Оплата        21.10.2019   

Универсальные поисковые системы. Порталы, универсальные поисковые системы и каталоги интернет-ресурсов

Несмотря на активное улучшение качества, и развитие функциональности внутренних моделей ТВ- тюнеров, способных превратить современных домашний компьютер в мощный мультимедийный центр, производители не перестают развивать направление внешних тюнеров, которые, конечно же, не могут похвастаться такой функциональностью, однако позволяют быстро и просто превратить обычный LCD монитор в современный телевизор, при этом его стоимость примерно вдвое ниже обычного LCD телевизора.

Однако, как мы уже не раз говорили, почти все внешние тюнеры имеют ряд недостатков. А именно, при подключении тюнера к компьютеру, качество компьютерной картинки заметно ухудшается. На экране появляется размытость и двоение. Единственным исключением стал тюнер AVerTV BOX 5, который позволил получить идеально четкую картинку при работе с компьютером, а так же преподнес пользователям много новых особенностей, заметно улучшающих качество и удобство самого тюнера.

В этой статье мы рассмотрим новую модель AVerTV BOX 9, которая пришла на смену AVerTV BOX 5. По сравнению с предыдущей моделью, AVerTV BOX 9 имеет ряд заметных отличий, среди которых мы хотим отметить поддержку стерео звука (A 2/ NICAM), разрешение до 1280х1024, возможность многоканального предварительного просмотра, функцию «картинка в картинке» с возможностью включить полупрозрачный режим, а так же наличие часов реального времени, на основе которых реализован полноценный таймер на включение и выключение. Конечно же, это не все особенности AVerTV BOX 9, но давайте не будем забегать вперед и рассмотрим все по порядку.

Внешние особенности AVerTV BOX 9

Внешне новый AVerTV BOX 9 ничем не отличается от пятой модели. Если бы не название на боковой стороне тюнера, определить какая это именно модель было бы не возможно. Благодаря стильному и компактному дизайну корпуса и грамотному расположению различных входов и выходов, AVerTV BOX 9 будет эффектно смотреться рядом со стильным LCD монитором или проектором. Конструкция корпуса позволяет одинаково удобно располагать тюнер как горизонтально, так и вертикально, для чего в комплект входит съемная подставка.

На лицевой стороне тюнера традиционно расположено окошко ИК- приемника, синий светодиод, отображающий включение питания тюнера, набор аудио/видео входов для подключения внешних источников, а так же аудио выход для подключения наушников.

Говоря об аудио/видео входах, мы не можем не отметить поддержку компонентного видеовхода Y - Pb - Pr , который реализован в виде отдельного переходника, совмещенного с S - Video входом. Использование компонентного входа заметно расширяет возможности тюнера, обеспечивая максимальное качество картинки, что особенно важно при подключении к тюнеру домашнего кинотеатра.

На боковой или верхней (в зависимости от расположения) стороне тюнера располагается панель управления, которая выполняет достаточный минимум функций, позволяя включать тюнер, выбирать нужный источник, менять громкость и переключать каналы. Все остальные функции

выполняются с помощью пульта дистанционного управления, о котором мы поговорим ниже.

На тыльной стороне тюнера расположены антенный вход, VGA и аудио входы и выходы, а так же разъем для подключения блока питания.

В принципе, здесь нет ничего удивительного. Такая конструкция применяется во всех внешних тюнерах, правда в AVerTV BOX 9, впрочем, как и в пятой модели используется качественный VGA кабель, который позволяет получить идеальное качество компьютерной картинки, чему могут позавидовать многие производители ТВ-тюнеров.

Для того, что бы Вы сами могли оценить качество картинки, мы публикуем фотографии, снятые в мониторном тесте. Как вы можете видеть, качество не изменилось. Изображение осталось четким и контрастным.

Особенности подключения AVerTV BOX 9

Подключить AVerTV BOX 9 сможет любой, даже не подготовленный пользователь. Необходимо лишь подключить монитор, видеовыход графической карты компьютера (если необходимо), а так же аудио кабели и антенну. Все, на этом процесс подключения закончен и можно приступать к настройке тюнера.

Процесс настройки требует некоторой подготовки, но благодаря использованию удобного русского меню очень похожего на меню любого современного телевизора, этот процесс занимает не много времени. Прежде всего, необходимо помнить, что все действия по настройке тюнера производятся с пульта дистанционного управления. Вообще пульт в любом внешнем тюнере, впрочем, как и в телевизоре, является единственным полнофункциональным устройством управления и настройки. Причем в AVerTV BOX 9 пульт выполнен настолько удобно, что пользователь может разобраться с управлением без чтения руководства, которое, кстати, подготовлено на русском языке, и включает лаконичное описание каждой функции.

При первом включении тюнера необходимо произвести настройку каналов, параметров изображения, а так же некоторые специфические параметры, о которых мы поговорим ниже. Итак, для входа в систему меню необходимо нажать соответствующую кнопку на пульте дистанционного управления.

Прежде всего, пользователю предлагается выбрать источник сигнала. По умолчанию установлен антенный вход. Если же вы планируете использовать другой источник, например, композитный, компонентный или S - Video вход, то можете выбрать его в разделе «источник сигнала».

Если же вы планируете использовать тюнер по своему основному назначению, то необходимо позаботиться о настройке каналов, для чего имеется одноименный раздел. Здесь пользователю предлагается произвести быстрый поиск канала, когда тюнер «пробегает» по всем предустановленным эфирным и кабельным каналам. Этот режим приятно удивил, обнаружив все наши кабельные каналы, причем качество приема было идеальным. В случае если быстрый поиск не обнаруживает те или иные каналы в ваших условиях, вы может использовать обычный режим сканирования диапазона.

Найдя нужную станцию, пользователь может установить видеостандарт (AUTO, SECAM, PAL, NTSC), аудио стандарт (моно:D/K или B/G и стерео: NICAM MONO, NICAM STEREO, NICAM DUAL A, NICAM DUAL B, A2 MONO, A2 STEREO, A2 DUAL A, A2 DUAL B). Важно отметить, что в отличие от некоторых внутренних тюнеров, в AVerTV BOX 9 используется принудительная установка того или иного стерео стандарт, что исключает появление звуковых помех при не уверенном приеме сигнала.

По завершению поиска и настройки, каналы можно отсортировать, правда, этот раздел меню мы практически не используем, так как стараемся изначально настраивать каналы в нужном нам порядке. Однако в случае необходимости у нас всегда остается возможность изменить порядок программ.

Теперь пришло время поговорить о настройках параметров изображения. Как было сказано выше, одной из отличительных особенностей тюнера AVerTV BOX 9 является поддержка разрешений до 1280х1024, что очень важно при подключении тюнера к 17” LCD монитору. Кроме разрешения пользователь может изменить частоту развертки 60/75Гц, яркость, контраст, насыщенность, оттенок и четкость картинки. Другими словами, AVerTV BOX 9 включает полный набор настроек параметров изображения свойственный уровню современных Hi - END телевизоров.

В заключение разговора о настройках тюнера AVerTV BOX 9 хотим обратить ваше внимание на возможность использования полноценного таймера, как на отключение, так и на включение.

AVerTV BOX 9 в работе…

Для улучшения качества картинки, сравнимого с качеством дорого телевизора, в последних моделях внешних тюнеров AVerMedia применяется ряд технологий. Прежде всего, мы хотим отметить технологию 3 D - motiom Adaptive De - interlace , которая позволяет устранить негативное влияние чересстрочной развертки, (эффект гребенки и нечеткость изображения).

Кроме этого, нельзя не отметить прогрессивную развертку и 3:2 Pull - down коррекцию, устраняющие дрожание и мерцание TV / DVD изображения, делая его более ясным и четким.

Благодаря применению этих технологий, изображение на экране получается действительно очень качественным, заметно превосходя качество, получаемое на многих представленных, на рынке тюнерах.

Кроме высокого качества картинки мы не можем не отметить возможности многоканального предварительного просмотра каналов. Эта функция реализована в AVerTV BOX 9 максимально грамотно. По центру экрана отображается живой эфир выбранного канала, в то время как по периметру в динамике отображается еще 12 каналов.

Вторая полезная особенность, так называемая «картинка в картинке». Только в отличие от телевизоров, здесь эта функция предназначена не для просмотра двух каналов в разных окнах, а для отображения телевизионного окна при одновременной работе за компьютером.

Наконец-то, эта долгожданная функция грамотно реализована во внешнем тюнере. В этом режиме пользователь может полноценно управлять просмотром, позиционировать окна, а так же включать полупрозрачный режим.

Очень важно обратить внимание, что в этом режиме качество компьютерной картинки, впрочем, как и телевизионного окна не ухудшается, обеспечивая комфортную работу в любимых приложениях, играх и ресурсонезависимый просмотр телевизора.

Заключение

Как вы могли заметить новый тюнер AVerTV BOX 9, является достойным продолжением в линейке внешних тюнеров AVerMedia , заметно расширив не только качество, но и функциональность. Благодаря применению новых особенностей в сочетание с отработанными ранее технологиями, AVerTV BOX 9 позволяет без проблем превратить любой современный монитор в полноценный многофункциональный телевизор класса Hi - END.

AltaVista
http://www.altavista.com

ИПС AltaVista была открыта в декабре 1995 года. Эта старейшая ПС и сейчас занимает одно из первых мест по объему проиндексированных html -документов (более 350 миллионов). AltaVista позволяет осуществлять простой и расширенный поиск, а также предоставляет дополнительные сервисы, облегчающие навигацию в среде WWW . Все страницы пользовательского интерфейса снабжены ссылкой на специальный раздел " Help " (помощь), который позволяет даже неподготовленным пользователям правильно составлять простые и сложные запросы.
Помимо собственной базы система предоставляет пользователям доступ к следующим информационным массивам:
- Suggested Relevant Searches ;
- БД RealNames;
- ИПС Ask Jeeves;
- каталог Интернет-ресурсов Open Directory (при поддержке LookSmart);
- БД, содержащая информацию о группах новостей (версия БД RemarQ );
- специализированные БД, содержащие сведения о мультимедийной информации.
Основными достоинствами ИПС являются: значительный объем базы; широкие возможности для составления поискового выражения как с использованием логических операторов, так и с использованием шаблонов; хорошо разработанные алгоритмы индексирования документов; возможность настройки пользовательского интерфейса и создания предустановок поиска.
Недостатками системы, по мнению экспертов, являются ограниченные возможности сортировки результатов поиска и недостаточно четкая обработка запросов, введенных строчными и прописными буквами.

ПРОСТОЙ ПОИСК

Запрос из ключевых слов вводится в поисковое поле " Search for " (см. рис. 11). По умолчанию используется логический оператор " OR " . Под поисковым полем приводится пример формулировки запроса, меняющийся при каждом новом открытии страницы простого поиска. Справа находится раскрывающееся меню для ограничения поиска документами на определенном языке.

Рис.11. Поисковое окно для ввода запроса ИПС AltaVista .

По умолчанию используется логический оператор OR , однако ввод самих логических операторов в простом поиске не поддерживается. ИПС AltaVista позволяет при помощи знаков " + " и " - " искать документы как содержащие, так и не содержащие заданные слова. Различаются запросы, введенные строчными и прописными буквами.
ИПС AltaVista поддерживает поиск по фразе. Фраза заключается в кавычки. Помимо кавычек система учитывает следующие знаки препинания, служащие для связи слов: %, $, /, #, _ . При поиске слова, связанные этими знаками, воспринимаются как фраза.
Поддерживается функция усечения справа, при этом ключевое слово вводится со знаком "*", поставленного после слова без пробела.
ИПС AltaVista поддерживает поиск не только в текстовой части html -документа, но и в других его разделах. Для этого используются следующие специальные операторы:
- Anchor : документы, которые содержат ключевое слово в тексте гиперссылки;
- Applet : документы, содержащие Java applet ;
- Domain : документы только внутри обозначенного домена. Например: только внутри домена. org ;
- Host : документы на определенном узле (компьютере). Например: только на сервере www . nlr . ru ;
- Image : документы, содержащие рисунки, обозначенные заданным ключевым словом;
- Link : документы, содержащие ссылки на определенный URL ;
- Text : документы, содержащие ключевое слово в любой части документа;
- Title : документы, содержащие заданное слово в заголовке (появляется в строке заголовка браузера);
- Url : документы, содержащие заданные ключевые слова в URL.
При работе с ИПС пользователь имеет возможность формулировать свой запрос на естественном языке. Запрос можно вводить только в поисковое окно " Search for " (см. рис.11) на странице простого поиска.
Отличительной особенностью ИПС AltaVista является наличие двух расширенных поисковых интерфейсов " Advanced Search " и " Power Search " (вызывается активизацией ссылки "More Search Options").

ПОИСК С ИСПОЛЬЗОВАНИЕМ ЛОГИЧЕСКИХ ОПЕРАТОРОВ
( Advanced Search)

ИПС AltaVista поддерживает использование следующих операторов: OR, AND, AND NOT, NEAR . Система позволяет комбинировать запрос из двух частей. В одно поисковое поле вводятся слова, связанные логическими операторами, в другое уточняющие ключевые слова (см. рис. 12) . Это значит, что первыми в итоговом списке документов, строго соответствующих запросу с логическими операторами, будут проранжированы документы, содержащие уточняющие ключевые слова (ранжирование по степени соответствия запросу).

Рис. 12. Форма для ввода запроса с использованием логических операторов ИПС AltaVista .

Ниже располагаются области уточнения запроса по языку, на котором написан документ (" Language "), и по дате создания (или последнего индексирования) поисковой программой (" From ... To "). Опция " One result per Web site " определяет количество ссылок, выводимых на страницу с результатами поиска.

РАСШИРЕННЫЙ ПОИСК
( Power Search)

Интерфейс расширенного поиска Power Search ИПС AltaVista представляет собой шаблон, состоящий из поля для ввода ключевых слов и нескольких областей уточнения запроса (см. рис. 13).
Первая область содержит два раскрывающихся меню. Опции меню " The search should include " дают возможность вводить запрос с использованием логических операторов (" Boolean "), или выбирать параметры обработки запроса " Any of the words " (любое слово), " All the words " (все слова) или " Exact phrase " (точная фраза). Опции меню " Search for words only on these Web page elements " позволяют производить поиск либо во всем html -документе (" All elements "), либо в тексте (" Page text "), в заголовке (" Title of the page ") или в ссылках (" Links to URL ") документа.

Рис. 13. Область уточнения запроса ИПС AltaVista

Далее следует область уточнения запроса по дате создания (или последнего индексирования) документа (см. рис. 14). Можно задать поиск документов за предлагаемые периоды времени (Anytime , Today , Week , 2 Weeks , Month , 3 Months , 6 Months , Year), либо ввести точные даты в поля опции " by date range ".

Рис.14. Область уточнения запроса по дате создания документа ИПС AltaVista

Поиск документов на определенном языке реализуется с помощью раскрывающегося меню " Language " (см. рис. 15), состоящего из 26 опций (пользователь выбирает один из 25 языков или " any language ", т.е. поиск без ограничения).

Рис.15. Раскрывающееся меню " Language " ИПС AltaVista .

Область уточнения запроса " Location " дает возможность ограничить поиск документов заданным географическим регионом, страной или конкретным узлом (см. рис. 16). Регион выбирается из опций раскрывающегося меню " by region ": " All regions ", " Asia ", " Africa ", " South America ", " North America ", " Central America ", " Middle East ", " Europe ", " South Pacific ", " Australia ". Опция " by domain " содержит поле для ввода доменов верхнего уровня. Опция " Search only this Web Site " дает возможность проводить поиск документов на конкретном сайте.

Рис.16. Область уточнения запроса " Location " ИПС AltaVista

Область уточнения " Show me " задает параметры выдачи результатов поиска (см. рис.17). Если пользователь помечает о пцию " One result per Web site ", то в списке результатов каждый web -сайт будет представлен только одним релевантным документом. Опция " Results per page " задает количество ссылок (от 10 до 50), выводимых на страницу результатов.

Рис.17. Область уточнения " Show me " ИПС AltaVista

В начале списка результатов поиска помещаются документы, которые содержат все заданные слова, причем преимущество отдается документам, в которых эти слова находятся рядом друг с другом и ближе к началу документа.

Рис.18. Формат выдачи результатов поиска ИПС AltaVista .

Каждый результат поиска выдается в виде заголовка документа и краткого описания страницы, которое берется или из поля " META " html -документа, или из первых строк документа. Ниже указывается URL документа (см.рис. 18).
Ссылка More Pages from this Site позволяет увидеть другие страницы данного сайта, релевантные запросу, потому что при выдаче результатов ИПС AltaVista представляет описание только одной страницы с конкретного сайта.
Related Pages - ссылка на список документов, найденных по запросу в каталоге Интернет-ресурсов LookSmart .
Опция " Search within these results " позволяет провести повторный уточняющий поиск среди уже найденных документов.
С помощью шаблона страницы предустановок поиска " Customize Settings " пользователь может настроить формат выдачи результатов, который состоит из следующих элементов:
- Description - первая строка найденного документа;
- URL - URL -адрес документа;
- Last Modified - дата последнего обновления документа;
- Web Page Size - размер документа в килобайтах;
- Web-site language - язык документа;
- Translate - ссылка на встроенный переводчик системы Babel Fish ;
- More Pages from This Site - показать другие релевантные страницы сайта;
- Related Pages - ссылка на список документов по теме запроса из раздела " AltaVista Recommends ";
- Company facts - сведения о компании (например, если документ находится на сайте какой-либо фирмы).
Пользователь выбирает нужные элементы, отмечая соответствующие селекторные кнопки. Кроме того, можно задать количество ссылок (от 10 до 50), выводимых на страницу результатов поиска. Последняя опция " Highlight the search term in the results " позволяет визуально выделить ключевые слова в описании или заголовке документа.
Созданные предустановки запоминаются браузером и действуют в каждой поисковой сессии, пока не будут изменены.
Система поддерживает поиск документов и файлов, содержащих мультимедийную информацию (изображения, аудио- и видеозаписи). Для этого пользователю предлагаются три специальных поисковых интерфейса Images , MP 3/ Audio и Video , переход на которые возможен с любой страницы ИПС.
Кроме того ИПС AltaVista предлагает пользователям доступ к специализированной базе Education Search , в которой проиндексировано более 20 миллионов web -страниц высших и средних учебных заведений.
Система имеет встроенный переводчик Babel Fish для перевода небольших фрагментов произвольно набранного текста или фрагмента документа, представленного в списке результатов запроса. Ограничение размера - 5 Кб текста в html -документе .
Помимо поиска по ключевым словам пользователь может проводить поиск в каталоге, который поддерживает ИПС LookSmart . Это один из крупнейших каталогов Интернет-ресурсов, содержащий более 2.300.000 отобранных ссылок. Он разбит на 17 категорий, каждая из которых делится на более дробные подразделы. Описание документа состоит из заголовка и краткой характеристики. Подробное описание этого каталога содержится в разделе "Каталоги Интернет-ресурсов".

ALL THE WEB, ALL THE TIME
(FAST SEARCH)
http://www.alltheweb.com

ИПС Fast Search была открыта в мае 1999 года. Сразу после этого норвежская компания Fast Search and Transfer , являющаяся создателем данной ИПС, начала деятельность по наращиванию информационного потенциала базы. За четыре месяца ее объем увеличился с 80 до 200 миллионов проиндексированных web -страниц. На сегодняшний день он составляет около 570 миллионов документов.
В качестве точки доступа к базе Fast Search был выбран интерфейс расширенного поиска ИПС Lycos . Параллельно ведутся работы над созданием собственного поискового интерфейса системы. Сейчас он представлен страницами простого и расширенного поиска. Кроме того, пользователи получают доступ к базе ИПС Fast Search , содержащей сведения о мультимедийной информации. Поиск в БД, индексирующей содержимое файловых архивов, по-прежнему осуществляется с севера ИПС Lycos .
Достоинствами ИПС являются высокая скорость обработки запроса, отсутствие списка стоп-слов и возможность вывода до 100 ссылок на одну страницу результатов поиска.
Основной недостаток ИПС, по мнению экспертов, заключается в ограниченном наборе поисковых функций. Система не поддерживает ввод запроса с использованием логических операторов и операторов близости, а также поиск с усечением ключевых слов. Составление поискового выражения возможно только при помощи шаблонов.

ПРОСТОЙ ПОИСК

Интерфейс страницы простого поиска ИПС Fast Search представляет собой словарный фильтр, состоящий из раскрывающегося меню и поля для ввода ключевых слов (см. рис.19).

Рис.19. Словарный фильтр ИПС Fast Search .

Опции раскрывающегося меню имеют следующие обозначения:
- " All the words "- в списке найденных документов присутствуют только те, которые содержат все заданные слова или фразы;
- " Any of the words " - в списке найденных документов присутствуют те, которые содержат хотя бы одно из заданных слов или фраз;
- " The exact phrase " - поиск фразы.
Система поддерживает ввод запроса с использованием специальных операторов "+" и "-", которые соответствуют логическим операторам " AND " и " NOT ". Фраза заключается в кавычки. Строчные и прописные буквы при поиске не различаются.
Ниже поля для ввода ключевых слов располагаются ссылки на справочный раздел по составлению запросов (" help "), на страницу создания предустановок поиска (" customize ") и на страницу расширенного поиска (" advanced search ").

РАСШИРЕННЫЙ ПОИСК

Интерфейс расширенного поиска ИПС Fast Search представляет собой шаблон, состоящий из словарного фильтра и нескольких областей для уточнения запроса (см. рис.20).

Рис. 20. Интерфейс расширенного поиска ИПС Fast Search .

Словарный фильтр " Search for " идентичен фильтру на странице простого поиска. Ниже пользователю предлагаются дополнительные возможности для составления поискового предписания.
" Language " - фильтр ограничения по языку, на котором написан документ. Справа находится раскрывающееся меню, которое позволяет пользователю указать наиболее предпочтительную для него кодировку документа.
" Word Filters " - дополнительный словарный фильтр. По умолчанию он состоит из трех одинаковых полей. При необходимости поля можно добавить или убрать, воспользовавшись кнопками Filters "+" или "-". Опции раскрывающихся меню слева имеют обозначения: " Should include " (возможно содержит), " Must include " (должен содержать) и " Must not include " (не должен содержать), что соответствует по смыслу логическим операторам OR , AND и NOT . Опции раскрывающихся меню справа позволяют производить поиск в различных частях html -документа:
- " In the text " - в тексте html -документа;
- " In the title " - в заголовке html -документа;
- " In the link name " - в тексте ссылки, имеющейся в html -документе;
- " In the URL " - в URL -адресе html -документа;
- " In the link to URL " - в URL -адресе ссылки, имеющейся в html -документе.
- " Domain Filters "- фильтр ограничения поиска документов по домену узла, на котором находится документ.
" Result Restrictions " - фильтр, дающий возможность задать количество ссылок на странице результатов поиска (раскрывающееся меню " Results per page ") и исключить из результатов поиска документы, содержащие ненормативную лексику (" Offensive content reduction ").

Результаты поиска выдаются в виде заголовка документа, первых строк текста и URL -адреса. На первой странице указывается количество найденных по запросу документов и время, затраченное ИПС на проведение поиска (см. рис. 21).

Рис.21. Формат выдачи результатов поиска ИПС Fast Search .

Основными дополнительными возможностями системы являются создание предустановок как для простого, так и для расширенного поиска. Имеется также доступ к базе ИПС Fast Search , содержащей сведения о мультимедийной информации.
Переход на страницу создания предустановок поиска осуществляется по ссылке " Search Customization ". Страница содержит четыре вида предустановок: " Offensive Content Reduction ", " Language Settings ", " Number of Word Filters " и " Mark Search Terms in Results ". Созданные предустановки запоминаются браузером и действуют в каждой поисковой сессии, пока не будут изменены.
Функция " Offensive Content Reduction " позволяет исключить из результатов поиска документы, содержащие ненормативную лексику. В полной мере она распространяется только на документы на английском языке.
Функция " Language Settings " позволяет задавать поиск документов с учетом нескольких параметров, например на английском и французском языке и в определенных кодировках.
Функция " Number of Word Filters "задает количество полей для дополнительного словарного фильтра на странице расширенного поиска.
Функция " Mark Search Terms in Results " дает возможность при выдаче результатов поиска выделять цветом ключевые слова.
Доступ к базе мультимедийной информации реализован в виде простого и расширенного поисковых интерфейсов, переход к которым осуществляется по ссылке с домашней страницы ИПС Fast Search (см. рис. 22). Страница простого поиска содержит поле для ввода ключевых слов, слева от которого располагается раскрывающееся меню с опциями " all media " (все виды мультимедийной информации), " images " (изображения), " video " (видеофайлы) и " audio " (аудиофайлы).

Рис.22. Интерфейс простого поиска мультимедийной информации ИПС Fast Search .

По ссылке " Advanced search " пользователь переходит к странице расширенного поиска, которая содержит аналогичное поле для ввода запроса и дополнительный набор фильтров для каждого вида мультимедийной информации (см. рис. 23).

Рис.23. Интерфейс расширенного поиска ИПС Fast Search .

Помимо поиска мультимедийной информации ИПС Fast Search предлагает пользователям такую интересную возможность, как поиск web -страниц, созданных для мобильных телефонов с поддержкой протокола WAP .

Google
http://www.google.com

ИПС Google была открыта в сентябре 1999 года. На сегодняшний день объем базы по оценкам экспертов Searchenginewatch . com составляет более 560 миллионов документов. Эта цифра не совпадает с той, которую создатели ИПС указывают на домашней странице (более 1 миллиарда документов). Система предлагает пользователю простой и расширенный поисковый интерфейсы, а также страницу создания предустановок поиска.
Отличительной особенностью ИПС Google является технология определения степени релевантности документа путем анализа ссылок других источников на данный ресурс. Эта технология называется PageRankTM . Чем больше ссылок на какую-либо web -страницу имеется на других страницах, тем выше ее рейтинг в базе Google . При выдаче результатов поиска в начале списка оказываются страницы с более высоким рейтингом (при прочих равных составляющих).
Помимо основной базы запрос обрабатывается с использованием таких информационных массивов как БД RealNames и каталог Интернет-ресурсов Google Web Directory .
ИПС Google предоставляет доступ к своей базе другим ИПС, среди которых наиболее известными являются Netscape " s Search и Yahoo !.
Основными достоинствами ИПС являются значительный объем базы, маленький список стоп-слов и возможность получения копии документа из базы Google , если он удален с основного адреса.
Недостатками ИПС являются отсутствие поддержки логических операторов AND и NOT , невозможность составления поисковых предписаний с использованием скобок, отсутствие поисковой функции усечения.

ПРОСТОЙ ПОИСК

При обработке запроса система интерпретирует пробел между словами как логический оператор AND , однако ввод самого оператора не поддерживает. Запрос вводится в поисковое поле (см. рис.24). Кнопка " I " m Feeling Lucky " прерывает поисковую сессию и открывает в окне браузера первый найденный документ. Справа расположены ссылки на страницу расширенного поиска (" Advanced Search ") и страницу создания предустановок поиска (" Preferences ").

Рис.24.Поле для ввода ключевых слов ИПС Google .

Если необходимо провести поиск с использованием стоп-слов, то перед ними проставляется знак "+". Система поддерживает использование логического оператора О R . Оператор NOT заменяется знаком "-" перед словом без пробела. Возможна постановка знаков "+" и "-" перед фразой.
Поддерживается поиск по фразе. Фраза заключается в кавычки. Помимо кавычек Google учитывает следующие знаки препинания, служащие для связи слов: дефисы ( mother-in-law ), косые черты ( national / library / russia ), знаки равенства ( national = library = russia ), апострофы ( Bill " s birthday ). При поиске слова, связанные этими знаками, воспринимаются как фраза.
Система не поддерживает поиск с учетом морфологии, поиск по части ключевого слова и не различает строчные и прописные буквы.
При составлении поискового выражения можно использовать два специальных оператора. Оператор link: дает возможность выявить документы со ссылкой на данный URL . Например, на запрос link: www . nlr . ru будут получены документы со ссылками на домашнюю страницу РНБ. Такой запрос нельзя комбинировать с обычными ключевыми словами. Оператор site: сужает круг поиска документами с определенного web -сайта. Например, по запросу site: www . nlr . ru database будут найдены документы на web -сайте РНБ, содержащие слово " database ".

РАСШИРЕННЫЙ ПОИСК

Интерфейс страницы расширенного поиска реализован в виде шаблона, состоящего из шести фильтров (см. рис.25).

Рис.25. Интерфейс страницы расширенного поиска ИПС Google .

Первый фильтр для ввода ключевых слов " Find results " состоит из 4-х полей:
- " with all of the words " - "все слова", соответствует логическому оператору AND ;
- " with any of the words " - "любое из слов", соответствует логическому оператору OR ;
- " without the words " - "исключить слова", соответствует логическому оператору NOT ;
- " with the exact phrase " - поиск по фразе.
Справа располагается раскрывающееся меню, позволяющее задать количество ссылок результата поиска, выводимых на одну страницу (от 10 до 100).
Фильтр " Occurrences " позволяет производить поиск ключевых слов в определенных областях html -документа: " anywhere in the page " (во всем документе), " in the title of the page " (в заголовке документа), " in the url of the page " (в URL -адресе документа).
Фильтр " Language " позволяет осуществлять поиск документов на одном из 25 языков, указанных в опциях раскрывающегося меню.
Фильтр " Domains " позволяет как искать документы, находящиеся на определенных узлах, так и исключать их из результатов поиска.
Фильтр " SafeSearch " позволяет исключить из результатов поиска документы, содержащие ненормативную лексику.
Следующая область страницы расширенного поиска " Page Specific Search " содержит два поисковых поля " Similar " и " Links ". Поле " Similar " служит для поиска документов, наиболее релевантных данному: здесь помимо ключевых слов учитывается домен узла, тип документа и проч. Поле " Links " служит для поиска документов, содержащих ссылки на заданную страницу (см. рис. 26).

Рис.26. Область страницы расширенного поиска " Page Specific Search " ИПС Google .

РЕЗУЛЬТАТЫ ПОИСКА И ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ

Как уже было сказано, ИПС Google определяет степень релевантности документа путем анализа ссылок других источников на данный ресурс. При сортировке результатов поиска из всех релевантных документов выбираются страницы с более высоким рейтингом и помещаются в начало списка.
Перед списком результатов указывается количество документов, найденных по запросу, и время обработки запроса в базе Google . Формат вывода результатов поиска состоит из следующих элементов (см. рис.27):
- заголовок документа;
- выдержки из текста с выделенными жирным шрифтом словами запроса;
- описание документа, полученное из поля meta (" description ");
- ссылка на соответствующий раздела каталога Google Web Directory (" category ");
- URL -адрес страницы;
- размер найденного документа в килобайтах;
- ссылка на копию документа в базе Google (" cached ");
- ссылка для задания поиска документов, наиболее релевантных данному (" similar pages "); здесь помимо ключевых слов учитывается домен узла, тип документа и проч.;
- другие страницы сайта, релевантные запросу, если таковые имеются (" more results from ").

Рис.27. Формат выдачи результатов поиска ИПС Google .

ИПС Google предоставляет пользователю разнообразные возможности по настройке интерфейса системы и непосредственно самих поисковых функций. На домашней странице имеется ссылка на страницу создания предустановок поиска " Preferences ". ИПС поддерживает интерфейсы на 25 языках и позволяет открывать каждый найденный документ в новом окне браузера. Пользователь может задать поиск документов одновременно на нескольких языках, регулировать количество результатов поиска, выводимых на одну страницу, а также подключать фильтр для документов, содержащих ненормативную лексику. Созданные предустановки запоминаются браузером и действуют в каждой поисковой сессии, пока не будут изменены.
На странице расширенного поиска расположены ссылки на специализированные информационные массивы ИПС. Это каталог высших учебных заведений, в основном американских и канадских, хотя географический охват постоянно расширяется; база web -сайтов правительственных и военных учреждений (материалы фильтруются по доменам верхнего уровня. gov и. mil); база web -сайтов по программному обеспечению различных операционных систем.
Как уже было отмечено выше, при выдаче результатов поиска большинство найденных документов сопровождаются ссылкой " category " на соответствующий раздел каталога Google Web Directory . В основе этого каталога лежит каталог Интернет-ресурсов Open Directory Project ( http:// dmoz . org ), созданный компанией Netscape . На данный момент в нем содержится около 1.5 миллионов ссылок. Каталог постоянно пополняется новыми материалами, которые присылают редакторы, работающие на добровольных началах. Подробное описание этого каталога содержится в разделе "Каталоги Интернет-ресурсов".

iWon
http :// www . iwon . com

ИПС iWon была открыта в октябре 1999 года. Она создавалась как коммерческий портал и сейчас имеет обычное для таких сайтов информационное наполнение - реклама, сводки новостей, погода, бесплатный почтовый сервис и возможность создания персональных настроек, гороскоп, различные рекламные акции для привлечения покупателей в электронные магазины и проч.
Особый интерес эта ПС представляет как полноценное средство доступа к базе данных ИПС Inktomi , содержащей более 500 миллионов html -документов. ИПС Inktomi не имеет собственного поискового интерфейса. Она заключает контракты с другими поисковыми системами, давая возможность их пользователям проводить поиск в своих информационных массивах. Эти поисковые системы (HotBot , MSN Web Search , Snap , iWon , GeoCities , Anzwers, Canada . com и другие) составляют так называемую группу Inktomi (Inktomi Group). Большинству своих партнеров Inktomi предлагает поиск в ограниченной базе объемом около 110 миллионов документов. ИПС iWon имеет доступ к расширенной базе GEN 3, содержащей около 400 миллионов web -страниц.
Кроме ИПС Inktomi запрос обрабатывается с привлечением следующих информационных массивов: каталог LookSmart , который содержит более 1.5 миллионов аннотированных ссылок, каталог Direct Hit , собирающий ссылки на наиболее популярные сайты, база данных Real Names , а также внутренние информационные массивы iWon - Moreover (новости) и Fact City .
Недостатки ИПС iWon по мнению экспертов Searchenginewatch . com и Searchengineshowdown . com состоят в низкой скорости загрузки страниц, особенно при выдаче результатов поиска, а также ограниченный набор поисковых функций.

ПРОСТОЙ ПОИСК

При обработке запроса, состоящего только из ключевых слов, по умолчанию используется логический оператор AND и учитываются все морфологические формы слова. Запрос водится в поисковое поле (см. рис.28).

Рис.28. Поисковое поле для ввода запроса ИПС iWon .

РАСШИРЕННЫЙ ПОИСК

Интерфейс страницы расширенного поиска реализован в виде шаблона и не поддерживает использование логических операторов. Шаблон состоит из трех областей уточнения запроса: словарный фильтр (см. рис.29), поиск морфологических форм слова и ограничение по дате.
Словарный фильтр позволяет искать документы как содержащие, так и не содержащие заданные слова или словосочетания. Здесь не допускается ввод ключевых слов с символами усечения.

Рис.29. Форма для составления поискового выражения ИПС iWon .

Область уточнения запроса по дате дает возможность выявить документы, зарегистрированные в базе ИПС Inktomi , по следующим параметрам: за последние две недели, месяц, три месяца, шесть месяцев, год, два года или без ограничения по дате.

РЕЗУЛЬТАТЫ ПОИСКА И ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ

Результаты поиска выдаются в виде заголовка документа, первых строк текста и URL-адреса. В результате простого поиска ИПС iWon показывает только одну релевантную страницу сайта. Для просмотра остальных необходимо воспользоваться ссылкой " More results from " (см. рис.30).

Рис.30. Форма выдачи результатов поиска ИПС iWon.

При проведении расширенного поиска выдаются все найденные релевантные запросу страницы, но в несгруппированном по сайтам виде. ИПС не поддерживает дополнительные возможности сортировки результатов по дате или в алфавитном порядке.
На первой странице результатов поиска выдается десять ссылок, на всех последующих - по двадцать. Кроме ссылок на релевантные web -страницы, на первую страницу выводятся результаты поиска в каталогах LookSmart и Direct Hit . Ссылка " Internet keywords for ... " переадресует запрос к базе данных Real Names .
Если запрос осуществлялся со страницы простого поиска, то кроме списка найденных страниц приводятся ссылки на разделы каталога LookSmart (" Related web directory categories "). Каталог содержит около 1,5 миллиона ссылок и разбит на более чем 100.000 категорий. Каждая ссылка содержит краткое описание ресурса. Каталог редактируется вручную и пополняется ежедневно.
Также на странице результатов поиска приводятся ссылки на самые популярные сайты, соответствующие запросу - " Most popular direct hit " (информация о которых берется из каталога Direct Hit).

NORTHEN LIGHT
http//www.northenlight.com

ИПС Northern Light была открыта в августе 1997 года. Ее объем составляет более 380 миллионов проиндексированных документов. Система обладает широким спектром поисковых возможностей. Кроме простого и расширенного поиска она предоставляет доступ к нескольким специализированным информационным массивам: БД Special Collection , архив Current News , коллекция Special Editions , специализированные поисковые сервисы Usgovsearch и Business Search .
БД Special Collection ( http://special.northernlight.com/ ) содержит более 5600 газетных и журнальных публикаций, а также отчеты информационных служб MarkIntel , Find / SVP , WEFA и Investext .
Архив Current News ( http://www.northernlight.com/news.html ) включает в себя новости крупнейших информационных агентств за последние 2 недели.
Над созданием коллекции Special Editions ( http://special.northernlight.com/ ) работает группа профессиональных редакторов с библиотечным образованием. Коллекция пополняется вручную отобранными ссылками на web -сайты и статьи по наиболее актуальным проблемам современной общественной жизни (например, генное модифицирование продуктов питания, европейская экономика и Международный валютный фонд, проблемы компьютерной безопасности и т.д.). Материал обновляется каждые две недели.
Широкие возможности для поиска web -сайтов федерального правительства США дает сервис Usgovsearch ( http://govsearch.northernlight.com/ ). Отбор материала для этой базы производится на основе расширенных алгоритмов, которые не ограничиваются формальными критериями фильтрации по домену верхнего уровня. gov и. mil . Доступ к ресурсу платный, однако публичные и университетские библиотеки, а также депозитарии могут получить право бесплатно пользования.
Специализированный поисковый сервис Business Search предоставляет информацию о web -сайтах, содержащих отчеты компаний, исследования рынка, экономические аналитические обзоры и т.д.

ПРОСТОЙ ПОИСК

Запрос из ключевых слов вводится в поисковое окно " Search for " (см. рис. 31). По умолчанию используется логический оператор " AND " . Над поисковым окном приводится пример формулировки запроса, меняющийся при каждом новом открытии страницы простого поиска. Справа находится ссылка " Tips " , предлагающая пользователю краткую справку по составлению запроса. Более подробные сведения содержатся в разделе " Help ", в который можно перейти с домашней страницы ИПС.

Рис.31. Поисковое поле для ввода запроса ИПС Northern Light .

Система поддерживает составление запроса с использованием логических операторов AND , OR и AND NOT (или "-"). Для составления сложного поискового выражения используются круглые скобки, задающие порядок действия операторов.
Поддерживается поиск по фразе. Фраза заключается в кавычки. Система не поддерживает другие операторы близости. Эксперты отмечают, что ИПС Northern Light не имеет четкого алгоритма различения фразы. Так, например, если фраза состоит из трех и более слов, то при обработке запроса система может интерпретировать ее как простой набор ключевых слов с оператором AND .
Поддерживается поисковая функция усечения, при этом ключевое слово вводится со знаком "*" для замены неограниченного количества символов и знаком "%" для замены одного символа. Знаки усечения можно использовать как в конце, так и середине слова.
Система осуществляет поиск с учетом морфологических форм ключевых слов, но не различает строчные и прописные буквы.
ИПС Northern Light поддерживает поиск не только в текстовой части html -документа, но и в других его разделах. Для этого используются следующие специальные операторы:
- title: поиск документов, содержащих заданные слова в заголовке html -документа;
- url: документы, содержащие заданные слова в URL-адресе html -документа;
- text: документы, содержащие заданные слова в любой части документа.
Эти операторы продублированы соответствующими фильтрами расширенного поиска.
Кроме того, для поиска в БД Special Collection используется оператор " pub :", который позволяет проводить поиск по названию периодического издания, а также оператор " recid :" для поиска по регистрационному номеру, который присваивается каждому документу в этой базе. Возможно также составление поискового выражения с операторами " company :" (поиск по названию фирмы) и " ticker :" (поиск в биржевых сводках).

РАСШИРЕННЫЙ ПОИСК

Интерфейс расширенного поиска ИПС Northern Light представляет собой шаблон, состоящий из словарного фильтра и нескольких областей для уточнения запроса. Словарный фильтр состоит из четырех полей для ввода ключевых слов (см.рис.32):
- " Search for " - общий поиск;
- " Words in title " - поиск в заголовке html -документа;
- " Publication name " - поиск по названию периодического издания;
- " Words in URL " - в URL-адресе html -документа.
Ссылка справа " See our list of publications " дает пользователю возможность просмотреть список периодических изданий, включенных в БД Special Collection . Под словарным фильтром расположена опция " Select ", которая определяет, с использованием каких информационных массивов будет производиться поиск.

Рис.32. Словарный фильтр ИПС Northern Light .

Далее на странице расположена область ограничения поиска " Limit Subjects To ", которая позволяет сузить область поиска одной или несколькими предметными рубриками. Расположенная ниже область " Limit Documents To " ограничивает результаты поиска определенными типами документов:
- " Commercial Web sites " - коммерческие web- сайты;
- " Education Web sites " - образовательные web- сайты;
- " Government Web sites " - правительственные web- сайты;
- " Military Web sites " - web -сайты военных организаций;
- " Non-profit Web sites " - некоммерческие web- сайты;
- " Personal pages " - личные страницы;
- " Learning materials " - учебные материалы;
- " Questions and answers " - " вопросы и ответы ";
- " For sale " - web -сайты электронных магазинов;
- " Job listings " - списки вакансий;
- " Broadcast news transcripts " - архивы новостей радиовещания;
- " City & regional newspapers " - городские и региональные газеты;
- " College newspapers " - газеты средних учебных заведений;
- " Press releases " - пресс - релизы.
Система также позволяет проводить поиск документов по географическому признаку и языку, на котором написан документ (английский, французский, немецкий, итальянский и испанский). Возможно ограничение поиска по дате создания документа с помощью опции " Select Date Range ".

РЕЗУЛЬТАТЫ ПОИСКА И ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ

Результаты поиска сортируются по степени релевантности. В качестве дополнительной возможности пользователю предлагается сортировка по дате создания или последнего обновления документа. Результаты поиска выдаются в следующем виде: заголовок документа, степень релевантности (в процентах), краткая выдержка из текста, дата создания документа и его URL -адрес (см. рис. 33). Ссылка " More Results " позволяет увидеть список других страниц сайта, релевантные запросу.

Рис.33. Формат выдачи результатов поиска ИПС Northern Light .

Отличительной чертой ИПС Northern Light является организация всего массива найденных документов в особые разделы, так называемые Custom Search Folders . Эти разделы формируются на основе 4-х признаков: предмет (тематическая рубрика), источник (коммерческие web -сайты, персональные страницы, журналы, энциклопедии, базы данных и проч.), тип документа (пресс-релиз, обзор, новости и т.д.) и язык документа. Каждый раздел может делиться на более мелкие рубрики в зависимости от количества найденных документов. Деление продолжается до тех пор, пока объем каждой папки (folder) не будет превышать 26 ссылок. Внутри папок результаты сортируются по дате создания документа или по релевантности.
Дополнительные поисковые возможности системы в большей степени представляют интерес для тех пользователей, чья деятельность связана с экономикой, финансами, инвестициями, недвижимостью. Доступ к ним осуществляется при помощи навигационной панели, расположенной в верхней части всех страниц сайта.

РУССКИЕ ПОИСКОВЫЕ СИСТЕМЫ

АПОРТ
http://www.aport.ru

ИПС Апорт входит в число ведущих отечественных поисковых систем. На сегодняшний день объем ее базы составляет более 20 миллионов проиндексированных документов. Система обладает широким спектром поисковых возможностей. Она позволяет осуществлять простой и расширенный поиск и является единственной ИПС с интегрированным каталогом Интернет-ресурсов. Особые алгоритмы индексирования позволяют программе-роботу при обработке документов учитывать имеющиеся в них ссылки, что существенно расширяет поисковое пространство системы. ИПС Апорт обладает функцией встроенного переводчика, это дает пользователю возможность формулировать запросы как на русском, так и на английском языках.
В данный момент Апорт представляет собой портал, объединивший поисковую систему, каталог Интернет-ресурсов @ Rus , а также ряд бесплатных сервисов и информационных проектов.

ПРОСТОЙ ПОИСК

Запрос из ключевых слов вводится в поисковое поле, расположенное в верхней части домашней страницы (см. рис. 34). По умолчанию используется логический оператор " AND " . Ниже находятся селекторные кнопки, позволяющие выбрать информационный массив, в котором будет производится поиск.

Рис.34. Поле для вводя ключевых слов ИПС Апорт.

Система поддерживает составление запроса с использованием логических операторов И (" AND ", "+", "&"), ИЛИ (" OR ", "|") и НЕ (" NOT ", "-"). Для составления сложного поискового выражения используются круглые скобки, задающие порядок действия операторов.
Поддерживается поисковая функция усечения, при этом ключевое слово вводится со знаком "*" для замены любого количества букв в конце слова.
Система осуществляет поиск с учетом морфологических форм ключевых слов. Создатели ИПС отмечают, что в некоторых случаях использование такой функции может привести к выдаче большого количества нерелевантных документов за счет совпадения морфологических форм различных по смыслу слов. Так, например, слово "пар" - это форма именительного падежа единственного числа существительного мужского рода и форма родительного падежа множественного числа существительного женского рода "пара" (в смысле двойка). Для снятия подобной неоднозначности используется специальный оператор "!", который ставится перед ключевым словом. Так, по запросу "!пар" не будет находиться словоформа "парой", имеющаяся только у существительного женского рода "пара".
ИПС Апорт поддерживает поиск по фразе. Фраза заключается в кавычки. Также в запросе возможно использование оператора близости "сл". Он задает общее количество слов во фрагменте с искомыми ключевыми словами. Например, по запросу сл20(библиотеки архивы информационные центры) будут найдены документы, содержащие все указанные ключевые слова в произвольном порядке, но общее число находящихся между ними слов не будет превышать 20. Синонимами оператора "сл" являются "с", " w " и квадратные скобки.
Система поддерживает поиск не только в текстовой части html -документа, но и в других его разделах. Для этого используются следующие специальные операторы:
- url= - поиск документов по определенному URL-адресу или его части;
- title=
- keywords= - поиск в поле "meta keywords" html-документа;
- alt= - поиск в комментариях к иллюстрациям html-документов;
- link= - поиск в URL-адресах ссылок, имеющихся в html-документах (можно искать только полное имя сервера до первой косой черты);
- anchor= - поиск в тексте ссылок html-документов;
- description= - поиск в поле "meta description" html-документов;
- text = - поиск только в основном тексте html-документа.
Оператор " url " можно комбинировать с ключевыми словами, например: по запросу url = www . nlr . ru AND электронные AND коллекции будут выданы документы с сайта РНБ, содержащие слова "электронные" и "коллекции". При поиске с использованием операторов " title = ", " keywords = ", " alt = ", " anchor= ", " description= " и " text= " несколько ключевых слов заключаются в кавычки, например: keywords =(библиотеки NOT архивы) .
Переход на страницу расширенного поиска осуществляется с домашней страницы ИПС по ссылке "расширенный", расположенной над полем для ввода ключевых слов.

РАСШИРЕННЫЙ ПОИСК

При переходе на страницу расширенного поиска под полем для ввода слов запроса появляется шаблон, состоящий из нескольких фильтров для уточнения запроса (см. рис. 35).

Рис.35. Шаблон расширенного поиска ИПС Апорт.

Опция " тщательный поиск " необходима для поиска всех релевантных документов на сайте. Если она не помечена, то в списке результатов выдается только один документ.
Опция " дата " позволяет сужать поиск по времени создания или последнего обновления документа.
Опции " искать " дублируют специальные операторы, позволяющие ограничивать поиск определенными разделами html-документа (" во всем документе ", " только в тексте ", " в заголовке ", " в тексте ссылок ", " в ключевых словах ", " в подписях к картинкам ", " в ссылках (href) ", и " в описаниях ресурса ").
выдача " задают полную или краткую (без описания сайта) форму выдачи результатов поиска.
Раскрывающееся меню " перевод выдачи " позволяет переводить результаты поиска на английский или русский язык. Опции меню " перевод запроса " используются для автоматического перевода ключевых слов на русский или английский языки.

РЕЗУЛЬТАТЫ ПОИСКА

В начале страницы с результатами поиска указывается количество найденных по запросу сайтов, а в скобках число содержащихся в них релевантных документов. Все найденные документы сортируются по степени релевантности, которая определяется с учетом следующих факторов:
- количество ключевых слов в тексте документа (в процентах) и расстояние между ними;
- раздел html -документа, в котором встречаются ключевые слова (заголовок, описание, поле "мета" и т.п.);
- внешний вид шрифта, которым набраны в тексте ключевые слова (размер, жирность, цвет);
- наличие связей с другими web -страницами.
Результаты поиска представлены в виде заголовка документа, URL-адреса и описания сайта, взятого из каталога @Rus. Кроме этого пользователю предоставляются сведения о дате создания документа, его размере в килобайтах и виде кодировки (см. рис. 36).

Рис.36. Формат выдачи результатов поиска ИПС Апорт.

Ссылка "похожие сайты" служит для поиска документов наиболее релевантных данному. Если документ был удален с основного сайта, то ИПС Апорт дает возможность получить копию текста по ссылке "реконструкция текста".

RAMBLER
http://www.rambler.ru

Доступ к ИПС Rambler был открыт в 1996 году. Это одна из первых российских ИПС, которая до сих пор сохраняет свои лидирующие позиции и активно развивается, предоставляя пользователям новые информационные сервисы. В базе ИПС Rambler проиндексировано более 12 миллионов документов, расположенных на серверах России и стран СНГ. Система использует несколько одновременно работающих программ-роботов и обрабатывает около 5 пользовательских запросов в секунду.
В данный момент Rambler представляет собой портал, объединивший поисковую систему, рейтинг-классификатор Rambler"s Top100, а также ряд бесплатных сервисов и информационных проектов. Ресурсы портала регистрируют ежесуточно более 3,5 млн. посещений, а ежемесячная аудитория ИПС Rambler составляет 60-70% всех пользователей российского Интернета. Наиболее интересными проектами являются " Rambler -Наука", "Интерактивные карты" и "Словари". Кроме того пользователям предоставляется возможность проведения поиска информации на ftp -серверах (http:// ftpsearch . rambler . ru:8101/).

ПРОСТОЙ ПОИСК

Запрос из ключевых слов вводится в поисковое окно, расположенное в верхней части домашней страницы (см. рис.37). По умолчанию используется логический оператор " AND " .

Рис.37. Поле для ввода ключевых слов ИПС Rambler .

Система поддерживает составление запроса с использованием логических операторов " AND " ("&") и " OR " ("|"). Чтобы исключить документы, содержащие те или иные слова, нужно перейти на страницу расширенного поиска и заполнить поле " Исключить документы, содержащие следующие слова ". Для составления сложного поискового выражения используются круглые скобки, задающие порядок действия операторов.
ИПС Rambler поддерживает поиск по фразе. Фраза заключается в кавычки. Система не различает строчные и прописные буквы и производит поиск ключевого слова в той грамматической форме, в которой оно было введено. Поиск морфологических форм задается оператором "#", а поиск однокоренных оператором "@".
Поддерживается поисковая функция усечения справа и в середине слова. Символ " * " заменяет любое количество букв; символ " ? " заменяет один неизвестный символ (например: к?мпания= кампания или компания ).
При составлении запроса можно использовать следующие специальные операторы:
- $All - поиск во всех разделах html-документа;
- $URL - поиск в URL-адресе html-документа;
- $Title - поиск в заголовке html-документа;
- $Essence - поиск в аннотации к html-документу.

РАСШИРЕННЫЙ ПОИСК

Интерфейс страницы расширенного поиска содержит поле для ввода ключевых слов и шаблон, состоящий из нескольких фильтров для уточнения запроса (см. рис.38).

Рис. 38. Шаблон расширенного поиска ИПС Rambler .

Опция " Учитывать слова запроса " содержит селекторные кнопки " все " и " любое ", заменяющие логические операторы " AND " и " OR ". Чтобы исключить документы, содержащие те или иные слова, нужно заполнить поле " Исключить документы, содержащие следующие слова ". Система дает возможность о граничить поиск документами, созданными за определенный период времени.
Ниже расположена область определения параметров сортировки и выдачи результатов поиска.

РЕЗУЛЬТАТЫ ПОИСКА

По умолчанию найденные документы сортируются по степени релевантности. Каждая страница может содержать от 15 до 50 ссылок на найденные документы. Полный формат выдачи результатов поиска состоит из следующих элементов: URL -адрес сайта, заголовок документа, выдержка из текста страницы с выделенными жирным шрифтом ключевыми словами, дата создания или последнего обновления документа, размер в килобайтах, указание на вид кодировки и ссылка "Найти похожие" для поиска документов, наиболее релевантных данному (см. рис.39).

Рис.39. Формат выдачи результатов поиска ИПС Rambler .

Кроме того указываются сведения о том, сколько всего найденных документов содержится на данном сайте, даются ссылки на первые три из них и список остальных документов.

Я ndex
http://www.yandex.ru

Доступ к ИПС Я ndex был открыт в 1997 году. На сегодняшний день объем проиндексированных в базе ИПС документов составляет более 33 миллионов. Поиск осуществляется не только по web -страницам, но и по специализированным массивам данных, среди которых новости ведущих информационных агентств, товары Интернет-магазинов, ресурсы WAP -серверов, а также каталог Интернет-ресурсов List . ru .
ИПС поддерживает собственный каталог Интернет-ресурсов, формирующийся на основе индекса цитирования Я ndex "а (CY - Citation Yandex). CY какой-либо web -страницы измеряется количеством других страниц, содержащих ссылки на эту страницу. Этот метод оценки ресурсов принципиально отличается от простого учета количества посещений страницы.
ИПС Я ndex имеет простой и расширенный поисковые интерфейсы, а также страницу настройки формата выдачи результатов поиска. ИПС использует собственную систему обозначений логических операторов, а также поддерживает большое количество поисковых функций, позволяющих составлять запросы различной степени сложности.

ПРОСТОЙ ПОИСК

В верхней части домашней страницы ИПС расположено поле для ввода ключевых слов (см. рис.40). По умолчанию слова запроса связываются оператором OR . Над поисковым полем приводится пример формулировки запроса, меняющийся при каждом новом открытии страницы простого поиска. Селекторные кнопки снизу позволяют ограничивать поиск следующими областями: "новости", "товары" и "картинки".

Рис.40. Поле для ввода ключевых слов ИПС Я ndex .

Поиск ключевых слов производится с учетом их морфологии. Если необходимо осуществить поиск по точной словоформе, то перед ним ставится знак "!" без пробела. Система различает слова, набранные строчными и прописными буквами. Поддерживается поиск по фразе, которая заключается в кавычки. Перед ключевым словом допускается постановка знаков "+" и "-", которые заменяют логические операторы AND и NOT соответственно.
ИПС Я ndex использует собственную систему обозначений логических операторов, которая одновременно позволяет задавать степень близости между ключевыми словами. Логические операторы AND и NOT обозначаются символами "&" и "~" соответственно. Употребление этих символов определяет наличие или отсутствие ключевых слов в отдельном предложении документа.
Для того чтобы подняться от уровня предложения до уровня всего документа, необходимо удвоить символ-оператор. Например, по запросу библиотеки && архивы будут найдены документы, содержащие оба слова без учета расстояния между ними, а по запросу библиотеки & архивы - документы, содержащие оба слова в пределах одного предложения.
Логический оператор OR вводится с помощью символа "|" и действует в пределах всего текста документа. Возможно также употребление круглых скобок для составления сложных поисковых предписаний.
Символ "/" ограничивает максимальное расстояние между ключевыми словами определенным числом. Например по запросу библиотеки /5 архивы будут найдены документы, в которых расстояние между ключевыми словами не превышает 5 слов. Комбинация символов "/+" позволяет задать расстояние более точно. Так, запросу библиотеки /2 архивы будут релевантны документы, содержащие фразу "библиотеки, областные архивы".
Также поддерживаются следующие специальные операторы для поиска в определенных областях html -документов:
- $title - в заголовке;
- $anchor - в тексте ссылок;
- #keywords= - в ключевых словах (поле " keywords ");
- #abstract= - поиск в описании (поле " META ");
- #image= - в имени файла изображения;
- #hint= - в подписи к изображению;
- #link= - поиск ссылок на заданный URL-адрес;
- #url= - поиск документов на заданном сайте (странице).

РАСШИРЕННЫЙ ПОИСК

Интерфейс расширенного поиска ИПС Я ndex представляет собой шаблон, состоящий из поля для ввода ключевых слов, словарного фильтра и нескольких областей уточнения запроса.
Словарный фильтр содержит три раскрывающихся меню (см. рис.41). Опции меню слева имеют следующие обозначения:
- " обязательно " - слово должно присутствовать в документе;
- " желательно " - наличие слова не обязательно, но если оно есть, документы с ним ранжируются выше;
- " исключить " - слово не должно присутствовать в документе;
- " операторы " - ввод запроса с использованием поисковых операторов ИПС Я ndex .

Рис.47. Словарный фильтр ИПС Я ndex .

Меню в центре позволяет осуществлять поиск с учетом или без учета морфологических форм слова.
Раскрывающееся меню справа позволяет ограничивать поиска определенной областью html -документа (весь документ, заголовок, URL -адрес, текст гиперссылки) или задавать степень близости между ключевыми словами (точная фраза или наличие всех ключевых слов в пределах одного предложения).
Далее расположены четыре области уточнения запроса (см. рис.42) в зависимости от местонахождения документа, наличия или отсутствия в нем определенных ссылок, изображений и специальных объектов, используемых для создания web -страницы.

Рис.42. Интерфейс расширенного поиска ИПС Я ndex .

На странице расширенного поиска имеется также раскрывающееся меню " Язык ", которое ограничивает поиск документов по алфавитному принципу (латиница или кириллица).

РЕЗУЛЬТАТЫ ПОИСКА И ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ

Результаты поиска выдаются в виде заголовка документа, его описания, URL -адреса, а также ссылок на рубрику каталога Интернет-ресурсов List . ru , в которую попадает данный документ (см. рис.43). Если рубрика содержит более одного релевантного документа, то появляется ссылка "Еще сайты из каталога".

Рис.43. Формат выдачи результатов поиска ИПС Я ndex .

Кроме того описание документа может содержать дополнительные сведения о его размере в килобайтах и о том, в какой форме он содержит слова запроса ("совпадение фразы" или "все слова"). Ссылка "Похожие документы" позволяет осуществить поиск web -страниц, релевантных найденной.
Результаты поиска сортируются по степени релевантности документов запросу. Релевантность документа зависит от ряда факторов, в том числе от частотных характеристик ключевых слов, их близости в тексте документа, а также от веса слова - параметра, который пользователь может задать самостоятельно. Для этого используется символ ":" и определенное число. Например, по запросу "городские архивы" библиотеки:3 будут найдены документы, содержащие фразу "городские архивы" и слово "библиотеки", но чем в документе чаще встречается слово "библиотеки", тем ближе он окажется к началу списка результатов.
В числе дополнительных возможностей, предлагаемых пользователям ИПС Я ndex , можно назвать следующие: интеграция с каталогом Интернет-ресурсов List . ru , поиск по новостным лентам ведущих информационных агентств, поиск в электронных магазинах и поиск по российским WAP-ресурсам, а также программа "Региональный Я ndex ".
Поиск по новостным лентам ( http://news.yandex.ru/ ) ведущих информационных агентств дает пользователям возможность получить список ссылок на полный текст информационного сообщения на сайте того или иного агентства. Также осуществляется доставка последних новостей по интересующей теме по электронной почте.
Раздел "Яndex.Товары" ( http://tovar.yandex.ru/ ) позволяет искать необходимые товары как в онлайновых, так и в обычных магазинах, предоставляющих соответствующую информацию.
Программа "Региональный Я ndex " ( http://www.yandex.ru/regions.html ) была создана благодаря сотрудничеству с региональными каталогами. Теперь можно ограничивать поиск ресурсами выбранного региона (Астрахань, Брянск, Владивосток, Воронеж, Екатеринбург, Иркутск и проч.).
В разделе Яndex.WAP ( http://wap.yandex.ru/ ) предлагается два вида поиска: по российским WAP-ресурсам и поиск на территории Москвы. Владелец мобильного телефона, указав свое местоположение (станцию метро или улицу), сможет узнать адреса ближайших станций техпомощи и автозаправки, пунктов обмена валюты и банкоматов, гостиниц, театров, кафе и т.п.


2. МЕТАПОИСКОВЫЕ СИСТЕМЫ

METACRAWLER
http :// www . metacrawler . com

ИПС Metacrawler была создана в 1995 году. При обработке запроса она использует базы данных следующих ПС: Lycos, WebCrawler, Infoseek, Excite, Thunderstone, AltaVista, GoTo, Google , FindWhat , LookSmart , About . com , DirectHit , RealNames и Yahoo. ИПС Metacrawler имеет простой и расширенный поисковые интерфейсы, а также страницу создания предустановок поиска.

ПРОСТОЙ ПОИСК

Запрос из ключевых слов вводится в поисковое поле (см. рис.44). Расположенные ниже селекторные кнопки определяют следующие режимы поиска: " any " - документы, содержащие любое слово запроса; " all " - документы, содержащие все слова; " phrase " - поиск по фразе.

Рис.44. Поле для ввода ключевых слов ИПС Metacrawler .

Опции раскрывающегося меню справа позволяют ограничить область поиска пространством WWW (" The Web "), группами новостей (" Newsgroups "), аудиофайлами или файлами в формате Mp 3 (" Audio / Mp 3 "). При составлении запроса можно использовать специальные операторы "+" (соответствует логическому оператору AND) и "-"(соответствует логическому оператору NOT).

РАСШИРЕННЫЙ ПОИСК

На странице расширенного поиска содержатся дополнительные опции для уточнения запроса и определения формы вывода результатов поиска.
Область " Engines to Use " позволяет сузить круг ПС, в базах которых будет производиться поиск. Если ни одна опция этой области не отмечена, то поиск будет производиться во всех ИПС.
Опции раскрывающегося меню " Domain/Origin " позволяют ограничить область поиска географическим регионом или одним из трех доменов верхнего уровня (.com, .edu, .gov).
Раскрывающееся меню " Speed/Timeout " определяет лимит времени, отведенный на проведение поиска (от 5 сек до 2 мин).
Область " Quantity " состоит из двух раскрывающихся меню. Первое меню задает количество результатов, выводимых на страницу (от 10 до 30), второе определяет количество результатов, которое можно получить от каждой ПС (от 10 до 30).
Селекторные кнопки области " View Results " позволяют сортировать документы по релевантности, по сайтам или по поисковым системам, ответившим на запрос.

Рис.45. Интерфейс расширенного поиска ИПС Metacrawler .

РЕЗУЛЬТАТЫ ПОИСКА И ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ

Результаты поиска выводятся в виде заголовка документа, первых строк документа (со ссылкой на ИПС, от которой получен ответ), URL -адреса и списка всех ИПС, в базе которых была обнаружена ссылка на данный документ. Ссылка " More Like This " дает пользователю возможность получить список документов, наиболее релевантных найденному (см. рис. 46).

Рис.46. Формат выдачи результатов поиска ИПС Metacrawler .

Каждая ПС по-разному оценивает степень релевантности найденного документа. ИПС Metacrawler учитывает эти методы оценки и с помощью специальных алгоритмов приводит их к общему знаменателю. Суммарная оценка степени релевантности выставляется по шкале, максимальное значение которой составляет 1000 баллов. Эта оценка находится перед URL -адресом найденного документа.
ИПС Metacrawler имеет дополнительные возможности сортировки результатов поиска. Пользователь может сгруппировать найденные документы по сайтам или по тем, ИПС, в базе которых они находятся.
Некоторым ПС требуется значительно большее время для обработки запроса, чем то, которое пользователь может указать на странице расширенного поиска. По этой причине список найденных документов может быть неполным, и тогда на странице с результатами поиска появляется предложение повторить запрос (ссылка " Find again ").
В начале страницы перед списком результатов находится раздел " Are you looking for:", где пользователю предлагается список рубрик каталога Интернет-ресурсов Open Directory Project, относящихся к теме запроса.

Кроме ИПС Metacrawler существует целый ряд метапоисковых систем. Краткие сведения о наиболее известных ПС этого типа приведены в табл.2.

Табл.2. Краткая характеристика метапоисковых систем.

Название ИПС
Используемые ИПС
Поисковые функции
Дополнительные возможности
Cyber 411
www . cyber 411. com
AltaVista , DejaNews , Excite, Galaxy, GoTo, HotBot, LookSmart, Lycos, Magellan, PlanetSearch, Search.com, Snap, Thunderstone, WebCrawler, What-U-Seek, Yahoo
По умолчанию AND ;
Поддерживает AND , OR , NOT и использование скобок
Использование операторов "+" и "-"
DogPile
www . dogpile . com
LookSmart, GoTo.com, Thunderstone, Yahoo!, Open Directory, About.com, InfoSeek, Direct Hit, Lycos и AltaVista
Поддерживает AND, OR, NOT
Поиск в группах новостей и ftp -архивах
MetaFind
www . metafind . com
Excite, AltaVista, Infoseek и WebCrawler
Поддерживает AND, OR, NOT
Сортировка результатов по релевантности, в алфавитном порядке и в сгруппированном по сайтам виде
SavvySearch
www . savvysearch . com
AltaVista, All The Web (Fast Search), Google, Lycos, WebCrawler, Thunderstone, Infoseek, Direct Hit, HotBot, Excite, Galaxy, and NationalDirectory
По умолчанию AND ;
поддерживает поиск по фразе
Поиск в группах новостей и электронных магазинах
Inference Find
www.infind.com
WebCrawler, Yahoo, AltaVista, Infoseek и Excite
Поддерживает AND , OR , NOT и использование скобок


3. КАТАЛОГИ ИНТЕРНЕТ-РЕСУРСОВ

LOOKSMART
http:// www . looksmart . com

Каталог Интернет-ресурсов LookSmart является одним из наиболее значительных и известных каталогов. Несмотря на то что он занимает второе по популярности место после каталога Yahoo !, его объем составляет около 2.300.000 проиндексированных документов (объем каталога Yahoo ! - 1.700.000 документов). Будучи самостоятельным информационным ресурсом, каталог LookSmart активно интегрируется с другими поисковыми службами. Доступ к его базе имеют пользователи таких крупных ИПС, как AltaVista . com , Anzwers . com , MSN Search и Go 2 Net .
Каталог имеет развернутую иерархическую структуру, состоящую из 250.000 категорий и рубрик. Над пополнением базы и поддержанием ее в актуальном состоянии работают более 200 редакторов.
Поиск по ключевому слову осуществляется с домашней страницы каталога. По умолчанию все слова запроса связываются оператором AND . На данный момент не поддерживается поиск по фразе, но создатели каталога обещают в скором будущем ввести эту поисковую функцию. Поиск в каталоге происходит с учетом морфологических форм ключевых слов, но строчные и прописные буквы не различаются. В числе недостатков каталога LookSmart эксперты отмечают отсутствие расширенного поискового интерфейса и невозможность составления запроса с использованием логических операторов.
При выдаче результатов поиска первыми выводятся ссылки на категории и рубрики каталога, содержащие ключевые слова. Затем пользователю предлагается список найденных документов, состоящий из названия, URL -адреса, первых двух строк аннотации и указания рубрики, в которой находится документ. Если релевантные запросу документы не находятся в каталоге LookSmart , то поиск автоматически переадресуется в базу ИПС AltaVista .
Основными дополнительными возможностями каталога помимо поиска в ИПС AltaVista является доступ к каталогу Direct Hit , собирающему сведения о наиболее популярных сайтах, и служба ответов по почте LookSmart Live . Обращаясь к службе LookSmart Live , пользователь заполняет форму для отправки запроса, указывает адрес своей электронной почты и получает письмо с консультацией специалиста по информационному поиску.

NBCI (SNAP)
http://www.nbci.com

Каталог Интернет-ресурсов NBCi (ранее известный как Snap) обладает значительным объемом проиндексированных документов. В его базе насчитывается более одного миллиона ссылок, разбитых на 80.000 категорий и рубрик. Над развитием каталога работают 30 редакторов, каждый из которых является специалистом по информационному поиску в какой-либо области знания.
Каталог NBCi активно интегрируется с другими поисковыми службами. Его пользователи имеют доступ к специализированной базе графических файлов Ditto . com , а также к информационному массиву компании Inktomi , насчитывающему более 110 миллионов документов. Помимо этого каталог располагает собственной базой мультимедийной информации.
Формирование базы каталога осуществляется двумя путями. На основе ссылок, присылаемых рядовыми пользователями сети Интернет, создается БД LiveDirectory . Затем редакторы каталога выбирают из этой базы сайты с наиболее высокой степенью посещаемости и оценивают их по ряду факторов, таких как информативность, надежность и качество предоставляемой информации и т.д. Обработанные таким образом сайты составляют содержание значительно меньшей по объему базы Top Web Sites .
Отличительной особенностью каталога является поддержка большого количества поисковых функций. Поиск по ключевому слову возможен как с домашней страницы, так и со страницы расширенного поиска. В обоих случаях поддерживается ввод запроса с использованием логических операторов AND ("+"), OR и NOT ("-", " AND NOT "). Операторы должны вводиться прописными буквами. Допускается составление сложного поискового выражения с использованием круглых скобок. Поддерживается поиск по фразе, которая заключается в кавычки, а также функция усечения справа (оператор "*").
Интерфейс страницы расширенного поиска реализован в виде шаблона, состоящего из нескольких областей для уточнения запроса. Первая область представляет собой словарный фильтр, состоящий из двух полей (см. рис.47). При необходимости количество полей можно увеличить, воспользовавшись кнопкой " More Terms ".

Рис.47. Словарный фильтр каталога NBCi .

Первое поле для вводя ключевых слов комбинируется с раскрывающимся меню " Search for ". Его опции имеют следующие обозначения:
- " All the words " - соответствует логическому оператору AND ;
- " Any of the words " - соответствует логическому оператору OR ;
- " The exact phrase " - поиск по фразе;
- " The page title " - поиск в заголовке html -документа;
- " The person " - поиск имени собственного;
- " Links to this URL " - поиск html -документов, содержащих ссылку на данный URL ;
- " The Boolean phrase " - поиск с использованием логических операторов;
- " All forms of the words " - поиск ключевых слов с учетом их морфологии.
Второе поле для ввода ключевых слов комбинируется с раскрывающимся меню " More Search Terms ", опции которого в сокращенном варианте дублируют первое меню и служат для составления сложных поисковых выражений.
Под словарным фильтром расположены селекторные кнопки " Search All Pages " и " Search Only Top-level Pages ", которые задают глубину поиска документов на сайтах. Поиск может проводиться как без ограничения, так и только среди домашних страниц сайтов.
Интерфейс расширенного поиска дает возможность сужения границ поиска по дате создания документа, по языку, на котором написан документ, а также по домену верхнего уровня.
Результаты поиска сортируются по степени релевантности. Первыми выводятся ссылки на документы, найденные в базе Top Web Sites , затем в базе LiveDirectory и далее результаты поиска ИПС Inktomi . Описание документа состоит из названия, URL -адреса и первых двух строк текста.

Open Directory Project
http://dmoz.org/

Каталог Интернет-ресурсов Open Directory Project , ранее называвшийся DMoz , входит в четверку крупнейших универсальных каталогов, объем которых превышает миллион проиндексированных документов. Каталог Open Directory Project содержит более 2.152.000 ссылок и имеет углубленную иерархическую структуру, насчитывающую около 314.000 категорий и рубрик.
Владельцем этого информационного массива является компания Netscape . Каталог активно используется многими крупными ИПС (AltaVista , Lycos , HotBot и другие), но не интегрирован с их БД.
Отличительной чертой каталога Open Directory Project является то, что его база пополняется исключительно за счет ссылок на web -страницы и web -сайты, которые присылают рядовые пользователи сети Интернет. В данный момент команда редакторов-добровольцев, работающих над развитием каталога, насчитывает почти 31.000 человек. Это дает возможность быстро наращивать информационный потенциал ресурса и своевременно пополнять его новыми материалами. По оценкам экспертов, каталог Open Directory Project содержит гораздо меньше "мертвых" ссылок по сравнению с каталогом Yahoo !.
Поиск по ключевому слову осуществляется с домашней страницы каталога. По умолчанию используется логический оператор AND , однако если поиск дает отрицательный результат, то запрос автоматически переходит в режим обработки с оператором OR .
Пользователь имеет возможность составлять поисковое выражение, используя логические операторы AND ("+"), OR и ANDNOT (-), которые могут вводиться как строчными, так и прописными буквами. С помощью оператора "*" поддерживается поисковая функция усечения справа. Существенным недостатком являются отсутствие поиска по фразе.
При выдаче результатов поиска первыми выводятся ссылки на категории и рубрики каталога, содержащие ключевые слова. Затем пользователю предлагается список найденных документов, состоящий из названия, URL -адреса и ссылки на рубрику, к которой относится документ. Результаты сортируются по степени релевантности.
YAHOO !
http:// www . yahoo . com

Каталог Интернет-ресурсов Yahoo ! является старейшим и наиболее известным каталогом. Он был создан в 1994 году и до сих пор занимает первое место по количеству посещений. На данный момент объем его базы составляет более 1,8 миллиона проиндексированных документов. Иерархическая структура Yahoo ! основывается на сокращенной версии списка предметных рубрик Библиотеки Конгресса и насчитывает более 100.000 категорий. Работа над каталогом ведется коллективом опытных редакторов, многие из которых имеют профессиональную библиотечную подготовку. В постоянном штате числятся более 100 редакторов. Помимо этого каталог постоянно пополняется ссылками, которые присылают рядовые пользователи сети Интернет.
Каталог имеет простой и расширенный поисковый интерфейсы. Простой поиск осуществляется с домашней страницы сайта. Встроенная поисковая система поддерживает ввод запроса с логическими операторами AND ("+") и OR , последний используется по умолчанию. Логический оператор NOT заменяется постановкой знака "-" перед ключевым словом. Возможна постановка знаков "+" и "-" перед фразой, которая заключается в кавычки. Для поиска ключевых слов в заголовке html -документа используется специальный оператор " t:". Поддерживается поисковая функция усечения справа, при этом ключевое слово вводится со знаком "*" для замены любого количества символов.
Переход на страницу расширенного поиска осуществляется с домашней страницы каталога по ссылке " Advanced ". Интерфейс расширенного поиска содержит поле для ввода ключевых слов и две области уточнения запроса (см. рис.48). Селекторные кнопки области " Select a search method " дают возможность связать ключевые слова логическими операторами AND или OR , задать поиск точной фразы (" an exact phrase match ") или провести особый вид поиска, так называемая опция " Intelligent default " использует по умолчанию оператор AND , но при отсутствии релевантных документов переходит к поиску с оператором OR .
Область " Select a search area " дает возможность искать документы либо только в каталоге Yahoo !, либо в БД ИПС Google . Можно ограничить поиск датой добавления документа в каталог (за последний день, за последние 3 дня, за последнюю неделю, месяц, 3 месяца, 6 месяцев или 4 года).

Рис.48. Интерфейс расширенного поиска каталога Yahoo !.

При выдаче результатов поиска все документы ранжируются по степени релевантности. При прочих равных условиях выше ранжируются документы, которые содержат ключевые слова в заголовке. Первыми выводятся ссылки на категории и рубрики каталога, содержащие ключевые слова. Затем пользователю предлагается список найденных документов, состоящий из названия, URL -адреса и краткой аннотации. Если поиск в каталоге Yahoo ! дает отрицательный результат, то запрос автоматически переадресовывается поисковой машине Google , которая осуществляет полнотекстовый поиск документов в масштабе всей сети WWW .
Кроме основной англоязычной версии каталог Yahoo ! предлагает пользователям версии сайта, полностью переведенные на другие языки (немецкий, французский, шведский и т.д.). Ссылки на эти версии расположены в нижней части домашней страницы каталога.
Среди достаточно многочисленных российских каталогов Интернет-ресурсов наибольшего внимания заслуживают каталоги List . ru и @ Rus (бывший Ау!). Сведения о каталоге @ Rus , который в данный момент полностью проинтегрирован в структуру портала Апорт, содержатся в главе "Порталы". Ниже приводится описание каталога List . ru .

List.ru
http://www.list.ru

Каталог постоянно пополняется ссылками, которые присылают рядовые пользователи сети Интернет. Помимо этого в его создании принимает участие коллектив редакторов, в обязанности которых входит пополнение рубрики новыми материалами, ведение переписки с пользователями, присылающими ссылки на свои страницы, и написание обзоров по теме.
Все категории каталога делятся на рубрики и, при необходимости более детальной систематизации материала, на подрубрики. Рубрики, отмеченные символом "@", структурно относятся к другим категориям, но содержат близкую по содержанию информацию.
В каждой рубрике список ресурсов упорядочен в алфавитном порядке. При необходимости пользователь может сгруппировать содержание рубрики по дате добавления ссылки в каталог или по степени популярности ресурса, которая определяется количеством его посещений. Количество посещений не отражает реальную посещаемость сайта, а показывает, сколько раз к данному ресурсу обращались пользователи каталога List.ru. Каждый документ открывается в новом окне браузера.
На домашней странице имеется ссылка "Структура каталога", которая открывает в новом окне браузера полный рубрикатор каталога. Реализована возможность перехода из рубрикатора в любую выбранную подкатегорию.
При работе с каталогом пользователь имеет возможность не только последовательно просматривать содержимое разделов и рубрик в поисках нужных ему документов, но и осуществлять поиск по ключевым словам и URL -адресам документов. Допускается использование языка запросов ИПС Я ndex .
При выдаче результатов поиска первыми выводятся ссылки на категории и рубрики каталога, содержащие ключевые слова. Затем пользователю предлагается список найденных документов, состоящий из названия, URL -адреса и краткой аннотации. Результаты сортируются по степени релевантности.

Что это

DuckDuckGo - это довольно известная поисковая система с открытым исходным кодом. Серверы находятся в США. Кроме собственного робота, поисковик использует результаты других источников: Yahoo, Bing, «Википедии».

Чем лучше

DuckDuckGo позиционирует себя как поиск, обеспечивающий максимальную приватность и конфиденциальность. Система не собирает никаких данных о пользователе, не хранит логи (нет истории поиска), использование файлов cookie максимально ограничено.

DuckDuckGo не собирает личную информацию пользователей и не делится ею. Это наша политика конфиденциальности.

Гэбриел Вайнберг (Gabriel Weinberg), основатель DuckDuckGo

Зачем это вам

Все крупные поисковые системы стараются персонализировать поисковую выдачу на основе данных о человеке перед монитором. Этот феномен получил название «пузырь фильтров»: пользователь видит только те результаты, которые согласуются с его предпочтениями или которые система сочтёт таковыми.

Формирует объективную картину, не зависящую от вашего прошлого поведения в Сети, и избавляет от тематической рекламы Google и «Яндекса», основанной на ваших запросах. При помощи DuckDuckGo легко искать информацию на иностранных языках, тогда как Google и «Яндекс» по умолчанию отдают предпочтение русскоязычным сайтам, даже если запрос введён на другом языке.


Что это

not Evil - система, осуществляющая поиск по анонимной сети Tor. Для использования нужно зайти в эту сеть, например запустив специализированный .

not Evil не единственный поисковик в своём роде. Есть LOOK (поиск по умолчанию в Tor-браузере, доступен из обычного интернета) или TORCH (один из самых старых поисковиков в Tor-сети) и другие. Мы остановились на not Evil из-за недвусмысленного намёка на Google (достаточно посмотреть на стартовую страницу).

Чем лучше

Ищет там, куда Google, «Яндексу» и другим поисковикам вход закрыт в принципе.

Зачем это вам

В сети Tor много ресурсов, которые невозможно встретить в законопослушном интернете. И их число будет расти по мере того, как ужесточается контроль властей над содержанием Сети. Tor - это своеобразная сеть внутри Сети со своими социалками, торрент-трекерами, СМИ, торговыми площадками, блогами, библиотеками и так далее.

3. YaCy

Что это

YaCy - децентрализованная поисковая система, работающая по принципу сетей P2P. Каждый компьютер, на котором установлен основной программный модуль, сканирует интернет самостоятельно, то есть является аналогом поискового робота. Полученные результаты собираются в общую базу, которую используют все участники YaCy.

Чем лучше

Здесь сложно говорить, лучше это или хуже, так как YaCy - это совершенно иной подход к организации поиска. Отсутствие единого сервера и компании-владельца делает результаты полностью независимыми от чьих-то предпочтений. Автономность каждого узла исключает цензуру. YaCy способен вести поиск в глубоком вебе и неиндексируемых сетях общего пользования.

Зачем это вам

Если вы сторонник открытого ПО и свободного интернета, не подверженного влиянию государственных органов и крупных корпораций, то YaCy - это ваш выбор. Также с его помощью можно организовать поиск внутри корпоративной или другой автономной сети. И пусть пока в быту YaCy не слишком полезен, он является достойной альтернативой Google с точки зрения процесса поиска.

4. Pipl

Что это

Pipl - система, предназначенная для поиска информации о конкретном человеке.

Чем лучше

Авторы Pipl утверждают, что их специализированные алгоритмы ищут эффективнее, чем «обычные» поисковики. В частности, приоритетными являются профили социальных сетей, комментарии, списки участников и различные базы данных, где публикуются сведения о людях, например базы судебных решений. Лидерство Pipl в этой области подтверждено оценками Lifehacker.com, TechCrunch и других изданий.

Зачем это вам

Если вам нужно найти информацию о человеке, проживающем в США, то Pipl будет намного эффективнее Google. Базы данных российских судов, видимо, недоступны для поисковика. Поэтому с гражданами России он справляется не так хорошо.

Что это

FindSounds - ещё один специализированный поисковик. Ищет в открытых источниках различные звуки: дом, природа, машины, люди и так далее. Сервис не поддерживает запросы на русском языке, но есть внушительный список русскоязычных тегов, по которым можно выполнять поиск.

Чем лучше

В выдаче только звуки и ничего лишнего. В настройках можно выставить желаемый формат и качество звучания. Все найденные звуки доступны для скачивания. Имеется поиск по образцу.

Зачем это вам

Если вам нужно быстро найти звук мушкетного выстрела, удары дятла-сосуна или крик Гомера Симпсона, то этот сервис для вас. И это мы выбрали только из доступных русскоязычных запросов. На английском языке спектр ещё шире.

Если серьёзно, специализированный сервис предполагает специализированную аудиторию. Но вдруг и вам пригодится?

Что это

Wolfram|Alpha - вычислительно-поисковая система. Вместо ссылок на статьи, содержащие ключевые слова, она выдаёт готовый ответ на запрос пользователя. Например, если ввести в форму поиска «сравнить население Нью-Йорка и Сан-Франциско» на английском, то Wolfram|Alpha сразу выведет на экран таблицы и графики со сравнением.

Чем лучше

Этот сервис лучше других подходит для поиска фактов и вычисления данных. Wolfram|Alpha накапливает и систематизирует доступные в Сети знания из различных областей, включая науку, культуру и развлечения. Если в этой базе находится готовый ответ на поисковый запрос, система показывает его, если нет - вычисляет и выводит результат. При этом пользователь видит только и ничего лишнего.

Зачем это вам

Если вы, например, студент, аналитик, журналист или научный сотрудник, то можете использовать Wolfram|Alpha для поиска и вычисления данных, связанных с вашей деятельностью. Сервис понимает не все запросы, но постоянно развивается и становится умнее.

Что это

Метапоисковик Dogpile выводит комбинированный список результатов из поисковых выдач Google, Yahoo и других популярных систем.

Чем лучше

Во-первых, Dogpile отображает меньше рекламы. Во-вторых, сервис использует особый алгоритм, чтобы находить и показывать лучшие результаты из разных поисковиков. Как утверждают разработчики Dogpile, их системы формирует самую полную выдачу во всём интернете.

Зачем это вам

Если вы не можете найти информацию в Google или другом стандартном поисковике, поищите её сразу в нескольких поисковиках с помощью Dogpile.

Что это

BoardReader - система для текстового поиска по форумам, сервисам вопросов и ответов и другим сообществам.

Чем лучше

Сервис позволяет сузить поле поиска до социальных площадок. Благодаря специальным фильтрам вы можете быстро находить посты и комментарии, которые соответствуют вашим критериям: языку, дате публикации и названию сайта.

Зачем это вам

BoardReader может пригодиться пиарщикам и другим специалистам в области медиа, которых интересует мнение массовой по тем или иным вопросам.

В заключение

Жизнь альтернативных поисковиков часто бывает скоротечной. О долгосрочных перспективах подобных проектов Лайфхакер спросил бывшего генерального директора украинского филиала компании «Яндекс» Сергея Петренко .


Сергей Петренко

Бывший генеральный директор «Яндекс.Украины».

Что касается судьбы альтернативных поисковиков, то она проста: быть очень нишевыми проектами с небольшой аудиторией, следовательно без ясных коммерческих перспектив или, наоборот, с полной ясностью их отсутствия.

Если посмотреть на примеры в статье, то видно, что такие поисковики либо специализируются в узкой, но востребованной нише, которая, возможно только пока, не выросла настолько, чтобы оказаться заметной на радарах Google или «Яндекса», либо тестируют оригинальную гипотезу в ранжировании, которая пока не применима в обычном поиске.

Например, если поиск по Tor вдруг окажется востребованным, то есть результаты оттуда понадобятся хотя бы проценту аудитории Google, то, конечно, обычные поисковики начнут решать проблему, как их найти и показать пользователю. Если поведение аудитории покажет, что заметной доле пользователей в заметном количестве запросов более релевантными кажутся результаты, данные без учёта факторов, зависящих от пользователя, то «Яндекс» или Google начнут давать такие результаты.

«Быть лучше» в контексте этой статьи не означает «быть лучше во всём». Да, во многих аспектах нашим героям далеко до и «Яндекса» (даже до Bing далековато). Но зато каждый из этих сервисов даёт пользователю нечто такое, чего не могут предложить гиганты поисковой индустрии. Наверняка вы тоже знаете подобные проекты. Поделитесь с нами - обсудим.

Google Chrome позволяет осуществлять поиск в интернете непосредственно из адресной строки вверху окна браузера (также называемое «универсальное окно поиска »). Если вводить поисковые термины в эту строку, в ней автоматически отображаются результаты поиска с помощью поисковой системы, например, Google.

Можно указать поисковую систему, которую адресная строка будет использовать по умолчанию .

Настройки поисковой системы по умолчанию

Адресная строка Google Chrome по умолчанию использует поиск Google для отображения результатов поиска, но можно использовать и другую поисковую систему :

Если нужной поисковой системы нет в списке, выполните следующие действия, чтобы добавить её как новую поисковую систему .

Добавление, изменение и удаление поисковых систем

Браузер Google Chrome автоматически сохраняет список поисковых систем, которые встречались во время просмотра. Например, если вы посетите страницу https://www.youtube.com , браузер автоматически определит и добавит поисковую систему YouTube в список поисковых систем, которыми можно пользоваться. Поэтому вы сможете осуществлять поиск на YouTube непосредственно из адресной строки, даже не переходя на этот сайт.

Чтобы вручную добавлять, редактировать или удалять поисковые системы в браузере, выполните следующие действия:

Подробнее о настройках поисковой системы

Ниже приведены несколько советов по информации, которую нужно предоставить для каждой поисковой системы.

  • Добавление новой поисковой системы . Введите метку для поисковой системы.
  • Ключевое слово . Введите текстовую комбинацию, которую нужно использовать для этой поисковой системы. Для быстрого доступа в адресной строке к этой поисковой системе воспользуйтесь ключевым словом.
  • URL-адрес . Введите адрес поисковой системы.

Чтобы найти соответствующий веб-адрес, выполните следующие действия:

  1. Откройте поисковую систему, которую хотите добавить.
  2. Выполните поиск.
  3. Скопируйте и вставьте веб-адрес страницы результатов поиска в поле URL. Помните, что URL страницы результатов поиска отличается от URL-адреса веб-сайта. Например, доступ к Google вы получаете по адресу http://www.google.com , но нужно добавить URL страницы результатов поиска, например, http://www.google.com/search?q=XYZ , если вы искали «xyz».
  4. Замените поисковый термин в URL на %s . Например, для поисковой системы Google конечный URL-адрес поисковой системы будет http://www.google.com/search?q=%s . При вводе поискового запроса в адресной строке, %s будет автоматически заменен на ваш поисковый термин.

Убедитесь, что вы включили %s в URL. Иначе вы не сможете настроить эту поисковую систему как поисковую систему по умолчанию .

Что это

DuckDuckGo - это довольно известная поисковая система с открытым исходным кодом. Серверы находятся в США. Кроме собственного робота, поисковик использует результаты других источников: Yahoo, Bing, «Википедии».

Чем лучше

DuckDuckGo позиционирует себя как поиск, обеспечивающий максимальную приватность и конфиденциальность. Система не собирает никаких данных о пользователе, не хранит логи (нет истории поиска), использование файлов cookie максимально ограничено.

DuckDuckGo не собирает личную информацию пользователей и не делится ею. Это наша политика конфиденциальности.

Гэбриел Вайнберг (Gabriel Weinberg), основатель DuckDuckGo

Зачем это вам

Все крупные поисковые системы стараются персонализировать поисковую выдачу на основе данных о человеке перед монитором. Этот феномен получил название «пузырь фильтров»: пользователь видит только те результаты, которые согласуются с его предпочтениями или которые система сочтёт таковыми.

Формирует объективную картину, не зависящую от вашего прошлого поведения в Сети, и избавляет от тематической рекламы Google и «Яндекса», основанной на ваших запросах. При помощи DuckDuckGo легко искать информацию на иностранных языках, тогда как Google и «Яндекс» по умолчанию отдают предпочтение русскоязычным сайтам, даже если запрос введён на другом языке.


Что это

not Evil - система, осуществляющая поиск по анонимной сети Tor. Для использования нужно зайти в эту сеть, например запустив специализированный .

not Evil не единственный поисковик в своём роде. Есть LOOK (поиск по умолчанию в Tor-браузере, доступен из обычного интернета) или TORCH (один из самых старых поисковиков в Tor-сети) и другие. Мы остановились на not Evil из-за недвусмысленного намёка на Google (достаточно посмотреть на стартовую страницу).

Чем лучше

Ищет там, куда Google, «Яндексу» и другим поисковикам вход закрыт в принципе.

Зачем это вам

В сети Tor много ресурсов, которые невозможно встретить в законопослушном интернете. И их число будет расти по мере того, как ужесточается контроль властей над содержанием Сети. Tor - это своеобразная сеть внутри Сети со своими социалками, торрент-трекерами, СМИ, торговыми площадками, блогами, библиотеками и так далее.

3. YaCy

Что это

YaCy - децентрализованная поисковая система, работающая по принципу сетей P2P. Каждый компьютер, на котором установлен основной программный модуль, сканирует интернет самостоятельно, то есть является аналогом поискового робота. Полученные результаты собираются в общую базу, которую используют все участники YaCy.

Чем лучше

Здесь сложно говорить, лучше это или хуже, так как YaCy - это совершенно иной подход к организации поиска. Отсутствие единого сервера и компании-владельца делает результаты полностью независимыми от чьих-то предпочтений. Автономность каждого узла исключает цензуру. YaCy способен вести поиск в глубоком вебе и неиндексируемых сетях общего пользования.

Зачем это вам

Если вы сторонник открытого ПО и свободного интернета, не подверженного влиянию государственных органов и крупных корпораций, то YaCy - это ваш выбор. Также с его помощью можно организовать поиск внутри корпоративной или другой автономной сети. И пусть пока в быту YaCy не слишком полезен, он является достойной альтернативой Google с точки зрения процесса поиска.

4. Pipl

Что это

Pipl - система, предназначенная для поиска информации о конкретном человеке.

Чем лучше

Авторы Pipl утверждают, что их специализированные алгоритмы ищут эффективнее, чем «обычные» поисковики. В частности, приоритетными являются профили социальных сетей, комментарии, списки участников и различные базы данных, где публикуются сведения о людях, например базы судебных решений. Лидерство Pipl в этой области подтверждено оценками Lifehacker.com, TechCrunch и других изданий.

Зачем это вам

Если вам нужно найти информацию о человеке, проживающем в США, то Pipl будет намного эффективнее Google. Базы данных российских судов, видимо, недоступны для поисковика. Поэтому с гражданами России он справляется не так хорошо.

Что это

FindSounds - ещё один специализированный поисковик. Ищет в открытых источниках различные звуки: дом, природа, машины, люди и так далее. Сервис не поддерживает запросы на русском языке, но есть внушительный список русскоязычных тегов, по которым можно выполнять поиск.

Чем лучше

В выдаче только звуки и ничего лишнего. В настройках можно выставить желаемый формат и качество звучания. Все найденные звуки доступны для скачивания. Имеется поиск по образцу.

Зачем это вам

Если вам нужно быстро найти звук мушкетного выстрела, удары дятла-сосуна или крик Гомера Симпсона, то этот сервис для вас. И это мы выбрали только из доступных русскоязычных запросов. На английском языке спектр ещё шире.

Если серьёзно, специализированный сервис предполагает специализированную аудиторию. Но вдруг и вам пригодится?

Что это

Wolfram|Alpha - вычислительно-поисковая система. Вместо ссылок на статьи, содержащие ключевые слова, она выдаёт готовый ответ на запрос пользователя. Например, если ввести в форму поиска «сравнить население Нью-Йорка и Сан-Франциско» на английском, то Wolfram|Alpha сразу выведет на экран таблицы и графики со сравнением.

Чем лучше

Этот сервис лучше других подходит для поиска фактов и вычисления данных. Wolfram|Alpha накапливает и систематизирует доступные в Сети знания из различных областей, включая науку, культуру и развлечения. Если в этой базе находится готовый ответ на поисковый запрос, система показывает его, если нет - вычисляет и выводит результат. При этом пользователь видит только и ничего лишнего.

Зачем это вам

Если вы, например, студент, аналитик, журналист или научный сотрудник, то можете использовать Wolfram|Alpha для поиска и вычисления данных, связанных с вашей деятельностью. Сервис понимает не все запросы, но постоянно развивается и становится умнее.

Что это

Метапоисковик Dogpile выводит комбинированный список результатов из поисковых выдач Google, Yahoo и других популярных систем.

Чем лучше

Во-первых, Dogpile отображает меньше рекламы. Во-вторых, сервис использует особый алгоритм, чтобы находить и показывать лучшие результаты из разных поисковиков. Как утверждают разработчики Dogpile, их системы формирует самую полную выдачу во всём интернете.

Зачем это вам

Если вы не можете найти информацию в Google или другом стандартном поисковике, поищите её сразу в нескольких поисковиках с помощью Dogpile.

Что это

BoardReader - система для текстового поиска по форумам, сервисам вопросов и ответов и другим сообществам.

Чем лучше

Сервис позволяет сузить поле поиска до социальных площадок. Благодаря специальным фильтрам вы можете быстро находить посты и комментарии, которые соответствуют вашим критериям: языку, дате публикации и названию сайта.

Зачем это вам

BoardReader может пригодиться пиарщикам и другим специалистам в области медиа, которых интересует мнение массовой по тем или иным вопросам.

В заключение

Жизнь альтернативных поисковиков часто бывает скоротечной. О долгосрочных перспективах подобных проектов Лайфхакер спросил бывшего генерального директора украинского филиала компании «Яндекс» Сергея Петренко .


Сергей Петренко

Бывший генеральный директор «Яндекс.Украины».

Что касается судьбы альтернативных поисковиков, то она проста: быть очень нишевыми проектами с небольшой аудиторией, следовательно без ясных коммерческих перспектив или, наоборот, с полной ясностью их отсутствия.

Если посмотреть на примеры в статье, то видно, что такие поисковики либо специализируются в узкой, но востребованной нише, которая, возможно только пока, не выросла настолько, чтобы оказаться заметной на радарах Google или «Яндекса», либо тестируют оригинальную гипотезу в ранжировании, которая пока не применима в обычном поиске.

Например, если поиск по Tor вдруг окажется востребованным, то есть результаты оттуда понадобятся хотя бы проценту аудитории Google, то, конечно, обычные поисковики начнут решать проблему, как их найти и показать пользователю. Если поведение аудитории покажет, что заметной доле пользователей в заметном количестве запросов более релевантными кажутся результаты, данные без учёта факторов, зависящих от пользователя, то «Яндекс» или Google начнут давать такие результаты.

«Быть лучше» в контексте этой статьи не означает «быть лучше во всём». Да, во многих аспектах нашим героям далеко до и «Яндекса» (даже до Bing далековато). Но зато каждый из этих сервисов даёт пользователю нечто такое, чего не могут предложить гиганты поисковой индустрии. Наверняка вы тоже знаете подобные проекты. Поделитесь с нами - обсудим.