Logo

Всё об Internet...

Home Links GuestBook

Принципы поиска информации в Интернете

 

Принципы поиска информации в Интернете

Очень трудно искать черную кошку в темной

комнате, особенно если там ее нет.

Конфуции

Став полноправным пользователем Интернета, вы получаете доступ к огромному числу информационных ресурсов. Например, количество имеющихся в Сети HTML-документов измеряется уже не десятками, а сотнями миллионов. А ведь в Интернете можно найти не только текст, но и программы, изображения, звуковые файлы и т. д. С одной стороны, в этом море информации наверняка найдется и та, которой вы интересуетесь, даже если сфера ваших интересов весьма специфична. С другой стороны, найти среди сотен миллионов Web-страниц именно те, которые вам интересны, — задача не из легких. Облегчить пользователям Сети поиск необходимой информации призваны поисковые системы.

Информационно-поисковые системы размещаются в Интернете на общедоступных серверах. Основой поисковых систем являются так называемые поисковые машины, или автоматические индексы. Специальные программы-роботы (известные также как «пауки») в автоматическом режиме периодически обследуют Интернет на основе определенных алгоритмов, проводя индексацию найденных документов. Созданные индексные базы данных используются поисковыми машинами для предоставления пользователю доступа к размещенной на узлах Сети информации. Пользователь в рамках соответствующего интерфейса формулирует запрос, который обрабатывается системой, после чего в окно броузера выдаются результаты обработки запроса. Механизмы обработки запросов постоянно совершенствуются, и современные поисковые системы не просто перебирают огромное число документов. Поиск ведется на основе оригинальных и весьма сложных алгоритмов, а его результаты анализируются и сортируются таким образом, чтобы представленная пользователю информация в наибольшей степени соответствовала его ожиданиям.

В настоящее время в развитии поисковых систем наблюдается тенденция объединения автоматических индексных поисковых машин и составляемых вручную каталогов Интернет-ресурсов. Ресурсы этих систем удачно дополняют друг друга, и объединение их возможностей вполне логично.

Тем не менее исследования возможностей поисковых машин, даже самых мощных из них, таких как AltaVista или HotBot, показывают, что реальная полнота охвата ресурсов Всемирной паутины отдельной такой системой не превышает 30%. Поэтому не стоит ограничиваться использованием какой-либо одной из них. Если вам не удалось отыскать интересующую вас информацию с помощью одной системы, попробуйте воспользоваться другой.

Каждая поисковая система имеет свои особенности, и качество полученного результата зависит от предмета поиска и точности формулировки запроса. Поэтому, приступая к поиску информации, прежде всего нужно четко представлять себе, что именно и где вы хотите найти. Например, зарубежные системы поражают числом проиндексированных документов. Для поиска в области профессиональных знаний, особенно информации на иностранном языке, такие системы, как Alta Vista, HotBot или Northern Light, подходят наилучшим образом.

Однако для поиска информации на русском языке, особенно в российской части Интернета, лучше приспособлены русские поисковые машины. Во-первых, они специально ориентированы именно на русскоязычные ресурсы Сети и, как правило, отличаются большей полнотой охвата и глубиной исследования этих ресурсов. Во-вторых, российские системы работают с учетом морфологии русского языка, то есть в поиск включаются все формы искомых слов. Российские системы лучше учитывают и такую исторически сложившуюся особенность российских Интернет-ресурсов, как сосуществование нескольких кодировок кириллицы.

Интерфейс всех поисковых систем построен примерно одинаково. Пользователю предлагается ввести запрос в специальное поле, а затем инициировать поиск щелчком на кнопке. Система выполняет поиск и выдает результаты в окно броузера. Кроме того, многими поисковыми системами пользователю предоставляется возможность задать дополнительные критерии поиска. Например, можно искать только в определенной тематической категории или только на определенных серверах. Вот так, например, выглядит окно поиска системы Апорт (рис. 4.1):

Рис. 4.1. Окно поиска системы Апорт

Успех поиска в значительной степени зависит от формулировки запроса. Вот несколько наиболее общих принципов составления запросов, применимых для большинства поисковых систем.

В запрос следует включать несколько слов, определяющих предмет поиска.
Попробуйте задать человеку вопрос, состоящий из одного слова, и получить на него вразумительный ответ. Скорее всего, диалог будет напоминать общение героев старого анекдота, случайно оказавшихся в кабине самолета:
— Приборы?

— Пятьдесят...

— Что «пятьдесят»?

— А что «приборы»?

Результат поиска будет намного лучше, если запрос состоит из нескольких связанных друг с другом слов. Старайтесь сформулировать вопрос как можно точнее. Например, запрос «сорта светлого пива» даст более определенный результат, чем «слабоалкогольные напитки».
Используйте синонимы. Если полученный список результатов содержит слишком мало полезных документов, попробуйте заменить искомое слово синонимом. Например, вместо слова «видеоконтроллер» можно попробовать «графический адаптер». Попытайтесь также использовать в запросе оба синонима.
Проверяйте орфографию. Если система не нашла ни одного документа, содержащего заданное слово, то стоит проверить правильность его написания. Например, если по запросу «дрессировка ротвейлеров и бультерьеров» были найдены только сведения по дрессировке ротвейлеров, скорее всего, вы просто допустили ошибку в слове «бультерьеров».
Следует также учитывать особенности интерфейса той поисковой системы, с которой вы работаете. Например, некоторые системы ограничивают поиск, если слово было набрано с прописной буквы. То есть, если в запросе набрано мерседес, то будут найдены документы, содержащие слова «мерседес» «Мерседес» и «МЕРСЕДЕС». А по запросу Мерседес будут найдены только те документы, где это слово написано с прописной буквы. В каждой поисковой системе имеется раздел Справка или Help, где можно ознакомиться с особенностями интерфейса этой системы.

Расширенный поиск

Кроме обычного запроса на естественном языке пользователи большинства систем могут также воспользоваться режимом «расширенного поиска» (в зарубежных системах — Advanced Search), в котором с помощью специальных символов можно задать более точные критерии и область поиска. Русское название этого режима, родившееся, видимо, из не совсем точного перевода с английского, нельзя признать удачным, так как на самом деле расширенным является только набор критериев поиска, а вот область поиска в большинстве случаев существенно сужается.

Большинство поисковых систем позволяет использовать весьма развитый и сложный синтаксис запросов. Однако по данным создателей поисковых систем, которые, будучи людьми дотошными, ведут учет посещаемости различных страниц своих серверов, оказывается, что лишь около десяти процентов посетителей добираются до страниц с описанием языка усложненных запросов. Это говорит не столько о том, что пользователи Сети не желают разбираться в специальных символах и составлять некие формулы, сколько о том, что большинство ищущих вполне удовлетворяют результаты, полученные с помощью простого запроса. Тем не менее многие 41ункции расширенного поиска весьма удобны и одинаковы для разных систем, а запомнить правила их использования не сложно.

Например, почти все системы имеют поддержку знаков + и -. Если вы хотите, чтобы указанное в запросе слово обязательно присутствовало в найденных документах, поставьте перед ним + (между знаком и словом не должно быть пробела). Так, если по запросу крокодил Гена будут найдены все документы, в которых встречается либо слово «крокодил», либо имя «Гена», то по запросу крокодил+Гена вы получите список документов, где упоминаются только крокодилы по имени Гена. Правда, Геной зовут не только героя популярного мультфильма. Так что, если вы не хотите вместо сказки о симпатичном крокодиле с гармошкой встретить в найденных документах материал о лидере КПРФ, запрос следует уточнить: крокодил-+Гена-Зюганов. В этом случае все упоминания фамилии известного политика, даже если авторы документа фамильярно назвали его Геной, будут из результатов поиска исключены.

Удобна также функция поиска только точной фразы. Например, вы хотите найти текст песни, но не помните, как она называется, а вот кто ее написал вы... тоже забыли, но зато точно помните, что в ней есть такие слова: «На поляне траву зайцы в полночь косили». Введите эту фразу в окно запроса и заключите ее в кавычки. Система найдет только документы, содержащие указанную фразу.

С помощью усложненных запросов можно задать самые разнообразные режимы поиска, например, ограничить поиск только определенными сайтами или определенными элементами документа. Можно также настраивать способы сортировки результатов поиска, определив более и менее важные слова в запросе. Зачастую создатели системы предоставляют также возможность указания взаимного расположения искомых слов в предложении или документе, например, насколько далеко одно искомое слово может отстоять от другого. Подробное описание синтаксиса запросов для конкретных систем имеется на сайтах этих систем в разделе справочной информации.

 

| Home |

 

Сайт создан в системе uCoz