Расписание занятий
En
Мытищинский филиал МГТУ им. Н. Э. Баумана

Полезные и интересные ссылки в Интернет

Поисковые системы и каталоги ресурсов Интернет

Поиск информации в сети Интернет

Что такое поисковые системы, и для чего они нужны

В глобальной сети Интернет можно найти информацию по любой интересующей теме. Но самое трудное в работе с сетью Интернет — найти нужную информацию. Т. к. Интернет не имеет четкой централизованной структуры, развивается хаотично, и в мире появляются все новые и новые серверы, вопросы поиска информации становятся очень актуальными.

Поисковые системы значительно облегчают работу в Интернет и помогают нам быстро найти нужную информацию в огромном массиве серверов Интернет (WWW, FTp, Usenet и др. ресурсах Интернет). Во всемирной паутине Intenet находится несколько тысяч поисковых систем, среди которых есть как уже хорошо зарекомендовавшие себя, так и менее известные. Из наиболее известных поисковых машин можно назвать среди российских: Яндекс, Rambler, АПОРТ! и др.; среди зарубежных: bing, Google, Yahoo! и др.

Каждая из поисковых систем имеет какие-то свои достоинства и недостатки, которые определяются принципом работы поисковой машины, удобством использования, ее оформлением, сложностью языка запросов, наличием различных расширенных функций (управление форматом и ранжированием выводимой информации, исправление орфографических ошибок и ошибочной раскладки клавиатуры при вводе ключевых слов, перевод страницы на др. языки т. д.), скоростью работы, и др. параметрами. Выбор поисковой системы для конкретного применения определяется целью поиска, характером искомой информации, желаемым форматом выводимых данных и шириной охвата отслеживаемых адресов серверов в мире Интернет.

Наиболее популярные поисковые системы

  • Яндекс (Компания «Яндекс») — средство полнотекстового поиска информации с учетом морфологии русского языка; поиск по сайтам, своему каталогу, новостям, товарам, географическим картам, словарям, блогам, картинкам, документам Microsoft Office и Adobe Acrobat PDF
  • Rambler (ОАО «Рамблер Интернет Холдинг») — поиск по сайтам с учетом морфологии русского и английского языков; имеет и каталоговую систему поиска.
  • NIGMA — интеллектуальная поисковая система (МГУ им. М. В. Ломоносова и Stanford University) — поиск документов, картинок, книг, новостей через Google, Yahoo, MSN, Yandex, Rambler, Altavista, Апорт; также система предоставляет уникальный поиск по химическим формулам и реакциям
  • Google — поиск по сайтам (есть возможность поиска по русскоязычным сайтам); поиск документов в форматах Adobe Acrobat PDF, Microsoft Office, postScript, Corel Wordperfect, Lotus 1-2-3 и др.; поиск картинок, видео, новостей, поиск по картам; возможность поиска по русскоязычным и российским сайтам; есть система перевода текста на др. языки (49 языков)
  • bing (Microsoft Corp.) — поиск по сайтам, изображений и видео; возможность поиска по русскоязычным и российским сайтам; есть система перевода текста на др. языки (22 языка)
  • Yahoo! (Yahoo) — поиск по сайтам, адресам E-Mail и др.

Список наиболее популярных поисковых серверов в России и СНГ в порядке убывания количества поисковых запросов по статистике популярного рейтингового ресурса SpyLog в настоящее время выглядит следующим образом:

  1. Яндекс — 61,3 %,
  2. Google — 24,9 %,
  3. Mail.Ru — 8,5 %,
  4. Rambler — 1,9 %,
  5. Bing — 0,8 %,
  6. Nigma.ru — 0,3 %,
  7. Yahoo! — 0,2 %,
    и остальные — 1,3 %.

За пределами России рейтинг поисковых систем возглавляет Google, далее следуют bing и Yahoo!.

Поиск по ключевым словам. Язык запросов поисковой системы

Поисковая система обычно имеет поле для ввода ключевых слов, по которым она находит документы, содержащие эти ключевые слова. Чем лучше (качественнее) составлен запрос к поисковой машине, тем меньше общее количество найденных документов, и больше из них документов, соответствующих тому, что Вам требуется. Если запрос очень простой или составлен неграмотно, то поисковая машина может Вам выдать несколько миллионов документов, которые Вам не просмотреть за всю жизнь.

Используя язык запроса, содержащий логические операции (логические операторы AND, OR, NOT, скобки и др.), префиксы обязательности присутствия ключевых слов в документе «+» и «-» (при поиске по узкоспециализированным терминам — предпочтительней использовать), расположения ключевых слов в документе рядом или на определенном расстоянии и т. д.) и др. элементы, и большее количество связанных ими ключевых слов, можно значительно сузить область поиска и более качественно составить запрос к поисковому серверу. Следует учитывать, что разные поисковые системы могут иметь как различающиеся языки запросов, так и очень похожие.

На сайтах поисковых систем обычно есть ссылки на справочную информацию по использованию поисковых сервисов, языков запросов, рекомендации по поиску и т. д.

Некоторые поисковые системы дополнительно имеют функцию расширенного поиска, позволяющую пользователю более точно описать то, что ему конкретно нужно и без знания языка запроса. Функцию расширенного поиска имеют, например, поисковые системы Яндекс и Google.

Описание языка запросов наиболее популярных поисковых систем (сравнительная таблица) дано внизу этой страницы.

Типы поисковых систем. Какой поисковой системой воспользоваться

Существует 2 основных типа поисковых систем Интернет: индексные и классификационные (каталоговые). Индексные поисковые системы (например, Яндекс, Google, Rambler, АПОРТ!, и др.), работая в автоматическом режиме обновления своей информации, просматривают в Интернет содержимое серверов, индексируя информацию, содержащуюся в них и внося информацию о расположении слов на страницах сайтов в свои базы данных. Каталоговые системы поиска (например, Rambler, Yahoo! и др.) содержат тематически структурированный каталог серверов, и чаще всего пополняются вручную. Обычно на WWW-странице классификационной поисковой системы содержится и поле для ввода ключевых слов для поиска в собственной базе данных. В каталоговой системе поиска можно, начав с более крупной тематической рубрики, и постепенно спускаясь дальше по рубрикам, прийти к ссылке на нужный Вам сайт. В одних случаях бывает удобней воспользоваться первым типом поисковых систем, в других — вторым. Есть поисковые системы, сочетающие в себе оба принципа работы. В частности, большинство индексных поисковых систем имеют и каталоговую систему поиска. Также поисковые машины могут использовать и какие-то другие принципы методы поиска.

Многие поисковые системы преобразовались в Интернет-порталы, объединяющие в себе большое количество ресурсов и сервисов. На страницах таких порталов можно прочитать новости, ознакомиться с программой телепередач, узнать о погоде, курсах валют, воспользоваться картографическим сервисом и мн. др.

Для поиска по российским ресурсам Интернет рекомендуется пользоваться российскими поисковыми системами, ввиду наличия русскоязычного интерфейса, возможности поиска по русским словам, учета особенностей русского языка, близости расположения сервера и т. д. Для поиска по зарубежным ресурсам можно воспользоваться многоязычными поисковыми машинами, имеющими в т. ч. и русскоязычный пользовательский интерфейс, а также возможность перевода найденных страниц на русский язык (например, Google).

Для поиска одновременно в нескольких поисковых системах можно воспользоваться так называемыми поисковыми метамашинами, обращающимися сразу к нескольким поисковым средствам, например, NIGMA.
Как известно, поисковых систем в Интернете много и найти нужную информацию крайне непросто. Отсутствие единого стандарта на спецификацию задачи поиска в Сети приводит к тому, что на каждом узле предлагается собственный способ решения поставленной задачи. В результате пользователь, не искушенный в премудростях синтаксических конструкций запросов к поисковой системе, либо не полностью использует возможности поисковика, либо, изучив функции конкретной системы, постоянно обращается лишь к одной.
Мета-поисковая система имеет единый язык запросов, иногда даже возможность перевода ключевых слов на др. языки. Такие поисковые системы, получая результаты запросов от др. поисковых систем, фильтруют полученные материалы, убирая дублирующиеся ссылки, и сортируют их по релевантности (степени нужности). Для поиска зарубежных ресурсов можно пользоваться российскими поисковыми метамашинами, обращающимися к другим поисковым средствам (в том числе зарубежным). Это удобно, ввиду наличия русскоязычного интерфейса, возможности поиска по русским словам, учета особенностей русского языка, близости расположения сервера, имеющего в большинстве случаев доступ к скоростному каналу за рубеж и т. д. Среди них можно назвать, например, поисковую метамашину NIGMA и др.

Существуют также поисковые системы, специализирующиеся по поиску по одной какой-либо теме (например, по информационным технологиям, по музыке, по ресурсам, посвященные природе и т. д.)

В некоторых случаях можно обойтись и без применения поисковых систем. Так, например, большинство крупных зарубежных фирм имеют адреса типа http://www.название_фирмы.com (например, официальный сайт Microsoft Corporation — http://www.microsoft.com), а большинство крупных российских фирм — http://www.название_фирмы.ru, (например, сайт компании «Лукоил» — http://www.lukoil.ru).

Можно также найти нужный Вам WWW-сервер в так называемых «Желтых страницах Интернет» (Yellow pages), выпускаемых в печатном виде или размещаемых в сети Интернет (Yellowpages.com, Желтые страницы интернет и мн. др.) В «Желтых страницах» ссылки на WWW-сервера располагаются по рубрикам. Каждому серверу дается краткое описание и иногда небольшой снимок первой страницы.

Также, собираясь посетить какой-то зарубежный сервер (например, официальный WWW или FTp-сервер какой-либо зарубежной фирмы), можно учитывать и такие возможные варианты, как наличие зеркальных серверов на территории России (копии зарубежного сайта) или наличие официального российского сайта зарубежной компании (на русском языке), наряду со своим главным официальным сайтом (например, официальный российский сайт компании Intel Corporation — http://www.intel.ru). Конечно же, лучше воспользоваться именно этими вариантами.

При выборе системы поиска не нужно следовать своим устоявшимся привычкам, использовать при любом поиске, например, только одну систему Яндекс. В разных случаях бывает лучше использовать разные системы поиска, используя для лучшей организации поиска какие-то особенности и расширенные возможности различных поисковых систем.

Описание языка запросов наиболее популярных поисковых систем (сравнительная таблица)

\ Яндекс Rambler Google
Ссылки на описания языков поисковых запросов Яндекс.Помощь: Поиск Рамблер-Помощь Cправка — Веб-поиск
Логические операторы & — И в пределах предложения,
&& — И в пределах документа,
| — ИЛИ,
~ — И-НЕ в пределах предложения,
~~ — И-НЕ в пределах документа,
( и ) — скобки
AND или & — И,
OR или | — ИЛИ,
NOT или ! — НЕ,
( и ) — скобки
OR — ИЛИ
Префиксы обязательности + и - Нет + и -
Учет расстояний между словами "Фразы в кавычках",
Слово1 /N Слово2 — расстояние между словами не больше N слов,
Слово1 /(-N M) Слово2 — расстояние между словами от -N слов слева и M слов справа,
Слово1 &&/(-N M) Слово2 — расстояние между словами от -N предложений слева и M предложений справа
"Фразы в кавычках",
(N, Слово1 Слово2 ...) — расстояние между словами не более N слов
(В противном случае расстояние не более 40 слов между словами запроса;
без кавычек и скобок предлоги, частицы и артикли игнорируются)
"Фразы в кавычках"
Учет морфологии языка (словоформы) На основе правил,
!Слово — указание точной словоформы
Словарный
(* и ? — зарезервированы, но пока не используются)
Нет
Учет регистра слов Нет, кроме Слов с большой буквы Нет, кроме Слов С Большой Буквы, следующих подряд Нет
Расширенные операторы $title $anchor
#keywords #abstract #image #hint #url #link
*
Нет cashe: link: related: info: stocks: site: allintitle: intitle: allinurl: inurl:
admission site:
Language: Date: Occurrences: Domains: SafeSearch:
Уточнение поиска Есть Есть Нет
Расширенный поиск Словарный фильтр, Дата, Сайт/вершина, Ссылка, Изображение, Специальные объекты, Язык, Формат выдачи Поиск по тексту, Искать слова запроса, Расстояние между словами запроса, Исключить документы содержащие следующие слова, Язык документа, Искать документы только на следующих сайтах, Вывод результатов поиска, Сортировать, Выдавать, Форма вывода, Связанные запросы Найти результаты (со всеми словами, с точной фразой, с любым из слов, без слов), Язык, Формат файла, Дата, Упоминание, Домен, Поиск по странице (Похожие, Ссылки)
Объекты поиска Сайты, Каталог, Новости, Маркет, Карты, Словари, Блоги, Картинки, RTF, DOC, XLS, PDF и т. д. Сайты, FTp, Новости, Картинки, Видео, Товары, Вакансии, Топ100, Словари и т. д. Сайты, Картинки, Карты, Новости, Группы, PDF и т. д.
Дополнительные возможности поиска Исправление орфографических ошибок и ошибочной раскладки клавиатуры, Автоподстановка ключевых слов, Виртуальная клавиатура, Перевод страницы и др. Автоподстановка ключевых слов, Виртуальная клавиатура, Калькулятор, Орфография, Транслитератор и т. д. Автоподстановка ключевых слов, Перевод страницы, Похожие страницы, Калькулятор, Преобразование единиц измерения, Конвертация валют и т. д.
Административный раздел