Сравнение возможностей популярных информационно-поисковых систем.
Помимо вычисления PageRank и сохранения текста ссылок, Google со-держит шрифтовой размер и смещение каждого слова относительно начала документа. В спецификации HTML 3.2 было установлено семь уровней заго-ловков по размеру шрифта (от - самого крупного, до - самого мел-кого). Вследствие этого поисковая система всегда предоставить по запросу документ, где это слово имеет более крупный шрифт или расположено ближе к началу документа. Поскольку система имеет представление о конкретном месте каждого слова в документе, возможен так называемый Proximitysearch – поиск по наиболее близкому расположению слов относительно друг друга. Например, по запросу ИПС отыщет много документов в своей базе данных, однако в выдачу на первых местах выйдут лишь те, в ко-торых находится наиболее близко слева от . Более подробно рассмотрим схему функционирования информацион-но-поисковой системы Google. Всю главную работу по фильтрации содер-жимого Интернета выполняют Интернет-роботы (боты, crawlers). Все они бе-рут один адрес (URL, uniformresourcelocator; каждый URL соответствует оп-ределённому идентификатору документа) из базы данных URL-сервера, ска-чивают и передают содержание страницы на сервер хранения документов (рисунок 9). Введение 2 1 Поисковые системы 4 1.1 Механизмы поиска в информационно-поисковых системах 4 1.2 Информация, собираемая поисковыми системами 7 1.3 Сравнительный обзор поисковых систем 12 1.4 Зарубежные поисковые машины 21 2 Мета-поисковые системы 23 2.1 Представление мета-поисковой системы 23 2.2 «За» и «против» мета-поисковых систем 24 2.3 Реальные МПС 24 2.4 «Псевдо» МПС первого типа 27 2.5 «Псевдо» МПС второго типа 28 2.6 Поисковые утилиты (поисковые приложения рабочего стола) 28 3 Полнотекстовые поисковые системы с учётом морфологии русского языка 30 3.1 Полнотекстовый поиск в русских текстах 30 3.2 Возможности Яndex 30 3.3 Развитие системы Яndex 32 3.4 Принципы работы информационно-поисковой системы Google 32 4 Специализированные поисковики 39 4.1 FindSounds.com 39 4.2 Gnod.net 40 4.3 Medpoisk.ru – поиск медицинской информации 41 4.4 Taggalaxy.de - поиск изображений 42 Заключение 45 Список использованных источников 46 1. Павел Храмцов. Поиск и навигация в Internet. – [Электронный ре-сурс]: статья. URL: http://www.osp.ru/cw/1996/20/31.htm (дата обращения 18.07.12). 2. How Intranet Search Tools and Spiders Work. – [Электронный ре-сурс]: статья. URL: http://linux.manas.kg/books/how_intranets_work/ch32.htm (дата обращения 17.07.12). 3. Martijn Koster. Robots in the Web: threat or treat? – [Электронный ресурс]: статья. URL: http://info.webcrawler.com/mak/projects/robots/threat-or-treat.html (дата обращения 18.07.12). 4. Обучение Интернет-профессиям. Searchengine Expert. – [Элек-тронный ресурс]: статья. URL: http://searchengine.narod.ru/archiv/se_2_250500.htm (дата обращения 16.07.12). 5. Андрей Аликберов. Несколько слов о том, как работают роботы поисковых машин. – [Электронный ресурс]: статья. URL: http://www.citforum.ru/internet/search/art_1.shtml (дата обращения 18.07.12). 6. Гусев В.С. Яндекс. Эффективный поиск. – М.: Диалектика, 2007. 7. Егоров А.Б. Поиск в Интернете. – СПб: НиТ, 2007. 8. Гусев В.С. Поиск, Internet. – М.: Диалектика, 2004. Похожие работы:
Поделитесь этой записью или добавьте в закладки |
Полезные публикации |