Работа поисковых систем

Автор работы: Пользователь скрыл имя, 17 Декабря 2012 в 18:17, реферат

Краткое описание

Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: «Google», «Yahoo», «MSN». В русском Интернете это – «Яндекс», «Рамблер», «Апорт».

Содержание

1. Понятия и функции поисковых систем......................2
1.1. Краткая история развития поисковых систем........7
2. Компоненты поисковых систем……………………..9
2.1. Основные характеристики поисковой системы…11
3. Особенности различных поисковых систем………14
4. Заключение………………………………………….17
5. Список использованной литературы………………18

Вложенные файлы: 1 файл

поисковые системы.doc

— 88.50 Кб (Скачать файл)
  • Точность

Точность - еще  одна основная характеристика поисковой  машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль»  находится 100 документов, в 50 из них  содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.

 

 

  • Актуальность

Актуальность - не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.

  • Скорость поиска

Скорость поиска тесно связана с его устойчивостью  к нагрузкам. Например, по данным ООО  «Рамблер Интернет Холдинг», на сегодняшний  день в рабочие часы к поисковой  машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.

  • Наглядность

Наглядность представления  результатов является важным компонентом  удобного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат только нужную информацию. Это означает, что пользователю зачастую приходится производить свой собственный поиск внутри найденного списка. Различные элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. Особенности различных поисковых систем.

Google – В 1998 году основана двумя студентами Стэндфордского университета Сергеем Брином и Ларри Пэйдж, которая на сегдняшний день получила мировое признание. PageRank используемая в Google в основном основана на link popularity. Т.е. при вычислении релевантности страницы наибольший вклад имеет количество и качество ссылок на страницы с других страниц. Сейчас link popularity используется во всех основных поисковых системах мира (в той или иной степени). База Google используется очень большим числом других поисковых систем и порталов.

Google добился  успеха благодаря этой технологии. Его траффик устойчиво увеличивается  . В июне 2000 г., такой Интернет-гигант, как Yahoo!, выбрал Google, как поставщика результатов поиска, вместо Inktomi.

Название поисковой  системы Google было образовано в результате игры букв в слове "googol". Этим компания хочет подчеркнуть их намерение  индексировать и обрабатывать большие объемы информации.

MSN – больший, нежели у других поисковых систем, акцент на информационное содержимое сайта. MSN search поддерживается Microsoft и размещается по адресу http://search.msn.com/. Эта поисковая система не имеет собственного паука (поискового робота) или каталога, она использует данные из Inktomi, LookSmart. MSN особенно важна т.к. именно эта поисковая система по умолчанию используется, когда пользователи Internet Explorer'а вводят в адресную строку поисковый запрос. MSN также является информационным узлом, и по данным MediaMetrix, является одним из наиболее посещаемых сайтов.

Yandex – крупнейшая российская поисковая система. Обрабатывает (по разным данным) от 60% до 80% всех русскоязычных поисковых запросов. Уделяет особое внимание тематическим ссылкам (нетематические внешние ссылки также имеют эффект, но в меньшей степени, чем у других поисковых систем). Индексация проходит медленнее, чем у Google, однако так же в приемлемые сроки. Понижает в рейтинге или исключает из индекса сайты, занимающиеся нетематическим ссылкообменом (содержащих каталоги нетематических ссылок, созданных лишь с целью повышения рейтинга сайта), а также сайты, участвующие в системах автоматического обмена ссылками. В периоды обновлений базы, которые длятся несколько дней, выдача Яндекса постоянно меняется, в такие периоды следует отказаться от каких-либо работ по сайту и дождаться стабильных результатов работы поисковой системы.

Еще одна особенность  Яндекс – различные результаты поиска в зависимости от регистра ключевых слов (т.е. «Слово» и «слово» дают разные результаты поиска).

Rambler – наиболее загадочная поисковая система. Занимает второе (по другим данные третье после Google) место по популярности среди российских пользователей. По имеющимся наблюдениям, понижает в рейтинге сайты, активно занимающиеся раскруткой (быстрое увеличение числа внешних ссылок). Ценит наличие поисковых терминов в простом тексте страницы (без выделения различными стилистическими тегами).

Mail.ru – набирающая популярность поисковая система. С января 2006 г. использует результаты поисковой системы Yandex ( до этого использовала Google ) после некоторой дополнительной обработки. Оптимизация под Mail.ru сводится к оптимизации под Yandex.

Aport - полнотекстовая российская поисковая система. Это означает, что она индексирует все слова, которые бы увидел на экране человек, просматривая конкретную страницу вашего сервера. В результате любое слово из текста ваших документов может служить критерием последующего поиска. Для документов HTML кроме основного текста документа индексируются также: заголовок документа (TITLE), ключевые слова (META KEYWORDS), описания страниц (META DESCRIPTION) и подписи к картинкам (ALT). Кроме того, Апорт индексирует как принадлежащие документу, тексты гиперссылок на этот документ с других страниц, находящихся, как внутри сайта, так и за его пределами, а также составленные (или проверенные) редакторами описания сайтов из каталога.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4. Заключение

Теперь подытожим  все вышесказанное.

  • Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут.
  • Основные характеристики поисковых систем:
    1. Полнота
    2. Точность
    3. Актуальность
    4. Скорость поиска
    5. Наглядность
  • Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.
  • В состав поисковой системы входят компоненты:
    1. Паук (spider)
    2. Краулер ( crawler)
    3. Индексатор
    4. База данных
    5. Система выдачи результатов

 

 

 

 

 

 

 

 

 

5. Список использованной литературы.

1. Seo news. Поисковый маркетинг // Поисковые системы интернета [Электронный ресурс]. URL:

http://www.seonews.ru/masterclasses/poiskovyie-sistemyi-interneta (дата обращения: 26.11.12)

2.Seolinks // База знаний // Алгоритмы работы поисковых систем

[Электронный  ресурс]. URL:

http://seolinks.ru/статьи/алгоритмы -работы-поисковых-систем (дата обращения: 26.11.12)

3.Информация  о поисковых системах //Особенности  различных поисковых систем

[Электронный  ресурс]. URL:

http://www.allposition.com/bk-13.htm (дата обращения: 26.11.12)

 

 

 

 

 

 

 

 

 

 


Информация о работе Работа поисковых систем