Индексация сайтов

Автор работы: Пользователь скрыл имя, 20 Мая 2013 в 02:45, реферат

Краткое описание

Для начала давайте разберемся с терминологией. Индексация страницы – это посещение страницы поисковым роботом какой-либо поисковой системы и занесение ее в базу данных поисковика. Поисковой робот - это программа, встроенная в поисковую систему как её составная часть и подчиняющаяся алгоритмам этой поисковой системы.

Вложенные файлы: 1 файл

ИПСИС.docx

— 172.06 Кб (Скачать файл)

similatiry(Q,D) = SUM(wqk*wdk),

где similatiry(Q,D) — схожесть запроса Q документу D; wqk — вес k-го слова в запросе; wdk — вес k-го слова в документе.

Документы, наиболее схожие с запросом, попадают в результаты поиска.

 

Ранжирование.

 

После того, как наиболее схожие документы были отобраны из основной коллекции, они должны ранжироваться, чтобы в верхних результатах  отражались наиболее полезные для пользователя ресурсы. Для этого используется специальная формула ранжирования, которая для разных поисковиков имеет разный вид, однако для всех из них основными факторами ранжирования являются:

  • вес страницы (Мера “важности” страницы в поисковой системе. Зависит от числа внешних ссылок на данную страницу и от их веса (важности). Другими словами, от количества и качества ссылающихся страниц. А если говорить математическим языком, то это алгоритм расчёта авторитетности страницы, используемый поисковой системой.)
  • авторитетность домена(история домена, частота запроса в поиске этого домена, ссылки на домен с авторитетных сайтов);
  • релевантность текста запросу;
  • релевантность текстов внешних ссылок запросу;

 

Существует упрощенная формула  ранжирования, которую можно найти  в некоторых статьях оптимизаторов:

Rа(x)=(m*Tа(x)+p*Lа(x))* F(PRa),

где:

Rа(x) – итоговое соответствие документа а запросу x,

Tа(x) – релевантность текста (кода) документа а запросу x,

Lа(x) – релевантность текста ссылок с других документов на документ а запросу x,

PRа – показатель авторитетности страницы а, константа относительно х,

F(PRa) – монотонно неубывающая функция, причем F(0)=1, можно допустить, что F(PRa) = (1+q*PRа),

m, p, q – некие коэффициенты.

То есть, мы должны знать, что при  ранжировании документов используются, как внутренние факторы, так и  внешние. А также можно их разделить на зависимые от запроса факторы (релевантность текста документа или ссылок) и независимые от запроса. Современные поисковые роботы, например, Google Panda или Google Penguin) разрабатываются на основе тысяч отзывов живых людей, которые оценивают релевантность выдаваемых поисковиком страниц их запросам, то есть с каждой новой версией эти системы приближаются к искусственному интелекту, а значит, сайт следует писать для людей, чтобы робот как можно выше разместил его в результатах поиска.

 

 

Заключение.

 

Основываясь на приведенных рекоммендациях по написанию сайта для его  последующей успешной индексации поисковым  роботом и на критериях поисковиков  по ранжированию поисковой выдачи, можно сделать вывод, что порой  тщательная проработка сайта и его  контента может заменить весомый  и зачастую дорогостоящий блок SEO раскрутки и даже вывести ваш проект в лидеры поисковой выдачи.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Список литературы.

  1. Интернет-ресурс Webkomora. (http://webkomora.com.ua/ru/articles/web/raskrutka/)
  2. Интернет-ресурс ktonaNovenkogo.ru. (http://ktonanovenkogo.ru/seo/search/kak-rabotayut-poiskovye-sistemy-snippet-index.html)
  3. Яндекс помощь. Вебмастер. (http://help.yandex.ru/webmaster/?id=1111858)
  4. Интернет-ресурс Search Bot. (http://search-bot.net/kak-rabotaet-poiskovyj-robot/)
  5. SEO блог Сергея Кокшарова на сайте devaka.ru (http://devaka.ru/articles/how-search-engines-work)

Информация о работе Индексация сайтов