Использование поисковых серверов
Реферат, 12 Сентября 2013, автор: пользователь скрыл имя
Краткое описание
Современный интернет представляет уникальное безграничное хранилище знаний, где можно получить ответ практически на любой вопрос. Фактически, здесь собранно все лучше, что изобретено и создано человечеством как за всю его длинную историю, а также новинки, которые появились только что.
Вложенные файлы: 1 файл
часть 2.docx
— 1.11 Мб (Скачать файл)СЕРВИСЫ GOOGLE
Возможности Google не ограничены лишь традиционным "джентльменским набором" поисковика с расширенными настройками и новостями. Ниже приведен короткий и неполный список современных сервисов Google:
- Google Local- находит местные предприятия и услуги в Интернете
- Google Mac - поиск по сайтам тематики Apple/macintosh
- Googles University Search - поиск по университетам
- Google Linux - поиск по сайтам тематики Linux
- Google GOV - поиск по всем государственным (*.gov) и военным (*.mil) сайтам
- Froogle - поиск товаров/продукции
- Google Options - опции
- Google Map Site - карта сайта
- Google Features - перечень разнообразных особенностей
- Google Microsoft - поиск по сайтам Microsoft
- Google Labs - сервисы
- Hacker Style Google - в оригинальном стиле
- Google BSD - поиск по BSD-сайтах
- Google Наоборот - google в зеркальном отображении
- Google Schoolar - поиск среди статей, книг, оглядел научной литературы и учебников
- Google Firefox - для фанатов Mozilla Firefox
- Google Fight - поединок: нужно ввести два слова, и поисковик покажет, которое из них ссылается на большее количество страниц
- Google Suggest - возможны варианты того, которое нужно, с показом количеству страниц по данному запросу
- Cheatoogle - поиск по читам и кодов к играм
- Google Easter - пасхальный кролик
- Gmail - почта от Google
- Video google - поиск видео
- Google для мобильников и КПК - мини-версия для удобной работы из мобильных телефонов и КПК
- Mobile Google - сервис для мобильной связи
- Google Fan Logos - сайт с логотипами на тему Google
- Google Holliday Logos - праздничные логотипы
- Официальные и Неофициальные - логотипы Google
- Google April Fools - поиск обо всем, что связано с днем дураков
- Google Maps - поиск по картам
- Google Blog - официальный блог Google
- Google News - новости от Google
- Google Print - поиск Google по миллионам оцифрованных книг, библиотек Гарварда, Стэнфорда, Оксфорда, Мичигана, а также из Нью-йоркской Публичной библиотеки
- Google Earth - программа для обзора Земли из космоса
- Can't find on google - сайт с перечнем запросов, в ответ на которые выдается не то, которое нужно
- Googlegulp - напитки от Google
- Uncle Sam - "патриотический" поисковик
- Blogsearch - поиск по блогам и ЖЖ
- Google Webmasters Guidelines - информация и советы Google для веб - разработчиков
- Google Reader - Google Reader
- Google Code - для кодеров, открытые исходники и так далее
- Google VPN - бесплатный VPN-сервис от Google
- Google Alerts - отслеживает появление новых страниц на поисковый запрос и сообщает об этом на e-mail
- Google Answers - можно задать вопрос, указать сумму вознаграждения за ответ и дождаться ответа
- Personalized Google Search - поиск с учетом настроек и потребностей пользователя
- Googlestore - магазин с аксессуарами в стиле и с логотипами Google
- Google Trade Catalogs - каталог товаров
- Google Personalize Homepage - подготовка поиска и внешнего вида Google под себя
- Google Base - база данных от Гугл, можно загрузить будь что
И это далеко не полный перечень возможностей, сервисы Google постоянно пополняются, а их качество, совершенствуется.
YAHOO
(http://www.yahoo.com)
Yahoo было основано в
1994, и на сегодняшний день это
самый старый и наиболее
Эта невероятно популярная система, которая обслуживает миллионы запросов ежедневно, зародилась как простая коллекция закладок, которую пополняли всего 2 человека, - Дэвид Фило и Джерри Янг.
Yahoo является самым популярным поисковым средством, и секрет его успеха Yahoo кроется в людях. Над составлением и редактированием содержания каталогов Yahoo работают свыше 150 редакторов. Yahoo имеет базу данных в более чем 1 млн. проиндексированных сайтов. Также, в случае нехватки собственной базы данных, Yahoo использует базу данных Google (до июля 2000 года Yahoo пользовался базой данных Inktomi).
ALTA-VISTA
(http://www.alta-vista.com)
Altavista начала предоставлять свои услуги в декабре 1995 года и на сегодняшний день является одной из наиболее больших поисковых систем (за количеством проиндексированных страниц). Как особенность поисковика можно отметить возможность поиска за усложненными критериями отбора. Altavista предлагает дополнительные услуги в виде поиска по каталогам (взятых из Open Directory and Looksmart), а также службу под названием "Ask Altavista" ("спроси Altavista"), результаты которого берутся из Ask Jeeves. На данное время Altavista является владельцем поисковой системы Raging Search.
MSN
(http://www.msn.com)
Поисковик разработано и запущено компанией Microsoft в 1997 роке.
В отличие от других поисковых систем, раньше у MSN никогда не было собственного паука или каталога. С 1997 года для выдачи результатов поиска использовались разные базы данных, такие как: Yahoo!, Looksmart, Altavista, Directhit, Inktomi и Realnames.
Только с начала 2005 года MSN запустил бета-версию собственного поискового алгоритма. Пользователи MSN Search могут осуществлять поиск, как по всему Интернету, так и по отдельным тематическим категориям, в том числе и по энциклопедии Microsoft Encarta.
Новый движок содержит возможность локализованного поиска (Near Me) - система способна автоматически определять местонахождение пользователя по IP - адресу его компьютера.
ОПИСАНИЕ РОССИЙСКИХ ПОИСКОВЫХ СИСТЕМ
В Рунете основными являются поисковые системы Яndex, Rambler и Mail.ru. На диаграмме представлен удельный вес разных поисковых машин Рунету.
YANDEX.RU
(http://yandex.ru)
(Упрощенно - http://ya.ru)
Yandex выполняет поиск по славяноязычной части Интернета с учетом морфологии славянских языков. Имея могучий механизм подбору сайтов под запросы, эта поисковая машина помогает найти наиболее соответствующие веб - страницы. Яндекс ежедневно пересматривает сотни тысяч веб-страниц в поисках изменений или новых ссылок, и их база постоянно растет.
Слово "Яndex" означает "Языковой индекс", или, если по-английски, "Yandex" - "Yet Another indexer". За 10 годы публичного существования Яndex возникали и другие толкования. Например, если в слове "Index" перевести с английского первую букву ("I" - "Я"), выйдет "Яndex".
Официально поисковая машина Yandex.Ru была анонсирована 23 сентября 1997 года на выставке Softool. Уже тогда поисковик имел определенные преимущества - возможность проверки документов на уникальность, учет морфологии славянских языков, возможность поиска, с учетом расстояния (например, при поиске точного словосочетания). Основной отличительной чертой Yandex тщательным образом разработан алгоритм оценки соответствия ответа запроса (релевантности), который учитывает не только количество слов запроса, найденных в тексте, но и "контрастность" слова (его относительную частоту для данного документа), расстояние между словами, и положение слова в документе.
Согласно данных глобальной статистики Рунету, сегодня больше 50% поискового трафика генерируется именно этим поисковиком (для сравнения, на долю Ramblera приходится около 20%, и еще меньше - на долю Google).
Регистрация происходит по адресу http://yandex.ru/addurl.html. В Яндекса достаточно быстрый поисковый робот. Благодаря нему регистрируемая страница появится в поисковых результатах в течение 2-4 часов. Но это лишь первичная индексация. После полной индексации, она может исчезнуть из поисковых результатов, если поисковый робот признает ее спамом. Поэтому положение web-страницы в результатах поиска нужно отслеживать до тех пор, пока не пройдет полная индексация. Перечень результатов может меняться в зависимости от загруженности серверов, поскольку база данных Яндекса имеет кластерную структуру и разнесенная на несколько серверов.
Яндекс любит документы средних размеров, насыщенные текстом (статьи и тому подобное). Следует умеренно повторять ключевые слова. Ключевые слова можно писать в описании, но вес слов в этом тэге является ниже. Хорошо индексируются страницы, что создано с помощью скриптов .cgi, .php. Это касается гостевых книг, форумов и тому подобное. Для индексации остальных (кроме главной) страниц сайта нужно приблизительно 2 недели.
Хороших позиций помогают достигать ключевые слова в целевых тэгах, где стоит отмечать слова, которые встречаются в тексте страницы. Целевые тэги, используются также и для выдачи описания страницы в результатах поиска. Это нужно учитывать при его составлении, поскольку, пользователь по этому описанию принимает решение посетить вас, или нет. Важно размещать ключевые слова и в тэге "title", заглавиях (h1-h6), содержании страницы, "Alt"-тегах.
Для определения релевантности Яндекс использует Взвешенный Индекс Цитирования, который влияет на рейтинг в результатах поиска. Обычный Индекс Цитирования используется только при сортировке сайтов в каталоге Яндекса.
RAMBLER.RU
(http://rambler.ru)
(Упрощенно - http://www.r0.ru)
Этот поисковик занимает сегодня второе место среди поисковиков Ренета. Он был первой поисковой программой, что создано специально для российского Интернета программистом компании Stack Ltd Дмитрием Крюком в 1996 году. Слово "Rambler" переводится как «гуляющий человек», «бродяга», по Интернету.
Rambler постоянно совершенствует свой поисковый алгоритм. Проводятся работы по оптимизации работы системы для точности и актуальности поиска. Как и большинство российских поисковых машин, Rambler учитывает морфологию русского языка. При выдаче результатов влияние имеет положение сайта в рейтинге Ramblers Top100. Rambler индексирует сайты в зонах ru .su, .ua, .by, .kz, .kg, .uz, .ge, а также славяноязычные сайты в доменах .com, .net или .org.
На сегодня Rambler огромный интернет - холдинг, в состав которого входят портал Рамблер, новостная интернет-газета Лента.ру, медицинский сайт Doctor.ru, онлайновый клуб родителей Mama.ru, картографический сервис Nakarte.ru, телекоммуникационный подраздел "Рамблер Запятых теле".
На Рамблере реализована умная система, которая выводит в результатах поиска слова, которые являются синонимами запроса. Еще одной функцией системы является выдача контекстной рекламы не только по конкретным ключевым словам, но и за фразами, которые тесно связаны с ними.
Регистрация находится по
адресу http://www.rambler.ru/doc/add_
Рамблер (в отличие от
других поисковиков) умеет вытягивать
гиперссылку из объектов Macromedia Flash.
Если сайт имеет заставку или навигационные
панели, которые выполнены с
Работы Рамблера игнорируют большинство целевых тэгов. Комментарии в документе работы Рамблера тоже не сканируют, но большего внимания обращают на заглавия и выделения в документе. Базовые понятия и ключевые для данного сайта слова целесообразно включать в следующие HTML-теги (в порядке значимости): "title", "h1"..."h4", "b", "strong", "u".
Максимальный размер документа для роботов составляет 200 килобайт. Документы большего размера усекаются к указанной величине.
APORT.RU
(http://aport.ru)
Поисковую систему "Апорт!" было разработано компанией "Агама" при поддержке Intel и впервые продемонстрировано в феврале 1996 года на пресс-конференции "Агамы" по поводу открытия "Российского клуба". Тогда она искала лишь по сайту russia.agama.com.
Важнейшими особенностями первой версии "Апорта" были перевод запроса и результатов поиска английским языком и обратно, а также возобновление всех проиндексированных страниц из собственной базы (что предоставляет возможность перегляда страниц, уже несуществующих в оригинале).
До конца 1999 года была представлена новая версия Апорт - "Апорт 2000", который стал первым российским поисковиком, что построенный на основе выдачи результатов по отдельно взятым сайтам. "Апорт 2000" практически реализовал две базовых технологии американской поисковой машины Google: учет "ранга сайта" (Page Rank), и обработка запроса, ориентируясь на HTML-код страницы. Среди не документируемых особенностей - больший приоритет сайтам, которые имеют высшую и элитную лигу в каталоге Atrus.
Aport является полнотекстовой поисковой системой, то есть она индексирует все слова, которые бы увидел на экране человек, который будет пересматривать конкретную страницу. В результате любое слово из текста документов может быть критерием для последующего поиска. Апорт также индексирует тексты гиперссылок на документ из других страниц, которые находятся, как внутри сайта, так и за его пределами, а также составлены (или проверенные) редакторами описания сайтов из каталога.
Результаты поиска упорядочиваются за частотой использования искомых сроков. Вместе со ссылкой отображается фрагмент текста, где встречается срок, указывается индекс соответствия с запросом и дата последней модификации файла. "Апорт!" в выданном фрагменте текста выделяет красным цветом спрошенные слова.
Регистрация сайта в Апорте
проводится из страницы http://www.aport.ru/addurl.asp
С момента добавления сайту
в Апорт к моменту его