Язык поисковых запросов. Применение языка запросов

Автор работы: Пользователь скрыл имя, 18 Марта 2014 в 20:39, реферат

Краткое описание

Интернет состоит из взаимосвязанных сетей, эксплуатируемых университетами, государственными учреждениями, военными, корпорациями и другими организациями. Эти сети связаны друг с другом различными видами оборудования такими, как маршрутизаторы, мосты и коммутаторы. Маршрутизаторы решают, в каком направлении отослать сетевые данные, предварительно посылая пакеты по нужному адресу и затем «маршрутизируя» данные в направлении соответствующего компьютера, где эти пакеты собираются вновь. Мосты предназначены для соединения двух каких-либо сегментов кабельной проводки внутри сети; коммутаторы – это приспособления для замыкания и размыкания цепей.

Содержание

Введение
1.Общие принципы организации поиска информации в сети интернет
1.1 Поиск информации в Интернет: стратегия и методика
1.2 Принцип работы, преимущества и недостатки каталогов
1.3 Электронные каталоги глобального масштаба
1.4 Российские каталоги ресурсов Интернет
2. Поиск с помощью поисковых машин
2. 1 Принцип работы, преимущества и недостатки поисковых машин
2.2 Глобальные поисковые машины
2.3 Российские поисковые машины
3.Язык поисковых запросов. применение языка запросов.
4.Владение пользовательскими инструментами и техникой
Заключение
Библиографический список

Вложенные файлы: 1 файл

курсовая работа.doc

— 169.00 Кб (Скачать файл)

Содержание

 

 Введение

 1.Общие принципы организации поиска информации в сети интернет

1.1 Поиск информации в Интернет: стратегия и методика

1.2 Принцип работы, преимущества  и недостатки каталогов

1.3 Электронные каталоги глобального  масштаба

1.4 Российские каталоги ресурсов Интернет

 2. Поиск с помощью поисковых машин

2. 1 Принцип работы, преимущества  и недостатки поисковых машин

2.2 Глобальные поисковые машины

2.3 Российские поисковые машины

3.Язык поисковых запросов.  применение  языка запросов.

4.Владение пользовательскими инструментами и техникой

Заключение

Библиографический список

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

          ВВЕДЕНИЕ

 

Интернет – глобальная компьютерная сеть, охватывающая весь мир. Она составлена из разнообразных компьютерных сетей, объединенных стандартными соглашениями о способах обмена информацией и единой системой адресации. Интернет образует ядро, обеспечивающее связь различных информационных сетей, принадлежащих различным учреждениям во всем мире.

Для того чтобы различные компьютеры в Интернете могли сообщаться друг с другом, используются протоколы, т.е. правила или условия коммуникации. Язык Интернета называется TCP/IP, что означает протокол Управления передачей/Интернет – протокол. Любой компьютер для того, чтобы общаться в Интернете, должен уметь «говорить» на языке TCP/IP. Этот стандарт является «открытым», что означает, что он не является фирменным продуктом какой–либо одной компании. Основная операционная система называется UNIX, но стандарт Интернета приспособлен для использования на всех наиболее распространенных системах, таких как UNIX, PC и Macintosh.

Интернет состоит из взаимосвязанных сетей, эксплуатируемых университетами, государственными учреждениями, военными, корпорациями и другими организациями. Эти сети связаны друг с другом различными видами оборудования такими, как маршрутизаторы, мосты и коммутаторы. Маршрутизаторы решают, в каком направлении отослать сетевые данные, предварительно посылая пакеты по нужному адресу и затем «маршрутизируя» данные в направлении соответствующего компьютера, где эти пакеты собираются вновь. Мосты предназначены для соединения двух каких-либо сегментов кабельной проводки внутри сети; коммутаторы – это приспособления для замыкания и размыкания цепей.

Одной из наиболее популярных служб, возникших на базе сети Интернет, стала «Вceмирнaя пaутинa» WWW (Wоrld Widе Wеb). Tипичнaя «Wеb – страница» представляет собой полный экран текстовой и графической информации, связанной с некоторым конкретным предметом или вопросом. Ключевые слова и (или) изображения на такой странице выделены. Если пользователь выбирает один из таких выделенных элементов, то на экране воспроизводится новая страница, посвященная выбранному слову или изображению. Пользователь может, следуя таким ссылкам, продолжить вывод на экран новых страниц. Программа, которая осуществляет поиск, выборку и воспроизведение Web – страниц, называется браузером, а компьютеры, хранящие информацию, – Web – серверами.

Концепцию «паутины» разработал в 1990 Т.Бернерс–Ли в Европейском центре ядерных исследований ЦЕРН в Женеве (Швейцария). Он хотел создать систему, которая помогала бы ученым сотрудничать, применяя упрощенные способы создания и использования мультимедиа–информации. Систему связей (ссылок) между документами называют гипертекстом. Для создания системы гипермедиа «паутина» сочетает гипертекст с мультимедиа (текст, изображения, звук и видео). Совместное пользование информацией, содержащейся в «паутине», стало возможным благодаря применению для создания Web – стpaниц oбщeгo языкa, пoлучившeгo нaзвaниe гипepтeкcтoвoгo языкa oписaния дoкумeнтoв НТML, общего протокола для обмена информацией, названного гипертекстовым транспортным протоколом HTTP, и стандартного формата адресов (унифицированного указателя ресурсов) URL. Важным достоинством URL является то, что он может работать с любым протоколом, а не только с HTTP; отсюда следует, что «Всемирная паутина» спроектирована так, чтобы ее можно было использовать со всеми существующими и будущими сетевыми службами.

«Паутина» приобрела в ЦЕРНе исключительно высокую популярность и вскоре появилась в других научно–исследовательских центрах, включая национальный центр США по применениям суперкомпьютерных вычислений NCSA. В 1993 группа сотрудников NCSA, возглавляемая М. Эндрессеном, начала разработку улучшенного Web–браузера, получившего название «Мозаик». «Мозаик» мог работать на большинстве типов рабочих станций и персональных компьютеров. Бесплатный доступ к этой программе просмотра сделал «паутину» исключительно популярной, и число обращений к сети начало расти с феноменальной скоростью. За несколько месяцев количество используемых экземпляров «Мозаик» превысило миллион, а трафик WWW вырос в 10 тыс. раз. Эндрессен и его группа ушли из NCSA, чтобы работать над коммерческой версией «Мозаик». Затем появились и другие коммерческие браузеры, способствовавшие быстрому росту и развитию «Всемирной паутины».

Спектр пользователей WWW довольно широк. Ее мультимедиа–возможности удобны для астрономов, заинтересованных в совместных наблюдениях за кометами, для математиков привлекательны воспроизводимые на экране геометрические фигуры, а для биологов – доступ к обширным базам данных по белкам. Благодаря тем же средствам стали возможными «виртуальные туры», посвященные осмотру коллекций произведений искусств в разных музеях. Такие государственные организации, как НАСА, Смитсоновский институт и Библиотека Конгресса используют WWW для публикации текстовой информации и изображений. Корпорации размещают в узлах WWW рекламу, информацию о продаже аппаратных или программных продуктов и принимают заказы. Для индивидуальных пользователей, располагающих собственными компьютерными идентификаторами, наиболее увлекательным представляется создание своих «базовых Web–страниц», открывающих новые возможности для самовыражения и совместного пользования информацией.

 

 

 

 

 

 

 

 

 

 

 

 

 

1.ОБЩИЕ ПРИНЦИПЫ ОРГАНИЗАЦИИ ПОИСКА ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ

          1.1 Поиск информации в Интернет: стратегия и методика

Поиск информации является одной из наиболее распространенных и одновременно наиболее сложных задач, с которыми приходится сталкиваться в Сети любому пользователю. Причина сложностей, возникающих при информационном поиске в Интернет, определяется двумя главными факторами. Во – первых, число источников в Сети чрезвычайно велико. Во – вторых, массив информации в Сети не только колоссален по объему, но еще и крайне динамичен. За те полминуты, что мы потратим на чтение первых строк этого раздела, в виртуальной вселенной появится порядка сотни новых или измененных документов, десятки будут перемещены на новые адреса, а единицы – навсегда прекратят свое существование.

Прежде чем начать поиск следует четко сформулировать задачу. До тех пор, пока задача не будет сформулирована об успешности, а тем более оптимизации поиска, не может быть и речи. Объем информации в Интернете слишком велик, и как нигде здесь верна поговорка «Время – деньги». Поэтому  здесь нельзя искать по принципу «Пойди туда, не знаю куда. Возьми то, не знаю что». Иначе результат будет плачевный.           Дать общий рецепт эффективной стратегии поиска информации в Интернет, пожалуй, невозможно. Есть лишь некоторые принципы, позволяющие тратить меньше времени. Вот некоторые из них. Например, вам необходимо узнать, где обитает трёхлапый ленивец, то вряд ли вы пойдете в алфавитный каталог библиотеки. Может быть, вы найдете нужную литературу с помощью систематического каталога. С несколько большей вероятностью – с помощью предметного. Но, скорее всего, ни один из библиотечных каталогов вам не поможет. Но, зайдя в информационно–библиографический отдел крупной библиотеки, дежурный библиограф достанет библиографический указатель по животным или какую–то похожую книжицу, из которой вы и найдете ответ на свой вопрос. Подобную стратегию можно с успехом применять и в Интернет. В ИПС(информационно–поисковых сетях) общего назначения можно утонуть в тысячах ссылок, выданных вам на простой запрос. Целью использования универсальной ИПС общего назначения может быть поиск специализированной ИПС, посвященной тематике вашего поиска. Такая ИПС может быть распознана по наличию слов «информация (information)», «документ (document)» и т.п. Но часто специализированная ИПС может скрываться на сервере общественной, профессиональной или специализированной организации, издательства.   Этот пример иллюстрирует еще один элемент стратегии: читайте найденные документы в поисках наиболее точных терминов и связей между терминами. Возможно, вы мыслите в совершенно не тех терминах, которые используют авторы искомых документов (ведь большую роль играют культурные различия!).          

Третий элемент стратегии: используйте несколько ИПС. Если вы регулярно занимаетесь поиском информации по какой–то тематике, отметьте те ИПС, которые для вас наиболее эффективны.

Необходимость и важность проблемы информационного поиска привела к образованию в самом Интернет целой отрасли, задача которой заключается именно в оказании помощи пользователю в его навигации в киберпространстве. Составляют эту отрасль специальные поисковые службы или сервисы. Условно их можно разделить на кaтaлoги (dirесtоriеs) и пoиcкoвыe мaшины (sеаrсh еnginеs).

Эти разновидности внешне очень похожи, поскольку каждый каталог, как правило, обладает собственной поисковой машиной, а каждая поисковая машина – собственным каталогом. Однако принципы их работы базируются на абсолютно разных подходах и технологиях. Каждый из этих инструментов имеет определенные преимущества, а основная разница между ними заключается в участии/неучастии человека. Поисковые машины запускают в Web программных «пауков» (spiders), которые путешествуют со страницы на страницу и на каждой индексируют ее полный текст. Каталоги же формируются людьми–редакторами, которые прочитывают страницы, отсеивают неподходящие и классифицируют узлы по темам. При этом каждая разновидность поисковых сервисов применяется для решения определенного типа задач. Правильным выбором инструмента во многом определяется стратегия поисковой деятельности и, в конечном итоге, результат разысканий.

Приступая к информационному поиску в Интернет, следует всегда помнить несколько основных моментов. Прежде всего, никакие средства навигации – каталоги или поисковые машины – не охватывают всего текущего информационного массива Интернет. По некоторым оценкам, даже такие признанные лидеры сетевого поиска как Google, отражают не более трети совокупного содержания Сети. Причина этого – постоянный колоссальный прирост объемов информации в Интернет, который, несмотря на все усилия навигационных служб, содержит огромное число белых пятен.

Помимо быстрого роста и изменения местоположения документов, большинство поисковых систем имеют внутренние ограничения на отражение материалов одного сайта и на объем индексируемой части страницы. Программы–роботы зачастую не идут в глубь сервера дальше определенной директории, что также сокращает число отраженных материалов.

В тоже время многие крупные сайты имеют собственную систему поиска, которая отражает весь их информационный массив. Выявив такие сервера с помощью каталогов, можно провести более детальное их обследование, использовав локальный поисковый механизм. Таким образом, для достижения наиболее полных результатов следует применять каталоги и поисковые машины в сочетании друг с другом.

Существует также ряд общих требований к поисковой деятельности, соблюдение которых повышает эффективность и экономит время, затрачиваемое на разыскание данных.

Для поиска материалов по крайне узкой специфической тематике стоит начинать с каталогов.

Для получения более полных результатов по сложному запросу поиск рекомендуется проводить отдельно в каждой поисковой машине. Поисковые системы имеют сильный разнос в отражении документов и их последовательное использование в значительной степени расширяет охват материала.

При разыскании документов об отдельной стране или на конкретном языке следует отдать предпочтение национальным/региональным поисковым средствам.

Формировать запрос надо максимально точно, используя все возможности механизма составления запроса. Затраты времени на детальное составление поискового предписания окупаются при анализе результатов поиска. При точном формировании запроса процент информационного шума будет намного ниже.

При систематическом обращении к поисковым средствам, необходимо постоянно следить за новостями, относящимися к поисковому сервису. В окружающем нас мире вообще, а в цифровом мире тем более, нет ничего вечного. Каждая поисковая система переживает периоды зарождения, расцвета и упадка. Не бойтесь отказаться от использования любимой, но устаревающей поисковой системы и перейти на использование новых поисковых инструментов, обладающих большей эффективностью.

1.2 Принцип работы, преимущества и недостатки каталогов

Каталоги – это пионеры навигации в Сети. Каталог представляет собой данные, структурированные по темам в виде иерархических структур. Пpи зaгpузкe кaтaлoгa нa экpaн вывoдитcя caмый oбщий пepечeнь oблacтeй чeлoвeчecкoй дeятeльнocти: ИCКУCCTВO, OБPAЗOВAHИE, БИЗHEC, HAУKA, ИГPЫ, CПOPT и т.д. Каталоги имеют иерархическую структуру, то есть пользователь, входя в любой раздел каталога, последовательно видит все более и более дробную его детализацию. Бoльшинcтвo кaтaлoгoв сoздaются путeм дoбaвлeния aвтopaми wеb–cтpaниц cвoeгo сaйтa к сущecтвующeму cпиcку ccылoк.

Поисковые кaтaлoги coздaются вpучную, т.e. инфopмaция в них зaнoсится людьми. Высококвалифицированные редакторы лично просматривают информационное пространство WWW, отбирают то, что по их мнению представляет общественный интерес, и заносят в каталог. Благодаря «человеческому» фактору, информация в каталогах организована достаточно четко, что позволяет в определенных случаях достичь требуемого результата быстрее, чем при помощи поисковых машин. Основной проблемой поисковых каталогов является чрезвычайно низкий коэффициент охвата ресурсов WWW. В каталоги попадают лишь лучшие страницы. Поэтому найти достаточно специфическую информацию в каталоге зачастую очень сложно.

Информация о работе Язык поисковых запросов. Применение языка запросов