Язык поисковых запросов. Применение языка запросов

Автор работы: Пользователь скрыл имя, 18 Марта 2014 в 20:39, реферат

Краткое описание

Интернет состоит из взаимосвязанных сетей, эксплуатируемых университетами, государственными учреждениями, военными, корпорациями и другими организациями. Эти сети связаны друг с другом различными видами оборудования такими, как маршрутизаторы, мосты и коммутаторы. Маршрутизаторы решают, в каком направлении отослать сетевые данные, предварительно посылая пакеты по нужному адресу и затем «маршрутизируя» данные в направлении соответствующего компьютера, где эти пакеты собираются вновь. Мосты предназначены для соединения двух каких-либо сегментов кабельной проводки внутри сети; коммутаторы – это приспособления для замыкания и размыкания цепей.

Содержание

Введение
1.Общие принципы организации поиска информации в сети интернет
1.1 Поиск информации в Интернет: стратегия и методика
1.2 Принцип работы, преимущества и недостатки каталогов
1.3 Электронные каталоги глобального масштаба
1.4 Российские каталоги ресурсов Интернет
2. Поиск с помощью поисковых машин
2. 1 Принцип работы, преимущества и недостатки поисковых машин
2.2 Глобальные поисковые машины
2.3 Российские поисковые машины
3.Язык поисковых запросов. применение языка запросов.
4.Владение пользовательскими инструментами и техникой
Заключение
Библиографический список

Вложенные файлы: 1 файл

курсовая работа.doc

— 169.00 Кб (Скачать файл)

Апорт (http://www.aport.ru)

Поисковая машина запущена в феврале 1996 года. Ее особенностью является то, что документы индексируются не только на серверах России и стран СНГ, но и на зарубежных серверах. Именно Апорт один из первых в России применил язык запроса, позволяющий улучшить результаты поиска. Более подробно о языке запроса, о используемых операторах можно узнать на самом сайте поисковой машины Апорт (http://aport.ru/help.htm). Апорт позволяет также искать MP3-файлы, аудиофайлы. Найденные документы содержат сведения об адресе, дате опубликования и последней проверке документа.

Кроме перечисленных, в российском сегменте Сети существует еще несколько поисковых машин, которые не отличаются высокими показателями работы, но также могут быть применены в случаях, когда лидеры не дают результатов. К их числу относятся: КМ–поиск (go.km.ru), Лупа (http://www.lupa.ru/) и Tela Textorum (tela.dux.ru).

Практически все всемирно известные каталоги и поисковые машины в настоящее время превратились во внушительные информационные корпорации с многомиллионными доходами. Заработав авторитет наиболее посещаемых мест в Сети, они предоставляют свои страницы для размещения рекламной информации, доходы от которой и составляют основу их бюджета. Постепенно поисковые сервера превращаются в многофункциональные порталы, в которых поисковый сервис остается главной приманкой для пользователей, но далеко не единственной и даже не основной из предоставляемых услуг. Помимо разыскания информации, такие сервера обычно предоставляют пользователям бесплатную электронную почту, возможность бесплатно размещать собственные страницы, сведения о погоде, текущих новостях, биржевые котировки, карты местности и т.д.

 

 

 

 

 

 

 

 

 

3.ЯЗЫК ПОИСКОВЫХ ЗАПРОСОВ.  ПРИМЕНЕНИЕ ЯЗЫКА ЗАПРОСОВ.

 
        Поисковый запрос  может состоять из одного или  нескольких слов, в нем могут  присутствовать различные знаки  препинания. Составлять самые простые  запросы можно и не вдаваясь  в тонкости языка запросов. Так, если ввести в поисковую строку несколько слов без знаков препинания и логических операторов, будут найдены документы, содержащие все эти слова, да ещё и если они находятся на строго ограниченном расстоянии друг от друга. Такой поиск с довольно большой вероятностью закончится отрицательным результатом. И здесь о понятии успешности не может быть и речи. Знание и правильное применение языка запросов поисковой машины поможет сделать поиск быстрым и эффективным. Что касается регистра, то в общем случае, регистр написания поисковых слов и операторов значения не имеет, то есть слова «реферат», «Реферат», «рефеРАт», «РЕФЕРАТ» и «РеФерАт» – все будут восприниматься одинаково. Это полностью касается и латиницы. Так, «Yas» и «yES», и даже «yeS», «yes» и «YES» все они для поиска однообразны. И лишь иногда, в целях повышения качества поиска, регистр поискового запроса принимается во внимание. Если в запросе задано слово с большой буквы, то будут найдены только слова в таком написании, а если с маленькой – оба варианта. Если запрос состоит из двух, трех или четырех слов, каждое из которых написано с большой буквы, то предполагается поиск по имени собственному, и автоматически производится изменение ограничения расстояния между словами запроса со значения по умолчанию на величину (n-1)*2, где n – количество слов запроса. Это позволяет находить группу слов запроса, внутри которой есть не более одного «лишнего» слова или знака препинания, например: «М. Лермонтов», «Баден-Баден», «Шарль де Голь», «Федор Михайлович Достоевский» и т.п.   Современные поисковые машины используют операторы для поиска в компьютерных сетях. Под оператором здесь понимается инструкция поиска. По этой причине запрос, включающий несколько слов, может содержать операторы. Поиск указанных операторов в документе не производится. Они служат лишь инструкцией поисковой машине. По этой причине они имеют свою орфографию и синтаксис. Рассмотрим их подробнее.     

Логические операторы. Два запроса, соединенные оператором AND (логическое И) образуют сложный запрос, которому удовлетворяют только те документы, которые одновременно удовлетворяют обоим этим запросам, т.е. по запросу «телефон AND мобильный» найдутся только те документы, которые содержат и слово «телефон», и слово «мобильный» одновременно. Если эти слова встретятся в текстах отдельно, поисковая машина эти тексты не покажет или покажет в конце списка найденных материалов, как только частично отвечающие запросу. Необходимо помнить, что если оператор в явном виде не указан, используется по умолчанию оператор AND. В результате будут выведены документы, содержащие все слова запроса.  Сложному запросу, состоящему из двух запросов, соединенных оператором OR (логическое ИЛИ) соответствуют все документы, удовлетворяющие хотя бы одному из этих двух запросов. Например, «телефон OR мобильный» будут найдены документы, в которых присутствует хотя бы одно из этих двух слов, либо оба эти слова вместе.      

Оператор NOT (логическое И–НЕ) образует запрос, которому отвечают документы, удовлетворяющие левой части запроса и не удовлетворяющие правой. Так, результатом поиска по запросу «телефон NOT мобильный» будут показаны все документы, в которых есть слово «телефон» и при этом в данном документе на установленном расстоянии отсутствует слово «мобильный».  
Каждый из операторов имеет своё сокращенное обозначение, соответствие их приведено в таблице.

 

 

 

 

 

 

 

 

Т а б л и ц а 1. Сокращенные обозначения операторов.

Оператор

Полное обозначение

Сокращённое обозначение

ИЛИ

OR

| , пробел

И

AND

& +

НЕ

NOT

~


 

В языке запросов обычно один значок оператора означает его действие в пределах абзаца, а два подряд – в пределах всего текста.     

Скобки. При построении запросов иногда возникает необходимость объединения слов запроса в группы, которые будут аргументами некоторого оператора. Такие группы заключаются в скобки. Как правило, в большинстве поисковых машин используют только скобки вида ( ). Часть запроса, заключенная в скобки, сама является запросом, и на нее распространяются все правила языка построения запросов. Использование скобок позволяет строить вложенные запросы и передавать их операторам в качестве аргументов, а также перекрывать приоритеты операторов, принятые по умолчанию.     Кавычки.Для поиска цитат можно использовать типовые (двойные) кавычки, вида « или “. Слова запроса, заключенного в двойные кавычки, ищутся в документах именно в том виде и в том порядке, как они были заданы в запросе. Это весьма эффективный способ поиска. Его применение обеспечивает успешность более 60%. Здесь важно учитывать только два момента. Во-первых, цитирование должно быть точным, т.е. без изменения по падежам, числам и лицам, во–вторых, материал, который вы ищите, как минимум должен быть в Интернете. Если при такой форме поиска будет допущена грамматическая ошибка, поиск даст отрицательный результат.  
 
        Таким образом, двойные кавычки можно использовать и просто для поиска слова в заданной форме (по умолчанию слова находятся во всех формах). Например, запросу: <поезд "прибыл" посадка> удовлетворяет документ, содержащий текст '... поезд прибыл для осуществления посадки пассажиров ...', и не удовлетворяют документы: с '.. поезд подошел к платформе для посадки пассажиров ...', или '… поезд был подан для проведения посадки пассажиров…' и т.п.              Метасимволы или маски. Далеко не всякая поисковая машина может поддерживать поиск строк с использованием метасимволов ('*', '?'), которые обычно используются в значении «любая подстрока» и «произвольный (любой) одиночный символ» соответственно. Тем не менее, эти операторы нередко бывают зарезервированы для подобного использования в будущем.    Рассмотрим конкретный пример. Откроем в браузере начальную страницу поискового сервера Яндекс. В поле поиска введём ключевые слова, например, «информатика учебники тесты CD-ROM», либо «информатика&учебники&тесты&CD-ROM». В результате проведённого поиска было найдено 202 страницы, содержащие данный запрос и не менее 81 сайта. В статистике поиска можно ознакомиться с количеством сайтов, содержащих каждое из ключевых слов: информатика – 55813, учебники – 189860, тесты – 498394, CD – 348167, ROM – 34315.  
Пример: Теперь зададим в поле поиска следующую фразу: «информатика|учебники|тесты|CD-ROM», используя оператор OR. В результате по этому запросу будет найдено 48518876 страниц, не менее 22970 сайтов, в каталоге 962 сайта.  
Пример: Используя оператор NOT, введём в поле поиска следующую фразу: «информатика ~учебники тесты CD-ROM»/ В результате будет найдено 3695907 страниц и не менее 4056 сайтов, которые будут содержать ключевое слово «информатика» с исключением слов, стоящих в запросе после значка «~».

Пример: Яndex также позволяет использовать вместо слов целые логические выражения, при этом его необходимо заключить в скобки. Используя наш пример, введём в поле поиска следующее выражение: (информатика учебники) тесты CD-ROM. В результате поиска будет найдено 3564 страниц и не менее 701 сайта, содержащие в себе такую группу слов как (информатика учебники).

При поиске информации в Интернет очень важно учитывать морфология языка запросов. По каждому слову запроса поиск ведется с учетом правил словоизменения соответствующего языка. Поисковая машина «понимает» и «различает» слова русского и английского языков - по умолчанию. Поиск ведется, с учетом изменения по склонению, спряжению, числу и лицу, т.е. по всем формам слова; включая даже совпадающие по смысловому значению. Например, при поиске по слову машина будут также найдены документы, содержащие слова 'о машине', ' промашину', 'машиной', и т.п., но и, что особенно важно, даже слова 'машины', 'машинам', 'машин' окажутся соответствующими запросу. Чтобы провести поиск только по одной строго определенной форме слова, нужно взять его в двойные кавычки или воспользоваться знаком "!".   

Также существуют некоторые слова и символы, которые по умолчанию исключаются из запроса в связи с их малой информативностью. Это – самые частотные слова русского и английского языков, например, предлоги, частицы и артикли. Очень часто опускаются апострофы и тире. Большинство поисковых машин их знают и сами освобождают от них сформулированный Вами запрос. Это связано с тем, что факт присутствия этих слов может заметно замедлить поиск и отрицательно повлиять на его результат и полноту, а, в конечном итоге, и успешность. В тоже время есть возможность обозначить необходимость этих слов в запросе. Для этого, следует взять запрос в двойные кавычки или воспользовавшись поиском точной фразы в расширенном поиске.    Существует также поиск, с помощью ограничения расстояния. Например, если запрос составлен из нескольких слов без применения операторов и конструкций языка запросов, то машина будет пытаться найти документы, в которых встречаются все слова запроса. При этом для каждого запроса всегда вводится так называемое ограничение контекста – положительное число. По умолчанию принимается расстояние равное 40 словам. Документ, в котором встретились все слова запроса, будет выдан только в том случае, если расстояние между словами запроса будет меньше этого числа. В поисковых системах есть возможность задавать порядок следования и расстояние между словами. Расстояние между словами А и В равно: 1 ( В следует сразу за А ), 2 ( В следует за А через одно слово ) и т. д. Или -1 ( В стоит перед А ), -2 … Знак "/" между словами, за которым стоит число, означает, что расстояние между ними не должно превышать этого числа слов.      Например, нам необходимо найти документы, в которых будут содержаться слова «информатика» и «учебники», и расстояние между ними не должно превышать 2 слов. Для этого введём в поле поиска следующее выражение: "информатика/2учебники". В результате по нашему запросу получим 9 страниц и не менее 5 сайтов

Пример: Если же мы немного изменим наш запрос - информатика/(+1+4)учебники – то мы получим документы, в которых данные ключевые слова будут идти друг за другом в таком порядке на расстоянии от 1 до 4 слов.  

Очень часто приходиться также проводить поиск уже в найденной информации, т.е. можно осуществить поиск по документам, найденным по предыдущему запросу. Для этого в конце запроса нужно поставить «$$» или просто сделать отметку в окошке «поиск в найденном», расположенном на странице запроса. Эта функция очень удобна для последовательного сужения поиска.  

Язык поисковой машины Яndex обладает наиболее полным набором возможностей в русскоязычном поиске, поэтому, освоив его, вы без труда сориентируетесь в языке запроса любого другого средства поиска.

 

 

 

 

 

 

 

 

 

4.ВЛАДЕНИЕ ПОЛЬЗОВАТЕЛЬСКИМИ ИНСТРУМЕНТАМИ

 И ТЕХНИКОЙ

Не забывайте о команде Find браузера. Если ваш браузер имеет в меню Файл, Правка или Вид команду Find (Найти), используйте ее для обнаружения трудноуловимых ключевых слов страницы. Чтобы отыскать слово, которое вам нужно, воспользуйтесь комбинацией клавиш CTRL+F в вашем браузере и введите искомое ключевое слово.

Сохраняйте ссылки на важные и часто посещаемые страницы, используя команду Добавить в «Избранное». Используйте подобные механизмы для регистрации предварительных результатов поиска в процессе беглого отбора с целью дальнейшего подробного изучения. Поддерживайте свою персональную коллекцию ссылок в рабочем состоянии: актуализируйте и систематизируйте ее, удаляйте устаревшие и ненужные. Существуют специализированные программные средства - интегрируемые модули расширения для стандартных браузеров, которые индексируют информационные ресурсы ранее посещаемых узлов. Они способны выполнять полнотекстовый поиск документов на любом узле, включая результаты обработки запросов.

Сохраняйте копии важных документов. Активно используйте команды контекстного меню Сохранить объект как… и Сохранить рисунок как… и команду меню Файл – Сохранить как… для создания копий необходимой вам информации из сети Интернет на локальном ресурсе вашего ПК. Этим вы решите некоторые проблемы: изменчивости и недолговечности WWW , концентрации внимания исключительно на целях определенного этапа поиска, экономии времени on–line подключения и перевод изучения отобранных материалов в режим off-line.

Отключайте вывод изображений. Если вы не желаете видеть многочисленные рекламные заставки и для вас важен не дизайн сайтов, а их содержательная информация, измените заданный режим просмотра в браузере на режим вывода только текста (исключив возможности мультимедиа). Это значительно увеличит скорость поиска. При этом, если возникнет необходимость быстрого просмотра важной графической информации, воспользуйтесь пунктом контекстного меню «Показать рисунок», кликнув для его вызова правой кнопкой мыши в место невыведенного рисунка.

Не теряйте самоконтроль. Интерактивная среда WWW увлекает, и зачастую после нескольких десятков минут Web–серфинга мы забываем: как попали на данный сайт, что хотели найти и по какому адресу расположена только что просмотренная уникальная информация… И в этом случае не пренебрегайте аккуратным использованием функциями (кнопками) вашего браузера Назад и Вперед, помогающими упорядочить навигацию. Чтобы не терять информацию и время, приучите себя всегда явно определять цель предстоящего on–line сеанса и при работе стараться не отступать от нее, оставляя прочие возникающие идеи и желания на потом. Планирование поисковой работы по этапам также даст результат: поиск станет более осознанным и систематичным, а результат – более полным и точным.

 

 

 

 

 

 

 

 

 

 

 

 ЗАКЛЮЧЕНИЕ

При работе над данной курсовой работой я определила для себя базовый  алгоритм поиска.

  1. Прежде всего, определите, к какому разделу относится искомая информация.
  2. Определитесь какую именно поисковую машину лучше использовать. Учитывайте её специфику.
  3. Выявите основные слова (или словосочетания), которые характерны для той информации, которую ищите. Попробуйте выявить ключевые слова.
  4. Задавая отдельные слова и фразы, учитывайте язык запросов, операторы поиска, логические связки искомых слов и т.п. элементы, которые делают поиск значительно более эффективным.
  5. Если вам известна точная фраза из искомых материалов, используйте её как цитату.
  6. После проведения предварительного поиска (или первой ступени поиска), если выдано довольно большое количество документов, воспользуйтесь элементом уточнения: «Искать в избранном». При этом задание поиска следует обязательно уточнить, введя хотя бы одно новое слово или ограничение, которое по вашему мнению поможет провести правильный отбор требуемого материала.
  7. Грамотно располагайте материал и проводите его сортировку по удобным для вас признакам. Это заметно ускорит последующую обработку материала.
  8. Фиксируйте все интересные для вас найденные адреса документов в Интернете (например, с помощью программы Блокнот). Затем выберите среди них нужные для выполнения конкретной работы.

Придерживаясь этого алгоритма поиск информации в сети интернета становится проще и быстрее.

Информация о работе Язык поисковых запросов. Применение языка запросов