Автоматизированные информационно – поисковые системы

Автор работы: Пользователь скрыл имя, 20 Мая 2015 в 08:52, курсовая работа

Краткое описание

В данной курсовой работе рассматриваются теоретические основы информационного поиска, классификация и разновидности информационно поисковых систем. Представлен материал по применяемым в настоящее время информационно – поисковым каталогом полнотекстовыми и гипертекстовым поисковым системам

Содержание

Введение ……………………………………………………………………3
Информационные системы…………………………………….4
Понятие информационных систем………………………………………4
Структура информационных систем……………………………………4
Классификация информационных систем……………………………..6
Информационно поисковые системы…………………………7
Исторические предпосылки развития поисковых систем……………7
Понятие поисковых систем…………………………………………….....9
Особенности поисковых систем…………………………………………10
структура сети…………………………………………………....11
структура работы поисковых систем……………………….....13
Характеристика поисковых систем……………………………17
проблемы и возможности поисковых систем…………………24
Заключение………………………………………………………………….25
Список литературы………………………………………………………...26

Вложенные файлы: 1 файл

каным.doc

— 147.00 Кб (Скачать файл)

 

Характеристика поисковых систем.

 

Начиная поиск чего-либо в Internet и имея минимум информации, а так же пытаясь огранить потери времени, для получения наиболее общей информации возможно обращение к следующей базе данных.

База данных: предмет ведет к Межсетевым ресурсам, построенным библиотекарями.

Содержание: Свыше 2,500 связей с Internet ресурсами, кратко аннотируемыми, с  указанными предметными заголовками.

Поиск:  Поиски могут быть ограничены названием ресурса, описанием его, или с указанными предметными заголовками.

Результаты: Результаты показаны в алфавитном порядке названиями ресурса.

Адрес: http://sunsite.berkeley.edu/InternetInd ex/

Частота Модернизации: ежедневно

 

 

Yahoo!

Yahoo! – самая известная поисковая  машина. Её сайты разбиты по  категориям и ключевым словам. Она содержит полезную информацию  на своей домашней странице. Может  подключаться к другим поисковым  машинам

Базы данных: в ведении находится служба поиска Internet-ресурсов, новостей, карт, рекламных информаций, спортивная информация, бизнес, номера телефонов, персональные WWW-страницы, и email-адреса (отдельная база данных).

Содержание: Основная директория содержит: адреса (URLs) для Internet-ресурсов и краткое описание для этих связей.

Поиск: Все Yahoo страницы предлагают не только простое поисковое окно, но и опции для этого поиска, а так же поиск Usenet или Email-адреса. Поиск может ограничиваться указанием определённого промежутка времени. Boolean операторы (и, или) и последовательный поиск также поддержаны. Отметим: если поиск в Yahoo! не привёл к положительному результату, то процесс поиска автоматически переходит на Alta Vista, которая продолжает поиск, и в случае положительных результатов автоматически возвращает найденную информацию в Yahoo!.

 Если Yahoo! не может установить  связь достаточно быстро с Alta Vista, то в этом случае Yahoo! будет  обеспечивать страницу связи  с набором инструментов поиска. После того как одна из этих  связей выбирается, ключевые слова передаются к поисковой машине на ваше усмотрение.

Средством, облегчающим поиск, является наличие “tip search”(TS) - поиск с помощью “намека”: Yahoo! Является подчиненным справочником, что означает, что система не имеет так много страниц, как поисковые машины, однако задание наиболее общих ключевых слов позволит найти необходимую тему на странице высокого уровня (первая страница, которая возникает перед пользователем при посещении сайта) для организации или компании.

Результаты: Связи отображаются в соответствии с очерёдностью задаваемых слов последовательностью поиска наряду с их описательным текстом и подчиненной иерархией.

Адрес: http://www.yahoo.com/

Частота Модернизации: ежедневно

 

Alta Vista

Alta Vista поддерживает поиск по  ключевому набору слов и для определения языка конкретной страницы использует методы искусственного интеллекта. Пользователи могут настроить опции поиска и выбирать тип поиска – сложный или упрощенный, а также воспользоваться различными способами предоставления информации. В отличие от машин, которые индексируют только ключевые слова, она индексирует весь текст, что позволяет осуществлять полный поиск. Однако из - за этого пользователь может просто утонуть в информации.

Базы данных: Расположенные по всему миру WWW-страницы и Usenet News (новости).

Содержание: 31 миллион WWW-страниц (на май 1997 г.) и полный текст более чем 14,000 newsgroups обновленный в реальном масштабе времени.

Поиск: Предлагает простой(simple (S)) поиск или (much more advanced (MMS)),т.е. более передовой, способ. S - поиск стоит в основном использовать для общих вопросов, MMS - поиск использует специфический поисковый синтаксис. Для облегчения выполнения процедуры имеется подсказка(Simple Search Help). MMS - поиск, используя булинь(boolean), т.е. с помощью ключевых союзов, используя (and, or, not - (и, или, не)) и простую смежность (near - (около)) позволяет употреблять несколько слов, чередование слов, словосочетание в качестве ключевых для проведения поиска.

TS - поиск: Введением ключа типа: " Ваша Фраза " как первое направление поиска, который будет ограничивать число найденных WWW - документов с заголовками типа " Ваша Фраза ".

Результаты: Предлагает три выбора результатов (но два дают тот же самый результат):

1) "Стандартные"("Standard") - результаты, полученные машиной в виде списка параграфов, резюмируемые ей, с наличием URL - адреса, размером файла и последней датой модернизации. Результаты возвращаются как десять пунктов на экране,

2) "Компактный"("Compact") помещают  каждый пункт в одной строке с последней датой модернизации картотеки,

3) "Детальный"("Detailed"), который  является таким же самым, как  и "Стандартный".

Адрес: http://altavista.digital.com

Частота модернизации: Постоянно WWW-роботом.

 

Excite

Для анализа информации Excite использует поисковую технологию Intelligent Concept Extraction, что позволяет делать запросы по образцу. Это самая популярная поисковая система в Америке. Для каждой найденной страницы она оценивает степень соответствия запросу.

Базы данных: WWW-страницы по всему миру, новости, карты, "yellow pages" ("желтые страницы"), свободно распространяемое программное обеспечение, основные цитаты, программы телевидения, погоду, E - mail адреса, рейсы авиалиний.

Содержание: 50 миллионов WWW-страниц и больше чем двухнедельный запас Usenet новостей.

Поиск: Предлагает только S - поиск, который поддерживает некоторые опции MMS - поиска.

TS - поиск: используйте плюс (+) чтобы  определить, что все документы  имеют данное слово, или используют  минус (-) что бы уточнить, что ни  один из документов не имеет данного слова. Возможно так же  поддержка вoolean-операторами.

Вы можете использовать "AND", "OR" and "AND NOT"(И, ИЛИ и. И НЕ) операторы и круглые скобки для группировки. Например: (digital or virtual or electronic) AND library.

(цифровой или виртуальный или электронный) И библиотека.

Результаты: Результаты показаны с названием документа, разряд уместности в процентах, URL - адрес, резюме программного обеспечением документа, и опция, чтобы восстановить "More Like This"(" Скорее Этот "), которая  позволяет  использовать документ как ваш вопрос.

Адрес: http://www.excite.com/

Частота Модернизации: Постоянно - WWW-роботом.

 

Hot Bot

Для поиска в Интернете использует многопроцессорную параллельную обработку 10. млн. страниц ежедневно. Полезная сторона Hot Bot ограничение на тип страниц по средствам выбора кнопок.

База данных: Расположенные по всему миру WWW-страницы.

Содержание: 54 миллиона WWW-страниц (на сентябрь 1996 г.).

Поиск: Предлагает S - поиск и Эксперт(Expert (Е))- поиск, поддерживает boolean-операторы (И и ИЛИ), поиск фразы, и выбор " человек "или" URL ". Е-поиск также поддерживает  задание даты, местоположение (страна и т.д.)

TS - поиск: использует заключение  фразы в двойные кавычки (например, " слова фразы ").

Результаты: Результаты показаны с названием документа, разряд уместности в проценте, URL, размер документа.

Адрес: http://www.hotbot.com/

Частота модернизации: Постоянно WWW-роботом ("Slurp").

 

Infoseek

Infoseek самая популярная поисковая  машина в компьютерной индустрии. В мае 1996 она была признана  как самая достоверно предоставляющая информацию машина. Привлекательность машины в том, что после отсеивания информации можно проверить найденную информацию ещё раз.

Базы данных: расположенные по всему миру WWW-страницы, новости, запасает цитаты, карты, желтые страницы("yellow pages"), e mail адреса, и т.д.

Содержание: Главный база данных: 50 миллионов URL-адресов. (на сентябрь 1996 г.)

Поиск: предлагает только простой S - поиск, но ключевые слова поиска могут быть ограничены специфическими полями (типа в пределах заголовков документа), поиск с использованием возможностей либо с исключением определённого слова (данному слову предшествует минус"-") или с включением требуемого слова (данному слову предшествует " + "). Для дополнительной информации относительно выбора поиска, используется. Infoseek-Помощь(Infoseek Help).

Результаты: Включает название документа, размер картотеки, URL, краткое резюме, извлеченное из документа, и разряд уместности в процентах.

Адрес: http://www.infoseek.com/

Частота Модернизации: Постоянно WWW-роботом.

Дополнительная информация: в случае большого количества информации см. http://info.infoseek.com/.

 

Lycos

Lycos – одна из первых поисковых  машин. Машина удобна для работы  с поиском и для одновременного  просмотра сайтов. При выводе  информации показывает краткий обзор, и найденные адреса.

Базы данных: расположенные по всему миру WWW-страницы, звуки, картины, "top 5% sites"

Содержание: 70 миллионов URL-адресов (на март 1997г.).

Поиск: предлагает S - поиск и клиентурный(Custom (С)) поиск.  С-поиск поддерживает boolean-операторы AND и OR (И и ИЛИ), также как некоторые другие назначения.

Результаты: результаты внесены в упорядоченный список; информация включает адрес документа (URL), название, размер файла, и выдержки  из файла.

Адрес: http://www.lycos.com/

Частота модернизации: постоянно WWW-роботом.

 

 

 

 

 

 

 

ПРОБЛЕМЫ И ВОЗМОЖНОСТИ ПОИСКОВЫХ СИСТЕМ.

Работа многих поисковых машин считается вполне успешной. Однако все современные поисковые системы страдают некоторыми серьёзными недостатками:

    1. поиск по ключевым словам даёт слишком много ссылок и многие из них бесполезны.
    2. огромное количество поисковых машин с разными пользовательскими интерфейсами порождает проблему когнитивной перегрузки.
    3. методы индексирования баз данных, как правило, не связаны с информационным содержанием.
    4. часто выдаются ссылки на информацию, которой в Интернете уже давно нет.
    5. машины ещё не столь совершены, чтобы понимать естественный язык

в последнее время потребности в интеллектуальной помощи быстро растут. Это привело к появлению интеллектуальных агентов.

Обычно интеллектуальные агенты являются основной частью поисковой машины для поиска используется искусственный интеллект. Пользователь учит агента, а затем он выходит в Интернет для поиска.

Интеллектуальные агенты выполняют инструкции от имени пользователя, имеют некоторую самостоятельность. После поиска они оповещают пользователя о результатах. Агенты учатся в результате своей деятельности.

Интеллектуальность – обучение на основе обратной связи по примерам ошибкам и по средствам взаимодействия с другими агентами.

Простота использования – можно тренировать агента используя естественный язык.

Индивидуальный подход – адаптация к предпочтениям пользователей.

Интегрированность – непрерывное обучение применение уже имеющих знаний к новым ситуациям.

Автономность – ощущение окружающей среды, и анализ выводов.

 

ЗАКЛЮЧЕНИЕ.

Рассмотренные мною поисковые машины далеки от совершенства. Считается, что идеальная поисковая машина должна отвечать следующим требованиям:

      1. простота в использовании
      2. чётко организованный и обновляемый индекс.
      3. быстрый поиск в базе данных и быстрое реагирование.
      4. надёжность и точность результатов поиска.

Масштабы информационных ресурсов и  их количество постоянно расширяется. Становится ясно, что база данных не является совершенной. Интеллектуальные агенты – новое направление лежащее в основе нового поколения поисковых машин, которые могут фильтровать информацию и получать более точный результат. Internet  продолжает развиваться с неослабевающей интенсивностью, по сути дела стирая ограничение на распространение и получение информации в мире. Однако в этом информационном океане бывает не очень легко найти необходимый документ следует также иметь в виду, что в сети наряду с давно действующими серверами возникают новые.

Информационные системы, в которых представлены хранение, и обработка информации осуществляются с помощью вычислительной техники, называют автоматизированными, различные виды деятельности и наиболее буро развивающиеся отраслью индустрии информационных технологий.

 

 

 

 

 

 

 

 

Список литературы.

        1. Э.А. Якубайтис «Информатика-электроника-сети». М., «Финансы и статистика», 1989.
        2. . А. В. Гаврилов "Локальные сети ЭВМ", Москва, Изд-во "Мир", 1990.
        3. Н.А. Гайдамакин «Автоматизированные информационные системы, базы и банки данных», М.: «Гелиос», 2002.

 

 

 

 


 



Информация о работе Автоматизированные информационно – поисковые системы