Информационные системы: Общие характеристики информационных систем

Автор работы: Пользователь скрыл имя, 05 Ноября 2012 в 20:38, курс лекций

Краткое описание

Лекция 1. Введение. Основные понятия, связанные с информационными системами 3
Лекция 2. Общая функциональность информационных систем 9
Лекция 4. Архитектуры и администрирование информационных систем 19
Лекция 5. Резервное копирование 24
Лекция 7. Основы теории информационного поиска 29
Лекция 8. Предкоординированные ИПС 34
Лекция 9. Словарные ИПС 39
Лекция 10. Стратегия поиска: использование нескольких источников 43

Вложенные файлы: 1 файл

инфосистемы.doc

— 1.77 Мб (Скачать файл)

Нормативно-справочная информация

Многие виды проверок данных при вводе информации выполняются с использованием нормативно-справочной информации (НСИ). НСИ бывает, в основном, двух видов:

  • Перечни (линейные упорядоченные/неупорядоченные списки)
  • Иерархические (древовидные) классификаторы.

Примеры перечней:

  • Перечень улиц
  • Перечень видов законодательных актов (закон, постановление, указ,  
    распоряжение ...)
  • Перечень видов изданий для целей библиотечного описания.

 

Пример классификатора:

 

Виды товаров (в магазине)

 

Продовольственные

   

Бакалея

     

Крупы

       

Рис

       

Греча

     

Макаронные изделия

       

...

     

спиртные напитки

       

крепкие

         

коньяки и бренди

         

ром

         

джин

         

виски

         

водка

       

вина

другая точка зрения

другая точка зрения

         

сухие

 

марочные

 

белые

 
         

сладкие

 

ординарные

 

красные

 
         

полусладкие

     

розовые

 
         

вермуты

                           
         

шипучие

                           
         

...

                           
 

Непродовольственные

   

хозтовары

   

галантерея

   

парфюмерия

   

одежда

   

обувь

 

...


Рис. 5. Пример классификатора

Интерфейсы информационной системы

Ввод информации информационная система осуществляет через свои интерфейсы. Информационные системы имеют интерфейсы трех типов:

  • аппаратные (с датчиками в АСУТП, аппаратурой регистрации в магазине — кассы, считыватели штрихкодов и т.п.)
  • межсистемные — с другими ИС
  • человеко-машинные — для ручного ввода данных и восприятия данных человеком.

Остановимся  на двух последних  типах интерфейсов.

Межсистемные  интерфейсы

Межсистемные  интерфейсы обеспечивают передачу информации между ИС и должны обеспечивать необходимые скорость этой передачи и уровень безошибочности. Межсистемный  интерфейс может быть реализован как передача файла (набора файлов), полученного в результате вывода информации из ИС, а может быть реализован в виде протокола, т.е.  набора соглашений о передаче и приеме информации и действиях, необходимых в случае рассогласования и возникновения иных ошибок взаимодействия ИС. Наличие протокола позволяет передавать информацию между ИС более оперативно, чем позволяет обмен файлами.

И структуры файлов, и протоколы  обмена информацией должны быть согласованы  с информационными потребностями взаимодействующих ИС. Если такое согласование достигнуто, то говорят об интероперабельности таких ИС. Уровень интероперабельности может быть различным. Так, файлы формата .doc позволяют сохранить в них программу VBA, а файлы формата .rtf — нет.

Форматы файлов и протоколы, обеспечивающие межсистемные  интерфейсы, называют коммуникативными.

Коммуникативные форматы

Существует четыре широко распространенных универсальных коммуникативных формата:

  • т.н. меточный
  • CSV — компактный, для линейных данных фиксированной структуры
  • семейство форматов TLV (Tag–Length–Value — Метка–Длина–Значение), наиболее известным форматом этого семейства является ISO2709 — компактный, предназначен для линейных данных с повторениями и пропусками
  • XML — более "рыхлый", но, в принципе, позволяет описать любые древовидные и списковые данные

и несколько стандартов описания коммуникативных  протоколов,  наиболее гибкими из которых является Abstract Syntax Notation One (ASN.1), используемый в настоящее время, в основном, в области коммуникаций (GSM, SSL, шифрование).

Самих коммуникативных  протоколов очень много. Коммуникативный  протокол может использовать коммуникативный формат файла для описания структуры передаваемой порции данных. Так, например, SOAP использует XML, а протоколы, описанные с помощью ASN.1, могут использовать ISO2709 (на самом деле они используют слегка другой формат — BER (Basic Encoding Rules) или даже совсем иные форматы, например, Packed Encoding Rules).

Коммуникативные форматы удобны для передачи данных, но не удобны для обработки, хранения и поиска информации, поэтому всегда применяются конвертеры — программы, преобразующие внутренний формат данных информационной системы в коммуникативный и наоборот.

Меточный формат

Меточный формат — наиболее простой из коммуникативных форматов. Стандарта на этот формат не существует, однако существуют общепринятые соглашения. Файл этого формата состоит из строк, каждая из которых либо соответствует одному полю записи, либо является разделителем записи. В качестве разделителей записей в меточном формате используются либо пустые строки, либо строки, содержащие те или иные заранее оговоренные последовательности символов, например, единственный знак «равно» ("=").

Каждое  поле записи меточного формата занимает ровно одну строку, начинающуюся с  метки этого поля (отсюда и название формата), за которой следует разделитель (обычно двоеточие, ":").

Name:Иванов 
FirstName:Пётр 
CitizenOf:Россия 
 
Name:Анненкова 
FirstName:Полина 
CitizenOf: 
Cargo:800 тонн 
 
Name:Бендер-бей  
FirstName:Остап 
OtherNames:Сулейман 
OtherNames:Берта 
OtherNames:Мария 
CitizenOf:Бразилия

Рис. 6. Записи меточного формата

Записи меточного формата могут  содержать повторяющиеся поля, поля с пустыми значениями, состав (перечень полей) записей в одном и том же файле может быть разным.

CSV-Comma Separated Values

CSV также, скорее, не стандарт, а общепринятое соглашение. В CSV-файле (расширение может быть любым) хранятся записи переменной длины. Для каждой записи отводится одна строка. CSV-записи содержат одинаковое число полей переменной длины. Поля отделяются друг от друга разделителем — запятой, точкой с запятой, кодом табуляции или любым другим символом, одинаковым для всего файла. Форматы числовых полей и  полей, содержащих даты, не регламентированы и для обеспечения интероперабельности должны согласовываться дополнительно. Строковые поля могут заключаться в двойные кавычки; если значение поля содержит символ-разделитель, то поле должно быть заключено в двойные кавычки. Если двойная кавычка содержится в значении поля, то она удваивается. Сочетание {двойная кавычка, разделитель, двойная кавычка} в значении поля обычно не допускается.

ISO2709 (TLV)

ISO2709 — международный стандарт Международной организации по стандартизации (International Standard Organization), впервые принят в 60-х годах XX в., последняя версия относится к 1996 г. Этот формат принадлежит семейству форматов {метка, длина, значение} — {Tag, Length, Value} (TLV). Все длины, о которых говорится в описании формата, измеряются в октетах (байтах). Файл этого формата содержит записи переменной длины, состоящие из трех частей:

  • Лидер
  • Справочник
  • Область данных

Лидер имеет фиксированную длину.  Эта часть записи разбита на несколько  полей, каждое из которых имеет также фиксированную длину. В этих полях задаются основные характеристики справочника, разделители полей и записей, информация о разбиении длинной записи на строки фиксированной длины и краткая информация об ИС, породившей запись.

Среди задаваемых характеристик справочника  присутствуют количество байтов, отводимых  под:

  • Метку поля
  • Длину поля (включая разделитель полей, но исключая разделитель записей)
  • Смещение поля
  • Количество элементов в справочнике

Каждое поле записи идентифицируется меткой фиксированной длины. Содержание метки поля — предмет договоренности между разработчиками/администраторами взаимодействующих ИС. Например, в библиотечном формате MARC используются трехсимвольные цифровые метки. Поля с одинаковыми метками могут присутствовать в записи многократно; при этом значения экземпляров полей могут быть различными (например, для передачи информации о нескольких авторах).

Наличие длин, смещений и разделителей позволяет контролировать целостность  поля/записи и читать файл, пропуская дефектные поля/записи.

Порядок полей  в справочнике может не совпадать  с порядком полей в области  данных.

 

0

                 

1

                 

2

                 

3

     

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

0

1

2

3

4

5

6

7

8

9

0

1

2

 

Лидер

Справочник

 

Длина 
записи

С

Код 
применения

И

П

Базовый адрес данных

Прим

В

Н

Рез

Метка

Длина

Сме

 

0

0

4

2

2

0

0

0

0

0

0

1

0

0

1

2

9

0

0

0

4

5

0

0

0

4

4

0

0

7

8

0

0

ç0

Справочник

 

щение

Метка

Длина

Смещение

Метка

Длина

Смещение

Метка

Длина

 

0

0

0

0

5

0

0

0

1

1

0

0

0

7

8

0

6

9

0

0

7

7

0

0

0

8

9

0

2

4

0

0

6

ç32

Справочник

 
 

Смещение

Метка

Длина

Смещение

Метка

Длина

Смещение

Метка

 

9

0

0

1

6

6

0

2

6

0

0

1

8

0

0

2

3

5

0

3

0

0

0

1

0

0

0

2

5

3

0

7

0

ç64

Справочник

 

Длина

Смещение

Метка

Длина

Смещение

Метка

Длина

Смещение

 

0

0

1

1

0

0

2

6

3

0

7

0

0

0

1

2

0

0

2

7

4

0

7

0

0

0

0

6

0

0

2

8

6

ç96

#

M

e

t

h

o

d

o

l

o

g

y

 

o

f

 

p

l

a

n

t

 

e

c

o

-

p

h

y

s

i

o

l

ç128

o

g

y

:

 

p

r

o

c

e

e

d

i

n

g

s

 

o

f

 

t

h

e

 

M

o

n

t

p

e

l

l

i

ç160

e

r

 

S

y

m

p

o

s

i

u

m

#

I

n

c

l

.

b

i

b

l

.

#

P

a

p

e

r

 

o

n

:

ç192

 

p

1

a

n

t

 

p

h

y

s

i

o

l

o

g

y

,

 

p

l

a

n

t

 

t

r

a

n

s

p

i

r

ç224

a

t

i

o

n

,

 

m

e

a

s

u

r

e

m

e

n

t

 

a

n

d

 

i

n

s

t

r

u

m

e

n

t

ç256

s

#

T

e

c

h

n

i

q

u

e

s

 

f

o

r

 

t

h

e

 

m

e

a

s

u

r

e

m

e

n

t

 

ç288

o

f

 

t

r

a

n

s

p

i

r

a

t

i

o

n

 

o

f

 

i

n

d

i

v

i

d

u

a

l

 

p

l

ç320

a

n

t

s

#

P

a

r

i

s

 

U

n

e

s

c

o

 

l

9

6

5

#

р

.

2

1

1

-

2

2

4

#

ç352

M

a

g

a

l

,

А

.

С

.

#

F

r

a

n

c

o

,

C

.

M

.

#

V

u

,

T

.

#

#

     

ç384


Рис. 7. Пример записи ISO2709

Записи ISO2709 могут выступать как данные других записей ISO2709. При этом процедуры контроля целостности данных и пропуска дефектных данных становятся более сложными.

XML (eXtensible Markup Language)

XML будет посвящена отдельная большая часть курса

Человеко-машинные интерфейсы

Человеко-машинные интерфейсы в подсистеме ввода информации представлены формами. В подсистеме вывода мы увидим другой человеко-машинный интерфейс — отчет.

Форма содержит компоненты двух основных типов:

  • Метки
  • Поля ввода данных.

Поля ввода данных, как можно  предполагать из их названия, служат для  ввода данных. Каждое поле ввода данных, как правило, снабжено меткой, указывающей пользователю, какие именно данные ожидает от него ИС в соответствующем поле. Метки обычно располагаются слева или сверху от соответствующего поля.

 

Фамилия:

[_________________________]

Имя:

[_______________]


Рис. 8. Фрагмент формы ввода, содержащий поля ввода и их метки

Поля ввода данных, в свою очередь, бывают различных типов:

  • Текстовое, отображаемое (в том числе с масками, например, для ввода телефонного номера:

+Ц (ЦЦЦ) ЦЦЦ-ЦЦЦЦ

  • Текстовое неотображаемое  (каждый вводимый символ заменяется символом-маской; используется, например, для ввода пароля)
  • Поле выбора (радио-кнопка)
  • Булево поле (галочка, checkbox)
  • Поле выбора из списка

На последнем типе полей следует  остановиться особо. Как правило, список для выбора формируется из нормативно-справочной информации (НСИ), но может формироваться и из уже введенных в систему данных. Таким образом, для демонстрации пользователю формы, предназначенной для ввода данных, ИС обращается к своей функции вывода информации.

  1. Обработка, поиск и вывод информации

Обработка информации

Хранение информации является важнейшей  функцией ИС, поэтому для хранения информации разрабатываются специальные аппаратные (от НЖМД к RAID к средам хранения) и программные (СУБД, ИПС) средства. Программные средства хранения информации зачастую имеют многочисленные настроечные параметры, позволяющие повысить эффективность хранения информации (например, уменьшить время доступа к ней).

Важнейшими характеристиками подсистемы хранения информации являются:

  • Емкость (в гигабайтах, записях)
  • Время доступа к данным
  • Надежность, которая характеризуется:
    • Временем наработки на отказ
    • Временем восстановления после отказа

Информация о работе Информационные системы: Общие характеристики информационных систем