Общая концепция построения электронного архива и принципы его организации

Автор работы: Пользователь скрыл имя, 05 Апреля 2014 в 21:10, реферат

Краткое описание

Целесообразным для большинства предприятий решением проблемы организации работы с крупными объемами документов является перевод востребованной части (а лучше - всей) документации предприятия в электронный вид и создание электронного архива. Именно электронные архивы становятся необходимыми условиями эффективной информационной поддержки работы предприятия в XXI веке.
Вышеизложенное является подтверждением актуальности выбранной темы, теоретической и практической значимости предмета ее исследования.
Основной целью работы является исследование профессиональной системы управления электронным архивом на предприятии.

Вложенные файлы: 1 файл

КУРСОВАЯ Электронный архив на предприятии (Курсовая).doc

— 319.50 Кб (Скачать файл)

Для сканирования сшитой узкоформатной (до формата А3) документации формата до А3 могут применяться бесконтактные книжные сканеры Bookeye, Minolta и Zeutschel. Особенностями данных сканеров является отсутствие механического контакта со сканируемыми материалами. Сканирующая камера расположена над столом на котором располагаются сшитые документы. Время сканирования разворота 3-5 секунд. Получаемый формат файла - *.tif монохромный и Gray scale. Сканер и программное обеспечение управления имеют опции, необходимые для работы со сшитыми документами - корректировку изгиба страниц и ряд дополнительных функций, позволяющих наиболее удобно поставить технологию сканирования, например, работа с баркодами. При наличии толстых книг и пачек сшитой документации целесообразно применять специальные дополнительные подставки. Оператор перелистывает страницы вручную. Запуск процесса сканирования может осуществляться при помощи педали, пульта управления сканером или прямо из ПО. Данные сканеры могут успешно применяться и для сканирования отдельных узкоформатных листов, имеющих ветхое состояние. Если на предприятии отсутствует необходимость сканирования узкоформатной сброшюрированной документации, но имеются небольшие объемы ветхих узкоформатных документов, то использование бесконтактных сканеров в этом случае нецелесообразно. Для этих целей вполне подходит простой планшетный сканер или планшет поточного сканера Fujitsu.

Для сканирования широкоформатной документации могут применяться широкоформатные сканеры компаний Contex Scanning Technologies и Vidar Systems Sorporation. Эти сканеры предназначены для перевода в электронный вид документации широких форматов (свыше А3 до А0) без ограничения по длине сканируемого листа. В сканерах аппаратно реализованы алгоритмы цифровой обработки изображений. Например, на сканерах Contex оператор управляет лишь выбором алгоритмов или их параметрами, но сам процесс обработки результата сканирования «зашит» в устройство и происходит в режиме реального времени. Среди основных алгоритмов, используемых для получения наилучших результатов, - механизм независимого улучшения деталей переднего плана и фона (Dual 2D-Adaptive Enhancement), выделение полутонов для качественного копирования (ADL + Error Diffusion Halftoning), динамическое выставление порога сканирования (2D-Adaptive Thresholding), фильтры повышения резкости (2D-Sharpening), сглаживания (2D-Softening) и размытия (2D-Blur) полутонового и цветного изображений, выделение деталей изображения по цветовым признакам (Color Feature Extraction), приведение цветовой палитры к заданным цветам (8 бит). Для разных типов оригинальных изображений используются различные наборы алгоритмов. Таким образом, оператор получает в руки мощный механизм обработки, и зачастую качество отсканированного изображения превосходит качество оригинала - например, при сканировании «синек» или выцветших оригиналов. Сканеры модельного ряда Vidar и Contex имеют прямой тракт протяжки с равномерно расположенными роликами, что позволяет успешно сканировать ветхую документацию и кальки. Оба модельных ряда имеют возможность монохромного, Gray scale и цветного сканирования. Конкретные модели отличаются также и по производительности.

При построении подсистемы сканирования электронного архива перспективным является сканирующее оборудование репрографических комплексов OSE TDS400, TDS600, TDS800, имеющее высокую производительность и качество. В состав комплекса входит сканер, плоттер и контроллер, являющийся связующим звеном между ними. Поддерживаемые форматы файлов: HP-GL, HP-GL2, Calcomp, Tiff и Cals, используемые в большинстве CAD- и EDMS-систем. Опционально предусмотрена поддержка Adobe PostScript 3, включающая прямую печать PDF-форматов. PDF- наиболее распространенный формат для большинства офисных приложений, все чаще применяемый для обмена данными в Internet и архивного хранения. Кроме того, TDS400 поддерживает форматы ASCII. Скорость сканирования TDS400 - 3 метра/мин, TDS600 - 5 метров/минуту, TDS800 -10 метров/минуту. Сканеры предназначены для сканирования большеформатной документации формат - до А0. Длина оригиналов может достигать 15 метров и определяется автоматически. К сожалению, в рамках одной статьи невозможно привести подробное описание всей техники Вы можете получить его в офисе Consistent Software , на сайте www.csoft.spb.ru, www.oce.ru или связавшись по телефону +7 (812) 430-34348.

Подобрать то или иное оборудование, как отмечалось выше, можно лишь после обследования «бумажного»архива предприятия и требований, выдвигаемых к электронному архиву. Обязательной для создания подсистемы сканирования является разработка непосредственно самой технологии сканирования, уникальной, как правило, в каждом отдельном случае и соответствующего подобранной технологии программного обеспечения обработки сканированных изображений. При подборе оборудования часто возникают ошибки, связанные с тем, что не учитывается технология проведения работ. Так, например поточный сканер A3 формата Scamax 2600 имеет производительность 90 листов в минуту. Но это совсем не означает, что за 8 часов работы будет отсканировано 8 х 60 х 90 = 43200 документов. На самом деле, производительность данной модели в среднем 10000-20000 отсканированных документов в день. Точная цифра зависит от качества документов, технологии работ. При наличии изображений низкого качества на бумажных документах, приходится включать дополнительные опции автоматической обработки изображений в программном обеспечении управления сканером, которые замедляют процесс сканирования. Если при поточном сканировании в пачках встречаются документы на бумаге низкого качества, то оператор сканирования будет вынужден периодически переходить из режима автоподачи в режим ручной подачи, что в свою очередь, замедляет производительность сканера. Разработка технологии проведения работ по сканированию является серьезной задачей и требует определенного опыта и знания всех, в том числе и дополнительных возможностей оборудования и ПО (работа с баркодами, корректирующие опции ПО, дополнительные блоки и аппаратные модули). Велика вероятность того, что Вам потребуется дополнительная обработка файлов, например устранение перекосов, «вырезание» изображений по формату, пакетное удаление повторяющихся и ненужных частей изображений (например, изображений перфорации на спецификациях). Необходимость дополнительных операций по обработке имеет следующие причины9:

• состояние подлинников (загрязненные, выцветшие, на цветных и серых бумагах), вызывающее появление нечетких, неконтрастных изображений низкого качества;

• наличие подлинников нестандартных размеров. Например, если оригинал на миллиметры шире формата А1, то при тиражировании, печатающее устройство может воспринять его, как документ формата А0, хотя поданные на печать «лишние миллиметры» не несут никакой информации;

• наличие повторяющихся фрагментов изображений не несущих информации, но делающих размер файла больше. Например, изображение перфорации по краям спецификаций;

• возможность перекосов изображения, связанных с перекосом ветхого документа в протяжном тракте поточного сканера.

Эти причины могут привести к тому, что часть изображений не будет иметь удовлетворительного качества. Часть из перечисленных недостатков может устраняться прямо в процессе сканирования при помощи стандартных аппаратных или программных опций. Как правило, сканирующее оборудование и программное обеспечение имеет ряд дополнительных аппаратных и программных блоков,приобретаемых отдельно, которые помогут справиться с имеющейся проблемой10. Не стоит скрывать того, что некоторые из перечисленных выше недостатков изображений невозможно устранить в процессе сканирования при помощи дополнительных аппаратных блоков и опцийпрограммного обеспечения. В этом случае необходима дополнительная обработка изображений. Правильно было бы стремиться максимально исключить «ручную» обработку и использовать дополнительное программное обеспечение пакетной обработки, которое автоматически устраняет недостатки полученных изображений. Всегда стоит помнить о том, что в архиве предприятия найдется часть документов, электронные копии которых возможно отредактировать лишь «вручную». Пакетная обработка не приемлема для файлов, недостатки изображений в которых не имеют каких-либо закономерностей и не встречаются в других файлах. В этих случаях, как правило, предусматривается использование дополнительного программного обеспечения. Исходя из вышеизложенного, при разработке подсистемы сканирования электронного архива предусматривается использование дополнительных программных пакетов, например SPOTLIGHT PRO V4 производства компании Consistent Software, выполняющего функции обработки растров, дигитайзирования, трассировки, векторизации, гибридной обработки. Специалисты компании Consistent Software помогут Вам произвести исследование «бумажного» архива, правильно подобрать необходимое оборудование, программное обеспечение и разработать технологию работы подсистемы сканирования электронного архива. Смоделировать процессы работы подсистемы сканирования по разработанной технологии Вы сможете прямо в нашем офисе на работающем оборудовании.

 

2.2 Организационные принципы создания системы хранения

 

Следующим этапом создания электронного архива является разработка системы хранения в составе устройств оперативного накопления и подсистемы долговременного хранения. Современные информационные технологии и аппаратное обеспечение без особых проблем и затрат позволяют создать оперативный электронный архив. Устройством оперативного накопления может являться жесткий диск или Raid - массив, объем которого определяется общей технологией создания архива. При расчете объема учитывается общий объем информации, подлежащий оперативному накоплению до записи в устройство долговременного хранения и оперативному использованию (на основе производительности блока сканирования и задач предприятия)11.

Более сложной является разработка подсистемы долгосрочного хранения. Это связано с большими и сверхбольшими объемами электронной информации, полученной при переводе «бумажного» архива предприятия в электронный вид. В качестве устройств долговременного хранения могут быть использованы роботизированные CD-DVD библиотеки под управлением специализированного программного обеспечения. Система долгосрочного хранения является одной из важнейших во всей структуре электронного архива и выполняет следующие задачи:

1. Организация хранения больших  и сверхбольших объемов информации;

2. Организация доступа к большим и сверхбольшим объемам информации;

3. Организация пополнения хранящейся  информации по мере её накопления  на предприятии;

Кроме требований, вытекающих из вышеперечисленных задач, к модулю долгосрочного хранения выдвигаются следующие:

1. Надежность хранения информации (физическая, техническая надежность и возможность разграничения по правам доступа);

2. Совместимость с системами  автоматизации предприятия, обеспечение  возможности обращения к информации  не только в «файл-серверном» режиме, как к открытому для тех или иных пользователей сетевому ресурсу, но и из программных надстроек (СУБД, систем автоматизации и т. д.);

3. Возможность расширения объемов  хранения;

4. Возможность увеличения производительности  при увеличении числа пользователей;

5. Наращиваемость системы;

6. Возможность дальнейшего развития  решения при дальнейшем развитии  информационных технологий при  исключении больших финансовых  затрат.

Одним из решений по созданию системы долгосрочного хранения могут являться роботизированные библиотеки компании NSM AG. Роботизированная CD-DVD библиотека под управлением специализированного программного обеспечения является высокотехнологичным накопителем информации. Носителями информации являются CD и DVD диски, являющиеся в настоящее время самым надежным и развивающимся носителем, позволяющим иметь удельную стоимость хранения единичного объема на порядок ниже по отношению к HDD и Raid - массивам. Кроме того, применяемые носители менее критичны к условиям эксплуатации (магнитные поля, температура и т. д.), не требуют перемагничивания и прочих процедур, необходимых при обслуживании жестких дисков. Время хранения информации ~ 75 лет (по оценкам разных экспертов - от 50 до 100). Все носители размещены в одном корпусе и при помощи специализированного программного обеспечения объединены в один локальный или сетевой ресурс сверхбольшого объема, администрируемый по правам пользователей и позволяющий обращаться к нему как в «файл-серверном» режиме, так и через вышестоящее программную надстройку (СУБД, систему автоматизации и т. д.). При обращении к тому или иному файлу, робот, размещенный внутри корпуса извлекает носитель и вставляет его в привод, далее, через SCSI - интерфейс, осуществляется его передача на управляющий PC и при помощи ПО, файл отдается в сеть.

Роботизированные библиотеки позволяют:

1. разместить в одном корпусе ~ от 120 до 600 CD-DVD носителей; В зависимости  от модели, число дисков может  быть ~ 135, 300, 400 или 600. Каждый диск  размещается в отдельном слоте  внутри корпуса библиотеки. Особенностями накопителей предлагаемого модельного ряда в организации размещения носителей являются12:

o использование технологии «No Tuch», заключающейся в том, что каждый носитель хранится в отдельном пластиковом конверте, исключающем механическое прикосновение к диску и, как следствие, не допускаются повреждения, влияющие на работоспособность системы;

o возможность подключения дисков  через mail-slot (по одному отдельно  хранимому диску) или при помощи  дополнительных магазинов. Каждый  дополнительный магазин содержит по пятнадцать дисков, необходимость постоянной работы с которыми отсутствует. Магазины могут храниться отдельно (вне корпуса библиотеки и подключаться при необходимости). Важной особенностью подключения магазинов является отсутствие необходимости выключать или перезагружать систему.

2. Представить весь массив носителей  в виде локального или сетевого  ресурса (проще говоря, в виде  одного диска размером до ~ 3 терабайт;

3. Организовать доступ к хранимой  информации, как к сетевому ресурсу;

4. Организовать запись на CD и DVD - носители при увеличении объемов информации (пополнении архива);

5. Повышать производительность  системы (модульность устройств  позволяет наращивать число приводов). Так, например, Вы можете установить  базовый модуль NSM6000 на 620 слото-мест с одним приводом. При наполнении архива и увеличении интенсивности доступа к нему, число приводов может быть увеличено до 14;

6. Переходить на новые, постоянно  развивающиеся технологии (Например, сейчас наивысшим стандартом, поддерживающим  все ранее разрабатываемые является DVD - 4.7 GB. Это означает, что привода указанного стандарта читают CD, DVD - 2.6, DVD-4.7). При появлении новых стандартов, библиотека не «устаревает». Необходимо лишь установить новый привод;

7. Увеличивать объемы хранимой  информации. Так, например при установке пишущих DVD приводов, возможна перезапись с существующих CD носителей на DVD, что позволит при использовании той же модели, при том же числе слото-мест значительно повысить «емкость» хранилища;

Задача создания подсистемы долгосрочного хранения подразумевает высокую надежность системы и большое время наработки на отказ.

Задача обеспечения надежности решается:

Информация о работе Общая концепция построения электронного архива и принципы его организации