Экспертные системы в исторической демографии

Автор работы: Пользователь скрыл имя, 20 Марта 2013 в 14:55, реферат

Краткое описание

Несмотря на сложность, на первый взгляд, внедрения работы искусственного интеллекта в работу историка, методы решения проблем с помощью экспертных систем уже практикуются. Одной из областей, где ЭС заняли свою законную нишу, является историческая демография. Рассмотрение применения экспертных систем в исторической демографии и является целью нашего исследования. Для достижения цели следует решить несколько задач:
Ознакомиться с предметом исследования, усвоить понятийный аппарат.
Рассмотреть историю вопроса.
Осветить непосредственно применение компьютерных методов в исторической демографии.

Вложенные файлы: 1 файл

черновик.docx

— 45.64 Кб (Скачать файл)

Только в 1960-е годы исследования в области демографии в нашей  стране возобновились. Среди вышедших в эти годы работ в первую очередь  следует отметить труды Б. Ц. Урланиса и А. Я. Боярского. Б. Ц. Урланис - крупнейший советский ученый-демограф, автор 18 книг по проблемам демографии. Учебник  по демографии опубликовал А. Я. Боярский. Он работал в ЦСУ СССР в отделе статистики населения и его учебник  посвящен именно статистике населения.

В 1970 - 1980-е годы в нашей стране появляется целый ряд талантливых  ученых-демографов. Это - работающий в  Институте российской истории АН РАН в Москве историк В. М. Кабузан. Его перу принадлежит ряд монографий о населении России в XVIII - XIX вв. Много  занимается он и проблемами колонизации. С. И. Брук - доктор географических наук, занимается проблемами расселения и  этнического состава населения  мира. А. И. Кваша много лет был  заведующим кафедрой демографии на экономфаке МГУ, является автором учебников  для экономистов. Среди историков  плодотворно занимается изучением  Всесоюзных переписей населения СССР В. Б. Жиромская. Немало потрудились и другие столичные историки - Я. Е. Водарский, В. П. Данилов, В. З. Дробижев, В. К. Яцунский. Среди уральских исследователей следует отметить работы В. В. Алексеева, С. В. Голиковой, В. М. Кириллова, Г. Е. Корнилова, Г. М. Коростелева, А. И. Кузьмина, Н. А. Миненко, И. П. Мокерова, А. Г. Мосина, В. П. Мотревича, А. Г. Оруджиевой, Ю.А. Русиной.

Таким образом можно отметить, что все исследования в области  исторической демографии основывались на том, что бы создать как можно  большую систематизированную стройную базу данных. Представлена она могла  быть в различном виде (таблицы, выписки  и проч.). Далее встаёт вопрос о  том, как можно эти базы использовать для моделирования исторической реальности. Тут возникает метод восстановления истории семей, который впоследствии и был положен в основу работы экспертных систем.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.ЭС В ИСТОРИЧЕСКОЙ  ДЕМОГРАФИИ.

 

2.1.Метод восстановления истории семей.

Метод восстановления истории  семей (reconstitution des familles) основан на совокупном использовании всех первичных источников, дающих сведения о событиях истории  семьи и людей ее составляющих.

В основе своей похож на составление генеалогий, однако, эта  методика прошла довольно длинный путь, трансформировавшись от искусства  построения генеалогического древа  до кропотливого, но эффективного метода воссоздания цепочки событий  семейной истории, гарантирующего сравнимость  результатов.

Термин ВИС был предложен  французским  демографом Л. Анри в середине 1950-х. Заслуга Л. Анри в придании искусству составления генеалогических древ, которым владели еще герольды, формы научного метода, адаптации массовых данных первичного демографического учета к виду, удобному для содержательного и количественного анализа. Результаты этой работы, плоды проб и ошибок и были обобщены в то, что сейчас называется методом ВИС, который неразрывно связывают с именем Л. Анри.

Сегодня метод Л. Анри заметно  видоизменился, по сравнению с концом 1950-х годов, но не утратил своей  сути. Он развивался по пути объединения  достоинств демографического метода ВИС  и генеалогической методики и  много приобрел с появлением компьютера. Современный ВИС - это доведенные до наших дней обширные регистры населения, которые начали создаваться в  форме баз данных в США, Канаде, а затем и в других странах, уникальные экспертные системы - искусственный  интеллект, решающий задачи классификации  и анализа первичной информации.

Начатый Л. Анри номинативный анализ в соединении с компьютерными  технологиями стал центральным направлением социальной истории и привел к  фундаментальному перелому в квантитативной истории.

Начав работать с номинативными  данными, Луи Анри показал человека в последовательности «личность-малая  социальная группа (семья)-общество-человечество-природа», сделав очевидным, сколь важна при  этом роль семьи.

Данные о членах семьи, основных событиях истории семьи  выписываются на так называемые семейные карты, уже на этапе выписки подвергаясь  стандартизации и анализу репрезентативности. В методе ВИС семья наблюдается  с момента брака, фиксируются  не только основные события семейной истории, но и по возможности все  номинативные сведения о родственниках  брачующихся, в дальнейшем могущих  послужить индикаторами неявно произошедших событий. Выписки сведений о рождениях  охватывают, по методике Л.Анри,  30-летние периоды до и после исследуемого периода, для которого происходит восстановление истории семьи, с целью впоследствии иметь возможность определить точный возраст супругов и восстановить пропуски рождений в конце периода. Даты рождения детей записывают черным карандашем, если они точно известны и красным, если они вычислены по косвенным данным (например, по дате смерти). Незаконные рождения, по Л.Анри, выписывают на отдельную карту, а на основной семейной карте делаются пометки о числе незаконных рождений, дате первого и последнего из них. По методу Л.Анри, в специальные разделы вносятся сведения о детях, окрещенных в частном порядке и заявленных родившимися мертвыми. Для записи таких рождений Л. Анри предлагал использовать карандаш иного типа. По методу ВИС, смерть родителей фиксируется в семейных картах по уже указанным принципам. Если точная дата смерти не указывается, то помечаются примерные «вехи» жизненного пути родителей, восстановленные по косвенным источникам.

Сложность применения этого метода заключается в его большой трудоемкости. Так, на обработку вручную материала одного прихода во Франции (1000 жителей) за сто лет приходится затратить один год. При этом учитывалось, что во Франции и в некоторых других государствах Западной Европы в XVII—XVIII вв. были в употреблении фамилии, правописание которых было относительно устойчивым по сравнению с территориями.Поэтому в развитии метода ВИС одним из важных этапов является применение с 70-х гг. ЭВМ, а затем — персональных компьютеров. Разработка сведений массовых источников сегодня немыслима без электронных технологий.В целом методика ВИС в общих чертах довольно успешно переживает перенос с бумажных формуляров на электронные формы. Все, в общем-то архаичные методы выделения записей : разные цвета карандашей, запись примерно известных сведений карандашом в отличии от записи точных чернилами и т.д. после реализации в электронном интерфейсе и структуре базы данных приобретают еще большую гибкость и информативность.

 

2.2.Применение  ЭС.

В США уникальная источниковая база исторической демографии начала формироваться много ранее появления  этой науки во Франции и с другими  целями. Видимо, мормоны первыми  осознали необходимость и получили материальную возможность применения компьютера в своих разработках. Их база данных создана на основе нескольких генеалогических источников населения  штата Юта. Для внесения индивида кроме факта вступления в брак было необходимо документальное подтверждение  факта его рождения или смерти на территории штата Юта или по пути следования мормонов-мигрантов  в 1840-х гг. из штатов Иллинойc и Миссури  до Юты. Отбирались главы семьи, родившиеся после 1800 г. Персональный компьютер и программа GENISYS, разработанная командой Марка Школьника из университета штата Юта (США), позволили на новом уровне изучать историю семьи средствами информатики; программы FR, GIE RDF и несколько утилит дополнили имеющиеся файлы. По некоторым зонам были созданы специальные индексы. Применение компьютера позволило раскрыть потенциал метода ВИС и интегрировать его в генеалогию; одновременно разрабатываются и восходящие, и нисходящие, и боковые ветви генеалогий в зависимости от возможностей источников. Американские ученые усовершенствовали классический вариант метода ВИС, предложенный Луи Анри, придав размах изучаемым территориям и многообразию связей индивидов, создав посредством объединения отдельных групп данных целый географическо-генеалогический комплекс индивидов, живущих на территории штата Юта12.

По сравнению с другими  эта база данных может показаться необычной как в плане размеров, так и в плане сложности, что  оправдано множеством исследовательских  проектов, развивающихся на ее основе. Консолидация сил по созданию баз  данных совместного пользования  и координация на этой основе междисциплинарных  исследований — наиболее эффективный  и плодотворный подход в изучении разнообразных проблем народонаселения. Демографические исследования в  этом центре начались с составления  календаря истории плодовитости, определения границы «естественной  плодовитости» и предшествующей переходной фазы. Параллельно был  также рассмотрен цикл семейной жизни  когорт женщин, начиная с достижения ими брачного возраста и оканчивая  завершением брачного союза. Поскольку  у Мормонов с 1840 по 1890 гг. существовала полигамия, было любопытно осуществить  компаративные исследования моногамных и полигамных хозяйств. Завершены  исследования детской и материнской  смертности. В 70–80-е годы электронные  технологии начали внедряться в историко-демографические  исследования во многих странах. Иногда в одной стране одновременно создавалось  несколько программ в разных научных  центрах. Использование компьютера развивалось от элементарных форм к  более сложным. Например, испанские  исследователи на начальном этапе  использовали просто перенос архивных данных в электронный формат. Для  каждого вида акта была разработана  карта с последующей кодификацией (идентификационным номером), контроль ошибок. Неноминативные элементы вводились  иногда в мнемоническом (приход, пол), а иногда в цифровом коде (происхождение, профессия, причина смерти и т.д.). Имена вносили в том виде, в  котором они представлены в источнике, не считаясь с мнемонической кодификацией, используя поля различной длины. Обработка полей такого вариативного типа не представляла трудностей для  компьютера. Контроль за информацией базы осуществлялся частично при помощи компьютера на двух различных стадиях. Для неноминативной информации он был заложен в программу и programmе-batch. Номинативная информация корректировалась через интерактивный режим; компьютер позволял редактирование обнаруженных в картах ошибок. Компьютер позволял получать распечатки алфавит-ных выборок имен, частотность и идентификационные номера первых трех упоминаний имени в архиве. С помощью программы было выявлено 0,48 % ошибок в 216188 информационных неноминативных полях и 0,54 % в 218785 номинативных информационных полях.

В Италии также были разработаны  программы для анализа данных регистров АГС Венеции середины XIX в. и XV–XX вв. В последнем случае удалось восстановить 70% семей. В таком же ключе были созданы БД регистров населения Франции XIX в., регистры населения Бельгии. В Бельгии, обладающей одной из наиболее репрезентативных генеральных совокупностей приходских регистров Европы и давней традицией генеалогических исследований, много внимания уделялось также и компьютеризации этого направления. В начале 90-х годов уже осуществлялась не только автоматическая группировка данных регистров населения, но был осуществлен переход к экспертным системам и более эффективным тестам связей. Бельгийский генератор программ NOMIDOC предусматривает 5 опций (создание-редактирование, внутренняя критика, кодирование, спаривание, использование в демографических целях). Эксплуатируется в ORACLE, SAS и т.д.; совместим с EASY-PLUS, SYBILLE и т.д.; имеется возможность автоматического получения возрастных пирамид, коэффициентов рождаемости, брачности, смертности; изучение миграций. Кембриджская группа исторической демографии, имеющая интернациональный состав исследователей, предлагает свой вариант автоматического восстановления истории семей.

Представляет интерес  опыт Польши, где была создана программа  автоматического и полуавтоматического  восстановления истории семей, хозяйств и местных коммун старой Польши. Она имеет две отличительные особенности: во-первых, отражает следующий за семьей уровень малой социальной группы — хозяйство. Во-вторых, создана на более широком круге источников, включающих именные списки, приходские регистры (р., б., с.), городские и сельские юридические регистры XVII–XVIII вв. Таким образом, в процессе интеграции в ВИС компьютерных технологий возникла и была решена еще одна задача — объединение данных источников с различной структурой. Программа польских коллег позволяет электронное форматирование массовых источников с открытой архитектурой.

Практически все современные  программы исторической демографии ориентированы на номинативные данные и обязательно имеют возможность  автоматического связывания данных о семье (ВИС). В этом отношении своего рода исключением стало создание агрегативной БД населения Норвегии 1736–1970 гг.

Сильная школа исторической демографии сформировалась в Канаде, где изучение проблем народонаселения, похоже, стало национальным научным  приоритетом. Остановимся более  подробно на канадском опыте, генетически  связанном с французской школой.

Программой исследований по исторической демографии Университета Монреаля были определены методы, пригодные  для изучения информации исторических источников, разработана структура  базы данных, коды, предусмотрен контроль качества записей и т.д. В 1977 г. выбор  был сделан в пользу системы ONTEL, в соответсвии с которой на экране воспроизводился используемый переписной лист, а операторы нескольких микрокомпьютеров вносили данные, которые  затем передавались для обработки  на базовую ЭВМ. Сортировка в порядке  хронологии осуществлялась автоматически; кодирование профессий, мест рождения и жительства в повторяющихся  случаях осуществлялось автоматически, тесты предусматривали маркировку некоторых ошибок. Увеличение мощности персональных компьютеров позволило  редактировать текст сразу, не расставаясь  с источником, что существенно  улучшило и ускорило перенесение  информации документов на карточки; основная часть кодировки была доверена компьютеру.

На этом этапе участники  Программы подошли к применению ВИС и необходи-мости объединения  данных по каждому индивиду. Если он имеет свой собственный номер, идентификация относительно проста. При этом сведения должны быть извлечены из старинных регистров и переписей, где пояснения часто носят смутный характер. На первом этапе для уточнения родственных и семейных отношений индивидов и осуществления определенной части группировок выявлялись и использовались упоминания брачных пар во всех возможных документах (не только приходских регистрах); объединение пар осуществляется на основании выборки, спаривания, а затем связывания. Связывание информации есть процесс поиска и группировки элементов, относящихся к одному единству. В контексте огромного богатства банка номинативных данных старого Квебека связывание было основано главным образом на степени родства. Кодирование или стандартизация номинативных элементов облегчает связывание. Такие неноминативные данные как пол, возраст, семейное положение также принимаются в расчет при идентификации персон.

Второй этап, направленный на включение индивида в определенную семью, дополнял информацией фазу связывания. Система, разработанная в рамках Программы, позволила получить не только семейную карту классического типа метода ВИС — инструмента, столь часто используемого в исторической демографии. Она имела генеалогическое распространение, позволяющее выстраивать восходящие и нисходящие генеалогии (подход, анало-гичный подходу команды штата Юта). Для придания БД более широкого значения предусмотрена возможность вливания в нее других файлов населения. Таким образом, при компьютеризации метода ВИС канадские ученые определили как значимые следующие характеристики актов гражданского состояния: однозначность антропонимических данных, точность указанных дат демографических событий, профессии и места жительства.

В рамках этого проекта  была реализована любопытная возможность  базы данных. В ответ на настойчивые  просьбы общественности руководство  Программы решило опубликовать ее краткие  сведения в форме репертория, где  акты прихода представлены в системе  хронологии, типа актов и в сопровождении  алфавитного указателя всех упомянутых в актах индивидов. Первая часть  издания (XVII в.) вышла в свет в 1980 г. в семи томах на 4126 л. (всего —  около 50-ти томов). Публикация облегчила  многочисленным пользователям приходских регистров изучение содержащихся в  них данных, сделав необязательным кон-сультирование оригиналов и  защитив их от интенсивного разрушающего использования. Дальнейшее прогрессирование данного проекта привело к  созданию операционного Органи-затора актов и регистра населения (GARP) .

Информация о работе Экспертные системы в исторической демографии