Шпаргалка по "Технологии баз данных"

Автор работы: Пользователь скрыл имя, 12 Марта 2013 в 18:00, шпаргалка

Краткое описание

Предметной областью курса «Технологии организации, хранения и обработки данных» является часть реального мира, (это может быть предприятие, его часть, процесс, система и т.д.), которая описывается или моделируется с помощью информационных систем и разрабатываемого программного обеспечения. Информационные системы разного класса и назначения, предназначены для оперирования особо интенсивными потоками информации и олицетворяют собой новую человеко-машинную технологию сбора, обработки, передачи информации.

Вложенные файлы: 1 файл

шпоры технол.баз данных.doc

— 282.50 Кб (Скачать файл)

Элементы управления делятся на связанные и несвязанные. Связанный элемент присоединен  к полю базовой таблицы или  запроса. Такие элементы управления используются для просмотра, ввода  или редактирования значений из полей БД. Ввод связанного элемента в прект формы\отчета осуществляется путем перетаскивания из окна со списком полей нужного поля в раздел Область данных. В результате появляются два прямоугольника – подпись поля и поле.

Маркеры перемещения служат для отдельного перемещения подписи, поля.

Для несвязанных  элементов управления источника  данных не существует. Такие элементы используются для отображения линий, прямоугольников, рисунков. Ввод в проект формы\отчета осуществляется так: на панели элементов производится щелчок по кнопке нужного элемента, а затем щелчок в том разделе проекта, где требуется разместить этот элемент.

 

60. Понятие макроса. Классификация  макрокоманд.

Современные СУБД (система управления базами данных) имеют богатый набор визуальных инструментальных средств для работы с БД и ее объектами. Но пользователю могут понадобиться сложные приложения, создание которых с помощью этих средств затруднительно или невозможно. В этом случае прибегают к разработке макросов и модулей.

Набор из одной или нескольких макрокоманд, каждая из которых выполняет определенное действие, называется макросом. Макросы выполняют особые, заданные пользователем задачи, и используются, главным образом, для автоматизации работы с формами и отчетами. Назначение макросов – автоматизация часто выполняемых операций без написания программ.

В макросах используются макрокоманды, которые можно классифицировать по назначению на:

  • Макрокоманды для работы с данными в формах и отчетах (например, НайтиЗапись)
  • Макрокоманды выполнения (например, ОткрытьЗапрос)
  • Макрокоманды импорта\экспорта (например, ОтправитьОбъект
  • Макрокоманды для работы с объектами БД (например, Копировать объект)

 

81. Распределенные  СУБД. Двенадцать правил К.ДЕЙТА.

В системах обработки  распределенных баз данных реализуется децентрализованная обработка данных :базы данных находятся на компьютерах сети, на них устанавливается локальная СУБД и можно обрабатывать данные в автономном режиме.

Однако в компьютерной сети может быть создана "виртуальная" база данных, объединяющая базы данных различных компьютеров. Такая "виртуальная" база данных получила название распределенной базы данных (РаБД). Системы управления РаБД (СУРБД) интегрируют локальные базы данных таким образом, что пользователь, работающий на любом компьютере сети, имеет доступ ко всем этим базам данных как к единой базе данных.

Информация о местоположении каждой из частей РаБД находится в  так называемом глобальном словаре  данных, который может храниться  на одном из компьютеров сети или  быть распределенным.

РаБД можно разделить  на гомогенные и гетерогенные. В  гомогенной РаБД все локальные базы данных имеют одинаковые модели данных и управляются однотипной СУБД. В  гетерогенной РаБД локальные базы данных могут базироваться на разных моделях  данных и управляться различными типами СУБД. Американский ученый Крис Дейт сформулировал двенадцать правил, которым должна следовать РаБД:

1) локальная независимость;

2) отсутствие опоры на центральный узел (компьютер);

3) непрерывное функционирование;

4) независимость от расположения;

5) независимость от фрагментации;

6) независимость от репликации;

7) обработка распределенных запросов;

8) управление распределенными транзакциями;

9) аппаратная независимость;

 

10) независимость от операционной системы;

11) независимость от сети;

12) независимость от типа СУБД.

Локальная независимость  предполагает, что управление данными  выполняется на каждом из узлов сети. Базы данных, расположенные на узлах, являются неотъемлемыми компонентами РаБД. Будучи фрагментом общего пространства данных, они в то же время функционируют как полноценные локальные базы данных, и управление ими выполняется локально и независимо от других узлов сети.

Отсутствие опоры на центральный узел означает, что ни один узел сети не зависит от центрального или какого-либо другого узла. Все узлы имеют равные возможности.

Непрерывное функционирование состоит в том, что система  продолжает функционировать и в  случае сбоя на каком-либо узле, и при  неисправности узла, и при расширении сети.

Независимость от расположения означает полную про зрачность (невидимость) расположения данных. Пользователь обращающийся к РаБД, ничего не должен знать о реальном' физическом размещении данных в узлах сети.

Независимость от фрагментации дает возможность пользователю работать с РаБД как с единой базой данных, хотя она может быть физически разделена на отдельные фрагменты, например, с целью повышения быстродействия доступа к данным.

Независимость от репликации предполагает, что процесс внесения изменений в реплики баз данных невидим для пользователей.

Обработка распределенных запросов трактуется как возможность  выполнения операций выборки над  распределенной базой данных, сформулированных в рамках обычного запроса на языке SQL. Другими словами, операцию выборки  из РаБД можно сформулировать с помощью тех же языковых средств, что и операцию над локальной базой данных.

Управление распределенными  транзакциями означает возможность  выполнения операций обновления РаБД, не разрушая целостность и согласованность  данных.

Аппаратная независимость  означает, что в качестве узлов сети могут выступать компьютеры любых моделей и любых производителей.

Независимость от операционной системы предполагает использование  различных операционных систем, управляющих  узлами сети.

Независимость от сети означает возможность использования различных сетей и сетевых технологий для соединения узлов.

Независимость от типа СУБД дает возможность использования  в РаБД СУБД различных производителей, которые должны, однако, поддерживать один и тот же интерфейс взаимодействия между узлами.

 

82.Обработка  распределенных запросов. Преимущества  и недостатки РаСУБД.

Обработка распределенных запросов трактуется как возможность  выполнения операций выборки над  распределенной базой данных, сформулированных в рамках обычного запроса на языке SQL. Другими словами, операцию выборки из РаБД можно сформулировать с помощью тех же языковых средств, что и операцию над локальной базой данных.

Систему обработки РаБД можно рассматривать как слабосвязанную сетевую структуру, на узлах которой  располагаются локальные базы данных. Они автономны, независимы и доступ к ним обеспечивается в общем случае различными СУБД. Узлы обмениваются между собой потоками данных.

Достоинства РаБД состоят  в том, что они более полно  отражают территориально распределенную структуру предприятия, обеспечивают большую живучесть информационной системы, так как в случае разрушения одной из локальных баз данных другие базы данных остаются работоспособными.

К недостаткам РаБД следует  отнести повышенную сложность их практической реализации.

В настоящее время  почти все крупнейшие производители  СУБД предлагают решения в области  управления РаБД. Однако следует отметить, что все эти решения лишь частично поддерживают правила построения РаБД, сформулированные К. Дейтом.

Среди многочисленных прототипов СУРБД следует упомянуть:

o систему SDD-1, созданную в конце 70-х - начале 80-х гг. XX в. в научно-исследовательском отделении фирмы Computer Corporation of America;

o систему System R*, созданную фирмой IBM в начале 1980-х гг.;

o систему Distributed INGRES, которая создана также в начале 1980-х гг. в Калифорнийском университете г. Беркли.

В настоящее время  в большинстве сетевых СУБД предусмотрены  отдельные виды поддержки РаБД с  различным набором функций. Среди  таких систем наиболее известны система INGRES/STAR фирмы The ASK Group Inc., система ORACLE фирмы Oracle Corp., а также модуль распределенной работы СУБД DB2 фирмы IBM.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

83.Хранилища  данных.OLAP-технологии.

В 1992 г. "отец-основатель" хранилищ данных Уильям Ин-мон определил хранилище данных (data warehouse) как ориентированную на предметную область, интегрированную, статичную, не разрушаемую совокупность данных, предназначенную для поддержки принятия решений.

Предметная ориентированность  означает, что хранилище данных предназначено для предоставления данных, связанных с одним организационным процессом.

Интегрированность (целостность  и внутренняя взаимосвязь) означает применение единых законов именования, способов вычисления значений данных, полученных из различных источников.

Статичность (независимость  от времени) означает, что хранилище  данных содержит как исторические данные, так и данные, которые имели  статус текущих при последнем  погружении в хранилище данных. Временные  рамки данных, содержащихся в хранилище  данных, изменяются в широких пределах - от 15 месяцев до 5 лет.

Неразрушаемая совокупность данных означает, что в хранилище  данных помещается большой объем  данных, которые, будучи раз погруженными, уже никогда больше не подвергаются каким-либо изменениям. Это приводит к тому, что пользователи, выполняющие один и тот же запрос к хранилищу данных, получат один и тот же результат.Для хранилища данных создается репозитарий - специальное хранилище данных о данных (метаданных), в которое помещаются:

o описания структур данных, их взаимосвязей;

o информация о хранимых данных;

o информация об источниках данных и степени их достоверности. Одна и та же информация может погружаться в хранилище данных из разных источников. Пользователь должен иметь возможность узнать, какой источник был выбран при этом основным и каким образом производились согласование и очистка данных;

o информация о периодичности погружения данных;

o информация о владельцах данных. Пользователю может оказаться полезной информация о наличии в системе данных, к которым он не имеет доступа, о владельцах этих данных и о действиях, которые он должен предпринять, чтобы получить доступ к этим данным;

o статистические оценки времени обработки запросов. До выполнения запроса полезно хотя бы приблизительно оценить время, которое потребуется для получения ответа, и объем этого ответа.

В настоящее время  кроме хранилищ данных разрабатываются  витрины данных (data mark). Иногда их называют также киосками данных.

OLAP-системы являются  дальнейшим развитием DSS- и OLTP-систем  и позволяют аналитику динамически формировать класс вопросов, который требуется для решаемой им текущей аналитической задачи. Эти системы служат для анализа деятельности корпорации или ее структурных подразделений и прогнозирования их будущего состояния. Анализ проводится на основе накопленных многочисленных данных о деятельности корпорации в прошлом, а также внешних источников данных.

Взаимодействуя с OLAP-системой, пользователь может осуществлять гибкий просмотр информации, получать произвольные срезы данных и выполнять аналитические операции агрегирования и детализации, сравнения во времени и т.д. Вся работа с OLAP-системой происходит в терминах предметной области.

OLAP-системы обладают  отличительными особенностями:

o анализ в них осуществляется с помощью хранилищ данных;

o они предоставляют гибкие средства навигации по данным - так называемые OLAP-манипуляции;

 

o могут работать на базе киосков данных. Достоинства OLAP-систем:

o консолидация информации из разных баз данных;

o полнота аналитических данных;

o повышенная защита данных;

o полная и легкая настройка отчета без программиста;

o возможность детализировать отчет в процессе анализа данных;

o непротиворечивость данных между отчетами;

o простота использования и восприятия отчетов.

К недостаткам OLAP-систем следует отнести их сложность при разработке и внедрении.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

84.Метод  интеллектуальной обработки данных DATA MINING.

В настоящее время  для интеллектуальной обработки  данных интенсивно разрабатываются  методы, получившие общее название Data Mining (добыча, извлечение знаний). Современные системы добычи знаний используют представления и интерпретации, основанные на методах искусственного интеллекта, и позволяют обнаруживать растворенную в терабайтных хранилищах не очевидную, но весьма ценную информацию.

Data Mining - это новая технология  интеллектуального анализа данных  с целью выявления скрытых  закономерностей в виде значимых  особенностей, зависимостей, тенденций  и шаблонов. В ее основу положена  концепция шаблонов (patterns). Шаблоны представляют собой закономерности, свойственные выборкам данных, которые могут быть компактно выражены в понятной человеку форме. Поиск шаблонов производится методами, не ограниченными рамками априорных (заранее известных) предположений о структуре выборки и виде распределений значений анализируемых показателей.

Другими словами, Data Mining - это исследование и обнаружение  алгоритмами и средствами искусственного интеллекта в данных шаблонов, которые:

o ранее не были известны;

o нетривиальны;

o практически полезны;

o доступны для интерпретации человеком и необходимы для принятия решений в различных сферах деятельности. Такие шаблоны должны отражать неочевидные, неожиданные закономерности, так называемые скрытые знания.

Выделяют следующие  типы закономерностей:

o классификация. Это наиболее распространенная задача Data Mining. Она позволяет выявить признаки, характеризующие однотипные группы объектов, для того чтобы по известным значениям этих характеристик можно было отнести новый объект к тому или иному классу. Ключевым моментом выполнения этой задачи является анализ множества классифицированных объектов;

Информация о работе Шпаргалка по "Технологии баз данных"