Интеграция информации (IBM DB2 Information Integration)
Информационная интеграция - это набор технологий, которые позволяют использовать при решении прикладных задач данные различного типа (структурированные, неструктурированные) вне зависимости от места их размещения, полученные с помощью запросов на языке SQL или XML, а также с помощью Web-служб.
Интеграция обеспечивает:
- объединение данных, полученных от разных источников (базы данных, Web-службы, хранилища);
- создание моделей данных и интерфейсов;
- доступ к разнообразным типам данных;
- преобразование данных в требуемый формат.
Обычно рассматривают три функции интеграции: объединение данных, перемещение данных (репликация), преобразование данных (конвертация) (см. рис. 6.17).
Рис. 6.17. Основные функции интеграции
Объединение позволяет предоставить доступ к данным от большого числа различных источников и платформ так, как если бы эти данные принадлежали единому ресурсу.
Возможности систем объединения:
- данные можно хранить в исходных системах, не перемещая их в единую систему хранения;
- можно использовать единый API для поиска и преобразования данных;
- объединенная система скрывает любые различия в местоположении, диалектах сети, топологии данных;
- можно получить доступ к хранилищам данных либо непосредственно, либо путем запроса, который возвращает данные динамически, что позволяет осуществлять управление данными с помощью единого диалекта SQL.
Объединение имеет смысл использовать, когда технические требования проекта информационной системы предполагают многократный поиск, вставку, обновление и удаление данных из разнородных источников.
Репликация - это процесс дублирования и размещения в результирующем ресурсе данных из различных источников. В зависимости от требований архитектуры информационной системы предприятия можно использовать различные схемы дублирования и размещения данных.
Репликация предоставляет следующие возможности:
- автоматизированное и надежное перемещение изменений данных из одной системы в другую (позволяет автоматически вносить изменения при появлении их в источнике);
- создание идентичных копий в двух системах (например, поддержка второй копии данных для их восстановления);
- копирование подмножества данных из одной системы во многие (например, с целью синхронизации информации в разных системах).
Такой вид репликации называется распределением данных; - копирование выбранных данных из многих источников в один (например, чтобы объединить информацию в информационное хранилище). Такой вид репликации называется консолидацией данных.
Репликация поддерживает целостность данных.
Конвертация данных - формирование документов на основе оптимизированных SQL-запросов к различным источникам данных. Преобразование данных может осуществляться как в момент их перемещения, так и при создании представлений.
Оптимизация SQL-запросов избавляет программиста от необходимости рассматривать особенности фактических источников данных при написании прикладной программы. Оптимизация позволяет приспособиться к факторам, которые не могли быть известны при написании программы, а также при ее изменении в связи с изменениями среды окружения.
При использовании информационной интеграции можно работать с данными, которые находятся как внутри информационной системы предприятия, так и за ее пределами.
Семейство IBM DB2 Information Integration состоит из двух продуктов: IBM DB2 Information Integration и IBM DB2 Information Integration for Content. Первый продукт (IBM DB2 Information Integration) предназначен для применения в тех случаях, когда основными источниками информации для работы приложений, использующих SQL, являются реляционные базы данных, дополненные нереляционными источниками (документы XML, Web-службы и др.).
Продукт IBM DB2 Information Integration for Content предназначен для случаев, когда приложениям необходима интеграция гетерогенной информации. Этот продукт очень подойдет тем разработчикам решений по управлению информационным наполнением, которые знакомы с программными интерфейсами управления контентом и объектно-ориентированным программированием.
Информация по функциям и поддерживаемым форматам данных семейства IBM DB2 Information Integration представлена в таблице 6.4.
1. | Объединение данных |
| Реляционные источники: DB2, Informix Dynamic Server, Informix Extended Parallel Server, Microsoft SQL Server, ORACLE, Sysbase SQL Server, Sysbase Adaptive Server Enterprise, Teradata; источники, доступные с помощью ODBC. Нереляционные источники: Excel, Documentum Enterprise Content; источники данных, доступные с помощью IBM Lotus Extended Search, IBM DB2 Information Integrator for Content |
2. | Репликация данных |
| DB2, Informix Dynamic Server, Microsoft SQL Server, ORACLE, Sysbase SQL Server, Sysbase Adaptive Server Enterprise, Informix Extended Parallel Server, Teradata; источники, доступные с помощью ODBC |
3. | Конвертация данных |
| Реляционные источники (те же, что в п.1). Нереляционные источники: Очереди сообщений IBM WebSphere MQ; Web-службы; Excel; XML-документы; Documentum Enterprise Content Management System; источники данных доступные с помощью IBM Lotus Extended Search; каталоги LDAP; источники IBM DB2 Information Integrator for Content (IBM DB2 Content Manager и др.) |