Обзоры
"Складирование" данных: решения от Intersolv
Сергей Елин
1. Технология Data Warehousing
Базы данных прочно вошли в жизнь. От грамотной работы с ними зависит успех деятельности любого предприятия. Однако сегодня множество компаний уже столкнулось с серьезной проблемой – необходимостью быстрого принятия решений на основе данных из разнородных, подчас несовместимых друг с другом систем. Например, в одном подразделении фирмы используется Paradox, в другом – FoxPro, корпоративные данные находятся под управлением Oracle или Informix, а руководитель должен иметь под рукой сводку на основе всей информации, допустим, в виде аналитического документа Word.
Первое решение проблемы доступа к разнородным данным было предложено фирмой Microsoft: она создала стандарт на алгоритм доступа к таким БД – спецификацию Open Database Connectivity (ODBC). Эта технология позволила разработчикам не заботиться о специфике работы с той или иной СУБД и делать свои системы переносимыми между базами данных. За время своего существования ODBC стала стандартом де-факто, и сейчас насчитывается более 160 прикладных систем, работающих с источниками информации через драйверы ODBC. В их числе такие популярные продукты, как Microsoft Word, Microsoft Excel, Lotus Notes, языки четвертого поколения PowerBuilder, JAM и др.
Если же проблема доступа к разнородным данным встает не перед программистом, создающим новую систему, а перед конечным пользователем, то ему на помощь приходит технология Data Warehousing. Она включает в себя четыре основных компонента извлечение данных, преобразование данных; представление данных; средства коммуникации.
Извлеченные и преобразованные в соответствии с заданными требованиями данные записываются в промежуточное хранилище, называемое Data Warehouse (склад данных). Там они хранятся в наиболее удобном для пользователя виде: например, он может свести в одну таблицу информацию отдела кадров, извлеченную из локального DBF-файла, данные по зарплате его сотрудников из корпоративной базы, находящейся под управлением СУБД Informix или Oracle, и объединить их с собственными данными из пакета Microsoft Excel. В результате получается сводная таблица, готовая к анализу, построению отчетов и принятию решений.

Технология Data Warehousing позволяет быстро вылавливать в море корпоративной информации именно те данные, которые нужны в настоящий момент. Согласно опросу, проведенному МЕТА Group, организации стараются применить технологию Data Warehousing последующим причинам:
– возможность принятия высокоэффективных решений,
– повышение качества деловой информации;
– улучшение обслуживания клиентов;
– поддержка стратегического планирования;
– общая реорганизация бизнес-процесса.
2. Продукты фирмы Intersolv для Data Warehousing
Фирма Intersolv поставляет все четыре компонента технологии Data Warehouse. Благодаря им процесс создания "склада данных" заметно упрощается. В основу решения фирмы Intersolv в этой области легли продукты серии Intersolv DataDirect.
2.1. Извлечение данных
Операция извлечения перемещает информацию из одной или нескольких БД в отдельную базу, специально созданную для хранения данных. При этом данные могут сочетаться так, как нужно конечному пользователю. Извлечение выполняется вручную средствами СУБД или специализированного программного обеспечения.
Предлагаемый Intersolv продукт Intersolv Q+E позволяет копировать и перемещать данные из различие БД. Сегодня поддерживается ????? 35 СУБД, и этот список постоянно расширяется. Пакет содержит средства описания сценариев, с помощью которых конечный пользователь может описать процесс создания или обновления своего собственного "склада данных". Запросы пользователя преобразуются в SQL-операторы, при этом их можно скорректировать вручную или составить самостоятельно.
Для клиентов, которые оплатили годовую поддержку, новые версии продукта предоставляются бесплатно.
2.2. Преобразование " данных
Преобразование данных заключается в анализе необработанных корпоративных данных и принятии решения о форме их представления конечному пользователю. Обычно это самая ответственная часть всего процесса доступа к разнородной информации. Для создания эффективного процесса преобразования (который помимо прочего включает определение физического места расположения составляющих Data Warehouse) необходима хорошо проработанная модель корпоративных данных.
Первым шагом в планировании преобразования информации является выработка определенного подхода к модели корпоративных данных. Для этого Intersolv предлагает пакет Intersolv Excelerator II – средство объектно-ориентированного анализа и проектирования бизнес-приложений, позволяющее аналитикам организации распределять корпоративные данные и создавать их модель. Командам разработчиков предоставляется возможность выбрать для создания проекта объектно-ориентированный, традиционный подход или их комбинацию.
После выбора данных можно задействовать продукт DataDirect »Data, который позволит преобразовать БД в упрощенные "динамические срезы данных" (dynamic views), обусловленные специфическими требованиями конечных пользователей. Архитектура пакета SmartData, построенная на основе технологии ODBC, обеспечивает открытый интерфейс с любым ODBC-совместимым продуктом.
Приложение, поддерживающее стандарт ODBC, может использовать "динамические срезы данных" как обычные таблицы. SmartData позволяет создавать сводные поля и таким образом скрывать от конечного пользователя чрезмерную сложность соединенных таблиц (joined tables). Чтобы работать с этим пакетом, не требуется познаний в SQL или реляционных базах данных. Кроме описанных продуктов преобразование данных можно выполнять с помощью уже упомянутого пакета Intersolv Q+E .
2.3. Представление данных
Для использования извлеченных и преобразованных данных необходимы средства их представления. Такой инструмент должен позволять пользователю визуально строить запросы к "складу данных" и получать отчеты со включенными в них графиками и диаграммами
Конечные пользователи нуждаются в удобных в применении и простых в изучении средствах поддержки создания запросов, построения отчетов и принятия решений. Для именования подобных программ, предоставляющих все вышеперечисленные возможности, выработан термин business intelligence software (BIS). И пакет Intersolv, совмещающий возможности SmartData, Job Sheduler, Drill Down, Report Writer и Chart Builder Q+E, по праву считается лидером в этой области.
Чтобы сохранить отчеты, Q+E использует стандартные форматы (например RTF). Поэтому его отчеты могут быть в дальнейшем обработаны с помощью большинства текстовых процессоров. Q+E основан на наборе из 35 ODBC-драйверов фирмы Intersolv, то есть имеет доступ к данным, хранящимся в форматах различных СУБД.
Наконец, для создания собственных средств представления данных Intersolv предлагает специализированную среду разработки приложений – пакет Intersolv APS for Client/Server.
2.4. Средства коммуникации
Средства коммуникации связывают процессы извлечения, преобразования и представления данных между собой и отвечают за доставку информации конечному пользователю. Наиболее приемлемы в этом случае средства с открытой архитектурой и поддержка признанных промышленных стандартов.
Фирма Intersolv занимает ведущие позиции на рынке средств Data Warehousing благодаря большому количеству поддерживаемых платформ – это 17 операционных систем и 35 СУБД, число которых постоянно увеличивается. Все вышеописанные продукты интегрированы друг с другом и представляют в совокупности хорошо структурированную, органичную систему.