1995 | 1996 | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | Оглавление текущего номера /150, 1996 г./ | Бонус | Поиск  

Репортажи

Data warehouse от "Техносерв А/С"

Антон Гололобов


© 2004, Еженедельник «Компьютерра» | http://www.computerra.ru/offline
Этого материала на сайте "Компьютерры", к сожалению, нет

В рамках 7-го Международного компьютерного форума заместитель директора департамента программного обеспечения акционерного общества "Техносерв А/С" Владимир Винокуров провел семинар, посвященный набирающей в мире все большую популярность новой концепции хранения данных.

Data warehouse "Техносерва", о которой, по словам г-на Винокурова, "идет очень много разговоров, но существует мало реальных проектов, так как реализовать это все достаточно сложно", представляет собой программное обеспечение от немецкой фирмы Software AG (подписание контракта с которой планируется на июль) и дисковые накопители американской корпорации ЕМС ("Техносерв" является ее эксклюзивным дистрибьютором в России). На выставке "Комтек'96" "Техносерв А/С" уже продемонстрировало на своем стенде действующую модель data warehouse, когда доступ к одной базе данных был возможен как через PC, так и через UNIX-компьютер и мэйнфрейм.

Проблема с хранением данных была проиллюстрирована рядом ситуаций, каждая из которых начиналась с просьбы менеджера быстро предоставить нужную ему информацию в Excel-формате, а заканчивалась объяснением начальника вычислительного центра, что необходимые данные лежат на большой машине, и для того, чтобы их достать в требуемом виде, потребуется несколько недель. На плечи начальника ВЦ тяжким грузом ложится наличие двух групп пользователей – исполнителей и аналитиков, постоянно обменивающихся информацией. "Исполнители" – это люди, создающие данные и работающие с прикладными программами в различных средах (UNIX, mainframe, PC). К примеру, операционист в банке или оператор на железной дороге. "Аналитики" – менеджеры среднего и высшего звена, требующие, чтобы данные из различных систем и ЭВМ накапливались в хронологическом порядке в одном месте и сравнительно легко экспортировалисьв Excel, Lotus 1 -2-3 и им подобные. Как правило, в крупной корпорации с традиционной организационной структурой запросы "аналитиков" невыполнимы.

Тут-то на сцену и выходит data warehouse, представляющая из себя "максимально ориентированную на аналитиков" выделенную базу данных, в которой собирается информация из прикладных программ. Снаружи, то есть со стороны пользователя – Хранилище, часто поддерживаемое на отдельном БД-сервере (UNIX или mainframe), должно быть "не сложнее Excel", потому как "data warehouse будет существовать лишь при условии, что пользователю будет легко осуществлять поиск и экстракцию данных (data mining)".

На базе накопителей ЕМС серий Symmetrix (для предприятий) и Centriplex (для работы в масштабах отдела) создается физическое хранилище данных, способное работать с различными платформами. К сему Software AG предлагает две СУБД: ставшую уже классикой Adabas С и более новую Adabas D. С их помощью создаются БД размером от 10 Гбайт и более, данные в которых запоминаются в хронологическом порядке и никогда не удаляются. Для извлечения данных из data warehouse должны быть определены источники данных, процедуры их извлечения из прикладных баз и файлов, правила проверки и процедуры передачи и загрузки в основную БД. Здесь Software AG предлагает такие инструменты, как Natural (работает со всеми известными СУБД), Passport, Connection, Entire Network (обеспечивает взаимодействие любого клиента с любым сервером) и ряд других Наконец, для "добычи" данных (data mining) немецкая фирма предлагает очень удобный и наглядный продукт под названием Esperant. При помощи этого средства возможна генерация и оптимизация SQL-запросов произвольной сложности, интерфейс с любой реляционной или ODBC-СУБД на любой машине и по любой сети, с любыми Desktop-продуктами, обеспечивающими дальнейший анализ.

 

Г-н Винокуров привел примеры двух успешно реализованных проектов, ставших классикой data warehouse. Первый был реализован для администрации города Кельн (миллионный город с числом управленцев более чем 23000, работающих в 70 офисах), он начал создаваться еще тогда, "когда понятия data warehouse еще не существовало". Масштабность осложняло и то обстоятельство, что все приложения были написаны на различных языках, СУБД, и работали на всех существующих платформах (mainframe, UNIX, LAN, PC). За два года было создано хранилище данных под названием Strategical Information System (SIS), аккумулирующее информацию из всех функциональных и региональных приложений, откуда, в свою очередь, аналитики и советники самостоятельно извлекают данные в Excel и Lotus. В качестве второго примера был приведен крупнейший в США производитель игрушек Ertl Company, проявляющий "совсем не игрушечное отношение к автоматизации". Начальная ситуация здесь была аналогична Кельну, разве что число пользователей ограничивалось 1500. В результате созданная на основе Adabas data warehouse, охватывающая все этапы жизненного цикла продукции, для доступа к данным по которой используется уже упоминавшийся Esperant, заняла первое место на выставке "DB/ Ехро'94" в номинации "реальное хранилище данных в промышленности".

В России потребителями data warehouse могут стать железные дороги, крупные предприятия, администрации (организации, пользующиеся дотациями из госбюджета) и банки. Система дорога, но выгоды от ее внедрения настолько велики, что все затраты окупятся за непродолжительное время. "Техносерв А/С" уже произвело разработку и "пилотную" установку data warehouse для одного из крупных отечественных предприятий (название которого не разглашается) и имеет в своем портфеле еще ряд заказов.

 

 


1995 | 1996 | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | Оглавление текущего номера /150, 1996 г./ | Бонус | Поиск  

© 2004, Издательский дом «Компьютерра» | http://www.computerra.ru
Телефон редакции: (095) 232-22-61
E-mail редакции: inform@computerra.ru