Моя колонка
Дейтаверихаус. Нечто обетованное
Георгий Кузнецов
Мы продолжаем обозревать состояние дел с ключевыми технологиями и другими аспектами компьютерного бизнеса в России. Обзоры обычно становятся "cover story", то есть выносятся на обложку. А чтобы они с каждым разом удавались все лучше, мы ввели в практику дежурство редакторов. Дежурный делает "каверсторию" и отвечает за номер целиком.
Сегодня впервые дежурю я. Здравствуйте! Мой номер – про datawarehouse. Это новое компьютерное учение с труднопроизносимым для нас названием. К тому же не поймешь, как правильно то ли data warehouse, то ли dataware house (важны и данные, и средства работы с ними). Переводят кто как склад, хранилище Интересно знать, что же в таком случае база данных?
Однако к делу, к истории DWH. У современной информационной технологии есть один полузабытый вексель, весьма серьезный обет, выданный лет двадцать пять назад. Обещали, что базы данных откроют самые широкие возможности для исследований, поиска новых путей и обоснования решений. Так не вышло по многим причинам как объективно техническим, так и субъективно-организационным.
Компьютеры никогда не бывают достаточно мощны, поэтому реальные БД компромиссны. Схема данных, физическая организация, структура распределенной коммуникационно-вычислительной среды приспосабливаются к чему-то одному или к рутинным задачам, или к исследовательским. Для последних к тому же недостаточно чисел, строк и непроцедурных операций, тут нужны и география, и графика, и хитрые алгоритмы.
Не всегда соблюдается дисциплина централизации информационных ресурсов Базы данных в подразделениях создают независимо друг от друга. Такая же картина наблюдается, когда корпорация бурно растет или сливаются несколько независимых фирм системы данных оказываются не только неинтегрированными, но и несовместимыми.
У многих на руках наследие устаревших компьютеров, программ на ходу и архивов данных Немногим лучше персональные БД и приложения на основе современных технологий вплоть до xBase под DOS или Windows. В идеале надо бы держать все данные под единым управлением, в одном экземпляре, в одном месте и одинаково доступными. Так не получается, и это делает жизнь разработчиков и пользователей захватывающе интересной. Кстати, и "Компьютерре" есть о чем писать.
До поры великий обет оставался невостребованным. Десятилетиями о нем не особенно беспокоились. Международные комитеты даже рекомендовали отказаться от стремления к интегрированным, "тотальным" базам данных и действовать по обстоятельствам Наконец, первопроходцы, так называемые smart corporations, начали на деле доказывать, что изучение собственного бизнеса дает конкурентные преимущества. Инструментом как раз и явились DWH – исследовательские системы данных второго слоя, надстраиваемые над имеющимися.
Успех идеи DWH сложился из множества факторов, а сами они основаны на новейших технологических достижениях. Прочитав этот номер, вы узнаете гораздо больше. Здесь же я предлагаю обсудить один простой практический вопрос. Все, что было написано выше, и почти все, что будет написано потом, – об американских реалиях А вот что они собираются ловить здесь, в России?
"Они" – это западные фирмы и их местные представители или посредники. Непохоже, чтобы они стремились понять этот рынок. Дело житейское. Допустим, одни решили жить продажей программных продуктов, другие надеются найти несколько крупных проектов и кормиться с них, а третьи довольны и тем, что начальство не задается пока вредными вопросами. Последнее, как вы понимаете, нетипично и в жизни почти не встречается.
Как мне представляется, живого наследия в большой России почти нет. Ненавистные АСУП повсеместно разогнали, а еэски с эсэмками и два-три года назад массово вывозили как компьютеры, продавая в качестве лома цветных и драгоценных металлов. Посмотрите газету "Из рук в руки" – сами увидите. Но и там, где машины советского периода сохранились, от них надо срочно избавляться по причине непомерной стоимости эксплуатации.
Представители фирмы Informix полагают, что их продукт имеет смысл покупать потому, что он широко распространен. Один Informix с высокой вероятностью встречает другой, а значит, нет проблем с совместимостью Междутем в России двум информиксам встретиться – это как амазонскому удаву, утекшему из зоопарка, найти себе пару в подвалах Пресни.
Давайте посмотрим на дело с другой стороны DWH объединяют данные о деятельности компании и о деловом окружении (география, демография, всяческая статистика и так далее), добавляя инструменты распознавания образов, статистического анализа и прогноза. Все это служит, в частности, для поиска новых путей.
Но ведь то же самое делается в начале бизнеса, при оценке идей и разработке бизнес-плана. И, если уж DWH стали обычной деловой практикой, не проще ли прямо с них и начинать, а потом пристраивать учетные системы? Иначе говоря, имело бы смысл рассмотреть и задачу, обратную существующей, и адекватный ей маркетинг.
В США говорят о data mining – добыче, разработке данных, как руды, и соответственно развивают технологии .В условиях России это было бы, скорее, старательством, поисками золота. Здесь, конечно же, есть полезные данные, и есть люди, понимающие их ценность Известно много случаев, когда сотрудники советских контор поднимали свои архивы и превращали их в более или менее толковые БД на продажу.
Вообще, DWH в России хорошо бы использовать по частям, как ром-бабу Например, файловые серверы и xBase стали у нас общественной напастью Успешные фирмы быстро растут, поэтому им надо поскорее избавляться от ошибок молодости, а не строить над ними саркофаги. Технология инвентаризации, откачки и конверсии данных, развитая для DWH, позволила бы разобраться в содеянном и перейти к системам современным, клиент-серверным, двухуровневым, не останавливая жизненно важных приложений.
Да, чуть не забыл. Не зная, что делать с переводом, я хочу сообщить вам одно ценное наблюдение. Слово datawarehouse первые отечественные специалисты в этой области произносят так "дейта-верихаус". Это не для американских ушей, но в целом рекомендую И лучше потренируйтесь заранее, иначе трудно будет читать.