Технологии
Lexis-Nexis и рынок online-услуг
Николай Лиходедов
Сегодня много говорится об Интернете, однако существует не менее заманчивый и незаслуженно забытый прессой информационный мир – профессионально-ориентированные базы данных. Они содержат сведения, необходимые для решения конкретных информационных задач, и могут послужить успешному развитию бизнеса в той или иной организации.
Особенно активно проблемы информационной индустрии обсуждаются на международных выставках (Online Show), которые ежегодно проходят в Лондоне в начале декабря. В 1995 году в лондонском выставочном центре "Олимпия" проводилась 19-я встреча. В ней приняли участие сотни компаний, предоставляющих доступ к информационным ресурсам в режиме онлайн Lexis-Nexis, Questel-Orbit, Dervent Publication, Extel Financial, Financial Times Information Services, Dialog-Datastar Europe и другие Россию представляли такие организации, как Andngal, Российская торгово-промышленная палата, Государственная публичная библиотека. Десятки организаций из республик бывшего СССР прибыли на встречу в качестве гостей. К счастью, Россия не стоит на месте и начинает постепенно втягиваться в мировой информационный процесс, выходит из информационного вакуума, в котором находилась много лет. Вопросы онлайновых информационных услуг довольно активно обсуждаются и в ряде специальных изданий, прежде всего – в "информационной библии" Gale Directory of Databases, которую уже много лет издает Gale Company.
Организацию, продающую информационные услуги, называют вендором (vendor), а компьютер, на котором поддерживаются базы данных, хост-компьютером (host).
По общепринятому тематическому делению, существуют следующие типы баз данных библиографические, словари, полнотекстовые, содержащие изображения (схемы патентов, графические изображения) доски объявлений, численные, справочные содержащие программное обеспечение, табличные, и т.д.
Если говорить о полнотекстовых БД, то одним из наиболее ярких примеров оказывется информационная служба Lexis-Nexis предоставляющая более 2400 тематических информационных массивов. Одним из примеров таких баз являются собрания полных текстов "New York Times" или "Financial Times", которые представлены в Lexis-Nexis с 1982 года. Однако есть здесь и библиографические базы данных, например, Embase – база рефератов научных публикаций из более чем 4800 информационных научных изданий, в той или иной мере связанных с биотехнологиями. Служба QuesteI-Orbit предоставляет главным образом библиографические базы данных, например, Chemical Abstracts включает рефераты из более чем 9000 научных изданий.

Безусловно, используемое деление БД весьма условно Questel-Orbit помимо библиографических баз данных содержит большое количество полнотекстовых (документы Agence France-Presse), баз данных с изображениями патентов, торговых марок, структурных химических формул. Здесь же находится база данных, представляющая несомненный интерес для тех, кто занимается программированием, – Microsearch, содержащая более 50 тысяч обзоров, посвященных компьютерным технологиям.
Рынок онлайновых информационных услуг довольно активно растет. В начале 70-х годов существовало немногим более 300 баз данных, их продажей занимались 105 компаний. Информацию производили около 200 компаний – в основном правительственные организации (около 56% от общего числа баз данных).
Из общего числа баз данных 33% относятся к области бизнеса 19% к области науки и техники, 12% связаны с законодательством, 10% в той или иной мере связаны с потребительским рынком (Consumer Market). Резко изменилось и соотношение в области производства информации На первое место (76%) вышли коммерческие организации, правительственные организации в области производства информации составляют теперь только 14%.
В 1995 году продажей информации занимались 1629 организаций, т. е. их число увеличилось в 16 раз. Производством информации в настоящее время занято 2778 компании – это в 14 раз больше, чем в 70-х годах. Таким образом, спустя двадцать лет можно констатировать значительный рост информационной индустрии. Доходы от продажи информации составили в 1995 году несколько миллиардов долларов США.
Интересно распределение баз чанных по странам и регионам Безусловным лидером здесь выступают США, которые предлагали в 1995 году доступ к 5011 БД На все остальные страны приходится 2988 баз данных, в том числе в Великобритании – 638, Канаде – 426, Германии – 343, Франции – 247, Австрии – 176, Японии – 144.
Если в 1975 году средний размер базы данных составлял 52 записи, то в 1994 году – 6319 записей. Средний размер записи составляет от 200 до 2000 слов. Текстовые базы данные (полнотекстовые и библиографические) составляют 70% от общего числа, численные – 18%, включающие видео – 5%, содержащие звук – 2%, программное обеспечение – 1%.
Россия
У нас сегодня баз данных, доступных в режиме онлайн, немного. Свыше 20 организаций в СНГ имеют свои собственные базы данных, онлайновый доступ к которым чаще всего осуществляется через зарубежных вендоров.
Эффективный доступ к базам банных, созданным в России, пока возможен только в том случае, если данные продаются через зарубежных вендоров информации. Совершенно ясно – вклиниться в информационный рынок, который функционирует уже более 20 лет и на котором несколько тысяч крупных игроков, непросто. А ее ли вы предоставляете эту информацию, предположим, через Lexis-Nexis, у которой более 700 тысяч подписчиков, вам не нужно бороться за этот рынок. Необходимо добиться согласия крупного вендора информации загрузить базу данных, что сложно, невыполнимо.
Доступ к восьмидесяти процентам всех баз данных можно получить в онлайновом режиме если у вас есть компьютер, модем и телефонная линия, вы можете через локальный узел глобальной компьютерной сети (например, сети Sprmtnet, Sovam Teleport, Tymnet, Internet или любой другой) соединиться с "большим компьютером" (Host) и пользоваться его информационными ресурсами в прямом диалоге в реальном времени.
Ценовая политика вендоров информации
Ценовые алгоритмы довольно сложны. Это связано с тем обстоятельством, что конкуренция на западном рынке информационных услуг очень жесткая, цены фактически выровнялись, и успех компании по привлечению новых подписчиков связан с оптимизацией схемы оплаты для каждого конкретного подписчика.
Используются следующие схемы оплаты:
1. Вы оплачиваете полностью, на условиях предоплаты, стоимость услуг за фиксированный промежуток времени (например, за год).
2. Оплата по факту за:
а) коммуникационный канал,
б) соединение с базами,
в) вывод информации на экран
г) транзакцию, то есть любой запрос на поиск информации
д) за предоставление неограниченного доступа к определенным базам данных
Схемы доступа к информационным ресурсам
Прежде всего стоит упомянуть такую схему крупные вендоры информации, например, Lexis-Nexis, Questel-Orbit, Kmght-Ridder и Dow Jones, как правило, имеют специальные соглашения с коммуникационными компаниями, согласно которым оплата коммуникационных услуг производится непосредственно вендору информации, и с коммуникационной компанией он рассчитывается самостоятельно. Такой поход чрезвычайно удобен для подписчиков баз данных, поскольку упрощает денежные расчеты, не говоря уже о том, что в этом случае коммуникационные услуги могут быть для клиента дешевле (особенно это касается России).
По второй схеме стоимость соединения с базами данных существенно зависит от вендора информации, типа баз данных и их объема. Например, в Questel-Orbit или Knight-Ridder стоимость одного часа соединения с базами данных колеблется от 40 до 222 долларов США, а в Lexis-Nexis ничего не стоит.
Некоторые компании взимают плату за вывод информации на экран (Questel-Orbit, Dialog, FT Profile). Оплачивается либо каждая строка, выводимая на экран, либо документ полностью, либо и то и другое одновременно. Цены в таком случае лежат в диапазоне от центов до десятых долей за строку
Наконец, некоторые вендоры информации, например, Lexis-Nexis, используют схему оплаты за услуги, основанную на транзакции (запросе). Для того, чтобы найти необходимую информацию (документ или определенное место в этом документе), вам необходимо отправить запрос на специальном языке поисковой системы (обычно они очень просты и с каждым годом приближаются к обычному естественному языку – последние разработки в этой области, связаны с так называемым "речевым интерфейсом").
Кстати, многие эксперты считают, что в Lexis-Nexis используется одна из лучших в мире поисковых систем Гибкая и развитая, Lexis-Nexis Services работает чрезвычайно быстро и обладает широкими возможностями эффективного и точного поиска.
Из общего количества БД 33% относятся к области бизнеса 19% к области науки и техники 12% связаны с законодательством 10% в той или иной мере связаны с потребительским рынком (Consumer Market) Резко изменилось и соотношение в области производства информации На первое место (76%) вышли коммерческие организации правительственные организации в области производства информации составляют теперь только 14% информации. Имеются режимы стандартного логического поиска, использования меню (ответы на предлагаемые системой вопросы), формулировки задачи на естественном языке (английском), словесной формулировки информационной задачи (речевой интерфейс). Эта поисковая система лишена ряда недостатков, свойственных другим системам. Она позволяет различать единственное и множественное число, прописные и заглавные буквы контролировать частоту появления поискового слова в документе, автоматически, на основе статистических критериев, выбирать информационный источник, в котором успешный поиск информации наиболее вероятен.
Важным обстоятельством является и то, что вы не платите за отображение информации на экране компьютера Вы можете быстро переходить от одного документа к любому другому, просматривая его либо в полном виде, либо только интересующую вас часть. Доступно и сохранение названий всех найденных документов. При этом пользователь имеет возможность отключиться на время, проанализировать список названий найденных документов, снова соединиться с Lexis-Nexis Services и затребовать только тот документ, который необходим Отобранная информация сохраняется в течение суток.
Формулирование вашей проблемы на языке поисковой системы называется "запросом на поиск", или транзакцией. Например, за одну такую транзакцию можно найти все статьи "New York Times" начиная с 1982 года или просмотреть курсы валют с 1980 года – и это обойдется всего в 9 долларов. Полные финансовые отчеты акционерных обществ открытого типа за три последних года – за несколько десятков долларов.
Для сравнения, департамент внешних связей правительства Москвы (см. еженедельник "КоммерсантЪ" #49 от 27 декабря) предоставляет адресную справку по фирме, занимающейся внешнеэкономической деятельностью, за 120 долларов. В Москве предоставление адресных реквизитов организаций, имеющих разрешение Главного управления Центрального банка РФ на реализацию товаров и услуг за инвалюту, будет вам стоить 10 долларов за один адрес, а в Lexis-Nexis за 50 долларов вы сможете получить регистрационные данные по сотням компаний. Так что информация, получаемая из Lexis-Nexis и других баз данных, на самом деле не так уж и дорога.
Анализ ценовой политики в этой области – сложная многопараметрическая задача, поэтому за подробностями лучше обращаться непосредственно к вендору информации.
Например, в Questel-Urbit есть уникальные возможности резко снизить возможные затраты за счет поиска информации в так называемых мета-файлах, которые могут объединять до сорока файлов одновременно. При этом час соединения стоит всего 40 долларов. Это очень важное обстоятельство, потому что в он-лайн-сеансе подписчик обычно 99% времени тратит на просмотр документов, введение запросов, размышления и т. п. Вывод информации на экран обходится в 20 долларов за час.
Профессионально-ориентированные базы данных
За второй квартал 1995 года число подписчиков онлайн-услуг возросло на 26 процентов и составило 1 1,8 млн. Такой рост объясняется, в основном, все возрастающей популярностью онлайн-сервиса среди обычных пользователей.
Согласно отчету опубликованному агентством SIMBA Information, количество подписчиков на базы данных для массового потребителя (consumer online services) увеличилось на 37 процентов и достигло 8,5 млн. Остальные сегменты рынка включают профессионально-ориентированные базы данных, компьютеризированные системы резервирования и финансовые информационные службы. Общее число подписчиков на такие виды онлайновых услуг – 3,3 млн.

Наибольшего прогресса среди служб, работающих в секторе consumer online, добилась America Online. За 1994 год количество ее подписчиков увеличилось вдвое и достигло 3 миллионов CompuServe довольствовалась 20-процентным ростом, что, тем не менее, позволило ей сохранить лидирующее положение с 3,2 миллионами подписчиков. На третьей позиции – фирма Prodigy (информационная служба IBM), число поклонников которой увеличилось на 12,5 процентов и составило 1,4 млн .Эта тройка контролирует 86% рынка баз данных, рассчитанных на массового потребителя. Объем продаж этого сегмента рынка онлайн-услуг составил в 1995 году около 1,2 миллиарда долларов
Большинство баз данных, предлагаемых этими онлайновыми системами, организованы в виде "Досок объявлений", и именно к таким базам доступ наиболее дешев – порядка нескольких десятков долларов в месяц. Доступ к полнотекстовым или справочным базам данных обойдется значительно дороже. Например, доступ к базе данных Consumer Reports Full Text, предоставляемый через CompuServe Knowledge Index, стоит 24 доллара в час .Обычно в этих базах данных отсутствуют развитые поисковые системы.
WWW и специализированные базы данных
Совершенно очевидно, что никогда WWW не будет конкурировать с базами данных для профессионалов. Любая организация или частное лицо может создать свою собственную базу данных на WWW и пригласить всех желающих к себе. Но никогда эта база данных ни по объему, ни по полноте представления, ни по достоверности информации не сможет сравниться с базами данных, поставляемыми профессиональными компаниями, которые более двадцати лет разрабатывают и поддерживают такие базы данных, как Investext, Predicast, Chemical Abstracts, Embase, Med-hne и т. п. При этом профессиональные, крупные игроки на информационном рынке открывают БД на WWW. Так, в начале мая 1996 года компания Questel-Orbit открыла базу данных на WWW – QPAT-US – 1,7 миллионов полных текстов патентов (объем этой базы на WWW составляет более 85 тысяч дискет), включая их изображения. Однако доступ к этой базе данных будет производиться на контрактной основе.
Основными "игроками" на рынке профессионально-ориентированных баз данных являются Lexis-Nexis (Division of Reed Elsevier), Questel-Orbit (France Telecom Group), Westlaw, Knight-Ridder (Dialog), Datastar, Dow Jones, STN, Datatimes (Oklahoma Publishing). В лидерах же по-прежнему Lexis-Nexis с 734 тыс зарегистрированных пользователей и объемом продаж в 700 миллионов долларов Dow Jones News/Retrieval (объем продаж более 100 миллионов) занимает второе место с 225 тыс подписчиков У Dialog число подписчиков превышает 200 тыс (объем продаж около 300 миллионов долларов по данным 1994 года).
60% подписчиков используют доступ к двум онлайновым системам, 22% – используют три системы, и только 18% используют одну онлайновую систему. Это тоже разумно и объяснимо данные, находящиеся в различных онлайн-системах, часто совпадают
В последнее время наметилась тенденция к объединению крупнейших вендоров информации Questel приобрел Qrbit в 1994 году. Крупнейший англо-нидерландский издательский концерн Reed Elsevier приобрел за полтора миллиарда долларов компанию Mead Data Central, предоставляющую доступ к базам данных Lexis-Naos Knight Ridder (Dialog) объединяется с Datastar, а известные газы данных Invest от Thomson Financial Services можно встретить в той же Lexis-Nexis Dialog купила компанию IAC (Information Access Company).
На рынке онлайн-услуг намечается интеграция основных вендоров информации. Этот рынок чрезвычайно перспективен. Сейчас на него пытаются выйти компании, традиционно стоявшие в стороне, например, такие, как Microsoft. Уже заключено соглашение о предоставлении пользователям Microsoft Network частичного доступа к обширным базам данных Lexis-Nexis. И, наконец, информация, извлеченная из хранилищ Lexis-Nexis, будет объединена в базы данных, доступные пользователям Microsoft Network. Эти базы данных будут содержать новости и сведения, актуальные для предприятий малого бизнеса.
От редакции
Автор этого материала – д-р Николай Лиходедов – является представителем по маркетингу Lexis Nexis и Questel Orbit. Оставляя на его совести цифры и оценки, приведенные в этом материале, мы хотели бы отметить огромную важность этой действительно незаслуженно забытой темы.
Быть может определенное падение интереса к онлайновым информационным услугам – естественная реакция на совсем недавнее прошлое Большое число отечественных профессионалов много говоривших об информационных ресурсах (достаточно вспомнить ГАСНТИ доступ через терминалы ВНИИПАС к зарубежным БД доступные патенты НПО ПОИСК и т.п.) недоумевали почему же эта информация никому в СССР, на родине НТП и НТР не нужна. Ломали голову над непотреблением информации рисовали схемы информационных потоков и переводили сотни тонн макулатурной бумаги на межвузовские переливания из пустого в порожнее. До сих пор вспоминаю и откровения профессора Романенко руководившего в свое время крупной информационной системой по ядерной физике INIS (МАГАТЭ), а после – кафедрой, где я учился в аспирантуре. Он так и остался по-моему, в шоке оттого что администрируемая из Австрии сложнейшая мировая информационная система работала, обслуживала массу реальных запросов а вся советская система НТИ одним из пионеров которой он был так и осталась бессмысленным монстром. Хотя может быть я и ошибаюсь пусть уж простит меня учитель.
Ведь чего только ни придумывали! Карты обратной связи формализованные информационные запросы тематические поиски. Увы, привлечь потребителя информации можно было только одним – оформлением свободного информационного дня или как он там назывался. Человек приходил в орган НТИ, отмечался и гулял по Москве. Впитывал впечатления. А с онлайном не ладилось. Даже не в смысле реализации. По каналам ГАСНТИ перекачивались приличные объемы данных. С экономической точки зрения никому не нужных.
Сегодня онлайновый доступ к разнообразным БД пополняемым подчас не один десяток лет стал проще а их поисковые средства – лучше. Остается только надеяться, что потребитель информации вместо метания между интернетовскими серверами вспомнит в нужный момент о существовании мощных хранилищ информации и воспользуется ими. Пользуясь случаем, хотелось бы пригласить к дискуссии по этому вопросу всех желающих. Высказывайтесь. Здесь много интересного. Модернизация ИПС сегодняшний день советских БД поисковые механизмы data warehouse и наконец рынок информационных ресурсов. С наиболее интересными материалами мы постараемся познакомить читателей.
Денис Викторов