1995 | 1996 | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | Оглавление текущего номера /172, 1996 г./ | Бонус | Поиск  

Вопрос недели

Действительно ли существует массовая потребность в системах оптического распознавания символов (OCR)?

 


© 2004, Еженедельник «Компьютерра» | http://www.computerra.ru/offline
Этого материала на сайте "Компьютерры", к сожалению, нет

Сотрудник (пожелавший остаться неизвестным) Научно-исследовательского кинофото-института (НИКОИ)

Я не понимаю, что значит массовая потребность, не знаю, насколько эти системы можно применить для бытовых целей. С другой стороны, всем, кто занимается этим профессионально, нужно четкое соответствие вводимого изображения тому, которое получается. Оптимально – это высокопрофессиональный сканер с большим разрешением. Однако он не вводит объемные картинки – для этого нужна видеокамера.

У нас есть потребность в таких системах. Мы все время работаем с изображениями, причем нас интересует не только сканирование, но и ввод с кинопленки. Однако удовольствие это дорогое, а сами подобных систем мы не разрабатываем.

 

Павел Зелинский, вице-президент фирмы «Параскрипт»

Ачто называть «массовой потребностью»? Рынки бывают разные. Вряд ли эти системы нужны массам, например, домохозяйкам. Хотя, с другой стороны, мы разработали систему распознавания рукописных адресов на почтовых конвертах. А письма пишут все, в том числе и домохозяйки. Таким образом, мы работаем и для широких масс, но не напрямую, а через системных интеграторов. Но наши разработки ориентированы в основном на Запад. Наша система индексирования и поиска по архивным записям используется в США – налоговой и почтовой службами, и итальянской фирмой Elsag Baily – крупным поставщиком сортировочного оборудования для почты.

Бурный рост рынка подобных технологий начался всего два года назад. Вызвано это тем, что ни одна система не распознает символы стопроцентно. OCR-технологии дают большие выгоды и экономию, но внедряются тяжело и требуют привлечения значительных капиталовложений, а также долгого и мучительного приспособления к решению каждой конкретной задачи. То есть требуются отладка и сопровождение.

В России это не развито. Если в Соединенных Штатах этой проблеме ежегодно посвящены пять крупных конференций и выставок, в двух из которых мы участвуем, то в России нет ни одной, – нет ни специальных журналов, ни какой-либо другой информации по этой проблеме.

 

Василий Якир, начальник сектора AS/400, IBM

Вопрос интересный, но, по-моему, вы его сужаете. Большая потребность существует не в самом по себе автоматическом распознавании текстов, а в автоматизированном вводе информации , в превращении бумажных документов в электронный вид. Архивы, всевозможные службы, которые используют в своей деятельности различные анкеты (налоговая служба, пенсионная служба, да и любой банк, работающий с потоком платежных поручений), нуждаются в таких системах. Однако не все из перечисленных организаций достаточно богаты, чтобы купить подобные системы. Поэтому широко они не внедрены, хотя потребность в них действительно массовая. Только в Башкирии это дело поставлено на широкую ногу. Там довольно хорошо развита автоматизация налоговой службы, а поскольку на периферии выбор меньше, то глаза не разбегаются и проще довести начатое дело до конца.

 

Сергей Зудов, PR-менеджер компании «Открытые технологии»

Мы – системные интеграторы, так сказать, стык науки и торговли. Мы такими системами не занимаемся, то есть не продаем, но используем в своей работе внутри фирмы. Эти системы безусловно нужны, поскольку позволяют избавиться от набивки текста вручную. Другое дело, нужно ли это простому российскому пользователю. Секретарю в офисе – нужны. Нужны и студенту – для написания рефератов, для правильной передачи цитат, то есть, конечно, они пользуются достаточным спросом. Однако тут все упирается в деньги: не все могут позволить себе тратить средства на такую роскошь, как эти программы.

 

Тагир Яппаров, президент компании «АйТи»

Прежде всего следует сказать, что рынок OCR-систем подразделяется на два больших сегмента. Первый – это настольные системы, предназначенные для обработки небольших документов и используемые в офисной деятельности или дома. Второй – это профессиональные системы, предназначенные для создания крупных электронных архивов документов и оперативной обработки различных бланков: платежных поручений, чеков, анкет и т. п.

Именно с профессиональными OCR-системами приходится работать системному интегратору при реализации крупных проектов. Рынок таких систем формируется и будет расти. Жизнь заставляет не только частные фирмы, но и государственные организации переводить огромные бумажные архивы в электронную форму, увеличивая скорость и качество обработки документов.

Наиболее перспективный вертикальный рынок для внедрения OCR-систем – это банки и крупные финансовые учреждения, архивы, центры хранения данных, статистические учреждения, налоговые службы (особенно с введением налоговых деклараций для частных лиц), силовые ведомства (например, картотеки МВД и армии).

В то же время следует отметить, что внедрению крупных систем в госслужбах мешает недостаток финансирования и недостаточная проработанность задач автоматизации. Поэтому этот рынок следует рассматривать как потенциальный.

Что касается «АйТи», то мы активно работаем над интеграцией OCR-программ в комплексные системы автоматизации предприятий, и сегодня у нас есть оригинальные разработки по интегрированным системам документооборота и ведения электронных архивов на базе Lotus Notes с OCR-системами.

 

Андрей Середа, старший инженер отдела автоматизации «Русского акцептного банка»

Мы пользуемся такими системами, но я думаю, что проблема эта специфична. Что касается массового потребления – то дома я ими пользоваться не буду. Как эти системы применяются в банковской деятельности? Широко. Последняя версия FineReader'a годится даже для распознавания таблиц. Если документ приходит не в электронном виде, то с использованием OCR-технологий из него создается Word'овский файл, пригодный для дальнейшего редактирования. При хорошей технике это себя оправдывает, но для надежного распознавания документов, их электронного копирования и хранения нужно выбирать первоклассные (и дорогие) системы, что не все могут себе позволить.

 

Дмитрий Малиновский, заместитель начальника управления автоматизации «Кристаллбанка»

Нет. Массовой потребность может быть только в том случае, если в офисе внедрена система электронного документооборота, а у нас она не внедрена. Потребности, которые покрывают такие системы у нас в банке, – это замена набивания текстов сканированием. Для этого мы используем стандартный распознаватель текста CuneiForm.

 

Павел Хромов, заместитель начальника управления информатизации Центральной налоговой инспекции г. Москвы

Такая потребность есть. Сегодня мы работаем с некоторыми организациями над решением этой проблемы, но, к сожалению, уровень современных систем оптического распознавания символов значительно ниже уровня наших запросов; а проекты, которые нам предлагают, на словах выглядят фантастично и заманчиво, но на деле оказываются блефом. Недавно мы купили высокоскоростной сканер, но без программы распознавания. Текст сканируется и вводится в машину автоматически, но распознавание его и перевод в базу данных производится уже вручную, операторами. Вот такая курьезная ситуация.

 

Флора Гидрович, к. т. н., доцент кафедры научно-технических и кино-фото-фоно-архивов факультета технотронных архивов Историко-архивного института

Безусловно, оптическое распознавание символов – это технология, которая должна применяться в архивах, но применяется сегодня с большим трудом.

В настоящее время применяются современные, но менее прогрессивные технологии копирования, – страховое копирование, индексирование, микрофильмирование. Для OCR- технологий у нас нет ни техники, ни средств.

Последние два года архивисты всех стран уделяют внимание этим вопросам. Совещания и собрания архивистов выявляют проблемы и направления в этих технологиях, но все согласно пришли к выводу, что это – дорого, причем дорого для всех. Есть, конечно, продвинутые страны. Так, в США создаются электронные копии пятнадцати процентов всех копируемых документов. В Европе – гораздо меньше.

На мой взгляд, архивы, во-первых, не готовы, и во-вторых, среди новейших технологий нет еще стандартных и стабильных технологий, которыми без особых проблем могли бы воспользоваться архивисты.

Большое неудобство для применения этих технологий создает смена поколений техники, происходящая каждые 7-10 лет. Она приводит к плачевным результатам: масса времени и сил затрачена на обработку документов; носители еще в хорошем состоянии, а использовать их мы не можем, потому что техника устарела и никто ее не поддерживает.

 

Оксана Стрешнева, сотрудник Центральной районной библиотеки им. Н. А. Добролюбова

Сканеры мы не употребляем, хотя собираемся. Дело в том, что один сканер нам подарили спонсоры, а вот программное обеспечение, видимо, придется покупать самим. Для нас проблема применения систем оптического распознавания символов действительно является насущной. Иногда читатели просят сделать копию. Когда нужно всего несколько страниц, то это не трудно. Но если необходимо скопировать целое издание – например, энциклопедии – проблема становится непосильной. Мы бы рады быстро и в компактной форме предоставить читателю большой объем информации, причем даже на дом, но нам не хватает оборудования. Мы – организация бюджетная, нами командует город.

Если бы мы могли внедрить у себя эти технологии, у нас появились бы широкие возможности, например, перевести на машинные носители фонд читального зала, фонд редких книг, которые пока еще есть, но буквально рассыпаются в руках. Однако я сомневаюсь, что в ближайшее время это удастся сделать.

 

Эрнест Волков, начальник отдела информатизации территориальной налоговой инспекции № 24 ЮАО г. Москвы

В налоговой инспекции эти технологии не применяются. Лишь часть программных продуктов мы получаем централизованно, остальные мы покупаем и платим за них собственные деньги. Таким образом, покупка новейших дорогостоящих технологий для нас – слишком дорогое удовольствие. Для нашей деятельности подошли бы достаточно мощные технологии распознавания табличной информации, которых на сегодняшний день нет, а более простые системы нам вообще не нужны.

Ответы собирала Наталья Теплоухова


1995 | 1996 | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | Оглавление текущего номера /172, 1996 г./ | Бонус | Поиск  

© 2004, Издательский дом «Компьютерра» | http://www.computerra.ru
Телефон редакции: (095) 232-22-61
E-mail редакции: inform@computerra.ru