1995 | 1996 | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | Оглавление текущего номера /113, 1995 г./ | Бонус | Поиск  

Software

Системы распознавания речи: требуется "командный голос"

Ирина Кандыкина


© 2004, Еженедельник «Компьютерра» | http://www.computerra.ru/offline
Этого материала на сайте "Компьютерры", к сожалению, нет

15 сентября в Научном парке МГУ Клуб голосовых технологий провел пресс-конференцию, на которой представил некоторые программные продукты, позволяющие управлять компьютером с помощью голоса.

Клуб голосовых технологий (КГТ) существует при Научном парке Московского госуниверситета имени М.В.Ломоносова уже несколько месяцев. Клуб ставит своей целью пропаганду и распространение голосовых интерфейсов, или иначе говоря, аппаратных и программных средств, позволяющих общаться с компьютером с помощью голоса.

Должна заметить, что имеющиеся на сегодня голосовые интерфейсы предъявляют архищадящие аппаратные требования. Никаких Pentium'oв, лишь бы наличествовала звуковая карта. В частности, показанный на пресс-конференции пакет Voice Mouse Kit минимально "просит" процессор 386SX-33, а также звуковую карту Sound Blaster-8.

Что же входит в Voice Mouse Kit? Система Voice Mouse. Позволяет управлять компьютером с помощью голоса – голосовой командой связывается произвольная последовательность нажатия клавиш). Однократно настраивается на говорящего. Работает под Windows. Голосовое подтверждение и ответ.

Система Just Voice – то же самое, но для DOS. В резидентном режиме вместе со словарем занимает около 80 Кб.

Звуковой редактор для разработчиков приложений Voice Toolkit. Позволяет записывать звуковые файлы и редактировать их; допускает их наложение и пребразовывание форматов.

И наконец, Speaking Mouse – система непосредственного синтеза речи на русском языке, способная читать русскоязычные тексты.

Во время пресс-конференции было продемонстрировано несколько примеров применения голосовых интерфейсов. Один из них очень наглядно показал, как можно облегчить себе жизнь, работая с каким-либо текстовым редактором. Натренировавшись произносить команды четко и твердо (вероятно, это и есть тот самый "командный голос") и настроив необходимое количество макросов, вы можете с голоса менять шрифты , переходить с одного языка на другой и т.п., совершенно не касаясь при этом клавиатуры или мыши.

Вторая демонстрация называлась "Слайд-шоу с произвольным доступом". Показ слайдов давно уже стал частью лекционного инструментария. Лектор, имеющий "на вооружении" такое средство, как голосовой интерфейс, больше не привязан к строгой последовательности слайдов, уложенных в приемное устройство проектора. Единственное требование – он должен помнить названия демонстрируемых кадров.

Одно из узких мест подобных технологий заключается в том, что пользователю необходимо держать в голове все требуемые команды. Поэтому в следующей версии того же Voice Mouse Kit планируется создать своеобразный файл подсказки. Кроме того, как я уловила из общения с теми, кто активно использует голосовые технологии, недостаточно совершенна система блокировки посторонних шумов. Это, конечно, не означает, что телефонный звонок может быть воспринят как команда для переформатирования винчестера, но, например, была замечена странная реакция компьютера на шумы от принтера и посторонние разговоры. Возможно, это недоработка системы, а может, и результат некорректной предварительной настройки.

Тел. КГТ: 932.90.09.

 


1995 | 1996 | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | Оглавление текущего номера /113, 1995 г./ | Бонус | Поиск  

© 2004, Издательский дом «Компьютерра» | http://www.computerra.ru
Телефон редакции: (095) 232-22-61
E-mail редакции: inform@computerra.ru