1995 | 1996 | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | Оглавление текущего номера /171, 1996 г./ | Бонус | Поиск  

Тема номера

Как и зачем

Александр Филонов


© 2004, Еженедельник «Компьютерра» | http://www.computerra.ru/offline
Этого материала на сайте "Компьютерры", к сожалению, нет

Не ищите в этой статье откровений по поводу устройства и работы программ машинного перевода. Она предназначена для пользователей, не владеющих иностранными языками, но вынужденных по каким-либо причинам работать с иноязычными текстами. Как правило, подобная деятельность сводится к переводу с английского на русский и (реже) с русского на английский.

Так в чём же проблема?

Есть такая расхожая байка: однажды вокруг стола усадили пятнадцать переводчиков (уж и не знаю, с какой целью затевали этот эксперимент), каждый из которых знал языки своих непосредственных соседей. Затем первому из них дали фразу, написанную по-французски: «Вино известно людям с давних времен». Он перевёл её на немецкий и передал соседу. Сосед, знавший немецкий и английский языки, перевёл её, сами понимаете, на английский и передал дальше. Так, по цепочке, фраза обошла вокруг всего стола. И каково же было изумление первого переводчика, когда он прочёл: «Вино – вкусный и полезный напиток».

Так ли уж невероятна эта история? Давайте разберёмся. Для начала страдательный залог неизбежно должен был смениться действительным: «Люди знают вино с давних времён». А теперь «знают» просто следовало заменить одним из синонимов, имеющих несколько другую смысловую окраску: скажем, «применяют». Дальше выстраивается цепочка: «применяют» – «употребляют» – «пьют» – «любят» (если на этом стуле сидит русский переводчик, он может употребить ещё и двузначное определение «упиваются»)... Но почему любят? И вот кто-то уточняет: «любят вино за его вкус». И так далее.

Этот пример ясно показывает, с какими трудностями сталкиваются разработчики программ машинного перевода. К сожалению, просто перевести текст слово за словом нельзя, этот приём не всегда срабатывает даже в родственных языках. И дело не только в особенностях фразеологических оборотов, разных способах передачи времени, отличающемся порядке слов в предложении... Если бы каждое слово имело одно и только одно значение, примириться с неуклюжими формулировками ещё было бы можно. Но возьмём хотя бы фразу «Bob was right». Переводится она совершенно неоднозначно: не будет ошибки ни в переводе «Боб был прав», ни «маятник был правильным», равно как и в полудюжине других вариантов. Определить, какой именно из них подходит, можно лишь по контексту. Определить же, о чём именно идёт речь, машине не дано – в лучшем случае она может выделить несколько ключевых слов и на их основе сделать вывод, что речь идёт о технике, живописи или кулинарии.

Разделим тексты условно на три категории: литературные, технические и деловые. Что касается литературных, то их можно переводить на компьютере разве что для курьёза. Ведь если даже люди выдают формулировки вроде «собака шла за ним, виновато зажав свой хвост между своими (!) задними ногами» вместо тривиального «поджав хвост», тогда чего же ждать от компьютера. (Хочу отметить, что эта фраза не только вышла из-под пера переводчика, но и каким-то чудом проскочила мимо редактора и была напечатана тиражом в 30 тысяч экземпляров в период буйного расцвета пиратских издательств.)

Впрочем, давайте попробуем.

Художественная литература

A logical being might conclude that humans spend little time worrying about the past and a great deal of time thinking about the future. Oddly enough, the exact opposite seems to be the case.

Машинный перевод:

Логический являющийся мог бы заключить, что люди тратят (проводят) немного времени, волнующего относительно прошлого и много времени думать относительно будущего. Достаточно Странно, точный противоположный кажется случаем.

Перевод человека:

Логика подсказывает, что человек должен отбросить тревогу о прошлом и много раздумывать о будущем. Как ни странно, на деле происходит как раз обратное.

Как видим, перевод человека не только понятнее, но и гораздо лаконичнее. Быть может, в обратном направлении дело пойдёт лучше?

Возьмём для разнообразия классику, скажем, Булгакова.

Начало ужасающей катастрофы нужно считать заложенным именно в этот злосчастный вечер, равно как первопричиною этой катастрофы следует считать именно профессора Персикова.

Получим машинный перевод.

The beginning (began) ужасающей of accident is necessary to be thought incorporated just in this злосчастный the evening, equally as первопричиною this accident follows to think just professor Персикова.

Поскольку некоторые слова машинному переводчику неизвестны, слегка изменим исходный текст, устранив непонятные места.

Начало ужасной катастрофы нужно считать заложенным именно в этот несчастный вечер, равно как причиной этой катастрофы следует считать именно профессора Персикова.

Получаем окончательный перевод:

The beginning (began) of awful accident is necessary to be thought incorporated just in this unfortunate evening, equally as by reason of this accident follows to think just professor Персикова.

Диагноз практически тот же. Любопытно: а что, если теперь перевести этот текст при помощи компьютера на русский язык?

Начало (началось) ужасного несчастного случая, необходим, чтобы думаться включён только этим неудачным вечером, одинаково, поскольку из-за этого несчастного случая следует, чтобы думать справедливого профессора Персикова.

Комментарии, как говорится, излишни.

А вот как это место перевёл человек:

This ill-fated evening must be regarded as marking the beginning of the appalling catastrophe, just as Professor Persikov must be seen as the prime cause of the said catastrophe.

Пожалуй, на этом мы и закроем тему литературного перевода при помощи компьютера. Конечно, можно было привести ещё массу примеров и отыскать более курьёзные, но если подобные казусы заинтересовали читателя, он может продолжить эксперименты самостоятельно. А посколь-ку существует ещё и такое понятие, как «авторский стиль», всерьёз рассматривать возможность применения машинного перевода в литературе вряд ли стоит на протяжении ближайших... лет. (Уточнять не будем, потому что в 1980 году ЕС-1066, занимавшая площадь 200 кв. м и имевшая ОЗУ 1 Мбайт, казалась техникой на грани фантастики. А сколько памяти в вашем ПК сейчас?)

Именно поэтому имеющиеся на рынке программы-переводчики ограничиваются только частными приложениями, сводящимися к технической документации и деловой переписке.

Техническая документация

Случается, что нужно разобраться с какой-нибудь неординарной проблемой, связанной с аппаратным или программным обеспечением, снабжённым лишь английской документацией. Как же следует поступить в таком случае? Если вы «не в ладах» с английским, то сам собой в качестве выхода напрашивается машинный перевод.

Если в вашем распоряжении имеется текстовый файл типа read.me, то особых проблем с его переводом не возникнет, поскольку он уже находится в компьютере. Остаётся лишь переименовать его таким образом, чтобы программа-переводчик могла его «увидеть» (если она работает в MS-DOS). Под Windows этого можно и не делать – разве что вы хотите сохранить исходный файл в неизменном виде.

А если это инструкция, напечатанная на бумаге? Тогда перевод её в электронный формат может вызвать немалые трудности: ведь ввести текст без ошибок, не зная языка, -задача, посильная лишь для людей, обладающих фотографической памятью. Всем остальным гораздо разумнее воспользоваться любым подручным сканером и системой распознавания.

И далее – по инструкции к программе.

Рассмотрим небольшой пример: как разобраться с полученным переводом (здесь намеренно использована далеко не лучшая программа-переводчик, довольно широко распространённая благодаря пиратским CD-ROM).

Исходный текст:

On certain keyboards holding down a set number of keys causes a keyboard error to occur. If this happens on your keyboards you will hear a short beep from the PC speaker. To rectify this simply redefine the keyboard controlsto use a different set of keys. All of the keys are configurable from the con fig controls screen.

Перевод:

На определённых клавиатурах, придерживающих количество набора клавиш вызывают клавиатурную ошибку происходить. Если это случается на ваших клавиатурах Вы услышите короткий гудок из динамика ПК. Чтобы исправить это просто переопределяет клавиатурные управления, чтобы использовать другой комплект клавиш. Все клавиши перестраиваемы с экрана управлений con fig.

В принципе, текст довольно понятен, недоумение вызывает лишь первая фраза. Ключом к её расшифровке является замена слов «придерживающих количество набора» на «нажатие ряда». Разгадка подобных переводов через некоторое время, по мере приобретения навыка, перестанет представлять трудность. Но на первых порах всегда держите под рукой словарь (можно и компьютерный) и в первую очередь проверяйте значение деепричастий.

Деловая корреспонденция

Оговорюсь сразу: что касается важных юридических документов, то следует раз и навсегда отказаться от мысли переводить их при помощи машины – поднаторевший адвокат сумеет избрать крайне двусмысленные формулировки, расшифровать которые сумеет далеко не каждый переводчик. Лучше потратить время и деньги, обратиться к специалистам именно по части юридических текстов – лишь бы потом не пришлось раскаиваться в собственной поспешности.

Однако краткую переписку – чаще всего это касается факсов – рациональнее читать оперативно; и уже в проблематичных случаях обращаться за консультацией к профессионалу.

Как правило, деловая корреспонденция пишется кратко, в телеграфном стиле и особых затруднений при переводе не вызывает.

Исходный текст:

Dear Victor:

I am awfully sorry for this delay. Please find below the amended copy of our agreement. Amendments were numerous but rather insubstantial and originate from some inaccuracy of original statements.

Sincerely yours

Ron

Перевод:

Дорогой Победитель:

Я ужасно сожалею о этой задержке. Пожалуйста найдите ниже исправленной копии нашего соглашения. Поправки были многочисленные, но довольно insubstantial и происходят из некоторой погрешности первоначальных утверждений(заяв-лений).

Sincerely yours

Ron

Как видно, помимо перевода имени и отсутствующего в словаре слова «insubstantial», означающего «несущественный», смысл сообщения вполне понятен.

Попробуем написать ответ. Естественно, прибегать к очень сложному построению фраз не следует.

Дорогой Рон!

При виде вашего факса меня охватила искренняя радость. Я сегодня же свяжусь со своим юристом и сверю полученные поправки.

Всего наилучшего

Виктор

Первая попытка перевода:

Dear Рон!

At kind of your fax of me охватила sincere радость. I today свяжусь with the lawyer and сверю the received amendments.

Whole best

Виктор

Любой человек, знакомый с английским хотя бы в пределах средней школы, даже невооруженным глазом увидит, что формулировка «At kind of your fax of me» является по меньшей мере странной. (По сути, она означает приблизительно «При чём-то вроде вашего факса меня».) Кроме того, в словаре не оказалось ряда использованных нами слов. Попробуем выразиться попроще.

Получив ваш факс, я искренне обрадовался. Я сегодня же поговорю со своим юристом и проверю полученные поправки.

Перевод:

After receiving your fax, I sincerely обрадовался. I today поговорю with the lawyer and проверю the received amendments.

Теперь непереведенные слова можно было бы найти в словаре, но их появление говорит о том, что фраза построена пока чересчур сложно. Построим её ещё проще.

Получив ваш факс, я искренне был рад. Мой юрист сегодня же проверит полученные поправки.

After receiving your fax, I sincerely was glad. My lawyer today checks up the received amendments.

Результат вполне удовлетворителен и приемлем для обеих сторон.

Итак, каковы же практические выводы? Приведём ряд рекомендаций по применению программ-переводчиков.

1. Всегда пользуйтесь только программами, ориентированными на конкретную специфику перевода -технического или делового.

2. Проявляйте осторожность при употреблении деепричастий, а ещё лучше – избегайте их употребления.

3. Обращайте особое внимание на имена собственные и аббревиатуры – как правило, они не переводятся, но в ряде случаев могут совпадать с именами нарицательными, что ведёт к путанице.

4. Стройте фразу как можно проще, воздерживаясь от сложноподчинённых и сложносочинённых предложений. Если она кажется не очень ясной на вашем родном языке, то в переводе превратится в нечто совершенно невразумительное.

5. Придерживайтесь строгого порядка главных членов предложения: кто, что сделал, как и почему.

6. В случае возникновения малейших сомнений лучше измените формулировку, чтобы перевод был совершенно однозначным.

7. Делайте перевод за несколько проходов, добиваясь максимальной простоты и лаконичности.

Что же нам сулит будущее?

Пожалуй, трудно будет отыскать человека, сомневающегося в том, что в ближайшие несколько лет программное обеспечение будет двигаться вперёд семимильными шагами. Так что программы машинного перевода наверняка станут совершеннее, проще в употреблении и будут вызывать куда меньше недоразумений. Однако мыслить машина вряд ли научится так скоро, и потому не стоит тешить себя мыслью, что можно будет обойтись без знания иностранных языков.

Но, с другой стороны, машинный перевод в сочетании с использованием электронной почты, факсимильной техники и технологии OCR даёт возможность весьма оперативно ориентироваться в потоке иноязычной информации, прежде всего – технической документации и деловой корреспонденции.

Поэтому можно предположить, что определённая категория пользователей, вынужденных часто прибегать к услугам программ-переводчиков, наработает своеобразный, упрощённый стиль типа «мама мыла раму». Волей-неволей они распространят его и на свою русскоязычную переписку, что может привести к появлению очередной разновидности канцелярского языка – на сей раз не переусложнённого, а чрезмерно упрощённого, а вслед за тем и новой субкультуры. А оттуда уже рукой подать до появления метаязыка... Впрочем, дальнейшее развитие этой темы было бы гораздо увлекательнее в фантастическом рассказе.


1995 | 1996 | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | Оглавление текущего номера /171, 1996 г./ | Бонус | Поиск  

© 2004, Издательский дом «Компьютерра» | http://www.computerra.ru
Телефон редакции: (095) 232-22-61
E-mail редакции: inform@computerra.ru