Не секрет‚ что онлайн-переводчики‚ хоть и становятся всё лучше и точнее‚ сильно уступают в результатах переводчикам-людям. Казалось бы‚ машинный подход как раз и призван обеспечивать безошибочность‚ корректность… Но на деле всё обстоит с точностью до наоборот. Немало шуток в Интернете связано с «перлами» очередного машинного переводчика‚ но похоже‚ что пределам несовершенству нет.
Недавний скандал был спровоцирован работой переводчика от компании Bing‚ известного мирового медиагиганта.
В географии переводчик не силён
Переводя ленту новостей в Твиттере‚ онлайн-переводчик производства Bing допустил особенно глупую и досадную ошибку. Дело в том‚ что переводил он записи‚ оставленные в социальной сети президентом США Дональдом Трампом. В них глава Штатов констатировал‚ что последние внешнеполитические шаги КНДР были опрометчивыми‚ и основные надежды американская общественность и он лично возлагают на действия соседнего Китая. В противном же случае США готовы сами принять меры. В конце стояла традиционная подпись‚ которую Трамп часто использует‚ завершая обращения к американцам и миру в целом: United States‚ то есть Соединенные Штаты.
Но что-то пошло не так. То ли в алгоритме случился сбой‚ то ли причина кроется в чем-то ещё‚ только результат поразил всех:
«Северная Корея ищет неприятности. Если Китай решает помочь‚ что бы здорово. Если нет‚ то мы будем решать проблемы без них! РОССИЙСКАЯ ФЕДЕРАЦИЯ»
При дальнейшей проверке выяснилось‚ что новый Bing-переводчик действительно переводит Unites States на русский‚ как «Российская Федерация»‚ запросто путая названия двух сверхдержав. И это напомнило блогосфере скандал‚ случившийся полтора года назад‚ когда название ИГИЛ‚ запрещенной в России террористической организации‚ Google переводчик превратил при двойном переводе в «Саудовскую Аравию»‚ и тем самым вызвал вопросы со стороны саудистских властей.
Почему же так получается? Ответ простой: как бы ни старались разработчики‚ современные онлайн-переводчики опираются на ассоциативные массивы. Они‚ в свою очередь‚ формируются при помощи машинного обучения‚ когда запоминаются связанные между собой понятия‚ например‚ часто поминаемые в одном предложении. Алгоритм пока не способен адекватно оценить‚ как именно они соотносятся между собой‚ и «запоминает» простое расположение слов и фраз в тексте.
Возможно‚ онлайн-переводчики будущего станут более разборчивыми‚ а пока несовершенство таких программ не удивляет.