Если вы учились в российской школе, то наверняка с первого или второго класса проходили английский язык: учили слова, зубрили грамматику и заучивали «устойчивые выражения», которые упаси вас Бог когда-либо употребить в разговоре с носителем языка. Вы доставите ему массу позитивных эмоций. В том смысле, что человек посмеется от души.

Я твой дом труба шатал: Skype Translator начал понимать по-русски

Так или иначе, итогом всего этого чудесного процесса, занимающего десяток лет, становится то, что соотечественники где-нибудь в Турции всегда смотрели на человека, способного связать два-три слова по-английски при заказе пива в баре, как на небожителя.

К чему я это все? На днях меня позвали в российский офис Microsoft и показали сервис Skype Translator с реализованной поддержкой русского языка. Для широкого круга пользователей возможность перевода русского языка стала доступна сегодня. Русский язык стал девятым в системе синхронного перевода. И это действительно очень круто.

Ну вот представьте, что вам нужно пообщаться с человеком, который говорит по-китайски. Допустим вы хотите снять квартиру в Шэньчжэне на месяц. А китайским вы не владеете. А он не говорит по-русски и по-английски.

В бытность спортивным журналистом я как-то побывал на пресс-конференции, предварявшей матч Кубка Федераций по теннису между женскими сборными России и Китая. Так вот, китаянки не владели английским, не понимали по-русски, а переводчика с русского на китайский почему-то не оказалось. Так что организаторам пришлось задействовать двойной перевод: с китайского на английский, с английского на русский и обратно. Даже не говоря о том, что результат был адским и с большим трудом доносил хоть какую-то часть смыслового содержания сказанного, это было очень сложно, плохо и очень долго. Но мы с вами не сможем и так. У нас нет двух переводчиков.

Но мы можем включить Skype, выбрать русский язык в качестве нашего, указать китайский в качестве языка собеседника и сказать: «привет!». Через несколько секунд внизу экрана появится субтитр со сказанным, а наш собеседник услышит и увидит «Ni hao», произнесенное компьютерным голосом, звучащим как автомобильный навигатор или, скажем, Siri. Затем наш собеседник тоже что-то скажет на своем языке, а мы увидим и услышим русскую версию произнесенного. Все просто. Главное — помнить два правила: говорить, как с иностранцем, то есть не торопиться, делать паузы между фразами, чтобы система могла сделать перевод. И говорить длинными фразами, так как чем длиннее фраза, тем проще системе понять контекст и дать правильный перевод тем или иным вашим словам. Все так просто…

На самом деле все невероятно сложно. И нейросети, и машинное обучение, и распознавание речи.

Проект Skype Translator существует с 2011 года. Работа над каждым новым языком начиналась с создания языковой базы, состоящей из сэмплов. Сотрудники Microsoft слушали ролики на YouTube, собирали языковые сэмплы у добровольцев, использовали базы Cortana в случае, если сервис уже работал с нужным языком.

Самой сложной задачей для разработчиков была очистка языка от слов-паразитов и особенностей речи, которые могут выражаться в ненужных повторениях и тому подобных вещах. И надо сказать, что в протестированной связке «русский-английский» это работает превосходно.

Главную роль здесь играет технология машинного обучения, которая позволяет системе развиваться, учитывая особенности речи конкретного пользователя с одной стороны и всех пользователей — с другой. И чем больше людей пользуются Skype Translator, чем точнее система понимает язык и делает перевод. Чем больше и чаще системой пользуетесь вы, тем лучше и полнее система будет переводить вашу речь и ту специфическую терминологию, которую вы используете. Тем точнее она будет извлекать смысл произносимого.

Разработчики добавили в интерфейс не только голос, но и работу с текстом — Skype Translator может переводить текстовые сообщения, причем поддерживается существенно больше языков. Но дело не в этом, а в том, что благодаря интерфейсу есть возможность в реальном времени видеть, как система корректирует перевод по мере того, как вы произносите все новые и новые слова. А иногда, когда фраза завершена, полностью меняет смысл и переводит заново, самостоятельно исправляя себя.

9 поддерживаемых языков при общении голосом — это русский, английский, испанский, китайский (мандарин), итальянский, французский, португальский (бразильский), немецкий и арабский.

Какие-то языковые пары работают очень хорошо, какие-то чуть хуже. Все зависит от степени востребованности того или иного перевода пользователями. Как я уже сказал, во время тестов перевод «русский-английский» получался почти безупречно. И это при том, что я мог проверять результат, так как понимаю оба языка. А вот пара «русский-французский» востребована в меньшей степени, и там частенько в переводах встречаются конструкции вроде вынесенной в заголовок. И можно бы кривиться и изображать недовольство, но не получается, так как результат ошеломляющий и способный в ближайшем будущем изменить мир вокруг нас невероятным образом.

И дело даже не в том, что на месте переводчиков я бы сейчас чувствовал себя неуютно. Во-первых, потому, что на месте людей, работающих с новостями, не очень уютно уже довольно давно, а во-вторых потому, что литературный перевод это немного иное. Это уже по большей части творчество, где форма иногда важнее сути.

Дело в другом. Речь о множестве интерфейсов, систем навигации, объявлении той или иной информации, даже инструкций по безопасности полетов в самолетах. Раньше для пяти человек нужно было сказать пять раз одно и тоже на разных языках, создавая немыслимый фоновый шум и тратя наше с вами время на прослушивание этого шума. Теперь все это можно сказать всего один раз, но каждый услышит так, как нужно ему.

Во многих фантастических романах можно встретить идею о людях или иных живых существах, взаимодействующих между собой, общаясь на понятийном, смысловом уровне, когда язык вообще не важен. И это всегда был какой-нибудь 7685-й год…

Внезапно казалось бы недостижимое будущее буднично вошло в нашу жизнь с обновлением ПО осенью 2016.

 

1008