Домой Интернет Я твой дом труба шатал: Skype Translator начал понимать по-русски

Я твой дом труба шатал: Skype Translator начал понимать по-русски

Microsoft объявил о начале поддержки русского языка сервисом Skype Translator

Если вы учились в российской школе, то наверняка с первого или второго класса проходили английский язык: учили слова, зубрили грамматику и заучивали «устойчивые выражения», которые упаси вас Бог когда-либо употребить в разговоре с носителем языка. Вы доставите ему массу позитивных эмоций. В том смысле, что человек посмеется от души.

Я твой дом труба шатал: Skype Translator начал понимать по-русски

Так или иначе, итогом всего этого чудесного процесса, занимающего десяток лет, становится то, что соотечественники где-нибудь в Турции всегда смотрели на человека, способного связать два-три слова по-английски при заказе пива в баре, как на небожителя.

К чему я это все? На днях меня позвали в российский офис Microsoft и показали сервис Skype Translator с реализованной поддержкой русского языка. Для широкого круга пользователей возможность перевода русского языка стала доступна сегодня. Русский язык стал девятым в системе синхронного перевода. И это действительно очень круто.

Ну вот представьте, что вам нужно пообщаться с человеком, который говорит по-китайски. Допустим вы хотите снять квартиру в Шэньчжэне на месяц. А китайским вы не владеете. А он не говорит по-русски и по-английски.

В бытность спортивным журналистом я как-то побывал на пресс-конференции, предварявшей матч Кубка Федераций по теннису между женскими сборными России и Китая. Так вот, китаянки не владели английским, не понимали по-русски, а переводчика с русского на китайский почему-то не оказалось. Так что организаторам пришлось задействовать двойной перевод: с китайского на английский, с английского на русский и обратно. Даже не говоря о том, что результат был адским и с большим трудом доносил хоть какую-то часть смыслового содержания сказанного, это было очень сложно, плохо и очень долго. Но мы с вами не сможем и так. У нас нет двух переводчиков.

Но мы можем включить Skype, выбрать русский язык в качестве нашего, указать китайский в качестве языка собеседника и сказать: «привет!». Через несколько секунд внизу экрана появится субтитр со сказанным, а наш собеседник услышит и увидит «Ni hao», произнесенное компьютерным голосом, звучащим как автомобильный навигатор или, скажем, Siri. Затем наш собеседник тоже что-то скажет на своем языке, а мы увидим и услышим русскую версию произнесенного. Все просто. Главное — помнить два правила: говорить, как с иностранцем, то есть не торопиться, делать паузы между фразами, чтобы система могла сделать перевод. И говорить длинными фразами, так как чем длиннее фраза, тем проще системе понять контекст и дать правильный перевод тем или иным вашим словам. Все так просто…

На самом деле все невероятно сложно. И нейросети, и машинное обучение, и распознавание речи.

Проект Skype Translator существует с 2011 года. Работа над каждым новым языком начиналась с создания языковой базы, состоящей из сэмплов. Сотрудники Microsoft слушали ролики на YouTube, собирали языковые сэмплы у добровольцев, использовали базы Cortana в случае, если сервис уже работал с нужным языком.

Самой сложной задачей для разработчиков была очистка языка от слов-паразитов и особенностей речи, которые могут выражаться в ненужных повторениях и тому подобных вещах. И надо сказать, что в протестированной связке «русский-английский» это работает превосходно.

Главную роль здесь играет технология машинного обучения, которая позволяет системе развиваться, учитывая особенности речи конкретного пользователя с одной стороны и всех пользователей — с другой. И чем больше людей пользуются Skype Translator, чем точнее система понимает язык и делает перевод. Чем больше и чаще системой пользуетесь вы, тем лучше и полнее система будет переводить вашу речь и ту специфическую терминологию, которую вы используете. Тем точнее она будет извлекать смысл произносимого.

Разработчики добавили в интерфейс не только голос, но и работу с текстом — Skype Translator может переводить текстовые сообщения, причем поддерживается существенно больше языков. Но дело не в этом, а в том, что благодаря интерфейсу есть возможность в реальном времени видеть, как система корректирует перевод по мере того, как вы произносите все новые и новые слова. А иногда, когда фраза завершена, полностью меняет смысл и переводит заново, самостоятельно исправляя себя.

9 поддерживаемых языков при общении голосом — это русский, английский, испанский, китайский (мандарин), итальянский, французский, португальский (бразильский), немецкий и арабский.

Какие-то языковые пары работают очень хорошо, какие-то чуть хуже. Все зависит от степени востребованности того или иного перевода пользователями. Как я уже сказал, во время тестов перевод «русский-английский» получался почти безупречно. И это при том, что я мог проверять результат, так как понимаю оба языка. А вот пара «русский-французский» востребована в меньшей степени, и там частенько в переводах встречаются конструкции вроде вынесенной в заголовок. И можно бы кривиться и изображать недовольство, но не получается, так как результат ошеломляющий и способный в ближайшем будущем изменить мир вокруг нас невероятным образом.

И дело даже не в том, что на месте переводчиков я бы сейчас чувствовал себя неуютно. Во-первых, потому, что на месте людей, работающих с новостями, не очень уютно уже довольно давно, а во-вторых потому, что литературный перевод это немного иное. Это уже по большей части творчество, где форма иногда важнее сути.

Дело в другом. Речь о множестве интерфейсов, систем навигации, объявлении той или иной информации, даже инструкций по безопасности полетов в самолетах. Раньше для пяти человек нужно было сказать пять раз одно и тоже на разных языках, создавая немыслимый фоновый шум и тратя наше с вами время на прослушивание этого шума. Теперь все это можно сказать всего один раз, но каждый услышит так, как нужно ему.

Во многих фантастических романах можно встретить идею о людях или иных живых существах, взаимодействующих между собой, общаясь на понятийном, смысловом уровне, когда язык вообще не важен. И это всегда был какой-нибудь 7685-й год…

Внезапно казалось бы недостижимое будущее буднично вошло в нашу жизнь с обновлением ПО осенью 2016.

 

Прокомментируйте первым!

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Предыдущая статьяОбзор игры Master of Orion. Возвращение легенды
Следующая статьяSamsung нарастит производство Galaxy S7 ради компенсации убытков от Galaxy Note 7