Реклама

Обычно переводчик «Яндекса» учит языки путем анализа параллельных текстов. В случае с эмодзи такой подход не работает. Параллельные тексты, в принципе, существуют – например, в 2015 году пресс-релиз о новой модели «Шевроле» вышел одновременно и на английском и на эмодзи, – но их крайне мало. Зато в интернете есть «словари» – сайты, где собраны всевозможные эмодзи, их описания и толкования.

Эмодзи не так много – счет идет на тысячи. Поэтому подобрать прямое соответствие в словарях можно далеко не для всех слов. Скажем, не существует пиктограмм, обозначающих слово «квас» (потому что эмодзи придумали в Японии, а квас распространен в России) или слово «клавесин» (потому что это древний инструмент, а эмодзи появились относительно недавно). Чтобы адекватно передавать такие слова с помощью эмодзи, важно понимать их смысл.

«Яндекс.Переводчик» научился переводить на эмодзи с 94 языков

Поиск «Яндекса» уже умеет искать по смыслу, и похожий подход разработчики задействовали и для эмодзи. Когда вы хотите перевести на эмодзи ту или иную фразу, «Яндекс.Переводчик» разбивает ее на отдельные элементы: слова и комбинации слов. Каждый элемент представляется в виде вектора – иными словами, записывается в виде набора чисел. Аналогичная операция проводится и с описаниями эмодзи. Затем векторы сопоставляются. Чем ближе друг к другу находятся векторные представления, тем точнее смысловое соответствие между словами и эмодзи.

Переводчик может переводить на эмодзи и обратно слова и фразы на любом из известных ему 94 языков. Перевод работает в веб-версии сервиса и в приложениях для iOS и Android. Понимание смысла позволяет подбирать эмодзи-эквиваленты практически для любых понятий.

Попробовать, как это работает, можно в нашей игре-лотерее с новогодними пожеланиями.

 

835