Как рассказали в к"Яндексе", теперь перевод выполняют обе модели, затем алгоритм на основе метода машинного обучения CatBoost сравнивает результаты и предлагает лучший. Нейросеть не разбивает тексты на отдельные слова и фразы, она обрабатывает целые предложения. Поэтому переведенный текст хорошо читается, говорят разработчики. Статистический переводчик так не умеет, но он лучше запоминает и переводит редкие и сложные слова и фразы. В компании считают, что системы компенсируют недостатки друг друга.

«Яндекс» запускает гибридную систему перевода

«Яндекс»

С самого начала «Яндекс.Переводчик» использует статистическую систему, которая разделяет предложения на отдельные слова и фразы и для каждого кусочка подбирает все возможные переводы с указанием их вероятности. Затем система составляет из переведенных фрагментов разные варианты нового предложения. Выбирается тот вариант, в котором фрагменты хорошо сочетаются друг с другом. Нейросетевой перевод может работать с голосовой или графической информацией. Нейросеть улавливает смысл даже в том случае, когда слова находятся в разных частях предложения. Однако при трудностях в переводе она начнет что-то выдумывать самостоятельно, пытаясь угадать правильный ответ.

Гибридная система используется для переводов с английского языка на русский, на это самый большой спрос: на такой перевод приходится 80% всех запросов к «Яндекс.Переводчику». В ближайшие месяцы компания обещает включить систему и для других языков. Сейчас можно сравнить две модели перевода с помощью специального переключателя.

465