Наверх

Siri перестанет бубнить? Apple работает над скоростью речи цифрового ассистента

Как ускорить речь ИИ до естественной? Секрет — в группировке похожих звуков. Это ключ Apple для новой Siri, которая не будет бубнить.

Опубликовано 05.02.2026 в 06:16 4 мин
4 мин
Siri

Основные идеи

Apple объявила партнёрство с Google (Gemini AI) для краткосрочного улучшения Siri.
Исследование Apple предлагает метод PCG для долгосрочного ускорения Siri самостоятельно.
Ключ — группировать акустически или семантически взаимозаменяемые речевые токены.
Это ускоряет генерацию речи, так как не нужно искать единственно «правильный» токен.

Мнение автора

Скорость речи ИИ увеличивается не из-за того, что процессоры тупо мощнее становятся, а из-за умного и простого подхода к задаче. Поэтому настоятельно рекомендую следить за развитием этой технологии — она вполне может оказаться фундаментом для следующего поколения наших голосовых помощничков.

Вот так дела, друзья! Сейчас все надежды на то, чтобы наша Siri стала умнее и шустрее, висят на одном коротеньком решении. Недавно Apple объявила о партнёрстве с Google, чтобы позаимствовать у них их ИИ-фишки, а точнее — технологию Gemini. Ну вы поняли, хотят быстренько прокачать своего голосового помощничка за счёт чужого ума. Это как взять у соседа крутой девайс на время, чтобы не отставать.

Но! Оказывается, есть и другой путь. Согласно одному свежему исследованию, у Apple есть свой, долгосрочный и дико интересный способ, чтобы заставить Siri работать быстрее — и всё это самостоятельно, своими силами. Представляете? Не полагаться на помощь со стороны, а раскопать свой собственный секретный рецепт. Вот это уже поострее, чем просто партнёрство, правда?

Статья «Принципиальный подход к грубому принятию решений при спекулятивном декодировании речи» была написана пятью исследователями из Apple и Тель-Авивского университета. В ней предлагается новый подход, который, по словам исследователей, может «ускорить генерацию речевых токенов при сохранении качества речи».

Видео от DGL.RU

По мнению исследователей, ключ к повышению скорости — отказ от излишней строгости. «Для речевых больших языковых моделей, генерирующих акустические токены, — пишут они, — точное совпадение токенов является чрезмерным ограничением: многие дискретные токены акустически или семантически взаимозаменяемы, что снижает процент корректных ответов и ограничивает возможности ускорения». Другими словами, при определенном уровне сходства не имеет значения, какой из двух возможных речевых токенов будет выбран, поскольку они звучат или означают практически одно и то же, а попытки определить, какой из них правильный, отнимают время и ресурсы процессора.

Предлагаемое решение заключается в том, чтобы группировать акустически схожие лексемы.

«Мы предлагаем метод Principled Coarse-Graining (PCG) — подход, который заменяет точное сопоставление токенов проверкой на уровне групп, — поясняется в статье. — Мы формируем группы акустической схожести (ASG) в пространстве векторных представлений токенов целевой модели, отражая внутреннюю организацию семантической и акустической схожести. PCG выполняет спекулятивную выборку на основе грубого распределения по ASG и отбраковывает выборки на уровне групп».

Исследователи утверждают, что это повысит скорость работы Siri без существенного снижения надежности. В ходе экспериментов было установлено, что увеличение количества токенов в секунду немного снижает точность, но гораздо меньше, чем при стандартном спекулятивном декодировании.

Доступность Siri в России

Siri в России работает, но её функции отстают от актуальных мировых трендов и российских аналогов. Её главная особенность — глубокая интеграция в экосистему Apple, однако ассистенты от российских IT-компаний предлагают более развитую поддержку местных сервисов и языка.

Вот ключевое сравнение Siri с основными российскими голосовыми ассистентами:

Siri (Apple): Тип: Встроенный ассистент Apple. Ключевые особенности: Базовая интеграция с iOS, персонализация, приватность данных. Недостатки: Медленное обновление функций в России, слабая интеграция с местными сервисами. Пример команд: «Позвони маме», «Проложи маршрут домой».

Алиса (Яндекс): Тип: Ассистент российского IT-гиганта. Ключевые особенности: Глубокая интеграция с Яндекс.Сервисами, поддержка нейросети YandexGPT, лидер на рынке. Недостатки: Ограничена на iPhone без приложения. Пример команд: «Вызови такси», «Закажи пиццу».

Маруся (VK): Тип: Ассистент экосистемы VK. Ключевые особенности: Интеграция с VK Музыка и соцсетью, «дружелюбный» характер. Недостатки: Узкая поддержка умного дома, паузы в диалоге. Пример команд: «Включи музыку из VK», «Напиши сообщение другу».

Салют (Сбер): Тип: Ассистент экосистемы Сбера. Ключевые особенности: Управление финансами, три варианта голоса, нейросеть GigaChat. Недостатки: Замедленная работа, неестественный голос. Пример команд: «Переведи деньги», «Найди сериал на ТВ».

Будущее Siri: грядущие изменения

Apple активно работает над модернизацией Siri, чтобы догнать конкурентов. Ожидается, что в 2026 году Siri подвергнется значительному обновлению:

Крупное обновление запланировано на конец 2026 года. Siri превратится в полноценного ИИ-чат-бота под кодовым названием «Campos», способного вести сложные диалоги и выполнять многошаговые задачи.

Для этого Apple заключила партнёрство с Google, чтобы использовать в основе своей технологии модель Gemini.

Уже весной 2026 года в обновлении iOS 26.4 должна появиться «персонализированная Siri» — промежуточная версия с улучшенным пониманием контекста.

Практические рекомендации

Для пользователей Apple в России: Siri удобна для базовых команд в рамках экосистемы (звонки, будильники, настройки). Однако для заказа такси, управления умным домом или использования российских медиасервисов лучше установить приложения с Алисой или Марусей.

При выборе основного ассистента: Если ваш смартфон и большинство услуг (музыка, навигация, такси) — от Яндекса, выбирайте Алису. Если жизнь тесно связана с VK — вам подойдёт Маруся. Салют будет наиболее полезен активным клиентам Сбера.

В целом, пока Siri остаётся удобным, но ограниченным инструментом для пользователей iPhone в России, а её будущая конкурентоспособность напрямую зависит от успеха грядущего масштабного обновления.

Siri наконец-то перестанет «глохнуть»: Apple купила уникальный стартап для спасения iPhone

Вопросы и ответы

Почему поиск идеального токена замедляет Siri?

Система тратит время и ресурсы, чтобы выбрать один «точный» звук из множества очень похожих. Для слушателя разницы часто нет, а задержка возникает.

Как метод PCG решает эту проблему?

Он группирует акустически схожие токены. Вместо выбора одного из тысячи вариантов система принимает решение для целой группы похожих звуков, что происходит намного быстрее.

Не ухудшит ли это качество речи Siri?

Эксперименты показывают, что потеря точности минимальна и значительно меньше, чем при других методах ускорения. Качество речи сохраняется на высоком уровне, а скорость растёт.

Дэвид Прайс

Дэвид Прайс

Он пишет о технологиях уже более двух десятилетий. Он попал под влияние ажиотажа вокруг Apple, когда освещал выпуск первого iPhone в 2007 году. Он с энтузиазмом пропагандирует Apple Watch и считает, что HomePod недооценивают.

Источник: Macworld
Теги:
Подпишитесь на наши новости:
Нажимая кнопку «Подписаться», вы принимаете «Пользовательское соглашение» и даёте согласие с «Политикой обработки персональных данных»