
Ваш голос больше не ваша собственность: ИИ научился подделывать его идеально
Новое исследование доказывает: вы не отличите дипфейк от реальности, а подделка может вызывать даже больше доверия.
Коротко о главном
- Созданные ИИ голоса теперь имитируют людей настолько убедительно, что их обнаружение практически невозможно.
- Создание убедительного голосового клона теперь занимает минуты и требует минимальных знаний.
- Некоторые синтетические голоса на самом деле были оценены как более заслуживающие доверия, чем реальные человеческие записи.
В течение многих лет многие люди предполагали, что речь, сгенерированная ИИ, всегда можно будет опознать по ее слегка «фальшивым» качествам.
Новое исследование из Лондонского университета королевы Марии оспаривает это предположение, показывая, что современная технология голосового ИИ достигла уровня, на котором «голосовые клоны» и дипфейки почти неотличимы от реальных записей.
В ходе исследования участники сравнивали человеческие голоса с двумя формами синтетического аудио: клонированными голосами, разработанными для имитации реальных говорящих, и голосами, сгенерированными из системы LLM без конкретных аналогов.
За пределами реализма и к доминированию
Слушатели часто с трудом различали их, что говорит о том, что технология вступила в фазу, когда человекоподобный реализм больше не является стремлением, а реальностью.
Исследовательская группа изучала не только то, смогут ли участники различить синтетические и реальные голоса, но и то, как они их воспринимали.
Удивительно, но оба типа голосов, сгенерированных ИИ, были оценены как более доминирующие, чем человеческие, а в некоторых случаях их сочли более заслуживающими доверия.
Доктор Надин Лаван, старший преподаватель психологии в Лондонском университете королевы Марии, подчеркнула, насколько легко и дешево ее команда создала эти голосовые клоны.
«Голоса, сгенерированные ИИ, сейчас повсюду, это был лишь вопрос времени, когда технология ИИ начнет производить натуралистичную, человекоподобную речь, процесс требовал минимальных знаний, всего нескольких минут голосовых записей и почти никаких денег», — сказала она.
Она сказала, что простота использования показывает, как далеко продвинулась технология за короткое время.
Такая доступность создает возможности в таких областях, как образование, коммуникация и доступность, где индивидуальные синтетические голоса могут повысить вовлеченность и охват.
Так же, как авторы ИИ поднимают вопросы об оригинальности, авторском праве и неправомерном использовании, генерация голоса ИИ вызывает дебаты о владении личностью и согласии.
Если реалистичное аудио можно создать всего лишь из короткого образца, риски несанкционированного клонирования становится трудно игнорировать.
Поскольку инструменты ИИ продолжают расширять свои возможности и доступность, задача будет заключаться в том, чтобы обеспечить реализацию преимуществ, не открывая новых путей для обмана.
Понимание того, как люди реагируют на эти голоса, — это лишь первый шаг в решении этических, правовых и социальных последствий технологии, которая больше не является футуристической, а прочно вошла в нашу жизнь.
Искусственный интеллект – искусственный пузырь? Экономист бьёт тревогу: крах неизбежен


















