OpenAI починила самую раздражающую проблему голосового ChatGPT
Переключение между голосом и текстом стало моментальным — обновление превращает голосовой режим ChatGPT в то, каким он должен был быть с первого дня.
Основные идеи
Мнение автора
Если честно, OpenAI давно стоило перенести голосовой режим прямо в чат — это решение выглядит максимально логичным и удобным. Такое ощущение, что теперь ChatGPT стал гораздо живее, а сам голосовой режим наконец перестал быть игрушкой. Единственный минус — система всё ещё слушает слишком долго, так что автоотключение было бы не просто приятной, а необходимой функцией.
Интересная новость, друзья, ChatGPT внес важные изменения в свой интерфейс и сделал голосовой режим более доступным, чем раньше. Так должно было быть с самого первого дня.
Прошло время с тех пор, как OpenAI представила функцию голосового режима в ChatGPT для своего приложения для смартфонов и веб-интерфейса. Затем, в марте прошлого года, компания добавила возможность общения в режиме реального времени.
При нажатии на значок в виде волны рядом с текстовым полем ChatGPT открывался сферический интерфейс, где можно было общаться с чат-ботом. Эта естественная возможность общения в реальном времени всё ещё существует, но теперь ChatGPT не перенаправляет вас в отдельный интерфейс, а позволяет использовать голосовой режим непосредственно в чате.
Нажмите на значок в виде волны, чтобы использовать голосовую команду, и вы сможете общаться с ChatGPT прямо в чате. Это изменение доступно как в приложении ChatGPT, так и в веб-интерфейсе. Вы можете задаться вопросом: зачем вообще понадобилось такое небольшое изменение?
В сферическом интерфейсе можно было только слушать ChatGPT, но не видеть его расшифровку на экране. Поэтому, если вы не расслышали чётко, что сказал ChatGPT, приходилось выходить из голосового режима, чтобы прочитать расшифровку и узнать ответ. Но теперь, когда голосовые функции перенесли в интерфейс чата, вы можете легко просматривать расшифровку во время общения с ChatGPT.
Чат-бот OpenAI теперь также может отображать информацию в режиме реального времени, такую как карты, прогнозы погоды и многое другое. К сожалению, эта функция сработала не так, как я надеялся. Хотя чат-бот точно описывал погоду в моём районе, функция отображения карты не работала так, как я ожидал.
Когда я запросил карту с лучшими ресторанами в моём районе, вместо интерфейса карты в окне чата мне показали ссылки на маршруты к этим ресторанам, хотя OpenAI в видео на X демонстрировала другое. Я даже сузил свой запрос и попросил показать карту конкретного ресторана, но мне всё равно предоставили ссылку на маршруты к нему. Как ни странно, интерфейс карты появился, когда я использовал ту же команду, что и в видео от OpenAI.
Больше людей будут использовать голосовой режим

Когда голосовой режим ChatGPT только запустился, он казался очень интересной функцией, и пользователи с удовольствием им пользовались. Но со временем люди стали пользоваться им реже, чем в первый раз. Я даже не помню, когда в последний раз использовал его для поиска.
Теперь, когда эта функция стала более доступной после переноса непосредственно в чат, OpenAI надеется, что больше пользователей начнут ею пользоваться. Стоит также отметить, что чем больше пользователей взаимодействуют с этой функцией, тем больше голосовых данных OpenAI получит для обучения своих моделей.
OpenAI, вероятно, окажется в удобном и выгодном положении после переноса голосовых функций в окно чата. К счастью, вы можете запретить OpenAI обучать свои модели ИИ на основе вашего голоса. Вот как это сделать:
- Откройте приложение ChatGPT на смартфоне, нажмите значок «Настроить» в левом верхнем углу, а затем нажмите свое имя, чтобы открыть окно настроек ChatGPT.
- Выберите элементы управления данными.
- Выключите переключатель рядом с опцией «Включить ваши аудиозаписи».
Однако голосовой режим в интерфейсе чата может быть не всем удобнее. Поэтому вы также можете вернуться к предыдущему интерфейсу со сферой. Для этого откройте окно настроек ChatGPT на смартфоне, выберите «Голосовой» и включите переключатель «Раздельный режим». В веб-интерфейсе ChatGPT откройте настройки, выберите «Персонализация», нажмите «Дополнительно» и включите переключатель «Раздельный режим».
Лучший ChatGPT
OpenAI интегрирует голосовой режим в интерфейс чата и, похоже, стремится сделать взаимодействие с чат-ботом более естественным. Теперь вы можете легко переключаться между текстовым и аудиорежимом в рамках одного разговора в ChatGPT. Однако я заметил, что функция голосового режима продолжает слушать вашу речь и реагировать на неё, пока вы вручную не нажмёте кнопку «Завершить».
В результате однажды я воспользовался функцией голосового режима и забыл нажать кнопку завершения разговора. Минут через пять я попросил маму приготовить мне чай, а ChatGPT решил, что я всё ещё с ним разговариваю, и начал рассказывать мне рецепт приготовления чая.
Я очень надеюсь, что OpenAI представит функцию автоматического отключения голосового режима после определённого периода бездействия. Впрочем, у конкурента ChatGPT, Gemini, уже есть похожая функция под названием Gemini Live, которая переключает вас на совершенно новый экран. При этом Gemini уже давно предлагает кнопку транскрипции в правом верхнем углу окна Gemini Live. Она позволяет просматривать транскрипцию и одновременно слышать, что говорит ИИ.
Раньше я активно пользовался Gemini Live на своём Pixel 10, потому что он мог отвечать мне голосом и одновременно отображать расшифровку в режиме реального времени. Теперь, когда эта функция доступна и в ChatGPT, я, пожалуй, перейду на него, поскольку голосовое управление ChatGPT мне нравится больше, чем Gemini Live.
Обзор vivo iQOO 15: новый флагман в гонке мощнейших устройств











