Компания OpenAI начала развертывание долгожданной функции «расширенного голосового режима» для подписчиков ChatGPT Plus и бизнес-пользователей ChatGPT Team. Пользователи тарифов Enterprise и Edu могут начать использование функции уже на следующей неделе.
Advanced Voice is rolling out to all Plus and Team users in the ChatGPT app over the course of the week.
While you’ve been patiently waiting, we’ve added Custom Instructions, Memory, five new voices, and improved accents.
It can also say “Sorry I’m late” in over 50 languages. pic.twitter.com/APOqqhXtDg
— OpenAI (@OpenAI) September 24, 2024
«Расширенный голосовой режим» делает общение с ИИ более естественным, плавным и быстрым. Чат-бот лучше понимает акценты, способен прерывать речь и сразу переключаться на другую тему, а также запоминать разговоры для дальнейшего использования. Впервые функция была анонсировала OpenAI в мае на мероприятии, посвященном обновленной модели искусственного интеллекта GPT-4o. Компания решила отложить ее запуск на несколько месяцев, так как были выявлены некоторые потенциальные проблемы, касающиеся безопасности. Функция, подверглась критике за голос, похожий на голос Скарлетт Йоханссон. Но уже в июле она стала доступна ограниченному числу клиентов ChatGPT Plus.
Теперь OpenAI заявила, что продукт не сможет имитировать речь других людей и соответственно, создавать фейки. В рамках расширенного развертывания добавляется пять новых голосов, общее число голосов, которые пользователи могут выбрать, составляет девять. Также в целях безопасности, добавлены фильтры, гарантирующие, что алгоритм может определять и отклонять некоторые запросы на создание музыки или других форм аудио, нарушающие авторские права.
Голосовой помощник ChatGPT пока что не получил ряд возможностей, которые изначально анонсировала OpenAI. В частности, отсутствует заявленная ранее функция компьютерного зрения, позволяющая при помощи камеры смартфона пользователя взаимодействовать с чат-ботом.