Компания OpenAI сообщила, что запустила голосовой интерфейс Advanced Voice Mode в веб-версии сервиса ChatGPT. Расширенный голосовой режим доступен только платным пользователям ChatGPT, владельцам подписок Plus, Enterprise, Teams или Edu. Владельцы подписок Plus и Team могут использовать Advanced Voice Mode только определенное количество времени в сутки. Система уведомит, когда у пользователя останется последние 15 минут ежедневного доступа к голосовому общению с ИИ-ботом.
Ранее голосовой интерфейс Advanced Voice Mode был добавлен в мобильной версии ChatGPT для iOS и Android, теперь же расширенные аудиовозможности ИИ можно протестировать прямо в браузере.
Advanced Voice Mode использует аудиовозможности ИИ-модели GPT-4o, предлагая естественное общение в реальном времени между пользователем и ChatGPT. Чат-бот способен распознавать в голосе своего собеседника даже не совсем очевидные признаки, вроде эмоционального окраса или темпа речи. Таким образом, создается эффект естественного разговора.
Для начала разговора в веб-версии чат-бота необходимо выбрать значок «Голос» в правом нижнем углу у поля ввода запросов к ChatGPT. Предварительно необходимо предоставить доступ к микрофону устройства. Функция предлагает на выбор один из девяти голосов для ChatGPT, каждый из которых имеет свой собственный тон и характер.
По словам директора по продуктам OpenAI Кевина Вейля (Kevin Weil), компания планирует «в ближайшие недели» внедрить голосовой формат общения с ChatGPT и для бесплатных пользователей.