ИИ-модель gpt-realtime от OpenAI обучена понимать речь, не переводя ее в текст

29.08.2025

Компания OpenAI представила передовую голосовую ИИ-модель gpt-realtime, работающей по принципу «speech-to-speech». То есть модель может понимать речь, не переводя ее в текст. Разработчики позиционируют ее как инструмент для голосовых ассистентов и автоматизированных колл-центров.

Вместе с тем gpt-realtime может распознавать интонацию говорящего, определять его эмоции, а также умеет имитировать их. ИИ-модель может говорить на различных языках и переключаться между ними прямо по ходу разговора. По результатам тестирования в бенчмарке MultiChallenge (Audio) gpt-realtime показала 30,5 %, тогда как у предыдущей версии gpt-4o-realtime-preview было 26,5%. В другом тесте, ComplexFuncBench (Audio), модель также обошла предшественницу: 66,5% против 58,9 %.

Кроме того, gpt-realtime поддерживает работу с изображениями. Нейросеть умеет анализировать их и использовать полученную информацию в диалоге. Поддержка MCP позволяет пользователю предоставлять модели доступ к нужной источникам информации, при этом во время поиска gpt-realtime обучена продолжать разговор, чтобы избежать затяжных пауз.

Цена использования gpt-realtime: $32 за миллион входящих токенов и $64 за миллион исходящих токенов.

Предыдущая статья

Microsoft представил первые ИИ-модели собственной разработки для генерации текста и речи

Следующая статья

Genesis GV60 Magma EV-ni təqdim etdi — Tesla və Porsche-yə rəqib yeni elektromobil

НОВОСТИ ПО ТЕМЕ

Пн	Вт	Ср	Чт	Пт	Сб	Вс
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

ИИ-модель gpt-realtime от OpenAI обучена понимать речь, не переводя ее в текст

Microsoft представил три ИИ-модели для генерации текста, голоса и изображений

Alibaba-nın yeni AI modeli Qwen 3.5-Omni video dərsliklərdən istifadə edərək kod yaza bilir

R.I.S.K. Company announces internship program for individuals interested in the field of AI (Artificial Intelligence)

О ЖУРНАЛЕ

ПОДПИШИТЕСЬ НА НАС

ИИ-модель gpt-realtime от OpenAI обучена понимать речь, не переводя ее в текст

Microsoft представил три ИИ-модели для генерации текста, голоса и изображений

Alibaba-nın yeni AI modeli Qwen 3.5-Omni video dərsliklərdən istifadə edərək kod yaza bilir

R.I.S.K. Company announces internship program for individuals interested in the field of AI (Artificial Intelligence)

СОЦИАЛЬНЫЕ СЕТИ

О ЖУРНАЛЕ

ПОДПИШИТЕСЬ НА НАС