Компания Google представила Gemini 3.5 Live Translate – ИИ-модель, предназначенную для голосового перевода в режиме реального времени. В ближайшее время нейросеть интегрируют в «Google Переводчик» на iOS и Android, позднее она появится в Google Meet. При подключении любых наушников система будет транслировать переведенную речь напрямую собеседнику.
Нейросеть способна автоматически распознавать более 70 языков, она генерирует перевод, сохраняя оригинальную интонацию, темп и высоту голоса спикера. В отличие от систем, ожидающих окончания фразы, Gemini 3.5 Live Translate обрабатывает аудиопоток синхронно. Задержка между оригинальной репликой и переводом составляет несколько секунд, благодаря чему диалог идет естественно. Кроме того, модель адаптирована к работе в шумных условиях и не требует ручной настройки дополнительных параметров. В целях безопасности и борьбы с дезинформацией все сгенерированные аудиозаписи маркируются невидимым цифровым водяным знаком SynthID.
Для владельцев устройств на базе Android также предусмотрен специальный «Режим прослушивания» (listening mode), позволяющий приложению переводить речь без дополнительных аксессуаров через динамик смартфона. Эта функция может быть полезна в ситуациях, когда «нужно быстро услышать перевод, не привлекая внимания окружающих, и под рукой нет наушников».
Для разработчиков модель Gemini 3.5 Live Translate уже доступна в формате публичной предварительной версии через Gemini Live API и Google AI Studio.







