Компания Google на I/O 2024 представила ИИ-ассистента Gemini Live, который во многом напоминает представленную накануне модель GPT-4o от OpenAI. ИИ ведет плавный и естественный диалог с пользователем, быстро делая логические выводы без каких-либо задержек или ошибок. Gemini Live может понимать сложные запросы, генерировать соответствующие и информативные ответы и даже участвовать в увлекательных беседах.
Кроме того, ИИ-модель не только даст ответы на вопросы, но и расскажет, что видит вокруг, определяя объекты через камеру в режиме реального времени. Причем речь не только про камеру смартфонов, но и очки. Не исключено, что Gemini Live однажды заменит уже привычного Google Ассистента.
Технические инновации, используемые в Gemini Live, частично связаны с проектом Project Astra, новой инициативой DeepMind по созданию приложений и «агентов» на базе ИИ с поддержкой «понимания» в реальном времени различных источников данных — текста, аудио и изображения.
Gemini Live первое время будет доступна только для подписчиков Google One AI Premium, в котором доступен чат-бот Gemini Advanced, а ближе к концу 2024 года доступ будет открыт для всех пользователей.