Компания Google выпустила Imagen 2, продвинутую модель для генерации изображений по текстовым запросам. Система доступна как в составе чат-бота Bard, так и отдельным сервисом ImageFX на платформе AI Test Kitchen (необходима регистрация).
ИИ-модель не полагается на определенные стили, которые усвоила в процессе обучения, а потому может легко изменять изображения и гибче подстраиваться под запрос пользователя.
Ранее в Bard не было генератора изображений, в отличие от Bing, у которого есть Bing Image Creator и Midjourney. Теперь в основе чат-бота лежит большая языковая модель Gemini Pro — она была представлена еще в декабре прошлого года, но до настоящего момента работала лишь у небольшой части пользователей. На данное время Gemini Pro доступна более чем на 40 дополнительных языках в 230 странах и территориях. В Bard ИИ-модель Imagen 2 доступна бесплатно в отличие от ChatGPT Plus, где требуется платная подписка для генерации фотореалистичных изображений в различных стилях.
В Google подчеркнули, что созданные сервисом ImageFX изображения маркируются как созданные ИИ посредством метаданных и цифровых водяных знаков SynthID. В поиске Google они будут помечаться соответствующим образом.