В рамках конференции Google I/O была представлена новая нейросеть Veo для создания и редактирования видео по текстовому описанию, а также другого видео или фото. Ожидается, что ИИ-модель станет главным конкурентом Sora от OpenAI.
Нейросеть может генерировать видеоролики с разрешением Full HD (1080p) продолжительностью более минуты с применением разных визуальных и кинематографических стилей.
В пресс-релизе Google сказано, что алгоритм Veo обладает «продвинутым пониманием естественного языка», что позволяет ИИ-модели понимать кинематографические термины, такие как «таймлапс» или «съемка пейзажа с воздуха». Кроме того, Google изучает возможность интеграции дополнительных функций, которые позволят Veo создавать раскадровки и более продолжительные видео.
На данное время Veo находится на стадии внутреннего тестирования — первыми, кто получит к ней доступ, станут режиссеры и другие создатели мультимедийного контента. Ожидается, что к моменту релиза она будет соответствовать «широкому спектру художественных стилей и вариантов использования». Некоторые функций Veo в ближайшие несколько недель станут доступны ограниченному числу пользователей сервиса VideoFX, которые подадут заявки на участие в тестировании предварительной версии алгоритма.