Компания Apple представила инструмент Keyframer на основе искусственного интеллекта, основанный на большой языковой модели (LLM). Нейросеть анимирует статичные изображения по запросу в формате естественного языка.
На данное время существует множество ИИ-генераторов изображений, работающих на основе текстовых описаний, например, Dall-E и Midjourney. Но анимация требует более сложного набора параметров, в том числе продолжительности сцены и координации движения объектов, которые непросто указать в едином описании задачи, поэтому могут потребоваться альтернативные средства, в том числе уточнение команды. Разработчики отмечают, что это удалось достичь в системе Keyframer.
Keyframer создает анимированные иллюстрации из статических двухмерных картинок. Команды обрабатываются нейросетью GPT-4, в качестве исходного изображения используется формат SVG (Scalable Vector Graphic), а на выходе получается анимирующий картинку код CSS. Пользователь может уточнить этот код, отредактировав его вручную или задав дополнительную текстовую команду.
Разработчики Apple продемонстрировали инструмент Keyframer профессиональным дизайнерам по анимации и инженерам и получили положительные отзывы. Они отметили, что подобный инструмент способен сэкономить время, для того, чтобы достичь результата, полученного ИИ, вручную, может уйти несколько часов.