Разработчики из компании Alibaba представили новую модель генерации изображений Z-Image с открытым исходным кодом, которая создает реалистичные изображения. На выбор доступно три версии:
- Z-Image-Turbo: быстро создает изображения, может добавлять текст сразу на двух языках (английский и китайский). Модель обучают также русскому, немецкому, французскому и испанскому языкам, но на них она пока пишет с ошибками;
- Z-Image-Base: базовая модель, которая лучше всего справляется с созданием изображений, раскрывая все возможности генератора;
- Z-Image-Edit: специальная версия, созданная для редактирования изображений.

На данное время пользователям доступна только Z-Image-Turbo. В глобальном рейтинге Text-to-Image модель заняла четвертое место, уступив только Seedream 4, Nano Banana и Nano Banana Pro. Z-Image-Turbo поддерживает рассуждение, благодаря чему может искать и проверять информацию перед созданием изображений.
Модель доступна в бесплатной демоверсии на HuggingFace. Код и веса Z-Image Turbo выложили на GitHub, HuggingFace и ModelScope. Для использования требуется видеокарта с 16 Gb видеопамяти.





