Стартап Stability AI выпустил новую версию нейросетевой модели преобразования текста в изображение Stable Diffusion XL 1.0 (SDXL) с открытым исходным кодом. Разработчики позиционируют новинку как свою «самую продвинутую» модель на сегодняшний день.
SDXL 1.0 содержит 3,5 млрд. параметров и позволяет создавать изображения с разрешением 1 Мп (720p) за «секунды». Предшествующей модели, Stable Diffusion XL 0.9, на генерацию требовалось больше вычислительной мощности.
По словам компании, новая версия обеспечивает «более яркие» и «точные» цвета и лучшую контрастность, тени и освещение по сравнению с предыдущей версией. Кроме того, SDXL 1.0 получила улучшения в области генерации текста. Из дополнительных функций заявлены восстановление недостающих частей изображения и расширение существующих изображений.
«SDXL 1.0 — кастомизируемая и готова к тонкой настройке в соответствии с концепциями и стилями. Она также проста в использовании, обладает способностью создавать сложные проекты с базовыми запросами на обработку естественного языка», — сказал Джо Пенна (Joe Penna), руководитель отдела прикладного машинного обучения Stability AI.
Модель SDXL 1.0 уже доступна на GitHub в дополнение к API Stability и приложениям Clipdrop и DreamStudio.
Следите за новостями в нашем Telegram-канале: https://t.me/infocity_az