Китайская компания Robbyant представила LingBot-World — ИИ-генератор игровых миров. По функциональности он напоминает Google Genie 3, но распространяется с открытым исходным кодом.
Нейросеть позволяет создавать интерактивные, игровые миры с минимальной задержкой, фактически превращая картинки или промпты в управляемую среду. В основе сервиса лежит языковая модель Wan2.2 от Alibaba, принимающая на входе как картинки, так и текстовые запросы. Система обеспечивает взаимодействие с частотой 16 fps, позволяя пользователю управлять персонажем и камерой, а не просто смотреть сгенерированное видео.
В отличие от генераторов видео, ИИ изучает причинно-следственные связи и физику объектов, что позволяет ему «взаимодействовать с созданными мирами». В компании отмечают, что LingBot-World обладает динамической закадровой памятью — модель запоминает объекты и то, как они себя ведут даже вне зоны видимости пользователя.
Ознакомиться с примерами генерации можно на сайте разработчиков. Исходный код и веса модели уже опубликованы на GitHub.




