Кроме ИИ-модели Qwen2.5-Max компания Alibaba выпустила Qwen2.5-VL, которая получила значительные улучшения по сравнению с предыдущей версией Qwen2-VL.
Мультимодальная модель Qwen2.5-VL умеет анализировать диаграммы и графики, извлекать данные из бухгалтерских документов, изучать видео длительностью более часа, а также распознавать фрагменты фильмов и сериалов. Кроме того, модель обладает функциями ИИ-агента, подобно OpenAI Operator, например, Qwen2.5-VL запустила приложение на Android и забронировала авиабилеты.
По словам разработчиков, Qwen2.5-VL превзошла OpenAI GPT-4o, Anthropic Claude 3.5 Sonnet и Google Gemini 2.0 Flash в ряде испытаний, включая «понимание» видео, решение математических задач, анализ документов и ответы на вопросы.
ИИ-модель Alibaba Qwen2.5-VL доступна через репозиторий Qwen Chat на платформе HuggingFace.