Китайская компания Alibaba выпустила новую версию модели искусственного интеллекта Qwen 2.5-Max, которая отличается улучшенной производительностью и точностью, способна лучше справляться с задачами, требующими глубокого понимания контекста, таких как анализ текста, перевод и генерация контента. Модель основана на архитектуре Mixture-of-Experts (MoE) и обучена на более чем 20 трлн. токенов.
По словам представителей компании, «Qwen2.5-Max демонстрирует значительный прогресс в обработке сложных запросов и предоставлении релевантных ответов».
Qwen2.5-Max была протестирована в ряде ключевых бенчмарков, включая MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard. Модель показала превосходство над DeepSeek V3 в таких тестах, как Arena-Hard, LiveBench и LiveCodeBench, а также продемонстрировала конкурентоспособные результаты в MMLU-Pro. Qwen2.5-Max также показала лидирующие позиции в сравнении с другими ведущими моделями, такими как GPT-4o и Claude-3.5-Sonnet.
Компания планирует интегрировать Qwen2.5-Max в свои облачные сервисы, что позволит клиентам использовать инструмент для решения широкого спектра задач, включая автоматизацию обработки данных, улучшение взаимодействия с клиентами через чат-ботов и оптимизацию бизнес-процессов.
ИИ-модель Qwen2.5-Max доступна через сервис Qwen Chat на HuggingFace.