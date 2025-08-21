Китайский стартап DeepSeek обновил свою флагманскую ИИ-модель V3. Версия V3.1 уже доступна на сайте, в мобильных приложениях и для загрузки с Hugging Face.

Больше не существует отдельных моделей: «быстрой» V3 и «рассуждающей» R1. V3.1 работает в обоих режимах, также в нее интегрирован веб-поиск – все это снижает затраты на обслуживание модели. Пока что это только для веб-версии и приложений — в API остаются две модели.

DeepSeek V3.1 обладает 685 млрд. параметров и базируется на гибридной архитектуре, обеспечивающей высокую производительность в задачах диалога, рассуждения и программирования. Компания пока не опубликована официальные результаты бенчмарков, но уже появилось достаточно много сторонних тестов. Первые неофициальные тесты показали, что новая модель демонстрирует результаты, сопоставимые с GPT-5 от OpenAI и Claude 4 от Anthropic. В бенчмарке Aider Polyglot, оценивающем LLM в решении сложных задач программирования сразу на нескольких языках, DeepSeek V3.1 набрала 71,6%. При этом задача в среднем стоит $1 против $68 у Claude Opus 4.

Обновление расширяет контекстное окно модели до 128 000 токенов, позволяя ей хранить больше информации при взаимодействии с пользователем. Такой объем соответствует книге примерно на 300 страниц. Отмечается высокая эффективность использования токенов.

Пользователи уже хвалят пониженный расход токенов и выросшую скорость ответа в режиме рассуждений. Есть и отрицательные отзывы: V3.1 стала больше подхалимничать, часто галлюцинирует и иногда переходит на китайский язык.