spot_img
25 февраля, 2025
ДомойAI / MLAnthropic выпустил Claude 3.7 Sonnet – свою первую «рассуждающую модель»

Anthropic выпустил Claude 3.7 Sonnet – свою первую «рассуждающую модель»

Компания Anthropic выпустила Claude 3.7 Sonnet — свою первую ИИ-модель, которая способна «рассуждать», то есть решать задачу пошагово. Также она имеет режим быстрого ответа. Разработчики называют Claude 3.7 Sonnet первой на рынке гибридной размышляющей моделью. По словам компании, модель способна решать более сложные задачи, чем предшественницы, и превосходит их в таких областях, как математика и написание программного кода.

Claude 3.7 Sonnet

Claude 3.7 Sonnet доступна в приложениях Claude и веб-версии чат-бота, в том числе и для бесплатных пользователей, но в ограниченном формате. Взаимодействовать с новой нейросетью также можно через API Anthropic, Amazon Bedrock и Google Cloud’s Vertix AI. Цена, по сравнению с предшественницей 3.5 Sonnet, не изменилась — $3 за миллион входящих токенов и $15 за миллион исходящих токенов, оплате подлежат и токены, затраченные на процесс размышлений модели.

Главное отличие новой версии Claude 3.7 Sonnet – это режим размышлений (reasoning), в котором модель сначала сама для себя разбирает задачу и условия, делает предположения, приходит к выводам и затем уже формирует ответ для пользователя. При использовании API разработчики получают контроль над тем, какой объем размышлений позволит себе модель (это также влияет и на расходы).

Claude 3.7 Sonnet

В задачах по разработке ПО новинка опережает конкурентов: например, в бенчмарке SWE-Bench точность Claude 3.7 Sonnet составила 62,3%, тогда как у o3-mini от OpenAI всего 49,3%. По тестам в других сферах она сопоставима с моделью o1.

Также Anthropic выпустил ИИ-агента Claude Code, который не отвечает на простой запрос пользователя, а получает задание и выполняет цепочку действий для достижения цели.

Claude Code сможет читать код, искать файлы, изменять их, запускать тесты и использовать инструменты командной строки. ИИ получил расширенную интеграцию с GitHub. По заявлению компании, в ходе тестирования Claude Code успешно выполнял задачи, на которые обычно уходит более 45 минут ручной работы. Пока что ИИ-агент работает в экспериментальном режиме.

НОВОСТИ ПО ТЕМЕ

СОЦИАЛЬНЫЕ СЕТИ

11,970ФанатыМне нравится
1,023ЧитателиЧитать
3,086ЧитателиЧитать
713ПодписчикиПодписаться
- Реклама -
- Реклама -
- Реклама -