Anthropic выпустила Claude Sonnet 4.5 — лучшую в кодинге и создании ИИ-агентов

Anthropic выпустила Claude Sonnet 4.5 — лучшую в кодинге и создании ИИ-агентов

Anthropic выпустила новую флагманскую модель Claude Sonnet 4.5. Компания заявляет, что это «лучшая в мире модель для кодинга и построения сложных агентов» с заметным ростом в работе «за компьютером» и рассуждениях.

Внутренние тесты и отзывы ранних клиентов отмечают 30+ часов автономной работы — в разы дольше, чем у прошлых версий. Одновременно вышел эксперимент «Imagine with Claude», где ИИ генерирует программное обеспечение на лету прямо в диалоге.


											
							Anthropic выпустила Claude Sonnet 4.5 — лучшую в кодинге и создании ИИ-агентов

Результаты Claude Sonnet 4.5 на бенчмарках

В тестах Sonnet 4.5 обогнал всех конкурентов, включая GPT-5 и Gemini 2.5 Pro, и показал впечатляющую автономность: более 30 часов непрерывной работы без потери качества. Для сравнения: в прошлой версии автономность была около 7 часов.

  • SWE-bench Verified (кодинг): Sonnet 4.5 набрал 77,2% (до 82% с расширенными вычислениями). Это выше, чем у GPT-5 (74,9%) и заметно выше, чем у Gemini 2.5 Pro (63,8%).
  • OSWorld (навыки «работы за компьютером»): у Sonnet 4.5 — 61,4%, тогда как у Sonnet 4 было 42,2%. Модель лучше справляется с браузером, файлами, таблицами и навигацией по системным интерфейсам.


											
							Anthropic выпустила Claude Sonnet 4.5 — лучшую в кодинге и создании ИИ-агентов

Что нового в Claude Sonnet 4.5

Anthropic делает ставку на реальную «производительность ИИ», а не только на умение вести диалог. Sonnet 4.5 не просто отвечает на вопросы, а становится полноценным рабочим агентом: может писать и проверять код, работать с системами и файлами, держать долгие задачи.

Возможности:

  • Код и разработка. Claude научился лучше рефакторить и редактировать проекты, удерживать длинные многошаговые цепочки «план → выполнение → тесты». Это делает его более надёжным инструментом для реальных инженерных задач.
  • Агентность. Теперь Claude может дольше работать в автономном режиме — десятки часов подряд. Это открывает дорогу для использования ИИ в качестве полноценного ассистента-разработчика или оператора внутри компаний.
  • Инструменты для девелоперов. SDK для создания собственных агентов (Claude Agent SDK) и нативное расширение для VS Code, а также поддержка памяти и контекстного редактирования в API.
  • Imagine with Claude. Исследовательский режим, где ИИ генерирует программное обеспечение «на лету»: не только отдельные куски кода, а сразу целые приложения с интерфейсами и логикой. Это шаг в сторону полностью автоматизированной разработки. Функция доступна только подписчикам Max и будет работать ограниченное время.
  • Интеграции. Sonnet 4.5 сразу появился в облаке Amazon Bedrock, что упрощает подключение для корпоративных клиентов.


											
							Anthropic выпустила Claude Sonnet 4.5 — лучшую в кодинге и создании ИИ-агентов

Рынок ИИ активно движется в сторону «агентности». В марте Google показала Gemini 2.5 Pro с сильным кодингом, в августе OpenAI выпустила GPT-5, который тоже сделал упор на SWE-bench. Moonshot AI запустила агентский режим «OK Computer» в чат-боте Kimi.

Теперь Anthropic делает следующий шаг — берёт лидерство на бенчмарках и выводит ИИ в режим длительной автономной работы. Вместе с этим компания расширяет экосистему: весной был представлен Claude Code, позже добавили API для работы с файлами, а теперь — полноценный набор инструментов для создания и деплоя агентов.

Стоимость совпадает с прошлым Sonnet 4. «Imagine with Claude» доступен только подписчикам Max, в тестовом режиме — всего на 5 дней.

Ранее ChatGPT добавил функцию родительский контроль.