Anthropic представила динамические рабочие процессы для Claude Code

ии-стартап Anthropic AI

Компания Anthropic выпустила Claude Opus 4.8 и отдельно представила для Claude Code функцию динамических рабочих процессов.

Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the ability to work independently for longer than its predecessors.

Available today at the same price. pic.twitter.com/EufxL7T1kb

Инструмент позволяет ИИ самому писать оркестрационные скрипты, запускающие десятки или сотни параллельных субагентов, и проверять работу до передачи результата пользователю.

Он рассчитан на сложные задачи в крупных кодовых базах: аудит безопасности, поиск ошибок, миграция между фреймворками и языками программирования, модернизация проектов.

Функция доступна в режиме предварительного тестирования в интерфейсе командной строки Claude Code, настольной версии и расширении для VS Code, через API, а также в Amazon Bedrock, Vertex AI и Microsoft Foundry.

Запустить режим можно прямой командой на создание рабочего процесса или через ultracode. Он повышает уровень вычислительных усилий до максимального и позволяет модели самостоятельно решать, когда задействовать многошаговую схему.

В Anthropic предупредили: динамические рабочие процессы потребляют существенно больше токенов, чем стандартная сессия Claude Code.

Модель разбивает задачу на подзадачи, распределяет их между параллельными агентами, затем объединяет выводы после взаимной проверки и попыток опровергнуть найденные решения.

В качестве примера Anthropic привела перенос Bun с языка программирования Zig на Rust. Разработчик Джаред Самнер использовал динамические рабочие процессы для генерации около 750 000 строк Rust-кода. Порт добился прохождения 99,8% существующего набора тестов, а путь от первого коммита до слияния занял 11 дней. При этом Anthropic уточнила, что версия пока не используется в продакшене.

Показатели новой модели Opus 4.8:

  • 69,2% в SWE-Bench Pro;
  • 49,8% в Humanity’s Last Exam без инструментов и 57,9% с ними;
  • 83,4% в OSWorld-Verified;
  • 1890 баллов в GDPval-AA;
  • 53,9% в Finance Agent v2.

В Terminal-Bench 2.1 Opus 4.8 уступила GPT-5.5 — 74,6% против 78,2%.

В Anthropic заявили, что Opus 4.8 стала заметно «честнее» при выполнении агентных задач: модель чаще указывает на неопределенность, реже заявляет о неподтвержденном прогрессе и лучше замечает проблемы в собственном коде до передачи результата пользователю.

Напомним, в мае Anthropic опубликовала первый отчет по Project Glasswing — программе поиска уязвимостей с помощью модели Claude Mythos.

Источник: https://forklog.com/news/ai/anthropic-predstavila-dinamicheskie-rabochie-protsessy-dlya-claude-code

Наверх