Сегодня, 29 мая, Anthropic представила Claude Opus 4.8 — обновление флагманской модели, которое вышло всего через 41 день после предыдущей версии Opus 4.7. Это заметно быстрее обычного цикла релизов компании. Цена API осталась прежней: $5 за миллион входящих токенов и $25 за исходящие.
Главное изменение — честность, а не мощь
Anthropic сделала акцент не на росте в бенчмарках, а на поведении модели. Opus 4.8 в четыре раза реже, чем предшественник, пропускает ошибки в коде и выдаёт их за готовый результат. Модель чаще признаёт неуверенность в ответах, реже делает неподтверждённые утверждения и лучше оценивает собственный прогресс при длительной самостоятельной работе — то есть ведёт себя скорее как осторожный инженер, а не самоуверенный стажёр.
По бенчмаркам: в SWE-Bench Pro — реальных задачах на исправление багов — модель набрала 69,2% против 64,3% у Opus 4.7. В тесте OSWorld на управление компьютером результат составил 83,4%. В сложной интеллектуальной работе GDPval-AA — 1890 баллов против 1753 у предыдущей версии. Единственная область, где Opus 4.8 пока уступает конкуренту: терминальное программирование, где GPT-5.5 держит 78,2% против 74,6% у Claude. Но разрыв заметно сократился.
Dynamic Workflows: сотни агентов в одной сессии
Вместе с моделью Anthropic запустила функцию Dynamic Workflows для Claude Code — сейчас в режиме research preview для планов Enterprise, Team и Max.
Работает так: вы даёте Claude Code крупную задачу, и система автоматически разбивает её на подзадачи, запускает до 16 параллельных субагентов одновременно и до 1000 агентов на один прогон. По завершении отдельные агенты-верификаторы проверяют результаты и оспаривают выводы — итерации продолжаются до тех пор, пока ответы не сойдутся. До пользователя доходит уже проверенный консолидированный результат.
Практический пример от Anthropic: Claude Code с Opus 4.8 способен проводить масштабную миграцию кодовой базы в проектах на сотни тысяч строк — например, порт на Rust — без постоянного контроля со стороны разработчика.
Контроль усилий и Fast Mode
Пользователи claude.ai и Cowork теперь могут самостоятельно выбирать, сколько ресурсов Claude тратит на задачу. Режим Low — быстрее, меньше расход лимитов. Режим Max — модель думает глубже и чаще, результат качественнее.
Одновременно запустился Fast Mode: примерно в 2,5 раза быстрее при цене втрое ниже стандартного тарифа. Включается в Claude Code командой /fast, API-доступ пока по запросу через менеджера аккаунта или лист ожидания.
Что дальше
Anthropic анонсировала, что в ближайшие недели планирует выпустить модели класса Mythos и Sonnet 4.8 — после прохождения дополнительных проверок безопасности.