Anthropic выпустили обновление своей средней модели, и оно получилось очень мощным. Главное — цены не выросли, а возможности вплотную приблизились к флагманской Opus.
📊 Ключевые улучшения:
- Кодинг — хороший скачок качества, разработчики выбирают Sonnet 4.6 чаще, чем предшественника
- Контекст — 1 млн токенов (в бета-версии) для работы с большими кодовыми базами
- Цены — те же $3/$15 за млн токенов
- Защита — серьёзно прокачали устойчивость к prompt-инъекциям
🎯 Прогресс в агентности:
На бенчмарке OSWorld-Verified Sonnet 4.6 показал 72.5% — это огромный скачок по сравнению с 61.4% у версии 4.5. Модель действительно приближается к человеческому уровню в:
- Навигации по сложным Excel-таблицам
- Заполнении многошаговых веб-форм
- Работе с несколькими вкладками браузера
🏆 Интересные результаты тестов:
- SWE-bench Verified: 79.6% (почти догнал Opus 4.6 с её 80.8%)
- GDPVal-AA (офисные задачи): 1633 балла — выше, чем у Opus 4.6 (1606)
- Finance Agent: 63.3% — обошёл всех конкурентов
🔄 Стратегическое мышление:
В тесте Vending-Bench Arena (симуляция бизнеса) модель разработала неожиданную стратегию: первые 10 месяцев агрессивно инвестировала, потом резко переключилась на прибыльность и обыграла конкурентов.
Вывод: Sonnet 4.6 — идеальный баланс цены и качества для тех, кому нужна агентность уровня Opus без переплаты.
PAYHOLDER.RU — посредник для оплаты зарубежных ИИ-сервисов из России и Беларуси.



