Как Anthropic решили три проблемы AI‑агентов

Мы — AI for Devs: разбираем модели, ИИ‑агентов и инструменты для разработчиков. Делаем практичные гайды, бенчмарки и выкладываем рабочие паттерны — всё, что помогает быстрее строить продукты с LLM. Меньше шума, больше пользы и кода. Подписывайтесь — будет чем прокачать ваш стек.

Открыть в Telegram Другие публикации

Автор:AI for Devs

•25 ноября 2025 г.

Помните, мы недавно разбирали проблему MCP-серверов: десятки инструментов, тысячи токенов на определения и агенты, которым дурно от огромного контекста? На самом деле это была лишь одна из проблем. Помимо раздувшихся описаний инструментов, модели страдали от неправильного выбора методов, гигантских промежуточных данных и неочевидных паттернов использования API.

Anthropic эти проблемы прекрасно видели — и вместе с релизом Opus 4.5 представили три фичи для работы агентов с инструментами:

1) Tool Search Tool. Вместо загрузки всех MCP-описаний сразу Claude теперь находит нужные инструменты по запросу. Это даёт до 85% экономии токенов на старте и значительно повышает точность выбора инструментов. Внутренние тесты показывают рост MCP-метрик — например, Opus 4.5 поднимается с 79,5% до 88,1%.
2) Programmatic Tool Calling. Одна из самых недооценённых проблем заключалась в том, что все промежуточные результаты попадали в контекст. Логи, транзакции, большие таблицы — всё это раздувало память модели и снижало стабильность. Теперь Claude пишет Python-код, вызывает инструменты изнутри этого кода и видит только финальный результат. Итог: –37% токенов, меньше задержек, сильный рост точности в сложных пайплайнах.
3) Tool Use Examples. Схема говорит, что можно передавать, но не как правильно этим пользоваться. Примеры прямо в определении инструмента решают это: модель понимает форматы дат, структуру вложенных объектов, связи между параметрами и правила эскалации. Точность корректных вызовов растёт с 72% до 90%.

В совокупности эти три нововведения закрывают именно те проблемы, о которых мы говорили раньше: MCP остаётся мощной концепцией, но теперь перегруженность контекста, неверные вызовы и «токсичные» промежуточные данные будут меньше влиять на результат.

И если честно, сейчас это всё выглядит так, будто именно так и должно было быть с самого начала. Но, видимо, если оттачивать каждую деталь до идеала, то за конкурентами не поспеешь — так и живём 🙂

Подробнее тут. @ai_for_devs

Как Anthropic решили три проблемы AI‑агентов

Читайте так же

Шумиха вокруг Opus 4.5 от Anthropic

Anthropic: Claude Code взаимодействует с браузером

Релиз Claude Opus 4.6 — крупное обновление Anthropic