Модель теперь должна следовать инструкциям буквально — не интерпретировать, не додумывать и делать именно то, что написано. В длинных агентных задачах (по обещаниям) держится дольше и не ломается по пути.
И самое интересное — сама проверяет результат перед ответом, прежде чем дать его.
У меня сейчас два бота в продакшене.
Первый каждый день перемалывает 216 Telegram-каналов, и Claude в нем фильтрует шум и собирает дайджест.
Второй подключен к часам и весам Garmin: каждые 30 минут забирает данные по сну, HRV, стрессу и Body Battery, в 8:30 присылает одну конкретную рекомендацию на день, при критичных отклонениях — шлет алерты. Этот пока работает с переменным успехом, знали ли бы вы как непросто пробить защиту Garmin и автоматически забирать данные 🤯
Буду тестировать в первую очередь на дайджесте: посмотрю, насколько точнее станут итоговые саммари. По Garmin-боту интереснее всего проверить недельные обзоры — там Claude работает с трендами за 14 дней, и глубина рассуждений должна быть заметна.
Цены не поменяли. А я пошел в настройки 😋


Дискуссия