В версии Cursor 2.2 появился отдельный режим работы агента, основанный не на угадывании фиксов, а на сборе реальных рантайм-логов и обязательной человеческой верификации.
Работает это следующим образом:
- Агент генерирует несколько гипотез о причинах бага, а не сразу пишет патч
- Сам вставляет логи в код, чтобы проверить свои гипотезы в рантайме
- Как только баг воспроизвелся, разработчик должен его подтвердить
- На основе воспроизведенного бага формируется точечный фикс — обычно 2–3 строки вместо перелопачивания всего проекта
- Финальная проверка тоже через человека: если баг не исчез, агент добавляет больше логов и возвращается на первый шаг
А ещё представили фичу multi-agent judging: при параллельном запуске нескольких агентов система сама выбирает лучшую реализацию и объясняет, почему выбрала именно её.
@ai_for_devs


