🤖 OpenAI совместно с Paradigm запустили EVMbench — бенчмарк для оценки ИИ-агентов в безопасности EVM-контрактов.
📦 В базе — 120 уязвимостей из 40 аудитов, включая кейсы из открытых конкурсов и сценарии аудита Tempo (платежные контракты).
🧠 3 режима проверки:
- 🔎 Обнаружение — полнота аудита
- 🛠 Исправление — фиксы без поломки логики
- 💣 Эксплуатация — атака в песочнице
🤖 GPT-5.3-Codex показал 72,2% в эксплуатации (против 31,9% у GPT-5 полгода назад).
🤖 Но ИИ всё ещё:
- останавливается после первой найденной уязвимости
- с трудом сохраняет функциональность при исправлениях
💰OpenAI выделяет $10 млн API-кредитов на киберзащиту open-source и критической инфраструктуры + расширяет бета агента Aardvark.
Как думаете, заменят ли ИИ аудиторов Web3 — или станут их главным инструментом?
💎@trainingcampton
