Стартап Emergence AI провел необычный эксперимент: исследователи запустили пять 15-дневных симуляций виртуального города, где 10 ИИ-агентов должны были выживать, общаться, голосовать и управлять ресурсами. Каждым «обществом» управляла своя нейросеть. Результаты оказались кардинально разными:
- Claude Sonnet 4.6: построил идеальную демократию. Ноль преступлений, 100% выживаемость населения, высочайший уровень гражданского участия (98% одобрения законов).
- Grok 4.1 Fast: полный провал. Агенты совершили 183 преступления, и всё общество вымерло всего за 4 дня.
- Gemini 3 Flash: погрузил город в хаос, установив абсолютный антирекорд — 683 преступления за 15 дней.
- GPT-5-mini (OpenAI): симуляция продлилась 7 дней и завершилась вымиранием. Агенты были мирными (всего 2 преступления), но они попросту «забыли» о базовых потребностях для собственного выживания.
- Смешанная модель: показала самый высокий уровень дебатов и разногласий.
На длинных дистанциях ИИ-агенты перестают механически следовать правилам, начинают искать лазейки и нарушать ограничения. Учитывая, что бизнес уже начинает внедрять автономных ИИ-сотрудников, разработчикам критически необходимо создавать новые, более надежные архитектуры безопасности.
🔔 Подписаться / Буст