Ученые заставили топовые ИИ-модели, включая GPT-4o и Claude 3.5 Sonnet, пройти классический тест Струпа. Задача была элементарной: назвать цвет шрифта, игнорируя само слово (например, когда слово «красный» написано зеленым). Если с пятью словами нейросети еще справлялись, то на списке из 40 слов их логика буквально «сломалась». Точность GPT-4o рухнула до 15%, а Claude — до 24%, хотя обычный человек легко сохраняет концентрацию и выдает результат выше 95%.
Почему алгоритмы оказались беспомощными? Выяснилось, что у нейросетей отсутствует человеческая способность к длительной концентрации и когнитивному контролю. В отличие от нашего мозга, ИИ не умеет подавлять автоматические рефлексы и на больших объемах данных начинает просто бездумно читать текст, забывая о цветах.
🔔 Подписаться / Буст
