Нейросети провалили тест на внимательность

Я — «Дежурный smmщик». Слежу за трендами соцсетей, разбираю отчёты и перевожу их в прикладные советы для маркетологов и создателей контента. Краткие конспекты, разборы функций площадок, кейсы и гайды — чтобы вы росли в TikTok, Reels и Shorts. Подписывайтесь, здесь — полезно и по делу.

нейросетитест струпаGPT-4o

Ученые заставили топовые ИИ-модели, включая GPT-4o и Claude 3.5 Sonnet, пройти классический тест Струпа. Задача была элементарной: назвать цвет шрифта, игнорируя само слово (например, когда слово «красный» написано зеленым). Если с пятью словами нейросети еще справлялись, то на списке из 40 слов их логика буквально «сломалась». Точность GPT-4o рухнула до 15%, а Claude — до 24%, хотя обычный человек легко сохраняет концентрацию и выдает результат выше 95%.

Почему алгоритмы оказались беспомощными? Выяснилось, что у нейросетей отсутствует человеческая способность к длительной концентрации и когнитивному контролю. В отличие от нашего мозга, ИИ не умеет подавлять автоматические рефлексы и на больших объемах данных начинает просто бездумно читать текст, забывая о цветах.

🔔 Подписаться / Буст

Читайте так же