Результаты решения теста ARC Challenge нейросетями, 2019–2025

arc challengeабстрактное мышлениенейросети

Результаты решения теста ARC Challenge нейросетями, 2019–2025 (e/acc)

ARC Challenge (Abstraction and Reasoning Corpus Challenge) оценивает способность ИИ к абстрактному мышлению и обобщению, приближённую к человеческому. Иными ловами, этот тест позволяет оценить, насколько близко нейросеть приблизилась к AGI. На картинках — примеры задач из теста

На диаграмме указан % решения этого теста сильнейшей на тот момент языковой моделью. Примечательно, что с декабря 2024 года рост выглядит экспоненциально

Другие наши публикации о том, как ИИ проходят тесты:

Политическая ориентация 24 крупнейших языковых моделей

Как хорошо справляются с тестами DeepSeek-R1 и ChatGPT o1

Как менялись возможности систем ИИ по распознаванию речи и изображений относительно способностей человека, 1998–2020

Как развивалась индустрия генеративного ИИ, 2014–2023

Диаграмма изменения процента успешного решения теста ARC Challenge нейросетями за 2019–2025 годы с пометками моделей и резким ростом к 2025 году
Примеры задач из набора ARC: цветные пиксельные сцены с фигурными объектами и соответствующими решениями, показывающие абстрактные правила трансформации
Серия входных и выходных клеточных изображений ARC с зелёными и жёлтыми фигурами, иллюстрирующих правила преобразования и предсказание результата
Несколько мини-примеров задач ARC и тепловые/цветовые визуализации преобразований с условным вопросительным знаком для итогового предсказания