Результаты решения теста ARC Challenge нейросетями, 2019–2025

Понимание мира через данные Статистика и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов Чат: @rationalchat https://rationalnumbers.ru По рекламе: @kgreenmedia В реестре: vk.cc/cKf8WS Автор: @kirillgreen

ARC ChallengeнейросетиAGI

ARC Challenge (Abstraction and Reasoning Corpus Challenge) оценивает способность ИИ к абстрактному мышлению и обобщению, приближённую к человеческому. Иными ловами, этот тест позволяет оценить, насколько близко нейросеть приблизилась к AGI. На картинках — примеры задач из теста

На диаграмме указан % решения этого теста сильнейшей на тот момент языковой моделью. Примечательно, что с декабря 2024 года рост выглядит экспоненциально

Другие наши публикации о том, как ИИ проходят тесты:

Диаграмма времени: процент успешных решений ARC Challenge разными моделями с 2019 по 2025, виден экспоненциальный рост после декабря 2024 года.
Диаграмма: процент решений ARC Challenge сильнейшими языковыми моделями по времени.
Несколько примеров задач ARC: чёрно-серые сетки с цветными областями и значком вопроса — иллюстрации входных и ожидаемых выходных решений.
Примеры задач ARC с исходными и целевыми паттернами в цветных и чёрно-белых решётках.
Последовательности преобразований в задачах ARC: зелёные и жёлтые пиксельные паттерны с указанием шага преобразования и итогового вопроса.
Превращение пиксельных паттернов: примеры шаговых трансформаций и итоговое задание.
Несколько панелей с разными AR C–задачами и их решениями в виде цветных схем и тепловых карт, демонстрация типов задач теста.
Различные типы задач ARC: шаблоны, тепловые карты и примерные ответы.