Как большие языковые модели проходят тест на IQ

Понимание мира через данные Статистика и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов Чат: @rationalchat https://rationalnumbers.ru По рекламе: @kgreenmedia В реестре: vk.cc/cKf8WS Автор: @kirillgreen

языковые моделиIQChatGPT-4o

На первой картинке — распределение результатов решения теста на IQ. Указаны средние результаты последних семи тестов

На второй картинке — результаты ChatGPT-4o на протяжении последнего года. Также на сайте публикуют задачу дня и ответы разных LLM. Под каждой задачей указан текстовый промт, при помощи которого задавали вопрос моделям

Другие наши публикации о том, как ИИ проходят тесты:

График распределения результатов теста IQ от Tracking AI с указанием средних результатов последних семи тестов и значков моделей на кривой распределения.
Распределение результатов решения теста IQ; отмечены средние значения последних семи тестирований.
Линейный график изменения результатов ChatGPT-4o (вербальный) по указанным тестам за год, с сопоставлением с Mensa Norway и офлайн-тестом.
Динамика результатов ChatGPT-4o по IQ в течение года по данным Tracking AI.
Задача дня из Tracking AI: визуальная логическая головоломка 3×3 с вариантами ответа и пометкой правильного ответа, используемая для оценки моделей ИИ.
Пример «задачи дня» и вариант правильного ответа, публикуемый вместе с промтом для моделей.