Как хорошо справляются с тестами DeepSeek-R1 и ChatGPT o1

Понимание мира через данные Статистика и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов Чат: @rationalchat https://rationalnumbers.ru По рекламе: @kgreenmedia В реестре: vk.cc/cKf8WS Автор: @kirillgreen

deepseek-r1ChatGPT o1Nvidia

В конце января 2025 года китайская компания DeepSeek выпустила свою языковую модель DeepSeek-R1 с открытым исходным кодом, которая превосходит o1 от OpenAI в некоторых тестах. За выходом этой модели последовало падение стоимости акций на американском фондовом рынке примерно на триллион долларов. Сильнее всего пострадала компания Nvidia — её капитализация за день упала на 17% или почти 620 миллиардов долларов

На картинке — результаты прохождения моделями тестов по математике, естественным наукам, английскому языку и программированию

Ещё мы писали про возможности и влияние ИИ:

Диаграмма сравнения DeepSeek‑R1 (синий) и OpenAI o1 (чёрный): результаты по математике, наукам, английскому и программированию.
График процентильных результатов DeepSeek‑R1 и ChatGPT o1 по шести тестам (AIME, Codeforces, GPQA, MATH‑500, MMLU, SWE‑bench).