Как хорошо справляются с тестами DeepSeek-R1 и ChatGPT o1

deepseek-r1chatgpt o1языковые модели

Как хорошо справляются с тестами DeepSeek-R1 и ChatGPT o1 (Tom Jones, David Crowther)

Как хорошо справляются с тестами DeepSeek-R1 и ChatGPT o1 (Tom Jones, David Crowther)

В конце января 2025 года китайская компания DeepSeek выпустила свою языковую модель DeepSeek-R1 с открытым исходным кодом, которая превосходит o1 от OpenAI в некоторых тестах. За выходом этой модели последовало падение стоимости акций на американском фондовом рынке примерно на триллион долларов. Сильнее всего пострадала компания Nvidia — её капитализация за день упала на 17% или почти 620 миллиардов долларов

На картинке — результаты прохождения моделями тестов по математике, естественным наукам, английскому языку и программированию

Ещё мы писали про возможности и влияние ИИ:

Столбчатая диаграмма сравнивает точность DeepSeek‑R1 (синий) и OpenAI o1 (чёрный) по задачам: математика, кодинг, науки и MMLU.
Сравнение точности DeepSeek‑R1 и OpenAI o1