Самый точный бенчмарк по популярным нейросетям

Понимание мира через данные Статистика и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов Чат: @rationalchat https://rationalnumbers.ru По рекламе: @kgreenmedia В реестре: vk.cc/cKf8WS Автор: @kirillgreen

бенчмаркнейросетиllm

#рацкек

Диаграмма сравнения популярных LLM по номерам версий: Llama, Claude, Mistral, Gemini, Qwen, Grok, GPT и другие модели.
Сравнительная диаграмма версий популярных LLM: GPT, Claude, Llama, Mistral и др.

Дискуссия

Anatoliy Komkov
Удивительно что дипсик так низко, он очевидно лучше многих из списка (лучше kimi, grok, qwen) и бесплатный То же самое про gemini, очень хорошая LLM, и такая мало популярная
≡
не самый точный - проблемы со шкалой
Alexandr Zeinalov
не самый точный - проблемы со шкалой
Её тоже нейросеть выбирала
I
И не много устаревший
Georg Taubert
Anatoliy Komkov
Удивительно что дипсик так низко, он очевидно лучше многих из списка (лучше kimi, grok, qwen) и бесплатный То же самое про gemini, очень хорошая LLM, и такая мало популярная
Ну не знаю, у дипсик всего 2. Даже у лламы больше 4. Думаю, есть над чем еще поработать. Можно брать пример с Эппл и Майкрософт - они просто 9 версию ОС пропустили и сразу сделали 10
Заметки математика-программиста, Алексей Драль
Ilja Freiberg
И не много устаревший
я бы сказал много ;)
Присоединиться к обсуждению →

Читайте так же