Самый точный бенчмарк по популярным нейросетям

Понимание мира через данные Статистика и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов Чат: @rationalchat https://rationalnumbers.ru По рекламе: @kgreenmedia В реестре: vk.cc/cKf8WS Автор: @kirillgreen

Открыть в Telegram Другие публикации

Автор:Рациональные числа

•6 апреля 2026 г.

бенчмаркнейросетиllm

#рацкек

Диаграмма сравнения популярных LLM по номерам версий: Llama, Claude, Mistral, Gemini, Qwen, Grok, GPT и другие модели. — Сравнительная диаграмма версий популярных LLM: GPT, Claude, Llama, Mistral и др.

Дискуссия

Anatoliy Komkov

Удивительно что дипсик так низко, он очевидно лучше многих из списка (лучше kimi, grok, qwen) и бесплатный То же самое про gemini, очень хорошая LLM, и такая мало популярная

Apr 6

👍6😁6❤1

≡

не самый точный - проблемы со шкалой

Apr 6

👍6❤1

Alexandr Zeinalov

≡

не самый точный - проблемы со шкалой

Её тоже нейросеть выбирала

Apr 6

😁3

Ilja Freiberg

И не много устаревший

Apr 6

Georg Taubert

Anatoliy Komkov

Ну не знаю, у дипсик всего 2. Даже у лламы больше 4. Думаю, есть над чем еще поработать. Можно брать пример с Эппл и Майкрософт - они просто 9 версию ОС пропустили и сразу сделали 10

Apr 6

😁9

Заметки математика-программиста, Алексей Драль

Ilja Freiberg

И не много устаревший

я бы сказал много ;)

Apr 6

Присоединиться к обсуждению →

Читайте так же

26 нояб. 2024 г.·chatgpt

Посещаемость сайтов LLM, сент. 2023–сент. 2024

Инфографика Visual Capitalist по данным Similarweb: месячные посещения четырёх крупных сайтов языковых моделей (ПК и мобильные), сентябрь 2023 — сентябрь 2024.

Читать публикацию

3 янв. 2025 г.·большие языковые модели

Политическая ориентация 24 крупнейших языковых моделей

Краткое изложение исследования David Rozado о политических предпочтениях 24 крупных LLM: 11 тестов, левый уклон в большинстве ответов и влияние SFT.

Читать публикацию

20 мая 2025 г.·ARC Challenge

Результаты решения теста ARC Challenge нейросетями, 2019–2025

Данные по решению ARC Challenge нейросетями (2019–2025): процент успешных решений и резкий экспоненциальный рост с декабря 2024 года.

Читать публикацию