Топ‑16 LLM в рейтинге Chatbot Arena (май 2023

Топ‑16 LLM в рейтинге Chatbot Arena (май 2023–апр 2024)

Понимание мира через данные Статистика и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов Чат: @rationalchat https://rationalnumbers.ru По рекламе: @kgreenmedia В реестре: vk.cc/cKf8WS Автор: @kirillgreen

Открыть в Telegram Другие публикации

Jianqi Pan

Chatbot Arena — один из самых авторитетных рейтингов больших языковых моделей (LLM). Места в рейтинге определяются в полевых условиях: пользователи общаются с двумя анонимными моделями и голосуют за лучшую. На сайте собрано уже более миллиона голосов. Рейтинг LLM высчитывается по системе ELO, которая применяется также для определения рейтинга игроков в шахматы, шашки или го

Жанки Пэн в конце апреля 2024 года опубликовал анимированный топ моделей за последний год. В актуальной на тот момент версии рейтинга лидировала ChatGPT-4-Turbo, но уступила первенство недавно вышедшей ChatGPT-4o

Полный рейтинг с подробной статистикой по всем категориям можно посмотреть на сайте. Там же можно решить исход очередной дуэли и повлиять на общий рейтинг, бесплатно воспользовавшись передовыми LLM современности

Больше интересных данных из мира нейросетей:

Топ‑16 LLM в рейтинге Chatbot Arena (май 2023–апр 2024)

Читайте так же

Рынок API больших языковых моделей, 2023–2025

Гендерный разрыв в отзывах в интернете

Открытые vs закрытые LLM в LiveCodeBench (2023–2025)