Топ‑16 LLM в рейтинге Chatbot Arena (май 2023–апр 2024)

Понимание мира через данные Статистика и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов Чат: @rationalchat https://rationalnumbers.ru По рекламе: @kgreenmedia В реестре: vk.cc/cKf8WS Автор: @kirillgreen

llmchatbot arenachatgpt-4o

Jianqi Pan

Chatbot Arena — один из самых авторитетных рейтингов больших языковых моделей (LLM). Места в рейтинге определяются в полевых условиях: пользователи общаются с двумя анонимными моделями и голосуют за лучшую. На сайте собрано уже более миллиона голосов. Рейтинг LLM высчитывается по системе ELO, которая применяется также для определения рейтинга игроков в шахматы, шашки или го

Жанки Пэн в конце апреля 2024 года опубликовал анимированный топ моделей за последний год. В актуальной на тот момент версии рейтинга лидировала ChatGPT-4-Turbo, но уступила первенство недавно вышедшей ChatGPT-4o

Полный рейтинг с подробной статистикой по всем категориям можно посмотреть на сайте. Там же можно решить исход очередной дуэли и повлиять на общий рейтинг, бесплатно воспользовавшись передовыми LLM современности

Больше интересных данных из мира нейросетей:

Скриншот анимированной горизонтальной диаграммы изменений ELO‑рейтинга: цветные полосы и подписи моделей, показывающие движение позиций топ‑моделей LLM за 2023–2024.
Фрейм анимации с изменением позиций моделей в рейтинге Chatbot Arena по системе ELO.
Скриншот таблицы рейтинга Chatbot Arena: ранги, названия моделей, ELO, число голосов, организации и лицензии — подробная сводка по топ‑моделям.
Таблица с позициями, ELO, голосами и организациями моделей на странице Chatbot Arena.