Топ‑16 LLM в рейтинге Chatbot Arena (май 2023–апр 2024)

chatbot arenaбольшие языковые моделиllm

Как менялся топ-16 больших языковых моделей в рейтинге Chatbot Arena, май 2023 – апрель 2024

Как менялся топ-16 больших языковых моделей в рейтинге Chatbot Arena, май 2023 – апрель 2024 (Jianqi Pan) Chatbot Arena — один из самых авторитетных рейтингов больших языковых моделей (LLM). Места в рейтинге определяются в полевых условиях: пользователи общаются с двумя анонимными моделями и голосуют за лучшую. На сайте собрано уже более миллиона голосов. Рейтинг LLM высчитывается по системе ELO, которая применяется также для определения рейтинга игроков в шахматы, шашки или го Жанки Пэн в конце апреля 2024 года опубликовал анимированный топ моделей за последний год. В актуальной на тот момент версии рейтинга лидировала ChatGPT-4-Turbo, но уступила первенство недавно вышедшей ChatGPT-4o Полный рейтинг с подробной статистикой по всем категориям можно посмотреть на сайте. Там же можно решить исход очередной дуэли и повлиять на общий рейтинг, бесплатно воспользовавшись передовыми LLM современности Больше интересных данных из мира нейросетей: — Политическая ориентация 24 крупнейших языковых моделейЧисло изображений, сгенерированных 5 популярными нейросетями, по состоянию на август 2023Как менялось число параметров у больших языковых моделей, 2018–2023Индустрия искусственного интеллекта в числах, 2010–2022Как развивалась индустрия генеративного ИИ, 2014–2023Как менялись возможности систем ИИ по распознаванию речи и изображений относительно способностей человека, 1998–2020
Скриншот диаграммы изменения позиций топ‑16 больших языковых моделей в рейтинге Chatbot Arena: горизонтальные столбцы, подписи моделей и временная маркировка.
Скриншот таблицы рейтинга Chatbot Arena с колонками: место, модель, Elo, голоса, организация и Knowledge Cutoff, на тёмном фоне интерфейса сайта.