Chatbot Arena — один из самых авторитетных рейтингов больших языковых моделей (LLM). Места в рейтинге определяются в полевых условиях: пользователи общаются с двумя анонимными моделями и голосуют за лучшую. На сайте собрано уже более миллиона голосов. Рейтинг LLM высчитывается по системе ELO, которая применяется также для определения рейтинга игроков в шахматы, шашки или го
Жанки Пэн в конце апреля 2024 года опубликовал анимированный топ моделей за последний год. В актуальной на тот момент версии рейтинга лидировала ChatGPT-4-Turbo, но уступила первенство недавно вышедшей ChatGPT-4o
Полный рейтинг с подробной статистикой по всем категориям можно посмотреть на сайте. Там же можно решить исход очередной дуэли и повлиять на общий рейтинг, бесплатно воспользовавшись передовыми LLM современности
Больше интересных данных из мира нейросетей:
- Политическая ориентация 24 крупнейших языковых моделей
- Число изображений, сгенерированных 5 популярными нейросетями, по состоянию на август 2023
- Как менялось число параметров у больших языковых моделей, 2018–2023
- Индустрия искусственного интеллекта в числах, 2010–2022
- Как развивалась индустрия генеративного ИИ, 2014–2023
- Как менялись возможности систем ИИ по распознаванию речи и изображений относительно способностей человека, 1998–2020

