Топ‑16 LLM в рейтинге Chatbot Arena (май 2023–апр 2024)Рациональные числа18 октября 2025 г.chatbot arenaбольшие языковые моделиllmКак менялся топ-16 больших языковых моделей в рейтинге Chatbot Arena, май 2023 – апрель 2024Как менялся топ-16 больших языковых моделей в рейтинге Chatbot Arena, май 2023 – апрель 2024 (Jianqi Pan) Chatbot Arena — один из самых авторитетных рейтингов больших языковых моделей (LLM). Места в рейтинге определяются в полевых условиях: пользователи общаются с двумя анонимными моделями и голосуют за лучшую. На сайте собрано уже более миллиона голосов. Рейтинг LLM высчитывается по системе ELO, которая применяется также для определения рейтинга игроков в шахматы, шашки или го Жанки Пэн в конце апреля 2024 года опубликовал анимированный топ моделей за последний год. В актуальной на тот момент версии рейтинга лидировала ChatGPT-4-Turbo, но уступила первенство недавно вышедшей ChatGPT-4o Полный рейтинг с подробной статистикой по всем категориям можно посмотреть на сайте. Там же можно решить исход очередной дуэли и повлиять на общий рейтинг, бесплатно воспользовавшись передовыми LLM современности Больше интересных данных из мира нейросетей: — Политическая ориентация 24 крупнейших языковых моделей — Число изображений, сгенерированных 5 популярными нейросетями, по состоянию на август 2023 — Как менялось число параметров у больших языковых моделей, 2018–2023 — Индустрия искусственного интеллекта в числах, 2010–2022 — Как развивалась индустрия генеративного ИИ, 2014–2023 — Как менялись возможности систем ИИ по распознаванию речи и изображений относительно способностей человека, 1998–2020
Как менялся топ-16 больших языковых моделей в рейтинге Chatbot Arena, май 2023 – апрель 2024Как менялся топ-16 больших языковых моделей в рейтинге Chatbot Arena, май 2023 – апрель 2024 (Jianqi Pan) Chatbot Arena — один из самых авторитетных рейтингов больших языковых моделей (LLM). Места в рейтинге определяются в полевых условиях: пользователи общаются с двумя анонимными моделями и голосуют за лучшую. На сайте собрано уже более миллиона голосов. Рейтинг LLM высчитывается по системе ELO, которая применяется также для определения рейтинга игроков в шахматы, шашки или го Жанки Пэн в конце апреля 2024 года опубликовал анимированный топ моделей за последний год. В актуальной на тот момент версии рейтинга лидировала ChatGPT-4-Turbo, но уступила первенство недавно вышедшей ChatGPT-4o Полный рейтинг с подробной статистикой по всем категориям можно посмотреть на сайте. Там же можно решить исход очередной дуэли и повлиять на общий рейтинг, бесплатно воспользовавшись передовыми LLM современности Больше интересных данных из мира нейросетей: — Политическая ориентация 24 крупнейших языковых моделей — Число изображений, сгенерированных 5 популярными нейросетями, по состоянию на август 2023 — Как менялось число параметров у больших языковых моделей, 2018–2023 — Индустрия искусственного интеллекта в числах, 2010–2022 — Как развивалась индустрия генеративного ИИ, 2014–2023 — Как менялись возможности систем ИИ по распознаванию речи и изображений относительно способностей человека, 1998–2020