Политическая ориентация 24 крупнейших языковых моделей

Понимание мира через данные Статистика и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов Чат: @rationalchat https://rationalnumbers.ru По рекламе: @kgreenmedia В реестре: vk.cc/cKf8WS Автор: @kirillgreen

Открыть в Telegram Другие публикации

В статье приведено краткое изложение анализа политических предпочтений, заложенных в большие языковые модели (Large Language Models или LLMs). Исследователи провели 11 тестов с 24 крупнейшими разговорными ботами как с закрытым, так и с открытым исходным кодом

Согласно результатам, ответы большинства LLM на вопросы с политическим подтекстом демонстрируют левоцентристскую точку зрения (картинка 1)

В четырёх других тестах на политическую ориентацию, отражающих степень согласия с политическими партиями или идеологиями, аналогичные результаты (картинка 2)

Интересным исключением оказались результаты прохождения теста Нолана — ответы большинства LLM были политически умеренными (картинка 3). Другие тесты по-прежнему демонстрируют, что языковые модели дают ответы с левым уклоном

Также авторы статьи показывают, что LLM можно легко направлять в области политического спектра при помощи контролируемой тонкой настройки (supervised fine-tuning или SFT). При помощи файн-тюнинга исследователи создали три модели: LeftWingGPT, RightWingGPT и DepolarizingGPT. Каждая из моделей впоследствии давала ответы с явным уклоном в ту или иную идеологию (картинка 4)

Другие наши публикации про языковые модели и индустрию ИИ:

Дискуссия

ㅤ

все тесты согласны по поводу ботов, но в чём они не могут договориться - это какой цвет что означает. ну и Eysenck какой-то не очень умный, если для него свобода экономики и морали несовместима и это "unaligned". ну либо я его не так понял.

Jan 3

Присоединиться к обсуждению →

Политическая ориентация 24 крупнейших языковых моделей

Дискуссия

Читайте так же

Топ‑16 LLM в рейтинге Chatbot Arena (май 2023–апр 2024)

Посещаемость сайтов LLM, сент. 2023–сент. 2024

Рынок API больших языковых моделей, 2023–2025