Ранее хвалила GPT 5-mini, но с тех пор появилась Gemini 3-flash, и она вне конкуренции. Было параллельно несколько проектов, где была возможность сравнить модели на небольших, но уже показательных тестах. Итак:
Общее качество. Следование инструкции, работа с большим контекстом - гемини просто лучше понимает и обрабатывает задачу и возвращает более уместный результат. Даже со структурированной выдачей.
Математика. Вот такой любопытный инсайт, гемини хорош в математике. 5-mini как семикласник, который никак не может догнать как считать проценты, что там на что умножать и делить, дроби тоже явно не его. И видимо tool calling, ибо code interpreter ему не помог.
Цена. Самое забавное. GPT 5-mini дешевле gemini 3-flash почти в два раза на миллион токенов. Но при medium reasoning/thinking у обеих моделей, 5-mini сжирает токены настолько неэффективно, что становится в 4.5 раза дороже. А качество всё равно ниже.
Такое чувство, что с gemini 3 flash можно делать сценарии нового уровня, с большим “делегированием” модели. Но пока это не подтвердилось кейсами, расскажу.