Google выпустили Gemini 3 Flash — frontier‑интеллект

Мы — AI for Devs: разбираем модели, ИИ‑агентов и инструменты для разработчиков. Делаем практичные гайды, бенчмарки и выкладываем рабочие паттерны — всё, что помогает быстрее строить продукты с LLM. Меньше шума, больше пользы и кода. Подписывайтесь — будет чем прокачать ваш стек.

gemini 3 flashgemini 3 profrontier-модель

По бенчмаркам модель выглядит неожиданно сильно. На GPQA Diamond — 90.4%, на Humanity’s Last Exam — 33.7% без инструментов, а на MMMU Pro — 81.2%, почти на уровне Gemini 3 Pro.

При этом Flash уверенно обходит Gemini 2.5 Pro и конкурирует с крупными frontier-моделями, оставаясь в другом ценовом классе.

Ключевая инженерная фишка — управляемый thinking. На сложных задачах модель может «думать дольше», но в среднем использует на 30% меньше токенов, чем 2.5 Pro, сохраняя более высокое качество.

@ai_for_devs

Скриншот с компоновкой результатов и визуализацией сравнения моделей — макет сравнительного отчёта по бенчмаркам Gemini 3 Flash.
Макет с результатами и сравнением производительности Gemini 3 Flash и других моделей.
Таблица с подробными бенчмарками и числовыми показателями: GPQA Diamond, MMMU Pro и другие метрики для Gemini 3 Flash.
Таблица бенчмарков: Gemini 3 Flash показывает высокие значения на ключевых тестах.
Диаграмма/скаттерплот, показывающая позиционирование Gemini 3 Flash относительно других frontier‑моделей по качеству и цене.
Визуализация позиционирования модели Gemini 3 Flash среди других frontier-моделей.

Читайте так же