Google выкатила обновлённые Gemini 2.5 Flash и Flash-Lite

Мы — AI for Devs: разбираем модели, ИИ‑агентов и инструменты для разработчиков. Делаем практичные гайды, бенчмарки и выкладываем рабочие паттерны — всё, что помогает быстрее строить продукты с LLM. Меньше шума, больше пользы и кода. Подписывайтесь — будет чем прокачать ваш стек.

googlegeminigemini 2.5

На днях Google выкатил обновлённые версии своих моделей — Gemini 2.5 Flash и 2.5 Flash-Lite.

Что улучшили?

  • 🟣 Flash-Lite теперь заметно умнее и экономичнее. Модель лучше выполняет сложные инструкции и системные подсказки, перестала писать лишние слова (а значит, тратит меньше токенов и работает быстрее), а ещё прокачала мультимодальные возможности — лучше распознаёт речь, понимает картинки и точнее переводит. Google заявляет, что количество выходных токенов снизили на 50%, а значит — дешевле ответы и ниже задержка.
  • 🟣 Flash подтянули в других местах. Во-первых, модель научили эффективнее пользоваться инструментами, что особенно важно для сложных агентных сценариев. На бенчмарке SWE-Bench Verified она прыгнула с 48,9% до 54%. Во-вторых, сделали работу с включённым «thinking» более экономичной: теперь ответы такого же (а то и лучшего) качества, но с меньшими затратами токенов.

Первые отзывы уже есть: Йичао «Peak» Цзи из Manus (они делают автономных AI-агентов) сказал, что у них получилось получить +15% производительности на длинных агентных задачах, а экономичность позволила масштабироваться сильнее, чем раньше.

Обе модели пока в preview, но доступны всем и уже есть на openrouter.

Источник Google: Gemini 2.5 Flash Lite Preview 09-2025 на openrouter Google: Gemini 2.5 Flash Preview 09-2025 на openrouter

@ai_for_devs

График сравнения производительности и задержки моделей: точечный график с подписью 'intelligence vs. end-to-end response time' и отметками для Gemini 2.5 Flash.
Сравнение производительности и задержки моделей (Gemini 2.5 Flash и прочие).
Столбчатая диаграмма эффективности выходных токенов: сравнение Gemini 2.5 Flash и Flash-Lite с предыдущими версиями по числу токенов и стоимости.
Уменьшение выходных токенов и снижение стоимости у Gemini 2.5 Flash / Flash-Lite.

Читайте так же