Google показала новую видеомодель, способную генерировать сверхреалистичные ролики с физикой, движением и поведением объектов почти на уровне реальной съемки.
Omni работает практически с любым исходником: можно загрузить фотографию, рисунок или просто описать сцену текстом. После этого видео редактируется обычными промптами - модель умеет менять освещение, заменять объекты и аккуратно корректировать детали сцены.
Но главное здесь - работа с контекстом. Gemini Omni не «ломает» весь кадр при изменениях: модель понимает структуру сцены и позволяет точечно редактировать отдельные элементы без пересборки всего ролика.
Похоже, Google всерьез нацелилась занять лидерство в AI-видео 🤩


Дискуссия