Google I/O 2024: основные анонсы по ИИ

Бесплатная версия Журналуса. Полная версия: – на сайте zhurnalus.artlebedev.ru – в боте @designersdigestbot

google i/ogeminiimagen 3

Что нового:

  • Gemini 1.5 Pro — обновлённая флагманская модель с контекстным окном до 2 млн токенов. Это позволяет ей анализировать тексты объёмом до 1500 страниц или суммировать до 100 писем. Вскоре добавится обработка до часа видеоконтента и кода объёмом до 30 тысяч строк. Доступна пользователям с подпиской Gemini Advanced
  • • Gemini 1.5 Flash — обновлённая лёгкая быстрая модель с 1 млн токенов и мультимодальным режимом. Протестировать можно здесь
  • Imagen 3 — обновлённая модель для генерации картинок по текстовому запросу. Лучше понимает промпты и умеет рендерить текст. Выйдет несколько версий под разные задачи
  • Veo — модель для генерации видео (аналог Sora). Способна генерировать видео в разрешении до 1080p и продолжительностью до минуты
  • • Gems — возможность создавать кастомные версии Gemini для разных задач (аналог GPTs)
  • Gemini Nano — лёгкая мультимодальная LLM для Android
  • Gemini Nano добавят в Chrome в ближайшем обновлении от 5 июня 2024 года. Модель будет работать прямо на девайсе пользователя, а разработчики получат доступ через специальные API. Таким образом, владельцам сайтов не придётся платить за облачные LLM
  • PaliGemma 3B — оупенсорсная визуальная модель. Может добавлять субтитры к изображениям и коротким видео, давать визуальные ответы на вопросы, понимать текст на изображениях, обнаруживать и сегментировать объекты и многое другое
  • Gemma 2 — обновлённая оупенсорсная модель для разработчиков, которая основана на Gemini. Выйдет в течение месяца
  • • Новые чипы: TPU v6 Trillium для облачной тренировки ИИ (в 4,7 раза быстрее прошлой версии) и Arm CPU Axion для дата-центров
  • Music AI Sandbox — первая music2music-модель, созданная специально для музыкантов. Умеет дорабатывать семплы, менять стиль и создавать вариации

#статья #новые_технологии

Фото сцены Google I/O 2024: большой экран с несколькими превью-картинками и выступающим докладчиком на фоне конференции.
Презентация Google I/O 2024: демонстрация мультимедиа на большом экране.