Что нового:
- • Gemini 1.5 Pro — обновлённая флагманская модель с контекстным окном до 2 млн токенов. Это позволяет ей анализировать тексты объёмом до 1500 страниц или суммировать до 100 писем. Вскоре добавится обработка до часа видеоконтента и кода объёмом до 30 тысяч строк. Доступна пользователям с подпиской Gemini Advanced
- • Gemini 1.5 Flash — обновлённая лёгкая быстрая модель с 1 млн токенов и мультимодальным режимом. Протестировать можно здесь
- • Imagen 3 — обновлённая модель для генерации картинок по текстовому запросу. Лучше понимает промпты и умеет рендерить текст. Выйдет несколько версий под разные задачи
- • Veo — модель для генерации видео (аналог Sora). Способна генерировать видео в разрешении до 1080p и продолжительностью до минуты
- • Gems — возможность создавать кастомные версии Gemini для разных задач (аналог GPTs)
- • Gemini Nano — лёгкая мультимодальная LLM для Android
- • Gemini Nano добавят в Chrome в ближайшем обновлении от 5 июня 2024 года. Модель будет работать прямо на девайсе пользователя, а разработчики получат доступ через специальные API. Таким образом, владельцам сайтов не придётся платить за облачные LLM
- • PaliGemma 3B — оупенсорсная визуальная модель. Может добавлять субтитры к изображениям и коротким видео, давать визуальные ответы на вопросы, понимать текст на изображениях, обнаруживать и сегментировать объекты и многое другое
- • Gemma 2 — обновлённая оупенсорсная модель для разработчиков, которая основана на Gemini. Выйдет в течение месяца
- • Новые чипы: TPU v6 Trillium для облачной тренировки ИИ (в 4,7 раза быстрее прошлой версии) и Arm CPU Axion для дата-центров
- • Music AI Sandbox — первая music2music-модель, созданная специально для музыкантов. Умеет дорабатывать семплы, менять стиль и создавать вариации
#статья #новые_технологии
