Qwen устроили день релизов и за пару часов выложили 3 модели, которые сразу ворвались в топы.
- ❤️Qwen3-TTS-Flash
- — Самая стабильная модель для генерации речи из текста.
- — 14 голосов, 10 языков (есть русский).
- — Задержка — всего 97 мс.
- ❤️Qwen-Image-Edit-2509
- — Редактирует и смешивает несколько изображений.
- — Сохраняет лица, объекты и контекст.
- — Есть встроенный ControlNet для точечного контроля поз.
- ❤️Qwen3-Omni
- — Мультимодальная модель, которая обрабатывает текст, изображения, аудио и видео.
- — Заняла первое место в 22 из 36 бенчмарков.
- — Поддерживает 119 языков.
- — Обрабатывает аудио длиной до 30 минут с задержкой 211 мс.
👍 Все нейронки работают полностью бесплатно и без ограничений.
