Вчера обновили Qwen3-Max-Thinking, но без особо серьёзных новвоведений. А сегодня первой громко отметилась Kimi K2.5.
Модель дообучили на ~15 трлн визуально-текстовых токенов, она изначально мультимодальная и без разделения «текст отдельно, картинки отдельно». Основной упор — код, в том числе с визуальным контекстом: image/video-to-code, визуальный дебаг, восстановление интерфейсов по скринкастам.
В инженерных задачах K2.5 тестируют на SWE-Bench (включая multilingual) и внутренних end-to-end сценариях — сборка, рефакторинг, отладка.
Отдельно показали Agent Swarm: модель сама оркестрирует до 100 субагентов и до 1 500 инструментальных шагов, что даёт ускорение до 4.5× по времени выполнения.
@ai_for_devs


