Релиз Claude Opus 4.6 — крупное обновление Anthropic
Claude Opus 4.6 от Anthropic: контекстное окно до 1 млн токенов, улучшения в агентном программировании и бенчмарках против GPT-5.2; доступно в Claude и RouterAI.

Мы — AI for Devs: разбираем модели, ИИ‑агентов и инструменты для разработчиков. Делаем практичные гайды, бенчмарки и выкладываем рабочие паттерны — всё, что помогает быстрее строить продукты с LLM. Меньше шума, больше пользы и кода. Подписывайтесь — будет чем прокачать ваш стек.
Claude Opus 4.6 от Anthropic: контекстное окно до 1 млн токенов, улучшения в агентном программировании и бенчмарках против GPT-5.2; доступно в Claude и RouterAI.

Анонс партнёрства с Veai — российской командой, создающей AI‑агента для разработчиков; доступен бесплатный 30‑дневный период.

Разбор работы Anthropic: деление ошибок LLM на bias и variance, влияние на агентные цепочки и непредсказуемость поведения.

80B MoE-модель Qwen3‑Coder‑Next: 3B активных параметров, контекст 256K, локальный запуск (46 ГБ ОЗУ, 85 ГБ для 8‑бит). Модель на Hugging Face.

Короткий обзор десктопного Codex от OpenAI: визуальный доступ к Skills, IDE‑фишки и бета‑планирование автоматизаций; временно открыт бесплатный доступ для Free и Go.
В логах Vertex AI найден id claude-sonnet-5@20260203; инсайдеры прогнозируют SWE-Bench 82.1%, прежние цены и контекст в 1 млн токенов.

Краткий разбор работы 2020 года о scaling laws: качество LLM растёт при синхронном масштабировании модели, данных и вычислений; есть практические ограничения.

Короткая заметка о релизах: Kimi K2.5 дообучена на ~15 трлн визуально‑текстовых токенов с фокусом на код и визуальный контекст; Agent Swarm оркестрирует до 100 субагентов.
Anthropic опубликовали тестовое задание по оптимизации производительности виртуальной машины: старт 147 734 такта, лучшие результаты Opus 4.5 около 1363 тактов.
Краткий разбор исследования Anthropic «The Assistant Axis»: пространство персон в Gemma 2, Qwen 3 и Llama 3 и как ось ассистентности влияет на поведение моделей.

Краткий обзор слухов о GPT‑5.3 (кодовое имя Garlic): упоминания партнёрства с Cerebras и скорость до ~2 000 ток/с для кодинга.

Ollama v0.14+ получила совместимость с Anthropic Messages API — Claude Code запускается на локальных моделях (gpt-oss:20b, qwen-coder, glm-4.7), поддерживаются streaming и vision.
