Granite 4: IBM — маленькие, шустрые LLM
Краткий обзор Granite-4.0: micro/tiny/small модели IBM с Mamba‑архитектурой, 128K контекстом и впечатляющими RAG/IF‑Eval бенчмарками.
Краткий обзор Granite-4.0: micro/tiny/small модели IBM с Mamba‑архитектурой, 128K контекстом и впечатляющими RAG/IF‑Eval бенчмарками.
Ollama запустила встроенный web-search через REST API с интеграцией в Python/JS SDK и MCP; есть generous free tier, детали в блоге и документации.
Короткий обзор GPT-5.2: результаты по кодингу, долгому контексту и tool-calling, доступность в ChatGPT и ориентиры цены от OpenAI.
Anthropic открыл Agent Skills — стандарт для переносимых агентных workflows; в каталоге на claude.com есть навыки от Notion, Canva, Figma и др.
Anthropic представила Claude Haiku 4.5 — в три раза дешевле и в два раза быстрее Sonnet 4; доступна через Claude.ai, API, AWS Bedrock, Vertex AI и Copilot.
Ollama v0.14+ получила совместимость с Anthropic Messages API — Claude Code запускается на локальных моделях (gpt-oss:20b, qwen-coder, glm-4.7), поддерживаются streaming и vision.
Codex‑Mini — облегчённая версия GPT‑5-Codex: в ~4 раза больше запросов при небольшой потере точности; повышенные лимиты для Plus, Business и Edu.
Дискуссия на Cursor: пользователи называют «агентные» ИИ маркетингом — модели теряют контекст и не выполняют простые инструкции, требуя .md и MCP-структуры.
Anthropic выпустил Claude Sonnet 4.5: топ на SWE-bench, рост точности на OSWorld до 61%, новые функции для кода и Agent SDK; доступна в API.
Cowork от Anthropic даёт Claude доступ к файловой системе — чтение, правка и создание файлов; есть коннекторы, skills и параллельные задачи. Отмечены риски: удаление файлов и prompt injection.
OpenRouter тестирует Sherlock Dash Alpha и Sherlock Think Alpha с контекстом 1,84 млн токенов; вероятно это обновлённый Grok 4, релиз — конец ноября–начало декабря.
Обновление Gemini CLI добавило PTY‑оболочку: интерактивный терминал с поддержкой vim, top, git rebase и корректными цветами терминала.
Google запустил Gemini CLI Extensions — фреймворк для подключения внешних инструментов к Gemini CLI; интеграции с Dynatrace, Figma, Cloud Run и публичный каталог.
Gemini 2.5 Computer Use — модель Google, которая управляет UI: клики, ввод, скриншоты в цикле; превью через Gemini API, Google AI Studio и Vertex AI.
Дайджест с ключевыми ссылками недели: GPT-5-Codex, Grok 4 Fast, обсуждение AI и подростков, безопасность AI-ассистентов.
Anthropic опубликовали тестовое задание по оптимизации производительности виртуальной машины: старт 147 734 такта, лучшие результаты Opus 4.5 около 1363 тактов.
Краткий разбор внутреннего исследования Anthropic: 132 инженера, 53 интервью и 200 000 сессий Claude Code — выводы по продуктивности, навыкам и ролям.
Короткий разбор подхода Anthropic: разделение ролей (Initializer, Coding Agent), строгие JSON‑требования и E2E‑тесты через Puppeteer для стабильной длительной работы агентов.
Короткий обзор TOON — компактная запись JSON, дающая ~30–60% экономии токенов и улучшенную предсказуемость LLM; есть CLI и TypeScript‑библиотека.
Кейс реверса Codex CLI и трюки Саймона Уиллиссона: как в Codex CLI через codex prompt вызвать GPT-5‑Codex‑Mini и получить SVG‑пеликана.