RedCodeAgent: автоматическое red‑teaming для кодовых агентов
Обзор Microsoft RedCodeAgent — автоматический агент для red‑teaming кодовых агентов; выявил 82 уникальные уязвимости в OpenCodeInterpreter.

Мы — AI for Devs: разбираем модели, ИИ‑агентов и инструменты для разработчиков. Делаем практичные гайды, бенчмарки и выкладываем рабочие паттерны — всё, что помогает быстрее строить продукты с LLM. Меньше шума, больше пользы и кода. Подписывайтесь — будет чем прокачать ваш стек.
Обзор Microsoft RedCodeAgent — автоматический агент для red‑teaming кодовых агентов; выявил 82 уникальные уязвимости в OpenCodeInterpreter.

Codex‑Mini — облегчённая версия GPT‑5-Codex: в ~4 раза больше запросов при небольшой потере точности; повышенные лимиты для Plus, Business и Edu.

Анонс Kimi K2 Thinking: open source‑модель с поддержкой INT4, до 300 шагов рассуждений и рекордными результатами на Humanity's Last Exam, BrowseComp и SWE-Bench.

OpenAI названа самой быстрорастущей бизнес‑платформой: свыше 1 млн бизнес‑клиентов, ChatGPT for Work — 7 млн рабочих мест; упоминания Booking, Cisco, Lowe’s.
Краткий обзор двух исследований по AI‑безопасности: «Rule of Two» от Meta и масштабные атаки на защиты prompt injection (успешность >90%).

Claude Code от Anthropic помог найти ошибку в Go‑реализации ML‑DSA: модель указала на «high bits» и подсказала идею автозапуска LLM при падении тестов.
Краткий обзор Cline v3.35: нативные вызовы инструментов, обновлённое меню и новая модель MiniMax M2 (бесплатно до 7 ноября).
Короткая заметка про Aardvark от OpenAI — агента на GPT-5 для поиска уязвимостей в репозиториях и подтверждения багов в изолированной среде.

Cursor 2.0 с multi-agent, встроенным браузером в IDE и Voice Mode; Composer — новая agentic‑LLM в 4× быстрее с ценой, сопоставимой с GPT‑5.
Минимизация: MiniMax-M2 от MiniMaxAI — MoE-модель 10B для кода и агентов, опережающая Grok 4 Fast и Gemini 2.5 Pro по ряду бенчмарков.

GitHub описал кастомный стек для Copilot: +20% сохранённых символов, +12% acceptance, 3× пропускная способность; обучение на 10 млн репозиториев.

Краткий обзор ChatGPT Atlas от OpenAI: браузер на Chromium с интегрированным чат‑ассистентом, доступен на macOS, 7 дней расширенных возможностей.