OpenAI: предупреждение о prompt injection

GPT Spark — Prompt Engineering | ChatGPT | AI @gpt_spark_ru

Показываю, как выжимать максимум из ChatGPT и Claude: авторские промпты, роли «Act as…», кастом‑инструкции и рабочие методики без воды. Проверяю на реальных задачах — от маркетинга и контента до сложного анализа с мульти‑экспертным синтезом. Если хотите, чтобы ИИ давал конкретику вместо шоу — вы по адресу.

Открыть в Telegram Другие публикации

Компания официально признала: браузеры с интегрированным искусственным интеллектом и автономные агенты для веб-сёрфинга невозможно полностью защитить от атак типа prompt injection.

Суть проблемы: вредоносный контент, размещённый на веб-страницах, способен:

Перезаписать исходные инструкции модели
Извлечь конфиденциальные токены и пользовательские данные
Инициировать несанкционированные действия от имени пользователя

OpenAI рекомендует подход «многослойной защиты» (defense in depth):

Принцип минимальных привилегий — агент получает только необходимые права
Изоляция в песочницах — ограничение доступа к системным ресурсам
Явные разрешения — подтверждение критических действий пользователем
Верификация источников — проверка надёжности посещаемых ресурсов
Постоянный мониторинг — отслеживание аномального поведения

Ключевой вывод: абсолютной защиты не существует. Разработчикам и бизнесу следует проектировать системы с учётом возможных отказов.

@gpt_spark_ru