AgentArmor: Применение анализа программ к трассировке выполнения агента для защиты от инъекций подсказок

2025-11-19 05:00:00

Краткое содержание

arXiv:2508.01249v3 Тип объявления: замена-перекрёстная Аннотация: Агенты больших языковых моделей (Large Language Model — LLM) предлагают мощный новый подход к решению различных задач путем объединения естественного языкового рассуждения с выполнением внешних инструментов. Однако их динамическое и непрозрачное поведение создает критические риски для безопасности, особенно в условиях атак на основе инъекций подсказок. В данной работе мы предлагаем новое понимание, при котором следы выполнения агента рассматриваются как структурированные программы со семантикой, поддающейся анализу. Таким образом, мы представляем AgentArmor — фреймворк анализа программ, который преобразует следы работы агентов в графовые промежуточные представления структурированных зависимостей между программами (например, CFG, DFG и PDG), обеспечивая соблюдение политик безопасности через систему типов. AgentArmor состоит из трех ключевых компонентов: (1) конструктора графа, который реконструирует следы выполнения агента в виде графовых промежуточных представлений с описанием потоков управления и данных внутри них; (2) реестра свойств, прикрепляющего сек

Полный текст статьи пока не загружен.

Читать оригинал статьи