Сжатие запроса (Prompt): Использование сжатия запросов как новой уязвимой поверхности атак против агентов, основанных на больших языковых моделях (LLM)

2025-11-10 05:00:00

Краткое содержание

arXiv:2510.22963v2 Тип объявления: замена-перекрёстная Аннотация: Агенты, работающие на больших языковых моделях (LLM), часто используют сжатие подсказок для снижения затрат на вычисления, однако это создаёт новый риск безопасности. Модули сжатия, оптимизированные скорее для эффективности, нежели для безопасности, могут подвергаться манипуляциям через враждебные входные данные, вызывая семантический дрейф и изменение поведения LLM. В данной работе выявляется новое направление атак — сжатие запросов, и предлагается первая фреймворк-атака CompressionAttack, использующая этот вектор. CompressionAttack включает две стратегии: HardCom, применяющий дискретные вредоносные правки для жёсткого сжатия, и SoftCom, выполняющий возмущение пространства признаков для мягкого сжатия. Эксперименты на нескольких LLM демонстрируют до 80% успешности атаки и до 98% переворотов предпочтений, оставаясь крайне скрытной и переносимой между моделями. Исследования на примерах VSCode CLI и Ollama подтверждают практическое влияние угроз, тогда как существующие средства защиты оказываются неэффективными, подчёркивая необходимость разработки более надёжных мер защиты.

Полный текст статьи пока не загружен.

Читать оригинал статьи