Расшифровка скрытых поверхностей атак в больших языковых моделях (LLM): внедрение подсказок через HTML при веб-суммаризации
Краткое содержание
arXiv:2509.05831v3 Тип объявления: замена-перекрёстная Аннотация: Большие языковые модели (LLM) всё чаще интегрируются в веб-системы для обобщения содержимого, однако их уязвимость перед атаками через инъекции запросов остаётся серьёзной проблемой. В данном исследовании мы изучаем, каким образом невидимые элементы HTML, такие как `<script>`, `aria-label` и атрибуты `alt`, могут использоваться для внедрения вредоносных инструкций без изменения видимого содержания веб-страницы. Мы представляем новый набор данных, состоящий из 280 статичных веб-страниц, поровну разделённых между чистыми версиями и версиями с внедрением угроз, созданных с использованием различных стратегий на основе HTML. Эти страницы обрабатываются через конвейер автоматизации браузера для извлечения как исходного HTML-кода, так и отображаемого текста, что близко имитирует реальные сценарии развертывания больших языковых моделей. Мы оцениваем две современные открытые модели — Llama 4 Scout от Meta и Gemma 9B IT от Google — по их способности суммировать этот контент. Для оценки используются как лексические метрики (ROUGE-L), так и семантические показатели (косинусное сходство SBERT).
Полный текст статьи пока не загружен.