Amulet: библиотека Python для оценки взаимодействий между средствами защиты машинного обучения и рисками

2025-11-10 05:00:00

Краткое содержание

arXiv:2509.12386v2 Тип объявления: замена-перекрёстная публикация Аннотация: Модели машинного обучения подвержены различным рискам безопасности, конфиденциальности и справедливости. Большинство защитных мер предназначены для защиты от каждого риска индивидуально (предусмотренные взаимодействия), однако они могут непреднамеренно влиять на восприимчивость к другим несвязанным рискам (непредусмотренные взаимодействия). Мы представляем библиотеку Amulet — первую библиотеку на Python для оценки как предусмотренных, так и непредусмотренных взаимодействий между защитами моделей машинного обучения и возникающими рисками. Библиотека Amulet является комплексной благодаря включению репрезентативных атак, методов защиты и метрик; расширяемой благодаря модульной архитектуре, позволяющей добавлять новые модули; согласованной с удобным шаблоном API для входных и выходных данных; применимой для анализа новых видов взаимодействий. Благодаря удовлетворению всех четырёх свойств библиотека Amulet создаёт единую основу для изучения того, каким образом защитные меры влияют друг на друга, позволяя впервые систематически оценивать непредусмотренные взаимодействия среди множества различных рисков.

Полный текст статьи пока не загружен.

Читать оригинал статьи