Биологически обоснованные гибридные атаки на выявление принадлежности пользователей в генеративных геномных моделях
Краткое содержание
arXiv:2511.07503v1 Тип объявления: кросс Аннотация: Повышенная доступность генетических данных преобразила исследования в области геномики, однако вызвала многочисленные проблемы конфиденциальности относительно их обработки ввиду высокой чувствительности этой информации. В данной работе исследуется применение языковых моделей (LM) для генерации синтетических профилей генетических мутаций, используя дифференциальную приватность (ДП) для защиты чувствительных генетических данных. Мы эмпирически оцениваем гарантии безопасности наших режимов ДП путём введения нового Биологически-Информированного Гибридного Атаки Инференса Членства (biHMIA), который объединяет традиционный чёрный ящик атаки MIA с контекстуальными метриками геномики для повышения силы атакующего воздействия. Наши эксперименты показывают, что как небольшие, так и крупные трансформеры типа GPT являются подходящими генераторами синтетических вариантов для небольших масштабов исследований в геномике, и что наш гибридный метод атаки обеспечивает, в среднем, большую успешность злоумышленника по сравнению с традиционными метрическими методами MIA.
Полный текст статьи пока не загружен.