← Вернуться к списку

PCA++: Как равномерность распределения обеспечивает устойчивость к фоновому шуму в контрастном обучении

Краткое содержание

arXiv:2511.12278v1 Тип объявления: cross Аннотация: Высокомерные данные часто содержат низкомерные сигналы, скрытые структурированным фоновым шумом, что ограничивает эффективность стандартного метода главных компонент (PCA). Мотивируясь контрастным обучением, мы решаем задачу восстановления общих сигнальных подпространств из позитивных пар — парных наблюдений, имеющих один и тот же сигнал, но различающихся фоном. Наш базовый метод, PCA+, использует контрастное обучение только с выравниванием и успешен, когда вариация фона невелика, но терпит неудачу при сильном шуме или в высокомерных режимах. Чтобы решить эту проблему, мы представляем PCA++ — контрастный PCA с жёстким ограничением единообразия, который обеспечивает единичную ковариацию для проецируемых признаков. PCA++ имеет закрытое решение через обобщённую проблему собственных значений, остаётся стабильным в высокой размерности и обеспечивает проверенную регуляризацию от фоновых помех. Мы предоставляем точную асимптотику в высокой размерности как в режиме фиксированного соотношения сторон, так и в режиме растущего спайка, демонстрируя роль единообразия в робастном восстановлении сигнала.

Полный текст статьи пока не загружен.