HyperCore: Выбор кор-сетов в условиях зашумленности с помощью моделей гиперсфер
Краткое содержание
arXiv:2509.21746v2 Тип объявления: replace Аннотация: Цель методов выбора ядерных наборов (coreset) заключается в определении репрезентативных подмножеств наборов данных для эффективного обучения моделей. Однако существующие методы часто игнорируют возможность наличия ошибок аннотирования и требуют заданных коэффициентов сокращения данных, что делает их непрактичными в реальных условиях. Мы представляем HyperCore, устойчивый и адаптивный фреймворк для выбора ядерных наборов, разработанный специально для зашумленных сред. HyperCore использует легковесные модели гиперсфер, обучаемые для каждого класса, которые размещают внутриклассовые примеры близко к центру гиперсферы, естественным образом отделяя внеклассовые примеры на основе их расстояния. Используя статистику J Юдена, HyperCore может адаптивно выбирать пороги отсева, обеспечивая автоматическое, учитывающее шум сокращение данных без настройки гиперпараметров. Наши эксперименты показывают, что HyperCore стабильно превосходит современные методы выбора ядерных наборов, особенно в условиях зашумленности и при работе с малыми данными. HyperCore эффективно отбрасывает ошибочно размеченные и неоднозначные
Полный текст статьи пока не загружен.