← Вернуться к списку

Нерегулярный классовый отбор корсета для тонкой настройки моделей зрения

Краткое содержание

arXiv:2504.13234v2 Тип объявления: замена-перекрёстная Аннотация: Выбор ядра данных направлен на выявление небольшого, но высокоинформативного подмножества данных, что позволяет повысить эффективность обучения моделей и снизить затраты на хранение. В последнее время эта возможность была использована для решения проблем тонкой настройки больших базовых моделей, предоставляя прямой путь к их эффективному и практическому внедрению. Однако большинство существующих методов не учитывают классы, в результате чего они упускают из виду значительные различия сложности между классами. Это приводит к непропорциональной обрезке выборок либо слишком простых, либо сложных классов, что приводит к неоптимальному распределению бюджета данных и ухудшению конечной производительности набора ядерных данных. Для устранения этого ограничения мы предлагаем метод выбора ядра с неоднородным учетом классов (Non-Uniform Class-Wise Coreset Selection — NUCS) — новую структуру, которая интегрирует как уровень класса, так и сложность уровня образца. Мы предлагаем надежную метрику глобальной сложности класса, количественно определяемую как усеченное среднее значение по каждому классу...

Полный текст статьи пока не загружен.