← Вернуться к списку

Сильно несбалансированная регрессия для табличных данных в SEP и других приложениях

Краткое содержание

arXiv:2509.16339v3 Тип объявления: замена Аннотация: Мы исследуем проблему несбалансированной регрессии для табличных данных с коэффициентом дисбаланса более 1000 («сильно несбалансированные»). Точная оценка целевых значений редких примеров важна в таких приложениях, как прогнозирование интенсивности редких вредоносных событий солнечных энергетических частиц (SEP). Для регрессии MSE-функция потерь не учитывает корреляцию между предсказанными и фактическими значениями. Типичные функции обратной важности допускают использование только выпуклых функций. Равномерное семплирование может давать мини-батчи, не содержащие редких примеров. Мы предлагаем метод CISIR, который включает корреляцию, важность на основе монотонно убывающей инволюции (MDI) и стратифицированное семплирование. На основе пяти наборов данных наши экспериментальные результаты показывают, что CISIR может достигать меньшей ошибки и более высокой корреляции по сравнению с некоторыми недавними методами. Кроме того, добавление нашего компонента корреляции к другим современным методам может улучшить их производительность. Наконец, важность MDI может превзойти дру

Полный текст статьи пока не загружен.