Обучение на основе предпочтений в аудиоприложениях: систематический анализ
Краткое содержание
arXiv:2511.13936v1 Тип объявления: кросс Аннотация: Несмотря на параллельные проблемы оценки выходных данных генеративных моделей в аудиои текстовых доменах, обучение по предпочтениям остается удивительно малоизученным направлением применительно к аудио приложениям. Проведя систематический обзор примерно 500 статей с использованием подхода, направляемого PRISMA, мы обнаружили, что только 30 из них (6%) применяют методы обучения по предпочтениям для решения задач обработки звука. Наш анализ выявил область, находящуюся в стадии перехода: работы до 2021 года были сосредоточены на распознавании эмоций с помощью традиционных методов ранжирования (RankSVM), тогда как исследования после 2021 года сместили акцент на задачи генерации с применением современных фреймворков RLHF. Мы выделяем три ключевых паттерна: (1) появление многомерных стратегий оценки, объединяющих синтетические, автоматизированные и человеческие предпочтения; (2) непоследовательное соответствие между традиционными метриками (WER, PESQ) и оценками людей в различных контекстах; и (3) формирование консенсуса относительно многоэтапных конвейеров обучения, сочетающих сигналы вознаграждения. Наши выводы свидетельствуют о том, что хотя обучение по предпочтений
Полный текст статьи пока не загружен.