← Вернуться к списку

Помимо значимости: улучшение объяснимости распознавания эмоций в речи с помощью акустических признаков, соотнесенных с экспертной оценкой

Краткое содержание

arXiv:2511.11691v1 Тип: новая статья Аннотация: Объяснимый ИИ (XAI) для распознавания эмоций по речи (SER) критически важен для создания прозрачных и заслуживающих доверия моделей. Современные методы, основанные на картах значимости и адаптированные из компьютерного зрения, выделяют области на спектрограммах, но не показывают, соответствуют ли эти области значимым акустическим маркерам эмоций, что ограничивает достоверность и интерпретируемость. Мы предлагаем фреймворк, который преодолевает эти ограничения, количественно оценивая величину ключевых признаков внутри значимых областей. Это проясняет, «что» именно выделено, и связывает это с «почему» это важно, увязывая карты значимости с акустическими признаками эмоций в речи, имеющими опору в экспертных знаниях. Эксперименты на эталонных наборах данных SER показывают, что наш подход улучшает качество объяснений за счёт явного связывания значимых областей с теоретически обоснованной и экспертно-верифицированной акустикой речи. По сравнению со стандартными методами анализа значимости он обеспечивает более понятные и правдоподобные объяснения работы моделей SER, делая фундаментальный шаг на пути к созданию доверенных систем.

Полный текст статьи пока не загружен.