← Вернуться к списку

Оценка направления прихода сигнала (DOA) с использованием облегчённой сети на акустических сценах, смоделированных с помощью крупных языковых моделей (LLM)

Краткое содержание

arXiv:2511.08012v1 Тип объявления: кросс Аннотация: Оценка направления прихода сигнала (DOA) имеет ключевое значение в пространственной аудиотехнике и обработке акустических сигналов, находя широкое применение в реальных условиях. Большинство существующих моделей оценки DOA обучаются на синтетических данных путём свёртки чистого голоса с импульсными характеристиками помещений (RIR), что ограничивает их применимость из-за недостаточной акустической разнообразности. В данной работе мы пересматриваем проблему оценки DOA, используя недавно созданный набор данных, построенный с помощью больших языковых моделей (LLM), который обеспечивает более реалистичные и разнообразные сценарии пространственного звука. Мы тестируем несколько типичных методов оценки DOA на основе нейронных сетей на данном наборе данных и предлагаем LightDOA — легковесную модель оценки DOA, основанную на разделяемых свёрточных слоях глубины, специально разработанную для многополосного ввода в различных средах. Экспериментальные результаты показывают, что LightDOA демонстрирует удовлетворительную точность и устойчивость во множестве акустических сценариев, оставаясь при этом низкозатратной с вычислительной точки зрения.

Полный текст статьи пока не загружен.