К единой аналитике нейронных сетей в непараметрической инструментальной переменной регрессии: оптимизация и обобщение
Краткое содержание
arXiv:2511.14710v1 Тип объявления: кросс Аннотация: Мы впервые доказываем глобальную сходимость нейронных сетей для двухэтапного метода наименьших квадратов (2SLS) в непараметрической инструментальной регрессии переменных (NPIV). Это достигается путем использования поднятого взгляда через динамику среднего поля Ланжевена (MFLD); однако наша постановка задачи 2SLS подразумевает биевровневую оптимизационную проблему в пространстве мер вероятности. Для решения этой проблемы мы используем подход штрафной градиентной оптимизации, недавно разработанный для биевровневой оптимизации и формулирующий задачу биевровневой оптимизации как лагранжеву задачу. В результате этого подхода был предложен новый полностью первого порядка алгоритм, названный F²BMLD. Помимо оценки сходимости, мы также предоставляем оценку обобщения, которая выявляет присущий компромисс при выборе множителя Лагранжа между гарантиями оптимизации и статистическими показателями. Наконец, мы эмпирически подтверждаем эффективность предлагаемого метода на задаче обучения с подкреплением без участия учителя.
Полный текст статьи пока не загружен.