Аспект уравнения Гамильтона-Якоби-Беллмана с мерой в байесовском оптимальном адаптивном контроле
Краткое содержание
arXiv:2502.12957v2 Тип объявления: замена Аннотация: Рассматривается байесовская адаптивная оптимальная стохастическая задача управления, где скрытый статический сигнал оказывает несепарабельное влияние на дрейф шумного наблюдения. Имея возможность контролировать форму этой зависимости, мы стремимся оптимизировать функционал затрат, зависящий от апостериорного распределения скрытого сигнала. Наши условия резко отличаются от существующих работ: мы включаем затраты, зависящие от полного апостериорного распределения в форме, допускающей широкий класс нелинейных отношений. Выражая динамику этого апостериорного распределения через фильтрацию наблюдений, мы встраиваем нашу задачу в истинно бесконечномерную стохастическую задачу управления с использованием мартингалов с мерными значениями. Мы решаем эту задачу с помощью теории вязкости и аргументов аппроксимации. В частности, мы показываем эквивалентность к соответствующей слабой формулировке и характеризуем оптимальное значение задачи через единственное непрерывное вязко
Полный текст статьи пока не загружен.