Временные ряды в замкнутом цикле обучения для последовательного принятия решений и управления
Краткое содержание
arXiv:2412.02423v2 Тип объявления: replace-cross Аннотация: Качество работы в замкнутом контуре алгоритмов последовательного принятия решений, таких как модель predictive control, сильно зависит от выбора параметров контроллера. Байесовская оптимизация позволяет обучать параметры по данным замкнутого контура, но стандартный подход рассматривает это как черный ящик и игнорирует временную структуру траекторий, что приводит к медленной сходимости и неэффективному использованию экспериментальных ресурсов. Мы предлагаем многоуровневый байесовский оптимизационный framework, учитывающий временные ряды, в котором уровень точности соответствует времени работы в замкнутом контуре. Это позволяет использовать промежуточные оценки производительности внутри одного эксперимента в качестве наблюдений с низкой точностью. Кроме того, мы выводим вероятностные критерии досрочной остановки, чтобы прекращать неперспективные эксперименты в замкнутом контуре на основе апостериорной вероятности суррогатной модели, избегая thus проведения полных испытаний для неудачных параметризаций и тем самым сокращая
Полный текст статьи пока не загружен.