Эвристическая адаптация потенциально некорректной области определения для вывода без вычисления правдоподобия в стохастических динамических системах
Краткое содержание
arXiv:2510.26656v2 Тип анонса: замена-перекрёстная публикация Аннотация: В робототехнике метод вывода вероятностной модели без вычисления правдоподобия (likelihood-free inference — LFI) позволяет получить распределение домена, адаптирующее обученного агента к параметрическому набору условий эксплуатации. Метод LFI предполагает произвольную область выборки, которая остаётся постоянной по мере итерационного уточнения исходного общего априорного распределения до более информативных апостериорных распределений. Однако неверное задание области выборки потенциально способно привести к неоптимальным, хотя и ошибочно уверенным, апостериорным оценкам. Для решения этой проблемы мы предлагаем три эвристические модификации метода LFI: EDGE, MODE и CENTRE. Каждая модификация интерпретирует сдвиг моды апостериора на этапах вывода по-своему и, будучи интегрированной в этап LFI, одновременно адаптирует область выборки вместе с выводом апостериорной оценки. Сначала мы раскрываем проблему некорректного задания области выборки и оцениваем наши эвристики с помощью стохастических динамических эталонных тестов. Затем исследуем влияние адаптации области выборки эвристическими методами на оценку параметров и обучение политики управления манипуляциями деформируемым линейным объектом (dynamic deformable linear object — DLO).
Полный текст статьи пока не загружен.