Глубокое обучение с подкреплением для управления ориентацией космического аппарата с ограничением на удержание направления взгляда
Краткое содержание
arXiv:2511.13746v1 Тип объявления: кросс Аннотация: В данной статье реализован метод глубокого обучения с подкреплением (DRL) для управления переориентацией космического аппарата при наличии одной зоны ограничения направления. Алгоритм Soft Actor-Critic (SAC) используется для обработки непрерывных пространств состояний и действий. Предложено новое представление состояния, которое явно включает компактное представление зоны ограничений ориентации. Функция вознаграждения сформулирована таким образом, чтобы достичь цели управления, соблюдая ограничение по ориентации. Для обучения агента применяется подход на основе учебной программы (curriculum learning). Результаты моделирования демонстрируют эффективность предложенного метода DRL для управления ориентацией космического аппарата с ограничением направления.
Полный текст статьи пока не загружен.