Гетерогенная многоагентная оптимизация приближённой политики для восстановления систем распределения электроэнергии
Краткое содержание
arXiv:2511.14730v1 Тип объявления: новое Аннотация: Восстановление систем распределения электроэнергии после крупномасштабных отключений требует последовательных операций переключения, которые изменяют топологию питающих линий и координируют распределенные энергетические ресурсы (DER) в условиях нелинейных ограничений, таких как баланс мощности, пределы напряжения и термические характеристики оборудования. Эти задачи делают традиционные методы оптимизации и основанные на значениях подходы обучения с подкреплением вычислительно неэффективными и сложными для масштабирования. Настоящая статья применяет подход к обучению с подкреплением гетерогенных агентов (HARL), реализованный через оптимизацию политики гетерогенного агента методом приближенной политики (HAPPO), чтобы обеспечить согласованное восстановление взаимосвязанных микросетей. Каждый агент управляет отдельной микросетью со своими нагрузками, емкостью DER и количеством коммутационных устройств, что вводит практическую структурную неоднородность. Децентрализованные политики акторов обучаются при помощи централизованного критика для вычисления значений преимущества стабильного обновления политики "на лету". Физически обоснованная среда OpenDSS
Полный текст статьи пока не загружен.