Энд-ту-энд подход глубокого обучения с подкреплением для решения задачи коммивояжёра с использованием дронов
Краткое содержание
arXiv:2511.05265v1 Тип объявления: кросс Аннотация: Появление коллаборативных систем грузовик-дрон в логистике последней мили вывело задачу коммивояжера с дронами (TSP-D) на передний план как ключевое расширение классической оптимизации маршрутов, где синхронизированная координация транспортных средств обещает значительное повышение операционной эффективности и снижение негативного воздействия на окружающую среду, однако вводит комбинаторную сложность класса NP-трудности, выходящую за рамки традиционных парадигм оптимизации. Глубокое обучение с подкреплением предлагает теоретически обоснованный подход к решению присущих задаче TSP-D проблем через самообучение политики принятия решений и адаптивное принятие решений. В данной работе предлагается иерархическая архитектура глубокого обучения с подкреплением типа Actor-Critic для решения проблемы TSP-D. Архитектура состоит из двух основных компонентов: кодировщика, вдохновленного архитектурой Transformers, и эффективного декодера на основе минимальных гейтированных блоков. Кодировщик включает новый оптимизированный механизм разреженного внимания на основе k ближайших соседей, специально
Полный текст статьи пока не загружен.