← Вернуться к списку

RAPTR: Оценка трехмерной позы на основе радара с использованием трансформера

Краткое содержание

arXiv:2511.08387v1 Тип объявления: кросс Аннотация: Оценка трехмерной позы человека внутри помещений на основе радарных измерений традиционно зависела от детальных меток ключевых точек в 3D-пространстве, получение которых особенно затратно в сложных условиях интерьера, включающих захламленность пространства, перекрытия объектов или присутствие нескольких людей. В данной работе мы предлагаем **RAPTR** (**Radar Pose esTimation using tRansformer**) — метод оценки позы под слабым надзором, использующий лишь ограниченные данные аннотированных меток 3D-объемных рамок (BBox) и 2D-точек, которые значительно проще и масштабируемее собирать. Архитектура RAPTR включает двухэтапный декодер позы с псевдо-трехмерным деформируемым вниманием, которое улучшает запросы на позу/суставы путем объединения многопроекционных радарных признаков: первый этап — декодер позы оценивает начальные 3D-позы с помощью специально разработанной функции потерь на основе шаблона 3D, предназначенной для эффективного использования меток 3D-BBox и устранения неопределенности глубины; второй этап — декодер суставов уточняет исходную оценку позы, используя метки 2D-ключевых точек и функцию потерь гравитации в 3D-пространстве. Тестирование на двух наборах данных для внутренних радарных наблюдений показало превосходство предложенного метода RAPTR по сравнению с существующими подходами, снизив ошибку позиционирования суставов на $34.3\%$ на наборе данных HIBER.

Полный текст статьи пока не загружен.