← Вернуться к списку

Обучение денойсингу с учетом сложности и руководством меток для детектирования трехмерных объектов монокулярной камерой

Краткое содержание

arXiv:2511.13195v1 Тип объявления: новый Аннотация: Однокамерное (монокулярное) обнаружение трехмерных объектов является экономически эффективным решением для приложений вроде автономного вождения и робототехники, однако оно остается фундаментально некорректной задачей вследствие присущих ей неоднозначных признаков глубины. Современные методы на основе DETR пытаются смягчить эту проблему путем глобального внимания и вспомогательного прогнозирования глубины, но всё равно сталкиваются с проблемами неточных оценок глубины. Более того, такие подходы часто упускают трудности обнаружения на уровне отдельных экземпляров, такие как перекрытие, расстояние и усечение, что ведет к неоптимальной производительности детектирования. Мы предлагаем MonoDLGD — новую структуру шумоподавления, управляемого метками с учетом сложности, которая адаптивно искажает и восстанавливает истинные метки на основании неопределенности обнаружения. В частности, MonoDLGD применяет более сильные возмущения к простым экземплярам и менее выраженные — к трудным случаям, после чего реконструирует их, эффективно обеспечивая явную геометрическую супервизию. Совместная оптимизация реконструкции меток и однокамерного обнаружения трёхмерных объектов

Полный текст статьи пока не загружен.