InsFusion: Переосмысление уровня экземпляров слияния LiDAR-камер для трехмерного обнаружения объектов
Краткое содержание
arXiv:2509.08374v2 Тип объявления: замена Аннотация: Обнаружение трехмерных объектов с использованием многовидовых камер и лидара является важнейшим компонентом автономных транспортных средств и интеллектуальных транспортных систем. Однако в процессе базовой экстракции признаков, преобразования перспективы и слияния признаков постепенно накапливаются шум и ошибки. Для решения этой проблемы мы предлагаем метод InsFusion, который способен извлекать предложения (proposals) как из исходных, так и объединённых признаков, используя эти предложения для запроса исходных признаков, что позволяет уменьшить влияние накопленных ошибок. Дополнительно, применяя механизмы внимания к исходным признакам, удается еще больше снизить воздействие накопленных ошибок. Эксперименты на наборе данных nuScenes показывают, что InsFusion совместим с различными передовыми базовыми методами и обеспечивает новый уровень производительности для обнаружения трёхмерных объектов.
Полный текст статьи пока не загружен.