Повышение эффективности автономного вождения от начала до конца с помощью семантической дистилляции рисков из модели видения и языка (VLM)

2025-11-19 05:00:00

Краткое содержание

arXiv:2511.14499v1 Тип объявления: новый Аннотация: Система автономного вождения (AD) продемонстрировала выдающиеся результаты в сложных дорожных ситуациях. Тем не менее, обобщение по-прежнему остается ключевым ограничением для текущей системы, что означает способность справляться с невиданными ранее сценариями или незнакомыми конфигурациями датчиков. В предыдущих работах исследовалось использование моделей видения и языка (VLM) для решения задач с малым количеством примеров или без них вообще. Хотя эти методы перспективны, они создают новую проблему — появление гибридной системы автономного вождения, где два различных механизма используются для планирования траектории, что может привести к потенциальным несоответствиям. Альтернативные направления исследований изучали фреймворки "видение—язык—действие" (VLA), которые генерируют управляющие действия непосредственно из модели видения и языка. Однако такие решения «от начала до конца» демонстрируют чрезмерно высокие вычислительные требования. Для преодоления этих трудностей мы предлагаем метод семантической дистилляции рисков (Risk Semantic Distillation, RSD) — инновационный подход, который использует модели видения и языка для улучшения обучения системам автономного вождения типа «от начала до конца».

Полный текст статьи пока не загружен.

Читать оригинал статьи