Готов ли ваш VLM к обеспечению безопасности автономного вождения? Комплексный бенчмарк для оценки внешних и внутрисалонных рисков
Краткое содержание
arXiv:2511.14592v1 Тип объявления: кросс Аннотация: Модели видения и языка (Vision-Language Models, VLM) демонстрируют большие перспективы для автономного вождения, однако их пригодность для критически важных с точки зрения безопасности сценариев остается в значительной степени неизученной, что вызывает опасения по поводу безопасности. Эта проблема возникает из-за отсутствия комплексных эталонных тестов, которые одновременно оценивали бы как внешние экологические риски, так и безопасность поведения водителя внутри салона автомобиля. Чтобы восполнить этот существенный пробел, мы представляем DSBench — первый всеобъемлющий бенчмарк для оценки безопасности вождения, предназначенный для проверки осведомленности модели VLM о различных рисках безопасности единым образом. DSBench охватывает две основные категории: внешние экологические риски и безопасность поведения водителя в салоне автомобиля, разделенные на 10 ключевых категорий и всего 28 подкатегорий. Этот всесторонний анализ охватывает широкий спектр ситуаций, обеспечивая тщательную оценку производительности моделей VLM в контексте критических с точки зрения безопасности задач. Обширные оценки, проведенные среди различных популярных открытых и закрытых моделей VLM, показывают значительное снижение производительност...
Полный текст статьи пока не загружен.