SITE: towards Spatial Intelligence Thorough Evaluation **SITE:** К всесторонней оценке пространственного интеллекта
Краткое содержание
arXiv:2505.05456v2 Тип объявления: замена Аннотация: Пространственный интеллект (SI) представляет собой когнитивную способность, включающую визуализацию, манипулирование и рассуждение о пространственных отношениях, лежащих в основе дисциплин от нейробиологии до робототехники. Мы представляем SITE — эталонный набор данных для всесторонней оценки пространственного интеллекта в стандартизированной форме многоальтернативного визуального вопросно-ответного формата, предназначенный для оценки уровня пространственного интеллекта крупных моделей видения и языка по различным визуальным модальностям (одиночные изображения, множественные изображения и видеоматериалы) и факторам SI (масштаб от фигурного до экологического, пространственная визуализация и ориентация, внутренняя и внешняя, статическая и динамическая). Наш подход к созданию эталонного набора включает сочетание восходящего опроса существующих 31 баз данных и нисходящей стратегии, основанной на трех системах классификации в когнитивной науке, что позволило нам разработать два новых типа заданий о восприятии вида и динамических сценах. Обширные эксперименты показывают, что ведущие модели отстают
Полный текст статьи пока не загружен.