ARC — это проблема зрения!
Краткое содержание
arXiv:2511.14761v1 Тип объявления: кросс Аннотация: Корпус абстракции и рассуждений (ARC) предназначен для продвижения исследований в области абстрактного мышления — фундаментального аспекта человеческого интеллекта. Традиционные подходы к решению задач ARC рассматривают его как языковую проблему, решаемую с помощью больших языковых моделей (LLM) или рекуррентных моделей рассуждения. Однако, несмотря на то что задачи типа головоломок в ARC по своей природе являются визуальными, существующие исследования редко рассматривали эту проблему с точки зрения компьютерного зрения. В данной работе мы формулируем ARC в рамках парадигмы компьютерного зрения, представляя её как задачу перевода изображения в изображение. Для включения визуальных априорных знаний мы представляем входные данные на «холсте», который может обрабатываться аналогично естественным изображениям. Это позволяет нам использовать стандартные архитектуры компьютерного зрения, такие как стандартный трансформер видения (Vision Transformer, ViT), для выполнения отображения изображений. Наша модель обучается с нуля исключительно на данных ARC и обобщает решения на невидимые ранее задачи через обучение во время тестирования. Наш подход назван Vision ARC.
Полный текст статьи пока не загружен.