Усиление агентно-автономного научного открытия возможностями моделей видения и языка
Краткое содержание
arXiv:2511.14631v1 Тип объявления: кросс Аннотация: Мы показываем, что многоагентные системы, управляемые моделями видения и языка (VLM), улучшают автономное научное открытие от начала до конца. Рассматривая графики как проверяемые контрольные точки, модель VLM в роли судьи оценивает фигуры по динамически генерируемым предметно-ориентированным критериям оценки, позволяя агентам исправлять собственные ошибки и направлять исследовательский анализ данных в реальном времени. Исследования в области космологии и астрохимии демонстрируют восстановление после ошибочных путей рассуждений и адаптацию к новым наборам данных без вмешательства человека. На эталонном тесте из 10 задач для открытия на основе данных системы с поддержкой VLM достигают показателей прохождения тестов "с первого раза" в диапазоне 0.7–0.8, тогда как показатели только кодовых систем составляют 0.2–0.3, а комбинированных систем кода и текста — 0.4–0.5; при этом они также предоставляют аудируемые следы рассуждений, повышающие интерпретируемость. Код доступен здесь: https://github.com/CMBAgents/cmbagent
Полный текст статьи пока не загружен.