ConnectomeBench: Могут ли большие языковые модели вычитывать коннектом?

2025-11-11 05:00:00

Краткое содержание

arXiv:2511.05542v1 Тип объявления: кросс Аннотация: Коннектомика — картирование нервных связей в мозге организма — в настоящее время требует значительных усилий человека для проверки данных, полученных методами визуализации и сегментации с помощью машинного обучения. В свете растущего интереса к использованию агентов ИИ для автоматизации важных научных задач мы исследуем возможность современных систем искусственного интеллекта выполнять несколько задач, необходимых для верификации данных. Мы представляем ConnectomeBench — мультимодальную тестовую платформу, оценивающую возможности больших языковых моделей (LLM) в трех критически важных задачах верификации данных: идентификации типа сегментов, исправления ошибок разделения и обнаружения ошибок слияния. Используя данные, аннотированные экспертами из двух крупных общедоступных наборов данных — кубического миллиметра зрительной коры мыши и полного мозга дрозофилы — мы оцениваем проприетарные мультимодальные LLM, включая Claude 3.7/4 Sonnet, o4-mini, GPT-4.1, GPT-4o, а также модели с открытым исходным кодом, такие как InternVL-3 и NVLM. Наши результаты показывают, что современные

Полный текст статьи пока не загружен.

Читать оригинал статьи