Бенчмаркинг графовых нейронных сетей для прогнозирования свойств материалов вне распределения с количественной оценкой неопределенности
Краткое содержание
arXiv:2511.11697v1 Тип: новая работа Аннотация: Мы представляем MatUQ, эталонный фреймворк для оценки графовых нейронных сетей (GNN) в задачах прогнозирования свойств материалов вне распределения (out-of-distribution, OOD) с количественной оценкой неопределенности (uncertainty quantification, UQ). MatUQ включает 1375 задач OOD-прогнозирования, созданных на основе шести наборов данных о материалах с использованием пяти стратегий разделения на основе OFM и новой предложенной стратегии SOAP-LOCO, которая эффективнее учитывает локальные атомные окружения. Мы оцениваем 12 репрезентативных моделей GNN в рамках унифицированного протокола обучения с учетом неопределенности, который сочетает метод Монте-Карло с исключением (Monte Carlo Dropout) и глубокий дивиденциальный регрессионный анализ (Deep Evidential Regression, DER), а также вводим новую метрику неопределенности D-EviU, которая демонстрирует самую сильную корреляцию с ошибками прогнозирования в большинстве задач. Наши эксперименты приводят к двум ключевым выводам. Во-первых, подход к обучению с учетом неопределенности значительно повышает точность прогнозирования моделей, сокращая ошибки в среднем на 70,6% в сложных OOD-сценариях. Во-вторых, эталонные испытания показывают, что ни одна
Полный текст статьи пока не загружен.