Онтология научных эталонных тестов MLCommons
Краткое содержание
arXiv:2511.05614v1 Тип объявления: новый Аннотация: Исследования в области научного машинного обучения охватывают разнообразные предметные области и типы данных, однако существующие усилия по созданию эталонных тестов остаются разрозненными и недостаточно стандартизированными. Это делает новые и преобразующие приложения машинного обучения для критически важных научных случаев использования более фрагментированными и менее ясными в плане путей достижения значимого эффекта. В данной статье представлена онтология для проведения научных бенчмарков, разработанная в рамках единого общесообщественного проекта, расширяющего экосистему MLCommons до областей физики, химии, материаловедения, биологии, климатологии и других наук. Основываясь на предыдущих инициативах, таких как XAI-BENCH, FastML Science Benchmarks, PDEBench и фреймворке SciMLBench, наша работа объединяет большое количество различных эталонов и платформ в единую таксономию научных, прикладных и системных уровней тестирования. Новые тесты могут добавляться через открытый процесс подачи заявок, координируемый рабочей группой MLCommons Science и оцениваться относительно...
Полный текст статьи пока не загружен.