Повышение точности и обобщаемости моделей регрессии молекулярных свойств с помощью фреймворка, учитывающего правила замены субструктур
Краткое содержание
arXiv:2511.08314v1 Тип объявления: кросс Аннотация: Искусственный интеллект (ИИ), применяемый в открытии лекарственных препаратов, является активно развивающейся областью исследований, однако модели ИИ часто демонстрируют низкую точность в регрессионных задачах прогнозирования молекулярных свойств и катастрофически плохо справляются с молекулами вне распределения (out-of-distribution — OOD). В данной работе мы представляем MolRuleLoss — фреймворк, использующий правила замены субструктур, который повышает точность и обобщаемость нескольких моделей регрессии молекулярных свойств (MPRM), таких как GEM и UniMol, применительно к различным задачам предсказания молекулярных свойств. MolRuleLoss интегрирует ограничения частных производных для правил замены субструктур (SSR) в функцию потерь MPRM-модели. При использовании моделей GEM для прогноза липофильности, растворимости в воде и свободной энергии сольватации (на наборах данных липофильность, ESOL и freeSolv из MoleculeNet) значения среднеквадратичной ошибки (RMSE) с использованием и без использования MolRuleLoss составили соответственно 0.587 против 0.660, 0.777 против 0.798 и 1.252 против 1.877.
Полный текст статьи пока не загружен.