← Вернуться к списку

GP-MoLFormer-Sim: Оптимизация молекул в режиме тестирования с помощью контекстуального управления сходством

Краткое содержание

arXiv:2506.05628v2 Тип объявления: replace Аннотация: Способность проектировать молекулы, сохраняя сходство с целевой молекулой и/или её свойством, крайне важна для различных приложений в области разработки лекарств, химического дизайна и биологии. В данной статье мы представляем эффективный метод, не требующий обучения, для навигации и выборки из молекулярного пространства с помощью генеративной Химической Языковой Модели (CLM), используя при этом молекулярное сходство с целевой молекулой в качестве ориентира. Наш метод использует контекстные представления, извлеченные из самой CLM, для оценки молекулярного сходства, которое затем применяется для корректировки авторегрессионной стратегии выборки CLM. На каждом шаге процесса декодирования метод отслеживает расстояние текущих генераций от цели и обновляет логиты, чтобы способствовать сохранению сходства в генерациях. Мы реализуем метод с использованием недавно предложенной SMILES-основанной CLM с ~47 млн параметров, GP-MoLFormer, и поэтому называем метод GP-MoLFor.

Полный текст статьи пока не загружен.