Генерация расширенного длинного цепочного рассуждения (Long-CoT), дополненного знаниями, для сложного биомолекулярного анализа
Краткое содержание
arXiv:2511.08024v1 Тип объявления: новый Аннотация: Понимание сложных биомолекулярных механизмов требует многоступенчатого рассуждения, охватывающего молекулярные взаимодействия, сигнальные каскады и метаболические пути. Хотя большие языковые модели (LLM) демонстрируют перспективность в выполнении таких задач, их применение к проблемам биомолекул ограничено логическими несоответствиями и отсутствием опоры на знания предметной области. Существующие подходы часто усугубляют эти проблемы: шаги рассуждений могут отклоняться от биологических фактов или не учитывать длительные механистические зависимости. Для решения этих проблем мы предлагаем фреймворк расширенного многошагового рассуждения с опорой на знания, который интегрирует LLM-модели с цепочками многоточечного рассуждения на основе графов знаний. Фреймворк строит механистические цепи посредством направленного многоточечного обхода и отсечения графа знаний; полученные цепи включаются в контролируемое дообучение для улучшения фактической обоснованности выводов и дополнительно уточняются методом подкрепляющего обучения для повышения надежности рассуждений.
Полный текст статьи пока не загружен.