Предсказание вторичной структуры белка с использованием 3D-графов и трансформеров с механизмом передачи сообщений, учитывающим взаимосвязи
Краткое содержание
arXiv:2511.13685v1 Тип объявления: новый Аннотация: В данном исследовании мы решаем сложную задачу предсказания вторичных структур белков из их первичных последовательностей — важнейший первоначальный шаг на пути к предсказанию третичных структур, который также дает ключевые сведения о деятельности, взаимосвязях и функциях белка. Существующие методы часто используют обширные наборы немаркированных аминокислотных последовательностей. Однако эти подходы не позволяют явно уловить и использовать доступные данные о трёхмерной структуре белков, которые признаны решающим фактором, определяющим функции белков. Чтобы решить эту проблему, мы используем графы остатков белка и вводим различные формы последовательных или структурных связей для получения расширенной пространственной информации. Мы умело комбинируем графовые нейронные сети (GNN) и языковые модели (LM), в частности, используя предварительно обученную трансформерную языковую модель для кодирования аминокислотных последовательностей и применяя механизмы передачи сообщений, такие как GCN и R-GCN, для улавливания геометрической и
Полный текст статьи пока не загружен.