Методы с учетом граней для ogbn-proteins в PyTorch Geometric: поклассовая нормализация, пост-обработочная калибровка и компромиссы между стоимостью и точностью
Краткое содержание
arXiv:2511.13250v1 Тип объявления: новый Аннотация: Мы представляем воспроизводимые, учитывающие рёбра базовые модели для ogbn-proteins в PyTorch Geometric (PyG). Мы исследуем два системных выбора, которые доминируют на практике: (i) как 8-мерные признаки рёбер агрегируются во входные данные узлов, и (ii) как рёбра используются внутри передачи сообщений. Наша сильнейшая базовая модель — это GraphSAGE с признаками преобразования "ребро-узел" на основе суммирования. Мы сравниваем LayerNorm (LN), BatchNorm (BN) и вид-озависимый Conditional LayerNorm (CLN), а также сообщаем о вычислительных затратах (время, VRAM, параметры) вместе с точностью (ROC-AUC) и качеством решений. В нашей основной экспериментальной установке (размер скрытого слоя 512, 3 слоя, 3 сида) суммирование последовательно превосходит усреднение и взятие максимума; BN достигает наилучшего AUC, в то время как CLN соответствует границе AUC с лучшим пороговым F1. Наконец, апостериорное масштабирование температуры для каждого ярлыка в сочетании с порогами для каждого ярлыка существенно улучшает микро-F1 и ожидаемую ошибку калибровки (ECE) с незначительным изменением AUC, а легкое сглаживание корреляции меток даёт небольшое [улучшение].
Полный текст статьи пока не загружен.