← Вернуться к списку

О сходимости непрерывного федеративного обучения с использованием инкрементально агрегированных градиентов

Краткое содержание

arXiv:2411.07959v3 Тип объявления: замена Аннотация: Святым Граалем машинного обучения является возможность реализации непрерывного федеративного обучения (CFL), которое повышает эффективность, конфиденциальность и масштабируемость систем ИИ при обучении на потоковых данных. Основная проблема системы CFL заключается в преодолении глобальной катастрофической забывчивости, когда точность глобального модели, обученной новым задачам, снижается на старых задачах. В данной работе мы предлагаем метод непрерывного федеративного обучения с агрегированными градиентами (C-FLAG) — новую стратегию федеративного обучения на основе воспроизведения памяти, включающую обновление градиентов на периферийных устройствах по данным памяти и агрегирование градиентов по текущим данным. Мы приводим анализ сходимости подхода C-FLAG, который решает проблему забывания и смещения, сходясь со скоростью порядка $O(1/\sqrt{T})$ за $T$ раундов коммуникации. Мы формулируем оптимизационную подзадачу, минимизирующую катастрофическое забывание, преобразуя CFL в итерационный алгоритм с адаптивными темпами обучения, обеспечивающий плавное обучение...

Полный текст статьи пока не загружен.