← Вернуться к списку

Iris: первоклассный опыт программирования для нескольких GPU в Triton

Краткое содержание

arXiv:2511.12500v1 Тип объявления: cross Аннотация: Программирование для нескольких GPU традиционно требует от разработчиков навигации по сложным компромиссам между производительностью и удобством программирования. Высокопроизводительные реализации обычно полагаются на низкоуровневые библиотеки связи HIP/CUDA, которые требуют значительных инженерных усилий даже для базовых шаблонов перекрытия, в то время как более простые абстракции часто жертвуют производительностью. Мы представляем Iris, библиотеку связи для нескольких GPU, полностью реализованную на Python и Triton, которая устраняет этот компромисс. Iris предоставляет плиточные (tile-based) симметричные абстракции памяти, которые естественным образом согласуются с моделью программирования Triton, позволяя разработчикам писать кернелы из единого источника, которые бесшовно чередуют вычисления и связь. Мы демонстрируем таксономию шаблонов перекрытия вычислений и связи — от синхронных пакетных (bulk-synchronous) до специализации рабочих групп (workgroup) с мелкой гранулярностью, — которые могут быть реализованы с минимальными изменениями кода в Iris, часто требуя всего нескольких дополнительных строк в том же

Полный текст статьи пока не загружен.