Модульное восстановление видео посредством селективного пространственно-временного трансформера зрения
Краткое содержание
arXiv:2511.07479v1 Тип объявления: кросс Аннотация: Обычные датчики изображений имеют ограниченный динамический диапазон, что вызывает насыщение в сценах с высоким динамическим диапазоном (HDR). Модульные камеры решают эту проблему путем свёртки падающего излучения в ограниченный диапазон, однако требуют специализированных алгоритмов развертывания для восстановления исходного сигнала. В отличие от методов восстановления HDR, расширяющих динамический диапазон из обычного выборочного пространства, восстановление модуля восстанавливает фактические значения из свернутых образцов. Несмотря на то, что модульное восстановление было предложено более десяти лет назад, прогресс в этой области был медленным, особенно в применении современных технологий глубокого обучения. В данной работе мы показываем, что стандартные методы HDR непригодны для восстановления модулированных сигналов. Трансформеры же способны захватывать глобальные зависимости и пространственно-временные отношения, критически важные для разрешения свернутых видеофреймов. Тем не менее адаптация существующих архитектур трансформеров для решения задачи восстановления модулей требует новых подходов. С этой целью мы предлагаем селективную пространственно-временную визуальную архитектуру трансформера.
Полный текст статьи пока не загружен.