Сбросить

arXiv:2511.12658v1 Тип объявления: новый Аннотация: Современные методы локализации подделок текста на изображениях (T-IFL) часто страдают от плохой обобщаемости вследствие ограниченного объема реальных наборов данных и разрыва распределения, вызванного синтетическими данными, неспособными отразить...

arXiv:2511.12371v1 Тип объявления: новый Аннотация: Целью поиска видео по текстовому запросу является выборка релевантных видеофайлов из больших баз данных на основе текстовых запросов. Современные методы достигли прогресса в обработке явных запросов, когда интересующий визуальный контент описан я...

arXiv:2511.12400v1 Тип объявления: новый Аннотация: Мы представляем MSLoRA — адаптер, независимый от архитектуры базовой сети, эффективно использующий параметры и переопределяющий отклик признаков вместо повторного дообучения самой базовой модели. Современные методы адаптации низкого ранга преимущ...

arXiv:2511.12415v1 Тип объявления: новый Аннотация: Задача восстановления структуры по движению (Structure from Motion — SfM) является ключевой задачей компьютерного зрения, направленной на восстановление трехмерной структуры сцены и движения камеры по последовательности двумерных изображений. Нед...

arXiv:2511.12419v1 Тип объявления: новый Аннотация: Чистые изображения критически важны для визуальных задач, таких как обнаружение мелких объектов, особенно при высоком разрешении. Однако реальные изображения часто ухудшаются из-за неблагоприятных погодных условий, а методы восстановления погоды ...

arXiv:2511.12452v1 Тип объявления: новое Аннотация: С быстрым распространением мультимодальных больших языковых моделей (MLLM) во множестве различных приложений остро встаёт необходимость наличия ориентированных на конкретные задачи высококачественных наборов тренировочных данных. Ключевым огранич...

arXiv:2511.12480v1 Тип объявления: новый Аннотация: В контролируемом обучении традиционный метод маскирования изображений сталкивается с двумя ключевыми проблемами: (i) отброшенные пиксели используются недостаточно эффективно, что ведет к потере ценной контекстной информации; (ii) маскирование мож...

arXiv:2511.12498v1 Тип объявления: новый Аннотация: Современные методы семантического завершения трехмерной сцены (SSC), основанные на камерах, всё чаще используют временные подсказки для обогащения признаков текущего кадра. Однако эти подходы, хотя и сосредоточены главным образом на улучшении вну...

arXiv:2511.12525v1 Тип объявления: новый Аннотация: Задача слияния инфракрасных и видимых изображений заключается в объединении дополнительной мультимодальной информации в единый результат. Однако существующие методы 1) не учитывают ухудшение качества видимого изображения в неблагоприятных погодны...

arXiv:2511.12572v1 Тип объявления: новый Аннотация: Мы представляем новый метод восстановления поверхностной температуры через лесную растительность путём объединения методов обработки сигналов и машинного обучения. Наша цель — обеспечить полностью автоматизированный мониторинг лесных пожаров с во...