CharDiff-LP: Модель диффузии с руководством на уровне символов для восстановления изображений номерных знаков
Краткое содержание
arXiv:2510.17330v2 Тип объявления: замена Аннотация: Восстановление изображений номерных знаков является важным не только как предварительный шаг для распознавания номерных знаков, но и для повышения доказательной силы, улучшения визуальной ясности и обеспечения более широкого повторного использования изображений номерных знаков. Мы предлагаем новую диффузийную рамку с руководством на уровне символов, CharDiff-LP, которая эффективно восстанавливает и распознает сильно поврежденные изображения номерных знаков, захваченные в реалистичных условиях. CharDiff-LP использует тонкие priors на уровне символов, извлеченные через внешние модули сегментации и оптического распознавания символов (OCR), адаптированные для низкокачественных изображений номерных знаков. Для точного и сфокусированного руководства CharDiff-LP включает новый модуль внимания, направленный на символы через маскирование по регионам (CHARM), который гарантирует, что руководство для каждого символа ограничено его собственным регионом, тем самым избегая помех с других регионов. В экспериментах CharDiff-LP значительно превзошел
Полный текст статьи пока не загружен.