Какая наилучшая архитектура нейронной сети для обнаружения объектов, которые определяются только по границам?

2023-02-15 08:37:34

Краткое содержание

У меня задача по цифровизации документов, где я хочу обнаруживать технические чертежи на изображениях. Эти изображения в основном состоят из объектов, образованных комбинацией фигур, таких как линии, окружности и прямоугольники. Вот пример: Что я ожидаю получить в результате – обнаружение всех "объектов" на этом изображении, таких как, например, выключатели, проводки и устройства, присутствующие на нем. Я уже пробовал несколько архитектур сетей, такие как: YOLODeepLabUNet (для классификации по пикселям). В общем, я наблюдаю, что все эти подходы хорошо работают для небольших объектов, но испытывают серьезные проблемы с "большими" объектами из-за их "разреженности". Я думаю, это не удивительно, если учитывать природу CNN. С одной стороны, моя задача кажется простой благодаря таким факторам, как высокая контрастность и ограниченное количество фигур ("поз") для различных объектов. Но я полагаю, что все CNN имеют проблемы с "разреженностью" объектов, поскольку обнаруживается только их контур, а внутренняя часть часто пуста. У кого-нибудь здесь есть идея, какие архитектуры стоит попробовать или ссылки на научные работы?

Полный текст статьи пока не загружен.

Читать оригинал статьи