← Вернуться к списку

Существуют ли какие-либо ссылки или примеры распознавания линий на доске с использованием модели машинного обучения?

Краткое содержание

Я пытаюсь разработать приложение реального времени, которое, на основе последовательности изображений доски, захваченных веб-камерой, распознает линии, которые рисуются на ней. Ему необходимо распознавать эти линии от фона доски, фильтровать присутствие учителя на изображении и преобразовывать эти линии в некоторое представление (например, список основных событий, таких как "начало линии в xxx,xxx", "продолжение линии в xxx,xxx" и т.д.). После нескольких дней поисков я ничего не нашёл. Ближайшее, что мне удалось найти – это приложения для распознавания символов, особенно когда у них есть этап распознавания штрихов. Какие-нибудь подсказки? Входные данные будут такими: это, это или это (просто без присутствия студентов). Я ожидаю, что учитель не будет прятать свою руку. Мы можем представить себе начало с пустой доской. Спасибо.

Полный текст

Есть ли какие-либо ссылки или примеры распознавания линий на доске с использованием модели машинного обучения? Задать вопрос

Задано 6 лет, 1 месяц назад Изменено сегодня Просмотрено 205 раз

Задано 6 лет, 1 месяц назад

$2 \begingroup$ Я пытаюсь разработать приложение в реальном времени, которое, на основе последовательности изображений доски, захваченных веб-камерой, распознает линии, которые на ней рисуются. Оно должно уметь распознавать линии с фона доски, фильтровать присутствие учителя на изображении и преобразовывать эти линии в некоторое представление (например, список основных событий, таких как «начало линии в xxx,xxx», «продолжение линии в xxx,xxx» и т.д.). После нескольких дней поисков я ничего не нашёл. Ближайшее, что мне удалось найти – это приложения для распознавания символов, особенно когда они имеют стадию распознавания штрихов. Есть ли какие-нибудь подсказки? Вход будет в виде последовательности, такой как эта, эта или эта (просто без присутствия студентов). Я ожидаю, что учитель не будет прятать свою руку. Мы можем представить себе начало с пустой доски. Спасибо. Примечание: я ищу не просто ответ, который говорит только о чём-то вроде «вы можете использовать глубокое обучение, обучив его двум классам», без деталей или ссылок. Объект запроса ссылки Обнаружение объектов Обработка изображений Улучшить этот вопрос Следить за редактированием 29 мин назад Mr. AI Cool 1,277 2 2 серебряные значки 21 21 бронзовый значок задано 14 декабря 2019 г. в 11:47 pasaba por aqui 1,313 7 7 серебряные значки 21 21 бронзовый значок задано 14 декабря 2019 г. в 11:47 $\endgroup$ 3 1 $\begingroup$ Я бы рассмотрел преобразование Хоука en.wikipedia.org/wiki/Hough_transform $\endgroup$ George White – George White 2019-12-14 18:53:38 +00:00 Задано 14 декабря 2019 г. в 18:53 $\begingroup$ @GeorgeWhite: спасибо за ваш комментарий. Как вы знаете, преобразование Хоука в основном предназначено для обнаружения прямых линий. Его можно обобщить на другие параметрические кривые, но я не вижу перспектив его использования в случае свободной формы. $\endgroup$ pasaba por aqui – pasaba por aqui 2019-12-14 19:31:36 +00:00 Задано 14 декабря 2019 г. в 19:31 $\begingroup$ Из «начало линии в xxx,xxx», «продолжение линии в xxx,xxx» я думал, что вы предполагали прямые линии. $\endgroup$ George White – George White 2019-12-14 19:33:40 +00:00 Задано 14 декабря 2019 г. в 19:33 Добавить комментарий | 2 Ответа 2 Отсортировано по: Сбросить по умолчанию Наивысший балл (по умолчанию) Измененный дата (от новых к старым) Создан дата (от старых к новым) 0 $\begingroup$ Я предполагаю, что камера стабильна (без изменения положения, масштаба или других настроек во время записи видео), в противном случае задача становится значительно более сложной. Предположим, что ваш набор данных представляет собой массив растров (изображения в формате массива). Вы упоминаете, что хотите обнаруживать события «начало линии» и «конец линии». Один из способов сделать это — вычислить приблизительную производную от вашей последовательности изображений. Например, возьмите изображение растра в индексе idx и следующее за ним изображение в индексе idx+1 (захваченные в моменты t и t + Δt, где Δt - интервал выборки). В координатах (i,j), эта производная может выглядеть примерно так: timeDerivative = (images[idx][j][i] - images[idx+1][j][i])/DeltaT. Это грубая оценка, и существуют лучшие способы вычисления приблизительной дискретной производной, но идея понятна. Последующим шагом может быть объявление состояния записи: рисуется ли линия или нет рисования. Состояния мы предполагаем, что они всегда чередуются, поскольку учитель должен отвести свою руку, чтобы нарисовать новую линию. Если обнаружена большая производная (область изображения внезапно переходит из черного в белый), и состояние «не рисует», записывается событие «начало линии», а состояние переключается на «рисует». Пока большая производная продолжает обнаруживаться по мере продвижения во времени в окрестности предыдущей точки с большой производной, ничего не меняется. Как только это перестанет быть правдой, состояние переключится на «не рисует» и записывается событие «конец линии» в последней точке с большой производной. Это основная идея, которую можно