Как обрабатывать чрезвычайно «длинные» изображения?
Краткое содержание
После преобразования временных рядов в формат изображения получается соотношение ширины к высоте примерно 135. Типичные приложения CNN с изображениями включают либо квадратные, либо достаточно прямоугольные пропорции – а мои выглядят почти как линии: Пример размеров: (16000, 120, 16) = (ширина, высота, каналы). Ожидают ли 2D CNN хорошо работать с такими соотношениями сторон? Какие гиперпараметры уместны - в частности, в терминах Keras/TF, strides, kernel_size (предпочтителен ли 'неравномерный' размер, например, strides=(16, 1))? Полезные публикации были бы кстати. Уточнение: ширина == временным рядам. Изображения получаются посредством преобразования временного ряда, например, Кратновременной Фурье-преобразованию. каналы - это исходные каналы. высота – результат преобразования, например, частотная информация. Задача состоит в бинарной классификации данных ЭЭГ (с сигмоидной функцией вывода).
Полный текст
Задано 5 лет, 8 месяцев назад Изменено сегодня Просмотрено 335 раз
Задано 5 лет, 8 месяцев назад
1 $\begingroup$ После преобразования временных рядов в формат изображения, я получаю отношение ширины-высоты ~135. Типичные CNN приложения для изображений включают либо квадратные, либо разумно прямоугольные пропорции - в то время как у меня они почти как линии: Пример размеров: (16000, 120, 16) = (ширина, высота, каналы). Подходят ли 2D CNN для работы с такими соотношениями сторон? Какие гиперпараметры подходят — в частности, в Keras/TF терминах, stride , kernel_size (предпочтителен ли "неравный" например, strides=(16, 1))? Полезны были бы соответствующие публикации. Уточнение: ширина == timesteps. Изображения получаются посредством преобразования временного ряда, например, Кратковременная Фурье Преобразование. Каналы — это исходные каналы. Высота — результат преобразования, например, частотная информация. Задача — бинарная классификация данных ЭЭГ (с сигмоидной функцией вывода). Полезный нич тон convolutional-neural-networks tensorflow python keras image-processing Улучшить вопрос Следить за изменениями отредактировано 6 апреля 2020 г. в 12:08 задано 5 апреля 2020 г. в 18:08 OverLordGoldDragon 158 6 6 бронзовые значки $\endgroup$ 7 $\begingroup$ Имеют ли пространственные корреляции по вертикали (высоте) значение? То есть имеет ли физический смысл расстояние по вертикали? $\endgroup$ MPA – MPA 2020-04-06 11:51:53 +00:00 Комментарий 6 апреля 2020 г. в 11:51 $\begingroup$ @MPA Вопрос обновлен $\endgroup$ OverLordGoldDragon – OverLordGoldDragon 2020-04-06 11:58:59 +00:00 Комментарий 6 апреля 2020 г. в 11:58 $\begingroup$ Какой тип выходных данных? Классовая метка (например, для обнаружения), временной ряд (например, для фильтрации) и т.д.? $\endgroup$ MPA – MPA 2020-04-06 12:07:52 +00:00 Комментарий 6 апреля 2020 г. в 12:07 $\begingroup$ @MPA Бинарная классификация, обновлено снова $\endgroup$ OverLordGoldDragon – OverLordGoldDragon 2020-04-06 12:09:05 +00:00 Комментарий 6 апреля 2020 г. в 12:09 $\begingroup$ В зависимости от физической природы входных данных, можно сначала выполнить 1D свертки с уменьшением размерности вдоль временной оси для извлечения наиболее релевантных признаков для каждого частотного диапазона, а затем объединить признаки каждого частотного диапазона в предсказание класса. Или если данные достаточно гладкие, можно попробовать автокодировщик для сжатия временной оси до меньшего латентного представления и проведения дальнейшего анализа в латентном пространстве. $\endgroup$ MPA – MPA 2020-04-06 14:00:14 +00:00 Комментарий 6 апреля 2020 г. в 14:00 | Показать 2 дополнительных комментария 1 Ответ 1 Отсортировано по: Сбросить до значения по умолчанию Наивысший рейтинг (по умолчанию) Измененная дата (от новых к старым) Создана дата (от старых к новым) 0 $\begingroup$ Я недавно использовал несколько необычный метод для обработки таких изображений, который включал использование RNN. Предположим, что размеры изображения составляют (16000, 120, 16) = (ширина, высота, каналы), как в вопросе. Примените 2D свертку (или несколько таких сверток) с формой(1, k, c), чтобы выход от сверток стал (16000, 1, c). Итак, если вы используете только один слой свертки, k=120 . Затем "сжимайте" дополнительное измерение, чтобы получить форму (16000, c). Теперь проблема преобразована обратно в проблему последовательности! Вы можете использовать варианты RNN для дальнейшей обработки. Улучшить ответ Следить за изменениями отредактировано 6 апреля 2020 г. в 4:00 отвечено 6 апреля 2020 г. в 3:53 Susmit Agrawal 125 5 5 бронзовые значки $\endgroup$ 1 $\begingroup$ Это бессмысленно для задачи; см. обновленный вопрос. $\endgroup$ OverLordGoldDragon – OverLordGoldDragon 2020-04-06 11:58:10 +00:00 Комментарий 6 апреля 2020 г. в 11:58 Добавить комментарий | Вам необходимо войти, чтобы ответить на этот вопрос Задайте вопрос, чтобы получить ответы Найдите ответ на свой вопрос, задав его. Задайте вопрос Исследуйте связанные вопросы convolutional-neural-networks tensorflow python keras image-processing Смотрите похожие вопросы с этими тегами.