При заданной аудиодорожке я пытаюсь найти способ распознать язык речи. Только в небольшом наборе (например, английский против испанского). Существует ли простое решение для определения языка в речи?

Я тренируюсь в тонкой настройке Resnet50 для задачи бинарной классификации. Вот фрагмент моего кода: base_model = ResNet50(weights='imagenet', include_top=False) x = base_model.output x = keras.layers.GlobalAveragePooling2D(name='avg_pool')(x) x = Dropout(0.8)(x) model_prediction = keras.layers.Den...

Я довольно новичок в машинном обучении (я прошел курс Эндрю Нга на Coursera и сейчас начинаю курсы deeplearning.ai). Мне нужно классифицировать действия человека в реальном времени, например: - Левая рука согнута; - Рука над плечом... Сначала я провел небольшое исследование по предобученным моделя...

Я пытаюсь разработать приложение реального времени, которое, на основе последовательности изображений доски, захваченных веб-камерой, распознает линии, рисуемые на ней. Ему необходимо уметь распознавать линии на фоне доски, фильтровать присутствие учителя на изображении и преобразовывать эти линии в...

Я пытаюсь разработать приложение реального времени, которое, на основе последовательности изображений доски, захваченных веб-камерой, распознает линии, которые рисуются на ней. Ему необходимо распознавать эти линии от фона доски, фильтровать присутствие учителя на изображении и преобразовывать эти л...

Теперь я понимаю, что это может нарушать некоторые правила StackExchange, и я совершенно открыт к удалению темы, если это потребуется! Я пытаюсь создать ИИ, который мог бы написать собственную книгу, и понятия не имею, с чего начать и какие алгоритмы и подходы использовать. С чего мне стоит начать и...

Мы используем 2D-лазерный сканер для сканирования различных объектов разной геометрической формы, например, цилиндр, шипованный, цилиндр с выемкой, цилиндр с закругленными краями и т. д. Набор данных содержит точки в формате [x, y], при этом размерность одного полного сканирования составляет 160x2. ...

Мы используем 2D-лазерный сканер для сканирования различных объектов разной геометрической формы, например: цилиндр, шип, цилиндр с вырезом, цилиндр с изогнутыми краями и т. д. Набор данных содержит точки в формате [x, y], при этом размерность одного полного сканирования составляет 160x2. Цель состо...

Мы используем 2D-лазерный сканер для сканирования различных объектов с разной геометрической формой, например: цилиндр, шип, цилиндр с вырезом, цилиндр с изогнутыми краями и т. д. Набор данных содержит точки в формате [x, y], при этом размерность одного полного сканирования составляет 160x2. Цель со...

Потеря RPN в статье Faster R-CNN: $$L({p_i}, {t_i}) = \frac{1}{N_{cls}} \sum_{i} L_{cls}(p_i,p_i^*) + \lambda \frac{1}{N_{reg}} \sum_i p_i^* L_{reg}(t_i, t_i^*)$$ Для задач регрессии используется следующая параметризация: $$t_x=\frac{x - x_a}{w_a}, \\ t_y=\frac{y−y_a}{h_a}, \\ t_w= \log \left( \frac...