Сбросить

У меня задача по цифровизации документов, где я хочу обнаруживать технические чертежи на изображениях. Эти изображения в основном состоят из объектов, образованных комбинацией фигур, таких как линии, окружности и прямоугольники. Вот пример: Что я ожидаю получить в результате – обнаружение всех "объе...

Для курсового проекта необходимо разработать алгоритм машинного обучения, в котором пользователь заполняет форму, а алгоритм анализирует наиболее подходящий университет на основе ответов. Я новичок в области машинного обучения и не знаю, какой тип алгоритма мы можем использовать. Является ли рекомен...

Во время обучения нейронной сети тестовая потеря достигла минимума на x-й эпохе, после чего я повторил обучение, установив максимальную эпоху равной x. Меня удивляет, что тестовая потеря во втором запуске сильно отличается от первой на эпохе x, хотя все остальные гиперпараметры остались теми же. Еди...

Во время обучения нейронной сети тестовая ошибка достигла минимума на x-й эпохе. Затем я повторил обучение, установив максимальную эпоху равной x. Для меня удивительно, что тестовая ошибка во втором запуске на x-й эпохе сильно отличалась от первой, хотя все остальные гиперпараметры были одинаковыми....

Во время обучения нейронной сети тестовая потеря достигла своего минимума наx-й эпохе. Затем я повторно запустил обучение с максимальным числом эпох, установленным какx. То, что меня удивляет, это то, что тестовая потеря во втором запуске была очень отличной от первого наx-й эпохе, несмотря на то, ч...

ChatGPT в последнее время привлекает много внимания, и это заслуженно. Он демонстрирует впечатляющие способности в ответах на новую информацию, а также в обобщении предоставленных данных. Однако ChatGPT также регулярно допускает логические и математические ошибки. Некоторые отмечают, что он действит...

Я воспроизвожу определенную архитектуру сети, которая очень скупо описывается. Одна часть этой архитектуры представлена на изображении, где выход 1x1024 или 1024x1 от трансформера должен быть объединен с выходом MLP для получения вектора 1x55 или 55x1, порядок измерений не имеет значения. Таким обра...

В данной статье мы рассмотрим топ-10 инструментов искусственного интеллекта (ИИ), которые способствуют инновациям и повышению эффективности в различных отраслях. Эти инструменты предназначены для автоматизации повторяющихся задач, улучшения рабочих процессов и повышения производительности. Инструмен...

Из книги «Глубокое обучение» (Курвилл, Гудфеллоу, Бенжио): активация ReLU часто «умирает», поскольку один из недостатков выпрямленных линейных единиц заключается в том, что они не могут обучаться с помощью градиентных методов на примерах, для которых их активация равна нулю. Аналогично, регуляризаци...

Я работаю над примером Transformer, который демонстрируется на сайте TensorFlow: https://www.tensorflow.org/text/tutorials/transformer В этом примере модель машинного перевода обучается для перевода с португальского на английский. Трансформер кодируется с нуля и не используются другие популярные биб...