Я разработал с нуля базовую нейронную сеть прямого распространения для классификации изображений: кошка или не кошка. Она работает нормально, но после 2500 итераций моя функция потерь не уменьшается должным образом. Я использую функцию потерь $L(\hat{y},y) = -ylog\hat{y}-(1-y)log(1-\hat{y})$. Не мог...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 74380
Я совсем недавно начал заниматься глубоким обучением. Я только что завершил специализацию по глубокому обучению профессора Эндрю Нга и Deep Learning AI. Теперь мой профессор (преподаватель) посоветовал мне ознакомиться с некоторыми классическими статьями о выделении аспектов и анализе мнений из виде...
Я закодировал версию Breakout с использованием оперативной памяти (RAM), однако, к сожалению, её максимальный результат составил всего лишь 5 очков. Я тренировался около двух часов и ни разу не достиг большего результата. Код довольно большой, поэтому я не могу вставить его сюда, но вкратце: я испол...
У меня есть таблица Excel, заполненная моими собственными оценками просмотренных фильмов, и я хочу использовать её для тренировки модели ИИ, чтобы она могла предсказывать, понравится ли мне конкретный фильм или нет, исходя из тех, которые я уже видел. Данные оформлены следующим образом (просто приме...
В ходе обсуждения моего вопроса на Math SE я объяснил одному пользователю, как, по моему мнению, работает ИИ, и написал, что с помощью функции сигмоиды (логистической) идентифицируются признаки набора данных, и многие такие итерации обеспечивают обучение. Является ли моё понимание того, как это рабо...
Согласно Брайану Канцвеллу Смиту, любое вычисление требует представления. Следовательно, компьютеры зависят от моделей. Таким образом, мы можем сказать, что ИИ ограничен внутренне моделью и внешне окружающей средой. Эта проблема обсуждается здесь в предыдущем вопросе, который я задал. Теперь рассмот...
Читаю статью, в которой реализован алгоритм градиентной политики глубокого детерминированного портфеля управления активами. Мой вопрос касается конкретной реализации нейронной сети, показанной на этой иллюстрации (статья, рисунок находится на странице 14). Первые три шага — свёрточные слои. После то...
XOR — это нелинейный набор данных. Его нельзя решить с помощью нейронной сети на основе любого количества перцептронов, но если к перцептронам применить сигмоидальную функцию активации, мы можем решить набор данных XOR. Однако я столкнулся с источником, в котором следующее утверждение указано как ло...
XOR является нелинейным набором данных. Его нельзя решить с помощью нейронных сетей, основанных на любом количестве перцептронов, но когда перцептроны применяют функцию активации сигмоиды, они могут решить набор данных XOR. Однако я столкнулся с источником, в котором утверждается, что следующее утве...
Я читал статью «Learning to Prune Filters in Convolutional Neural Networks», в которой речь идет об обрезке фильтров CNN с использованием обучения с подкреплением (policy gradient). В статье говорится, что входом для агента по обрезке (агентом является сверточная нейронная сеть) является двумерный м...