Главная - AST-AIHub

Почему не уменьшается loss моей нейронной сети после 2500 итераций?

2020-07-11 17:01:47

Я разработал с нуля базовую нейронную сеть прямого распространения для классификации изображений: кошка или не кошка. Она работает нормально, но после 2500 итераций моя функция потерь не уменьшается должным образом. Я использую функцию потерь $L(\hat{y},y) = -ylog\hat{y}-(1-y)log(1-\hat{y})$. Не мог...

Читать оригинал Подробнее

Какие есть хорошие статьи или ресурсы по извлечению аспектов и моделированию мнений из видео- или аудиоматериалов?

2020-06-22 12:40:47

Я совсем недавно начал заниматься глубоким обучением. Я только что завершил специализацию по глубокому обучению профессора Эндрю Нга и Deep Learning AI. Теперь мой профессор (преподаватель) посоветовал мне ознакомиться с некоторыми классическими статьями о выделении аспектов и анализе мнений из виде...

Читать оригинал Подробнее

Как реализовать версии игр Atari с использованием оперативной памяти (RAM)

2020-06-06 07:57:34

Я закодировал версию Breakout с использованием оперативной памяти (RAM), однако, к сожалению, её максимальный результат составил всего лишь 5 очков. Я тренировался около двух часов и ни разу не достиг большего результата. Код довольно большой, поэтому я не могу вставить его сюда, но вкратце: я испол...

Читать оригинал Подробнее

Обучите модель, используя многоколончную заполненную текстом таблицу Excel.

2020-06-03 12:13:49

У меня есть таблица Excel, заполненная моими собственными оценками просмотренных фильмов, и я хочу использовать её для тренировки модели ИИ, чтобы она могла предсказывать, понравится ли мне конкретный фильм или нет, исходя из тех, которые я уже видел. Данные оформлены следующим образом (просто приме...

Читать оригинал Подробнее

Понимаю ли я правильно, как работает ИИ?

2020-05-14 22:49:32

В ходе обсуждения моего вопроса на Math SE я объяснил одному пользователю, как, по моему мнению, работает ИИ, и написал, что с помощью функции сигмоиды (логистической) идентифицируются признаки набора данных, и многие такие итерации обеспечивают обучение. Является ли моё понимание того, как это рабо...

Читать оригинал Подробнее

Постигает ли второй неполнота теоремы Гёделя ограничения для систем искусственного интеллекта?

2020-05-13 05:53:45

Согласно Брайану Канцвеллу Смиту, любое вычисление требует представления. Следовательно, компьютеры зависят от моделей. Таким образом, мы можем сказать, что ИИ ограничен внутренне моделью и внешне окружающей средой. Эта проблема обсуждается здесь в предыдущем вопросе, который я задал. Теперь рассмот...

Читать оригинал Подробнее

Что авторы данной статьи подразумевают под термином смещения (bias term) на этой иллюстрации реализации нейронной сети?

2020-05-09 19:49:04

Читаю статью, в которой реализован алгоритм градиентной политики глубокого детерминированного портфеля управления активами. Мой вопрос касается конкретной реализации нейронной сети, показанной на этой иллюстрации (статья, рисунок находится на странице 14). Первые три шага — свёрточные слои. После то...

Читать оригинал Подробнее

Решение функции XOR с помощью нейронной сети без скрытых слоев

2020-05-04 12:54:04

XOR — это нелинейный набор данных. Его нельзя решить с помощью нейронной сети на основе любого количества перцептронов, но если к перцептронам применить сигмоидальную функцию активации, мы можем решить набор данных XOR. Однако я столкнулся с источником, в котором следующее утверждение указано как ло...

Читать оригинал Подробнее

Может ли нейронная сеть решить функцию XOR без использования скрытых слоев?

2020-05-04 12:54:04

XOR является нелинейным набором данных. Его нельзя решить с помощью нейронных сетей, основанных на любом количестве перцептронов, но когда перцептроны применяют функцию активации сигмоиды, они могут решить набор данных XOR. Однако я столкнулся с источником, в котором утверждается, что следующее утве...

Читать оригинал Подробнее

Как можно многократно сэмплировать выходное распределение при отсечении фильтров с помощью обучения с подкреплением?

2020-04-26 01:16:07

Я читал статью «Learning to Prune Filters in Convolutional Neural Networks», в которой речь идет об обрезке фильтров CNN с использованием обучения с подкреплением (policy gradient). В статье говорится, что входом для агента по обрезке (агентом является сверточная нейронная сеть) является двумерный м...

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)