Предсказание вероятностей событий с использованием нейронных сетей
Краткое содержание
У меня есть несколько тысяч последовательностей вида 1.23, 2.15, 3.19, 4.30, 5.24, 6.22, где числа обозначают времена, в которые произошли события (существует всего один тип событий). События являются периодическими, и период известен точно и равен единице, однако точные времена варьируются. Иногда события отсутствуют и случаются другие нерегулярности, но давайте пока проигнорируем их. Я хотел бы обучить нейронную сеть для предсказания вероятности того, что в заданном временном интервале произойдет следующее событие. Проблема в том, что у меня нет вероятностей для обучения. Все, что у меня есть, — это вышеупомянутые последовательности. Если бы у меня было четыре последовательности вида 1.23, 2.15, 3.19, 4.30, 5.24, 6.05; 1.23, 2.15, 3.19, 4.30, 5.24, 6.83; 1.23, 2.15, 3.19, 4.30, 5.24, 6.27; 1.23, 2.15, 3.19, 4.30, 5.24, 6.22; 1.23, 2.15, 3.19, 4.30, 5.24, 6.17, то я мог бы сказать, что вероятность события в интервале [6.10, 6.30] составляет 60%, и использовать это значение для обучения. Однако все мои последовательности разные. Я мог бы попытаться сгруппировать их каким-либо образом, чтобы
Полный текст
Задан 5 лет, 11 месяцев назад Изменен сегодня Просмотрено 685 раз
Задан 5 лет, 11 месяцев назад
1 $\begingroup$ У меня есть несколько тысяч последовательностей вида 1.23, 2.15. 3.19, 4.30, 5.24, 6.22, где числа обозначают времена, в которые произошли события (есть только один вид событий). События носят периодический характер, и период известен точно и равен единице, однако точные времена варьируются. Иногда события отсутствуют и бывают другие нерегулярности, но пока проигнорируем их. Я хотел бы обучить нейронную сеть для предсказания вероятности того, что в заданном временном интервале произойдет следующее событие. Проблема в том, что у меня нет вероятностей для обучения. Все, что у меня есть, — это вышеуказанные последовательности. Если бы у меня было четыре последовательности вида 1.23, 2.15. 3.19, 4.30, 5.24, 6.05 1.23, 2.15. 3.19, 4.30, 5.24, 6.83 1.23, 2.15. 3.19, 4.30, 5.24, 6.27 1.23, 2.15. 3.19, 4.30, 5.24, 6.22 1.23, 2.15. 3.19, 4.30, 5.24, 6.17, то я мог бы сказать, что вероятность события в интервале [6.10, 6.30] равна 60%, и использовать это значение для обучения. Однако все мои последовательности разные. Я мог бы попытаться сгруппировать их каким-то образом, чтобы определить нечто подобное вероятности, но это звучит гораздо сложнее того, чего я пытаюсь достичь. Вместо этого я мог бы попытаться использовать последовательность 1.23, 2.15. 3.19, 4.30, 5.24, 6.22, чтобы выучить, что после префикса 1.23, 2.15. 3.19, 4.30, 5.24, в интервале [6.10, 6.30] гарантированно произойдет событие (значение для обучения равно единице); если бы вместо 6.22 было 6.05, значение для обучения было бы нулем. Обученная сеть выдавала бы среднее значение (скажем, 0.60). Однако ошибка никогда не сойдет к нулю, так что не будет критерия качества, и, вероятно, есть большой риск переобучения, приводящего к бессмысленным результатам. Есть ли способ справиться с этим? neural-networks prediction probability Share Improve this question Follow asked Jan 27, 2020 at 12:50 maaartinus 573 3 3 silver badges 9 9 bronze badges $\endgroup$ 2 1 $\begingroup$ Не могли бы вы помочь нам уточнить постановку вашей задачи? В качестве входных данных задана временная серия $(t_0, t_1, ..., t_n)$, вы хотите, чтобы нейронная сеть предсказывала, будет ли событие в интервале $[t_n, t_{n+\tau}]$, с фиксированным $\tau$ для всех предсказаний? Или вы хотите, чтобы нейронная сеть предсказывала вероятность того, что событие произойдет в $[t_1, t_2]$, для любых заданных на вход $t_1$ и $t_2$? Или это что-то другое? $\endgroup$ Raphael Lopez Kaufman – Raphael Lopez Kaufman 2022-06-15 19:32:35 +00:00 Commented Jun 15, 2022 at 19:32 $\begingroup$ Я согласен с @Raphael Lopez kaufman, что вопрос в его текущем виде не ясен. Пожалуйста, пересмотрите свой пост в соответствии с его запросом. $\endgroup$ Snehal Patel – Snehal Patel 2022-11-13 05:27:32 +00:00 Commented Nov 13, 2022 at 5:27 Add a comment | 4 Answers 4 Sorted by: Reset to default Highest score (default) Date modified (newest first) Date created (oldest first) 0 $\begingroup$ Вы можете настроить нейронную сеть для предсказания, есть ли событие в случайно выбранном интервале. То есть, если в вашем наборе данных для обучения в этом интервале есть событие, вы обучаете сеть выводить 1, иначе вы обучаете выводить 0. Если вы используете квадратичную функцию потерь, предсказание НС должно аппроксимировать вероятность такого события. Переобучение можно отслеживать, разделив ваши данные для обучения на обучающий и тестовый наборы. Если вы обучаете RNN, подавая на вход интервалы между событиями, эти интервалы должны быть более похожими, чем точные времена событий. Моделирование временной серии таким образом также имеет больше смысла. Конечно, эти детали зависят от того, что именно представляют собой данные. Также возможно, что для этого набора данных невозможны адекватные предсказания. Share Improve this answer Follow answered Jan 27, 2020 at 14:07 BlindKungFuMaster 4,265 14 14 silver badges 23 23 bronze badges $\endgroup$ Add a comment | 0 $\begingroup$ Это в точности то, что делает «классификатор». О «задачах классификации» часто говорят