Какую нейронную сеть можно использовать для решения этой задачи оптимизации с ограничениями?

2021-05-01 20:57:31

Краткое содержание

Пусть $\mathcal{S}$ — набор обучающих данных, где каждый входной вектор $u^i \in \mathcal{S}$ имеет $d$ признаков. Я хочу спроектировать АПН таким образом, чтобы минимизировалась нижеприведённая функция стоимости (сумма квадратов парных разностей между выходными данными модели) и выполнялось заданное ограничение, где $w$ — вектор параметров АПН. \begin{align} \min _{w}& \sum_{\{i, j\} \in \mathcal{S}}\left(f\left(w, u^{i}\right)-f\left(w, u^{j}\right)\right)^{2} \\ &f\left(w, u^{i}\right) \geq q_{\min }, \quad i \in \mathcal{S} \end{align}Какой вид АПН подходит для этой цели?

Полный текст

Какой нейронной сети использовать для решения этой задачи оптимизации с ограничениями? Задать вопрос

Задано 4 года, 9 месяцев назад Изменено сегодня Просмотрено 362 раза

Задано 4 года, 9 месяцев назад

$4 \begingroup$ Пусть $\mathcal{S}$ — набор обучающих данных, где каждый входной $u^i \in \mathcal{S}$ имеет $d$ признаков. Я хочу спроектировать ANN таким образом, чтобы минимизировалась функция стоимости ниже (сумма квадратов парных разностей между выходными данными модели) и выполнено заданное ограничение, где $w$ — вектор параметров модели ANN.
\begin{align} \min _{w}& \sum_{\{i, j\} \in \mathcal{S}}\left(f\left(w, u^{i}\right)-f\left(w, u^{j}\right)\right)^{2} \\ &f\left(w, u^{i}\right) \geq q_{\min }, \quad i \in \mathcal{S} \end{align} Какая ANN наиболее подходит для этой цели? neural-networks machine-learning architecture model-request constrained-optimization Поделиться Улучшить вопрос Следить за изменениями отредактировано 18 дек. 2021 г. в 9:54 nbro 43,2 тыс. 14 14 золотых значков 121 121 серебряный значок 222 222 бронзовый значок задано 1 мая 2021 г. в 20:57 user3489173 309 1 1 серебряный значок 7 7 бронзовый значок $\endgroup$ $3 \begingroup$ Если сеть выдает qmin постоянно для каждого прогноза, не сводит ли это на нет вашу функцию потерь? $\endgroup$ Mike NZ – Mike NZ 2021-05-01 23:20:56 +00:00 Комментировано 1 мая 2021 г. в 23:20 $4 \begingroup$ @ Mike NZ, да, но постоянная выдача qmin для каждого прогноза невозможна. Мой вопрос был о том, какой тип ANN использовать. $\endgroup$ user3489173 – user3489173 2021-05-01 23:30:37 +00:00 Комментировано 1 мая 2021 г. в 23:30 $4 \begingroup$ @ Mike NZ, на самом деле мне нужно найти структуру ANN, которая минимизирует разницу между выходными данными сети при рассмотрении всех обучающих данных. $\endgroup$ user3489173 – user3489173 2021-05-01 23:35:56 +00:00 Комментировано 1 мая 2021 г. в 23:35 Добавить комментарий | 2 Ответа 2 Сортировка по: Сбросить по умолчанию Наивысший балл (по умолчанию) Измененная дата (от новых к старым) Созданная дата (от старых к новым) $0 \begingroup$ Если я правильно понимаю ваш запрос, вы хотите создать латентное пространство, которое группирует похожие объекты. Тогда вам следует поискать сети сжимающего типа (Siamese networks). Однако вашей функции потерь потребуется еще один член для увеличения разницы между разными метками. В противном случае, как указано Майком NZ, сеть коллапсирует (да, это возможно). Возможно, это даст некоторые сведения. Обратите внимание, что вышеуказанный метод не полностью безразличен. На самом деле есть несколько заявлений об неограниченных классификациях посредством кластеризации, хотя ваша целевая функция будет выглядеть очень иначе. Вы можете ознакомиться с этой статьей (называемой SCAN) для получения более подробной информации. Надеюсь, это поможет. [Редактирование] Если вам нужна (низкоразмерная) репрезентация самих объектов, просмотр этого может помочь. Для сложной задачи линейные сокращения, такие как PCA, хотя и полезны, вероятно, не то, что вам нужно. Здесь вы можете попробовать обучить автоэнкодеры. Функция потерь будет работать вместе с некоторым членом регуляризации. Поделиться Улучшить ответ Следить за изменениями отредактировано 2 мая 2021 г. в 17:26 отвечено 2 мая 2021 г. в 9:10 cybershiptrooper 174 2 2 бронзовые значки $\endgroup$ $3 \begingroup$ @ cybershiptrooper, проблема, которую я решаю, заключается в следующем: предположим, что у нас есть набор S, состоящий из N человек, и для них мы определяем d-мерный вектор признаков. Вектор признаков включает признаки, характеризующие "качество" людей. Я считаю, что хотя каждый человек в S имеет разные значения признаков, они одинаковы по качеству. Следовательно, я хочу спроектировать ANN, которая будет минимизировать их различия. $\endgroup$ user3489173 – user3489173 2021-05-02 12:20:58 +00:00 Комментировано 2 мая 2021 г. в 12:20 $4 \begingroup$ @user3489173, значит вам нужно что-то вроде понижения размерности? Попробуйте использовать архитектуры типа автоэнкодер. Я добавил больше деталей в свой ответ. $\endgroup$ cybershiptrooper – cybershiptrooper 2021-05-02 17:20:50 +00:00 Комментировано 2 мая 2021 г. в 17:20 $4 \begingroup$ @ cybershiptrooper Это не имеет ничего общего с понижением размерности. Проблема заключается в том, что...

Читать оригинал статьи