Как математически доказать, что каждый чисто реактивный агент обладает поведением, эквивалентным стандартному агенту?
Краткое содержание
Это в какой-то мере интуитивно понятно, но я не уверен насчет формального доказательства. Я начну с краткого перечисления определений из "Введение в мультиагентные системы", Уудворд, 2002, а затем представлю мои попытки рассуждений на данный момент. $E$ – это конечный набор дискретных, мгновенных состояний, ($E = (e, e', ...)$). $Ac$ – это репертуар возможных действий (также конечный), доступный агенту, который преобразует среду, ($Ac = (\alpha, \alpha', ...)$). Запуск – это последовательность переплетенных состояний среды и действий, $r = (e_0, \alpha_0, e_1, \alpha_1,..., \alpha_{u-1}, e_u)$, множество всех таких возможных конечных последовательностей (над $E$ и $Ac$) – это $R$, $R^E$ – это подмножество $R$, содержащее запуски, заканчивающиеся состоянием среды. Агент, реагирующий только на текущую ситуацию, моделируется как: $Ag_{pure}: E \mapsto Ac$, стандартный агент моделируется как: $Ag_{std}: R^E \mapsto Ac$. Таким образом, если $R^E$ – это последовательность действий агента и состояний среды, то логично, что $E \subset R^E$. Следовательно, $Ag_{std}$ может отображаться на каждое действие, которое может выполнить $Ag_{pure}$. И поведенческая эквивалентность
Полный текст
Задано 5 лет, 11 месяцев назад Изменено сегодня Просмотрено 559 раз
Задано 5 лет, 11 месяцев назад
2 $\begingroup$ Это в какой-то степени интуитивно понятно, но я не уверен насчет формального доказательства. Я начну с краткого перечисления определений из "Многоагентные системы", Воодрудж, 2002 и дам свои попытки рассуждений. $E$ – это конечный набор дискретных, мгновенных состояний, $E=(e, e',...)$. $Ac$ – это репертуар возможных действий (также конечный), доступных агенту, которые преобразуют среду, $Ac=(\alpha, \alpha', ...)$. Бег – это последовательность переплетенных состояний среды и действий, $r=(e_0, \alpha_0, e_1, \alpha_1,..., \alpha_{u-1}, e_u)$, множество всех таких возможных конечных последовательностей (над $E$ и $Ac$) – это $R$, $R^E$ – это подмножество $R$, содержащее беги, заканчивающиеся состоянием среды. Чисто реактивный агент моделируется как: $Ag_{pure}: E\mapsto Ac$, стандартный агент моделируется как $Ag_{std}: R^E\mapsto Ac$. Таким образом, если $R^E$ – это последовательность действий агента и состояний среды, то логично, что $E \subset R^E$. Следовательно, $Ag_{std}$ может отображать каждое действие на которое $Ag_{pure}$ способен. И поведенческая эквивалентность относительно среды $Env$ определяется как $R(Env, Ag_{1}) = R(Env, Ag_{2})$; где $Env=\langle E,e_{0},t \rangle$, $e_{0}$ – начальное состояние среды, $t$ – функция преобразования (определение не имеет значения для текущего момента). Наконец, если $Ag_{pure}: E\mapsto Ac$ и $Ag_{std}: R^E\mapsto Ac$, и $E \subset R^E$, мы можем сказать, что $R(Env,Ag_{pure}) = R(Env, Ag_{std})$ (возможно, это слишком смелое предположение). Следовательно, любой чисто реактивный агент имеет поведениельно эквивалентного стандартного агента. Обратное может быть неверным, поскольку $E \subset R^E$ означает, что все элементы $E$ принадлежат $R^E$, а не все элементы $R^E$ принадлежат $E$. Это учебная задача, но я не нашел ключ к ответам для проверки моего решения. Если у кого-то есть формально (и возможно математически) доказанное это ранее, можете ли вы опубликовать свои отзывы, мысли, доказательства в комментариях? Например, набор математических шагов для вывода $E \subset R^E$ из их определений: $E=(e_{0}, e_{1},..., e_{u})$ и $R^E$ – "все беги агента, заканчивающиеся состоянием среды" (не найдено формального уравнения) не ясно для меня. math multi-agent-systems Поделиться Улучшить вопрос Следили 1 час назад Mr. AI Cool 1,452 2 2 серебряные значки 21 21 бронзовый значок спросил 18 февраля 2020 г. в 7:13 aidar_ms 21 2 2 бронзовый значок $\endgroup$ 4 $\begingroup$ Привет и добро пожаловать в AI SE. Вы говорите, что "если $R^E$ – это последовательность действий агента и состояний среды, то это просто имеет смысл, что $E \subset R^E$", но я бы сказал, что это не имеет смысла! $E$ – это множество всех состояний среды, а $R^E$ может не содержать всех состояний среды, если я правильно понимаю ваши определения. Я думаю, что вы запутаны в том, что "бег" определяется как $\gamma=(e_0, \alpha_0, e_1, \alpha_1, \dots,e_u, \alpha_u)$, что заставляет вас думать, что оно содержит все состояния среды, но интуитивно это не обязательно так. $\endgroup$ nbro – nbro 2020-02-19 01:07:36 +00:00 Комментировал 19 февраля 2020 г. в 1:07 $\begingroup$ Я исправлю определения. Также, я думаю, что вы правильно указали на ошибку в моих предположениях. $\endgroup$ aidar_ms – aidar_ms 2020-02-19 06:04:11 +00:00 Комментировал 19 февраля 2020 г. в 6:04 $\begingroup$ Но я думаю, что пример с шахматами делает это немного понятнее (по крайней мере, я думаю, что это начало :D). $E$ – все законные позиции; $Ac$ – все законные ходы; $r$ – игра (последовательность позиций и ходов); $R$ – множество всех возможных игр; $R^{Ac}$ – подмножество $R$, набор последовательностей, заканчивающихся ходом; $R^E$ – подмножество $R$, набор последовательностей, заканчивающихся позицией. Я думаю, что теоретически мы можем видеть, что $R^E$, будучи множеством всех возможных игр с позицией, действительно включает в себя $E$. $\endgroup$ aidar_ms – aidar_ms 2020-02-19 06:35:19 +00:00