Почему многопользовательские игры с неполной информацией и играми в карты на выбывание сложны для ИИ?

29.12.2020 09:27

Краткое содержание

Искусственный интеллект достиг сверхчеловеческого уровня в многих сложных играх, таких как шахматы, го, техасский покер, Dota 2 и StarCraft 2. Однако он все еще не достиг этого уровня в играх с картами, где требуется определение победителя хода (trick-taking card games). Почему нет сверхчеловечного ИИ, играющего в многопользовательские игры с карточными играми с неполной информацией, такие как Spades, Whist, Hearts, Euchre и Bridge? В частности, каковы препятствия для создания такого ИИ? Я думаю, что это причины, по которым Spades трудно освоить для ИИ: игры с неполной информацией представляют собой две отдельные проблемы: выбор хода и вывод. Размер игрового дерева не мал, однако более крупные игры были овладены. I. История размера: $14!^4 = 5.7 \cdot 10^{43}$ II. Существует $\frac{52!}{13!^4}= 5.4 \cdot 10^{28}$ возможных начальных состояний. III. Каждое начальный набор информации может быть завершен в полном состоянии $ \frac{39!}{13!^3}=8.45\cdot10^{16} $способами. Оценка производится только на терминальных состояниях. Многопользовательские игры: I. сложнее обрезать - алгоритмы поиска менее эффективны II. моделирование оппонента затруднено.

Полный текст

Почему многопользовательские, неполная информация, игры с выигрышем карт затрудняют работу ИИ? Задайте вопрос

Задано 4 года, 11 месяцев назад Изменено сегодня Просмотрено 995 раз

Задано 4 года, 11 месяцев назад

5 $\begingroup$ ИИ достиг сверхчеловеческого уровня во многих сложных играх, таких как Шахматы, Го, Техасский Холдем, Dota2 и StarCraft2. Однако он все еще не достиг этого уровня в играх с выигрышем карт. Почему нет сверхчеловеческого ИИ, играющего в игры с неполной информацией, многопользовательские, с выигрышем карт, такие как Спейдс, Уизт, Хартс, Юкер и Брідж? В частности, каковы препятствия для создания сверхчеловеческого ИИ в этих играх? Я думаю, что эти причины затрудняют освоение Спейдс ИИ: игры с неполной информацией представляют собой две отдельные проблемы: выбор ходов и вывод. Размер игрового дерева не мал, однако большие игры были овладены. I. История размера: $14!^4 = 5.7\cdot10^{43}$ II. Существует $\frac{52!}{13!^4}= 5.4\cdot10^{28}$ возможных начальных состояний. III. Каждое начальный набор информации может быть завершен в полное состояние $\frac{39!}{13!^3}=8.45\cdot10^{16} $ способами Оценка только на терминальных состояниях . Многопользовательские игры: I. сложнее обрезать – алгоритмы поиска менее эффективны II. моделирование оппонента затруднено III. выбор цели - существует несколько целей, необходимо менять цели по ходу раунда в соответствии с полученной информацией. Агент должен координироваться с партнером: конвенции, сигналы . состояние игры передовые вычислительные сложности игры с неполной информацией-случайные игры Улучшите этот вопрос Следите за изменениями отредактировано 21 нояб. 2023 г., 5:55 Ray 344 4 4 серебряных значков 12 12 бронзовых значков задано 29 дек. 2020 г., 9:27 Cohensius 423 3 3 серебряных значков 15 15 бронзовых значков $\endgroup$ 6 $\begingroup$ Не является ли покер игрой с неполной информацией и многопользовательской? Я думаю, что да. Поэтому я предполагаю, что вас интересует только то, почему игры, такие как Спейдс (которые, по-видимому, называются "играми с выигрышем карт"), еще не были "решены" ИИ. Не является ли покер более сложной игрой, чем Спейдс? Я не знаю, потому что я не думаю, что мне знакома игра Спейдс, но я хорошо знаком с одним вариантом покера. Если да, то, возможно, еще нет ИИ, который решает Спейдс, просто потому, что никто не проявлял к этой игре интереса. Это просто предположение. $\endgroup$ nbro – nbro 2021-01-21 00:26:25 +00:00 Комментировано 21 января 2021 г., 0:26 1 $\begingroup$ Были проведены обширные исследования игр с выигрышем карт, особенно Бріджа. Исследования Спейдс были сделаны в основном Стюртвейном и др. webdocs.cs.ualberta.ca/~nathanst/papers/mpuct_icga.pdf и AI factory core.ac.uk/download/pdf/157854537.pdf $\endgroup$ Cohensius – Cohensius 2021-01-21 07:06:00 +00:00 Комментировано 21 января 2021 г., 7:06 1 $\begingroup$ Первый документ имеет более чем 10 лет, а второй - более свежий. Просто чтобы иметь представление, потому что сейчас у меня нет времени читать их, они (в примере со вторым, по крайней мере) пытались использовать последние техники, которые также использовались в случае, например, покера или AlphaGo, или они используют, возможно, более традиционные подходы? Честно говоря, я не знаком со всеми деталями, даже с AlphaGo, но, насколько мне известно, он использует MCTS и RL. Большинство других, о которых вы упоминаете, которые достигли сверхчеловеческой производительности, вероятно, также используют эти техники (по крайней мере, RL). $\endgroup$ nbro – nbro 2021-01-21 16:49:30 +00:00 Комментировано 21 января 2021 г., 16:49 $\begingroup$ Да, они оба пытались использовать MCTS / UCT. Я использовал MCTS и Суперивизированное обучение для фазы аукциона на ecai2020.eu/papers/235_paper.pdf однако в моей реализации UCT полезен только в фазе игры вблизи конца раунда (~5 последних карт) частично из-за строгих ограничений по времени / вычислениям. $\endgroup$ Cohensius – Cohensius 2021-01-21 20:27:24 +00:00 Комментировано 21 января 2021 г., 20:27 1 $\begingroup$ @Cohensius Заметил, что вы сами опубликовали статью на эту тему ( arxiv.org/abs/1912.11323 ) так что, возможно, нам следует задавать вам этот вопрос! Я очень хочу узнать, есть ли у вас идея, почему покер не был решен ИИ.

Читать оригинал статьи