Линейные бандиты высокой размерности при стохастической латентной гетерогенности
Краткое содержание
arXiv:2502.00423v2 Тип объявления: замена Аннотация: В данной работе рассматривается критически важная проблема стохастической латентной гетерогенности в онлайн-принятии решений, когда реакции индивидов на действия варьируются не только в зависимости от наблюдаемых контекстов, но также зависят от ненаблюдаемых случайных подгрупп. Современные данные-ориентированные подходы преимущественно учитывают наблюдаемую гетерогенность через контекстуальные признаки, однако оказываются неэффективными, когда источники вариативности являются скрытыми и стохастическими. Мы предлагаем фреймворк латентно-гетерогенных бандитов, который явным образом моделирует вероятностную принадлежность к подгруппе и специфичные для группы функции вознаграждения, используя целевое продвижение в качестве мотивирующего примера. Наш фазовый алгоритм EM-жадный совместно изучает вероятности принадлежности к скрытой группе и параметры вознаграждений в пространствах высокой размерности, достигая оптимальных гарантий оценки и классификации. Наш анализ выявляет новое явление, уникальное для принятия решений в условиях наличия стохастических латентных подгрупп: случайность реализаций групп создает необратимую неопределённость в классификации.
Полный текст статьи пока не загружен.