Задержки и эффекты упорядочивания в онлайн-решениях

2025-11-18 05:00:00

Краткое содержание

arXiv:2511.13060v1 Тип: новая статья Аннотация: Онлайн-системы принятия решений часто работают в условиях запаздывающей обратной связи и чувствительной к порядку (некоммутативной) динамики: действия влияют на то, какие наблюдения поступают и в какой последовательности. Принимая расхождение Брегмана $D_\Phi$ в качестве базового показателя потерь, мы доказываем, что избыточные базовые потери допускают структурированную нижнюю границу $L \ge L_{\mathrm{ideal}} + g_1(\lambda) + g_2(\varepsilon_\star) + g_{12}(\lambda,\varepsilon_\star) - D_{\mathrm{ncx}}$, где $g_1$ и $g_2$ — калиброванные штрафы за задержку и чувствительность к порядку, $g_{12}$ отражает их геометрическое взаимодействие, а $D_{\mathrm{ncx}}\ge 0$ — штраф за невыпуклость/аппроксимацию, который исчезает при выполнении условий выпуклости по Лежандру. Мы расширяем это неравенство на прокс-регулярные и слабо выпуклые случаи, получая робастные гарантии за пределами выпуклого случая. Мы также предлагаем операционный рецепт для оценки и мониторинга этих четырёх членов с помощью простых рандомизированных $2\times 2$ экспериментов и потоковой диагностики.

Полный текст статьи пока не загружен.

Читать оригинал статьи