Теоретический анализ обнаружения временных рядов, генерируемых большими моделями

2025-11-12 05:00:00

Краткое содержание

arXiv:2511.07104v2 Тип объявления: замена Аннотация: В данной работе мы исследуем проблему выявления синтетических временных рядов, генерируемых большими моделями временных рядов (TSLM), мотивированные возрастающими рисками неправильного использования и фабрикации данных. Несмотря на обширные исследования методов обнаружения текста, создаваемого моделями, мы обнаружили, что существующие методы неприменимы к временным рядам вследствие фундаментальных различий в типе данных — временные ряды обычно имеют меньшую информационную плотность и более гладкое распределение вероятностей по сравнению с текстом, что ограничивает дискриминационные возможности детекторов, основанных на токенах. Для решения этой проблемы мы изучаем тонкие различия распределений между реальными и искусственно созданными временными рядами и предлагаем гипотезу сжатия, согласно которой временные ряды, созданные моделью, в отличие от реальных, демонстрируют прогрессивное уменьшение неопределенности при рекурсивном прогнозировании. Мы строго доказываем эту гипотезу исходя из теоретических предположений относительно поведения модели и структуры временного ряда.

Полный текст статьи пока не загружен.

Читать оригинал статьи