Что такое факты? Автоматическое извлечение фактов, установленных судом, из решений уголовного суда
Краткое содержание
arXiv:2511.05320v1 Тип объявления: кросс Аннотация: Административные данные системы уголовного правосудия содержат лишь ограниченный объем сведений о совершенных преступлениях. Однако существует неиспользуемый источник обширной информации — решения судов континентальной Европы, содержащие описания преступных деяний, за которые обвиняемые были признаны виновными. В данной работе мы исследовали возможность извлечения этих описаний из общедоступных судебных решений Словакии. Мы использовали два различных подхода к извлечению информации: регулярные выражения и большие языковые модели (LLM). Базовый подход заключался в простом методе поиска типичных слов, встречающихся до и после описания, используя регулярные выражения. Усовершенствованный подход с регулярными выражениями дополнительно учитывал особенности написания слова «сбережение» («sparing») и его нормализацию (вставка пробелов между отдельными буквами), характерную для выделения описания. Подход с использованием больших языковых моделей включал применение модели Gemini Flash 2.0 для извлечения описаний с помощью предварительно определенных подсказок.
Полный текст статьи пока не загружен.