Инструктивное Тюнингование Хронологически Согласованных Языковых Моделей
Краткое содержание
arXiv:2510.11677v2 Тип объявления: замена Аннотация: Мы представляем семейство хронологически согласованных больших языковых моделей, дообученных на инструкциях, для устранения смещения, вызванного предвидением. Каждая модель обучается только на данных, доступных до чётко определённой даты отсечки по знаниям, что обеспечивает строгое временное отделение от любых данных после этой отсечки. Получившаяся система предлагает (i) простой разговорный чат-интерфейс, (ii) полностью открытые, фиксированные веса моделей, гарантирующие воспроизводимость, и (iii) консервативную нижнюю границу точности прогнозирования, выделяя ту долю предсказуемости, которая сохраняется после устранения утечки данных из обучающей выборки. В совокупности эти особенности предоставляют исследователям простой в использовании инструмент генеративного ИИ, пригодный для широкого спектра прогнозных задач и свободный от смещения, вызванного предвидением.
Полный текст статьи пока не загружен.