ArliAI: QwQ 32B RpR v1 (бесплатная версия) (arliai/qwq-32b-arliai-rpr-v1)
Краткое содержание
QwQ-32B-ArliAI-RpR-v1 — это модель с параметрами объёмом 32 миллиарда, дообученная на основе модели Qwen/QwQ-32B с использованием специально подобранного набора данных творческого письма и ролевых игр, изначально разработанного для серии RPMax. Модель предназначена для поддержания связности и рассуждений в ходе длительных многоходовых диалогов путём введения явных этапов рассуждения на каждом этапе диалога, генерируемых и уточняемых самой базовой моделью. Обучение проводилось методом RS-QLORA+ на последовательностях длиной 8К символов и поддерживает окна контекста размером до 128К (с практической производительностью около 32К). Оптимизированная для креативной ролевой игры и генерации диалогов, модель акцентирует внимание на минимизации повторений между контекстами при сохранении стилистического разнообразия.
Полный текст статьи пока не загружен.