← Вернуться к списку
Нейрочат 7Б версии 3.1 (интел/нейро-чат-7б)
Краткое содержание
Настроенная модель на основе mistralai/Mistral-7B-v0.1 на открытом датасете Open-Orca/SlimOrca, согласованная с использованием алгоритма DPO (Direct Preference Optimization). Для получения дополнительной информации обратитесь к блогу: Практика контролируемого дообучения и прямой оптимизации предпочтений на процессорах Habana Gaudi2.
Полный текст статьи пока не загружен.