← Вернуться к списку

Нейрочат 7Б версии 3.1 (интел/нейро-чат-7б)

Краткое содержание

Настроенная модель на основе mistralai/Mistral-7B-v0.1 на открытом датасете Open-Orca/SlimOrca, согласованная с использованием алгоритма DPO (Direct Preference Optimization). Для получения дополнительной информации обратитесь к блогу: Практика контролируемого дообучения и прямой оптимизации предпочтений на процессорах Habana Gaudi2.

Полный текст статьи пока не загружен.