← Вернуться к списку
OpenChat 3.5 7B (openchat/openchat-7b) (Точный перевод технической строки сохранён без изменений.)
Краткое содержание
OpenChat 7B — библиотека открытых моделей естественного языка, дообученная методом "C-RLFT (усиленное обучение с подкреплением с условием)" — подход, вдохновлённый офлайн-обучением с подкреплением. Она была натренирована на смешанных по качеству данных без меток предпочтений. - Для версии OpenChat, дообученной на основе модели Mistral 7B, смотрите OpenChat 7B. - Для версии OpenChat, дообученной на основе модели Llama 8B, смотрите OpenChat 8B. #с-отрытым-кодом
Полный текст статьи пока не загружен.