← Вернуться к списку

: OpenHermes 2.5 Mistral 7B (teknium/openhermes-2.5-mistral-7b)

Краткое содержание

Продолжение модели OpenHermes 2, обученной на дополнительных наборах данных кода. Потенциально наиболее интересным результатом обучения на хорошем соотношении (оценка около 7-14% от общего набора данных) инструкций по коду стало повышение производительности по нескольким не-кодовым бенчмаркам, включая TruthfulQA, AGIEval и GPT4All suite. Однако, это привело к снижению оценки бенчмарка BigBench, но общий чистый прирост является значительным.

Полный текст статьи пока не загружен.