← Вернуться к списку
: OpenHermes 2.5 Mistral 7B (teknium/openhermes-2.5-mistral-7b)
Краткое содержание
Продолжение модели OpenHermes 2, обученной на дополнительных наборах данных кода. Потенциально наиболее интересным результатом обучения на хорошем соотношении (оценка около 7-14% от общего набора данных) инструкций по коду стало повышение производительности по нескольким не-кодовым бенчмаркам, включая TruthfulQA, AGIEval и GPT4All suite. Однако, это привело к снижению оценки бенчмарка BigBench, но общий чистый прирост является значительным.
Полный текст статьи пока не загружен.