: OpenHermes 2.5 Mistral 7B (teknium/openhermes-2.5-mistral-7b)

2023-11-20 00:00:00

Краткое содержание

Продолжение модели OpenHermes 2, обученной на дополнительных наборах данных кода. Потенциально наиболее интересным результатом обучения на хорошем соотношении (оценка около 7-14% от общего набора данных) инструкций по коду стало повышение производительности по нескольким не-кодовым бенчмаркам, включая TruthfulQA, AGIEval и GPT4All suite. Однако, это привело к снижению оценки бенчмарка BigBench, но общий чистый прирост является значительным.

Полный текст статьи пока не загружен.

Читать оригинал статьи