← Вернуться к списку

Мы: Гермес 4 405Б (nousresearch/hermes-4-405b)

Краткое содержание

Hermes 4 — это крупномасштабная модель рассуждений, построенная на основе Meta-Llama-3.1-405B и выпущенная исследовательской группой Nous. Модель вводит гибридный режим рассуждений: она способна либо проводить внутренние размышления с использованием трассировок (traces), либо отвечать непосредственно, обеспечивая гибкость между скоростью и глубиной обработки. Пользователи могут управлять поведением модели через булев параметр `reasoning enabled`. Модель была дополнительно настроена на выполнение инструкций с расширенным корпусом постобучающих данных (~60 млрд токенов), акцентируя внимание на трассировках рассуждений, что улучшило её производительность в математике, кодировании, технических науках (STEM) и логическом рассуждении, сохранив при этом универсальность ассистента широкого профиля. Она также поддерживает структурированные выходные данные, включая режим JSON, соответствие схемам, вызовы функций и использование инструментов. Обучение модели направлено на повышение управляемости, снижение отказов и выравнивание поведения в сторону нейтральности и ориентации на запросы пользователей.

Полный текст статьи пока не загружен.