Сбросить

Я неоднократно переводил программу обучения с подкреплением из Python на JavaScript с использованием TensorFlow.js, реализующую алгоритм Twin Delayed Deep Deterministic Policy Gradient (TD3). Я просто создаю базовый план для себя и сообщества. Вложив много работы, я чувствую, что она должна быть в о...

Дикая модель с 7 миллиардами параметров, объединяющая несколько моделей с помощью нового метода слияния `task_arithmetic` из библиотеки MergeKit. Список объединённых моделей: - NousResearch/Nous-Capybara-7B-V1.9 - HuggingFaceH4/zephyr-7b-beta - lemonilia/AshhLimaRP-Mistral-7B - Vulkane/120-Day...

Большой языковой модели (LLM), созданный путем объединения двух предварительно настроенных моделей Llama объемом 70 млрд параметров каждая в одну общую модель размером 120 млрд параметров. Объединяет модели Xwin и Euryale. Благодарности выражаются: - @chargoddard — за разработку фреймворка, использ...

Ваш запрос будет обработан метамоделью и направлен одной из десятков моделей (см. ниже), оптимизируя результат до наилучшего возможного варианта. Чтобы узнать, какая именно модель была задействована, зайдите в раздел «Активность», либо ознакомьтесь с атрибутом `model` в ответе. Стоимость вашего зап...

Последняя версия модели GPT-4 Turbo с возможностями обработки изображений. Запросы, связанные с обработкой изображений, теперь поддерживают режим JSON и вызовы функций. Обучающие данные: до апреля 2023 года.

Устаревшая модель GPT-3.5 Turbo с улучшенным выполнением инструкций, поддержкой формата JSON, воспроизводимыми результатами вывода, параллельным вызовом функций и прочими улучшениями. Обучающие данные: до сентября 2021 года включительно.

Обучен на 900 тыс. инструкций, превосходит все предыдущие версии Hermes 13B и ниже, и соответствует 70B на некоторых бенчмарках. Hermes 2 обладает сильными навыками многооборотного чата и возможностями системных промптов.