Сбросить

Продолжение модели OpenHermes 2, обученной на дополнительных наборах данных кода. Потенциально наиболее интересным результатом обучения на хорошем соотношении (оценка около 7-14% от общего набора данных) инструкций по коду стало повышение производительности по нескольким не-кодовым бенчмаркам, включ...

Способность понимать изображения помимо всех остальных возможностей GPT-4 Turbo. Обучающие данные: до апреля 2023 года. **Примечание:** сильно ограничена по количеству запросов со стороны OpenAI во время предварительного просмотра. #мультимодальность

Я понимаю, что маскированная блокировка многоголового внимания гарантирует, что генерация токена на шаге времени t не зависит от последующих токенов входных данных. Но остаточное соединение, которое добавляет входные значения к выходу маскированной блокировки многоголового внимания, добавляет некото...

Слияние моделей типа Mythomax/MLewd_13B на основе выбранных моделей объёмом 70 миллиардов параметров. Многообразное слияние нескольких моделей LLaMA2-70B, дообученных для ролевых игр и творчества. Целью было создание модели, объединяющей креативность и интеллектуальность для улучшения пользовательск...

Я неоднократно переводил программу обучения с подкреплением из Python на JavaScript с использованием TensorFlow.js, реализующую алгоритм Twin Delayed Deep Deterministic Policy Gradient (TD3). Я просто создаю базовый план для себя и сообщества. Вложив много работы, я чувствую, что она должна быть в о...

Дикая модель с 7 миллиардами параметров, объединяющая несколько моделей с помощью нового метода слияния `task_arithmetic` из библиотеки MergeKit. Список объединённых моделей: - NousResearch/Nous-Capybara-7B-V1.9 - HuggingFaceH4/zephyr-7b-beta - lemonilia/AshhLimaRP-Mistral-7B - Vulkane/120-Day...

Большой языковой модели (LLM), созданный путем объединения двух предварительно настроенных моделей Llama объемом 70 млрд параметров каждая в одну общую модель размером 120 млрд параметров. Объединяет модели Xwin и Euryale. Благодарности выражаются: - @chargoddard — за разработку фреймворка, использ...

Ваш запрос будет обработан метамоделью и направлен одной из десятков моделей (см. ниже), оптимизируя результат до наилучшего возможного варианта. Чтобы узнать, какая именно модель была задействована, зайдите в раздел «Активность», либо ознакомьтесь с атрибутом `model` в ответе. Стоимость вашего зап...

Последняя версия модели GPT-4 Turbo с возможностями обработки изображений. Запросы, связанные с обработкой изображений, теперь поддерживают режим JSON и вызовы функций. Обучающие данные: до апреля 2023 года.