Главная - AST-AIHub

: OpenHermes 2.5 Mistral 7B (teknium/openhermes-2.5-mistral-7b)

2023-11-20 00:00:00

Продолжение модели OpenHermes 2, обученной на дополнительных наборах данных кода. Потенциально наиболее интересным результатом обучения на хорошем соотношении (оценка около 7-14% от общего набора данных) инструкций по коду стало повышение производительности по нескольким не-кодовым бенчмаркам, включ...

Читать оригинал Подробнее

Nous: Капибара 34B (nousresearch/nous-capybara-34b)

2023-11-15 00:00:00

Эта модель была обучена на основе модели Yi-34B в течение трёх эпох на датасете Capybara. Это первая 34-миллиардная модель от Nous и первая модель от Nous с длиной контекста до 200 тысяч токенов.

Читать оригинал Подробнее

OpenAI: GPT-4 Vision (openai/gpt-4-vision-preview) (Текст идентичен оригиналу — здесь нечего переводить.)

2023-11-13 00:00:00

Способность понимать изображения помимо всех остальных возможностей GPT-4 Turbo. Обучающие данные: до апреля 2023 года. **Примечание:** сильно ограничена по количеству запросов со стороны OpenAI во время предварительного просмотра. #мультимодальность

Читать оригинал Подробнее

Маскировка в декодере трансформера

2023-11-12 12:36:05

Я понимаю, что маскированная блокировка многоголового внимания гарантирует, что генерация токена на шаге времени t не зависит от последующих токенов входных данных. Но остаточное соединение, которое добавляет входные значения к выходу маскированной блокировки многоголового внимания, добавляет некото...

Читать оригинал Подробнее

LZLV 70B (lizpreciatior/lzlv-70b-fp16-hf)

2023-11-12 00:00:00

Слияние моделей типа Mythomax/MLewd_13B на основе выбранных моделей объёмом 70 миллиардов параметров. Многообразное слияние нескольких моделей LLaMA2-70B, дообученных для ролевых игр и творчества. Целью было создание модели, объединяющей креативность и интеллектуальность для улучшения пользовательск...

Читать оригинал Подробнее

Почему мой агент застрял на одной и той же действия в моей программе с двумя задержками глубокого детерминированного градиента политики (TD3)?

2023-11-11 04:12:05

Я неоднократно переводил программу обучения с подкреплением из Python на JavaScript с использованием TensorFlow.js, реализующую алгоритм Twin Delayed Deep Deterministic Policy Gradient (TD3). Я просто создаю базовый план для себя и сообщества. Вложив много работы, я чувствую, что она должна быть в о...

Читать оригинал Подробнее

Топпи М 7Б (undi95/toppy-m-7b)

2023-11-10 00:00:00

Дикая модель с 7 миллиардами параметров, объединяющая несколько моделей с помощью нового метода слияния `task_arithmetic` из библиотеки MergeKit. Список объединённых моделей: - NousResearch/Nous-Capybara-7B-V1.9 - HuggingFaceH4/zephyr-7b-beta - lemonilia/AshhLimaRP-Mistral-7B - Vulkane/120-Day...

Читать оригинал Подробнее

Голиаф 120Б (alpindale/goliath-120b)

2023-11-10 00:00:00

Большой языковой модели (LLM), созданный путем объединения двух предварительно настроенных моделей Llama объемом 70 млрд параметров каждая в одну общую модель размером 120 млрд параметров. Объединяет модели Xwin и Euryale. Благодарности выражаются: - @chargoddard — за разработку фреймворка, использ...

Читать оригинал Подробнее

Автоматический маршрутизатор (openrouter/auto)

2023-11-08 00:00:00

Ваш запрос будет обработан метамоделью и направлен одной из десятков моделей (см. ниже), оптимизируя результат до наилучшего возможного варианта. Чтобы узнать, какая именно модель была задействована, зайдите в раздел «Активность», либо ознакомьтесь с атрибутом `model` в ответе. Стоимость вашего зап...

Читать оригинал Подробнее

OpenAI: GPT-4 Turbo (устаревшая версия от 1106) (openai/gpt-4-1106-preview)

2023-11-06 00:00:00

Последняя версия модели GPT-4 Turbo с возможностями обработки изображений. Запросы, связанные с обработкой изображений, теперь поддерживают режим JSON и вызовы функций. Обучающие данные: до апреля 2023 года.

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)