Главная - AST-AIHub

Почему мой агент застрял на одной и той же действия в моей программе с двумя задержками глубокого детерминированного градиента политики (TD3)?

2023-11-11 04:12:05

Я неоднократно переводил программу обучения с подкреплением из Python на JavaScript с использованием TensorFlow.js, реализующую алгоритм Twin Delayed Deep Deterministic Policy Gradient (TD3). Я просто создаю базовый план для себя и сообщества. Вложив много работы, я чувствую, что она должна быть в о...

Читать оригинал Подробнее

Топпи М 7Б (undi95/toppy-m-7b)

2023-11-10 00:00:00

Дикая модель с 7 миллиардами параметров, объединяющая несколько моделей с помощью нового метода слияния `task_arithmetic` из библиотеки MergeKit. Список объединённых моделей: - NousResearch/Nous-Capybara-7B-V1.9 - HuggingFaceH4/zephyr-7b-beta - lemonilia/AshhLimaRP-Mistral-7B - Vulkane/120-Day...

Читать оригинал Подробнее

Голиаф 120Б (alpindale/goliath-120b)

2023-11-10 00:00:00

Большой языковой модели (LLM), созданный путем объединения двух предварительно настроенных моделей Llama объемом 70 млрд параметров каждая в одну общую модель размером 120 млрд параметров. Объединяет модели Xwin и Euryale. Благодарности выражаются: - @chargoddard — за разработку фреймворка, использ...

Читать оригинал Подробнее

Автоматический маршрутизатор (openrouter/auto)

2023-11-08 00:00:00

Ваш запрос будет обработан метамоделью и направлен одной из десятков моделей (см. ниже), оптимизируя результат до наилучшего возможного варианта. Чтобы узнать, какая именно модель была задействована, зайдите в раздел «Активность», либо ознакомьтесь с атрибутом `model` в ответе. Стоимость вашего зап...

Читать оригинал Подробнее

OpenAI: GPT-4 Turbo (устаревшая версия от 1106) (openai/gpt-4-1106-preview)

2023-11-06 00:00:00

Последняя версия модели GPT-4 Turbo с возможностями обработки изображений. Запросы, связанные с обработкой изображений, теперь поддерживают режим JSON и вызовы функций. Обучающие данные: до апреля 2023 года.

Читать оригинал Подробнее

OpenAI: GPT-3.5 Turbo 16K (устаревшая версия от 11 июня — openai/gpt-3.5-turbo-1106)

2023-11-06 00:00:00

Устаревшая модель GPT-3.5 Turbo с улучшенным выполнением инструкций, поддержкой формата JSON, воспроизводимыми результатами вывода, параллельным вызовом функций и прочими улучшениями. Обучающие данные: до сентября 2021 года включительно.

Читать оригинал Подробнее

Google: PaLM 2 Code Chat 32K (google/palm-2-codechat-bison-32k)

2023-11-03 00:00:00

PaLM 2 дообучен для диалогов чат-бота, помогающих решать вопросы, связанные с кодом.

Читать оригинал Подробнее

Google: PaLM 2 Chat 32K (google/palm-2-chat-bison-32k)

2023-11-03 00:00:00

PaLM 2 — языковая модель от Google с улучшенными возможностями работы с несколькими языками, рассуждениями и кодом.

Читать оригинал Подробнее

: OpenHermes 2 Mistral 7B (teknium/openhermes-2-mistral-7b)

2023-11-01 00:00:00

Обучен на 900 тыс. инструкций, превосходит все предыдущие версии Hermes 13B и ниже, и соответствует 70B на некоторых бенчмарках. Hermes 2 обладает сильными навыками многооборотного чата и возможностями системных промптов.

Читать оригинал Подробнее

Мистраль ОпенО́рка 7Б (open-orca/mistral-7b-openorca)

2023-10-30 00:00:00

Файн-тюн модели Mistral на датасете OpenOrca. Первая 7-миллиардная модель, превзошедшая все остальные модели менее 30 миллиардов параметров.

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)