Главная - AST-AIHub

Психобоец 13B (jebcarter/psyfighter-13b)

2023-11-29 00:00:00

Модель слияния на основе Llama-2-13B, созданная благодаря вычислительным ресурсам сообщества KoboldAI. Это объединение моделей: - KoboldAI/LLaMA2-13B - chaoyi-wu/MedLLaMA_13B - Doctor-Shotgun/llama-2-13b-chat-limarp-v2-merged #слияние

Читать оригинал Подробнее

Существует ли серьёзная теоретико-игровая работа по риску ИИ и выравниванию?

2023-11-28 17:44:49

Моя область — политическая экономия и теория игр. Я интересуюсь дискуссиями об ИИ-рисках и выравнивании, но пока не смог найти работ на эту тему, которые бы серьезно опирались на классическую аксиоматическую теорию рационального выбора (ТРЧ). Некоторые утверждения, на мой взгляд, противоречат основн...

Читать оригинал Подробнее

OpenChat 3.5 7B (openchat/openchat-7b) (Точный перевод технической строки сохранён без изменений.)

2023-11-28 00:00:00

OpenChat 7B — библиотека открытых моделей естественного языка, дообученная методом "C-RLFT (усиленное обучение с подкреплением с условием)" — подход, вдохновлённый офлайн-обучением с подкреплением. Она была натренирована на смешанных по качеству данных без меток предпочтений. - Для версии OpenChat,...

Читать оригинал Подробнее

Нейрочат 7Б версии 3.1 (интел/нейро-чат-7б)

2023-11-25 00:00:00

Настроенная модель на основе mistralai/Mistral-7B-v0.1 на открытом датасете Open-Orca/SlimOrca, согласованная с использованием алгоритма DPO (Direct Preference Optimization). Для получения дополнительной информации обратитесь к блогу: Практика контролируемого дообучения и прямой оптимизации предпочт...

Читать оригинал Подробнее

Как обнаружить отрицание (отсутствие) объекта?

2023-11-22 18:40:02

Я хочу обнаруживать людей, которые НЕ носят жилеты СИЗ, используя предварительно обученную модель обнаружения объектов, такую как YOLO или Grounding Dino. Модели способны обнаруживать людей и жилеты по отдельности, но я не уверен, как обнаружить человека БЕЗ жилета. Как лучше всего это сделать в общ...

Читать оригинал Подробнее

Антропик: Клод Инстант версия 1.1 (anthropic/claude-instant-1.1)

2023-11-22 00:00:00

Модель Anthropic для низкоотложенной (с низкой задержкой), высокопроизводительной генерации текста. Поддерживает сотни страниц текста.

Читать оригинал Подробнее

Антропик: Клод версии 2 (anthropic/claude-2)

2023-11-22 00:00:00

Claude 2 предлагает улучшения ключевых возможностей для предприятий — включая передовую в отрасли контекстную область размером до 200 тысяч токенов, значительное снижение частоты появления ложной информации от модели, поддержку системных подсказок и новую бета-функцию: использование инструментов.

Читать оригинал Подробнее

Антропик: Клод версии 2.1 (anthropic/claude-2.1)

2023-11-22 00:00:00

Claude 2 предлагает улучшения ключевых возможностей для предприятий — включая передовую в отрасли контекстную область размером до 200 тысяч токенов, значительное снижение частоты появления ложной информации от модели, поддержку системных подсказок и новую бета-функцию: использование инструментов.

Читать оригинал Подробнее

: OpenHermes 2.5 Mistral 7B (teknium/openhermes-2.5-mistral-7b)

2023-11-20 00:00:00

Продолжение модели OpenHermes 2, обученной на дополнительных наборах данных кода. Потенциально наиболее интересным результатом обучения на хорошем соотношении (оценка около 7-14% от общего набора данных) инструкций по коду стало повышение производительности по нескольким не-кодовым бенчмаркам, включ...

Читать оригинал Подробнее

Nous: Капибара 34B (nousresearch/nous-capybara-34b)

2023-11-15 00:00:00

Эта модель была обучена на основе модели Yi-34B в течение трёх эпох на датасете Capybara. Это первая 34-миллиардная модель от Nous и первая модель от Nous с длиной контекста до 200 тысяч токенов.

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)