Сбросить

От создателей Goliath, Magnum 72B — первая модель новой линейки, разработанная для достижения качества прозы уровня моделей Claude 3, особенно Opus и Sonnet. Модель основана на Qwen2 72B и обучена на 55 миллионах токенов тщательно отобранных данных ролевых игр (RP).

Экспериментальная объединённая модель на основе Llama 3, демонстрирующая весьма характерный стиль письма. Она сочетает лучшие качества Meta Llama 3 8B и Hermes 2 Pro от Nous Research. Hermes-2 Θ (тета) была специально разработана с учётом нескольких возможностей: выполнение вызовов функций, генерац...

У меня довольно большая ML-платформа, которая принимает несколько терминов условной вероятности, вычисляемых с помощью классификаторов/нейронных сетей. Эта произвольная функция потерь вычисляется посредством функции: loss_value = arbitrary_loss(probability1, probability2, ..., P(Y|Z)). Я хочу иметь ...

Я увидел этот вопрос и сталкиваюсь с той же проблемой: ядра в обученной CNN выглядят случайным образом. Я использую PyTorch для обучения CNN, и мой код основан на примерах, которые обучают символы MNIST: около 50 сверточных слоев размером 20x20 ядер, которые подаются в два полносвязных слоя, с испол...

Я увидел этот вопрос и сталкиваюсь с той же проблемой: ядра в обученной CNN выглядят случайным образом. Я использую PyTorch для обучения CNN, и мой код основан на примерах, которые обучают символы MNIST: около 50 сверточных слоев размером 20x20 ядер, которые подаются в два полносвязных слоя, с испол...

Я новичок в области ML и планирую использовать KerasCV, модель stabledifussion, для генерации изображений из текста. Пример на сайте KerasCV достаточно прост, но я не смог найти способа сохранить модель локально для последующего использования. Я также заметил, что библиотека подключается к Hugging F...

Я новичок в ML и планирую использовать стабильную модель KerasCV stablediffusion для генерации изображений из текста. Пример на сайте KerasCV прост, но я не смог найти способ сохранить модель локально для последующего использования. Также заметил, что библиотека подключается к Hugging Face для загру...

Gemma 2 9B от Google — это передовая открытая языковая модель, устанавливающая новый стандарт эффективности и производительности в своем классе моделей. Созданная для широкого спектра задач, она позволяет разработчикам и исследователям создавать инновационные приложения, одновременно обеспечивая до...

Stheno 8B 32K — это модель для творческого письма и ролевых игр от Sao10k. Изначально она была обучена на контексте длиной 8К токенов, после чего контекст был расширен до 32К токенов. По сравнению со старой версией модели Stheno, данная версия обучалась на основе: - удвоенного количества образцов т...

Я хочу использовать байесовскую нейронную сеть для задачи регрессии. Для этого я преобразовал BNN из этой статьи в Python 3. Предоставленный скрипт обучения запускается, и я получаю файл pickle, который хочу использовать для предсказания значения в своей регрессии. Хотя потери на обучении практическ...