Главная - AST-AIHub

NeverSleep: Лама 3 Люмимейд 8Б (neversleep/llama-3-lumimaid-8b)

2024-05-04 00:00:00

Команда NeverSleep вернулась с тонкой настройкой модели Llama 3 размером 8 миллиардов параметров, обученной на специально отобранных ими данных для ролевых игр. Lumimaid была разработана таким образом, чтобы сочетать серьезность с отсутствием цензуры там, где это необходимо, соблюдая баланс между эл...

Читать оригинал Подробнее

Google DeepMind на ICLR 2024

2024-05-03 13:39:00

Разработка следующего поколения ИИ-агентов, исследование новых модальностей и прокладывание путей в области фундаментального обучения.

Читать оригинал Подробнее

Снежинка: Арктическая Инструкция (snowflake/snowflake-arctic-instruct)

2024-04-30 00:00:00

Арктик — гибридная архитектура трансформера плотный-МоЕ (Mixture of Experts), предварительно обученная с нуля командой исследований ИИ Snowflake. Арктик объединяет 10-миллиардную плотную модель трансформера с остаточной сетью МоЕ MLP размером 128×3,66 млрд параметров, что даёт суммарно 480 миллиардо...

Читать оригинал Подробнее

Фейерверки: FireLLaVA 13B (fireworks/firellava-13b)

2024-04-26 00:00:00

Огненно быстрый визуально-лингвистический модельный комплекс FireLLaVA быстро распознаёт и тексты, и изображения. В тестах демонстрирует впечатляющие способности общения и был разработан для подражания мультимодальному GPT-4. Первая коммерчески доступная открытая версия модели LLaVA, полностью обуч...

Читать оригинал Подробнее

Как найти аргумент функции NN (которая возвращает распределение), чтобы минимизировать дивергенцию Кл?

2024-04-24 23:28:32

Рассмотрим функцию нейронной сети $f:\mathbb{R}\to\text{распределение}$. Для простоты, возможно, стоит предположить, что она возвращает гауссово распределение. Я хочу найти $\arg\min_{s\in\mathbb{R}}D_{KL}(f(s),q)$ для некоторого фиксированного распределения $q$. Существует ли эффективный замкнутый ...

Читать оригинал Подробнее

Как создать 1 встраивание для текста + изображения

2024-04-22 20:24:58

Я использую Ollama для запуска LLM. Я могу создавать эмбеддинги для текста и изображений, которые я сохраняю в ChromaDB. Цель всего этого – найти контент, который наилучшим образом соответствует вопросу, чтобы я мог создать хороший ответ. Вот как я создаю эмбеддинги для textcurl http://localhost:114...

Читать оригинал Подробнее

Можно ли создать одно единственное вложение (embedding) как для текста, так и для соответствующего изображения?

2024-04-22 20:24:58

Я использую Ollama для запуска LLM. Я могу создавать эмбеддинги для текста и изображений, которые я сохраняю в ChromaDB. Цель всего этого – найти контент, который наилучшим образом соответствует вопросу, чтобы я мог создать хороший ответ. Вот как я создаю эмбеддинги для textcurl http://localhost:114...

Читать оригинал Подробнее

Линн: Лама 3 Солилокви 8Б версия 2 (lynn/soliloquy-l3)

2024-04-22 00:00:00

Soliloquy-L3 v2 — это быстрая и высокоэффективная ролевой модели, разработанная для погружающих динамичных впечатлений. Обученная на более чем 250 миллионах токенов ролевых данных, Soliloquy-L3 обладает обширной базой знаний, богатым литературным выражением и поддержкой контекста длиной до 24 тысяч ...

Читать оригинал Подробнее

Как получить сложность каждого слоя, последовательность операций и максимальную длину пути в архитектуре сверточной нейронной сети (CNN)?

2024-04-21 16:29:41

В статье «Внимание — всё, что вам нужно», приведена таблица 1, кто-нибудь пояснит, какая архитектура имеется в виду в строке «Свёрточная (Convolution)», и соответственно опишите остальные три колонки этой строки? Остальные архитектуры достаточно понятны: например, рекуррентная («Recurrent») требует ...

Читать оригинал Подробнее

Этика продвинутых ИИ-помощников

2024-04-19 10:00:00

Исследование перспектив и рисков будущего с более мощным ИИ.

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)