Команда NeverSleep вернулась с тонкой настройкой модели Llama 3 размером 8 миллиардов параметров, обученной на специально отобранных ими данных для ролевых игр. Lumimaid была разработана таким образом, чтобы сочетать серьезность с отсутствием цензуры там, где это необходимо, соблюдая баланс между эл...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 75587
Разработка следующего поколения ИИ-агентов, исследование новых модальностей и прокладывание путей в области фундаментального обучения.
Арктик — гибридная архитектура трансформера плотный-МоЕ (Mixture of Experts), предварительно обученная с нуля командой исследований ИИ Snowflake. Арктик объединяет 10-миллиардную плотную модель трансформера с остаточной сетью МоЕ MLP размером 128×3,66 млрд параметров, что даёт суммарно 480 миллиардо...
Огненно быстрый визуально-лингвистический модельный комплекс FireLLaVA быстро распознаёт и тексты, и изображения. В тестах демонстрирует впечатляющие способности общения и был разработан для подражания мультимодальному GPT-4. Первая коммерчески доступная открытая версия модели LLaVA, полностью обуч...
Рассмотрим функцию нейронной сети $f:\mathbb{R}\to\text{распределение}$. Для простоты, возможно, стоит предположить, что она возвращает гауссово распределение. Я хочу найти $\arg\min_{s\in\mathbb{R}}D_{KL}(f(s),q)$ для некоторого фиксированного распределения $q$. Существует ли эффективный замкнутый ...
Я использую Ollama для запуска LLM. Я могу создавать эмбеддинги для текста и изображений, которые я сохраняю в ChromaDB. Цель всего этого – найти контент, который наилучшим образом соответствует вопросу, чтобы я мог создать хороший ответ. Вот как я создаю эмбеддинги для textcurl http://localhost:114...
Я использую Ollama для запуска LLM. Я могу создавать эмбеддинги для текста и изображений, которые я сохраняю в ChromaDB. Цель всего этого – найти контент, который наилучшим образом соответствует вопросу, чтобы я мог создать хороший ответ. Вот как я создаю эмбеддинги для textcurl http://localhost:114...
Soliloquy-L3 v2 — это быстрая и высокоэффективная ролевой модели, разработанная для погружающих динамичных впечатлений. Обученная на более чем 250 миллионах токенов ролевых данных, Soliloquy-L3 обладает обширной базой знаний, богатым литературным выражением и поддержкой контекста длиной до 24 тысяч ...
В статье «Внимание — всё, что вам нужно», приведена таблица 1, кто-нибудь пояснит, какая архитектура имеется в виду в строке «Свёрточная (Convolution)», и соответственно опишите остальные три колонки этой строки? Остальные архитектуры достаточно понятны: например, рекуррентная («Recurrent») требует ...
Исследование перспектив и рисков будущего с более мощным ИИ.