Искусственный интеллект (ИИ) преобразует технологический ландшафт, привлекая разнообразный круг инвесторов, стремящихся извлечь выгоду из его потенциала. В этой статье мы рассмотрим ключевых игроков, стимулирующих инвестиции в ИИ — от технологических гигантов и венчурных фондов до бизнес-ангелов, и ...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 74621
Soliloquy v3 — высокоэффективная ролевой модели, предназначенная для погружающих динамичных впечатлений. Обучена на более чем двух миллиардах токенов ролевых данных, обладает обширной базой знаний и богатым литературным выражением, поддерживает контекст длиной до 32 тысяч токенов. Она превосходит су...
Мой вопрос касается статьи arxiv.org/pdf/1312.6114. Я хочу узнать, почему они предложили использовать MLP-декодер Гаусса с параметрами, заданными преобразованием z переменной посредством MLP, в качестве модели правдоподобия $p_{\theta}(x|z)$. Если они используют НСН для выполнения инференса по наилу...
Мой вопрос касается статьи arxiv.org/pdf/1312.6114. Я хочу узнать, почему они предложили использовать MLP-Gaussian декодер с параметрами, заданными преобразованием z переменной через MLP, как модель правдоподобия $p_{\theta}(x|z)$. Если они используют НСН для выполнения инференса по наилучшему набор...
Jamba 1.5 Large является частью новой линейки открытых моделей от AI21, предлагая превосходную скорость, эффективность и качество. Он обладает эффективным контекстным окном в размере 256K, самым большим среди открытых моделей, что позволяет повысить производительность при выполнении таких задач, ка...
Модели серии Yi — это большие языковые модели, разработанные с нуля специалистами компании 01.АИ. Это предшественник модели Yi 34B. Модель непрерывно предварительно обучается на высококачественном корпусе объемом 500 миллиардов токенов и дообучается на трех миллионах разнообразных образцов тонкой на...
Jamba 1.5 Mini — первая в мире серийная модель на основе архитектуры Mamba, объединяющая структуры SSM и Transformer для обеспечения окна контекста размером 256К и высокой эффективности. Модель поддерживает работу с девятью языками и способна решать различные задачи написания и анализа текста на ур...
Использование глубокого обучения для решения фундаментальных задач в вычислистой квантовой химии и исследования взаимодействия вещества со светом.
Модели Phi-3.5 — это лёгкие передовые модели открытого типа. Они были обучены на наборах данных Phi-3, включающих синтетические данные и отфильтрованную общедоступную веб-информацию, с акцентом на высокое качество и насыщенность рассуждениями. Модель Phi-3.5 Mini содержит 3,8 миллиарда параметров и ...
Я поражен тем, насколько сложной для меня является задача решения функции f(x) = x^2 с использованием подхода многослойного персептрона с линейной регрессией и PyTorch. Я использую SGD в качестве оптимизатора, MSELoss для функции потерь и настраиваю один скрытый слой с восемью скрытыми узлами. Я исп...