Главная - AST-AIHub

Ландшафт инвестиций в ИИ: кто финансирует следующую волну инноваций?

2024-08-26 15:57:23

Искусственный интеллект (ИИ) преобразует технологический ландшафт, привлекая разнообразный круг инвесторов, стремящихся извлечь выгоду из его потенциала. В этой статье мы рассмотрим ключевых игроков, стимулирующих инвестиции в ИИ — от технологических гигантов и венчурных фондов до бизнес-ангелов, и ...

Читать оригинал Подробнее

Линн: Лама 3 Солилокви 7Б версия 3 32К (линн/солилокви-в3)

2024-08-24 00:00:00

Soliloquy v3 — высокоэффективная ролевой модели, предназначенная для погружающих динамичных впечатлений. Обучена на более чем двух миллиардах токенов ролевых данных, обладает обширной базой знаний и богатым литературным выражением, поддерживает контекст длиной до 32 тысяч токенов. Она превосходит су...

Читать оригинал Подробнее

Почему использовать MLP Гауссово декодер в VAE, если он ограничен в моделировании сложных данных?

2024-08-23 15:57:27

Мой вопрос касается статьи arxiv.org/pdf/1312.6114. Я хочу узнать, почему они предложили использовать MLP-декодер Гаусса с параметрами, заданными преобразованием z переменной посредством MLP, в качестве модели правдоподобия $p_{\theta}(x|z)$. Если они используют НСН для выполнения инференса по наилу...

Читать оригинал Подробнее

МЛП Гауссовский Детектор в ВЭА

2024-08-23 15:57:27

Мой вопрос касается статьи arxiv.org/pdf/1312.6114. Я хочу узнать, почему они предложили использовать MLP-Gaussian декодер с параметрами, заданными преобразованием z переменной через MLP, как модель правдоподобия $p_{\theta}(x|z)$. Если они используют НСН для выполнения инференса по наилучшему набор...

Читать оригинал Подробнее

Jamba 1.5 Large (ai21/jamba-1-5-large) – Джамба 1.5 Большой (ai21/jamba-1-5-large)

2024-08-23 00:00:00

Jamba 1.5 Large является частью новой линейки открытых моделей от AI21, предлагая превосходную скорость, эффективность и качество. Он обладает эффективным контекстным окном в размере 256K, самым большим среди открытых моделей, что позволяет повысить производительность при выполнении таких задач, ка...

Читать оригинал Подробнее

Ий 1.5 34B Чат (01-ай/ий-1.5-34б-чат)

2024-08-23 00:00:00

Модели серии Yi — это большие языковые модели, разработанные с нуля специалистами компании 01.АИ. Это предшественник модели Yi 34B. Модель непрерывно предварительно обучается на высококачественном корпусе объемом 500 миллиардов токенов и дообучается на трех миллионах разнообразных образцов тонкой на...

Читать оригинал Подробнее

AI21: Jamba 1.5 Мини (ai21/jamba-1-5-mini)

2024-08-23 00:00:00

Jamba 1.5 Mini — первая в мире серийная модель на основе архитектуры Mamba, объединяющая структуры SSM и Transformer для обеспечения окна контекста размером 256К и высокой эффективности. Модель поддерживает работу с девятью языками и способна решать различные задачи написания и анализа текста на ур...

Читать оригинал Подробнее

FermiNet: Квантовая физика и химия с первых принципов

2024-08-22 19:00:00

Использование глубокого обучения для решения фундаментальных задач в вычислистой квантовой химии и исследования взаимодействия вещества со светом.

Читать оригинал Подробнее

Майкрософт: Phi-3.5 Мини 128К Инструкшн (microsoft/phi-3.5-mini-128k-instruct)

2024-08-21 00:00:00

Модели Phi-3.5 — это лёгкие передовые модели открытого типа. Они были обучены на наборах данных Phi-3, включающих синтетические данные и отфильтрованную общедоступную веб-информацию, с акцентом на высокое качество и насыщенность рассуждениями. Модель Phi-3.5 Mini содержит 3,8 миллиарда параметров и ...

Читать оригинал Подробнее

Как решить задачу линейной регрессии для вогнутой (или выпуклой) зависимости в машинном обучении?

2024-08-19 20:11:49

Я поражен тем, насколько сложной для меня является задача решения функции f(x) = x^2 с использованием подхода многослойного персептрона с линейной регрессией и PyTorch. Я использую SGD в качестве оптимизатора, MSELoss для функции потерь и настраиваю один скрытый слой с восемью скрытыми узлами. Я исп...

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)