Главная - AST-AIHub

Квен: Квэн3 14Б (бесплатный) (квэн/квэн3-14б)

2025-04-28 21:41:18

Qwen3-14B — плотная языковая модель с причинной структурой, содержащая 14,8 млрд параметров из серии Qwen3, предназначенная как для сложных рассуждений, так и эффективного ведения диалога. Модель поддерживает плавный переход между режимом «мышления», используемым для выполнения задач вроде математик...

Читать оригинал Подробнее

Квен: Квэн3 32Б (qwen/qwen3-32b)

2025-04-28 21:32:25

Qwen3-32B — плотная языковая модель с причинной структурой, содержащая 32,8 миллиарда параметров, относящаяся к серии Qwen3 и оптимизированная как для сложных рассуждений, так и эффективного ведения диалога. Модель поддерживает плавный переход между режимом «размышления», предназначенным для выполне...

Читать оригинал Подробнее

Qwen: Qwen3 235B A22B (бесплатный) (qwen/qwen3-235b-a22b)

2025-04-28 21:29:17

Qwen3-235B-A22B — это модель типа смесь-экспертов (MoE) с параметрами 235 миллиардов, разработанная компанией Qwen, активирующая 22 миллиарда параметров за один проход прямого распространения. Модель поддерживает плавный переход между режимом «размышления», предназначенным для выполнения сложных рас...

Читать оригинал Подробнее

TNG: DeepSeek R1T Chimera (бесплатная версия) (tngtech/deepseek-r1t-chimera)

2025-04-27 13:34:35

DeepSeek-R1T-Chimera создается путем объединения моделей DeepSeek-R1 и DeepSeek-V3 (версия от 03/24), объединяя способности рассуждения модели R1 с улучшенной эффективностью обработки токенов версии V3. Модель основана на архитектуре трансформера DeepSeek-MoE и оптимизирована для общих задач генерац...

Читать оригинал Подробнее

THUDM: GLM Z1 Рефлексия 32B (thudm/glm-z1-rumination-32b)

2025-04-25 17:18:15

THUDM: GLM Z1 Размышление 32B — это глубокая модель рассуждений с параметрами объёмом 32 миллиарда (из серии GLM-4-Z1), оптимизированная для сложных открытых задач, требующих длительного размышления. Она построена на основе модели glm-4-32b-0414 с добавлением этапов дополнительного обучения с подкре...

Читать оригинал Подробнее

ТХУДМ: ГЛМ З1 9Б (thudm/glm-z1-9b)

2025-04-25 17:12:20

GLM-Z1-9B-0414 — языковая модель с параметрами объёмом 9 миллиардов, разработанная лабораторией THUDM в рамках семейства моделей GLM-4. В её архитектуре использованы методы, изначально применявшиеся для больших моделей серии GLM-Z1: расширенное обучение с подкреплением, выравнивание парных ранжирова...

Читать оригинал Подробнее

THUDM: GLM 4 9B (thudm/glm-4-9b) (Точный перевод технической аббревиатуры невозможен без контекста, однако структура сохранена.) Лаборатория больших моделей Цинхуа (THU Dialogue Model): Генерализованная языковая модель версии 4 объёмом 9 миллиардов параметров (thudm/glm-4-9b)

2025-04-25 17:10:23

GLM-4-9B-0414 — языковая модель серии GLM-4 от компании THUDM с количеством параметров 9 миллиардов. Обучена теми же методами подкрепляющего обучения и выравнивания, что и её старшие аналоги с 32 миллиардами параметров. Благодаря этому GLM-4-9B-0414 демонстрирует высокую производительность относител...

Читать оригинал Подробнее

Музыкальный ИИ "Песочница", теперь с новыми функциями и расширенным доступом.

2025-04-24 15:01:00

Помощь музыкальным профессионалам в исследовании потенциала генеративного ИИ.

Читать оригинал Подробнее

Как работают токенайзеры BPE с параметром `add_prefix_space`, обрабатывая естественный язык, такой как цитаты или поэзия, где префиксный пробел отсутствует?

2025-04-24 12:43:24

Токенизаторы BPE являются стандартом для современных больших языковых моделей. По умолчанию большинство токенизаторов добавляет пробел перед словом, чтобы фраза «John went away» была предварительно токенизирована как `[_John][_went][_away]`. Для сохранения обратимости при обратном преобразовании нач...

Читать оригинал Подробнее

Может ли GRPO стать эффективнее в 10 раз? SRPO от Kwai AI предполагает, что да — благодаря SRPO

2025-04-24 02:30:16

Фреймворк SRPO от Kwai AI сокращает этапы постобучения больших языковых моделей методом подкрепляющего обучения (RL) на 90%, при этом достигая уровня производительности модели DeepSeek-R1 в математике и коде. Двухэтапный подход RL с повторной выборкой истории устраняет ограничения метода GRPO. Стат...

Читать оригинал Подробнее

Лента материалов из области искусственного интеллекта (AI)