← Вернуться к списку

Qwen: Qwen3 30B A3B (бесплатная версия) (qwen/qwen3-30b-a3b)

Краткое содержание

Qwen3 — новейшее поколение серии больших языковых моделей Qwen, которое сочетает плотную архитектуру и архитектуру смеси экспертов (MoE), обеспечивая превосходство в области рассуждений, многоязычной поддержки и сложных агентских задач. Уникальная способность переключаться между режимом размышления для сложного анализа и нерефлексивным режимом для эффективного диалога обеспечивает универсальную и высококачественную производительность. Значительно опережая предыдущие модели, такие как QwQ и Qwen2.5, Qwen3 демонстрирует выдающиеся способности в математике, кодировании, здравом смысле, творческом письме и интерактивной беседе. Вариант Qwen3-30B-A3B включает 30,5 миллиардов параметров (из которых активируется 3,3 миллиарда), имеет 48 слоёв, содержит 128 экспертов (по восемь активных на каждую задачу) и поддерживает контекст до 131 тысячи токенов с использованием YaRN, устанавливая новый стандарт среди открытых моделей.

Полный текст статьи пока не загружен.