← Вернуться к списку

ШагФункция: Шаг 3 (stepfun-ai/step3)

Краткое содержание

Шаг 3 — передовая мультимодальная модель рассуждений, построенная на архитектуре смеси экспертов с общим количеством параметров 321 млрд и активным числом 38 млрд. Она разработана от начала до конца таким образом, чтобы минимизировать затраты на декодирование, обеспечивая при этом выдающиеся результаты в области визуального и языкового анализа. Благодаря совместной разработке методов мультиматричной факторизационной аттеншна (MFA) и разделения внимания и FFN (AFD), Шаг 3 сохраняет высокую эффективность работы как на флагманских, так и на бюджетных ускорителях.

Полный текст статьи пока не загружен.