Майкрософт: Phi 4 Рассуждение (microsoft/phi-4-reasoning)

2025-05-01 17:41:15

Краткое содержание

Phi-4-reasoning — это плотный декодер-трансформер с 14 миллиардами параметров, разработанный компанией Microsoft путём тонкой настройки модели Phi-4 для улучшения возможностей сложного рассуждения. Модель сочетает контролируемую тонкую настройку на цепочках мыслей (chain-of-thought traces) и обучение с подкреплением, ориентированное на задачи рассуждений в математике, естественных науках и коде. С окном контекста размером 32К и высокой эффективностью вывода она оптимизирована для структурированных ответов в двухчастном формате: сначала след рассуждений, затем итоговое решение. Модель демонстрирует сильные результаты на специализированных бенчмарках вроде AIME, OmniMath и LiveCodeBench, превосходя многие более крупные модели в задачах структурированного рассуждения. Она распространяется под лицензией MIT и предназначена для использования в средах с ограничением задержки, поддерживающих исключительно английский язык и требующих надёжную пошаговую логику. Рекомендуется использовать её совместно с подсказками формата ChatML и форматом структурированного рассуждения для достижения наилучших результатов.

Полный текст статьи пока не загружен.

Читать оригинал статьи