Майкрософт: Phi 4 Reasoning Plus (microsoft/phi-4-reasoning-plus)
Краткое содержание
Phi-4-reasoning-plus — улучшенная модель от Microsoft с параметрами размером 14 миллиардов, прошедшая дообучение на основе модели Phi-4 с дополнительным усилением обучения с подкреплением для повышения точности выполнения задач по математике, естественным наукам и коду. Она использует такую же плотную архитектуру декодера-трансформера, как и базовая версия Phi-4, однако генерирует более длинные и исчерпывающие результаты, структурированные пошагово с выводом итогового ответа. Хотя эта модель демонстрирует повышенные показатели производительности относительно базовой версии Phi-4-reasoning на тестовых заданиях вроде AIME, OmniMath и HumanEvalPlus, её ответы примерно на 50% длиннее, что увеличивает задержку обработки запросов. Модель предназначена исключительно для англоязычных приложений и оптимально подходит для рабочих процессов, ориентированных на структурированное рассуждение, когда качество вывода важнее скорости отклика.
Полный текст статьи пока не загружен.