← Вернуться к списку

Майкрософт: Phi-3.5 Мини 128К Инструкшн (microsoft/phi-3.5-mini-128k-instruct)

Краткое содержание

Модели Phi-3.5 — это лёгкие передовые модели открытого типа. Они были обучены на наборах данных Phi-3, включающих синтетические данные и отфильтрованную общедоступную веб-информацию, с акцентом на высокое качество и насыщенность рассуждениями. Модель Phi-3.5 Mini содержит 3,8 миллиарда параметров и представляет собой плотный декодер-только трансформер, использующий тот же токенизатор, что и Phi-3 Mini. Эти модели прошли строгий процесс улучшения, включая контролируемое дообучение, оптимизацию близкой политики (Proximal Policy Optimization) и прямую оптимизацию предпочтений, чтобы обеспечить точное выполнение инструкций и надёжные меры безопасности. По результатам тестирования на эталонных тестах, проверяющих здравый смысл, понимание языка, математику, кодирование, обработку длинных контекстов и логическое мышление, модели Phi-3.5 продемонстрировали устойчивые и передовые показатели среди моделей с менее чем 13 миллиардами параметров.

Полный текст статьи пока не загружен.