← Вернуться к списку

Тайфун2 8B Инструкшн (scb10x/llama3.1-тайфун2-8b-инструкшн)

Краткое содержание

Llama3.1-Typhoon2-8B-Instruct — это двуязычная тайско-английская модель инструкций с 8 миллиардами параметров, построенная на основе архитектуры Llama 3.1. Она значительно превосходит базовую версию модели в области рассуждений на тайском языке, выполнения инструкций и вызова функций, одновременно демонстрируя конкурентоспособную производительность на английском языке. Модель оптимизирована для двуязычного взаимодействия и показывает хорошие результаты на бенчмарках переключения кодов между тайским и английским языками (Thai–English code-switching), MT-Bench, IFEval и тестах использования инструментов. Несмотря на меньший размер, она демонстрирует сильную обобщающую способность в математике, программировании и многоязычных задачах, превосходя сопоставимые модели объёмом 8 миллиардов параметров практически во всех специфичных для тайского языка заданиях. Полные результаты тестов и методология представлены в техническом отчёте.

Полный текст статьи пока не загружен.