← Вернуться к списку

Тайфун2 70B Инструкшн (scb10x/llama3.1-typhoon2-70b-instruct)

Краткое содержание

Llama3.1-Typhoon2-70B-Instruct — это двуязычная тайско-английская языковая модель с инструкциями, настроенная на выполнение команд и содержащая 70 миллиардов параметров, построенная на основе архитектуры Llama 3.1. Модель демонстрирует высокую производительность в широком спектре задач общего назначения, математики, программирования и работы с инструментами, показывая передовые результаты на специализированных бенчмарках для тайского языка, таких как IFEval, MT-Bench и переключение кодов между тайским и английским языком. Модель отличается выдающимися способностями в билингвальном рассуждении и сценариях вызова функций, обеспечивая высокую точность решений в различных областях. Сравнительные оценки показывают стабильное превосходство над предыдущими моделями тайских больших языковых моделей (LLM) и базовыми вариантами семейства Llama. Полный набор результатов и методология представлены в техническом отчёте.

Полный текст статьи пока не загружен.