DeepSeek: R1 Дистиллят Qwen 1,5B (deepseek/deepseek-r1-distill-qwen-1.5b)

2025-01-31 12:54:27

Краткое содержание

DeepSeek R1 Distill Qwen 1.5B — дистиллированная большая языковая модель, основанная на Qwen 2.5 Math 1.5B с использованием выходных данных от DeepSeek R1. Это очень компактная и эффективная модель, превосходящая GPT 4o 0513 по результатам тестов по математике. Другие результаты бенчмарков включают: - AIME 2024 pass@1: 28.9 - AIME 2024 cons@64: 52.7 - MATH-500 pass@1: 83.9 Модель использует дообучение на основе результатов DeepSeek R1, обеспечивая конкурентоспособную производительность, сопоставимую с большими передовыми моделями.

Полный текст статьи пока не загружен.

Читать оригинал статьи