DeepSeek: R1 Дистиллят Qwen 14B (deepseek/deepseek-r1-distill-qwen-14b)

2025-01-29 23:39:00

Краткое содержание

DeepSeek R1 Distill Qwen 14B — дистиллированная большая языковая модель, основанная на модели Qwen 2.5 14B с использованием выходных данных от DeepSeek R1. Она превосходит OpenAI’s o1-mini по различным бенчмаркам, достигая новых передовых результатов среди плотных моделей. Другие результаты тестов включают: - AIME 2024 pass@1: 69.7 - MATH-500 pass@1: 93.9 - Рейтинг CodeForces: 1481 Модель использует дообучение на основе выходов DeepSeek R1, обеспечивая конкурентоспособную производительность, сравнимую с большими пограничными моделями.

Полный текст статьи пока не загружен.

Читать оригинал статьи