DeepSeek: R1 Дистиллят Qwen 32B (deepseek/deepseek-r1-distill-qwen-32b)

2025-01-29 23:53:50

Краткое содержание

DeepSeek R1 Distill Qwen 32B — дистиллированная большая языковая модель, основанная на модели Qwen 2.5 32B с использованием выходных данных от DeepSeek R1. Она превосходит OpenAI’s o1-mini по различным бенчмаркам, достигая новых передовых результатов среди плотных моделей. Другие результаты тестов включают: - AIME 2024 pass@1: 72,6 - MATH-500 pass@1: 94,3 - Рейтинг CodeForces: 1691 Модель использует дообучение на основе выходов DeepSeek R1, обеспечивая конкурентоспособную производительность, сопоставимую с большими моделями переднего края.

Полный текст статьи пока не загружен.

Читать оригинал статьи