← Вернуться к списку
DeepSeek: DeepSeek R1 0528 Qwen3 8B (бесплатная версия) (deepseek/deepseek-r1-0528-qwen3-8b)
Краткое содержание
DeepSeek-R1-0528 — это слегка улучшенная версия модели DeepSeek R1, использующая больше вычислительных ресурсов и умнее применяющая постобучающие трюки, благодаря чему её способности к рассуждению и выводу приближаются к уровню флагманских моделей вроде O3 и Gemini 2.5 Pro. Теперь она лидирует в рейтингах математики, программирования и логики, демонстрируя значительный прогресс в глубине мышления. Сжатый вариант этой модели, DeepSeek-R1-0528-Qwen3-8B, переносит цепочку рассуждений в форму с 8 миллиардами параметров, превосходя стандартный Qwen3 8B на 10 процентных пунктов и достигая уровня гиганта с 235 млрд параметров на экзамене AIME 2024 года.
Полный текст статьи пока не загружен.