← Вернуться к списку
MinerU2.5 — открытая 1.2B-модель для парсинга PDF документов превосходит Gemini 2.5 Pro на бенчмарках
Краткое содержание
MinerU2.5 — компактная vision-language модель с 1.2 миллиардами параметров для парсинга PDF документов, представленная командой Shanghai Artificial Intelligence Laboratory. Модель достигает state-of-the-art результатов в парсинге PDF при минимальных вычислительных затратах благодаря двухэтапной стратегии обработки: анализ структуры на уменьшенном изображении и детальное распознавание фрагментов в исходном разрешении. Код доступен на GitHub, веса модели — на Hugging […]Source:MinerU2.5 — открытая 1.2B-модель для парсинга PDF документов превосходит Gemini 2.5 Pro на бенчмарках
Полный текст статьи пока не загружен.