ZERO: Готовая к промышленному применению визуальная базовая модель с многоформатными подсказками
Краткое содержание
arXiv:2507.04270v4 Тип анонса: замена-перекрёстная публикация Аннотация: Фундаментальные модели произвели революцию в области ИИ, однако испытывают трудности при нулевом внедрении в реальных промышленных условиях из-за отсутствия высококачественных специализированных наборов данных. Для преодоления данного разрыва компания Superb AI представляет ZERO — готовую к промышленному применению фундаментальную визуальную модель, использующую мультимодальное подсказывание (текстовое и визуальное) для обобщения без дополнительного переобучения. Обученная на компактной, но репрезентативной выборке объемом 0,9 млн размеченных образцов из проприетарного промышленного набора данных миллиардного масштаба, модель ZERO демонстрирует конкурентоспособную производительность на академических эталонных наборах вроде LVIS-Val и значительно превосходит существующие решения на 37 различных промышленных датасетах. Более того, ZERO заняла второе место в конкурсе детектирования объектов CVPR 2025 и четвертое место в соревновании по маловыборочному обнаружению объектов, подчеркивая её практичность, применимость и способность к обобщению с минимальной адаптацией и ограниченным количеством данных. По нашим сведениям...
Полный текст статьи пока не загружен.