Использование самоконтролируемых вспомогательных задач для улучшения детального представления лицевых признаков
Краткое содержание
arXiv:2105.06421v4 Тип объявления: replace-cross Аннотация: Распознавание эмоций по лицу (FER) — это задача тонкой классификации, где ценность трансферного обучения часто принимается как данность. Мы сначала количественно оцениваем это предположение и показываем, что на наборе данных AffectNet обучение с нуля со sufficiently сильной аугментацией данных последовательно соответствует или превосходит тонкую настройку модели, предварительно обученной на ImageNet. Мотивированные этим результатом, мы предлагаем Гибридное Многозадачное Обучение (HMTL) для FER в реальных условиях. HMTL дополняет обучение с учителем (SL) задачами самообучения (SSL) в процессе тренировки, сохраняя при этом модель на этапе вывода неизменной. Мы реализуем HMTL с двумя специализированными pretext-задачами — puzzling и inpainting с перцептивными потерями, — которые способствуют извлечению признаков, учитывающих части лица и релевантных для определения эмоций. На наборе AffectNet обе разновидности HMTL достигают высочайшей точности в условиях классификации восьми эмоций без использования каких-либо дополнительных данных для предварительного обучения, и они обеспечивают больший прирост в условиях ограниченного объема данных. По сравнению с обычными SSL п
Полный текст статьи пока не загружен.