FaceMoE : mélange d’experts pour la reconnaissance faciale basse résolution
Auteurs & institutions
Kartik Narayan
Johns Hopkins University
Vishal M. Patel
Johns Hopkins University
Problème traité
L’article traite la faiblesse d’un encodeur unique, susceptible de perdre les connaissances HR et de mal gérer les régions dégradées après adaptation LR.
Résultat clé
Sur onze benchmarks HR, mixtes et LR, les auteurs rapportent des gains nets par rapport à l’état de l’art avec activation parcimonieuse des experts.
Résumé
FaceMoE traite la reconnaissance faciale basse résolution, où flou, occlusions, faible contraste et écart HR/LR affaiblissent les indices d’identité. Le transformer ajoute des experts FFN et un routeur top-k pour mobiliser une capacité spécialisée.
Point de départ de la recherche
Surveillance, contrôle d’accès et frontière comparent souvent des probes dégradés à des images d’enrôlement propres ; le risque vient aussi du domain gap.
Méthode
FaceMoE insère des experts feed-forward dans un transformer et applique un routage top-k par token. La loss de reconnaissance, la z-loss du routeur et l’équilibrage de charge stabilisent la spécialisation.
À retenir
FaceMoE aide les équipes qui ne maîtrisent pas la qualité de capture. Le routage ajoute de la capacité pour les visages dégradés sans système LR séparé ni coût complet d’un grand modèle dense.