FaceMoE: mezcla de expertos para reconocimiento facial de baja resolución
Autores e instituciones
Kartik Narayan
Johns Hopkins University
Vishal M. Patel
Johns Hopkins University
Qué problema resuelve
El trabajo aborda la debilidad de un único encoder compartido, que puede perder conocimiento HR y no modelar bien regiones degradadas tras fine-tuning LR.
Resultado clave
En once benchmarks HR, mixtos y LR, los autores reportan mejoras claras frente al estado del arte con activación dispersa de expertos.
Resumen
FaceMoE aborda reconocimiento facial de baja resolución, donde desenfoque, oclusión, bajo contraste y brecha HR/LR debilitan la identidad. Añade expertos FFN y un enrutador top-k a un transformer para activar capacidad especializada de forma dispersa.
Punto de partida
Vigilancia, control de acceso y frontera comparan probes degradados con imágenes de alta calidad; el riesgo es la brecha de dominio, no solo la falta de detalle.
Método
FaceMoE inserta expertos feed-forward en un transformer y usa routing top-k por token. La pérdida de reconocimiento, z-loss del router y balanceo de carga estabilizan la especialización.
Conclusión del artículo
FaceMoE sirve a equipos que no controlan la calidad de captura. Su valor es añadir capacidad para rostros degradados mediante routing sin entrenar otro sistema LR ni pagar todo el coste de un modelo denso mayor.