FaceMoE: mistura de especialistas para reconhecimento facial de baixa resolução
Autores e instituições
Kartik Narayan
Johns Hopkins University
Vishal M. Patel
Johns Hopkins University
Que problema resolve
O artigo trata a fraqueza de um encoder único, que pode perder conhecimento HR e modelar mal regiões degradadas após ajuste LR.
Resultado-chave
Em onze benchmarks HR, mistos e LR, os autores relatam ganhos claros sobre o estado da arte com ativação esparsa de especialistas.
Resumo
FaceMoE mira reconhecimento facial de baixa resolução, em que blur, oclusão, baixo contraste e diferença HR/LR reduzem pistas de identidade. O transformer usa especialistas FFN e roteador top-k para ativar capacidade especializada.
Ponto de partida da pesquisa
Vigilância, acesso e fronteira comparam probes degradados com cadastro limpo; o problema é também o gap de domínio, não só a falta de detalhes.
Método
FaceMoE insere especialistas feed-forward em um transformer e usa roteamento top-k por token. A loss de reconhecimento, z-loss do roteador e balanceamento de carga estabilizam a especialização.
Síntese do artigo
FaceMoE é útil quando a qualidade de captura não é controlável. O roteamento adiciona capacidade para faces degradadas sem treinar outro sistema LR nem pagar todo o custo de um modelo denso maior.