← Voltar ao Blog
Radar de pesquisaDetecção facialarXivJunho de 2026

Radar mensal do arXiv

Detecção facial em junho de 2026: benchmarks de justiça, detecção neonatal e viés PAD

Os trabalhos mostram a primeira etapa biométrica mais auditável: medição de justiça, adaptação clínica e escolha de arquitetura PAD.

O que este mês sinaliza

O sinal do mês é governança: labels demográficos, validação de domínio e PAD avaliado por accuracy e justiça.

Artigo 012026-06-30cs.CV

WIDER-FAIR: versão anotada do WIDER-FACE para avaliação de justiça

Autores e instituições

Maxime Moussi

UCLouvain, Louvain-la-Neuve, Belgium

Benoît Ronval

UCLouvain, ICTEAM, Louvain-la-Neuve, Belgium

Siegfried Nijssen

UCLouvain, ICTEAM, Louvain-la-Neuve, Belgium

KU Leuven, DTAI, Leuven, Belgium

Félicien Schiltz

Euranova, Mont-Saint-Guibert, Belgium

Que problema resolve

Trata uma lacuna de medição: benchmarks de detecção raramente trazem rótulos sensíveis.

Resultado-chave

A demonstração encontra desempenho menor para pessoas Black; excluir esse grupo aumenta mais a disparidade do que excluir outros grupos.

Resumo

WIDER-FAIR adiciona etnia e sexo percebidos a um subconjunto WIDER-FACE para auditar disparidades demográficas em detectores. A coerência é validada com embeddings, KNN e t-SNE.

Ponto de partida da pesquisa

Detecção facial costuma iniciar reconhecimento, liveness e analytics; erros demográficos nessa etapa se propagam.

Método

Os autores anotam manualmente 16.256 imagens com quatro etnias percebidas e dois sexos, depois fazem ablações para medir efeitos de exclusão de grupos.

Síntese do artigo

WIDER-FAIR torna a justiça de detectores testável. Para fornecedores, um bom score global pode esconder falhas por grupo sem anotações corretas.

Artigo 022026-06-18cs.CV

InfantFace: detecção de rostos de bebês em ambientes clínicos neonatais

Autores e instituições

Abdullah Bin-Obaid

Institute of Biomedical Engineering, Department of Engineering Science, University of Oxford, Oxford, United Kingdom

Maria M. Cobo

Department of Paediatrics, University of Oxford, Oxford, United Kingdom

Universidad San Francisco de Quito USFQ, Colegio de Ciencias Biológicas y Ambientales, Quito, Ecuador

Rebeccah Slater

Department of Paediatrics, University of Oxford, Oxford, United Kingdom

Lionel Tarassenko

Institute of Biomedical Engineering, Department of Engineering Science, University of Oxford, Oxford, United Kingdom

Mauricio Villarroel

Institute of Biomedical Engineering, Department of Engineering Science, University of Oxford, Oxford, United Kingdom

Que problema resolve

Trata a falta de datasets neonatais públicos e a incerteza sobre detectores gerais em UTI neonatal.

Resultado-chave

Antes do ajuste clínico, atinge AP50 0,87 e supera três detectores gerais; após adaptação neonatal chega a 0,96.

Resumo

InfantFace adapta detecção facial a vídeo clínico neonatal para dor, desconforto, sinais cardiorrespiratórios e respiração sem contato. YOLOv11m é ajustado com 228 vídeos de 113 bebês.

Ponto de partida da pesquisa

Detecção clínica difere do consumo: pouca luz, fundo confuso e equipamentos podem ocluir o rosto do bebê.

Método

Os autores criam uma pipeline YOLOv11m one-stage, treinam estrutura facial geral em datasets públicos e adaptam com vídeos neonatais do domínio alvo.

Síntese do artigo

InfantFace lembra que detecção facial não é uma categoria única. Em saúde, adaptação de domínio e governança de dados podem importar mais que o detector geral mais novo.

Artigo 032026-06-16cs.CV

Viés arquitetural em detecção de ataque de apresentação facial: ViT versus CNN

Autores e instituições

Ngela Landon Ntung

College of Engineering, Carnegie Mellon University Africa, Kigali, Rwanda

Floride Tuyisenge

College of Engineering, Carnegie Mellon University Africa, Kigali, Rwanda

Jema David Ndibwile

College of Engineering, Carnegie Mellon University Africa, Kigali, Rwanda

Que problema resolve

Questiona se justiça é só problema de dados ou se viés arquitetural e pré-treinamento também mudam comportamento entre grupos.

Resultado-chave

DeiT-S pré-treinado atinge 97,27% de accuracy e 0,86% EER, reduz o gap ACER para 0,13% e relata vantagem BPCER 3,6x sobre ResNet18.

Resumo

Compara se a arquitetura afeta a justiça demográfica em PAD facial. No CASIA-SURF CeFA avalia ViT-Tiny multimodal, ResNet18 e DeiT-S pré-treinado.

Ponto de partida da pesquisa

PAD é camada de segurança biométrica; erros por tom de pele ou etnia criam bloqueio ou risco desigual.

Método

Comparam CNN e transformers no mesmo benchmark PAD, medindo accuracy/EER e lacunas APCER/BPCER/ACER por grupo e zero-shot Central Asian.

Síntese do artigo

Para compradores biométricos, arquitetura afeta justiça tanto quanto accuracy. Avaliação PAD deve incluir fatias demográficas e populações não vistas.