← Volver al Blog
Radar de investigaciónDetección facialarXivJunio de 2026

Radar mensual de arXiv

Detección facial en junio de 2026: benchmarks de equidad, detección neonatal y sesgo PAD

Los trabajos muestran una primera etapa biométrica más auditable: medición de equidad, adaptación clínica y arquitectura PAD.

Lo que señala este mes

La señal del mes es gobernanza: labels demográficos, validación específica de dominio y PAD evaluado por accuracy y equidad.

Artículo 012026-06-30cs.CV

WIDER-FAIR: versión anotada de WIDER-FACE para evaluación de equidad

Autores e instituciones

Maxime Moussi

UCLouvain, Louvain-la-Neuve, Belgium

Benoît Ronval

UCLouvain, ICTEAM, Louvain-la-Neuve, Belgium

Siegfried Nijssen

UCLouvain, ICTEAM, Louvain-la-Neuve, Belgium

KU Leuven, DTAI, Leuven, Belgium

Félicien Schiltz

Euranova, Mont-Saint-Guibert, Belgium

Qué problema resuelve

Aborda una brecha de medición: benchmarks populares rara vez incluyen etiquetas sensibles para validar equidad.

Resultado clave

La demostración halla menor rendimiento para personas Black; excluir ese grupo aumenta más la disparidad que excluir otros grupos étnicos.

Resumen

WIDER-FAIR añade etnia y sexo percibidos a un subconjunto de WIDER-FACE para auditar disparidades demográficas en detectores. Valida coherencia con embeddings, KNN y t-SNE.

Punto de partida

La detección facial suele ser el primer paso de reconocimiento, liveness y analítica; sus fallos demográficos se propagan.

Método

Anotan manualmente 16.256 imágenes con cuatro etnias percibidas y dos sexos, y hacen ablaciones para medir cómo excluir grupos cambia la equidad.

Conclusión del artículo

WIDER-FAIR convierte la equidad de detectores en evidencia medible. Para proveedores, un buen score global puede ocultar fallos por grupo si faltan anotaciones.

Artículo 022026-06-18cs.CV

InfantFace: detección de rostros de bebés en entornos clínicos neonatales

Autores e instituciones

Abdullah Bin-Obaid

Institute of Biomedical Engineering, Department of Engineering Science, University of Oxford, Oxford, United Kingdom

Maria M. Cobo

Department of Paediatrics, University of Oxford, Oxford, United Kingdom

Universidad San Francisco de Quito USFQ, Colegio de Ciencias Biológicas y Ambientales, Quito, Ecuador

Rebeccah Slater

Department of Paediatrics, University of Oxford, Oxford, United Kingdom

Lionel Tarassenko

Institute of Biomedical Engineering, Department of Engineering Science, University of Oxford, Oxford, United Kingdom

Mauricio Villarroel

Institute of Biomedical Engineering, Department of Engineering Science, University of Oxford, Oxford, United Kingdom

Qué problema resuelve

Aborda la falta de datasets neonatales públicos y la incertidumbre sobre detectores generales en UCI neonatal.

Resultado clave

Antes del ajuste clínico alcanza AP50 0,87 y supera tres detectores generales; tras adaptación neonatal sube a 0,96.

Resumen

InfantFace adapta la detección facial a video clínico neonatal, útil para evaluar dolor, estrés, señales cardiorrespiratorias y respiración sin contacto. YOLOv11m se ajusta con 228 videos de 113 bebés.

Punto de partida

La detección clínica difiere del consumo: mala iluminación, fondos complejos y equipos que ocluyen el rostro del bebé.

Método

Construyen una pipeline YOLOv11m de una etapa, aprenden estructura facial general con datasets públicos y la adaptan con videos neonatales del dominio objetivo.

Conclusión del artículo

InfantFace recuerda que “detección facial” no es una categoría única. En salud, adaptación de dominio y gobernanza de datos importan más que elegir el detector general más nuevo.

Artículo 032026-06-16cs.CV

Sesgo arquitectónico en detección de ataques de presentación facial: ViT frente a CNN

Autores e instituciones

Ngela Landon Ntung

College of Engineering, Carnegie Mellon University Africa, Kigali, Rwanda

Floride Tuyisenge

College of Engineering, Carnegie Mellon University Africa, Kigali, Rwanda

Jema David Ndibwile

College of Engineering, Carnegie Mellon University Africa, Kigali, Rwanda

Qué problema resuelve

Pregunta si la equidad es solo un problema de datos o si sesgos arquitectónicos y preentrenamiento cambian el comportamiento entre grupos.

Resultado clave

DeiT-S preentrenado alcanza 97,27% accuracy y 0,86% EER, reduce la brecha ACER a 0,13% y logra ventaja BPCER 3,6x sobre ResNet18.

Resumen

Compara si la arquitectura afecta la equidad demográfica en PAD facial. En CASIA-SURF CeFA evalúa ViT-Tiny multimodal, ResNet18 y DeiT-S preentrenado en varios grupos.

Punto de partida

PAD es una capa de seguridad biométrica; errores distintos por tono de piel o etnia crean bloqueo o riesgo desigual.

Método

Comparan CNN y transformers en el mismo benchmark PAD, midiendo accuracy/EER y brechas APCER/BPCER/ACER por grupo y zero-shot Central Asian.

Conclusión del artículo

Para compradores biométricos, la arquitectura afecta la equidad tanto como la precisión. La evaluación PAD debe incluir cortes demográficos y poblaciones no vistas.