← Zurück zum Blog
ForschungsradarGesichtserkennung und Face DetectionarXivJuni 2026

Monatliches arXiv-Radar

Face Detection im Juni 2026: Fairness-Benchmarks, Neonataldetektion und PAD-Bias

Die Arbeiten zeigen, dass der erste Schritt biometrischer Pipelines stärker auditierbar wird: Fairnessmessung, klinische Domain Adaptation und PAD-Architekturwahl.

Was dieser Monat zeigt

Das Signal des Monats ist Governance: Detektoren brauchen demografische Labels, domainspezifische Validierung und PAD-Architekturen mit Accuracy- und Fairnessprüfung.

Paper 012026-06-30cs.CV

WIDER-FAIR: annotierte WIDER-FACE-Version für Fairness-Evaluierung

Autoren & Institutionen

Maxime Moussi

UCLouvain, Louvain-la-Neuve, Belgium

Benoît Ronval

UCLouvain, ICTEAM, Louvain-la-Neuve, Belgium

Siegfried Nijssen

UCLouvain, ICTEAM, Louvain-la-Neuve, Belgium

KU Leuven, DTAI, Leuven, Belgium

Félicien Schiltz

Euranova, Mont-Saint-Guibert, Belgium

Welches Problem es löst

Die Arbeit adressiert eine Messlücke: verbreitete Detektionsbenchmarks enthalten selten Sensitive-Feature-Labels.

Zentrales Ergebnis

Die Demonstration zeigt deutlich niedrigere Detektionsleistung für Black individuals; ihr Ausschluss erhöht die Disparität stärker als andere Gruppen.

Abstract

WIDER-FAIR ergänzt einen WIDER-FACE-Subset um wahrgenommene Ethnie und Geschlecht, damit Face-Detektoren auf demografische Unterschiede geprüft werden können. Embeddings, KNN und t-SNE prüfen die Konsistenz.

Ausgangspunkt der Forschung

Face Detection ist oft der erste Schritt für Recognition, Liveness und Analytics; demografische Fehlerraten wirken sich auf alle Downstream-Metriken aus.

Methode

Die Autoren annotieren 16.256 Bilder manuell nach vier wahrgenommenen Ethnien und zwei Geschlechtskategorien und nutzen Ablationen, um Fairness-Effekte von Gruppenausschlüssen zu messen.

Einordnung

WIDER-FAIR macht Fairness von Face-Detektoren testbar. Für Anbieter zeigt es, dass ein guter Gesamtbenchmark gruppenspezifische Fehler verdecken kann.

Paper 022026-06-18cs.CV

InfantFace: Erkennung von Säuglingsgesichtern in neonatologischen Kliniken

Autoren & Institutionen

Abdullah Bin-Obaid

Institute of Biomedical Engineering, Department of Engineering Science, University of Oxford, Oxford, United Kingdom

Maria M. Cobo

Department of Paediatrics, University of Oxford, Oxford, United Kingdom

Universidad San Francisco de Quito USFQ, Colegio de Ciencias Biológicas y Ambientales, Quito, Ecuador

Rebeccah Slater

Department of Paediatrics, University of Oxford, Oxford, United Kingdom

Lionel Tarassenko

Institute of Biomedical Engineering, Department of Engineering Science, University of Oxford, Oxford, United Kingdom

Mauricio Villarroel

Institute of Biomedical Engineering, Department of Engineering Science, University of Oxford, Oxford, United Kingdom

Welches Problem es löst

Die Arbeit adressiert den Mangel an öffentlichen neonatalen Face-Detection-Datasets und die Unsicherheit allgemeiner Detektoren in Intensivbedingungen.

Zentrales Ergebnis

Vor klinischem Fine-tuning erreicht das Modell AP50 0,87 und schlägt drei allgemeine Detektoren; nach Anpassung steigt AP50 auf 0,96.

Abstract

InfantFace passt Face Detection an neonatologische Klinikvideos an, wo Gesichtslokalisierung kontaktlose Schmerz-, Stress-, kardiorespiratorische und Atembewertungen unterstützt. YOLOv11m wird auf 228 neonatalen Videos feinjustiert.

Ausgangspunkt der Forschung

Klinische Face Detection unterscheidet sich stark von Consumer-Szenarien: schlechtes Licht, Unordnung und Geräte verdecken oft das Gesicht.

Methode

Die Autoren bauen eine One-Stage-YOLOv11m-Pipeline, lernen allgemeine Gesichtsstruktur aus öffentlichen Datasets und passen sie mit neonatalen Zielvideos an.

Einordnung

InfantFace zeigt, dass Face Detection kein einheitliches Produkt ist. In Medizin und anderen restriktiven Umgebungen sind Domain Adaptation und Dataset Governance oft wichtiger als der neueste allgemeine Detektor.

Paper 032026-06-16cs.CV

Architektureller Bias in Face Presentation Attack Detection: Vergleich von Vision Transformern und CNNs

Autoren & Institutionen

Ngela Landon Ntung

College of Engineering, Carnegie Mellon University Africa, Kigali, Rwanda

Floride Tuyisenge

College of Engineering, Carnegie Mellon University Africa, Kigali, Rwanda

Jema David Ndibwile

College of Engineering, Carnegie Mellon University Africa, Kigali, Rwanda

Welches Problem es löst

Die Arbeit fragt, ob Fairness nur ein Datenproblem ist oder ob Architektur-Bias und Pretraining ebenfalls Verhalten über Gruppen verändern.

Zentrales Ergebnis

Pretrained DeiT-S erreicht 97,27% Accuracy und 0,86% EER, reduziert den African/East-Asian-ACER-Gap auf 0,13% und meldet 3,6x BPCER-Vorteil gegenüber ResNet18.

Abstract

Die Arbeit vergleicht, ob Architektur demografische Fairness in Face PAD beeinflusst. Auf CASIA-SURF CeFA werden Multimodal ViT-Tiny, ResNet18 und pretrained DeiT-S über African, East Asian und zero-shot Central Asian Gruppen evaluiert.

Ausgangspunkt der Forschung

PAD ist eine Sicherheitsschicht biometrischer Authentisierung; unterschiedliche Fehlerraten nach Hautfarbe oder Ethnie erzeugen ungleiche Risiken.

Methode

Die Autoren vergleichen CNN-Baseline und Transformer-Varianten auf demselben PAD-Benchmark und messen neben Accuracy/EER auch APCER/BPCER/ACER-Gaps und Zero-Shot-Generalisation.

Einordnung

Für Biometrie-Käufer zählt: Architekturwahl beeinflusst Fairness, nicht nur Accuracy. PAD-Evaluierungen sollten demografische Slices und unseen-population tests enthalten.