← Назад в Блог
Исследовательский радарДетекция лицarXivИюнь 2026

Ежемесячный радар arXiv

Детекция лиц в июне 2026: fairness benchmarks, neonatal detection и PAD bias

Работы показывают, что первый этап biometric pipeline становится более audit-ready: fairness measurement, clinical adaptation и PAD architecture choice.

Что показывает этот месяц

Сигнал месяца — governance: demographic labels для audits, domain validation для clinics и PAD architectures по accuracy/fairness.

Статья 012026-06-30cs.CV

WIDER-FAIR: аннотированная версия WIDER-FACE для оценки fairness

Авторы и организации

Maxime Moussi

UCLouvain, Louvain-la-Neuve, Belgium

Benoît Ronval

UCLouvain, ICTEAM, Louvain-la-Neuve, Belgium

Siegfried Nijssen

UCLouvain, ICTEAM, Louvain-la-Neuve, Belgium

KU Leuven, DTAI, Leuven, Belgium

Félicien Schiltz

Euranova, Mont-Saint-Guibert, Belgium

Какую задачу решает

Работа закрывает measurement gap: популярные detection benchmarks редко имеют sensitive-feature labels.

Ключевой результат

Демонстрация показывает более низкую детекцию для Black individuals; исключение этой группы усиливает disparity больше других групп.

Аннотация

WIDER-FAIR добавляет perceived ethnicity и sex к subset WIDER-FACE, чтобы аудитить demographic disparities у face detectors. Согласованность проверяется embeddings, KNN и t-SNE.

Отправная точка исследования

Face detection часто первый этап recognition, liveness и analytics; demographic miss rates затем распространяются вниз по pipeline.

Метод

Авторы вручную размечают 16 256 изображений по четырем perceived ethnic groups и двум sex categories, затем делают training ablations для оценки fairness.

Вывод по статье

WIDER-FAIR переводит fairness детекторов из анекдотов в проверяемые данные. Для vendors общий benchmark score может скрывать group-specific failures.

Статья 022026-06-18cs.CV

InfantFace: детекция лиц младенцев в неонатальной клинике

Авторы и организации

Abdullah Bin-Obaid

Institute of Biomedical Engineering, Department of Engineering Science, University of Oxford, Oxford, United Kingdom

Maria M. Cobo

Department of Paediatrics, University of Oxford, Oxford, United Kingdom

Universidad San Francisco de Quito USFQ, Colegio de Ciencias Biológicas y Ambientales, Quito, Ecuador

Rebeccah Slater

Department of Paediatrics, University of Oxford, Oxford, United Kingdom

Lionel Tarassenko

Institute of Biomedical Engineering, Department of Engineering Science, University of Oxford, Oxford, United Kingdom

Mauricio Villarroel

Institute of Biomedical Engineering, Department of Engineering Science, University of Oxford, Oxford, United Kingdom

Какую задачу решает

Работа решает нехватку public neonatal datasets и неопределенность надежности generic detectors в ICU conditions.

Ключевой результат

До clinical fine-tuning модель дает AP50 0.87 и лучше трех generic detectors; после neonatal adaptation AP50 растет до 0.96.

Аннотация

InfantFace адаптирует face detection к neonatal clinical video для бесконтактной оценки боли, distress, кардиореспираторных сигналов и дыхания. YOLOv11m дообучается на 228 видео 113 младенцев.

Отправная точка исследования

Клиническая face detection отличается от consumer-сценариев: плохой свет, cluttered background и оборудование закрывают лицо.

Метод

Авторы строят one-stage YOLOv11m, обучают общую face structure на public datasets и адаптируют на ethically collected neonatal videos.

Вывод по статье

InfantFace показывает, что face detection не единая категория. В healthcare domain adaptation и dataset governance важнее выбора самого нового generic detector.

Статья 032026-06-16cs.CV

Архитектурный bias в Face PAD: сравнение Vision Transformers и CNN

Авторы и организации

Ngela Landon Ntung

College of Engineering, Carnegie Mellon University Africa, Kigali, Rwanda

Floride Tuyisenge

College of Engineering, Carnegie Mellon University Africa, Kigali, Rwanda

Jema David Ndibwile

College of Engineering, Carnegie Mellon University Africa, Kigali, Rwanda

Какую задачу решает

Работа спрашивает, fairness — только data problem или architecture inductive bias и pretraining тоже меняют cross-demographic behavior.

Ключевой результат

Pretrained DeiT-S достигает 97.27% accuracy и 0.86% EER, снижает ACER gap до 0.13% и дает 3.6x BPCER advantage над ResNet18.

Аннотация

Работа сравнивает, влияет ли архитектура на demographic fairness в Face PAD. На CASIA-SURF CeFA оцениваются Multimodal ViT-Tiny, ResNet18 и pretrained DeiT-S.

Отправная точка исследования

PAD — слой безопасности biometric authentication; разные ошибки по skin tone или ethnicity создают неравный lockout/spoofing risk.

Метод

Авторы сравнивают CNN и Transformer variants на одном PAD benchmark, отслеживая accuracy/EER, APCER/BPCER/ACER gaps и zero-shot Central Asian.

Вывод по статье

Для biometric buyers важно: architecture choice влияет на fairness не меньше headline accuracy. PAD evaluation должна включать demographic slices и unseen-population tests.