← 返回博客
研究雷达人脸检测arXiv2026年5月

每月 arXiv 雷达

2026 年 5 月人脸检测论文:呈现攻击、合成人脸闸门与单类真实性建模

2026 年 5 月显式 face detector 论文较少,因此本期扩展到企业人脸系统越来越常与检测前端绑定的决策:呈现攻击检测、合成人脸闸门,以及在人脸图像进入下游身份流程前的真实性评分。

本月趋势判断

人脸系统前端正从单纯定位转向可信判断:实时 PAD、不确定性感知合成人脸检测和单类真实性建模正在汇入同一层接入判断。

论文 012026-05-13cs.CV

面向轻量级人脸呈现攻击检测的光流增强与知识蒸馏

作者与机构

Muhammad Shahid Jabbar

SDAIA-KFUPM Joint Research Center for Artificial Intelligence, King Fahd University of Petroleum & Minerals, Dhahran, Saudi Arabia

Muhammad Sohail Ibrahim

Interdisciplinary Research Center for Intelligent Secure Systems (IRC-ISS), King Fahd University of Petroleum & Minerals, Dhahran, Saudi Arabia

Taha Hasan Masood Siddique

College of Information Science & Electronic Engineering, Zhejiang University, Hangzhou, China

Kejie Huang

College of Information Science & Electronic Engineering, Zhejiang University, Hangzhou, China

Shujaat Khan

SDAIA-KFUPM Joint Research Center for Artificial Intelligence, King Fahd University of Petroleum & Minerals, Dhahran, Saudi Arabia

Department of Computer Engineering, College of Computing and Mathematics, King Fahd University of Petroleum & Minerals, Dhahran, Saudi Arabia

解决了什么问题

论文解决了基于光流的 FacePAD 方法在推理阶段成本过高的问题。

关键结果

蒸馏学生模型在 Replay-Attack 和 Replay-Mobile 上达到 0.0% HTER,在 ROSE-Youtu 上 0.94% HTER,在 SiW-Mv2 上 5.65% HTER,在 OULU-NPU 上 0.42% ACER,并在 NVIDIA Jetson Orin Nano 上达到 52 FPS。

摘要

人脸呈现攻击检测需要处理打印、重放、3D 面具、妆容和遮挡等多种攻击,同时还要满足实时部署。论文在训练阶段利用光流增强运动表征,再通过知识蒸馏把 motion-aware 能力迁移到 RGB-only 轻量学生模型,使推理阶段无需显式光流。

研究出发点

呈现攻击检测需要识别细微运动线索,同时还要能在嵌入式设备和摄像头侧硬件上运行。

方法概述

双分支教师模型同时学习 RGB 外观和颜色轮编码光流,再通过 logit 蒸馏把运动感知知识迁移给轻量 RGB-only 学生模型。

论文总结

它的实际贡献在于让动作感知的呈现攻击检测不必在推理阶段承担完整光流计算成本。光流增强教师模型把时间维活体线索蒸馏给轻量 RGB 学生模型,使方案更适合自助终端、移动开户和端侧摄像头等需要快速防伪、又不希望依赖服务器往返的场景。

论文 022026-05-11cs.CV

基于证据的合成人脸检测决策建模与不确定性驱动主动学习

作者与机构

Qingchao Jiang

Key Laboratory of Smart Manufacturing in Energy Chemical Process, Ministry of Education, East China University of Science and Technology, Shanghai, China

Zhenxuan Hou

School of Information Science and Engineering, East China University of Science and Technology, Shanghai, China

Zhiying Zhu

School of Information Science and Engineering, East China University of Science and Technology, Shanghai, China

Zhenxing Qian

College of Computer Science and Artificial Intelligence, Fudan University, Shanghai, China

Xinpeng Zhang

College of Computer Science and Artificial Intelligence, Fudan University, Shanghai, China

Zaiwang Gu

Institute of Advanced Intelligence and Computing, Agency for Science, Technology and Research (A*STAR), Singapore

解决了什么问题

该工作针对合成人脸检测中的 Softmax 过度自信和高标注成本问题。

关键结果

作者报告了更好的可解释性与泛化能力,相比已有 SOTA 基线准确率提升 15%。

摘要

合成人脸检测模型常因 Softmax 过度自信而难以处理未知分布样本,也依赖大量标注。EMSFD 使用 Dirichlet 分布建模证据并显式估计不确定性,再用不确定性驱动主动学习选择更有价值的未标注样本,从而提高可靠性与泛化。

研究出发点

合成人脸检测已不再是封闭集分类问题,因为新的生成器和分布外图像持续出现。

方法概述

EMSFD 用 Dirichlet 分布建模类别证据,显式输出预测不确定性,并用不确定性驱动主动学习选择更有信息量的未标注样本。

论文总结

EMSFD 把合成人脸检测从简单二分类,重新表述为带不确定性估计的决策流程。这对内容审核、开户注册和身份风险控制很重要,因为系统可以把低置信度样本送去复核或主动标注,而不是在遇到未知生成器时给出过度自信的判断。

论文 032026-05-11cs.CV

只训练一次:用于人脸真实性检测的不确定性感知单类学习

作者与机构

Qingchao Jiang

School of Information Science and Engineering, East China University of Science and Technology, Shanghai, China

Zhenxuan Hou

School of Information Science and Engineering, East China University of Science and Technology, Shanghai, China

Zhiying Zhu

School of Information Science and Engineering, East China University of Science and Technology, Shanghai, China

Zhenxing Qian

College of Computer Science and Artificial Intelligence, Fudan University, Shanghai, China

Xinpeng Zhang

College of Computer Science and Artificial Intelligence, Fudan University, Shanghai, China

Zaiwang Gu

Institute for Infocomm Research, Agency for Science, Technology and Research (A*STAR), Singapore

解决了什么问题

论文将人脸伪造检测改写为只从真实人脸学习的单类问题,试图统一 DeepFake 与整脸合成检测。

关键结果

在 DF40 和 ASFD 上,论文报告平均准确率 96.63%、平均精度 98.83%,并展现较强泛化能力。

摘要

面对不断变化的生成范式,二分类式人脸伪造检测容易在未知生成器上性能下降。FADNet 将人脸真实性检测改写为只用真实人脸训练的单类学习问题,结合证据深度学习和伪伪造样本生成器,使偏离真实人脸分布的图像被识别为伪造。

研究出发点

人脸真实性系统需要面对未知伪造生成器,而不能每出现一种新方法就重训二分类器。

方法概述

FADNet 学习真实人脸分布,引入证据深度学习估计不确定性,并使用可插拔伪伪造生成器收紧真实数据周围的决策边界。

论文总结

FADNet 的价值在于针对检测器频繁失效的问题:它不再要求为每一种新伪造生成器收集样本,而是学习真实人脸分布,并把明显偏离该分布的样本视为可疑。结合不确定性估计和伪伪造样本收紧边界后,这种方法更适合作为覆盖 deepfake 与完全合成人脸的通用真实性门控。