作者与机构
Sunghwan Baek
Carnegie Mellon University, USA
Tariq Anwaar
Carnegie Mellon University, USA
Karanveer Singh
Carnegie Mellon University, USA
Rita Singh
Carnegie Mellon University, USA
解决了什么问题
论文检验精心选择的手工取证线索是否能在不扩大模型的情况下提升鲁棒性。
关键结果
新增模块仅增加 292 个参数,将 FaceForensics++ 平均 AUC 从 74.8% 提升到 78.6%,DFDC-Preview 从 70.5% 提升到 74.9%,并在八个公开基准上优于 F3Net、SRM 和 SPSL。
摘要
论文表明,视频人脸伪造检测不一定需要更宽或双流骨干。作者在 Xception 基线上加入仅 292 个参数的轻量融合模块,将低频小波去噪特征与相位谱或局部二值模式线索结合,在多个公开基准上提升 AUC。
研究出发点
许多视频人脸伪造检测器通过加宽模型或增加分支提升能力,但这会提高部署成本。
方法概述
作者在 Xception 上加入极小融合模块,将小波去噪特征与相位谱线索或局部二值模式结合。
论文总结
这篇论文的核心启发是:Deepfake 检测并不总是需要更大的 backbone,关键在于取证线索是否选得准、融合得好。它用极小的融合模块结合低频小波去噪特征与相位或纹理线索,为需要更强跨基准鲁棒性、但不想增加数据、测试增强或重推理成本的团队提供了一个成本更克制的方向。