Fusión ligera de señales complementarias para detección robusta de falsificaciones faciales en video
Autores e instituciones
Sunghwan Baek
Carnegie Mellon University, USA
Tariq Anwaar
Carnegie Mellon University, USA
Karanveer Singh
Carnegie Mellon University, USA
Rita Singh
Carnegie Mellon University, USA
Qué problema resuelve
El problema central es resolver cuellos de botella de video face forgery detection, lightweight forensics, frequency cues en detección de deepfakes de forma evaluable para despliegue real.
Resultado clave
Los resultados muestran mejoras en precisión, eficiencia, generalización o explicabilidad, reduciendo riesgo de despliegue.
Resumen
Este trabajo aborda «Lightweight Complementary-Cue Fusion for Robust Video Face Forgery Detection» y estudia video face forgery detection, lightweight forensics, frequency cues bajo restricciones cercanas a producción. Sus resultados ayudan a evaluar precisión, eficiencia, generalización y fiabilidad.
Punto de partida
La motivación es que video face forgery detection, lightweight forensics, frequency cues en detección de deepfakes afecta privacidad, coste, robustez o experiencia de usuario.
Método
El enfoque de «Lightweight Complementary-Cue Fusion for Robust Video Face Forgery Detection» combina diseño de modelo, estrategia de entrenamiento u optimización de sistema para acercar la investigación a una capacidad desplegable.
Conclusión del artículo
La lección principal es que la detección de deepfakes no siempre necesita un backbone mayor si las señales forenses se eligen y fusionan bien. Al combinar rasgos de baja frecuencia denoised por wavelet con señales de fase o textura mediante un bloque de fusión mínimo, el trabajo ofrece una alternativa consciente del coste para equipos que buscan robustez en más benchmarks sin añadir datos, augmentación ni inferencia pesada.