← Zurück zum Blog
ForschungsradarDeepfake-ErkennungarXivApril 2026

Monatliches arXiv-Radar

Deepfake-Erkennung im April 2026: Prompt Learning, leichte Generalisierung und 3D-Forensik

Die April-Arbeiten adressieren drei Enterprise-Schmerzpunkte: Generalisierung auf unbekannte Fälschungen, geringere Detektorkosten und stärkere Gesichtsevidenz als RGB-Pixel allein.

Was dieser Monat zeigt

Generalisierung zählt inzwischen genauso wie Peak Accuracy. Leichte Architekturen, Prompt-Anpassung und 3D-Rekonstruktion werden praktische Hebel für Robustheit.

Paper 012026-04-19cs.CV

Generalisierbare Gesichtsfälschungserkennung durch separierbares Prompt Learning

Autoren & Institutionen

Enrui Yang

School of Computer Science and Technology, Ocean University of China, Qingdao, China

Yuezun Li

School of Computer Science and Technology, Ocean University of China, Qingdao, China

Welches Problem es löst

Das Kernproblem ist, Engpässe rund um face forgery detection, prompt learning, CLIP deepfake detection in Deepfake Detection so zu adressieren, dass die Lösung nicht nur akademisch, sondern auch für Einkauf, Compliance und Engineering bewertbar wird.

Zentrales Ergebnis

Die Ergebnisse betonen Verbesserungen bei Genauigkeit, Effizienz, Robustheit oder Generalisierung. Für Käufer zählt vor allem, ob diese Verbesserungen Deployment-Risiken senken und den Einsatzbereich erweitern.

Abstract

Die Arbeit passt CLIP zu einem Gesichtsfälschungsdetektor an, indem sie nicht nur den visuellen Encoder, sondern besonders die Textseite des Modells nutzt. Durch Prompt Learning und Cross-Modality Alignment trennt sie fälschungsspezifische von irrelevanten Hinweisen und verbessert die Generalisierung über Datensätze und Angriffsmethoden hinweg.

Ausgangspunkt der Forschung

Die Motivation liegt darin, dass Deepfake Detection von Laborbenchmarks in reale Systeme wandert und face forgery detection, prompt learning, CLIP deepfake detection direkt Datenschutz, Kosten, Stabilität oder Nutzererlebnis beeinflusst.

Methode

Der Ansatz rund um „Generalizable Face Forgery Detection via Separable Prompt Learning“ kombiniert technische Architektur, Trainingsstrategie oder Systemoptimierung für face forgery detection, prompt learning, CLIP deepfake detection. Dadurch wird Forschung näher an produktfähige Fähigkeiten gebracht.

Einordnung

Kurz gesagt: Dieses Paper zeigt für Deepfake Detection im April 2026, dass face forgery detection, prompt learning, CLIP deepfake detection zu zentralen Variablen für Produktisierung und Enterprise-Bewertung werden.

Paper 022026-04-14cs.CV

LRD-Net: Ein leichtgewichtiges realzentriertes Detektionsnetz für domänenübergreifende Gesichtsfälschungserkennung

Autoren & Institutionen

Xuecen Zhang

Department of Computer Science and Engineering, University at Buffalo, The State University of New York, Buffalo, NY, USA

Vipin Chaudhary

Department of Computer Science and Engineering, University at Buffalo, The State University of New York, Buffalo, NY, USA

Welches Problem es löst

Das Kernproblem ist, Engpässe rund um cross-domain deepfake detection, lightweight face forgery detection, frequency-guided detection in Deepfake Detection so zu adressieren, dass die Lösung nicht nur akademisch, sondern auch für Einkauf, Compliance und Engineering bewertbar wird.

Zentrales Ergebnis

Die Ergebnisse betonen Verbesserungen bei Genauigkeit, Effizienz, Robustheit oder Generalisierung. Für Käufer zählt vor allem, ob diese Verbesserungen Deployment-Risiken senken und den Einsatzbereich erweitern.

Abstract

LRD-Net ist ein leichtgewichtiger domänenübergreifender Gesichtsfälschungsdetektor, der Frequenzführung mit einem MobileNetV3-artigen räumlichen Backbone kombiniert. Die realzentrierte Lernstrategie verankert Repräsentationen um authentische Gesichter, verbessert Robustheit gegenüber unbekannten Fälschungen und hält das Modell klein und schnell.

Ausgangspunkt der Forschung

Die Motivation liegt darin, dass Deepfake Detection von Laborbenchmarks in reale Systeme wandert und cross-domain deepfake detection, lightweight face forgery detection, frequency-guided detection direkt Datenschutz, Kosten, Stabilität oder Nutzererlebnis beeinflusst.

Methode

Der Ansatz rund um „LRD-Net: A Lightweight Real-Centered Detection Network for Cross-Domain Face Forgery Detection“ kombiniert technische Architektur, Trainingsstrategie oder Systemoptimierung für cross-domain deepfake detection, lightweight face forgery detection, frequency-guided detection. Dadurch wird Forschung näher an produktfähige Fähigkeiten gebracht.

Einordnung

Kurz gesagt: Dieses Paper zeigt für Deepfake Detection im April 2026, dass cross-domain deepfake detection, lightweight face forgery detection, frequency-guided detection zu zentralen Variablen für Produktisierung und Enterprise-Bewertung werden.

Paper 032026-04-17cs.CV

M3D-Net: Multimodales 3D-Gesichtsmerkmals-Rekonstruktionsnetz für Deepfake-Erkennung

Autoren & Institutionen

Haotian Wu

Ant Group, China

Yue Cheng

Ant Group, China

Shan Bian

Ant Group, China

Welches Problem es löst

Das Kernproblem ist, Engpässe rund um 3d deepfake detection, multimodal forensic cues, facial reconstruction in Deepfake Detection so zu adressieren, dass die Lösung nicht nur akademisch, sondern auch für Einkauf, Compliance und Engineering bewertbar wird.

Zentrales Ergebnis

Die Ergebnisse betonen Verbesserungen bei Genauigkeit, Effizienz, Robustheit oder Generalisierung. Für Käufer zählt vor allem, ob diese Verbesserungen Deployment-Risiken senken und den Einsatzbereich erweitern.

Abstract

M3D-Net rekonstruiert Gesichtsgeometrie und Reflektanz aus RGB-Bildern und fusioniert diese 3D-Hinweise mit Standard-Visual-Features für Deepfake-Erkennung. Ziel ist es, Detektion in Gesichtsstruktur zu verankern, die über einfache Pixelartefakte hinaus Bestand hat und dadurch besser über Szenarien generalisiert.

Ausgangspunkt der Forschung

Die Motivation liegt darin, dass Deepfake Detection von Laborbenchmarks in reale Systeme wandert und 3d deepfake detection, multimodal forensic cues, facial reconstruction direkt Datenschutz, Kosten, Stabilität oder Nutzererlebnis beeinflusst.

Methode

Der Ansatz rund um „M3D-Net: Multi-Modal 3D Facial Feature Reconstruction Network for Deepfake Detection“ kombiniert technische Architektur, Trainingsstrategie oder Systemoptimierung für 3d deepfake detection, multimodal forensic cues, facial reconstruction. Dadurch wird Forschung näher an produktfähige Fähigkeiten gebracht.

Einordnung

Kurz gesagt: Dieses Paper zeigt für Deepfake Detection im April 2026, dass 3d deepfake detection, multimodal forensic cues, facial reconstruction zu zentralen Variablen für Produktisierung und Enterprise-Bewertung werden.