연구 레이더딥페이크 탐지arXiv2026년 5월

월간 arXiv 레이더

2026년 5월 딥페이크 탐지 논문: 경량 비디오 단서, 파운데이션 모델 한계, 확산 얼굴 위치화

연구는 더 작은 모델, 명확한 일반화 한계, 확산 시대 얼굴 위조 위치화에 초점을 맞췄다.

이번 달이 보여주는 신호

핵심 신호는 더 큰 탐지기뿐 아니라 목표 단서와 정직한 일반화 감사가 중요하다는 점이다.

논문 012026-05-27cs.CV

강건한 영상 얼굴 위조 탐지를 위한 경량 상보 단서 융합

arXiv PDF

저자 및 소속

Sunghwan Baek

Carnegie Mellon University, USA

Tariq Anwaar

Carnegie Mellon University, USA

Karanveer Singh

Carnegie Mellon University, USA

Rita Singh

Carnegie Mellon University, USA

해결하는 문제

핵심 문제는 딥페이크 탐지의 video face forgery detection, lightweight forensics, frequency cues 관련 병목을 실제 배포 평가가 가능한 형태로 해결하는 것이다.

핵심 결과

결과는 정확도, 효율, 일반화 또는 설명 가능성의 개선을 보여 배포 리스크를 낮춘다.

초록

이 논문은 「Lightweight Complementary-Cue Fusion for Robust Video Face Forgery Detection」를 다루며 video face forgery detection, lightweight forensics, frequency cues를 실제 배포에 가까운 제약에서 검토한다. 결과는 정확도, 효율, 일반화, 신뢰성을 평가하는 데 도움을 준다.

연구 출발점

동기는 딥페이크 탐지에서 video face forgery detection, lightweight forensics, frequency cues가 개인정보, 비용, 견고성, 사용자 경험에 직접 영향을 주기 때문이다.

방법

「Lightweight Complementary-Cue Fusion for Robust Video Face Forgery Detection」의 접근은 모델 설계, 학습 전략 또는 시스템 최적화를 결합해 연구를 배포 가능한 역량에 가깝게 만든다.

논문 요약

핵심 교훈은 포렌식 단서를 잘 선택하고 융합한다면 딥페이크 탐지가 항상 더 큰 백본을 필요로 하지는 않는다는 점입니다. 저주파 웨이블릿 노이즈 제거 특징과 위상 또는 텍스처 단서를 아주 작은 융합 블록으로 결합해, 추가 데이터나 테스트 시 증강, 무거운 추론 비용 없이 더 넓은 벤치마크 견고성을 원하는 팀에 비용 절감형 대안을 제시합니다.

논문 022026-05-24cs.CV

얼굴 딥페이크 탐지에서 비전 파운데이션 모델의 교차 도메인 일반화 한계

arXiv PDF

저자 및 소속

Ibrahim Delibasoglu

Department of Software Engineering, Faculty of Computer and Information Sciences, Sakarya University, Sakarya, Türkiye

해결하는 문제

핵심 문제는 딥페이크 탐지의 foundation models, facial deepfake detection, cross-domain generalization 관련 병목을 실제 배포 평가가 가능한 형태로 해결하는 것이다.

핵심 결과

결과는 정확도, 효율, 일반화 또는 설명 가능성의 개선을 보여 배포 리스크를 낮춘다.

초록

이 논문은 「Cross-Domain Generalization Limits of Vision Foundation Models in Facial Deepfake Detection」를 다루며 foundation models, facial deepfake detection, cross-domain generalization를 실제 배포에 가까운 제약에서 검토한다. 결과는 정확도, 효율, 일반화, 신뢰성을 평가하는 데 도움을 준다.

연구 출발점

동기는 딥페이크 탐지에서 foundation models, facial deepfake detection, cross-domain generalization가 개인정보, 비용, 견고성, 사용자 경험에 직접 영향을 주기 때문이다.

방법

「Cross-Domain Generalization Limits of Vision Foundation Models in Facial Deepfake Detection」의 접근은 모델 설계, 학습 전략 또는 시스템 최적화를 결합해 연구를 배포 가능한 역량에 가깝게 만든다.

논문 요약

이 논문은 고정된 비전 파운데이션 모델이 딥페이크 일반화 문제를 자동으로 해결한다고 가정하면 안 된다는 경고입니다. 교차 도메인 테스트는 전체 얼굴 합성보다 국소 편집이 더 어려울 수 있음을 보여 주므로, 조달과 모델 선택에는 평균 벤치마크 점수뿐 아니라 생성기 변화와 조작 유형 변화에 대한 스트레스 테스트가 포함되어야 합니다.

논문 032026-05-11cs.CV

MFVLR: 일반화 가능한 확산 얼굴 위조 탐지와 위치 지정을 위한 다중 도메인 세밀한 비전-언어 재구성

arXiv PDF

저자 및 소속

Yaning Zhang

Faculty of Computer Science and Technology, Qilu University of Technology (Shandong Academy of Sciences), Jinan, China

Tianyi Wang

School of Computing, National University of Singapore, Singapore

Zan Gao

Shandong Artificial Intelligence Institute, Qilu University of Technology (Shandong Academy of Sciences), Jinan, China

Key Laboratory of Computer Vision and System, Ministry of Education, Tianjin University of Technology, Tianjin, China

Yibo Zhao

Key Laboratory of Computer Vision and Systems, Ministry of Education, Tianjin University of Technology, Tianjin, China

Chunjie Ma

Shandong Artificial Intelligence Institute, Qilu University of Technology (Shandong Academy of Sciences), Jinan, China

Meng Wang

School of Computer Science and Information Engineering, Hefei University of Technology, Hefei, China

해결하는 문제

핵심 문제는 딥페이크 탐지의 diffusion face forgery, vision-language forensics, forgery localization 관련 병목을 실제 배포 평가가 가능한 형태로 해결하는 것이다.

핵심 결과

결과는 정확도, 효율, 일반화 또는 설명 가능성의 개선을 보여 배포 리스크를 낮춘다.

초록

이 논문은 「MFVLR: Multi-domain Fine-grained Vision-Language Reconstruction for Generalizable Diffusion Face Forgery Detection and Localization」를 다루며 diffusion face forgery, vision-language forensics, forgery localization를 실제 배포에 가까운 제약에서 검토한다. 결과는 정확도, 효율, 일반화, 신뢰성을 평가하는 데 도움을 준다.

연구 출발점

동기는 딥페이크 탐지에서 diffusion face forgery, vision-language forensics, forgery localization가 개인정보, 비용, 견고성, 사용자 경험에 직접 영향을 주기 때문이다.

방법

「MFVLR: Multi-domain Fine-grained Vision-Language Reconstruction for Generalizable Diffusion Face Forgery Detection and Localization」의 접근은 모델 설계, 학습 전략 또는 시스템 최적화를 결합해 연구를 배포 가능한 역량에 가깝게 만든다.

논문 요약

MFVLR은 확산 얼굴 포렌식을 이미지 수준의 참/거짓 탐지에서 위치 지정과 교차 도메인 설명으로 확장한다는 점에서 중요합니다. 세밀한 언어 재구성, 시각 잔차 도메인, 위조 영역 위치 지정을 위한 디코더를 결합해, 이미지가 가짜인지뿐 아니라 증거가 어디에 나타나는지도 알아야 하는 검토 워크플로를 지원할 수 있습니다.