← ブログ一覧へ戻る

リサーチレーダーディープフェイク検出arXiv2026年6月

月次 arXiv レーダー

2026年6月のディープフェイク検出論文：リップシンク局所化、重要人物フォレンジック、公平な校正

2026年6月のdeepfake detectionは、万能classifierよりoperational evidenceへ向かった。重要論文はmouth editを局所化し、trusted identity referenceと比較し、人口統計group間のerror rateを公平にするcalibrationを扱う。

本月の重要シグナル

今月はlayered defense stackを示す。小さな改ざんをlocalizeし、targetが既知ならidentity referenceを使い、最終判断をcalibrateしてdetector errorが脆弱groupに集中しないようにする。

論文 012026-06-22cs.CV

LoCC：反事実フレーム一貫性によるリップシンク・ディープフェイクの検出と局所化

著者・所属

Soumyya Kanti Datta

University at Buffalo, State University of New York

Shan Jia

University at Buffalo, State University of New York

Siwei Lyu

University at Buffalo, State University of New York

何を解決するか

細かなlocalizationの必要を扱う。security reviewerはvideo全体が怪しいかだけでなく、どのframe/segmentがfakeかを知る必要がある。

主要結果

LAV-DF、AVDF1M、FakeAVCeleb、KODFでSOTAを上回り、compression levelとdatasetをまたいだgeneralizationも報告される。

要旨

LoCCは、各mouth frameが時間的neighborから作られるcounterfactual reconstructionと一貫するかを調べてlip-sync deepfakeを検出する。diffusion reconstruction model、teacher network、student network、transformer aggregationによりsegment、frame、video levelで判断する。

研究の出発点

lip-sync改ざんはmouth regionだけが変わり、編集segmentが短いこともあるため、video全体やaudio-visual detectorではlocal inconsistencyを見逃しやすい。

手法

LoCCはreal mouth framesでdiffusion modelを学習し、隣接frameからmiddle frameを予測する。teacherはreconstruction errorと時間関係からsegment-level inconsistencyを学び、studentがframe-wise predictionへ蒸留し、transformerが長いcontextを統合する。

論文要点

LoCCは単一のopaque scoreではなくlocalized evidenceを出すためforensic workflowに有用である。counterfactual framingは、改ざんsignalが少数のmouth frameだけにあるshort-formや部分編集videoで特に効く。

論文 022026-06-18cs.CV

CUPID：解釈可能な重要人物ディープフェイク検出のためのUVテクスチャマップ再構成

著者・所属

Giovanni Affatato

Dipartimento di Elettronica, Informazione e Bioingegneria (DEIB), Politecnico di Milano, Milan, Italy

Sara Mandelli

Dipartimento di Elettronica, Informazione e Bioingegneria (DEIB), Politecnico di Milano, Milan, Italy

Edoardo Daniele Cannas

Dipartimento di Elettronica, Informazione e Bioingegneria (DEIB), Politecnico di Milano, Milan, Italy

Paolo Bestagini

Dipartimento di Elettronica, Informazione e Bioingegneria (DEIB), Politecnico di Milano, Milan, Italy

Stefano Tubaro

Dipartimento di Elettronica, Informazione e Bioingegneria (DEIB), Politecnico di Milano, Milan, Italy

何を解決するか

POI detectionの3つの実務的制約、post-processingへのrobustness、efficient inference、どの顔領域が逸脱するかを示すexplanationを同時に扱う。

主要結果

4つのdeepfake datasetで、多くのdatasetにおけるSOTA性能、downscaling/compression下で最も高いrobustness、大幅に速いinferenceが報告される。

要旨

CUPIDは、query videoを同一人物のpristine reference videosと比較するperson-of-interest detectorである。3D顔再構成から得たUV texture mapで顔appearanceを表し、masked autoencoderで汎用latent spaceを学習し、identity comparisonとresidual-map interpretationを可能にする。

研究の出発点

公人や経営層はtargeted deepfakeの対象になりやすく、調査側にはreal reference footageがあることが多い。POI detectorはgeneric fake detectorよりidentity-specific evidenceを直接使える。

手法

学習時、CUPIDは多くのsubjectのreal videoだけを使い、fake videoもtarget POIも使わない。推論時はqueryのUV-map embeddingをpristine POI referenceと照合し、decoded residual mapで怪しい顔領域を示す。

論文要点

CUPIDはdecisionとinterpretable facial residualの両方を出すため、enterpriseやpublic-sector verificationに適している。高リスクの主張を人間がreviewし、stakeholderに説明し、post-processingでvideoが劣化した後も防御する必要がある場合に重要だ。

論文 032026-06-03cs.LG

校正され公平で正確なディープフェイク検出に向けて

著者・所属

Ryan Brown

University of Oxford

Chris Russell

University of Oxford

何を解決するか

多くのfairness methodが持つ導入摩擦を扱う。demographic attribute、model retraining、または商用チームが受け入れにくいaccuracy sacrificeを必要とする。

主要結果

in-domainおよびcross-dataset testで、Face-FairnessはFPR/TPR gapを減らし、minimum-group accuracyを改善し、overall accuracyを維持またはしばしば改善しながらruntime overheadをほぼ増やさない。

要旨

この論文は、deepfake detectorのbias mitigation向けplug-in post-processing frameworkであるFace-Fairnessを提案する。主手法Face-Feature Tuningは、固定顔embeddingを条件に軽量calibratorでdetector logitをremapし、demographic labelもbase detectorの再学習も不要とする。

研究の出発点

deepfake detectorの購入者にはaggregate accuracyだけでなく、calibrated scoreと公平なerror rateが必要になっている。false positiveやmissed fakeが特定人口groupに集中しうるためである。

手法

frameworkにはlabel-free calibrationのFFT、group labelがある場合のFF-Max、embedding clusterからgroupを推定するFF-Discoverが含まれる。3つともdetector後段で動作し、base modelは変更しない。

論文要点

Face-Fairnessは、多くの組織が実際にdetectorを購入する形に合うため有用である。base modelはclosedまたは再学習が高価なことが多い。identity labelなしでfairnessを改善するpost-processing calibratorは、governance、audit、安全なrolloutへの現実的な道を与える。