← Voltar ao Blog

Radar de pesquisaDetecção de deepfakesarXivJunho de 2026

Radar mensal do arXiv

Detecção de deepfakes em junho de 2026: localização lip-sync, forense POI e calibração justa

A pesquisa se move de classificador universal para evidência operacional: localizar edições da boca, comparar referências de identidade e calibrar justiça.

O que este mês sinaliza

O mês aponta a defesa em camadas: localizar manipulações pequenas, usar referências de identidade e calibrar decisões para não concentrar erros.

Artigo 012026-06-22cs.CV

LoCC: detecção e localização de deepfakes lip-sync por consistência contrafactual de frames

Autores e instituições

Soumyya Kanti Datta

University at Buffalo, State University of New York

Shan Jia

University at Buffalo, State University of New York

Siwei Lyu

University at Buffalo, State University of New York

Que problema resolve

Resolve a necessidade de localização fina: analistas precisam saber quais frames ou segmentos são falsos, não só o rótulo do vídeo.

Resultado-chave

Relatam desempenho superior em LAV-DF, AVDF1M, FakeAVCeleb e KODF, com generalização entre compressões e datasets.

Resumo

LoCC detecta lip-sync deepfakes comparando cada frame da boca com uma reconstrução contrafactual de vizinhos temporais. Usa difusão, teacher-student e agregação transformer.

Ponto de partida da pesquisa

Manipulações lip-sync são difíceis porque só a boca muda e o segmento pode ser curto; detectores holísticos perdem inconsistência local.

Método

Treina difusão em frames reais da boca para prever o frame central. Teacher aprende inconsistência por segmento; student produz predições por frame; transformer agrega contexto.

Síntese do artigo

LoCC é útil em forense porque fornece evidência localizada, não só um score opaco. O enquadramento contrafactual serve para vídeos curtos ou parcialmente editados.

Artigo 022026-06-18cs.CV

CUPID: reconstrução de mapas de textura UV para detecção interpretável de deepfakes de pessoas de interesse

Autores e instituições

Giovanni Affatato

Dipartimento di Elettronica, Informazione e Bioingegneria (DEIB), Politecnico di Milano, Milan, Italy

Sara Mandelli

Dipartimento di Elettronica, Informazione e Bioingegneria (DEIB), Politecnico di Milano, Milan, Italy

Edoardo Daniele Cannas

Dipartimento di Elettronica, Informazione e Bioingegneria (DEIB), Politecnico di Milano, Milan, Italy

Paolo Bestagini

Dipartimento di Elettronica, Informazione e Bioingegneria (DEIB), Politecnico di Milano, Milan, Italy

Stefano Tubaro

Dipartimento di Elettronica, Informazione e Bioingegneria (DEIB), Politecnico di Milano, Milan, Italy

Que problema resolve

Trata três limites práticos: robustez a pós-processamento, inferência eficiente e explicações de regiões faciais desviantes.

Resultado-chave

Em quatro datasets, relatam SOTA na maioria, melhor robustez a downscaling/compressão e inferência bem mais rápida.

Resumo

CUPID compara vídeo de consulta com referências limpas da mesma identidade. Usa mapas UV de reconstruções 3D e masked autoencoder para comparação de identidade e interpretação por residuais.

Ponto de partida da pesquisa

Figuras públicas e executivos sofrem deepfakes direcionados; investigadores têm referências reais, que detectores POI exploram melhor que genéricos.

Método

No treino usa só vídeos reais de muitos sujeitos, sem fakes nem POI alvo. Na inferência compara embeddings UV com referências POI e mostra mapas residuais.

Síntese do artigo

CUPID é atraente para empresas e setor público por dar decisão e residual facial interpretável. Importa quando casos de alto impacto exigem revisão humana e explicação.

Artigo 032026-06-03cs.LG

Rumo à detecção de deepfakes calibrada, justa e precisa

Autores e instituições

Ryan Brown

University of Oxford

Chris Russell

University of Oxford

Que problema resolve

Trata fricções de implantação: muitos métodos exigem atributos demográficos, retreino ou perda de accuracy.

Resultado-chave

Em testes in-domain e cross-dataset, reduz gaps FPR/TPR, melhora accuracy do pior grupo e mantém ou melhora accuracy global com overhead mínimo.

Resumo

Apresenta Face-Fairness, pós-processamento plug-in para mitigar viés em detectores. Face-Feature Tuning remapeia logits com calibrador leve condicionado por embeddings faciais congelados, sem labels demográficos nem retreino.

Ponto de partida da pesquisa

Compradores precisam de scores calibrados e erros justos, não só accuracy global, pois falsos positivos e misses podem se concentrar em grupos.

Método

Inclui FFT sem labels, FF-Max com labels de grupo e FF-Discover por clusters de embeddings. Todos rodam após o detector, mantendo o modelo base.

Síntese do artigo

Face-Fairness combina com compras reais: modelo base pode ser fechado ou caro para retreinar. Um calibrador pós-processado sem labels de identidade ajuda governança, auditorias e rollout seguro.