视频中深度伪造人脸检测算法研究文献综述

 2022-11-24 21:00:47

文 献 综 述

1 引言

深度伪造技术源自deep-learning(深度学习)和fake(造假)的组合,它可以将目标人物面部的图像叠加到视频原人物面部的相应位置,从而创建包含目标人物的视频,使目标人物说一些不曾说过的话,做一些不曾做过的动作,以达到混淆视听的目的。尽管该技术可用于实现声音合成、视频分辨率修复和图像艺术风格迁移等,但总体而言,其弊端仍大于优势。深度伪造的滥用,给国家、社会和个人带来了潜在威胁。

本文将从视频帧和视频完整性两个主要方面综述现有的深度伪造视频检测技术。第2节对深度伪造视频生成原理进行综述; 3、4两节介绍了深度伪造数据集和检测伪造视频的预处理手段。第5节介绍了基于视频帧和视频完整性的深度伪造视频检测技术,并介绍了作为检测补充手段的基于区块链溯源的防篡改公共机制和数字水印、视频指纹等信息安全方法;最后总结全文,并对深度伪造视频检测技术的发展趋势进行展望。

2 深度伪造视频生成

深度伪造视频的生成通常以深度学习模型为基础。前期的伪造视频生成主要依靠共享权重的自编码器。生成对抗网络(GAN)的出现克服了自编码器刻意逼近真实数据概率分布的缺点,使得生成的伪造视频更难以分辨。同时,一些团队还提出了多种改进的GAN算法,以实现更逼真的“伪造”效果。

2.1 自动编码器

自动编码器是一种神经网络模型,由编码器和解码器两部分组成。在训练阶段使用两组人脸图像,第一组是原视频中将要被替换的人脸图像,第二组是将要替换到视频中的目标人脸图像。由于对两组图像使用不同的编码器进行训练会使模型无法习得其共同潜在特征,因此Nguyen等在训练阶段使两组图像在编码阶段共享权重,再使用含不同权重的解码器分别对两组图像完成数据重构。在生成阶段,对于新视频中将被替换的人脸图像,在编码阶段获得其面部特征潜在表示,再通过解码器B将第二组假人脸图像替换到新的人脸上,实现深度伪造。

2.2 生成对抗网络

共享权重的自编码器为了使生成模型性能达到最佳,有时会刻意逼近真实数据,导致泛化能力不足。生成对抗网络以隐式概率分布函数为基础,更为深入地学习真实样本的分布,较自动编码器更优秀。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。