生成对抗网络概述论文_董美雪

河南省禹州市第一高级中学 河南 禹州 461670

摘要:生成对抗网络(Generative Adversarial Nets,简称GAN)是深度学习中的一个重要模型。本文首先从GAN中的两个模型-生成模型和判别模型出发,介绍了其概念以及区别,并讲述了其工作原理和大致训练过程,最后从数学表达式解析生成模型和判别模型的优化工作。

关键词:深度学习;生成对抗网络;机器学习;神经网络

1.引言

GAN(Generative Adversarial Networks)是深度学习领域中“生成对抗网络”的简称,是深度学习领域的一个重要模型,也是人工智能研究的一个重要工具。蓬勃发展的人工智能和近年来炙手可热的GAN之间有什么关系呢?

人工智能就是让机器具备观察和感知的能力,可以做到一定程度的理解和推理及获得自适应能力。如何让机器获得这些智能化能力呢?这种实现机器智能化的方法路径就是机器学习——即让机器模仿人类学习的过程,通过不断“学习”数据并总结规律,来做出智能的判断和决策行为。深度学习是机器学习的一种深度模式,是具有深层次神经网络结构的学习方式;GAN就是深度学习系统中非监督学习的一个重要方法,是一种探索神经网络概率空间的学习方法,是一种智能运算方法;它除了具有机器学习和深度学习的所有特点之外,还具有充分拟合数据、速度快、生成样本逼真等优点,它采用独特的生成模型(Generator)和判别模型(Discriminator)零和博弈的思维模式,通过一系列输入输出试验,最终取得理想效果[1]。

2.生成模型(Generator)和判别模型(Discriminator)

GAN中有两个模型,分别是生成模型(Generator)和判别模型(Discriminator),它们有各自的功能。

2.1生成模型和判别模型的相同点及区别

生成模型(Generator)和判别模型(Discriminator)同样是接受输入,然后有一个输出,可以用一串复杂的函数表达输入输出映射关系;但是它们两者之间的关系却是一个负责伪装现实(生成模型),一个负责识破真相(判别模型)。生成模型的功能就像是一个样本生成器,输入一串随机数,然后输出可以以假乱真的样本集。判别模型实际上是一个二分类器(如同0-1分类器),将样本的类别分为真假两类,真用1表示,假用0表示。

2.2生成模型和判别模型的概念

如图1所示,图中左侧存在上下两层数据集,上层是真实数据集,下层就是由生成网络制造出来的数据集。

生成模型(Generator)是一个深度学习系统中的神经网络模型,该神经网络是由大量彼此相连、概念化的人造神经元组成的,这些神经元彼此之间传递着数据,输入是一组数据集Z,通过神经网络的训练以及相应权重的不断调整,输出的是一个图像数据集x。

判别模型(Discriminator)就是图中右半部分的神经网络结构,它同样是一个深度学习系统中的神经网络模型,大量彼此相连、概念化的人造神经元之间传递着数据。输入数据集,通过神经网络的训练以及相应权重的不断调整,输出一个概率值。假如输入的是真样本(真实数据集),判别模型(Discriminator)输出概率值就接近1;输入的是假样本(制造数据集),判别模型(Discriminator)输出概率值就接近0,可以通俗的理解为概率值大于0.5的是真,小于0.5的是假;或者概率值大于0.5的可以接受,小于0.5的不予接受——判别网络的目的是要判别出来,输入的数据集是来自真实样本集还是假样本集。而生成网络的目的却是制造出一系列不断改进的假样本,直到判别网络无法判断出是真样本还是假样本[2]。

2.3生成网络与判别网络在GAN中的工作原理

生成网络与判别网络的目的正好是相反的,GAN(Generative Adversarial Networks)中的生成“对抗”网络涵义也由此而来。设计者可以以追求以假乱真的样本为目的,通过不断调整改进生成网络,制造更逼真的样本,令判别网络能力不足以区分真假样本;也可以以追求提高判别网络能力为目的,不断调整改进判别网络能力,令其准确判别,明辨真伪;生成网络和判别网络共同提高,在此消彼长中共同提升。从输出的数值来解释,也就是当生成网络生成的假样本输入到判别网络之后,当判别网络难辨真假时,判别网络给出的数值接近0.5,达到了纳什平衡。

生成模型(Generator)和判别模型(Discriminator)的有机结合,形成了完美的生成对抗网络。

2.4生成模型与判别模型的训练/优化

那么,如何训练生成对抗网络的两个模型呢?生成模型与判别模型是独立的两个模型,需要单独交替迭代训练。

首先,对于生成网络模型来说,输入一组初始数据就会输出一个假样本集,这个输出的假样本集很容易被判别网络识别,那么设置其标签为0;同样的道理,就可以设置真样本集标签为1。

为了判别生成网络最终输出数据集的真伪程度,需要联合判别网络提供误差数值,这样一次次的交替训练才能达到训练生成网络的目的,所以对于生成网络的训练其实是对生成-判别网络串接的训练[3]。

其次,对于判别网络模型来说,输入真样本集(1)和假样本集(0),通过神经网络的训练以及相应权重的不断调整;输出一个概率值,利用误差调整参数通过交替训练输出理想的数值。

对于生成对抗网络的训练,是一个完美系统的有机结合。

3. GAN系统中各个模型的关系及工作原理

图2标识了GAN系统中各个模型的关系以及如何相互作用和相互联系。

对于假样本G(z),我们希望假样本的标签是1,所以是D(G(z))越大越好,统一成1-D(G(z))的形式,那么为了形式的统一,表达为最小化1-D(G(z))。也就是说,输入随机数z,生成可以以假乱真的图片,使得判别网络判为1,即求D(G(z))最大值;公式表达为,求G取什么值时,V(D,G)取得最小值[4]。

那么,生成对抗网络关系就可以用以上总数学式表达,里面包含了判别模型的优化,包含了生成模型的以假乱真的优化,也就是这两个优化模型的最大最小目标函数了。

4. 总结

GAN(生成对抗网络)为深度学习系统中非监督学习提供了一个强有力的算法框架,而非监督学习是通往人工智能重要的一环。Facebook人工智能研究院的Yann LeCun形象的比喻说:如果人工智能是一块蛋糕,那么深度学习是蛋糕上的一粒樱桃,监督学习是外面的一层糖霜,非监督学习则是蛋糕胚。目前我们只知道如何制作糖霜和樱桃,却不知如何制作蛋糕胚。GAN来了,它为这个蛋糕胚的制作提供了一个强有力的解决方案[5]。

GAN可以用在特定人脸的图像生成上,例如戴着墨镜的人脸,戴口罩的人脸等等。还可用在图像语义分割上,通过引入对抗训练,得到更锐利的风格结果。在视频生成上,GAN可以通过过去的一些帧来预测未来的一些帧,从而捕捉到一些运动的信息。许多做人工智能研究的公司正在投入大量的精力来发展和推广GAN模型[4]

论文作者:董美雪

论文发表刊物:《科技新时代》2018年9期

论文发表时间:2018/11/16

标签:;  ;  ;  ;  ;  ;  ;  ;  

生成对抗网络概述论文_董美雪
下载Doc文档

猜你喜欢