90

NVIDIA 展示了一种通过 GAN 生成面孔的新方法

 6 years ago
source link: https://zhuanlan.zhihu.com/p/30593291?
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

NVIDIA 展示了一种通过 GAN 生成面孔的新方法

一个相信理想主义的现实主义者
简评:这种新方法较之以前的神经网络,生成的面孔要逼真更多。

不知道大家对 Google 在 2015 年发布的 DeepDream 还有没有印象,Google 把自家生成图片的技术 Inceptionism 开源化,搞了一个深度学习「艺术品」—— 输入一张图片后,选择某一层神经网络(Google 的神经网络有 10-30 层)进行重复处理的次数和变形的程度,就能获得一张非常后现代的「画作」。

你可以说它是萨尔瓦多·达利的化身,但我更觉得是清醒时看到恶梦,随便举个例子感受下:

v2-1560d88b1ecb03cfac905e766230ab67_720w.jpg

Google’s DeepDream interprets Prince William; Kate, duchess of Cambridge; and Prince George, pictured on April 9, 2014, in Wellington, New Zealand.

我们回归正题。

NVIDIA 最近发布了一篇论文,展示了一种通过生成式对抗网络(GAN)产生独特面孔的新方法。GAN 的原理引用下大佬

的叙述:

以生成图片为例进行说明。

假设我们有两个网络,G(Generator)和 D(Discriminator)。正如它的名字所暗示的那样,它们的功能分别是:
1. G 是一个生成图片的网络,它接收一个随机的噪声 z,通过这个噪声生成图片,记作 G(z)。
2. D 是一个判别网络,判别一张图片是不是「真实的」。它的输入参数是 x,x 代表一张图片,输出 D(x) 代表 x 为真实图片的概率。如果为 1,就代表 100% 是真实的图片,而输出为 0,就代表不可能是真实的图片。

在训练过程中,生成网络 G 的目标就是尽量生成真实的图片去欺骗判别网络 D。而 D 的目标就是尽量把 G 生成的图片和真实的图片分别开来。这样,G 和 D 构成了一个动态的「博弈过程」。
最后博弈的结果是什么?在最理想的状态下,G 可以生成足以「以假乱真」的图片 G(z)。对于 D 来说,它难以判定 G 生成的图片究竟是不是真实的,因此 D(G(z)) = 0.5。

这样我们的目的就达成了:我们得到了一个生成式的模型 G,它可以用来生成图片。

Image: Screengrab via Nvidia

根据 NVIDIA 的论文,采用新的渐进式训练方式,他们使用 CelebA-HQ 图像数据库生成了前所未有的高质量图像,最终能达到 1024*1024 的分辨率。

We describe a new training methodology for generative adversarial networks. The key idea is to grow both the generator and discriminator progressively, starting from low-resolution images, and add new layers that deal with higher resolution details as the training progresses. This greatly stabilizes the training and allows us to produce images of unprecedented quality, e.g., CelebA images at 1024² resolution.

这绝对是非常棒的结果,尽管目前只是静态图像,但所有人物都能清晰地展现在你面前。NVIDIA 的方法同样适用于物体和风景的生成,可以看下视频演示:


参考链接:
分类收藏:

产品 | 设计 | 技术 | HackLife | Photography

推荐阅读:

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK