6

DALL·E这波超进化,画质艺术感双飞升,还学会了无痕P图

 2 years ago
source link: https://www.qbitai.com/2022/04/33874.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

DALL·E这波超进化,画质艺术感双飞升,还学会了无痕P图

head.jpg鱼羊 2022-04-07 12:49:17 来源:量子位

Photoshop可以不用学了?

鱼羊 发自 凹非寺

量子位 | 公众号 QbitAI

把椅子上的萌犬P成猫猫,需要几步?

第一步,圈出狗狗。第二步,告诉AI你的需求。鼠标一点,齐活。

854248cc0fe24657a31a17ad11454d2d~tplv-tt-shrink:640:0.image

这位AI P图大师,其实是位老朋友——OpenAI风靡全球的那位DALL·E

现在,它刚刚完成了“2.0超进化”。不仅新学了一手出神入化的P图绝技,创作质量也有了飞跃式的提升。

话不多说,直接看作品感受一下~

这是DALL·E 2在“星云爆炸状柯基头”这一提示下的创作出来的画作:

5351e44e7ff7435fa3e80ce3430c0ecf~tplv-tt-shrink:640:0.image

这幅萨尔瓦多·达利的画像,是不是有点萨尔瓦多·达利内味儿了?

0ef6f7d1033543239c9c1cae1ebfc10a~tplv-tt-shrink:640:0.image

跟初代DALL·E比起来,着实是画质与艺术感双双飞升了。

ce1aa74c0b5348b2b24385f391f05be4~tplv-tt-shrink:640:0.image

△“日出时分安坐在田野里的狐狸,莫奈风格”

所以,研究人员具体如何点亮了DALL·E的新技能点?

CLIP+扩散模型

DALL·E此番进化,简单来说就是分辨率更高了,延迟更低了。

此外,还有更新2大新功能:

首先,在更细粒度上实现文本→图像功能。

也就是说,DALL·E 2可以根据自然语言提示进行P图。在P图的过程中,还会考虑阴影、反射、纹理等元素的变化。

比如在左图标“2”的位置P一个火烈鸟泳圈,DALL-E 2会把水面倒影这种细节也处理到位。

4b4ab4ecd74b42db8a6f88c61953b802~tplv-tt-shrink:640:0.image

其次,是可以在保留原作核心元素的基础之上,赋予原作船新的风格。

并且生成画面的画质是DALL·E 1的4倍,即从256×256提升到了1024×1024。

35e64dbc48cc4ede923b8850fa994328~tplv-tt-shrink:640:0.image

CLIP是原版DALL·E功能实现的基础,是一个负责给图像重排序的模型,其零样本学习能力已经在各种视觉和语言任务上大放异彩。

而扩散模型的特点在于,在牺牲多样性的前提下,能大大提升生成图像的逼真度。

于是,OpenAI的研究人员设计了这样一种方案:

53afd15297f04008896d93a637ef300e~tplv-tt-shrink:640:0.image

在这个名为unCLIP的架构中,CLIP文本嵌入首先会被喂给自回归或扩散先验,以产生一个图像嵌入。

而后,这个嵌入会被用来调节扩散编码器,以生成最终的图像。

OpenAI解释称,DALL·E能够get图像和用于描述画面的文本之间的关系。其图像的生成是在“扩散”过程中完成的,可以理解为是从“一堆点”出发,用越来越多的细节去把图像填充完整。

be224d4700184a8287a8d7ba9ad96f73~tplv-tt-shrink:640:0.image

研究人员将DALL·E 2与DALL·E、GLIDE等模型进行了对比。

f4f252d567964c66a89114cb11570db5~tplv-tt-shrink:640:0.image

实验结果显示,DALL·E 2的图像生成质量与GLIDE相当,但DALL·E的生成结果更具多样性。

87ae2dd47d864312a28e84db7bfaff20~tplv-tt-shrink:640:0.image

目前,DALL·E 2并未对公众开放,不过如果你感兴趣,可以在线注册申请一发~

1fa8eb483d6e434a99010dd68a8f8742~tplv-tt-shrink:640:0.image

项目地址:
https://openai.com/dall-e-2/#demos

版权所有,未经授权不得以任何形式转载及使用,违者必究。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK