2

想看特朗普跳《鸡你太美》吗?这个AI技术做到了

 3 years ago
source link: https://www.techug.com/post/want-to-see-trump-dance-chicken-you-re-too-beautiful-this-ai-technology-does-it.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client
蕾师师 发自 凹非寺
量子位 报道 | 公众号 QbitAI

只要一张照片、一段视频,就能让特朗普跟着蔡徐坤「唱、跳、Rap、篮球」!

img1608082489511386204.gif

这就是来自上海科技大学团队的一项新研究,在提出的新框架内,处理人体图像合成任务。

img1608082491221744486.png

其中包括人体运动模仿、外观转换和新视角合成等。

并且,该项目的代码、数据集已开源。

建立模仿数据集

首先,研究团队建立了一个具有多种样式、不同人物穿不同衣服的数据集,称为Impersonator(iPER)数据集。

研究人员采集了30个研究对象的数据,他们的体型、身高各不相同。每个研究对象穿着不同的衣服,完成一套指定动作和一套随机动作。

整个数据集有206个视频、包含241564帧画面。

206个视频以特定的命名保存,例如“ xxx_yyy_zzz.mp4”,其中:

  • xxx:演员姓名
  • yyy:外观编号,不同的编号表示不同的衣服
  • zzz:动作类型,1代表姿势,2代表随机姿势

如何保留人物细节特征?

目前,主要是用2D图片来确定肢体的结构和动作,但是这远远不能满足这里的需求。

这里采用了3D网格肢体复原形式来提取动作和姿势,即可以模拟关节的位置和旋转,又能够表现出个性化的身体形状。

但是纹理、样式、颜色又该怎么保留呢?

针对这个问题,研究者提出了注意型液化GAN。

通过降噪卷积自动编码器提取特朗普的身体特征,然后经过GAN不断地训练学习、微调、监督、转化,将低分辨率的模型转变成高分辨率的模型,使输出来的视频图像清晰。

整个模型的工作流程大致如下:

(a)首先,肢体网格恢复模块将每个图像的3D网格图绘制好。

(b)其次,流组模块将计算图像空间中的投影顶点,将图像分成动作前景图和背景图。

(c)最后,GAN模块生成三个层,第一层是背景层,第二层是临摹出来的动作层,第三层是参考保留细节层。

注意型液化GAN

在本文中,不仅提出了注意型液化GAN,还提出了一种带有注意型液化块AttLWB(Attentional Liquid Warping Block),两者共同运作,输出高真的模仿图像。

(a)addWB结构,获取了GTSF的数据,生成自己的数据模型。
(b)(Attentional) Liquid Warping Block结构,基于GSID和GTSF的数据,并经过一系列的运算,生成参数。
(c)AttWB结构层。经过这里,得到了最终的数据结果。

网络架构图

大量的实验证明了这个方法在保持面部特征性、形状一致性和衣服细节等方面很有效。

AI舞蹈动作恶搞,不仅恶搞了特朗普,还有人还恶搞了华盛顿。

微博互联网知名博主说,现在的AI论文Demo越来越不尊重“老人”了。调侃200多岁的华盛顿好吗?这不好。

作者团队介绍

这个科研团队来自于上海科技大学

通讯作者是高盛华,高盛华博士2008年本科毕业于中国科学技术大学,2012年博士毕业于新加坡南洋理工大学,2014年8月加入上海科技大学,任助理教授,研究员。

他的研究方向是计算机视觉、机器学习。

高盛华

第一作者是Wen Liu,2016年在西北工业大学获得了学士学位,目前在上海科技大学攻读博士。主要研究人体三维体重建、图像合成、运动转移等方面。

Wen Liu

还有一位作者是Lin Ma,硕士毕业于哈尔滨工业大学,在香港中文大学获得了博士学位。曾经是华为诺亚方舟实验室的研究员,现在是深圳腾讯AI实验室的首席研究员。他目前的研究兴趣在计算机视觉领域、多模式深度学习领域等。

Lin Ma

其他参与的作者还有Zhixin Piao、Zhi Tu、Wenhan Luo 等。

项目地址:
https://www.impersonator.org/work/impersonator-plus-plus.html

数据集下载地址:
https://svip-lab.github.io/dataset/iPER_dataset.html

开源代码地址:
https://github.com/iPERDance/iPERCore

论文地址:
https://arxiv.org/pdf/2011.09055.pdf


Recommend

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK