6

字节跳动开源最新 GAN 压缩算法,算力消耗 可减少至 1/46

 2 years ago
source link: https://new.qq.com/omn/20210827/20210827A0BP9S00.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

字节跳动开源最新 GAN 压缩算法,算力消耗 可减少至 1/46

8 月 27 日消息,字节跳动近期开源了一项代号为 OMGD 的压缩技术。这是字节自研的 GAN(生成对抗网络)压缩算法,在保证生成效果不变的前提下,算力消耗最低可以减少到原来的 1/46,相比之前业界的最佳压缩效果提升一倍多。据悉,这项技术的论文已入选国际计算机视觉会议 ICCV 2021。

1000

图:字节跳动技术团队发表的自研 GAN 压缩算法论文

GAN 是人工智能领域重要的深度学习模型,在图像生成、音乐生成和视频生成等方面应用广泛,还可以提高图像质量,实现图像风格化、图像着色等任务。漫画特效等人们常用的短视频道具,就是通过 GAN 实现的。

由于 GAN 对计算资源和存储空间的需求巨大,模型难以直接部署到手机、Pad 等移动设备上,业界一直在努力改进 GAN 的压缩方法。2020 年,麻省理工学院、Adobe 和上海交通大学的研究者们提出一种 GAN 压缩算法,将算力消耗成功减少到 1/21。此次字节跳动提出的 OMGD 方法则进一步提升了压缩能力。

OMGD(Online Multi-Granularity Distillation)意为 “在线多粒度蒸馏”。据字节跳动技术团队的论文显示,该算法能灵活地在训练过程中优化并压缩 GAN 模型,从而实现更好的图像效果和更少的计算成本。

测试数据表明,OMGD 压缩算法对 Pix2Pix 和 CycleGAN 这两种常用的 GAN 解决方案效果显著。Pix2Pix 和 CycleGAN 主要应用于图像到图像的 “翻译”,比如将照片转换为绘画,对黑白图片着色等。OMGD 压缩算法可使其算力消耗分别减少到原来的 1/40 和 1/46。

目前,OMGD 压缩算法已在抖音等产品中落地,为用户提供更丰富的视频创作能力。相关技术代码也已发布在开源社区,以帮助从业者提升 GAN 的创新和应用效率。迄今,字节跳动已开源了机器学习平台 Klever、联邦学习平台 Fedlearner、高性能分布式训练框架 BytePS 、LightSeq 推理和训练引擎等重磅项目。

节能环保是字节跳动一个重要的技术研究方向。在不久前的自然语言处理领域国际顶会 ACL 2021 上,字节跳动的词表学习方案获得年度唯一的 “最佳论文”大奖,该论文同样极具节能价值,相比主流词表可以节约 92% 的算力。

OMGD 论文链接:https://arxiv.org/abs/2108.06908

开源项目链接:https://github.com/bytedance/OMGD

免责声明:本文来自腾讯新闻客户端自媒体,不代表腾讯网的观点和立场。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK