即插即用！视频超分中的涨点神器：iSeeBetter

CNN让超分结果更真实，GAN让超分结果更丰满，所以CNN+GAN=GOOD!

添加一个鉴别器组件就能使结果增加0.32dB，即插即用，涨点神器！是否在其他的CNN架构上也可行，还需实验验证。

题目：iSeeBetter：iSeeBetter: Spatio-temporal video super-resolution using recurrent generative back-projection networks

论文：https://arxiv.org/pdf/2006.11161.pdf

代码：https://github.com/amanchadha/iSeeBetter

看点

CNN在大尺度上的超分往往缺乏精细的细节纹理，生成性对抗网络能够缓解这个问题。为此，本文提出了一种基于GAN的时空视频超分方法——iSeeBetter，亮点如下： 结合了SR中的SOTA技术： 使用循环反投影网络(RBPN)的作为其生成器，从当前帧和相邻帧中提取时空信息。使用SRGAN中的鉴别器，提高了超分辨率图像的“自然性”，减轻了传统算法中的伪影。 优化了损失函数的架构： 本文使用了四重损失函数（MSE、感知损失、对抗损失和全变差损失(TV)）来捕捉均方误差（MSE）可能无法捕捉到的图像中的精细细节，加强生成视频的感知质量。

ZBvQJrZ.png!mobile

方法

下图展示了分别由RBPN和SRGAN作为生成器和鉴别器的iSeeBetter架构。

QNNfQbn.png!mobile

RBPN中的投影模块有两种从不同来源提取缺失细节的方法：SISR和MISR。下图展示了使用DBPN作为SISR结构的水平流（图2中的蓝色箭头）。

UjiEry7.png!mobile

下图展示了使用五个残差块作为MISR结构的垂直流（图2中的红色箭头），MISR的输入由LR帧、相邻帧以及它们之间的密集动作流图组成。

ziyMVrM.png!mobile

在每个投影中，RBPN观察LR中丢失的细节，并从相邻帧中提取残差特征来恢复细节。RBPN利用循环编解码机制来融合从SISR和MISR中提取的细节，并通过反投影将它们合并到SR帧中。一旦合成了SR帧，它就被到鉴别器中以验证其“真实性”，鉴别器采用SRGAN的鉴别器，结构如下图所示。

Bre2eev.png!mobile

损失

生成的SR图像的感知质量取决于损失函数的选择。为了评估图像的质量，MSE是各种方法中最常用的损失函数，其目的是提高图像的PSNR。但是这可能无法捕获图像中的精细细节，从而影响感知质量。同时，MSE捕获复杂纹理细节的能力有限，生成的视频帧过于平滑。为了解决这些问题，iSeeBetter使用了四重损失，并将这些损失综合起来作为训练iSeeBetter的最终评估标准。

MSE损失

MSE损失也称内容损失，其中表示SR帧。

感知损失

感知损失定义为SR帧的特征表示与真实帧HR之间的欧氏距离。它关注的是感知相似性，而不是像素空间中的相似性。依赖于从VGG-19网络中提取的特征。

其中表示第个池化层之前卷积激活后的特征图。

对抗损失

对抗损失限制模型的“幻想”，提高了超分辨图像的“自然性”。定义如下：

其中，是鉴别器认为生成图像是真实图像的输出概率。本文最小化去获得更佳的梯度行为。

全变差损失

全变差损失定义为水平方向和垂直方向上相邻像素之间的绝对差之和。由于TV损失测量输入中的噪声，因此将其最小化作为总体损失目标的一部分有助于去除输出SR帧中的噪声，从而提高空间平滑度。定义如下：

总损失

生成器的总损失为上面四个损失的加权和，如下图所示：

其中是权重，值分别为1，，，。鉴别器的总损失如下：

实验

数据集

为了使iSebetter更加健壮，并使其能够处理真实世界的视频，作者从YouTube收集了额外的数据，将数据集扩充到大约170000个片段，训练/验证/测试分别为其中的80%/10%/10%。训练时采用BI的降质方式，下图展示了数据集的组成。 JRr2e2A.png!mobile

消融实验

对所提出的架构和损失函数进行消融实验：

VNZJFvZ.png!mobile

量化评估

备注：超分辨率

IFjaYzf.jpg!mobile

超分辨率交流群

图像视频超分辨率，可见光、红外、遥感超分辨率等技术，若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:[email protected]

网站:www.52cv.net

byA7ju3.jpg!mobile

在看，让更多人看到 fUJvIbe.gif!mobile

MSE损失

感知损失

对抗损失

全变差损失

总损失

数据集

消融实验

量化评估

备注：超分辨率

超分辨率交流群

Recommend

社区团购阴影下的商超生死局

正确的问题不是“如何激励他人”，而是“怎样让他人自我激励”

万物皆可盲盒，这届年轻人为什么“好赌”？

疯狂的半导体2020，总融资超500亿元！

快递价格战全面开启，极兔京喜丰网争夺这一市场？

不送充电器，我们是不是就吃亏了？

冬天，又一家独角兽轰然倒下：最后一位投资人放弃

分享路亚钓慢速铁板钓法的操控本事

2021年厮杀之年，K8s通吃跨云落地各平台，成现代化主流标准

Spring Boot 构建微服务实践

About Joyk