48

ECCV 2018 | 腾讯AI lab提出正交深度特征分解算法:在多个跨年龄人脸识别任务中创造新...

 5 years ago
source link: https://www.jiqizhixin.com/articles/tencent-ai-lab-eccv-2018-oecnn?amp%3Butm_medium=referral
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
e263AzE.png!web

机器之心 原创

2018/09/08 3:49

机器之心发布

ECCV 2018 | 腾讯AI lab提出正交深度特征分解算法:在多个跨年龄人脸识别任务中创造新记录

这项工作由腾讯 AI Lab 独立完成,其目的是通过研发新的深度学习模型以提高跨年龄人脸识别的精度。

在这篇文章里,我们提出了一种正交深度特征分解算法 OE-CNNs,通过把深度特征正交分解为年龄分量和身份分量,从而将年龄分量和身份分量有效分离开,从而达到减少年龄差异、提高跨年龄人脸识别精度的目标。

我们在多个跨年龄人脸识别的国际评测基准(FG-NET, Morph Album 2, CACD-VS)中都取得了国际领先的性能,显著提高了跨年龄人脸识别的精度。此外,我们还建立了一个新的跨年龄人脸数据库 CAF 以帮助促进跨年龄人脸识别研究。

跨年龄人脸识别是人脸识别领域中的一个极具挑战性的国际性难题。众所周知,同一个人的不同年龄阶段的图片会有非常大的差异,这些差异会严重影响到跨年龄人脸识别的精度。迄今为止,深度学习已经被广泛运用到人脸识别,并且取得了非常好的性能。但是,对于跨年龄人脸识别,问题,由于同一个人在不同年龄阶段下的多张人脸之间存在着非常显著的差异,这严重影响到现有的深度人脸识别模型的性能。为了克服这个巨大的年龄差异,在这篇文章里我们研发了一种新的深度学习算法,该算法把深度特征按照模长方向和角度方向(这两个方向是彼此正交的)分别分解为年龄成分和身份成分,如下图所示。

iu2Arij.png!web

其中,年龄成分被分解成一维径向分量,而身份成分则分解为高维角度分量。这两种分量最后通过多任务学习的方式同时训练,最终的损失函数是二者损失的算术叠加:

BRvYFnV.png!web

其中身份成分的损失函数

RVJvQ3j.png!web

而年龄成分的损失函数

zumiM3n.png!web

基于这种新的分解模型我们可以把人脸的年龄分量和身份分量有效分离开,并基于身份分量来做跨年龄人脸识别从而有效提高跨年龄人脸识别的精度。

为了进一步提高跨年龄人脸识别性能,我们还采集了一个面向跨年龄人脸识别的的新型人脸数据库 CAF。我们通过在网上搜集名人在不同年龄段拍的照片,以保证这些训练图片有足够大的年龄差异。我们的搜集的人名来源于公共的信息库,比如 IMDB, Forbes Celebrity, Wikipedia 等。我们的 CAF 数据库有 4,668 个不同的人和这些人的 313,000 张图片。这个数据库的样例和统计分布如下图所示。

NVfA7br.png!web

实验结果

JbaiEfZ.png!web

在上表的 FG-NET 跨年龄人脸识别任务中,我们的新算法 OE-CNNs 取得了高达 53.26% 的第一识别率,比第二名的 38.21% 足足高了超过 15% 的识别率。

eY3QvuE.png!web

在上表的 Morph Album 2 识别任务中,我们的算法也稳定地高于其它所有的人脸算法。

qyQNbeU.png!web

在上表的对比实验中,能明显看出增加了我们新建立的 CAF 人脸数据做训练后,对于上表中的所有人脸算法,它们的识别率都能显著获得提升,这证明了 CAF 对于跨年龄人脸识别研究的帮助和价值。

相关数据

特征分解 技术

Eigen decomposition

线性代数中,特征分解(Eigendecomposition),又称谱分解(Spectral decomposition)是将矩阵分解为由其特征值和特征向量表示的矩阵之积的方法。需要注意只有对可对角化矩阵才可以施以特征分解。

来源: 维基百科

人脸识别 技术

Facial recognition

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

来源: 维基百科

基准 技术

baseline

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

来源: Google ML Glossary

损失函数 技术

Loss function

在数学优化,统计学,计量经济学,决策理论,机器学习和计算神经科学等领域,损失函数或成本函数是将一或多个变量的一个事件或值映射为可以直观地表示某种与之相关“成本”的实数的函数。

来源: Wikipedia

深度学习 技术

Deep learning

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

来源: LeCun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. nature, 521(7553), 436.

多任务学习 技术

Multi-task learning

e263AzE.png!web
机器之心

机器之心编辑


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK