20

墨奇科技汤林鹏:如何用 AI 技术颠覆指纹识别?

 3 years ago
source link: https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/106653971
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

ZzeyeeU.jpg!web

vmq2Ynm.jpg!web

受访者 | 墨奇科技联合创始人& CTO 汤林鹏

记者 | Aholiab,编辑 | Carol

出品 | AI科技大本营(ID:rgznai100

随着深度学习等AI技术的成熟,生物识别成为了关注度较高的领域,指纹、人脸、虹膜等识别技术,正在越来越多的场景中得到应用。根据前瞻产业研究院的数据,目前中国生物识别技术的市场规模已超过300亿元,到2023年,这一数字将达到379亿元。虽然人脸识别、虹膜识别近几年大有成为「后起新贵」之势,但指纹识别凭借其“证据之王”的权威性和较高的安全性,仍然占据整个生物识别领域的半壁江山(52%)。

在生物特征识别产业中,有这样一家公司,他们利用AI+指纹识别技术,解决了传统指纹识别耗时长、精确度低、指纹大库搜索困难、无法处理低质量指纹等问题。通过海量高精度图像搜索技术,实现了20亿枚指纹秒级精准对比的落地应用; 同时, 其自主研发的非接触3D指纹采集技术,也已在强身份认证领域获得应用。这家公司就是墨奇科技。  

作为墨奇科技的联合创始人兼CTO,汤林鹏在普林斯顿大学获得博士学位,曾在KDD、AISTATS、OSDI、ATC等顶级机器学习和系统会议上发表多篇论文。早在读博期间,他就开始了机器学习和人工智能方面的研究,并开发出了一套高精度的图像搜索系统,这套系统成为了墨奇科技业务方向和核心技术的开端。 尽管彼时深度学习的发展已相对成熟,但谈到成立墨奇科技的初衷时,汤林鹏坦言:“还是想在AI的原理和应用上,做出比较大的突破,继续推动技术的发展。”  

aiAzuae.jpg!web

不久前,CSDN记者采访到了汤林鹏,对于AI在指纹识别领域中的应用、指纹识别技术创新,以及墨奇科技的发展等话题,与他进行了畅谈。对于AI创业者和开发者来说,相信通过汤林鹏的分享,一定会让你对AI技术的应用与创新,有更深的理解。

vmYnU3e.jpg!web

「小众」赛道不小众,为何要做指纹识别?

CSDN:你从什么时候开始研究深度学习,你的技术生涯是怎样的?

汤林鹏: 我最早关注深度学习是我本科刚毕业的时候,大概是2012年,那个时候深度学习还处在早期阶段,但国内已经有一批公司在这个领域做了。我个人对这个领域也比较感兴趣,所以在博士期间开发出了一套高精度的图像搜索技术,并将其运用到了指纹识别之中。这也成为了成立墨奇科技的契机之一。  

2017年博士毕业后我就回国了。主要是看到AI在国内的落地更优势,包括计算机视觉、图像感知、工业互联网、NLP等领域,关注度都非常高。此外,我当时也觉得,虽然深度学习历经了四五年的发展后已经相对成熟,但依然有一些瓶颈需要突破,因此希望能在方法论上去做一些创新。

CSDN:我记得那个时候,很多初创公司都是选择切入到图像识别、人脸识别等较宽的赛道,为什么你们却瞄准了指纹识别这么一个相对细分的领域?

汤林鹏: 这里有一个误区,其实指纹识别的市场并不小。我们可以看看前瞻产业研究院的预测,到2021年生物识别的市场规模将达到340亿元,而在生物识别中,指纹识别的占有率为52%,这样来看的话,其实指纹识别是一个百亿级别的市场。

究其原因,是因为指纹识别相比于其他的生物识别方式更加成熟,指纹门禁、手机指纹解锁、二代身份证、护照等都已经应用了指纹识别技术。 而另一方面,中国这样的人口大国,特别需要通过指纹识别实现全民的身份认证,从而进入智能社会的快车道, 因此我们才希望能在这一领域做出一些技术突破,提供一系列能够落地的AI解决方案解决现实的难题。

CSDN:既然指纹识别已经是一个发展迅速且相对成熟的领域,那么还有哪些「现实的难题」呢?

汤林鹏 :传统的指纹识别中,其实还有不少可以提升的空间,主要包括以下几个方面:

  • 耗时长 ,专业指纹人工编辑非常费时,对相关专家要求较高;

  • 精确度低 ,大库容比对时唯一比中率不足;

  • 海量指纹搜索困难, 随着指纹库容增大,系统计算会造成延时甚至宕机;

  • 安全及隐私风险 ,指纹信息一旦泄露会造成一定的欺诈风险;

  • 无法处理低质量指纹。

euUjAvZ.jpg!web

重新定义指纹识别技术

CSDN:针对上述传统指纹识别中的痛点,墨奇科技做了哪些技术创新?

汤林鹏: 我们研发出了高精度图像搜索引擎技术,它包含三个部分: 图像的自适应多尺度表示和索引系统、无标注或极少标注的自学习框架,以及高速异构的搜索系统。 通过这套技术我们可以实现20亿量级指纹图像秒级识别。

qaY7beB.jpg!web

墨奇高精准图像搜索引擎架构

CSDN:可以分别讲讲这三个部分的作用及基本原理吗?

汤林鹏: 好的。我们首先讲讲图像的多尺度表示和索引系统,在展开前,我们不妨先来看看传统的指纹识别的原理是怎样的。 传统的指纹识别主要依靠的是特征点,比如手指上的纹线、纹线的分叉和断点等。但在真实场景中,指纹的质量往往比较低,模糊、残缺、扭曲都十分常见,给识别增加了难度。

而在我们的多尺度算法索引下,我们会按照整体到局部在到细节等多个尺度,对指纹图像进行特征提取,不同尺度之间我们还会考虑它的多样性刻画。 相比于传统的指纹识别,这种算法可以提取到更多的信息,看到更多的细节。而相比于深度学习算法,这种多尺度的算法则可以更有效地对质量较差的指纹进行识别。

mA3maeV.jpg!web

高精度图像搜索数学模型

再说说只需极少量样本的自学习框架。其实这一框架与上面的多尺度表示是相辅相成的。传统的深度学习框架需要大量的标注数据,其原因在于一张图片能提取的特征只有一两个。 比如要识别一只猫的体态,需要对成百上千张不同体态的猫的图片进行特征提取,才能完成训练。而在多尺度多样化表示的算法中,一张图中就可以提取出成百上千个特征,这样一来,我们所需要的样本数量就可以压缩到传统深度学习的千分之一,甚至万分之一 。不仅如此,由于有了多尺度多样化表示这一特点,图像搜索过程中对于误差的容忍性也提升了数十倍。

最后是高速异构的搜索系统,它的核心是通过对图像搜索精度要求的判断,来调用不同的运算资源。 对于量大且不需要高精度的图像,可以使用GPU来进行运算;而对精度要求较高的图像则调用CPU来进行运算,从而实现指纹图像的高速比对 。完成比对之后,系统会对相似度较高的结果进行排序,就类似网页搜索引擎反馈的排名较高的搜索答案一样。

yyayqiA.jpg!web

高性能异构搜索系统

CSDN:刚才我们讲到的是指纹的搜索和比对,其实指纹的采集也是很重要的一个环节,一般的指纹都是通过指压的方式进行采集的,但我了解到墨奇科技研发出了非接触指纹识别技术,请问研发这一技术的原因是什么?

汤林鹏: 原因有三。 第一是指纹识别在应用上的普及, 无论是办证、出入境还是其他场景,指纹识别都是首选的生物识别方案。传统的指纹采集方式却存在一些弊端,例如手指表面的脱皮、破损、干湿度、按压力度/角度,都会造成指纹的畸变,导致指纹的质量降低。而多次反复采集又非常耗时。

第二,得益于深度学习的发展及行业的积累,现在我们已经有能力对低质量的指纹进行处理。

第三,随着边缘计算、AI芯片的发展,边缘端的计算能力得以增强,一些图像处理过程完全可以在边缘端去实现。

另外,新冠疫情也让大家深刻体会到非接触指纹采集的重要性。不少国家接触式的指纹门禁已经被禁用,出入境指纹采集后还需要消毒,非常的不卫生不方便。美国国家标准与技术研究所(NIST)最近也加速了非接触指纹技术的评估和推广。

https://www.nist.gov/news-events/news/2020/05/nist-study-measures-performance-accuracy-contactless-fingerprinting-tech

我认为,这几点是历史性的机遇,也是我们为什么要做非接触指纹识别的原因。

CSDN:那么非接触指纹识别的技术原理是怎样的?

汤林鹏 :主要原理是 基于多目视觉+结构光 这样一个三维成像方法,从不同角度来重建指纹的三维曲面,再进行融合,然后再对指纹信息从三维曲面到二维曲面进行展开,这样就得到了一个高质量、大面积的指纹。

与一般3D扫描不同的是,墨奇的非接触指纹采集的精度非常高,可以精确到亚毫米。

CSDN:在人脸识别中3D扫描技术可以对人脸的真实性进行判断,那么3D扫描指纹是否也可以对指纹的真假进行判别?

汤林鹏 :没错,在指纹识别中我们称之为「活体指纹识别」。因为在传统的指纹识别中,像指纹膜、假手指等欺骗手段很容易骗过指纹采集设备。因为传统的按压式的指纹设备得到的只是一张黑白的二维图像。 而在非接触采集中,我们却可以得到RGB彩色图像。 同时,通过对三维手指外在的眩光、时序信号等,可以精确地分析手指的生理和光学性质,从而判断指纹是否来自活体。

NNfMrqz.jpg!web

未来,打通AIoT和5G场景

CSDN:你如何看待深度学习的发展?

汤林鹏 :我认为深度学习取得今天的成绩,跟一批有远见卓识,且孜孜不倦在这个领域上努力研究的人有关,例如神经网络之父Geoffrey Hinton和一些年轻的研究者,他们用很多年的时间来推动这门技术的发展。

此外,深度学习在一开始表现的并不如传统的算法好,是因为它对数据量的要求比较多,但早期的数据量不够。 所以想要提升深度学习的性能的前提,需要先建立一个海量的数据集 。我在普林斯顿的导师李凯教授和李飞飞教授一起在早期推动了 ImageNet 数据集的建立,也直接促成了2012年以来深度学习发展的浪潮。当然在很多应用中,大规模的数据采集是比较困难的,我们的技术规避了深度学习的这一瓶颈,同时实现了更加精准的视觉信号的搜索。

CSDN:墨奇科技的未来计划是怎样的?

汤林鹏 :近期的规划是继续深耕指纹识别领域,并以此为核心建立起下一代的强身份认证平台。未来2~3年,我们希望能够打造通用的、精确的图像搜索技术,并将这些技术应用到AIoT、5G等场景中。但总结起来一句话, 我们的核心是希望不断在技术上有所突破,推进 AI 的发展,并以此来撬动更多重要的行业应用。

nayQVbv.jpg!web

推荐阅读
你点的每个“在看”,我都认真当成了AI

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK