35

京东副总裁周伯文:旅美18年,为何选择回归投身中国的AI浪潮?

 5 years ago
source link: http://www.10tiao.com/html/46/201806/2651007682/1.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
记录与时代并行的技术人,暌违已久的二叉树短视频回来了!叩问过技术大牛的「初心」,描绘过技术人的「众生相」,这次我们带您去见识那些横跨「两界之间」的技术人们。这是 10 位行走在中国人工智能之路上的技术人,他们正见证着中国的人工智能技术落地。点击公众号菜单「戳」一栏“二叉树视频”或扫描文末二维码可观看往期高清视频。


《两界之间》技术专题纪录片 | 第八集

由 InfoQ 二叉树 出品

嘉宾简介

周伯文,京东集团副总裁、京东 AI 平台与研究部负责人。在加入京东之前,周伯文是 IBM Watson 的首席科学家。

Q:介绍一下您接触人工智能的经历?


人工智能是我在科大读书的时候,我们学的是信息论,然后开始做语音识别,这是我进入人工智能的第一个方向。也非常巧,信息论和语音识别的两个领域的大专家在 IBM Watson 研究院成立了世界上第一个用统计方法做语音识别和机器翻译的研究组,很多年以后我在美国博士毕业就来到 IBM 这个组,成为 IBM 的研究员。这也许是一种技术的宿命吧?

Q:您觉得您是一个偏理论学术派的,还是一个偏工程实现派的?

我不是特别喜欢贴标签。但是如果非要回答这个问题的话,我会认为我自己更是一个喜欢学术研究,但是非常实际应用落地价值为导向的这么一个人。这不代表说所有的研究一开始或者短期内就有价值,但我会把我自己的研究的一些精力更多放在一些我认为能够帮助一些领域、帮助一些应用场景、产生一些突破性的研究方向上。

Q:您的这种观念是什么时候形成的?

回到我做研究选择语音翻译这个方向,为什么会选这个方向?在当时是一个非常难的问题,因为语音识别大家也没有解决,机器翻译也是一个非常难的问题,像通天塔一样难。然后我当时做一件事情是,不仅仅是把这两件事情结合在一起——做从语音到语音的翻译,而且我还决定要把它做在手持设备上,当时叫做 PDA。我为什么会做这么一件事情?当时所有人都告诉我这是不可能的,因为语音识别错误率比较高,机器翻译错误也很高,而且当时需要大的计算资源,机器翻译需要很多内存。

但我在想说,语音翻译的根本目的是什么?是解决当人们碰到语言障碍的时候去使用。你回到 2000 年初,那个时候没有 iPhone,甚至没有那么好的互联网。在那种情况下,你如果作为一个有语言障碍的一个跨国旅行或者任何场景下,你需要解决语言障碍,那么那个时候你需要的就是一台你随时能够携带的电子设备来帮助你解决语言障碍。我是完全从实际问题出发。


我做了世界上第一个大词汇量的、双向的,比如说从英文语音识别翻译成中文的文字,再通过语音合成播放出来,再从中文回到英文,全部做在一个端到端的手持设备上。手持设备只有我记得非常清楚,当时是惠普的 iPAQ,只有 206 兆赫兹的 CPU,32 兆的内存。我是世界上第一个做到这个的。我想这个是我个人学术研究生涯的一个亮点,也是我的哲学观念的表现:我希望去解决实际问题。我当时还有一个选择是根本不去做这个问题,我可以十年之后再来做这个问题,我可以用我最好的研究的时光去做一些更 well defined 的学术问题,去产生更多的 citation,产生更大的影响力,但我认为在那个时代,人们需要这么一个便携好用的实时的语言翻译系统,我就去做它。

Q:这件事情的前后,还有哪些让您印象比较深刻的事情?

我想这个给我一个很大的启示,就是说我以后做研究也好,带团队也好,在人工智能领域,我都会去结合技术的深度和可落地型和对真正客户带来价值这些角度综合去考虑。我不会追逐热点,我有时候会选择一些冷门的东西,坚持做下去。


这也影响到我,比如说像我们谈到在构建人工智能团队,我非常清醒地意识到,要解决一个人工智能这么一个目前正在急速发展、快速变化、理论还不完善这么一个领域,要把人工智能用好,一方面要对做人工智能基础研究,第二方面要去做人工智能的平台化建设,去推动人工智能跟实际应用长期的结合,第三也得考虑到商业的价值。我认为这三者合在一起,才能搭建一个健康持续发展生产价值的人工智能生态和团队。所以在京东的人工智能团队里面,我就包含了人工智能研究院,负责人工智能基础技术研究,同时会有人工智能平台部门。

我们星期天(2018 年 4 月 15 日)刚刚发布了我们开放普惠的人工智能平台,Neuhub。这个平台我们就希望把这些最核心最前沿的人工智能技术,以非常低的门槛提供给开发者,提供给一些中小企业,提供给学生,提供给包括京东我们的同事们的各种应用场景去使用这些人工智能。但是我们的人工智能研究院就在后面不断的迭代推进,甚至从 0 到 1 的开创一个新的方向,把能力及时付能到平台上。


我们作为人工智能的专家,我们希望帮助到一些企业去理解怎么用人工智能去思考,去重构他们的业务流程,靠拢的客户服务,所以我们在做一些人工智能驱动的商业模式创新。所以这三个模块在我看来构成的人工智能生态建设的必不可缺的部分。

Q:其实从美国回来对您来说也是个很大的决定。当时怎么权衡的?

我在美国已经待了将近 18 年,在 IBM 待了 15 年,我在 IBM 负责 IBM 的公司基础研究,同时负责 IBM 的 Watson 集团的所有的人工智能技术的规划和 API。我回到中国有很大一个原因,是因为我看到中国在快速发展,对人工智能这么一个新兴的技术有非常大的渴求。而且中国作为世界上最大的发展中国家,在前几年的高速发展中,积累了大量的人工智能的应用场景和数据和一些非常勤奋有天赋的人才。我们国家的高度重视,和我们像京东这样的一批优秀的企业对人工智能的投入和渴求,是促使我回到中国做人工智能的一个主要原因。

Q:听说当时您回来只带了一位助理?

我是一个人回来的,助理是京东帮我找的。

Q:可以简单讲讲半年以来团队组建的过程?

过去的半年,人才建设和团队建设是我的一个重要工作。我对人才也有一些特别的想法,我认为人工智能人才短缺是一个世界性的难题,它有几个深层原因。

第一个原因是,我们现在看到的新一代人工智能是过去几年短时间内迅速迅猛发展起来的,虽然有少数研究者在这个领域耕耘了很久,但大部分我们的计算机科学或者相应的这种高校硕士博士甚至本科生的培养,跟现在人工智能所需要的这些背景知识匹配的并不好。所以换个角度讲,我们在 supply 这一段是有很大问题的,整个世界性的人工智能人才的短缺,是因为我们的培养体系,全世界范围内没有跟上人工智能发展的速度。所以在很多高校,特别在美国看到很多硕士博士,他们的博士导师在往人工智能这边在转型。

第二个原因是因为人工智能发展非常迅猛,各行各业都看到一些巨大的机会,不仅仅是技术企业,也包括一些传统行业,他们都在建立人工智能团队,所以 demand 的这一块是非常高的,这样导致了 supply 和 demand 的一个极大的一个不平衡。所以我们的方法,包括本人的哲学,就是人才不是靠挖,不是靠抢,更多是靠培养和吸引。吸引的角度来讲,就说是作为一个 leader,作为一个企业应该有很好的公司的愿景和明确的价值观,人工智能到底是给社会带来什么价值?以企业为平台给社会带来什么价值?

我们很愿意跟高校、跟教授一起去培养培养人才,建立新一代的产学研合作的这种体系。在美国我们经常看到,很多在高校里做人工智能研究的教授被高薪挖到企业去担任要职,所以我跟一些人工智能领域的非常有号召力的教授也都聊过,比如 Yoshua Bengio 我们就聊过很多次,他跟我提到就是说如果所有的人工智能学术界的人才都被挖到企业的去,那么谁来负责培养下一代人工智能人才?我认为他问的是一个非常深刻的问题。所以我的答案就是告诉他,我们的方法是我们企业界跟高校一起来培养人工智能人才,这是根本的,我们绝对不应该把所有的人才都放到企业去。我的企业应该担起责任来,跟高校一起培养人才。

来京东以后,我也同样的这么一个思维,我们希望通过京东这么一个平台,用人工智能对社会、对我们的国家、对我们的消费者产生价值。我们提供这么一个舞台,从基础研究到人工智能平台到人工智能驱动商业创新,我们有非常清晰的愿景,而且形成非常自洽的这么一个生态,让人工智能人才看到,他有非常宽阔的舞台去施展他们的才能。

我们对人工智能下一步的发展方向有非常深刻的领悟。我们认为人工智能现在处于一个初级阶段,有很多深刻的技术需要去做,我本人都在定期跟踪最前沿的论文,因为我认为人工智能目前的技术体系还远远不完善,一些新的论文的产生可能会导致一些方向的重大变化。所以我们对技术投入非常非常多,也对技术的钻研非常深,所以我们能吸引很多人才加入我们。同时我们又非常重视落地。京东的场景和数据能提供这些独特的价值,让一些人工智能人才感觉在京东他大有用武之地。我们对商业模式、对人工智能可能对一些传统行业引起的变化非常关注,我们用人工智能赋能这些企业能帮助他们一起做这样的转型,对很多人工智能的人才也很有吸引力,特别对一些复合型的人才很有吸引力,所以通过这些办法我们能吸引到一些很强的人才,所以我也非常非常骄傲、非常自豪的告诉大家,就是过去几个月之内,那么迅速搭建了一个将近 200 人的团队,也包含了一大批来自世界一流公司的顶级科学家加入我们。

Q:比如说我现在是一个大学生,然后可能我主要是计算机专业或者是物理专业或者其他什么专业,我有什么途径可以培养自己成为一个像您需要的人才?

对一个有对应背景的大学生,我想首先可以在理论上进一步学习。现在人工智能发展非常快,所以最好的学习办法是去读最新的论文。从最新论文入手,去倒推需要的基础知识,这是我们大部分的学习方法。因为人工智能发展非常块,在你书还没写出来之前,这本书已经过时了,所以去跟踪最新的论文是一个最好的办法。

同时一定要有实际的经验,所以我会建议像这样愿意投身于人工智能,具备相应数理基础的、编程基础的同学,去找到跟他兴趣匹配的这种人工智能落地方向,在企业里面,在一些这种真正有一线研究经验的导师带领下,去做一些这种深度的 handson 的一些这种人工智能的落地的系统的探索开发研究。

然后再以这个为基础,如果他们觉得他们需要博士学位,需要更好的去系统的深入的研究这些理论,再去找相应的导师在高校里面去攻读学位,我认为这是比较好的一个办法。

Q:您现在关注论文的渠道和方法是什么?最近这一年有什么重要的论文?

因为我自己还在写一些论文——跟我的合作者们,我每天尽量抽时间来读论文,我读论文大部分是根据 arxiv 的一些推送,因为我对一些特别的领域设定了关键词,还有我的一些合作者,他们会定期发送一些论文给我。

在过去一两年中,我认为现在的人工智能已经慢慢具体化了,会有三个阶段。

第一个阶段就是我们目前最成功的这些人工智能技术,基于深度学习的、大规模标注数据的有监督学习。这一块目前非常成功,我把这个阶段叫狭义人工智能,原因在于就是说人工智能,就像别人讲的,有多少人工就有有多少智能——要用这么多的标注的数据去学习这些东西。学习好了,它在感知这个层面用 pattern classification 做到非常高的精度,但是它的障碍在于就是说是,他这些模型也好,这些算法也好,这些产生的系统也好,它不具备这种在相类似的 task 上转移能力的技术。比如说你做的一个特别精确的一个某一个人工智能系统,换成类似的 task,它会完全 fail 掉,这是一个很大的问题。

长期来讲人工智能研究方向对每一个人工智能研究者来讲是做这种通用人工智能,我们把它叫做 AGI。但是 AGI 目前来讲更像是一个 direction,更像是一个乌托邦,或者像 destination,它不是一个 well defined problem。大家都清楚 AGI 是我们想做的东西,我的理解是 AGI 会有更多的这种 self automation,它能够自己自治,这是长期的方向。


但作为我们在一线的人工智能研究者和实践者来讲,我更关心的在于是下一个里程碑,我是特别说 Artificial Broad Intelligence,ABI,会比较好的弥补目前 AI 的不足,跟 AGI 相比又更好的 well defined。粗略的讲,ABI 相比 ANI 会多这么几个核心的能力:第一个说是它会把简单的这种单任务的学习变成一个多任务的终身学习,它会保留原来它自己的 skill,就跟人一样,它会的技能会越来越多。你原来是骑自行车的,学会了开汽车不代表会你就不会再骑自行车了,目前窄义 AI 的就这么一个情况。

还有其他几个关键的点,比如说是 ABI 的人工智能系统会有一种能力,会从所有可能的信号中去学习,而不仅仅是从有标注的大量的有标注数据中去做有监督的学习。所以这种学习能力不仅仅是我们今天讲的这种 supervised learning/unsurpervised learning,他更多是会产生一种就说是没有输入也能够自我学习。有一种很好的类比,你知道我们人每天晚上睡觉,睡觉以后你有意识或者无意识地会去回放你今天白天经历过的事情,你可能会去从这种回放中发现什么地方做得好,什么做得不好。第二天醒来的时候,让你成为一个 better person,你会更好的知道怎么 deal with 同样的事情。

最后一个方向,我认为会是优化方面会有很多的提高。我们今天的深度学习在某种程度上是一种幸运或者偶然。原因是说我们深度神经网络最常用的一种反向传播的优化算法,理论上不是最优的,没有任何 guarentee 它能够训练好,但是在现实我们发现,深度神经网络可以让理论上不是最优的这些训练模型在没有见过的数据上也能训练的很好。没有人知道 exactly 为什么,这是我们的幸运。但是在 ABI 的时候,我们会发现,当你神经系统能够自我学习,从没有输入中学习,能够无监督的学习,能够用新的架构去学习,让自己能够 grow 新的 layer,自己能够去 adapt 新的 neuron 这些情况下,我认为我们需要更好更新的优化算法。

Q:之前你也提到您关注脑科学,这方面他现在跟人工智能的一线有关系吗?

目前来讲他们的关系还很少,虽然借了很多语言,比如说我们把神经网络每个单元叫做 neuron,就是从脑科学中借的一个词,但目前来看它们的关联非常少。

但是人类的大脑是一个非常神奇的系统,所以我觉得对人类大脑的一些深度的了解和研究,必定会催生人工智能的一些发展。像我说的自我回放的能力,这种概念性的东西,会对人工智能可以有借鉴。

Q:人工智能可以说是发展了五六十年,发展到现在这个地步。您觉得这是快还是慢?

非线性的。就跟深度学习网络一样,它是非常非线型的一个过程。你在历史的长河中看,你会发现,有一段时间它非常的平缓,长期没有进展;有一段时间,它进展非常快,就像过去 2012 年到现在的深度神经深度学习一样,这 5、6 年可以说是重新刷新了很多人工智能领域的最好的结果。

但是你放在更长远的时间中,肯定会发现,即使在发展非常慢的阶段,实际上也在积累力量,在积累一些人才,积累大家对一些领域的深度了解,所以你不能去通过线性的角度去判断,这个时代是黄金十年,那个时代发展非常慢没什么进展。就像你吃饭一样,你不能说你吃饭吃饱了是最后一口饭让你吃饱的。

Q:那现在我们正好在这个黄金时代,大家都对这个东西抱有很高的期待。您怎么看这样的期待?您对于自己在这个时代希望发挥的作用是怎么?

我觉得现在人工智能这么热,应该一分为二的去看它。一,确实过去几年中,或者过去几十年中,人工智能有很多非常好的积累,比如我们今天非常好的评测体系,我们知道怎么去评测一个模式系统 work 还是不 work。


在另外一方面来讲,我认为人工智能确实有一些是泡沫,因为并不是每一个号称人工智能的公司都理解人工智能。会有些 hype 在里面,但我认为 hype 也是健康的。

我们还是要去从问题出发,从场景出发,你要解决一个什么样的问题?这个问题今天的人工智能技术是不是能够去解决?它有没有达到这个程度去解决?如果没有,障碍在什么地方?需要的资源是什么?规划应该是什么?所以这就需要一些对人工智能技术有非常深刻的领悟,同时又具有一些商业头脑 business sense 的 leader 来做这么一个事情。


我很荣幸在这么一个时代,在中国这么个大舞台能够参与这样的一个人工智能大潮,我也希望我个人在大潮中带领团队发挥一些作用。


最后,推荐一个 InfoQ 的资深技术作者的专栏。

作者李运华,在 InfoQ 公众号发表了多篇 10w+的文章。现在,他在极客时间开设了 50 期的专栏《从 0 开始学架构》,将与你分享他的架构设计方法论。希望通过这种体系化的、结合案例进行的方法论培训,帮助架构新手很快地掌握这套方法论并在实践中应用,实现成为架构师的梦想。

订阅方法:

方法一:请点击以下卡片,进入小程序订阅专栏⊿

方法二:请点击阅读原文,下载极客时间 App,订阅专栏⊿


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK