37

Google中日韩文搜索算法主要设计者吴军:区块链可能是大数据安全解决之道

 5 years ago
source link: https://www.8btc.com/article/305191?amp%3Butm_medium=referral
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

编者按:2018 中国计算机大会(CNCC2018)于 10 月 25-27 日在杭州国际博览中心举办,会议由中国计算机学会(CCF)主办,杭州市萧山区人民政府、浙江大学承办,浙江工业大学、浙江工商大学、杭州电子科技大学协办。

今年的大会主题是「大数据推动数字经济(Big Data Drives the Digital Economy)」,CNCC 邀请到近 400 位国内外计算机领域知名专家、企业家到会演讲。大会次日,共有九位嘉宾带来特邀报告,第二位特邀嘉宾是 Google 中日韩文搜索算法的主要设计者吴军,他的报告题目是《超级智能时代》。

吴军博士认为人工智能的发展趋势是「超级人工智能」,未来的世界应该是强连接的,而这种强连接带来的好处包括:更好地保障食品和药品安全以及交易安全,还能够更好地追踪健康,让人能够更加及时发现病症。同时,他也指出这种强连接会带来隐私隐患、风险和危害,例如,IT 巨头掌握并控制大量的数据信息,一旦泄露就会导致巨大的隐私风险;黑客犯罪成本接近零,巨大的收益将会鼓励他们进行网络犯罪。这些问题可能是用法律无法解决的,所以我们需要尝试从技术的角度来解决它们。

针对大数据带来的隐私隐患,他表示,区块链是可能的解决方案。这是由于其具备如下特点:

一是这项技术将所有权、使用权和验证分开了,更好地保证了公正性;

二是较高的安全性,其理论上是无法破解的;

三是方便性,可随意合并打包和拆解,能很好地进行追踪,极大方便了溯源;

四是低成本;

五是透明化程度高。

至于区块链在具体应用场景中的作用,他提到两点:第一,去中心化,能够存放病例等数据信息,使得使用者和拥有者都能从中获益;第二,是智能合约方面的应用,能够使用区块链监控贷款还款以及拨款等问题,所有的执行完全由算法监控,这使得相关人员都无法进行人为违约。

以下为他的演讲内容,雷锋网 AI 科技评论做了不改变原意的编辑整理。

3iAv22b.png!web Google 中日韩文搜索算法主要设计者、博士吴军

这是一个学术会议,我发现在中国,冠以「中国」开头的会议都是最高的,冠以「世界」的会议我都不参加——因为可能没有什么收获。在座的各位都是专家、学者,我站在这里显得有些班门弄斧,而且有时候我发现学术界存在一个鄙视链,做理论研究的看不起做应用研究的,而我是在鄙视链的最底层。

今天我讲的题目跟人工智能有关,因为我发现本次会议,大概有三分之二的报告内容跟人工智能有点关系。如果在十年前我们开这个会议,一定不会出现这样的情况,那为什么今天会出现这种情况呢?很大的原因是,2016 年 AlphaGo 赢了李世石,这成为了人工智能技术的一个节点。

人工智能的发展趋势:「超级人工智能」

从 2016 年至今,我的感受是人工智能的发展有这么一个趋势:它从类似于人的单一的智能单机或者说系统智能变成了网络智能,所以我把它叫做「超级人工智能」。

很多人问我怎样判断一个人研究的课题是真是假?我说很简单,如果要造飞机,那些在研究鸟类飞行的就是骗子,因为他需要研究的,其实是空气动力学。如果我们能够找到他所做研究的一些科学基础,那他就是在真正做人工智能研究。

rMbmmun.jpg!web

今天,人工智能有三个基础:

第一个是摩尔定律,我们计算机从业者原本都对它有一个理解,我将换一种方式来讲怎样理解摩尔定律;

第二个是数据,今天的人工智能之所以成功是因为有大数据的支撑;

第三个是数据模型。

两年前,一位原来做深度学习的同事跟我说,他过去每次参加机器学习类会议,大概能够坐 100 人的会场只坐了 10 个人,这 10 个人还都是去做报告的。深度学习本身是一个数据模型,我们可能还会找到更好的数据模型,不过这是机器的特长,而不是我们人的特长。

除了人工智能,还有两件事发展得非常快,一个是 IoT,这使得我们跟踪东西变得不再那么困难;另一个是区块链。

最近有一个热门的话题叫做 5G,今天你的手机上网,哪怕是看 4K 电视,网速都是够的,那为什么还要 5G?在场有一千多位参会者,如果把我们的桌子、椅子都连接到一起,不管带宽多少,当我们同时上网时,网络都会变得非常阻塞,所以我们需要一个更好的上网方式。在 5G 时代,如果将所有的东西都连到网上,会怎么样?带来的第一个好处是我们可以跟踪很多事情。

讲两个很简单的真实例子。第一个例子,在教室装上摄像头来了解每一个学生是否有好好听课(这件事有没有侵犯隐私我们另说);另外一个是更现实的应用,如果你有孩子的话,当课后送他去补习班后,他可能在那边玩手机、橡皮,而在这样智能化的教室里,你就可以很好地监控孩子的动态。

6biUrqF.jpg!web

在生活中我们还可以用这项技术来追踪更大的问题,比如说食品安全。阿里巴巴的人跟我说,中国的食品安全问题还很严重,这个问题也很难解决。后来我还通过一些做药品的人了解到,很多药店卖的是假药,一种情况是他不知道自己进的是假药,另一种情况是制药厂可能都不知道自己制造的是假药。还有反欺诈的问题,刚才黄教授讲了智能合约这个概念,如果我们将合约都变成这类智能合约,是可以解决违约、欺诈问题的。

此外,我们还可以进行健康跟踪。现在任何一架商用客机上都装有一千多个传感器,每天能产生超过 1 G 的数据,可以很好地监控里面的温度、湿度以及其他运行情况。但是人体内没有传感器,以至于今天很多人在得知自己得了癌症的时候,已经是晚期了。我们对自己身体的监控,做得远没有像对很多设备的监控那么好。今天特斯拉汽车里面装了几百个传感器以及计算功能强大的芯片,你买个非电动的汽车都有 200 个传感器。我们为什么不去做追踪人体健康这件事?一是因为有难度,二是因为存在隐私隐患。

fqaYviZ.jpg!web

今年 Facebook 出了一件大事,被曝卖掉了 5000 万客户的数据,而扎克伯格作证时则说他们卖了 8700 多万客户的数据。我们说云计算好,很大程度上是因为它安全,有专业的团队替你管理数据,不过有时候,专业团队的管理并没有我们想象中那么好。更重要的是,我们的信息安全需要建立在大公司的善意的基础上,一家大公司作为一个经济实体可以有这个善意,然而公司里面操作业务的人是否有这种善意,我们就不得而知了。所以,我们需要从技术的角度来解决这个问题,因为有时候我们不能完全靠法律——法律总是滞后很多。

区块链可能是大数据隐私隐患的解决方案

对于网络连接带来的隐私隐患、风险和危害,区块链是一个可能的解决方案。不过因为这个概念实在被炒得太热了,以至于现在大家都还在怀疑它是否是泡沫。

为什么说区块链可能是一个解决方案?因为它有一些很重要的特点:

第一,它在数学上很漂亮。它使用非对称的加密,公开密钥;你可以确认真伪,但是不需要拥有;你可以访问信息,但是无法修改。

第二,从理论上来说,区块链是无法被破解的,它很安全。

第三,区块链的使用很方便,你可以随意合并打包和拆解。这也让商品和药品的溯源变得更简单。

此外,区块链还有成本低、透明等特点。

JJ7ree6.jpg!web

然而,现实的情况其实不是这样的。

一是区块链使用起来很不方便,因为它的协议还很粗糙。

二是成本非常高。大家可以猜想一下,如果我们用比特币来买咖啡,成本有多高?大概是 12-15 美元。此外,还存在交易延迟问题,平均的延迟时间大概为两三个小时。刚才黄教授提到以太坊十分之一秒就能完成一笔交易,不过吞吐量是一回事,真实的交易又是另一回事。

三是透明性问题。今天真正实现了应用的区块链,从逻辑上来看是透明的,但是在现实应用中企业会考虑很多中间环节,因此最终也变得没那么透明了。

不过我认为,任何一个问题都是一个机会,如果世界很完美,我们就都没有工作了,而恰恰就是因为世界不完美,才需要我们在座的计算机科学家去做一些事情,比如说刚才讲到的效率或者说延时问题。

第一代区块链协议是比特币,第二代是以太坊,以太坊是怎样提高效率的呢?打个比方,滴滴司机有两种方式接单:一是抢单,谁抢到就是谁的;二是由滴滴来进行订单分配。比特币的协议采用的就是抢单的方式,有很多交易需要验证真伪,最终会由第一个抢到的人进行验证,如果他验证出来了,这笔功劳就是他的,当他验证的足够多的时候,就会得到一个比特币的奖励。在大家一拥而上抢单的时候,整个验证过程的效率就变得很低,以至于每一次交易验证都需要花很多时间。

rQvyIr6.jpg!web

而以太坊的协议是,如果你想参与我们的验证工作,就要先买以太币,然后再根据你们手上所买的以太币数量,按比例进行分配。这样,区块链就从技术上解决了延时问题,从而提高了效率。

以太坊今天的价值为几百亿美元,虚拟货币市场是两千亿到三千亿美元。当到第三代区块链的时候,有可能把延时从以太坊的几分钟减少至几秒钟。

区块链的具体应用

区块链到底有什么用?

一是能够保护跟踪我们的隐私。斯坦福大学的一位教授发现,现在所谓的医疗病例数据共享在美国几乎是不可能实现的,病例数据共享在中国谈了这么多年,到目前为止也还没能实现,原因就是大家对隐私的担忧。有些人是坚决的反对者,他们认为一旦病人的数据泄露出去,比信用卡的数据泄露还要严重得多。

此外,还有两个严重的问题:一个是医院不愿意共享数据,另一个是病历的归属问题。从现在的实际情况来说,无论中国还是美国,病历都属于医院,医院内部的信息系统是很难对外开放的。另外,即使法律上将病历归属于病人,你也没有办法把它放到你家的计算机里。

如果有一个去中心化的地方存放病历呢?如果将一个病历开放给医院,每次访问收费十美元,医生都愿意支付查看。这就意味着如果你真有一个疑难杂症,一年收入可达十万美元,另外当一些研究者对这个病历感兴趣时,他们也会买来查看。而今天大家对 BAT 不满的是,他们卖你的数据,获利的却是他们。区块链则提供了一个可能性:将数据还给大家,让所有者从中获益,同时也让使用者从中获得更大的应用。

二是智能合约的应用。中国过去在商业上有一个词——三角债,这个问题很难用现有的技术从根本上解决。为什么?比如在之前还欠别人的款的情况下,你再去向银行贷款建工厂,因为所贷的这笔款是可以很快被挪用的,经银行批准后,你就可能把钱挪做他用,最后就形成三角债,从而导致经济运行效率的下降。只要是由人来进行拨款,三角债问题就很难被解决。

人工智能发展到现在会进入一个新阶段,而人工智能和人的区别在于群体效应,比如无人驾驶汽车,将来会将整个城市的所有车都连成一张大网,从而带来极大的网络效应。

如果把人工智能想象为一个人,IoT 相当于是它的五官,计算机程序就是它的大脑,许多连接会带来大量安全隐患,在这种情况下,区块链有可能成为一个很好的解决办法。

虽然区块链现在还存在很多问题,跟它相关的项目可能 99% 都是骗人的,但是我们确确实实看到区块链可以用来做跟踪,来解决现有技术所解决不了的一些难题。

最后与大家分享我的观点:任何时候当你碰到问题,倒过来看可能就是机会。这个世界上有各种各样的问题,当应用上出现困难的时候,可能就是在座每一位计算机科学家的机会。

(完)


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK