22

5岁小孩碾压AI,“玩”就够了?

 3 years ago
source link: http://www.tmtpost.com/4782366.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

YZbMFn.jpg!mobile

图片来源@视觉中国

文丨脑极体

探索是人类的本能,从婴儿时期开始,好奇心就驱动着我们去探索并理解自己所在的世界, AI的成长则离不开对人类的观察与模仿,其中,就包括探索的能力。

这种能力被算法掌握之后,出现了阿尔法狗打败人类棋圣,也出现了OpenAIFive——在电子游戏领域完虐人类玩家。不过即便如此,人类的探索能力依然令最高级的AI都望尘莫及。

比如婴儿可以从爬行和探索中学会认知三维空间,而一些计算机视觉还总被曝出被平面照片所欺骗过去的新闻,上马更高性能的3D视觉算法则需要耗费巨大的算力资源,从这个角度看,人脑无疑在效果和效率上都碾压了AI。

那么,能不能引入儿童的学习能力,来实现更聪明的AI呢?这个猜测,就像是“把爱因斯坦的大脑给我我也能拿诺贝尔奖”一样,是一个有点铁憨憨,又有点重要的问题。

5岁小孩碾压AI,“玩”就够了

大家不妨在假期做一个生活观察,看看小孩子们是如何探索世界的?

如果一个玩具看起来有很多玩法,但他们不知道哪一个是正确的,小孩子们会进行假设驱动的探索,如果“假设”失败了,他们就会转向新的玩具。

有研究显示,一个11个月大的婴儿,在看到许多违反物理定律的现象时,会忍不住对其进行更多的探索,甚至会做出一些违规行为来实践自己的假设。

比如看到一辆漂浮在空中的汽车,有点颠覆以往的认知了,你会怎么做?婴儿会选择将玩具砰地扔到桌子上,想知道这种“不合常理”的情况是怎么出现的(所以阻止熊孩子弄坏你手办的唯一办法,就是根本不要让他们看到它们)。

zMFnu2r.jpg!mobile

这种“不见黄河心不死”式的自由探索,有时会令家长和大人们不堪其扰,但抽象化的“假设”能够让人类做出大量预测,想象出许多新的可能性,不仅是一种极为有意义的学习方式,更是人类创造力的由来。

不过就像小王子觉得枯燥的大人们看不到“蟒蛇肚子里的大象”一样,令人遗憾的是,这种探索能力是幼儿的专长,大部分情况下只存在在5岁以前,这也让他们成为宇宙中最好的学习者。

既然儿童行为如此有参考意义,科学家们自然也想得到。事实上,儿童发展学对AI的进展起到了重要的方向牵引作用。

科学家们曾将好奇心引入神经网络,打造了深度增强学习,通过奖励反馈来鼓励智能体(agent)主动探索和理解环境,更新模型参数。这让AI能够自主获得技能,在电子游戏等需要通用智能的复杂场景中能够做出自己的决策,而不是人类预先通过庞大的标注数据集给定答案。

其他类型的儿童行为亦有价值。前面提到的“不见黄河心不死”的探索,就被化作深度优先搜索策略,DeepMind和加州大学伯克利分校的研究人员,开发了一个3D导航和解谜环境。智能体(agent)沿着特定路径进行探索,如果遇到死胡同,那就回去找到下一条没有探索过的道路,继续前进。

miEFZb.jpg!mobile

听起来是不是很像小孩子走迷宫的游戏?这能让智能体接触到各种各样的经验,在信息较少的环境中工作;减少对数据量的依存,改变目前算力资源紧张的局面,让许多小数据、少样本的领域(如金融、医疗)也能实现智能化。

将儿童探索行为应用于AI,一切都能变得更好,理想层面上确实如此,但现实总喜欢跟科学家们开玩笑,也算是给人类保留了一个“杀手锏”吧。

AI能力暴涨的当下,人类为什么还能稳坐智慧王座?

需要注意的是,这些类似儿童探索的策略,通常更多被用在训练期间提高代理人的经验值,而不是在决策时支持快速学习和探索。用人话说就是“懂得了许多道理,却不一定能过好这一生”,因为一到关键选择时刻就会掉链子。

就拿前面提到的深度优先搜索(DFS)来说,科学家们发现,如果让孩子们自由探索,那么他们与智能体按DFS做出的行动有90%的相似,而以目标为导向(找到橡皮糖)来探索的话,有96%的路线都是相似的。但不同的是,探索越多的孩子,最后能花费更少的时间完成任务,智能体却相反。

IrYZfaz.jpg!mobile

如果智能体发现一个地方很有趣(能得到奖励),就会一直重新访问该区域,直到它终于终于终于觉得那里不再有趣了,这会导致其概括性不佳(无法形成最佳策略)。

其中的差别就在于,孩子不是被动地孤立学习或由目标驱动,而是在不断实验和收集信息,将自己的认知和经验与获得的信息结合起来,编织出一个丰富的世界模型。而即使最复杂的机器探索方法,也只能为特定的目标服务,一时半会还无法完美匹配这个充满了各种“意外”的真实世界。

为什么有了一定的探索能力,AI智能体的表现还是不尽如人意呢?

首当其冲就是实验室与现实环境的巨大不同。

深度强化学习过去都是“机上谈兵”,不是跟人类在二维游戏里PK,就是数字网格里下棋,而儿童的探索则是发生在信息丰富的三维现实世界之中,许多潜在因素很难被应用到实验中。

这也是为什么,当今最强大的AI智能机器人也达不到一个仅小学毕业的优秀人类服务员的工作能力,能像他们一样快速适应环境、完成各种复杂任务。

此外,儿童的发展心理学研究很难在AI产业链中形成“闭环”。要真正激发AI生长出服务现实的能力,不仅要构建出具有更强探索能力的智能体,还要继续学习人类的认知能力,推进人工智能自身的理论创新和软硬件升级(比如搭建三维训练环境),这一系列链式突破,才能最终将技术构想转化为现实生产力。“大力出奇迹”的深度学习,其高光时刻就是这么来的。

沿着这个方向,我们可以进一步了解,怎样才能弥合智能体与人类之间的差距。

下一代AI,逐渐浮出迷雾的真实未来

在过去的数年里,深度学习做到了传统算法所无法企及的进度,催生了大量的工业界应用,但其实,现在的深度学习还是很傻——举个例子,大部分人都可以通过几十个小时的学习学会开小汽车,而完全自动的L5级无人汽车至今还是个遥远的梦。

图灵奖得主Geoffrey Hinton就一直非常渴望找到一种新的实现深度网络的方法,认为目前(最广泛的反向传播算法)根本不是大脑的工作机制。

另一位图灵奖得主Yann Lecun,就认为在某些游戏中,需要大量增加模型训练时间才能达到或超过专业人类玩家的水平。

通过儿童的学习模式,发现当前最优秀的AI也比不上5岁小孩的智力,或许我们可以回答“下一代AI应该是什么样”,这个神经网络最重要的未解难题之一。

至少要有两重升级:

1.有意识。目前公认文字表达能力最高、模型最为庞大的GPT-3也曾被专家吐槽是“无脑作业”,其实并不真正理解自己写出的句子。而具有自主探索、决策、推理能力的AI,可以理解自己周围的环境,才是真正的人工智能。

2.能效比。为什么即使存在缺陷,依然没有妨碍深度学习带领AI进来发展热潮呢?核心原因就在于深度神经网络大幅度降低了全社会处理、挖掘、应用大数据的成本。相对人脑而言,现有的计算硬件功耗都很高,不断提升AI性价比,是避免再次陷入寒冬的唯一方法,也在呼唤更高级的算法。

这两个基本难题,只能交给科学家和工程师们在针尖上做大文章了。对于我们普通人来说,保有一颗如儿童般对世界的好奇心,触碰充满各种信息的大自然,由此得来的系统认知与思维能力,或许才是机器永远无法企及,且弥足珍贵的。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK