55

这是人类高手输给AI的第一场辩论赛

 5 years ago
source link: http://www.10tiao.com/html/751/201806/2691341009/3.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

点击上方“腾讯科技”,选择“置顶公众号”

关键时刻,第一时间送达


来源 / 量子位(ID:QbitAI)

文 / 郭一璞&岳排槐

欢迎下载腾讯新闻客户端,关注科技页卡,查看更多科技热点新闻


人类再一次被自己创造的AI击败了。


在旧金山的一间精心装潢的IBM会议室里,一块竖着的黑色电子面板正在台上侃侃而谈。


它大约有1米8高,一人宽,长着蓝色的动画嘴巴,看起来就像一块造型特异的广告屏幕。


它发出流利的女声,声音中充满自信。虽然说话有些磕磕绊绊,但它所讲的内容却不无道理,仿佛是一位学识丰富但口舌结巴的教授。


而它的身边则是再正常不过的人类辩论手,用自己人类的思考和语言表达、配合肢体动作来阐述观点。


正在进行的是一场AI与人类的辩论赛。


这块黑色面板背后的“灵魂”是IBM的人工智能Project Debater,IBM的研究员们正在台下紧张得注视着自己的作品。



人机辩论大战


这天的比赛分为两场,Project Debater分别对阵两位人类辩手。比赛的规则是1v1,人机双方各有4分钟的陈述时间和4分钟的驳论时间,以及最后2分钟的总结时间。


随后,将根据在场观众的立场是否改变而判断输赢。


第一场的题目是“我们是否应当资助太空探索”,Project Debater为正方,而反方则是2016年以色列全国辩论冠军Noa Ovadia。



Project Debater认为,太空探索对人类有益,能够促进科学研究,并且激励年轻人的的自我思考与自我超越。


Noa Ovadia则认为,政府经费应当被合理利用,除了探索太空之外,还有太多领域需要政府提供资金支持,并且,不需要飞上太空,地面上的科学研究同样十分重要。


而Project Debater听完之后则作出了反驳,它认为太空探索带来的潜在技术和经济利益超过其他政府支出。



第二场议题则是“我们是否应当更多地使用远程医疗”,Project Debater依然是正方,另一位以色列辩论专家Dan Zafrir为反方。


Project Debater在语言表达方面显然输给了旁边的真人,但它传递的信息量则高出了人类。在两场辩论中,观众们都投票表示同意这一点。


至于辩论的结果,从观众的投票中可以看出,相比人类,人工智能辩手Project Debater提供了更多有利的证据,更具说服力。可以说,这是人类输给AI的第一场辩论赛。



尽管赢得了辩论赛,但Project Debater的语言表达能力的确是个硬伤。


比如,在第一场辩论“我们是否应当资助太空探索”中,Project Debater提出了重要的论点:探索太空有利于经济发展。


但是,在表达过程中,它却啰啰嗦嗦,用不同的语句把这个观点重复了许多次,仿佛一个AI版的唐僧。


另外,Project Debater说出的许多话其实都是有语病的,经常会出现一句话的前后两部分不搭调的情况。


除此之外,在抖机灵和引用资料的时候,Project Debater也过于刻意了。


比如,在太空探索话题的辩论中,它引用著名宇航员斯科特·凯利的发言时,Project Debater说了一句“配音”,之后,它竟然开始播放视频中斯科特·凯利讲话的录音——这恐怕不是什么正经辩手。


现场直击


那么和人工智能辩论,实际是一种怎样的体验?


说一千道一万,不如直接感受一下。下面是我们截取的现场视频,只有30秒时间,先是AI结语,然后人类开始发言。


人机辩论30秒


从这段视频来看,Project Debater的声音,还是常见的合成声,有明显的,嗯……机器人口音。听久了可能有种催眠的感觉。


而人类选手一开口,立刻就能感到不同。


人类选手Noa Ovadia的音调更加的抑扬顿挫,而且她还有着机器无法比拟的优势:有表情、有动作,能传递更丰富的信息。


尽管如此,AI还是拿下一局,不是么?


会辩论的AI有什么用


虽然“舌头”不灵活,不过好在Project Debater在辩论中表达的信息量大呀,这对查资料困难症来说的确是福音了。


这有赖于IBM让Project Debater具备了数据驱动的写作能力、语音表达能力、以及听取语音并提炼要点、确定反驳论点的能力。


Project Debater具有非常强大的数据处理能力,能够处理几十个主题相关的数百万篇新闻,然后将文章中的要点片段提取出来,重新组合润色成为流畅的文章。处理海量数据可能不是最难的,但对于计算机来说,这种水平的资料查询整理及写作能力已经是难能可贵的了。


Project Debater的这种能力扩展了IBM超级计算机Watson的功能,IBM正在用它来挖掘庞大的内部数据集——比如帮助医生诊断不同类型的癌症。



其实,除了处理数据和打辩论赛,IBM的这项研究最初是为了制造出更为复杂的虚拟助理——毕竟,当你在使用目前的语音助理Siri、Alexa或是小爱同学的时候,总觉得它们前言不搭后语,且无法完成什么复杂的思考和任务。


语音助理可能暂时还没有面世,但Project Debater的“思考判断”能力却能够为人类社会所用。


比如,当人类在进行企业决策或反恐分析时,往往会存在多个选择,比如是否应该开展某项新业务、某个人是否构成安全威胁等。


而决策团队成员在开会讨论时,由于受到利益、情绪、立场和思维方式的影响,经常会出现一些互相矛盾的观点,这就很容易争个没完没了,甚至吵得不可开交。


Project Debater就不一样了,它可以不受感情因素和情绪的困扰,“理性”的听取所有成员的对话,将所有证据和论据都考虑进去来进行判断。


并且,如果人类的分析逻辑出现问题,Project Debater会diss你呦。



外界评论


谈到这次的人机辩论,不少报道都用了“令人印象深刻”、“里程碑”、“令人不安”甚至“毛骨悚然”等形容词。


连Project Debater的人类对手都表示“震惊”。


每当这样的时刻,总有人特别关心人类的终极命运。当然和之前一样,也有人指责这又是一次IBM的过度营销。


Reddit用户TaupeRanger言辞激烈的表示:如果Project Debater真能做到IBM所说的事情,那是史无前例的进步。但IBM历史上常见毫无价值的技术哗众取宠,这次也不例外。


的确,曾经IBM也有过很多令人印象深刻的技术展示。


比如当年深蓝击败国际象棋大师卡斯帕罗夫,沃森在《Jeopardy!》问答节目中,击败人类高手等等。当然也确实有一些夸大的时候。


去年5月,风险投资公司Social Capital创始人、首席执行官Chamath Palihapitiya在CNBC节目《Closing Bell》中直言IBM在人工智能上毫无优势:“我就说白了吧,沃森就是个笑话”。



其实也不仅仅是IBM。


DeepMind也是一个非常善于宣传造势的公司。只不过,DeepMind的AlphaGo确实取得了实打实的惊人成就。


前不久,Google展示了一个能打预订电话的人工智能:Google Duplex。而且新任Alphabet董事长,宣称这个AI已经在特定领域,通过了图灵测试。显然,这也引发了一波外界的质疑。


PlaceIQ高级副总裁Drew Breunig认同辩论AI是一个有意义且值得重视的想法,但他担心Project Debater展示过程中的误导和不公正。


还有用户说:我就想知道,IBM团队花了多久时间,才说服他们自己,给这个AI起了一个普通的名字~


总会有质疑,路漫漫且修远。


正如IBM所说:辩论,只是一个开始。


问答Project Debater


1、目标是什么?


Project Debater是由IBM Research开发的一项AI技术,旨在通过公正的辩论来扩展人们的思维。 IBM研究人员正在通过教授计算机来探索人工智能的界限,以创造引人入胜且信息更加丰富的观点。


这个项目的目标是建立一个系统,帮助人们在答案不是非黑即白时,作出基于证据的决定。 Project Debater从2012年开始研发,是深蓝和沃森之后,IBM在AI领域的下一个里程碑。


2、和AI助手有什么区别?


AI助手在一些任务上已经非常在行。而Project Debater希望通过AI技术形成长篇讨论,并就各种没有正确或错误答案的主题,提供公正的论点。


3、为什么教机器辩论?


从文化上讲,辩论的起源不是冲突和竞争,而是民主和讨论。辩论丰富了决策制定的过程,帮助人们权衡新想法、新理念的利弊。辩论是文明社会的核心。我们辩论不只是为了获得他人的认同,也是为了理解和学习彼此的观点。未来,我们相信机器可以帮助人类更好的做决定。



4、Project Debater如何学会一个话题?


实际上,它没有学会某一话题,但是能够可用数据,快速创建一个有说服力的论述。这个系统被训练用来讨论不熟悉的话题,只要语料库中有大量的相关内容。


5、它的论点是怎么形成的?


对于给定的主题,这个AI系统会搜索大量的知识,寻找最相关的观点和证据,然后在其中选择最吸引人、最多样化、支持度最高的论点,然后把这些构建成一个完整的观点加以叙述。



About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK