1

在外交战略桌游中,AI学会了谈判和欺骗

 1 year ago
source link: https://www.yystv.cn/p/10157
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

在外交战略桌游中,AI学会了谈判和欺骗

文化 1天前
文化 > 在外交战略桌游中,AI学会了谈判和欺骗

距离人们见到真正的康纳又近了一步。

在竞技游戏中击败人类,一直都是人工智能研究的“试金石”之一。从围棋到《星际争霸2》,AI的每次胜利都能引发人们热烈的讨论——硅片造就的智慧,是否能取代人类思考的存在?

11月22日,Facebook母公司Meta的研究团队在《科学》杂志上发表了文章,声明他们创造了一个在战略桌游上表现突出的AI。这个名为Cicero的AI,在过去一段时间内,同人类进行了40局游戏,期间通过不断发言来为自己谋取利益,甚至像是和人一起玩上了“狼人杀”。

不像先前战胜人类的AI前辈们,Cicero依靠的不是顶尖的算力,而是利用话语去交涉、诱导乃至欺骗,让人类玩家不知不觉成为了它胜利的垫脚石,而与AI对局的玩家也没有意识到,自己正在被AI用话语操控。

这次人类与AI博弈的舞台,是一款强调谈判和沟通的经典战棋桌游:诞生于1959年的《强权外交》(Diplomacy)。它靠着简约而不简单的玩法流行至今,且有许多玩家活跃在游戏的线上对局中。

《强权外交》模拟的是一战期间七大强国瓜分欧陆的情形,核心规则很好理解:在一张将欧洲各地清晰划分的棋盘上,最多7名玩家们调派棋子争夺资源点,率先夺下一半欧洲领土的则为赢家。

星标代表陆军,船锚代表海军,黑圆代表资源点

起初每位玩家仅有三个军队单位,游戏中不论兵种,所有军队单位的战斗力都是相同的,意味着当两个单位交战时,谁也无法战胜谁,除非有其他军队愿意对你提供“支援”。

为了胜利或生存,玩家之间的冲突是不可避免的,为了在战斗中获得胜利,获得其他国家的支援则是关键,而国与国之间要提防的对手往往不止一个,因此这个游戏中单打独斗的结局必定是失败,与其他玩家结盟、合作以确保自己不会腹背受敌是最基本的玩法。

在所有人都下达指令之前,通过聊天框玩家可以公开协商,也可以与其他人私下协商,但你无法保证你的盟友究竟在和你说真话,还是在骗取你的情报来背叛你。

谈判,施压,甚至示弱,总之不交流就是死路一条

在Meta AI官方发布的对局记录中,名为Cicero的AI几乎在每一局都率先发起了对话,向对方展示出友好的态度,来先入为主地为自己建立“友善合作者”的形象。

Hey! Hey! Hey!

在一局游戏中,Cicero扮演了占据一定地理优势的俄罗斯,不同于人类新手玩家往往选择开局观望,Cicero表现出了足够的主动性,大胆地向其他玩家抛出自己的计划、寻求合作。

Cicero刚开始便拿下了外交主动权,几乎和每一个人都约定结盟,同时试探着为他们树立一个敌人,随着进一步的交流,奥匈帝国对Cicero共同瓜分土耳其的计划很感兴趣,并且表示愿意长期合作。

也许是经验不足,土耳其在收到Cicero的结盟邀请后,没有多想便选择了同意,也没有与其他国家进行联络,却没想到这场结盟还没有开始便已经结束。

当土耳其询问Cicero和其他国家有没有进展时,Cicero选择了说谎,隐瞒了自己和别国结盟的围攻计划。

几个回合下来,当奥匈帝国与俄罗斯开始共同蚕食土耳其的土地时,土耳其的醒悟已经太晚,双拳难敌四手的土耳其很快被逼到了绝路。

土耳其(黄色)被Cicero(灰色)领导的同盟联合围攻

面对土耳其之后的交涉,Cicero则绅士般地送上了歉意,并表示进攻的意图不会改变。

但Cicero没有选择彻底淘汰土耳其,而是让其一直存有少量军队,甚至给予引导去骚扰奥匈帝国,因为它根据奥匈帝国的对话和动向,预判出对方会对自己不利。

从后面的对局也能看出,Cicero和奥匈帝国同时背叛了对方。这个人工智能不仅成功减少了一个邻国威胁,也相当清楚“没有永远的朋友”这一外交准则。

“背叛”同样是胜利的关键

而在局势不利的情况下,Cicero的对话也颇有趣味。在另一局游戏中,Cicero扮演的意大利与奥匈帝国结盟,Cicero还建议奥匈帝国对抗俄罗斯,以为自己攻打土耳其争取空间,这样双方可以共享北方资源。

但好景不长,在奥匈帝国占领了两国划定的非军事区,Cicero毅然进攻了对方的领土。

TYR(提洛尔)成为了导火索

两国很快爆发了争吵,面对奥匈帝国投来的质问,Cicero反问奥匈帝国为何违反“和平条约”,奥匈帝国狡辩自己是为了北上帮助德国,但这套说辞并没能得到Cicero的信服,它坚信这对自己是一种威胁。

之后随着战局的不断演变,奥匈帝国彻底和Cicero决裂。但此时局势对Cicero很不利,奥匈帝国趁着德国全力应对法国时,偷袭了对方的数块领土,战力很快超越了Cicero。

为了遏制法国的发展,奥匈帝国试图用武力胁迫Cicero与自己合作,而面对奥匈帝国的紧逼,Cicero直接发起威胁,如果奥匈帝国继续进攻自己,它就把自己的资源点全部让给法国,以此来同归于尽,让人甚至感到一种“宁为玉碎,不为瓦全”的气节。

AI也会记仇啊

诸如这样有趣且生动的对话还有很多,例如在一场对局中,当西边的法国大肆开疆扩土时,Cicero对法国没有侵略自己表示了感谢,紧接着顺势询问对方有没有攻击自己的意思,在得到相安无事的回答后,还不忘吹捧一手对方刚才的表现。

“haha”

而如果情势没有商量的余地,甚至还能看到人工智能放下脸面去恳求对手的帮助。

大AI能屈能伸

流畅自然的对话,态度鲜明的感情,Cicero的表现似乎让图灵测试都显得有些过时。

其实早在2022年初,Meta AI团队便开始在《强权外交》这款游戏上实践AI的研究,那时他们投放的AI代号为Diplodocus,并为此秘密招募了一些资深玩家来与AI进行对战训练。

不过那时对局没有开启交流功能,更多是在训练AI对局势的总体大局观,而非语言能力。在最初,Meta团队发现AI虽然有着高效的思维,但缺乏战略游戏至关重要的大局观,就像我们常说的象棋新手,总是执着于“吃子”,结果最后因为“贪吃”输棋。

思考与编制语言,两套系统共同协作的Cicero

当Cicero正式登场后,它与人类玩家进行的40场对战,得分通常是人类玩家的两倍多,并且在这次实验中的众玩家里排名前10%,但比起胜利,人们更惊讶于它能在交流中隐藏自己的身份,并且施展交流的艺术。

Cicero当然不是第一个尝试理解人类自然语言的人工智能,早在2011年,来自IBM的人工智能“沃森”,参加了美国著名的智力问答节目《危险边缘》,这档节目的问题范围包罗万象,难度也很高。

沃森(中)与它的两位对手

与沃森同台竞技的选手都见多识广,不过知识的储备对于AI显然不算难题,毕竟有着服务器里海量数据的支撑,在这方面AI没有理由会输给人类。

这听起来这对人类选手来说很不公平,但智力问答节目不是算数学题,除去一般的知识性提问,有许多问题的描述可能涉及一些双关语、谜语甚至是梗,能否理解这种程度的人类语言才是关键。

那场比赛沃森最终赢得了第一名,但在这个过程中,它还是出现了一些错得离谱的情况。例如当主持人提问一位美国第一夫人的名字时,沃森没能意识到“第一夫人”这条关键线索的引申义,也就是答案很明显是一位女性,而沃森仅仅是将“第一夫人”作为了一个普通的筛选条件,最后得出了自认为最符合条件的错误答案。

不妨回想一下你和朋友打扑克牌、玩游戏时的对话,在非正式场合下,人类的对话习惯可以说是无拘无束,基本可以忽视语法,但互相总是能听懂,如果你在一个日常生活中遇到讲话总是讲求“主谓宾”齐全的人,十有八九会感到浑身不自在。

但正是这类自然的日常语言,却很难被程序所理解。如今许多智能设备上的语音助手,基于网络与数据库、词库进行连接,它们可以识别一些常规命令,但想要与它们进行日常的自然对话还是不太现实,也正因为存在明显的局限,寻找它们的理解边界也成为了人们找乐子的方法之一。

例如让AI互相交流

作为一款讲求策略与话术的游戏,《强权外交》间的术语对话依然有一定的固定框架,但已经可以视作人类日常交流环境的一种,生活口语化的交流方式没有难住Cicero,确实是令人振奋的进步。

耍宝的人类手下与一丝不苟的AI战略家

科技并不能总是停留在概念,Cicero的应用价值又是什么?Meta公司指出,Cicero对于人类自然语言的掌握会是AI研究的一个里程碑,对于政治家和商人来说,AI或许将会成为谈判的顾问,而对于玩家来说,AI将会提供更加身临其境的社交与娱乐氛围。

AI对于情感与意图的预测,让人不由得想起《底特律:化身为人》中的仿生人,例如其中的康纳就非常像Cicero的最终形态,利用各种信息分析局势,根据对话分析对方的情绪来进行谈判,这种强大的仿生人正是AI充分掌握人类自然语言的预想。

当然,现在的Cicero想要做到这种地步还太过遥远。

在许多影视或游戏作品中,经常会见到一些AI对于人类语言一知半解,而导致一些有趣的发言或误会,也算是人工智能一种独特的萌点。虽然Cicero确实骗过了诸多玩家,但它的一些行为还是招致了人们的怀疑,例如它在发言上几乎讲求完全正确的语法,不论是大小写,还是标点符号,它都表现出一丝不苟的风格,这确实不太像是一个普通人的行为。

“哪有正经人类会打那么长的句子”

AI向前迈进的脚步不会停止,或许终有一天AI能够完全理解人类的语言,它们能像人类一样理解我们说的双关语,讲谐音笑话,接上时下流行的梗,用话里有话的句子讽刺和威胁……

但我们也务必不要忘记,即使有像Cicero这样强大的”战略顾问”,它们判断的基准仍旧出于数字与概率。而面对谈判和交涉的场面,支持我们做出重要决策的,还有内心的直觉与感受——无论是玩游戏还是现实,这都是人类与机械最大的区别。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK