在外交战略桌游中，AI学会了谈判和欺骗

文化 1天前

文化 > 在外交战略桌游中，AI学会了谈判和欺骗

距离人们见到真正的康纳又近了一步。

在竞技游戏中击败人类，一直都是人工智能研究的“试金石”之一。从围棋到《星际争霸2》，AI的每次胜利都能引发人们热烈的讨论——硅片造就的智慧，是否能取代人类思考的存在？

11月22日，Facebook母公司Meta的研究团队在《科学》杂志上发表了文章，声明他们创造了一个在战略桌游上表现突出的AI。这个名为Cicero的AI，在过去一段时间内，同人类进行了40局游戏，期间通过不断发言来为自己谋取利益，甚至像是和人一起玩上了“狼人杀”。

不像先前战胜人类的AI前辈们，Cicero依靠的不是顶尖的算力，而是利用话语去交涉、诱导乃至欺骗，让人类玩家不知不觉成为了它胜利的垫脚石，而与AI对局的玩家也没有意识到，自己正在被AI用话语操控。

这次人类与AI博弈的舞台，是一款强调谈判和沟通的经典战棋桌游：诞生于1959年的《强权外交》（Diplomacy）。它靠着简约而不简单的玩法流行至今，且有许多玩家活跃在游戏的线上对局中。

《强权外交》模拟的是一战期间七大强国瓜分欧陆的情形，核心规则很好理解：在一张将欧洲各地清晰划分的棋盘上，最多7名玩家们调派棋子争夺资源点，率先夺下一半欧洲领土的则为赢家。

星标代表陆军，船锚代表海军，黑圆代表资源点

起初每位玩家仅有三个军队单位，游戏中不论兵种，所有军队单位的战斗力都是相同的，意味着当两个单位交战时，谁也无法战胜谁，除非有其他军队愿意对你提供“支援”。

为了胜利或生存，玩家之间的冲突是不可避免的，为了在战斗中获得胜利，获得其他国家的支援则是关键，而国与国之间要提防的对手往往不止一个，因此这个游戏中单打独斗的结局必定是失败，与其他玩家结盟、合作以确保自己不会腹背受敌是最基本的玩法。

在所有人都下达指令之前，通过聊天框玩家可以公开协商，也可以与其他人私下协商，但你无法保证你的盟友究竟在和你说真话，还是在骗取你的情报来背叛你。

谈判，施压，甚至示弱，总之不交流就是死路一条

在Meta AI官方发布的对局记录中，名为Cicero的AI几乎在每一局都率先发起了对话，向对方展示出友好的态度，来先入为主地为自己建立“友善合作者”的形象。

Hey! Hey! Hey!

在一局游戏中，Cicero扮演了占据一定地理优势的俄罗斯，不同于人类新手玩家往往选择开局观望，Cicero表现出了足够的主动性，大胆地向其他玩家抛出自己的计划、寻求合作。

Cicero刚开始便拿下了外交主动权，几乎和每一个人都约定结盟，同时试探着为他们树立一个敌人，随着进一步的交流，奥匈帝国对Cicero共同瓜分土耳其的计划很感兴趣，并且表示愿意长期合作。

也许是经验不足，土耳其在收到Cicero的结盟邀请后，没有多想便选择了同意，也没有与其他国家进行联络，却没想到这场结盟还没有开始便已经结束。

当土耳其询问Cicero和其他国家有没有进展时，Cicero选择了说谎，隐瞒了自己和别国结盟的围攻计划。

几个回合下来，当奥匈帝国与俄罗斯开始共同蚕食土耳其的土地时，土耳其的醒悟已经太晚，双拳难敌四手的土耳其很快被逼到了绝路。

土耳其（黄色）被Cicero（灰色）领导的同盟联合围攻

面对土耳其之后的交涉，Cicero则绅士般地送上了歉意，并表示进攻的意图不会改变。

但Cicero没有选择彻底淘汰土耳其，而是让其一直存有少量军队，甚至给予引导去骚扰奥匈帝国，因为它根据奥匈帝国的对话和动向，预判出对方会对自己不利。

从后面的对局也能看出，Cicero和奥匈帝国同时背叛了对方。这个人工智能不仅成功减少了一个邻国威胁，也相当清楚“没有永远的朋友”这一外交准则。

“背叛”同样是胜利的关键

而在局势不利的情况下，Cicero的对话也颇有趣味。在另一局游戏中，Cicero扮演的意大利与奥匈帝国结盟，Cicero还建议奥匈帝国对抗俄罗斯，以为自己攻打土耳其争取空间，这样双方可以共享北方资源。

但好景不长，在奥匈帝国占领了两国划定的非军事区，Cicero毅然进攻了对方的领土。

TYR（提洛尔）成为了导火索

两国很快爆发了争吵，面对奥匈帝国投来的质问，Cicero反问奥匈帝国为何违反“和平条约”，奥匈帝国狡辩自己是为了北上帮助德国，但这套说辞并没能得到Cicero的信服，它坚信这对自己是一种威胁。

之后随着战局的不断演变，奥匈帝国彻底和Cicero决裂。但此时局势对Cicero很不利，奥匈帝国趁着德国全力应对法国时，偷袭了对方的数块领土，战力很快超越了Cicero。

为了遏制法国的发展，奥匈帝国试图用武力胁迫Cicero与自己合作，而面对奥匈帝国的紧逼，Cicero直接发起威胁，如果奥匈帝国继续进攻自己，它就把自己的资源点全部让给法国，以此来同归于尽，让人甚至感到一种“宁为玉碎，不为瓦全”的气节。

AI也会记仇啊

诸如这样有趣且生动的对话还有很多，例如在一场对局中，当西边的法国大肆开疆扩土时，Cicero对法国没有侵略自己表示了感谢，紧接着顺势询问对方有没有攻击自己的意思，在得到相安无事的回答后，还不忘吹捧一手对方刚才的表现。

“haha”

而如果情势没有商量的余地，甚至还能看到人工智能放下脸面去恳求对手的帮助。

大AI能屈能伸

流畅自然的对话，态度鲜明的感情，Cicero的表现似乎让图灵测试都显得有些过时。

其实早在2022年初，Meta AI团队便开始在《强权外交》这款游戏上实践AI的研究，那时他们投放的AI代号为Diplodocus，并为此秘密招募了一些资深玩家来与AI进行对战训练。

不过那时对局没有开启交流功能，更多是在训练AI对局势的总体大局观，而非语言能力。在最初，Meta团队发现AI虽然有着高效的思维，但缺乏战略游戏至关重要的大局观，就像我们常说的象棋新手，总是执着于“吃子”，结果最后因为“贪吃”输棋。

思考与编制语言，两套系统共同协作的Cicero

当Cicero正式登场后，它与人类玩家进行的40场对战，得分通常是人类玩家的两倍多，并且在这次实验中的众玩家里排名前10%，但比起胜利，人们更惊讶于它能在交流中隐藏自己的身份，并且施展交流的艺术。

Cicero当然不是第一个尝试理解人类自然语言的人工智能，早在2011年，来自IBM的人工智能“沃森”，参加了美国著名的智力问答节目《危险边缘》，这档节目的问题范围包罗万象，难度也很高。

沃森（中）与它的两位对手

与沃森同台竞技的选手都见多识广，不过知识的储备对于AI显然不算难题，毕竟有着服务器里海量数据的支撑，在这方面AI没有理由会输给人类。

这听起来这对人类选手来说很不公平，但智力问答节目不是算数学题，除去一般的知识性提问，有许多问题的描述可能涉及一些双关语、谜语甚至是梗，能否理解这种程度的人类语言才是关键。

那场比赛沃森最终赢得了第一名，但在这个过程中，它还是出现了一些错得离谱的情况。例如当主持人提问一位美国第一夫人的名字时，沃森没能意识到“第一夫人”这条关键线索的引申义，也就是答案很明显是一位女性，而沃森仅仅是将“第一夫人”作为了一个普通的筛选条件，最后得出了自认为最符合条件的错误答案。

不妨回想一下你和朋友打扑克牌、玩游戏时的对话，在非正式场合下，人类的对话习惯可以说是无拘无束，基本可以忽视语法，但互相总是能听懂，如果你在一个日常生活中遇到讲话总是讲求“主谓宾”齐全的人，十有八九会感到浑身不自在。

但正是这类自然的日常语言，却很难被程序所理解。如今许多智能设备上的语音助手，基于网络与数据库、词库进行连接，它们可以识别一些常规命令，但想要与它们进行日常的自然对话还是不太现实，也正因为存在明显的局限，寻找它们的理解边界也成为了人们找乐子的方法之一。

例如让AI互相交流

作为一款讲求策略与话术的游戏，《强权外交》间的术语对话依然有一定的固定框架，但已经可以视作人类日常交流环境的一种，生活口语化的交流方式没有难住Cicero，确实是令人振奋的进步。

耍宝的人类手下与一丝不苟的AI战略家

科技并不能总是停留在概念，Cicero的应用价值又是什么？Meta公司指出，Cicero对于人类自然语言的掌握会是AI研究的一个里程碑，对于政治家和商人来说，AI或许将会成为谈判的顾问，而对于玩家来说，AI将会提供更加身临其境的社交与娱乐氛围。

AI对于情感与意图的预测，让人不由得想起《底特律：化身为人》中的仿生人，例如其中的康纳就非常像Cicero的最终形态，利用各种信息分析局势，根据对话分析对方的情绪来进行谈判，这种强大的仿生人正是AI充分掌握人类自然语言的预想。

当然，现在的Cicero想要做到这种地步还太过遥远。

在许多影视或游戏作品中，经常会见到一些AI对于人类语言一知半解，而导致一些有趣的发言或误会，也算是人工智能一种独特的萌点。虽然Cicero确实骗过了诸多玩家，但它的一些行为还是招致了人们的怀疑，例如它在发言上几乎讲求完全正确的语法，不论是大小写，还是标点符号，它都表现出一丝不苟的风格，这确实不太像是一个普通人的行为。

“哪有正经人类会打那么长的句子”

AI向前迈进的脚步不会停止，或许终有一天AI能够完全理解人类的语言，它们能像人类一样理解我们说的双关语，讲谐音笑话，接上时下流行的梗，用话里有话的句子讽刺和威胁……

但我们也务必不要忘记，即使有像Cicero这样强大的”战略顾问”，它们判断的基准仍旧出于数字与概率。而面对谈判和交涉的场面，支持我们做出重要决策的，还有内心的直觉与感受——无论是玩游戏还是现实，这都是人类与机械最大的区别。

在外交战略桌游中，AI学会了谈判和欺骗

在外交战略桌游中，AI学会了谈判和欺骗

Recommend

马克龙向哈里斯推荐宇航员，美媒：他想让首位登月欧洲人是法国人

DoorDash lays off 1,250 employees

架构解析：Dubbo3 应用级服务发现如何应对双11百万集群实例 - ApacheDubbo

Google Play因抽成30%在美国遭集体诉讼，谷歌：无法证明对用户造成损失

数据埋点设计实践案例解析

CrowdStrike shares drop on weaker-than-expected growth in new revenue

特斯拉的订阅付费，车企们学不会

React native lists implemented with a stretchy header image

This Week in JBoss - December, 1st 2022

Pop-Up Farming Pods to Help Colonizers Grow Crops on Mars

About Joyk