4

在社会实验里 AI设计出优于人类设计的财富再分配系统

 1 year ago
source link: http://jandan.net/p/110939
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

第一次用冷冻干燥保存的体细胞克隆出小鼠有更多狗的社区,暴力犯罪率更低

majer @ 2022.07.06 , 11:06

32

在社会实验里 AI设计出优于人类设计的财富再分配系统

新研究表明,人工智能(AI)可以设计出优于人类设计的财富分配方案。

由英国AI Company DeepMind的一组研究人员提出的研究结果表明,机器学习系统不仅擅长解决复杂的物理和生物学问题,而且还可以帮助实现更多的开放式社会目标,例如实现一个公平,繁荣的社会的目标。

当然,这不是一件容易的事。如果可以在人工智能研究中建立“价值一致”性,无疑能带来有价值的结果。

在第一作者和DeepMind Researchs科学家Raphael Koster领导的论文中,研究者解释说:“价值一致性的一个关键障碍是,人类社会承认了多种观点,这使得AI无所适从。例如,政治科学家和经济学家就经常提出相互矛盾的理论。”

为了弥合现实里的矛盾,研究人员开发了负责财富分配的AI,其培训数据中内置了人们的互动(实际和虚拟)信息。指导AI朝着人类总体上更公平的结果前进。

AIS可以产生令人惊叹的结果,甚至也可以得出距离现在还很遥远的社会学论断。人类反馈可以帮助将神经网络朝着更好的方向发展。

“在AI研究中,人们越来越认识到,要建立与人类兼容的系统,我们需要新的研究方法,其中AI和人类互动,并越来越多地从人类那里学习价值观来建立价值一致的系统。”

在涉及成千上万参与者的实验中,该团队的AI代理(称为“民主AI”)研究了一种名为“公共物品游戏”的投资练习,玩家可以收到不同数量的钱,并可以向公共基金捐款,然后从与其投资水平相对应的基金中获取回报。

在一系列不同的游戏中,财富通过三个传统的再分配范式重新分配给玩家——严格的平等主义者,自由主义者和自由主义平等主义者——每种奖励的收益都不同。

还测试了第四种方法——深度强化学习开发的人类中心重新分布机制(HCRM),使用人类参与者的反馈数据和旨在模仿人类行为的反馈数据。

随后进行的实验表明,HCRM系统比任何传统的再分配标准都更受玩家欢迎,并且比人类裁判设计的新重新分配系统更受欢迎。

研究人员解释说:“AI发现了一种机制,该机制纠正了最初的财富失衡,并成功赢得了多数票。我们表明,有可能利用价值一致性,以实现更广泛的人类社会中使用的共识来选举代表,决定公共政策或做出法律判断。

值得注意的是,研究人员承认他们的系统提出了许多问题——主要是,AI中的价值一致性围绕民主决定,这意味着代理人实际上可能会加剧社会上的不平等或偏见。

还有信任的问题。在实验中,玩家不知道财富重分配模型的来源。他们知道后,是否还会支持AI?目前还不清楚。

最后,该小组表示,其研究不应被解读为一项激进的技术官僚提案,以推翻社会实际上的财富重分配制度的研究——但它是一种研究工具,可以帮助人类设计更好的方案。

作者写道:“我们的结果并不意味着支持'AI政府'的形式。我们认为民主AI是设计潜在有益机制的研究方法,而不是在公共领域部署AI的秘诀。”

这些发现在《自然·人类行为》中报道。

https://www.sciencealert.com/ai-could-be-be-better-at-distributing-wealth-experiment-suggests

赞一个 (7)


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK