1

腾讯开悟平台迈向全面开放,为AI训练提供“王者”赛场-品玩

 1 year ago
source link: https://www.pingwest.com/a/273558
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

腾讯开悟平台迈向全面开放,为AI训练提供“王者”赛场-品玩业界动态

腾讯开悟平台迈向全面开放,为AI训练提供“王者”赛场

article-body

11月21日,腾讯“开悟”平台宣布正式开放“王者荣耀AI开放研究环境”申请,迈出全面开放的第一步。面向非商业用途的机器学习算法研究,“开悟”平台将提供业界独有的高复杂度MOBA训练环境,助力相关学术领域的前沿探索。

最新开放申请的“王者荣耀AI开放研究环境”,包含了王者荣耀1v1对战环境与baseline算法模型,当前支持20位英雄的镜像对战任务以及非镜像类对战任务,尤其适合研究竞争性强化学习中的泛化性与通用性问题。

现在,研究者只需在腾讯开悟平台官网注册账号、提交资料并通过平台审核,即可免费下载王者荣耀1v1测试环境gamecore,在本地进行AI相关研究测试。

article-body

据了解,“王者荣耀AI开放研究环境”项目发布以来受到广泛关注,今年9月以264星登上Github 月度热榜,同时,相关论文已被AI领域的顶级国际学术会议 NeurIPS 2022接收。

随着王者荣耀游戏在持续运营中成长迭代,“开悟”平台也将逐步探索并开放更多适用于AI研究的游戏测试环境,为AI业界面临的“缺乏高挑战测试环境”难题提供全新解决方案。

高复杂度、高挑战性的智能体训练环境

在王者荣耀对战中,双方玩家互为竞争关系,需要收集资源的同时干扰对方,以达到赢得游戏的目的。作为一个具备多英雄、多玩法的复杂对抗游戏,王者荣耀的状态、动作空间复杂度比围棋等游戏高很多,是学术届研究复杂控制类问题的优质环境。

2019年,腾讯AI Lab首次发布决策智能AI“王者绝悟”的研究论文,介绍在王者荣耀1v1环境中研究用深度强化学习来为智能体预测游戏动作的方法,该论文被AAAI 2020接收,之后“王者绝悟”陆续攻克5v5挑战及全英雄池,在学术领域取得多项成就同时,也为王者荣耀玩家带来了“挑战绝悟”等创新玩法。

同年,王者荣耀及腾讯AI Lab联手打造“开悟”AI开放研究平台,打造游戏AI产学研新生态。如今“开悟”正式开放王者荣耀1v1环境,并对环境进行了易用性封装,提供标准代码与训练框架,让个人用户在资源允许的情况下可以轻松上手分布式训练。

本次最新开放申请的“王者荣耀AI开放研究环境”在只考虑双方英雄选择条件下,支持400种对战子任务,如果算上召唤师技能,将会有40000种子任务,这对模型的泛化性有很大挑战,所以尤其适合研究竞争性强化学习中的泛化性与通用性问题。

进一步看,研究模型对不同任务的泛化性,对降低AI在不同领域的应用成本至关重要。例如,面对测试环境中的多个任务,如何在有限的资源和时间条件下获得最好的效果,这其中的研究方法论和成果就可以迁移到其他领域,比如机器人不同部位的控制等。

“开悟”AI开放研究平台:助力产学研共享AI新生态

“开悟”是腾讯牵头构建的AI多智能体与复杂决策开放研究平台,依托腾讯AI Lab和“王者荣耀”在算法、算力、实验场景方面的核心优势,为学术研究人员和算法开发者开放的国内领先、国际一流研究与应用探索平台。

目前,“开悟”也正在持续助力AI学界人才培养。2019年至今,“开悟”AI 开放研究平台已成功主办两届“开悟多智能体强化学习大赛”、承办了成都大运会“世界大学生数智竞技邀请赛”AI赛道,“以赛促研”为国内外青年研究人才提供测试及提升AI在复杂游戏场景下应用水平的机会。

2021年起,“开悟”先后与北大、清华、中科大等19所国内头部高校教师团队联合发起创新课程合作项目,已于多所高校陆续落地多智能体强化学习实践课程,帮助学生通过更有趣的方式掌握机器学习、强化学习、多智能体决策等关键知识点。

基于“开悟”平台,腾讯将与学界、业界携手,共同利用游戏环境不断提升AI能力,并寻找 AI 技术解决更多问题的可能性,在机器人、医疗、工业、交通等领域发挥更大作用。

附:论文地址

article-body

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK