

揭秘首个AI数学大赛:为防止人类替考,AI“先交代”再交卷
source link: https://www.jiemodui.com/N/138100.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

揭秘首个AI数学大赛:为防止人类替考,AI“先交代”再交卷
作者:昆布 发布时间: 2024-04-15 17:08

图源:Pixabay
北京时间4月15日上午8点,2024阿里巴巴全球数学竞赛预选赛正式交卷,58个国家与地区的选手在线鏖战48小时,更有来自全球知名高校院所与企业的563支队伍使用AI作答,其中00后占比超50%。
阿里巴巴全球数学竞赛组委会介绍,当前,AI已经在不少领域展现超越人类的能力,但在“人类智慧的皇冠”数学领域还颇为受限。因此,从2024年起,阿里巴巴全球数学竞赛决定向AI开放,鼓励探索AI的潜力上限,推动AI在数学领域的研究和应用创新。
在这场48小时的预选赛中,AI和人类选手共用一套试卷,题目包括选择题、解答题与证明题。为了保证公平,防止“人类替考”,组委会制定了“赛前固定方案、赛中诚实答题、赛后复现总结”的三步走规则。因此,在正式开考之前,AI参赛团队就需要完成模型的训练或微调,并锁定做题版本;如使用提示词工程,也需要提前提交相应方案。
AI挑战赛吸引了全球563支队伍踊跃报名,主要来自全球知名高校院所与企业,包括北大、清华、牛津、中国科学院、AWS、字节跳动等,大多具有AI专业背景,也有部分来自数学、物理等专业。
统计显示,参赛队伍中,00后占比超50%,年轻一代正在成为AI生力军。他们有的在开源大模型的基础上进行专项微调,让AI从初等数学进阶到高等数学;他们有的构建起AI Agent,结合提示词工程来调用GPT-4等闭源模型,使得GPT-4的数学解题能力有大幅提升。
西南交通大学应用物理系的大四学生向劲宇是一名AI开发者,也是MetaGPT-MC小组贡献者之一,这次他和多位开发者组队参赛,使用GPT-4与Claude 3组成Multi-Agent的方案,让AI分饰多个角色、相互验证来完成答题步骤,改善了AI“一本正经的胡说八道”的通病,提升了AI做题的准确性。在AWS从事AI研究的毛帽,是数学专业的博士,已连续三年参赛,今年转换身份,从人类选手转为AI的竞赛辅导员,与同事组成一支“豪华团队”,集合了数学、统计、地球物理及机器学习背景的4名博士,希望能向人类选手们秀一把AI的实力。
据介绍,本次AI挑战赛结果将于6月与人类选手成绩同期公布,AI前三名分别获得奖金10000美元、5000美元、2000美元。不少选手表示,他们更期待的是,AI的成绩能否达到人类优秀选手水平,能否达到决赛资格线?在往年的阿里巴巴全球数学竞赛中,只有1%的预选赛选手能够晋级决赛。
由阿里巴巴公益、达摩院共同举办的阿里巴巴全球数学竞赛,截至目前共举办6届。今年,这项赛事紧扣AI与数学融合的技术趋势,首次向AI开放,不限选手是碳基还是硅基。

2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。
来源: 芥末堆
Recommend
-
80
-
29
OpenAI 曾在 2017 年战胜 Dota2 世界顶级玩家 Dendi,本月初战胜了由职业选手和解说员组成的半职业战队,这一系列出彩的表现提升了人们对人工智能再次夺冠的期望。8 月 22 日在温哥华举行的 TI8 上,OpenAI 联合创始人兼 CTO 格雷格·布罗...
-
3
更新于 2021/07/17 | 创建于 2021/07/17 HRSAce2受体以防止 SARS-CoV-2 (COVID-19) 病毒攻击人类细胞 Sars-cov-2是导致covid...
-
5
← 奥密克戎变种在世卫通报之前便已于欧洲开始传播majer @ 2021.12.03 , 18:54
-
4
国内首个AI安全大赛圆满收官,预演风险竞逐“智”高点
-
13
有一个摄影比赛听起来很不正经的样子,却是全球知名、意义非凡,每年吸引数百万人围观,它就是搞笑野生动物摄影大赛。 今年这届比赛进入了尾声——决赛的入围名单已公布,能从数千个参赛作品中脱颖而出,以下这些动物们的精彩表现,绝对能为你再增添几分愉悦。
-
3
百度百家号举办首个AI创作大赛,内容创作进入人机共创时代-品玩 业界动态 百度百家号举办首个AI创作大赛,内容创作进入人机共创时代
-
5
张益唐喊你参加阿里数学大赛:奖金400多万,今年还有文科开放题
-
3
「数学菜鸡」ChatGPT很懂人类喜好!在线生成随机数,竟是宇宙终极答案 作者:新智元 2023-03-24 13:07:00 ChatGPT在生成随机数字方面,也是玩明白了人类的套路。
-
5
2023-05-04 11:50 中国鞋服行业首个 AIGC 准专业级设计大赛将于 5 月开幕 巴比特讯,温州多家科研机构、科技公司和社会组织已于 4 月共同发起温州 AIGC 产业联盟,并与温州市服装商会共同发起“首届温州鞋服产业 AIG...
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK