1

48小时烧脑角逐,吃住赛场,国内首个大模型极限挑战赛落幕

 4 weeks ago
source link: https://www.qbitai.com/2024/04/137247.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

48小时烧脑角逐,吃住赛场,国内首个大模型极限挑战赛落幕

量子位的朋友们量子位的朋友们 2024-04-23 18:03:41 来源:量子位

围绕“科技助老”命题

4月21日晚,第四届ATEC科技精英赛(ATEC2023)线下赛落幕。本届赛事以大模型为技术基座,围绕“科技助老”命题,是国内首个基于真实场景的大模型全链路应用竞赛。ATEC2023线下赛采用48小时极限挑战的形式,来自东南大学、哈尔滨工业大学、华中科技大学的4名选手夺冠并捧走100万元奖金。赛事赛题的全程解读及代码展示,将在国内首档程序员科技节目《燃烧吧!天才程序员4》中播出。

48小时烧脑角逐,吃住赛场,国内首个大模型极限挑战赛落幕

本届ATEC科技精英赛(ATEC2023)由中国电子学会主办,ATEC前沿科技探索社区承办,清华大学等17所高校参与,清华大学与蚂蚁集团共同命题。

经过三个月层层海选,从1901支报名队伍3000余位选手中脱颖而出的16位选手,在48小时内,依托大模型技术,在支付宝智能助手等真实业务场景中,极限破解老年人异地就医所遇到的一系列现实问题。

“大模型+贴近工业真实”,这两大亮点让本届赛事报名人数及985、211高校占比都创下历史新高。本次竞赛的核心挑战,是解决工业真实场景中,大模型训练过程及落地应用亟需解决的三个核心问题:可用性、安全性、高效能。

赛题出题人之一、蚂蚁集团基础智能部技术总监张志强告诉记者,赛题围绕这三个核心问题来出题,考验选手们的破解思路和能力,比如让模型学会检索文档并总结文档内容做出精确回答、让模型学会收集用户需求并调用工具解决实际问题;在模型推理阶段,掌握好模型效果和推理速度的平衡,以让模型能为生产之用;在追求模型效果和迭代效率的同时,也追求模型线上推理速度,以让计算成本可控。

值得一提的是,这届赛事以大模型为技术基座,以贴近工业真实的业务场景做命题,折射了以蚂蚁为代表的国内互联网企业加速发展AI及AI落地应用的趋势。譬如,本届赛事命题中涉及的蚂蚁大模型医疗场景,今年年初在权威全球医疗评测榜单PubMedQA中,就以最小的模型参数,取得了准确度位居第五的成绩,排在GPT-4之前。

“选手们面临的都是来自真实应用的挑战,在大模型了转向大规模落地应用的当下,ATEC是技术青年们很好的练兵场。”ATEC2023评审委员会主席、西安交通大学教授沈超教授强调,“给代码赋予意义、让技术造福社会,关注科技助老等价值命题,是大赛组委会的初心。

版权所有,未经授权不得以任何形式转载及使用,违者必究。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK