4

“百模大战”即将迎来一轮应用淘汰赛

 9 months ago
source link: https://www.woshipm.com/ai/5879660.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

“百模大战”即将迎来一轮应用淘汰赛

2023-08-04
0 评论 2431 浏览 0 收藏 19 分钟
释放双眼,带上耳机,听听看~!
00:00
00:00

随着大语言模型的走红,各个企业都在研发相关产品。如今,“百模”大战,恐怕要迎来第一个“淘汰赛”阶段。具体如何?我们一起来看看本文分析。

e8b2456a-df4a-11ed-9dfa-00163e0b5ff3.jpg

这年头,不做大模型就不好意思说自己是科技公司。

这不,“百模”大战打了几个月之后,又有新玩家入场了,京东、携程都加入了大模型“战场”。

相比京东、携程发发布大模型布,这两天的大模型发生了一个更重量级的事情:Meta发布新一代AI模型LLama V2,并宣布LLama V2开源,并可直接商用。

傅盛发朋友圈评论:“这一下不知道多少公司笑醒在深夜,多少公司哭晕在厕所……”

“百模大战”即将迎来一轮应用淘汰赛

据传,LLama V2性能超过了GPT-4、Microsoft和Google的AI模型,能够生成语言、代码和图像。最重要的,相比GPT4,LLama V2开源,并且可以直接商用。

消息一出,不少人都在感慨:一夜之间大模型变天了。

要说大模型行业变天,恐怕还有点早,但LLama V2开源可商用、再加上国内这么多大模型落地,“百模”大战,恐怕要迎来第一个“淘汰赛”阶段。

一、“百模”大战之后,大模型迈进应用驱动阶段

大模型赛道,做通用模型的都是大公司。

Open AI背后站在微软,文心一言背后是百度,通义千问背后是阿里,混元大模型背后是腾讯……再加上商汤、讯飞等“本土”玩家,留给后来者的舞台其实并不大。

而这个不大的舞台,如今却显得有些拥挤。此前一份国产大模型列显示,目前国内的大模型已经有近百家。

“百模大战”即将迎来一轮应用淘汰赛

这么多大模型落地,说明AI大模型可能即将进入产品驱动阶段。

互联网江湖认为,大模型的发展会经过三个阶段。

第一阶段,模型数据、数据为核心的技术驱动阶段。

从ChatGPT 到GPT3阶段,大模型是由技术驱动,这时候关键是算法,和数据训练。

GTP3之后,差距就在于数据量,这不难理解,这好比是一个有着超强学习能力的孩子,在咿呀学语之前,进步不大,一旦掌握了世界的“数据语言”,那么大模型的进展是飞速的。

而做通用大模型的玩家,需要尽快度过这个阶段,并建立自己的核心优势。

目前来看,百度文心、腾讯混元、阿里通义千问、商汤大模型、以及讯飞火星等,国产主要大模型都走到这一阶段。

这些大模型,都是大公司做出来的,能走到这个阶段的大模型,要么算法更先进,要么有足够的数据参数和训练量。

以百度为例,5月份上线的文心大模型3.5,能力已经超出ChatGPT 3.5,虽然官方没有公布具体的数据量级,但大量的数据、算法优化训练是必经之路。

这个阶段,拼的其实就是硬实力,拼的是数据生态,人才技术和资金投入,创业公司很难真的从底层做起来。

第二阶段,是产品驱动阶段。

当国产大模型不断涌现,“百模”大战的格局上演之后,行业其实就已经走到了产品驱动阶段。

产品驱动阶段,“百模”大战会经历一轮淘汰赛。

大模型从业者普遍认为,400 亿-500亿参数量级是模型能力“质变”的门槛。 换言之,对于资本市场来说,百亿参数量级之前,一些大模型项目很可能会首先遇到“生存问题”。也就是说,对于一些后来者、在遇到生存问题之前,必须要有足够应用落地。

也因此,产品阶段的大模型,核心在落地场景。

大模型其实没有什么路线之争,垂直或者通用,与其说是路线之争,倒不如说是落地的场景之争。

我们认为产品驱动阶段,大模型落地的重点在于,大公司底层做起,打造行业大模型基础设施,在此之上,垂类的创业公司去做应用端的垂直创新。

其实现在已经有企业走在这条道路上了,比如商汤SenseChat大模型,在不少领域已经开始与品牌合作落地。

“表面上看通用大模型和垂直大模型代表了两种技术方向,但实际上两者相辅相成,可以并行发展。更强的通用大模型具备更强大的学习能力,可以快速融合不同行业领域的知识,支持垂直大模型的训练和开发。”商汤科技相关人士表示。

在大模型领域,商汤扎根很深。

4月份,商汤“日日新SenseNova”大模型体系公布,并迅速落地。在自动驾驶行业,商汤构建了业内首个感知决策一体化的端到端自动驾驶解决方案UniAD,,使车道线的预测准确率提升了30%,预测运动位移的误差降低了近40%,规划误差降低了近30%。

天眼查APP显示,商汤科技2021年在香港上市,彼时上市募资55亿港元。

“百模大战”即将迎来一轮应用淘汰赛

科大讯飞落地也很快。此前科大讯飞曾表示,随着星火认知大模型的不断迭代,其诊后康复管理平台将逐步实现对所有病种、病程的精细化管理等能力。科大讯飞的大模型最大的特点是更C端,有自己的产品矩阵,接入大模型之后,更容易触达C端用户。

大模型领域,最先产生商业价值不一定是通用的ChatGPT4,反而更可能产生在应用端走得更快的领域。

实际上,在科技进步的浪潮中,并不是所有的价值都会被先发的企业拿走,技术商业化的价值,往往会被更成熟的企业拿走的更多。

就像微信不是最先出现的社交应用,但无疑是最成功的。

第三个阶段,是用户驱动阶段。

有了场景之后,最重要的是能够获得用户的认可。从过去AI技术的落地来看,由ToB到ToC,是大模型落地的最终路径。所以,首先为大模型买单的一定是B端。

不过,从底层商业逻辑上,谁是最终的“受益者”,也就会是最终的“买单者”,说到底,大模型应用的最终结果还是要服务用户。长期来看,也最终会走到用户驱动的阶段。

只不过,与现在大家所熟知的移动应用不同,“大模型应用”的用户驱动会更快更直接,因此,有大量C端用户的公司(百度、阿里、腾讯)的进展速度可能会超出想象。

二、大模型应用爆发的黎明,商业化拐点已至?

虽然大模型很火,但真正躬身下沉的玩家都是大公司,投资市场的交易数量与去年淡季没有什么变化。

很明显,市场有顾虑。

比如,现在下场了,将来如何退出?大模型毕竟是个需要长期投入的项目,募资难,想要退出也难。再比如,比较有潜力的大模型项目其实都在大公司手里,这不是说创业公司没有机会,但市场还是在观察。

“大模型的终局会是什么呢?我认为对于大模型来说,终局会集中在少量的几个大模型”。百度集团副总裁吴甜表示。

吴甜认为,大模型产业生态可类比芯片代工厂,把大数据、大算力、大算法都封装,建设自动化、数字化、标准化的生产模式。

一方面,从底层做起来的大模型,成本非常高,需要多年积累。另一方面,应用层面,几个少量大模型,就会有非常广泛的应用生态。换句话来说,其实并不需要那么多大模型来做重复的应用。

大模型领域,可能也会有一个新的“二八定律”:两成的大模型玩家掌握真正的底层核心技术,而八成的大模型企业都在各个领域创新,去做大模型的应用。

可以预见的是,Meta的LLama V2大模型开源、放开商业化之后,大模型应用端的创新会迎来一个高潮,而国内大模型产品集中爆发,应用端也会迎来许多的新变化。

过去的十年,以用户关系为中心,互联网完成了内容消费、服务消费、商品消费的中心化。

大家看视频到抖音、快手、B站,买东西到淘宝京东拼多多,本地生活到饿了么美团。于是,搜索广告之后,短视频、本地生活、电商,成了互联网技术创造价值的主要方式。

而大模型,正在用新技术和新交互,重新改变价值的创造方式。

这种改变分为几个方面:

一、过去的互联网是分发内容,而大模型则是在分发的过程中创造内容;

你向大模型发出一个提问,AI不是事先给出答案,而是在实时生成答案,这样的信息交互方式,本身是分发,也是在创造。

如果应用到广告领域,就可以通过大模型实时生成广告,广告内容、呈现方式触达用户更精准,不再是所谓的“精准投放”而是真正意义上的“一对一”的制作、传播广告。

在过去,一千读者心中有一千个哈姆雷特,而在未来,一千个用户面前同时展示的,则是一千个不同定制的品牌广告。用户更能接收到品牌关键信息,广告的转化率也就更高。

在广告领域,已经有相关的尝试,百度基于大模型推出“擎舵”、腾讯推出“混元”,阿里妈妈的AIGB出价模型,都是这个方向上的应用尝试。

进一步来看,这种“黑镜”式的信息分发、创造,可能会改变整个互联网的内容生产逻辑。

二、大模型的交互设计,有新的商业化机会;

大模型的应用,浅层的是强调功能性,深层的是改变成本结构。

一个基本的判断是,大模型商业化应用首先会改变的一定是广告、营销行业,因为广告行业对用户获取信息的方式变化更敏感。

因此,在营销、内容创造等行业,一些新的商业机会可能会被发现。

几乎可以确定的是,在初期的应用阶段,商业化的机会一定与交互有关。

比如,Copy.AI和Jasper这两个营销创意工具,以GPT-3作为底层接口实现了持续的规模化变现。他们提供了交互界面和插件、API接口,让大模型能更好的去服务某个领域的客户。

当然,这只是解决最基本的功能性问题,大模型真正的价值在于改变垂直行业的成本结构,比如自动驾驶大模型的商业化价值,就是在于改变了人们的出行成本结构。

营销只是一个方面,商业化方面,其实还是得看具体细分领域的应用。

对于不同的领域,大模型会不断的被垂直细分,去满足更小、更细微的场景应用。而这些更细微,更小的场景,可能会有率先商业化的机会。

比如,文本生成,比如图片生成。能够先让编剧、漫画家的工作变得更容易?能不能把文案从做PPT的日常循环中给解放出来,这些细小的场景,能够率先变现。

大公司,和创业公司,在应用层差别可能不是很大,应用层是创业机会最多的大模型领域,未来行业内也可能会跑出几家专注于大模型应用的公司。

互联网江湖认为,新技术应用,找到专有价值链要素,嵌入行业,是一个必经之路。因此在应用上,找场景的公司,比练算法、堆参数的公司更有机会。

大模型的成功有阶段性质变,就像是GPT3到GPT4,但接下来这种变化会越来越不明显。也就是说,数据训练的边际收益会降低,

大模型能力的进阶需要数据量做支撑,而商业化则需要考虑成本问题,如何解决这个问题,颇为关键。

商业化拐点已至,大模型的商业化短期看B端,长期机会可能还是在C端。

大模型,有点像前几年火的ToB,不仅是要看自身的成熟度,也得看行业端的适配。

大模型的成本很高,商业化首先就要到合适的场景中,并且能够真正赚到钱,只有真正在AI应用场景中挣到钱,并且能够真正与行业适配,大模型才有商业化的竞争力。

能够承载大模型商业化的,只有降本需求更迫切的B端。

事实也的确如此,以商汤为例,在金融领域,商汤与银行、保险、券商等客户展开合作,利用数字人进行智能客服、智慧营销等工作,并通过接入大语言模型能力,提供投研分析、研报撰写等新功能,试图帮助银行金融机构降本增效。

在医疗领域,商汤中文医疗语言大模型“大医”,也能够提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力。

进一步来看,B端之外,未来的大模型也可能会承载更多的商品和服务分发。

移动生态中,触达用户的方式其实就是网页、APP、小程序,那么未来的大模型生态中,如果用大模型来分发内容,那么流量的分发会更加去中心化。

实际上,一旦语言大模型成熟,并且有了足够多的用户习惯,那么,承载商品与服务分发的APP、小程序,可能就会被大模型取代。

也就是说,在ToB应用的阶段之后,未来大模型长期的价值和商业化机会,更多其实还是在C端。

只不过,以当下的视角来看,很难去定义AI应用的“新场景”,这就像是当你身处90年代,你不可能预测到如今的微信、抖音崛起。

如今的大模型也同样如此。

从公元元年到18世纪,人类经济增长曲线几乎是平的,也只有在近三百年才出现工业革命,近几十年才有了信息技术。

人类历史上第一台计算ENIAC最初诞生,并不是用于个人计算,而是用于大量军用数据的计算,但数十年后,它却彻底改变了人们的生活方式。

如今的大模型,就如同当年的ENIAC。

当泡沫散去,大模型究竟是不是“比互联网更伟大”的机会?或许人们心中早已有了答案。

专栏作家

刘志刚,微信公众号:互联网江湖(ID:VIPIT1)。人人都是产品经理专栏作家。资深媒体人,TMT领域深度报道。

本文原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议。

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK