2

AI长文本之战:Kimi快跑,大厂围剿

 1 month ago
source link: https://www.aixinzhijie.com/article/6845262
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
2024-03-28 01:38

AI长文本之战:Kimi快跑,大厂围剿

文章来源:智能涌现

文|周鑫雨

编辑|苏建勋

图片来源:由无界AI生成
图片来源:由无界AI生成

一条名为“Kimi”的鲶鱼,将大模型公司卷到了长文本的新战场。

这款来自AI独角兽月之暗面的大模型对话产品,最大的标签就在于“长”。上下文窗口的大小,代表着一个模型的记忆力。窗口越长,模型单次可处理的文本就越长。对用户而言,模型能读懂的文字越多,在学习、工作等场景下就越有用。

深谙营销之道的月之暗面,是国内乃至全球范围内,第一家将“长文本”作为标签的大模型公司。2023年10月30日,打着“全球首个支持输入20万汉字”名号的Kimi Chat就快速在一堆卷榜单、卷参数的模型中,拥有了辨识度。

Kimi有多火?国信证券的调研显示,从2023年10月到2024年3月,Kimi的DAU从10万攀升到了300多万,翻了30倍。自春节起大规模投放广告后,SimilarWeb数据显示,Kimi的访问量在2月增长了107.6%,仅次于百度的文心一言和阿里的通义千问。3月21日,无法承接过多用户的Kimi App和小程序一度宕机,用户需要排队才能正常使用。

Kimi的爆火,还直接牵动了股市——一些与月之暗面有合作传闻的上市公司,被冠以“Kimi概念股”之名,股价飙升。后续纷纷出来辟谣的海天瑞声、中广天择,已经先吃上了Kimi的红利,在3月20日应声涨停。这段时间,沪深互动平台最多的问题是“公司是否与Kimi助手有合作”,又或是“公司有接入Kimi吗”。

Fjsm7UamQGDaSyBgG_xYPjhhZZSq

△网上流传的“Kimi概念股”名单

在2024年3月24日的一场用户活动上,月之暗面的几位产品负责人直言:“我们不敢说太多,还是希望大家关注产品本身。”

而一场对Kimi的长文本围剿战,也已经在大厂中打响。3月23日,360 AI 浏览器宣布内测500万字长文本处理功能。百度的文心一言也被曝将在4月开放长文本功能,长度在200万-500万。阿里的通义千问则一口气免费开放了1000万字的长文档处理功能,坐上了“全球第一长”的宝座。

可炮制的技术,被验证的需求

Kimi带起的长文本之火,无外乎两个原因:技术门槛不高,市场需求已经被月之暗面初步验证。

2023年10月9日,Kimi带着“全球首个支持输入20万汉字”的标签走进大众视野。彼时,这一上下文窗口长度达到了Claude-100K(约8万字)的2.5倍,GPT-4-32K(约2.5万字)的8倍。

不过,多名从业者对36氪表示,长文本处理的技术壁垒并不高。长文本建模的方案,主要有外部召回(借助外部工具处理长文本或者利用外部记忆存储上下文向量)、模型优化、注意力计算优化三种,而每一种都有公开的研究论文和技术方案。

很快,Kimi“20万字”的记录就被他人打破。2023年10月30日,Kimi首发仅过了21天,王小川的百川智能就推出了上下文窗口达192K的大模型Baichuan2-192K,单次能处理35万个汉字。11月,王座再次易位,李开复成立的零一万物,又发布了能够处理约40万字的大模型Yi-34B,是Kimi的约2倍。

长文本带来的模型竞速,最根本的原因,还是在于看到了庞大的消费群体。

“C端用户对大模型的需求无外乎两种,一是提效工具,二是娱乐工具。”一名AI从业者告诉36氪。他认为,目前AI对短文本的理解和生成能力,还没完全超过人类,比如看咨询、写短文案,“人用在修改AI生成的文案的时间,其实不比自己从头想来的少。”

但大模型相较于人的竞争力,恰恰在于理解长文本的效率。“10万字的论文,一般人读完起码要30小时,还是在不休息的情况下,但大模型只要几分钟。”一名法律行业AI产品经理向36氪提及,问答机器人、模拟法庭等AI产品在专业度高、实践性强的法律行业都跑不通,唯一能跑通的只有对判决文书等长文本的总结,而“Kimi是目前律师等法律专业用户认可度最高的一款AI产品”,不少律师用Kimi来总结资料,输出法律文书。

Kimi的火爆,是苦于C端变现途径的大厂所垂涎的。在大模型落地的打法上,体系庞大的大厂们,采用的基本是模型+云服务、AI功能+原有产品的保守打法。在B端,这样的打法初见成效。百度在2023年的财报中,强调了大模型对云等B端业务的推动。

但大模型对App、搜索等C端产品营收的助推,依然是个谜。百度财报显示,2023年12月,百度App的月活达6.67亿,同比增长了3%——然而,这个数字与9月的6.63亿基本持平,不及6月的6.77亿。

而Kimi证明了,不采用和其他产品的“打包”模型,大模型本身也有拉新造血的潜力。通过月之暗面这个对手,大厂们完成了对长文本的市场验证。

Kimi的难题是商业模式,大厂的难题是获客

但要让长文本真正造血,厂商们担心的仍然是高昂的成本。

日前,Kimi的获客成本就引发了讨论。据新浪科技获得的数据,算上广告投放和算力成本,Kimi每个用户的获客成本达12-13元,按照近一个月17804的日均下载量计算,Kimi每日的获客成本高达20万元。

Ftz1HnDfxYrXDQ3cwBmgCdD-fu0M

△Kimi在B站投放的广告

每日20万元的获客成本,加之随着参数规模水涨船高的大模型研发费用,对尚未商业化造血的月之暗面而言,烧钱的局面依然要维持一段时间。

初创公司的另一难题,则在于如何运营如此庞大的用户群体,并提供稳定的服务。2024年3月21日下午,由于用户数超出负荷,Kimi的App和小程序一度无法正常使用,用户需要排队等待。

但月之暗面的困境,对于作为后来者的大厂们而言并非难题。亿欧智库2022年3月的数据显示,中国互联网企业的平均获客成本在380-580元之间。

可以说,Kimi人均不到20元的获客成本,对于大厂而言,反倒是用更低的获客成本,找到了新的流量入口。

而在服务质量上,算力资源、人力资源充足的大厂,更容易输出稳定的服务。而在技术上,一名AI从业者告诉36氪,将可以处理1000万字的通义千问后和Kimi比较,可以发现同等文本的解读,通义千问的总结完成度略高一筹。甚至于,360的长文本功能,增加了摘要和思维导图的能力。

但后来者的劣势,也恰恰在于失去了先发优势和辨识度。

当面向庞大的C端用户,亮眼的营销手段显得格外重要。被当成过河搭石的Kimi,胜在有一个别出心裁的亮相,早早就贴上了“长文本”的标签,在一众大模型模糊的面孔中打出了差异化。至少提到“长文本”,用户脑海中最先跳出的,大概率是月之暗面的Kimi。

而大厂的包袱,还在于要为用户提供更完整、更复杂的产品体系。不少体验过各家大模型产品的用户都告诉36氪,大厂模型产品的UI设计、插件生态很复杂,功能过多,导致用户的需求要经过多步操作解决。但Kimi的界面很简洁,对于用户而言,使用门槛反而降低了。

FuYtJUANzR3-0JwIHJo2188cKo5o

△Kimi首页

Kimi的爆火已经为商业化创造了时机。月之暗面表示,有用户反映是否可以用付费解决等待的问题,今年公司会有初步的商业化方案。

只是找到合适的商业模式,证明自身的造血能力,是月之暗面接下来面临的考题。面对异军突起长文本之战,当Kimi在用户前构筑了一道付费墙,能否贴牢“长文本第一家”的标签,还未可知。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK