2024-03-28 01:38

AI长文本之战：Kimi快跑，大厂围剿

文章来源：智能涌现

文｜周鑫雨

编辑｜苏建勋

图片来源：由无界AI生成

一条名为“Kimi”的鲶鱼，将大模型公司卷到了长文本的新战场。

这款来自AI独角兽月之暗面的大模型对话产品，最大的标签就在于“长”。上下文窗口的大小，代表着一个模型的记忆力。窗口越长，模型单次可处理的文本就越长。对用户而言，模型能读懂的文字越多，在学习、工作等场景下就越有用。

深谙营销之道的月之暗面，是国内乃至全球范围内，第一家将“长文本”作为标签的大模型公司。2023年10月30日，打着“全球首个支持输入20万汉字”名号的Kimi Chat就快速在一堆卷榜单、卷参数的模型中，拥有了辨识度。

Kimi有多火？国信证券的调研显示，从2023年10月到2024年3月，Kimi的DAU从10万攀升到了300多万，翻了30倍。自春节起大规模投放广告后，SimilarWeb数据显示，Kimi的访问量在2月增长了107.6%，仅次于百度的文心一言和阿里的通义千问。3月21日，无法承接过多用户的Kimi App和小程序一度宕机，用户需要排队才能正常使用。

Kimi的爆火，还直接牵动了股市——一些与月之暗面有合作传闻的上市公司，被冠以“Kimi概念股”之名，股价飙升。后续纷纷出来辟谣的海天瑞声、中广天择，已经先吃上了Kimi的红利，在3月20日应声涨停。这段时间，沪深互动平台最多的问题是“公司是否与Kimi助手有合作”，又或是“公司有接入Kimi吗”。

△网上流传的“Kimi概念股”名单

在2024年3月24日的一场用户活动上，月之暗面的几位产品负责人直言：“我们不敢说太多，还是希望大家关注产品本身。”

而一场对Kimi的长文本围剿战，也已经在大厂中打响。3月23日，360 AI 浏览器宣布内测500万字长文本处理功能。百度的文心一言也被曝将在4月开放长文本功能，长度在200万-500万。阿里的通义千问则一口气免费开放了1000万字的长文档处理功能，坐上了“全球第一长”的宝座。

可炮制的技术，被验证的需求

Kimi带起的长文本之火，无外乎两个原因：技术门槛不高，市场需求已经被月之暗面初步验证。

2023年10月9日，Kimi带着“全球首个支持输入20万汉字”的标签走进大众视野。彼时，这一上下文窗口长度达到了Claude-100K（约8万字）的2.5倍，GPT-4-32K（约2.5万字）的8倍。

不过，多名从业者对36氪表示，长文本处理的技术壁垒并不高。长文本建模的方案，主要有外部召回（借助外部工具处理长文本或者利用外部记忆存储上下文向量）、模型优化、注意力计算优化三种，而每一种都有公开的研究论文和技术方案。

很快，Kimi“20万字”的记录就被他人打破。2023年10月30日，Kimi首发仅过了21天，王小川的百川智能就推出了上下文窗口达192K的大模型Baichuan2-192K，单次能处理35万个汉字。11月，王座再次易位，李开复成立的零一万物，又发布了能够处理约40万字的大模型Yi-34B，是Kimi的约2倍。

长文本带来的模型竞速，最根本的原因，还是在于看到了庞大的消费群体。

“C端用户对大模型的需求无外乎两种，一是提效工具，二是娱乐工具。”一名AI从业者告诉36氪。他认为，目前AI对短文本的理解和生成能力，还没完全超过人类，比如看咨询、写短文案，“人用在修改AI生成的文案的时间，其实不比自己从头想来的少。”

但大模型相较于人的竞争力，恰恰在于理解长文本的效率。“10万字的论文，一般人读完起码要30小时，还是在不休息的情况下，但大模型只要几分钟。”一名法律行业AI产品经理向36氪提及，问答机器人、模拟法庭等AI产品在专业度高、实践性强的法律行业都跑不通，唯一能跑通的只有对判决文书等长文本的总结，而“Kimi是目前律师等法律专业用户认可度最高的一款AI产品”，不少律师用Kimi来总结资料，输出法律文书。

Kimi的火爆，是苦于C端变现途径的大厂所垂涎的。在大模型落地的打法上，体系庞大的大厂们，采用的基本是模型+云服务、AI功能+原有产品的保守打法。在B端，这样的打法初见成效。百度在2023年的财报中，强调了大模型对云等B端业务的推动。

但大模型对App、搜索等C端产品营收的助推，依然是个谜。百度财报显示，2023年12月，百度App的月活达6.67亿，同比增长了3%——然而，这个数字与9月的6.63亿基本持平，不及6月的6.77亿。

而Kimi证明了，不采用和其他产品的“打包”模型，大模型本身也有拉新造血的潜力。通过月之暗面这个对手，大厂们完成了对长文本的市场验证。

Kimi的难题是商业模式，大厂的难题是获客

但要让长文本真正造血，厂商们担心的仍然是高昂的成本。

日前，Kimi的获客成本就引发了讨论。据新浪科技获得的数据，算上广告投放和算力成本，Kimi每个用户的获客成本达12-13元，按照近一个月17804的日均下载量计算，Kimi每日的获客成本高达20万元。

△Kimi在B站投放的广告

每日20万元的获客成本，加之随着参数规模水涨船高的大模型研发费用，对尚未商业化造血的月之暗面而言，烧钱的局面依然要维持一段时间。

初创公司的另一难题，则在于如何运营如此庞大的用户群体，并提供稳定的服务。2024年3月21日下午，由于用户数超出负荷，Kimi的App和小程序一度无法正常使用，用户需要排队等待。

但月之暗面的困境，对于作为后来者的大厂们而言并非难题。亿欧智库2022年3月的数据显示，中国互联网企业的平均获客成本在380-580元之间。

可以说，Kimi人均不到20元的获客成本，对于大厂而言，反倒是用更低的获客成本，找到了新的流量入口。

而在服务质量上，算力资源、人力资源充足的大厂，更容易输出稳定的服务。而在技术上，一名AI从业者告诉36氪，将可以处理1000万字的通义千问后和Kimi比较，可以发现同等文本的解读，通义千问的总结完成度略高一筹。甚至于，360的长文本功能，增加了摘要和思维导图的能力。

但后来者的劣势，也恰恰在于失去了先发优势和辨识度。

当面向庞大的C端用户，亮眼的营销手段显得格外重要。被当成过河搭石的Kimi，胜在有一个别出心裁的亮相，早早就贴上了“长文本”的标签，在一众大模型模糊的面孔中打出了差异化。至少提到“长文本”，用户脑海中最先跳出的，大概率是月之暗面的Kimi。

而大厂的包袱，还在于要为用户提供更完整、更复杂的产品体系。不少体验过各家大模型产品的用户都告诉36氪，大厂模型产品的UI设计、插件生态很复杂，功能过多，导致用户的需求要经过多步操作解决。但Kimi的界面很简洁，对于用户而言，使用门槛反而降低了。

△Kimi首页

Kimi的爆火已经为商业化创造了时机。月之暗面表示，有用户反映是否可以用付费解决等待的问题，今年公司会有初步的商业化方案。

只是找到合适的商业模式，证明自身的造血能力，是月之暗面接下来面临的考题。面对异军突起长文本之战，当Kimi在用户前构筑了一道付费墙，能否贴牢“长文本第一家”的标签，还未可知。

AI长文本之战：Kimi快跑，大厂围剿

AI长文本之战：Kimi快跑，大厂围剿

可炮制的技术，被验证的需求

Kimi的难题是商业模式，大厂的难题是获客

Recommend

中国设计师品牌COMME MOI似我在天津万象城开设门店。

The Steve Eddins Interview: 30 years of MathWorking

Why do (or don't) languages forbid unreachable code?

Christian Louboutin路铂廷在宁波阪急开设精品店，为宁波首店。（时间：4月1日）

JDK 22: An average Java release, sort of

人工智能：试用了GFPGAN修复老照片，人脸修复的挺清晰，但是一点也不像啊

英国沙龙香氛品牌Penhaligon’s潘海利根在深圳万象天地开设“肖像兽首系列”华南独展空间...

东方甄选出事了，俞敏洪将商家告上法庭

近日，JAC与巴西UBER（优步）正式建立战略合作伙伴关系，为巴西全国的UBER司机提供E-J...

国内大佬破解 ChatGPT 4.0 Plus，国内无限攻略！

About Joyk