4

对话联想创投宋春雨:相信万亿参数、多模态是通往 AGI 的最佳路径

 3 weeks ago
source link: https://www.geekpark.net/news/334065
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

对话联想创投宋春雨:相信万亿参数、多模态是通往 AGI 的最佳路径

2024/04/22
3e9950598a01f799e1786f04bdb6e925.png

「这个世界不愁钱,缺的是最好的创业者和最好的创业公司」

一年多来,宋春雨频繁跟他见到的创业者说,「你们这些做人工智能的专家(包括工业界、学术界),如果这个时代不去做 AGI,就是枉费人生!」

这位在联想创投专门负责看 AI 的合伙人,旗帜鲜明地称自己是「技术信仰派」,跟朱啸虎这样的「现实派」不是一类人:比如,他坚信基础大模型才是战略制高点,未来超级应用 95% 的能力都来模型本身;他坚信开源模型追不上闭源模型,用单一集群万卡训出来的万亿参数多模态大模型才是通往 AGI 的最佳路径;他并不太在意「商业化赚钱」,认为 AI 公司的首要目标应该是跟上 AGI 的技术创新。

这种观点在当下的投资人里并不常见。大模型是难以算过账的商业模式,前期资金消耗无止尽,但模型效果、领先性并不确定,且其商业化路径还不明朗、成本收回遥遥无期。对于身处资本紧缩环境的投资机构来说,它们很难支持这么昂贵、不确定的生意。宋春雨也承认这一点,他说多数人要算 revenue(营收),自己是绝对的「少数派」。

然而,一个矛盾不由得浮现:既然信仰基础大模型,为什么不出手?

在大模型火热的这一年多时间,宋春雨没有投任何一个基础大模型公司,而是投了一些垂直模型、开源社区、上层应用,以及算力芯片公司。对此,他的解释是,需要时间看清楚,哪家大模型团队更有通向 AGI 的实力。「如果看清楚了,我们肯定会毫不犹豫地出手。」

那时间点会是什么时候?他说,2024 年中国大模型竞争会迎来分水岭,这会是出手的时机。这时昂贵的估值是否能接受?他说,没有给钱的「上限」,回报也暂不考虑,「你只能相信它,星辰大海」。

作为投科技十余年、身处中国最老牌科技公司的技术向投资人,宋春雨累计投资超过 50 家 AI 相关企业,包括寒武纪、第四范式、深城交、旷视等头部公司。他说,自己对技术的相信一直是非共识。

2011 年他天使轮投资旷视时,AI 还是冷门赛道,四年后 AlphaGo 才点燃风口;2017 年投寒武纪时,AI 芯片的前景尚不明朗;而 2020 年到 2022 年,中国 AI 迎来「至暗时刻」——资本不断质疑「AI 四小龙」做 ToB 难以规模化、毛利差,市场上没有人投 AI。但他却加码了 5、6 个 AI 项目,包括思谋科技、澜舟科技、摩尔线程、此芯科技等。

这是一种有趣的选择:在 AI 的至暗时刻选择加注,却在 AI 的狂热时刻选择冷静。在他身上,或许能看到那些懂技术、且信仰技术的中国科技投资人在当下的选择与顾虑。

用他自己的话说,技术出身(他最早是联想集团的一名工程师)给他带来的影响是,他倾向于先把一个事看透、接着选择最好的标的。而身处一家资金充裕、对商业化回报更宽容的 CVC(企业风险投资),或许是他选择的底气。某种程度上,他的选择也反映了联想在 AI 时代的选择。

不过他也认为,技术信仰会越来越成为投资圈「共识」,「这个世界不愁钱,缺的是最好的创业者和最好的创业公司。」无论怎样,他所讲的技术信仰和理想主义,对中国的 AGI 之路来说并不是坏事。至少,它为创业者提供了最宝贵的信心、想象力和燃料。

以下是宋春雨对于基础大模型的技术路线、AI 各赛道的机会、以及技术周期和资本等的看法,或许能为行业带来一些思考、碰撞。

对话经极客公园整理后发布:

通往 AGI 有多条路径,最看好万亿参数多模态大模型

极客公园:听说你最近一直在国外,能不能讲一下你在国外看到的AI进展或者动态?

宋春雨:联想是一家国际化公司,所以我们一直在全球看人工智能和大模型的演进过程。其实我们看到,中国和美国都在分别组织整个产业界往 AGI 走,我们坚信人类终会迎来硅基智能、新物种爆发的时刻。

从大模型的角度讲,我们认为下一代大模型突破的主线就是原生多模态。大家看到 OpenAI 发布的 Sora,它不只是文生文,而是创造了一个视觉、语言完全融合的新世界。我们认为,视觉模型和语言模型会合二为一,形成一个统一的、最强大的基础模型。

极客公园:所以你觉得,Sora 代表的多模态路线会比单纯的语言文本路线更重要?

宋春雨:第一更加重要,第二更加复杂、门槛更高。

首先在数据层面,语言模型训练的数据集是有限的,就是互联网上人类产生的所有文本,任何一家公司如果有资源都能触及。但在多模时代,训练的样本和训练的数据要靠大模型去生成,或者像自动驾驶一样让机器去理解和吸收物理世界的数据。这个难度非常非常大。

其次在算力层面,多模态对算力的要求要 10 倍于文本。比如 GPT-3.5 这个水平,基本上千卡就可以了。但在多模大模型的时代,GPT-4 级别的训练需要单一集群万卡,这是入门门槛。所谓单一物理集群万卡,就是说你不能把各个地方,比如内蒙、上海、西安等地的几千块卡集联起来做万卡集群,而是要一个地方的。这也非常非常难。

另外在算法方面,目前语言模型和视觉模型还是两个框架的模型,而且多模模型没有任何开源。这也导致它的实现难度非常大。

极客公园:你怎么看王小川说,他不看好 Sora、也不想走多模态路线?

宋春雨:我们认为在中国的基础大模型牌桌上,各家公司在 2024 年会围绕自己的优势领域,做出分化和选择。

比如有一类就主攻多模态、还有一类会围绕行业的应用去做垂域模型、还有一类企业围绕 To C 迭代出字节抖音这类产品、还有一类就像小川这样以语言模型为核心专注医疗垂直应用领域等等。

极客公园:看好原生多模态这个观点,你们是不是还算比较独特?

宋春雨:是。我跟你分享一下为什么,就是因为挑战难度太大了,很多人提了可能做不出来。

极客公园:为什么对OpenAI来说,刚毕业的几个博士生就可以做出 Sora?

宋春雨:因为它已经有一个万亿参数的大模型,它是在一个巨人的肩膀上做这件事。但它的对手 Pika 就没有一个万亿模型,只能在一个小模型上去做,这个能力差距太大了。

?code=MTZjZDFiODk3MmY0NjM4NzJmZmY5MWYyNGQyNGFkMTlfVTA3c3FSdU10S3hpZVU0YTQ2R3RnTER1QjFlOXdCM1VfVG9rZW46THFidWJvcEplb0tDTUp4bExRWmNLaEdQblZjXzE3MTM3OTIxNzg6MTcxMzc5NTc3OF9WNA

Sora 生成的「咖啡里的海盗船」视频|图片来源:OpenAI 官网

极客公园:对多模态的相信,是不是跟你们投过上一波视觉模型(如旷视科技)有关系?

宋春雨:是。我们很早就意识到,虽然大模型是从语言模型开始,但未来一定是视觉和语言统一的新架构。

包括在 Sora 出来之前,我们就知道 OpenAI 在做这个了。我们当时就推测,OpenAI 依靠万亿级超级大模型,最后肯定要秒杀 Pika 的。最后果然不出所料。

另外 OpenAI 有完整的多模态数据工具链,可以生成高质量的多模态视频数据,同时其万亿参数大模型对于物理世界的理解更加真实和准确,也会帮助 Sora 的视觉效果更加真实。

极客公园:你们内部会有反对观点吗?

宋春雨:我们是通过去年一年的观察,慢慢形成了这个观点。内部也有不同的声音,但大家最后从各个维度讨论、直到统一了思想。

极客公园:在多模态这条路线上,你们发现好的标的了吗?

宋春雨:有一些很好的标的,我们都在做评估。

极客公园:你们会在目前排名前四的大模型公司中挑选,还是有更多可能?

宋春雨:不只是这些,比这些要多。我们那个圈子划得还是挺大的。

2024 年中国基础模型可能会迎来一个大的分水岭——它的标志是,谁会发万亿模型、谁代表了多模态、谁能跨过 GPT4 的水平。这是我们投资整个大模型领域的逻辑,联想的 AI PC 战略也是需要和这样的公司合作。

基础大模型「信仰派」,却没有出手任何一家

极客公园:你一直在提基础大模型,你属于「技术信仰派」吗?

宋春雨:我是技术信仰派。前一段朱啸虎谈到,他不投大模型、只投应用,我们的观点跟他是不同的,我们认为大模型就是最大的超级应用。

Sora 给全球的创业者带来了一个巨大启示:它仅靠应届博士生带领的小团队,就打败了 Pika 和 Runway,这是因为它站在万亿参数大模型的基础上,才能更好地理解物理规律、生成的视频才远超其他家。

我们认为在未来的人工智能时代,基础大模型才是战略制高点。只有拥有一个超级强的大模型,才有可能诞生 Super APP,并构建数据、模型、应用的商业闭环。

极客公园:所以上层应用的价值主要取决于基础大模型的技术?

宋春雨:如果说互联网时代应用的本质是「连接」,比如美团是把线上和线下连接。那大模型时代的应用是「智力」,它对外输出的是硅基智能,它 95% 的能力都在大模型里,应用只是起到表层交互的作用。大模型本身就是硅基智能时代的 Super APP。

在过去的移动互联网时代,字节跳动依靠一个高维参数的推荐引擎,迭代出了今日头条、抖音、TikTok 等超级应用。那在今天的 AI 时代,我们也相信通过大模型的引擎,会出现下一个像今日头条、TikTok 这样的超级应用。

AI1.0 时代即移动互联网时代,我们有「TMD」(头条、美团、滴滴),其中头条商业效率最高。现在 AI2.0 时代的效率理论上还将更高。

极客公园:那你是不是不看好目前一些依靠开源模型做应用的公司?

宋春雨:并非不看好,那些可能只是一个「业务」,等基础大模型一升级,它们可能马上就没有太多的价值了。因为创业公司一旦收敛之后,根本跟不了万亿以上模型的创新能力。

开源模型的核心价值还是在垂直领域,开发者可以快速优化,在其领域形成商业闭环和应用价值,但其本质并不是基础大模型。

极客公园:开源模型一定比不上闭源模型吗?

宋春雨:开源一定会比闭源落后。此开源非彼开源,之前所谓的开源就是代码,运行起来就完事了。但这一轮人工智能是,你要通过单集群万卡把它(模型)和高质量数据训一遍,一般的公司哪有这个能力?即使是开源模型,真正能驾驭的公司也是很少的。

所以为什么那些公司开源,因为它知道开了也无所谓,能把开源复现、真正用起来的公司注定是少数。

极客公园:你这么相信基础大模型,为什么却一家都没有投?

宋春雨:我们其实每一轮都在看,但我们确实需要时间去看清楚,哪家大模型团队更有通向 AGI 的实力。目前已经在快速收敛中,2024 年会是中国大模型的分水岭,能赶超 GPT-4 就有机会上 AGI 的牌桌,做不到的就会分化、下沉下来用开源做垂域大模型。

一旦这些公司中有谁能让我们看到,它具备引领中国基础大模型的研发实力,我们肯定会毫不犹豫地出手。有时候让子弹飞一会,也未尝不是一件好事。

极客公园:这个时间点大概是什么时候?

宋春雨:2024 年大分水岭出现的时候。

极客公园:但这时候这些公司已经很贵了。

宋春雨:是很贵,估值体系非常颠覆原来的范式。当年我们投资旷视才几千万人民币的估值,但是现在大模型公司的天使轮可能都 3、5 亿美金起,小川是 10 亿美金起。确实没办法。

极客公园:你们有一个给钱的上限吗?

宋春雨:我们没有。

极客公园:那回报怎么办?

宋春雨:目前依然是早期,但 AGI 前景,堪比第四次工业革命。你要说回报预期真的不敢说,你只能相信它,星辰大海。

非共识的投资观:赚钱、商业化不是最重要的

极客公园:你投了「海纳AI」这种 AI 应用,背后的逻辑是什么?

宋春雨:我觉得这类应用如果能在小模型的基础上,快速构建对一些行业的数据独占,是有机会的。

海纳的数据不是在互联网上能拿到的,而是要一个客户一个客户地合作,比如顺丰、沃尔玛百万级员工的面试都会用到它,这个数据壁垒就构建起来了。在某些特定工种,如蓝领、程序员的批量面试,海纳 AI 已经可以 100% 机器代替 HR 完成面试。

极客公园:怎么看目前的应用生态?

宋春雨:从美国来看,大模型应用正处于新物种大爆发的风起云涌时代。A16Z 最新发布的报告显示,按用户使用时长、下载量排名的 AI 应用榜上,已经比半年多出了 40% 的新面孔。但由于基础模型的原因,中国的应用还没有到大爆发阶段。

?code=N2U4MjBkNDM0YTI4MTVmZDNjZWI3ZTc4OTU1YzNjMTJfNWFqTTd6SjhQY00zeVhrbTNSQzdoZWtPTVFSWmY2cVJfVG9rZW46U3pkNGJ0cW1Lb0NrSWh4dmdNOWNsWmRBbkRmXzE3MTM3OTIxNzg6MTcxMzc5NTc3OF9WNA

2024 年 3 月,a16z 发布了排名前 50 的 Gen AI 产品榜单。与 2023 年 9 月相比,超过 40% 的上榜公司都是新公司|图片来源:a16z

极客公园:现在很多投资人看好上层应用,因为它们商业化很好。

宋春雨:我们更看重的是,这些公司是否能追赶、甚至能在硅基智能时代齐头并进。这一波的公司首先要能跟上硅基智能的创新,其次才是去考虑赚钱的事。短期的商业化只是一个参考。

极客公园:你相信技术一定能赚到钱吗?

宋春雨:我们有信心。比如 OpenAI,它在发布 GPT3.5 之前根本没有任何的商业化,它就一直在追赶这件事。但一旦突破那个技术点,我坚信就一定能赚钱。而且未来 AI 算力的成本会大幅下降,肯定会在其中找到一个(盈利)平衡点。

极客公园:你跟创业者也会这么讲吗?

宋春雨:我也会这么讲。

极客公园:可以分享一段你跟创业者的讲话吗?

宋春雨:我跟大家都这么说。无论是在工业界还是在学术界,我说你们这些做人工智能的专家,如果这个时代不去做 AGI,就是枉费人生。

极客公园:今天像你们这样有着强烈技术信仰的大模型投资人,算是少数派还是多数派?

宋春雨:我们这么技术派的(投资人),可能还处于一个非共识状态。

很多人都是要看 revenue(营收)。在美国也是一样,公司一到 10 亿、20 亿美金(估值)就比较难,因为投资人的压力很大,它们要考虑商业化这些问题。

极客公园:为什么你们会是少数派?

宋春雨:其实我做投资这么多年,包括投上一波 AI 也基本是非共识。比如 2012 年我投旷视的时候,产业界都没有投的。2018 年我投寒武纪的时候,当时 GPU 还很少用在 AI 上。2022 年上半年往前数两年,那是中国 AI 的至暗时刻,当时所有的社会舆论、资本市场都质疑中国的「AI 四小龙」,做 2B、毛利不好、烧钱,整个市场没有人投 AI。但那两三年,我们基本上投了 5、6 个 AI 项目。

当时我们坚定投思谋,把 AI 和传统行业深度整合起来;我们还投了周明;在大家对算力根本没那么认可的情况下,我们投了摩尔线程、此芯科技。都是在至暗时刻投的。

我们坚信基础大模型是关键的成功要素,它需要极高的人才密度、极强的算力储备、创始人极大的产业号召力等等,所以必定也是技术少数派。

极客公园:你们的技术信仰来自于什么呢?

宋春雨:跟我们的技术背景有关系。

老贺(注:联想创投总裁贺志强)和我都是联想研究院出身,他是联想研究院的 CTO,我是联想研究院的研究室主任、当时负责虚拟化和信息安全。我们这种技术基因的倾向是,先把一个事看透、想明白了之后,就选择最好的标的。

极客公园:从本质上说,CVC 对盈利性的宽容,是不是你们底气的来源?

宋春雨:对,因为我们(联想)的生态资源本身就是对创业公司最大的赋能,它一下就解决了商业化的大瓶颈,所以我们的考虑会更宽容。

拥有独占数据的垂直模型和垂直应用,也有机会

极客公园:你也投了澜舟科技这样的垂直模型公司,这是为什么?

宋春雨:我们认为 2B 的垂域模型和 2C 的终端个人模型也同样有价值。如果这些企业能围绕模型和数据,迭代出各自领域的超级应用,我们也非常愿意投资。

澜舟有自己独占的数据。我觉得周明老师(注:澜舟科技创始人)围绕金融、互联网营销等的切入点是完全对的,他在这些领域的 know-how 也很深。对标美国,垂域模型的创新也有非常多好的案例。我觉得他是能够跑出来的。

极客公园:所以除了基础大模型之外,你也相信其他模型的价值?

宋春雨:未来是基础模型、垂域模型和个人大模型混合的一个时代。

比如 Mistral(欧洲模型公司)很典型,它做的是小模型和中模型,不是做超级大模型,它可能在垂直行业的闭环速度最快,最后会进到自己的优势领域迭代。

极客公园:你也投了欧洲的垂直大模型公司,也是看重数据吗?

宋春雨:是的,因为欧洲要求数据和 AI 训练的 infra 都要在欧盟内。大模型是先进生产力,我觉得未来大的地域都会有自己的大模型,欧洲会出,日韩也可能会出。

极客公园:你为什么会投两个开源模型社区?

宋春雨:我们也是有非常战略的考虑。那些垂直领域的中小模型可以通过开源模型做,而闭源是冲着超级大模型去的,没必要做这部分长尾市场。

所以未来开源肯定会占一席之地。世界范围内这个比重是五五开,中国和其他国家有很大的区别,最终比重还没定论。但我们坚信中国肯定有 Hugging Face(美国开源社区)的机会。

极客公园:阿里的魔搭、百度的千帆都想做开源模型社区,创业公司的机会是什么?

宋春雨:比如 [JJR1] 要帮客户部署模型的时候,它们(大厂)肯定偏向于用自家的模型。创业公司会更客观。

极客公园:大厂可以通过算力挣钱,模型社区怎么赚钱?

宋春雨:战略价值是最大的。你看 Hugging Face 的报表,它没怎么赚钱,但它是百亿美金级别的战略性公司。你看微软收购的 GitHub(开源的代码管理公司),它也不赚钱,但它有 300 亿美金的估值。

另外我对创始人还挺有信心的,他肯定能把公司变成赚钱的,就是不要太急。

算力是唯一确定性的赛道,看好计算架构的创新

极客公园:算力是你投得最多的,这是因为它的确定性最大吗?

宋春雨:确实算力是唯一确定性的要素,它是硅基智能时代的水、电、煤。这也是我们投资的核心关注点。

极客公园:由于英伟达芯片的限制问题,你对算力的投资是国产替代逻辑吗?

宋春雨:倒不完全是。一方面,我们确实处于 AI 算力不足的阶段,所以对于现在能提供和英伟达相等计算能力的芯片公司,我们是非常非常关注的。

但另一方面,围绕现在大模型的特性,我们也会很关注计算架构的创新:一是算力的加速,一是超低功耗。

极客公园:你们具体都投了哪些?

宋春雨:因为我们坚信未来的智能计算会是多元异构的架构,所以各种计算架构我们都会投。包括传统的 GPU(图形处理器)、GPGPU(通用图形处理单元);以寒武纪和华为为代表的 NPU(神经网络处理器)架构;RISC-V 架构(知名的开源指令集架构);终端融合 NPU 算力架构。这四点应该都非常影响产业的演变,所以我们全都投资。

另外,训练芯片、推理芯片、终端计算芯片,以及端边云网芯片……只要覆盖 AI 算力的,我们都会投资。因为联想本质是一个卖计算的公司,我们有以 GPU、NPU 为核心的新一代的人工智能超算集群,所以我们都会覆盖。

极客公园:产业链有价值的你们都会投?有没有什么特别的筛选标准?

宋春雨:第一,算力架构能力可以对标英伟达的 A 系列(A100 系列)、算力密度和能力相当强、能支持人工智能大模型训练的芯片,肯定是我们想投的 No.1。

第二,在核心的 IT 和架构方面有自独到之处,能做出差异化,比如超低功耗是我们非常看重的一点。

第三,团队要具备智能算力的长期引领、创新能力。

第四,在行业里有过非常强的操盘能力,能够做超级大芯片、而不是很小的芯片。这背后考验好的制程匹配,无论是用摩尔制程、还是用先进制程。

另外,公司还要有很好的量产确定性。当然,估值也是我们看重的一个点。

极客公园:最近行业里会提,芯片已经从过去冯·诺伊曼时代的存算分离架构,变成了存算一体架构?

宋春雨:存算一体已经是共识了。那些填补国内空白的下一代产品都已经是存算一体,来提升计算效率和降低功耗。

极客公园:华为是去年唯一一个做出AI芯片的厂商,和大厂相比,创业公司有多大机会能跑出来?

宋春雨:首先我们认为市场格局不会一家独大。如果我们看全球份额,英伟达 GPU 这么庞大了,谷歌的 TPU(张量处理器)还能在全球占 15% 的份额。现在 Altman(OpenAI 的 CEO)也要入场做芯片了,微软也要做,所以 GPU 的份额会越来越少的,未来肯定是多种架构并存。

而相较于英伟达在全球 AI 芯片的垄断地位,中国远没有形成这样的格局。在国内,华为和其他 AI 算力芯片创业公司的起步时间点都差不多,现在就看谁能有产能,谁能够构建生态,能在万卡集群上训练大模型。

我坚信有创业公司有机会,未来两年会是一个比较重要的红利期,中国算力芯片市场会分化出格局。

极客公园:我们距离实现真正的芯片国产替代还有多久?

宋春雨:如果是有和无的问题,那差距已经没有那么大了。

比如最近英伟达 GTC 大会发布了下一代 Blackwell 架构的 GPU,宣称算力提高了 30 倍,这是非常重要的技术点。但我们通过增加卡数,它是 1 万张最新的 GPU 卡,我们上 10 万张,其实也能达到同样的能力。这不是一个本质差别了。

?code=MTk2YWU1NDY0MTIxNzE2ZTdlOTNlNmJiZWEwMWYwNjZfRkJhQTdEenp3MmRWSDk3ZklEbnI1dnJpWW1KbEJtOFZfVG9rZW46SWJGRGJwUTM4b1pQeEh4cDhCZ2MxZmhsbnNnXzE3MTM3OTIxNzg6MTcxMzc5NTc3OF9WNA

英伟达在 GTC 大会上发布的 Blackwell 芯片(左),与较旧的 H100 Hopper 架构(右)对比| 图片来源:英伟达

极客公园:Sora 这样的多模态模型对算力考验更大了,我们该怎么应对?

宋春雨:多模态需要单集群万卡,它考验超算集群本身的连接能力、网络通讯能力、内存管理能力等等。这个过程没那么容易,要非常大的投资。不过国家也在重点支持整个产业,这些都会帮助创业者。

不过,我认为未来算力的成本不会像现在这么高。相当于摩尔定律,过了一段时间它就会降低到一定程度。

极客公园:大概能降低多少?

宋春雨:目前还没有一个数字预测,有可能是现在成本的十分之一。未来算力或许像水、电、煤一样,那是一个普惠智能的时代。

前所未有的变量涌现,大模型是一次「人类超级科技工程」

极客公园:你投了上一波AI四小龙中的旷视,它们当初的最大困境是模型通用性不高,导致 To B 交付基本是项目制,很难规模化、毛利不高。你觉得现在这一波的大模型公司能避免这个问题吗?

宋春雨:这一轮大模型的泛化能力和通用性确实是好很多。从我们目前掌握的情况来看,它确实是可以跨客户的。原来 AI 1.0 的小模型,每换一个客户都需要针对客户的数据和场景重新训练,现在不用了。

极客公园:联想一直在提AI PC 的战略,你怎么看大模型和端侧的结合?

宋春雨:去年联想宣布进入到 AI PC 的时代,包括 AI phone,AIOT,要用大模型赋能新的硬件。很多大模型公司都非常愿意和我们合作。

我们相信未来端侧会有专门的大模型,因为个人数据的隐私考虑,不能直接放到云端(模型)上训练。另外,端侧模型能对用户有更快速的响应。如果模型整合了端到端,在特定领域的模型效率肯定是最好的。

极客公园:随着大模型跟机器人结合,这是否意味着机器人产业迎来了 GTP-3 的时刻?

宋春雨:我去年初就这样认为了,只是当时不知道是谁会引领这个产业。

机器人的通用性,主要是大模型带来的、而不是硬件带来的。因为硬件就是一个驱动单元,驱动单元(的进步)是一个渐进式过程。但大模型能让机器人理解物理世界,它会带来剧变。

极客公园:您好像投了一些垂直领域的机器人,你看好通用人形机器人吗?

宋春雨:之前我投的是 AI 1.0 时代做特定任务的的机器人,现在我也让团队快速地去看通用机器人。在这个产业大潮里,所有的领域都在快速地迭代。我相信 10 年内,人形机器人可以产业化。

其他各个板块,包括英伟达发布的新芯片,马斯克开源的新模型,OpenAI 要发布 GPT-5,所有终端厂商全在谈 AI PC、AI phone 和 AIOT,新进入的 top 玩家和 top 创业公司越来越多……这真是非常非常 Dynamic(动态变化)的大时代。

极客公园:这么多的变量涌现,是不是你投了科技这么多年从来没有感受到的?

宋春雨:即使我们投科技这么多年,也从来没有感受到。

之前我们投寒武纪、旷视科技、第四范式、思谋科技,这都是 AI 1.0 时代非常非常重要的公司。那时侯的竞争格局和产业收敛程度,可能是以三年为周期。但大家现在看到的大模型浪潮,基本是以半年为周期收敛。

这波大模型浪潮和之前所有的科技创新都不一样。它是大 dynamic、大资金,大家从人才、资金等各个维度切进去,这是前所未有的一次人类超级科技工程。

「这个世界不愁钱,缺的是最好的创业者和最好的创业公司」

极客公园:听说你们每年年初都会拿 3 个月时间,不做投资、只做行业调研。在大模型火热的这两年,你们都得出了什么调研结论?

宋春雨:其实结论是相似的,核心就是相信 scaling law(规模定律)、相信视觉模型和语言模型要走向统一,最终人类最终会实现 AGI、进入硅基智能的大爆发时代。同时,我们也坚信中国应该出现自己的 OpenAI。

极客公园:为什么要研究 3 个月、而且还要全员参与?

宋春雨:因为时代在发生很大的变化,当硅基智能时代到来,很多未知的东西都需要深入研究才能明白。

比如神经网络为什么要这样的模式才能运行?为什么在 Transformer 架构下加算力、再加超大规模参数就能涌现?模型的上限潜力到底在哪里?如果我们想知道这些问题,就要研究,而研究之后,我们对 AGI 才有了信心。

极客公园:像你们这样对 AGI 有技术信仰的机构并不多,最终是否有足够的钱来支持创业公司昂贵的 AGI 梦想?

宋春雨:去年我去美国跟硅谷的大公司交流,他们跟我分享了一个数据。过去一年,硅谷的 VC 在人工智能大模型上投资的资金量,是 AI1.0 时代所有总和的 10 倍。这个资金量是非常非常惊人的。

中国也一样,肯定有一年的资金量,会是过去 AI 1.0 时代的 10 倍。但这一年不一定是去年,因为去年才刚开始。大家都在摸索和学习的过程。

?code=NDVjODA5ZmZmMDBmMDljZWQwMmJlZDFkYTYyMmZiM2FfcXhaT2o0bVFtYm83T0g0RWF0MUhYNGhhN3BQRUt0Um9fVG9rZW46UElTamJGa3lFb3oxMFZ4dGs4eGNvc2g2bmNjXzE3MTM3OTIxNzg6MTcxMzc5NTc3OF9WNA

对生成式 AI 的投资在 2023 年迎来爆发|图片来源:CB Insights

极客公园:所以你对资金这个事还是比较乐观?

宋春雨:比较乐观。这个世界不愁钱,缺的是最好的创业者和最好的创业公司。

极客公园:现在大模型公司的投资方背后基本都是大厂,拥有资金、产业等优势的 CVC,会是能陪创业者走到最后的机构吗?

宋春雨:CVC 肯定是其中一股势力。

极客公园:你觉得 AGI 的实现预计要多久?

宋春雨:估计是 2028 年到 2030 年。

极客公园:在技术的大浪潮下,会有一些对人类的忧虑吗?

宋春雨:肯定会有。硅基智能和碳基智能的神经网络原理,其实是非常非常相似的。人的神经网络也是靠不断学习、接触数据、受到刺激,才能更加智能。

所以人不用脑也会落后,客观一点说,人也要进步。

极客公园:听说你们内部喜欢说「问对的问题」,可否提一个大模型行业的「对的问题」?

宋春雨:我们内部梳理出了 100 多个问题,比如开源和闭源的关系、大模型有多家还是一家独大等等,都是我们想提出的问题。

极客公园:你们看好怎样的创业者?

宋春雨:还是要在大模型创新上有非常强的认知、并且能不断推进大模型的创新路径。这种创业者是我最喜欢的。

极客公园:具体怎么理解?

宋春雨:很多人是看到了 Sora 所以相信,但我不是,我是预判。创业者也是一样。他不一定要先做出来什么,但他要有能力去理解,这个是关键。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK