火爆全网的ChatGPT，早被资本盯上了，国内有人刚融了10亿

2022-12-13

0 评论 1272 浏览 0 收藏 16 分钟

双12暖冬钜惠！起点课堂会员买一年送半年，还有产品汪、周年T恤等好礼任你抽！点击立即查看>>

释放双眼，带上耳机，听听看~！

00:00

ChatGPT，这个由OpenAI开发的大规模预训练语言模型可谓是火遍全网，用户数量已突破100万，免费公测版本的服务器都快就被热情的测试用户挤爆了。ChatGPT到底是什么？其背后的大规模预训练模型是怎样一条赛道，为何会受到众多投资机构的追捧？融资热背后，又离真正大规模商用落地还有多远？本篇文章就来一探究竟。

这几天，一个名为ChatGPT的聊天机器人彻底破圈了，火遍全网。

它写得了代码，修复得了bug，还能帮你写工作周报、写小说、进行高考答题，甚至你还可以诱骗它规划如何毁灭人类。

尽管市面上已经有了大量的聊天机器人，但马斯克仍然对此感叹：“很多人疯狂地陷入了ChatGPT循环中，我们离强大到危险的人工智能不远了。”

这个看似无所不能的ChatGPT是由美国OpenAI开发的大规模预训练语言模型，马斯克曾是这家公司的创始人之一。

12月5日，OpenAI首席执行官Sam Altman在社交媒体上发文表示，ChatGPT于上周三推出，截至目前已突破100万用户。

甚至免费公测版本的服务器很快就被热情的测试用户挤爆了。

联想集团副总裁、联想创投集团高级合伙人宋春雨告诉创业邦，AI预训练大模型的出现，成为了近三年以来AI算法创新最受关注的投资机会。

睿兽分析显示，2022年以来，国内大规模预训练模型赛道出现多笔大额融资，单笔融资金额高达10亿元，其中不乏联想创投、君联资本、启明创投、创新工场等知名投资机构。

被网友玩坏了的ChatGPT到底是什么？其背后的大规模预训练模型是怎样一条赛道，为何会受到众多投资机构的追捧？融资热背后，又离真正大规模商用落地还有多远？

AI如何攻破人类，发人深省的回答

AI教你怎么找男朋友

帮你写份周报应付老板

试一下python写个判断闰年，还有详细的解释，不过看上去像是在某个程序网站抄的

AI是如何一本正经地胡说八道的

一、“新晋网红”ChatGPT到底是什么？

简单来说，预训练模型（Pre-trained Model）是前人为了解决问题所创造出来的模型。后人在解决类似问题的时候，无需再从零开始训练一个新模型，而是可以利用此前在类似问题中训练过的模型来解决现有问题。

与人们熟悉的语音助手不同，ChatGPT在与人们的对话中可以理解较为复杂的语句内容，比如有多层语法嵌套的句子。同时，ChatGPT拥有一定联系上下文理解语境的能力，可以针对一个问题不断深入交流。令人惊讶的是，ChatGPT既能承认错误、质疑不正确的前提，还能拒绝不恰当的请求。

这就意味着，ChatGPT已经可以实现围绕某个话题，与人类展开一段谈话讨论的可能。

OpenAI官方称，ChatGPT是在人类的帮助下创建并训练的，人类训练师对该AI早期版本回答查询的方式进行排名和评级。然后，这些信息被反馈到系统中，系统会根据训练师的偏好来调整答案。这是一种训练人工智能的标准方法，被称为强化学习。

据国盛证券研报，ChatGPT有着多达1750亿个模型参数，OpenAI主要使用的公共爬虫数据集是有着超过万亿单词的人类语言数据集。

该研报指出，ChatGPT在寻找答案、解决问题的效率上已经部分超越了如今的搜索引擎。ChatGPT或许在未来会改变我们获取信息、输出内容的方式，AIGC（AI生成内容）有望成为数字经济时代驱动需求爆发的杀手级应用。

不过，ChatGPT也并非上知天文下知地理的“最强懂哥”。

据官网显示，ChatGPT目前存在着一些局限性，包括有时会给出看上去正确但荒谬的答案、微调提问的方式会得到完全不同的答案、有时会反复使用某些句子等。

网友也发现，ChatGPT有两个明显的缺点：输入不能有错，解释不够人性化。

所以，这个五天用户突破百万的模型突然遭到编程问答社区Stack Overflow的封禁。

目前，ChatGPT的研究团队也表示将根据用户反馈持续改进模型，未来还有很长的道路要走。

尽管如此，OpenAI依然被视为全球AI领域的顶级机构。

OpenAI在2020年推出的上一代GPT-3在当时就被称之为人工智能领域的一个重要里程碑。

在此之后，OpenAI也开始尝试对GPT-3进行商业化。目前，OpenAI以API的形式向开发者客户有偿提供GPT-3模型，并根据token使用量来收费。目前，基于GPT-3产生的App已经达到300多个。

今年大火的AI绘画也与OpenAI密不可分。

最早，OpenAI曾推出一款DALL-E低代码工具，用户只要提出想法、输入参数，电脑就会自动生成艺术级别的画作。在这一波AI绘画热潮中，还涌现了Midjourney、Stable AI等初创公司，有些公司已经成为独角兽。

正是预感到了大模型的巨大价值，在GPT-3推出的前一年，也就是2019年，微软向OpenAI进行了高达10亿美元的投资。

这也为微软大力推进的云战略吸引来了不少客户。

例如，美国最大的汽车零售平台CarMax利用OpenAI的开发工具把10万条客户评论直接进行了分析，根据客户的表达情绪分类成正面、中性和负面，还提取了关键字摘要，对于公司的战略决策起到了很大的帮助。

CarMax首席技术官甚至表示，如果没有人工智能，这项工作靠人工编辑团队需要耗费11年才能完成。

可以说，OpenAI带给了人们巨大的想象空间。

二、融资火热背后，离真正大规模商用还有多远？

实际上，不仅是最近破圈的ChatGPT，近两年国内也迎来了“大练模型”和“练大模型”的军备竞赛热潮。

其中，自然少不了行业巨头和高校科研机构。

百度发布了产业级知识增强大模型“文心”（参数规模达2600亿），并基于“文心”模型形成了产业全景图。同时，华为联合鹏程实验室等也发布了“盘古”大模型，阿里巴巴达摩院发布了中文语言模型 PLUG。

此外，由北京智源人工智能研究院牵头，汇聚清华、北大、人大、中科院和相关企业共同研发的超大规模预训练模型“悟道”（悟道2.0参数规模达1.75万亿）也于2021年亮相。

“AI预训练大模型的出现，成为了近三年以来AI算法创新最受关注的投资机会。”联想集团副总裁、联想创投集团高级合伙人宋春雨表示，随着超大规模AI预训练模型的技术突破，在自然语言理解方面已经展现出超高程度的可用性，简而言之就是“机器真的懂人了”。

他认为，大规模预训练模型是AI大数据要走的必然之路。从学术界和产业界的角度来看，AI和大数据技术的变化也会非常大。未来两年、最多三年，AI将会有很大能力的提升。

回溯历史，从最早Deep Learning到Alpha go，到Zero 自训练，到Transformer，再到GPT-3， AI在突飞猛进的发展，并不断落地在应用场景中，比如 AI制药、预测化学分子都极大地提高了所在行业的生产力。

启明创投合伙人周志峰也表示，人工智能过去10年发展集中在感知智能，特别是视觉和语音技术的突破。下一个十年，人工智能将走向认知智能，预训练大模型是其核心技术推动力和关键基础设施，让AI吸收更多的知识去理解和思考，最终实现接近人类水平的认知。同时，预训练大模型使得AI从依赖手工调参建模走向可大规模复制的工业化阶段。

大规模预训练模型被投资人看好，也直接反映在了投融资的热度上。

睿兽分析显示，2022年以来，尤其是下半年，大规模预训练模型领域出现了多笔大额融资。

2月10日，澜舟科技完成近亿元Pre-A轮融资，由联想创投、斯道资本共同领投，创新工场跟投。9月26日，智谱AI宣布获得数亿元B轮融资，由君联资本和启明创投联合领投。11月7日，小冰公司宣布完成10亿元新融资。12月6日，聆心智能完成数千万元天使+轮融资，由连星资本领投，图灵创投和智谱AI跟投。

这些企业均将商业落地作为融资后的发力重点，但其落地的侧重点各有不同。

澜舟科技研发的“孟子”模型，用更小的模型规模（10亿参数量）实现了比肩超大模型的性能，能够具备灵活的领域和场景适应能力，在机器翻译、文本生成、行业搜索等场景更利于快速、低成本地落地。

2021年9月，澜舟科技和传神合作的第一个基于孟子预训练模型的“任度”翻译引擎正式发布上线，截至目前澜舟科技已完成了各行业垂直领域20余个翻译模型的开发，覆盖新闻、金融、汽车等领域。

聆心智能目前则主要侧重于游戏、营销、情感三个领域。

聆心智能在12月推出了图灵世界的首个产品“AI乌托邦”，用户可快速定制 AI 角色，只需要输入简单的角色描述，就可以召唤出相应人设的 AI ，与之进行深度对话，还可以命令AI完成相应的任务。

此外，聆心智能还打造了Emohaa情绪疗愈机器人，并与精神心理平台好心情达成合作，落地了国内首款人工智能心理陪伴数字人；还与高端豪华电动车品牌Beyonca合作，打造了新一代智能驾舱助手。

新一轮融资公布当天，小冰公司启动了对旗下人工智能数字员工（AI Being Employee）产品线的年度升级，其中之一就是加强大模型对话引擎。

据悉，目前小冰框架中运行了30万名数字员工，包括万科集团年度优秀员工“崔筱盼”、红杉中国首位虚拟分析师“Hóng”、虚拟歌手“洛天依”等。由小冰框架生成的“小堂妹”等数名虚拟主播，全网播放量均已破亿。

尽管各家的“大炼模型”已经在商业落地上取得了一些成绩，但实际应用情况如何、能解决哪些实际问题仍然在遭受着用户的质疑。

平安科技前沿技术部门负责人王磊就曾公开指出，当前大规模预训练模型在垂直领域存在“致命”问题。

他认为，大规模预训练模型在垂直领域性能达不到要求的原因可能是：大规模预训练模型的训练语料库规模很大，既包含了该领域的关键信息也包含了其他无关信息，使得模型缺少对关键信息的关注。同时，当前大规模预训练模型的机制改进也很少涉及对关键信息的提取。

不同于网友在ChatGPT上的“自娱自乐”，大规模预训练模型一旦商用，假如出现错误，或将会造成难以挽回的实际损失。这也是客户最大的担心之处。

特别是金融行业的客户对上线模型的精度要求很高，不少场景直接使用预加载模型往往很难满足需求。

有投资人也表示，“尽管可以通过置信度评估方法等方式来提升模型的靠谱程度，但距离商用真正意义上的‘好用’仍有很长一段路要走。”

作者：巴里；编辑：子钺

来源公众号：创业邦（ID：ichuangyebang），创新成长，创业兴邦。

本文由人人都是产品经理合作媒体 @创业邦授权发布，未经许可，禁止转载。

题图来自 Unsplash，基于 CC0 协议

该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。

给作者打赏，鼓励TA抓紧创作！

火爆全网的ChatGPT，早被资本盯上了，国内有人刚融了10亿