4

火爆全网的ChatGPT,早被资本盯上了,国内有人刚融了10亿

 1 year ago
source link: https://www.woshipm.com/ai/5704331.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

火爆全网的ChatGPT,早被资本盯上了,国内有人刚融了10亿

2022-12-13
0 评论 1272 浏览 0 收藏 16 分钟
释放双眼,带上耳机,听听看~!
00:00
00:00

ChatGPT,这个由OpenAI开发的大规模预训练语言模型可谓是火遍全网,用户数量已突破100万,免费公测版本的服务器都快就被热情的测试用户挤爆了。ChatGPT到底是什么?其背后的大规模预训练模型是怎样一条赛道,为何会受到众多投资机构的追捧?融资热背后,又离真正大规模商用落地还有多远?本篇文章就来一探究竟。

mAUQhLPFF8d1yGk504pv.jpg

这几天,一个名为ChatGPT的聊天机器人彻底破圈了,火遍全网。

它写得了代码,修复得了bug,还能帮你写工作周报、写小说、进行高考答题,甚至你还可以诱骗它规划如何毁灭人类。

尽管市面上已经有了大量的聊天机器人,但马斯克仍然对此感叹:“很多人疯狂地陷入了ChatGPT循环中,我们离强大到危险的人工智能不远了。”

这个看似无所不能的ChatGPT是由美国OpenAI开发的大规模预训练语言模型,马斯克曾是这家公司的创始人之一。

12月5日,OpenAI首席执行官Sam Altman在社交媒体上发文表示,ChatGPT于上周三推出,截至目前已突破100万用户。

甚至免费公测版本的服务器很快就被热情的测试用户挤爆了。

联想集团副总裁、联想创投集团高级合伙人宋春雨告诉创业邦,AI预训练大模型的出现,成为了近三年以来AI算法创新最受关注的投资机会。

睿兽分析显示,2022年以来,国内大规模预训练模型赛道出现多笔大额融资,单笔融资金额高达10亿元,其中不乏联想创投、君联资本、启明创投、创新工场等知名投资机构。

被网友玩坏了的ChatGPT到底是什么?其背后的大规模预训练模型是怎样一条赛道,为何会受到众多投资机构的追捧?融资热背后,又离真正大规模商用落地还有多远?

火爆全网的ChatGPT,早被资本盯上了,国内有人刚融了10亿

AI如何攻破人类,发人深省的回答

火爆全网的ChatGPT,早被资本盯上了,国内有人刚融了10亿

AI教你怎么找男朋友

火爆全网的ChatGPT,早被资本盯上了,国内有人刚融了10亿

帮你写份周报应付老板

火爆全网的ChatGPT,早被资本盯上了,国内有人刚融了10亿

试一下python写个判断闰年,还有详细的解释,不过看上去像是在某个程序网站抄的

火爆全网的ChatGPT,早被资本盯上了,国内有人刚融了10亿

AI是如何一本正经地胡说八道的

一、“新晋网红”ChatGPT到底是什么?

简单来说,预训练模型(Pre-trained Model)是前人为了解决问题所创造出来的模型。后人在解决类似问题的时候,无需再从零开始训练一个新模型,而是可以利用此前在类似问题中训练过的模型来解决现有问题。

与人们熟悉的语音助手不同,ChatGPT在与人们的对话中可以理解较为复杂的语句内容,比如有多层语法嵌套的句子。同时,ChatGPT拥有一定联系上下文理解语境的能力,可以针对一个问题不断深入交流。令人惊讶的是,ChatGPT既能承认错误、质疑不正确的前提,还能拒绝不恰当的请求。

这就意味着,ChatGPT已经可以实现围绕某个话题,与人类展开一段谈话讨论的可能。

OpenAI官方称,ChatGPT是在人类的帮助下创建并训练的,人类训练师对该AI早期版本回答查询的方式进行排名和评级。然后,这些信息被反馈到系统中,系统会根据训练师的偏好来调整答案。这是一种训练人工智能的标准方法,被称为强化学习。

据国盛证券研报,ChatGPT有着多达1750亿个模型参数,OpenAI主要使用的公共爬虫数据集是有着超过万亿单词的人类语言数据集。

该研报指出,ChatGPT在寻找答案、解决问题的效率上已经部分超越了如今的搜索引擎。ChatGPT或许在未来会改变我们获取信息、输出内容的方式,AIGC(AI生成内容)有望成为数字经济时代驱动需求爆发的杀手级应用。

不过,ChatGPT也并非上知天文下知地理的“最强懂哥”。

据官网显示,ChatGPT目前存在着一些局限性,包括有时会给出看上去正确但荒谬的答案、微调提问的方式会得到完全不同的答案、有时会反复使用某些句子等。

网友也发现,ChatGPT有两个明显的缺点:输入不能有错,解释不够人性化。

所以,这个五天用户突破百万的模型突然遭到编程问答社区Stack Overflow的封禁。

目前,ChatGPT的研究团队也表示将根据用户反馈持续改进模型,未来还有很长的道路要走。

尽管如此,OpenAI依然被视为全球AI领域的顶级机构。

OpenAI在2020年推出的上一代GPT-3在当时就被称之为人工智能领域的一个重要里程碑。

在此之后,OpenAI也开始尝试对GPT-3进行商业化。目前,OpenAI以API的形式向开发者客户有偿提供GPT-3模型,并根据token使用量来收费。目前,基于GPT-3产生的App已经达到300多个。

今年大火的AI绘画也与OpenAI密不可分。

最早,OpenAI曾推出一款DALL-E低代码工具,用户只要提出想法、输入参数,电脑就会自动生成艺术级别的画作。在这一波AI绘画热潮中,还涌现了Midjourney、Stable AI等初创公司,有些公司已经成为独角兽。

正是预感到了大模型的巨大价值,在GPT-3推出的前一年,也就是2019年,微软向OpenAI进行了高达10亿美元的投资。

这也为微软大力推进的云战略吸引来了不少客户。

例如,美国最大的汽车零售平台CarMax利用OpenAI的开发工具把10万条客户评论直接进行了分析,根据客户的表达情绪分类成正面、中性和负面,还提取了关键字摘要,对于公司的战略决策起到了很大的帮助。

CarMax首席技术官甚至表示,如果没有人工智能,这项工作靠人工编辑团队需要耗费11年才能完成。

可以说,OpenAI带给了人们巨大的想象空间。

二、融资火热背后,离真正大规模商用还有多远?

实际上,不仅是最近破圈的ChatGPT,近两年国内也迎来了“大练模型”和“练大模型”的军备竞赛热潮。

其中,自然少不了行业巨头和高校科研机构。

百度发布了产业级知识增强大模型“文心”(参数规模达2600亿),并基于“文心”模型形成了产业全景图。同时,华为联合鹏程实验室等也发布了“盘古”大模型,阿里巴巴达摩院发布了中文语言模型 PLUG。

此外,由北京智源人工智能研究院牵头,汇聚清华、北大、人大、中科院和相关企业共同研发的超大规模预训练模型“悟道”(悟道2.0参数规模达1.75万亿)也于2021年亮相。

“AI预训练大模型的出现,成为了近三年以来AI算法创新最受关注的投资机会。”联想集团副总裁、联想创投集团高级合伙人宋春雨表示,随着超大规模AI预训练模型的技术突破,在自然语言理解方面已经展现出超高程度的可用性,简而言之就是“机器真的懂人了”。

他认为,大规模预训练模型是AI大数据要走的必然之路。从学术界和产业界的角度来看,AI和大数据技术的变化也会非常大。未来两年、最多三年,AI将会有很大能力的提升。

回溯历史,从最早Deep Learning到Alpha go,到Zero 自训练,到Transformer,再到GPT-3, AI在突飞猛进的发展,并不断落地在应用场景中,比如 AI制药、预测化学分子都极大地提高了所在行业的生产力。

启明创投合伙人周志峰也表示,人工智能过去10年发展集中在感知智能,特别是视觉和语音技术的突破。下一个十年,人工智能将走向认知智能,预训练大模型是其核心技术推动力和关键基础设施,让AI吸收更多的知识去理解和思考,最终实现接近人类水平的认知。同时,预训练大模型使得AI从依赖手工调参建模走向可大规模复制的工业化阶段。

大规模预训练模型被投资人看好,也直接反映在了投融资的热度上。

睿兽分析显示,2022年以来,尤其是下半年,大规模预训练模型领域出现了多笔大额融资。

2月10日,澜舟科技完成近亿元Pre-A轮融资,由联想创投、斯道资本共同领投,创新工场跟投。9月26日,智谱AI宣布获得数亿元B轮融资,由君联资本和启明创投联合领投。11月7日,小冰公司宣布完成10亿元新融资。12月6日,聆心智能完成数千万元天使+轮融资,由连星资本领投,图灵创投和智谱AI跟投。

这些企业均将商业落地作为融资后的发力重点,但其落地的侧重点各有不同。

澜舟科技研发的“孟子”模型,用更小的模型规模(10亿参数量)实现了比肩超大模型的性能,能够具备灵活的领域和场景适应能力,在机器翻译、文本生成、行业搜索等场景更利于快速、低成本地落地。

2021年9月,澜舟科技和传神合作的第一个基于孟子预训练模型的“任度”翻译引擎正式发布上线,截至目前澜舟科技已完成了各行业垂直领域20余个翻译模型的开发,覆盖新闻、金融、汽车等领域。

聆心智能目前则主要侧重于游戏、营销、情感三个领域。

聆心智能在12月推出了图灵世界的首个产品“AI乌托邦”,用户可快速定制 AI 角色,只需要输入简单的角色描述,就可以召唤出相应人设的 AI ,与之进行深度对话,还可以命令AI完成相应的任务。

此外,聆心智能还打造了Emohaa情绪疗愈机器人,并与精神心理平台好心情达成合作,落地了国内首款人工智能心理陪伴数字人;还与高端豪华电动车品牌Beyonca合作,打造了新一代智能驾舱助手。

新一轮融资公布当天,小冰公司启动了对旗下人工智能数字员工(AI Being Employee)产品线的年度升级,其中之一就是加强大模型对话引擎。

据悉,目前小冰框架中运行了30万名数字员工,包括万科集团年度优秀员工“崔筱盼”、红杉中国首位虚拟分析师“Hóng”、虚拟歌手“洛天依”等。由小冰框架生成的“小堂妹”等数名虚拟主播,全网播放量均已破亿。

尽管各家的“大炼模型”已经在商业落地上取得了一些成绩,但实际应用情况如何、能解决哪些实际问题仍然在遭受着用户的质疑。

平安科技前沿技术部门负责人王磊就曾公开指出,当前大规模预训练模型在垂直领域存在“致命”问题。

他认为,大规模预训练模型在垂直领域性能达不到要求的原因可能是:大规模预训练模型的训练语料库规模很大,既包含了该领域的关键信息也包含了其他无关信息,使得模型缺少对关键信息的关注。同时,当前大规模预训练模型的机制改进也很少涉及对关键信息的提取。

不同于网友在ChatGPT上的“自娱自乐”,大规模预训练模型一旦商用,假如出现错误,或将会造成难以挽回的实际损失。这也是客户最大的担心之处。

特别是金融行业的客户对上线模型的精度要求很高,不少场景直接使用预加载模型往往很难满足需求。

有投资人也表示,“尽管可以通过置信度评估方法等方式来提升模型的靠谱程度,但距离商用真正意义上的‘好用’仍有很长一段路要走。”

作者:巴里;编辑:子钺

来源公众号:创业邦(ID:ichuangyebang),创新成长,创业兴邦。

本文由人人都是产品经理合作媒体 @创业邦 授权发布,未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

给作者打赏,鼓励TA抓紧创作!

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK