2023中国AI大模型生态图谱，以及关乎明年的八个问题

麻省理工科技评论-2023中国AI大模型生态图谱，以及关乎明年的八个问题

展望 2024 年，随着模型技术的不断成熟，AI 应用将迎来高潮。

d32b4ad968cb46a4aa6d31bbf1fee8e6~tplv-obj.image?lk3s=ef143cfe&traceid=202312291724405656BE405B2251C00ED1&x-expires=2147483647&x-signature=xZLFXLMltnLDTDSb0flWmhuz7eE%3D

图丨中国 AI 大模型生态图谱，此处未穷尽所有模型，仅做关系脉络分析使用（来源：DeepTech）

说明：统计时间截至 2023 年 12 月 20 日；如模型等信息有更新或变化，请读者自行关注。如您希望获得中国大模型全部统计列表，请在文末联系我们。

61e399f6cbf545859cb5afcb0750aa0e~tplv-obj.image?lk3s=ef143cfe&traceid=202312291724405656BE405B2251C00ED1&x-expires=2147483647&x-signature=h%2FsVpmqDWzbJCdyyBy0UXQX%2FjqQ%3D

灵魂力量与统治地位

2023 年，人工智能领域的尖峰成就、热点、热钱与热潮，可以说离不开这五个核心关键词：AIGC、Transformer、ChatGPT/GPT-4、Prompt和 OpenAI。

在 AIGC 领域，Transformer 框架已成为所有追逐目标和实现方法的基础。这个框架的贡献意义重大，一路催生了众多强大的模型，如 Bert、Bart、T5、GLM、Bard、GPT-4、LLaMA 和 Claude 等。它引领了一次真正的人工智能革命，并带来一系列成就与突破。

df09d567817c4f29a7b5b05492b180b7~tplv-obj.image?lk3s=ef143cfe&traceid=202312291724405656BE405B2251C00ED1&x-expires=2147483647&x-signature=p2HdgTU%2B0I62K9m8Ajchw89U%2FF0%3D

图丨大模型进化树（来源：公开资料）

这张图展示了 Transformer 在大语言模型领域的“灵魂力量”，以及 Google、OpenAI 和 Meta 等少数公司的全球研发领导地位。OpenAI 等新锐组织能靠很小规模取得如此巨大成就的部分原因，正是其核心成员曾参与并一路引领 Transformer 研究的创始与发展。

此外，对于大模型在中国的发展，图中作为唯二代表的百度和清华显然透露出一些独特的意义，我们将在后续文章中深入探讨。

ChatGPT 是改变一切的起点，已经多次被选中成为 2023 年的年度关键词。GPT-4 则成为了行业的关键指标，是全球同行追逐的能力标杆和发展目标，尤其是其最近发布的多模态能力版本，以及广被揣测、甚至引发了公司内部动荡的某个更高阶版本。

尽管一些专家仍持有不同的观点，或推崇其他技术流派，但截至目前，Transformer 仍然占据着该研究的主导地位。此框架具有广泛的适用性，最初仅被设计用于解决语言问题，但后来又被证明还可以应用于图像、视频、音频和其他多种模态。

在众多的实践中，Transformer 不仅实现了其原始目标，还为其他技术路线提供了启示或利用价值。但随着 Gemini 等诸多新架构的模型在年终诞生，2024 年单纯的 Transformer 方案是否还能持续其场上灵魂核心的效用，非常值得观察。

c79a42c973444661aa9dbea170fbcdd2~tplv-obj.image?lk3s=ef143cfe&traceid=202312291724405656BE405B2251C00ED1&x-expires=2147483647&x-signature=Si8MZP3MHTK7WPtYO7hFUeQ4vYs%3D

新颖概念与新型应用

关于人工智能技术的现实发展方向，在今年的企业级市场和应用研究领域达成了一些崭新的共识。这些共识大体围绕三个关键概念展开：AI 助理（Co-Pilot）、智能体（Agent）以及多模态（Multimodal）。

AI 助理：工作的新颖副手

微软等公司推广的“AI 助理”概念，即所谓的“Co-Pilot”，已经逐渐在国际上获得追捧。虽然国内对此概念的统一定义尚未形成，但其实质内涵已经在各种项目行动上不断显现影响。如百度、科大讯飞等企业的商业化产品动向便印证了这一趋势——尽可能让 AI 成为一线工作者的随身助手，以提高各种效率和个体能力。

智能体：深化、立体化与系统化

智能体技术是 AI 发展应用的另一个重要方向，它涵盖了一系列的架构和技术解决方案。这些方法旨在将简单的问答交互发展为更加立体和丰满的系统和产品，与更多功能、业务和流程深度融合。这不仅在技术层面会产生许多突破，更有助于生产力工具更新乃至对当代核心商业模式的创新。

多模态技术：跨数据融合的必经之路

多模态技术的重要意义正在日益体现，尤其是在考虑到国内外在该领域的巨大差距时。目前多数国内模型仍局限在语言或其他某一单一模态的运行状态，而实际应用需求则迫切需要更为复杂的多模态数据能力，以让模型能够理解和处理多种类型的数据和信息表示，接入更多的系统和场景。

例如，视觉、听觉、触觉等任何感官类的数字输入与输出都可以被视为某种模态。尽管现有模型能较好地处理文本数据，并理解图像与文本之间的关系，但这只是一个起点。美国在多模态领域的领先地位显著，无论是在图像处理、视觉相关技术、3D 构建、具身智能，还是在工业产品开创等方面都遥遥领先。多模态技术的发展差距正在影响国内行业应用的实施。

47fce467bbcd4ef3af1abf3339e4b7fb~tplv-obj.image?lk3s=ef143cfe&traceid=202312291724405656BE405B2251C00ED1&x-expires=2147483647&x-signature=OEvma%2F%2BA5mR287eT%2Fb2Yz%2BFlk%2BQ%3D

生态成长与滋生乱象

在当前的技术生态中，开源模式的重要性愈加凸显。开源不再是学术界和小范围开发者社区的专利，而是成为了 AIGC 全球性发展的核心动力。国际开源大模型的释出，显著加速了国内 AI 模型的开发、追随与创新步伐。

与开源生态的成长普及相伴随的，是行业对模型能力评估标准的渴求。基准测评（Benchmark）作为一种评估 AI 模型性能的方法手段被广泛推崇。行业企图通过创立各种新的、制定易于实现的题库去快速量化模型的能力分，以此推动模型的定型和排名，并让客户和用户更加方便理解其中的优劣、比较和价值。

尽管基准测评在行业中高度普及，但其标准化程度却并不尽人意。目前的评测体系、标准、题库以及评分方法，虽然多数源自第三方机构，但其专业度、独立性和公允性却饱受质疑。这一局面导致了行业中的一系列乱象，例如对榜单的针对性刷分、刷榜等滥用行为，评价体系的公正、公平性和可依赖性开始成为各界关注的焦点。

另外，伴随着自媒体行业的蓬勃发达，以及许多利益攸关方面的搅动，过度的宣传和吹捧成为了行业的另一大“特色”。这种不加节制的推广方式往往歪曲或夸大了技术模型的实际能力，对于意图选用相关模型的个人和企业来说，可能会造成误解和误导。这样的自证、证明或传播策略不仅未能客观反映技术的真实水平，还正在带来负面影响。

f7c3658fe321459f9290d880c69e98d9~tplv-obj.image?lk3s=ef143cfe&traceid=202312291724405656BE405B2251C00ED1&x-expires=2147483647&x-signature=dJLoW9sIukw6qcXOZkBY23sPC5k%3D

华人智慧与趋势机遇

2023 年，全世界见证了多个科技领域的深度思辨、激烈竞争和人才争夺。在科研、资本和企业界的创新热度空前，显示出各界对各种新科技的高度重视，尤其在人工智能领域，对顶尖人才的争夺愈演愈烈。

过去一年，华人及华裔研究者在 AI 领域取得显著成就，他们主导的高影响力学术论文层出不穷。他们的才华和成果频频摘桂，让媒体和行业领袖们多次感慨中国人在人工智能领域的关键影响力。但是，他们中的大多数却不在中国本土学习或工作，这开始凸显出中国在培养和留住关键人才方面的深层次隐忧。

在中国，仅少数如清华大学等组织在大模型研发方面扮演着关键角色，其毕业生和关联企业在国内 AI 研发领域占据重要地位。今年获得融资的国内 AI 企业，许多与清华有着一定的联系。

在已投身该事业的人才和已成功成立的智能技术组织中，有两个相关趋势有望激发产生更大的时代机遇：

首先是 AI 领域新兴公司形态、创业模式、资源合作方式以及商业模式的变革。例如，Midjourney 以极其精简的团队规模实现了亿级美元的付费收入，成为行业现象级案例。另外，Pika 等新晋热门创业公司也展示了独特的创业节奏和产品上线策略，许多类似经验还尚未在中国市场涌现。

其次，是从“高精尖研究挑战”转向“应用机会挑战”的行业热点变化。今年在技术领域已经迎来了多重、重大的技术性革新，但其中许多仍处于研究和积累量变的阶段。影视或游戏行业就是一例，它们在生产力提升方面已经悄然进行了几个月的尝试，AI 技术正在提高这些行业一部分生产管线的效率，甚至在某些局部实现了对人类员工的替代。明年中国公司们在这类行业实战方面的机遇和挑战将会是关键性、决定性，甚至决战性的。

cbe52f01d3e64d13bcc87a6235f4c006~tplv-obj.image?lk3s=ef143cfe&traceid=202312291724405656BE405B2251C00ED1&x-expires=2147483647&x-signature=knsFHPBmTVlITrCagn%2FA9spnNCo%3D

管控风险与人类对齐

在今年，人们探讨人工智能的未来时常常遭遇两极化的辩论：一边是对技术潜力的高度乐观，另一边则是对潜在威胁的深度忧虑。在国际政治舞台与舆论台上，今年的争论特别集中在 AI 的风险和威胁，一系列媒体报道、社会事件、提案、政策甚至立法，以及意见领袖如埃隆·马斯克等的警示性言论，都反映出对 AI 安全的极度关注。

相较之下，国内对于这一议题的敏感程度相对较低。这并非表明国内对 AI 的风险不敏感，而是可能缘于手头技术尚未到达一个显著的担忧阈值。但随着技术的不断进步，一旦国内模型也出现新的突破性发展或智能涌现，国内的思想碰撞和争议声音也可能随之增强。一些企业和相关部门正在未雨绸缪。

AI 的风险问题可以从很多维度展开。比如内容的安全性和使用安全性；偏见和隐私侵犯问题；错误应用带来的衍生风险，如恶搞、虚假信息、诈骗、网络骚扰和仇恨言论；责任归属问题；以及所谓“文明风险”，包括了机器意识的考虑。此外还有对社会经济造成的冲击风险，例如劳动力市场的替代问题、工人的焦虑、就业市场的混乱，以及监管层面的应对策略。目前，经过人工智能峰会等诸多努力与尝试，各国政府在监管层面已有所行动，并且在一定程度上达成了初步的共识。

那么，面对智能的风险，技术层面的应对解决策略是什么呢？此时必须提到的就是“对齐”这一概念。在人工智能领域，“对齐”技术是指引导人工智能系统的行为，使其符合设计者的利益和预期目标。人工智能对齐的主要研究内容包括向人工智能灌输复杂的价值观念、发展诚实的人工智能、监管方式的扩展、对人工智能模型的审核与阐释，以及对人工智能系统有害倾向的防范，例如防止其发展出对控制权的渴求。

在技术方面，对齐技术的研究包括人工智能的可解释性、稳健性、异常检测、不确定性量化、形式验证、偏好学习、安全攸关系统工程、博弈论、公平性等。这些研究旨在帮助人类检测规则博弈，并引导人工智能系统朝向安全合理的目标运行。

在行业行动方面，人工智能对齐已成为现代人工智能系统的一个开放性问题。人工智能研究学界和联合国呼吁加强相关的技术研究和政策制定，以保证人工智能系统符合人类价值。我们需要建立健全人工智能安全治理体系，对人工智能技术本身所致的内生安全、人工智能应用中的衍生安全以及影响和决定人工智能前景的发展安全问题进行系统性治理，确保人工智能安全、可靠、可控。

“对齐”原本指的是如何将 AI 生成的结果优化至人类可接受或喜欢的状态。但与时俱进地，该术语的含义已经拓展，它现在涉及的是如何确保 AI 的发展方向与人类价值观、安全性和控制性等方面的一致性。

值得关注的是，在 OpenAI 近期的“哗变”事件及其结论中，公司承诺将在技术“对齐”上进行更大的投入，努力将其打造成一个全球性的专门体系。明年国内的模型们也应该、且必须在相关方面做出实质性的共同努力。

368f6f99b0fa440bbcdc881ea8d8e621~tplv-obj.image?lk3s=ef143cfe&traceid=202312291724405656BE405B2251C00ED1&x-expires=2147483647&x-signature=v7Rs3t99y2eV461llYlmZfmB%2BWA%3D

天生难题与重重挑战

在人工智能的发展潮流中，特别是以 Transformer、Diffusion 等为基础的生成类模型展现出巨大的潜力的同时，即将面临更严苛的难题与挑战。

严肃正视大模型的幻觉问题

在人工智能的语境中，“幻觉”一词被核心技术成员首次创意提出，用以表示模型可能出现的非预期输出问题。这种精心选择的用词尝试去缓解对人们和行业可能产生的负面影响，表明即使是最先进的机器学习模型，也难免会出现“类似人类”、“可以理解的”、“认知误差”等现象。

然而幻觉问题远非小事，它凸显了当前模型在发散性与准确性之间的弹性。业界正致力于通过各种技术路径应对，包括但不限于创造事后补丁或预防机制，挂载额外的模块或系统，以及在模型出现偏差时及时介入的控制策略等等。这些尝试尽管很有价值，但至今尚未找到彻底解决问题的答案。

算力需求及其带来的挑战

今年，算力需求的急速增长牵动了整个行业，从国家层面到企业，都在算力的漩涡中经历波折。循环神经网络、Transformer 模型等对算力的饥渴程度呈指数级增长。以 OpenAI 的新计划为例，行业内有企业高管曾表示 OpenAI 的需求量级可能达到令人恐怖的“千万级”GPU 算力集群——这个数字甚至远远超出了英伟达的年产量。中国国内的算力卡存货、技术水平、产能等各方面问题更是尤其突出，甚至可能导致明年大模型的开发步伐不得不被迫放缓。

能源消耗与环境影响

能源消耗与环境影响是另一前沿议题。例如，GPT-3 模型训练耗电量达 1.28 吉瓦时，相当于 120 个美国家庭年用电总和，伴随而来的是 550 吨二氧化碳的排放量。

根据《麻省理工科技评论》内容，Hugging Face 和卡内基梅隆大学的研究人员的一项最新研究发现，使用人工智能模型生成的图像，所消耗的能量与给一部智能手机充满电所需的能量差不多；图像生成，是能源消耗和碳密集度最高的人工智能任务。使用强大的人工智能模型（如 Stable Diffusion XL）生成 1000 张图像，所产生的二氧化碳大约相当于一辆燃油汽车行驶 4.1 英里。

这样的操作若无法有效管控，势必引发环境问题的关注。

成本问题的现实掣肘

从创立角度看，组织和训练一个大模型所需的投入早已达到了数百万美元为起点的水平，这对于多数企业来说是难以承受的。即使技术上有所突破，如算法压缩、分流、模型拆分等手段能够降低一些训练或推理成本，但持续的成本问题依然如泰山压顶。

国内参赛方的应对努力已有不少，除了广开财路吸引更多资本外，如智谱 AI、百度、华为等国内软硬件厂商的深度合作，建设了绕开算力“卡脖子“的一些崭新思路，值得关注。

从应用角度看，模型应用改造的经济成本也不可忽视。行业客户对 AI 的兴趣虽然高涨，但学习、实验、数据整理与部署等环节所需成本，以及培养新人才的费用，使得投入产出比常常不尽人意。市场上资金紧张，企业在创新步伐上不得不谨慎。

ce640ae375404fbbad6a4cc8e0907f09~tplv-obj.image?lk3s=ef143cfe&traceid=202312291724405656BE405B2251C00ED1&x-expires=2147483647&x-signature=QWuo9BGG43O6B%2FxQZKZ6dwoaeu4%3D

科研创造与不懈努力

在这一波技术革新浪潮中，新型研究机构而非巨头企业成为了驱动力量的主体。

在美国的大模型生态系统中，OpenAI 无疑是一个创新性实体的代表，它以一种新型组织的形态存在，对整个领域的进步起到了不可或缺的推动作用。而微软研究院与谷歌 DeepMind 等巨头企业的研究机构，作为以科研为导向的组织，也处于核心驱动位置。

在中国，科研驱动的特点更为显著。清华大学及其他领先的高等教育机构和新兴的人工智能研究机构是科研的先锋力量。尽管拥有算力资源的互联网巨头在技术研发方面投入巨大，但它们在科研创新能力上尚未形成主导地位。

在技术方面，模型的泛化能力是当前研究的关键词。技术目标在于不断提升模型在不同任务下的泛化能力。而应用层面的泛化，则是另一回事。将某些人工智能应用，如文本生成技术，拓展到更广泛的生产流程和环节，是应用泛化的体现。

与此同时，业界还在探索如何将经典 AI 技术（如强化学习）与新兴技术（AIGC）相结合。例如谷歌近日推出的 Gemini，就是一次大的改变尝试，虽然具体成效仍有待观察。

“工程化”是推动技术成功落地的又一关键，在中国这一领域似乎尚未得到足够的重视。工程化不仅仅是算法和模型的开发，还包括将模型部署到适当的网络环境、提供良好的架构，并构建支持未来发展的框架和体系。在全球范围内，OpenAI 在工程化方面表现卓越，这一点从 GPT 模型的性能和其应用生态中可见一斑。

OpenAI 以其算法研究能力而闻名，但同样不可忽视的是其工程团队的贡献。CEO 和 CTO 等高层领导在产品开发与算法工程协同工作中起到了重要作用，保证了模型能被广泛应用，并提升了用户体验。

智谱 AI 或许它在工程能力上不如对手，但从最初智谱 AI（GLM）就没有选择和 OpenAI 走完全相同的技术路线，到现在，它仍是一个相对独立的旗帜，算是中国的一股中坚力量。

目前很多 AI 创业公司的分工可能并不合理，在融资以后他们接受了一些任务，所以他们有很多做商业化设计、有很多做客户服务、市场开拓、或设计行业产品，导致他们的精力不够聚焦。所以到目前为止，用户很难像用 OpenAI 一样去惊喜地使用它们的 C 端产品。

还能看到一些努力，比如 Plugin、GPTs 等，也是 OpenAI 提出的一些创举。即便大家也都不清楚这些东西的终局，但是不可忽视的，他们指明的是有可能会带来用户交互的革命，就是所谓的超级 APP，或消灭老产品。

78134554297b4b98a94aea985eb96715~tplv-obj.image?lk3s=ef143cfe&traceid=202312291724405656BE405B2251C00ED1&x-expires=2147483647&x-signature=BWGEjAIJUl9TT4uDkHF%2BoAkqBk8%3D

永续微调与 MaaS 当立

在中国市场，对于大型人工智能模型的应用，业界持有乐观的信心。

这得益于三大支柱：无比广大的市场与行业、强大的定制化服务能力、以及充足的应用型人才储备。在这样的背景下，国产大模型在 2024 年预计将迎来关键的应用部署战役。

在技术层面，微调（Fine-tuning）会是应用发展的关键。它是从传统的人工智能迈向新时代的一个标志性进步。微调的价值在于，它能够将一个通用模型转变为针对特定任务高效的专用模型。这种方法在行业应用、企业应用以及垂直领域均显示出巨大的潜力。值得注意的是，自 2023 年下半年以来，微调的成本已大幅降低，为其广泛应用铺平了道路。

模型即服务（MaaS）的概念在行业内得到迅速发展，许多大型企业已在其发布会上提及这一概念。它涉及将云资源与 AI 部署相结合，使模型能够直接提供服务，这被认为是具有颠覆性的，有望重构众多应用领域。

在未来，混合部署和端侧应用预计将受到更多的关注。手机制造商、半导体公司如高通、英特尔，以及联想、汽车制造商等都将开始探索在端侧的应用。

Google 从夏季开始便与 OpenAI 区分开来，推出了不同规模的模型，以适应从小型设备到云计算的不同需求。这种多层次、可伸缩、适应性强的解决方案与将所有计算任务集中到 OpenAI 的做法形成了鲜明的对比。

这一趋势背后，揭示了一个行业共识：开源的下一步不仅仅是追求“更大”，企业的部署也不必然走向“更大”。谷歌们的方案开始得到广泛支持，因为它为大模型在端侧的利用提供了可能性，而这不会破坏现有的商业结构。

在各个垂直行业中，金融、电力、工业和医疗等领域已经出现了一些典型的应用案例。教育、汽车、生活服务和直播等领域虽在中国市场有突破，针对人工智能大模型的应用，业界的信心源自于其庞大的用户基础、市场潜力以及日益增强的定制化服务能力。随着技术的持续进步，这一领域的发展前景备受看好。然而，真正的挑战在于如何将模型的能力转化为实际应用，这是当前面临的现实问题。

7fb20a0cae59412781719e27bcb2056a~tplv-obj.image?lk3s=ef143cfe&traceid=202312291724405656BE405B2251C00ED1&x-expires=2147483647&x-signature=0kqunjdfM9VPKsnFl5XLtRnp8Fk%3D

结语

2023 年，人工智能领域经历了极其活跃和充实的一年。在模型技术不断突破的同时，应用创新也不断涌现，既重塑了各行各业，也极大拓宽了人工智能的影响范围。

从模型研发来看，Transformer 框架在过去一年进一步巩固了其在人工智能领域的主导地位。新的模型不断涌现，如 GPT-4、Claude 等，极大推动了 AI 能力的发展。与此同时，计算能力的增长也为 AI 技术提供了更强大的驱动装置。

在应用创新方面，助理式 AI、智能体以及多模态技术等新概念在企业界得到广泛探索，预示着 AI 即将切实感知和助力日常生产与工作。此外，垂直行业中的众多案例也显示 AI 正在加快渗透各个领域。

尽管 AI 技术已经取得长足进步，但安全与对齐问题依然无法忽视。通向可信赖的 AI 道路还很长。各方面需要为此付出更大努力，例如强化安全机制、规范评测标准以及加强对人工智能的监管。

展望 2024 年，随着模型技术的不断成熟，AI 应用将迎来高潮。同时，计算资源不足、成本问题以及业界影响力分割等挑战也将随之浮出水面。如何推动 AI 能力的持续创新，且使其成果惠及各行各业，仍将是 AI 发展的重中之重。新一年，人工智能研究领域必将迎来更多的新发现与成就。

我们相信，只有通过国际合作与共同努力，人类才能把握人工智能给世界带来的机遇，同时化解可能带来的隐忧与风险。

我们将持续关注中国的相关发展，继续梳理完善国际与中国的大模型生态图谱，我们认为，中国需要加强原始创新能力，培育更多世界一流的人才和学术团队。同时应注重 AI 在关键基础设施和核心产业的应用，以实现可持续发展。只有通过不断学习塑造自身优势，中国 AI 事业才能在国际舞台上展露风采。

如您希望与我们交流或有任何问题，以及获取中国 AI 大模型企业统计列表，请与我们联系：[email protected]；+86 18813083977。

Recommend

Thinking about Go Module

Xiaomi SU7 - Xiaomi's first ev, with ambitions to be the Tesla of China | Produc...

357期《澳门挂牌成语:南拳北腿》开奖时间2023年12月23日(星期六）晚9:30开(农历十一月...

用电动半挂车取代柴油卡车会导致充电时间和负载损失转嫁给客户

Tecno Spark 20 Pro+推出Helio G99 Ultimate，这是Apple的类似灵动岛的功能

【玩转腾讯混元大模型】怎么说?我用混元AI大模型开发了个IDEA插件 - 杨不易呀

Submitting - Share your products. Grow your users | Product Hunt

新《公司法》2024年7月施行，注册资本须自公司成立起5年内缴足

Apple's 'Napoleon,' from Ridley Scott, tops $200 million in global box office re...

8 Key Financial Technologies Of 2023

About Joyk