3

全球AIGC明星公司大盘点:谁会成为头号玩家?

 1 year ago
source link: https://www.36kr.com/p/2136697872943495
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

全球AIGC明星公司大盘点:谁会成为头号玩家?

新眸·2023-02-18 05:00
受chatGPT影响,今年AIGC赛道依旧火热。

受chatGPT影响,今年AIGC赛道依旧火热。它指的是利用人工智能技术生成内容,AIGC也被认为是继UGC、PGC后一种新型内容生产方式。 

流行的原因有很多因素,除了生成逼真图像、视频和文本的能力,用更高效的方式生成创意内容,AIGC在办公、娱乐、医疗、金融等领域都有着不小的潜力,去年刚兴起的AIGC浪潮,一度让不少业内人士认为,它的出现,将掀起一场革命性科技浪潮。 

过去几年里,生成式人工智能的普及率一直在稳步增长,并且这种趋势很可能会持续下去。原因在于,就像前面说的,数据和计算能力的可用性不断提高,人们对更高效、更有效的方式来生成创意内容的需求等因素,正在推动生成型人工智能的普及。 

作为一个快速发展的领域,研究人员和工程师正在努力推进这项技术,新的突破不断出现。由于AIGC目前的主要目标是通过学习数据分布的规律,进一步细分包括 图像、视频、音频 等生成,以及 自然语言 生成,比如生成文本或像搜索引擎一样通过信息整合提供对话、问答。 

除此以外,AIGC还能够作为自动编码器,或者基于对抗学习,让机器学会生成与真实数据相似的样本,这项技术也已经被广泛运用到图像、音频和文本等领域。 

如今已经有多家公司基于这项技术做出了重大贡献,包括OpenAI、谷歌、NVIDIA、微软和Facebook等,国内的互联网公司中,百度上线了中文版的AI绘画工具“文心一格”,阿里巴巴、京东等拥有海量数据的大厂也在陆续入局:

v2_00f254e8f5b54da7a6b2f46e5d6d7b8b_oswg164148oswg864oswg650_img_000

当然,还有许多初创公司正在开发生成型人工智能的创新应用,这里举一些例子:

v2_b29fab90a2174da09ae3d3c549ff5119_oswg252616oswg864oswg650_img_000

市场的火热,让包括a16z、梯度风险投资、科斯拉风险投资公司、软银、红杉等知名投资机构纷纷入局。去年10月,Stable Diffusion背后的Stability AI宣布获得1.01亿美元来自Coatue和光速的投资,投后估值攀升至10亿美元。相关领域的其他多家公司获得了大量融资,比如:

v2_e15934a175ef4cabbd32b986d23cd653_oswg176145oswg864oswg650_img_000

总的来看,这些公司成功的因素都有一些共性特征,包括获取大量高质量数据、在人工智能和机器学习方面的强大技术专长,以及为一系列行业和用例开发用户友好且有效的应用程序的能力。此外,还有保持对道德考虑和负责任地使用技术,每一个参与者都需要重视的是长期价值。

Open AI:呼声最高的重量级选手

ChatGPT火爆全球,让open AI成为AIGC领域中估值最高的一家公司。追溯到这家公司创始人,20岁的山姆·阿尔特曼从斯坦福辍学创业,28岁晋升为YC孵化器总裁,37岁凭借ChatGPT被外界看作具备划时代的意义。

自从今年1月底,微软宣布对Open AI追加第三轮投资,数额或高达一百亿美元,Open AI的身价已经飙升到290亿美元。据了解,上线5天的ChatGPT,用户数就突破百万,2个月MAU破1亿,也意味着更高的服务器带宽成本。

微软为了在AI领域和Google、Meta等对手竞争,Azure被推向前台,作为Open AI的独家供应商,提供了多项优惠待遇。但即便如此,Open AI还没赚到过钱。ChatGPT和旗下其他AIGC产品都处于免费公测阶段,目前仅有卖AI软件赚的千万美元营收。

举个简单例子,微软对单个100 GPU的收费是每小时3美元,生成一个单词的费用约为0.0003美元,摩根士丹利甚至认为,ChatGPT一次回复可能会花掉2美分,大约是谷歌搜索查询平均成本的7倍。

这种情况下,Open AI亟须找到商业化路径来实现盈利,比如近期官宣了专业版本ChatGPT Pro,定价将为每月每月42美元(约285人民币)。同时,微软还计划将ChatGPT整合进旗下搜索引擎Bing中,Office产品也将陆续整合Open AI的其他AIGC产品。

微软投资OpenAI的逻辑也很好理解,生成式AI的大量资金最终往往都流向了基础设施层——以AWS、Azure、GCP为主的云厂商,以及以英伟达为代表的GPU厂商。应用层厂商将大约20%~40%的收入用于推理和模型微调。

据A16Z估计,这部分收入通常直接支付给云厂商或第三方模型提供商,第三方模型提供商也会将大约一半的收入用于云基础设施。因此,总的来看生成式AI总收入的10%~20%都流向了云提供商。

根据《财富》报道,在OpenAI的第一批投资者收回初始资本后,微软将有权获得OpenAI 75%的利润直到收回投资成本;当OpenAI赚取920亿美元的利润后,微软的份额将降至49%。简单来说,OpenAI把公司借给微软,借多久取决于OpenAI赚钱的速度。老牌巨头与科技新星的强强联手,微软希望在下一个AI十年向谷歌及其他科技巨头发起挑战。

Anthropic:含着金钥匙出生的新生代选手

很多人觉得ChatGPT会颠覆搜索引擎,微软宣布旗下所有产品将全线整合ChatGPT之后,谷歌也开始开发自家的对话模型。

去年底,AIGC火的时候,谷歌的云部门向AI初创公司Anthropic投资了约3亿美元,获得10%的股份,Anthropic的最新估值逼近50亿美元,成了仅次于OpenAI的领域独角兽。

在此之前,2021年,Anthropic获1.24亿美元A轮融资,2022年获加密货币交易所FTX创始人Bankman-Fried领投的5.8亿美元融资,两轮融资后估值已达40亿美元。

据媒体透露,Anthropic打造的一款ChatGPT产品已经处于测试阶段。谷歌为了追赶微软,打算将Anthropic的数据密集型计算工作引入数据中心。相似的味道出现了,Anthropic近日宣布谷歌云作为“首选云提供商”,共同开发AI计算系统。这不能不令人联想起三年前,微软向OpenAI注资10亿美元,成为OpenAI的独家云提供商。

Anthropic和ChatGPT开发公司OpenAI关系暧昧,前者的创始人大部分都是从OpenAI离职的的几位高管:2020年底,OpenAI的早期员工Dario Amodei带着10名员工加入“硅谷叛徒”俱乐部,拿着1.24亿美元创办Anthropic。

目前正在开发通用人工智能聊天机器人Claude,Anthropic 将拿着这笔新融资继续计算密集型研究,来开发可操控、可解释且稳健的大规模人工智能系统,与此同时,谷歌云部门将提供计算能力和先进的人工智能芯片,Anthropic 计划使用这些芯片来训练和部署其未来的人工智能产品。

Hugging face:主打社区的成长型选手

v2_7e6e8159631b465092dbc4f8395578e7_oswg34793oswg866oswg362_img_000

Hugging Face是一家非常活跃的人工智能创业公司,早期凭借 Transformers 模型库和非常强大且活跃的人工智能社区被业内外关注。

创始人Clément Delangue来自法国,从17岁开始连续创业,又折腾过好几个创业公司。Hugging Face最开始的方向是对话机器人,从Betaworks和杜兰特等拿到天使融资,但项目并没有多大起色。

2018年,谷歌发布基于transformer机器学习方法的自然语言处理预训练模型BERT,标志人工智能你如了大炼模型参数的预训练模型。之后他们为了训练机器人的NLP能力,开发了一个部署机器学习模型的底层库,并在GitHub 上开源,赶上Transformer这波潮流,一下子就火了。

就像存放Git repo的地方叫Github,在 Hugging Face Hub,可以找到上万个已经训练好的模型,用户可以在 Hugging Face上托管和共享ML模型、数据集,也可以自己搭建部署新的模型。

v2_3f7c6840245745e0a51534b9835328c0_oswg373426oswg864oswg516_img_000

关于自然语言处理的论文很多,而且每个实验室所开发出来的模型,如果要移植到自己的应用程式上面也很困难,Hugging Face试图解决这类的问题。他们把这些不同架构的模型,包成规格统一的 API ,让工程师可以更容易使用。

除此以外,Hugging Face提供的Library让用户更方便地使用Transformer做自然语言处理的应用程式,其中,最常用到的神器比如Transformer、Tokenizers和Datasets,能够提供开发策略,进行前后处理资料收集等功能。

完整的生态系和社群让人们觉得,几乎可以只使用Hugging Face,就做完大部分最困难的Transformer。

截至目前,Hugging Face 上共有近13.5万个预训练模型,在 GitHub 上拥有超过 1660名贡献者,54000名用户,81000颗stars和18000次forks,平均每天有超过5万人从 Hugging Face下载模型。

v2_c90475d03941499888ae0095b4752c62_oswg326825oswg864oswg449_img_000

2019年底,Lux Capital的Brandon Reeves遇到Delangue,投了8000万美元。截至2022年5月,Hugging Face获得1亿美元C轮融资,由Lux Capital领投,Sequoia US、Coatue 等跟投。

目前Hugging Face目前有数千名客户和机构,包括微软、英特尔、高通、谷歌和彭博社等。虽然上一年收入还不到1000万美元,但上一轮融到的4000万美元依然存放在公司银行账户,并且据透露这家公司在去年年中已接近盈亏平衡,估值达到20亿美元。

Jasper:典型的面向PLG选手

v2_f9765bf2282d44cfba68857e4be334bf_oswg124032oswg866oswg454_img_000
v2_f9765bf2282d44cfba68857e4be334bf_oswg124032oswg866oswg454_img_000

ChatGPT之前,Jasper才是一度最被看好的“ AI 文字生成”工具。它能用来编写视频脚本、广告营销文本额电子邮件,以及其他具有重复性特征的文字工作。

这是一家成立在2021年的年轻公司。创始人Rogenmoser 认为Jasper是激进的,最初的想法是想做一个招聘软件,后来和朋友船板了一家小型营销公司,为网站内容、Facebook 广告和搜索引擎优化提供文案服务。Rogenmoser 和他的朋友都不具备这些技能,所以他们更多是找外包。

那时候,Rogenmoser在Twitter上看到人们谈论 GPT-3,这一模型在AI圈内十分火热,Rogenmoser和他的合伙人们抓住了这个风口,制作了一个对话式AI的原型,并把它卖给企业用户。

创立一年团队只有9人,10个月后扩大到160人。当时The Information报道,预计年营收将超过6000万,同年10月,Coatue 与 Insight Partners、Bessemer Venture Partners 等公司一起参与了8500万美元的A轮融资,Jasper成了历史上最快达到独角兽的公司之一。

去年下半年,Jasper又获得1.25亿美元融资,身价达到15亿美元,与此同时它的客户也达到10万名,资本市场对 Jasper 的欢迎一目了然。首席执行官 Dave Rogenmoser 称,融资用于打造Jasper的核心产品、改善客户体验、并将 Jasper 的技术引入更多应用程序,比如新推出的图像生成产品Jasper Art。

ChatGPT是Open AI 基于自己的 GPT-3 大模型所做的聊天机器人应用;而Jasper的技术底层也是 OpenAI 的 GPT-3。也就是说,Jasper 是在竞争对手的平台上,建立了自己的业务,这也是它未来发展的风险来源之一,意味着,对于Jasper的客户来说,他们是否会持续使用,很大程度在于使用效果有没有比对手更好,以及OpenAI开放的API是否能被不同地区接受。

Inflection AI:有点东西但不多型选手

v2_63ea1edf60984a60aa085ab6a774d392_oswg297155oswg866oswg487_img_000

Inflection AI是一家在通用建模领域的私人企业,作为一家机器学习初创公司,它开发了多个神经网络,可以优化处理自然语言文本,提供AI人机交互领域的一站式解决方案。

据了解,这家公司在去年5月获得了2.25亿美元的A轮融资,资金来源尚不清楚,估值超过12亿美金。Inflection的融资规模,反映了构建复杂AI系统的高成本。据估计,OpenAI 已花费数百万美元开发 GPT-3,该公司的系统可以在给出提示的情况下生成类似人类的文本。

Mustafa Suleyman是Inflection AI的CEO兼联合创始人,同时也是DeepMind AI实验室的创始成员,并在谷歌收购 DeepMind 6年之后,成为谷歌人工智能产品与政策副总裁,

在去年的CNBC简介中,Suleyman希望构建的产品能够简化人们与机器交流的需要,利用人工智能帮助人类与计算机“对话”。他声称Inflection在开发一套新技术,最终将使任何人都能用简单的语言与计算机交谈。目前尚不清楚Inflection会将其产品出售给哪些潜在客户、产品的价格和面世时间也未公布。

将人类意图翻译成计算机语言,即使是当今最好的聊天机器人和语音助手也没有兑现,但Suleyman认为,人工智能的未来进步将在未来五年内实现直观的人机界面。用联合创始人Dario Amodei的话来说是“探索机器学习系统的可预测扩展特性”。

stability.ai:开源、开放的技术型选手

v2_02a6a39c29c04495a06ec551fde838a1_oswg67798oswg864oswg504_img_000

同样是去年10月,爆火的文本到图像模型Stable Diffusion背后的创业公司Stability AI 宣布,在Coatue、Lightspeed Venture Partners和O'Shaughnessy Ventures领导的一轮融资中筹集了1.01 亿美元。这轮融资后,Stability AI公司的估值已经到达10亿美元。

这家公司的身世也很有意思。在AI技术研究受制于有限的算力和资金的时候,Open AI为AI研究人员提供了相对自由的研究环境,以及大量的资金与算力做支撑,可以帮助技术研发部门专心深入AIGC。

但由于2020年时的内部问题,造成无法支撑非盈利项目的后续运营,导致大批核心研究员出走,基于Open AI的企业价值理念,曾担任工程师、分析师的Emad Mostaque创办了Stability AI,希望延续非盈利模式的、同时更加开放的经营理念。

Stable Diffusion是一个根据文字生成图片的AI技术模型,只需要几秒钟的时间,就可以生成分辨率、清晰度高,同时不失真实性和艺术性的图片。它有一个由4000多个 Nvidia A100 GPU 组成的集群,用来训练 AI 系统,其中就包括 Stable Diffusion。它的维护成本相当高,Stability AI 的运营和云计算支出超过了 5000 万美元。

Mostaque表示,本轮融资的资金将用于为客户部署更大规模的 Stable Diffusion 的定制版本,并会投资于更多的算力上。这笔资金还将用于雇佣更多的员工,预计在未来的一年内,公司的员工将从100人增加到300人左右。

除了 Stable Diffusion,Stability AI 还有其他可商业化的项目正在进行中,包括生成音频、语言、"3D" 甚至视频的人工智能模型。其中之一就是目前已经公开的 "Dance Diffusion",它可以通过对数百小时的现有歌曲进行训练来生成音乐片段。

参与此轮投资的 Coatue 公司在声明中表示:"在 Coatue,我们相信开源的人工智能技术有能力释放人类的创造力,并实现更广泛的利益。我们很高兴能成为 Stability AI 旅程的一部分,我们期待能看到全球各方用 Stability AI 的技术创造出什么。"

Character. AI:创始人是谷歌20年老员工

v2_4e0229a56737482890973c397c0abb78_oswg495841oswg864oswg531_img_000

Character.AI的创始人Noam Shazeer 是前谷歌首席软件工程师,也是Transformer论文作者之一。此前他在2000年底加入谷歌,直到2021年最终离职,是谷歌最重要的早期员工之一。

另一位联合创始人Daniel De Freitas也是前谷歌研究人员,他们之前曾在该公司的内部 LaMDA 系统上工作。这家公司成立于2021年10月,对于这家公司的组织架构和业务模式,外界能获取的信息量较少。据报道,Character AI已经创建了一个基于 LaMDA 的神经语言模型聊天机器人Web应用程序,能够生成类似人类的文本响应并参与上下文对话。

简单来说,产品为用户提供了一种与虚拟聊天机器人chatbot,任何人都可以在其中与虚拟的唐纳德特朗普、埃隆马斯克、臭名昭著的“绝命毒师”沃尔特怀特和许多其他角色聊天。

据The Information报道,这家公司目前在寻求筹集2.5亿美元融资。目前投资者包括Gmail创始人Paul Buchheit和前GitHub首席执行官Nat Friedman,估值也达到10亿美元左右。报道称,它已经与包括红杉资本在内的顶级风险投资公司进行了会谈,讨论仍处于早期阶段,他们是否会成功还有待观察。

Adept:另辟蹊径的黑马型选手

v2_5ddc413c1fa34440bdd088285072f5ab_oswg335279oswg864oswg527_img_000

去年4月,Adept AI成立,业务专注于创建一种基于与文本生成工具相同核心技术的机器人,由首席科学家Ashish Vaswani和CTO Niki Parmar,以及现任CEODavid Luan三人共同创立。目前市场推测估值在10亿美元左右。

他们都曾是谷歌大脑的核心员工,其中Luan是GPT-2、PaLM 的论文作者之一,参与了 GPT-3 的部分工作;CTO和首席科学家都是Transformer 论文作者之一,还聚集了一大批曾在谷歌工作的技术人才。

这家公司去年从 Addition和Greylock 等获得融资 6500万美元,投资人包括 Scott Belsky(Behance 创始人)、Howie Liu(Airtable 创始人)、Chris Re(斯坦福)、Andrej Karpathy(特斯拉 Autopilot 负责人)和 Sarah Meyohas,Luan打算把这笔资金将用于通过一种既能读写又能操作的转换器,进一步优化智能技术。

谈及离开谷歌创业的原因,Luan认为,在谷歌,我们训练出了越来越大的 Transformer,目标是最终构建一个可以支持所有 ML 用例的模型。但过程中,团队发现了一个主要限制:像 GPT-3 这样的模型可以写出很棒的散文,但它们无法在数字世界中采取行动。

你不能要求 GPT-3 订机票,给供应商开支票,或者进行科学实验,或者使用Airtable、Photoshop、ATS、Tableau等工具完成工作。所以有媒体指出,Adept的目标更像是协作智能,它选择了和其他通用人工智能公司不同的道路,前者是建立AI工具,来帮人类完成任务。这种方式更容易实现。

“变压器及其应用代表了近代史上迈向通用智能的最大一步。但我们认为,真正的通用智能需要能够行动的变形金刚——而不仅仅是读写。”Luan说,“在 Adept,我们正在训练一个模型来使用人们今天使用的所有软件工具和 API。”

百度:来自中国本土的重量级选手

v2_aaa815680ee1473e85f0178cbc7ea4bb_oswg359360oswg864oswg504_img_000

主打AI的百度,绝不会错过这场科技盛宴。虽然ChatGPT在国内已经把AIGC推向爆发前夜,不过目前阿里、腾讯、字节等巨头,及科大讯飞、天娱数科等细分领域企业的布局大多仍是围绕提高工作效率上。

据了解,早在2019年,百度已经发布国内首个正式开放的预训练模型ERNIE1.0,并持续投入于大模型的研发升级;2021年初,ERNIE 3.0升级为知识增强千亿大模型鹏程-百度文心。

文心大模型基于大规模知识和海量无结构数据融合深度学习,吸收海量文本数据中词汇、结构、语义等方面的知识,并通过持续学习不断提升理解能力和生成能力,实现视频、歌词、艺术画等创意作品的自动生成。

去年末,文心大模型迎来全面升级。在模型层一次性发布11个大模型,涵盖基础大模型、任务大模型、行业大模型的三级体系;工具与平台层,升级大模型开发套件、文心API和提供全流程开箱即用大模型能力的EasyDL和BML开发平台;新增产品与社区层,包括AI艺术与辅助创作平台“文心一格”、产业级搜索系统“文心百中”和旸谷社区面向个人用户。

ChatGPT之后,近日百度也推出大模型新项目“文心一言”,公布消息当天,港股股价在一天内大涨15%,美股股价涨幅也达到了12%。据百度确认,文心一言计划于今年3月完成内测,面向公众开放。而按照谷歌和微软加快推出类 ChatGPT 服务的节奏,文心一言开放内测还有可能提前。多家企业宣布介入文心一言,这也推动了百度的股价上涨。

Synthesia:主打视频的硅谷型选手

v2_e07c3f962914448b968f267899736ebf_oswg212631oswg864oswg522_img_000

Synthesia在2021年末就宣布B轮融资结束,由硅谷风险投资公司Kleiner Perkins领头,GV和Firstmark Capital、LDV Capital、欧洲最大的科技创业孵化平台Seedcamp以及MMC Ventures参投。本轮融资完成后,Synthesia融资总额达5000万美元。

早在2021年4月,Synthesia就完成筹集1250万美元的A轮融资,官方至今并未透露公司的具体估值。随后新增部分功能,用户可以轻松创建自己的虚拟人物形象。目前,Synthesia有1000个自定义人物形象。里帕贝利以安永会计事务所为例,它利用Synthesia平台创建虚拟形象,制作视频,与35家合作伙伴进行内部通信和交流。

不过具体到产品功能上,有媒体介绍,早期Synthesia能将文本或幻灯片转为视频,配有会说话的角色形象。“用户可基于预设虚拟人物,或上传视频创建自己的虚拟形象。此外,用户还能上传语音素材,转化成所需内容。”

由于Synthesia认为几乎所有网络工具都可能被利用进行不当用途,所以这家公司只为企业客户提供服务,而不是面向个人。Synthesia表示,客户主要使用产品工具来制作培训视频,不过这样的用户群体和创始人Victor Riparbelli想的并不一样。

“以前,人人都可以制作幻灯片或编写Word文档,现在他们还可以自己创建视频。从人工智能技术的角度来看,这是我们快速发展的关键所在。”他认为比起视频制作部门的大批用户,组织内部的其他人员才是该工具的超级用户。

Synthesia进一步开发虚拟人物形象视频,使其视觉和感官酷似真人,比如一个不知名的演员,或是自家公司的首席执行官。

本文来自微信公众号 “新眸”(ID:xinmouls),作者:新眸投研,36氪经授权发布。

该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK