45

浙报集团40亿元押注AI,下一个独角兽会出现在哪个AI领域?

 6 years ago
source link: http://36kr.com/p/5104292.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

浙报集团40亿元押注AI,下一个独角兽会出现在哪个AI领域?

36氪的朋友们·2017-11-22 09:45
17年后的人工智能经济,造就将的下一个阿里巴巴在哪?

本文来自“氢媒工场”,作者 Leo刘尊 

同是作为一家媒体,浙报集团的打法似乎跟其他人都有点“格格不入”,先是靠手游实现盈利,并对纸媒进行反哺,接着通过VC、PE等非媒体的资本方式狂揽收入,成为了国内最富有的报业集团之一。而如今,浙报又瞄准了下一个领域:AI。 



先来看AI行业一个大新闻:创新工场联合创始人、管理合伙人汪华表示,创新工场将与浙报数字文化集团股份有限公司(A股上市公司,简称“浙数文化”)共同成立40亿元人民币的人工智能产业投资基金,这个基金将落户杭州。

此外,汪华还在接受氢媒工场采访时候透露,创新工场此后将重点布局AI,而在国内的主要AI投资,都将集中在与浙报数字文化集团合作的AI基金上。

原中共浙江省委常委、杭州市委书记王国平在本次GMIC会上的一句话:“今天我们所面临的人工智能的时代,和17年以前我们第一次到阿里巴巴去,杭州、中国面临着互联网经济的时代,电子商务的时代是完全一样的。”

换而言之,在王国平看来,17年前的互联网经济造就了阿里巴巴。我们顺着这个思路开始思想实验:17年后的人工智能经济,造就将的下一个阿里巴巴在哪?如今40亿基金、大数据中心等资源已备齐,下一个“马云”会出现在哪个AI领域?

1、入口级技术即将井喷

根据《IT桔子人工智能报告》对中国 467 家AI企业,及 636 起投资事件的统计数据,计算机视觉(CV)与自然语言处理(NLP)是创业者最集中的两大赛道,分别占比19%和18%;与这组数据相对应的是,计算机视觉与自然语言处理同时是获投企业最多的两个AI领域,分别占20%与18%。 

format,jpg
format,jpg

具体到投资机构,据氢媒工场观察,近年来投资AI企业最多的真格基金先后投资了计算机视觉领域的格灵深瞳和依图科技,在自然语言处理领域也投了出门问问,这三者目前已成各自领域的明星企业;以AI为未来主要投资方向的创新工场,也对计算机视觉、自然语言处理领域情有独钟,旷视科技与追一科技都是其高管常提起的典型案例。(数据显示,真格基金、创新工场是目前国内对AI企业投资最多的两大投资机构。)

计算机视觉与自然语言处理,为什么备受青睐呢? 

最直接的原因,当然是深度学习算法在这两个领域内的突破,让这两个领域直接受益;再加上AI开源成为主流,二者的准入门槛进一步降低。

更深层的原因在于,计算机视觉与自然语言处理是AI时代入口级产品最重要的前端技术,是“入口级技术”。 

想象一下,你到任何地方去,必须要从第一个入口进去,进了门以后,楼里面有各个房间,每个进入房间的只有几个人,但是所有人都要从大楼的门口进入。 

可想而知,这个楼里每个房间的重要性,都不及第一个入口。

我们知道,互联网的三大主要入口搜索、电商、社交造就了BAT,三大次级入口内容、用餐、出行形成TMD。就目前来看,手机、智能家居、汽车甚至是机器人都将是AI时代的入口,而作为人机器交互最重要的前端技术,正是这两项技术。

而艾媒咨询最新发布的《2017年中国人工智能行业白皮书》更是将这两项技术与机器学习并称为“AI核心技术”。

format,jpg

可以预见的是,AI入口的争夺会比以前市场大很多,也激烈很多——上述白皮书显示,到2020年,AI核心产业规模将超过1500亿。正因如此,AI时代的入口将形成至少是超级独角兽级别的企业,甚至会诞生下一个马云、马化腾。 

目前为止,这个思想实验已有初步的答案:入口级技术。我们将思想实验深入一层:计算机视觉与自然语言处理领域,做产品还是做服务更有优势呢?2C还是2B更易崛起超级独角兽呢?

2、2B、2C谁更有优势?

在氢媒工场看来,互联网时代产生的BAT和TMD,都是以“需求驱动为主,以技术驱动为辅”对商业进行改造而成功的。如阿里巴巴最初,是大量中小企业对高效交易的需求激发了电子商务;百度则最初是因门户内容极速膨胀,所带来了用户对于高效获取精准信息的需求。

换而言之,BAT的出现,本质是“提升效率的需求倒逼技术进步”,是从“不能忍”到“高效率”的过程,是0到1。

而AI时代若能崛起一批巨型企业,逻辑则完全相反,应该是“以技术驱动为主,以需求驱动为辅”的。它应该是从“高效率”到“更高效率”的过程,(短期看来)是1到2的进程,(长期看来)是1到N的进程。

举个例子,想象一下这个情景:你想用手机搜索“氢媒工场”四个字,用了一下Siri后发现搜索结果总是“青梅工场”,于是你会干脆放弃语音搜索,改用更精准高效的手机打字。

发现了吗?AI的技术是从“高效率”到“更高效率”,因此并非刚需,你可以选择不用;但若把整个搜索引擎给你取消了,你肯定受不了,它可是刚需,没了它你肯定“不能忍”。

所以说,AI时代的崛起的超级独角兽,是“以技术驱动为主,以需求驱动为辅”的,是与BAT崛起的逻辑刚好相反的。

明白了这一层逻辑后,我们把这个思想实验再深入一层:哪些企业将会在AI时代崛起?没错,技术驱动型企业。哪些技术驱动型企业呢?应该是那些暂时不做产品,专注优化技术的企业。简单来说,就是2B型技术企业。

原因:一方面,在于刚刚所说的,AI时代崛起的新巨头必然以技术驱动为主的底层逻辑;另一方面,2C企业离用户更近以获取数据的优势,目前在BAT面前几乎微不足道。根据2016年“互联网女皇”玛丽·米克尔发布的《2016年的互联网趋势报告》显示,BAT占据了中国用户71%的移动消费时长。 

format,jpg

我们知道,深度学习技术建立在大量实例基础上,就像小孩收集现实世界的信息一样。而且,“喂”的数据越多,它就越聪明,并且不会“消化不良”。因为大数据的不可或缺,所以目前深度学习做得最好的基本是拥有大量数据的IT巨头,如谷歌、微软、BAT等。可以说,深度学习得到大数据的助力,就像火箭有了燃料。 

如前文提到的创新工场与浙数文化曾在今年6月达成战略合作,双方合作的内容就包括人工智能和大数据。数据来源由浙数文化集团旗下的浙江大数据交易中心解决,同时数据的存储与计算则可以通过浙数文化集团旗下的富春云互联网数据中心来提供基础支撑。

再如真格基金和IDG之类密切关注AI的投资机构,也一直以来对大数据应用平台做了投资布局。但这都是避免与BAT直接正面进行数据竞争的方式。 

除了上述两点原因外,产业链不成熟,花费较高也都是2C企业的难题。

所以,从宏观而言,大数据仍在BAT手中,2C企业优势较小。

相反,和2C相比,2B业务更值得深入挖掘。金融服务、生命科学、医疗保健、能源、交通、重工业、农业和材料等领域,有清晰的产业边界,也有专有数据,这些创业公司可以利用专有数据和机器学习模型解决高层次的专业问题。

前述《IT桔子人工智能报告》的统计也显示,目前AI创业公司主要以2B的企业服务类业务为主,汽车、交通、安防、医疗等行业应用相对较为广泛。

到此为止,我们得出的结论是:未来5到10年,在计算机视觉或自然语言处理领域里的、技术驱动型的、2B业务的企业,在大概率上将迅速崛起超级独角兽。

我们把这个思想实验继续深入:还能不能将下一个BAT出现的范围,再进一步缩小呢?

3、CV+NLP融合技术或造就AI时代的BAT

氢媒工场观察到了一个趋势:计算机视觉与自然语言处理的融合。 

我们此前介绍这两个领域似乎都是将其独立的,而事实却是,近年来不少科学研究已经将二者融合。

首先,计算机视觉与自然语言处理的技术基础都是深度学习,这是二者融合的基础。MIT在读博士、深度学习和机器学习专家周博磊告诉氢媒工场,计算机视觉和自然语言处理并不是隔阂的两个研究方向。两者的未来发展会借助各自的优势齐头并进,融合到General AI的框架之下。 

其次,这种融合目前已经有了理论基础且得以应用。在2014年斯坦福大学人工智能实验室主任李飞飞教授与其得意门生Andrej Karpathy曾发表论文探讨了这种“跨界”。传统CNN(卷积神经网络)训练数据中每幅图像都有单一的一个标记,这篇论文描述的模型则是每幅图像都带有一图注。

format,jpg

周博磊认为,对图片数据的语义化和结构化,可以说是自然语言处理在计算机视觉里的一个首要应用。他告诉氢媒工场,自然语言中一个“词”代表某个概念或者类,比如说“猫”和“动物”。通过语义关系,利用这些词可以很容易建立一个语义结构关系网。

为了防止烧脑,你可以简单将这个技术理解成让AI学会“看图说话”(我们以下简称“看图说话技术”)。这项技术简单解释起来是这样的:

我们以前训练深度学习都是一个网络只有一个功能,并且需要大量样本数据作为训练支撑。但是我们人类的学习是可以迁移的,比如你可能没见过马,但是假如有人告诉你马的特征,比如平直的长脸、坚硬的蹄、棕色的毛等等,你就可以遇到马的时候推断它是马。

“看图说话技术”就让能AI“看大量马的照片,形成自己对于马的语言定义形成特征,然后将这个定义和特征进行迁移,比如把“马有棕色的毛”这一点迁移成“斑马有黑白相间的毛”。那么AI就能在没看过斑马照片的情况下,认出斑马来。

可以说它本质是“对图片的语义标定”,它最大的优势在于:用小样本来学习,并进行迁移。即让AI“举一反三”。

所以,这里要强调的最后一点,也是最最最重要的一点是:“看图说话技术”对于数据量并不十分依赖。这就意味着,企业可以通过这项技术,避开与BAT的数据之争!这对于中小AI企业可谓天大的优势。要知道,过分依赖海量标注数据,是目前主流深度学习方法所面临的最大困境。 

因此,这类技术的进一步发展,很有可能造就AI时代的BAT(当然,前提是中途没被收割)。

在氢媒工场看来,未来5到10年,AI仍存在入口之争,且将会出现超级独角兽企业甚至AI时代的BAT。这个机会,大概率上,将出现在计算机视觉或自然语言处理领域里的、技术驱动型的、2B业务的企业。 

同时,计算机视觉与自然语言处理的技术的融合,摆脱了过分依赖海量数据的困境,或许能为未来超级独角兽的绕开BAT,迅速崛起,提供强有力的技术支持。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK