13

独家披露:VC数千万抢投1位北大学霸 让数据标注比PS简单 效率升10倍

 3 years ago
source link: https://www.pencilnews.cn/p/38791.html?from=article_list
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

独家披露:VC数千万抢投1位北大学霸 让数据标注比PS简单 效率升10倍

曼孚科技 可联系
人工智能数据服务提供商
2021年1月
立元创投,伽利略资本
赵剑,毕业于北京大学,曾任职于网易,2018年创办曼孚科技。

af52afaf35507ebaab2f281314e4a327.jpg

记者 | 古典典

在AI行业有句行话:“有多少智能,就有多少人工。”

在贵州的农村或山西的产业园,成千上万人的工作是做AI的“老师”。他们被称作“数据标注员”,日常工作是给车道线打点,或是给人脸拉框,将各式各样的生活场景数据“投喂”给AI。2019年,中国数据标注产业的规模达到了30.9亿元,但在外界的印象里,这依然是一个劳动密集型产业。

“数据好比是AI行业发展运行的石油,现在的问题是石油的供应不稳定。AI的成本需要降下来,这样AI应用才能在各个行业落地。”2018年,此前在网易工作的赵剑与此前在阿里工作的章越加入了AI创业的行列,从最上游的AI数据入手,创办了曼孚科技。

曼孚科技主打的产品是数据服务SaaS平台“SEED”,可以将企业标注成本降低30%,部分场景的标注效率达到原来的近10倍;此外,公司研发的AI数据中台系统,可以与AI训练平台无缝对接,提升AI算法迭代的效率。

目前,SEED平台可以处理计算机视觉、语音交互、自然语言处理等领域的数据,服务的客户涵盖阿里巴巴、百度、字节跳动、网易等科技企业,以及高校和传统制造企业等。曼孚科技已于近日完成了数千万元的天使轮融资,本轮融资由立元创投领投,老股东伽利略资本持续加码,春泥资本担任独家财务顾问。

注:赵剑承诺文中数据无误,为内容真实性负责。铅笔道作客观真实记录,已备份速记录音。

改变AI的上游

曼孚创始人赵剑对创业有一种执念。在北大读书时,他已经有了两次创业经历:做了外国留学生交友平台“Laowai In Beijing”和托福口语点评软件“众余toeking”。2015年毕业后,他进入网易从事市场营销的工作,但一直没有放下创业的梦想。

2018年,他终于等到了机会。那时,创投圈热烈地讨论着5G、区块链和AI,技术创业者纷纷入局。赵剑按捺不住,找到了在阿里做架构师的高中好友章越,同怀创业梦想的两个人坐下来开始选赛道。

做5G,两个人都没有硬件背景;做区块链,两个人觉得技术创新的空间有限;最后,他们选择了AI。AI行业有三大板块——算力、算法和数据,赵剑和章越最终放弃了需要大量烧钱的算力和算法,选择进入尚处于初期发展阶段的AI数据行业。

他们发现,AI的进步,尤其是有监督学习算法的进步,需要学习大量的标注数据,因此催生了数据标注行业。在不少人工智能产业园,这样的场景数见不鲜:几百个数据标注员坐在一排排屏幕前,给车道线打点,或是给人脸拉框,把复杂的生活场景数据源源不断地“投喂”给AI。行业内流行这么一句话:有多少智能,就有多少人工。作为行业上游,数据标注常常给人“人工智能富士康”的刻板印象。

依赖密集劳动力的数据标注,成品往往差强人意。“很多企业培训数据标注员就是放个视频,新人可能没真正学会就上岗了,导致的结果就是交付的时候良品率低。”除此之外,曼孚科技创始团队还发现,甲方的项目需求往往不是持续的,数据标注团队常常会有空档期,这一期间企业就要负担不菲的人力成本。

基于AI数据行业以上的种种问题,曼孚创始团队明确了在AI领域的创业方向,即通过开发一套完整的数据标注SaaS系统,改良人力密集型的AI数据标注行业,但是资本市场的表现与预想中的有些不同。

“AI数据服务行业处于发展的初期,资本市场对这个领域的研究并不深入,另外,由于SaaS系统的开发周期较长,导致投资回报周期比较长,国内资本市场对该行业处于持续观望的状态。”

虽然国内市场尚未意识到SaaS平台的价值,但在大洋另一端的美国,数据标注公司Scale于2019年融资1亿美元,跻身独角兽;数据标注巨头Appen花3亿美元收购了竞争对手Figure Eight,此外还有数十家同行获得了数千万美元的融资。赵剑认为,科技公司对AI标注数据集的要求越来越精细,场景越来越垂直,需求量越来越大,SaaS数据处理平台的重要性会凸显出来。

在创业的早期,曼孚创始团队见了十几位投资人,一次次地去复述自己的项目构想,终于遇到了伯乐——伽利略资本。当时赵剑对伽利略的创始合伙人说了一句“数据决定AI,AI改变世界“,让对方印象深刻。“ 当时我们的产品解决方案主要是用于无人驾驶的,我们认为无人驾驶是未来AI的核心应用领域,这和伽利略资本的判断是一致的。”

拿到了数百万元种子轮融资后,赵剑在2018年开始补强团队,来自google的产品合伙人蒋筱萌在这个阶段加入公司。

可以做项目管理的SaaS

公司成立后,曼孚科技创始团队先做了一个多月的市场调研。和科技公司的算法团队聊了一圈后,他们发现甲方不仅需要标注效率工具,也需要更好的项目管理工具。根据客户的需求,曼孚科技创始团队开始研发公司的核心SaaS产品——SEED数据处理平台。

38d54596a2563a0e996a88e4d4c2bd71.jpg

SEED平台 

2019年10月,SEED平台上线。它借鉴了PS的部分功能,但在交互体验上更友好,标注员更容易上手。标注员在使用SEED后,在部分场景下,单人标注效率可以提升近10倍。

SEED在项目管理上也更进一步。“乙方标注的过程对于甲方就是个黑盒子。他给你承诺一个月标完,但最后可能拖了两三个月才能交付。”为了改善拖延现象,团队在SEED中设置了可视化的管理与协同模块,并给参与项目的人员分出账号权限。

在提升效率的同时,SEED平台还能为企业用户降低90%的管理成本。

“ 国内无人机头部企业在看过我们的产品后,直接撤了自己的数据标注团队。他们觉得我们的项目管理做得很细,用我们的产品成本能降下来。”赵剑对自己的产品信心十足。

最开始,曼孚科技创始团队通过BPO的形式找到了第一批科技公司客户,包括阿里巴巴、百度、字节跳动、网易等。随着SEED的口碑逐渐树立,其他行业的客户也找到了曼孚科技,包括传统车企、高校等等。

随着客户的增多,客户需求也越来越多元。高校和研究院的经费不如科技公司充足,更倾向于把SaaS产品买下来,让学生去标注;一些AI科技公司对数据安全很敏感,会要求自己架设服务器。对于有数据安全要求的客户,曼孚科技可以提供SaaS平台的私有化部署,或者混合云的解决方案。

苏宁金融研究院指出,未来5-10年内,人工标注仍将是AI数据标注的主流,占比超过75%。人工标注的成本与规模很可能成为限制AI技术发展的关键因素。曼孚创始团队表示,“AI的成本需要降下来,才会有更多行业去做AI。我们做SaaS就是为了把数据这一块的成本降下来。”

目前,SEED平台可以处理计算机视觉、语音交互、自然语言处理等领域的数据,平台通过任务建立、执行标注、数据质检等环节搭建起了一套项目管理体系。SEED平台正在完善语音场景,目标是成为覆盖全场景的AI数据中台。

现如今,在自动驾驶领域,SEED平台在3D点云处理技术上已经积累了一定的业内知名度。曼孚科技的下一个目标是成为自动驾驶领域的头部服务商,并在未来两年拓展海外业务。

“美国同行的价格是我们的1.5-2倍,我们有很大的成本优势。”赵剑透露,国外科技巨头在开展中国业务时会带来很大的数据标注需求。“特斯拉的无人驾驶要在中国做本地化的适配,就需要对中国的路况数据做标注处理。”

与种子轮融资时的艰难状况相比,得到了用户认可的曼孚科技,在资本市场上也见到了曙光。近日,曼孚科技完成了数千万元的天使轮融资,本轮融资由立元创投领投,老股东伽利略资本持续加码,春泥资本担任独家财务顾问。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK