55

36氪首发 | 做AI行业的送水人, 数据服务平台「龙猫数据」获 3370 万元A 轮融资

 6 years ago
source link: http://36kr.com/p/5100810.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

做AI行业的送水人, 数据服务平台「龙猫数据」获 3370 万元A 轮融资-36氪

36氪首发 | 做AI行业的送水人, 数据服务平台「龙猫数据」获 3370 万元A 轮融资

石亚琼·2017-11-06 23:31
优质一手数据往往很难依靠市场上的“公开数据”获取

36氪获悉,AI 数据服务平台「龙猫数据」宣布完成 3370万人民币A 轮融资,本轮由金沙江创投领投,九合创投、不惑创投继续跟投。此前龙猫数据曾获得九合创投、云天使天使轮及真顺基金Pre-A轮投资。本轮融资主要用于:加大研发投入,适应更多数据类型的采集标注,健全数据生产机制;提高服务能力和服务范围,比如医疗数据标注、小众人群采集、国外语音图像采集等。

龙猫数据上线于 2016 年初,其核心业务是为 AI 及大数据领域公司提供数据采集、标注等定制化数据解决方案,服务领域涵盖图像、语音、文本、视频四个方面。目前,龙猫数据旗下拥有众包平台「龙猫众包」,包括移动端APP、PC端标注网站等。官方表示,目前用户量达到百万级,可承担千万人以上样本量,为客户节约至少 50% 数据成本,是国内可调动数据处理人员最多、结果最精准的 AI 数据服务平台。目前,龙猫数据长期合作伙伴包括:百度、腾讯、小米、今日头条、蔚来汽车、升哲、出门问问猎户星空、Advance、图森、下厨房、深鉴、Remo、YI+、西井、博云、云从、Video++ 等一系列国内领先科技公司。

具体业务方面,图像采集、标注是龙猫数据的第一大业务,龙猫数据提供的解决方案可广泛应用于计算机视觉、智能驾驶、智能安防、电商/新闻平台等多个领域,包括但不限于人脸图片、手势识别、各类车牌、商超 SKU 分类,以及车道线、车辆行驶区域标注、车辆行人 2D/3D 拉框、3D 点云等。龙猫数据告诉36氪,公司曾为多家无人车研发公司提供标注服务,积累了一批优秀标注员,每天可对数十万张图片进行标注。

语音/语义识别也是公司重要的业务之一。这方面,以语音交互智能硬件为例,龙猫数据已为多家相关公司提供语音录制服务,短时间内交付数十万人声样本,并且 100% 审核,大幅提高了客户研发进展。除此之外,龙猫数据还可提供语音转写 ASR,语义标注 NLP 等定制化服务。

v2_37e0c19806cf4e279daa90d922fbffbb_img_000

当前,人工智能行业快速发展,以深度学习为代表的算法在诸多领域被逐渐应用,对优质数据,尤其是优质一手数据的需求量快速增长。当前,这些“有价值”的数据往往很难依靠市场上的“公开数据”获取,因而为做数据服务的公司提供了新的市场机遇。

专家预测,2018年,62%的大企业将会使用人工智能技术。Tractica预测,2024年人工智能市场规模将增长至111亿美元。基于乐观的市场前景,这一领域也出现了不少服务商。国外方面,亚马逊推出众包数据平台 Amazon Mechanical Turk,初创公司方面有CrowdFlower、Mighty AI等。国内方面,百度推出数据众包平台;成立于1998年的“海天瑞声”去年开始业绩有了大幅提升;成立较早的“数据堂”已经成功挂板新三板,2016年年收入达到9680万元,毛利率达到39.68% ;泛涵科技已完成融资;BasicFinder已于今年3月完成一千多万元pre-A轮融资;爱数智慧2017年初获得明势资本Pre-A轮融资,预计今年订单数量将达到千万元以上。 

行业玩家众多,竞争不可避免。龙猫科技认为,公司的优势在于依靠千万级数据采集处理能力,构建了一整套高效健全的系统,从精度、速度、安全性三方面确保了数据结果。精度上,龙猫数据平台目前拥有多重审核机制,包括标注、审核、抽检,多人交叉验证,专业考核及线下培训等,并仍在不断完善。速度上,龙猫数据依托龙猫自有 APP 平台数百万 C 端标签用户,可实现根据需求实时调配人员,任务反应迅速。安全性方面,龙猫数据支持将标注系统直接部署在客户服务器上,不在自身服务器留存,解除了客户对数据安全的顾虑。

v2_0332faa655614f5b880eae95129ed6e7_img_000

数据服务行业,重人力的劳动密集型行业。这类公司的关键点就在于——人员效率、交付质量。一般来说,目前市面上主要有众包和自营两种模式。自营模式较容易保证质量,但往往交付效率不高;众包模式效率高,但为保证质量后续质检要求高。

采用众包模式,龙猫数据的难点就落在了保证质量上:外部需要客户认可数据服务质量;内部需要提升质检的效率,降低运营成本。龙猫数据采用了「免费试采试标-后付费」的模式,合作初期免费为客户提供采集标注服务,正式合作确认后客户验收数据完毕可再付款,提升客户信任感。在质检的机制方面,数据质检应客户的需求,分初审、复审、抽审等多个步骤,为了提高质检效率,团队会针对每个项目,筛选培养一批用户审核团队来进行初审,初审中会采用交叉验证等机制来确保审核质量。

 对于这一波因为深度学习而兴起的数据服务商来说,最大的潜在威胁很可能并非来自竞品,而是来自于增强学习、迁移学习等算法,后者仅需要少量的数据即可以达到一定的效果。龙猫数据表示,公司也在不断关注技术的进展,新的技术成熟后也会积极进行业务的调整。

龙猫数据团队目前有33人。 CEO 昝智拥有 7 年互联网产品经验,曾任豌豆荚商业产品负责人、百度联盟产品经理;CTO 姚毅曾任豌豆荚游戏频道技术负责人,Google、中兴工程师,并是点心(百度收购)创始团队核心人员。

本文由「石亚琼」原创出品, 转载或内容合作请点击 转载说明 ;违规转载必究。

寻求报道 。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK