2

畅想大模型之前,数据飞轮才是企业的「基本功」

 1 year ago
source link: https://www.geekpark.net/news/317888
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
鹏友说
8min read

畅想大模型之前,数据飞轮才是企业的「基本功」

2023/04/20
dff611ee2d8d6f3c4365805dc3a87f09.jpg

数据飞轮,一张通向生产力升级的「船票」。

天天新闻里都在说「大模型时代即将到来」,中国企业界也正在用非常快的速度,意识到生产力又要发生变化了。但这个时候,最重要的可能不是赶新潮,而是赶紧看看自己的基本功——数据。

作为继土地、劳动力、资本和技术之后的第五大生产要素,数据的重要地位不言而喻,但根据 Gartner 的研究报告,目前仍有 68% 的企业数据没有被用来分析、使用;高达 82% 的企业仍处于数据孤岛之中。

这其实是一个很严重的问题。数据是一切智能化的基础,如果不能将自己的公司业务和经营建立在数据之上,就意味着无法参与到未来令人期待的 AI 生产力升级之中。

众所周知,字节跳动是一家把「数据驱动」刻进了骨子里的企业,当年今日头条、抖音刚推出时,名字就是经历了 A/B 测试后才最终确定的。最近我观察到字节旗下的火山引擎刚刚发布的一系列新的数据智能产品,提供了一块「能力跳板」。这基本上将字节内部的数据驱动理念,转化为可落地的产品服务,我觉得这是一个帮助国内更多的企业完成「数据跃迁」的重要能力,甚至是一张通向生产力升级的「船票」。

更重要的是,我看到在 4 月 18 日的火山引擎原动力大会上,火山引擎除了发布全新的管理驾驶舱 Plus、升级后的湖仓一体分析服务 LAS 等工具外,还给出了企业生产力升级的正确姿势——数据飞轮模式。

到底什么是所谓的「数据飞轮」?「数据飞轮」要解决哪些问题?

最近我和火山引擎内部的同学聊了聊,发现这背后其实还是字节「数据驱动」理念的世界观和方法论的又一次外溢,很值得聊一聊。



01 数据飞轮需要「看的清,做的对,跑的顺」



火山引擎在去年曾经提出过云上增长的三要素是「体验创新」「数据驱动」和「敏捷迭代」,其中「数据驱动」是最核心的一个环节,也是今年「数据飞轮」提出的起源。

听火山引擎的同学介绍,「数据飞轮」的核心是「数据消费」,也就是通过数据消费来促进决策加速、推动快速行动,进而提升业务价值;与此同时,业务的蓬勃发展也将带来更大规模、更多种类数据,这也将反过来推动企业做好数据管理和质量优化。简而言之,「数据飞轮」就是将数据生产、数据应用、数据消费三大环节有机结合起来,并且通过一系列的数据工具实现三者之间的往复转动。



b271d126590ab4bce36606c30f16a808.png

火山引擎这次提出「数据飞轮」主要想实现的是:「用数据驱动业务提升,用业务推动数据提效。」

这很容易让人想到以往的「数据中台」概念,但是与仅仅将企业的各类数据加工成统一的数据资产不同,「数据飞轮」更想帮助企业形成看得见、摸得着的业务实效,通过是业务与数据达成互动关系,形成数据飞轮持续转动所带来的业务价值。

拆开来看,「数据」和「业务」是「数据飞轮」的两端,这两者是互为目的、彼此服务的。频繁的数据使用,可以使得业务在做决策和运营的时候,更快更有效;而业务价值的提升也会带来更多优质的回流数据,倒逼数据建设与管理上的优化升级。

但理念再怎么解释也是抽象的,要想使「数据」与「业务」之间形成循环往复的飞轮闭环,我们讨论后一致认为这需要达成两个前提:一个是要有可用的数据;一个是要有能让数据运作起来、产生实际价值的系统与工具。

有可用的数据当然是最基础的,但大家经常忽视的一点是,怎样能让大家都看懂数据。

要使数据真正融入业务之中,就要摆脱「数据只是给程序员看的」这一误区,转而让公司各个角色、各个层级的人都能看懂并使用数据,如果没有这个第一步,那企业就很难搭建起属于自己的「数据飞轮」。

火山引擎的同学对于这一点明显有着成熟的认知,火山引擎数据产品负责人郭东东告诉我,不同职位的人对于数据的需求是不一样的,决策层的需求是实时掌握业务动态,中层执行层更多是以 OKR、战略目标来关注自己所负责部分的业务情况,最基础的执行层更注重的则是使用数据的效率问题。

针对不同的角色,火山引擎陆续推出了很多对应的工具。今年火山引擎将重点放在了解决管理层的数据需求上面,推出了管理驾驶舱 Plus,目标是帮助管理者实时观测战略目标的达成进度,更方便、直观地了解公司业务数据。

过去我们很多企业的「数据驱动」其实还是以 PPT 分析汇报为主,但是这样做的问题在于汇报逻辑的不同很可能会导致大家对业务的不同理解,一些业务数据看着很健康,换个角度,可能就是大问题。而管理者还是希望能更全面地掌握信息,避免信息断层,同时更直观地看到业务哪里有问题,哪里可以继续推进。

所以好的 CEO 平时管理公司业务时需要处理的数据很多,数据的维度也很多,如果有一个「驾驶舱」可以帮我梳理公司业务数据,通过把各项指标串联起来分析业务运行的健康程度,那我就只需要时不时关注一下就可以了,就不用耗费开会听汇报的时间了。

而我的 N-1 团队,估计会更加欢迎这个功能,因为我不用老烦他们去做数据汇报,他们之前折腾半天去准备,预约时间去汇报讨论,和我在驾驶舱看到问题或者疑问,直接针对问题和他们展开即时讨论,然后最终再能追踪结果相比,后者会节约大量彼此的时间。

据我所知,字节内部早就在使用这套工具了,像抖音等业务的负责人会通过管理驾驶舱 Plus 来把控业务的整体情况,再确定今年是要做增长还是做留存。但在一些较为传统的行业里,很多管理者并不是真正的在用数据的思路来定义自己的业务,所以火山引擎这次推出新产品,很大程度上也是希望培养管理者使用数据、用数据驱动实际业务的 sense。

有了数据意识,接下来的事情就是搭建起能让数据运作起来的工具和系统。

过去大家比较熟悉的可能是字节出名的 AB test,自从给 B 端客户开放了火山引擎 DataTester 后,很多金融、互联网行业的客户都在使用,比如平安银行就是该工具一个重度用户,经常通过 AB test 来测试 App 的 Tab 栏该如何设计才能吸引用户。

但在应用的过程中,火山引擎数智平台的产品研发们也发现了些问题,其中很重要的一点是以往的 AB test 这个理念很容易被接受,但具体到应用场景中怎么设计出科学、合理的 AB 实验也是「拦路虎」。因此这次火山引擎对于 DataTester 的升级有点类似于「辅助驾驶」,工具能自动决定怎么去做投放、怎么去调整,比如你告诉工具你关注的是点击率,系统就会自动将流量调整到点击率更高的方案上。

除了以往应用工具的升级外,这次火山引擎在基础设施上也更进一步,升级了湖仓一体分析服务 LAS,一个更为底层的全托管大数据分析服务,目标是使数据服务门槛更低、更智能、更自动。

这个目标同样也是目前客户最大的需求。据火山引擎的同学观察,近年来客户的需求明显经历了一个变迁:几年前大家都还吵着要有自己的引擎,要自己搭建数据系统,但是随着近年来公有云的增多,越来越多客户开始希望能有一个免运维、全托管的系统把底层系统搭建起来,自己只需要在上层「搭积木」就好了。

基于这个背景,火山引擎的同学们做了大量优化升级,湖仓一体分析服务 LAS 能够更好地帮助客户一站式完成数据的计算、存储、分析,甚至你每天的工作量什么时候重、什么时候轻,系统可以自动做一些资源的适配,保证你的工作效率。如果用一句话来解释这个服务的厉害之处,那就是「用得越久性能越快」,因为系统可以慢慢地通过历史数据掌握核心运行规律。

从数据到业务,从业务再到数据,正是有了工具和系统作为中间渠道,确保了数据闭环,「数据飞轮」才能转动起来。



02 利用好字节「数据驱动」能力的外溢



对于火山引擎把「数据飞轮」放在如此重要的地位上来推动,我是不意外的。

张一鸣过去经常说要把公司当做产品去做,产品背后一定是有自己的一套世界观和方法论的。字节原本就是一家天生的数字化公司,以「数据驱动」理念孵化出了今日头条、抖音,数据实践的过程中也逐渐开发出了一套「数据驱动」工具,这次和火山引擎的同学聊过之后,我对于字节内部的数据实践是如何展开的也有了更深的理解。

2014 年字节刚开始做数据平台建设时先是聚焦了当时业务目标、业务痛点,研发出的是能直接解决问题的工具,到 2018 年,随着内部数据量的飙升和业务复杂度的提升,字节才重点投入建设数据基础层。字节的数据驱动理念给火山引擎提供了很重要的实践经验,慢慢地,数据治理平台、数据处理与分析服务等开始通过火山引擎对外服务。



adfc6f51f0cedc8a0040135eeda087ac.jpg

而之所以在这个时间点,火山引擎将「数据飞轮」抽象成理念并在原动力大会上提出来说,原因也很简单,就是「时候到了」。

在过去与客户的接触中,火山引擎团队发现虽然很多公司也有「数据中台」的理念,但是很多情况是数据中台仅仅只是将数据汇集在一起,并没有实现接下来的数据打通、数据资产化,因此很难对业务产生实质的影响。于是,从 2021 年开始,火山引擎逐步将字节内部的数据能力以工具和云服务的形式给到 B 端的客户,希望能帮助更多企业摆脱「有数据但不会用数据」的困境。

经过两年的「对外输出」、彼此交流后,最近火山引擎的新发现是「大家对于 Serverless(无服务器运算)的诉求越来越强」,「只有将数据应用层、数据建设层联合起来才能更好地发挥数据飞轮的价值」。

火山引擎试着将上述洞察融入产品服务。在与一个头部银行的合作中,通过将银行的数据建设和数据营销这两个分属不同产品矩阵,但在应用时会彼此影响的数据工具一次性建设、联动起来,从工具层面帮客户避免了之后可能会出现的数据应用难题。

一个更具体的火山引擎帮助企业搭建数据飞轮的例子发生在汽车行业。

汽车研发过程中产生的大量数据很多企业是通过 Excel 表格进行记录、总结和分享的,这样做难免会出现数据丢失、无法对齐等情况。为了解决这个问题,火山引擎先是给车企客户推荐了 DataWind 这类可以帮助车企快速的制作报表以及直观看数的智能数据洞察工具,大概几个月过去,这家车企里使用该工具的人数就突破了 1000 人。



b6525e628e280abbfa849ab65fcf026f.png

之后随着数据工具使用的场景越来越多,平时被忽视的一些数据管理和治理的痛点慢慢暴露,于是接下来火山引擎又给他们推荐了大数据研发治理套件产品 DataLeap,帮助对方更好地实现数据与业务之间的循环运作。最近火山也有计划再和对方谈谈彻底将数据打通,通过新推出的管理驾驶舱 Plus 去更好地把控整体业务的运行情况。

不难发现,火山引擎通过一系列数据产品、服务帮助其他企业搭建「数据飞轮」的过程,是将字节的数据实践经验对外整体输出。

我个人看到火山引擎能将字节在「数据驱动」思想下进行的数据实践向外扩散,并变成一个一个科学、高效的体系还是很兴奋的。毕竟,未来的大模型时代肯定还会涌现出更多的技术创新和生产力升级,但是如果一个企业本身还不是跑在数据上的公司,那么新时代「可能的红利」就会全部变成「确定的冲击」。

这是个不进则退的时代,练好基本功,才会有船票。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK