4

这才是数据分析最好用的九个方法

 1 year ago
source link: https://www.yunyingpai.com/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/916126.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

导语:本文作者主要介绍了几种关于数据分析的方法论,从基础到单一指标,慢慢延伸至多指标,文章思路清晰,包含了众多实用方法,值得想进一步拓展自己数据分析能力的小伙伴阅读。

eWV0cYMYsalvRWHf86Td.jpg

“你做数据分析有啥方法论?”无论是工作还是面试,此问题一出,都会难倒一片同学。妈耶,每天照单跑数就知道,但方法论是个什么鬼!该怎么总结!今天介绍给大家基础的九种方法,面试、述职、吹牛专用!

01 什么是基础方法

从本质上看,几乎所有工作都和数据有关系,都或多或少需要一些数据分析方法。但数据本身是有门槛的,很多人上学的时候就怕数学课,更不要说复杂的理论了。

因此,所谓基础数据分析方法,应该是:

  • 不涉及高等数学、统计学、运筹学、算法原理
  • 不涉及复杂的业务逻辑、因果推断逻辑
  • 不局限于特定的业务场景,有普适性

总之,人人能用的,才是基础方法。基于这个理念,我们为大家整理了九种基础分析方法,简单又好用。

这才是数据分析最好用的九个方法

02 从一个指标开始

1、周期性分析法

最基础的分析方法,可以从一个指标开始,这就是“周期性分析法”。所谓“周期性分析法”,操作上非常简单,就是把一个指标的观察时间拉长,看它是否有周期变化规律。

这种方法分析简单,但是非常实用。因为新手经常因为不懂看周期变化,引发笑话。

“我发现昨天指标大跌”——昨天是周末,本来就该跌(自然周期变化)

“我发现A产品卖得很好”——A产品刚上市,它就该卖得好(产品生命周期)

这才是数据分析最好用的九个方法

很多时候,我们看的指标是总体指标,而总体指标是由若干部分组成的,比如:

总公司-分公司A、分公司B、分公司C总销售-商品A、商品B、商品C

因此看到一个总体指标以后,可以根据它的组成部分,对总体做拆解,了解各部分组成,是为结构分析法(分析总体的内部结构)。

2、结构分析法

结构分析法在很多时候都好用,比如问:”为什么业绩下滑呀!”答:”因为XX区域没有做好!”通过看结构,能很快找到责任人。

这才是数据分析最好用的九个方法

3、分层分析法

除了单纯地看结构,人们也喜欢做排名,区分个高中低,这就是分层分析法。

这才是数据分析最好用的九个方法

很多同学会把分层和结构搞混,大家只要记得以下两句:

结构是客观存在的,问清楚即可分层是主观的,要定个高低出来

这三种方法,是基础中的基础。一来,它们都是在分析一个指标,二来,它们都是基于事实陈述,不需要啥计算。当我们初到一个公司,初接触一个新数据,都可以用这三种方法,建立基础认知。

03 从一个指标到2个指标

1、矩阵分析法

当指标从一个增加到2个的时候,最好的方法就是矩阵分析法。矩阵分析法,通过两个指标的交叉,构造分析矩阵,利用平均值切出四个象限,从而发现问题(如下图)。

这才是数据分析最好用的九个方法

矩阵分析法的最大优势,在于:直观易懂。可以很容易从两个指标的交叉对比中发现问题。特别是当这两个指标是投入/成本指标的时候,成本高+收入低,成本低+收入与高两个类别,能直接为业务指示出改进方向,因此极大避免了:“不知道如何评价好坏”的问题。

很多咨询公司都喜欢用这种方法,类似KANO模型或者波士顿矩阵,本质就是找到了两个很好的评价指标,通过两指标交叉构造矩阵,对业务分类。分类的区分效果很好,就广为流传了。

04 从2个指标到多个指标

当分析指标变得更多的时候,最重要的工作,就是弄清楚:到底这些指标是什么关系。典型的关系有两种。

1、第一种:并列关系

几个指标相互独立,且是上一级指标的组成部分。比如我们常说的:业绩=客户数*消费率*客单价在这个公式里

  1. 一级指标:业绩
  2. 二级指标:客户数、消费率、客单价
  3. 客户数、消费率、客单价相互独立

此时,客户数、消费率、客单价就是并列的三个指标,并且都是业绩的子指标。

2、第二种:串行关系

几个指标相互关联,有前后顺序关系。比如我们常说的:新注册用户数=广告浏览人数*落地页转化率*注册页转化率。

  1. 一级指标:新注册用户数
  2. 二级指标:广告浏览人数、落地页转化率、注册页转化率
  3. 用户要先看到广告,再点击广告进入落地页,再完成注册

此时,广告页、落地页、注册页的指标相互关联,用户要一步步走。

这才是数据分析最好用的九个方法

这两种关系,分别对应两种基础分析方法:

并列关系:指标拆解法,通过拆解一个一级指标,从二级指标里发现问题。

漏斗分析法:通过观察一串流程,了解其流程转化率,发现转化率短点。

3、指标拆解法

指标拆解法,一般在经营分析中使用较多。举个简单的例子,一个小程序商城,上月销售业绩150万,本月120万。如果只看结果,除了少了30万以外啥也不知道。但是进行指标拆解以后,就能发现很多东西(如下图)

这才是数据分析最好用的九个方法

拆解以后可以明显看出:本月虽然注册用户人数增加了,但是消费率大幅度降低,所以收入少了。后续可以进一步思考:如何提高消费率。

4、漏斗分析法

漏斗分析法,则在互联网产品/推广/运营分析中使用较多,因为互联网产品能记录较多用户数据,因此可以呈现整个用户转化流程,从而进行分析。

举个简单例子,在网上看到一个商品广告,我们很感兴趣,点击进入购买。需要经历广告页→详情页→购物车→支付几个步骤,每多一个步骤,就会有一些用户流失,如同漏斗一样。

此时可以用一个转化漏斗,形象地表示这种关系(如下图)。

这才是数据分析最好用的九个方法

有了转化漏斗以后,就能进一步基于漏斗分析,从而指导业务改善:

  • 哪个环节漏掉的用户最多,需要改善?
  • 不同的商品,漏斗形态如何,哪个更适合推广?
  • 新的产品改版后,是否减少了漏掉的用户数量?

5、相关分析法

当然,还有一些指标,可能不是直接的并行/串行关系,但是在工作中,也很想知道他们有没有关系,比如:

  • 广告投入与销售业绩
  • 下雨刮风和门店人流
  • 用户点击和消费行为

此时,需要掌握相关分析法。注意:指标之间可能天生存在相关关系。常见的天生相关,有三种形态:

  • 在结构分析法中,整体指标与部分指标之间关系
  • 在指标拆解法中,主指标与子指标之间的关系
  • 在漏斗分析法中,前后步骤指标之间的关系

这三种情况,称为:直接相关直接相关不需要数据计算,通过指标梳理就能看清楚关系。相关分析法,更多是利用散点图/相关系数,找到潜在的相关关系(如下图)。

这才是数据分析最好用的九个方法

但是要注意:相关不等于因果,到底如何解读相关系数,需要结合具体业务含义,不能胡乱下结论哦

05 从指标到业务逻辑

1、标签分析法

以上所有方法,都是基于数据指标计算,但实际业务中,很多关系并不能直接用数据指标表示。

  • 是不是社区店比步行街店,生意更好?
  • 是不是私域流量比公域流量,转化更佳?
  • 是不是刮风下雨比晴空万里,销售更好?

社区店/私域流量/刮风下雨,很难用一个数据指标来衡量。但这些因素,又确实会对企业经营产生影响,该怎么分析呢?这就需要采用:标签分析法。

举个简单的例子,南方某省,8月份经常下暴雨。大家都觉得:下雨会影响门店业绩。那么怎么分析呢?按照五步法,可以针对该省份门店,做分析如下图:

这才是数据分析最好用的九个方法

那么可以得出结论:下雨对业绩影响不大,这就做完了。

注意,上边的小例子里,标签做的很粗糙,只有简单粗暴的下雨/没下雨两类。除了下雨以外,还可能有台风、冰雹、高温等等情况。因此,做标签的精细程度,决定了标签分析的准确度。而能否选取到合适的标签,则考验的是分析人员对业务的理解程度。

这才是数据分析最好用的九个方法

到这里,一共介绍了八种基础方法。在实际工作中,一般都是多种方法综合使用的。因为业务提的问题会很复杂,很有可能涉及多个指标,多个标签。此时千头万绪,要理清思路,就得祭出第九种方法:MECE法。

2、MECE法

MECE是(Mutually Exclusive Collectively Exhaustive)的缩写,指的是“相互独立,完全穷尽”的分类原则。通过MECE方法对问题进行分类,能做到清晰准确,从而容易找到答案。

这才是数据分析最好用的九个方法

MECE法是基础分析和高级分析的分水岭,也是从基础提升到高级的通道。所有复杂的问题,都需要经过认真的梳理和分解,才能成为一个个能解决的小问题。所谓的业务分析模型,其实就是对业务问题的MECE分解。

当然,肯定也有同学好奇:掌握了这九种方法以后,还可以怎么深入呢?一般有三条深入路线,可以进行深入分析。

06 掌握了基础方法以后

1、路线一:业务分析模型

业务模型,用来解决:定义模糊、数据贫瘠、需指导业务的问题。比如业务在纠结:

  • 到底做什么用户更好?
  • 到底怎样才能激励销售?
  • 到底活动起了多大作用?

这些问题听起来简单,其实定义非常模糊,什么算好?怎么叫起作用?不发钱的激励真的有用?各种问题错综复杂,且很有可能掺杂了业务部门自己的小心思。因此,需要细细的梳理业务逻辑,推导出可行的解题逻辑。

2、路线二:算法分析模型

算法模型,用来解决:定义清晰、数据丰富、计算过程复杂的问题。

比如,高价值用户识别问题,业务上已经定义清楚了:

  • 用什么指标衡量用户价值
  • 用什么标准评价价值“高”
  • 采集了丰富的数据(性别、年龄、兴趣、关联商品、互动、评论……)
  • 有一批人工标注过的“高价值”用户做正样本

此时,可以用各种算法来建模了。建模的目的,不是为了增加分析深度,而是提高从分析到业务应用的效率。有了相对准确的模型判断,业务可以通过CDP+MA,自动触发营销规则,不需要每次都写ppt写很久。

3、路线三:统计推断

统计推断方法,用来解决:定义清晰、没有数据、需测试收集数据的问题。

比如:要上一个新版本产品,业务已经定义了:新版本要提升用户的人均在线时长(均值问题),现在要做测试,从两个预备版本里选一个。此时要用:双总体均值比较假设检验的方法。

当然,实际问题会更复杂,考虑各种控制变量、假设前提,还要考虑系统开发、数据采集方案,不单单靠分析师解决。

作者:接地气的陈老师

来源:微信公众号“接地气的陈老师”

本文由@接地气的陈老师 原创发布于运营派,未经许可,禁止转载。

题图来自Unsplash,基于CCO协议。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK