27

数据分析里的鄙视链:Excel连小弟都不是?

 4 years ago
source link: https://zhuanlan.zhihu.com/p/269185084
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

在说今天的话题之前,我想先抛出一个结论:

“做数据分析,不要建立一种以掌握的软件来给自己分级的心态,但是一定要用工具避免误入职业发展的歧途!”

为什么今天要谈关于数据分析工具分级的问题呢?

其实这涉及到职场中一个非常常见的现象—— 工具鄙视链

  • 会python编程语言的,瞧不起用自助BI工具做数据分析的;
  • 会用Tableau、FineBI这种分析工具的,瞧不起会用SPSS、SQL这种数据工具的;
  • 会用SPSS、SQL的,瞧不起用PPT做数据汇报的;
  • 会用PPT做数据汇报的,瞧不起只会用Excel做数据统计与整理的;
VVnEnmf.jpg!mobile

逃不开的鄙视链

不光是数据分析行业,在程序员、产品经理等行业中都存在这样的鄙视链

也有不少人和公司,遵从着这样的鄙视链现象,通过这样的鄙视链进行岗位的分级,或者作为选人招聘的门槛标准

而这个鄙视链似乎是与这个岗位生死同戚、共生共存、难以分离的:

比如我,在前几年我还刚接触数据分析的时候,只学会用Excel做数据处理,所有的数据清洗、数据加工和图表可视化工作都是用Excel完成的

但是看着网上很多人都在学Python编程,当时还有一种“python才是数据分析标配”的言论,我也成为了跟风的一份子

ZN3uymM.jpg!mobile

当时带我的老大就告诉我:

网上说学python才能做数据分析的,纯粹就是放屁 ,python做数据分析确实比Excel要专业一些,但是真正的核心,是要是什么数据场景和什么人在用。

我用Excel做的数据清洗绝对能完爆这些工具,但是我想做一些高级可视化,也会用python去做,谁规定数据分析师只能用一个软件了?

说到底还是 出于对数据分析岗位的自卑 ,数据分析才出现几年啊,谁都觉得用Excel做数据分析太low逼了,一点体现不出我们的专业性,不学一门编程语言,其他部门的人谁瞧得起我们?”

ZZZ3Evy.jpg!mobile

对于我老大的话,我深以为然,正是出于对于数据分析作岗位的错误认知,才会造成那么多人对于数据分析工具的误解

其实这么多年,excel、Tableau、FineBI、PowerBI、SPSS、Python......我几乎每种工具和软件都用过,并没有觉得哪一种是最万能的

工具从来只是工具,是用来辅助我们进行数据分析的,最核心的关键还是在于人,也就是你是否真的具有数据分析思维和能力

像我之前老大的能力,用Excel照样牛逼;要是没有能力,学一万种语言都没用!

所以很多刚入门数据分析的朋友,一上来就买很多Python,R语言,VBA的书籍和资料,安装了各个语言的环境

但其实数据分析师的日常工作,最多就是用到SQL取数以及Excel数据透视图、BI分析工具中拖拉拽图表

Qb6NFr.jpg!mobile

所以,会用工具不是能力,懂得数据思维,才是数据分析师存在的意义

工具是辅助

那么回到我们今天的话题,数据分析当中有着不同的数据场景,会用到非常多的工具,那么应该如何选择,下面简单举几个例子

1、excel

别以为EXCEL只会处理表格,你可以把它当成数据库,也可以把它当成IDE,甚至可以把它当成数据可视化工具来使用

它可以创建专业的数据透视表和基本的统计图表,但由于默认设置了颜色、线条和风格,使其难以创建用于看上去“高大上”视觉效果

尽管如此,我仍然推荐你使用Excel

2、BI工具

近几年冒出来的BI之秀,如TB、qlk都强调可视化,一改传统BI工具SAP BO、IBM家的cognos(不过近几年貌似都在研发云BI)

这里不谈开源,还没见到能成熟应用的BI,成熟的BI工具如 FineBI (国内)和 Tableau(国外),都很推荐

73eURb2.jpg!mobile

3、python

学过Python数据分析的朋友都知道,在可视化的工具中,有很多优秀的三方库,比如matplotlib,seaborn,plotly,Boken,pyecharts等等,这些可视化库都有自己的特点,在实际应用中也广为大家使用

iqa6Nbz.jpg!mobile

4、SPSS

SPSS是统计分析入门软件,如果你想快速入门而又不想学习编程,我推荐使用SPSS

学习SPSS的重点并不在于软件本身,而是相关的统计学知识,这也是在前面建议大家铺垫的,也就是你要学会怎样去分析“输入数据后,软件给你呈现的结果”

推荐大家一本书:《如虎添翼 数据处理的SPSS/SAS EG实现》,徐筱刚老师写的,十分适合SPSS新手入门

最后说点啥

其实今天谈的这个话题,也是其他行业里常见的现象之一,既然产生了这种乱象,说明一定有其产生的原因与逻辑,我们不必太过敏感

但是,对于我们数据分析师自身而言,真正做分析时候,你会发现市面上有太多的分析工具,需要掌握的实在是太多了

其实不必纠结于此,依据个人能力,配合当前的数据分析环境,适用的工具自然会被选出,最后记住一句话: 工具是人用的,重点在于人,而不在于工具!


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK