9

指标与标签有何不同?

 3 years ago
source link: http://www.woshipm.com/data-analysis/4337716.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

编辑导语:在如今的大数据时代,用数据说话更能体现出差异点,很多时候数据是最实际的表达手法,比如你的年度指标用数据来定义等等;除了这些之外,标签也是重要的一点,如今标签已经成为了各大企业都在做的一个目标;本文作者分享了指标和标签有什么异同点,我们一起来看一下。

IZ7Nzy7.jpg!mobile

自从大数据概念开始兴起后,好像人们都不怎么谈指标了,而津津乐道于标签。

数字经济时代,谈论指标真的落伍了吗?其实未必!指标也好,标签也罢,只要用好都能发挥其价值。

怎样才能用好它们呢,我觉得要从懂它们开始;说到懂它们,就要清楚它们的异同点,到底指标和标签有什么异同点呢?今天就来探讨一下。

一、概念不同

指标是用来定义、评价和描述特定事物的一种标准或方式;比如:新增用户数、累计用户数、用户活跃率等是衡量用户发展情况的指标,月均收入、毛利率、净利率等是用来评价企业经营状况的指标。

标签是人为设定的、根据业务场景需求,对目标对象运用一定的算法得到的高度精炼的特征标识。

可见,标签是经过人为再加工后的结果;比如:说某个人是个“酒鬼”,这里“酒鬼”就是标签,一看到“酒鬼”这个标签人们就能很快知道,这个人肯定是经常喝酒、喜欢喝酒的人。

二、构成不同

指标通常由两部分构成,即名称和取值;名称是指标的外在标识符号,取值是指标的具体内容。

指标名称是对事物质与量两方面特点的命名;指标取值是指标在具体时间、地域、条件下的数量表现。

当然,指标取值可以是定量的数值,有时候也可以是定性的描述;比如描述一个人时,性别、年龄、身高和体重是经常用到的指标,以体重是220斤为例,指标的名称体重,指标的取值就是220斤;指标如果可以数量化的话,那么都是有单位或量纲的;从词性上说,指标几乎都是名字。

标签通常就是简单的几个字或符号;还是以某人体重为220斤为例,用标签的方式来描述的话,“大胖子”就是一个可用的标签;标签一般是不可量化的,通常都是形容词或形容词+名词;比如“大胖子”就是形容词+名词的结构;标签通常是孤立的,除了基础类标签,通过一定算法加工出来的标签一般都没有单位和量纲。

三、属性与特征不同

1)指标是ICT时代和BI时代的通用语言

指标注重对事物及事件的过程进行全面的、体系化的描述,指标的描述范围更广泛,既包括过程也涵盖结果;指标更注重与业务的结合,逻辑上更严谨,表现风格也比较严肃刻板;指标更侧重业务化、严格化和数量化。

2)标签是大数据与人工智能时代的通用语言

标签比指标更有深度、更凝练,是对指标深度加工的结果;标签注重人物和实体对象的描述,标签一般侧重对局部特征和结果的描述,注重与具体业务场景的结合,描述的范围相对较窄; 标签更侧重生活化、口语化和符号化。

总之,标签源于指标,却高于指标;指标更理性,标签更感性;标签比指标更有趣、更形象化、人格化,更有画面感,但指标比标签更讲求精确性、合理性、全面性和体系化。

四、价值评价方式不同

对指标与标签的价值评估方式、评估内容与它们的应用场景相关,也与使用者的感受有关系。

对指标的价值通常用“好不好用”、“全不全面”来评价,对标签的价值通常用“准不准”、“像不像”来评价。

指标的评价较易量化,通常有一定的标准和尺度;标签的评价一般与使用者的感受、应用的结果有强关联关系,不同的人、不同的应用场景,标签能发挥的效果可能大相径庭。

还有一点,由于标签是指标进一步产品化的结果,指标是半成品,标签是成品;所以,标签有时候具有一定的商品属性。

在大数据价值链上,标签是可定价、可售卖、可交易的一种数据产品;比如:在个人征信服务领域,用户的三要素、四要素在合规使用的前提下都是可以按条收费的;而指标通常是不具备售卖价值的,指标的价值可在具体应用场景里或者被融合到产品中才能体现出来。

对价值的认知上,指标可以按照重要性分为关键指标、一般指标等,或者说高价值指标、低价值指标之类的;而标签较少提及这种说法,比如有关键指标一说,而没有关键标签一说。

五、分类不同

1)指标有很多种分类方式

比如:

  • 按照指标计算逻辑,可以将指标分为原子指标、派生指标、组合指标三种类型;
  • 按照对事件描述内容的不同,分为过程性指标和结果性指标;
  • 按照描述对象的不同,分为用户类指标、事件类指标等;
  • 按照指标的变化频率,分为静态指标和动态指标;按领域划分,有用户类指标、收入类指标、行为类指标等;
  • 按照重要程度,分为主要指标和次要指标等;按职能来分,分为观测指标、管控指标和挑战指标。

当然,还有很多其它的分类方法,不再一一列举。

2)标签的分类方法通常比指标要少一些

之所以这么说,是因为指标能描述的对象范围更广,对事物的描述能做维度更全面、颗粒度更细,而标签对事物(用于对人的描述比较多)的描述则是更深入、更形象的。

  • 按照标签的变化性分为静态标签和动态标签;
  • 按照标签的指代和评估指标的不同,可分为定性标签和定量标签;
  • 按照标签体系分级分层的方式,可以分为一级标签、二级标签、三级标签等,每一个层级的标签相当于一个业务维度的切面;
  • 按照复杂程度分为:基础标签、规则标签和模型标签——基础标签通常是写实的,与指标有较高的重合度,比如身高、体重等;规则标签一般是有一些简单的规则来控制,符合某种规则时才生成相应的标签;模型标签一般需要通过某些机器学习算法来生成。

六、表现形态不同

指标的表现形态相对简单,通常以格式化的报表、直方图、趋势图、看板等图形来表示。

标签的表现形态相对复杂,我们通常说的标签是数据化的标签,数据化标签的表现形态以可视化的图表或大屏为主;比如,我们在客户画像时通常以词云图的形式来表现其特征。

事实上,在现实世界中标签还有三种表现形态:实物标签、网络标签和电子标签。

  • 实物标签是用于标明物品的品名、重量、体积、用途等信息的简要标牌,例如:商品标签、价格标签、车检标签、服装吊牌、车票、登机牌都是实物标签;
  • 网络标签(Tag)是一种互联网内容组织方式,是相关性很强的关键字,它能帮助人们通过关键词快速建立对内容总体印象;
  • 电子标签又称RFID射频标签,是一种识别效率和准确度都比较高的识别工具,通过射频信号自动识别目标对象并获取相关数据,识别工作无须人工干预,可工作于各种恶劣环境。

七、生产过程不同

指标是生产性思维、拆解式思维,讲究的是化整为零,将事物分解开来进行多角度的描述,得到很多的指标;标签则是合成性思维、聚合式思维,讲究的是化零为整,将多个分散的指标按照一定的原理进行综合加工,得出概括性的结果。

一般情况下,先有指标,后有标签;指标是业务管理导向的,需要提前规划;标签是应用导向的,跟随业务需求的而变化,面向业务可随时增加;

指标的生产通常先要扫平数据质量问题,统一数据口径;而标签生产涉及数据质量的问题较少,因为数据质量的问题已经在指标生产阶段被解决了;指标通常存在多个口径、口径不一致的问题,而标签在这方面的问题则相对较少。

八、应用场景不同

指标的应用场景很多,涉及企业的战略、管理、运营和支撑等层面;具体包括:战略目标、市场定位、业务监测、业绩考核、任务分解、数据分析、数据建模、BI应用等。

标签的应用场景主要集中于CRM领域,尤其适合于用户运营。比如:客户画像、新增获客、沉默用户激活、存量客户维系、数据建模、数据可视化等。

指标最擅长的应用是监测、分析、评价和建模,标签最擅长的应用是标注、刻画、分类和特征提取。

特别需要指出的是,由于对结果的标注也是一种标签,所以在自然语言处理和机器学习相关的算法应用场景下,标签对于监督式学习有重要价值,只是单纯的指标难以做到的;而指标在任务分配、绩效管理等领域的作用,也是标签无法做到的。

九、管理与维护的内容不同

原则上来说,指标与标签都需要建立体系化的管理机制。就指标的管理机制而言,指标管理通常涉及三个方面:需求阶段的管理、开发过程的管理、应用过程的管理;所以,对指标的管理动作主要就是:做指标、管指标、控指标。

指标的日常管理涉及指标的定义、指标的分类、指标的权限管理等;对指标的监控与维护通常涉及缺失值、异常值、勾稽关系等方面的检查。

对标签的管理与维护通常按照标签的生命周期来开展的,涉及标签开发与发布、标签应用、标签价值评估和标签优化及下线四个阶段。

对标签的管理动作主要就是:打标签、贴标签、用标签和改标签等;为做好标签管理与维护,有必要设立专门的标签管理团队,建立标签分类、命名、描述、和实施等方面的规范,完善配套的数据采集流程、标签加工流程、标签问题处理与反馈流程等;建立标签全生命周期管理体系,与数据资产管理制度相统一,为标签在各层面的落地及管理提供建设依据。

十、小结

以上是笔者从9个方面详细解读了指标与标签的不同点。

当然,两者还是有不少共同点的,比如:指标和标签都是对事物的一种描述和解读,都是对数据加工的结果,都可以分维度拆解,都是企业的数据资产等等,还有一些共同点就不再一一展开。

剖析指标和标签的异同点是为了更好的使用它们、驾驭它们;所以,希望以上我关于指标与标签的分析能够对诸位有所启发。

作者:黄小刚,微信公众号:大数据产品设计与运营

本文由 @黄小刚 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Unsplash,基于CC0协议


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK