欢迎光临
我们一直在努力

聊聊业务指标到技术指标的转化落地

最近有位业务的同事问了一个关于数据指标的问题:A分厂A车间年度产值完成率、A分厂A车间月度产值完成率、A分厂年度产值完成率,这是三个不同的指标吗?

要回答这个问题,首先要理清楚指标的概念。

一、指标的概念

指标是统计学范畴,用于数据的描述性统计,衡量目标总体特征的概念及其数值的综合。指标一般由指标名称和指标数值组成,指标名称体现了指标质和量的规定,指标数值反映了指标在具体时间、地点、条件下的数量表现。

在统计工作和统计理论研究中,往往直接将说明总体数量特征的概念称为指标。从同事的问题中,可以看出“产值完成率”是表征总体特征的,可以定义为指标。同事说的三个指标,已经附加了业务语境(时间、地点、对象等),从量化精分来看,可以区分为3个不同的数据指标(复合指标)。

二、业务指标和技术指标的关系

同事又问,从业务视角来看,都是产值完成率,那应该算是一个考核指标啊?

这样考虑也没有错,总体来说是指标分级管理问题,高层级分类往往会站在一定高度上进行抽象汇总,例如上面的“产值完成率”指标,就是一个抽象汇总指标,在业务管理上有意义,它附加不同的分析维度、时间窗口、限定条件等不同,会衍生出许多细分数据指标。

数据指标是用来衡量目标的,从分析角度看,通过细分数据指标,可以获知分析的视角,数据的统计逻辑,数据的量度等,所以指标细化到具体的执行层,才有实际分析意义。例如“A分厂A车间年度产值完成率”在分析层有意义。

系统在做指标管理时,往往要做指标的分类管理,用于指标的分层,便于归类管理。另外,系统会从业务视角,增加业务指标的管理。业务指标往往是一些描述性文字,定义指标设置的目的、计算公式、统计周期,统计维度等,用于指导技术指标的建设。

此处提到了“技术指标”,所谓的技术指标,是从技术实现角度,抽象出的三类指标,即原子指标、衍生指标和复合指标

原子指标是多维模型中的最细数据粒度,定义了事实表中度量属性的聚合逻辑,仅含有唯一度量,是技术指标体系中原子粒度的计算口径描述。

衍生指标由原子指标通过添加时间限定、条件限定和维度卷积而成,限定、维度均来源于与原子指标关联的事实表。

复合指标由一个或多个衍生指标叠加计算而成,是依据业务需要对衍生指标的再加工,尤其可以实现对相同维度(组)的、不同事实表间的多个衍生指标进行组合计算,以达到对数据进行分析统计的需求。

通过上面的三个定义,可以了解到,技术指标依赖于事实表,是对事实表中的维度和度量进行依次加工转化,最终输出符合业务需要的指标数据 。

通过上面的描述,我们对业务指标和技术指标有了一定了解,可通过下图清晰的表达两者之间的关系:

三、业务指标如何转化落地

当听到业务人员说某个业务指标的时候,我们该如何落地实施呢?例如听到业务指标“高风险行业客户占比”时,需要明确业务指标如何拆解成原子指标、衍生指标和复合指标。笔者根据自己的工作经验做了如下总结:

第一步,明确指标维度和统计周期,从数据分析角度,确定数据计算口径。例如高风险行业客户占比”这个指标,明确后的指标为“截至当日各分行的高风险行业客户占比”。“截至当日”确定了数据统计的时间周期,“各分行”确定了维度,即数据统计group by的依据。

第二步,明确指标的计算公式:例如:高风险行业客户占比=高风险行业客户总数/客户总数。

第三步,确定原子指标。原子指标是不可再进行拆分的指标,是基于业务过程的度量值,确定事实表中度量属性的聚合逻辑。结合第二步中的计算公式,提炼出本案例原子指标为:客户总数。

第四步,确定衍生指标。衍生指标=时间限定(统计周期)+维度(统计粒度)+业务限定(筛选数据)+原子指标,本案例衍生指标拆解如下:

第五步,确定复合指标。复合指标是在一个或多个衍生指标基础上,通过各种逻辑运算符合成的,例如比率,比例等类型的指标。本案例复合指标“高风险行业客户占比”由两个衍生指标相除获得:截至当日各分行的高风险行业客户总数/截至当日各分行的客户总数。

指标拆解完毕后,落地到系统上还有很多工作要做,例如源数据的统一集成,数据的治理加工、数据建模、数据计算等,每一步都有很多工作要做,后续会发文逐一展开讨论,以上内容仅为业务指标到技术指标转化落地的总结,期望对大家有所帮助。

未经允许不得转载:IT极限技术分享汇 » 聊聊业务指标到技术指标的转化落地

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址