数据分析的顶级方法是什么?
在数据驱动的商业时代,数据分析已经成为企业决策的重要工具。然而,面对许多复杂的数据分析方法,如何选择合适的工具来解决实际的业务问题已经成为一个挑战。
同学们常常疑惑:
"什么是顶级的数据分析方法"
“面试的时候,有人问:用过什么方法,怎么回答? ? "
"为什么我所说的分析方法,会被人嫌弃简单?"
今日系统盘点数据分析方法,大家也罢不懂装懂,看看自己说的水平如何。
第一,不是名字带“分析”二字,而是数据分析方法。很多 XX 分析是统计、运筹、数学的专业工具,并不直接指向业务问题的答案。当人们问“有哪些分析方法”时,他们期望听到一种可以给出结论的方法。
因此要回答好这个问题,要回答:数据分析到底应该处理哪些业务问题。
就商业用途而言,数据分析可以解决问题 5 大类问题
1、多少(数据描述)
2、是什么(建立数据标准)
3、为什么(探索问题的原因)
4、会怎样(预测业务趋势)
5、怎样(综合考虑)?
围绕每一个问题场景,有特定的方法组合(如下图所示)
第一,处理“多少”的方法?
有必要建立一个完善的数据指标系统来描述数据。要建立一个数据指标系统,我们需要对数据指标之间的思维进行梳理。数据指标之间有两个基本思路:串行逻辑和并行逻辑,从而衍生出两种基本的分析方法:漏斗分析 & 指标拆解法。
拆解业务较多,人们发现,某些数据指标可以固定组合使用,例如:
使用者操作场景:AARRR 指标、RFM 指标
零售商店情景:人、货、场指标
产品管理情景:进、销、存指标。
这就是所谓的习惯性:分析模型。
但是注意,这些只是在显示数据。
数据 判断标准,才能得出分析结论。有关判断标准的分析,即:是什么样的问题。
二是处理“是什么”问题的方法?
判断标准可以很简单,比如领导的指示,KPI 要求和过去同期的数据都可以作为标准。这些统称为简单标准。然而,在许多情况下,没有明确的指标趋势。 KPI 约束,甚至 KPI 达到标准,但趋势奇特,领导还是会觉得有问题。此时需要寻找其它参考。所以衍生出一系列的分析方法。
例如:
与业务本身的规律相比,判断优缺点:生命周期法、自然周期法
与同类型、同期发展的业务对比:同期群分析法
对比相关业务个人:分层分析法
这种对比,即使只有 1 一个数据指标,也可以得到优劣的判断。假如市场扩张违反了过去的规律,确实比其他个人差,可以判断为:不好。
当然,也可以使用 2 一个指标,比如经典的矩阵分析法,通过两个指标交叉。 两个指标平均,分为四类业务,从而得出优劣判断。
假如使用更多的指标,比如常用的指标。 Kmean 聚类,可以先用多个指标对业务个人进行聚类,然后再看各种类型之间的表现。
以上这些方法,都可以把生意做好。 / 区分不良,进而在一定程度上帮助判断。
处理“为什么”问题的方法三、
"分析一下这个问题是什么原因造成的…"这是一个常见的要求,这就是“为什么”。
解决问题有两个基本思路:
1. 结果推断:问题发生后,利用各种数据寻找差异,建立假设。
例如:常见的,例如:
结构分析法:通过结构分析,找出问题的发生点。
标记分析方法:通过标记,进行个人比较,找出问题的原因。
相关分析方法:通过计算指标的相关关系,找出相关指标,然后形成假设
MECE 法律:讲多种商业假设, MECE 原则合并为分析逻辑,逐一验证
结果可以推断出业务口中的“我认为这是 XX 原因“,抽象成一个可以通过数据验证的假设,所以适用范围很广。但是结果推断只是单方面总结结果,可能会有偏差,需要实验验证。
2. 试验推断:先有假设,然后通过试验 / 分组比较,验证假设。
常用的方法包括 ABtest、DID、PSM、RDD、Uplift 等方法。
这几种方法更接近传统统计学的实验,大部分要求:
进行数据测试,验证假设
设参考组 / 实验组,并参考组 / 实验组的特点相似
调节变量、环境变量的区别,重点测量调节变量的影响
实验推断有统计依据,计算步骤复杂,看起来更加量化。但对实验条件的要求太高,比如大促销。 ALL in 无法控制环境的业务,如商品、商店等需求场景,如业务员行为、内容传播等难以收集数据的行业,都很难使用。
理想状态,必须是两者的结合,事实 - 假设 - 验证,不断循环,接近真相。但是现实中有很多条件。结果,我们只能从一个角度切入,慢慢接近真相。第四,如何处理“会发生什么”的问题
预测问题,是每个人都感兴趣的话题,也是统计学。 / 算法最有可能发挥作用的地方。唯一有限的方法是:有多少数据? & 业务人员是否应该参与。
如果业务人员坚持参与预测过程,只能使用业务假设法或滚动预测法,列出所有影响结果的参数值,方便业务人员拍脑袋,帮助他们明确:我想做多少?
如果业务人员不参与,视数据量而定。如果数据较少,则使用时间序列进行预测。如果数据较多,并且有影响结果的原因,则可以使用回归模型等算法进行预测。
处理“又怎样”问题的方法?
综合评价和分配问题,俗称“怎么做”。这是决策的最后一步,决定是否做生意,做多少动作。有些简单的评价很容易,比如销售签了生死,达不到业绩目标就解雇。
但是在大多数情况下,评价非常复杂,需要考虑各个方面。这里最大的区别在于是否要考虑领导的主观意见。如果你想,果断使用主观评分法!满足领导的评分欲望是第一位的。如果没有,考虑使用有监督的机器学习算法或因素分析法。DEA 法律(求相对效率)等客观方法。
对于:做多少,谁来做。这是一个更复杂的问题。想要做好分配,首先要完成前几步的分析,对每条业务线的基本能力有深刻的了解,然后才能做出判断。在这里,线性规划的方法可以用来支持。
为什么感觉没有用上方法?
综上所述,数据分析的方法有很多。但是为什么很多学生觉得自己没有用上方法呢?因为每种方法都与需求场景、领导风格、数据质量密切相关。
比如因果推断算法多以分组检测为基础,而在实际业务中,很多因果分析都是以后再查原因,也不给二次实验机会。
举例来说,许多公司的分配方案,根本就是领导拍脑袋,一言堂,根本没有机会让分析师使用算法。
举例来说,预测问题,许多企业根本没有足够的数据积累,只有一个销售数据,那么撑死也只能用时间序列法。
这种理想和现实的差距让很多学生非常痛苦。一方面,我不知道如何使用这些方法,另一方面,我不知道如何应对项目需求。面试和工作都很困难。
本文由产品经理作者【接地气的陈老师】、微信微信官方账号:【接地气的陈老师】、原创。 / 授权 发布于每个人都是产品经理,未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




