数据分析的顶级方法是什么?

2024-11-11

在数据驱动的商业时代,数据分析已经成为企业决策的重要工具。然而,面对许多复杂的数据分析方法,如何选择合适的工具来解决实际的业务问题已经成为一个挑战。


同学们常常疑惑:


"什么是顶级的数据分析方法"


“面试的时候,有人问:用过什么方法,怎么回答? ? "


"为什么我所说的分析方法,会被人嫌弃简单?"


今日系统盘点数据分析方法,大家也罢不懂装懂,看看自己说的水平如何。


第一,不是名字带“分析”二字,而是数据分析方法。很多 XX 分析是统计、运筹、数学的专业工具,并不直接指向业务问题的答案。当人们问“有哪些分析方法”时,他们期望听到一种可以给出结论的方法。


因此要回答好这个问题,要回答:数据分析到底应该处理哪些业务问题。


就商业用途而言,数据分析可以解决问题 5 大类问题


1、多少(数据描述)


2、是什么(建立数据标准)


3、为什么(探索问题的原因)


4、会怎样(预测业务趋势)


5、怎样(综合考虑)?


围绕每一个问题场景,有特定的方法组合(如下图所示)


第一,处理“多少”的方法?


有必要建立一个完善的数据指标系统来描述数据。要建立一个数据指标系统,我们需要对数据指标之间的思维进行梳理。数据指标之间有两个基本思路:串行逻辑和并行逻辑,从而衍生出两种基本的分析方法:漏斗分析 & 指标拆解法。


拆解业务较多,人们发现,某些数据指标可以固定组合使用,例如:


使用者操作场景:AARRR 指标、RFM 指标


零售商店情景:人、货、场指标


产品管理情景:进、销、存指标。


这就是所谓的习惯性:分析模型。


但是注意,这些只是在显示数据。


数据 判断标准,才能得出分析结论。有关判断标准的分析,即:是什么样的问题。


二是处理“是什么”问题的方法?


判断标准可以很简单,比如领导的指示,KPI 要求和过去同期的数据都可以作为标准。这些统称为简单标准。然而,在许多情况下,没有明确的指标趋势。 KPI 约束,甚至 KPI 达到标准,但趋势奇特,领导还是会觉得有问题。此时需要寻找其它参考。所以衍生出一系列的分析方法。


例如:


与业务本身的规律相比,判断优缺点:生命周期法、自然周期法


与同类型、同期发展的业务对比:同期群分析法


对比相关业务个人:分层分析法


这种对比,即使只有 1 一个数据指标,也可以得到优劣的判断。假如市场扩张违反了过去的规律,确实比其他个人差,可以判断为:不好。


当然,也可以使用 2 一个指标,比如经典的矩阵分析法,通过两个指标交叉。 两个指标平均,分为四类业务,从而得出优劣判断。


假如使用更多的指标,比如常用的指标。 Kmean 聚类,可以先用多个指标对业务个人进行聚类,然后再看各种类型之间的表现。


以上这些方法,都可以把生意做好。 / 区分不良,进而在一定程度上帮助判断。


处理“为什么”问题的方法三、


"分析一下这个问题是什么原因造成的…"这是一个常见的要求,这就是“为什么”。


解决问题有两个基本思路:


1. 结果推断:问题发生后,利用各种数据寻找差异,建立假设。


例如:常见的,例如:


结构分析法:通过结构分析,找出问题的发生点。


标记分析方法:通过标记,进行个人比较,找出问题的原因。


相关分析方法:通过计算指标的相关关系,找出相关指标,然后形成假设


MECE 法律:讲多种商业假设, MECE 原则合并为分析逻辑,逐一验证


结果可以推断出业务口中的“我认为这是 XX 原因“,抽象成一个可以通过数据验证的假设,所以适用范围很广。但是结果推断只是单方面总结结果,可能会有偏差,需要实验验证。


2. 试验推断:先有假设,然后通过试验 / 分组比较,验证假设。


常用的方法包括 ABtest、DID、PSM、RDD、Uplift 等方法。


这几种方法更接近传统统计学的实验,大部分要求:


进行数据测试,验证假设


设参考组 / 实验组,并参考组 / 实验组的特点相似


调节变量、环境变量的区别,重点测量调节变量的影响


实验推断有统计依据,计算步骤复杂,看起来更加量化。但对实验条件的要求太高,比如大促销。 ALL in 无法控制环境的业务,如商品、商店等需求场景,如业务员行为、内容传播等难以收集数据的行业,都很难使用。


理想状态,必须是两者的结合,事实 - 假设 - 验证,不断循环,接近真相。但是现实中有很多条件。结果,我们只能从一个角度切入,慢慢接近真相。第四,如何处理“会发生什么”的问题


预测问题,是每个人都感兴趣的话题,也是统计学。 / 算法最有可能发挥作用的地方。唯一有限的方法是:有多少数据? & 业务人员是否应该参与。


如果业务人员坚持参与预测过程,只能使用业务假设法或滚动预测法,列出所有影响结果的参数值,方便业务人员拍脑袋,帮助他们明确:我想做多少?


如果业务人员不参与,视数据量而定。如果数据较少,则使用时间序列进行预测。如果数据较多,并且有影响结果的原因,则可以使用回归模型等算法进行预测。


处理“又怎样”问题的方法?


综合评价和分配问题,俗称“怎么做”。这是决策的最后一步,决定是否做生意,做多少动作。有些简单的评价很容易,比如销售签了生死,达不到业绩目标就解雇。


但是在大多数情况下,评价非常复杂,需要考虑各个方面。这里最大的区别在于是否要考虑领导的主观意见。如果你想,果断使用主观评分法!满足领导的评分欲望是第一位的。如果没有,考虑使用有监督的机器学习算法或因素分析法。DEA 法律(求相对效率)等客观方法。


对于:做多少,谁来做。这是一个更复杂的问题。想要做好分配,首先要完成前几步的分析,对每条业务线的基本能力有深刻的了解,然后才能做出判断。在这里,线性规划的方法可以用来支持。


为什么感觉没有用上方法?


综上所述,数据分析的方法有很多。但是为什么很多学生觉得自己没有用上方法呢?因为每种方法都与需求场景、领导风格、数据质量密切相关。


比如因果推断算法多以分组检测为基础,而在实际业务中,很多因果分析都是以后再查原因,也不给二次实验机会。


举例来说,许多公司的分配方案,根本就是领导拍脑袋,一言堂,根本没有机会让分析师使用算法。


举例来说,预测问题,许多企业根本没有足够的数据积累,只有一个销售数据,那么撑死也只能用时间序列法。


这种理想和现实的差距让很多学生非常痛苦。一方面,我不知道如何使用这些方法,另一方面,我不知道如何应对项目需求。面试和工作都很困难。


本文由产品经理作者【接地气的陈老师】、微信微信官方账号:【接地气的陈老师】、原创。 / 授权 发布于每个人都是产品经理,未经许可,禁止转载。


题图来自 Unsplash,基于 CC0 协议。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com