人工智能时代前沿技术社区

首页 > 大数据 > 热点

数据分析方法论实战案例与实战案例

今天讲的内容主要包括五个方面

作者: | 2019-10-06 22:14:55


今天讲的内容主要包括五个方面:

 

1570371546433522.jpg

一、数据分析是什么

业务发展路径来看:粗放到精细的过程

0-1 验证业务逻辑

1-2 验证业务模型的可复制性

2-80 快速增长,复制,裂变

80-100 精细化运营,寻找下一个业务曲线

 

什么是数据:订单信息、GMV、司机号码等属于内部数据;统计局数据、爬虫等属于外部数据。即一切信息都是数据。

什么是分析:通过现象看本质的过程。

 

数据分析的关键:

数据对应方法(概率论、统计学等),分析对应的是思路(业务调研、逻辑思考等)。——轻方法,重研究。

 

数据分析的四个阶段即阐述现实,然后分析,进而给出建议,最后落实到方案。

 

二、如何开展数据分析

数据分析可以从分析流程、业务理解、分析类型和破题手法四方面进行。

1、分析流程:包括业务理解、问题转化和数据分析。

2、业务理解:第一个先要想的是人,即分析对象;第二个是目的,分析的产出计划用来做什么;第三步是背景,项目所处的阶段或当前的难点,需求过来它的背景;第四步是需求,这个很重要,我见过很多的分析师见到需求直接喀什做了,但其实业务方希望见到的并不是字面的;第五步是产品,也是交付的展出;第六步即其他。——当面沟通最好或者微信文字形式。

3、分析类型:包括评估(评估效果或复盘)和探索型两种(周拆解KPI)。前者推荐GSM框架,包括目标、现象和指标。后者分为营销管理的咨询模型(4P4C)、数据算法模型(关联规则、决策树)、自建框架模型(h5页面的分析)。

 

三、常用的数据分析方法

汇总统计:起源。想用单个数据或几个指标反映大规模数据的各种特征,平均值、中位数就可以做很好的概括。当你发现简单的数据无法对你的分析做覆盖的时候或者说用小样本反应大数据的时候你可能会用到统计学的指标。

例子:活跃用户—一个重要指标:用标准差进行衡量

汇总统计:设计

汇总数据指标的设计,源于非常朴素的思想

 

常用的数据分析方法:

—对比分析法

是一个比较常用的分析法,本身是一种独立的分析方法,也作为很多数据分析方法的基础,“没有对比,就没有分析”,对比的关键是选择合适的参考标的,即关注关键因素和多维度对比,作为独立的分析方法时,常见对比方法又自身类似行为活动、目标规划以及竞品行业,如KPI是否达成。

—细分分析法

将事物从大到小,从复杂到简单进行拆解,拆解到直至问题能为其他分析方法可解,并且满足业务需要,如店铺流量分析以及用户分层分析。

—趋势分析法

关注被分析事物一定时间跨度内的数据表现,其实是从静态到动态的延伸,从离散变成连续,如APP用户留存分析以及品牌广告投放后的品牌声量分析

—结构分析法

研究各个部分占总体的比例,对各个部分之间的干系进行对比,如O2O货运平台的竞争现状或者某平拍各产品线销量贡献的分析。

—交叉分析法

所有分析方法综合起来进行分析,多维度的结合分析,本质也是一种细分的方法,也会作为一个概览数据的细化解读,如安卓系统个渠道的新增用户数据分析以及集团下各品牌各品类的月销分析。

—平均分析法

如各大厂公布的人均年薪

—描述性分析法

如司机的月收入分布或者订单流水是否出现问题

——漏斗图分析法

通常用于分析牵涉多环节的业务场景,用以发现具体哪个环节为亮点或者漏洞,如威胁你H5活动分析

—四象限分析法

通常是基于2-3个指标,把研究对象群体作为一个划分,横纵坐标代表量化指标,可以加入气泡,本质是将研究对象加标签,为业务决策提供分配资源以及优先级安排建议,如店铺商品研究。

 

四、数据分析案例

案例一:如何找出叫车平台配对率低的问题所在?

首先要拆解,建立一个框架。司机加入平台接单,用户下单,平台提供服务,进行匹配,用户正反的反馈传播到更多的用户等。

订单拆解:配对成功75.17%,失败24.83%,而在成功里执行成功的也只有50.14%,失败在继续拆解,原因分为用户取消、司机拒绝等。

漏斗分析:司机接单流程——登陆、工作、有单、点单、抢单、接单、完单

案例二:热力图对比—广州地区某顺风车易配对失败分析

背景:配对率低

怎么做:前后对比,找出低配对区域并标记做围栏补贴,改善配对率

五、常见统计陷阱

相关系数的误解:因果性,数据性的相关性不代表逻辑的相关性

精心挑选的平均数:被平均,只有正态分布的数据谈平均数才有实际意义

无所不能的图形:双刃剑,不同格式的图形可以表达不同的涵义,数据分析者有责任和义务利用准确的图形反映现实情况

比较的误区:缺失和错配,比较的基础是求同,比较的目标是存异。

抽样不具有代表性:幸存者偏差

总结:方法和工具是基础,业务和逻辑是核心;知道看数据,更知道真实数据;细致拆分做分析,汇总结论做汇报。