首先介绍了七周分别需要掌握什么知识
数据思维
业务知识excel数据可视化SQL统计学python数据分析师一门交叉领域的学科
分析师们既可以用excel完成一份最基础的数据报告也可以用python输入挖掘真正决定数据分析师上限的是能力,而不是工具(用好工具简单,但是想要学会真正的数据分析需要积累)
数据分析的结构层次
底层数据的收集/产品端收集
数据采集简称埋点,收集用户在网页端,产品端客户端等终端的数据,也包括第三方外部数据用户行为-原始数据数据业务化/产品需要什么样的数据
将收集的数据转换成可理解、可量化、可观察的业务指标。单纯的数据没有意义,只有和业务结合才能发挥价值原始数据-加工数据数据可视化/产品的表现如何
有了数据指标,必须管理好指标,数据分析体系即数据指标体系,指标需要监控和衡量加工数据-可视化数据/信息数据决策和执行/怎么让产品更好
当从数据中获得了洞察,就需要把洞察转换成策略,这也是包含分析的过程,执行既包含策略的指定,也包括优化和改进,这是持续的可视化数据/信息-数据决策数据模型/产品开始自动化和系统化的运营
这是将策略制作成数据应用和产品,当你洞察到数据中蕴含的规律,什么样的用户喜欢,什么样的商品会被购买,什么样的活动形式更好,就尝试把这些做成系统数据决策-数据产品/应用数据战略/指导未来
当积累了大量的数据,大量的模型,大量的数据应用时,公司级的数据体系已经具备雏形,他不只是数据分析,而是应该将数据变现数据工具-数据体系/战略
第一周:数据分析思维
为什么思维重要:思维能帮助你更好的进行数据分析what 三种核心思维why数据分析的思维技巧how如何在业务时间锻炼分析能力三种核心思维
第一种:结构化将分析思维结构化将论点归纳和整理将论点递进和拆解将论点完善和补充核心论点
可以是假设,问题,预测,原因结构拆解
拆分成分论点MECE
相互独立,完全穷尽论点之间要避免交叉和重复要尽量完善验证
可量化,可以用数据说话必然是可验证的思维导图(适合单兵作战)
例如 销量下降原因? - 内部原因/外部原因内部原因 - 各个地区 - 消费人数下降 - ....外部原因 - 市场竞争/政策/市场容量查看资料和背景,将结论列成一张表/卡片
把表上的结论,依据主题分类将同一类型的结论,按顺序区分讨论同一级别的共通结论,将其结论放在上一段位置
第二种:公式化
结构化是分析的思维,但他还不够数据,而且难免有发散的缺点+-*/一切皆可公式销售额由什么组成? 销量*客单价利润由什么组成? 销售额收益-成本销售额是单一的维度吗?不是 销售额是多个商品/SKU的总和地区的销量由什么组成?是不同线下渠道的累加
第三种:业务化
为了分析而分析,没有深入理解业务,俗称不接地气,好的数据分析思维,本身也是具备业务思维。有没有从业务方的角度思考
真的分析出原因了吗能不能将分析结果落地如何预估上海地区的共享单车投放量?
1.从城市流动人口计算2.从人口密度计算3.从城市交通数据计算4.从保有自行车计算5.单车的消耗因素一个销售公司业绩没有起色,对他进行了分析
销售人员的效率降低,因为士气低落产品质量不佳,和同期竞争对手对比没有优势价格平平,顾客并不喜欢看似像是结论,实际并不是结论
多和业务方沟通
课程学习人数下降
通过三种思维方式,做出一个假设性的分析案例课程学习人数下降的原因? - 内部原因/外部原因
内部原因 - 价格过高,质量不行,受众面不广分为几个地区外部原因 - 同行竞争,市场容量,市场趋势 数据分析的思维技巧1.象限法就是把一堆数据进行分类,可以按照中位数,平均数(经验)
核心:策略驱动
优点:直观、清晰、对数据进行人工的划分2.对比法数据需要对比,和历史数据对比,和竞争对手对比,才能得出一个靠谱的结果
3.漏斗法
4.二八法
20% 产生 80%的效果
TOP N(抓住核心)
5.指数法
线性加权:
例如斗鱼直播的热度,是由礼物,观看人数,弹幕数组成的,
可以 礼物 * 0.7 + 观看人数 * 0.2 + 弹幕数 * 0.1
反比例(收敛,变化会很小)
1 - 1/x
log
6.假设法(没有数据和线索)很多时候,数据分析师没有数据可明确参考的,比如新进入一个市场,公司开拓某样产品,老板让你预测一年后的销量,或者产品的数据基础非常糟糕,你拿不到数据。这时候只能靠假设了
公司在节日进行了一次营销活动,APP上的销量数据整体比上周上升了20%,因为统计失误问题,拿不到明细数据,也就是说,活动效果是一个黑盒,现在的问题是,销量本身就有可能因为节日而提高,怎么证明活动是有效或者无效的呢?
假设活动是有效的
思考一下,活动有效的话,会发生什么事情
会有一定数量的用户购买,则有效
用户通过活动购买商品,会发生什么可观测的行为呢
假设有一些用户会评论留言,那么可以统计提及活动的字眼
当用户提及了这次营销活动,有效值是多少 10%?
假设参与用户行为没有变化,那么通过历史数据的用户评论占比,反推购买人数
7.多维法
用户统计维度:性别,年龄
用户行为维度:注册用户,用户偏好,用户兴趣
消费维度:消费金额,消费频率,消费水平
商品维度:商品品类,商品品牌,商品属性