文章目录
- 数据分析价值与数据分析思维
-
- 一、数据分析概述
-
- 1.什么是数据
- 2.理解数据
- 3.什么是数据分析
- 3. 数据分析的步骤
- 二、数据分析价值
-
- 1.定义和组成
- 2. 商业价值案例–豆浆
- 三、数据分析思维
-
- 1. 核心思维方式
-
- (1)、结构化分析思维
- (2)、公式化分析思维
- (3)、业务化分析思维
- 数据预处理
-
- 一、excel介绍与安装
- 二、数据采集
- 三、数据清洗
-
- 1. 数据一致性处理
- 2. 缺失数据的处理
- 3. 删除重复记录
- 四、数据加工
- 数据可视化
-
- 一、excel可视化
-
- 1. 柱形图
- 2.多系列柱形图
- 3.条形图
- 4.甘特图
- 5.折线图
- 6.双坐标图
- 7.饼图
- 8.股价图
- 9.雷达图
- 数据分析常用方法
-
- 一、excel数据分组
-
- 1.统计分组概念
- 2.利用‘数据透视表’分组
- 二、excel描述性统计分析
-
- 1.描述性统计分析的概念
- 2.总量指标和平均指标
- 3.中位数和众数
- 4.极差、方差、标准差
- 5.样本方差和总体方差
- 三、动态数列分析法
-
- 1.动态数列的概念
- 2. 动态数列的速度指标
- excel相关分析和回归分析
-
- 一、excel相关分析
-
- 1. 相关分析定义
- 2. 相关图–>散点图
- 3.相关系数–>CORREL()
- 二、回归分析
-
- 1. 回归分析概念
- 2. 回归分析原理
- 3. 决定系数
- 4. 利用Excel散点图和趋势线进行回归分析
- 三、excel相关分析补充
-
- 1. 分析工具库的安装
- 2. 相关系数补充
- 3. 利用Excel回归分析工具进行回归分析
-
- (1)SUMMARY OUTPUT
- (2) 方差分析
- (3) 回归结果分析
- 4. 多元线性回归案例
- 其他常见数据分析方法
-
- 一、其他常见数据分析方法
-
- (1)、象限法
- (2)、RFM分析
- (3)、综合评价分析法
- (4)、假设法
- (5)、二八法
- (6)、漏斗法
- (7)、对比法
- 指标体系搭建
-
- 一、指标体系概述
-
- 1、指标体系的必要性
- 2、指标体系特性
- 3、指标体系的作用
- 4、指标的构成
- 二、指标体系搭建流程
-
- 1、理清业务模式(清晰业务阶段和方向)
-
- (1)业务模式梳理的通用方法
- (2)京东自营电商业务
- (3)滴滴出行
- 2、 业务方向的确定
- 3、确定核心指标(北极星指标)
-
- (1)北极星指标
- (2) 核心指标维度拆解
- (3)按公式拆解子指标
- (4)按流程拆解过程指标
- 4、添加分类维度
- 5、指标宣贯、存档、落地
- 6、数据采集
- 7、指标看板搭建
数据分析价值与数据分析思维
一、数据分析概述
1.什么是数据
声音、图像、文字等
- 数据:是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的的原始素材。
2.理解数据
- 数据的呈现形式:表格
- 数据的类型:
- 数据分类的作用:决定数据的整理、显示方法、分析方法、处理方法等。
- 按度量尺度分:
- 定性/离散数据 (分类数据,顺序数据)
- 定量/连续数据(连续数据可进行运算的,不可数的)
3.什么是数据分析
-
最专业的数据分析:
- 有针对性的收集、加工、整理数据,并采用统计和挖掘技术分析和解释 数据的科学与艺术!
-
最简洁的数据分析:
- 简单的很,就是分析数据 。
- 描述数据特征,预测数据趋势,展示分析结果,
- 从一大堆数据中提取到你想要的信息,就是数据分析。
-
数据分析和数据挖掘的区别
- 数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程,是数学与计算机学科结合的产物
- 数据挖掘是指从大量数据中通过算法搜索其中隐藏信息的过程
- 数据分析与挖掘的终极目的就是对大量数据进行分析,提炼隐藏在数据背后的信息,使数据产生新的价值
3. 数据分析的步骤
-
(1提出分析目标
- 现状统计+问题定位+预测
-
(2收集数据
2. 商业价值案例–豆浆
? 未婚妻听了你的话,照做。
? 果然,你们更换进货渠道后,用几乎是原先三分之一的价格,就获得了同品质的食品原料,利润率轻松 提高了150%。
? 时间又过了十来年,你们通过每年屯原料,降低成本,提高利润率,开了多家分店。隔壁老王看了很眼红,也学着你们开了相似的店,做着同样的事。
? 随着对原料市场的深入了解,以及对供需关系愈发清晰,你太太开始做豆子等原材料的期货交易。而你,依旧坚持不懈的收集数据,进行数据分析。
? 但是近期,你通过对多年数据的比对分析,建模检测,忽然发现了一个新的风险点。
什么风险点呢br>
(1)、结构化分析思维
根据目标,梳理条理,形成有逻辑,有步骤的分析思路
(2)、公式化分析思维
结构化可以帮我们理清数据分析的各个论点,但每个论点不一定靠谱有效,比如说上面案例中的外部原因中的竞争对手销量,这些数据我们是无法得到的。
需要一定的数据量化,会用到很多计算公式,比如利润=销售额收益-成本,利润就可以用销售额收益和成本来量化。
用结构法+公式法可以对业务进行辅助和量化
(3)、业务化分析思维
业务化思维避免我们为了分析而分析,用结构化思考+公式化拆解,获得的最终分析论点,很多时候,是现象,数据是某个结果的体现,但不代表原因
数据预处理
一、excel介绍与安装
Microsoft Excel是Microsoft为使用Windows和[Apple Macintosh](https://baike.baidu.com/item/Apple Macintosh)操作系统的电脑编写的一款电子表格软件。直观的界面、出色的计算功能和图表工具,再加上成功的市场营销,使Excel成为最流行的个人计算机数据处理软件。在1993年,作为Microsoft Office的组件发布了5.0版之后,Excel就开始成为所适用操作平台上的电子制表软件的霸主。
二、数据采集
- 数据分类
- 一手数据:也称原始数据。指通过人员访谈、询问、问卷、测定等方式直截获得的,时效性和相关性更好。
- 二手数据:利用文献,统计年 以及数据库等前人统计好的数据资料。优点是获取成本低,且现成可用。一般可以长时间保存,生成数据趋势图方便。
三、数据清洗
数据清洗就是将格式错误的数据进行处理纠正,将错误的数据纠正或删除,将缺失的数据补充完整,将重复多余的数据删除。
1. 数据一致性处理
如:单位同意
2. 缺失数据的处理
- 用样本均值(或众数、中位数)代替缺失值
- 将有缺失值的记录删除
- 保留该记录,在要用到该值做分析时,将其临时删除(最常用方法)
3. 删除重复记录
- excel–>数据–>删除重复项按钮
四、数据加工
- 数据转置
- 字段分列
- 字段匹配–VLOOKUP
- 数据抽取
- LEFT()
- RIGHT()
- MID()
- YEAR()
- MONTH()
- DAY()
- WEEKDAY()
- 数据计算
- INT()–>向下取整
- ROUND()–>向上取整
数据可视化
一、excel可视化
-
统计图:统计图是利用几何图形或具体形象表现统计资料的一种形式。
它的特点是形象直观、富于表现、便于理解,因而绘制统计图也是统计资料整理的重要内容之一。
统计图可以表明总体的规模、水平、结构、对比关系、依存关系、发展趋势和分布状况等,更有利于统计分析与研究。
下面主要介绍如何利用Excel软件来绘制统计图。Excel常用的统计图有柱形图、条形图、饼图、折线图、散点图等。
1. 柱形图
- 单系列
2.多系列柱形图
- 多系列
3.条形图
- 条形图就是将柱形图顺时针旋转90°后所得的效果图,其作用与柱形图一样。
4.甘特图
- 甘特图通过线条或矩形条来展现项目的进度。
在甘特图中,横轴表示时间,纵轴表示项目,线条或矩形条的起点、终点和长度分别表示项目的开始时间、结束时间和持续时间,
5.折线图
- 体现数据的变化趋势
6.双坐标图
- 两个系列数据差别很大时。
7.饼图
- 一个整体分成若干部分,表示每个部分所占的比重
- 简单饼图
- 复合饼图,制作饼图时,有时会遇到这种情况:饼图中的一部分数值的占比较小,将其放到同一个饼图中难以看清这些数据,这时使用复合条饼图就可以提高小百分比数据的可读性。
8.股价图
- 用来显示股价的波动
9.雷达图
- 雷达图因形状酷似雷达的形状而得名。
数据分析常用方法
一、excel数据分组
1.统计分组概念
3.中位数和众数
- 中位数:median()
- 众数:mode()
4.极差、方差、标准差
-
极差=最大值-最小值
-
方差:VAR.P和VARS
-
标准差:STDEV.P和STDEV.S
2. 动态数列的速度指标
- 发展速度:两个不同时期的水平值,分析研究时期的水平值叫 告期水平;对比基础时期的水平值叫基期水平
- 定基发展速度:都和某一固定的基期水平比较
- 环比发展速度:和前一期水平比较
- 总发展速度:
- 最终的水平值除以最初的水平值
- PRODAUT
- 增长速度=发展速度-1(或100%)
- 平均发展速度=geomean(环比发展速度)
2. 相关图–>散点图
3.相关系数–>CORREL()
- 发展速度:两个不同时期的水平值,分析研究时期的水平值叫 告期水平;对比基础时期的水平值叫基期水平
2. 回归分析原理
回归分析法的基本思路是:当数据分布在一条直线(或曲线)附近时,找出一条最佳的直线(或曲线)来模拟它。
当所有点到该直线的竖直距离的平方和∑(y-y′)2最小时,得到的直线(或曲线)最佳,如图所示。这就是最小二乘法原理(二乘就是平方)。
4. 利用Excel散点图和趋势线进行回归分析
三、excel相关分析补充
1. 分析工具库的安装
(1)在Excel 窗口中,选择“文件”|“选项”命令。
(2)在随后打开的“Excel选项”对话框中,单击左边的“加载项”选项后,再单击下方的“转到”按钮
(3)在随后打开的“加载宏”对话框中,选中“分析工具库”复选项,单击“确定”按钮
(4)加载成功后,会在”数据”选项卡中看到一个新的功能“数据分析”
(1)SUMMARY OUTPUT
(2) 方差分析
4. 多元线性回归案例
用回归分析法分析上一小节例3中超市的销量与超市的面积大小、促销费用、所在地理位置的关系,并根据回归方程预测一家在二类地段、面积为1000平方米、月促销费5万元的超市月销售额将会是多少。数据文件为工作簿“相关与回归分析.xlsx”中“多元线性回归”工作表。
其他常见数据分析方法
一、其他常见数据分析方法
(1)、象限法
- 提取所有用户
- 计算每个用户的R,F,M指标
- 对R F M 各指标进行二分类
- 对二分类后的指标进行组合后对应用户类型
详细步骤1、点击数据中任意位置,在数据窗口中选择高级筛选,将买家进行去重,提取出来2、新增三列数据分别为RFM,计算窗口结束日期,求日期列的最大值3、新增一列为最后一次来的时间,ctrl+shift+回车4、计算R 分析日期-最后一次来的时间5、计算F 来了多少次6、计算M 花了多少钱7、使用roundown对R向下取整,计算RFM平均值
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!