上一课时,我介绍了数据可视化分析的基本概念,通过对比的方式,讲述了数据可视化分析的概念定义和知识体系,相信你对数据可视化分析已经有了一个基本的了解。本课时,我将给大家分享数据可视化分析的方法论,内容包括:建设目标、工作方法和建设流程。希望你在学完这个课时之后,能够掌握数据可视化分析的建设目标、方法体系和操作流程,并且能够吸收和学会运用。
数据可视化分析之建设目标图
1.呈现业务
数据可视化分析的首要目标是通过将数据以可视化图表的形式真实、完整地呈现业务现状,为发现业务问题打好基础,包括实时的业务数据、数据历史的变化趋势、数据的空间分布和数据构成分布等,在系统建设层面,呈现业务对应的业务系统,往往是业务运营监控系统。通常情况下,我们看到的类似天猫双12数据大屏,公安、交通指挥中心的数据大屏等,都是呈现业务的典型案例。
2.发现异常
了解了业务后,就要对相关数据进行多维度的监控,发现数据的异常,包括对比差异、时间变化趋势、空间分布和构成结构上的异常等,都属于异常。这一环节可以人工完成,也可以系统自动完成,一般的数据可视化系统都会集成异常数据监控能力。
3.分析问题
分析问题往往需要人工介入,基于业务现象和异常的表现,通过时间维度、空间维度、结构维度和关系维度,分析引起异常的可能原因,并进行逐一验证。分析问题通常以人工 + 系统的方式完成,系统提供分析问题所需要的功能,人工通过该功能进行操作来验证问题的原因。
4.定位原因
定位原因是一个比较复杂的系统工程,不止需要人工介入,还要基于数据表现,制定对应的产品和运营策略,通过A/B测试的模式,来验证假设,对于分析问题过程中的推论进行业务验证,从而发现根本原因。例如,当你发现商品的价格因素可能是导致销量下降的原因的时候,可以通过适当的降价/促销等营销活动,来验证这个假设是否成立。
上述四个方面既是数据可视化分析的建设目标,同时也是基于数据可视化分析,解决业务问题的四个步骤,在逻辑上具有前后依赖关系。从系统建设和使用视角而言,则是业务监控、数据化运营、数据化营销和数据化决策的过程。构建数据可视化分析体系,可以有效支撑业务运营决策,从而优化现有业务过程模型。
以上就是建设目标的 4 个过程,你在实际的工作过程中,也可以结合着自己的业务场景、面临的问题来回估和补充完善这些内容。下面我们就来讲讲数据可视化的方法体系。
方法体系
数据可视化分析操作流程图
1.业务理解
业务理解是进行数据可视化分析的起点。一个不了解业务的人,无法参与到数据可视化分析的工作中来;拒绝了解业务的人,没有权力参与数据可视化分析的工作。
在业务理解上,你需要做到:
-
系统地掌握业务流程,包括业务流、数据流和资金流等;
-
深刻理解业务规则,是解读业务的前提;
-
识别业务活动,是输出业务指标和分析维度的关键;
2.定义指标
定义指标是数据可视化分析中的第 2 个步骤。指标是说明总体综合数量特征的概念, 一个完整的指标一般由指标名称和指标数值两部分组成,它体现了事物质的规定性、量的规定性两个方面的特点。定义指标的过程是基于业务活动、抽取和提炼可度量因子的过程。
完整的指标定义过程包括:
-
业务口径,指标的业务逻辑,比如订单已定量 = 订单净已定量 + 订单已退量, 这一过程赋予了业务指标业务含义;
-
计算逻辑,业务指标的技术口径,对应完整的 SQL 查询语句和对应的聚合逻辑;
-
权限控制,对于指标使用范围的限定和约束,可以有效约束核心指标数据的使用边界,是保障数据安全的一种手段。
完成指标定义的范例如下图所示:
常见维度图
4.设计呈现
设计呈现是数据可视化分析的第 4 个步骤,基于已定义的指标和维度,设计页面布局、选择可视图表、设计主题样式和数据交互模式,进行数据可视化呈现的过程。该步骤的核心在于可视化图表的选择,常见的可视化图表包括:折线图、柱状图、散点图等,每个图表适用的场景不同,我会在后面课时中具体讲解。常见图表呈现效果如下图所示:
数据可视化分析平台图
6.数据发布
数据发布是数据可视化分析的第 6 个步骤,数据发布的目的是把程序设计阶段的输出结果,通过工具化和线上化的手段进行共享。上述 5 个步骤,都是服务于第 6 个步骤的。数据发布面向不同的用户群体,发布不同的数据内容,包括个人客户、部门客户、业务线客户和集团客户。数据发布的最终输出形式,往往以 Web 站点的方式对外进行,包括数据看板、仪表盘和数据大屏等。典型的数据发布案例如下图所示:

数据发布图
7.分析洞察
分析洞察是数据可视化分析的最后一个步骤,前面 6 个步骤,完成的是数据呈现业务的问题。该步骤是建立在数据发布基础之上的,基于构建的数据可视化图表,进行问题发现、问题分析和定位原因的过程。虽然分析洞察是数据可视化分析工作的最后一个环节,但不是数据分析工作的最后一个步骤,得出的结论,需要应用到运营策略、营销策略中去,才能够产生最后的价值。
以某单一产品的销售情况为例。某一个时间节点,总销量下降,我们可以在商品销量趋势图中看到明显的转折点,通过商品销量的构成维度、地区分布维度及对比维度,可以发现该商品销量下降的情况是:某个时间节点,某个地区的销量下降导致的总销量异常,发现问题发生的地方。尔后,调整产品运营、营销策略验证具体原因,从而解决相关问题。
小结
本课时主要介绍了数据可视化分析的建设目标、方法体系和操作流程。通过本课时的学习,希望你能够了解:
-
数据可视化分析旨在解决业务数据化过程中面临的诸多问题;
-
数据可视化分析工作并非从零开始,需要借鉴可参考的分析方法,让其成为我们的助力;
-
基于实践经验的总结,沉淀出了数据可视化分析的一套完整的操作流程,可以作为我们进行数据可视化分析工作的推进步骤。
精选评论
**1307:
老师,关于数据可视化分析有什么推荐的书籍或者资料吗??
讲师回复:
市面上的图书质量参差不齐,暂时找不到适合推荐的。资料方面,建议定去看一下:Echarts可视化图表、PyEcharts开源框架、Redash和Superset相关的用户手册。
**传:
老师,我很好奇,大数据和AI的区别是什么呀据,再深化下去,并和其他很多方面整合,才是AI吗据的话,需要的编程语言,技术栈,框架等,都是需要些什么的呢p>
讲师回复:
这是一个相对复杂的问题,了解这个之前需要明确两点:1. 你的视角:从业务视角还是技术视角;2. 你是否具备关于AI和大数据的完整的知识体系。
从业务视角,大数据也好,AI也好,都是手段,不是目标,业务用户关注的是最终提供给终端用户的服务能力;从技术视角而言,大数据特指四个层次的东西:分布式存储和计算、数据仓库、工具平台(类似redash)、数据应用( 表、BI);AI特指:神经 络模型、深度学习框架(TF、PyTorch、Caffe等)、拟人化能力(语音识别、机器视觉、NLP、知识图谱等)。
概况而言:二者是不同方向上的两条技术线,彼此有交集,有依赖,也相互独立,可以共同构建业务服务能力,对外输出。
**军:
本章节的图是什么软件画的可视化分析操作流程图 等几个图画的不错,看起来很清爽。或者是从哪个软件截取的
用PPT画哦
*伶:
老师您讲的真好,我现在困惑问题就是搭建个可视化 表时不知如何着手我日常如何去训练这个技能呢,谢谢您,盼回复
讲师回复:
这里面涉及的是一个工作思路和方法论的问题:即如何构建一个企业级的数据 表体系。需要具备的完整的知识体系包括几个方面:1. 业务建模:业务过程、业务逻辑、业务活动(通过业务建模,了解到底哪些业务主题需要构建可视化的 表);2. 指标定义:明确各个业务活动,需要哪些衡量指标(例如:业绩指标(目标-已完成),人效指标、财务指标等等);3. 维度定义:时间维度、对比维度、分布维度、组成维度等;4. 创建可视化 表;5. 分析和洞察。以上内容我会在课程的“模块三:典型案例篇”详细介绍,敬请期待。
**强:
继二楼,问下老师您对大数据与数据挖掘的区别
讲师回复:
大数据是强调的数据规模,有一套与之配套的技术框架和分析方法;数据挖掘是应用,同一个问题的不同方面
文章知识点与官方知识档案匹配,可进一步学习相关知识OpenCV技能树视频分析光流11545 人正在系统学习中
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!