随着 DT 时代的到来,传统的统计图表很难对复杂数据进行直观地展示。这几年数据可视化作为一个新研究领域也变得越来越火。成功的可视化,如果做得漂亮,虽表面简单却富含深意,可以让观测者一眼就能洞察事实并产生新的理解。可视化(visualization)和可视效果(visual)两个词是等价的,表示所有结构化的信息表现方式,包括图形、图表、示意图、地图、故事情节图以及不是很正式的结构化插图。
基本的可视化展现方式,如条形图、折线图、饼图、雷达图可以很容易通过各种软件(如 Excel)容易生成,这些方法是常见可视化问题的良好且强大的解决方案。然而,使用这些方法的最佳方式局限于一些特定的数据类型,而且其标准型和普遍性意味着它们基本无法达到新颖性。如果对地理空间数据、 会 络关系、多维数据进行可视化,直观地传递数据期望表达的信息是需要特定的图表类型来展示。
让我们一起来看几个经典的可视化,观测它们是如何充分利用其源数据结构的。
01
“美国大选”数据可视化
在美国大选期间,美国媒体做了不少与之相关的数据 道,让我们来回顾一下,他们是如何将美国大选的数据可视化的吧!
从 络图可以看出,不同家族的成员基本紧密联系在一起,并通过一些关键成员与其他家族成员联系。例如我们发现右下角的那个 群的成员先通过 user1 用户、再通过 user12 用户跟其他 团成员联系在一个大 络图中。
我们也可以用 Gephi 软件快速绘制 会 络图,并对其进行美化。
也可以利用 Remap 快速实现未来天气预 。
城市热力图也是近年来非常流行的一种地理信息可视化方式,通过颜色的深浅表示不同地区的实际数值大小(动图链接)。
比如 D3 可以非常容易地绘制交互桑基图。桑基图(Sankey diagram),即桑基能量分流图,也叫桑基能量平衡图。它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融等数据的可视化分析。桑基图最明显的特征就是,始末端的分支宽度总和相等,即所有主支宽度的总和应与所有分出去的分支宽度的总和相等,保持能量的平衡(动图链接)。
ECharts(http://echarts.baidu.com/)
ECharts,缩写来自 Enterprise Charts,商业级数据图表,一个纯 JavaScript 的图表库,可以流畅的运行在 PC 和移动设备上,兼容当前绝大部分浏览器(IE6/7/8/9/10/11,chrome,firefox,Safari 等),底层依赖轻量级的 Canvas 类库 ZRender,提供直观,生动,可交互,可高度个性化定制的数据可视化图表。创新的拖拽重计算、数据视图、值域漫游等特性大大增强了用户体验,赋予了用户对数据进行挖掘、整合的能力。
动图链接
R(https://www.r-project.org/)
R 语言是一套开源的数据分析解决方案,几乎可以独立完成数据处理、数据可视化、数据建模及模型评估等工作,而且可以完美配合其他工具进行数据交互。 R 语言拥有顶尖的制图功能。不仅有 lattcie 包、ggplot2 包对复杂数据进行可视化,更有 rCharts 包、recharts 包、plotly 包实现数据交互可视化,甚至可以利用功能强大的 shiny 包实现 R 与 web 整合部署,构建 页应用,帮助不懂 CSS,HTML 的用户能利用 R 快速搭建自己的数据分析 APP 应用。
比如我们可以绘制动态交互的气泡图,通过下面的时间轴播放动态查看不同年份的气泡情况。
还可以结合自己掌握的数据分析和可视化技术,搭建数据可视化平台,从而实现智能BI的可视化功能。比如说,我们不需要具备开发能力,利用 R 工具的 shiny 包可以快速搭建数据可视化原型。下面这个例子(https://www.showmeshiny.com/global-terrorism/)就是一个通过 shiny 包结合可视化技术实现的一个可视化平台。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!