9月12日,在由中国传媒大学国际传媒教育学院、财新数据可视化实验室、百度新闻实验室联合主办的“京华论道——2015可视化与数据新闻分享会”上,财新传媒首席技术官、财新数据可视化实验室负责人黄志敏带着案例与现场听众进行了分享。他根据自己从业的经验,将数据新闻的生产切割成七个步骤,庖丁解牛般地将数据新闻的选题确定、数据整理和可视化呈现进行了清晰地分析。声名在外的财新数据可视化实验室实是怎样完成一个大体量的数据新闻制作的p>

以下为演讲实录:

今天我用一个案例,给大家拆解数据新闻的生产过程。

什么是可视化span>

科学可视化主要用于处理科学数据,如地理信息、医疗数据等,以自然科学领域为主。我们日常接触到的地图、气象图、CT等都属于典型的科学可视化。

信息可视化主要用于处理抽象的、非结构化、非几何的抽象数据,如金融交易、 交 络和文本数据。传统的信息可视化起源于统计图形学,又与信息图形、视觉设计等现代技术相关。我们在路上看到的交通标志都属于信息可视化。

第三类叫可视分析。北大的袁晓如老师一直强调我们不应该叫可视化分析,应该叫可视分析。可视分析用可视化的方式来帮助分析数据,以找到我们平常不容易发现的内容。平常我们接触最多的可视分析可能是是最近大家又爱又恨的那个东西(上半年主要是爱,下半年主要是恨)——K线图,将最高价、最低价、开盘价收盘都合并到一个曲线里,非常的方便,特别典型的可视分析。

可视化的好处是直观。炒股的朋友,如果早上一打开炒股软件或 页,满眼都是红的,顿时精神愉快容光焕发,能开心一整天;万一看到满眼绿色,立刻整个人都不好了。这个效果特别明显,都不需要看具体的数字,有点颜色刺激就行。所以有个炒股软件提供了一个功能,叫红绿对调,逢股灾的日子把这个功能打开,整个屏幕刷的一下就变红了,虽然明知道是假的,可心情还是好很多。这也是可视化的功劳。

科学可视化,信息可视化和可视分析,这三个都称为可视化,把可视化和精确新闻 道结合在一起,就成了数据新闻。

数据新闻可以用静态的图表来表现,也可以用代码来实现。前者也称为信息图,后者可以叫互动图表。今天我所讲的数据新闻,主要指互动图表。

数据新闻团队怎么构建span>

财新数据可视化实验室有十几个成员,大家组成不同的项目组,完成不同的数据新闻,这是我们的工作方式。

一个案例告诉你数据新闻生产的7个步骤

第一步——找选题

一个好的选题会决定这个数据新闻的受欢迎程度。我们实验室成立于2013年10月8日,成立两三个月之后我们就碰到一个非常好的选题,是什么呢周老虎的案件。这是几十年一遇的好选题。

第二步——找角度

一个选题可以从不同的角度去表现,当时关于这个选题,财新组织了6万字的调查 道,从里面可以找出丰富的素材。在这个 道里头什么角度最引人关注,什么素材最适合做数据新闻,我们花了不少时间讨论。

仔细阅读文章后,我发现其中有一个内容特别有意思——这起案件涉及了几十个被调查的人,有他的亲属、亲家、下属,甚至下属的下属,调查了几十个人。我想如果能把这几十个人的关系讲清楚是很好的一个题材。第二部分是关于公司,里头讲了一百多家公司,都是周氏家族直接间接持有的公司,通过这些公司赚钱。这些公司有的并不直接在周氏家族成员名下,有些公司已经被转让了。能不能把这些公司讲清楚,也是很有意思的事情。于是我决定用这个角度,从人和公司的角度,来做这个数据新闻。

为什么要整理成有规律的数据为了后面写代码的时候便于数据提取。除了把数据按各个字段分开,还要将错误的数字剔除,再整理成统一的格式,这个过程称为数据清洗。

第四步——数据分析

这一步首先要分析这些数据的特征。从前面这张数据库的图可以看出:数据基本都是定性分析,主要讲的是人跟人之间的关系,以及人跟公司、公司与公司之间的关系。分析这些数据之后,会发现核心两个关键点:一个叫人,一个叫公司。关系有三种,一是人跟人之间的关系,第二个是人跟公司之间的关系,第三个是公司跟公司之间的关系。

然后,再把这些关系分别合并为几种类型。

人跟人的关系合并为三种类型,第一种叫直系亲属,第二种叫上下级,第三种是老板和秘书。直系亲属关系没有方向性,关系是相互的。上下级和老板秘书这个反系,则有明显的方向性,得讲清楚谁是谁的下级,谁是谁的秘书。

人与公司或公司与公司之间的关系,可以合并成两种:第一种是持股,第二种叫转让或者收益。这样数据就简单了,变成对这些关系做定性分析。

第五步——要选择合适的图形

做数据新闻我最喜欢这个环节。你必须找出最合适的图形来表现前面那一堆数据,没有标准答案,只有最佳答案,可以不断地改进,让图形更简洁、更优美、更准确,就像解智力题。

我们先看一下图形的分类,数据新闻中常用的图形大致有两类。

当我们对数据做定量分析的时候,通常使用基于坐标绘制的图形。例如折线图和散点图,基于直线坐标画出;例如饼图,基于极坐标画出。

如果对数据做定性分析,你会发现通常你画的图不需要基于坐标。下周第一个叫流程图,第二个叫树性图。这些跟坐标都没关系,主要是靠点、线、和箭头来表现。你可以根据需要对图形做扭屈和变形,只要元素相互关系不变,一般不会影响内容的表达。

最后我们讨论出一个图形。我们把点平均分布到一条直线上,把联线变成弧线,这样整个图形看起来显得很美观、整齐、有规律。左边将有关系的人用弧线连起来。右边将持股的公司用弧线连起来。实际做的时候还会在一些弧线上添加运动的小点表示它的方向。

到第五步已经确定了基本的图形,第六步要丰富这个图形的内涵。

第七步——代码呈现图形

图形设计好了,接下来怎么用代码来呈现呢有很多朋友做数据新闻相关的工作,或者在公司和学校里希望做可视化的东西,但遇到很大的困难。前面我都会了,后面怎么办呢办法:第一是自己学写代码,自力更生,丰衣足食;第二个办法找能写代码的人合作。我们这个作品是通过合作完成的。

这样一个作品,真正要实现的时候,还有很多需要考虑和丰富的地方。例如:你怎么引导用户视线能让用户不要眼花缭乱能让他知道应该先看什么后看什么能把它不关注的内容隐藏掉关注某项特定内容的时候,能不能给他展现更多的数据p>

这个作品最终在一个屏幕的空间呈现了三万字的信息。

End.

(By:Eastmount 2015-10-5 晚上10点半 http://blog.csdn.net/eastmount/)

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2015年9月4日
下一篇 2015年9月4日

相关推荐