黄志敏:数据新闻制作7步法,一张图抵3万字

0x_fmt=png

讲数据新闻离开不可视化,可视化是数据新闻的基础。什么是可视化们把可视化分为三个领域,第一个叫科学可视化,第二个叫信息可视化,第三个叫可视分析。

科学可视化主要用于处理科学数据,如地理信息、医疗数据等,以自然科学领域为主。我们日常接触到的地图、气象图、CT等都属于典型的科学可视化。

信息可视化主要用于处理抽象的、非结构化、非几何的抽象数据,如金融交易、社交网络和文本数据。传统的信息可视化起源于统计图形学,又与信息图形、视觉设计等现代技术相关。我们在路上看到的交通标志都属于信息可视化。

第三类叫可视分析。北大的袁晓如老师一直强调我们不应该叫可视化分析,应该叫可视分析。可视分析用可视化的方式来帮助分析数据,以找到我们平常不容易发现的内容。平常我们接触最多的可视分析可能是是最近大家又爱又恨的那个东西(上半年主要是爱,下半年主要是恨)——K线图,将最高价、最低价、开盘价收盘都合并到一个曲线里,非常的方便,特别典型的可视分析。

可视化的好处是直观。炒股的朋友,如果早上一打开炒股软件或网页,满眼都是红的,顿时精神愉快容光焕发,能开心一整天;万一看到满眼绿色,立刻整个人都不好了。这个效果特别明显,都不需要看具体的数字,有点颜色刺激就行。所以有个炒股软件提供了一个功能,叫红绿对调,逢股灾的日子把这个功能打开,整个屏幕刷的一下就变红了,虽然明知道是假的,可心情还是好很多。这也是可视化的功劳。

科学可视化,信息可视化和可视分析,这三个都称为可视化,把可视化和精确新闻报道结合在一起,就成了数据新闻。

讲到这里不能不提精确新闻报道。精确新闻报道产生于二十世纪六七十年代,提出者认为传统新闻报道向艺术的方向发展,追求讲故事,追求文字优美动人,但还可以有另外一个发展方向,就是科学的方向,追求精确的分析和表达,这个方向就是精确新闻报道。所谓精确新闻报道,是将社会科学的研究方法,比如抽样调查、实验和内容分析等引入到新闻报道中。所以它更像一篇论文或调查报告。现在看到的财经报道,很多都可以被归入精确新闻报道。但精确新闻报道往往充斥了大量的数字,不容易理解和记忆,这种情况下可视化发挥了重要的作用,它可以帮助作者和读者从数据中挖掘出隐藏的真相,还可以帮助读者理解文章的内容。将可视化和精确新闻报道相结合,就成了数据新闻。

数据新闻可以用静态的图表来表现,也可以用代码来实现。前者也称为信息图,后者可以叫互动图表。今天我所讲的数据新闻,主要指互动图表。

  • 数据新闻团队怎么构建/span>

0x_fmt=jpeg

当我们完成前两个步骤就需要启动第三步:数据收搜集整理和清洗。前两步可以认为是策划阶段,以口头讨论为主,如果觉得不合适可以推倒重来,成本损失不大。从第三步进行实操环节,会有较大的工作量。把这些数据从报道里抽出来之后,按照我们设计的格式把它变成了图中这个数据库的样子。

为什么要整理成有规律的数据是为了后面写代码的时候便于数据提取。除了把数据按各个字段分开,还要将错误的数字剔除,再整理成统一的格式,这个过程称为数据清洗。

第四步——数据分析

这一步首先要分析这些数据的特征。从前面这张数据库的图可以看出:数据基本都是定性分析,主要讲的是人跟人之间的关系,以及人跟公司、公司与公司之间的关系。分析这些数据之后,会发现核心两个关键点:一个叫人,一个叫公司。关系有三种,一是人跟人之间的关系,第二个是人跟公司之间的关系,第三个是公司跟公司之间的关系。

0x_fmt=png

人跟人的关系合并为三种类型,第一种叫直系亲属,第二种叫上下级,第三种是老板和秘书。直系亲属关系没有方向性,关系是相互的。上下级和老板秘书这个反系,则有明显的方向性,得讲清楚谁是谁的下级,谁是谁的秘书。

人与公司或公司与公司之间的关系,可以合并成两种:第一种是持股,第二种叫转让或者收益。这样数据就简单了,变成对这些关系做定性分析。

第五步——要选择合适的图形

做数据新闻我最喜欢这个环节。你必须找出最合适的图形来表现前面那一堆数据,没有标准答案,只有最佳答案,可以不断地改进,让图形更简洁、更优美、更准确,就像解智力题。

我们先看一下图形的分类,数据新闻中常用的图形大致有两类。

当我们对数据做定量分析的时候,通常使用基于坐标绘制的图形。例如折线图和散点图,基于直线坐标画出;例如饼图,基于极坐标画出。

0x_fmt=png

0x_fmt=png

具体到这个案例,我们主要做的是定性分析,基本上不需要基于坐标轴的图形。

0x_fmt=png

我举一个简化的例子。我们看一下左边这个图形,如果我用一个点来表现一个人,用一根点和点的连线来表现人与人的关系,人际关系基本上可以表现为一些相互连接的点和线。假如把六个点平均的分布在一个圆周上,形成六角形的六个顶点,大致会看到左边的样子,这是很常见的情况。

0x_fmt=png

如果我还要表现人跟公司之间的关系,把公司的股东跟他持有的公司再一连,这图形就变得复杂了,看了不太好理解。怎么办们反复推敲很多的方案,用什么样的图形表现最合适呢/p>

0x_fmt=png

我们还做了一件很重要的事,就是反复调整点的前后位置,以便弧线的交叉最少。在这个图中,基本上左边的图形也好,右边的图形也好,把弧线的交叉全部清除了。

第六步——丰富图形的内涵

到第五步已经确定了基本的图形,第六步要丰富这个图形的内涵。

0x_fmt=png

然后再怎么做把代表人的这一行放在上方,把代表公司的这一行放在下方,把人和公司之间的连线用直线从上到下连接起来,这样就整个图形就形成了。

第七步——代码呈现图形

图形设计好了,接下来怎么用代码来呈现呢座有很多朋友做数据新闻相关的工作,或者在公司和学校里希望做可视化的东西,但遇到很大的困难。前面我都会了,后面怎么办呢个办法:第一是自己学写代码,自力更生,丰衣足食;第二个办法找能写代码的人合作。我们这个作品是通过合作完成的。

0x_fmt=gif

来源:weixin_34107955

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2017年4月2日
下一篇 2017年4月2日

相关推荐