数据研发学习笔记4.11:大数据之数据可视化

文章目录

  • 1 可视化概述
    • 1.1 什么是数据可视化
    • 1.2 可视化的发展历程
    • 1.3 可视化的重要作用
  • 2 可视化工具
    • 2.1 入门级工具
    • 2.2 信息图表工具
    • 2.3 地图工具
    • 2.4 时间线工具
    • 2.5 高级分析工具
  • 3 可视化典型案例
    • 3.1 全球黑客活动
    • 3.2 互联网地图
    • 3.3 编程语言之间的影响力关系图
    • 3.4 百度迁徙
    • 3.5 世界国家健康与财富之间的关系
    • 3.6 3D可视化互联网地图APP
  • 4 可视化工具实践
    • 4.1 D3可视化库使用指南
    • 4.2 Easel.ly信息图制作实践
    • 4.3 数据可视化之魔镜
    • 4.4 数据可视化之ECharts

1 可视化概述

1.1 什么是数据可视化

数据可视化是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。

数据可视化技术的基本思想是将数据库中每一个数据项作为单个图元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。

1.2 可视化的发展历程

霍乱地图分析了霍乱患者分布与水井分布之间的关系,发现在有一口井的供水范围内患者明显偏多,据此找到了霍乱爆发的根源是一个被污染的水泵 。

数据研发学习笔记4.11:大数据之数据可视化
20世纪50年代,随着计算机的出现和计算机图形学的发展,人们可以利用计算机技术在电脑屏幕上绘制出各种图形图表,可视化技术开启了全新的发展阶段。最初,可视化技术被大量应用于统计学领域,用来绘制统计图表,比如圆环图、柱状图和饼图、直方图、时间序列图、等高线图、散点图等,后来,又逐步应用于地理信息系统、数据挖掘分析、商务智能工具等,有效促进了人类对不同类型数据的分析与理解。

随着大数据时代的到来,每时每刻都有海量数据在不断生成,需要我们对数据进行及时、全面、快速、准确的分析,呈现数据背后的价值,这就更需要可视化技术协助我们更好地理解和分析数据,可视化成为大数据分析最后的一环和对用户而言最重要的一环。

1.3 可视化的重要作用

在大数据时代,可视化技术可以支持实现多种不同的目标:

(1)观测、跟踪数据

数据研发学习笔记4.11:大数据之数据可视化
(3)辅助理解数据
数据研发学习笔记4.11:大数据之数据可视化

2 可视化工具

2.1 入门级工具

Excel是微软公司的办公软件Office家族的系列软件之一,可以进行各种数据的处理、统计分析和辅助决策操作,已经广泛地应用于管理、统计、金融等领域。

2.2 信息图表工具

信息图表是信息、数据、知识等的视觉化表达,它利用人脑对于图形信息相对于文字信息更容易理解的特点,更高效、直观、清晰地传递信息,在计算机科学、数学以及统计学领域有着广泛的应用。

(1)Google Chart API
谷歌公司的制图服务接口Google Chart API,可以用来为统计数据并自动生成图片,该工具使用非常简单,不需要安装任何软件,可以通过浏览器在线查看统计图表。

(2)D3
D3是最流行的可视化库之一,是一个用于网页作图、生成互动图形的JavaScript函数库,提供了一个D3对象,所有方法都通过这个对象调用。D3能够提供大量线性图和条形图之外的复杂图表样式,例如Voronoi图、树形图、圆形集群和单词云等。

数据研发学习笔记4.11:大数据之数据可视化
(1)Google Fusion Tables
Google Fusion Tables让一般使用者也可以轻松制作出专业的统计地图。该工具可以让数据表呈现为图表、图形和地图,从而帮助发现一些隐藏在数据背后的模式和趋势。

(2)Modest Maps
Modest Maps是一个小型、可扩展、交互式的免费库,提供了一套查看卫星地图的API,只有10KB大小,是目前最小的可用地图库,它也是一个开源项目,有强大的社区支持,是在网站中整合地图应用的理想选择。

(3)Leaflet
Leaflet是一个小型化的地图框架,通过小型化和轻量化来满足移动网页的需要。

2.4 时间线工具

时间线是表现数据在时间维度的演变的有效方式,它通过互联网技术,依据时间顺序,把一方面或多方面的事件串联起来,形成相对完整的记录体系,再运用图文的形式呈现给用户。时间线可以运用于不同领域,最大的作用就是把过去的事物系统化、完整化、精确化。自2012年Facebook在F8大会上发布了以时间线格式组织内容的功能后,时间线工具在国内外社交网站中开始大面积流行。

下图显示了我国户籍制度在1994年到2014年间随时间的演变情况,它采用了时间线表示方法。

数据研发学习笔记4.11:大数据之数据可视化

3.2 互联网地图

为了探究互联网这个庞大的宇宙,俄罗斯工程师 Ruslan Enikeev 根据 2011 年底的数据,将全球 196 个国家的 35 万个网站数据整合起来,并根据 200 多万个网站链接将这些“星球”通过关系链联系起来,每一个“星球”的大小根据其网站流量来决定,而“星球”之间的距离远近则根据链接出现的频率、强度和用户跳转时创建的链接来确定,由此绘制得到了“互联网地图”(http://internet-map.net)。

数据研发学习笔记4.11:大数据之数据可视化

3.4 百度迁徙

2014年1月25日晚间,央视与百度合作,启用百度地图定位可视化大数据播报春节期间全国人口迁徙情况,引起广泛关注。

数据研发学习笔记4.11:大数据之数据可视化

3.6 3D可视化互联网地图APP

3D可视化是描绘和理解数据的一种手段,是数据的一种表征形式,并非模拟技术。3D可视化以一种独特的立体视角为用户呈现数据,可以帮助用户发现一些在2D模式下无法察觉的内容。Peer 1开发了一个称为“互联网地图”的APP(如下图),这是一个建立在小盒子形式上的3D地图。

“http://d3js.org/d3.v3.min.js” charset=“utf-8”></script>

(3)预备知识
学习D3可视化库需要的一些基础知识如下:

  • HTML:超文本标记语言,用于设定网页的内容,比如和

    标签

  • CSS:层叠样式表,用于设定网页的样式
  • JavaScript:一种直译式脚本语言,用于设定网页的行为
  • DOM:文档对象模型,用于修改文档的内容和结构
  • SVG:可缩放矢量图形,用于绘制可视化的图形

(4)基本操作

数据研发学习笔记4.11:大数据之数据可视化
语法说明
数据研发学习笔记4.11:大数据之数据可视化
数据研发学习笔记4.11:大数据之数据可视化
数据研发学习笔记4.11:大数据之数据可视化

来源:Lynn Wen

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年4月16日
下一篇 2020年4月16日

相关推荐