互联网人要相识的数据可视化——底子篇|大家都是产物司理 ...
数据可视化对互联网人来说是一项日益紧张的技能,如今,从底子开始,一起分享互联网人要相识的数据可视化。http://image.woshipm.com/wp-files/2019/09/Cm8mU5auLssOSzJfEKaJ.jpg
现现在无论是工作报告,产物计划,背景计划乃至是数据大屏,越来越多的职业必要和数据打交道。尤其是想要进进一个B真个公司,数据可视化更是必不可少的一个技能。
数据可视化,可谓是越来越表现一个人的专业本领。因此把握数据可视化本领,是面向将来的互联网人所必备的本领。
然而尴尬的是,国内没有一款针对于讲授数据可视化的全套办理方案,这让许多渴看学习的同砚摸不着头脑。以是这也促使我开启了这个系列《互联网人必要相识的数据可视化》,盼望可以或许给各人带来一些不一样的内容,为各人梳理一个完备的数据可视化框架。
本日带来的就是这个系列的第一篇,数据可视化的概念以及数据可视化计划的根本准则。
近来不停在做国际外包,时间非常的零星,而写逻辑性强的文章又非常泯灭精神。以是从开题到如今,用了快要2个月的时间才将这篇文章彻底扫尾。全文总计25000字左右,阅读必要20分钟左右,干货满满,请各人做好预备。
一、什么是数据可视化
数据可视化就是借助视觉的表达方式(不范围于笔墨),将枯燥的,专业的,不直观的数据内容,风趣的、浅近的、直观的转达给观众的一种本领。
非计划师在制作数据可视化时,每每会由于重点突出数据的紧张性,而让可视化图表变得枯燥乏味。而计划师在制作数据可视化时,又会由于过分注意壮丽多彩而让数据的出现结果大打扣头。以是在这种大情况下,催生出了数据可视化行业。
作为计划师,怎样拥抱这个新兴的行业,怎样把握计划与功能之间的均衡,从而更好的沟通与转达信息,便是本文的重点。
http://image.woshipm.com/wp-files/2019/09/6b2qGrf79kKUJCZE6loJ.png
信息图表,就是数据可视化后产生的效果,就是我们在工作报告中,项目先容中,以及背景体系中常常见到的数据图表。
信息图形由信息和图形两个词语构成,它被称之为“信息图形”(Infographics或Information Graphics)。信息图形最初是在旧的纸质媒体上登载的,更加有助于人们明白消息信息的可视化内容。
http://image.woshipm.com/wp-files/2019/09/22NeDLmT9GJH6ZDMIT8b.png
http://image.woshipm.com/wp-files/2019/09/3y9ejr6Y3w225f6BCoJU.png
二、信息图表的分类
根据木村博之的界说,从视觉体现情势的角度,将“信息图表”的出现方式分为六大类:图解(Diagram)、图表(Chart)、表格(Table)、统计图(Graph)、舆图(Map)、图形符号(Pictogram)。
http://image.woshipm.com/wp-files/2019/09/sWhOYqkKV0S3BPgLcTWX.png
笔墨有时间是一种匮乏的信息通报方式,而可视化的方式,则是人类最本源的一种信息通报方式,图解就是将许多无法正确或高效用语言转达的内容,以生动形象的图形表明出来。
下图是一张经典的对于咖啡种类图解,38种咖啡配方,不须要用多余的笔墨表明,直接用图解表现,简朴明白,清楚易懂。
http://image.woshipm.com/wp-files/2019/09/vYwVeUgXtJhjHSTAaeyG.png
2.1 图表:运用图形、线条及插图等,论述事物的相互关系
图表通常用于简化人们对于大量数据之间的关系的明白,人们通常明白图表会比明白数据要快许多。图表和图解唯一的差别点在于,图解是用可视化的方式往通报信息;而图表则是用往复论述信息之间的逻辑关系,流程图就是典范的图表。
下图是一张宠物狗的进化图,用奇妙的方式清楚地向我们通报了,狼是怎样被人类驯化成差别种类的宠物狗的。
http://image.woshipm.com/wp-files/2019/09/GFL5MbFkV4tq0r9zhoGS.png
2.2 表格:根据特定信息尺度举行区分,设置纵轴和横轴
表格是按照行和列大概接纳更复杂的布局分列的数据,表格广泛应用于通讯、研究和数据分析。实在表格并没有一个确定的界说,它会由于差别的行业和评论情况而存在差别。
http://image.woshipm.com/wp-files/2019/09/hgzasZPFFOjWvBtqLkto.png
2.3 统计图:通过数值来体现变革趋势大概举行比力
统计图是根据统计数字,用多少图形、事物形象和舆图等绘制的各种图形。它具有直观、形象、生动、详细等特点。
统计图可以使复杂的统计数字简朴化、普通化、形象化,使人一览无余,便于明白和比力。因此,统计图在统计资料整理与分析中占据紧张职位,并得到广泛应用。
下图是大都会通勤的时长统计,通过这些柱状图,我们能很清楚看出各个级别的都会通勤时长的比例关系,并相识他们的拥堵时长和非拥堵时长分别是怎样的环境。
http://image.woshipm.com/wp-files/2019/09/V1zP6Zeqyj5I4TvWKkRf.png
2.4 舆图:形貌在特定地区和空间里的位置关系
将真实的天下转换为平面,在此过程中一定要讲一些东西略往。
现实上,要说“省略”是舆图上最关键的词也不为过,无论是哪种信息舆图,最紧张的是让用户找到想要看到的信息。
信息舆图也可分为两大类:
[*]将整个地区的结构或布局完备出现的舆图;
[*]将特定对象突出表现的舆图。
以下是美国各州拥有枪支人数占总人数的百分比统计图。
http://image.woshipm.com/wp-files/2019/09/nrbXwtWzk5uD2nQJzaov.png
2.5 图形符号:不利用笔墨,直接用图画转达信息
所谓图形符号(也就是我们常说的icon),根本就是通过易于明白、与人直觉符合的图形转达信息的一种情势。
生存中到处存在图形符号,包罗地铁站收支口上的地铁标识,路边的指示牌与限速标识。人们会约定俗成地运用一些符号来代表一些固定的意思,好比茅厕门口的男女标识。许多市肆为了个性化计划,利用了不常用的符号来表现男女,这会给消耗者造成很大的困扰,由于这离开了他们常见的明白范围。
图形符号的计划原则是尽大概不利用笔墨,其作用有两条:
[*]制止语言不通造成的困扰;
[*]更便捷、更清楚地通报信息。
多年来,最经典的图形符号应用案例可以说是奥运会和残奥会的活动图标了。图形符号可以说已经成为奥运会和残奥会的紧张构成部门,就像火把通报和活动会LOGO一样,从赛事门票到奥运村的品牌,图形符号都在被广泛利用。
下图即为东京奥运会的活动图形符号(局部):
http://image.woshipm.com/wp-files/2019/09/QE6tcPrbE4YDoTLDxkxU.png
三、到达数据可视化目的的根本方法
现在我们工作中常常碰到的数据可视化,大多数是制作数据图表(即统计图Graph),以是我们本文的重要讲授内容也是围绕着怎样制作统计图来说。
制作统计图的过程可以被四个步调,分别是:明白目标、选择图表、视觉计划、突出信息。
http://image.woshipm.com/wp-files/2019/09/ebNyjTAadZvppE2htIgg.png
[*]明白目标:明白数据可视化的目的,通过数据可视化我们要办理什么样的题目,必要探索什么内容或报告什么究竟,并选择符合的图表。
[*]选择图表:围绕目的找到能提供信息的指标大概数据,选择符合的图形往展示必要可视化的数据。
[*]视觉计划:以可视化的本领将数据转化成风趣的计划语言。
[*]突出信息:根据可视化展示目的,将紧张信息添加辅助线或更改颜色等本领,举行信息的凸显,将用户的留意力引向关键信息,资助用户明白数据意义。
3.1 明白目标
大多数环境,明白图表自己要到达的目标,比制作好图表自己更加紧张。
假如对数据熟悉不清,就会造成2种效果:
[*]无法制定符合的图表标题,从而使读者失往阅读图表的爱好;
[*]无法选择出精确的可视化方式,从而使图表难以明白。
知识点01:好的图表标题——即是乐成的一半
大多数图表都必要一个好的标题,如许才气让口试官知道他们在看什么。
标题应该是一个结论,是你盼望口试官从中得到的信息(故意义而且风趣的部门),而不但仅是对图表展示内容的概括(即偶然义且无趣的部门)。
http://image.woshipm.com/wp-files/2019/09/ZaRRS2XXBKkALN5l8Xwy.png
3.2 选择图表
Andrew Abela根据统计图的重要功能,将全部的统计图分为了四大类:比力、接洽、分布、构成。在其资料的底子上,我制作了一套更得当计划师的“图表选择器”(The Way of Data Visualization)。
http://image.woshipm.com/wp-files/2019/09/C6MZKFu67C98d5jRMfF9.png
通过上述图表选择器,我们可以容易地根据我们想要显现的数据的种类,以及我们制作图表的目标,来选择到符合的图表。
但是一样平常工作中,我们每每用不到这么多的图表种类,这个“图表选择器”更得当我们作为学习图表概念的工具。一样平常工作中,有六种根本图表已经可以覆盖我们大部门的利用场景,也是做数据可视化最常用的六种图表范例。
http://image.woshipm.com/wp-files/2019/09/xKQHsnU1JM17GkjkUK9o.png
以是作为新手的我们,只要能纯熟把握这六种图表,即可应付大部门的利用场景,而对于我们这种更专业的人士来说,上述的“图表选择器”可以或许大大进步我们的工作服从。
3.3 视觉计划
接下来也是数据可视化中最紧张的一步——视觉计划。
许多时间我们在计划图表时没有既定的规则,全依附在平面计划和UI计划中得到的知识来举行计划。但之以是数据可视化被单独细化成一个种别,并在国外发达发展,乃至衍生出了专业的数据可视化计划师,就证实在数据可视化范畴,许多规则是与其他计划差别的。
一个最简朴的例子,市面上大多数的配色方案都在数据可视化范畴不实用。
1)毫无包涵性的配色方案
起首,实用于数据可视化的配色方案,肯定在明度上是有变革的。许多配色方案不但不具备这种特性,乃至不会思量包涵性。
UI计划的配色方案看起来都很壮丽多彩,但是很显着,他们是为了用户界面而计划的。色瞽者士每每很难往阅读那些运用了低包涵性配色方案的可视化图表。
http://image.woshipm.com/wp-files/2019/09/HGC2jK087NljRcaQMgYa.png
2)没有充足多的颜色种类
另一个题目就是,大多数配色方案并没有充足多的颜色种类。在构建一套完备的可视化图表时,我们每每至少必要6种颜色的调色板来举行计划,我们见过的大多数配色方案并不具有这么多种颜色。
http://image.woshipm.com/wp-files/2019/09/R4BicfGkYeERlRf6gAJR.png
固然这些配色方案同样壮丽多彩,但是他们不能机动应对图表中复杂的信息层级。
3)难以区分层级的配色方案
渐变配色方案可以轻松办理上述两个题目(颜色之间有显着的对比,且可以无穷细分颜色种类)。但很歉仄,如许的配色方案同样不实用数据可视化,我们举一些简朴的例子各人就可以明确。
http://image.woshipm.com/wp-files/2019/09/WGuvYzU5Pic2l74WLqaI.png
这些渐变色看起来没什么题目,但是当我们选择此中一个,将其颜色分类扩充到10时题目就出现了。
http://image.woshipm.com/wp-files/2019/09/piVR8VpKqSkvuibJuzVR.png
你能区分出最左边的4个颜色之间有什么差异吗?恐怕很难。
前面的论述,大多数是为了让各人对数据可视化有一个清楚的概念。
在“视觉计划”这一章我将重点解说,数据可视化(即图表制作时)必要留意的计划准则,下面的内容重要办理各人在数据可视化中所碰到的三个题目。
[*]怎样制作数据可视化图表?
[*]怎样高效快速地制作数据可视化图表?
[*]怎样制作一份兼具实用性和雅观性的数据可视化图表?
http://image.woshipm.com/wp-files/2019/09/5gNgg5lGhTkR6lXnlYiv.png
3.3.1 实用于全部图标的制作规则
1)图表中的线条
① 有无刻度线
当数据的数值非常紧张时,肯定要利用刻度线来让观众更清楚的相识数据。
假如你的听众只必要相识A数据大于B数据,那么刻度线是没有须要的,只需在坐标轴上利用小刻度即可。假如你的读者要花一些时间在柱状图上并感爱好A数据是45.65而B数据是37.66,那么利用刻度线将有助于他们明白。
http://image.woshipm.com/wp-files/2019/09/pGNfh0fsbvKTWet10eiP.png
② 刻度线的颜色
假如确定要利用刻度线,则必要使它们比作为现实数据的点大概线条要层级低。由于这些刻度线也属于配景的一部门。
总结来说,不要利用全黑大概全白的线条。假如你的配景颜色是白色大概淡色系,那么你应该让你的线条灰一些。你也同样可以让这些线条酿成亮灰色,点状大概虚线。
http://image.woshipm.com/wp-files/2019/09/YTygqsqi07Xss3kSa8Wp.png
③ 负空间的刻度线网格
你也可以利用灰色的配景,然后将刻度线反白,这是一种很好的使用负空间做计划的方法;大概刻度线可以用轻微偏玄色一点的灰色,由于很显着如许会让刻度线更融进配景一些。
http://image.woshipm.com/wp-files/2019/09/J6PxLxPAglM5VNfTSWGD.png
④ 坐标线
坐标线应该比刻度线,线条更粗,颜色更深,才气让整个图表显得更有主次的区分。
http://image.woshipm.com/wp-files/2019/09/MsUmlrespmf6OZLejBZ0.png
2)选择符合的坐标上下限
① 选择符合的坐标下限
一样平常来讲,我们应该把我们的坐标下限设置为0。
有人会问,如许的话我们的数据就会变得没有那么升沉变革了。那大概是由于你的数据自己就没有那么长势喜人。
但同样,实在许多事变可以反过来思索,之以是有人乐意不把坐标轴设定为0为出发点,实在就是为了在视觉上让人形成对比猛烈的感觉,从而突出业绩,这种方法的利用因人而异。
http://image.woshipm.com/wp-files/2019/09/9ILbhjLo4u2oXqje4EuR.png
好比在小米的发布会中,为了对比,小米把数据的下限出发点设置为了10000,从而使小米的跑分数据看似跑赢了友商一倍还多,但实在小米的数据增长,只比友商高出了25%。
再举个例子:这张条形图也是经福克斯消息答应利用的。
http://image.woshipm.com/wp-files/2019/09/LhRpeirIS4SlqclU0quv.png
3月31日目的的值为7,066,000,比6,000,000高17.8%,然而第二个柱形险些是第一个柱形长度的三倍。
http://image.woshipm.com/wp-files/2019/09/xlLuO8QSgPEtCrAkY4Lv.png
这也同时提示我们要留意:在观看别人的图表时,仅仅观看柱状图的高低趋势每每不能得出精确结论,必要留意坐标轴起始位置有没有被人做过虚伪处置惩罚。
同样,有些人为了报告业绩,也会使每个刻度的跨度不同等,从而进步柱状图团体的对比度。这种环境也应该多把稳观察,不要被外貌的内容所疑惑。
http://image.woshipm.com/wp-files/2019/09/1hRUSyz6GuUjyJoDaFJA.png
② 选择符合的坐标上限
坐标轴中另一个必要留意的点即为坐标上限,上限界定的方式有两种,可根据需求自行判定。
[*]假如只是为了比力各个数据的数值,可以用数据的最大值作为坐标轴上限。
[*]假如是必要将数据与某个最大值比力,则用此最大值作为上限。
http://image.woshipm.com/wp-files/2019/09/KId8S3dBzCbns07g3XGw.png
3)刻度值
固然Y轴的刻度值标签通常放置在刻度线的最左边,但我们也可以把它们放置在其他的地方,好比刻度线的顶部(但此时肯定要把握好密切性原则,稍不留意就会引起观众的狐疑,这也是我们常常会在看其他图表时碰到的题目,到底刻度值标志的是哪一条刻度线?)。
http://image.woshipm.com/wp-files/2019/09/ESLbIX9izzzmUjNyOCcW.png
刻度线和刻度值相辅相成,这会让图表看起来更加规范。刻度值放置在那里无所谓优劣,只是必要根据差别的场所加以利用。
① 隔断匀称
http://image.woshipm.com/wp-files/2019/09/CYgheBhb8ZBV0KVshVYk.png
在坐标轴上应该利用匀称的跨度0,5,10,15,20,而非不匀称的跨度0,3,5,16,50。这里即呼应上方“坐标轴下限”中的末了一点,偶然图表制作人也会用不匀称的刻度来蒙骗我们对数据产生误解。
固然,此处的举例只是夸大了错误的结果,实际生存中的不匀称刻度每每更加潜伏,必要我们细致往甄别。
② 不要利用非程度和竖直的笔墨标注,也不要利用转行
偶然坐标轴上的解释笔墨会许多,以是许多人为了妥协,在小空间内表现出全部的笔墨标注内容,而利用倾斜的文本,大概将文本转行处置惩罚。
不要用过于复杂的计划情势,数据可视化的第一要义是简朴易懂,以是在碰到标签笔墨过长时,可以接纳以下方法举行办理。
http://image.woshipm.com/wp-files/2019/09/5hXn64uNQJNtEyGRPAiE.png
4)数据的处置惩罚与排序
我们在每次制作前都对数据举行排序,而不是随机排布。如许我们可以在图表中为观众展示更多信息,即某个数据在总的数据库内里的序列。
① 巨细排序
我们照旧从一系列国家的数据开始。
http://image.woshipm.com/wp-files/2019/09/HUJeRyDDT3I2jYR5acJr.png
现在的排布很随机,大概是按照字母表排序的。接下来我们要按照数值从大到小举行分列。
http://image.woshipm.com/wp-files/2019/09/HrWVgZp4QfhMtfdDRGBL.png
我们随机挑选一组数据,好比玻利维亚(Bolivia),在上图中,我们只能得到玻利维亚的数据值,以及他大概在数据库中排在中游的位置,仅此而已。
但是下图中,根据巨细分列好的数据,我们不但可以得到刚才的两个信息,同时还能立刻知道玻利维亚在整个图表中的排名(第四名)。
同时你还可以看到吉尔吉斯斯坦(Krygyzstan)和越南(Vietnam)居于榜首而美国(America)是倒数第一,这就是好的图表能给我们带来的“更多的信息”。
我们再看一遍按照字母表排序的图表,你能容易说出“冈比亚(Gambia)”排名第几吗?
http://image.woshipm.com/wp-files/2019/09/DD77mtJb3BC5djRmkmWp.png
② 刻意的序列
在发布会中我们经常见到,为了突出本身产物的刁悍,每每要与友商的数据做对比,在这种环境下,我们的数据也不是随机排布的,我给这种数据排布方法起了个名字,叫“刻意的序列”。
在魅族 16th的发布会中,这张旗舰机重量对比的图表很有讲求,可以发现,除了索尼(最重的手机)以及魅族 16th(最轻的手机)外,别的全部的手机都是按照降序分列。不看颜色对比,把236g的索尼和152g的魅族放置在一起举行解说,以更加突出魅族的浮滑。
那么这个图表的数据排序实在颠末了三次处置惩罚。
[*]1.把重量从高到低排序;
[*]2.把重量最高的和最低的手机单独放置,并给予特别颜色单独表现;
[*]3.把这两个数据放置在末了,再次突出对比,吸引观众留意。
这就是我们学习数据可视化时非常必要留意的细节点,在数据可视化中,细节决定成败。
http://image.woshipm.com/wp-files/2019/09/xCSb2iDWZYI9zOFW02Lp.png
http://image.woshipm.com/wp-files/2019/09/Zss6HRUtwPYm1l0k8GO7.png
5)关于图例的计划
① 数字必要四舍五进
我们偶然为了包管图表的清楚整齐,并不能完全选择符合数据上限和下限的数字作为刻度,而是选择一些取整的数字。
同样的,这不但仅实用于图例中的数字,同样实用于坐标轴上下限的数字。
http://image.woshipm.com/wp-files/2019/09/cDq4Bf3X1uv75NVgk18I.png
② 标志图例的界限比标志图例的范围更好
在必要用多种颜色做区分的图表中,偶然可以通过标志图例界限而不是标志图例范围的方式,来进步观众的阅读服从。
http://image.woshipm.com/wp-files/2019/09/vUO4sc0orUOeoOArCTcK.png
③ 程度大概垂直方向的图例
对于数字的刻度,程度图例每每比垂直图例更加轻易阅读,由于这符合我们的阅读风俗。
http://image.woshipm.com/wp-files/2019/09/DBmFaiSvieWH23Z8GgRN.png
但是,对于有种别区分的图例来说,垂直图例每每结果更好。由于我们可以在图例的右边放置更长的文本(跟坐标轴的解释同样的原理)。
http://image.woshipm.com/wp-files/2019/09/Tc8lrsQMfz6fhc6tuYQ2.png
④ 删除内部界限
偶然我们乃至可以更简地的表现图例,当你只想表达一个渐进的过程,24和55之间的差别并不紧张,观众只必要知道后者比前者大即可。
在这种环境下,我们可以实验只标志出图例的最大值和最小值,而不须要标志出每个界限大概颜色,如许可以给观众淘汰不须要的信息负担。
http://image.woshipm.com/wp-files/2019/09/2aqeNltn29xrVQ6BJDAd.png
6)图表上的笔墨信息
笔墨标注的作用,不是来添补空缺的,而是用来夸大相干信息或拓展额外的配景知识的。
① 引用消息泉源
大多数环境下,我们制作的图表都不会将原数据附在旁边,因此最幸亏图表中引用你的数据泉源。一样平常来说,引用规则是在左下角防止数据泉源信息,每每接纳特别字体。
http://image.woshipm.com/wp-files/2019/09/B38VtEPAfKtJT2LSX6xu.png
引用消息泉源,既可以方便你随时索引数据泉源(就像我文章开头的每一个图表都标注出了他的原标题+索引网址),也可以增长数据的可信度(风趣的是,大家每每不会关注数据泉源于那里,只要有泉源,就会大大增长人们的佩服感)。
http://image.woshipm.com/wp-files/2019/09/HLJrCpXLBE568tJCbJdD.png
② 用数字辅助表达
偶然你必要在你的图表中标注出数据值,而不但仅应该依靠视觉元素向观众转达信息。
http://image.woshipm.com/wp-files/2019/09/NqYgXp7OCy9YGypHC5Uh.png
通常来说,不必要太严谨的图表,我们会对数据值举行肯定水平的处置惩罚。
[*]有小数的值四舍五进(234.19 ―― 234)。
[*]在数据的量级非常大时,将肯定位数数字取整(52,133 ―― 52,000)。
[*]当全部数据的量级都非常大时,将肯定位数的数字缩进单元中(521,000,000 元 ―― 5.21 亿元)。
[*]Y轴刻度值只管转化为千位分隔符,如K,M,B。
[*]Y轴最大值取值要适当,包管图表占据2/3以上。
假如我们不如许处置惩罚,你就会发现你的图表总是不那么整齐。
7)控制字体的数目
图表中的字体数目以及字体巨细的种类加起来不要凌驾3种(标题和副标题除外)。
通常来说,我们在制作时会把解释和坐标轴标签设置为两种字体样式,以是只必要确保将这两者同一起来,那么就可以包管我们的图表不凌驾3种字体样式。
http://image.woshipm.com/wp-files/2019/09/sMOPSKyIz5hxOo5i7CAw.png
http://image.woshipm.com/wp-files/2019/09/PyWfqGJvhYoQ54WG4yTF.png
3.3.2 柱状图的制作规范
1)柱状过宽或过窄
http://image.woshipm.com/wp-files/2019/09/7JPjc5SS5c0RJaoipQXL.png
过宽的柱会让图表看起来粗笨,只管保持柱的浮滑;如许可以保持优雅的表面,但是太薄了会让用户很难对数据举行比力。
尺度的数值是,柱的宽度为“柱与柱间距”的2倍。固然这只是个参考值,现实我们根据差别的环境,对宽度作出调解。
http://image.woshipm.com/wp-files/2019/09/ucJPnYvpDvJ66r4QH4NS.png
2)只管不要凌驾7个值
一样平常举行数据比力时,柱状图发起不要凌驾5个数据值,对于条形图来说,发起不要凌驾7个数据值。
3.3.3 折线图的制作规范
1)有条理区分的折线/曲线
当我们在制作一个复杂的折线图时,我们想要表现此中的一条数据,最好的方法就是增强它与其他元素的对比,从而进步它的紧张性层级。
[*]使用我们之前的方法,把其他的数据变为灰色;
[*]将我们必要夸大的曲线置于顶层。
http://image.woshipm.com/wp-files/2019/09/xtVYNRTA1wUJzEgyMRXc.png
2)什么时间利用折线图
2017年1月和2月的大米出口量是相干的,他们代表一种数据在差别时间下的数据值,因此我们可以用折线图将它们毗连起来。但是2017年1月的大米出口量和玉米出口量(16万吨)是不相干的,以是我们不能任意用折线图来取代柱状图。
http://image.woshipm.com/wp-files/2019/09/8oEAXZ11G87zbrfeDpkI.png
用折线图可以很好地表现天天往医院的人数,由于统计天天往医院的人数可以用来观察趋势。
http://image.woshipm.com/wp-files/2019/09/pHchXwfipSEOzJanen0S.png
3)按照时间推进的数据并不能总是用折线图来表现
偶然我们也必要举行一些区分。假如我们想要绘制美国大规模枪击变乱的伤亡人数随时间推移的图表。这些枪击变乱确实是一个接一个发生的,但是它们本质上却没有关系,以是你不能用折线图(应该用条形图)。
但是,假如按年份对它们举行回类,并盘算每年的伤亡人数。如许的环境下可以利用折线图举行统计,由于统计效果的趋势变革是故意义的,是可以得出相应的结论的。
4)使锯齿状的线条平滑
假如你的折线上下浮动过于剧烈,那么你应该实验拉长时间隔断,好比不天天采样而以周为单元来采样。观众们不会往阅读锯齿状的线条,大概说他们不会喜好如许的图表。
5)在你的折线图中绘制数据点
当有些特定的数值特殊紧张时,我们可以在线条上标注出他们。假如你有大量的数据必要展示,大概你只想展示数据的走势,那么实在你只必要利用折线就充足了,不必要增长数据点。不信你可以试试,大量的数据点=杂乱不堪的界面。
http://image.woshipm.com/wp-files/2019/09/4e6ziogEIJls9wxo7Z5T.png
3.3.4 饼图的制作规范
饼图和圆环图在数据可视化方面抱病散乱,但却是利用的最频仍的图表之一。
饼图是一种应该制止利用的图表,由于肉眼对面积巨细不敏感,而且险些没有对与角度巨细的概念。更况且是肉眼完全无法重合比力的图形。
http://image.woshipm.com/wp-files/2019/09/kvoYNgH4NdnPUu1kUIfP.png
比方上面左图,我们很难往比力逐日从肉类(Meat)中摄进的卡路里与从糖类(Sugar&Fat)中摄进的卡路里数目的比例。人眼的直觉中,糖类与肉类的比例应该在2:1左右,但现实的比例却是1.5:1。
上述右图将这一征象放大的更加显着。人眼的直觉中,办公与欢迎的数值差距非常大(这是由于我们直觉更风俗从面积上做判定),但现实上欢迎与办公的比例为1.5:1。
许多计划师以为饼图应该是被克制利用的图表,我以为不能说的太尽对。不管怎样,迄今为止的究竟环境,仍旧有许多人在利用饼图,以是我们至少可以夺取精确地利用他们。
固然云云,但是在夸大个体与总体的比例关系方面,饼图照旧有其独特的上风。
1)制止过分分割饼图,否则终极会导致根本无法阅读
http://image.woshipm.com/wp-files/2019/09/qqao5Ej26Hya9XBNIlue.png
那么有同砚会问:分割多少块是过分分割?这是一个必要在现实制作时举行判定的题目。
一个简朴的方法,假如我们已经很难从图中看出此中一块扇形是另一块的两倍大了,大概好几块较小的扇形看起来差未几大时,那么就不能再分割了。此时可以思量把较小的类目回进一个更大的“其他”模块。
假如肯定要给出一个确切的分类数量,我以为一样平常不要凌驾9个;凌驾的话,发起用条形图来展示,不要太依靠于饼图。
http://image.woshipm.com/wp-files/2019/09/Kv6jwyWTncPB3fZYutgG.png
例:这张饼图来自维基百科,它展示了国家的差别地区。
左边这张饼图已经分割出了无数个扇形了,但旁边另分离出一张饼图,表现出了左图中更多的,看不到的更小国家的环境,以此来提供更多的信息。实在另有许多的方法可以展示这组数据,比方树状图大概平凡的舆图。
范围较大的饼图只实用于展示只有几组值的数据。
除饼图外,环形图(甜甜圈图)亦可表现占比,其差别是将饼图的中心地区挖空,在空心地区表现文本信息,好比标题,上风是其“空间使用率更高”。
http://image.woshipm.com/wp-files/2019/09/vMAbzwBhpMKMGvOPQSiZ.png
2)饼图的起始位置要恰当
人们的阅读风俗每每是从12点钟开始的(跟表盘雷同)。以是我们在制作饼图时也要遵照观众的阅读风俗,从12点钟方向开始制作,如许才气出现出更加清楚的数据。
http://image.woshipm.com/wp-files/2019/09/1GLiJdaL4ZMlnNVz6dqz.png
3)饼图的次序要恰当
这个规则与其他的数据图表同等,我们在拿到数据后,不要急于往举行数据可视化,而是应该对数据举行排序处置惩罚,一样平常来讲,我们对于图表都要举行从大到小的数据排序,才更有利于我们展示数据,但是有一个破例的环境。
当数据中包罗一个种别叫“其他”时,无论其他的内容占比为多少,我们最好都把他放置在饼图的最厥后展示。
http://image.woshipm.com/wp-files/2019/09/uspfI8ahwkT1OeXBmWq1.png
4)切割的展示方式
偶然,我们可以想一些创意情势来办理饼图对比不敷显着的题目。
http://image.woshipm.com/wp-files/2019/09/DoAyjXyN7JRaE29HbFk4.png
当我们将饼图分拆开来计划时,将他们设置为同一出发点,我们可以清楚的对比出数据的巨细,但严酷意义上来讲这已经不算是饼图了。
3.3.5 散点图的制作规范
1)散点图可以承载最多四个维度的变量
当包罗多重变量时,散点图自己包罗2个维度的数据,当出现更多维度时,我们可以通过改变散点的颜色和巨细乃至是外形来对数据举行更多维度的分别,这个时间,散点图即酿成了气泡图。
http://image.woshipm.com/wp-files/2019/09/BSlVUbhH8AagDESRQnmB.png
2)只管为散点图添加趋势线
通过添加趋势线,可以更好的让观众感受数据的变革,人们不会乐意担当未处置惩罚的数据,每每倾向于担当已经被处置惩罚好的数据效果。
http://image.woshipm.com/wp-files/2019/09/o5x7ScskUCF1bBlzqcAJ.png
3.3.6 面积图的制作规范
面积图又叫地区图,与折线图很相近,都可以用来展示随着一连时间的推移数据的变革趋势。区别在于,面积图在折线与种别数据的程度轴(X轴)之间添补颜色大概纹理,形成一个面表现数据体积。
相对于折线而言,被添补的地区可以更好的引起人们对总值趋势的留意,以是面积图重要用于转达趋势的巨细,而不是确切的单个数据值。面积图有三种差别的形态,根据数据以及配景的差别,均有其最佳的展示情况。
1)只管不重叠,利用透明色
当图表中要展示多组数据时,最好包管全部的数据都不重叠,如许才可以更好的展示数据。假如无法制止重叠,则应该得当的设置颜色和透明度,使得重叠的地区变得更加易读。
http://image.woshipm.com/wp-files/2019/09/i0zbo32VyyOTkklkyt0F.png
2)不要凌驾四个种别
面积图只得当显现少量的数据,最多发起不要凌驾四个种别,否则就会导致非常难以辨认。因此在多个种别下,要只管制止利用面积图。
http://image.woshipm.com/wp-files/2019/09/71SgXKZ1zMAX9p16MkHU.png
3.4 突出信息
3.4.1 紧张的内容用颜色做区分
偶然我们为了突出显现某部门数据,必要对它们举行特别的处置惩罚(包罗添加辅助线,更改颜色,线条粗细等方法)来加大它们与其他数据的对比,以吸引用户留意,并表明你想报告的观点。
http://image.woshipm.com/wp-files/2019/09/a8QAoIjTPjJFslaYGVKF.png
如上左图,通过添加辅助线和标红的方式,来表现快递公司未到达60万件派件尺度的月份,从而突出表现公司业绩不及格部门。如上右图,通过对9月份的颜色区分,来突出表现二手房代价在9月份到达亘古未有的高度。
3.4.2 把不紧张的内容变为灰色
对于不太紧张的内容,我们通常会把它们的层级低落,将其变为灰色每每是一个好方法。(如上左图中1-6月与9月数据的配色,以及上右图中1-8月数据的配色)
通常来说,我们会用灰色来标志:
[*]未被选中的元素大概配景。
[*]为紧张的数据点做对比的数据。
[*](在交互图表中)不是当前选中的元素。
http://image.woshipm.com/wp-files/2019/09/pPa4sqTBI1M55H818KKV.png
3.4.3 没有那么多重点信息
假如你以为每个信息点都很紧张,然后为他们都做了特别的备注,那么请把他们都往掉,由于那恰好证实他们都不紧张。
数据可视化的精华就在于你往用视觉元素往资助用户做筛选,假如观众们真的很想知道每个数据代表什么,那大概你应该给他们显现一份表格而不是图表。
http://image.woshipm.com/wp-files/2019/09/6RHganEoA5ngaM4MxOGV.png
3.4.4 添加须要的辅助阐明
http://image.woshipm.com/wp-files/2019/09/KgiQFruZf5HVK3NU84iz.png
关于这个图表,假如我们不举行标注的话,它只能报告故事的一部门。假如要把故事报告的全面,那么就必须添加一些标注。
假如我告诉你,这个图表想告诉我们,在第6天的时间该团队利用了灵敏开辟,在利用新技能初期,Bug数目显着上升,而后刹时降落。加上了标注,图表报告了一个跟之前完全不一样的故事。
以是,我们为了更好的阐明我们的目标,偶然必要对图表举行特别处置惩罚,包罗做一些突出某些信息的标注。
3.4.5 添加须要的辅助线
这一点重要针对于柱状图和折线图,好比当我们想要出现两个差别时期的数据变革时,添加辅助线可以更直观地表现出此中的变革。
好比像这个图表,为了表现出相应速率有很大的提拔,,添加了相干辅助线并标注了相应的数字,使 PRO5 和 SONY Z3+ 之间的对比更加显着。
http://image.woshipm.com/wp-files/2019/09/SmWgP48wcqsBclTT44dV.png
四、跋文
以上就是该系列的第一篇的全部内容,后续我将以此为底子更新更多关于数据可视化的知识,从数据图表、信息图表、背景计划、乃至到大屏数据可视化,都有大概涉及。
假如各人有想看的内容,可以在批评区留言,批评最多的内容,我会优先更新。
就如许,盼望各人喜好。
本文由 @大家聊产物 原创发布于大家都是产物司理,未经允许,克制转载
题图来自 Unsplash,基于 CC0 协议
http://www.fyguaji.com
页:
[1]