任务一 初识数据可视化

任务概述

对商务数据进行可视化处理,既可以提高阅读效率,也符合人类的生理本性。电商用户可以利用图像、曲线、二维图形、三维动画等可视化方式来表现商务数据,可以对数据的模式和相互关系进行可视化分析,从而传递出更多的信息,同时也可以提高商务数据的视觉吸引力和说服力。本任务将引领读者认识数据可视化,了解数据可视化图表、数据可视化视觉效果及数据可视化的方法。

任务重点与实施

一、认识数据可视化

在生活和工作中,一张图片所传递的信息往往比文字更直观、更清楚。所谓“字不如表,表不如图”,图表的重要性可见一斑。在统计分析产品、用户画像等方面,从业者需要具备优秀的数据可视化能力。现在常见的如“一图看懂×××”等信息交流方式,就是用图表来传递信息,这是典型的数据可视化成果。

例如,若要描述某公司最近5年的收入情况,就需要说明该公司每个月的收入是多少,同比、环比增幅是多少,收入最多、最少的是哪个月,同比、环比增幅最低、最高的是哪个月等,而若用数据图表来表达的话,只需使用柱状图和折线图的组合图表就能准确地表达以上信息,如图1-1所示。

图1-1 某公司最近5年收入图表

商务数据图表的另一个优势是可以通过简单的逻辑和视觉体验让用户快速把握要点,如图1-1所示,通过图表能够一眼看出哪一年的收入最高,而不用将每个数字都放到大脑中进行比较,那样无法得到很直观的结果。用户通过大脑的视觉系统可以迅速地识别、贮存、回忆图形信息,本能地将图形中的信息转化为长期记忆。

商务数据可视化还可以改变我们解读世界的方式,相同的数据,不同的表达方式能产生不同的效果。在展现商务数据时,一张清晰而又独特的数据图表能够让别人更加直观且准确地理解我们所要表达的信息和意图,同时也可以让信息表达看上去更加具有说服力,让商务数据的价值最大化。

二、数据可视化图表

Excel是目前使用最广泛的数据可视化工具之一,它基本包含了所有常用的图表。除此之外,还有许多在线的数据可视化工具,如ECharts、Dydata、Plotly、ggplot2、Tableau、Raw、Infogram、ChartBlocks、JpGraph,基于JavaScript的D3.js、Chart.js、FusionCharts、JavaScript InfoVis Toolkit等。

常用的数据可视化图表分为反映发展趋势、反映比例关系、反映相关性、反映差异化、反映空间关系,以及反映工作流程等可视化类型。

1.反映发展趋势的可视化图表

反应发展趋势的可视化图表是通过图表来反映事物的发展趋势,让人们一眼就能看清趋势或走向。常见的表现随时间变化趋势的图表类型有柱形图、折线图和面积图等。

柱形图是以宽度相等的条形高度的差异来显示统计指标数值大小的一种图形,如图1-2所示。按照时间绘制柱形图,可以反映事物的变化趋势,如某个指标最近一年的变化趋势,也可以按照其他维度,如区域、机型、版本等来反映事物的分布情况。

折线图是点和线连在一起的图表,可以反映事物的发展趋势和分布情况,如图1-3所示。与柱形图相比,折线图更适合展现增幅、增长值,但不适合展现绝对值。

面积图是通过在折线图下加上阴影的面积大小来反映事物的发展趋势和分布情况,如图1-4所示。

2.反映比例关系的可视化图表

反映比例关系的可视化图表是通过不同的面积大小、长短等反映事物的结构和组成,从而让用户知道什么是主要的,什么是次要的。常见的反映比例关系的图表类型有饼图、旭日图、瀑布图等。

饼图是将一个圆饼分为若干份,用于反映事物的构成情况,显示各个项目的大小或比例,如图1-5所示。饼图适合展现简单的占比比例,在不要求数据精细的情况下使用。

旭日图有多个圆环,可以直观地展示事物组成部分下一层次的构成情况,如图1-6所示。

图1-2 柱形图

图1-3 折线图

图1-4 面积图

图1-5 饼图

图1-6 旭日图

瀑布图采用绝对值与相对值相结合的方式,用于表达特定数值之间的数量变化关系,最终展示一个累计值,如图1-7所示。瀑布图能够反映事物从开始到结束经历了哪些过程,用于分解问题的原因或事物的构成因素。例如,要表现本月收入是如何在上月收入的基础上变化的,就可以通过瀑布图分解每个收入组成部分所做的贡献,找出哪一组成部分提升了收入,哪一组成部分降低了收入。

图1-7 瀑布图

3.反映相关性的可视化图表

反映相关性的可视化图表是通过图表来反映事物的分布或占比情况,从而展示事物的分布特征、不同维度间的关系等。常见的反映相关性的图表类型有散点图、气泡图、热力图、词云图等。

散点图主要反映若干数据系列中各个数值之间的关系,类似X轴、Y轴,判断两个变量之间是否存在某种关联,如图1-8所示。此外,通过散点图还可以看出极值的分布情况。

图1-8 散点图

气泡图是通过气泡面积大小来表示数值的大小,与散点图相比多了一个维度,如图1-9所示。

图1-9 气泡图

热力图是以特殊高亮的形式显示访客热衷的页面区域和访客所在地理区域的图示,如图1-10所示。

图1-10 热力图

词云图主要用于描述事物的主要特征,要求能够让人一眼就看出一个事物的主要特征,越明显的特征越要突出显示,如图1-11所示。同时,象形的词云图,如轮廓是一个人、一只鸟等,用于反映事物的主题,这样会更形象、更生动。此外,词云图还可以显示词汇出现的频率,可以用于制作用户画像、用户标签等。

图1-11 词云图

4.反映差异化的可视化图表

反映差异化的可视化图表是通过对比来发现不同事物之间的差异和差距,从而总结出事物的特征。常见的反映差异化的图表类型是雷达图。

雷达图主要展现事物在各个维度上的分布情况,从而看出事物在哪些方面强、哪些方面弱。例如,一个运动员各方面能力的得分可以通过雷达图清晰地表达出来,让用户一眼就能看出这个运动员哪方面能力强,哪方面能力弱,如图1-12所示。此外,一个产品在各个评价维度上的评分也可以通过雷达图来进行展现。

图1-12 雷达图

5.反映空间关系的可视化图表

反映空间关系的可视化图表是通过地图来反映事物的地理分布情况或用户的出行轨迹。常见的反映空间关系的图表类型有全球地图、中国地图、省市地图、街道地图、地理热力图等。

地图可以形象地反映事物在地理上的分布情况及人群迁徙情况,主要包括地理分布图(全球、全国、各省市等)、迁徙图、热力地图等。热力地图主要反映地理、点击热力分布情况,从而看出哪里是人群最多的地方,哪里是用户点击最多的地方等,可以反映用户出行习惯、使用习惯等,如图1-13所示。

6.反映工作流程的可视化图表

反映工作流程的可视化图表是通过图表来反映工作流程各个环节的关系,可以帮助管理者了解实际工作活动,消除工作过程中多余的工作环节,合并同类活动,使工作过程更加经济、合理和简便,从而提高工作效率。常见的反映工作流程的图表类型是漏斗图。

漏斗图主要用于反映关键流程各个环节的转化情况,让人们一眼看清整个流程的转化情况。通过分析各个环节的转化情况,能够发现问题所在,从而找准改进的方向。

在电商数据分析过程中,漏斗图不仅能够展示用户从进入网站到实现购买的转化率,还可以展示每个销售环节的转化率,能够帮助卖家直观地发现问题,如图1-14所示。

图1-13 热力图

图1-14 电商销售漏斗图

三、数据可视化视觉效果

创建外观精美的可视化商务数据对于设计人员来说是一种挑战,优秀的商务数据内容表达不仅仅是简单的图文混排,还必须要在视觉上能够表达出数据的主旨,这就要求设计人员在进行视觉设计前必须要了解数据内容的框架,同时掌握一定的技巧。

用户要想呈现出良好的商务数据可视化视觉效果,可以在以下方面进行提升,如图1-15所示。

图1-15 提升可视化视觉效果的十个方面

·色彩:使用的图标建议不要超过五种颜色,色彩使用要收敛,仅用于突出关键信息。

·字体:所有文字必须字体清晰、大小合适,用于快速选择信息。

·版式:要提供符合逻辑的层级,引导用户进行信息阅读,尽可能让图表元素保持对齐,从而保证视觉一致。

·标注:谨慎使用标注,仅用于标注关键信息。

·留白:要保持足够的留白空间,如果信息量太大,整体会看起来很杂乱。

·插图:插图必须符合主题基调,能够提高内容传达效率,否则没有必要用插图。

·图标:简约、易懂且具有普遍性,其作用主要是为了便于内容理解。

·数据:一组数据对应一份图表就足够了,不要画蛇添足。

·比例:确保数据可视化设计中的组成元素比例得当,以便于用户快速阅读。

·简约:避免不必要的设计,如文本的3D效果、装饰性的插图和毫无关联的元素等。

四、数据可视化的方法

对商务数据进行可视化处理时,一般可以按照以下步骤进行。

(1)明确数据可视化的需求,寻找数据背后的故事

在开始创建一个商务数据可视化项目时,需要明确数据可视化的需求是什么。首先回答这样一个问题:这个可视化项目会给用户提供哪些帮助?这个问题可以帮助用户避免在数据可视化时把一些不相干的数据放在一起比较。

在确定了可视化项目的目标之后,经过整理、分组与理解信息,寻找其中可视化的可能性。同时,通过观察与比较来总结信息之间的关系,建立基本的数据关系结构,思考如何利用含义清晰的视觉元素将这些数据包装成更加有趣的故事。

(2)为数据选择正确的可视化类型

在确定需求之后,就可以为数据选择一个正确的可视化类型。数据可视化的效率很高,但前提是准确运用,因为不同类型的数据有其最适合的图表类型,如果使用错误的图表类型去展现,很容易造成误解。

(3)确定最关键的信息指标,给予场景联系

高效的数据可视化不仅取决于信息的可视化类型,还取决于一种平衡,既要保证总体信息的通俗易懂,又要在某些关键点上有所突出,提供深刻甚至独家的信息解读。此外,还需要提供合适的场景来进行上下文的联系,从而合理地架构数据。

(4)为内容而设计,优化展现形式

故事再好、数据再有吸引力,如果设计得很糟糕,用户也不会被其吸引。优秀的设计同样很关键,这样可以高效地对信息进行转换,利用精美的视觉效果来吸引用户进行阅读。在进行数据可视化设计时,需要为内容而设计,并优化展现形式,如图1-16所示。

图1-16 为内容而设计,优化展现形式