前言

随着大数据时代的来临,计算机科学、数据科学,乃至各个领域都更加关注如何对海量复杂的大数据进行处理和分析,从而挖掘其中隐藏的真正有意义的信息。可视化正是一种将抽象的、复杂的、不易理解的数据转化为可感知的、直观的、有意义的图形化表示,从而传达数据中蕴含的信息的技术。自2013年以来,可视化持续在“大数据十大发展趋势预测”中占有重要的地位。可视化技术为大数据分析提供了更加直观的呈现和分析手段,有助于研究人员发现大数据中蕴含的规律,因而在各领域均得到了广泛应用。

面对当前大数据、可视化研究与应用的新形势,我们有必要掌握大数据可视化的基本原理和典型设计,初步掌握可视化实现方法,并发展新的数据可视分析方法。目前,国内正需要根据数据可视分析完整流程和应用案例介绍大数据可视化基本原理与方法的参考书。

本书结合作者多年的教学经验,针对可视化学习需求编写而成,可作为我国高校计算机相关专业的高年级本科生及低年级研究生学习数据可视化的入门教材,以帮助学生掌握可视化与可视分析的完整流程、典型设计和实现方法。同时,本书可供对数据分析能力有要求的其他专业的学生学习参考,也可作为数据科学研究和数据分析人员的参考手册。

读者在利用本书学习数据可视化知识时,一定要多思考、多分析、多动手实践,首先要了解可视化的基本流程,然后循序渐进地掌握相关知识,并结合可视分析案例做到融会贯通;在学习数据可视化工具时,一定要动手实践。只有这样,才能真正掌握使用某种工具开展数据可视化分析的方法。此外,本书总结的丰富可视化方法可为读者在进行数据可视化时提供速查方案。

本书具有以下特色:

❑采用故事线的形式,从数据采集与处理、可视化任务设计,到视图和交互设计、可视分析系统构建和具体案例介绍,从简单到复杂,覆盖可视化与可视分析的完整流程。

❑数据特征和案例丰富,所介绍的案例基本涵盖高维、文本、网络、时空等典型数据特征。

❑融合最新学术成果,聚焦于可视化顶级会议与期刊的学术成果,将教材编写团队的研究成果融入具体内容,进行相关方法和技术的阐述。

本书共分为8章。第1章首先介绍数据可视化的概念、发展史,以及可视化与相关学科的关系;然后介绍可视化的主要应用领域和典型案例,帮助读者建立对可视化的直观印象;最后介绍可视化的基本流程和可视化三个分支的经典模型。

第2章介绍可视化的基础——数据,包括数据的获取方式、数据的检查与清洗、数据预处理和数据抽象等内容。对数据的全面了解有助于更好地发挥可视化的作用,加强对数据的表达并提升用户对数据的理解。

第3章主要介绍可视化任务是什么,以及如何定义自己的可视化任务。首先介绍可视化任务的基本概念,帮助读者理解可视分析为什么需要定义可视化任务;其次介绍基于数据的任务抽象方法,帮助读者认识如何定义具体、准确的可视化任务。

第4章主要介绍视觉编码设计的理论基础和应用场景。首先从生理学角度介绍视觉感知与认知理论,再从心理学角度介绍格式塔理论;其次介绍可视化编码的基础——标记与视觉通道,以及两个重要的视觉编码原则——表达性原则和有效性原则;最后结合应用场景阐述视觉编码如何形成视图。

第5章主要介绍交互和多视图。首先介绍交互设计的基本概念和设计准则;其次介绍并列视图、聚合视图和叠加视图等多种视图设计方式;最后介绍常见的交互技术,并以一个定向广告的可视分析系统为例,阐述如何通过交互实现多视图协调关联分析。

第6章重点介绍可视分析。首先介绍可视分析的改进模型和设计模型,以及具体构建可视分析系统的步骤;其次介绍可视化测评的概念、流程,以及常用的测评方法;最后通过一个基于旅游数据的完整案例,融合前5章的知识详细阐述可视分析系统的构建过程。

第7章主要介绍Web数据可视化工具。首先简要介绍一些常见的可视化工具和类库;其次分别介绍ECharts、AntV和D3这三种目前广泛使用的Web数据可视化工具的原理和使用方法,并给出实际的图表绘制例子,方便读者找到合适的可视化工具。

第8章总结可视化领域常见的可视化视图,供读者概览和速查。首先介绍折线图类、柱状图类、饼图类、散点图类等基础视图;其次介绍以树图类、关系/网络图类和地理坐标/地图类为主的复杂视图;最后介绍对基础视图和复杂视图进行组合、扩展和隐喻的改进视图。

本书由四川大学视觉计算实验室可视化与可视分析小组部分师生共同编著,主要编写人员除封面署名主编外,还包括曹梦琦、刘尚松、庞潇、彭第、韦东鑫、温啸林、姚林、张馨艺、朱浩天(排名不分先后)。澳大利亚皇家墨尔本理工大学(RMIT)的李明召博士对全书做了认真审校,并提出了许多具体的修改建议。本书参考了数据可视化方面的书籍、学术论文和网络资料,在此一并向这些文献的作者致谢。

由于编者水平有限,书中难免存在一些欠妥乃至错误之处,恳请读者指正。

编者