- Neo4j权威指南 (图数据库技术丛书)
- 张帜
- 3408字
- 2020-11-28 15:15:45
前言
这是第一本由中国人原创的图数据库专业书籍。
本书将陪伴您漫步“图”的世界,领略“图”的风采,玩转大数据时代新的利器——图数据库Neo4j。
“图数据库”即便对业内人士而言,也是一个陌生的词汇。单这个“图”字,便会使人联想到图形、图片或图像。正如,最近一位朋友得知我在玩图数据库,就邀我去做一个用语音控制图像的产品。我解释了半天,才让他明白:此“图”非彼“图”。误解就在这个“图”字上。
那么,图数据库究竟是什么?可以用它来干什么呢?
就在不久前的两会期间,CCTV《超越》栏目播出的阿丘老师对我的专访《关于图数据库的梦想》,恰好能解答上述疑惑。我们不妨一起来回顾这段对话。
CCTV《超越》栏目:关于图数据库的梦想
阿丘:大数据时代已经来临。这是一个最好的时代,也是一个最坏的时代。大数据涉及的行业范围很广,其中图数据库被大家称为大数据时代的高铁,它越来越受到人们的关注。对于这项技术我们了解多少?它的应用又能给我们的现实生活带来哪些方便?CCTV《超越》栏目邀请到了中国图数据库的先导者张帜先生,让他带领我们一起来了解图数据库。
阿丘:什么是图数据库?
张帜:这是一个新型的数据库系统。大家以前可能听到过MySQL、Oracle等数据库,但随着社交、金融、零售等行业的发展,亟需一种新型的数据库来支撑这些新的业务。现实社会织起了一个庞大而复杂的关系网,比如天天有人给你打电话要你买房子,他们是通过什么技术来找到你的呢?就是通过一些关系运算。如果使用传统的数据库会很难处理,而采用图数据库来处理它,会更高效、更方便。在科技领域里有一个六度空间理论,简单地说就是,世界上任何两个人最多只需通过6个关系就一定能够找到对方。用图数据库就可以把这个理论变成现实。所以,称它为一种新型的数据库完全不为过,它能支持海量、复杂、多变数据的关系运算,而且运算性能非常高。
阿丘:那和传统数据库比起来,图数据库的优势在哪儿呢?
张帜:首先,图数据库可以说是应专门处理这种复杂关系网的“运”而生的。虽然传统的数据库也能处理,但其效率极其低下,功能扩展也很困难,要花的时间将很长,而用图数据库就能方便、高效地解决这个问题;更重要的是,就连非技术人员都能看得懂。如果用传统数据库来构建,其模型非常复杂、烦琐,相比而言,用图数据库,就非常直观、浅显、简单。
阿丘:通常图数据库都应用在哪些领域呢?
张帜:它的应用领域非常广,在社交、零售、金融等领域都有广泛的应用。比如说社交,一个最典型的应用就是领英。领英在国际上的知名度和应用的广度相当于我们中国的微信。领英一个最重要的功能就是能够把你朋友的朋友的朋友推荐给你,这是进行了关系运算的结果。另外一个就是零售商品的实时推荐,比如沃尔玛,你在它的网站上点击了几个商品后,它就能揣测出你可能对哪些商品感兴趣,就会立马把你感兴趣的商品推荐给你。用图数据库来计算这种推荐会更快捷。现在国外用得很多,但是在我们国内才刚刚开始。随着图数据库的应用,不久的将来我们就可以享受到更为实时、准确、方便的推荐。
阿丘:图数据库全方位地让互联网更便利了我们的生活。正如对话开始所说,这是一个好的时代,也有人说是一个坏的时代,机遇与挑战并存。我相信,在未来不远的日子里,图数据库会和我们的生活联系越来越密切,会提升我们的生活幸福指数,使我们未来的生活更便捷。
这段对话告诉我们,图数据库能高效地处理各种复杂的关系网络,在许多领域有着广泛的应用。它是基于图论而实现的新型数据库系统,擅长处理大量的、复杂的、互联的、多变的网状数据,其效率远远高于传统的关系型数据库。
本书内容
世界上很多著名的公司都在使用图数据库。比如,领英用它来管理社交关系,实现朋友推荐,构建了一个非常强大的人脉网络;沃尔玛用它连接“商品关联”和“买家习惯”两个子网,实现了零售商品的实时推荐,给买家带来更好的购物体验;思科用它做主数据管理,将企业内部的组织架构、产品订购、社交网络、IT网络等有效地管理起来;惠普用它管理复杂的IT网络;全美排名前三的金融公司,都在用图数据库进行风控业务管理。此外,物流、交通、电信、制造业、广告、打印、文化传媒和医疗等领域的公司也在使用图数据库。
反观我国的情况又如何呢?我是从2015年开始研究图数据库的,当时国内知道图数据库的人还寥寥无几。令人意想不到的是,才短短一年多时间,国内竟然有很多应用都用上了图数据库,涉及的领域包括金融、社交、商务、知识管理等。毋庸置疑,其发展速度将远超乎我们的想象。
然而遗憾的是,目前市面上有关图数据库的中文书籍屈指可数,即便有也是直接从英文原版翻译而成。随着图数据库在中国的推广和普及,大家都渴求有一本国人原创的权威指南,能系统、全面地涵盖图数据库的原理和使用方法等方方面面。因此,我们决定集中组织国内对图数据库有深入研究的专家,共同来编写一套原创的中文版图数据库技术丛书。
鉴于Neo4j在全球图数据库领域的排名一直遥遥领先,我们就首选《Neo4j权威指南》作为这套技术丛书的开篇。
本书基于Neo4j 3.1版本编写,共分9章,外加两个附录,涵盖基本概念、基础入门、查询语言、开发技术、管理运维、集群技术、应用案例、高级应用、中文扩展、配置设置、内建过程等内容。各章简要介绍如下:
第1章Neo4j图数据库基础 介绍图数据库概念以及Neo4j的体系结构。本章可以作为初学者的入门部分。有经验者可以略过,直接阅读后续章节。
第2章Neo4j基础入门 引导读者初步使用Neo4j,包括Neo4j的安装部署、操控平台的使用、引导实例。
第3章Neo4j之Cypher 详细介绍Cypher语法,它是Neo4j引擎的接口语言,掌握好它是用好Neo4j的关键,也是使用中常备的参考资料。
第4章Neo4j程序开发 详细讨论如何将Neo4j与开发平台、编程语言之间的集成,并提供相应开发实例。
第5章Neo4j数据库管理 介绍Neo4j数据库管理相关的内容,主要包括:部署、监控、安全管理、运维与优化、备份与恢复、数据库管理相关工具等基本知识和基本操作。
第6章Neo4j集群技术 主要介绍如何部署大规模生产环境,包括高可用性、备份与恢复,以及最新的因果集群。
第7章Neo4j应用案例 对Neo4j目前的客户应用实践进行汇总,同时介绍5个Neo4j典型应用案例。
第8章Neo4j高级应用 介绍高级索引、Docker环境部署、自定义批量导入、Neo4j与图计算、Neo4j与自然语言处理等高级话题。
第9章Neo4j简体中文版 介绍Neo4j简体中文版及其扩展功能,包括图片显示、数据驱动下节点和关系的呈现,以及智能查询功能。
附录A Neo4j配置设置 详细介绍配置文件neo4j.conf的配置细节。
附录B Neo4j内建过程 详细介绍通用过程、本地用户和角色管理过程。
本书技术支持
联系邮箱:neo4jguide@we-yun.com
下载地址:http://we-yun.com/neo4jguide/
微信群:《Neo4j权威指南》读者、中国图数据库、中国图数据库技术
QQ群:547190638(Neo4j中文社区)
论坛:http://neo4j.com.cn/(Neo4j中文社区)
创作团队与致谢
本书的写作始于2016年12月,历经数月,现终于问世,是整个写作团队齐心协力、日夜耕耘的结晶。这支团队在大数据和图数据库领域具有丰富的实战经验。他们是张帜(微云数聚创始人)、庞国明(Neo4j中文社区创始人)、胡佳辉(数之联软件架构师)、赵炳(北京邮电大学研究生)、陈振宇(中科院中美联合培养博士)、苏亮(国防科技大学计算机博士)、李敏(中科院计算数学博士)、高兴宇(中科院中新联合培养博士)、薛述强(华为公司高级工程师)和董琴洁(微软Office专家)。
在本书的编写过程中,得到了各界朋友的倾力支持。请允许我代表整个写作团队在此表示由衷的感谢!
首先要感谢邬瑞文先生。他热忱地帮助我们与Neo Technology公司进行各种沟通与协调,在将图数据库引进到中国以及编写本书的过程中,起到了非常重要的桥梁作用。
另一位必须感谢的是中国首席数据官联盟创始人刘冬冬先生。是他一直全力支持我们在全国推广和普及图数据库的理念。没有他的鼎力相助,图数据库在中国的人气不会有现在这么旺盛,此书也不会这么快问世。
还得感谢写作团队每一位成员的家人,是他们的理解和支持,才让我们能够舍弃陪伴家人的时间,安心创作。
更要感谢关注本书的每一位朋友,尤其是微信和QQ群里的“图控”们,他们对此书的关注和期盼,是我们完成此书的强大动力。
特别感谢清华大学出版社的编辑夏毓彦老师以及编辑室的全体老师,有了他们的竭力支持和精雕细琢,本书才得以顺利问世。
最后,我要感谢董定君女士,正是她在背后默默的支持,使我能够潜心研究图数据库和组织编写本书。
谨以此书献给奋斗在中国大数据领域的同行们!由于时间紧迫,篇幅过大,错误及不足之处在所难免,敬请读者海涵,或请直接与我们联系(neo4jguide@we-yun.com),不吝指正,我们将及时在下一个版本中予以更正和补充。
张帜
2017年6月28日
于橘郡