1.1.1 螺旋上升、新旧交替的数据库历史

在关系型数据库出现以来的几十年中,经历了如图1-1所示的两次重要变革。

图1-1 20世纪90年代以来IT发展中的两次重要变革

首先是20世纪90年代从大型机到小型机的过渡。小型机在市场上的胜出,直接导致Oracle等新数据库产品最终战胜大型机上的数据库产品并一统江湖,但这并不意味着银行或世界500强企业用Oracle直接替换掉原本稳定运行的IBM大型机上的数据库,实际上直到现在还有很多传统应用运行在IBM大型机上的数据库中。但是,小型机时代的Oracle的确“霸占”了所有新增业务的市场。

从目前来看,以Oracle、DB2等数据库为代表的传统关系型数据库,历经多年的发展,对于自身固有的业务场景来说,其基本已经做到了业界极致;而在新的数据中台联机湖仓、微服务数据融合管理、海量数据实时访问、非结构化在线处理等方面,这类传统交易性数据库则明显力不从心。

从市场角度来看,传统交易性数据库的增长空间正逐渐缩小。华泰证券的数据库行业研究报告《分布式数据库或成为新的增量》中提到,据Gartner研究表明,2018年全球数据库管理系统(DBMS)市场规模达461亿美元,同比增长18.4%,增速达到近10年的峰值。但关系型数据库市场增长渐趋平缓,据T4.ai预测,全球关系型数据库市场规模2018—2022年的CAGR(复合年均增长率)为6%,较2012—2017年的11%或将有所下降。

而在企业数字化转型的过程中,数据量会随着业务发展而快速膨胀,形成全新的业务需求及数据增量,为数据库带来全新的市场机遇。《分布式数据库或成为新的增量》报告中指出,“传统的关系型数据库在高并发、分析等方面存在一定的劣势,应运而生的分布式数据库能够较好地满足大数据分析的需求,或形成数据库市场新的增量”。

因此,在2010年前后,以AWS为首的新一代分布式数据库厂商,已经开始在海外的增量数据库业务市场占据主导地位,Oracle与IBM等小型机数据库产品则只能依靠存量市场生存。

相比于传统关系型数据库,分布式数据库在提供ACID(Atomicity,Consistency,Isolation,Durability,数据库事务正确执行的四个基本要素,即原子性、一致性、隔离性、持久性)事务一致性能力的同时,拥有更灵活的扩展能力及多数据模型的处理能力。在面向海量数据弹性扩展的新兴业务需求时,使用分布式数据库逐步迭代,伴随全新的数字化业务渐渐渗透到传统业务,成为新的数据核心场景,是分布式数据库技术在企业中的最佳落地方案。

因此,分布式数据库的“星辰大海”绝不仅仅在于对传统关系型数据库的简单替换。数据库领域的每一次技术浪潮都是对当时主流基础和应用架构的颠覆式创新,而不是针对已有技术产品的改良或修正。分布式数据库的诞生首先是为了应对传统数据库不擅长的场景。在关系型数据库做到极致的领域,Oracle、DB2同样发展了很长的时间才完善了其功能及生态的建设。得益于高弹性、强事务一致、多模融合等特点,近年来不少企业已经在数据中台联机湖仓、微服务数据融合管理、海量数据实时访问、非结构化在线处理等方面实现了原生分布式数据库规模化的生产落地。可以看到,分布式数据库的应用领域几乎每年都会有大幅度扩展,成为支撑企业数字化改革升级中不可或缺的弹性数据基础设施。