2.1.3 内容管理服务

SequoiaDB分布式内容管理解决方案(基于SequoiaDB的内容管理平台见图2-3)提供了可弹性扩展的非结构化数据存储平台,以及批次管理、版本管理、生命周期管理、标签管理、模糊检索、断点续传等丰富的元数据管理机制。它基于Spring Cloud框架的微服务架构,通过可插拔组件与可配置流程,允许用户自由定义不同数据存储容器中对象文件的处理方式。比如,对于合同扫描件类型的业务,系统可以将OCR文字识别模块直接加入非结构化文件处理流程,使得所有写入该容器的合同自动进行文字识别处理,并直接支持针对其内容的全文检索能力。

图2-3 基于SequoiaDB的内容管理平台

SequoiaDB内容管理平台包含以下技术特性。

● 无限弹性扩展:随着移动化应用在企业中的不断普及,越来越多的业务系统需要存储影像扫描件等非结构化数据。使用传统技术,存储设备的容量与带宽往往成为最大的瓶颈;而使用基于SequoiaDB的分布式内容管理解决方案,用户可以存储容量近乎无限的非结构化数据。

● 高并发、低延时:如今,非结构化数据的应用已不限于传统的归档与审计类业务,越来越多的联机交易系统开始在业务流程中依赖影像图片数据。分布式内容管理解决方案为用户提供了面向联机业务的高并发、低延时的非结构化数据访问能力。

● 异地分布式架构:对于拥有大量分支机构的企业来说,对分散在全国各地的非结构化数据进行统一、有效的汇总纳管,往往受到数据中心带宽的制约。基于SequoiaDB的分布式内容管理解决方案,提供了“元数据统一纳管,非结构化数据异地存放”的体系架构,可最大化地节省数据中心之间的传输带宽。

● 多租户:由于上层应用程序所服务的业务场景不同,因此,不同应用程序对数据的安全性、稳定性及延迟等特性要求不一。SequoiaDB提供多实例及数据区域隔离等特性,确保来自不同业务系统的存储资源能相互独立、互不干扰。

● 高可用性:如今的联机业务系统经常大量使用非结构化数据,由于其内容管理系统发生故障而导致的业务中断往往令人难以接受。SequoiaDB采用数据多副本冗余的方式,最大程度地提升数据的可靠性与可用性。同时,SequoiaDB支持同城双中心、同城三中心、两地三中心、三地五中心等丰富的容灾策略。

基于SequoiaDB搭建的内容管理平台能够向客户提供以下价值。

● 非结构化数据统一管理:可提供企业级非结构化数据统一视图,打破业务系统之间的数据壁垒,同时提升业务系统之间的数据交换效率。

● 数据全量在线:历史影像数据全面在线。这既可以提升用户体验,又可以减少历史数据抽取的开销,提升企业的IT运维能力。

● 降低风险:提供“24小时×7天”级别的高可用性与容灾策略,保证数据永远在线、可用,可避免将核心业务数据库直接暴露给外部消费类业务系统,以及避免因直接对核心业务数据库进行访问而造成损失,并且能快速实现新业务构思。

● 降低成本:用PC服务器取代小型机可减少软硬件费用,降低对接公有、私有云平台的IT投入成本。

基于SequoiaDB的分布式内容管理平台可实现全类型数据的统一管理,其主要应用在影像平台、海量音频/视频管理、非结构化数据治理、双录系统、无纸化系统等方面。