- 基于大智移云技术的财政数字化转型研究
- 彭程 王宏利 霍然 罗建钢
- 4667字
- 2021-08-12 18:27:44
第1章 引言
在全面推进工业信息化的全新时代,各行各业都在进行信息化发展,党和国家领导人也在多个场合提及信息化、数字化、信息网络等概念,并要求大力推进“工业化、信息化、城镇化、农业现代化”四个方面协同发展。当下,信息化发展已然成为各行各业转型发展的趋势,财政领域的信息化也在不断进步。
在信息化时代的当下,社会各经济主体的实践活动与相关业务数据的产生是不可分割的,这也导致了海量业务数据爆发式的增长已成常态。尽管这些海量的数据信息看似杂乱无章、毫无关联,但其实通过相应的数据处理,能够发现众多数据之间的关联,从中提取有用的信息,也能将其变为珍贵的数据资源。作为服务经济社会健康发展的保障与基础,财政业务也在每天以兆级的速度产生着不可估量的数据资源,但是由于不同财政业务主体对相关业务数据的处理标准不一致,导致了业务数据统计口径不统一,各级财政部门根据各自情况采集到的财政业务数据有所差异,部门之间数据共享程度低,因此财政业务数据资源的利用率有待提高,价值有待挖掘。
针对传统数据处理方式无法解决的大数据现象,利用相应的数据处理手段,能够高效挖掘数据价值信息,并积极促进数据跨领域、跨层级的分享与关联,从而推动社会相关信息资源的有效交互,并提高政府监管部门对相关数据资源使用详情的管控力度,将大数据资源转换为有效的价值信息,以提高社会运行质量,服务人民大众。值得一提的是,以大数据技术为代表的关于财政相关数据处理的信息化手段,对优化各级政府内部控制和业务运行具有重要的推动作用,有利于实现各级政府的财政治理现代化与数字化,并共同推进中国特色财政治理体系的建设。
随着财政业务体系的逐渐完善与发展,相应财政数字平台的建设(即针对业务产生数据的处理)显得至关重要。一方面,该平台应当具有高效的数据收集能力,以便对全国范围内各级财政部门的数据进行全面统计,并根据资产负债具体类别进行详细分类;另一方面,通过整合各级财政主体管理的数据库资源,该平台能够实现财政单位与其他金融机构关于特定财政数据资源的共享与关联,以提升数据资源的利用率以及作用广度。此外,财政数字平台所特有的数据分析技术以及数据挖掘模型,整体能够确保财政业务数据价值的最大化,使得原本看似无用的数据资源成为财政监管、政策制定等一系列相关财政活动的数据支撑。
在国家对信息化的大力倡导以及各行各业对信息技术充分利用的共同作用下,以大数据技术为代表的大智移云技术正逐渐成为我国信息化发展的重要推动力,也是信息技术大范围推广的主要工具,对我国政治、经济、社会等各领域都产生了深远的影响。作为信息化水平的重要体现,大智移云技术的推广与使用不仅是财政数字化转型的必经之路,也是我国在中国特色社会主义新时代中迈入更高台阶的强力助推器。随着信息化水平的不断提高与技术成熟,大智移云技术已经逐渐渗透入各个领域的应用中,金融机构借此开展“国家金库工程”研发工作,税务机关以此建设“金税工程”,财政部门则致力于“阳光财政”建设工作,可见不同领域的经济主体部门都致力于数字化转型研究以及相关数字系统的研发,以上建设工作都会牵涉到财政数据管理以及相关核算的功能服务。因此,财政数字化转型已经是不可逆转的趋势,这不仅是财政相关业务部门日常工作的需要,更是众多经济主体对财政数据的强烈需求以及财政数字系统的认可。
具体而言,财政部门关于数字化平台的功能需求主要是整合跨系统的财政数据资源,实现数据统一处理并提供相应的数据可视化服务,以便满足财政业务流程办公需求,优化办公流程,提高办公效率,全面推进财政数字化转型。基于我国信息化发展水平以及财政发展现状,本书针对财政数字化转型具体工作进行了详细研究,旨在解决财政数据管理水平低下、利用率不足的问题,借助大智移云为代表的信息化技术助力财政数字系统建设。主要可以分为以下几个方面的内容:
第1章,引言。简要介绍财政大数据的发展进程,平台提出的背景与意义。随着互联网技术的不断发展,财政数字化也将成为必然趋势,大数据、机器学习、人工智能、5G、云计算、物联网等技术的使用促进了财政数字化平台的发展,有利于解决财政数据采集、存储、挖掘、展示、决策等问题,促进财政决策数据化与智能化。
第2章,财政数字化转型平台的背景分析。主要介绍项目的建设背景与建设目标。本项目是基于财政现实需要提出的,目前,财政数字化的目标不够明确,对非政府部门的重视程度不够。财政数字化制度和统计方法不够完善,数据共享程度低,业务整合难度较大,造成了大量多头操作、分别维护的情况,影响了工作效率。财政收支统计范围不够全面,缺少统一的对外、对内的财政信息系统集成平台,与上下级财政、代理银行等的信息共享程度较低,从而造成了信息无法及时互通的现状,这就需要建设一个财政信息系统集成平台进行统一处理。另外,财政数字化分析框架不够健全,没有建立统一的财政数据仓库,资源配置决策效率较低。政府财政数字化体系与国际标准仍然存在较大差距。因此,需要建立财政数字化转型大数据平台,及时全面地采集财政数据,精准高效地监管财政数据,对财政数据进行预测与挖掘,打造财政数据多维展示报表,实现财政智能应用服务。
第3章,财政数字化转型项目需求规格说明。主要从项目角度,梳理财政数字化转型平台的建设需求与关键技术。从需求层面来看,目前的财政数字化转型平台还不完善,需要在数据采集、数据存储、数据检索、数据分析、数据可视化、数据挖掘、数据决策等方面应用大智移云技术进行相关的提升。为实现这些需求,本书结合目前的大数据与分析技术,使用Flink(数据流执行引擎)技术解决财政数据流式采集与处理的问题,利用Hive(数据仓库工具)技术解决财政大数据存储与静态数据批量统计分析的问题,利用HBase(分布式的,面向列的开源数据库)技术解决财政大数据实时读写的问题,利用MySQL(关系型数据库管理系统)技术解决实时可视化的问题,并结合逻辑回归、随机森林、支持向量机等技术,解决财政数据价值挖掘的问题。在项目设计过程中,遵循标准性、规范化、整体性、成熟性、安全性、可靠性、实用性、灵活性、易用性、集成性、开放性等设计原则进行系统功能设计。在平台开发过程中,使用了数据融合技术、指标设计技术、全文检索技术、可视化技术、分布式采集保存与计算技术、大数据挖掘分析技术。
第4章,基于大智移云技术的财政数字化转型平台总体建设方案。主要介绍财政数字化转型平台的部署架构设计、总体架构设计与平台概要设计。整个财政数字化技术部署架构分为数据源、服务器集群数据处理与存储、数据库、API、数据门户5个方面,完成财政支出、经济运行、社会发展、精准扶贫等财政相关数据的收集、处理、存储与可视化。根据总体框架的数据内容,可将相关财政数据的反馈结果划分为财政运行、经济效果、社会发展、就业情况、金融风险几大类,并通过5G网络通信技术以及Kafka、Spark等实时数据采集技术接入到HBase数据仓库与全文检索库ELS。在全文检索库中的数据通过建立索引,实现快速搜索,为财政建立数据仓库。HBase数据仓库中的财政数据资源通过小时与分钟的聚合,批量导入Hive数据仓库中。外部API(Application Programming Interface,应用程序接口)数据通过DB(Database,数据库)API技术,使内部运行数据与财政数据通过Sqoop技术非实时地批量接入到Hive数据仓库。财政数字化转型平台的总体架构可以根据财政业务的实际需求分为7个层次,即资源层、数据源层、采集层、存储层、计算层、档案层、应用层。
第5章,财政数字化转型平台数据中台详细设计。主要设计财政数字化转型平台数据中台的采集、存储、数仓建模、数据输出、报表定制等方案。在数据采集过程中,将会规范数据采集方法,明确数据成果的内容需求、成果类型、采集范围,对敏感的文件类型数据应进行加密处理,并预留数据存储扩展接口。在财政数据的存储方案中,将提供数据资源管理、元数据管理、目录管理、备份管理等数据资源管理功能,以及组织人员管理、财政权限管理、日志管理等系统管理功能。数仓建模主要包括数据接入、数仓实施建设、数据ETL实施工作、数据准确性校验、数据可视化。数据中台主要实现对所有财政相关数据的管理,是资源检索服务功能的扩展,将对财政政策库资源、研究资料库资源、财政项目及分析测算库、机构与专家库、统计分析数据资源等各种共享资源进行跨区域统一检索和分级呈现,实现一站式跨库检索和数据输出。报表定制支持各类业务表单的数据采集、公式设置、样式设置、报表生成。通过可视化表单定制器,提供表单的定制、导入、预览、打印、导出等多种功能。利用报表定制机制,可以根据业务需要快速定义表单格式,并用于相关业务应用。
第6章,财政数字化转型平台数据智能详细设计。主要从财政运行、社会运行、风险分析、形势预测、重点项目等方面进行智能报表详细设计。财政发展情况主要包括当年GDP、就业数量、供给侧改革、居民收入、消费、投资、贸易等指标。财政运行情况主要通过财政收入、当月财政支出、财政收支缺口、当月税收收入等指标展示,通过省份、时间、财政类型等分类,将衍生同比、环比等数值进行趋势分析、板面分析与区域、财政分布分析。社会运行分析主要是研究影响人类社会内在运动规律的各组成因素的结构、功能及其相互联系。该部分主要分为就业状况、居民收入、精准扶贫3部分内容。风险分析主要从财政收入、财政支出、收支缺口、税收收入、财政风险5部分的指标展开。形势预测主要分为GDP(Gross Domestic Product,国内生产总值)预测、投资预测、消费预测、货物与服务进出口预测、通货膨胀率预测、PPI(Producer Price Index,生产价格指数)预测6大指标内容。财政收入及重点税收预测指标分析主要分为财政收入预测、国内增值税收入预测、企业所得税预测、国内消费收入预测、进口货物增值税预测、消费税收入预测6部分内容。
第7章,财政数字化转型平台共享系统建设方案。主要介绍共享系统的总体架构、详细设计与门户设计。财政共享平台的数据层包括两大板块7个组成部分。数据层主要分为财政运行与社会发展两个板块。财政运行板块中主要包括财政收入、财政支出、收支缺口、财政风险4部分;社会发展板块主要分为就业状况、居民收入、精准扶贫3部分。财政运行板块的财政收入部分包括预算收入、基金收入、税收收入等指标;财政支出部分包括公共财政支出、财政基金支出、基建建设支出等指标;收支缺口部分主要包括财政赤字与财政盈余等指标;财政风险部分主要包括政府债务、货币数量、贷款额度等指标。社会发展板块的就业状况部分包括就业指标、就业人数、失业人数、就业需求等指标;居民收入部分包括城镇居民收入、农村居民收入、行业平均月薪、月薪集中趋势等指标;精准扶贫部分主要包括扶贫资金、贫困人口、贫困发生率、贫困县数量等指标。通过相关信息的获取,面向财政的政策决策、财政决策、经济决策、社会决策、风险监控、智能预警、预算管理、决算管理等财政决策主题,根据决策的需求形成不同的多层次决策方案。
第8章,财政数字化转型其他功能设计。主要介绍系统管理与扩展接口、系统任务调度、接口规范设计、非系统功能设计。系统管理方面,平台的财政管理和角色权限可以通过分财政、分功能权限、分部门权限、分数据权限的管理手段,全面保障数据安全。系统任务调度方面,实现参数输入、任务下钻、任务执行、任务检查、状态检查、状态更新、状态还原等功能。接口规范设计方面,设计了规范化的数据导入导出方法。非系统功能设计方面包括安全性、可靠性、可用性、灵活性、易用性、集成性、开放性等设计原则。
第9章,财政数字化转型项目管理方案。主要介绍项目实施过程中的质量控制、组织管理与分工。