在政务大数据的应用工作中建立各级政府核心数据库的方法研究论文_严昊

淮安市电子政务网络管理中心江苏省淮安市223001

摘要:本文围绕目前我国各级政府建立核心数据库的必要性、可行性以及具体建设的方式方法等议题进行了探讨,依托于数据共享交换平台的数据交换功能,论述了核心数据库建立的方法,提出了数据共享交换平台功能拓展的方向,尝试运用人工智能的技术对核心数据库进行管理和优化,旨在不断提升我国各级政府对大数据分析的效率,以更好的为国家和社会群众服务。

关键词:核心数据库、数据共享交换平台、人工智能、大数据分析、数据库管理。

一、引言

当前,大数据的分析利用对生产、流通、分配、消费以及宏观经济运行状态、社会管理方式和评判各级政府治理能力的方面有着不可忽视的影响。2015年,我国国务院印发了《促进大数据发展行动纲要》(国发〔2015〕50号),该文件中所涉及的政务大数据的内容为我国各级政府如何运用和分析数据指明了方向。目前我国各级政府组成部门所掌握的政务数据量虽然十分庞大,但在实施数据分析工作时,所运用到各类数据的关联性还存在薄弱环节。因此,建立各级政府核心数据库的工作是非常必要的。

二、数据共享交换平台的概念和政务数据应用分析的现状

1、数据共享交换平台

该平台是指依托于计算机网络构建一整套软硬件系统,使得若干个不同应用系统的数据可通过该系统进行传输,对数据进行抽取、审核、推送、写入等方式完成各异构系统之间的数据共享和交换。该平台可有效的提高数据资源的利用率。

2、政务数据共享交换工作的原理和拓扑结构

目前,较为流行的一种政务数据共享交换的方式是采用数据库A--前置机—数据共享交换平台—前置机—数据库B的模型。相关拓扑结构如图1所示。

图1

3、政务数据的现状

目前,政务数据的体量十分庞大,各级政府的组成部门均掌握着不同类型的政务数据。以某地举例:该地工商部门建有企业信息数据库;该地税务部门建有税收信息数据库;该地食药监部门建有食品和药品信息数据库;该地公安部门建有人口户籍信息数据库等等。以上所有的数据库在建立时所采用的技术平台,数据结构,数据表关联,数据维护方式等各不相同。并且,有些数据库是国家级,有些是省级,有些是地市级,这些种种问题为地方政府在利用政务大数据分析时带来了重重困难。

三、建立核心数据库的必要性和具体方法

1、建立核心数据库的必要性

如果仍旧保持现有的政务数据库零散的状况,不建立核心数据库,那么,政务大数据的分析利用将十分困难。现举例说明:如某地开展经济运行情况的检查工作,欲了解本地经济发展的优势和劣势。现将相关数据分析的流转过程大致如下:

首先,通过对该地工商部门的数据库中不同类型的企业数据进行抓取。其次,对食药监部门、安监部门、质监部门、卫生部门、税务部门、人社部门等等多个单位的数据库中的涉及到企业规模、纳税数量、用工人员、资金流转、处罚信息等数据进行抓取。再次,通过对数据的交叉对比,可分析出本地不同类型企业运行状态。最后,再根据相关的经济运行的评判标准再对各企业信息进行汇总分类,最终形成不同类型的企业对本地经济所做出的贡献图表。

通过以上的例子,我们可以看出多个问题:1、最终数据的可信性没有保障,当以上任一部门的数据库出现问题时,那么最终输出的数据与事实情况则可能存在较大的偏差。2、运行效率较慢,当从不同部门的数据库中抓取数据时,所需的时间将由对方数据库的运行效率所决定,一旦需抓取的数据数量增加,那所耗费的时间将成倍增加。3、数据筛选的口径不统一将进一步加剧了大数据分析工作的难度。

建立核心数据库,是将各部门自有的数据库中有用的、重要的数据事先存放到核心数据库中。当进行大数据分析时将极大的提高效率,并有效的保证了输出数据的准确性。

2、建立核心数据库的方法

人工智能是目前最前沿的科技,利用人工智能,可以极大的节约人力资源。利用人工智能,建立核心数据库主要有以下几个要点:

(1)核心数据库顶层设计的合理性。

建立核心数据库,首先需要将各级政府组成部门所掌握的数据库中数据的类型,数据表的关联性,数据的可用性等等信息进行全面的梳理,确保核心数据库架构设计的合理。笔者认为,该项工作不是一蹴而就的,可以分步实施。第一步,先梳理各零散的数据库信息。第二步,可先行按照人口基础信息库、法人单位基础信息库、地理信息基础信息库以及经济信息库的方式逐个规划。第三步,在四个基础数据库设计合理的基础上,再开展核心数据的规划设计工作。

核心数据库的顶层设计工作是所有政务大数据分析利用的基础,其中的索引设计、数据类型和数据表关联性更为重要,没有完成顶层设计工作,那么所讨论的政务大数据分析工作将是空中楼阁,对各级政府进行社会管理和决策工作时带来错误的引导。

(2)核心数据库中数据的完整性和可信性。

数据的完整性和可信性直接影响大数据分析结果的正确性,核心数据库中的存放的数据均需是利用数据共享交换平台抓取得各级政府组成部门的业务数据库中的数据。因数据量过于庞大,因此数据在抓取过程中是否存在错误,或者业务数据库中的数据变更后,核心数据库中是否同步变更等系列问题需依靠人工智能的方式进行实施。在核心数据库建立的过程中,人工智能主要需完成以下几个方面的工作:1、数据的校验工作,数据共享交换平台在抓取数据存放至核心数据库后,人工智能将对核心库的数据与原始数据进行校验比对,正确的数据将予以存放,错误的数据将重新抓取。2、在业务数据库中的原始数据有变更操作时,需将操作流程同步推送给人工智能平台,人工智能将根据操作流程对核心数据库中的数据进行同步变更,变更完成后需通过数据共享交换平台对业务数据库中的变更数据重新抓取并进行比对。数据一致则说明变更有效,不一致则需重新变更。3、人工智能平台在实施数据抓取时需对数据实时进行优化,过滤掉垃圾数据,仅保留可用数据。4、人工智能平台必须具备对非线性数据的识别功能,利用文字识别、语音识别等功能对图片、音视频等非线性数据进行筛选。

(3)核心数据库中数据分析的实时性。

建立核心数据库的目的是为了在做大数据分析工作时提高效率和准确性。所以核心数据库需依靠人工智能建立不同的数据分析模型并支持可视化修改。当数据分析的目标与固有模型不一致时,人工智能平台需具备分析条件修改功能,并能在自建模型执行时快速的对核心数据库中的数据进行分析,实现正确的结论。

3、核心数据库的管理维护工作

核心数据库的建立后需对其存储的数据进行定期的管理维护并对数据表结构实施优化,要根据实际工作的需要不断完善核心数据库中的数据,对涉及重要数据结构变更的,需做好数据备份工作,防止出现数据丢失。同时,要建立健全相关的数据管理制度,对数据的安全性,使用范围和保密性做出明确的要求。对承载核心数据库的硬件设备和网络要实行信息安全等级保护的测评,以杜绝数据外泄的可能性。

结语:综上所述,建立核心数据库对于各级政府的政务大数据分析工作有着至关重要的作用。各级政府的大数据管理部门和人员应积极利用前沿技术,通过对掌握的政务数据进行挖掘分析,以正确的形式社会管理智能,为社会民众提供更好的服务。

参考文献:

[1]《促进大数据发展行动纲要》(国发〔2015〕50号)

[2]张淼.面向新型智库应用的政务大数据开放共享机制研究[D].陕西师范大学,2018.

[3]唐长乐,王春迎.基于政务云数据中心的政府数据开放共享服务集成平台研究[J].情报资料工作,2017(05):13-19.

[4]黄铧焕,薛丽芳.大数据,大政务,新网络——大数据时代电子政务网络的发展方向[J].电子政务,2013(05):104-109.

[5]李洺,王巍.政府应急平台数据库的数据需求、实现路径与管理制度[J].电子政务,2008(05):56-61.

论文作者:严昊

论文发表刊物:《科技新时代》2018年12期

论文发表时间:2019/2/18

标签:;  ;  ;  ;  ;  ;  ;  ;  

在政务大数据的应用工作中建立各级政府核心数据库的方法研究论文_严昊
下载Doc文档

猜你喜欢