高校数据治理探索论文

高校数据治理探索

刘振华

(中华女子学院 现代教育技术中心,北京)

摘 要: 近年来,高校智慧校园建设逐渐展开,特别是在大数据平台建设、大数据分析、数据服务建设等方面成为了研究及实践的热点。然而,随着数据分析及数据服务内容的建设也暴露了很多目前学校数据存在的各类问题。因此,本文基于学校现有主数据,重新分析数据源、数据流通情况,提出数据治理框架,并在信息标准、数据质量、数据共享等方面提出具体的解决方案,达到提升数据质量的目的,从而促进有意义的分析和有效的决策支持。

关键词: 数据治理;信息标准;数据流通;数据质量

一 引言

中华女子学院信息化建设多年以来,已经完成了人事、教务、科研、财务、国资、学工等重要业务系统的建设,并且搭建了基础的数据集成平台,整合了学校重要业务系统的数据到共享核心数据库,将分散于各处的源数据进行抽取、筛选,基本上解决了学校重要业务部门数据难以共享的障碍。同时,基于共享核心数据库也在学校全局范围内建设了PC端信息服务门户和移动端微信服务门户,服务类的应用已经建设50余个。

但随着数据在业务系统之间的共享、数据逐渐的应用到数据服务也发现了越来越多的问题,例如有数据标准缺失、缺少源头数据、数据准确性不高、数据不一致、数据共享流程不合理等问题,严重制约了后续数据访问、数据挖掘分析、数据服务建设等工作的开展。很难做出有意义的分析和有效的决策支持,这也是目前很多高校信息化工作的重点和难点。

二 数据治理目标

我国国家标准《信息技术服务治理第5部分:数据治理规范》(GB/T34960.5-2018)将数据治理定义为数据资源及应用过程中相关管控活动、绩效和风险管理的集合。[1]《规范》具体说明了在数据标准、数据治理、数据安全、元数据管理、数据生存周期等方面数据治理需要完成的工作内容。

我国学者许晓东等认为:数据治理是提高大学教育质量的需要;数据治理是提高大学决策科学性的需要;数据治理是提高大学管理效率的需要[2]

《教育信息化“十三五”规划》明确提出要建设“智慧校园”,不断探索“以数据为核心资产、以数据驱动业务革新”的发展模式。各大高校都在不断完善和深入研究数据服务平台,实现对数据的采集、存储、交换、安全及应用,为满足各类教学、科研、管理的综合需要。

基于上述,高校数据治理目的可以理解为是提升数据质量,使校内互通更加流畅,为数据共享、数据服务、数据分析打下良好的基础,长期提供安全可信的数据,为学校组织决策、提高教学质量和管理效率等方面提供借鉴意义, 促进数据的价值实现,逐步的利用数据资产使得“数字校园”逐渐的向 “智慧校园”过渡。

三 数据治理框架

我校数据治理的思路是以现有的跨部门、跨系统的数据流为切入点,重新分析数据源的收集情况,对以往的数据标准进行检查,落实可用的数据标准,补充未执行的标准。其次,重新梳理数据流通与数据集成方案,对集成情况与数据质量进行摸底。借助数据治理技术工具检测数据标准、数据模型、数据接口等方面的问题并提出具体的解决方案,实时监控数据治理情况。同时,进行数据存储与数据备份,使得数据得以保护,进行安全的数据传递。

我校信息标准制定于2016年,制定了包含组织机构、教职工基本信息、学生基本信息、专业信息等标准集,基于此标准建设了一系列的业务管理系统,例如人事系统、学工系统、国资系统、招生和就业系统、迎新离校系统等,并且搭建了数据集成平台,建设了PC端和移动端信息门户。

在对上述接口及数据源头分析过程中发现的问题主要有:

图1 数据治理框架

四 数据治理实施过程

(一)信息标准

此外,数据治理不完全是技术管理问题,兼具技术与管理的双重属性,数据治理的管理层面也需要重点纳入到治理工作中来。在全校范围内必须要用制度作为保障,需要发布信息标准,数据交换标准,数据源权责制度,数据安全管理规范等,为保证数据的长久稳定保驾护航。图1为我校数据治理框架。

数据标准方面的治理,主要目的是实现信息标准的可视化维护,根据学校数据的需求逐渐的在数据治理工具上部署,包括数据标准和代码标准两部分,形成一套实际可用通用信息标准,为后续数据质量监测和数据共享提供良好的基础。

1.设置数据质量监控规则模板。规则设置有:不在代码表、不唯一、空值、手机号码规则、电子邮箱规则、身份证号规则、数字超出正常范围、首尾空格等。

虽然建设了信息标准,但是由于数据共享主要是围绕组织机构和教职工、学生基本信息展开,这些没有做共享的数据相关的信息标准并未补充到学校的信息标准集中。业务类数据主要是做了数据提取工作,例如科研成果、资产信息、财务信息、学生课程信息、成绩信息、校园卡信息等。而且还有大部分系统的业务数据还存储于业务系统数据库中,如果今后要做更多的数据分析和数据服务的应用,需要补充这些业务信息标准集。此外,随着我校新业务的开展及维护管理人员的变更,出现了很多非标准化的数据,这些非标准化的数据无法实时检测。

关于建筑业的绿色化发展,主要存在以下几个问题,对我国绿色建筑的发展造成了障碍,同时也造成了能源浪费,不利于企业经济效益的发展。

为了实现此目标,在信息标准方面,我校的治理工作主要有:

1.引入数据治理工具与我校主数据建立关联,将我校目前执行的数据标准和代码标准同步到工具中。根据业务进行分类,建立数据模型并设置代码标准的引用关系,真正的实现标准的可维护。

2.重新梳理主数据的数据源,确定数据的权威源,利用数据治理工具形成一个清晰的、真实的标准引用报告,产生我校实际执行的标准。将现有标准和实际执行标准进行对比,整理出我校数据标准和代码标准描述不全或者不准确的情况,与业务部门沟通与确认更新到信息标准中。

3.根据主数据的数据情况,整理出我校缺少的信息标准集,例如资产信息标准集、科研信息标准集、学工信息标准集等业务类标准集。针对上述情况,进一步明确信息标准范围,技术部门和业务部门一起从学校的实际业务问题出发,以学校共享数据的需求为基础,不断完善《中华女子学院信息标准》。

(二)数据质量

随着数据规模的逐渐扩大,数据质量问题也被越来越多的暴露出来,数据质量的衡量标准主要在于完整性、准确性、唯一性等。在数据质量方面,主要是利用工具进行检测,分析各类数据质量问题产生的原因,确定是数据源的问题还是在数据提取、转换过程中产生的问题等,针对不同的情况提出相应的解决方案。在数据质量方面,我校的治理工作主要有:

海关管理权的丧失,使中国海关完全沦为西方列强侵华的工具。晚清关税制度变迁过程也是西方国家逐步夺取海关管理权的过程。

在成虫盛发期每亩用80%敌敌畏乳油100~150毫升,用高梁秆或玉米秆切成20厘米长,吸足药液制成药棒,亩播40~50棒熏蒸成虫,注意敌敌畏对高梁有药害。

2.集成接口建设不规范

冯建宁充分认识到科学技术的重要性,自2014年起连续2年参加了县农广校举办的新型职业农民培训,并于2015年参加了现代青年农场主培训,同年11月,冯建宁作为全省新型职业农民代表带着自己发明的专利产品“核桃树防护贴”,参加了第四届中国国际现代农业博览会。

2.按数据模型分类检测我校主数据,生成数据质量检测报告。以人事和教务系统为检测样本,发现的问题主要有:

表1 数据质量问题及解决方案

3.根据报告内容,准确定位数据存在的问题,不断的进行修改、检测,反复几轮,促使生产数据部门数据维护,对数据进行监管,确保数据完整性、准确性和唯一性。

(三)数据流通

我校的数据集成工具采用的是oracle ODI,数据源根据主数据的要求提供过滤后的视图,经过加工、清洗、转换等操作,集成到共享库中,然后下发相关数据到需要共享的业务系统目标中间库中,由业务系统对应的接口进行服务处理,以解决业务系统之间不能互联互通、不能共享数据的问题。数据共享相关问题治理的开展首先是对跨部门、跨业务、跨系统的数据流进行重新梳理。本次治理工作重新梳理学校现有接口总计221个,如表2所示。

表2 数据接口汇总图

整个数据治理框架主要分为三个层次,数据来源层、数据治理层、数据服务层。各类业务系统的数据经过清洗、抽取与转换集成到主数据中,数据治理工具重点针对主数据进行监测。在信息标准、数据质量、数据流通等方面发现主数据的问题,主数据经过不断的修改反复,反应数据实际情况到数据治理工具中。顶部数据访问即为用户提供不同权限的数据查询,数据分析即为学校提供各类分析数据辅助决策;数据服务即为全校师生提供各类信息查询及业务办理应用。整个数据治理过程依靠制度建设执行贯彻,包括标准建设、管理体系建设、数据安全制度建设等。

1.主数据缺少重要业务数据

通过与相关业务部门调研,很多需要共享的重要业务数据并未集成到主数据中来,例如:缺少教职工及学生党员信息、教职工科研项目、教职工职称评审、辅导员基本信息、学生宿舍信息、留学生数据、后勤宿舍数据等。针对具备集成条件的业务系统新增接口完善主数据。

《义务教育语文课程标准(2011年版)》在“课程性质”中开宗明义:“语文课程是一门学习语言文字运用的综合性、实践性课程。”它告诉我们,语文课是学习语言文字运用的,这是语文课的目的和归宿。“语文教学要注重语言的积累、感悟和运用,注重基本技能训练,让学生打好扎实的语文基础”,由此可以看出学习语言文字运用是语文教学的“根”。那么语文教学中如何涵养语文的“根”呢?

或许有人会说,声音并不是超级跑车的全部魅力,但在整个社会都试图降低交通噪声的当下,高性能发动机的嘶吼反而成为了车迷心中的最后绿洲。法拉利为我上演了一场由12个气缸演奏的狂野乐章,被环绕在发动机的阵阵嘶吼声中,我甚至会陷入某种关于人生的思考:我究竟是不是在梦里?这梦到底何时开始?这梦到底何时结束?

集成接口的建设需要按照遵循我校数据标准体系,在集成过程中需要按照主数据的模型进行转换。但目前存在例如教务系统完全按照教务系统本身的数据结构集成到主数据中,并没有按照主数据的标准和模型来实施,导致数据监测平台无法起到监控的作用。

我和老婆一走进雅4,姚琳琳便夸张指着手表叫嚷起来:我说哥们,你们俩行不行啊?看看这都几点了?咋才来呢?上官婉也跟着帮腔说:谁说不是了,这也太没组织没纪律了吧。

3.业务流程重构

随着各部门业务系统的不断建设,有些业务流程进行了变更。例如,由于学校绩效工资改革,教职工工资数据的提取由原来的财务系统需要变更到人事系统。此外,迎新系统、招生系统、就业系统以往接口的建设只是集成到主数据中来,并为与教务系统、学工系统打通,需要对现有业务流程进行全面的功能分析,设计流程改进方案,与各业务部门一起进行评估,对于不合理的流程进行重构,持续改善流程。

通过不断的持续改进,目前在数据治理工具上形成了比较完善的数据流通图,学校部分系统数据流通图如图2所示:

把公路用自卸车改装为非公路用自卸车时 ,由于路况恶劣、超载严重和设计初期仿真分析欠缺等问题,国内厂家生产的矿用重型自卸车不同程度地发生因推杆失效而导致产品可靠性低的问题,是一个亟待研究的课题[1-2]。

图 2 数据流通图

五 制度建设

数据治理是不同于以往的学校数据管理,需要自上而下制定相关的数据质量保障制度和管控机制。在制度建设方面,首先发布了新版《中华女子学院管理信息标准》,包含学校基础情况、教职工、学生、教学、科研、资产、财务、办公等子集。此外,为了加强数据治理的维护保障机制,还制定了《中华女子学院基础数据管理办法》明确数据的管理体系、数据生产部门职责、数据使用部门职责、数据变更管理、数据交换管理、数据保密等问题,建立完整的数据质量管理体系及实施机制,优化数据质量并持续改进。

六 工作展望

经过本次数据治理工作,使得我校数据质量有了比较大的提高,但数据治理是一个长期的、复杂的过程,需要结合学校自身的业务发展,以创建数据服务为动力,不断的完善信息标准和数据流程等。后续工作除了继续完善上述方面,还应考虑纳入非结构化数据的收集及自动化治理工作,例如,网络日志、访问日志等,将大数据内容纳入到学校整体数据平台总体架构中,针对不同的数据源情况,设计不同的集成方式和存储结构,以追求为教师和学生提供良好的用户体验,满足上层数据多维分析、历史数据积累,能够进行主数据历史数据追溯,保留整个数据生命周期的完整性。

参考文献

[1] 中华人民共和国国家标准《信息技术服务治理第5部分:数据治理规范》(GB/T34960.5-2018)

[2] 许晓东,王锦华,卞良,等.高等教育的数据治理研究[J].高等工程教育研究,2015(05):25-30.

本文引用格式: 刘振华.高校数据治理探索[J]. 教育现代化,2019,6(77):228-231.

DOI:10.16541/j.cnki.2095-8420.2019.77.076

基金项目: 中华女子学院校园信息化数据治理研究(ZKY208020903)的研究成果。

作者简介: 刘振华,男,河北承德人,中华女子学院现代教育技术中心,主任。

标签:;  ;  ;  ;  ;  

高校数据治理探索论文
下载Doc文档

猜你喜欢