开放数据背景下美国政府支出数据标准的启示论文

开放数据背景下美国政府支出数据标准的启示*

李红芹1,…2 翟 军 1邹书怡1

(1.大连海事大学航运经济与管理学院 辽宁大连 116026;2.山东工商学院会计学院 山东烟台 264005)

〔摘 要〕 文章以《数字问责和透明法案》对政府开放支出数据的要求为主线,以其信息模型模式为分析对象,从领域、组件、元素和元数据四个级别界定数据标准的数据字典,研究数据标准的数据收集及创建过程、机器可读标准XBRL及实施效果。美国已形成了较为完备的联邦支出数据标准,数据标准是开放数据不可或缺的首要步骤,对我国而言,开发数据标准将是一个十分必要且紧迫的课题。归纳总结美国政府支出数据标准及其应用成果,以期为我国数据标准制定提供参考。

〔关键词〕 《数字问责和透明法案》 数据标准 信息模型模式 元数据 可扩展商业报告语言

1 引言

美国的预算透明度一直处于世界领先水平,国际预算合作组织(International Budget Partnership,IBP)2017年发布的预算公开指数(OBI)显示,美国得分为77分,排名第8位,属于重要预算信息基本对外公开的国家[1]。财政透明是开放政府合作组织(Open Government Partnership,OGP)国家必须具备的四个条件之一,同时“财政与合同”是《开放数据宪章》(G8 Open Data Charter)承诺积极推进的14个重要领域之一[2]。美国作为OGP和G8成员国,在2015年10月27日发布的第三轮国家行动计划(2015—2017)[3]中包含了“财政透明”的内容,提出根据《数字问责和透明法案》(以下简称《数据法案》)[4]的要求来完成联邦政府支出数据的标准化,从而增加政府支出的透明度。美国作为开放政府数据运动的领跑者和推动者,政府支出领域是其重要开放数据领域之一。

建立和实施一套政府支出开放数据标准是《数据法案》的核心内容,该标准应是“广泛可用的、非专有的、可搜索的、平台独立的且机器可读的标准”。2013年5月9日美国政府发布了《开放数据政策:将信息作为资产管理》备忘录[5],提出有效管理信息生命周期的每个阶段,重构数据收集和创建过程,采用数据标准促进互操作性和开放性。美国开放数据研究组织数据基金会(Data Foundation)2016年发布的《联邦开放数据现状》指出[6]:政府数据每100个核心数据集有超过90个不存在标准模式,如果没有标准模式来定位它们,软件很难直接使用这些数据集。出现这种情况的原因在于,目前开放数据仅在用户可用性和机器可读性方面努力,没有关注数据标准,因此数据基金会将标准化视为开放数据不可或缺的步骤之一。同时数据标准也是OGP总结的各国在供给侧(Supply Side)建设的13项主要内容[7]之一。

第二轮环保督查已于近日启动强化督查。本次督查组从原来200多个增至290多个,并预留了100多个特别机动组,较第一阶段督查力度更强、排查更精细、实时公开约谈等。据悉,本次强化督查范围涉及山东、河南、山西、河北、江苏、浙江、安徽等省份和北京、上海、天津地级市。

传统数理统计的内容包括哪些呢?虽然不同的教科书在编排上有所不同,但大同小异,主要包括:样本及抽样分布(随机样本、直方图、统计量、抽样分布)、参数估计(参数的点估计、估计量的评选标准、参数的区间估计、正态总体均值与方差的区间估计、置信区间)、假设检验(正态总体均值与方差的假设检验、分布拟合检验)、方差分析和回归分析(单因素试验的方差分析、一元回归分析).

国家审计署审计科研所从数据标准应用领域联邦支出角度分析了《数据法案》对我国财务支出公开及审计工作的启示[8];朱琳等做了美国政府数据开放政策与实践研究,从数据管理和价值方面指出数据标准平台USASpending.gov为用户提供了更易使用的界面和更清晰直观的数据展示[9]。文章将对美国政府支出数据标准构建及实施进行分析,以期为我国开放数据的数据标准制定提供参考。

2 数据标准

2016年4月29日,美国财政部发布了政府支出数据标准的完整版本即“《数据法案》信息模型模式”(DATA Act Information Model Schema,DAIMS)。数据标准主要包含三个方面:数据字典、数据收集及创建过程、机器可读标准。

2.1 数据字典

数据字典定义了机构必须报告的数据,是数以百计的不同数据元素的术语、定义、格式和结构的权威来源,同时为数据消费者提供上下文,以便更好地理解数据。数据标准概念信息模型[10]从领域级、组件级、元素级和元数据级四个级别提供了数据字典制定的完整视图,不同级别之间的关系和模型如图1所示。

图1 数据标准概念信息模型

2.3.1 模式文件

目前,数据标准仅支持美国联邦政府的支出,如图1中最外层的左半区域所示。右半区域指明了未来DAIMS可能支持的领域,如美国国际开发署、世界银行和金融行业数据标准。

Level 2:组件级

应用数据挖掘技术对学生成绩进行分析,首先通过聚类算法对学生成绩数据进行分类,并对分类后的结果使用ID3算法建立决策树深入分析,得到影响成绩的关键因素是上课出勤,其他因素虽然对成绩有影响,但影响得很小。通过聚类和决策树算法对影响学生成绩的因素进行分析,可将藏匿于海量数据中的有用信息挖掘出来,促进学校教学工作的进一步提升。

组件包含一组相关的数据元素,表示一个业务功能或一个实体。组件独立依赖于业务需求,可以共享数据元素。根据《数据法案》要求,政府支出数据至少包含以下要素:项目活动、对象类、接受者、交易类型、支出类型等。据此,DAIMS组件包括以下五类(图1组件级左半部分):①账户余额,包括联邦预算账户余额、对象类、项目活动;②奖项财务:包括联邦奖项账户、对象类、项目活动、奖项;③奖项细节——拨款和其他财务资助,包含财务资助奖项和获奖者属性;④奖项细节——采购,包含采购奖项和获奖者属性;⑤获奖者/接受者,包含获奖者和接受者的详细信息。未来DAIMS组件包括:收益和融资,绩效。

Level 3:元素级

数据元素是一个数据的原子单元的描述,具有精确的语义。数据标准通过领域和组件定义数据元素及其关系。首先财政部和行政管理预算局根据五大组件建立了六大数据标准,共57个数据元素[11],分为两大类。第一大类是现有的FFATA数据标准,包括以下五类:

Awardee and Recipient Entity Data Standards:获奖者和接受者实体信息,包括获奖者/接受者法定实体名称及唯一标识、法定实体地址、最顶层法定实体标识等共10个元素,元素编号为1—10,元素编号用于文件定义;Award Amount Data Standards:描述奖项的资金信息,包括联邦活动义务金额、非联邦资金金额、奖项金额等5个元素,元素编号为 11—15;Award Characteristic Data Standards:描述每个奖项的特点,包括奖项类型、识别号及描述、父奖项识别号、奖项修订号等22个元素,编号为16—37;Funding Entity Data Standards:描述资助实体信息,包括资助机构、子机构、办公室的名称及代码共6个元素,元素编号为38—43;Awarding Entity Data Standards:描述授予实体信息,包括授予机构、子机构、办公室名称及代码共6个元素,元素编号为44—49。

第二大类为根据《数据法案》要求新添加的数据标准。如前所述,《数据法案》扩大了FFATA的公开范围,要求发布机构的财务状况和预算信息,因此需要增加描述机构及奖项账户信息,《数据法案》构建了新标准Account Level Information,共8个元素:50号对象类Object Class、51号财政部账户符号Treasury Account Symbol、52号预算授权拨款Budget Authority Appropriated、53号义务Obligation、54号未尽义务余额Unobligated Balance、55号其它预算资源Other Budgetary Resources、56号项目活动Program Activity、57号费用Outlay。

然后,财政部根据数据收集和创建过程的要求定义了八大文件:文件A拨款账户明细、B对象类和项目活动细节、C奖项财务细节、FABS财务资助代理提交细节、D1奖项和获奖者属性(采购)、D2奖项和获奖者属性(财务资助)、E额外的获奖者属性、F分级奖项属性。文件定义使用了上述六大标准中的数据元素。需要强调的是,文件中的数据元素与标准中的数据元素并不是直接对应的,比如数据标准中51号元素财政部账户符号Treasury Account Symbol(TAS)在文件中对应7个元素:51(A)分配资金机构代码、51(B)接受资金机构代码、51(C)资金可用期间开始年度、51(D)资金可用期间结束年度、51(E)可用类型代码、51(F)主账号、51(G)子账号,元素都是51,但是后面有具体的编号,因此数据标准中的57个数据元素不是简单的数据属性,文件中的数据元素则是其包含的属性[12]。数据字典从元素所在文件、标签、定义、使用和分组五个方面介绍了每个数据元素,共565个元素,具体参见文献[13],这里不再详细介绍,文件的具体内容将在数据收集和创建过程中根据提交抽取规则进一步具体定义。

Level 4:元数据级

对于高校而言,加强基层服务型党组织建设具有重要的现实意义。高校在承担教书育人、传承文化的基本任务外,还担负着培育和弘扬民族精神、培养中国特色社会主义事业合格建设者和接班人的历史使命。建设服务型党组织作为建设学习型和创新型党组织的基础工程,是党在新形势下全心全意为人民服务宗旨的必然要求。建设服务型党组织既是政治责任,也是高校内涵发展的实践需要,对大学生的健康成长也起着重要的作用。

元数据是美国开放政府数据的建设核心之一,提供了数据的一个或多个方面的信息,为建立共识和共享提供基础。数据标准DAIMS的元数据定义了联邦支出数据字典中每个数据元素的名称、类型、长度等属性,具体元数据属性参见表1。

表1 数据标准的元数据属性及含义

DAIMS依据ISO/IEC 11179元数据标准进行数据元素命名和定义,ISO/IEC 11179提供了标准化数据元素名称和描述的指导,实现跨组织数据的共同理解。具体使用的标准包括:①ISO/IEC 11179-3[14]描述数据元素的属性;②ISO/IEC 11179-4[15]指定需求和建议来起草在元数据注册表中注册的数据定义;③ISO/IEC 11179-5[16]指定命名约定。对于数据字典中每个数据元素的具体元数据属性取值将在数据收集及创建过程中进行界定。

汾河灌区位于山西省中部的太原盆地,灌区地跨三个地市,即太原市、晋中市和吕梁市。灌区东西宽约20 km,南北长约140 km,全灌区总耕地面积10.5万hm2,设计灌溉面积约10万hm2。灌区的主要农作物包括春玉米、冬小麦等。灌区年灌溉引水量约2亿m3,亩次灌水定额约100 m3[10]。

为了协助联邦机构使用数据标准,美国财政部和行政管理预算局编写了《DATA法案实施手册》,涵盖八个关键步骤,包括:第一步,组织团队:建立主要事务专家工作组,开发机构项目计划;第二步,评价元素:学习《数据法案》数据元素,向行政管理预算局和财政部提供反馈;第三步,库存数据:定位机构现有系统的元素,识别差距,集体讨论改进;第四步,设计和制定战略:建立集成团队,捕获所有数据元素,并提交实现方案到行政管理预算局;第五步,准备提交到数据法案代理的数据:学习报告提交规范RSS和接口定义文件IDD,建立模式和机构数据之间的映射引擎,实现系统变化来捕获数据;第六步,验证代理输出,确保数据是有效的:建立从机构系统检索数据的方法,利用代理“验证引擎”修正提取;第七步,更新数据和系统:传递数据并验证到财政部的提交过程;第八步,提交数据:机构登录MAX.GOV提交数据到财政部并分析数据。

2.2 数据收集及创建过程

图2数据标准信息流[17]描述了数据收集及创建过程:从机构如何从自有的财务和奖金系统收集并提交数据,到数据法案代理如何从机构提交数据中抽取数据,如何验证数据并发布到公共网站和数据库。整个信息流分为提交阶段、提取阶段和验证阶段,图的左侧是《数据法案》增加的季度报告,右侧是FFATA原有的每日报告或每月两次报告。

图2 数据标准信息流

提交阶段:图2左侧机构每个季度从财务管理系统提取数据上传到数据法案代理,上传数据包括A拨款账户、B对象类和项目活动、C奖金财务,文件提交规范将在下文介绍。图2右侧奖金系统至少每月两次提交数据到财务资助代理提交文件(FABS代表奖金提交门户ASP),然后进行字段级别的验证,通过验证后上传到公共网站和数据库;同时奖金系统每天上报数据到联邦采购数据系统(Federal Procurement Data System,FPDS),然后由FPDS上传到公共网站;接受者传递数据到FFATA分级奖项报告系统(FFATA Subaward Reporting System,FSRS)和补偿的官员数据(SAM),FSRS和SAM系统每天上传数据到公共网站。

提取阶段:《数据法案》代理自动从公共网站和数据库提取奖项和获奖者属性数据,生成D1奖项和获奖者属性(采购)、D2奖项和获奖者属性(财务资助)、E额外的获奖者属性、F分级奖项属性四个文件,提取规范将在下文介绍。

2.3.2 定义链接库

汪处长几个你望望我我望望你,不知道是说了好还是不说了好。这样耽误有时,刚才打周教授的日本兵就火了,说八嘎,不说死啦死啦的。

以https://fedspendingtransparency.github.io/data-model/网页上2017年第2季度的实例文档为例,文档包含了AppropriationsAccountPackage.xbrl、AwardPackage.xbrl、FinancialAccountPackage.xbrl三个文件,从消费者使用的角度进行分类,图4为拨款账户包里c-01账户的信息。

数据标准定义了报告提交规范[18](Reporting Submission Specification,RSS)为联邦机构提供提交指导,是一个针对机构提交内容的人类可读数据标准。

(1)文件内容

从图2可以看出,提交文件包含A,B,C和FABS四个文件,RSS对这些文件包含的具体数据元素及每个数据元素的具体属性进行了详细介绍。以A文件为例,详见表2。

热熔焊接操作人员应集中培训,考试合格后方能上岗操作,确保接口成功率。建立严格的施工记录签证制度,现场接口编号记录,责任到人,增强全员质量意识。连接好的管道,经目视检查合格后应及时埋设,减少在外界暴露的时间,确保管道使用寿命。

表2 A 文件包含的数据元素

表2第一列Element Number将文件与前文介绍的六大数据标准的数据元素联系起来,从该列可以看出,表中的所有元素均来自Account Level数据标准。另外,如前所述,文件中的数据元素并不直接对应数据标准中的57个数据元素,而是对应其属性,元素编号后有后缀,如51(A)。后缀“_FYB”和“_CPE”表示获取的数据是财政年度开始还是当期结束,表明该元素取值有日期上下限。

(2)文件提交要求

在提交格式方面,RSS规定采用四个独立的CSV或TXT格式文件提交, 四个文件分别对应于文件A,B,C,FABS的具体信息,其中A,B,C三个文件每个季度提交一次;FABS文件每月至少提交两次。文件格式及内容要求包括:①所有值都使用逗号或竖线分隔;每一行的值由换行符分隔。②标题行:即文件的第一行包含该类型文件(A,B,C,FABS)的所有数据元素名称列表,这个列表的元素名称必须与该类型文件在RSS中的数据元素匹配,顺序可以任意。注意,即使是可选元素,机构不填写也必须在标题行提供。③内容行:每行必须包含与标题行相同数量的逗号或竖线分隔的数据元素值,数据值必须采用与标题行相同的顺序。数值类型元素的值不能是空白,但可以是零,可选元素的值可能是空白的。

2.2.2 接口定义文件IDD

接口定义文件[19](Interface Definition Document,IDD)提供了如何提取数据,是一个从外部数据源提取内容的人类可读数据标准。《数据法案》代理每个季度将奖项,分级奖项,获奖者属性提取到D1到F的文件:D1文件来源为FPDS;D2文件来源为ASP;E文件来源为SAM;F文件来源为FSRS。D1和D2主要提取提交机构和机构指定日期的奖项数据;E提取D1和D2文件中的最高补偿官员信息;F文件提取D1和D2文件中奖项相关的分级奖项数据。IDD也采用了表1中的元数据属性对每个文件的数据元素进行说明,支持利用元数据来理解从采购系统和财务资助系统提取的数据。

2.3 数据标准的机器可读版本XBRL

《数据法案》的数据标准同时提供了人类可读版本和机器可读版本。财政部和行政管理预算局确定将可扩展商业报告语言XBRL(eXtensible Business Reporting Language)作为联邦政府数据标准机器可读的版本。XBRL[20]是将会计准则与计算机语言相结合,用于财务信息交换的国际公认标准;通过数据统一为其他软件提供数据源,实现一次录入、多次使用。数据标准的机器可读版本XBRL[21]的分类标准结构如图3所示。

高校中涉及专业性强的校园特色活动缺乏专业教师的指导。现阶段,高校绝大多数文体活动都是由一些社团承办,而高校的社团组织庞大,高校很难为每个社团都配备指导教师,社团学生的流动性和开展活动的随意性很强,这就导致有的文体活动水平和层次不高,难以从本质上难得到提升。

图3 数据标准机器可读版本XBRL的分类标准结构

XBRL分类标准包括模式文件和链接库文件[22](标签链接库、引用链接库、展示链接库、定义链接库)。标签链接库是元素的人类可读的描述标签,此处用于数据元素标签属性定义。引用链接库为元素提供参考信息,从图3看出,这里有三个引用链接库,分别提供了57个元素类及其对应属性、元素与外部系统(图2中的FSRS,FPDS,ASP)之间的映射关系、数据元素的具体属性值(表1第1列)信息。展示链接库表达元素之间的层次关系,这里包含提交抽取和消费者两类;定义链接库对元素的其他关系加以说明,在DAIMS中用于维度定义。下面简单介绍一下数据标准机器可读版本XBRL的定义。

采用报废地磅台为基础,无需在场地上施工基础,也就不需要在煤场现在加工安装装置,节省了安装时间,减少了对煤场筛分的影响。

Level 1:领域级

图3中椭圆代表了模式文件,一共有六个模式文件,最核心的是core。daims_core_v1.2_2017-12-22(简称core)文件包含了DAIMS具体数据元素的定义,例如:

提升电视台记者专业素质的策略有很多,此处提到:电视台记者要提高自己的政治素养;要不断提高科学文化素养;要充分利用科学技术;要对电视台节目严格把关,保证信息质量等。接下来,笔者将针对上述提到的几点,展开较为详细的论述:

其中,name为元素名称。type为元素类型,取值为模式文件types中定义的类型。该文件定义了83种数据类型,包括枚举值的定义,保证XBRL报道的事实取自一个预定义的值集;规范值输入,提高数据的一致性和可比性。substitutionGroup替代组属性,表明该元素是数据项item、元组tuple(联合数据项)还是部分parts(用于引用链接库),模式文件parts用于部分元素定义(如表1中第1列属性)。id是计算机易于识别的名字。xbrli:periodType为时间类型属性,表明元素值存在于某个期间duration还是具体时点instant。此处还省略了一个属性abstract,用于标识元素为抽象元素还是具体元素,默认值false表示具体元素,此时该属性可省略不写,抽象元素不是数据标准中的数据元素,不需要赋值,不会出现在实例文档中,其存在的目的是为了满足展示链接库表达元素层次关系和维度定义的需要,如award_dates_heading。抽象元素的存在导致XBRL定义的元素个数569并不等于A-F八个文件元素个数之和565(图3包含具体元素个数),另外A-F文件中有重复的数据元素,XBRL定义时不需重复定义。

验证阶段:《数据法案》代理对文件A,B,C进行字段级验证;然后对文件A到D执行跨文件验证;最后进行机构验证数据,通过验证后放到公共网站和数据库。

daims_package_v1.2_2017-12-22_def是DAIMS维度定义。维度[22]是对数据采取切片、切块和旋转等方式分析数据,使用户能够从多角度、多侧面地观察数据,进而深入了解数据所包含的信息及内涵,类似于数据透视表。DAIMS维度根据消费者在拨款账户、财务账户和奖项三个方面的需求,建立相应的维度,Appropriations Account下建立了一个基础数据项拨款账户、一个维度拨款账户,域包括账户信息和金额信息两个;Financial Account下建立了一个基础数据项、一个维度,域包括项目活动对象类、账户信息和金额信息三个;Award下建立了四个基础数据项:奖项机构、地理位置、奖项及获奖者属性(财务资助)、奖项及获奖者属性(采购),四个维度:奖项识别维度、位置维度、财务资助奖项维度、采购奖项维度,后三个基础数据项各有两个维度并共享奖项识别维度。以Award下的财务资助奖项维度信息为例,从维度术语对表3进行分析:①基础数据项即要分析的项目如财务资助奖项;②超立方体是维度的集合,如财务资助超立方体包含两个维度奖项识别by_award_identifiers_entry_id_dimension和财务资助奖项by_financial_assistance_awards_dimension;③维度是描述基础数据项的一个侧面或角度,如奖项识别维度;④域是描述一个维度所形成的集合,如奖项识别维度下的域有5个,包含奖项活动、奖项日期、奖项机构、资助机构、接受者属性;财务资助维度下的域为财务资助属性域financial_assistance_attributes_heading;⑤域成员是具体的域信息,在DAIMS中对应数据元素,如财务资助属性域的域成员:联邦国内资助目录号码cfda_number、记录类型record_type,对应文件D2的具体元素。

3 数据标准实施指南

DAIMS元数据将带来以下好处:允许资源发现——通过相关标准将相似资源聚集在一起,区分不同的资源,并提供位置;互操作性——可被机器和人类理解,实现跨库搜索;数字识别——提供持久的标识符;归档和保存——实现数据对象溯源,从起源到如何被修改,详细记录其行为。

表3 数据标准中的维度定义

同时,为了提高使用数据标准生成的联邦支出数据集的创新应用,美国开放数据研究组织数据基金会在2016年5月、2016年9月和2017年6月[23]举行了三次《数据法案》培训活动。美国财政部也发布了一系列的分析工具来帮助机构和公众了解联邦支出数据集,如数据库快照和API功能。数据库快照通过亚马逊关系数据库服务RDS(Relational Database Service)为用户提供了联邦支出数据库及其使用步骤,该数据库每周更新[24],联邦支出的GitHub API库包括使用RDS数据库快照结构的Python模型[25]以及利用该数据库的API源代码。API页面https://api.usaspending.gov/则为用户提供了入门教程和当前可用的端点,用户可学习并利用数据创建新的应用或服务。另外,财政部托管在GitHub上的新数据实验室(见网址:https://datalab.usaspending.gov/)提供了联邦账户、承包商、支出分类和政府工作强大的可视化,可免费获取源代码。

4 数据标准实施效果

根据《数据法案》的要求,2017年5月9日所有机构都必须使用政府数据标准报告它们的支出数据,截至目前已经执行了一年多,以下是网站USAspending.gov上的实施效果。

4.1 原始数据提交情况

登录https://www.usaspending.gov/#/网站,点击网页上Agency Submission Files下的Download Raw Files按钮,可看到机构提交的原始文件,根据RSS要求提交文件分成两类Raw Financial Assistance Files和Raw Quarterly DATA Act Files,分别对应于前文所述的FABS和A,B,C,D1,D2,E,F。

Raw Financial Assistance Files下的FABS提交文件按照年度、机构、月份逐层管理,进入月份可看到机构提交的文件,当前网站包含了2017年11月份至今的文件,文件格式均为csv,下载文件查看其内容包含了FABS文件的所有元素,并且每个机构提交的FABS文件均采用了相同的格式和数据元素,方便用户进行相应的数据比较。Raw Quarterly DATA Act Files下的A,B,C,D1,D2,E,F文件是按年度、季度、机构逐层管理,选择具体季度,可看到按机构排序的文件,每个机构包含了上述七个文件和一个提交说明,当前网站包含了2017年第二季度Q2至2018年第一季度的文件。

根据《数据法案》要求,2018年5月9日前财政部和行政管理预算局提供免费下载功能,从上述过程可以看出,当前提交的文件已经实现了下载功能。

4.2 XBRL实例文档

XBRL实例文档是通过引入分类标准模式文件中的元素,根据真实数据对元素进行赋值而生成。

2.2.1 报告提交规范RSS

模板的创建与创建新文档一样,设置好样式后,选择“文件”菜单中的“另存为”,在打开的“另存为”的对话框“保存类型”中选择“Word模板”类型文件,就可创建新模板(扩展名为.docx)。

daims-core命名空间为http://www.treasury.gov/DAIMS/v1.2/2017-12-22/core,daims-core:treasury_account_identifier为模式文件core中定义的数据元素财务账户符号。contextRef为自定义的上下文,此处表示具体的拨款账户c-01,以区分不同账户相同元素的赋值。unitRef指定数值型数据项的度量单位,u-pure在文件前面定义,表示没有度量单位的纯数字,decimals表示小数位数,此处为0。图4共定义了15个数据元素的具体信息,包括财务账户符号1580、财务账户标签011X0082、分配机构代码020、可用类型代码X表示无限期承担义务、主账号0082、子账号000、拨款给非洲开发银行、报告机构代码011、名称为总统行政办公室、主管组织08、财务报告实体名字为财政部、功能代码150、描述为国际事务、子功能代码151、描述为国际发展和人道主义援助。

图4 拨款账户包XBRL实例文档账户c-01的具体信息

借助于XBRL,网站提供了丰富的可视化、多维度分析以及向下钻取功能。以图4中的联邦为例,其钻取路径为:机构——账户——项目活动——对象类,探索过程可视化显示并可随时返回任一层,方便用户详细了解一项支出的来龙去脉。

爆珠工艺生产线废水含10000mg/L的高浓度石蜡油,因此,需进行预处理除油后,方可与其他2种废水混合。油墨清洗废水色度重,需混凝预处理脱色后与其他2种废水混合。

图5 USAspending.gov…Contracts…and…Purchases 元数据文件定义

4.3 与 Data.Gov 对接

2013年开始,美国政府开放数据网站Data.gov以“目录聚合”的方式从外部网站采集元数据聚合到Data.gov上,使得用户能够“一站式”浏览全国范围内的所有开放数据集[26]。在Data.Gov上可以找到两个支出相关的数据集USAspending.gov Contracts and Purchases[27]和USAspending.gov Grants and Loans[28],点击两个数据集页面上下载资源处的按钮,均进入USAspending.gov网站的定制奖项数据页面[29],实现了两个网站之间的关联。

同时,每个数据集都提供了元数据文件Data.json,图5为USAspending.gov Contracts and Purchases元数据文件定义。

4.防护措施落实依从性低:随医院船、卫生运输船等执行保障任务时,伤员转运为集体换乘,伤员呈批量处理,流水式作业方式,这使得工作节奏紧张。工作忙乱和危急情况下防护措施落实差,操作动作随意,如不戴手套接触污染物(检验化学试剂粘染),不抓住针柄拔针,操作完毕不及时处置废弃物,医疗废物二次分拣等。甚至医务人员因个体原因对防护用具有排斥心理,如医生反映的戴护目镜造成视野有死角,镜片模糊、头晕等,这会造成防护措施落实依从性低。

文件类型为json,JSON语法采用键值对形式,图5中加粗部分如@type、accessLevel、bureauCode等为键,冒号后面对应其值。该定义提供了数据集的数据类型、访问级别、数据更新频率、发布部门代码、联系人及Email、描述信息(机构支出信息,允许访问网站USAspending.gov包含的数据)、访问URL、下载URL、数据集标识符、发布时间、关键字、修改时间、定位页面、发布者及上级组织、数据集名称。

同时,Data.gov还提供了溯源元数据(provenance metadata)描述该数据集的来源,属性包括Metadata Context、Metadata Catalog ID、Harvest Object Id、Harvest Source Id、Harvest Source Title等,具体解释可参见文献[26]

5 对我国的启示

美国政府支出数据标准是为满足联邦支出数据开放要求而构建的,《数据法案愿景和价值》[30]描述了它的价值:通过访问一个统一的联邦支出数据集,公民、机构、监管机构和接受者都将获得短期、中期和长期收益,公民可详细了解政府支出,获得更好的服务;机构可简化报告过程并利用标准实现机构内的信息共享,提高内部管理效率;监管机构可以分析和洞察支出类别,打击欺诈、浪费和滥用;接受者可了解竞争对手,同时消除合规成本。我国可借鉴美国政府支出数据标准的构建经验,可着重从以下几方面的启示入手,建立相关领域的数据标准。

5.1 采用基于共识的方法构建数据标准

标准构建是一个复杂的过程,需要多方协作。DAIMS的构建就采用了基于共识的方法[31],财政部DAIMS模式团队管理不同来源的变更请求,包括数据法案项目管理办公室、行政管理预算局、USAspending.gov网站团队、机构和公众,通过工作组会议、周期性反馈、与机构代表的定期会议建立共识。我国在建设数据标准的过程中也应广泛听取各方意见,建立沟通和反馈的渠道,以提高数据标准的质量和可用性。

5.2 建立与行业标准相协调的数据标准

作为一个与行业数据标准化最佳实践相协调的美国政府标准,数据标准DAIMS利用并符合以下联邦指导和架构[10]:XBRL、美国联邦企业架构(U.S. Federal Enterprise Architecture,FEA)[32]、联邦参与的自愿开发和使用共识标准符合性评估活动政策——OMB通告NO.A-119修订版[33]、OMB备忘录M-13-13。我国在制定数据标准时,也应充分考虑现行业标准,建立与行业标准相协调的数据标准,提高数据标准的兼容性和可用性。

5.3 设计机器可读的数据标准

美国《数据法案》的数据标准同时提供了人类可读和机器可读版本,机器可读版本XBRL为实现数据的自动处理奠定了基础,同时满足了数据可视化显示和比较分析的要求,提高了信息透明度。我国从2002年开始对XBRL标准进行研究,2004年上海证券交易所开始XBRL报告试点,自2008年报开始,上交所要求所有上市公司提交XBRL报告,并在其网站[34]上披露供使用者分析。2005年2月深圳证券交易所启动XBRL试点,2009年2月深交所要求所有上市公司采用XBRL实例文档呈报年报[35]。由此可见,我国在XBRL使用方面已经卓有成效,但是目前我国的 XBRL 技术主要用于企业,政府尚未使用。因此,我国政府应该学习数据标准DAIMS的XBRL构建经验,结合我国企业应用 XBRL 的实践经验,推动XBRL 在我国政府数据标准构建中的应用。

5.4 建立永久的数据标准管理机构

美国《数据法案2022》[36]报告提出:DAIMS缺少一个永久的管理机构。财政部和行政管理预算局只负责根据数据法案的要求开发和实现数据标准,但它们缺少永久管理DAIMS所需的资源,无法确保DAIMS在未来应用的灵活性和稳定性。如果DAIMS被扩大到州和地方支出甚至国际支出,将远远超出这些机构的司法管辖区。因此,报告建议联邦政府应考虑长期建立一个独立的非营利组织维护数据标准。我国在建立数据标准时也应考虑标准管理机构问题,避免标准在后期的执行中出现问题。

6 结语

美国政府已经认识到数据标准的重要性,并在《数据法案》中增加了强大的数据标准授权立法。我国学术界已经开始了这方面的研究,翟军等综合分析了高价值数据开放的先进经验,提出了4阶段数据发布流程,指出在数据发布阶段应提供数据字典、元数据记录、机器可读格式[37]。黄如花等基于数据生命周期视角提出我国政府数据开放在数据创建采集、组织处理、存储发布、发现获取、增值评价阶段的障碍,指出在数据组织处理阶段,应根据一定的标准,对数据类目、元数据元素、数据格式等加以规范[38]。马海群等指出我国政府开放数据没有统一的标准,信息孤岛、数据口径不同和格式多样阻碍了数据共享,建议制定数据表示标准、数据采集标准、行业大数据应用标准等多个标准[39]。具体实践方面,我国近20个地方政府开放数据网站已上线[40],国家统一数据门户网站www.data.gov.cn也在建设中[41],但目前尚未关注开放数据的数据标准建设,而政府开放数据的质量问题日益凸显,工信部印发的《大数据产业发展规划(2016—2020年)》指出我国大数据产业存在“数据质量不高,数据资源流通不畅,管理能力弱,数据价值难以被有效挖掘利用”的问题,并提出加快推进工业大数据等重点应用领域相关国家标准的研制[42]。随着我国开放数据的深入发展,开发数据标准将是一个十分必要且紧迫的课题。

(来稿时间:2018年12月)

参考文献:

1. Open Budget Survey 2017[EB/OL].[2018-01-01].https://www.internationalbudget.org/ wp-content/ uploads/ open-budget-survey-2017-report-english.pdf.

2. Cabinet Office. G8 Open Data Charter and Technical Annex[EB/OL]. [2015-10-27]. http://www.gov.uk/government/publications/opendata-charter/g8-open-data-charter-and-technical-annex.

3. United States Third National Action Plan 2015-2017[EB/OL].[2013-06-18]. https://www.opengovpartnership.org/documents/unitedstates-third-national-action-plan-2015-2017.

4. DIGITAL ACCOUNTABILITY AND TRANSPARENCY ACT OF 2014[EB/OL].[2014-05-09]. https://www.congress.gov/113/plaws/publ101/PLAW-113publ101.pdf.

5. Open Data Policy--Managing Information as an Asset[EB/OL].[2013-05-09].https://obamawhitehouse.archives.gov/sites/default/files/omb/memoranda/ 2013/m-13-13.pdf.

6. Alison Gill, Hudson Hollister, Adam Hughes. THE STATE OF THE UNION OF OPEN DATA[EB/OL].[2016-11-10]. http://www.datafoundation.org/state-of-the-union-of-open-data-2016/.

7. OGP. Aligning Supply and Demand for Better Governance:Open Data in the Open Government Partnership[EB/OL].[2015-10-10].http://www.opengovpartnership.org/irm/irm-reports.

8. 审计署审计科研所.美国《数据法案》对我国财政支出公开及审计工作的启示[EB/OL].[2015-10-10].http://www.audit.gov.cn/n6/n39/n63/c77142/content.html.

9. 朱琳,张鑫.美国政府数据开放政策与实践研究[J].情报杂志,2017, 36(4):98-105, 176.

10. DATA Act Information Model Schema (DAIMS)Architecture[EB/OL].[2017-09-22].https://fedspendingtransparency.github.io/assets/docs/DAIMS_Architecture.pdf.

11. Federal Spending Data Elements[EB/OL].[2017-12-22].https://fedspendingtransparency.github.io/data-elements/.

12. Elements: Appropriations Account, Agency, Treasury Account Symbol (excluding sub-account) [EB/OL].[2017-12-22].https://fedspendingtransparency.github.io/whitepapers/approp-agency-tas/.

13. DATA Act Information Model Schema Data Dictionary v1.2[EB/OL].[2017-12-22].https://fedspendingtransparency.github.io/dictionary-v1.2/.

14. ISO/IEC 11179-3[EB/OL].[2013-02-15].http://standards.iso.org/ittf/PubliclyAvailableStandards/c050340_ISO_IEC_11179-3_2013.zip.

15. ISO/IEC 11179-4[EB/OL].[2004-07-15].http://standards.iso.org/ittf/PubliclyAvailableStandards/c035346_ISO_IEC_11179-4_2004(E).zip.

16. ISO/IEC 11179-5[EB/OL].[2015-04-01].http://standards.iso.org/ittf/PubliclyAvailableStandards/c060341_ISO_IEC_11179-5_2015.zip.

17. DAIMS Information Flow[EB/OL].[2017-12-22].https://fedspendingtransparency. github.io/DAIMS-v1.2/.

18. Reporting Submission Specification[EB/OL]. [2017-12-22].https://fedspendingtransparency.github.io/assets/docs/DAIMS_RSS_v1.2.xlsx.

19. Interface Definition Document[EB/OL]. [2017-12-22]. https://fedspendingtransparency.github.io/assets/docs/DAIMS_IDD_v1.2.xlsx.

20. The business reporting standard XBRL[EB/OL].[2017-12-22].https://www.xbrl.org/.

21. XBRL Schema and Data Files[EB/OL].[2017-12-22].https://fedspendingtransparency.github.io/assets/docs/daims_v1.2_2017-12-22.zip.

22. 张天西,李晓荣,吴忠生,等. XBRL财务报告:理论、规范及应用[M].北京:经济科学出版社, 2010:171-184.

23. DATA Act Training[EB/OL].[2017-12-22].http://www.datafoundation.org/data-act-training-june-2017/.

24. USAspending.gov database[EB/OL].[2017-12-22].https://amazonaws-china.com/cn/public-datasets/usaspending/.

25. Fedspendingtransparency/usaspending-api[EB/OL].[2017-12-22].https://github.com/fedspendingtransparency/usaspending-api.

26. 于梦月,翟军,林岩,等.美国政府开放数据的元数据标准及其启示:目录聚合的视角[J].情报杂志,2017, 36(12):145-151.

27. USAspending.gov Contracts and Purchases[EB/OL].[2017-12-22].https://catalog.data.gov/dataset/usaspending-gov-contractsand-purchases-a7059.

28. USAspending.gov Grants and Loans[EB/OL].[2017-12-22].https://catalog.data.gov/dataset/usaspending-gov-grants-and-loans-89a71.

29. Custom Award Data[EB/OL].[2017-12-22].https://www.usaspending.gov/#/download_center/ custom_award_data.

30. Data Foundation and MorganFranklin Consulting:The DATA Act: Vision & Value[EB/OL].[2016-07-15]. http://www.datafoundation.org/data-act-vision-and-value-report/.

31. DATA Act Information Model Schema (DAIMS) Overview[EB/OL].[2017-09-22].https://fedspendingtransparency.github.io/assets/docs/DAIMS_Overview.pdf.

32. The Common Approach to Federal Enterprise Architecture[EB/OL].[2012-05-02].http://obamawhitehouse.archives.gov/sites/default/files/omb/assets/egov_docs/common_approach_to_federal_ea.pdf.

33. OMB Circular No. A-119 Revised[EB/OL].[2016-01-22].https://www.nist.gov/sites/default/files/revised_circular_a-119_as_of_01-22-2016.pdf.

34. 上海证券交易所—上市公司XBRL[EB/OL].[2017-12-22].http://listxbrl.sse.com.cn/.

35. 深圳证券交易所—XBRL互动平台咨询系统[EB/OL].[2017-12-22].http://xbrl.cninfo.com.cn/.

36. Data Foundation and Deloitte. DATA Act 2022:Changing Technology, Changing Culture[EB/OL]. [2017-05-12]. http://www.datafoundation.org/data-act-2022/.

37. 翟军,李晓彤,林岩.开放数据背景下政府高价值数据研究——数据供给的视角[J].图书馆学研究,2017(12):76-84, 54.

38.黄如花,赖彤.数据生命周期视角下我国政府数据开放的障碍研究[J].情报理论与实践,2018, 41(2):7-13.

39. 马海群,江尚谦.我国政府数据开放的共享机制研究[J].图书情报研究,2018, 11(1):3-11.

40. 曹雨佳. 政府开放数据生存状态:来自我国19个地方政府的调查报告[J].图书情报工作, 2016, 60(14):94-101.

41. 国务院办公厅关于印发政务信息系统整合共享实施方案的通知[EB/OL]. [2017-05-18]. http://www.gov.cn/zhengce/content/2017-05/18/content_5194971.htm.

42. 工业和信息化部.大数据产业发展规划(2016-2020年)[EB/OL].[2017-01-17].http://www.miit.gov.cn/n1146295/n1652858/n1652930/n3757016/c5464999/content.html.

Enlightenment of Government Spending Data Standards in the United States under Open Data

Li Hongqin1,2 Zhai Jun1 Zou Shuyi1
( 1.School of Maritime Economics and Management of Dalian Maritime University; 2. Accounting Institute, Shandong Technology and Business University )

〔Abstract〕 The requires of DATA Act to open spending data of the federal agencies as the main line, DATA Act Information Model Schema is used as the analysis object, from domains, components, elements and meta data levels to de fine the data dictionary of data standards, data collection and creation process, machine readable standard XBRL and effect in USA Spending.The United States has formed a comparatively complete federal spending data standards that are an indispensable first step in open data. For our country,developing data standards will be a very necessary and urgent issue. We should summarize the US open spending data and application results in order to provide reference for the development of China’s data standards.

〔Keywords〕 Digital Accountability and Transparency Act Data standards DAIMS Meta data XBRL

〔中图法分类号〕 G253

〔引用本文 格式〕 李红芹,翟军,邹书怡.开放数据背景下美国政府支出数据标准的启示[J].图书馆,2019(8):029—038.

* 本文系教育部人文社会科学研究规划基金项目“国家大数据战略下的政府开放数据的目录体系构建研究”(项目编号:17YJAZH115)研究成果之一。

〔作者简介〕 李红芹(1979—),女,大连海事大学管理科学与工程博士研究生,山东工商学院讲师,研究方向:关联数据与开放数据;翟军(1969—),男,大连海事大学教授、博士生导师,研究方向:开放数据;邹书怡(1991—),女,大连海事大学工程管理硕士研究生,研究方向:开放数据标准。

标签:;  ;  ;  ;  ;  ;  ;  

开放数据背景下美国政府支出数据标准的启示论文
下载Doc文档

猜你喜欢