新闻出版业大数据体系构建论文

新闻出版业大数据体系构建论文

新闻出版业大数据体系构建

张佳倩 北京印刷学院

摘要: 大数据技术的发展和应用重构了内容生产、制作和传播的方式,改变了新闻出版业传统的出版模式和发展方式。在当前我国新闻出版业转型升级的过程中,应加快新闻出版业大数据体系建设,推动其个性化、智能化、数据化发展。本文从实际问题出发,提出构建新闻出版业集数据生产、标引、计算统计、建模和服务为一体的大数据体系,并注意数据安全和数据型人才队伍建设,推动新闻出版业转型发展。

关键词: 新闻出版业;大数据;数据服务

一、引言

近年来,我国信息化发展水平日渐提高,对数据资源的开发和利用也不断深化,社会各领域的数据量呈现出前所未有的爆炸式增长。自“大数据”概念出现以来,大数据行业得到的国家政策的大力支持。“十三五”期间新闻出版广电总局将深入贯彻落实《十三五规划纲要》,逐步建立起新闻出版大数据体系,以支撑国家数据强国的建设和发展[1]

在大数据蓬勃发展的时代,我国传统出版业正在经历前所未有的挑战与变革。大数据技术正渗透出版业中的各个环节,改变了人们传统的思维习惯和行为模式,

水资源是一切生物赖以生存的必然物质。一些施工单位为了节省成本,往往在资材优劣、多寡上做文章,殊不知给工程质量和后期养护带来忧患和不便。据我们多年来的实践和调查显示,岩石边坡的生态恢复工程中,6-40g/m2施用的保水材料和黏结剂,成本0.2-1.2元,较没有施用的出苗率高14%-60%,无垮塌,植物生长发育良好,第一年养护最多浇水3遍(如内蒙、贵州等环境恶劣地区),第二年基本不用管理,养护成本较对照节省19%-43%.相反,在调查的17家在施工时没有添加保水和粘结材料的单位了解到,因为水土流失造成坍塌返工的9家,占53%;因为干旱浇灌不及时出苗不匀修补的13家,占76%.

大数据技术为内容生产,数字出版,知识服务、行为营销等方面提供了转型思路,助力传统出版业向智能化的方向转型[2]。我国出版行业处于重要的数字化转型阶段,应积极响应国家政策,加强出版行业大数据的体系建设。

二、大数据体系构建

就新闻出版行业而言,大数据体系的建构是一个集数据采集、标引、计算统计、建模、服务于一体的数据体系。新闻出版大数据体系的构建应整合各方数据资源,通过数据计算统计将处理后的二次数据应用于新闻出版业的个性化、智能化、数据化服务,助力传统出版业的转型升级。

(一)数据采集

在对海量数据进行采集和标引之后,便需要对数据进行云计算处理,处理的结果就是产生了可用于参考及应用的二次数据。利用云计算技术通过互联网来提供动态、易扩展、虚拟化的信息资源,并将海量用网络连接的资源统一管理和调度,构成一个数据资源池向不同需求的用户提供不同的服务[5]

将缓冲器轴向力减去阻尼力,获得气弹力和摩擦力;绘制“缓冲系统行程—气弹力和摩擦力”曲线,与静压曲线进行对比,根据两条曲线的差异情况确定起落架缓冲功能是否异常,如果异常,根据异常出现的起始点确认异常时的缓冲器行程,并记录起落架载荷。

数据建模根据不同的应用范围可分为学科体系建模和行业应用建模。其中,学科体系建模依赖于现有的学科体系,有着相对成熟的理论知识体系,可以根据数据的相关关系和内在模型,选择合理的方案进行大数据模型构建;行业应用建模,应用的范围涉及到社会的方方面面,需明晰社会各行各业的基础现状,深入把握各个行业和职业的工作流程、业务范围的特点和规律,并针对用户特定的需求构建相应的大数据模型[6]

(二)数据标引

2.智能化出版流程

(三)数据计算统计

1.云计算

仅缓存DNS服务器在一些局域网办公环境中也是很常用的,它能有效的加速本地局域网内的DNS查询请求并节省网络带宽。本文在阐明相关技术原理的基础上实践配置了一个DNS缓存服务器。

新闻出版业生产和使用的数据类型包括内容数据、用户数据、市场数据和交互数据等多种形态。出版业的核心业务是为社会提供有价值的内容供给,出版机构则是内容的创造者与生产者。我国出版机构在长期经营发展的过程中积累了体量庞大、权威专业的内容资源,在出版业转型升级的过程中,部分内容资源经过数字化和碎片化的生产转化为内容数据,为大数据应用提供了丰富的内容资源。在互联网背景下,传统内容消费者同时也转变为内容的生产者,用户在消费内容的同时也会产生海量的“用户生产内容”,这些用户数据内容丰富、形式多样、时效性强,明确精准地体现了用户特征与需求,是内容创作的源泉[3]。出版业在日常运营的过程中所产生的市场数据和交互数据经过数据汇聚与分析可以支撑和指导在生产与运营,协助出版机构做出科学决策。

新闻出版机构运用大数据技术,整合从不同渠道获得的数据资源,进行数字化整理之后在知识服务平台中为用户提供检索和阅读、热点分析、知识关联分析、数据挖掘分析等服务,构建知识图谱,为用户提供知识化、数字化、智能化服务。同时大数据也使得数字出版知识服务更加个性化。新闻出版机构可以利用大数据掌握用户的搜索、浏览等所有终端行为,精准的掌握用户需求规律,分析用户的知识需求以提供个性化的定制方案[6]

在经历了数据的采集、标引、统计、建模等环节后,便可为目标用户提供丰富多彩的大数据服务。在新闻出版业转型升级的过程中,大数据技应用可以推动出版机构从内容出版到知识服务的转型,出版流程由人工到智能化的转型,业务驱动到数据驱动的转型,提高新闻出版机构的管理效率,同时为社会提供丰富的内容资源和优质的知识信息服务,加快国家的文化建设[5]

(四)数据建模

但是,我国出版业数据体系不健全,行业内数据缺乏衔接,数据孤岛现象严重,上下游企业缺乏数据共享机制以及数据标准不统一从而造成数据流通不畅。行业内数据资产管理意识不高,不能充分认识和利用数据价值。另外,出版行业内与行业外的数据未能实现交换,大量的用户数据被掌握在移动阅读与知识服务等网络运营服务平台或者图书销售网络平台手中,出版机构与终端用户的联系被屏蔽,难以衡量其出版服务的效果与质量,使其无法做出真正基于用户需求的科学决策。因此,针对于出版业存在的数据资源问题,出版业应建立统一规范化的数据采集标准,建立大数据采集平台,纳入行业数据强化规范自身数据管理,纳入相关签约作者数据和出版机构日常运营中的市场与交互数据实现行业上下游之间的数据共享,并与移动阅读与知识服务网络运营服务平台和图书销售网络平台协调合理化的数据交换模式获取用户数据,为大数据分析与应用提供丰富全面的数据资源,提高大数据应用的准确性与时效性。

伴CNS炎性脱髓鞘的原发性干燥综合征8例临床分析 … ……………………… 李晖,李昌茂,张斌,等 134

(五)数据服务

虽然计算机技术不断发展使得统计数据的搜集、处理、分析、存贮、传递、印制等过程日益现代化,提高了统计工作的效能,但是计算统计无法厘清数据所反映复杂的规律、判断未来发展趋势以提出决策方案。标引和计算后的数据需要进行统计学分析,把数据中的不确定性进行量化,从数据中把信息和规律提取出来,找出最优化的方案。

1.个性化知识服务

8.来稿须附所有作者的工作单位、所在省市名、邮政编码、E-mail、联系电话。论文如属科研基金资助项目,应在稿件首页地脚处注明“基金项目:××课题或项目 (编号:××××)”,并附基金证书复印件。页脚处请附上第一作者、通信作者简介(包括性别、出生年份、学位、职称、研究方向、电子邮箱)。

2.统计学分析

在进行海量数据的采集之后,出版机构要对所获数据进行加工标引工作。数据标引是实现大数据应用的基础,同时对大数据在自然科学领域和社会科学领域发挥预测、预警作用,实现数据创新具有关键作用[4]。对出版行业而言,数据标引主要侧重于知识标引和行业应用标引,知识标引适用于学科研究,行业应用标引适用于国民经济各行业的应用,为开展知识服务奠定基础。

在新闻出版业转型的过程中,大数据技术可推动出版流程的智能化改造。在选题策划方面,出版机构基于海量的数据资源,通过数据挖掘可以根据网络热点词汇传播图谱,结合情感分析,用户偏好分析等数据分析结果,预测出受读者欢迎的选题方案[7]。出版业利用大数据平台中的丰富数据资源进行营销分析,分析挖掘行为数据,深刻了解读者的阅读需求,然后针对目标市场进行精准定位,对不同性别、年龄、收入和不同受教育程度的读者制定不同的营销方案,进行精准化营销。

3.数据化专业决策

就新闻出版业而言,传统的选题策划依赖于编辑人员的经验,难免在信息的筛选上受主观色彩的影响,做出非完全理性的判断,顾此失彼。在大数据的协同帮助下,编辑只需要设定自己的偏好和想法,通过海量数据的运算、筛选与匹配,与作者的资源相匹配,迅速定位目标读者人群,帮助编辑制定更加科学的策划方案。在图书营销决策方面,出版机构可以根据用户自身的数据与行为数据进行影响力分析,直接对接目标读者进行可视化的呈现与推荐,从而实现产品与服务的全面数据化,利用数据化决策提升运营效率[8],减少环境带来的不确定性,推动出版行业转型升级。

三、新闻出版业大数据体系建设应当注意的问题

(一)重视数据安全

随着大数据技术的迅速发展,数据体量规模呈爆炸式的增长趋势,信息开放程度进一步扩大,数据的安全性逐渐受到了人们的重视,出版机构在加快自身大数据应用建设的同时也要重视用户隐私数据和自身数据的安全。出版机构可以从技术和管理方面采取措施提高数据的安全防护。在技术层面,根据数据的保密等级和使用需求,对不同的用户设置不同的访问权限。不断提高大数据的安全防护技术,及时发现安全隐患,有效遏制数据泄露。在管理层面,出版行业应建立规范健全的数据安全保护机制,对大数据的使用过程进行规范和监督[9]

在这一组例子中,a句单用的时候,都不可接受,因为谓语部分是形容词(漂亮)或者名词(头发),属于没有定语的简单谓语,而且只对场景中的单一对象进行描写,不符合描写语体的凸显原则。b句可接受,是因为谓语部分得到了定语(很、一头)的修饰,符合强凸显原则;而c句是在对举句中出现,是对场景中的两个点进行描写,可以弱凸显。

(二)加快数据型人才队伍建设

在转型升级的过程中,出版业面临着巨大的经营压力与业务挑战,各出版机构应该改变原有的人才结构,加快数据开发型人才队伍建设,实现从传统编辑人才到数据开发型人才储备的转型。在出版业中,利用大数据技术和人工智能就可以实现准确高效的校对、排版、销售等工作,因此对传统编辑人员的需求减少,对从事数据管理、数据开发和数据分析的人才需求迅速增加[10]。着力加快出版业数据型人才队伍建设,有利于促进出版企业的数字化建设,推动出版业向数字化、智能化发展,提高出版业的总体效能。

四、结语

我国传统出版业处在数字化转型的进程中,新闻出版机构应在内容、阅读、营销、管理等方面逐步实现“数据化”运作,加快建立出版业大数据体系。在新闻出版机构中建立起统一的数据标准、构建统一的数据共享平台,经过数据采集、数据标引、数据计算统计、数据建模等处理后提供数据服务,提高新闻出版机构的生产效率、优化营销决策、提升内容价值。

参考文献:

[1]冯宏声.大数据时代,新闻出版业如何跟进?[N].中国出版传媒商报,2016-09-09 (006).

[2]王茜.人工智能与数据驱动下的出版业转型研究[J].科技与出版,2018 (12).

[3]张濮,赖青.面向出版企业转型的客户数据管理[J].科技与出版,2018 (12).

[4]张新新.新闻出版业大数据应用的思索与展望[J].科技与出版,2016 (1).

[5]闵超,石佳靓,孙建军.新闻出版业大数据应用新业态分析[J].中国出版,2015 (15).

[6]田军.新闻出版业大数据运用的新业态研究[J].传播与版权,2017 (8).

[7]秦艳华,郝丹.新闻出版业用户行为跟踪大数据的开发与应用[J].科技与出版,2017.

[8]付达杰.大数据环境下数字教育资源特征及其供给策略[J].伊犁师范学院学报,2017 (4).

[9]孟庆麟,刘巍.新时代出版业与大数据战略[J].中国出版,2018 (13).

[10]刘银娣.数据驱动出版:基于大数据的传统出版模式变革研究[J].中国出版,2014 (15).

作者简介: 张佳倩(1996-),女,河北石家庄人,北京印刷学院传媒经济与管理专业研究生,研究方向为区块链与数字版权。

标签:;  ;  ;  ;  

新闻出版业大数据体系构建论文
下载Doc文档

猜你喜欢