关于地方有声资源语言数据库建设模式初步研究实施的思考论文_覃敏

关于地方有声资源语言数据库建设模式初步研究实施的思考论文_覃敏

摘要:地方有声资源语言数据库的建设是一个长期而有意义的工程。在调查研究建设实施过程中,采取了活态口语采录、数字化技术、增设地方艺术资源库三个初步创新的措施。同时对资源库的建设提出了四点建议。

关键词:地方有声语言 资源库 方言保护

语言作为资源,是保存、传承人类物质文化遗产和非物质文化遗产的重要载体。是文化模式的体现。从保护人类文化多样性的角度出发,保护语言资源、将语言资源保留传承已经成为人类的共识。在大数据时代到来时将有声语言这种“特殊的社会资源”更好的保存、传承下去,建设有声资源语言数据库,这是一个长期而有意义的工程。而笔者在研究建设有声资源语言数据库的过程中,在实施过程中,思考研究方法和路径,对如何利用声像技术、数字技术、网络技术等先进的现代信息技术构建有声语言资源数据库进行了一些实践,提出了一些设想,与大家一起探讨。

一、调查研究实施中的初步创新措施:

(一)多使用活态口语的采录方法。

传统的语言资源的调查记录一直是以描写语言学为核心的传统田野调查理念和方法。调查团队选择不同年龄阶段的发音合作人,用 1000 字调查语音系统词库: 用 1200 词调查基本词汇系统句库: 用 50个句子调查主要的语法现象话语调查,讲述规定故事《牛郎和织女》,在规定自选话题选择话题对话。而我们在进行课题调研的时候,在实践中,以“话语”为中心,除音、词和语法外,加大对日常会话、故事传说、民间歌谣、民间口语艺术、祭祀词等口头传统的声像记录。而活性化的有声语档建设不仅有助保护珍贵的地方有声语言资源,也有利于延长语言的活跃周期。

(二)多采用数字化技术。

在信息化的时代背景下,有声资源的建设更加侧重于数字化的管理。首先是应该强调运用数字化的技术手段对地方语言资源进行全过程管理。运用录音、录像等方式采集、记录语言资源现在己成为国内外研究人员的主要手段,得到普遍认可。其次因为国家语委启动的“中国语言资源有声数据库”的建设,有声语言资源建设工作得到进一步推进。我们调查时按照统一规范,采集各种语言的有声资料,并进行整理、保存。语言资源的记录、立档等工作也注重数字化技术和设备的运用。在形式上,以声像档案为主;在内容上,强调以语音采录为主、以话语为中心,重视长篇语料的记录。观念的转变和技术的保障,能加快语言资源数字化工作的进展。

(三)尝试增设“地方口头文化艺术语言资源”。

地方方言,除了保留“中国语言资源有声数据库字库”中的“词库”“句库”“话语库”几部分以外,我们还尝试还可以根据实际情况,增加本第特色的文化资源,我们增设的“地方口头文化艺术语言资源库”,录制了地方戏剧汉剧、常德丝弦、童谣、三盘鼓、方言小品等经典片段。并将调查内容按照一定要求进行了必要的国际音标转写和汉字转写。最后对不同调查点的所有调查资料和电子文件进行命名、分类、归档、保存。

二、建设地方有声信息资源库的实施过程中的几点建议:

(一)建议建立起统一的规范和标准。

期刊文章分类查询,尽在期刊图书馆

目前的语言调查记录尚未完全突破传统观念和方法的局限,具体操作上各行其是,随意性很大,缺乏高质量全保真记录语言的理性认识和操作技能,没有确立完全统一的规范标准和指导原则,在记录的内容和方法上,语料的数量和质量上,都不能保证达到语言记录的标准。因此,认真总结经验,客观分析现状,理性地认识现存的不足和缺陷,建立起必要与统一的的规范标准和指导原则,十分迫切和重要。

(二)建议地方政府加快进行整体规划。

我国语言众多,语言生态复杂,对于当前的语言现状不管是国家还是地方都还缺乏全面、深入、细致的了解。因此地方政府有必要从全局出发进行整体规划,明确地方方言的现状,避免重复立项,将人力、物力、财力合理投入,以加快有声语言资源库的建设工作,使这项工作得以切实有效地开展。

(三)建议应开放合作进行建设。

地方有声资源建设是一个持续的工作,不能只靠语言学工作者来完成。应开放合作,除了与其他方面如档案学等的相关研究者合作之外,还应该发动群众,支持广大用户自主采录、集成和传输口语音频视频资源,把身边发生的、自己亲历的、丰富多彩的语言资源,源源不断地汇集到语料库中,真正实现国家语言资源建设的可持续发展。目前国内已有少数语言数据库和网站支持用户上传共享自己的语言资源,这种做法,将语言资源的建设又向前推进了一步。

(四)建议实现资源共享。

语言记录特别强调信息资源的共享。而这个目标可以通过以下几种途径来实现:首先是建立地方有声语言资源档案馆、特藏室、资料库(或语音语料数据库、多媒体数字资源库、电子文献中心)其次是开展地方语言文献记录的编纂、公布出版工作,研发多样化地方方言文化产品,第三是举办主题展览和宣传活动,成立语音实验室,建立专门网站。第四是构建语言信息网络平台和利用服务平台。

参考文献:

[1]曹志耘. 方言濒危、文化碎片和方言学者的使命[J]. 中国语言学报,2014( 16) : 207 - 214.

[2]王铁琨. 基于语言资源理念的语言规划———以“语言资源监测研究”和“中国语言资源有声数据库建设”为例[J]. 陕西师范大学学报: 哲学社会科学版,2010,39( 6) : 58 - 66.

[3]李宇明. 论中国语言资源有声数据库的建设[J].中国语文,2010( 4) : 356 - 363.

[4]范俊军. 汉语方言自然口语语料库建设的几个基本问题[J]. 学术研究,2011( 3) 153 - 158.

[5]范俊军. 汉语方言词汇数据库研制的思路[J]. 广东教育学院学报,2006,26( 2) : 62 - 64.

基金:湖南常德市2019年度社会科学重点资助课题“大数据时代常德语言资源有声数据库建设新模式的初步研究”。课题号:CSP19ZZ13

作者简介:覃敏,湖南幼儿师范高等专科学校副教授,国家级普通话测试员。从事语言文字等研究。

论文作者:覃敏

论文发表刊物:《教育学文摘》2019年8月第15期

论文发表时间:2020/1/15

标签:;  ;  ;  ;  ;  ;  ;  ;  

关于地方有声资源语言数据库建设模式初步研究实施的思考论文_覃敏
下载Doc文档

猜你喜欢