郭风岚,北京语言大学语言资源高精尖创新中心在研项目《中国周边(6国)语言资源建设》负责人,教授,博士生导师。现任北京语言大学出版社总编辑,中国民族语文应用研究中心执行主任。国家民委民族语文工作专家咨询委员会副秘书长。主要研究领域为社会语言学与语言应用,民族语言文化研究。已出版学术专著3部,发表学术论文、获采纳咨询报告50余篇(份)。主持参与国家社科基金等省部级以上项目10余项。曾获“北京市优秀教师”称号,研究成果获第14届中国社会科学院青年语言学家奖二等奖,中国社会科学院2014年优秀对策信息对策研究类三等奖(合作)。
一、引言
作为全球治理新模式,“一带一路”以政策沟通、设施联通、贸易畅通、资金融通、民心相通等“五通”为主要内容,倡议沿线各国携手同行,开创新的发展机遇,拓展新的发展空间,通过深化多领域合作,共建人类命运共同体。“一带一路”建设给世界带来机遇的同时,也带来挑战,要互信互助,互惠互利,互通互鉴,语言是基础,是关键。“‘一带一路’建设涉及国家的国语或国家通用语有近50种,再算上这一区域民族或部族语言,重要者不下200种”。可谓语言资源丰富,这些语言大多为非通用语种,语言类型多样,语言系属不一,国内学习并掌握者数量有限,很多语言我们知之甚少。要保证“五通”贯通,就应该去了解、学习和研究“一带一路”沿线国家语言。而随着“一带一路”建设的持续推进,语言需求日益旺盛,尤其是非通用语种,但语言服务尚难令人满意。如果实现语言顺通,“一带一路”建设将会插上飞翔的翅膀,飞得更快更高更远。为此,学者们呼吁应重视“一带一路”沿线国家的语言规划,要加强“一带一路”语言能力和语言资源建设。“一带一路”沿线语言资源丰富复杂,绝大多数属于非通用语种,语言学界对这些语言了解不多,认识有限,因而,对世界语言共性的认识、对语言普遍性原理的描写与研究还不深入,不充分。随着世界多极化、经济全球化的深入发展,语言接触日趋频繁,语言竞争不断加剧,语言博弈愈演愈烈,语言转用现象突出,语言的功能、地位受到巨大挑战,语言发展不平衡,语言的命运也在发生变化,强势语言不断巩固其地位,弱势语言日渐趋弱,人类语言生态正被快速改变着。据英国曼彻斯特大学的调研报告,2050年全世界90%的语言将消失,只剩百分之四左右的语言继续博弈。有学者指出,当今世界,每两个星期就有一种语言消亡,其速度之快前所未有,一旦消亡,资源的不可再生性更加剧其生态恢复的艰难性。语言是人类重要的精神家园和文化资源,一种语言的消亡,意味着承载该语言的文化失去了依附,意味着人类文化多样性的危机。与此相反,英语热正在席卷全球,美国学者Jay Walker先生在其《关于世界英语热》演讲中指出:全世界英语学习者已超过20亿,为什么?因为全世界的需要,英语让你可以获得更好的生活、工作机会,让你拥有一个更好的未来的希望,英语正在成为解决问题的语言。其话语非言过其实,据中国有关资料报告,“目前我国外语教育中仍存在英语‘一家独大’的局面。通过对全国423家语言服务机构调研发现,提供中译英服务、英译中服务的企业占比最高,分别为96.93%和94.80%”。基于以上现实,我们尝试设计开发中国周边六个国家的语言资源库,以下通过对中国周边国家语言资源库建设理念、原则、规范等等的描写,希望能够为“一带一路”沿线国家语言资源库建设提供可资借鉴的样本。二、中国周边国家语言资源库设计理念与原则
如果把“一带一路”沿线国家看作是一个朋友圈,那么这个圈也可以通过地理位置、经济特色等等建成不同的群,中国周边国家即是其中一个群。历史上,中国与周边国家唇齿相依,守望相助。习近平总书记在2013年10月24日召开的周边外交工作座谈会上特别指出:“我国周边充满生机活力,有明显发展优势和潜力,我国周边环境总体上是稳定的,睦邻友好、互利合作是周边国家对华关系的主流。” 并强调:“做好周边外交工作,是实现‘两个一百年’奋斗目标、实现中华民族伟大复兴的中国梦的需要,要更加奋发有为地推进周边外交,为我国发展争取良好的周边环境,使我国发展更多惠及周边国家,实现共同发展”。发展良好的周边关系,首先需要沟通顺畅,据知,中国周边地区是世界上语言分布最为复杂多样的地区之一,不仅语言种类繁多,语言类型多样,而且特色突出,特别是还分布有较多的跨境民族使用的跨境语言。在中国境内“有38种属于在相邻的两个或两个以上国家使用的跨境语言”。跨境语言一方面显示出中国与周边国家人民交往之密切,另一方面,跨境民族跨境而居,“这些跨境分布的相同民族语言在语言身份、方言划分、文字和书面语、语言社会使用功能等方面可能出现一定的差异,”“跨境的同一民族语言受不同国家语言环境和语言政策的影响,可能处于不同的语言活力和地位等级”。但我们对跨境语言的认识还不足,对周边国家语言的研究也不充分,语言资源库建设更是匮乏。可以说,特殊的地理、政治形势,造成了国境语言研究薄弱,开展中国周边语言研究具有睦邻戍边的重要意义,目前已经到了时已至、势已至时刻。为此,我们尝试设计开发哈萨克斯坦、吉尔吉斯斯坦、乌兹别克斯坦、老挝、缅甸、越南六个周边国家语言资源库。 语言资源库应该怎么建?建库目标、规模及容量、语种的选择、语言材料的设计、语料采录方法及技术等等,都会影响资源库的利用效率。受技术条件制约,传统语言研究对语言材料的记录收集和采录,常以纸笔的方式完成,对语言系统的全貌难以很好地系统地展现。美国密歇根大学端木三教授曾指出,传统语言研究以大语种为研究对象者多,语料较零碎,缺乏对完整语言的定义和全面研究完整语言的理论和技术,记录的语料数量不能达到语言保存特别是濒危语言保存的目的。随着科学技术的快速进步,科技在助力语言研究方面为其插上了梦想的翅膀,多模态语言数据库的研制成为现实,使得我们能够全面立体地认识人类语言。但就目前看,世界语言资源库无论从规模还是语种容量上说,尚不能满足我们对人类语言全貌的认识,特别是小语种或濒危语言,能够利用先进技术手段采集建成多模态语言资源库的语种还是占绝对少数。在周边国家语言资源库建设之前,作为一项国家工程的中国语言资源保护工程(以下简称“语保”)已经实施起来,语保工程的目标是“利用现代化技术手段,全面调查我国当今语言状况,收集记录汉语方言、少数民族语言和口头文化的实态语料,进行科学整理和加工,建成大规模、可持续增长的多媒体语言资源库,并开展语言资源保护研究工作,形成系统的基础性成果,进而进行深度开发和展示”。语保工程的成功实践也给周边国家语言资源库建设提供了宝贵的中国经验和语言资源保护中国方案,值得借鉴推广。为此,周边国家语言资源库建设从设计理念到技术规范等等,均以语保工程模本为参照,并有所延展扩充,我们命之为“语保+”模式。根据“一带一路”建设目标和其沿线国家语言资源状况,本语言资源库建设秉承服务“一带一路”建设、保护语言多样性的宗旨,将语言铺路和语言和谐作为设计理念。语言是沟通的桥梁,是通途,更是融洽合作的前提,“一带一路”建设中的“五通”,每项内容都离不开交流沟通,因此,李宇明提出的“‘一带一路’需要语言铺路”观点,也成为我们研制周边国家语言资源库的理念。 语言是人类思想的载体,政治冲突、经济竞争、文化隔阂的导火索常常是语言,并直接影响语言生态。戴庆厦(2008;2013)、李宇明(2013)等学者均提出过语言和谐思想,主张语言是人类宝贵的财富,每种语言都有其存在的价值,语言间应相互包容、和平共处,和谐的语言关系,不仅能够减缓语言冲突,更是促进人类文化发展的重要载体。“一带一路”建设过程中,倡导语言和谐,保护人类语言文化多样性,也是构建人类命运共同体使然。戴庆厦教授(左)、李宇明教授(右)
总之,语言铺路突出的是语言的交流功用,铺好语言之路,可以更好地为人类服务;语言和谐突出的是语言的生态功能和文化功能,强调人类语言间的多元包容,理解尊重,共生共荣。在语言铺路和语言和谐设计理念下,肩负不同功能或地位的语种齐飞、语言结构与语言文化共舞的使命,中国周边国家语言资源库以统一的设计模板为规范,以规模大、功能强、开放且可持续开发及应用的多模态语言资源库为目标,为“一带一路”建设服务,为语言学习、语言研究提供基本支撑,为语言资源保护与深度开发提供基础数据。其设计原则主要包括如下几方面。多语种多模态语言资源库的建设非一己之力所能为,需要投入大量的人力物力,本语言资源库定位为学习、研究和保护,众多项目参与者需要精诚合作,共同策划共同创建,建成后资源库也将全面开放,因此,成果应经得起检验。坚持共商共创共建共享的工作原则,可以更好地保障项目研发质量。 充分考虑资源库的实用性和成果的应用性,保证资源的最大化利用,以语保工程的设计与功能为基础,一方面对接语保规范及内容,整体与语保有效衔接;另一方面,根据本资源库特点,拓展延伸部分内容,包括微调规范,增加语言采录条目数量等等。 语言资源库的建设最终还是服务用户,本资源库将以内容丰富、界面友好、使用简单等特点,最大限度地满足用户的语言学习、研究与应用开发等需求。 本资源库创建“语保+”模式,期望这一模式能够为世界语言资源开发提供中国方案,为此,设计之初即考虑资源的可持续开发利用,资源库以规模更大、功能更强、便于持续开发为目标,为未来各类语言资源库的研发及深度开发提供模板及端口。三、中国周边国家语言资源库内容与规范
中国周边国家语言资源库建设项目由北京语言大学语言资源高精尖创新中心立项实施,首期确定实施“一带一路”沿线哈萨克斯坦、吉尔吉斯斯坦、乌兹别克斯坦、缅甸、老挝、越南六个周边国家的语言资源库建设。根据顶层设计,本语言资源库建设首期聚焦语言资源库、语言文化资源库和语言文化文献资源库三库。语言资源库承担语言系统资源的采录任务,其内容从语言本体视角切入设计,包括语音、词汇、语法等等,该资源库最终形成电子数据和纸质成果。语言文化资源库承担承载文化特色词语的采录任务,其内容从语言负载的文化信息切入,以图片及视频形式呈现。语言文化文献资源库主要汇聚周边国家语言文化研究成果,采取的方式是索引目录和成果实物收集两种。主要汇聚国别语言本体资源数据,采集的样本为多模态平行语料,即语料不仅是采录音视频,而且是汉语和国别语言两两对齐。语言数据的采集我们设计了国家通用语言(或官方语言或国语)、地区通用语言和濒危语言等三个层次,每一类都包含语音、词汇、语法、朗读、话语、口头文化等内容,按统一的规范进行调查采录,以获得语言保存示范性、语言学习参照性和语言研究丰富性等多重效应。采录内容如下:统一的规范包括内容和技术两方面。内容方面,以词汇调查采录为例,国家通用语言的词汇调查,要求词汇量达8000词,由基础词汇3000词、扩展词汇3000词和补充词汇3000词构成。其中,基础词汇统一使用中国语言资源保护工程编制的中国少数民族语言调查词表,目前涉及了汉藏语系和部阿尔泰语系分词表;扩展词汇由课题组编制,由六个课题组调查时统一使用;补充词汇属于国别特色词,由各国别组自行编制。这样设计的目的,既保证了一种语言词汇容量足够大,可以为语言学习提供充足的词汇量,为跨语言对比、跨境语言研究等提供同质的丰富的语言材料,又突出了国别特色。以图像和视频方式,采录具有突出特征的国别语言文化词语,语言文化类别参照语保工程设计,上至天文下至地理共含十几类,均突出语言蕴含的文化特色。资源库建成后,希望能够通过直观展示,进一步增进国家之间不同层面的了解、理解与信任,互容互鉴。旨在通过以索引目录和成果实物收集两种方式汇聚国别语言文化文献,方便学者获取国别语言文化文献,了解国别语言文化研究的热点、难点及空白点,在学术研究上开拓创新。本资源库在内容和技术设计上的规范均采取统一性兼开放性,保证各种语言资源平行对齐,同时保证国别语言特色。就内容来说,以词汇为例,每一国别国家通用语言都将摄录8000个词汇,包括直接使用语保工程的3000词语,课题组编制的用于本项目的3000共用词语,同时,考虑国情不同,又留出2000个各国独特的特色性词语空白供补充填录。在技术路线方面,则完全对接语保工程,语保工程对摄录设备的要求很高,至今仍较为先进,可以满足课题的需要。四、结语
语言资源建设属于基础工程,既非一己之力能够完成,也非一时之功得以成型,需要投入巨大的人力物力财力,思想理念、原则及目标要明确,设计方法具有可操作性,尤其是跨国调查、跨国合作均非易事,需要精诚合作。中国周边国家语言资源库建设是我们提出打造“一带一路”语言文化命运和责任共同体的初步尝试,相信该资源库的开发,不仅是语保工程中国经验的深度实践,也会为“一带一路”沿线国家语言资源库建设提供可资借鉴的中国方案。 项目在实施过程中已经积累了较多的经验,以此为基础,我们将进一步延伸开发,力争带动“一带一路”语言文化资源的多层面汇聚,形成“一带一路”语言资源建设的四位一体:未来期待通过多国专家学者的共商共创共建共享,以“滚雪球”方式实现“一带一路”沿线语言文化资源的全方位开发。我们的愿景是,由语言铺路,以语言为媒,让语言造福人类,让世界变得更美。
[1] 曹志耘.中国语言资源保护工程的定位、目标与任务[J].语言文字应用,2015(4):10-17.
[2] 戴庆厦.构建我国多民族语言和谐的几个理论问题[J].中央民族大学学报(哲学社会科学版),2008(2):101-104.
[3] 戴庆厦.开展我国语言和谐研究的构想[J].黔南民族师范学院学报,2013(3):1-5.
[4] 郭风岚 2014 关注中国周边语言,中国语言生活状况报告(2014)[M,]北京:商务印书馆.
[5] 黄行,许峰.我国与周边国家跨境语言的语言规划研究[J].语言文字应用,2014(2):9-17.
[6] 李宇明.和谐语言生活 减缓语言冲突[J].语言文字应用,2013(1):10-11.
[7] 李宇明.国境语言研究,时已至,势已至——在“2013海内外中国语言学者联谊会——第四届学术论坛”上的致辞[Z]. 2013年7月27日.
[8] 李宇明.“一带一路”需要语言铺路[J].中国科技术语,2015(6):62.
[9] 朱艳华.论跨境语言资源保护[J].贵州民族研究,2016(3):204-208.