联系客服
客服二维码

联系客服获取更多资料

微信号:LingLab1

客服电话:010-82185409

意见反馈
关注我们
关注公众号

关注公众号

linglab语言实验室

回到顶部
面向语音合成的缅甸语文本分析与实现

摘要:

缅甸语是缅甸的官方语言,属汉藏语系藏缅甸语族缅甸语支,与同语系的汉语和藏语语音合成研究相比,缅甸语语音合成相关研究亟待重视。本文以开发缅甸语语音合成系统为目的,构建发音语料库,研究并实现文本归一化、分词和文本注音。本文的主要工作包括:(1)构建发音语料库。从缅甸语网站上抓取大约600M原始文本语料,去除语料中的非法字符和重复句子,并统一文本语料的字符编码方式。统计文本语料库中的高频词、句子长度、句子类型、声韵母的分布,将其作为发音语料选取的依据;为了使发音语料库包含的发音现象、语言现象更加完整,通过句子之间的相似度比较作为另一个选取依据;最终挑选出的发音语料库规模为5000句。(2)文本归一化。研究了数字、缩写词以及特殊字符的归一化问题,对不同类型的字符分别提出了具体的归一化方案并进行了实现。(3)实现三种分词方法。设计并实现了基于正向最大匹配(Forward Maximum Matching,简称FMM)的分词、基于条件随机场模型(Conditional Random Fields,简称CRF)分词以及基于双向长短期记忆神经网络+条件随机场模型(Bidirectional Long Short-Term Memory Networks with a CRF layer,简称BiLSTM+CRF)的分词。实验结果表明,三种方法的分词速度比较结果为:FMM>CRF>BiLSTM+CRF,分词精度比较结果为:BiLSTM+CRF>CRF>FMM。CRF方式与BiLSTM+CRF方式相比,分词精度略差,前者的分词速度为后者的62倍。综合考虑,选择基于CRF的分词方法应用于缅甸语语音合成系统开发的分词模块。(4)文本自动注音。根据MLC(The Myanmar Language Commission)转写系统和IPA(International Phonetic Alphabet)注音系统提出基于声韵母拼接的文本自动注音方法。缅甸语是一种文白异化现象较多的语言,通过对语音变化情况进行分类,选择涵盖大部分语音变化现象的四种模式,在声韵母拼接注音的基础上,提出基于规则的注音方法和基于CRF的注音方法。通过对比实验与结果分析,基于CRF的文本自动注音方式优于其它两种,且其词和音节的标注正确率的均值分别为71.6%和90.6%,音标正确率的均值分别为63.6%和86.8%。

年份:2019

求助
推荐
收藏
表情
图片
附件