联系客服
客服二维码

联系客服获取更多资料

微信号:LingLab1

客服电话:010-82185409

意见反馈
关注我们
关注公众号

关注公众号

linglab语言实验室

回到顶部
汉藏双语跨语言统计参数语音合成的研究

摘要:

近年来,多语种语音信息处理成为了智能语音信息处理中的重要研究方向。其中,由于跨语言的语音合成能够利用同一个语音合成系统合成出不同语言的语音,成为了目前的研究热点。中国是一个少数民族语言和方言众多的国家,跨语言语音合成技术的研究对促进方言和民族语言语音技术的发展有着重要的意义。但是,目前国内外的研究中,并没有一个完整的普通话/民族语言或普通话/方言的多语种语音合成系统。本文选取了汉语普通话和藏语拉萨方言作为研究对象,研究了两种语言在发音上的特点及共性,设计了普通话和藏语通用的标音方案、语音基元的语境信息标注格式以及对声学模型进行决策树聚类的问题集。在此基础上,利用一个多说话人的普通话语料库和一个单说话人的藏语拉萨方言语料库,将说话人自适应训练引入基于隐Markov模型(Hidden Markov Model,HMM)的语音合成方法中,训练获得了一个混合语言的平均音模型;之后,再利用待合成藏语或汉语的少量训练语句,采用说话人自适应变换算法获得藏语或者普通话的说话人相关模型,最终合成出藏语或汉语语音,实现了汉藏双语跨语言语音合成系统。论文的主要工作和创新如下:1.设计了一套面向统计参数语音合成的藏汉双语的机读音标方案。从声母、韵母和声调等方面对藏语和汉语的发音特点做了对比研究,找出了两者在发音上的共性,利用国际通用的机读音标,设计了一套汉藏双语的机读音标,实现了文本到字音的转换。2.设计了一套面向统计参数语音合成的汉藏双语的上下文相关的标注格式。标注格式包括声韵母层、音节层、词层、韵律词层、韵律短语层和语句层6层,用来标注藏语或者汉语语句中的每个声韵母的语境信息。同时,设计了涵盖两种语言语音特色的决策树问题集,用于声学模型的训练过程中对模型的聚类。3.提出了一种利用说话人自适应训练实现汉藏双语跨语言语音合成的方法。利用一个多说话人的普通话语料和一个单说话人的藏语语料,在HMM模型的训练中引入说话人自适应训练,得到一个语言无关的平均音模型;然后采用1个藏语说话人的训练语料或者1个普通话说话人的训练语料,采用说话人自适应训练获得该语言的说话人相关模型,从而利用同一个系统合成出藏语语音或普通话语音。4.实现了一个汉藏双语跨语言语音合成系统,评测了系统合成语音的音质。主观评测和客观评测结果表明,在藏语训练集较少的情况下,本文提出的方法合成的藏语语音的语音质量高于传统的方法。

年份:2015

求助
推荐
收藏
表情
图片
附件