摘要:
随着人类社会交流的增加和生活习惯的改变,嗓音疾病的发生率越来越高,因此临床上对言语嗓音障碍的评估越来越重视,有关病理嗓音检测分析的研究也越来越多。能够对病理嗓音进行准确诊断是一切嗓音问题解决的根本。本研究根据病理嗓音的国内外研究现状以及目前的研究趋势,围绕病理嗓音的声学测量以及模式识别方法中的支持向量机,展开了病理嗓音客观自动分类与评级的前瞻性研究,最终构建了病理嗓音自动分类器。由于病理嗓音分类器的构建需要输入若干特征向量,因此本研究需进行嗓音特征参数的选取研究。针对分类器的特征向量集选取了和病理嗓音特征相关的基频类参数、振幅类参数、共振峰类参数、声门类参数、谐噪比参数以及倒谱类参数共六大类声学参数。为了克服基频提取时噪声对计算结果的干扰,采用同态系统和倒谱分析这种对噪声干扰不敏感的基频提取方法进行嗓音基频的提取,并在此基础上获得了其它新的基频类参数、谐噪比参数和倒谱类参数。为了提高病理嗓音分类器的分类效率,本研究对所选声学参数进行了优化。通过对病理嗓音声学特征参数相互之间的相关性分析,以及病理嗓音感知特征和声学特征的相关性分析,完成了病理嗓音声学参数的两次优化;从而选取包含较多信息含量,最能反映病理嗓音特征的参数作为优化后特征参数向量,输入到病理嗓音分类器中。为了避免有限样本量对研究结果的影响以及实现病理嗓音的非线性分类,本研究选择支持向量机这种模式识别方法作为病理嗓音的分类方法,其十分适合小样本和非线性分类问题的研究。根据提取的所有声学参数和优化后的声学参数分别建立了支持向量机的嗓音训练模型,从而构建了两个能够对正常嗓音和病理嗓音进行自动区分的病理嗓音二分类器。然后采用交叉验证和ROC曲线相结合的验证方式对病理嗓音二分类器的效果进行检验;这种检验方式避免了有限样本对验证结果的影响,推广性佳,而且简单直观。通过对分类器的识别正确率和ROC曲线图的研究发现:针对正常嗓音和病理嗓音识别的病理嗓音二分类器的分类效果极佳,识别率达到96%-98%,基本可以实现二者的区分。为了克服各类别嗓音样本数量不均衡的问题,以及避免分类重叠和不可分类的情况出现,本研究在病理嗓音二分类器的基础上,采用一对一的方法,根据提取的所有声学参数和优化后的声学参数,分别构建了两个能够对病理嗓音四级严重程度进行自动等级划分的病理嗓音四分类器。然后采用交叉验证和ROC曲线相结合的验证方式对病理嗓音四分类器的效果进行检验;通过对分类器的识别正确率和ROC曲线图的研究发现:针对病理嗓音等级评价的病理嗓音四分类器具有一定的分类效果,识别率达到73%~84%,但不如病理嗓音二分类器;基于优化后参数的病理嗓音分类器的分类效果略低于原始参数,在追求分类效率的情况下可以使用基于优化后参数的病理嗓音分类器进行分类。病理嗓音自动分类器不只针对病理嗓音和正常嗓音两种类型进行客观化区分,还针对病理嗓音的四级严重程度进行客观化的等级评价。对病理嗓音自动化分类与评级的研究使得嗓音障碍的评估不受到主观差异、语言环境等因素的影响,能够更加客观化。 关键词:病理嗓音; 声学参数; 相关分析; 倒谱; 模式识别; 支持向量机;
年份:2013