CN106601271B

CN106601271B - 一种语音异常信号检测系统

Info

Publication number: CN106601271B
Application number: CN201611170425.2A
Authority: CN
Inventors: 张涛; 李林
Original assignee: Hebei Jitu Technology Co Ltd
Current assignee: Hebei Jitu Technology Co ltd
Priority date: 2016-12-16
Filing date: 2016-12-16
Publication date: 2020-05-22
Anticipated expiration: 2036-12-16
Also published as: CN106601271A

Abstract

本发明涉及一种语音异常信号检测系统，其包括数据训练模块、训练三支决策分类器模块、优化三支决策分类器模块、测试数据模块和决策分类模块；所述数据训练模块将待测数据处理后传输至所述训练三支决策分类器模块，由所述训练三支决策分类器模块对处理后的待测数据进行分类；分类后的待测数据传输至所述优化三支决策分类器模块内，由所述优化三支决策分类器模块进行优化处理，优化处理后的待测数据与所述测试数据模块获得的实际测试正常数据传输至所述决策分类模块内，实现对语音异常信号的检测。本发明成本较低，而且具有较高的准确率，使用较为便捷。

Description

一种语音异常信号检测系统

技术领域

本发明涉及一种语音信号检测系统，特别是关于一种语音异常信号检测系统。

背景技术

帕金森病(PD)是一种常见的中枢神经系统神经变性疾病,至今医学界尚未明确帕金森病的病因，也还未找到一种能够治愈病症的方法，有研究表明，在病发初期，对病人进行合理的治疗，可以在很大程度上减缓病情的发展，大大改善患者的生活质量。因此对于病情的早期诊断就显得尤为重要。然而，帕金森病的早期症状容易与患者身体机能的老化所混淆，因此早期的帕金森病诊断极其困难。目前帕金森病的诊断仍是由医生凭借临床经验经验对患者的病史和体检并且结合问卷调查的方式来得出结论，这项工作不仅耗时耗力，而且由于临床医生个人的主观性，对判断结果也会带来不同的影响。要想按照严格的临床标准，准确的排除极似病人方法比较复杂费用比较昂贵，如CT、正电子发射体层摄影术(PET)等。也正是由于早期病症不明显，因此也就不能提醒人们及时的进行诊断。

在帕金森病症的各种表现中，语音障碍为典型的病症之一，大约90％的帕金森病人会出现不同程度的语音障碍，并且语音的采集方法较为简单，因此帕金森病的语音诊断近年来收到越来越多的关注。牛津大学的Max A.Little研究小组在2007年开始进行对帕金森病的语音方面的研究。该小组分别对31人进行语音数据采集，一共采集195条语音样本，该数据于2008年被列入美国California大学的UCI数据库。虽然取得较高的正确判断率，但支持向量机的原理无法用物理意义进行解释，在医学领域不具备说服力。

在语音障碍诊断方面当前都是以分类为基本原则，但诊断过程本身为决策过程。三支决策具有良好的可解释性的决策过程，如何通过三支决策分类器对帕金森病的语音异常信号进行决策分类成为目前亟需解决的技术问题。

发明内容

针对上述问题，本发明的目的是提供一种语音异常信号检测系统，该系统成本较低，而且具有较高的准确率，使用较为便捷。

为实现上述目的，本发明采取以下技术方案：一种语音异常信号检测系统，其特征在于：该系统包括数据训练模块、训练三支决策分类器模块、优化三支决策分类器模块、测试数据模块和决策分类模块；所述数据训练模块将待测数据处理后传输至所述训练三支决策分类器模块，由所述训练三支决策分类器模块对处理后的待测数据进行分类；分类后的待测数据传输至所述优化三支决策分类器模块内，由所述优化三支决策分类器模块进行优化处理，优化处理后的待测数据与所述测试数据模块获得的实际测试正常数据传输至所述决策分类模块内，实现对语音异常信号的检测。

进一步，所述训练三支决策分类器模块内的三支决策分类器构建方法如下：1)设论域U＝{x₁,...x_n,...,x_N}，x_n是其中的某一对象，A＝{a₁,...,a_d,...,a_D}是对象的D维特征集合，设V＝{V₁,...,V_d,...,V_D}为对象x_n特征集合A的数值集合，其中

为x_n的特征a_d的值，设集合类别X＝{X₁,...,X_k,...,X_K}，表示对象类别；2)将高维数据降维映射到二维平面，降维映射后，每一个数列就表示一个特征，判断区间也变为一维；3)对于某一测试数据，以该测试数据在各特征上的数值为中心，选取长度r为判断半径；4)对于一条待测数据对象x_n，其特征a_d的值为

在特征a_d上若以

为中心，以长度r为半径，划分判断区间R_d，

5)分别计算该判断区间内属于不同类别的样本的数目c_k，0≤c_k≤B，则在特征a_d上该数据属于某一类别X_k的概率为：

式中，B为判断区间内样本的总数；6)根据概率

判断测试数据类别，完成分类。

进一步，所述步骤4)中，判断区间半径r的选取过程如下：4.1)将测试数据归一化后，全部特征的数值都分布在区间[0,1]上，根据实际需求的预设精度，首先将半径r的初始值r_sta设定为0，步进r_stp为0.01个单位，最大r_end为1；4.2)经步骤4.1)计算后，选出分类最高精度P₁，并且得到该精度下的r值：r＝n₁·0.01，式中，1≤n₁≤100；此时有：n₁·0.01≥(n₁-1)·0.01，且n₁·0.01≥(n₁+1)·0.01；4.3)重设初始值r_sta值和最大r_end：

4.4)经步骤4.3)计算后，得出分类最高精度P₂，如果有P₂>P₁，则此时：

r＝(n₁-1)·0.01+n₂·0.001；

4.5)根据上述步骤进行迭代，直至P_i+1≤P_i结束，得到最高分类精度P_i和此时半径：

进一步，所述步骤6)中，具体分类过程如下：6.1)在阈值为[0,1]的情况下，若概率

则说明在此种特征上做判断，该数据属于类X_k，对于类X_k而言，判断区间R_d相当于三支决策中的正域；6.2)若概率

则说明该数据不属于类别X_k，对于类X_k而言，判断区间R_d相当于三支决策中的负域；6.3)若

则不做决断，然后进行下一个特征判断，直到所有对于类X_k，判断区间R_d相当于三支决策中的边界域；等到所有的特征都判断完毕，再分别将各个类别在所有特征上的概率加和：

得到集合P＝[P₁,...,P_k,...P_K]，每一个概率P_k分别对应一个类别X_k，取max[P₁,...,P_k,...,P_K]所对应的类别为最终的判断结果。

进一步，所述优化三支决策分类器模块内设置有距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块；分类后的待测数据依次经所述距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块进行优化。

进一步，所述距离权重模块的具体优化过程如下：(1)设论域U外一条测试数据x，其特征a_d的数值为v_d；在训练数据集特征a_d上，以v_d为中心，以某一适当的长度γ为半径，在V_d上划分出一块空间[v_d-γ,v_d+γ]，此空间作为判别空间；在此空间内，存在类别X_k的样本数量为i，1≤i≤N，每个样本的数值到v_d的欧氏距离为：

则，该类别样本到v_d的平均欧氏距为：

式中，E_k表示某类别样本数据到测试数据的平均距离；定义测试数据x到类别X_k在距离上的系数为：

式中，O为测试数据到类别X_k在距离上的系数，则其原概率可修正为：

(2)采用高斯函数对每个数据的权重进行调节，得到测试样本x属于每一种类别的概率为：

进一步，所述步骤(2)中，具体调节过程如下：(2.1)高斯函数的表达式为：

式中，μ是期望，σ是标准差；对于某条测试数据x，将其特征a_d的数值v_d视为高斯函数的期望μ，再通过预先设定的标准差σ，得出适用于样本训练的高斯函数f；在判断区间[v_d-r,v_d+r]上，存在M个数据样本，这些样本的特征a_d值

则这些特征值在高斯函数f上的取值为

且

(2.2)设在M个训练数据中，有m个样本属于类别X₁，那么在判断区间[v_d-r,v_d+r]上，X₁的分布权重为：

(2.3)设该判断区间内，共包含n种类别的数据，则实现对每个数据的权重进行调节。

进一步，所述重叠度权重优化模块的具体优化过程如下：(1)设特征的权重为w_d为：

式中，C_p、C_q分别表示两个不同的类别；CSL表示两个不同类别的重叠度；(2)对所有特征做与步骤(1)同样的计算得到权重集合[w₁,...,w_d,...w_D]；(3)将测试样本x属于每一种类别的概率修改为：

进一步，所述AdaBoost优化优化模块的具体优化过程为：利用AdaBoost算法对引入重叠度的三支决策分类器进行优化，在每一次迭代中，数据的分布发生改变，每一维特征上的重叠度权重和最佳判断区间半径也随之发生改变，得到新的W集合和判断区间半径r值，即为在此次迭代中，弱三支决策分类器的可调参数，参数的改变将产生不同的若分类器模型，迭代结束后，将每一个弱分类器乘以其权重然后加和便得到强化后了的分类器。

本发明由于采取以上技术方案，其具有以下优点：1、本发明采用的三支决策分类器使数据自然生长，利用权重的调节自发性的划分出分布区域。尊重原始数据的自身信息，并不对数据进行强行的映射或者用线性、非线性的方法进行划分。数据的自然生长更能体现出其所具有的意义，因此在应用到帕金森病的语音异常检测中取得了非常好的分类效果，并且该方法是在完全可视化条件下发生，具备良好的可解释性。2、本发明对三支决策分类器采用距离权重、重叠度权重及AdaBoost进行优化，利用UCI数据库中的帕金森病语音特征集和自采集的语音特征集对三支决策分类器进行实验测试，在帕金森病的语音诊断中获得了较为优越的性能，具备实用价值。

附图说明

图1是本发明的整体结构示意图。

具体实施方式

下面结合附图和实施例对本发明进行详细的描述。

如图1所示，本发明提供一种语音异常信号检测系统，其包括数据训练模块、训练三支决策分类器模块、优化三支决策分类器模块、测试数据模块和决策分类模块。数据训练模块将待测数据处理后传输至训练三支决策分类器模块，由训练三支决策分类器模块对处理后的待测数据进行分类；分类后的待测数据传输至优化三支决策分类器模块内，由优化三支决策分类器模块进行优化处理，优化处理后的待测数据与测试数据模块获得的实际测试正常数据传输至决策分类模块内，实现对语音异常信号的检测。

在一个优选地实施例中，训练三支决策分类器模块内的三支决策分类器构建方法如下：

1)设论域U＝{x₁,...x_n,...,x_N}，x_n是其中的某一对象，A＝{a₁,...,a_d,...,a_D}是对象的D维特征集合，设V＝{V₁,...,V_d,...,V_D}为对象x_n特征集合A的数值集合，其中

为x_n的特征a_d的值，设集合类别X＝{X₁,...,X_k,...,X_K}，表示对象类别。

2)将高维数据降维映射到二维平面，降维映射后，每一个数列就表示一个特征，判断区间也变为一维。

3)对于某一测试数据，以该测试数据在各特征上的数值为中心，选取长度r为判断半径。

4)对于一条待测数据对象x_n，其特征a_d的值为

在特征a_d上若以

为中心，以长度r为半径，划分判断区间R_d，

式中，B为判断区间内样本的总数。

6)根据概率

判断测试数据类别，完成分类；具体过程如下：

6.1)在阈值为[0,1]的情况下，若概率

则说明在此种特征上做判断，该数据属于类X_k，对于类X_k而言，判断区间R_d相当于三支决策中的正域；

6.2)若概率

则说明该数据不属于类别X_k，对于类X_k而言，判断区间R_d相当于三支决策中的负域；

6.3)若

上述步骤4)中，由于在分类器建模时，判断区间半径r的选取直接关系着分类效果。因此，本发明在该分类器r的选择时，采取单位距离步进的方法来选取，通过地毯式的搜索来选取最佳r值。具体过程如下：

4.1)将测试数据归一化后，全部特征的数值都分布在区间[0,1]上，根据实际需求的预设精度，首先将半径r的初始值r_sta设定为0，步进r_stp为0.01个单位，最大r_end为1。

4.2)经步骤4.1)计算后，选出分类最高精度P₁，并且得到该精度下的r值：

r＝n₁·0.01 (3)

式中，1≤n₁≤100。此时有：

n₁·0.01≥(n₁-1)·0.01 (4)

且n₁·0.01≥(n₁+1)·0.01。

4.3)重设初始值r_sta值和最大r_end：

r＝(n₁-1)·0.01+n₂·0.001 (6)

在一个优选地实施例中，优化三支决策分类器模块内设置有距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块。分类后的待测数据依次经距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块进行优化。其中：

距离权重模块的具体优化过程如下：

(1)设论域U外一条测试数据x，其特征a_d的数值为v_d。在训练数据集特征a_d上，以v_d为中心，以某一适当的长度γ为半径，在V_d上划分出一块空间[v_d-γ,v_d+γ]，此空间作为判别空间。在此空间内，存在类别X_k的样本数量为i，1≤i≤N，每个样本的数值到v_d的欧氏距离为：

则，该类别样本到v_d的平均欧氏距为：

式中，E_k表示某类别样本数据到测试数据的平均距离。从式中可以看出，E_k越大则表示X_k的样本距离测试数据x就越远，因此x属于类别X_k的概率就越小。所以定义测试数据x到类别X_k在距离上的系数为：

(2)在计算距离权重时，将某个类别的全部数据当作一个整体，计算这个整体的质心到测试数据的距离，进而计算该类别的分布权重，但是也因此忽略了相同类别中不同数据间在距离上的个体差异，为了体现出这种个体差异，本发明引入高斯函数对每个数据的权重进行调节。

(2.1)高斯函数的表达式为：

式中，μ是期望，σ是标准差。若高斯函数值在x为期望值μ时取得最大值，x越远离期望值函数值越小。

对于某条测试数据x，将其特征a_d的数值v_d视为高斯函数的期望μ，再通过预先设定的标准差σ，得出适用于样本训练的高斯函数f。在判断区间[v_d-r,v_d+r]上，存在M个数据样本，这些样本的特征a_d值

则这些特征值在高斯函数f上的取值为

且

越靠近测试数据的样本其

的值就越大，也就说明测试数据与该样本的相似性就更大。

(2.3)设该判断区间内，共包含n种类别的数据，则测试样本x属于每一种类别的概率为：

重叠度权重优化模块的具体优化过程如下：

对于三支决策分类器而言，在每一个特征上的判断都是独立进行，原始的三支决策分类器每个特征的权重都是一样的，因叠度概念后，此不能体现不同特征分类效果的差别，本发明采用重计算不同数据上数据的混合程度，然后基于此计算不同特征的权重，即以区分不同特征在分类程度上的贡献。

(1)设特征的权重为w_d为：

式中，C_p、C_q分别表示两个不同的类别；CSL表示两个不同类别的重叠度。混叠度越小则特征所占权重就越大，反之亦然。

(2)对所有特征做与步骤(1)同样的计算得到权重集合[w₁,...,w_d,...w_D]；

(3)将测试样本x属于每一种类别的概率修改为：

本发明引入重叠度使得不同特征在分类性能上的差异得以区分对待，更符合数据的实际分布类别。

AdaBoost优化优化模块的具体优化过程为：利用AdaBoost算法对引入重叠度的三支决策分类器进行优化，在每一次迭代中，数据的分布发生改变，每一维特征上的重叠度权重和最佳判断区间半径也随之发生改变，得到新的W集合和判断区间半径r值，即为在此次迭代中，弱三支决策分类器的可调参数，参数的改变将产生不同的若分类器模型，迭代结束后，将每一个弱分类器乘以其权重然后加和便得到强化后了的分类器。

由于AdaBoost算法是一种分类器的加强算法，其本质其实是改变了数据的分布特性，在每一次迭代中，计算错误分类率，根据这个错误分类率，对重新调整每一个数据的权重。被正确分类的数据的权重减小，错误分类的数据的权重增大。这样便得出新的数据分布，然后根据这个分布在训练下一个分类器。这样通过若干次迭代，便得到同样个数的分类器，再将全部弱分类器集合起来，便得到一个加强的分类器，作为最后的决策分类器，以提高正确分类率。

实施例：

在本实施中测试数据选择UCI数据集中的帕金森语音特征集，UCI数据集是加州大学欧文分校建立的数据库，是目前世界上具有权威性的机器学习数据库，被广泛的用于各方面的科研项目中，因此，从客观公正的角度出发，所使用的数据集便使用该库中的帕金森病语音特征集，该特征数据集包含22维语音特征。

此外，共对4名帕金森病人和1名健康者进行实地语音采集，每人各元音分别采集一段语音，最后共采集到25条语音数据。然后利用语音特征处理工具对语音信号提取的特征数据，共提取了18个特征的数据。然后，利用两个数据集对原始三支决策分类器，及其优化方案进行试验测试。

本发明采用留一法为测试方法，这样可以最大程度发挥数据的价值。首先比较原始三支决策分类器及其引入不同距离权重优化后的三支决策分类器对帕金森病语音特征的分类性能。

表1至表2显示了引入重叠度概念并利用AdaBoost优化后的三支决策分类器的分类结果.

表2AdaBoost_TWDC在UCI帕金森语音特征数据集合上的分类器结果

表3AdaBoost_TWDC在自采集音特征数据集合上的分类器结果

表1中，对UCI帕金森语音特征数据集进行诊断分类，一次迭代后得到的分类结果超过了原始的TWDC，说明这种优化方式取得了优化效果。表1中，对自采集的语音特征集进行诊断分类，得到了最高80％的分类精度，也因为自采集的数据集并不具有完备性，因此该结果并不能全面的证明这种优化方式下的三支决策分类器的性能优劣。

综上所述，本发明主要是对三支决策分类器在帕金森病的语音异常检测上的性能进行研究。首先解释了三支决策思想的基本概念和三支决策分类器的基本构造方法，然后对三支决策分类器从距离权重、重叠度权重及引入AdaBoost算法进行优化。最后利用UCI数据库中的帕金森病语音特征集和自采集的语音特征集对三支决策分类器进行实验测试，测试结果表明，三支决策分类器在帕金森病的语音诊断中表现出了较为优越的性能，三支决策分类器具备实用价值。

上述各实施例仅用于说明本发明，各部件的结构、尺寸、设置位置及形状都是可以有所变化的，在本发明技术方案的基础上，凡根据本发明原理对个别部件进行的改进和等同变换，均不应排除在本发明的保护范围之外。

Claims

1.一种语音异常信号检测系统，其特征在于：该系统包括数据训练模块、训练三支决策分类器模块、优化三支决策分类器模块、测试数据模块和决策分类模块；所述数据训练模块将待测数据处理后传输至所述训练三支决策分类器模块，由所述训练三支决策分类器模块对处理后的待测数据进行分类；分类后的待测数据传输至所述优化三支决策分类器模块内，由所述优化三支决策分类器模块进行优化处理，优化处理后的待测数据与所述测试数据模块获得的实际测试正常数据传输至所述决策分类模块内，实现对语音异常信号的检测；

所述优化三支决策分类器模块内设置有距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块；分类后的待测数据依次经所述距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块进行优化。

2.如权利要求1所述的一种语音异常信号检测系统，其特征在于：所述训练三支决策分类器模块内的三支决策分类器构建方法如下：

1)设论域U＝{x₁,...x_n,...,x_N}，x_n是其中的某一对象，A＝{a₁,...,a_d,...,a_D}是对象的D维特征集合，设

为对象x_n特征集合A的数值集合，其中

为x_n的特征a_d的值，设集合类别X＝{X₁,...,X_k,...,X_K}，表示对象类别；

2)将高维数据降维映射到二维平面，降维映射后，每一个数列就表示一个特征，判断区间也变为一维；

3)对于某一测试数据，以该测试数据在各特征上的数值为中心，选取长度r为判断半径；

4)对于一条待测数据对象x_n，其特征a_d的值为

在特征a_d上若以

为中心，以长度r为半径，划分判断区间R_d，

式中，B为判断区间内样本的总数；

6)根据概率

判断测试数据类别，完成分类。

3.如权利要求2所述的一种语音异常信号检测系统，其特征在于：所述步骤4)中，判断区间半径r的选取过程如下：

4.1)将测试数据归一化后，全部特征的数值都分布在区间[0,1]上，根据实际需求的预设精度，首先将半径r的初始值r_sta设定为0，步进r_stp为0.01个单位，最大r_end为1；

r＝n₁·0.01

式中，1≤n₁≤100；此时有：

n₁·0.01≥(n₁-1)·0.01

且n₁·0.01≥(n₁+1)·0.01；

4.3)重设初始值r_sta值和最大r_end：

4.4)经步骤4.3)计算后，得出分类最高精度P₂，如果有P₂＞P₁，则此时：

r＝(n₁-1)·0.01+n₂·0.001；

4.如权利要求2所述的一种语音异常信号检测系统，其特征在于：所述步骤6)中，具体分类过程如下：

6.1)在阈值为[0,1]的情况下，若概率

6.2)若概率

6.3)若

得到集合P＝[P₁,...,P_k,...P_K]，每一个概率P_k分别对应一个类别X_k，取

所对应的类别为最终的判断结果。

5.如权利要求1所述的一种语音异常信号检测系统，其特征在于：所述距离权重模块的具体优化过程如下：

(1)设论域U外一条测试数据x，其特征a_d的数值为v_d；在训练数据集特征a_d上，以v_d为中心，以某一适当的长度γ为半径，在V_d上划分出一块空间[v_d-γ,v_d+γ]，此空间作为判别空间；在此空间内，存在类别X_k的样本数量为i，1≤i≤N，每个样本的数值到v_d的欧氏距离为：

则，该类别样本到v_d的平均欧氏距为：

6.如权利要求5所述的一种语音异常信号检测系统，其特征在于：所述步骤(2)中，具体调节过程如下：

(2.1)高斯函数的表达式为：

则这些特征值在高斯函数f上的取值为

且

7.如权利要求1所述的一种语音异常信号检测系统，其特征在于：所述重叠度权重优化模块的具体优化过程如下：

(1)设特征的权重为w_d为：

式中，C_p、C_q分别表示两个不同的类别；CSL表示两个不同类别的重叠度；

(3)将测试样本x属于每一种类别的概率修改为：

8.如权利要求1所述的一种语音异常信号检测系统，其特征在于：所述AdaBoost优化优化模块的具体优化过程为：利用AdaBoost算法对引入重叠度的三支决策分类器进行优化，在每一次迭代中，数据的分布发生改变，每一维特征上的重叠度权重和最佳判断区间半径也随之发生改变，得到新的W集合和判断区间半径r值，即为在此次迭代中，弱三支决策分类器的可调参数，参数的改变将产生不同的若分类器模型，迭代结束后，将每一个弱分类器乘以其权重然后加和便得到强化后了的分类器。