CN106601271B - 一种语音异常信号检测系统 - Google Patents
一种语音异常信号检测系统 Download PDFInfo
- Publication number
- CN106601271B CN106601271B CN201611170425.2A CN201611170425A CN106601271B CN 106601271 B CN106601271 B CN 106601271B CN 201611170425 A CN201611170425 A CN 201611170425A CN 106601271 B CN106601271 B CN 106601271B
- Authority
- CN
- China
- Prior art keywords
- data
- module
- training
- value
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 15
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 13
- 238000012360 testing method Methods 0.000 claims abstract description 54
- 238000005457 optimization Methods 0.000 claims abstract description 44
- 238000000034 method Methods 0.000 claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 34
- 230000008569 process Effects 0.000 claims abstract description 24
- 238000012545 processing Methods 0.000 claims abstract description 5
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 5
- 230000005856 abnormality Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 4
- 238000013461 design Methods 0.000 claims description 3
- 208000018737 Parkinson disease Diseases 0.000 description 17
- 230000006870 function Effects 0.000 description 13
- 238000003745 diagnosis Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 230000006735 deficit Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000013399 early diagnosis Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 238000002600 positron emission tomography Methods 0.000 description 1
- 208000027765 speech disease Diseases 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/66—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/54—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Evolutionary Computation (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种语音异常信号检测系统,其包括数据训练模块、训练三支决策分类器模块、优化三支决策分类器模块、测试数据模块和决策分类模块;所述数据训练模块将待测数据处理后传输至所述训练三支决策分类器模块,由所述训练三支决策分类器模块对处理后的待测数据进行分类;分类后的待测数据传输至所述优化三支决策分类器模块内,由所述优化三支决策分类器模块进行优化处理,优化处理后的待测数据与所述测试数据模块获得的实际测试正常数据传输至所述决策分类模块内,实现对语音异常信号的检测。本发明成本较低,而且具有较高的准确率,使用较为便捷。
Description
技术领域
本发明涉及一种语音信号检测系统,特别是关于一种语音异常信号检测系统。
背景技术
帕金森病(PD)是一种常见的中枢神经系统神经变性疾病,至今医学界尚未明确帕金森病的病因,也还未找到一种能够治愈病症的方法,有研究表明,在病发初期,对病人进行合理的治疗,可以在很大程度上减缓病情的发展,大大改善患者的生活质量。因此对于病情的早期诊断就显得尤为重要。然而,帕金森病的早期症状容易与患者身体机能的老化所混淆,因此早期的帕金森病诊断极其困难。目前帕金森病的诊断仍是由医生凭借临床经验经验对患者的病史和体检并且结合问卷调查的方式来得出结论,这项工作不仅耗时耗力,而且由于临床医生个人的主观性,对判断结果也会带来不同的影响。要想按照严格的临床标准,准确的排除极似病人方法比较复杂费用比较昂贵,如CT、正电子发射体层摄影术(PET)等。也正是由于早期病症不明显,因此也就不能提醒人们及时的进行诊断。
在帕金森病症的各种表现中,语音障碍为典型的病症之一,大约90%的帕金森病人会出现不同程度的语音障碍,并且语音的采集方法较为简单,因此帕金森病的语音诊断近年来收到越来越多的关注。牛津大学的Max A.Little研究小组在2007年开始进行对帕金森病的语音方面的研究。该小组分别对31人进行语音数据采集,一共采集195条语音样本,该数据于2008年被列入美国California大学的UCI数据库。虽然取得较高的正确判断率,但支持向量机的原理无法用物理意义进行解释,在医学领域不具备说服力。
在语音障碍诊断方面当前都是以分类为基本原则,但诊断过程本身为决策过程。三支决策具有良好的可解释性的决策过程,如何通过三支决策分类器对帕金森病的语音异常信号进行决策分类成为目前亟需解决的技术问题。
发明内容
针对上述问题,本发明的目的是提供一种语音异常信号检测系统,该系统成本较低,而且具有较高的准确率,使用较为便捷。
为实现上述目的,本发明采取以下技术方案:一种语音异常信号检测系统,其特征在于:该系统包括数据训练模块、训练三支决策分类器模块、优化三支决策分类器模块、测试数据模块和决策分类模块;所述数据训练模块将待测数据处理后传输至所述训练三支决策分类器模块,由所述训练三支决策分类器模块对处理后的待测数据进行分类;分类后的待测数据传输至所述优化三支决策分类器模块内,由所述优化三支决策分类器模块进行优化处理,优化处理后的待测数据与所述测试数据模块获得的实际测试正常数据传输至所述决策分类模块内,实现对语音异常信号的检测。
进一步,所述训练三支决策分类器模块内的三支决策分类器构建方法如下:1)设论域U={x1,...xn,...,xN},xn是其中的某一对象,A={a1,...,ad,...,aD}是对象的D维特征集合,设V={V1,...,Vd,...,VD}为对象xn特征集合A的数值集合,其中 为xn的特征ad的值,设集合类别X={X1,...,Xk,...,XK},表示对象类别;2)将高维数据降维映射到二维平面,降维映射后,每一个数列就表示一个特征,判断区间也变为一维;3)对于某一测试数据,以该测试数据在各特征上的数值为中心,选取长度r为判断半径;4)对于一条待测数据对象xn,其特征ad的值为在特征ad上若以为中心,以长度r为半径,划分判断区间Rd,5)分别计算该判断区间内属于不同类别的样本的数目ck,0≤ck≤B,则在特征ad上该数据属于某一类别Xk的概率为:
进一步,所述步骤4)中,判断区间半径r的选取过程如下:4.1)将测试数据归一化后,全部特征的数值都分布在区间[0,1]上,根据实际需求的预设精度,首先将半径r的初始值rsta设定为0,步进rstp为0.01个单位,最大rend为1;4.2)经步骤4.1)计算后,选出分类最高精度P1,并且得到该精度下的r值:r=n1·0.01,式中,1≤n1≤100;此时有:n1·0.01≥(n1-1)·0.01,且n1·0.01≥(n1+1)·0.01;4.3)重设初始值rsta值和最大rend:
4.4)经步骤4.3)计算后,得出分类最高精度P2,如果有P2>P1,则此时:
r=(n1-1)·0.01+n2·0.001;
4.5)根据上述步骤进行迭代,直至Pi+1≤Pi结束,得到最高分类精度Pi和此时半径:
进一步,所述步骤6)中,具体分类过程如下:6.1)在阈值为[0,1]的情况下,若概率则说明在此种特征上做判断,该数据属于类Xk,对于类Xk而言,判断区间Rd相当于三支决策中的正域;6.2)若概率则说明该数据不属于类别Xk,对于类Xk而言,判断区间Rd相当于三支决策中的负域;6.3)若则不做决断,然后进行下一个特征判断,直到所有对于类Xk,判断区间Rd相当于三支决策中的边界域;等到所有的特征都判断完毕,再分别将各个类别在所有特征上的概率加和:
得到集合P=[P1,...,Pk,...PK],每一个概率Pk分别对应一个类别Xk,取max[P1,...,Pk,...,PK]所对应的类别为最终的判断结果。
进一步,所述优化三支决策分类器模块内设置有距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块;分类后的待测数据依次经所述距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块进行优化。
进一步,所述距离权重模块的具体优化过程如下:(1)设论域U外一条测试数据x,其特征ad的数值为vd;在训练数据集特征ad上,以vd为中心,以某一适当的长度γ为半径,在Vd上划分出一块空间[vd-γ,vd+γ],此空间作为判别空间;在此空间内,存在类别Xk的样本数量为i,1≤i≤N,每个样本的数值到vd的欧氏距离为:则,该类别样本到vd的平均欧氏距为:
式中,Ek表示某类别样本数据到测试数据的平均距离;定义测试数据x到类别Xk在距离上的系数为:
(2)采用高斯函数对每个数据的权重进行调节,得到测试样本x属于每一种类别的概率为:
进一步,所述步骤(2)中,具体调节过程如下:(2.1)高斯函数的表达式为:
式中,μ是期望,σ是标准差;对于某条测试数据x,将其特征ad的数值vd视为高斯函数的期望μ,再通过预先设定的标准差σ,得出适用于样本训练的高斯函数f;在判断区间[vd-r,vd+r]上,存在M个数据样本,这些样本的特征ad值则这些特征值在高斯函数f上的取值为且(2.2)设在M个训练数据中,有m个样本属于类别X1,那么在判断区间[vd-r,vd+r]上,X1的分布权重为:
(2.3)设该判断区间内,共包含n种类别的数据,则实现对每个数据的权重进行调节。
进一步,所述重叠度权重优化模块的具体优化过程如下:(1)设特征的权重为wd为:
式中,Cp、Cq分别表示两个不同的类别;CSL表示两个不同类别的重叠度;(2)对所有特征做与步骤(1)同样的计算得到权重集合[w1,...,wd,...wD];(3)将测试样本x属于每一种类别的概率修改为:
进一步,所述AdaBoost优化优化模块的具体优化过程为:利用AdaBoost算法对引入重叠度的三支决策分类器进行优化,在每一次迭代中,数据的分布发生改变,每一维特征上的重叠度权重和最佳判断区间半径也随之发生改变,得到新的W集合和判断区间半径r值,即为在此次迭代中,弱三支决策分类器的可调参数,参数的改变将产生不同的若分类器模型,迭代结束后,将每一个弱分类器乘以其权重然后加和便得到强化后了的分类器。
本发明由于采取以上技术方案,其具有以下优点:1、本发明采用的三支决策分类器使数据自然生长,利用权重的调节自发性的划分出分布区域。尊重原始数据的自身信息,并不对数据进行强行的映射或者用线性、非线性的方法进行划分。数据的自然生长更能体现出其所具有的意义,因此在应用到帕金森病的语音异常检测中取得了非常好的分类效果,并且该方法是在完全可视化条件下发生,具备良好的可解释性。2、本发明对三支决策分类器采用距离权重、重叠度权重及AdaBoost进行优化,利用UCI数据库中的帕金森病语音特征集和自采集的语音特征集对三支决策分类器进行实验测试,在帕金森病的语音诊断中获得了较为优越的性能,具备实用价值。
附图说明
图1是本发明的整体结构示意图。
具体实施方式
下面结合附图和实施例对本发明进行详细的描述。
如图1所示,本发明提供一种语音异常信号检测系统,其包括数据训练模块、训练三支决策分类器模块、优化三支决策分类器模块、测试数据模块和决策分类模块。数据训练模块将待测数据处理后传输至训练三支决策分类器模块,由训练三支决策分类器模块对处理后的待测数据进行分类;分类后的待测数据传输至优化三支决策分类器模块内,由优化三支决策分类器模块进行优化处理,优化处理后的待测数据与测试数据模块获得的实际测试正常数据传输至决策分类模块内,实现对语音异常信号的检测。
在一个优选地实施例中,训练三支决策分类器模块内的三支决策分类器构建方法如下:
1)设论域U={x1,...xn,...,xN},xn是其中的某一对象,A={a1,...,ad,...,aD}是对象的D维特征集合,设V={V1,...,Vd,...,VD}为对象xn特征集合A的数值集合,其中 为xn的特征ad的值,设集合类别X={X1,...,Xk,...,XK},表示对象类别。
2)将高维数据降维映射到二维平面,降维映射后,每一个数列就表示一个特征,判断区间也变为一维。
3)对于某一测试数据,以该测试数据在各特征上的数值为中心,选取长度r为判断半径。
5)分别计算该判断区间内属于不同类别的样本的数目ck,0≤ck≤B,则在特征ad上该数据属于某一类别Xk的概率为:
式中,B为判断区间内样本的总数。
得到集合P=[P1,...,Pk,...PK],每一个概率Pk分别对应一个类别Xk,取max[P1,...,Pk,...,PK]所对应的类别为最终的判断结果。
上述步骤4)中,由于在分类器建模时,判断区间半径r的选取直接关系着分类效果。因此,本发明在该分类器r的选择时,采取单位距离步进的方法来选取,通过地毯式的搜索来选取最佳r值。具体过程如下:
4.1)将测试数据归一化后,全部特征的数值都分布在区间[0,1]上,根据实际需求的预设精度,首先将半径r的初始值rsta设定为0,步进rstp为0.01个单位,最大rend为1。
4.2)经步骤4.1)计算后,选出分类最高精度P1,并且得到该精度下的r值:
r=n1·0.01 (3)
式中,1≤n1≤100。此时有:
n1·0.01≥(n1-1)·0.01 (4)
且n1·0.01≥(n1+1)·0.01。
4.3)重设初始值rsta值和最大rend:
4.4)经步骤4.3)计算后,得出分类最高精度P2,如果有P2>P1,则此时:
r=(n1-1)·0.01+n2·0.001 (6)
4.5)根据上述步骤进行迭代,直至Pi+1≤Pi结束,得到最高分类精度Pi和此时半径:
在一个优选地实施例中,优化三支决策分类器模块内设置有距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块。分类后的待测数据依次经距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块进行优化。其中:
距离权重模块的具体优化过程如下:
(1)设论域U外一条测试数据x,其特征ad的数值为vd。在训练数据集特征ad上,以vd为中心,以某一适当的长度γ为半径,在Vd上划分出一块空间[vd-γ,vd+γ],此空间作为判别空间。在此空间内,存在类别Xk的样本数量为i,1≤i≤N,每个样本的数值到vd的欧氏距离为:
则,该类别样本到vd的平均欧氏距为:
式中,Ek表示某类别样本数据到测试数据的平均距离。从式中可以看出,Ek越大则表示Xk的样本距离测试数据x就越远,因此x属于类别Xk的概率就越小。所以定义测试数据x到类别Xk在距离上的系数为:
式中,O为测试数据到类别Xk在距离上的系数,则其原概率可修正为:
(2)在计算距离权重时,将某个类别的全部数据当作一个整体,计算这个整体的质心到测试数据的距离,进而计算该类别的分布权重,但是也因此忽略了相同类别中不同数据间在距离上的个体差异,为了体现出这种个体差异,本发明引入高斯函数对每个数据的权重进行调节。
(2.1)高斯函数的表达式为:
式中,μ是期望,σ是标准差。若高斯函数值在x为期望值μ时取得最大值,x越远离期望值函数值越小。
对于某条测试数据x,将其特征ad的数值vd视为高斯函数的期望μ,再通过预先设定的标准差σ,得出适用于样本训练的高斯函数f。在判断区间[vd-r,vd+r]上,存在M个数据样本,这些样本的特征ad值则这些特征值在高斯函数f上的取值为且越靠近测试数据的样本其的值就越大,也就说明测试数据与该样本的相似性就更大。
(2.2)设在M个训练数据中,有m个样本属于类别X1,那么在判断区间[vd-r,vd+r]上,X1的分布权重为:
(2.3)设该判断区间内,共包含n种类别的数据,则测试样本x属于每一种类别的概率为:
重叠度权重优化模块的具体优化过程如下:
对于三支决策分类器而言,在每一个特征上的判断都是独立进行,原始的三支决策分类器每个特征的权重都是一样的,因叠度概念后,此不能体现不同特征分类效果的差别,本发明采用重计算不同数据上数据的混合程度,然后基于此计算不同特征的权重,即以区分不同特征在分类程度上的贡献。
(1)设特征的权重为wd为:
式中,Cp、Cq分别表示两个不同的类别;CSL表示两个不同类别的重叠度。混叠度越小则特征所占权重就越大,反之亦然。
(2)对所有特征做与步骤(1)同样的计算得到权重集合[w1,...,wd,...wD];
(3)将测试样本x属于每一种类别的概率修改为:
本发明引入重叠度使得不同特征在分类性能上的差异得以区分对待,更符合数据的实际分布类别。
AdaBoost优化优化模块的具体优化过程为:利用AdaBoost算法对引入重叠度的三支决策分类器进行优化,在每一次迭代中,数据的分布发生改变,每一维特征上的重叠度权重和最佳判断区间半径也随之发生改变,得到新的W集合和判断区间半径r值,即为在此次迭代中,弱三支决策分类器的可调参数,参数的改变将产生不同的若分类器模型,迭代结束后,将每一个弱分类器乘以其权重然后加和便得到强化后了的分类器。
由于AdaBoost算法是一种分类器的加强算法,其本质其实是改变了数据的分布特性,在每一次迭代中,计算错误分类率,根据这个错误分类率,对重新调整每一个数据的权重。被正确分类的数据的权重减小,错误分类的数据的权重增大。这样便得出新的数据分布,然后根据这个分布在训练下一个分类器。这样通过若干次迭代,便得到同样个数的分类器,再将全部弱分类器集合起来,便得到一个加强的分类器,作为最后的决策分类器,以提高正确分类率。
实施例:
在本实施中测试数据选择UCI数据集中的帕金森语音特征集,UCI数据集是加州大学欧文分校建立的数据库,是目前世界上具有权威性的机器学习数据库,被广泛的用于各方面的科研项目中,因此,从客观公正的角度出发,所使用的数据集便使用该库中的帕金森病语音特征集,该特征数据集包含22维语音特征。
此外,共对4名帕金森病人和1名健康者进行实地语音采集,每人各元音分别采集一段语音,最后共采集到25条语音数据。然后利用语音特征处理工具对语音信号提取的特征数据,共提取了18个特征的数据。然后,利用两个数据集对原始三支决策分类器,及其优化方案进行试验测试。
本发明采用留一法为测试方法,这样可以最大程度发挥数据的价值。首先比较原始三支决策分类器及其引入不同距离权重优化后的三支决策分类器对帕金森病语音特征的分类性能。
表1至表2显示了引入重叠度概念并利用AdaBoost优化后的三支决策分类器的分类结果.
表2AdaBoost_TWDC在UCI帕金森语音特征数据集合上的分类器结果
表3AdaBoost_TWDC在自采集音特征数据集合上的分类器结果
表1中,对UCI帕金森语音特征数据集进行诊断分类,一次迭代后得到的分类结果超过了原始的TWDC,说明这种优化方式取得了优化效果。表1中,对自采集的语音特征集进行诊断分类,得到了最高80%的分类精度,也因为自采集的数据集并不具有完备性,因此该结果并不能全面的证明这种优化方式下的三支决策分类器的性能优劣。
综上所述,本发明主要是对三支决策分类器在帕金森病的语音异常检测上的性能进行研究。首先解释了三支决策思想的基本概念和三支决策分类器的基本构造方法,然后对三支决策分类器从距离权重、重叠度权重及引入AdaBoost算法进行优化。最后利用UCI数据库中的帕金森病语音特征集和自采集的语音特征集对三支决策分类器进行实验测试,测试结果表明,三支决策分类器在帕金森病的语音诊断中表现出了较为优越的性能,三支决策分类器具备实用价值。
上述各实施例仅用于说明本发明,各部件的结构、尺寸、设置位置及形状都是可以有所变化的,在本发明技术方案的基础上,凡根据本发明原理对个别部件进行的改进和等同变换,均不应排除在本发明的保护范围之外。
Claims (8)
1.一种语音异常信号检测系统,其特征在于:该系统包括数据训练模块、训练三支决策分类器模块、优化三支决策分类器模块、测试数据模块和决策分类模块;所述数据训练模块将待测数据处理后传输至所述训练三支决策分类器模块,由所述训练三支决策分类器模块对处理后的待测数据进行分类;分类后的待测数据传输至所述优化三支决策分类器模块内,由所述优化三支决策分类器模块进行优化处理,优化处理后的待测数据与所述测试数据模块获得的实际测试正常数据传输至所述决策分类模块内,实现对语音异常信号的检测;
所述优化三支决策分类器模块内设置有距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块;分类后的待测数据依次经所述距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块进行优化。
2.如权利要求1所述的一种语音异常信号检测系统,其特征在于:所述训练三支决策分类器模块内的三支决策分类器构建方法如下:
1)设论域U={x1,...xn,...,xN},xn是其中的某一对象,A={a1,...,ad,...,aD}是对象的D维特征集合,设为对象xn特征集合A的数值集合,其中 为xn的特征ad的值,设集合类别X={X1,...,Xk,...,XK},表示对象类别;
2)将高维数据降维映射到二维平面,降维映射后,每一个数列就表示一个特征,判断区间也变为一维;
3)对于某一测试数据,以该测试数据在各特征上的数值为中心,选取长度r为判断半径;
5)分别计算该判断区间内属于不同类别的样本的数目ck,0≤ck≤B,则在特征ad上该数据属于某一类别Xk的概率为:
式中,B为判断区间内样本的总数;
3.如权利要求2所述的一种语音异常信号检测系统,其特征在于:所述步骤4)中,判断区间半径r的选取过程如下:
4.1)将测试数据归一化后,全部特征的数值都分布在区间[0,1]上,根据实际需求的预设精度,首先将半径r的初始值rsta设定为0,步进rstp为0.01个单位,最大rend为1;
4.2)经步骤4.1)计算后,选出分类最高精度P1,并且得到该精度下的r值:
r=n1·0.01
式中,1≤n1≤100;此时有:
n1·0.01≥(n1-1)·0.01
且n1·0.01≥(n1+1)·0.01;
4.3)重设初始值rsta值和最大rend:
4.4)经步骤4.3)计算后,得出分类最高精度P2,如果有P2>P1,则此时:
r=(n1-1)·0.01+n2·0.001;
4.5)根据上述步骤进行迭代,直至Pi+1≤Pi结束,得到最高分类精度Pi和此时半径:
4.如权利要求2所述的一种语音异常信号检测系统,其特征在于:所述步骤6)中,具体分类过程如下:
5.如权利要求1所述的一种语音异常信号检测系统,其特征在于:所述距离权重模块的具体优化过程如下:
(1)设论域U外一条测试数据x,其特征ad的数值为vd;在训练数据集特征ad上,以vd为中心,以某一适当的长度γ为半径,在Vd上划分出一块空间[vd-γ,vd+γ],此空间作为判别空间;在此空间内,存在类别Xk的样本数量为i,1≤i≤N,每个样本的数值到vd的欧氏距离为:
则,该类别样本到vd的平均欧氏距为:
式中,Ek表示某类别样本数据到测试数据的平均距离;定义测试数据x到类别Xk在距离上的系数为:
式中,O为测试数据到类别Xk在距离上的系数,则其原概率可修正为:
(2)采用高斯函数对每个数据的权重进行调节,得到测试样本x属于每一种类别的概率为:
8.如权利要求1所述的一种语音异常信号检测系统,其特征在于:所述AdaBoost优化优化模块的具体优化过程为:利用AdaBoost算法对引入重叠度的三支决策分类器进行优化,在每一次迭代中,数据的分布发生改变,每一维特征上的重叠度权重和最佳判断区间半径也随之发生改变,得到新的W集合和判断区间半径r值,即为在此次迭代中,弱三支决策分类器的可调参数,参数的改变将产生不同的若分类器模型,迭代结束后,将每一个弱分类器乘以其权重然后加和便得到强化后了的分类器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611170425.2A CN106601271B (zh) | 2016-12-16 | 2016-12-16 | 一种语音异常信号检测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611170425.2A CN106601271B (zh) | 2016-12-16 | 2016-12-16 | 一种语音异常信号检测系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106601271A CN106601271A (zh) | 2017-04-26 |
CN106601271B true CN106601271B (zh) | 2020-05-22 |
Family
ID=58599763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611170425.2A Expired - Fee Related CN106601271B (zh) | 2016-12-16 | 2016-12-16 | 一种语音异常信号检测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106601271B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107170443A (zh) * | 2017-05-12 | 2017-09-15 | 北京理工大学 | 一种模型训练层AdaBoost算法的参数优化方法 |
CN107808663B (zh) * | 2017-10-25 | 2021-04-27 | 重庆大学 | 基于dbn和rf算法的帕金森病语音数据分类系统 |
CN109616141B (zh) * | 2019-01-03 | 2022-01-11 | 燕山大学 | 发音异常检测方法 |
CN110826587B (zh) * | 2019-08-15 | 2024-03-19 | 南京航空航天大学 | 基于改进的加权一类支持向量机的涡轴发动机故障检测方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198605A (zh) * | 2013-03-11 | 2013-07-10 | 成都百威讯科技有限责任公司 | 室内突发异常事件报警系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101808810B1 (ko) * | 2013-11-27 | 2017-12-14 | 한국전자통신연구원 | 음성/무음성 구간 검출 방법 및 장치 |
-
2016
- 2016-12-16 CN CN201611170425.2A patent/CN106601271B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198605A (zh) * | 2013-03-11 | 2013-07-10 | 成都百威讯科技有限责任公司 | 室内突发异常事件报警系统 |
Non-Patent Citations (4)
Title |
---|
基于三支决策的海量数据分类方法研究及其在视频异常检测中的应用;李萍;《中国优秀硕士学位论文全文数据库》;20161031;全文 * |
基于三支决策粗糙集的视频异常行为检测;谢骋,商琳;《南京大学学报》;20130731;第49卷(第4期);全文 * |
基于语音特征的帕金森病可视化诊断方法研究;张涛;《中国博士学位论文全文数据库》;20120831;全文 * |
帕金森语音特征提取软件开发及三支决策诊断方法研究;杨沫;《中国优秀硕士学位论文全文数据库》;20170131;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN106601271A (zh) | 2017-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Seeböck et al. | Unsupervised identification of disease marker candidates in retinal OCT imaging data | |
CN106601271B (zh) | 一种语音异常信号检测系统 | |
CN111986811B (zh) | 一种基于算法和大数据的疾病预测系统 | |
Nandpuru et al. | MRI brain cancer classification using support vector machine | |
CN106295124B (zh) | 多种图像检测技术综合分析基因子图相似概率量的方法 | |
CN111000553B (zh) | 一种基于投票集成学习的心电数据智能分类方法 | |
CN110604550B (zh) | 一种肿瘤放疗后正常组织器官并发症预测模型的建立方法 | |
CN105930663B (zh) | 一种基于演化模糊规则的手部震颤信号及音频信号分类方法 | |
CN111009321A (zh) | 一种机器学习分类模型在青少年孤独症辅助诊断中的应用方法 | |
CN103593674B (zh) | 一种颈部淋巴结超声图像特征选择方法 | |
CN107729926A (zh) | 一种基于高维空间变换的数据扩增方法、机器识别系统 | |
Lederman et al. | Alternating diffusion for common manifold learning with application to sleep stage assessment | |
CN106548041A (zh) | 一种基于先验信息和并行二进制微粒群算法的肿瘤关键基因识别方法 | |
CN110786849A (zh) | 基于多视图鉴别分析的心电信号身份识别方法及系统 | |
CN112215259A (zh) | 基因选择方法和装置 | |
CN114596253A (zh) | 一种基于脑成像基因组特征的阿尔兹海默症识别方法 | |
Bouguerra et al. | Brain Tumor Classification Based Deep Transfer Learning Approaches | |
CN117195027A (zh) | 基于成员选择的簇加权聚类集成方法 | |
Ubaidillah et al. | Classification of liver cancer using artificial neural network and support vector machine | |
CN111709441A (zh) | 基于改进特征子集区分度的行为识别特征选择方法 | |
Sadiq et al. | Diagnosis of Alzheimer's Disease Using Pearson's Correlation and ReliefF Feature Selection Approach | |
KR101750107B1 (ko) | 사상 체질 판별을 위한 얼굴 영상 분석 방법 | |
Kavitha et al. | Brain tumour detection using self-adaptive learning PSO-based feature selection algorithm in MRI images | |
KR20100001177A (ko) | 주성분 분석을 이용한 유전자 선택 알고리즘 | |
CN113284512B (zh) | 一种基于深度稀疏迁移学习的帕金森语音分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200426 Address after: 066004 No. 8-1-6, Huayuan xinju, Qinhuangdao Economic and Technological Development Zone, Hebei Province Applicant after: Hebei Jitu Technology Co.,Ltd. Address before: 100000 No. 9 West Fourth Ring Road, Beijing, Haidian District 2104-110 Applicant before: BEIJING LINGZHONG BOTONG TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200522 Termination date: 20211216 |