CN106601271B - 一种语音异常信号检测系统 - Google Patents

一种语音异常信号检测系统 Download PDF

Info

Publication number
CN106601271B
CN106601271B CN201611170425.2A CN201611170425A CN106601271B CN 106601271 B CN106601271 B CN 106601271B CN 201611170425 A CN201611170425 A CN 201611170425A CN 106601271 B CN106601271 B CN 106601271B
Authority
CN
China
Prior art keywords
data
module
training
value
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201611170425.2A
Other languages
English (en)
Other versions
CN106601271A (zh
Inventor
张涛
李林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei Jitu Technology Co ltd
Original Assignee
Hebei Jitu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei Jitu Technology Co Ltd filed Critical Hebei Jitu Technology Co Ltd
Priority to CN201611170425.2A priority Critical patent/CN106601271B/zh
Publication of CN106601271A publication Critical patent/CN106601271A/zh
Application granted granted Critical
Publication of CN106601271B publication Critical patent/CN106601271B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Evolutionary Computation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种语音异常信号检测系统,其包括数据训练模块、训练三支决策分类器模块、优化三支决策分类器模块、测试数据模块和决策分类模块;所述数据训练模块将待测数据处理后传输至所述训练三支决策分类器模块,由所述训练三支决策分类器模块对处理后的待测数据进行分类;分类后的待测数据传输至所述优化三支决策分类器模块内,由所述优化三支决策分类器模块进行优化处理,优化处理后的待测数据与所述测试数据模块获得的实际测试正常数据传输至所述决策分类模块内,实现对语音异常信号的检测。本发明成本较低,而且具有较高的准确率,使用较为便捷。

Description

一种语音异常信号检测系统
技术领域
本发明涉及一种语音信号检测系统,特别是关于一种语音异常信号检测系统。
背景技术
帕金森病(PD)是一种常见的中枢神经系统神经变性疾病,至今医学界尚未明确帕金森病的病因,也还未找到一种能够治愈病症的方法,有研究表明,在病发初期,对病人进行合理的治疗,可以在很大程度上减缓病情的发展,大大改善患者的生活质量。因此对于病情的早期诊断就显得尤为重要。然而,帕金森病的早期症状容易与患者身体机能的老化所混淆,因此早期的帕金森病诊断极其困难。目前帕金森病的诊断仍是由医生凭借临床经验经验对患者的病史和体检并且结合问卷调查的方式来得出结论,这项工作不仅耗时耗力,而且由于临床医生个人的主观性,对判断结果也会带来不同的影响。要想按照严格的临床标准,准确的排除极似病人方法比较复杂费用比较昂贵,如CT、正电子发射体层摄影术(PET)等。也正是由于早期病症不明显,因此也就不能提醒人们及时的进行诊断。
在帕金森病症的各种表现中,语音障碍为典型的病症之一,大约90%的帕金森病人会出现不同程度的语音障碍,并且语音的采集方法较为简单,因此帕金森病的语音诊断近年来收到越来越多的关注。牛津大学的Max A.Little研究小组在2007年开始进行对帕金森病的语音方面的研究。该小组分别对31人进行语音数据采集,一共采集195条语音样本,该数据于2008年被列入美国California大学的UCI数据库。虽然取得较高的正确判断率,但支持向量机的原理无法用物理意义进行解释,在医学领域不具备说服力。
在语音障碍诊断方面当前都是以分类为基本原则,但诊断过程本身为决策过程。三支决策具有良好的可解释性的决策过程,如何通过三支决策分类器对帕金森病的语音异常信号进行决策分类成为目前亟需解决的技术问题。
发明内容
针对上述问题,本发明的目的是提供一种语音异常信号检测系统,该系统成本较低,而且具有较高的准确率,使用较为便捷。
为实现上述目的,本发明采取以下技术方案:一种语音异常信号检测系统,其特征在于:该系统包括数据训练模块、训练三支决策分类器模块、优化三支决策分类器模块、测试数据模块和决策分类模块;所述数据训练模块将待测数据处理后传输至所述训练三支决策分类器模块,由所述训练三支决策分类器模块对处理后的待测数据进行分类;分类后的待测数据传输至所述优化三支决策分类器模块内,由所述优化三支决策分类器模块进行优化处理,优化处理后的待测数据与所述测试数据模块获得的实际测试正常数据传输至所述决策分类模块内,实现对语音异常信号的检测。
进一步,所述训练三支决策分类器模块内的三支决策分类器构建方法如下:1)设论域U={x1,...xn,...,xN},xn是其中的某一对象,A={a1,...,ad,...,aD}是对象的D维特征集合,设V={V1,...,Vd,...,VD}为对象xn特征集合A的数值集合,其中
Figure BDA0001183369280000021
Figure BDA0001183369280000022
为xn的特征ad的值,设集合类别X={X1,...,Xk,...,XK},表示对象类别;2)将高维数据降维映射到二维平面,降维映射后,每一个数列就表示一个特征,判断区间也变为一维;3)对于某一测试数据,以该测试数据在各特征上的数值为中心,选取长度r为判断半径;4)对于一条待测数据对象xn,其特征ad的值为
Figure BDA0001183369280000023
在特征ad上若以
Figure BDA0001183369280000024
为中心,以长度r为半径,划分判断区间Rd
Figure BDA0001183369280000025
5)分别计算该判断区间内属于不同类别的样本的数目ck,0≤ck≤B,则在特征ad上该数据属于某一类别Xk的概率为:
Figure BDA0001183369280000026
式中,B为判断区间内样本的总数;6)根据概率
Figure BDA0001183369280000027
判断测试数据类别,完成分类。
进一步,所述步骤4)中,判断区间半径r的选取过程如下:4.1)将测试数据归一化后,全部特征的数值都分布在区间[0,1]上,根据实际需求的预设精度,首先将半径r的初始值rsta设定为0,步进rstp为0.01个单位,最大rend为1;4.2)经步骤4.1)计算后,选出分类最高精度P1,并且得到该精度下的r值:r=n1·0.01,式中,1≤n1≤100;此时有:n1·0.01≥(n1-1)·0.01,且n1·0.01≥(n1+1)·0.01;4.3)重设初始值rsta值和最大rend
Figure BDA0001183369280000028
Figure BDA0001183369280000029
4.4)经步骤4.3)计算后,得出分类最高精度P2,如果有P2>P1,则此时:
r=(n1-1)·0.01+n2·0.001;
4.5)根据上述步骤进行迭代,直至Pi+1≤Pi结束,得到最高分类精度Pi和此时半径:
Figure BDA00011833692800000210
进一步,所述步骤6)中,具体分类过程如下:6.1)在阈值为[0,1]的情况下,若概率
Figure BDA00011833692800000211
则说明在此种特征上做判断,该数据属于类Xk,对于类Xk而言,判断区间Rd相当于三支决策中的正域;6.2)若概率
Figure BDA00011833692800000212
则说明该数据不属于类别Xk,对于类Xk而言,判断区间Rd相当于三支决策中的负域;6.3)若
Figure BDA0001183369280000031
则不做决断,然后进行下一个特征判断,直到所有对于类Xk,判断区间Rd相当于三支决策中的边界域;等到所有的特征都判断完毕,再分别将各个类别在所有特征上的概率加和:
Figure BDA0001183369280000032
得到集合P=[P1,...,Pk,...PK],每一个概率Pk分别对应一个类别Xk,取max[P1,...,Pk,...,PK]所对应的类别为最终的判断结果。
进一步,所述优化三支决策分类器模块内设置有距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块;分类后的待测数据依次经所述距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块进行优化。
进一步,所述距离权重模块的具体优化过程如下:(1)设论域U外一条测试数据x,其特征ad的数值为vd;在训练数据集特征ad上,以vd为中心,以某一适当的长度γ为半径,在Vd上划分出一块空间[vd-γ,vd+γ],此空间作为判别空间;在此空间内,存在类别Xk的样本数量为i,1≤i≤N,每个样本的数值到vd的欧氏距离为:
Figure BDA0001183369280000033
则,该类别样本到vd的平均欧氏距为:
Figure BDA0001183369280000034
式中,Ek表示某类别样本数据到测试数据的平均距离;定义测试数据x到类别Xk在距离上的系数为:
Figure BDA0001183369280000035
式中,O为测试数据到类别Xk在距离上的系数,则其原概率可修正为:
Figure BDA0001183369280000036
(2)采用高斯函数对每个数据的权重进行调节,得到测试样本x属于每一种类别的概率为:
Figure BDA0001183369280000037
进一步,所述步骤(2)中,具体调节过程如下:(2.1)高斯函数的表达式为:
Figure BDA0001183369280000038
式中,μ是期望,σ是标准差;对于某条测试数据x,将其特征ad的数值vd视为高斯函数的期望μ,再通过预先设定的标准差σ,得出适用于样本训练的高斯函数f;在判断区间[vd-r,vd+r]上,存在M个数据样本,这些样本的特征ad
Figure BDA0001183369280000041
则这些特征值在高斯函数f上的取值为
Figure BDA0001183369280000042
Figure BDA0001183369280000043
(2.2)设在M个训练数据中,有m个样本属于类别X1,那么在判断区间[vd-r,vd+r]上,X1的分布权重为:
Figure BDA0001183369280000044
(2.3)设该判断区间内,共包含n种类别的数据,则实现对每个数据的权重进行调节。
进一步,所述重叠度权重优化模块的具体优化过程如下:(1)设特征的权重为wd为:
Figure BDA0001183369280000045
式中,Cp、Cq分别表示两个不同的类别;CSL表示两个不同类别的重叠度;(2)对所有特征做与步骤(1)同样的计算得到权重集合[w1,...,wd,...wD];(3)将测试样本x属于每一种类别的概率修改为:
Figure BDA0001183369280000046
进一步,所述AdaBoost优化优化模块的具体优化过程为:利用AdaBoost算法对引入重叠度的三支决策分类器进行优化,在每一次迭代中,数据的分布发生改变,每一维特征上的重叠度权重和最佳判断区间半径也随之发生改变,得到新的W集合和判断区间半径r值,即为在此次迭代中,弱三支决策分类器的可调参数,参数的改变将产生不同的若分类器模型,迭代结束后,将每一个弱分类器乘以其权重然后加和便得到强化后了的分类器。
本发明由于采取以上技术方案,其具有以下优点:1、本发明采用的三支决策分类器使数据自然生长,利用权重的调节自发性的划分出分布区域。尊重原始数据的自身信息,并不对数据进行强行的映射或者用线性、非线性的方法进行划分。数据的自然生长更能体现出其所具有的意义,因此在应用到帕金森病的语音异常检测中取得了非常好的分类效果,并且该方法是在完全可视化条件下发生,具备良好的可解释性。2、本发明对三支决策分类器采用距离权重、重叠度权重及AdaBoost进行优化,利用UCI数据库中的帕金森病语音特征集和自采集的语音特征集对三支决策分类器进行实验测试,在帕金森病的语音诊断中获得了较为优越的性能,具备实用价值。
附图说明
图1是本发明的整体结构示意图。
具体实施方式
下面结合附图和实施例对本发明进行详细的描述。
如图1所示,本发明提供一种语音异常信号检测系统,其包括数据训练模块、训练三支决策分类器模块、优化三支决策分类器模块、测试数据模块和决策分类模块。数据训练模块将待测数据处理后传输至训练三支决策分类器模块,由训练三支决策分类器模块对处理后的待测数据进行分类;分类后的待测数据传输至优化三支决策分类器模块内,由优化三支决策分类器模块进行优化处理,优化处理后的待测数据与测试数据模块获得的实际测试正常数据传输至决策分类模块内,实现对语音异常信号的检测。
在一个优选地实施例中,训练三支决策分类器模块内的三支决策分类器构建方法如下:
1)设论域U={x1,...xn,...,xN},xn是其中的某一对象,A={a1,...,ad,...,aD}是对象的D维特征集合,设V={V1,...,Vd,...,VD}为对象xn特征集合A的数值集合,其中
Figure BDA0001183369280000051
Figure BDA0001183369280000052
为xn的特征ad的值,设集合类别X={X1,...,Xk,...,XK},表示对象类别。
2)将高维数据降维映射到二维平面,降维映射后,每一个数列就表示一个特征,判断区间也变为一维。
3)对于某一测试数据,以该测试数据在各特征上的数值为中心,选取长度r为判断半径。
4)对于一条待测数据对象xn,其特征ad的值为
Figure BDA0001183369280000053
在特征ad上若以
Figure BDA0001183369280000054
为中心,以长度r为半径,划分判断区间Rd
Figure BDA0001183369280000055
5)分别计算该判断区间内属于不同类别的样本的数目ck,0≤ck≤B,则在特征ad上该数据属于某一类别Xk的概率为:
Figure BDA0001183369280000056
式中,B为判断区间内样本的总数。
6)根据概率
Figure BDA0001183369280000057
判断测试数据类别,完成分类;具体过程如下:
6.1)在阈值为[0,1]的情况下,若概率
Figure BDA0001183369280000058
则说明在此种特征上做判断,该数据属于类Xk,对于类Xk而言,判断区间Rd相当于三支决策中的正域;
6.2)若概率
Figure BDA0001183369280000059
则说明该数据不属于类别Xk,对于类Xk而言,判断区间Rd相当于三支决策中的负域;
6.3)若
Figure BDA0001183369280000061
则不做决断,然后进行下一个特征判断,直到所有对于类Xk,判断区间Rd相当于三支决策中的边界域;等到所有的特征都判断完毕,再分别将各个类别在所有特征上的概率加和:
Figure BDA0001183369280000062
得到集合P=[P1,...,Pk,...PK],每一个概率Pk分别对应一个类别Xk,取max[P1,...,Pk,...,PK]所对应的类别为最终的判断结果。
上述步骤4)中,由于在分类器建模时,判断区间半径r的选取直接关系着分类效果。因此,本发明在该分类器r的选择时,采取单位距离步进的方法来选取,通过地毯式的搜索来选取最佳r值。具体过程如下:
4.1)将测试数据归一化后,全部特征的数值都分布在区间[0,1]上,根据实际需求的预设精度,首先将半径r的初始值rsta设定为0,步进rstp为0.01个单位,最大rend为1。
4.2)经步骤4.1)计算后,选出分类最高精度P1,并且得到该精度下的r值:
r=n1·0.01 (3)
式中,1≤n1≤100。此时有:
n1·0.01≥(n1-1)·0.01 (4)
且n1·0.01≥(n1+1)·0.01。
4.3)重设初始值rsta值和最大rend
Figure BDA0001183369280000063
Figure BDA0001183369280000064
4.4)经步骤4.3)计算后,得出分类最高精度P2,如果有P2>P1,则此时:
r=(n1-1)·0.01+n2·0.001 (6)
4.5)根据上述步骤进行迭代,直至Pi+1≤Pi结束,得到最高分类精度Pi和此时半径:
Figure BDA0001183369280000065
在一个优选地实施例中,优化三支决策分类器模块内设置有距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块。分类后的待测数据依次经距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块进行优化。其中:
距离权重模块的具体优化过程如下:
(1)设论域U外一条测试数据x,其特征ad的数值为vd。在训练数据集特征ad上,以vd为中心,以某一适当的长度γ为半径,在Vd上划分出一块空间[vd-γ,vd+γ],此空间作为判别空间。在此空间内,存在类别Xk的样本数量为i,1≤i≤N,每个样本的数值到vd的欧氏距离为:
Figure BDA0001183369280000071
则,该类别样本到vd的平均欧氏距为:
Figure BDA0001183369280000072
式中,Ek表示某类别样本数据到测试数据的平均距离。从式中可以看出,Ek越大则表示Xk的样本距离测试数据x就越远,因此x属于类别Xk的概率就越小。所以定义测试数据x到类别Xk在距离上的系数为:
Figure BDA0001183369280000073
式中,O为测试数据到类别Xk在距离上的系数,则其原概率可修正为:
Figure BDA0001183369280000074
(2)在计算距离权重时,将某个类别的全部数据当作一个整体,计算这个整体的质心到测试数据的距离,进而计算该类别的分布权重,但是也因此忽略了相同类别中不同数据间在距离上的个体差异,为了体现出这种个体差异,本发明引入高斯函数对每个数据的权重进行调节。
(2.1)高斯函数的表达式为:
Figure BDA0001183369280000075
式中,μ是期望,σ是标准差。若高斯函数值在x为期望值μ时取得最大值,x越远离期望值函数值越小。
对于某条测试数据x,将其特征ad的数值vd视为高斯函数的期望μ,再通过预先设定的标准差σ,得出适用于样本训练的高斯函数f。在判断区间[vd-r,vd+r]上,存在M个数据样本,这些样本的特征ad
Figure BDA0001183369280000076
则这些特征值在高斯函数f上的取值为
Figure BDA0001183369280000077
Figure BDA0001183369280000078
越靠近测试数据的样本其
Figure BDA0001183369280000079
的值就越大,也就说明测试数据与该样本的相似性就更大。
(2.2)设在M个训练数据中,有m个样本属于类别X1,那么在判断区间[vd-r,vd+r]上,X1的分布权重为:
Figure BDA00011833692800000710
(2.3)设该判断区间内,共包含n种类别的数据,则测试样本x属于每一种类别的概率为:
Figure BDA0001183369280000081
重叠度权重优化模块的具体优化过程如下:
对于三支决策分类器而言,在每一个特征上的判断都是独立进行,原始的三支决策分类器每个特征的权重都是一样的,因叠度概念后,此不能体现不同特征分类效果的差别,本发明采用重计算不同数据上数据的混合程度,然后基于此计算不同特征的权重,即以区分不同特征在分类程度上的贡献。
(1)设特征的权重为wd为:
Figure BDA0001183369280000082
式中,Cp、Cq分别表示两个不同的类别;CSL表示两个不同类别的重叠度。混叠度越小则特征所占权重就越大,反之亦然。
(2)对所有特征做与步骤(1)同样的计算得到权重集合[w1,...,wd,...wD];
(3)将测试样本x属于每一种类别的概率修改为:
Figure BDA0001183369280000083
本发明引入重叠度使得不同特征在分类性能上的差异得以区分对待,更符合数据的实际分布类别。
AdaBoost优化优化模块的具体优化过程为:利用AdaBoost算法对引入重叠度的三支决策分类器进行优化,在每一次迭代中,数据的分布发生改变,每一维特征上的重叠度权重和最佳判断区间半径也随之发生改变,得到新的W集合和判断区间半径r值,即为在此次迭代中,弱三支决策分类器的可调参数,参数的改变将产生不同的若分类器模型,迭代结束后,将每一个弱分类器乘以其权重然后加和便得到强化后了的分类器。
由于AdaBoost算法是一种分类器的加强算法,其本质其实是改变了数据的分布特性,在每一次迭代中,计算错误分类率,根据这个错误分类率,对重新调整每一个数据的权重。被正确分类的数据的权重减小,错误分类的数据的权重增大。这样便得出新的数据分布,然后根据这个分布在训练下一个分类器。这样通过若干次迭代,便得到同样个数的分类器,再将全部弱分类器集合起来,便得到一个加强的分类器,作为最后的决策分类器,以提高正确分类率。
实施例:
在本实施中测试数据选择UCI数据集中的帕金森语音特征集,UCI数据集是加州大学欧文分校建立的数据库,是目前世界上具有权威性的机器学习数据库,被广泛的用于各方面的科研项目中,因此,从客观公正的角度出发,所使用的数据集便使用该库中的帕金森病语音特征集,该特征数据集包含22维语音特征。
此外,共对4名帕金森病人和1名健康者进行实地语音采集,每人各元音分别采集一段语音,最后共采集到25条语音数据。然后利用语音特征处理工具对语音信号提取的特征数据,共提取了18个特征的数据。然后,利用两个数据集对原始三支决策分类器,及其优化方案进行试验测试。
本发明采用留一法为测试方法,这样可以最大程度发挥数据的价值。首先比较原始三支决策分类器及其引入不同距离权重优化后的三支决策分类器对帕金森病语音特征的分类性能。
表1至表2显示了引入重叠度概念并利用AdaBoost优化后的三支决策分类器的分类结果.
表2AdaBoost_TWDC在UCI帕金森语音特征数据集合上的分类器结果
Figure BDA0001183369280000091
表3AdaBoost_TWDC在自采集音特征数据集合上的分类器结果
Figure BDA0001183369280000092
表1中,对UCI帕金森语音特征数据集进行诊断分类,一次迭代后得到的分类结果超过了原始的TWDC,说明这种优化方式取得了优化效果。表1中,对自采集的语音特征集进行诊断分类,得到了最高80%的分类精度,也因为自采集的数据集并不具有完备性,因此该结果并不能全面的证明这种优化方式下的三支决策分类器的性能优劣。
综上所述,本发明主要是对三支决策分类器在帕金森病的语音异常检测上的性能进行研究。首先解释了三支决策思想的基本概念和三支决策分类器的基本构造方法,然后对三支决策分类器从距离权重、重叠度权重及引入AdaBoost算法进行优化。最后利用UCI数据库中的帕金森病语音特征集和自采集的语音特征集对三支决策分类器进行实验测试,测试结果表明,三支决策分类器在帕金森病的语音诊断中表现出了较为优越的性能,三支决策分类器具备实用价值。
上述各实施例仅用于说明本发明,各部件的结构、尺寸、设置位置及形状都是可以有所变化的,在本发明技术方案的基础上,凡根据本发明原理对个别部件进行的改进和等同变换,均不应排除在本发明的保护范围之外。

Claims (8)

1.一种语音异常信号检测系统,其特征在于:该系统包括数据训练模块、训练三支决策分类器模块、优化三支决策分类器模块、测试数据模块和决策分类模块;所述数据训练模块将待测数据处理后传输至所述训练三支决策分类器模块,由所述训练三支决策分类器模块对处理后的待测数据进行分类;分类后的待测数据传输至所述优化三支决策分类器模块内,由所述优化三支决策分类器模块进行优化处理,优化处理后的待测数据与所述测试数据模块获得的实际测试正常数据传输至所述决策分类模块内,实现对语音异常信号的检测;
所述优化三支决策分类器模块内设置有距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块;分类后的待测数据依次经所述距离权重优化模块、重叠度权重优化模块和AdaBoost优化模块进行优化。
2.如权利要求1所述的一种语音异常信号检测系统,其特征在于:所述训练三支决策分类器模块内的三支决策分类器构建方法如下:
1)设论域U={x1,...xn,...,xN},xn是其中的某一对象,A={a1,...,ad,...,aD}是对象的D维特征集合,设
Figure FDA0002180743900000018
为对象xn特征集合A的数值集合,其中
Figure FDA0002180743900000011
Figure FDA0002180743900000012
为xn的特征ad的值,设集合类别X={X1,...,Xk,...,XK},表示对象类别;
2)将高维数据降维映射到二维平面,降维映射后,每一个数列就表示一个特征,判断区间也变为一维;
3)对于某一测试数据,以该测试数据在各特征上的数值为中心,选取长度r为判断半径;
4)对于一条待测数据对象xn,其特征ad的值为
Figure FDA0002180743900000013
在特征ad上若以
Figure FDA0002180743900000014
为中心,以长度r为半径,划分判断区间Rd
Figure FDA0002180743900000015
5)分别计算该判断区间内属于不同类别的样本的数目ck,0≤ck≤B,则在特征ad上该数据属于某一类别Xk的概率为:
Figure FDA0002180743900000016
式中,B为判断区间内样本的总数;
6)根据概率
Figure FDA0002180743900000017
判断测试数据类别,完成分类。
3.如权利要求2所述的一种语音异常信号检测系统,其特征在于:所述步骤4)中,判断区间半径r的选取过程如下:
4.1)将测试数据归一化后,全部特征的数值都分布在区间[0,1]上,根据实际需求的预设精度,首先将半径r的初始值rsta设定为0,步进rstp为0.01个单位,最大rend为1;
4.2)经步骤4.1)计算后,选出分类最高精度P1,并且得到该精度下的r值:
r=n1·0.01
式中,1≤n1≤100;此时有:
n1·0.01≥(n1-1)·0.01
且n1·0.01≥(n1+1)·0.01;
4.3)重设初始值rsta值和最大rend
Figure FDA0002180743900000021
Figure FDA0002180743900000022
4.4)经步骤4.3)计算后,得出分类最高精度P2,如果有P2>P1,则此时:
r=(n1-1)·0.01+n2·0.001;
4.5)根据上述步骤进行迭代,直至Pi+1≤Pi结束,得到最高分类精度Pi和此时半径:
Figure FDA0002180743900000023
4.如权利要求2所述的一种语音异常信号检测系统,其特征在于:所述步骤6)中,具体分类过程如下:
6.1)在阈值为[0,1]的情况下,若概率
Figure FDA0002180743900000024
则说明在此种特征上做判断,该数据属于类Xk,对于类Xk而言,判断区间Rd相当于三支决策中的正域;
6.2)若概率
Figure FDA0002180743900000025
则说明该数据不属于类别Xk,对于类Xk而言,判断区间Rd相当于三支决策中的负域;
6.3)若
Figure FDA0002180743900000026
则不做决断,然后进行下一个特征判断,直到所有对于类Xk,判断区间Rd相当于三支决策中的边界域;等到所有的特征都判断完毕,再分别将各个类别在所有特征上的概率加和:
Figure FDA0002180743900000027
得到集合P=[P1,...,Pk,...PK],每一个概率Pk分别对应一个类别Xk,取
Figure FDA0002180743900000028
所对应的类别为最终的判断结果。
5.如权利要求1所述的一种语音异常信号检测系统,其特征在于:所述距离权重模块的具体优化过程如下:
(1)设论域U外一条测试数据x,其特征ad的数值为vd;在训练数据集特征ad上,以vd为中心,以某一适当的长度γ为半径,在Vd上划分出一块空间[vd-γ,vd+γ],此空间作为判别空间;在此空间内,存在类别Xk的样本数量为i,1≤i≤N,每个样本的数值到vd的欧氏距离为:
Figure FDA0002180743900000031
则,该类别样本到vd的平均欧氏距为:
Figure FDA0002180743900000032
式中,Ek表示某类别样本数据到测试数据的平均距离;定义测试数据x到类别Xk在距离上的系数为:
Figure FDA0002180743900000033
式中,O为测试数据到类别Xk在距离上的系数,则其原概率可修正为:
Figure FDA0002180743900000034
(2)采用高斯函数对每个数据的权重进行调节,得到测试样本x属于每一种类别的概率为:
Figure FDA0002180743900000035
6.如权利要求5所述的一种语音异常信号检测系统,其特征在于:所述步骤(2)中,具体调节过程如下:
(2.1)高斯函数的表达式为:
Figure FDA0002180743900000036
式中,μ是期望,σ是标准差;对于某条测试数据x,将其特征ad的数值vd视为高斯函数的期望μ,再通过预先设定的标准差σ,得出适用于样本训练的高斯函数f;在判断区间[vd-r,vd+r]上,存在M个数据样本,这些样本的特征ad
Figure FDA0002180743900000037
则这些特征值在高斯函数f上的取值为
Figure FDA0002180743900000038
Figure FDA0002180743900000039
(2.2)设在M个训练数据中,有m个样本属于类别X1,那么在判断区间[vd-r,vd+r]上,X1的分布权重为:
Figure FDA00021807439000000310
(2.3)设该判断区间内,共包含n种类别的数据,则实现对每个数据的权重进行调节。
7.如权利要求1所述的一种语音异常信号检测系统,其特征在于:所述重叠度权重优化模块的具体优化过程如下:
(1)设特征的权重为wd为:
Figure FDA0002180743900000041
式中,Cp、Cq分别表示两个不同的类别;CSL表示两个不同类别的重叠度;
(2)对所有特征做与步骤(1)同样的计算得到权重集合[w1,...,wd,...wD];
(3)将测试样本x属于每一种类别的概率修改为:
Figure FDA0002180743900000042
8.如权利要求1所述的一种语音异常信号检测系统,其特征在于:所述AdaBoost优化优化模块的具体优化过程为:利用AdaBoost算法对引入重叠度的三支决策分类器进行优化,在每一次迭代中,数据的分布发生改变,每一维特征上的重叠度权重和最佳判断区间半径也随之发生改变,得到新的W集合和判断区间半径r值,即为在此次迭代中,弱三支决策分类器的可调参数,参数的改变将产生不同的若分类器模型,迭代结束后,将每一个弱分类器乘以其权重然后加和便得到强化后了的分类器。
CN201611170425.2A 2016-12-16 2016-12-16 一种语音异常信号检测系统 Expired - Fee Related CN106601271B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611170425.2A CN106601271B (zh) 2016-12-16 2016-12-16 一种语音异常信号检测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611170425.2A CN106601271B (zh) 2016-12-16 2016-12-16 一种语音异常信号检测系统

Publications (2)

Publication Number Publication Date
CN106601271A CN106601271A (zh) 2017-04-26
CN106601271B true CN106601271B (zh) 2020-05-22

Family

ID=58599763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611170425.2A Expired - Fee Related CN106601271B (zh) 2016-12-16 2016-12-16 一种语音异常信号检测系统

Country Status (1)

Country Link
CN (1) CN106601271B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107170443A (zh) * 2017-05-12 2017-09-15 北京理工大学 一种模型训练层AdaBoost算法的参数优化方法
CN107808663B (zh) * 2017-10-25 2021-04-27 重庆大学 基于dbn和rf算法的帕金森病语音数据分类系统
CN109616141B (zh) * 2019-01-03 2022-01-11 燕山大学 发音异常检测方法
CN110826587B (zh) * 2019-08-15 2024-03-19 南京航空航天大学 基于改进的加权一类支持向量机的涡轴发动机故障检测方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103198605A (zh) * 2013-03-11 2013-07-10 成都百威讯科技有限责任公司 室内突发异常事件报警系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101808810B1 (ko) * 2013-11-27 2017-12-14 한국전자통신연구원 음성/무음성 구간 검출 방법 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103198605A (zh) * 2013-03-11 2013-07-10 成都百威讯科技有限责任公司 室内突发异常事件报警系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
基于三支决策的海量数据分类方法研究及其在视频异常检测中的应用;李萍;《中国优秀硕士学位论文全文数据库》;20161031;全文 *
基于三支决策粗糙集的视频异常行为检测;谢骋,商琳;《南京大学学报》;20130731;第49卷(第4期);全文 *
基于语音特征的帕金森病可视化诊断方法研究;张涛;《中国博士学位论文全文数据库》;20120831;全文 *
帕金森语音特征提取软件开发及三支决策诊断方法研究;杨沫;《中国优秀硕士学位论文全文数据库》;20170131;全文 *

Also Published As

Publication number Publication date
CN106601271A (zh) 2017-04-26

Similar Documents

Publication Publication Date Title
Seeböck et al. Unsupervised identification of disease marker candidates in retinal OCT imaging data
CN106601271B (zh) 一种语音异常信号检测系统
CN111986811B (zh) 一种基于算法和大数据的疾病预测系统
Nandpuru et al. MRI brain cancer classification using support vector machine
CN106295124B (zh) 多种图像检测技术综合分析基因子图相似概率量的方法
CN111000553B (zh) 一种基于投票集成学习的心电数据智能分类方法
CN110604550B (zh) 一种肿瘤放疗后正常组织器官并发症预测模型的建立方法
CN105930663B (zh) 一种基于演化模糊规则的手部震颤信号及音频信号分类方法
CN111009321A (zh) 一种机器学习分类模型在青少年孤独症辅助诊断中的应用方法
CN103593674B (zh) 一种颈部淋巴结超声图像特征选择方法
CN107729926A (zh) 一种基于高维空间变换的数据扩增方法、机器识别系统
Lederman et al. Alternating diffusion for common manifold learning with application to sleep stage assessment
CN106548041A (zh) 一种基于先验信息和并行二进制微粒群算法的肿瘤关键基因识别方法
CN110786849A (zh) 基于多视图鉴别分析的心电信号身份识别方法及系统
CN112215259A (zh) 基因选择方法和装置
CN114596253A (zh) 一种基于脑成像基因组特征的阿尔兹海默症识别方法
Bouguerra et al. Brain Tumor Classification Based Deep Transfer Learning Approaches
CN117195027A (zh) 基于成员选择的簇加权聚类集成方法
Ubaidillah et al. Classification of liver cancer using artificial neural network and support vector machine
CN111709441A (zh) 基于改进特征子集区分度的行为识别特征选择方法
Sadiq et al. Diagnosis of Alzheimer's Disease Using Pearson's Correlation and ReliefF Feature Selection Approach
KR101750107B1 (ko) 사상 체질 판별을 위한 얼굴 영상 분석 방법
Kavitha et al. Brain tumour detection using self-adaptive learning PSO-based feature selection algorithm in MRI images
KR20100001177A (ko) 주성분 분석을 이용한 유전자 선택 알고리즘
CN113284512B (zh) 一种基于深度稀疏迁移学习的帕金森语音分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200426

Address after: 066004 No. 8-1-6, Huayuan xinju, Qinhuangdao Economic and Technological Development Zone, Hebei Province

Applicant after: Hebei Jitu Technology Co.,Ltd.

Address before: 100000 No. 9 West Fourth Ring Road, Beijing, Haidian District 2104-110

Applicant before: BEIJING LINGZHONG BOTONG TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200522

Termination date: 20211216