CN113361563B - 一种基于样本和特征双变换的帕金森病语音数据分类系统 - Google Patents
一种基于样本和特征双变换的帕金森病语音数据分类系统 Download PDFInfo
- Publication number
- CN113361563B CN113361563B CN202110437294.4A CN202110437294A CN113361563B CN 113361563 B CN113361563 B CN 113361563B CN 202110437294 A CN202110437294 A CN 202110437294A CN 113361563 B CN113361563 B CN 113361563B
- Authority
- CN
- China
- Prior art keywords
- sample
- local
- transformation
- samples
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000009466 transformation Effects 0.000 title claims abstract description 117
- 208000018737 Parkinson disease Diseases 0.000 title claims abstract description 46
- 238000012549 training Methods 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 22
- 238000013145 classification model Methods 0.000 claims abstract description 15
- 239000011159 matrix material Substances 0.000 claims description 46
- 230000014759 maintenance of location Effects 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 16
- 238000013507 mapping Methods 0.000 claims description 3
- 208000027089 Parkinsonian disease Diseases 0.000 claims 7
- 206010034010 Parkinsonism Diseases 0.000 claims 7
- 238000000844 transformation Methods 0.000 claims 1
- 230000002159 abnormal effect Effects 0.000 abstract description 5
- 238000005065 mining Methods 0.000 abstract description 4
- 230000007246 mechanism Effects 0.000 description 12
- 238000002474 experimental method Methods 0.000 description 9
- 230000009467 reduction Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000035945 sensitivity Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000000717 retained effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000002411 adverse Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 206010013952 Dysphonia Diseases 0.000 description 1
- 206010044565 Tremor Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/40—Detecting, measuring or recording for evaluating the nervous system
- A61B5/4076—Diagnosing or monitoring particular conditions of the nervous system
- A61B5/4082—Diagnosing or monitoring movement diseases, e.g. Parkinson, Huntington or Tourette
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/259—Fusion by voting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Neurology (AREA)
- Neurosurgery (AREA)
- Human Computer Interaction (AREA)
- Biomedical Technology (AREA)
- Multimedia (AREA)
- Developmental Disabilities (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physiology (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Acoustics & Sound (AREA)
- Heart & Thoracic Surgery (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及语音分类技术领域,具体公开了一种基于样本和特征双变换的帕金森病语音数据分类系统,其包括样本输入模块、样本变换模块、数据集划分模块、特征变换模块、模型生成模块和表决模块。本系统基于现有PD语音样本数量少的特点,特别在样本和特征两个维度上进行变换:对于样本变换,通过迭代均值聚类法挖掘不同PD语音样本的层次结构,生成新的样本;对于特征变换,则通过不同的特征核进行PD语音特征维度变换。样本变换不仅可以减少异常样本对分类器边界的影响,以及相关性较高的样本对训练时间和存储空间的影响,还能在样本中体现样本的层次结构信息。特征变换对PD语音样本进行降维,降低分类模型的复杂度,实现高性能的分类。
Description
技术领域
本发明涉及语音分类技术领域,尤其涉及一种基于样本和特征双变换的帕金森病语音数据分类系统。
背景技术
帕金森病(PD)作为中枢神经系统的神经变性疾病,病症主要包括震颤,僵直,肌肉控制丧失,运动缓慢,平衡不良和语音问题等。截止目前,该病在全球影响近千万人,中国也属于帕金森病高发区。高质量的生物标志物是帕金森病诊断和治疗的关键。不幸的是,可靠的PD生物标志物至今也尚未确定。然而,最近的研究表明,语音信号(数据)有助于从健康人群中识别帕金森病患者,因为绝大多数患者通常在某种程度上表现为发音障碍。
PD语音样本数量少一直是PD语音分类研究的难点,样本信息的不充沛导致训练效果不尽人意。并且,目前的帕金森语音分类技术并未考虑异常样本对分类器边界的影响,以及相关性较高的样本对训练时间和存储空间的影响,导致语音样本特征中可能存在相关性较高的特征或噪音等与目标分类无关的特征,分类的准确率不算很高,还有较多的优化空间。
发明内容
本发明提供一种基于样本和特征双变换的帕金森病语音数据分类系统,解决的技术问题在于:如何最大化利用现有的样本信息,提高帕金森语音分类的效果。
为解决以上技术问题,本发明提供一种基于样本和特征双变换的帕金森病语音数据分类系统,包括:
样本输入模块,用于输入由多个受试者的帕金森原始语音样本组成的原始语音数据集;
样本变换模块,用于将原始语音数据集作为原始层,对原始层上每个受试者的帕金森原始语音样本采用迭代均值聚类方法生成第一层结构层至第L层结构层的新样本,L≥1;
数据集划分模块,用于将每一层级上的样本划分为训练集和测试集,其中,L+1个层级上的训练集来源于相同的受试者,L+1个层级上的测试集来源于相同的受试者;
特征变换模块,用于对每个层级上的训练集采用不同的特征核进行局部类别保留特征变换,得到L+1层特征;
模型生成模块,用于采用该L+1层特征分别对L+1个分类模型进行训练以及采用对应层的测试集对训练后的L+1个分类模型进行测试,训练后的L+1个分类模型可对一受试者的帕金森语音数据输出L+1个分类结果;
表决模块,用于对L+1个分类结果进行投票表决,得到该受试者的帕金森语音分类结果。
优选的,样本变换模块所采用迭代均值聚类方法的目标函数为:
其中,表示第l-1层样本与相应的聚类中心的距离之和,mk(k=1,2,...,K)为给定样本xj(j=1,2,...,N)的K个初始均值,K为聚类数目,xl-1为第l-1层样本,xj l-1为第l-1层样本的第j个样本,N为第l-1层的样本总数,是第i个受试者的第l层表示,l表示第l层层次结构,l-1=0时表示原始层的数据。
优选的,样本变换模块所采用迭代均值聚类方法进行迭代的过程为:
根据最近邻准则将每个受试者的每一层的每个样本分配到相应的集群中;
重新计算聚类均值,直至聚类均值不再变化;计算聚类均值遵循:
优选的,所述特征变换模块采用局部保留特征变换方式或局部类别保留特征变换方式作为特征核进行特征提取。
优选的,局部保留特征变换方式为局部保留投影、局部保留判别投影或局部判别保留投影;
所述局部保留投影的目标式为:
s.t WTXDXTW=I
所述局部保留判别投影的目标式为:
s.t WTXDXTW=I
所述局部判别保留投影的目标式为:
s.tμ·WTSLWW+λWTXPXTW=ηI
其中,X为样本集,P=D-S为拉普拉斯矩阵,D为对角矩阵,S为邻接矩阵,W是映射矩阵,I为单位矩阵;SB为类间散度矩阵,SW为类内散度矩阵;SLB为局部类间散度矩阵,SLW为局部类内散度矩阵;μ、λ均为正则化系数,η是常数,用以约束W有唯一解;tr()表示括号内矩阵的所有对角元素之和。
优选的,所述局部类别保留特征变换方式为在局部保留投影、局部保留判别投影或局部判别保留投影上均增加了类别标签的局部类别保留投影、局部类别保留判别投影或局部类别判别保留投影。
优选的,所述局部类别保留投影的目标式为:
所述局部类别保留判别投影的目标式为:
所述局部类别判别保留投影的目标式为:
其中,所有带有下标“c”的参数均表示在原参数上增加了类别信息。
优选的,所述局部类别保留特征变换方式中构建的亲和力矩阵为:
其中,Aij表示亲和力矩阵中的第i行第j列元素,表示样本xj与样本xi属于同一类别,且样本xi在样本xj的Nck个同类近邻范围内;表示样本xi与xj样本属于同一类别,且样本xj在样本xi的Nck个同类近邻范围内;||表示或。
优选的,所述局部类别保留特征变换方式中构建的亲和力矩阵为:
其中,Aij表示亲和力矩阵中的第i行第j列元素,表示样本xj与样本xi属于同一类别,且样本xi在样本xj的Nck个同类近邻范围内;表示样本xi与xj样本属于同一类别,且样本xj在样本xi的Nck个同类近邻范围内;||表示或;t为核参数。
本发明提供的一种基于样本和特征双变换的帕金森病语音数据分类系统,基于现有PD语音样本数量少的特点,特别在样本和特征两个维度上进行变换:对于样本变换,采用样本变换模块通过迭代均值聚类法挖掘不同PD语音样本的层次结构,生成新的样本;对于特征变换,则采用特征变换模块通过不同的特征核进行PD语音特征维度变换。样本变换不仅可以减少异常样本对分类器边界的影响,以及相关性较高的样本对训练时间和存储空间的影响,还能在样本中体现样本的层次结构信息。由于各层级的PD语音样本特征中可能存在相关性较高的特征或噪音等与目标分类无关的特征,通过特征变换对PD语音样本降维,降低分类模型的复杂度,实现高性能的分类。本系统从最大化利用现有样本信息的角度,提出了样本-特征双变换算法用于PD语音分类,减少冗余特征的影响,提高分类准确率。
附图说明
图1是本发明实施例提供的一种基于样本和特征双变换的帕金森病语音数据分类系统的模块结构图;
图2是本发明实施例提供的样本变换、特征变换和投票表决过程的示意图;
图3是本发明实施例提供的无标签近邻保留方式(a)和有标签近邻保留方式(b)的示例图;
图4是本发明实施例提供的样本-特征双变换前后单个受试者样本的尺寸变化示意图。
具体实施方式
下面结合附图具体阐明本发明的实施方式,实施例的给出仅仅是为了说明目的,并不能理解为对本发明的限定,包括附图仅供参考和说明使用,不构成对本发明专利保护范围的限制,因为在不脱离本发明精神和范围基础上,可以对本发明进行许多改变。
为了最大化利用现有的样本信息,提高帕金森语音分类的准确率,本发明实施例提供一种基于样本和特征双变换的帕金森病语音数据分类系统,如图1的模块结构图所示,包括:
样本输入模块,用于输入由多个受试者的帕金森原始语音样本组成的原始语音数据集;
样本变换模块,用于将原始语音数据集作为原始层,对原始层上每个受试者的帕金森原始语音样本采用迭代均值聚类方法生成第一层结构层至第L层结构层的新样本,L≥1;
数据集划分模块,用于将每一层级上的样本划分为训练集和测试集,其中,L+1个层级上的训练集来源于相同的受试者,L+1个层级上的测试集来源于相同的受试者;
特征变换模块,用于对每个层级上的训练集采用不同的特征核进行局部类别保留特征变换,得到L+1层特征;
模型生成模块,用于采用该L+1层特征分别对L+1个分类模型进行训练以及采用对应层的测试集对训练后的L+1个分类模型进行测试,训练后的L+1个分类模型可对一受试者的帕金森语音数据输出L+1个分类结果;
表决模块,用于对L+1个分类结果进行投票表决,得到该受试者的帕金森语音分类结果。
本系统从最大化利用现有样本信息的角度,提出了样本-特征双变换(样本变换模块、特征变换模块)用于PD语音分类。样本-特征双变换是在样本和特征两个维度上进行变换:对于样本变换,通过迭代均值聚类以挖掘不同PD语音样本的层次结构,生成新的样本;对于特征变换则采用不同的特征核进行PD语音特征维度变换,以减少冗余特征的影响,提高分类准确率。
对于样本输入模块,本例的原始语音数据集可以是时下已经存在的Sakar、MaxLittle语音数据集等,也可以由新采集的帕金森原始语音样本所组成,或者是根据这些数据样本而组合生成的新的数据集。
对于样本变换模块,样本转换不仅可以减少异常样本对分类器边界的影响,以及相关性较高的样本对训练时间和存储空间的影响,还能在样本中体现样本的层次结构信息。本例通过迭代均值聚类实现深度样本变换,从而挖掘原样本空间的层级结构信息,用聚类中心表征样本层次结构信息,有效降低分类误差。具体是:在每个受试者的PD语音原始样本(原始层)上通过均值聚类得到第一层层次结构样本(第一层结构层),再在每个受试者的第一层层次结构样本上进行聚类得到第二层层次结构样本(第二层结构层),依次类推,得到总共L层样本结构层,加上最底层的原始层,总共得到L+1层样本,每个层级上均有每个受试者的样本集,但每个层级上同一受试者的样本集不一致,如图2的左侧所示。注:不同层的样本可以存在于不同的存储空间中(单个存储阵列里或多个存储阵列里),便于并行处理。融合机制为投票表决,对数据同步无特殊要求,便于实现。
样本变换是以迭代均值聚类的方式挖掘样本隐含信息,构造分级层次结构样本,从而深入挖掘样本层次结构信息。在样本变换上,层次结构样本是在上一层样本的基础上聚类的结果。PD语音数据集中每个受试者含有多条语音数据,使用迭代均值聚类向下挖掘同一受试者的隐含信息生成层次结构样本。以下是层次结构样本的构建过程,最小化迭代均值聚类目标函数:
其中,表示第l-1层样本与相应的聚类中心的距离之和,mk(k=1,2,...,K)为给定样本xj(j=1,2,...,N)的K个初始均值,K为聚类数目,xl-1为第l-1层样本,xj l-1为第l-1层样本的第j个样本,N为第l-1层的样本总数,是第i个受试者的第l层表示,l表示第l层层次结构,l-1=0时表示原始层的数据。
迭代均值聚类通过下面两步进行迭代:
1)每个受试者的每个样本会根据最近邻准则分配到相应的集群中;
2)重新计算聚类均值(聚类中心),直至聚类均值不再变化。计算聚类均值遵循:
为迭代完成后的第l层样本的聚类均值,Nk表示第l-1层样本中第i个受试者的集群的样本个数,xn表示该集群的各个样本。每一层层次结构样本所含的信息可能会发生变化,导致每层的分类结果有所不同,因此,最终结果由每个层级投票决策,如图2的右侧所示。
对于数据集划分模块,当样本变换模块得到L+1个层级结构的样本时,需要进行数据集的划分。具体是,将每一层级上的样本划分为训练集和测试集,其中,L+1个层级上的训练集来源于相同的受试者,L+1个层级上的测试集来源于相同的受试者。即,将每个层级上一大部分受试者的样本集划分为训练集,剩下的小部分受试者的样本集也划为测试集。
对于特征变换模块,由于各层级的PD语音样本特征中可能存在相关性较高的特征或噪音等与目标分类无关的特征,使用特征变换的方法对PD语音样本降维,可降低分类模型的复杂度,对实现高性能的分类尤为重要。不同的降维方法对不同的数据集在同一维度下会产生不同的效果,目前还没有针对特定数据特点选择降维方法的准则。LPP(LocalityPreserving Projections,局部保留投影)是一种高效的保留投影前后样本局部近邻关系的无监督流形降维方法,LPDP(Locality Preserving Discriminant Projections,局部保留判别投影)、LDPP(Locality Discriminant Preserving Projections,局部判别保留投影)是在此基础上考虑全局判别和局部判别的有监督降维方法,它们在近邻关系中不仅保留了近邻范围内同类样本的关系,也保留了与投影样本异类的样本关系。但为最大化利用现有样本信息,在上述三种保留局部关系的特征变换LPP(局部保留投影)、LPDP(局部保留判别投影)、LDPP(局部判别保留投影)的基础上,分别设计局部类别保留投影(LocalityClass Preserving Projections,LCPP)、局部类别保留判别投影(Locality ClassPreserving Discriminant Projections,LCPDP)、局部类别判别保留投影(LocalityClass Discriminant Preservation Projection,LCDPP),统称局部类别保留特征变换,旨在投影的近邻关系中引入类别标签,保留同类近邻样本的关系结构,让数据在分类前更充分地利用样本完整信息。
图3(a)为LPP(局部保留投影)、LPDP(局部保留判别投影)、LDPP(局部判别保留投影)的局部保留示意图,当保留5个近邻关系时,其不会区分样本类别,保留最近邻的5个样本的关系。图3(b)为LCPP(局部类别保留投影)、LCPDP(局部类别保留判别投影)、LCDPP(局部类别判别保留投影)的局部保留示意图,因为加入了类别信息,其保留5个同类别的最近邻样本的关系。在特征变换上,局部类别保留特征变换LCPP、LCPDP、LCDPP是在LPP、LPDP、LDPP的局部保留特征变换中加入标签信息后的特征变换方法,其可最大化利用现有样本信息。
LPP的目标式如下:
s.t WTXDXTW=I
LPDP的目标式如下:
s.t WTXDXTW=I
LDPP的目标式如下:
s.tμ·WTSLWW+λWTXPXTW=ηI
其中,X为样本集,P=D-S为拉普拉斯矩阵,D为对角矩阵,S为邻接矩阵,W是映射矩阵,I为单位矩阵;SB=(μ1-μ2)(μ1-μ2)T为类间散度矩阵,为类内散度矩阵,μ1是类别1的样本中心,μ2是类别2的样本中心,X1是类别1的样本,X2是类别2的样本;为局部类间散度矩阵,为局部类内散度矩阵,表示离类中心mc最近的第i个近邻样本,表示kmc个近邻样本,mlb为整体样本的局部中心,mlbc、mlwc分别是第c类样本在局部类间和局部类内的局部中心,Nlc是第c类样本的局部样本数量,C表示共有C个类别(本例中C=2);μ、λ均为正则化系数,η是常数,用以约束W有唯一解。
LCPP的目标式如下:
LCPDP的目标式如下:
LCDPP的目标式如下:
可以看到,局部类别保留变换的目标式与其改进前的目标式的主要区别在于:在LPP、LPDP、LDPP的基础上增加了类别标识“c”。
局部类别保留特征变换中两种表示近邻关系的亲和力矩阵,即类别亲和力矩阵如下:
在两个式子中,Aij表示亲和力矩阵中的第i行第j列元素,||表示或,表示样本xj与样本xi属于同一类别,且样本xi在样本xj的Nck个同类近邻范围内;表示样本xi与xj样本属于同一类别,且样本xj在样本xi的Nck个同类近邻范围内。在亲和力矩阵2中,t为核参数。亲和力矩阵1是简单表示的类别亲和力矩阵的计算形式,亲和力矩阵2是热力核类别亲和力矩阵的计算形式。
需要强调的是,具体选择哪一类变换作为特征核则根据分类器或其他因素而定。
每一层层次结构样本经特征核变换之后,送入分类器训练预测,最终结构由每一层的结果投票表决,这里涉及到模型生成模块和表决模块。对于模型生成模块,由上述内容可知,有L+1层的样本特征,每一层均构建有分类器,该分类器可以是SVM、KNN等常用的二分类器,将各个层级的特征输入对应的分类器进行训练,训练后的每个分类器则会输出一个二分类结果。对于多个二分类结果,表决模块进行投票表决决定最后的二分类结果,如图2右侧所示,根据具体情况设置2/3胜出机制或1/2胜出机制或其他机制。
从样本-特征双变换的变换方式上来看,单个受试者的样本尺寸会在样本和特征两个维度上发生变化,图4列举了样本送入分类器前,单个受试者部分可能的样本尺寸情况。图4所示,单个受试者原始的样本尺寸为7*8,即一个受试者包含7条语音样本,每一条语音样本有8个特征。在样本-特征双变换过程中,迭代均值聚类会使样本数量发生改变;而特征核可能会使特征数发生改变。因此,单个受试者的样本尺寸,会随聚类数目和降维维数的变化而变化。
当一个分类模型训练完成后,需要对其进行测试,以获得其准确率、敏感度、特异度等指标。本例采用数据集划分模块划分出的测试集对该模型进行测试。
为了验证本例所述分类系统的效果,下面展示具体的实验过程、结果和分析。
实验目的:
展示和分析样本-特征双变换在PD语音分类上的探究结果。
实验内容:
对比分析了样本-特征双变换作用于二个PD语音数据集上的结果,层次样本的有效性探究,近邻参数及近邻类别关系的影响分析。
实验数据集:
两个公共PD语音数据集。Sakar数据集和MaxLittle数据集是国内外PD语音分类算法研究常用的两个数据集。Sakar数据集中有40位受试者,包括20名PD病患者,20名健康人。每个受试者包含26个语音样本段,每个语音样本包含26个特征。MaxLittle数据集由31名受试者的语音组成,其中包括23名PD患者的一系列生物医学语音,每个受试者有6条语音内容。每条语音含22个特征。
实验条件与设置:
实验使用64位Windows 7计算机,实验平台的硬件参数为CPU(Intel i3-4170M),6Gb内存。实验在Matlab R2018b上运行。所有实验采用LOSO交叉验证,样本-特征双变换中层级参数设置为2,实验采用SVM和KNN两种常用分类器,所有结果均是在分类器的最优参数下取得。
样本-特征双变换方式的有效性分析:
下表1对比了SVM和KNN两种分类器下,使用原始数据直接分类、原始数据经特征变换后分类以及样本-特征双变换后分类的结果。从表1中可以直观地看到:
1、不论是采用哪种分类方式,采用样本-特征双变换后所得的准确率均不低于使用原始数据直接分类和使用原始数据进行特征变换后分类的结果;
2、不区别分类器的情况下,样本-特征双变换后的Sakar数据集能在1维数据下达到100%的准确率;样本-特征双变换后的MaxLittle能在2维数据下达到100%的准确率;
3、同使用原始数据直接分类相比,采用样本-特征双变换后的准确率、敏感度和特异度均得到了提升,且取得的准确率最大相差了50%;
4、与原始数据经特征变换后分类相比,采用样本-特征双变换后所得的准确率、敏感度和特异度均大于等于前者,且在大多数最优准确率下的数据维度相对更少。
综合分类准确率和数据维度规模来看,样本-特征双变换在二个PD语音数据集上表现的效果较其他两种对比方式更好,也证明了样本-特征双变换在PD语音数据集上的有效性。
表1 样本-特征双变换结果比较
下表2给出了样本-特征双变换取得最优结果所对应的特征核和特征维度,对于不同的数据集以及不同的分类器,大多数情况下最优结果的特征核会有所不同,需要根据具体的情况进行选择。在样本-特征双变换下,最优结果所对应的特征维度在大部分情况下,都得到了极大的缩减,在模型预测过程中可以增加运行效率,也节省了运行空间。
表2 样本-特征双变换最优结果下的特征参数
样本层级投票机制的有效性探究:
下表3分别列出了Sakar、MaxLittle二个PD语音数据集在SVM和KNN两种分类器下,每一个层级和三个层级投票决策的分类准确率、敏感度和特异度。原始层、第一层、和第二层的特征维度和特征核与投票机制下的参数设置相同,实验参数设置根据最优结果取得,具体特征参数设置如上表2所示。
表3 样本-特征双变换不同层级结果
从表3中的结果可以得出以下结论:
(1)迭代出的层次结构样本中确实含有原始样本隐藏的样本信息。在大多数情况下,挖掘出的层次结构样本信息是有利于分类的,但也不能完全保证挖掘出的层次信息都有利于分类,如Sakar数据集在KNN分类器下,原始层和第一层层次结构样本的准确率、敏感度和特异度都能达到100%,但第二层层次结构样本的分类准确率、敏感度和特异度只有50%。
(2)层级投票机制能够降低样本中不利分类信息的影响。由于模型实际运作过程中,并不知道当前挖掘出的层次信息是否有利于分类,但是从结果来看,通过投票机制可以弱化不利信息的影响,增强模型的泛化能力。如MaxLittle数据集在KNN分类器下,每一层的准确率虽然没有发生变化,但实际一些受试者的预测类型可能在不同层级中的发生了变化,从而使得投票后的准确率发生变化,具体可通过下表4进行阐述,加粗部分是当前层预判错误的标签。表中原始层、第一层结构层、第二层结构层的准确率均为80%,但最终三层投票决策的预测结果为100%,由此可证明层级投票机制的有效性。
表4 投票机制结果有效性分析
综上所述,本发明实施例提供的一种基于样本和特征双变换的帕金森病语音数据分类系统,基于现有PD语音样本数量少的特点,特别在样本和特征两个维度上进行变换:对于样本变换,采用样本变换模块通过迭代均值聚类法挖掘不同PD语音样本的层次结构,生成新的样本;对于特征变换,则采用特征变换模块通过不同的特征核进行PD语音特征维度变换。样本变换不仅可以减少异常样本对分类器边界的影响,以及相关性较高的样本对训练时间和存储空间的影响,还能在样本中体现样本的层次结构信息。由于各层级的PD语音样本特征中可能存在相关性较高的特征或噪音等与目标分类无关的特征,通过特征变换对PD语音样本降维,降低分类模型的复杂度,实现高性能的分类。本系统从最大化利用现有样本信息的角度,提出了样本-特征双变换算法用于PD语音分类,减少冗余特征的影响,提高分类准确率。
实验证明,PD语音样本在使用样本-特征双变换后分类的结果,比直接用原始数据分类和对原始数据进行降维后分类的结果更优,且Sakar数据集和MaxLittle数据集能在1-2维的数据下达到100%的准确率。在样本层级中,实验证明层级投票机制能够降低样本中不利分类信息的影响。在样本-特征双变换的近邻关系中加入标签信息后的特征核不管是在准确率上还是在数据维度上都表现得更为稳定,更不容易受近邻参数的影响。
还需说明的是本系统具有较好的普适性,该样本-特征双变换不仅限于本实施例中例举的帕金森语音数据分类识别,其他能够运用该样本-特征双变换机制的情形也同样适用。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (9)
1.一种基于样本和特征双变换的帕金森病语音数据分类系统,其特征在于,包括:
样本输入模块,用于输入由多个受试者的帕金森原始语音样本组成的原始语音数据集;
样本变换模块,用于将原始语音数据集作为原始层,对原始层上每个受试者的帕金森原始语音样本采用迭代均值聚类方法生成第一层结构层至第L层结构层的新样本,L≥1;
数据集划分模块,用于将每一层级上的样本划分为训练集和测试集,其中,L+1个层级上的训练集来源于相同的受试者,L+1个层级上的测试集来源于相同的受试者;
特征变换模块,用于对每个层级上的训练集采用不同的特征核进行局部类别保留特征变换,得到L+1层特征;
模型生成模块,用于采用该L+1层特征分别对L+1个分类模型进行训练以及采用对应层的测试集对训练后的L+1个分类模型进行测试,训练后的L+1个分类模型可对一受试者的帕金森语音数据输出L+1个分类结果;
表决模块,用于对L+1个分类结果进行投票表决,得到该受试者的帕金森语音分类结果。
4.如权利要求2所述的一种基于样本和特征双变换的帕金森病语音数据分类系统,其特征在于:所述特征变换模块采用局部保留特征变换方式或局部类别保留特征变换方式作为特征核进行特征提取。
5.如权利要求4所述的一种基于样本和特征双变换的帕金森病语音数据分类系统,其特征在于:局部保留特征变换方式为局部保留投影、局部保留判别投影或局部判别保留投影;
所述局部保留投影的目标式为:
s.t WTXDXTW=I
所述局部保留判别投影的目标式为:
s.t WTXDXTW=I
所述局部判别保留投影的目标式为:
s.tμ·WTSLWW+λWTXPXTW=ηI
其中,X为样本集,P=D-S为拉普拉斯矩阵,D为对角矩阵,S为邻接矩阵,W是映射矩阵,I为单位矩阵;SB为类间散度矩阵,SW为类内散度矩阵;SLB为局部类间散度矩阵,SLW为局部类内散度矩阵;μ、λ均为正则化系数,η是常数,用以约束W有唯一解;tr()表示括号内矩阵的所有对角元素之和。
6.如权利要求5所述的一种基于样本和特征双变换的帕金森病语音数据分类系统,其特征在于:所述局部类别保留特征变换方式为在局部保留投影、局部保留判别投影或局部判别保留投影上均增加了类别标签的局部类别保留投影、局部类别保留判别投影或局部类别判别保留投影。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110437294.4A CN113361563B (zh) | 2021-04-22 | 2021-04-22 | 一种基于样本和特征双变换的帕金森病语音数据分类系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110437294.4A CN113361563B (zh) | 2021-04-22 | 2021-04-22 | 一种基于样本和特征双变换的帕金森病语音数据分类系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113361563A CN113361563A (zh) | 2021-09-07 |
CN113361563B true CN113361563B (zh) | 2022-11-25 |
Family
ID=77525332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110437294.4A Active CN113361563B (zh) | 2021-04-22 | 2021-04-22 | 一种基于样本和特征双变换的帕金森病语音数据分类系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113361563B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107808663A (zh) * | 2017-10-25 | 2018-03-16 | 重庆大学 | 基于dbn和rf算法的帕金森病语音数据分类系统 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5506273B2 (ja) * | 2009-07-31 | 2014-05-28 | 富士フイルム株式会社 | 画像処理装置及び方法、データ処理装置及び方法、並びにプログラム |
US8965076B2 (en) * | 2010-01-13 | 2015-02-24 | Illumina, Inc. | Data processing system and methods |
US9763617B2 (en) * | 2011-08-02 | 2017-09-19 | Massachusetts Institute Of Technology | Phonologically-based biomarkers for major depressive disorder |
JP6751658B2 (ja) * | 2016-11-15 | 2020-09-09 | クラリオン株式会社 | 音声認識装置、音声認識システム |
CN107609588B (zh) * | 2017-09-12 | 2020-08-18 | 大连大学 | 一种基于语音信号的帕金森患者updrs得分预测方法 |
CN109192221A (zh) * | 2018-03-30 | 2019-01-11 | 大连理工大学 | 一种基于聚类的使用语音判断帕金森严重程度检测方法 |
CN108520759B (zh) * | 2018-04-13 | 2021-05-11 | 吉林大学 | 用于帕金森病语音检测的时频特征图像提取方法 |
CN110852336A (zh) * | 2018-08-20 | 2020-02-28 | 重庆工商职业学院 | 一种基于矢量空间的帕金森病数据集分类方法 |
CN111210846B (zh) * | 2020-01-07 | 2022-07-05 | 重庆大学 | 基于集成流形降维的帕金森语音识别系统 |
CN111898704B (zh) * | 2020-08-17 | 2024-05-10 | 腾讯科技(深圳)有限公司 | 对内容样本进行聚类的方法和装置 |
CN112309577B (zh) * | 2020-10-10 | 2023-10-13 | 广东工业大学 | 一种优化帕金森语音数据的多模态特征选择方法 |
CN112529063B (zh) * | 2020-12-03 | 2023-12-15 | 重庆大学 | 一种适用于帕金森语音数据集的深度域适应分类方法 |
-
2021
- 2021-04-22 CN CN202110437294.4A patent/CN113361563B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107808663A (zh) * | 2017-10-25 | 2018-03-16 | 重庆大学 | 基于dbn和rf算法的帕金森病语音数据分类系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113361563A (zh) | 2021-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11561951B2 (en) | Multidimensional associative memory and data searching | |
Guyon et al. | An introduction to feature extraction | |
Xie et al. | Penalized model-based clustering with cluster-specific diagonal covariance matrices and grouped variables | |
De Bin et al. | A novel approach to the clustering of microarray data via nonparametric density estimation | |
Lamba et al. | Feature Selection of Micro-array expression data (FSM)-A Review | |
Vengatesan et al. | The performance analysis of microarray data using occurrence clustering | |
Nair et al. | An ensemble-based feature selection and classification of gene expression using support vector machine, K-nearest neighbor, decision tree | |
Gu et al. | Fuzzy style k-plane clustering | |
Bellazzi et al. | The Gene Mover's Distance: Single-cell similarity via Optimal Transport | |
Mahallati et al. | Cluster tendency assessment in neuronal spike data | |
Swetha et al. | Leveraging Scalable Classifier Mining for Improved Heart Disease Diagnosis | |
CN113361563B (zh) | 一种基于样本和特征双变换的帕金森病语音数据分类系统 | |
Scrucca et al. | Projection pursuit based on Gaussian mixtures and evolutionary algorithms | |
Merritt et al. | An experimental study of dimension reduction methods on machine learning algorithms with applications to psychometrics | |
Paithankar et al. | A HK clustering algorithm for high dimensional data using ensemble learning | |
KR20100001177A (ko) | 주성분 분석을 이용한 유전자 선택 알고리즘 | |
Wani | Incremental hybrid approach for microarray classification | |
Kuzudisli et al. | Effect of recursive cluster elimination with different clustering algorithms applied to gene expression data | |
Beavers et al. | Data Nuggets: A Method for Reducing Big Data While Preserving Data Structure | |
Jia et al. | TDMO: Dynamic multi-dimensional oversampling for exploring data distribution based on extreme gradient boosting learning | |
Bhat | Evaluating SVM algorithms for bioinformatic gene expression analysis | |
Poruthoor et al. | Exploration of genomic, proteomic, and histopathological image data integration methods for clinical prediction | |
CN113971984A (zh) | 分类模型构建方法及装置、电子设备、存储介质 | |
Yang et al. | Detecting communities in attributed networks through bi-direction penalized clustering and its application | |
AU2021102810A4 (en) | A system for human cognitive states classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |