CN113393932A - 一种帕金森病语音样本段多类型重构变换方法 - Google Patents

一种帕金森病语音样本段多类型重构变换方法 Download PDF

Info

Publication number
CN113393932A
CN113393932A CN202110761463.XA CN202110761463A CN113393932A CN 113393932 A CN113393932 A CN 113393932A CN 202110761463 A CN202110761463 A CN 202110761463A CN 113393932 A CN113393932 A CN 113393932A
Authority
CN
China
Prior art keywords
data set
sample
target data
clustering
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110761463.XA
Other languages
English (en)
Other versions
CN113393932B (zh
Inventor
李勇明
刘承宇
王品
张小恒
李新科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN202110761463.XA priority Critical patent/CN113393932B/zh
Publication of CN113393932A publication Critical patent/CN113393932A/zh
Application granted granted Critical
Publication of CN113393932B publication Critical patent/CN113393932B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及语音分类技术领域,具体公开了一种帕金森病语音样本段多类型重构变换方法,首先,设计重构算子对原始数据样本段进行变换,从而得到第一目标数据集;其次,考虑到样本间的差异性,对原始数据集进行聚类重构,得到第二目标数据集;再次,利用聚类重构的新样本段集对聚类后的数据样本集进行卷积处理,得到第三目标数据集;最后,基于这三个新数据集分别训练子分类器,然后对分类结果进行决策加权融合。本发明提出了基于多类型重构和聚类算法的PD语音样本变换算法,有效获得高质量新样本,从而提高识别准确率。实验结果表明本方法构建的三个新样本数据集都比变换前的原数据集具有较高的准确率。

Description

一种帕金森病语音样本段多类型重构变换方法
技术领域
本发明涉及语音分类技术领域,尤其涉及一种帕金森病语音样本段多类型重构变换方法。
背景技术
帕金森病(Parkinson’s disease,PD)是一种中枢神经系统的神经退行性疾病。目前PD尚无完全治愈或预防方法,但可以通过早期诊断和治疗来加以控制。构音障碍是PD的早期重要征兆,因此基于机器学习的PD语音识别算法研究对PD早期诊断非常重要。
目前相关方法主要关注在特征学习和分类器设计方面,虽然有利于提高分类准确率,但难以解决PD语音样本问题,因此准确性的提高有限。PD语音样本质量主要体现在以下几方面:1)由于受试者病变程度不一、采集设备和环境流程等原因,语音样本反映疾病的能力不一。2)同一受试者的不同语音样本段含语料不同(元音、字、词、句等),由于不同语料与PD构音障碍关联性不一,因此语音样本与疾病类别标签相关性不一。3)语音样本还存在非均衡性、类重叠性等问题。这些样本质量问题阻碍了PD语音识别性能的进一步提升。
样本段选择可以在现有样本中获得高质量样本,从而提升样本集质量,如考虑稀疏邻域的非平衡数据集的样本选择、重复剪辑近邻法等。但是,该类方法仅局限在现有样本集中,无法重构新样本,从而限制了其提高样本质量的性能潜力。近年来,有学者尝试研究对PD语音样本进行变换来获得高质量新样本,显著提高了准确率。但是,这一方法仅能对单个病人所有样本进行线性重构,并未考虑其它重构方法,且未对样本进行区别处理,因此变换后的新样本的质量仍有待提高。
发明内容
本发明提供一种帕金森病语音样本段多类型重构变换方法,解决的技术问题在于:如何提升样本段质量,以提升PD语音识别性能。
为解决以上技术问题,本发明提供一种帕金森病语音样本段多类型重构变换方法,包括步骤:
S1:对原始数据集S中各个受试者的样本段
Figure DA00031492257239997079
使用重构算子进行重构,得到第一目标数据集Ef
S2:对原始数据集S中各个受试者的样本段
Figure DA00031492257240001624
进行迭代式均值聚类,得到聚类数据集Y;
S3:对聚类数据集Y使用所述重构算子进行重构,得到第二目标数据集Es
S4:对聚类数据集Y和第二目标数据集Es使用卷积算子进行卷积,得到第三目标数据集Et
S5:基于所述第一目标数据集Ef、所述第二目标数据集Es、所述第三目标数据集Et,对三个子分类器进行训练及测试,训练时对各子分类器的分类结果做加权融合。
进一步地,在所述步骤S1和所述步骤S3中,所述重构算子用于计算样本的均值、中位数、25%裁剪均值、标准差、四分位距离和平均绝对误差。
进一步地,原始数据集
Figure BDA0003149225720000021
其中的各个样本
Figure BDA0003149225720000022
G表示S的总样本数,N表示每个样本的特征数;L表示受试者人数;
Figure BDA0003149225720000023
表示各个受试者的样本段
Figure BDA0003149225720000024
包括G0=G/L个样本。
进一步地,第一目标数据集Ef=[Ef1,Ef2,...,EfL]T,其中:
Figure BDA0003149225720000031
其中:l(·)表示重构算子,
Figure BDA0003149225720000032
Figure BDA0003149225720000033
表示计算每个受试者的G0个样本
Figure BDA0003149225720000034
的均值;
Figure BDA0003149225720000035
Figure BDA0003149225720000036
表示计算每个受试者的G0个样本
Figure BDA0003149225720000037
的中位数;
Figure BDA0003149225720000038
Figure BDA0003149225720000039
表示计算每个受试者的G0个样本
Figure BDA00031492257200000310
的25%裁剪均值,
Figure BDA00031492257200000311
表示取整运算;
Figure BDA00031492257200000312
Figure BDA00031492257200000313
表示计算每个受试者的G0个样本
Figure BDA00031492257200000314
的标准差,“·”表示点乘;
Figure BDA00031492257200000315
Figure BDA00031492257200000316
表示计算每个受试者的G0个样本
Figure BDA00031492257200000317
的四分位距离;
Figure BDA00031492257200000318
Figure BDA00031492257200000319
表示计算每个受试者的G0个样本
Figure BDA00031492257200000320
的平均绝对误差。
进一步地,所述步骤S2具体为:
对原始数据集S中各个受试者的样本段
Figure BDA00031492257200000321
基于K-means迭代式均值聚类算法,得到聚类数据集
Figure BDA0003149225720000041
其中
Figure BDA0003149225720000042
Figure BDA0003149225720000043
为聚类计算,
Figure BDA0003149225720000044
Figure BDA0003149225720000045
表示第i个受试者的第j个聚类簇样本集,1≤i≤L,1≤j≤Q,Q表示聚类簇数。
进一步地,所述K-means迭代式均值聚类算法是指基于K-means聚类算法构造上一层新样本,再作为输入样本进行K-means聚类又得到上上一层新样本,如此重复;其中,样本间的欧几里得距离,为:
Figure BDA0003149225720000046
Figure BDA0003149225720000047
表示一个受试者的两个不同样本;
目标是最小化目标函数即平方和误差:
Figure BDA0003149225720000048
K为该聚类簇中的样本数,cj为第j个聚类中心,
Figure BDA0003149225720000049
表示2范数的平方;
聚类中心ck的更新由下式给出:
Figure BDA00031492257200000410
进一步地,在所述步骤S3中,第二目标数据集Es=[Es1,Es2,...,EsL]T,其中
Figure BDA00031492257200000411
进一步地,所述步骤S4具体为:
设计卷积算子对聚类数据集Y与第二目标数据集Es进行卷积和运算,得到第三目标数据集Et=[Et1,Et2,...,EtL]T,其中:
Figure BDA00031492257200000412
Figure BDA00031492257200000413
为Eti的第k个聚类簇与相应重构样本集卷积计算得到的样本集合,γ(·)为卷积算子;
其中,
Figure BDA0003149225720000051
I为聚类簇的样本数;
通过式(10)对Ti j
Figure BDA0003149225720000052
进行卷积和运算,得到样本集
Figure BDA0003149225720000053
Figure BDA0003149225720000054
其中,“·”为点乘。
进一步地,所述步骤S5具体包括步骤:
S51:对第一目标数据集Ef、第二目标数据集Es和第三目标数据集Et进行归一化,得到对应的第四目标数据集E′f、第五目标数据集E′s和第六第三目标数据集E′t
S52:对E′f、E′s和E′t分别进行训练集和测试集的划分,即
Figure BDA0003149225720000055
Figure BDA0003149225720000056
S53:根据
Figure BDA0003149225720000057
Figure BDA0003149225720000058
构造第七目标数据集
Figure BDA0003149225720000059
第八目标数据集
Figure BDA00031492257200000510
和第九目标数据集
Figure BDA00031492257200000511
用于分别对各子分类器进行训练和测试,训练时对各子分类器的分类结果做加权融合。
进一步地,加权融合的公式为:
Figure BDA00031492257200000512
其中,Hi是第i个子分类器的预测标签,Hfinal是加权后的预测标签;αi是第i个子分类器的权重,由网格搜索法得到。
本发明提供的一种帕金森病语音样本段多类型重构变换方法,首先,设计重构算子对原始数据样本段进行变换,从而得到第一目标数据集;其次,考虑到样本间的差异性,对原始数据集进行聚类重构,得到第二目标数据集;再次,利用聚类重构的新样本段集对聚类后的数据样本集进行卷积处理,得到第三目标数据集;最后,基于这三个新数据集分别训练子分类器,然后对分类结果进行决策加权融合。
相比现有方法,本发明显著的进步在于:
1)提出了基于多类型重构和聚类算法的PD语音样本变换算法,有效获得高质量新样本,从而提高识别准确率;
2)考虑到样本间的差异性,在使用重构算子前对样本集进行聚类;
3)设计卷积和算子构建新数据集;
4)采用类似层次递进均值聚类的方式构造新样本段数据集;
5)对多个样本数据集决策结果加权融合,以提高分类准确率。
目前PD语音诊断的公开数据集较少,本发明选取了两个具有代表性PD语音数据集用于方法验证。实验结果表明本方法构建的三个新样本数据集都比变换前的原数据集具有较高的准确率,本方法在使用特征学习算法后分类效果依然有不小提升,并在多种特征学习算法上有较好的提升潜力。
附图说明
图1是本发明实施例提供的一种帕金森病语音样本段多类型重构变换方法的步骤图;
图2是本发明实施例提供的PD的二类诊断混淆矩阵示图。
具体实施方式
下面结合附图具体阐明本发明的实施方式,实施例的给出仅仅是为了说明目的,并不能理解为对本发明的限定,包括附图仅供参考和说明使用,不构成对本发明专利保护范围的限制,因为在不脱离本发明精神和范围基础上,可以对本发明进行许多改变。
为了提升样本段质量,以提高分类准确率,本发明实施例提供一种帕金森病语音样本段多类型重构变换方法,如图1所示,包括步骤:
S1:对原始数据集S中各个受试者的样本段S使用重构算子进行重构,得到第一目标数据集Ef
S2:对原始数据集S中各个受试者的样本段
Figure BDA0003149225720000075
进行迭代式均值聚类,得到聚类数据集Y;
S3:对聚类数据集Y使用所述重构算子进行重构,得到第二目标数据集Es
S4:对聚类数据集Y和第二目标数据集Es使用卷积算子进行卷积,得到第三目标数据集Et
S5:基于所述第一目标数据集Ef、所述第二目标数据集Es、所述第三目标数据集Et,对三个子分类器进行训练及测试,训练时对各子分类器的分类结果做加权融合。
具体的,在所述步骤S1和所述步骤S3中,所述重构算子用于计算样本的均值、中位数、25%裁剪均值、标准差、四分位距离和平均绝对误差。
在步骤S1中,原始数据集
Figure BDA0003149225720000071
其中的各个样本
Figure BDA0003149225720000072
G表示S的总样本数,N表示每个样本的特征数;L表示受试者人数;
Figure BDA0003149225720000073
表示各个受试者的样本段
Figure BDA0003149225720000074
包括G0=G/L个样本。
以l(·)表示重构算子,则对每个受试者的样本段
Figure BDA0003149225720000076
进行重构得到数据集Efi,其过程表示为:
Figure BDA0003149225720000081
其中:
Figure BDA0003149225720000082
Figure BDA0003149225720000083
表示计算每个受试者的G0个样本
Figure BDA0003149225720000084
的均值;
Figure BDA0003149225720000085
Figure BDA0003149225720000086
表示计算每个受试者的G0个样本
Figure BDA0003149225720000087
的中位数;
Figure BDA0003149225720000088
Figure BDA0003149225720000089
表示计算每个受试者的G0个样本
Figure BDA00031492257200000810
的25%裁剪均值,
Figure BDA00031492257200000811
表示取整运算;
Figure BDA00031492257200000812
Figure BDA00031492257200000813
表示计算每个受试者的G0个样本
Figure BDA00031492257200000814
的标准差,“·”表示点乘;
Figure BDA00031492257200000815
Figure BDA00031492257200000816
表示计算每个受试者的G0个样本
Figure BDA00031492257200000817
的四分位距离;
Figure BDA00031492257200000818
Figure BDA00031492257200000819
表示计算每个受试者的G0个样本
Figure BDA00031492257200000820
的平均绝对误差。
从而,对L个受试者的样本段采用重构算子l(·)进行重构,得到的第一目标数据集可表示为:
Ef=[Ef1,Ef2,...,EfL]T
步骤S2具体为:
对原始数据集S中各个受试者的样本段
Figure BDA0003149225720000091
基于K-means迭代式均值聚类算法,得到聚类数据集
Figure BDA0003149225720000092
其中
Figure BDA0003149225720000093
Figure BDA0003149225720000094
为聚类计算,
Figure BDA0003149225720000095
Figure BDA0003149225720000096
表示第i个受试者的第j个聚类簇样本集,1≤i≤L,1≤j≤Q,Q表示聚类簇数。
这里的K-means迭代式均值聚类算法是指基于K-means聚类算法构造上一层新样本,再作为输入样本进行K-means聚类又得到上上一层新样本,如此重复;其中,样本间的欧几里得距离,为:
Figure BDA0003149225720000097
Figure BDA0003149225720000098
表示一个受试者的两个不同样本;
目标是最小化目标函数即平方和误差:
Figure BDA0003149225720000099
K为该聚类簇中的样本数,cj为第j个聚类中心,
Figure BDA00031492257200000910
表示2范数的平方;
聚类中心ck的更新由下式给出:
Figure BDA00031492257200000911
进一步地,在所述步骤S3中,对聚类数据集Y使用步骤S1同样的重构算子进行重构,得到第二目标数据集Es=[Es1,Es2,...,EsL]T,其中
Figure BDA00031492257200000912
进一步地,所述步骤S4具体为:
设计卷积算子对聚类数据集Y与第二目标数据集Es进行卷积和运算,得到第三目标数据集Et=[Et1,Et2,...,EtL]T,其中:
Figure BDA0003149225720000101
Figure BDA0003149225720000102
为Eti的第k个聚类簇与相应重构样本集卷积计算得到的样本集合,γ(·)为卷积算子;
其中,
Figure BDA0003149225720000103
I为聚类簇的样本数;
通过式(10)对Ti j
Figure BDA0003149225720000104
进行卷积和运算,得到样本集
Figure BDA0003149225720000105
Figure BDA0003149225720000106
其中,“·”为点乘。
在本实施例中,直接采用第一目标数据集Ef、第二目标数据集Es和第三目标数据集Et对3个子分类器进行单独训练后再加权融合取分类结果的方式。在其他实施例中,可以根据三个目标数据集重新构建三个新的目标数据集,在这种实施方式中,步骤S5具体包括步骤:
S51:对第一目标数据集Ef、第二目标数据集Es和第三目标数据集Et进行归一化,得到对应的第四目标数据集E′f、第五目标数据集E′s和第六第三目标数据集E′t
S52:对E′f、E′s和E′t分别进行训练集和测试集的划分,即
Figure BDA0003149225720000107
Figure BDA0003149225720000108
S53:根据
Figure BDA0003149225720000109
Figure BDA00031492257200001010
构造第七目标数据集
Figure BDA0003149225720000111
第八目标数据集
Figure BDA0003149225720000112
和第九目标数据集
Figure BDA0003149225720000113
用于分别对各子分类器进行训练和测试,训练时对各子分类器的分类结果做加权融合。
加权融合的公式为:
Figure BDA0003149225720000114
其中,Hi是第i个子分类器的预测标签,Hfinal是加权后的预测标签;αi是第i个子分类器的权重,由网格搜索法得到。
基于第一、第二、第三这三个目标数据集,其他实施例可做任意拆分、合并等常见变换,本实施例则不再赘述。
本发明所述方法的算法伪代码如下:
Figure BDA0003149225720000115
综上,本发明实施例提供的一种帕金森病语音样本段多类型重构变换方法,首先,设计重构算子对原始数据样本段进行变换,从而得到第一目标数据集;其次,考虑到样本间的差异性,对原始数据集进行聚类重构,得到第二目标数据集;再次,利用聚类重构的新样本段集对聚类后的数据样本集进行卷积处理,得到第三目标数据集;最后,基于这三个新数据集分别训练子分类器,然后对分类结果进行决策加权融合。
相比现有方法,本发明显著的进步在于:
1)提出了基于多类型重构和聚类算法的PD语音样本变换算法,有效获得高质量新样本,从而提高识别准确率;
2)考虑到样本间的差异性,在使用重构算子前对样本集进行聚类;
3)设计卷积和算子构建新数据集;
4)采用类似层次递进均值聚类的方式构造新样本段数据集;
5)对多个样本数据集决策结果加权融合,以提高分类准确率。
为了验证本例所述方法的有效性,实验部分组织了多组消融实验进行有效性验证,并与多个代表性算法进行对比。
目前国际上有代表性的两个PD语音公共数据集源于加州大学欧文分校建立的机器学习的数据库:①由Sakar等提供的数据集包含40例受试者的信息,其中患有0~6年PD的患者20例(14例男性,6例女性),正常人20例(10例男性,10例女性)。每例受试者有26个不同发音任务的语音样本,每个语音样本包含多种发音内容,包括连续元音字母发音、数字发音、单词发音、短句发音等。每个样本有26个特征。②由Little团队提供的数据集包括31例受试者,其中23例PD患者(16例男性,7例女性),8例正常人(3例男性,5例女性)。每例受试者有6个或者7个发音任务的样本,每个样本22个特征。两个数据集信息如表1,更多关于这两个数据集的详细信息,可访问网站(https://archive.ics.uci.edu/ml/index.php)。
表1数据集基础信息
Figure BDA0003149225720000121
实验采用分类准确度(accuracy)、灵敏度(sensitivity)和特异性(specificity)作为实验结果的评价指标,验证本例提出算法的有效性。准确率是指被正确判断的样本占样本总数的百分比。敏感性和特异性是解释医学诊断试验准确性的两个常用指标。由于本例的PD语音诊断是二元分类任务,因此可以使用混淆矩阵来描述灵敏度和特异性的组成,如图2所示。
由图中混淆矩阵,本例所使用的指标可表示为:
Figure BDA0003149225720000131
Figure BDA0003149225720000132
Figure BDA0003149225720000133
根据数据集中多个样本对应一个受试者的特点,本例采用了leave-one-subject-out(LOSO)方法。此方法能够最大限度地增加训练样本数量,尤其在小样本情况下,能更好地反映分类算法的潜力。该方法对所有的样本都进行了充分的测试,测试准确率更接近实际应用场景中的结果。现有的算法大多基于k-fold和holdout交叉验证方法,训练样本和测试样本可能来自同一受试者,从而导致分类准确率不真实。与这两种方法不同的是,LOSO可以保证训练样本和测试样本来自不同受试者,可以保证分类精度与实际诊断相一致。
为了验证本方法的性能,在实验中采用了常用的多项式核函数的支持向量机(support vector machine,SVM)和随机森林(RF)。支持向量机的损失函数设置10,gamma函数设置为0.005,随机森林分类器数设置为50。所使用的硬件设备是64位计算机,其操作系统是Windows10,软件是Matlab2017(b)。
本实验中,分别基于Sakar和Maxlittle两个数据集使用消融法验证算法有效性。步骤一,对原始数据数据使用重构算子得到第一个新数据集(EF_IT)。步骤二,对原始数据集进行聚类重构,得到第二个新数据集(ES_IT)。步骤三,结合第二个新数据集和聚类得到的数据集,进行卷积处理,得到第三个新数据集(ET_IT)。最后,分别采用SVM基于这三个数据集进行训练,并做决策加权融合,得到分类结果。实验结果如表2、3所示。实验中,SVM(支持向量机)和RF(随机森林)被采用作为分类器。
表2基于Sakar数据集的消融法比较
Figure BDA0003149225720000141
表3基于Maxlittle数据集的消融法比较
Figure BDA0003149225720000142
如表2所示,基于Sakar数据集,基于数据集一EF_IT的SVM的准确率仅为79.25%,RF准确率仅为76.76%。基于数据集二ES_IT的SVM的准确率提升了9.75%,RF的准确率提升了1.24%。基于数据集三ET_IT的分类结果相较于ES_IT来说,采用RF的准确率提升了4.5%。对于MRCSST,无论是SVM还是RF,所获得的准确率均高于上述三个数据集(数据集一、二、三)。表3和表2的结果有一定的相似性,均表明本例方法获得的新样本集可以显著提升分类准确率。如表3所示,基于Maxlittle数据集,数据集一的SVM的准确率为88.28%,RF准确率为80.34%,而数据集二在考虑到样本分布差异,采用聚类再重构的方法,SVM的准确率提升了4.82%,RF的准确率提升了2.76%,本例方法的RF准确率也均高于这三个数据集。综上所述,本例构建的三个新样本数据集都比变换前的原数据集具有较高的准确率,说明本例算法中涉及的样本段聚类和多类型重构方法是有效的;并且本例方法对三个数据集加权融合的结果取得了更高的准确率,说明本例方法中多样本段集决策加权融合方法是有效的。
为了进一步验证本方法的有效性,这里选用了经典的特征学习算法作为基准算法,对比采用本方法的前后效果。对比结果如表4所示。
表4与特征学习方法比较
Figure BDA0003149225720000151
如表4所示,基于sakar数据集,针对这四种特征学习算法,本例算法显著提升了准确率,提升量均不低于20%。在Maxlittle数据集上,由于MaxLittle中阳性和阴性样本的不平衡,TPR和TNR在四种比较方法中差异较大,本例算法在特异度上的表现更好,Relief方法上RF准确率提高5.17%,Lpp方法上SVM准确率提高3.45%,Pca方法上RF准确率提高6.55%,Lda方法上RF准确率提高10%。总之,在大多数情况下,本例算法显著提升了现有特征学习算法性能。
目前PD语音诊断的公开数据集较少,本实施例选取了两个具有代表性PD语音数据集用于方法验证。实验结果表明本方法构建的三个新样本数据集都比变换前的原数据集具有较高的准确率,本方法在使用特征学习算法后分类效果依然有不小提升,并在多种特征学习算法上有较好的提升潜力。
最后需要说明的是,本实施例仅以帕金森病语音分类为例,该方法可用于其他语音样本上的分类,根据实际需求选择。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (10)

1.一种帕金森病语音样本段多类型重构变换方法,其特征在于,包括步骤:
S1:对原始数据集S中各个受试者的样本段
Figure FDA0003149225710000011
使用重构算子进行重构,得到第一目标数据集Ef
S2:对原始数据集S中各个受试者的样本段
Figure FDA0003149225710000012
进行迭代式均值聚类,得到聚类数据集Y;
S3:对聚类数据集Y使用所述重构算子进行重构,得到第二目标数据集Es
S4:对聚类数据集Y和第二目标数据集Es使用卷积算子进行卷积,得到第三目标数据集Et
S5:基于所述第一目标数据集Ef、所述第二目标数据集Es、所述第三目标数据集Et,对三个子分类器进行训练及测试,训练时对各子分类器的分类结果做加权融合。
2.根据权利要求1所述的一种帕金森病语音样本段多类型重构变换方法,其特征在于:在所述步骤S1和所述步骤S3中,所述重构算子用于计算样本的均值、中位数、25%裁剪均值、标准差、四分位距离和平均绝对误差。
3.根据权利要求2所述的一种帕金森病语音样本段多类型重构变换方法,其特征在于:
原始数据集
Figure FDA0003149225710000013
其中的各个样本
Figure FDA0003149225710000014
G表示S的总样本数,N表示每个样本的特征数;L表示受试者人数;
Figure FDA0003149225710000015
1≤i≤L表示各个受试者的样本段
Figure FDA0003149225710000016
包括G0=G/L个样本。
4.根据权利要求3所述的一种帕金森病语音样本段多类型重构变换方法,其特征在于:
第一目标数据集Ef=[Ef1,Ef2,...,EfL]T,其中:
Figure FDA0003149225710000021
其中:
Figure FDA00031492257100000218
表示重构算子,
Figure FDA0003149225710000022
E1表示计算每个受试者的G0个样本
Figure FDA0003149225710000023
1≤j≤G0的均值;
Figure FDA0003149225710000024
Figure FDA00031492257100000219
表示计算每个受试者的G0个样本
Figure FDA0003149225710000025
1≤j≤G0的中位数;
Figure FDA0003149225710000026
E3表示计算每个受试者的G0个样本
Figure FDA0003149225710000027
1≤j≤G0的25%裁剪均值,
Figure FDA0003149225710000028
表示取整运算;
Figure FDA0003149225710000029
Figure FDA00031492257100000210
表示计算每个受试者的G0个样本
Figure FDA00031492257100000211
1≤j≤G0的标准差,“·”表示点乘;
Figure FDA00031492257100000212
Figure FDA00031492257100000213
表示计算每个受试者的G0个样本
Figure FDA00031492257100000214
1≤j≤G0的四分位距离;
Figure FDA00031492257100000215
Figure FDA00031492257100000216
表示计算每个受试者的G0个样本
Figure FDA00031492257100000217
1≤j≤G0的平均绝对误差。
5.根据权利要求4所述的一种帕金森病语音样本段多类型重构变换方法,其特征在于,所述步骤S2具体为:
对原始数据集S中各个受试者的样本段
Figure FDA0003149225710000031
基于K-means迭代式均值聚类算法,得到聚类数据集
Figure FDA0003149225710000032
其中
Figure FDA0003149225710000033
Figure FDA0003149225710000034
为聚类计算,
Figure FDA0003149225710000035
Figure FDA0003149225710000036
表示第i个受试者的第j个聚类簇样本集,1≤i≤L,1≤j≤Q,Q表示聚类簇数。
6.根据权利要求5所述的一种帕金森病语音样本段多类型重构变换方法,其特征在于:所述K-means迭代式均值聚类算法是指基于K-means聚类算法构造上一层新样本,再作为输入样本进行K-means聚类又得到上上一层新样本,如此重复;其中,样本间的欧几里得距离,为:
Figure FDA0003149225710000037
Figure FDA0003149225710000038
表示一个受试者的两个不同样本;
目标是最小化目标函数即平方和误差:
Figure FDA0003149225710000039
K为该聚类簇中的样本数,cj为第j个聚类中心,
Figure FDA00031492257100000310
表示2范数的平方;
聚类中心ck的更新由下式给出:
Figure FDA00031492257100000311
7.根据权利要求6所述的一种帕金森病语音样本段多类型重构变换方法,其特征在于,在所述步骤S3中,第二目标数据集Es=[Es1,Es2,...,EsL]T,其中
Figure FDA00031492257100000312
8.根据权利要求7所述的一种帕金森病语音样本段多类型重构变换方法,其特征在于,所述步骤S4具体为:
设计卷积算子对聚类数据集Y与第二目标数据集Es进行卷积和运算,得到第三目标数据集Et=[Et1,Et2,...,EtL]T,其中:
Figure FDA0003149225710000041
Figure FDA0003149225710000042
为Eti的第k个聚类簇与相应重构样本集卷积计算得到的样本集合,γ(·)为卷积算子;
其中,
Figure FDA0003149225710000043
I为聚类簇的样本数;
通过式(10)对
Figure FDA0003149225710000044
进行卷积和运算,得到样本集
Figure FDA0003149225710000045
Figure FDA0003149225710000046
其中,“·”为点乘。
9.根据权利要求1~8任意一项所述的一种帕金森病语音样本段多类型重构变换方法,其特征在于,所述步骤S5具体包括步骤:
S51:对第一目标数据集Ef、第二目标数据集Es和第三目标数据集Et进行归一化,得到对应的第四目标数据集E′f、第五目标数据集Es′和第六第三目标数据集Et′;
S52:对E′f、Es′和Et′分别进行训练集和测试集的划分,即
Figure FDA0003149225710000047
Figure FDA0003149225710000051
S53:根据
Figure FDA0003149225710000052
Figure FDA0003149225710000053
构造第七目标数据集
Figure FDA0003149225710000054
第八目标数据集
Figure FDA0003149225710000055
和第九目标数据集
Figure FDA0003149225710000056
用于分别对各子分类器进行训练和测试,训练时对各子分类器的分类结果做加权融合。
10.根据权利要求9所述的一种帕金森病语音样本段多类型重构变换方法,其特征在于,加权融合的公式为:
Figure FDA0003149225710000057
其中,Hi是第i个子分类器的预测标签,Hfinal是加权后的预测标签;αi是第i个子分类器的权重,由网格搜索法得到。
CN202110761463.XA 2021-07-06 2021-07-06 一种帕金森病语音样本段多类型重构变换方法 Active CN113393932B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110761463.XA CN113393932B (zh) 2021-07-06 2021-07-06 一种帕金森病语音样本段多类型重构变换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110761463.XA CN113393932B (zh) 2021-07-06 2021-07-06 一种帕金森病语音样本段多类型重构变换方法

Publications (2)

Publication Number Publication Date
CN113393932A true CN113393932A (zh) 2021-09-14
CN113393932B CN113393932B (zh) 2022-11-25

Family

ID=77625295

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110761463.XA Active CN113393932B (zh) 2021-07-06 2021-07-06 一种帕金森病语音样本段多类型重构变换方法

Country Status (1)

Country Link
CN (1) CN113393932B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080319741A1 (en) * 2007-06-20 2008-12-25 At&T Corp. System and method for improving robustness of speech recognition using vocal tract length normalization codebooks
CN106202952A (zh) * 2016-07-19 2016-12-07 南京邮电大学 一种基于机器学习的帕金森疾病诊断方法
CN107170445A (zh) * 2017-05-10 2017-09-15 重庆大学 基于语音混合信息特征协同优选判别的帕金森症检测装置
CN107316049A (zh) * 2017-05-05 2017-11-03 华南理工大学 一种基于半监督自训练的迁移学习分类方法
CN107943830A (zh) * 2017-10-20 2018-04-20 西安电子科技大学 一种适用于高维大数据集的数据分类方法
CN108416364A (zh) * 2018-01-31 2018-08-17 重庆大学 分包融合集成学习数据分类方法
CN108877947A (zh) * 2018-06-01 2018-11-23 重庆大学 基于迭代均值聚类的深度样本学习方法
CN109192221A (zh) * 2018-03-30 2019-01-11 大连理工大学 一种基于聚类的使用语音判断帕金森严重程度检测方法
CN109376574A (zh) * 2018-08-14 2019-02-22 西安电子科技大学 基于cnn的可拒判雷达hrrp目标识别方法
CN110890154A (zh) * 2018-09-07 2020-03-17 重庆工商职业学院 一种高效的帕金森病数据集分类方法
CN111354338A (zh) * 2020-02-26 2020-06-30 重庆大学 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统
CN111368076A (zh) * 2020-02-27 2020-07-03 中国地质大学(武汉) 一种基于随机森林的伯努利朴素贝叶斯文本分类方法
CN111524606A (zh) * 2020-04-24 2020-08-11 郑州大学第一附属医院 一种基于随机森林算法的肿瘤数据统计方法
CN113057585A (zh) * 2021-03-15 2021-07-02 中国科学院计算技术研究所 一种认知障碍检测模型及其训练方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080319741A1 (en) * 2007-06-20 2008-12-25 At&T Corp. System and method for improving robustness of speech recognition using vocal tract length normalization codebooks
CN106202952A (zh) * 2016-07-19 2016-12-07 南京邮电大学 一种基于机器学习的帕金森疾病诊断方法
CN107316049A (zh) * 2017-05-05 2017-11-03 华南理工大学 一种基于半监督自训练的迁移学习分类方法
CN107170445A (zh) * 2017-05-10 2017-09-15 重庆大学 基于语音混合信息特征协同优选判别的帕金森症检测装置
CN107943830A (zh) * 2017-10-20 2018-04-20 西安电子科技大学 一种适用于高维大数据集的数据分类方法
CN108416364A (zh) * 2018-01-31 2018-08-17 重庆大学 分包融合集成学习数据分类方法
CN109192221A (zh) * 2018-03-30 2019-01-11 大连理工大学 一种基于聚类的使用语音判断帕金森严重程度检测方法
CN108877947A (zh) * 2018-06-01 2018-11-23 重庆大学 基于迭代均值聚类的深度样本学习方法
CN109376574A (zh) * 2018-08-14 2019-02-22 西安电子科技大学 基于cnn的可拒判雷达hrrp目标识别方法
CN110890154A (zh) * 2018-09-07 2020-03-17 重庆工商职业学院 一种高效的帕金森病数据集分类方法
CN111354338A (zh) * 2020-02-26 2020-06-30 重庆大学 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统
CN111368076A (zh) * 2020-02-27 2020-07-03 中国地质大学(武汉) 一种基于随机森林的伯努利朴素贝叶斯文本分类方法
CN111524606A (zh) * 2020-04-24 2020-08-11 郑州大学第一附属医院 一种基于随机森林算法的肿瘤数据统计方法
CN113057585A (zh) * 2021-03-15 2021-07-02 中国科学院计算技术研究所 一种认知障碍检测模型及其训练方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
YONGMING LI 等: ""Classification of Parkinson"s disease by Decision Tree based Instance Selection and Ensemble Learning algorithms"", 《JOURNAL OF MEDICAL IMAGING AND HEALTH INFORMATICS》 *
张小恒 等: ""基于语音卷积稀疏迁移学习和并行优选的帕金森病分类算法研究"", 《电子与信息学报》 *
张小恒 等: ""混合语音段特征双边式优选算法用"", 《生物医学工程学杂志》 *
张成: ""基于样本分布学习与协同学习的帕金森病语音诊断方法研究"", 《中国优秀硕士学位论文全文数据库 (医药卫生科技辑)》 *
李勇明 等: ""基于语音样本重复剪辑和随机森林的帕金森病诊断算法研究"", 《生物医学工程学杂志》 *

Also Published As

Publication number Publication date
CN113393932B (zh) 2022-11-25

Similar Documents

Publication Publication Date Title
Saeedi et al. Major depressive disorder assessment via enhanced k-nearest neighbor method and EEG signals
Caliskan et al. Diagnosis of the parkinson disease by using deep neural network classifier
US12002545B2 (en) Technique for identifying features
Bihis et al. A generalized flow for multi-class and binary classification tasks: An Azure ML approach
Costa et al. Classification of breast tissue in mammograms using efficient coding
CN110400610B (zh) 基于多通道随机森林的小样本临床数据分类方法及系统
Pei et al. A hybrid deep learning scheme for multi-channel sleep stage classification
Manohar et al. Diagnosis of schizophrenia disorder in MR brain images using multi-objective BPSO based feature selection with fuzzy SVM
CN112052874A (zh) 一种基于生成对抗网络的生理数据分类方法及系统
Wang et al. Non-uniform speaker disentanglement for depression detection from raw speech signals
Li et al. Insight into an unsupervised two-step sparse transfer learning algorithm for speech diagnosis of Parkinson’s disease
Logeshwaran et al. Optimizing the Capacity of Extreme Learning Machines for Biomedical Informatics Applications
Hazarika et al. A novel machine learning based technique for classification of early-stage alzheimer’s disease using brain images
Wu et al. A data-driven principal component analysis-support vector machine approach for breast cancer diagnosis: Comparison and application
CN113393932B (zh) 一种帕金森病语音样本段多类型重构变换方法
Tsanas et al. Large-scale Clustering of People Diagnosed with Parkinson's Disease using Acoustic Analysis of Sustained Vowels: Findings in the Parkinson's Voice Initiative Study.
Li et al. Envelope multi-type transformation ensemble algorithm of Parkinson speech samples
Dudchenko et al. Extraction from medical records
CN113284512B (zh) 一种基于深度稀疏迁移学习的帕金森语音分类方法
Khatami et al. Evaluating the performance of different classification methods on medical X-ray images
Agarwal et al. Hybrid nature-inspired algorithm for feature selection in alzheimer detection using brain MRI images
Bhardwaj et al. Machine Learning Assisted Binary and Multiclass Parkinson's Disease Detection
Frid et al. Kohonen-based topological clustering as an amplifier for multi-class classification for Parkinson’s disease
Adiban et al. I-vector based features embedding for heart sound classification
Ferdous et al. Application of hybrid classifier for multi-class classification of MRI brain tumor images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant