CN111354338B - 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统 - Google Patents

基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统 Download PDF

Info

Publication number
CN111354338B
CN111354338B CN202010119313.4A CN202010119313A CN111354338B CN 111354338 B CN111354338 B CN 111354338B CN 202010119313 A CN202010119313 A CN 202010119313A CN 111354338 B CN111354338 B CN 111354338B
Authority
CN
China
Prior art keywords
convolution kernel
convolution
optimal
particle
pso
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010119313.4A
Other languages
English (en)
Other versions
CN111354338A (zh
Inventor
李勇明
张小恒
王品
李新科
贾云健
颜芳
黄智勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN202010119313.4A priority Critical patent/CN111354338B/zh
Publication of CN111354338A publication Critical patent/CN111354338A/zh
Application granted granted Critical
Publication of CN111354338B publication Critical patent/CN111354338B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/086Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Physiology (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,包括:数据采集模块、公共数据库、目标数据库和分类识别器;系统将公共语音数据集的语音特征进行卷积稀疏学习,得到相应的卷积核;然后利用目标数据库中的一部分目标数据集进行卷积稀疏编码及样本和特征并行优选;通过PSO算法得到最优卷积核;然后基于最优卷积核,利用目标数据库中的另一部分目标数据集进行卷积稀疏编码及样本和特征并行优选;从而得到系统最优卷积核及最佳样本和特征;最后数据采集模块采集待测对象的语音数据基于最优卷积核进行卷积稀疏编码,提取编码后的最佳样本和特征,由分类识别器得出测试结果。本系统分类准确率高,样本需求量少,实施方便。

Description

基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统
技术领域
本发明涉及智慧医疗技术,具体地说,是一种基于PSO(粒子群优化算法)卷积核优化稀疏迁移学习的帕金森语音识别系统。
背景技术
帕金森病(PD)是一种多发于中老年的渐进性中枢神经系统变性疾病,在帕金森病患者中,有50%~80%的病例起病隐袭,早期难以察觉而常被忽视,检测语言障碍将有助于实现高准确性的帕金森病早期诊断,目前,PD语音特征参数提取的主要类型有基音周期,振幅微扰,基频微扰、谐波信噪比及基频标准差等多种类型。特征选择变换的方法有PCA,LDA,串行搜索法、基于进化计算法等。分类器的方法主要有支持向量机、K最近邻网络、随机森林和决策树等,深度学习方法包括DBN,DNN,自动编码器等等,还有模糊理论也作为一种辅助方法。
上述研究均基于当前语音数据采用机器学习算法实现PD分类,取得了较大进展。但是,这些方法大都直接基于当前语音数据集本身进行。目前这些PD语音公共数据集规模较小,难以采用深度学习方法进行处理,样本和特征的同时优选将有利于在小样本量情况下获得高质量的样本和特征,提高分类准确性。
发明内容
针对现有技术的不足,本发明的目的是提供一种基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,能够快速准确的实现帕金森语音识别。
为达到上述目的,本发明所采用的具体技术方案如下:
一种基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,其关键在于包括:数据采集模块、公共数据库、目标数据库和分类识别器;
所述公共数据库用于存储公共语音数据集;
所述目标数据库用于存储代表帕金森语音数据的目标数据集;
所述分类识别器采用人工智能模型;
所述数据采集模块采集待测对象的语音数据,对该语音数据提取语音特征并基于最优卷积核进行卷积稀疏编码,然后选择编码后的最佳样本和特征输入所述分类识别器得出测试结果;
所述最优卷积核以及最佳样本和特征由以下步骤确定:
S1:初始化PSO算法相关参数并随机初始化卷积核粒子群;
S2:将每一代卷积核粒子群中各个粒子作为原始卷积核对所述公共数据库中的公共语音数据集的语音特征进行卷积稀疏学习,得到各自对应的卷积核终值;
S3:基于各个卷积核终值,利用所述目标数据库中的一部分目标数据集作为训练集进行卷积稀疏编码及并行样本和特征优选;得出分类准确率高的样本和特征并确定其对应的各个粒子的适应度函数值;
S4:基于各个粒子的适应度函数值更新卷积核粒子群,循环执行步骤S2和步骤S3直至得到所述最优卷积核;
S5:基于所述最优卷积核,利用所述目标数据库中的另一部分目标数据集作为验证集和测试集进行卷积稀疏编码及并行样本和特征优选;得到所述最优卷积核对应的最佳样本和特征。
可选地,所述公共数据库中的公共语音数据集通过加载不同类型不同信噪比的噪声来扩展数据样本。
可选地,所述目标数据库中每个测试对象的语音样本包括26个,具体为下表所示:
样本序列 样本描述
第1个 持续元音aaa
第2个 持续元音ooo
第3个 持续元音uuu
第4个~第13个 数字1~10
第14个~第17个 预设的短句
第18个~第26个 预设的单词
且所述数据采集模块也按照上述样本形式采集待测对象的语音数据。
可选地,步骤S1随机初始化卷积核粒子群时,设定卷积核尺度为8*8,并视为1*64维向量,每一维的取值范围为[-1,+1],种群大小为20,粒子初始速度为0.01,最大速度为1,最大迭代次数为60。
可选地,步骤S2中,所述公共数据库中的公共语音数据集的语音特征进行卷积稀疏学习时,主循环次数,特征图循环次数及卷积核训练次数分别为100,10和10。
可选地,将步骤S3中训练集的测试准确率作为各个粒子的适应度函数值,并按照下式更新粒子的移动速度和位置:
Figure GDA0002443363960000031
Figure GDA0002443363960000041
i=1,2,3…,M;其中:
Figure GDA0002443363960000042
是粒子i在第k次迭代中第d维的速度;
Figure GDA0002443363960000043
是粒子i在第k次迭代中第d维的位置;winertia是惯性权重,且c1和c2是学习因子,Chi为退化因子;
Figure GDA0002443363960000044
Figure GDA0002443363960000045
是介于0~1之间的随机数;
Figure GDA0002443363960000046
是粒子i在第d维的个体极值点的位置;
Figure GDA0002443363960000047
是整个种群在第d维的全局极值点的位置。
可选地,所述分类识别器采用SVM模型。
本发明的显著效果是:
本发明提出了一种基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,结合了卷积稀疏迁移学习和样本特征并行优选,在稀疏卷积学习方面,该方法更有利于表达PD语音特征的有效结构信息;在并行优选方面,样本与特征的关联性同时被考虑。样本特征并行优选考虑到了样本和语音特征间的关系,从而有助于获取高质量的特征。
附图说明
图1是本发明的系统架构图;
图2是本发明的系统流程图。
具体实施方式
下面结合附图对本发明的具体实施方式以及工作原理作进一步详细说明。
本实施例提供一种基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,数据采集模块、公共数据库、目标数据库和分类识别器;
所述公共数据库用于存储公共语音数据集;本实施例中采用TIMIT公共数据集,并将其作为源数据集,通过加载不同类型不同信噪比的噪声来扩展数据样本。
具体地,设扩展后数据集
Figure GDA0002443363960000051
其中
Figure GDA0002443363960000052
是公共数据集中的原始语音信号,
Figure GDA0002443363960000053
为不同类型噪声信号,SNRj表示不同的信噪比,φ(·)为加噪及信噪比调节函数。
所述目标数据库用于存储表达帕金森语音数据的目标数据集;
本实施例将Sakar数据集,MaxLittle数据集和西南医院自建的数据集共同作为目标数据集,并分为PartA和PartB两部分,Sakar数据集由Sakar等人建立并从加州大学欧文分校(UCI)机器学习数据库网站获取。主要选取名为“Trainning_Data”的数据集,其中包含M=40名受试者,M1=20名健康受试者,M2=20患者受试者,每一个测试对象包含了H0=26个语音样本,具体样本参考表1,每一个语音样本设置N=26个特征,具体为下表所示:
样本序列 样本描述
第1个 持续元音aaa
第2个 持续元音ooo
第3个 持续元音uuu
第4个~第13个 数字1~10
第14个~第17个 预设的短句
第18个~第26个 预设的单词
MaxLittle集是由MaxLittle等人在2008年创建的。
所述分类识别器采用人工智能模型,本实施例选择SVM模型;
所述数据采集模块采集待测对象的语音数据,对该语音数据提取语音特征并基于最优卷积核进行卷积稀疏编码,然后选择编码后的最佳样本和特征输入所述分类识别器得出测试结果;
具体实施时,每一次测试对象的测试数据还可以保存至所述目标数据库中从而扩大目标数据集的样本数量,系统还可以定期或不定期的利用所述公共数据库和最新的目标数据库来重新进行训练,得到当前状态下系统的最佳样本和特征以及最优卷积核。
如图1和图2所示,具体实施时,所述最优卷积核以及最佳样本和特征由以下步骤确定:
S1:初始化PSO算法相关参数并随机初始化卷积核粒子群;设定卷积核尺度为8*8,并视为1*64维向量,每一维的取值范围为[-1,+1],种群大小为20,粒子初始速度为0.01,最大速度为1,最大迭代次数为60;
S2:将每一代卷积核粒子群中各个粒子作为原始卷积核对所述公共数据库中的公共语音数据集的语音特征进行卷积稀疏学习,得到各自对应的卷积核终值;
本实施例通过对扩展后数据集进行特征提取将形成特征库:
Figure GDA0002443363960000061
作为源领域数据集,其中
Figure GDA0002443363960000062
采用现有的特征提取方法可以提取语音信号N个不同特征,特征样本总数为L,
Figure GDA0002443363960000063
为二维H0×N块矩阵,且
Figure GDA0002443363960000064
为稀疏字典学习训练样本,
Figure GDA0002443363960000065
为卷积核稀疏学习训练样本。
在卷积稀疏编码(CSC)中,给定M个训练样本
Figure GDA0002443363960000071
通过以下最小化目标函数学习卷积核组
Figure GDA0002443363960000072
Figure GDA0002443363960000073
其中
Figure GDA0002443363960000074
为H0×N块矩阵,em,k为H0×N特征图矩阵,通过与相对应的卷积核dk卷积逼近xm,符号*表示二维卷积符号且η是大于零的正则化因子,解决以上优化问题的方法都是基本经典框架交替方向乘子法(ADMM)。
上式可重新表达为:
Figure GDA0002443363960000075
其中,
Figure GDA0002443363960000076
D=[D1 D2…DK]为[d1 d2…dK]所对应的向量化卷积运算符,
Figure GDA0002443363960000077
为向量化特征图。
基于上述表达时,通过固定卷积核可以学习特征图,通过固定特征图可以学习卷积核,本例中设置主循环次数,特征图循环次数及卷积核训练次数分别为100,10和10。
S3:基于各个卷积核终值,利用PartA中的目标数据集作为训练集进行卷积稀疏编码及并行样本和特征优选;得出分类准确率高的样本和特征并确定其对应的各个粒子的适应度函数值;
S4:基于各个粒子的适应度函数值更新卷积核粒子群,循环执行步骤S2和步骤S3直至得到所述最优卷积核;
S5:基于所述最优卷积核,利用PartB中的目标数据集作为验证集和测试集进行卷积稀疏编码及并行样本和特征优选;得到所述最优卷积核对应的最佳样本和特征。
针对目标数据集而言,在进行样本和特征优选时,定义目标数据集:
Figure GDA0002443363960000081
其中向量
Figure GDA0002443363960000082
标签向量
Figure GDA0002443363960000083
分块矩阵
Figure GDA0002443363960000084
样本总数为H,每个样本的特征数(向量分量数)为N,全体样本划分为M个受试者(subject),即每个受试者包含的样本数为:H0=H/M;
特征扩展,并构造:
Figure GDA0002443363960000085
其中传统稀疏卷积稀疏编码的特征扩展是将特征矩阵
Figure GDA0002443363960000086
重整为行向量,归一化G得G′,并分割
Figure GDA0002443363960000087
为训练集
Figure GDA0002443363960000088
与测试集Tm
基于Relief算法,计算归一化向量
Figure GDA0002443363960000089
的权重
Figure GDA00024433639600000810
特征
Figure GDA00024433639600000811
的权重表达如下.
Figure GDA00024433639600000812
M(γij)是γij的邻居集合,集合包含R个样本,H(γij)是γij的邻居集合,也包含R个样本,Mrij)∈M(γij),Hrij)∈H(γij),通过重排
Figure GDA00024433639600000813
w1≥w2≥…≥wQ,特征集
Figure GDA00024433639600000814
通过权重重构如下:
Figure GDA0002443363960000091
其中Q维向量
Figure GDA0002443363960000092
Figure GDA0002443363960000093
通过
Figure GDA0002443363960000094
的Q个最大的权重来选择,
Figure GDA0002443363960000095
index是权重wi对应的特征列向量的列下标。
在进行PSO卷积核优化时,将步骤S3中训练集的测试准确率作为各个粒子的适应度函数值,并按照下式更新粒子的移动速度和位置:
Figure GDA0002443363960000096
Figure GDA0002443363960000097
i=1,2,3…,M;其中:
Figure GDA0002443363960000098
是粒子i在第k次迭代中第d维的速度;
Figure GDA0002443363960000099
是粒子i在第k次迭代中第d维的位置;winertia是惯性权重,且c1和c2是学习因子,Chi为退化因子;
Figure GDA00024433639600000910
Figure GDA00024433639600000911
是介于0~1之间的随机数;
Figure GDA00024433639600000912
是粒子i在第d维的个体极值点的位置;
Figure GDA00024433639600000913
是整个种群在第d维的全局极值点的位置。
本系统将目标集分成两部分PartA和PartB,基于不同的卷积核对PartA实施卷积稀疏迁移学习及样本和特征的并行优选会得到不同的准确率,选取准确率高的卷积核然后再基于优选后的核对PartB实施卷积稀疏迁移学习及样本和特征并行优选,最终得出最优卷积核及对应的最佳样本和特征,从而提高系统分类准确率。
通过上述过程将系统的分类准确率提升后,可以直接将其用于对待测患者进行帕金森语音识别,通过所述数据采集模块按照上述样本的形式采集待测对象的语音数据,提取相关的语音特征后,通过最佳的卷积核进行卷积稀疏编码,然后选择编码后的最佳样本和特征,送入所述分类识别器中,根据分类识别器的输出结果确定待测对象是否属于帕金森病患者。与现有技术相比,本系统的分类准确率更高,而且实施起来工程复杂度不高,可有效减少对训练样本的需求。
最后需要说明的是,上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (7)

1.一种基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,其特征在于包括:数据采集模块、公共数据库、目标数据库和分类识别器;
所述公共数据库用于存储公共语音数据集;
所述目标数据库用于存储代表帕金森语音数据的目标数据集;
所述分类识别器采用人工智能模型;
所述数据采集模块采集待测对象的语音数据,对该语音数据提取语音特征并基于最优卷积核进行卷积稀疏编码,然后选择编码后的最佳样本和特征输入所述分类识别器得出测试结果;
所述最优卷积核以及最佳样本和特征由以下步骤确定:
S1:初始化PSO算法相关参数并随机初始化卷积核粒子群;
S2:将每一代卷积核粒子群中各个粒子作为原始卷积核对所述公共数据库中的公共语音数据集的语音特征进行卷积稀疏学习,得到各自对应的卷积核终值;
S3:基于各个卷积核终值,利用所述目标数据库中的一部分目标数据集作为训练集进行卷积稀疏编码及并行样本和特征优选;得出分类准确率高的样本和特征并确定其对应的各个粒子的适应度函数值;
S4:基于各个粒子的适应度函数值更新卷积核粒子群,循环执行步骤S2和步骤S3直至得到所述最优卷积核;
S5:基于所述最优卷积核,利用所述目标数据库中的另一部分目标数据集作为验证集和测试集进行卷积稀疏编码及并行样本和特征优选;得到所述最优卷积核对应的最佳样本和特征。
2.根据权利要求1所述的基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,其特征在于:所述公共数据库中的公共语音数据集通过加载不同类型不同信噪比的噪声来扩展数据样本。
3.根据权利要求1所述的基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,其特征在于:所述目标数据库中每个测试对象的语音样本包括26个,具体为下表所示:
样本序列 样本描述 第1个 持续元音aaa 第2个 持续元音ooo 第3个 持续元音uuu 第4个~第13个 数字1~10 第14个~第17个 预设的短句 第18个~第26个 预设的单词
且所述数据采集模块也按照上述样本形式采集待测对象的语音数据。
4.根据权利要求1-3任一所述的基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,其特征在于:步骤S1随机初始化卷积核粒子群时,设定卷积核尺度为8*8,并视为1*64维向量,每一维的取值范围为[-1,+1],种群大小为20,粒子初始速度为0.01,最大速度为1,最大迭代次数为60。
5.根据权利要求4所述的基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,其特征在于:步骤S2中,所述公共数据库中的公共语音数据集的语音特征进行卷积稀疏学习时,主循环次数,特征图循环次数及卷积核训练次数分别为100,10和10。
6.根据权利要求4所述的基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,其特征在于:将步骤S3中训练集的测试准确率作为各个粒子的适应度函数值,并按照下式更新粒子的移动速度和位置:
Figure FDA0002392474100000031
Figure FDA0002392474100000032
i=1,2,3…,M;其中:
Figure FDA0002392474100000033
是粒子i在第k次迭代中第d维的速度;
Figure FDA0002392474100000034
是粒子i在第k次迭代中第d维的位置;winertia是惯性权重,且c1和c2是学习因子,Chi为退化因子;
Figure FDA0002392474100000035
Figure FDA0002392474100000036
是介于0~1之间的随机数;
Figure FDA0002392474100000037
是粒子i在第d维的个体极值点的位置;
Figure FDA0002392474100000038
是整个种群在第d维的全局极值点的位置。
7.根据权利要求1所述的基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,其特征在于:所述分类识别器采用SVM模型。
CN202010119313.4A 2020-02-26 2020-02-26 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统 Active CN111354338B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010119313.4A CN111354338B (zh) 2020-02-26 2020-02-26 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010119313.4A CN111354338B (zh) 2020-02-26 2020-02-26 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统

Publications (2)

Publication Number Publication Date
CN111354338A CN111354338A (zh) 2020-06-30
CN111354338B true CN111354338B (zh) 2022-03-15

Family

ID=71197231

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010119313.4A Active CN111354338B (zh) 2020-02-26 2020-02-26 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统

Country Status (1)

Country Link
CN (1) CN111354338B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112233785B (zh) * 2020-07-08 2022-04-22 华南理工大学 一种帕金森症的智能识别方法
CN111899757B (zh) * 2020-09-29 2021-01-12 南京蕴智科技有限公司 针对目标说话人提取的单通道语音分离方法及系统
CN112489761A (zh) * 2020-11-19 2021-03-12 华中科技大学同济医学院附属协和医院 一种液体及能量管理系统
CN113284512B (zh) * 2021-05-25 2022-05-27 重庆大学 一种基于深度稀疏迁移学习的帕金森语音分类方法
CN113393932B (zh) * 2021-07-06 2022-11-25 重庆大学 一种帕金森病语音样本段多类型重构变换方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202952A (zh) * 2016-07-19 2016-12-07 南京邮电大学 一种基于机器学习的帕金森疾病诊断方法
CN107025911A (zh) * 2016-01-29 2017-08-08 重庆工商职业学院 基于粒子群优化的基音频率检测方法
CN107609588A (zh) * 2017-09-12 2018-01-19 大连大学 一种基于语音信号的帕金森患者updrs得分预测方法
CN107808663A (zh) * 2017-10-25 2018-03-16 重庆大学 基于dbn和rf算法的帕金森病语音数据分类系统
CN108399434A (zh) * 2018-03-20 2018-08-14 东北大学 基于特征提取的高维时间序列数据的分析预测方法
CA3078119A1 (en) * 2017-10-05 2018-10-04 The Climate Corporation Disease recognition from images having a large field of view
CN108734208A (zh) * 2018-05-15 2018-11-02 重庆大学 基于多模态深度迁移学习机制的多源异构数据融合系统
CN109599129A (zh) * 2018-11-13 2019-04-09 杭州电子科技大学 基于注意力机制和卷积神经网络的语音抑郁症识别方法
CN110070888A (zh) * 2019-05-07 2019-07-30 颐保医疗科技(上海)有限公司 一种基于卷积神经网络的帕金森语音识别方法
CN110245252A (zh) * 2019-06-10 2019-09-17 中国矿业大学 基于遗传算法的机器学习模型自动生成方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150235143A1 (en) * 2003-12-30 2015-08-20 Kantrack Llc Transfer Learning For Predictive Model Development
US10475530B2 (en) * 2016-11-10 2019-11-12 Sonde Health, Inc. System and method for activation and deactivation of cued health assessment

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107025911A (zh) * 2016-01-29 2017-08-08 重庆工商职业学院 基于粒子群优化的基音频率检测方法
CN106202952A (zh) * 2016-07-19 2016-12-07 南京邮电大学 一种基于机器学习的帕金森疾病诊断方法
CN107609588A (zh) * 2017-09-12 2018-01-19 大连大学 一种基于语音信号的帕金森患者updrs得分预测方法
CA3078119A1 (en) * 2017-10-05 2018-10-04 The Climate Corporation Disease recognition from images having a large field of view
CN107808663A (zh) * 2017-10-25 2018-03-16 重庆大学 基于dbn和rf算法的帕金森病语音数据分类系统
CN108399434A (zh) * 2018-03-20 2018-08-14 东北大学 基于特征提取的高维时间序列数据的分析预测方法
CN108734208A (zh) * 2018-05-15 2018-11-02 重庆大学 基于多模态深度迁移学习机制的多源异构数据融合系统
CN109599129A (zh) * 2018-11-13 2019-04-09 杭州电子科技大学 基于注意力机制和卷积神经网络的语音抑郁症识别方法
CN110070888A (zh) * 2019-05-07 2019-07-30 颐保医疗科技(上海)有限公司 一种基于卷积神经网络的帕金森语音识别方法
CN110245252A (zh) * 2019-06-10 2019-09-17 中国矿业大学 基于遗传算法的机器学习模型自动生成方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A Spectrogram-Based Deep Feature Assisted Computer-Aided Diagnostic System for Parkinson’s Disease;Laiba Zahid et al.;《IEEE Access》;IEEE;20200214;第8卷;全文 *
Multimodal Feature Level Fusion based on Particle Swarm Optimization with Deep Transfer Learning;Pedro H.Silva,et al.;《 2018 IEEE Congress on Evolutionary Computation》;IEEE;20181004;全文 *
基于稀疏特征迁移的语音情感识别;宋鹏等;《数据采集与处理》;中国知网;20160315;第31卷(第2期);全文 *
基于语音卷积稀疏迁移学习和并行优选的帕金森病分类算法研究;张小恒等;《电子与信息学报》;中国知网;20190319;第41卷(第7期);全文 *

Also Published As

Publication number Publication date
CN111354338A (zh) 2020-06-30

Similar Documents

Publication Publication Date Title
CN111354338B (zh) 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统
Yu et al. Mixed pooling for convolutional neural networks
CN111000553B (zh) 一种基于投票集成学习的心电数据智能分类方法
CN113693563B (zh) 一种基于超图注意力网络的脑功能网络分类方法
CN108764280B (zh) 一种基于症状向量的医学数据处理方法和系统
CN112329721B (zh) 一种模型轻量化设计的遥感小目标检测方法
CN116226629B (zh) 一种基于特征贡献的多模型特征选择方法及系统
CN111292851A (zh) 数据分类方法、装置、计算机设备和存储介质
CN114708903A (zh) 一种基于自注意力机制的蛋白质残基间距离预测方法
CN116842460A (zh) 基于注意力机制与残差神经网络的咳嗽关联疾病识别方法和系统
CN112836772A (zh) 基于LightGBM集成多个BERT模型的随机对照试验识别方法
CN112885378B (zh) 一种语音情感识别方法、装置及存储介质
CN117456283A (zh) 一种基于深度学习的指甲病图像智能诊断方法
CN116843970A (zh) 基于任务特定通道重构网络的细粒度小样本分类方法
CN116091446A (zh) 食管内窥镜图像的异常检测方法、系统、介质及设备
CN114398932A (zh) 一种基于注意力机制和集成学习的睡眠分期方法
Kumar et al. Detection of Parkinson’s disease using LightGBM Classifier
CN114238558A (zh) 一种电子病历的质检方法、装置、存储介质及设备
CN114822734A (zh) 基于循环卷积神经网络的中医病案分析方法
Girdher et al. Detecting and estimating severity of leaf spot disease in golden pothos using hybrid deep learning approach
CN104778479A (zh) 一种基于稀疏编码提取子的图像分类方法及系统
Ani et al. Automated classification of phonetic segments in child speech using raw ultrasound imaging
CN118098289B (zh) 一种结合精准模型与轻量级模型的抑郁症识别方法及系统
CN117037895B (zh) 模型训练方法、装置、电子设备及存储介质
CN118098288B (zh) 一种基于自学习标签校正的弱监督语音抑郁症检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant