CN111354338A - 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统 - Google Patents

基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统 Download PDF

Info

Publication number
CN111354338A
CN111354338A CN202010119313.4A CN202010119313A CN111354338A CN 111354338 A CN111354338 A CN 111354338A CN 202010119313 A CN202010119313 A CN 202010119313A CN 111354338 A CN111354338 A CN 111354338A
Authority
CN
China
Prior art keywords
convolution kernel
convolution
optimal
particle
pso
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010119313.4A
Other languages
English (en)
Other versions
CN111354338B (zh
Inventor
李勇明
张小恒
王品
李新科
贾云健
颜芳
黄智勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN202010119313.4A priority Critical patent/CN111354338B/zh
Publication of CN111354338A publication Critical patent/CN111354338A/zh
Application granted granted Critical
Publication of CN111354338B publication Critical patent/CN111354338B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/086Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Physiology (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,包括:数据采集模块、公共数据库、目标数据库和分类识别器;系统将公共语音数据集的语音特征进行卷积稀疏学习,得到相应的卷积核;然后利用目标数据库中的一部分目标数据集进行卷积稀疏编码及样本和特征并行优选;通过PSO算法得到最优卷积核;然后基于最优卷积核,利用目标数据库中的另一部分目标数据集进行卷积稀疏编码及样本和特征并行优选;从而得到系统最优卷积核及最佳样本和特征;最后数据采集模块采集待测对象的语音数据基于最优卷积核进行卷积稀疏编码,提取编码后的最佳样本和特征,由分类识别器得出测试结果。本系统分类准确率高,样本需求量少,实施方便。

Description

基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统
技术领域
本发明涉及智慧医疗技术,具体地说,是一种基于PSO(粒子群 优化算法)卷积核优化稀疏迁移学习的帕金森语音识别系统。
背景技术
帕金森病(PD)是一种多发于中老年的渐进性中枢神经系统变 性疾病,在帕金森病患者中,有50%~80%的病例起病隐袭,早期难 以察觉而常被忽视,检测语言障碍将有助于实现高准确性的帕金森病 早期诊断,目前,PD语音特征参数提取的主要类型有基音周期,振 幅微扰,基频微扰、谐波信噪比及基频标准差等多种类型。特征选择 变换的方法有PCA,LDA,串行搜索法、基于进化计算法等。分类 器的方法主要有支持向量机、K最近邻网络、随机森林和决策树等, 深度学习方法包括DBN,DNN,自动编码器等等,还有模糊理论也作为一种辅助方法。
上述研究均基于当前语音数据采用机器学习算法实现PD分类, 取得了较大进展。但是,这些方法大都直接基于当前语音数据集本身 进行。目前这些PD语音公共数据集规模较小,难以采用深度学习方 法进行处理,样本和特征的同时优选将有利于在小样本量情况下获得 高质量的样本和特征,提高分类准确性。
发明内容
针对现有技术的不足,本发明的目的是提供一种基于PSO卷积 核优化稀疏迁移学习的帕金森语音识别系统,能够快速准确的实现帕 金森语音识别。
为达到上述目的,本发明所采用的具体技术方案如下:
一种基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统, 其关键在于包括:数据采集模块、公共数据库、目标数据库和分类识 别器;
所述公共数据库用于存储公共语音数据集;
所述目标数据库用于存储代表帕金森语音数据的目标数据集;
所述分类识别器采用人工智能模型;
所述数据采集模块采集待测对象的语音数据,对该语音数据提取 语音特征并基于最优卷积核进行卷积稀疏编码,然后选择编码后的最 佳样本和特征输入所述分类识别器得出测试结果;
所述最优卷积核以及最佳样本和特征由以下步骤确定:
S1:初始化PSO算法相关参数并随机初始化卷积核粒子群;
S2:将每一代卷积核粒子群中各个粒子作为原始卷积核对所述公 共数据库中的公共语音数据集的语音特征进行卷积稀疏学习,得到各 自对应的卷积核终值;
S3:基于各个卷积核终值,利用所述目标数据库中的一部分目标 数据集作为训练集进行卷积稀疏编码及并行样本和特征优选;得出分 类准确率高的样本和特征并确定其对应的各个粒子的适应度函数值;
S4:基于各个粒子的适应度函数值更新卷积核粒子群,循环执行 步骤S2和步骤S3直至得到所述最优卷积核;
S5:基于所述最优卷积核,利用所述目标数据库中的另一部分目 标数据集作为验证集和测试集进行卷积稀疏编码及并行样本和特征 优选;得到所述最优卷积核对应的最佳样本和特征。
可选地,所述公共数据库中的公共语音数据集通过加载不同类型 不同信噪比的噪声来扩展数据样本。
可选地,所述目标数据库中每个测试对象的语音样本包括26个, 具体为下表所示:
样本序列 样本描述
第1个 持续元音aaa
第2个 持续元音ooo
第3个 持续元音uuu
第4个~第13个 数字1~10
第14个~第17个 预设的短句
第18个~第26个 预设的单词
且所述数据采集模块也按照上述样本形式采集待测对象的语音 数据。
可选地,步骤S1随机初始化卷积核粒子群时,设定卷积核尺度 为8*8,并视为1*64维向量,每一维的取值范围为[-1,+1],种群大小 为20,粒子初始速度为0.01,最大速度为1,最大迭代次数为60。
可选地,步骤S2中,所述公共数据库中的公共语音数据集的语 音特征进行卷积稀疏学习时,主循环次数,特征图循环次数及卷积核 训练次数分别为100,10和10。
可选地,将步骤S3中训练集的测试准确率作为各个粒子的适应 度函数值,并按照下式更新粒子的移动速度和位置:
Figure BDA0002392474110000031
Figure BDA0002392474110000041
其中:
Figure BDA0002392474110000042
是粒子i在第k次迭代中第d维的速度;
Figure BDA0002392474110000043
是粒子i在第k次 迭代中第d维的位置;winertia是惯性权重,且c1和c2是学习因子,Chi 为退化因子;
Figure BDA0002392474110000044
Figure BDA0002392474110000045
是介于0~1之间的随机数;
Figure BDA0002392474110000046
是粒子 i在第d维的个体极值点的位置;
Figure BDA0002392474110000047
是整个种群在第d维的全局 极值点的位置。
可选地,所述分类识别器采用SVM模型。
本发明的显著效果是:
本发明提出了一种基于PSO卷积核优化稀疏迁移学习的帕金森 语音识别系统,结合了卷积稀疏迁移学习和样本特征并行优选,在稀 疏卷积学习方面,该方法更有利于表达PD语音特征的有效结构信息; 在并行优选方面,样本与特征的关联性同时被考虑。样本特征并行优 选考虑到了样本和语音特征间的关系,从而有助于获取高质量的特征。
附图说明
图1是本发明的系统架构图;
图2是本发明的系统流程图。
具体实施方式
下面结合附图对本发明的具体实施方式以及工作原理作进一步 详细说明。
本实施例提供一种基于PSO卷积核优化稀疏迁移学习的帕金森 语音识别系统,数据采集模块、公共数据库、目标数据库和分类识别 器;
所述公共数据库用于存储公共语音数据集;本实施例中采用 TIMIT公共数据集,并将其作为源数据集,通过加载不同类型不同信 噪比的噪声来扩展数据样本。
具体地,设扩展后数据集
Figure BDA0002392474110000051
其中
Figure BDA0002392474110000052
是公共数 据集中的原始语音信号,
Figure BDA0002392474110000053
为不同类型噪声信号,SNRj表示不同的信 噪比,φ(·)为加噪及信噪比调节函数。
所述目标数据库用于存储表达帕金森语音数据的目标数据集;
本实施例将Sakar数据集,MaxLittle数据集和西南医院自建的数 据集共同作为目标数据集,并分为PartA和PartB两部分,Sakar数据 集由Sakar等人建立并从加州大学欧文分校(UCI)机器学习数据库 网站获取。主要选取名为“Trainning_Data”的数据集,其中包含M=40 名受试者,M1=20名健康受试者,M2=20患者受试者,每一个测试对 象包含了H0=26个语音样本,具体样本参考表1,每一个语音样本设 置N=26个特征,具体为下表所示:
样本序列 样本描述
第1个 持续元音aaa
第2个 持续元音ooo
第3个 持续元音uuu
第4个~第13个 数字1~10
第14个~第17个 预设的短句
第18个~第26个 预设的单词
MaxLittle集是由MaxLittle等人在2008年创建的。
所述分类识别器采用人工智能模型,本实施例选择SVM模型;
所述数据采集模块采集待测对象的语音数据,对该语音数据提取 语音特征并基于最优卷积核进行卷积稀疏编码,然后选择编码后的最 佳样本和特征输入所述分类识别器得出测试结果;
具体实施时,每一次测试对象的测试数据还可以保存至所述目标 数据库中从而扩大目标数据集的样本数量,系统还可以定期或不定期 的利用所述公共数据库和最新的目标数据库来重新进行训练,得到当 前状态下系统的最佳样本和特征以及最优卷积核。
如图1和图2所示,具体实施时,所述最优卷积核以及最佳样本 和特征由以下步骤确定:
S1:初始化PSO算法相关参数并随机初始化卷积核粒子群;设 定卷积核尺度为8*8,并视为1*64维向量,每一维的取值范围为 [-1,+1],种群大小为20,粒子初始速度为0.01,最大速度为1,最大 迭代次数为60;
S2:将每一代卷积核粒子群中各个粒子作为原始卷积核对所述公 共数据库中的公共语音数据集的语音特征进行卷积稀疏学习,得到各 自对应的卷积核终值;
本实施例通过对扩展后数据集进行特征提取将形成特征库:
Figure BDA0002392474110000061
作为源领域数据集,其中
Figure BDA0002392474110000062
采用现有 的特征提取方法可以提取语音信号N个不同特征,特征样本总数为L,
Figure BDA0002392474110000063
为二维H0×N块矩阵,且
Figure BDA0002392474110000064
为稀疏字典学习训练样本,
Figure BDA0002392474110000065
为卷积核稀 疏学习训练样本。
在卷积稀疏编码(CSC)中,给定M个训练样本
Figure BDA0002392474110000071
通过以 下最小化目标函数学习卷积核组
Figure BDA0002392474110000072
Figure BDA0002392474110000073
其中
Figure BDA0002392474110000074
为H0×N块矩阵,em,k为H0×N特征图矩阵,通过与相 对应的卷积核dk卷积逼近xm,符号*表示二维卷积符号且η是大于零的 正则化因子,解决以上优化问题的方法都是基本经典框架交替方向乘 子法(ADMM)。
上式可重新表达为:
Figure BDA0002392474110000075
其中,
Figure BDA0002392474110000076
D=[D1 D2 … DK]为[d1 d2 … dK]所对应的向量化卷 积运算符,
Figure BDA0002392474110000077
为向量化特征图。
基于上述表达时,通过固定卷积核可以学习特征图,通过固定特 征图可以学习卷积核,本例中设置主循环次数,特征图循环次数及卷 积核训练次数分别为100,10和10。
S3:基于各个卷积核终值,利用PartA中的目标数据集作为训练 集进行卷积稀疏编码及并行样本和特征优选;得出分类准确率高的样 本和特征并确定其对应的各个粒子的适应度函数值;
S4:基于各个粒子的适应度函数值更新卷积核粒子群,循环执行 步骤S2和步骤S3直至得到所述最优卷积核;
S5:基于所述最优卷积核,利用PartB中的目标数据集作为验证 集和测试集进行卷积稀疏编码及并行样本和特征优选;得到所述最优 卷积核对应的最佳样本和特征。
针对目标数据集而言,在进行样本和特征优选时,定义目标数据 集:
Figure BDA0002392474110000081
其中向量
Figure BDA0002392474110000082
标签向量
Figure BDA0002392474110000083
分块矩阵
Figure BDA0002392474110000084
样本总 数为H,每个样本的特征数(向量分量数)为N,全体样本划分为M 个受试者(subject),即每个受试者包含的样本数为:H0=H/M;
特征扩展,并构造:
Figure BDA0002392474110000085
其中传统 稀疏卷积稀疏编码的特征扩展是将特征矩阵
Figure BDA0002392474110000086
重整为行向量,归一化 G得G′,并分割
Figure BDA0002392474110000087
为训练集
Figure BDA0002392474110000088
与测试集Tm
基于Relief算法,计算归一化向量
Figure BDA0002392474110000089
的权重
Figure BDA00023924741100000810
特征
Figure BDA00023924741100000811
的权重表达如下.
Figure BDA00023924741100000812
M(γij)是γij的邻居集合,集合包含R个样本,H(γij)是γij的邻居集 合,也包含R个样本,Mrij)∈M(γij),Hrij)∈H(γij),通过重排
Figure BDA00023924741100000813
w1≥w2≥…≥wQ,特征集
Figure BDA00023924741100000814
通过权重重构如下:
Figure BDA0002392474110000091
其中Q维向量
Figure BDA0002392474110000092
Figure BDA0002392474110000093
通过
Figure BDA0002392474110000094
的 Q个最大的权重来选择,
Figure BDA0002392474110000095
index是权重wi对应的特征列 向量的列下标。
在进行PSO卷积核优化时,将步骤S3中训练集的测试准确率作 为各个粒子的适应度函数值,并按照下式更新粒子的移动速度和位置:
Figure BDA0002392474110000096
Figure BDA0002392474110000097
其中:
Figure BDA0002392474110000098
是粒子i在第k次迭代中第d维的速度;
Figure BDA0002392474110000099
是粒子i在第k次 迭代中第d维的位置;winertia是惯性权重,且c1和c2是学习因子,Chi 为退化因子;
Figure BDA00023924741100000910
Figure BDA00023924741100000911
是介于0~1之间的随机数;
Figure BDA00023924741100000912
是粒子 i在第d维的个体极值点的位置;
Figure BDA00023924741100000913
是整个种群在第d维的全局 极值点的位置。
本系统将目标集分成两部分PartA和PartB,基于不同的卷积核 对PartA实施卷积稀疏迁移学习及样本和特征的并行优选会得到不同 的准确率,选取准确率高的卷积核然后再基于优选后的核对PartB实 施卷积稀疏迁移学习及样本和特征并行优选,最终得出最优卷积核及 对应的最佳样本和特征,从而提高系统分类准确率。
通过上述过程将系统的分类准确率提升后,可以直接将其用于对 待测患者进行帕金森语音识别,通过所述数据采集模块按照上述样本 的形式采集待测对象的语音数据,提取相关的语音特征后,通过最佳 的卷积核进行卷积稀疏编码,然后选择编码后的最佳样本和特征,送 入所述分类识别器中,根据分类识别器的输出结果确定待测对象是否 属于帕金森病患者。与现有技术相比,本系统的分类准确率更高,而 且实施起来工程复杂度不高,可有效减少对训练样本的需求。
最后需要说明的是,上面结合附图对本发明的实施例进行了描述, 但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅 仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的 启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可 做出很多形式,这些均属于本发明的保护之内。

Claims (7)

1.一种基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,其特征在于包括:数据采集模块、公共数据库、目标数据库和分类识别器;
所述公共数据库用于存储公共语音数据集;
所述目标数据库用于存储代表帕金森语音数据的目标数据集;
所述分类识别器采用人工智能模型;
所述数据采集模块采集待测对象的语音数据,对该语音数据提取语音特征并基于最优卷积核进行卷积稀疏编码,然后选择编码后的最佳样本和特征输入所述分类识别器得出测试结果;
所述最优卷积核以及最佳样本和特征由以下步骤确定:
S1:初始化PSO算法相关参数并随机初始化卷积核粒子群;
S2:将每一代卷积核粒子群中各个粒子作为原始卷积核对所述公共数据库中的公共语音数据集的语音特征进行卷积稀疏学习,得到各自对应的卷积核终值;
S3:基于各个卷积核终值,利用所述目标数据库中的一部分目标数据集作为训练集进行卷积稀疏编码及并行样本和特征优选;得出分类准确率高的样本和特征并确定其对应的各个粒子的适应度函数值;
S4:基于各个粒子的适应度函数值更新卷积核粒子群,循环执行步骤S2和步骤S3直至得到所述最优卷积核;
S5:基于所述最优卷积核,利用所述目标数据库中的另一部分目标数据集作为验证集和测试集进行卷积稀疏编码及并行样本和特征优选;得到所述最优卷积核对应的最佳样本和特征。
2.根据权利要求1所述的基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,其特征在于:所述公共数据库中的公共语音数据集通过加载不同类型不同信噪比的噪声来扩展数据样本。
3.根据权利要求1所述的基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,其特征在于:所述目标数据库中每个测试对象的语音样本包括26个,具体为下表所示:
样本序列 样本描述 第1个 持续元音aaa 第2个 持续元音ooo 第3个 持续元音uuu 第4个~第13个 数字1~10 第14个~第17个 预设的短句 第18个~第26个 预设的单词
且所述数据采集模块也按照上述样本形式采集待测对象的语音数据。
4.根据权利要求1-3任一所述的基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,其特征在于:步骤S1随机初始化卷积核粒子群时,设定卷积核尺度为8*8,并视为1*64维向量,每一维的取值范围为[-1,+1],种群大小为20,粒子初始速度为0.01,最大速度为1,最大迭代次数为60。
5.根据权利要求4所述的基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,其特征在于:步骤S2中,所述公共数据库中的公共语音数据集的语音特征进行卷积稀疏学习时,主循环次数,特征图循环次数及卷积核训练次数分别为100,10和10。
6.根据权利要求4所述的基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,其特征在于:将步骤S3中训练集的测试准确率作为各个粒子的适应度函数值,并按照下式更新粒子的移动速度和位置:
Figure FDA0002392474100000031
Figure FDA0002392474100000032
i=1,2,3…,M;其中:
Figure FDA0002392474100000033
是粒子i在第k次迭代中第d维的速度;
Figure FDA0002392474100000034
是粒子i在第k次迭代中第d维的位置;winertia是惯性权重,且c1和c2是学习因子,Chi为退化因子;
Figure FDA0002392474100000035
Figure FDA0002392474100000036
是介于0~1之间的随机数;
Figure FDA0002392474100000037
是粒子i在第d维的个体极值点的位置;
Figure FDA0002392474100000038
是整个种群在第d维的全局极值点的位置。
7.根据权利要求1所述的基于PSO卷积核优化稀疏迁移学习的帕金森语音识别系统,其特征在于:所述分类识别器采用SVM模型。
CN202010119313.4A 2020-02-26 2020-02-26 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统 Active CN111354338B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010119313.4A CN111354338B (zh) 2020-02-26 2020-02-26 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010119313.4A CN111354338B (zh) 2020-02-26 2020-02-26 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统

Publications (2)

Publication Number Publication Date
CN111354338A true CN111354338A (zh) 2020-06-30
CN111354338B CN111354338B (zh) 2022-03-15

Family

ID=71197231

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010119313.4A Active CN111354338B (zh) 2020-02-26 2020-02-26 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统

Country Status (1)

Country Link
CN (1) CN111354338B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111899757A (zh) * 2020-09-29 2020-11-06 南京蕴智科技有限公司 针对目标说话人提取的单通道语音分离方法及系统
CN112233785A (zh) * 2020-07-08 2021-01-15 华南理工大学 一种帕金森症的智能识别方法
CN112489761A (zh) * 2020-11-19 2021-03-12 华中科技大学同济医学院附属协和医院 一种液体及能量管理系统
CN113284512A (zh) * 2021-05-25 2021-08-20 重庆大学 一种基于深度稀疏迁移学习的帕金森语音分类方法
CN113393932A (zh) * 2021-07-06 2021-09-14 重庆大学 一种帕金森病语音样本段多类型重构变换方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150235143A1 (en) * 2003-12-30 2015-08-20 Kantrack Llc Transfer Learning For Predictive Model Development
CN106202952A (zh) * 2016-07-19 2016-12-07 南京邮电大学 一种基于机器学习的帕金森疾病诊断方法
CN107025911A (zh) * 2016-01-29 2017-08-08 重庆工商职业学院 基于粒子群优化的基音频率检测方法
CN107609588A (zh) * 2017-09-12 2018-01-19 大连大学 一种基于语音信号的帕金森患者updrs得分预测方法
CN107808663A (zh) * 2017-10-25 2018-03-16 重庆大学 基于dbn和rf算法的帕金森病语音数据分类系统
CN108399434A (zh) * 2018-03-20 2018-08-14 东北大学 基于特征提取的高维时间序列数据的分析预测方法
US20180240535A1 (en) * 2016-11-10 2018-08-23 Sonde Health, Inc. System and method for activation and deactivation of cued health assessment
CA3078119A1 (en) * 2017-10-05 2018-10-04 The Climate Corporation Disease recognition from images having a large field of view
CN108734208A (zh) * 2018-05-15 2018-11-02 重庆大学 基于多模态深度迁移学习机制的多源异构数据融合系统
CN109599129A (zh) * 2018-11-13 2019-04-09 杭州电子科技大学 基于注意力机制和卷积神经网络的语音抑郁症识别方法
CN110070888A (zh) * 2019-05-07 2019-07-30 颐保医疗科技(上海)有限公司 一种基于卷积神经网络的帕金森语音识别方法
CN110245252A (zh) * 2019-06-10 2019-09-17 中国矿业大学 基于遗传算法的机器学习模型自动生成方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150235143A1 (en) * 2003-12-30 2015-08-20 Kantrack Llc Transfer Learning For Predictive Model Development
CN107025911A (zh) * 2016-01-29 2017-08-08 重庆工商职业学院 基于粒子群优化的基音频率检测方法
CN106202952A (zh) * 2016-07-19 2016-12-07 南京邮电大学 一种基于机器学习的帕金森疾病诊断方法
US20180240535A1 (en) * 2016-11-10 2018-08-23 Sonde Health, Inc. System and method for activation and deactivation of cued health assessment
CN107609588A (zh) * 2017-09-12 2018-01-19 大连大学 一种基于语音信号的帕金森患者updrs得分预测方法
CA3078119A1 (en) * 2017-10-05 2018-10-04 The Climate Corporation Disease recognition from images having a large field of view
CN107808663A (zh) * 2017-10-25 2018-03-16 重庆大学 基于dbn和rf算法的帕金森病语音数据分类系统
CN108399434A (zh) * 2018-03-20 2018-08-14 东北大学 基于特征提取的高维时间序列数据的分析预测方法
CN108734208A (zh) * 2018-05-15 2018-11-02 重庆大学 基于多模态深度迁移学习机制的多源异构数据融合系统
CN109599129A (zh) * 2018-11-13 2019-04-09 杭州电子科技大学 基于注意力机制和卷积神经网络的语音抑郁症识别方法
CN110070888A (zh) * 2019-05-07 2019-07-30 颐保医疗科技(上海)有限公司 一种基于卷积神经网络的帕金森语音识别方法
CN110245252A (zh) * 2019-06-10 2019-09-17 中国矿业大学 基于遗传算法的机器学习模型自动生成方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LAIBA ZAHID ET AL.: "A Spectrogram-Based Deep Feature Assisted Computer-Aided Diagnostic System for Parkinson’s Disease", 《IEEE ACCESS》 *
PEDRO H.SILVA,ET AL.: "Multimodal Feature Level Fusion based on Particle Swarm Optimization with Deep Transfer Learning", 《 2018 IEEE CONGRESS ON EVOLUTIONARY COMPUTATION》 *
宋鹏等: "基于稀疏特征迁移的语音情感识别", 《数据采集与处理》 *
张小恒等: "基于语音卷积稀疏迁移学习和并行优选的帕金森病分类算法研究", 《电子与信息学报》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112233785A (zh) * 2020-07-08 2021-01-15 华南理工大学 一种帕金森症的智能识别方法
CN112233785B (zh) * 2020-07-08 2022-04-22 华南理工大学 一种帕金森症的智能识别方法
CN111899757A (zh) * 2020-09-29 2020-11-06 南京蕴智科技有限公司 针对目标说话人提取的单通道语音分离方法及系统
CN111899757B (zh) * 2020-09-29 2021-01-12 南京蕴智科技有限公司 针对目标说话人提取的单通道语音分离方法及系统
CN112489761A (zh) * 2020-11-19 2021-03-12 华中科技大学同济医学院附属协和医院 一种液体及能量管理系统
CN113284512A (zh) * 2021-05-25 2021-08-20 重庆大学 一种基于深度稀疏迁移学习的帕金森语音分类方法
CN113284512B (zh) * 2021-05-25 2022-05-27 重庆大学 一种基于深度稀疏迁移学习的帕金森语音分类方法
CN113393932A (zh) * 2021-07-06 2021-09-14 重庆大学 一种帕金森病语音样本段多类型重构变换方法
CN113393932B (zh) * 2021-07-06 2022-11-25 重庆大学 一种帕金森病语音样本段多类型重构变换方法

Also Published As

Publication number Publication date
CN111354338B (zh) 2022-03-15

Similar Documents

Publication Publication Date Title
CN111354338B (zh) 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统
Yu et al. Mixed pooling for convolutional neural networks
Colonna et al. Automatic classification of anuran sounds using convolutional neural networks
CN112329721B (zh) 一种模型轻量化设计的遥感小目标检测方法
CN108764280B (zh) 一种基于症状向量的医学数据处理方法和系统
CN110992988B (zh) 一种基于领域对抗的语音情感识别方法及装置
CN111400540B (zh) 一种基于挤压和激励残差网络的歌声检测方法
CN116226629B (zh) 一种基于特征贡献的多模型特征选择方法及系统
CN111292851A (zh) 数据分类方法、装置、计算机设备和存储介质
Chattopadhyay et al. A feature selection model for speech emotion recognition using clustering-based population generation with hybrid of equilibrium optimizer and atom search optimization algorithm
CN116842460A (zh) 基于注意力机制与残差神经网络的咳嗽关联疾病识别方法和系统
CN114022687B (zh) 一种基于增强学习的图像描述对抗生成方法
CN114398932A (zh) 一种基于注意力机制和集成学习的睡眠分期方法
CN115206437A (zh) 一种线粒体效应分子的智能筛选体系及其构建方法和应用
CN112885378B (zh) 一种语音情感识别方法、装置及存储介质
CN112489689B (zh) 基于多尺度差异对抗的跨数据库语音情感识别方法及装置
CN113779295A (zh) 一种异常细胞图像特征的检索方法、装置、设备和介质
Flower et al. A novel concatenated 1D-CNN model for speech emotion recognition
Girdher et al. Detecting and estimating severity of leaf spot disease in golden pothos using hybrid deep learning approach
Widneh et al. Medicinal plant parts identification and classification using deep learning based on multi label categories
CN114822734A (zh) 基于循环卷积神经网络的中医病案分析方法
CN114238558A (zh) 一种电子病历的质检方法、装置、存储介质及设备
CN104778479A (zh) 一种基于稀疏编码提取子的图像分类方法及系统
CN116503674B (zh) 一种基于语义指导的小样本图像分类方法、装置及介质
CN118098289B (zh) 一种结合精准模型与轻量级模型的抑郁症识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant