CN112687290A - 一种经过压缩的咳嗽自动检测方法及嵌入式设备 - Google Patents

一种经过压缩的咳嗽自动检测方法及嵌入式设备 Download PDF

Info

Publication number
CN112687290A
CN112687290A CN202011617737.XA CN202011617737A CN112687290A CN 112687290 A CN112687290 A CN 112687290A CN 202011617737 A CN202011617737 A CN 202011617737A CN 112687290 A CN112687290 A CN 112687290A
Authority
CN
China
Prior art keywords
cough
model
audio
detection
rank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011617737.XA
Other languages
English (en)
Other versions
CN112687290B (zh
Inventor
李由
尤鸣宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN202011617737.XA priority Critical patent/CN112687290B/zh
Publication of CN112687290A publication Critical patent/CN112687290A/zh
Application granted granted Critical
Publication of CN112687290B publication Critical patent/CN112687290B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明涉及一种经过压缩的咳嗽自动检测方法及嵌入式设备,咳嗽自动检测方法包括:获取待检测音频;提取待检测音频的音频帧级特征;根据提取的音频特征搭建同构咳嗽检测子模型;对同构咳嗽检测子模型进行压缩并集成后蒸馏为精炼模型;使用咳嗽检测精炼模型在嵌入式设备上实时进行咳嗽自动检测。嵌入式设备包括至少一个处理器以及至少一个与处理器进行通信连接的存储器,存储器存储有可被处理器执行的指令,指令可被至少一个处理器执行,可被执行的指令包括上述咳嗽自动检测方法。与现有技术相比,本发明具有能够被部署到嵌入式设备、准确性高等优点。

Description

一种经过压缩的咳嗽自动检测方法及嵌入式设备
技术领域
本发明涉及咳嗽自动检测技术领域,尤其是涉及一种经过压缩的咳嗽自动检测方法及嵌入式设备。
背景技术
咳嗽是人体的重要保护机制,也是多种呼吸系统疾病的常见主诉症状之一,咳嗽的严重程度可以做为显示病人病情的指标,有助于指导医生对病人病因与病程的判断。目前主流的咳嗽检测办法是基于由医学研究者以及护理学学者提出的自我管理计划的医患联动监测控制病情的诊治方法,该方法因受患者的主观意识影响极大,为诊断过程造成了极大的困难。
基于上述问题,咳嗽声的监测和正确记录对咳嗽病症的诊治是至关重要的。为了正确、有效地记录可能发生的咳嗽声、且尽量不给受测者的生活活动造成干扰,利用便携式设备进行咳嗽检测无疑是最具可行性的方案。
目前,针对咳嗽检测方法的研究不断进行,如中国专利CN109431507A中公开了一种基于深度学习的咳嗽疾病识别方法,包括:对咳嗽音频进行预处理得到若干咳嗽音频帧序列;从若干咳嗽音频帧序列中提取得到所述咳嗽音频的声音特征;通过咳嗽疾病识别模型对所述咳嗽音频的声音特征进行分类预测,得到所述咳嗽音频对应的咳嗽疾病标签;根据所述咳嗽疾病标签输出所述咳嗽音频对应的咳嗽疾病识别结果。该专利虽然实现了对咳嗽的识别,但是并未考虑到上述算在运行在嵌入式设备上时的难易程度。若想要在嵌入式设备中实现较为精准、具有实际应用价值的咳嗽声检测与识别功能,需要以相对复杂的算法和深度神经网络模型作为支撑,受到伦理隐私的限制,咳嗽检测器大多数情况下只能运行在离线模式而不能依靠于大型的云端服务器,这无疑提高了对硬件计算能力的要求,从而相应地增加了开发成本。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种实现在可控成本的嵌入式设备中使用深度模型进行精确的咳嗽声检测的经过压缩的咳嗽自动检测方法及嵌入式设备。
本发明的目的可以通过以下技术方案来实现:
一种经过压缩的咳嗽自动检测方法,所述的咳嗽自动检测方法包括:
步骤1:获取待检测音频;
步骤2:提取待检测音频的音频帧级特征;
步骤3:根据步骤2提取的音频特征搭建同构咳嗽检测子模型;
步骤4:对同构咳嗽检测子模型进行压缩并集成后蒸馏为精炼模型;
步骤5:使用咳嗽检测精炼模型在嵌入式设备上实时进行咳嗽自动检测。
优选地,所述的音频帧级特征包括MFCC音频特征、PLP音频特征和Mel bank音频特征。
更加优选地,所述的音频帧级特征的提取方法为:
统一音频采样率后分别提取三中音频帧级特征,分别为:
MFCC音频特征的提取方法:首先对声音信号预加重、分帧和加汉明窗处理;对每一帧进行512个点的快速傅里叶变换,得到能量谱;将能量谱通过一组Mel尺度的三角形滤波器组,得到每个滤波器组的对数能量输出;将对数能量进行离散余弦变换,求得13阶的MFCC;在MFCC基础上加入一阶差分系数和二阶差分系数组合为组合特征,并将其确定为最终的MFCC音频特征;
PLP音频特征的提取方法:首先对声音信号加窗和快速傅里叶变换,得到短时功率谱;然后将功率谱映射到Bark尺度,获得PLP音频特征;
Mel bank音频特征的提取方法:首先对声音信号预加重、分帧和加汉明窗处理;对每一帧进行512个点的快速傅里叶变换,得到能量谱;将能量谱通过一组Mel尺度的三角形滤波器组,得到每个滤波器组的输出。
更加优选地,所述的步骤3具体为:
将三种音频帧级特征分别作为三个子网络模型的输入;每个子网络模型均采用5层BLSTM双向长短时记忆网络结构,每层设置隐节点数100个,最后通过全连接层获得(0,1)范围的咳嗽帧概率值。
更加优选地,所述的步骤4具体为:
步骤4-1:通过低秩分解的方法初步压缩三个子网络模型的参数;
步骤4-2:使用压缩前的模型训练集分别训练三个子网络模型;
步骤4-3:以三个子网络模型的预测结果平均值做为集成模型输出;
步骤4-4:对集成模型进行知识蒸馏,获得压缩后的精炼模型。
更加优选地,所述的步骤4-1具体为:
对于第l层网络的原始权重矩阵Wl,利用奇异值分解法寻找与其矩阵范数尽量相近的低秩矩阵
Figure BDA0002872967470000031
其中
Figure BDA0002872967470000032
Figure BDA0002872967470000033
可被表示为
Figure BDA0002872967470000034
其中,
Figure BDA0002872967470000035
Wl
Figure BDA0002872967470000036
应满足
Figure BDA0002872967470000037
对于BLSTM中的权重矩阵Wxc、Wxi、Wxf、Wxo,即记忆单元、输入门、遗忘门和输出门中的权重矩阵,同样可以利用低秩分解法进行分解[Wxc,Wxi,Wxf,Wxo]=USVT=[Uxc,Uxi,Uxf,Uxo]SVT
方法为向每个子网络模型中的LSTM相邻两层中添加线性无偏置的低秩降维层,低秩降维层的添加位置为上层BLSTM单元的输出之后,即下层BLSTM单元的输入之前;设M、N、R分别为上层输出结点数、下层输入结点数和低秩降维层的结点数,则分解前的模型参数为4M×N个,分解后的参数为4M×R+R×N=R×(4M+N)个;
低秩分解层秩,即节点数满足:
Figure BDA0002872967470000038
更加优选地,所述的步骤4-4具体为:
以训练好的三个子网络模型做为教师模型,设置一个两层低秩BLSTM网络做为学生模型,以MFCC音频特征做为学生模型的输入,通过知识蒸馏的方法,利用教师模型指导学生模型训练,使学生模型得到与教师模型性能相当的结果;
所述的教师模型指导学生模型训练的方法为:
通过集成模型计算每个输入样本的预测结果,即是否为咳嗽的概率做为软目标,与该样本的真实结果共同构成联合损失函数:
Figure BDA0002872967470000039
其中,ytrue为样本的真实标签,ps和pt分别为学生和教师模型的预测输出,T为温度变量,λ是常数。
优选地,所述的步骤5具体为:
步骤5-1:在嵌入式设备上加载精炼模型的参数;
步骤5-2:输入待检测音频,获得每一个分帧的预测结构;
步骤5-3:针对连续帧的检测结果,生成咳嗽检测事件。
更加优选地,所述的咳嗽检测事件的生成方法为:
筛选连续检测结果中与左右两帧分类结果均不同的孤立结果,将其结果反转;
将连续结果连接为以事件为单位的检测结果,记录其对应起始时间、终止时间。
一种嵌入式设备,包括至少一个处理器以及至少一个与处理器进行通信连接的存储器;
所述的存储器存储有可被处理器执行的指令;所述的指令可被至少一个处理器执行;所述的可被执行的指令包括上述咳嗽自动检测方法。
与现有技术相比,本发明具有以下有益效果:
一、能够被部署到嵌入式设备中:本发明中的咳嗽自动检测方法通过混合低秩分解与知识蒸馏的方法对集成深度网络模型实现压缩,在保证检测精度的前提下,使得高精度模型的体积大大减小,并能够被部署到嵌入式设备中,实现在可控成本的嵌入式设备中使用深度模型进行精确的咳嗽声检测。
二、准确性高:本发明中的咳嗽自动检测方法采用集成深度网络模型实现高精度的咳嗽检测,综合3种不同的声学特征,即MFCC、PLP和Mel bank三种特征,可实现优于基于单一特征模型的检测效果,保证了压缩后的精炼模型的检测准确性。
附图说明
图1为本发明中的咳嗽自动检测方法的流程示意图;
图2为本发明实施例中深度网络模型的结构示意图;
图3为本发明中通过低秩分解法进行模型压缩时的示意图;
图4为本发明中通过知识蒸馏法进行模型压缩时的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
针对现有技术中存在的问题,本发明中提出了一种用于嵌入式设备的咳嗽检测集成模型的压缩方法,通过这个方法,可以实现利用高精度的深度集成模型对声音信号中的咳嗽声进行预测定位,同时其经过压缩后的体积可以完美嵌入到便携式设备中。此方法通过开发出基于声音信号的集成高精度咳嗽检测算法深度模型,采用低秩分解和知识蒸馏的方法对深度模型进行压缩,实现了在低成本便携式设备中嵌入高精度咳嗽检测模型的方法,利用该设备完成端到端的自动咳嗽检测日志生成,从而降低了自动咳嗽检测设备的开发成本。
实施例1
本实施例中以树莓派3B+为例,该设备安装Ubuntu Mate 16.04系统的ARM版本,搭载1.4GHz 64位4核ARM Cortex-A53 CPU。
一种经过压缩的咳嗽自动检测方法,其流程如图1所示,包括:
步骤1:获取待检测音频,并对其进行预处理;
预处理咳嗽数据库中的音频数据;将音频序列切分为10s的长度,并划分为训练集和验证集;
步骤2:提取待检测音频的音频帧级特征;
音频帧级特征包括MFCC音频特征、PLP音频特征和Mel bank音频特征;
使用内置语音处理工具库Kaldi对保存的音频文件分为25ms的片段,且为了保证相邻两帧的连续性,每两帧时间设置了10ms的重叠部分,对于每一帧,分别提取MFCC特征、PLP特征、Mel bank特征,并进行保存;
音频帧级特征的提取方法为:
统一音频采样率后分别提取三中音频帧级特征,分别为:
MFCC音频特征的提取方法:首先对声音信号预加重、分帧和加汉明窗处理;对每一帧进行512个点的快速傅里叶变换,得到能量谱;将能量谱通过一组Mel尺度的三角形滤波器组,得到每个滤波器组的对数能量输出;将对数能量进行离散余弦变换,求得13阶的MFCC;在MFCC基础上加入一阶差分系数和二阶差分系数组合为组合特征,并将其确定为最终的MFCC音频特征;
PLP音频特征的提取方法:首先对声音信号加窗和快速傅里叶变换,得到短时功率谱;然后将功率谱映射到Bark尺度,获得PLP音频特征;
Mel bank音频特征的提取方法:首先对声音信号预加重、分帧和加汉明窗处理;对每一帧进行512个点的快速傅里叶变换,得到能量谱;将能量谱通过一组Mel尺度的三角形滤波器组,得到每个滤波器组的输出。
步骤3:根据步骤2提取的音频特征搭建同构咳嗽检测子模型,具体为:
将三种音频帧级特征分别作为三个子网络模型的输入;每个子网络模型均采用5层BLSTM双向长短时记忆网络结构,每层设置隐节点数100个,获得3个复杂检测模型,最后通过全连接层获得(0,1)范围的咳嗽帧概率值;
上述3个检测模型的结果通过平均可得集成检测模型;
步骤4:对同构咳嗽检测子模型进行压缩并集成后蒸馏为精炼模型;
步骤4-1:通过低秩分解的方法初步压缩三个子网络模型的参数;
对于第l层网络的原始权重矩阵Wl,利用奇异值分解法寻找与其矩阵范数尽量相近的低秩矩阵
Figure BDA0002872967470000061
其中
Figure BDA0002872967470000062
Figure BDA0002872967470000063
可被表示为
Figure BDA0002872967470000064
其中,
Figure BDA0002872967470000065
Wl
Figure BDA0002872967470000066
应满足
Figure BDA0002872967470000067
对于BLSTM中的权重矩阵Wxc、Wxi、Wxf、Wxo,即记忆单元、输入门、遗忘门和输出门中的权重矩阵,同样可以利用低秩分解法进行分解[Wxc,Wxi,Wxf,Wxo]=USVT=[Uxc,Uxi,Uxf,Uxo]SVT
方法为向每个子网络模型中的LSTM相邻两层中添加线性无偏置的低秩降维层,低秩降维层的添加位置为上层BLSTM单元的输出之后,即下层BLSTM单元的输入之前;设M、N、R分别为上层输出结点数、下层输入结点数和低秩降维层的结点数,则分解前的模型参数为4M×N个,分解后的参数为4M×R+R×N=R×(4M+N)个;
低秩分解层秩,即节点数满足:
Figure BDA0002872967470000068
设置R=10,在相邻BLSTM的两层之间设置好低秩降维层后,可以有效减少每个BLSTM单元中的4组共4*100*100个参数到4*100*10+10*100。
步骤4-2:使用压缩前的模型训练集分别训练三个子网络模型;
步骤4-3:以三个子网络模型的预测结果平均值做为集成模型输出;
步骤4-4:对集成模型进行知识蒸馏,获得压缩后的精炼模型;
以训练好的三个子网络模型做为教师模型,设置一个两层低秩BLSTM网络做为学生模型,以MFCC音频特征做为学生模型的输入,通过知识蒸馏的方法,利用教师模型指导学生模型训练,使学生模型得到与教师模型性能相当的结果;
所述的教师模型指导学生模型训练的方法为:
通过集成模型计算每个输入样本的预测结果,即是否为咳嗽的概率做为软目标,与该样本的真实结果共同构成联合损失函数:
Figure BDA0002872967470000071
其中,ytrue为样本的真实标签,ps和pt分别为学生和教师模型的预测输出,T为温度变量,设置为4,λ是常数,设置为0.5;
本实施例通过低秩分解初步压缩模型参数量;向复杂检测模型中的每一层添加低秩降维层,设置每一层的秩为10,加载训练集对3个模型分别训练,以输出和真实标签间的交叉熵做为损失函数,同时通过验证集测试网络经过每一个epoch迭代后的损失,直到10个epoch的损失均不再下降时,保存当前模型为目标模型,通过此方法压缩3个模型参数分别至原模型参数量的50%,通过将3个模型额结果平均做为集成模型的输出结果;
步骤5:使用咳嗽检测精炼模型在嵌入式设备上实时进行咳嗽自动检测;
步骤5-1:在嵌入式设备上加载精炼模型的参数;
步骤5-2:输入待检测音频,获得每一个分帧的预测结构;
步骤5-3:针对连续帧的检测结果,生成咳嗽检测事件。
咳嗽检测事件的生成方法为:
筛选连续检测结果中与左右两帧分类结果均不同的孤立结果,将其结果反转;
将连续结果连接为以事件为单位的检测结果,记录其对应起始时间、终止时间。
本步骤对步骤4得到的集成模型知识蒸馏;以集成模型做为教师模型,搭建2层低秩BLSTM网络做为知识蒸馏的学生模型,再训练集上,以单一MFCC特征作为输入,教师模型的输出结果为软标签,指导学生模型的学习,训练方法同步骤4,最终压缩模型参数量为集成检测模型的6%。
图2为本发明中可采用的一种深度模型网络结构图,对上述方法中选取的3种声学特征,即MFCC、PLP和Mel bank依次计算,分别将3种特征归一化特征后,输入到网络层中。网络层由深度双向循环长短时记忆网络(BLSTM)组成,每层设置隐藏层结点数100个,每次的输出通过tanh激活函数输入到下一层中。由于双向的特性,每一层的输出为200维,最后通过一层全连接加sigmoid激活函数拟合到一维的标签空间中,范围(0,1)。设置评估标准为敏感度、特异度以及二者的调和平均值F1,计算方法以事件为单位,敏感度SENS=TP/(TP+FN),特异度SPEC=TN/(TN+FP),对比基于相同的训练数据,1-7层的BLSTM网络的检测效果。当层数设置为5时,可达到最佳F1,单个网络参数量304479。
图3为本实施例中通过低秩分解法模型压缩的方法图,针对图2中的5层BLSTM网络,向其中所有层之间添加低秩降维层的方法实现低秩压缩。在输入xt和网络单元的结点之间加入降维层,降维层的结点数设置为10,通过降维层,底层的隐结点输出通过线性映射被压缩到更少的结点中。设Wxc、Wxi、Wxf、Wxo中各有M×N个参数,网络中的原始模型参数个数为304479,经过低秩分解后,模型参数被压缩至130797,压缩比为0.423。
图4为本实施例中通过知识蒸馏法模型压缩的方法图,经过低秩分解后的集成模型做为教师模型,蒸馏后的模型做为学生模型,具体流程为:
(1)对于同一个训练集、每一批训练样本同时计算教师模型和学生模型的网络输出ps和pt
(2)ps作为软标签,分别计算pt与软标签ps、真实标签ytrue之间的交叉熵损失,分别记作BCE(ytrue,ps)和BCE(ps,pt);
(3)设置温度T=4,λ=0.5计算联合损失:
Figure BDA0002872967470000081
然后根据损失值更新网络权重。
实施例2
一种嵌入式设备,包括至少一个处理器以及至少一个与处理器进行通信连接的存储器,在存储器内存储有可被处理器执行的指令,这些可被至少一个处理器执行,可被执行的指令包括实施例1中的任一项方法。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种经过压缩的咳嗽自动检测方法,其特征在于,所述的咳嗽自动检测方法包括:
步骤1:获取待检测音频;
步骤2:提取待检测音频的音频帧级特征;
步骤3:根据步骤2提取的音频特征搭建同构咳嗽检测子模型;
步骤4:对同构咳嗽检测子模型进行压缩并集成后蒸馏为精炼模型;
步骤5:使用咳嗽检测精炼模型在嵌入式设备上实时进行咳嗽自动检测。
2.根据权利要求1所述的一种经过压缩的咳嗽自动检测方法,其特征在于,所述的音频帧级特征包括MFCC音频特征、PLP音频特征和Mel bank音频特征。
3.根据权利要求2所述的一种经过压缩的咳嗽自动检测方法,其特征在于,所述的音频帧级特征的提取方法为:
统一音频采样率后分别提取三中音频帧级特征,分别为:
MFCC音频特征的提取方法:首先对声音信号预加重、分帧和加汉明窗处理;对每一帧进行512个点的快速傅里叶变换,得到能量谱;将能量谱通过一组Mel尺度的三角形滤波器组,得到每个滤波器组的对数能量输出;将对数能量进行离散余弦变换,求得13阶的MFCC;在MFCC基础上加入一阶差分系数和二阶差分系数组合为组合特征,并将其确定为最终的MFCC音频特征;
PLP音频特征的提取方法:首先对声音信号加窗和快速傅里叶变换,得到短时功率谱;然后将功率谱映射到Bark尺度,获得PLP音频特征;
Mel bank音频特征的提取方法:首先对声音信号预加重、分帧和加汉明窗处理;对每一帧进行512个点的快速傅里叶变换,得到能量谱;将能量谱通过一组Mel尺度的三角形滤波器组,得到每个滤波器组的输出。
4.根据权利要求2所述的一种经过压缩的咳嗽自动检测方法,其特征在于,所述的步骤3具体为:
将三种音频帧级特征分别作为三个子网络模型的输入;每个子网络模型均采用5层BLSTM双向长短时记忆网络结构,每层设置隐节点数100个,最后通过全连接层获得(0,1)范围的咳嗽帧概率值。
5.根据权利要求4所述的一种经过压缩的咳嗽自动检测方法,其特征在于,所述的步骤4具体为:
步骤4-1:通过低秩分解的方法初步压缩三个子网络模型的参数;
步骤4-2:使用压缩前的模型训练集分别训练三个子网络模型;
步骤4-3:以三个子网络模型的预测结果平均值做为集成模型输出;
步骤4-4:对集成模型进行知识蒸馏,获得压缩后的精炼模型。
6.根据权利要求5所述的一种经过压缩的咳嗽自动检测方法,其特征在于,所述的步骤4-1具体为:
对于第l层网络的原始权重矩阵Wl,利用奇异值分解法寻找与其矩阵范数尽量相近的低秩矩阵
Figure FDA0002872967460000021
其中
Figure FDA0002872967460000022
Figure FDA0002872967460000023
可被表示为
Figure FDA0002872967460000024
其中,
Figure FDA0002872967460000025
Wl
Figure FDA0002872967460000026
应满足
Figure FDA0002872967460000027
对于BLSTM中的权重矩阵Wxc、Wxi、Wxf、Wxo,即记忆单元、输入门、遗忘门和输出门中的权重矩阵,同样可以利用低秩分解法进行分解[Wxc,Wxi,Wxf,Wxo]=USVT=[Uxc,Uxi,Uxf,Uxo]SVT
方法为向每个子网络模型中的LSTM相邻两层中添加线性无偏置的低秩降维层,低秩降维层的添加位置为上层BLSTM单元的输出之后,即下层BLSTM单元的输入之前;设M、N、R分别为上层输出结点数、下层输入结点数和低秩降维层的结点数,则分解前的模型参数为4M×N个,分解后的参数为4M×R+R×N=R×(4M+N)个;
低秩分解层秩,即节点数满足:
Figure FDA0002872967460000028
7.根据权利要求5所述的一种经过压缩的咳嗽自动检测方法,其特征在于,所述的步骤4-4具体为:
以训练好的三个子网络模型做为教师模型,设置一个两层低秩BLSTM网络做为学生模型,以MFCC音频特征做为学生模型的输入,通过知识蒸馏的方法,利用教师模型指导学生模型训练,使学生模型得到与教师模型性能相当的结果;
所述的教师模型指导学生模型训练的方法为:
通过集成模型计算每个输入样本的预测结果,即是否为咳嗽的概率做为软目标,与该样本的真实结果共同构成联合损失函数:
Figure FDA0002872967460000031
其中,ytrue为样本的真实标签,ps和pt分别为学生和教师模型的预测输出,T为温度变量,λ是常数。
8.根据权利要求1所述的一种经过压缩的咳嗽自动检测方法,其特征在于,所述的步骤5具体为:
步骤5-1:在嵌入式设备上加载精炼模型的参数;
步骤5-2:输入待检测音频,获得每一个分帧的预测结构;
步骤5-3:针对连续帧的检测结果,生成咳嗽检测事件。
9.根据权利要求8所述的一种经过压缩的咳嗽自动检测方法,其特征在于,所述的咳嗽检测事件的生成方法为:
筛选连续检测结果中与左右两帧分类结果均不同的孤立结果,将其结果反转;
将连续结果连接为以事件为单位的检测结果,记录其对应起始时间、终止时间。
10.一种嵌入式设备,其特征在于,包括至少一个处理器以及至少一个与处理器进行通信连接的存储器;
所述的存储器存储有可被处理器执行的指令;所述的指令可被至少一个处理器执行;所述的可被执行的指令包括权利要求1~9任一项所述的方法。
CN202011617737.XA 2020-12-30 2020-12-30 一种经过压缩的咳嗽自动检测方法及嵌入式设备 Active CN112687290B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011617737.XA CN112687290B (zh) 2020-12-30 2020-12-30 一种经过压缩的咳嗽自动检测方法及嵌入式设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011617737.XA CN112687290B (zh) 2020-12-30 2020-12-30 一种经过压缩的咳嗽自动检测方法及嵌入式设备

Publications (2)

Publication Number Publication Date
CN112687290A true CN112687290A (zh) 2021-04-20
CN112687290B CN112687290B (zh) 2022-09-20

Family

ID=75453713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011617737.XA Active CN112687290B (zh) 2020-12-30 2020-12-30 一种经过压缩的咳嗽自动检测方法及嵌入式设备

Country Status (1)

Country Link
CN (1) CN112687290B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4109357A3 (en) * 2021-12-08 2023-04-05 Beijing Baidu Netcom Science Technology Co., Ltd. Model training method, apparatus and storage medium

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013040485A2 (en) * 2011-09-15 2013-03-21 University Of Washington Through Its Center For Commercialization Cough detecting methods and devices for detecting coughs
US20170076196A1 (en) * 2015-06-05 2017-03-16 Google Inc. Compressed recurrent neural network models
CN107945817A (zh) * 2017-11-15 2018-04-20 广东顺德西安交通大学研究院 心肺音信号分类方法、检测方法、装置、介质和计算机设备
CN108777146A (zh) * 2018-05-31 2018-11-09 平安科技(深圳)有限公司 语音模型训练方法、说话人识别方法、装置、设备及介质
CN109360584A (zh) * 2018-10-26 2019-02-19 平安科技(深圳)有限公司 基于深度学习的咳嗽监测方法及装置
CN109637546A (zh) * 2018-12-29 2019-04-16 苏州思必驰信息科技有限公司 知识蒸馏方法和装置
CN111629663A (zh) * 2017-12-21 2020-09-04 昆士兰大学 用疾病特征分析咳嗽声音以诊断呼吸系统疾病的方法
CN111627428A (zh) * 2020-05-15 2020-09-04 北京青牛技术股份有限公司 构建压缩的语音识别模型的方法
CN111933185A (zh) * 2020-10-09 2020-11-13 深圳大学 基于知识蒸馏的肺音分类方法、系统、终端及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013040485A2 (en) * 2011-09-15 2013-03-21 University Of Washington Through Its Center For Commercialization Cough detecting methods and devices for detecting coughs
US20170076196A1 (en) * 2015-06-05 2017-03-16 Google Inc. Compressed recurrent neural network models
CN107145940A (zh) * 2016-03-01 2017-09-08 谷歌公司 压缩的递归神经网络模型
CN107945817A (zh) * 2017-11-15 2018-04-20 广东顺德西安交通大学研究院 心肺音信号分类方法、检测方法、装置、介质和计算机设备
CN111629663A (zh) * 2017-12-21 2020-09-04 昆士兰大学 用疾病特征分析咳嗽声音以诊断呼吸系统疾病的方法
CN108777146A (zh) * 2018-05-31 2018-11-09 平安科技(深圳)有限公司 语音模型训练方法、说话人识别方法、装置、设备及介质
CN109360584A (zh) * 2018-10-26 2019-02-19 平安科技(深圳)有限公司 基于深度学习的咳嗽监测方法及装置
CN109637546A (zh) * 2018-12-29 2019-04-16 苏州思必驰信息科技有限公司 知识蒸馏方法和装置
CN111627428A (zh) * 2020-05-15 2020-09-04 北京青牛技术股份有限公司 构建压缩的语音识别模型的方法
CN111933185A (zh) * 2020-10-09 2020-11-13 深圳大学 基于知识蒸馏的肺音分类方法、系统、终端及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DANIEL K. MCNEILL: "《Training RNN simulated vehicle controllers using the SVD and evolutionary algorithms》", 《2018 IEEE INTELLIGENT VEHICLES SYMPOSIUM (IV)》 *
王俊: "《基于SVD裁剪的深度神经网络压缩技术研究与实现》", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 *
秦楚雄: "《基于深度学习的低资源语音识别技术研究》", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 *
陈冲等: "基于高频子带特征的咳嗽检测方法", 《南京大学学报(自然科学)》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4109357A3 (en) * 2021-12-08 2023-04-05 Beijing Baidu Netcom Science Technology Co., Ltd. Model training method, apparatus and storage medium

Also Published As

Publication number Publication date
CN112687290B (zh) 2022-09-20

Similar Documents

Publication Publication Date Title
CN111048114A (zh) 一种设备异常声音检测的设备及方法
CN109044396B (zh) 一种基于双向长短时记忆神经网络的智能心音识别方法
CN108520753A (zh) 基于卷积双向长短时记忆网络的语音测谎方法
CN111951824A (zh) 一种基于声音判别抑郁症的检测方法
Kranthi Kumar et al. COVID-19 disease diagnosis with light-weight CNN using modified MFCC and enhanced GFCC from human respiratory sounds
CN110772235A (zh) 基于云计算和移动平台的中医智能健康分析系统
Wu et al. Learning acoustic features to detect Parkinson’s disease
CN112820279B (zh) 基于语音上下文动态特征的帕金森检测模型构建方法
Anupam et al. Preliminary diagnosis of COVID-19 based on cough sounds using machine learning algorithms
CN112587153A (zh) 一种基于vPPG信号的端到端的非接触房颤自动检测系统和方法
Singh et al. Short unsegmented PCG classification based on ensemble classifier
CN112687290B (zh) 一种经过压缩的咳嗽自动检测方法及嵌入式设备
Omeroglu et al. Multi-modal voice pathology detection architecture based on deep and handcrafted feature fusion
CN113674767A (zh) 一种基于多模态融合的抑郁状态识别方法
CN116741148A (zh) 一种基于数字孪生的语音识别系统
Huang et al. Recognition of Parkinson's Disease Based on Residual Neural Network and Voice Diagnosis
Kaushik et al. SLINet: Dysphasia detection in children using deep neural network
Nouhaila et al. An intelligent approach based on the combination of the discrete wavelet transform, delta delta MFCC for Parkinson's disease diagnosis
Liu et al. AI recognition method of pronunciation errors in oral English speech with the help of big data for personalized learning
CN113974607A (zh) 一种基于脉冲神经网络的睡眠鼾声检测系统
Sharan et al. Detecting cough recordings in crowdsourced data using cnn-rnn
CN116965819A (zh) 基于语音表征的抑郁症识别方法和系统
Yerigeri et al. Meta-heuristic approach in neural network for stress detection in Marathi speech
CN114299995A (zh) 一种用于情绪评估的语言情感识别方法
Arora et al. A fusion framework based on cepstral domain features from phonocardiogram to predict heart health status

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant