CN113229842B - 一种基于复数深度神经网络的心肺音自动分离方法 - Google Patents
一种基于复数深度神经网络的心肺音自动分离方法 Download PDFInfo
- Publication number
- CN113229842B CN113229842B CN202110543927.XA CN202110543927A CN113229842B CN 113229842 B CN113229842 B CN 113229842B CN 202110543927 A CN202110543927 A CN 202110543927A CN 113229842 B CN113229842 B CN 113229842B
- Authority
- CN
- China
- Prior art keywords
- complex
- heart
- time
- frequency spectrum
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B7/00—Instruments for auscultation
- A61B7/02—Stethoscopes
- A61B7/04—Electric stethoscopes
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B7/00—Instruments for auscultation
- A61B7/003—Detecting lung or respiration noise
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Heart & Thoracic Surgery (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Animal Behavior & Ethology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Pulmonology (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
本发明公开了一种基于复数深度神经网络的心肺音自动分离方法,该方法包括:电子听诊器采集混合心肺音信号,每当数据累积到设定时长时启动心肺音自动分离程序;通过带通滤波再归一化得到预处理后的混合心肺音信号xmix;对xmix作短时傅里叶变换得到复时频谱矩阵并进行补零进而获得增广复时频谱矩阵Ymix;将Ymix输入到训练好的复数深度神经网络中,输出分离后的心音信号复时频谱矩阵和肺音信号复时频谱矩阵对和进行短时傅里叶反变换后分别得到分离后的心音时域信号和肺音时域信号用户选择心音模式时输出选择肺音模式时输出本发明提供的一种基于复数深度神经网络的心肺音自动分离方法能够对心肺音信号有效分离,为心音诊断和肺音诊断提供了有效手段。
Description
技术领域
本发明涉及心肺音自动分离技术领域,特别是涉及一种基于复数深度神经网络的心肺音自动分离方法。
背景技术
《中国心血管报告2019》显示,心血管病的死亡率在城乡居民总死亡率中排名第一,其中农村占比达45.91%,城市占比43.56%。同时,新冠疫情肆虐以及大气污染问题严重,这样的现状导致肺部疾病的发病率越来越高。心肺系统疾病的现状令人担忧,而且未来发展态势也不容乐观。
相比于心电图以及CT等等诊断方式,听诊是最直接也最便捷的诊断方式。但是听诊常常依赖于医务人员的专业水平,并且当病人具有传染性疾病时,会对医务人员的健康造成危险。所以采用可无线传输数据的电子听诊器采集心音与肺音,同时采用现代信号分析方法对声音信号进行分析是一种安全可靠的方法。
由于心脏、肺两者的位置相近,在信号采集过程中,心肺音常常是呈现混合的状态。正常心音的频率范围为20-150Hz,部分高频杂音可达100-1000Hz。正常肺音的频率范围是100-1000Hz,部分肺异常杂音可达400-1600Hz。心肺音的频率范围高度重叠,给心肺音分离与接下来的心肺音信号分析带来了挑战。心肺音分离是是实现远程心音听诊、肺音听诊的基础。图1展示了心肺音信号分离的实例,其中(a)是混合心肺音、(b)是分离后心音、(c)是分离后肺音。
K.-H.Tsai等人(Blind Monaural Source Separation on Heart and LungSounds Base d on Periodic-Coded Deep Autoencode,in IEEE Journal of Biomedicaland Health Informa tics,vol.24,no.11,pp.3203-3214)于2020年提出利用调制频率分析实现对时间信息的周期性分类,再利用自编码生成干净的心肺音。但是该论文存在以下缺点:
(1)用短时傅里叶变换后的幅度谱对网络进行训练,然后结合原始有噪声的相位谱进行短时傅里叶反变换,从而得到心肺音信号。但是原始相位谱是未分离的混合谱,直接使用会给分离后的心肺音信号带来干扰;
(2)基于小样本,导致数据信息利用不全。
发明专利申请“一种基于自回归正则化NMF的心肺音分离方法及系统”(公开号CN108133200A)对纯净心音信号和纯净肺音信号经过时频变换后做自回归正则化非负矩阵分解,得到基矩阵;处理待分离心肺音混合信号得到混合非负幅度矩阵;利用基矩阵对混合非负幅度矩阵进行非负矩阵分解得到系数矩阵;根据系数矩阵、心音非负幅度矩阵和肺音非负幅度矩阵进行重构及逆处理操作,得到心音信号及肺音信号。但是NMF存在以下缺点:
(1)NMF收敛速度较慢;
(2)NMF分解结果不唯一,导致全局最小点很难找到;
(3)仍然存在直接使用原始相位谱的问题。
发明专利申请“一种基于快速独立分量分析的心音肺音信号分离方法及装置”(公开号CN104382614A)该方法和装置实现对心音肺音信号分离是在利用小波阈值去噪对信号进行处理的基础之上,通过运用快速独立分量分析算法从而达到分离出心肺音信号的目的。但是该方法至少需要两个传感器,并且心肺源之间独立的假设与实际情况不符。
发明内容
针对现有技术存在的问题,本发明提出的一种基于复数深度神经网络的心肺音自动分离方法通过搭建的复数深度神经网络,实现对心肺音的自动分离。
本发明保护一种基于复数深度神经网络的心肺音自动分离方法,该方法包括如下步骤:
S1,电子听诊器采集混合心肺音信号,其采样频率为fs,输入到原始混合心肺音信号缓存空间,每当数据累积到设定时长T时,启动心肺音自动分离程序;
S2,开始心肺音自动分离程序,对缓存内的混合心肺音信号通过带通滤波器进行滤波,再归一化得到预处理后的混合心肺音信号,该信号表示为向量形式xmix;电子听诊器原始混合心肺音信号缓存清空,同步开展S1;
进一步地,所述对预处理后的混合心肺音信号xmix进行短时傅里叶变换得到复时频谱矩阵包括,将预处理后的混合心肺音信号xmix分帧,每帧包含NSTFT个采样点,帧间交迭Loverlap个采样点,最终得到M帧,其中第m帧数据表示为xmix,m(k),k=1,2,...,NSTFT;由M帧数据计算构造M×(NSTFT/2+1)维的复时频谱矩阵其中的第(m,n)个元素的计算公式为n=1,2,...,NSTFT/2+1,m=1,2,...,M,其中,h(n)为汉明窗。
进一步地,所述复数深度神经网络,该网络由1个或若干个堆叠的复数U-Net构成,其网络参数由一个大样本有标注的数据集训练得到。
进一步地,所述复数U-Net的结构由KC层编码器组成的下行通路、中间层、KC层解码器组成的上行通路、掩膜生成层以及心肺音分离结果输出层依次构成;每层编码器由复数卷积与激活以及复数批归一化组成,第一层编码器的输入为增广复时频谱矩阵Ymix,后续编码器的输入为上一层编码器的输出;中间层由PC个连续的复数卷积与激活构成;每层解码器由复数反卷积与激活以及复数批归一化组成,其输入由上一层输出以及同层编码器的输出在通道维度上拼接而成;掩膜生成层由两个并行的复数卷积层构成,分别输出心音复数掩膜矩阵Sheart和肺音复数掩膜矩阵Slung;心肺音分离结果输出层分别输出将心音复数掩膜Sheart和肺音复数掩膜Slung分别与增广复时频谱矩阵Ymix对应元素相乘,分别得到分离后的心音信号复时频谱矩阵和分离后的肺音信号复时频谱矩阵
其中,每层解码器的复数反卷积定义为,对某复数张量X通过某复数卷积核W进行复数反卷积的操作包括CDeConv(X,W)=[DeConv(real(X),real(W))-DeConv(imag(X),imag(W))]+j·[DeConv(real(X),imag(W))+DeConv(imag(X),real(W))]。其中,CDeConv(·,·)为复数反卷积,DeConv(·,·)为实数反卷积;
其中,复数激活的激活函数表示为fc(·)=f[real(·)]+j·f[imag(·)],其中f(·)为该复数激活函数所对应的实数激活函数;
其中,复数批归一化的定义为,对某维度为B×H×W×D的复数张量X的复数批归一化结果仍为一个维度为B×H×W×D的复数张量,其批索引b、高索引h、宽索引w所对应的向量其中(·)T表示矩阵转置,xr,b,h,w=real(X[b,h,w,:]),Xi,b,h,w=imag(X[b,h,w,:]),X[b,h,w,:]为复数张量X批索引b、高索引h、宽索引w所对应的向量,在这里为了满足方法的实时性,设定批索引个数B=1;
进一步地,所述复数深度神经网络的训练过程为,使用大量纯净心音以及纯净肺音两两混合生成训练数据,其中利用混合心肺音求得其增广复时频谱矩阵Ymix作为网络的输入,将其对应的纯净心音以及纯净肺音的增广复时频谱矩阵作为标签,基于神经网络后向传播方法进行网络训练,从而得到该网络的参数;
循环平稳谱代价函数其中为由分离后的批索引b心音信号复时频谱矩阵计算得到的循环频率谱密度,为由产生批索引b的训练数据所用的纯净心音的复时频谱矩阵计算得到的循环频率谱密度,k与l为整数,Δα为循环频率的频率分辨率;
对本发明中的任意一个维度为P×N的复时频谱矩阵X,计算其循环频率谱密度γX(α)的操作包括,首先,对其实施降采样到fds并合成降采样后的全频率复时频谱矩阵Xd,该P′×N′维矩阵Xd=[X(1:P′,1:N′/2+1),fliplr(X*(1:P′,2:N′/2))],其中 fds的取值范围为100Hz~fs,fliplr(·)是将矩阵各行元素左右颠倒的函数,(·)*为矩阵求共轭,表示下取整;计算频域通道的抽取因子并由此计算循环频率的频率分辨率Δα=fds/(L′P′);由Xd计算移项降采样全频率复时频谱矩阵其第(p′,n′)个元素的计算公式为然后,利用估计Xd的循环谱密度其中α=αI+qΔα为离散循环频率,qΔa为频移因子,q是取值范围为-M/2~M/2-1的整数,αI为离散循环频率坐标点,f为离散频率,它们的表达式分别为αI=(k-l)(fds/N′)和f=(k+l)(fds/N′)/2,其中k与l均为-N′/2~N′/2-1内的整数,g(r)为长度为P′的汉宁窗;最后,利用循环谱密度SX(α,f)计算循环频率谱密度γX(α),其计算公式为c=-L′P′,-L′P′+1,...,L′P′-1。
S6,对分离后的心音信号复时频谱矩阵和分离后的肺音信号复时频谱矩阵进行短时傅里叶反变换后分别得到分离后的心音时域信号和分离后的肺音时域信号若当前电子听诊器用户选择的是心音输出模式时输出分离后的心音时域信号当前电子听诊器用户选择的是肺音输出模式时输出分离后的肺音时域信号当电子听诊器原始混合心肺音信号缓存数据累积到下一个设定时长T时,回到S2执行操作。
进一步地,具体对分离后的心音信号复时频谱矩阵和分离后的肺音信号复时频谱矩阵进行短时傅里叶反变换后分别得到分离后的心音时域信号和分离后的肺音时域信号包括,利用分离后的心音信号复时频谱矩阵合成心音信号全频率复时频谱矩阵其中fliplr(·)是将矩阵各行元素左右颠倒的函数,对心音信号全频率复时频谱矩阵的各行进行短时傅里叶反变换,并通过汉明窗加权合成分离后的心音时域信号对分离后的肺音信号复时频谱矩阵进行同样的操作得到分离后的肺音时域信号
本发明还保护相应的两类计算机程序产品、设备:
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本发明的有益效果:1、本发明使用复数短时傅里叶变换谱的全部信息,包括完整的幅度和相位,作为特征进行分离,保证分离的可靠性;2、本发明能够对心肺音信号进行端到端有效分离,为心音诊断和肺音诊断提供了有效的手段;3、本发明只需使用一个传感器就能实现分离;4、本发明对心、肺两个信号源之间的关系无需做任何假设。
附图说明
图1(a)为心肺音分离系统所输入的混合心肺音示例图;
图1(b)为心肺音分离系统输出的分离后心音示例图;
图1(c)为心肺音分离系统输出的分离后肺音示例图;
图2为一种基于复数深度神经网络的心肺音自动分离方法的流程图;
图3为本发明复数深度神经网络的结构示意图。
图4(a)为实验生成的仿真混合心肺音数据的时域波形实例图。
图4(b)为原始心音波形实例图。
图4(c)为原始肺音波形实例图。
图4(d)为本发明分离出的心音波形实例图。
图4(e)为本发明分离出的肺音波形实例图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的说明。本发明的实施例是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显而易见的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。
实施例1
本实施例所用数据来自公共数据集,其中心音数据选自Physionet(https://physionet.org/content/challenge-2016),肺音数据选自ICBHI(https://bhichallenge.med.auth.gr)。选出Physionet中划分为正常且干净的一段心音段,Pysionet中数据的采样率为2000Hz,此时先将信号上采样为8000Hz,然后按照每段为6s的时长不交叠地截取心音,并取出其中一段6s长的干净心音段;选出ICBHI中划分为正常且干净的一段肺音段,ICBHI中数据的采样率为44100Hz,此时先将信号下采样为8000Hz,然后按照每段为6s的时长不交叠地截取,并取出其中一段6s长的干净肺音段。将选出的心音段与肺音段按照心音肺音功率比为0dB混合,得到一段仿真混合心肺音数据。
如图2所示,执行本发明所提出的一种基于复数深度神经网络的心肺音自动分离方法,该方法包括如下步骤:
S1,在计算机程序中模拟电子听诊器采集混合心肺音信号输入到原始混合心肺音信号缓存空间的过程,加载上述仿真混合心肺音数据,在数据的时间维度上移动,每当数据到达设定时长T=6秒时,启动心肺音自动分离程序;
S2,开始心肺音自动分离程序,对缓存内的混合心肺音信号通过带通滤波器进行滤波,再归一化得到预处理后的混合心肺音信号,该信号表示为向量形式xmix;电子听诊器原始混合心肺音信号缓存清空,同步开展S1;
具体地,所述对预处理后的混合心肺音信号xmix进行短时傅里叶变换得到复时频谱矩阵包括,将预处理后的混合心肺音信号xmix分帧,每帧包含NSTFT=256个采样点,帧间交迭Loverlap=64个采样点,最终得到M=747帧,其中第m帧数据表示为xmix,m(k),k=1,...,NSTFT;由M=747帧数据计算构造M×(NSTFT/2+1)维的复时频谱矩阵其中的第(m,n)个元素的计算公式为n=1,2,...,NSTFT/2+1,m=1,2,...,M,其中h(n)为汉明窗。
具体地,所述复数深度神经网络,如图3所示,由1个或若干个堆叠的复数U-Net构成,其网络参数由一个大样本有标注的数据集训练得到。
更具体地,所述复数U-Net的结构由KC=3层编码器组成的下行通路、中间层、KC=3层解码器组成的上行通路、掩膜生成层以及心肺音分离结果输出层依次构成;每层编码器由复数卷积与激活以及复数批归一化组成,第一层编码器的输入为增广复时频谱矩阵Ymix,后续编码器的输入为上一层编码器的输出;中间层由PC=2个连续的复数卷积与激活构成;每层解码器由复数反卷积与激活以及复数批归一化组成,其输入由上一层输出以及同层编码器的输出在通道维度上拼接而成;掩膜生成层由两个并行的复数卷积层构成,分别输出心音复数掩膜矩阵Sheart和肺音复数掩膜矩阵Slung;心肺音分离结果输出层分别输出将心音复数掩膜Sheart和肺音复数掩膜Slung分别与增广复时频谱矩阵Ymix对应元素相乘,分别得到分离后的心音信号复时频谱矩阵和分离后的肺音信号复时频谱矩阵
其中,每层解码器的复数反卷积定义为,对某复数张量X通过某复数卷积核W进行复数反卷积的操作包括CDeConv(X,W)=[DeConv(real(X),real(W))-DeConv(imag(X),imag(W))]+j·[DeConv(real(X),imag(W))+DeConv(imag(X),real(W))],其中CDeConv(·,·)为复数反卷积,DeConv(·,·)为实数反卷积。
其中,复数激活的激活函数表示为fc(·)=f[real(·)]+j·f[imag(·)],其中f(·)为该复数激活函数所对应的实数激活函数。
其中,复数批归一化的定义为,对某维度为B×H×W×D的复数张量X的复数批归一化结果仍为一个维度为B×H×W×D的复数张量,其批索引b、高索引h、宽索引w所对应的向量其中(·)T表示矩阵转置,xr,b,h,w=real(X[b,h,w,:]),Xi,b,h,w=imag(X[b,h,w,:]),X[b,h,w,:]为复数张量X批索引b、高索引h、宽索引w所对应的向量,在这里为了满足方法的实时性,设定批索引个数B=1。
具体地,所述复数深度神经网络的训练过程为,使用大量纯净心音以及纯净肺音两两混合生成训练数据,其中利用混合心肺音求得其增广复时频谱矩阵Ymix作为网络的输入,将其对应的纯净心音以及纯净肺音的增广复时频谱矩阵作为标签,基于神经网络后向传播方法进行网络训练,从而得到该网络的参数;
循环平稳谱代价函数其中为由分离后的批索引b心音信号复时频谱矩阵计算得到的循环频率谱密度,为由产生批索引b的训练数据所用的纯净心音的复时频谱矩阵计算得到的循环频率谱密度,k与l为整数,Δα为循环频率的频率分辨率;
对任意一个维度为P×N的复时频谱矩阵X,计算其循环频率谱密度γX(α)的操作包括,首先,对其实施降采样到fds=250Hz并合成降采样后的全频率复时频谱矩阵Xd,该P′×N′维矩阵Xd=[X(1:P′,1:N′/2+1),fliplr(X*(1:P′,2:N′/2))],其中 fliplr(·)是将矩阵各行元素左右颠倒的函数,(·)*为矩阵求共轭,表示下取整;计算频域通道的抽取因子并由此计算循环频率的频率分辨率Δα=fds/(L′P′);由Xd计算移项降采样全频率复时频谱矩阵其第(p′,n′)个元素的计算公式为然后,利用估计Xd的循环谱密度其中α=αI+qΔα为离散循环频率,qΔa为频移因子,q是取值范围为-M/2~M/2-1的整数,αI为离散循环频率坐标点,f为离散频率,它们的表达式分别为αI=(k-l)(fds/N′)和f=(k+l)(fds/N′)/2,其中k与l均为-N′/2~N′/2-1内的整数,g(r)为长度为P′的汉宁窗;最后,利用循环谱密度SX(α,f)计算循环频率谱密度γX(α),其计算公式为c=-L′P′,-L′P′+1,...,L′P′-1。
S6,对分离后的心音信号复时频谱矩阵和分离后的肺音信号复时频谱矩阵进行短时傅里叶反变换后分别得到分离后的心音时域信号和分离后的肺音时域信号若当前电子听诊器用户选择的是心音输出模式时输出分离后的心音时域信号当前电子听诊器用户选择的是肺音输出模式时输出分离后的肺音时域信号当电子听诊器原始混合心肺音信号缓存数据累积到下一个设定时长T时,回到S2执行操作。
具体地,所述对分离后的心音信号复时频谱矩阵和分离后的肺音信号复时频谱矩阵进行短时傅里叶反变换后分别得到分离后的心音时域信号和分离后的肺音时域信号包括,利用分离后的心音信号复时频谱矩阵合成心音信号全频率复时频谱矩阵其中fliplr(·)是将矩阵各行元素左右颠倒的函数,对心音信号全频率复时频谱矩阵的各行进行短时傅里叶反变换,并通过汉明窗加权合成分离后的心音时域信号对分离后的肺音信号复时频谱矩阵进行同样的操作得到分离后的肺音时域信号
最终画出得到的分离后信号的时域图,如图4所示,其中(a)是实验生成的仿真混合心肺音数据的时域波形图,(b)原始心音时域波形图(c)原始肺音时域波形图(d)生成心音时域波形图(e)生成肺音时域波形图。
实施例2
本实施例的训练和测试数据集为公共数据集,其中心音数据选自Physionet(https://physionet.org/content/challenge-2016),肺音数据选自ICBHI(https://bhichallenge.med.auth.gr)。选用Physionet中划分为正常且干净的心音段,共计54段,每段数据时长不等。Pysionet中数据的采样率为2000Hz,此时先将信号上采样为8000Hz,然后按照每段为6s的时长不交叠地截取54段数据,最终得到218段6s长的干净心音数据段;选用ICBHI中划分为正常且干净的肺音段,共计41段,每段数据时长不等。ICBHI中数据的采样率为44100Hz,先将信号下采样为8000Hz,然后按照每段为6s的时长不交叠地截取41段数据,最终得到135段6s长的干净肺音数据段。将一段心音或肺音与不同的肺音或心音混合时会得到不同的混合数据,按照此方法配成400对干净心音与肺音段。将这400对干净心音与肺音段按照不同的心音肺音功率比(-10,-5,0,5,10,15)dB混合,最终得到2400段混合心肺音。按照6:1:1比例划分这2400段混合心肺音,其中训练集个数为1800,验证集的个数为300,测试集的个数为300。
利用上述训练集与验证集中的仿真混合心肺音数据,对本发明提出的用于心肺音分离的复数深度神经网络进行训练,从而得到该复数深度神经网络的参数值。
将上述测试集中的每一段仿真混合心肺音数据通过本发明提出的一种基于复数深度神经网络的心肺音自动分离方法,利用实施例1的过程,实现心音与肺音的分离,综合利用每一段分离出来的结果,计算SAR(信噪伪影比)、SDR(信噪失真比)、SIR(信噪干扰比),最终结果为:SAR=10.585、SDR=15.6882、SIR=12.554,可见本发明所提出的方法可实现优异的心肺音分离效果。
实施例3
在硬件上本发明通常基于计算机设备实现,该计算机设备通常包括处理器、存储器、网络接口和数据库。其中,处理器用于提供计算和控制能力,存储器包括非易失性存储介质、内存储器。所述非易失性存储介质可以存储有操作系统、计算机程序和数据库;所述内存储器可以为非易失性存储介质中的操作系统和计算机程序的运行提供环境,通过运行计算机程序实现实施例1中基于复数深度神经网络的心肺音自动分离方案。
实施例4
相应的,本发明在硬件上还可直接体现于计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现实施例1中基于复数深度神经网络的心肺音自动分离方案。
显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域及相关领域的普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域及相关领域的普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
Claims (5)
1.一种基于复数深度神经网络的心肺音自动分离方法,其特征在于,该方法包括如下步骤:
S1,电子听诊器采集混合心肺音信号,其采样频率为fs,输入到原始混合心肺音信号缓存空间,每当数据累积到设定时长T时,启动心肺音自动分离程序;
S2,开始心肺音自动分离程序,对缓存内的混合心肺音信号通过带通滤波器进行滤波,再归一化得到预处理后的混合心肺音信号,该信号表示为向量形式xmix;电子听诊器原始混合心肺音信号缓存清空,同步开展S1;
S6,对分离后的心音信号复时频谱矩阵和分离后的肺音信号复时频谱矩阵进行短时傅里叶反变换后分别得到分离后的心音时域信号和分离后的肺音时域信号若当前电子听诊器用户选择的是心音输出模式时输出分离后的心音时域信号当前电子听诊器用户选择的是肺音输出模式时输出分离后的肺音时域信号当电子听诊器原始混合心肺音信号缓存数据累积到下一个设定时长T时,回到S2执行操作;
所述步骤S3中,所述对预处理后的混合心肺音信号xmix进行短时傅里叶变换得到复时频谱矩阵包括,将预处理后的混合心肺音信号xmix分帧,每帧包含NSTFT个采样点,帧间交迭Loverlap个采样点,最终得到M帧,其中第m帧数据表示为xmix,m(k),k=1,2,...,NSTFT;由M帧数据计算构造M×(NSTFT/2+1)维的复时频谱矩阵其中的第(m,n)个元素的计算公式为n=1,2,...,NSTFT/2+1,m=1,2,...,M,其中h(n)为汉明窗;
所述步骤S5中,所述复数深度神经网络,该网络由1个或若干个堆叠的复数U-Net构成,其网络参数由一个大样本有标注的数据集训练得到;
所述复数深度神经网络的训练过程为,使用大量纯净心音以及纯净肺音两两混合生成训练数据,其中利用混合心肺音求得其增广复时频谱矩阵Ymix作为网络的输入,将其对应的纯净心音以及纯净肺音的增广复时频谱矩阵作为标签,基于神经网络后向传播方法进行网络训练,从而得到该网络的参数;
循环平稳谱代价函数其中为由分离后的批索引b心音信号复时频谱矩阵计算得到的循环频率谱密度,为由产生批索引b的训练数据所用的纯净心音的复时频谱矩阵计算得到的循环频率谱密度,k与l为整数,Δα为循环频率的频率分辨率;
对任意一个维度为P×N的复时频谱矩阵X,计算其循环频率谱密度γX(α)的操作包括,首先,对其实施降采样到fds并合成降采样后的全频率复时频谱矩阵Xd,该P′×N′维矩阵Xd=[X(1:P′,1:N′/2+1),fliplr(X*(1:P′,2:N′/2))],其中 fds的取值范围为100Hz~fs,fliplr(·)是将矩阵各行元素左右颠倒的函数,(·)*为矩阵求共轭,表示下取整;计算频域通道的抽取因子并由此计算循环频率的频率分辨率Δα=fds/(L′P′);由Xd计算移项降采样全频率复时频谱矩阵其第(p′,n′)个元素的计算公式为然后,利用估计Xd的循环谱密度其中α=αI+qΔα为离散循环频率,qΔa为频移因子,q是取值范围为-M/2~M/2-1的整数,αI为离散循环频率坐标点,f为离散频率,它们的表达式分别为αI=(k-l)(fds/N′)和f=(k+l)(fds/N′)/2,其中k与l均为-N′/2~N′/2-1内的整数,g(r)为长度为P′的汉宁窗;最后,利用循环谱密度SX(α,f)计算循环频率谱密度γX(α),其计算公式为
2.根据权利要求1所述的一种基于复数深度神经网络的心肺音自动分离方法,其特征在于,所述复数U-Net的结构由KC层编码器组成的下行通路、中间层、KC层解码器组成的上行通路、掩膜生成层以及心肺音分离结果输出层依次构成;每层编码器由复数卷积与激活以及复数批归一化组成,第一层编码器的输入为增广复时频谱矩阵Ymix,后续编码器的输入为上一层编码器的输出;中间层由PC个连续的复数卷积与激活构成;每层解码器由复数反卷积与激活以及复数批归一化组成,其输入由上一层输出以及同层编码器的输出在通道维度上拼接而成;掩膜生成层由两个并行的复数卷积层构成,分别输出心音复数掩膜矩阵Sheart和肺音复数掩膜矩阵Slung;心肺音分离结果输出层将心音复数掩膜Sheart和肺音复数掩膜Slung分别与增广复时频谱矩阵Ymix对应元素相乘,分别得到分离后的心音信号复时频谱矩阵和分离后的肺音信号复时频谱矩阵
其中,每层解码器的复数反卷积定义为,对某复数张量X通过某复数卷积核W进行复数反卷积的操作包括CDeConv(X,W)=[DeConv(real(X),real(W))-DeConv(imag(X),imag(W))]+j·[DeConv(real(X),imag(W))+DeConv(imag(X),real(W))],其中CDeConv(·,·)为复数反卷积,DeConv(·,·)为实数反卷积;
其中,复数激活的激活函数表示为fc(·)=f[real(·)]+j·f[imag(·)],其中f[real(·)]为该复数激活函数所对应的实数激活函数;
其中,复数批归一化的定义为,对某维度为B×H×W×D的复数张量X的复数批归一化结果仍为一个维度为B×H×W×D的复数张量,其批索引b、高索引h、宽索引w所对应的向量其中(·)T表示矩阵转置,xr,b,h,w=real(X[b,h,w,:]),Xi,b,h,w=imag(X[b,h,w,:]),X[b,h,w,:]为复数张量X批索引b、高索引h、宽索引w所对应的向量,在这里为了满足方法的实时性,设定批索引个数B=1;
4.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至3中任一项所述的一种基于复数深度神经网络的心肺音自动分离方法。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至3中任一项所述的一种基于复数深度神经网络的心肺音自动分离方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110543927.XA CN113229842B (zh) | 2021-05-19 | 2021-05-19 | 一种基于复数深度神经网络的心肺音自动分离方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110543927.XA CN113229842B (zh) | 2021-05-19 | 2021-05-19 | 一种基于复数深度神经网络的心肺音自动分离方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113229842A CN113229842A (zh) | 2021-08-10 |
CN113229842B true CN113229842B (zh) | 2022-10-14 |
Family
ID=77137485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110543927.XA Active CN113229842B (zh) | 2021-05-19 | 2021-05-19 | 一种基于复数深度神经网络的心肺音自动分离方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113229842B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114190968A (zh) * | 2021-12-27 | 2022-03-18 | 江苏大学 | 一种基于BiGRU和DHMM的心肺音分离方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110251152A (zh) * | 2018-03-12 | 2019-09-20 | 北京大学 | 一种自动分离心肺音的骨传导式数字听诊系统 |
CN110809784A (zh) * | 2017-09-27 | 2020-02-18 | 谷歌有限责任公司 | 高分辨率图像分割的端到端网络模型 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6903611B2 (ja) * | 2018-08-27 | 2021-07-14 | 株式会社東芝 | 信号生成装置、信号生成システム、信号生成方法およびプログラム |
-
2021
- 2021-05-19 CN CN202110543927.XA patent/CN113229842B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110809784A (zh) * | 2017-09-27 | 2020-02-18 | 谷歌有限责任公司 | 高分辨率图像分割的端到端网络模型 |
CN110251152A (zh) * | 2018-03-12 | 2019-09-20 | 北京大学 | 一种自动分离心肺音的骨传导式数字听诊系统 |
Non-Patent Citations (3)
Title |
---|
DCCRN: Deep Complex Convolution Recurrent Network for Phase-Aware Speech Enhancement;Yanxin Hu 等;《arXiv:2008.00264v4》;20200923;全文 * |
EXPLORING DEEP COMPLEX NETWORKS FOR COMPLEX SPECTROGRAM;Ashutosh Pandey 等;《ICASSP 2019》;20190417;全文 * |
Sing-voice separation from monaural recording using deep recurrent neural networks;Po-Sen Huang 等;《15th International Society for Music Information Retrieval Conference》;20141231;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113229842A (zh) | 2021-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Emmanouilidou et al. | Adaptive noise suppression of pediatric lung auscultations with real applications to noisy clinical settings in developing countries | |
CN110246510B (zh) | 一种基于RefineNet的端到端语音增强方法 | |
CN112259120B (zh) | 基于卷积循环神经网络的单通道人声与背景声分离方法 | |
Mondal et al. | Reduction of heart sound interference from lung sound signals using empirical mode decomposition technique | |
CN110755108A (zh) | 一种基于智能听诊器的心脏声音分类方法、系统、装置及可读存储介质 | |
CN113066502B (zh) | 基于vmd和多小波的心音分割定位方法 | |
CN112863667B (zh) | 一种基于深度学习的肺部声音诊断装置 | |
CN110705624B (zh) | 一种基于多信噪比模型的心肺音分离方法及系统 | |
CN112971839B (zh) | 一种基于前馈卷积神经网络的心音分类方法 | |
Gupta et al. | Gammatonegram based triple classification of lung sounds using deep convolutional neural network with transfer learning | |
Khan et al. | Separating Heart Sound from Lung Sound UsingLabVIEW | |
US20230329646A1 (en) | Classifying biomedical acoustics based on image representation | |
Lin et al. | Blind source separation of heart and lung sounds based on nonnegative matrix factorization | |
CN113229842B (zh) | 一种基于复数深度神经网络的心肺音自动分离方法 | |
CN113436726A (zh) | 一种基于多任务分类的肺部病理音自动化分析方法 | |
CN114469124A (zh) | 一种运动过程中异常心电信号的识别方法 | |
CN111370120B (zh) | 一种基于心音信号的心脏舒张功能障碍的检测方法 | |
Lee et al. | Restoration of lung sound signals using a hybrid wavelet-based approach | |
González-Rodríguez et al. | Robust denoising of phonocardiogram signals using time-frequency analysis and U-Nets | |
CN115251978B (zh) | 基于小波谱图的异常心音识别方法、装置和服务架构 | |
Hadjileontiadis et al. | Current techniques for breath sound analysis | |
Liutkus et al. | Source separation for target enhancement of food intake acoustics from noisy recordings | |
CN114587357A (zh) | 基于脑电频谱特征的太极桩精神状态检测方法 | |
CN114171044A (zh) | 基于时域全卷积深度神经网络电子听诊器自适应消噪方法 | |
Sharan et al. | Automated Cough Sound Analysis for Detecting Childhood Pneumonia |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |