CN111755022B

CN111755022B - 基于时序卷积网络的混合听诊信号分离方法及相关装置

Info

Publication number: CN111755022B
Application number: CN202010680233.6A
Authority: CN
Inventors: 李贺; 罗钊川; 李柔仪; 李世杰; 黄泽茵; 黄梓欣; 李化宇; 佘烁康; 陈沛琪; 司徒军华; 青靓
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2020-07-15
Filing date: 2020-07-15
Publication date: 2023-05-05
Anticipated expiration: 2040-07-15
Also published as: CN111755022A

Abstract

本申请公开基于时序卷积网络的混合听诊信号分离方法及相关装置，方法包括：通过预置线性编码网络将预置混合听诊信号进行编码处理，得到混合编码信号；采用预置时序卷积神经网络对混合编码信号进行信号分离，得到源信号掩码，源信号掩码包括心音信号掩码和肺音信号掩码，预置时序卷积神经网络采用预置一维扩张卷积块提取混合编码信号的信号特征；通过预置线性解码网络根据所述源信号掩码进行信号重构处理，得到目标分离信号，目标分离信号包括心音信号和肺音信号。本申请解决了现有信号分离技术没有利用心肺混合信号的时序特性，导致分离准确度较低的技术问题。

Description

基于时序卷积网络的混合听诊信号分离方法及相关装置

技术领域

本申请涉及信号处理技术领域，尤其涉及基于时序卷积网络的混合听诊信号分离方法及相关装置。

背景技术

根据世界卫生组织发布的2018世界卫生统计报告显示心血管疾病是全球头号杀手，心血管疾病死亡数占死亡总数的31％。使用听诊器听诊是最常用的心肺诊断方法之一，具有无创、低成本的特点；胸部听诊是现代医学中诊断心脏系统疾病和呼吸系统疾病的一种重要手段。传统的听诊器由共振片、声音共振腔和传导声音的导管组成，然而它有一些不可弥补的缺点：胸壁听诊时听诊信号通常为心肺音混合声音，需要听诊者根据主观经验区分心音和肺音，且听诊的效果会因心音和肺音的信号混叠而减弱，因此从混合的听诊信号中分离干净的心音信号和肺音信号是很有意义的，能提高听诊质量。

心音信号和肺音信号在60Hz-320Hz频带存在相互干扰，传统的带通滤波无法将它们完全分离；目前的基于非负矩阵分解模型和基于长短时记忆网络的心肺音分离方法取得了较好的分离效果，但是模型存在结构复杂、参数较多、收敛速度慢以及无法挖掘时频谱时序上下文关系的问题；而基于非负矩阵分解的递归稀疏表示的混合听诊信号分离方法，通过非负矩阵分解构建能有效描述心肺音的递归特征心肺音字典，再基于该字典，获得心音和肺音的稀疏表示，实现混合听诊信号的分离，但是该方法无法实际没有利用心肺信号的视频谱的非线性时序信息，使得分离精度有限。

发明内容

本申请提供了基于时序卷积网络的混合听诊信号分离方法及相关装置，用于解决现有信号分离技术没有利用心肺混合信号的时序特性，导致分离准确度较低的技术问题。

有鉴于此，本申请第一方面提供了基于时序卷积网络的混合听诊信号分离方法，包括：

通过预置线性编码网络将预置混合听诊信号进行编码处理，得到混合编码信号；

采用预置时序卷积神经网络对所述混合编码信号进行信号分离，得到源信号掩码，所述源信号掩码包括心音信号掩码和肺音信号掩码，所述预置时序卷积神经网络采用预置一维扩张卷积块提取所述混合编码信号的信号特征；

通过预置线性解码网络根据所述源信号掩码进行信号重构处理，得到目标分离信号，所述目标分离信号包括心音信号和肺音信号。

优选地，所述通过预置线性编码网络将预置混合听诊信号进行编码处理，得到混合编码信号，之后还包括：

将所述混合编码信号进行全局归一化处理，得到归一化混合编码信号。

优选地，所述将所述混合编码信号进行全局归一化处理，得到归一化混合编码信号，具体包括：

采用预置均值公式计算所述混合编码信号的均值，所述预置均值公式为：

其中，x_i为所述混合编码信号，m为信号总数，μ_β为所述均值；

采用预置方差公式计算所述混合编码信号的方差，所述预置方差公式为：

其中，

为所述方差；

采用预置标准化公式进行归一化计算，得到所述归一化混合编码信号，所述预置标准化公式为：

其中，

为所述归一化混合编码信号，ε为预置微小正数。

优选地，所述采用预置时序卷积神经网络对所述混合编码信号进行信号分离，得到源信号掩码，所述源信号掩码包括心音信号掩码和肺音信号掩码，所述预置时序卷积神经网络采用预置一维扩张卷积块提取所述混合编码信号的信号特征，还包括：

对所述预置一维扩张卷积块的输入进行零填充处理。

本申请第二方面提供了基于时序卷积网络的混合听诊信号分离装置，包括：

编码模块，用于通过预置线性编码网络将预置混合听诊信号进行编码处理，得到混合编码信号；

分离模块，用于采用预置时序卷积神经网络对所述混合编码信号进行信号分离，得到源信号掩码，所述源信号掩码包括心音信号掩码和肺音信号掩码，所述预置时序卷积神经网络采用预置一维扩张卷积块提取所述混合编码信号的信号特征；

解码模块，用于通过预置线性解码网络根据所述源信号掩码进行信号重构处理，得到目标分离信号，所述目标分离信号包括心音信号和肺音信号。

优选地，还包括：

归一化模块，用于将所述混合编码信号进行全局归一化处理，得到归一化混合编码信号。

优选地，所述归一化模块具体用于：

其中，

为所述方差；

其中，

为所述归一化混合编码信号，ε为预置微小正数。

优选地，还包括：

填充处理模块，用于对所述预置一维扩张卷积块的输入进行零填充处理。

本申请第三方面提供了基于时序卷积网络的混合听诊信号分离设备，其特征在于，所述设备包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行第一方面任一项所述的基于时序卷积网络的混合听诊信号分离方法。

本申请第四方面提供了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行第一方面任一项所述的基于时序卷积网络的混合听诊信号分离方法。

从以上技术方案可以看出，本申请实施例具有以下优点：

本申请中，提供了基于时序卷积网络的混合听诊信号分离方法，包括：通过预置线性编码网络将预置混合听诊信号进行编码处理，得到混合编码信号；采用预置时序卷积神经网络对混合编码信号进行信号分离，得到源信号掩码，源信号掩码包括心音信号掩码和肺音信号掩码，预置时序卷积神经网络采用预置一维扩张卷积块提取混合编码信号的信号特征；通过预置线性解码网络根据源信号掩码进行信号重构处理，得到目标分离信号，目标分离信号包括心音信号和肺音信号。

本申请提供的基于时序卷积网络的混合听诊信号分离方法，对预置混合听诊信号的主要处理过程为编码-提取信号特征-信号分离-解码，其中编码和解码采用的都是线性化的网络，从而提高了运算速度；采用预置时序卷积神经网络对编码后的混合信号进行信号分离操作，可以通过调整网络灵活改变感受野，这样就能避免普通卷积网络感受野小带来的无法记忆长时信息的问题；网络中实际进行特征提取的是一维扩张卷积块，它可以有效的提取混合信号中不同信号的信号特征，提升分离准确度；提取到的信号特征具有时序性，且网络可以大规模并行处理输入信号。因此，本申请能够解决现有信号分离技术没有利用心肺混合信号的时序特性，导致分离准确度较低的技术问题。

附图说明

图1为本申请实施例提供的基于时序卷积网络的混合听诊信号分离方法的一个流程示意图；

图2为本申请实施例提供的基于时序卷积网络的混合听诊信号分离装置的一个结构示意图；

图3为本申请实施例提供的基于时序卷积网络的混合听诊信号分离操作流程示意图；

图4为本申请实施例提供的基于时序卷积网络的混合听诊信号分离操作结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了便于理解，请参阅图1，本申请提供的基于时序卷积网络的混合听诊信号分离方法的实施例一，包括：

步骤101、通过预置线性编码网络将预置混合听诊信号进行编码处理，得到混合编码信号。

需要说明的是，预置线性编码网络是由多个卷积块构成的，具体卷积块数量可以表示为L，可设置每个卷积块由内核大小为K＝8、步长S＝4、1个输入通道、2个输出通道和Relu激活函数组成；每个卷积块的后面是内核大小为1、步长为1、4个输出通道和门控线性单元(GLU)作为激活函数的卷积操作；由于GLU会将通道数量减半，因此，每个卷积块都有2个输出通道，实现以较低的计算成本提高模型的深度和表达能力。进行编码前的信号是混合听诊信号，编码就是将不定长的混合听诊信号序列变成定长的背景变量，如果相对于正式进行信号分离操作而言，编码操作属于预处理操作，是为了便于后续对信号进行特征提取。

步骤102、采用预置时序卷积神经网络对混合编码信号进行信号分离，得到源信号掩码，源信号掩码包括心音信号掩码和肺音信号掩码，预置时序卷积神经网络采用预置一维扩张卷积块提取混合编码信号的信号特征。

需要说明的是，预置时序卷积神经网络根据实际情况设定，设定的内容包括具体网络层数，输入要求等；预置一维扩张卷积块的设计使用了剩余路径和跳过连接路径，一个卷积块的剩余路径作为下一个卷积块的输入，所有卷积块的跳过连接路径相加作为时序卷积网络的输出。本实施例可以设置预置时序卷积神经网络包括8层，输入维度为编码维度，输出维度为编码维度与声源数的乘积，隐藏层维度设置为特征维度的4倍。整个网络主要由一维扩张卷积块组成的全卷积网络构成，时序卷积网络中的每一层都由增加的扩张因子一维卷积块组成，扩张因子成指数增长，从而确保足够大的时间上下文窗口，更加有利于输入信号的远程依赖性。由于每次卷积提取的都是扫描区域的重要特征，特征图会随着卷积加深不断变小，因此，可以对预置一维扩张卷积块的输入进行零填充处理，确保输出信号长度与输入时的长度一致。输出信号连接的是内核大小为1的卷积块，用于进行掩码估计，具体的是通过一维因果卷积块和非线性激活函数估算分离后的心音信号掩码矢量和肺音信号掩码矢量，这样的掩码可以直接提取出原始混合信号中的不同信号，然后通过解码操作就可以得到目标分离信号。本实施例中的时序卷积神经网络用于提取信号序列中的时序信息，其反向传播路径和序列的时间方向不同，能够有效避免循环神经网络模型经常出现的梯度爆炸和梯度消失问题，且可以大规模并行处理的特点能够减少网络的训练和验证时间。

步骤103、通过预置线性解码网络根据源信号掩码进行信号重构处理，得到目标分离信号，目标分离信号包括心音信号和肺音信号。

需要说明的是，请参阅图3，信号重构处理其实就是将预置时序卷积神经网络中输出的源信号掩码提取未经分离的混合编码信号中的不同编码信号，然后通过预置线性解码网络解码得到目标分离信号。预置线性解码网络其实就是预置线性编码网络的逆操作，同样是由L个卷积块构成，卷积块采用的是一维因果卷积，每个卷积块是由内核大小为3、步长为1、2个输入和输出通道以及Relu激活函数组成，最后是由卷积核大小为8，步长为4的转置卷积作为解码输出结束操作，最后进行信号的合成，得到目标分离信号，也就是心音信号和肺音信号。由于输出通道是线性的，没有使用其他激活函数，所以解码网络输出通道直接生成相应的信号波形，完成混合听诊信号的分离。此处预置线性解码网络的设置只需与预置线性编码网络存在“编码-解码”的相对关系即可，其中的具体参数设置可以根据实际情况调整，在此不作赘述。请参阅图4，本实施例若是简单的进行结构描述，可以表述为图4，时序卷积网络分离模型中用Conv表示卷积，输入输出分别为编码器和解码器，输入为混合听诊信号，输出得到分离后的目标分离信号。

本实施例提供的基于时序卷积网络的混合听诊信号分离方法，对预置混合听诊信号的主要处理过程为编码-提取信号特征-信号分离-解码，其中编码和解码采用的都是线性化的网络，从而提高了运算速度；采用预置时序卷积神经网络对编码后的混合信号进行信号分离操作，可以通过调整网络灵活改变感受野，这样就能避免普通卷积网络感受野小带来的无法记忆长时信息的问题；网络中实际进行特征提取的是一维扩张卷积块，它可以有效的提取混合信号中不同信号的信号特征，提升分离准确度；提取到的信号特征具有时序性，且网络可以大规模并行处理输入信号。因此，本实施例能够解决现有信号分离技术没有利用心肺混合信号的时序特性，导致分离准确度较低的技术问题。

作为更进一步地，还包括：将混合编码信号进行全局归一化处理，得到归一化混合编码信号，具体过程包括：

采用预置均值公式计算混合编码信号的均值，预置均值公式为：

其中，x_i为混合编码信号，m为信号总数，μ_β为均值；

采用预置方差公式计算混合编码信号的方差，预置方差公式为：

其中，

为方差；

采用预置标准化公式进行归一化计算，得到归一化混合编码信号，预置标准化公式为：

其中，

为归一化混合编码信号，ε为预置微小正数。

需要说明的是，进行全局归一化处理的原因是神经网络会随着网络深度加深或者训练过程，其分布逐渐发生偏移或者变动，整体分布逐渐向非线性函数的取值区间上下限两端靠近，这会造成梯度爆炸或者梯度消失，因此，将混合听诊信号编码后进行全局归一化处理可以将数据标准化，强行将数据分布控制在均值为0，方差为1的标准正态分布，可以有效的避免梯度爆炸和梯度消失的问题。

为了便于理解，请参阅图2，本申请还提供了基于时序卷积网络的混合听诊信号分离装置的实施例，包括：

编码模块201，用于通过预置线性编码网络将预置混合听诊信号进行编码处理，得到混合编码信号；

分离模块202，用于采用预置时序卷积神经网络对混合编码信号进行信号分离，得到源信号掩码，源信号掩码包括心音信号掩码和肺音信号掩码，预置时序卷积神经网络采用预置一维扩张卷积块提取混合编码信号的信号特征；

解码模块203，用于通过预置线性解码网络根据源信号掩码进行信号重构处理，得到目标分离信号，目标分离信号包括心音信号和肺音信号。

进一步地，还包括：

归一化模块204，用于将混合编码信号进行全局归一化处理，得到归一化混合编码信号。

进一步地，归一化模块204具体用于：

其中，x_i为混合编码信号，m为信号总数，μ_β为均值；

其中，

为方差；

其中，

为归一化混合编码信号，ε为预置微小正数。

进一步地，还包括：

填充处理模块205，用于对预置一维扩张卷积块的输入进行零填充处理。

本申请还提供了基于时序卷积网络的混合听诊信号分离设备，设备包括处理器以及存储器：

存储器用于存储程序代码，并将程序代码传输给处理器；

处理器用于根据程序代码中的指令执行上述方法实施例任一项的基于时序卷积网络的混合听诊信号分离方法。

本申请还提供了一种计算机可读存储介质，计算机可读存储介质用于存储程序代码，程序代码用于执行上述方法实施例任一项的基于时序卷积网络的混合听诊信号分离方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以通过一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(英文全称：Read-OnlyMemory，英文缩写：ROM)、随机存取存储器(英文全称：Random Access Memory，英文缩写：RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。