CN111755022B - 基于时序卷积网络的混合听诊信号分离方法及相关装置 - Google Patents

基于时序卷积网络的混合听诊信号分离方法及相关装置 Download PDF

Info

Publication number
CN111755022B
CN111755022B CN202010680233.6A CN202010680233A CN111755022B CN 111755022 B CN111755022 B CN 111755022B CN 202010680233 A CN202010680233 A CN 202010680233A CN 111755022 B CN111755022 B CN 111755022B
Authority
CN
China
Prior art keywords
signal
mixed
preset
coding
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010680233.6A
Other languages
English (en)
Other versions
CN111755022A (zh
Inventor
李贺
罗钊川
李柔仪
李世杰
黄泽茵
黄梓欣
李化宇
佘烁康
陈沛琪
司徒军华
青靓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202010680233.6A priority Critical patent/CN111755022B/zh
Publication of CN111755022A publication Critical patent/CN111755022A/zh
Application granted granted Critical
Publication of CN111755022B publication Critical patent/CN111755022B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B7/00Instruments for auscultation
    • A61B7/02Stethoscopes
    • A61B7/04Electric stethoscopes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Quality & Reliability (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本申请公开基于时序卷积网络的混合听诊信号分离方法及相关装置,方法包括:通过预置线性编码网络将预置混合听诊信号进行编码处理,得到混合编码信号;采用预置时序卷积神经网络对混合编码信号进行信号分离,得到源信号掩码,源信号掩码包括心音信号掩码和肺音信号掩码,预置时序卷积神经网络采用预置一维扩张卷积块提取混合编码信号的信号特征;通过预置线性解码网络根据所述源信号掩码进行信号重构处理,得到目标分离信号,目标分离信号包括心音信号和肺音信号。本申请解决了现有信号分离技术没有利用心肺混合信号的时序特性,导致分离准确度较低的技术问题。

Description

基于时序卷积网络的混合听诊信号分离方法及相关装置
技术领域
本申请涉及信号处理技术领域,尤其涉及基于时序卷积网络的混合听诊信号分离方法及相关装置。
背景技术
根据世界卫生组织发布的2018世界卫生统计报告显示心血管疾病是全球头号杀手,心血管疾病死亡数占死亡总数的31%。使用听诊器听诊是最常用的心肺诊断方法之一,具有无创、低成本的特点;胸部听诊是现代医学中诊断心脏系统疾病和呼吸系统疾病的一种重要手段。传统的听诊器由共振片、声音共振腔和传导声音的导管组成,然而它有一些不可弥补的缺点:胸壁听诊时听诊信号通常为心肺音混合声音,需要听诊者根据主观经验区分心音和肺音,且听诊的效果会因心音和肺音的信号混叠而减弱,因此从混合的听诊信号中分离干净的心音信号和肺音信号是很有意义的,能提高听诊质量。
心音信号和肺音信号在60Hz-320Hz频带存在相互干扰,传统的带通滤波无法将它们完全分离;目前的基于非负矩阵分解模型和基于长短时记忆网络的心肺音分离方法取得了较好的分离效果,但是模型存在结构复杂、参数较多、收敛速度慢以及无法挖掘时频谱时序上下文关系的问题;而基于非负矩阵分解的递归稀疏表示的混合听诊信号分离方法,通过非负矩阵分解构建能有效描述心肺音的递归特征心肺音字典,再基于该字典,获得心音和肺音的稀疏表示,实现混合听诊信号的分离,但是该方法无法实际没有利用心肺信号的视频谱的非线性时序信息,使得分离精度有限。
发明内容
本申请提供了基于时序卷积网络的混合听诊信号分离方法及相关装置,用于解决现有信号分离技术没有利用心肺混合信号的时序特性,导致分离准确度较低的技术问题。
有鉴于此,本申请第一方面提供了基于时序卷积网络的混合听诊信号分离方法,包括:
通过预置线性编码网络将预置混合听诊信号进行编码处理,得到混合编码信号;
采用预置时序卷积神经网络对所述混合编码信号进行信号分离,得到源信号掩码,所述源信号掩码包括心音信号掩码和肺音信号掩码,所述预置时序卷积神经网络采用预置一维扩张卷积块提取所述混合编码信号的信号特征;
通过预置线性解码网络根据所述源信号掩码进行信号重构处理,得到目标分离信号,所述目标分离信号包括心音信号和肺音信号。
优选地,所述通过预置线性编码网络将预置混合听诊信号进行编码处理,得到混合编码信号,之后还包括:
将所述混合编码信号进行全局归一化处理,得到归一化混合编码信号。
优选地,所述将所述混合编码信号进行全局归一化处理,得到归一化混合编码信号,具体包括:
采用预置均值公式计算所述混合编码信号的均值,所述预置均值公式为:
Figure BDA0002585563350000021
其中,xi为所述混合编码信号,m为信号总数,μβ为所述均值;
采用预置方差公式计算所述混合编码信号的方差,所述预置方差公式为:
Figure BDA0002585563350000022
其中,
Figure BDA0002585563350000023
为所述方差;
采用预置标准化公式进行归一化计算,得到所述归一化混合编码信号,所述预置标准化公式为:
Figure BDA0002585563350000024
其中,
Figure BDA0002585563350000025
为所述归一化混合编码信号,ε为预置微小正数。
优选地,所述采用预置时序卷积神经网络对所述混合编码信号进行信号分离,得到源信号掩码,所述源信号掩码包括心音信号掩码和肺音信号掩码,所述预置时序卷积神经网络采用预置一维扩张卷积块提取所述混合编码信号的信号特征,还包括:
对所述预置一维扩张卷积块的输入进行零填充处理。
本申请第二方面提供了基于时序卷积网络的混合听诊信号分离装置,包括:
编码模块,用于通过预置线性编码网络将预置混合听诊信号进行编码处理,得到混合编码信号;
分离模块,用于采用预置时序卷积神经网络对所述混合编码信号进行信号分离,得到源信号掩码,所述源信号掩码包括心音信号掩码和肺音信号掩码,所述预置时序卷积神经网络采用预置一维扩张卷积块提取所述混合编码信号的信号特征;
解码模块,用于通过预置线性解码网络根据所述源信号掩码进行信号重构处理,得到目标分离信号,所述目标分离信号包括心音信号和肺音信号。
优选地,还包括:
归一化模块,用于将所述混合编码信号进行全局归一化处理,得到归一化混合编码信号。
优选地,所述归一化模块具体用于:
采用预置均值公式计算所述混合编码信号的均值,所述预置均值公式为:
Figure BDA0002585563350000031
其中,xi为所述混合编码信号,m为信号总数,μβ为所述均值;
采用预置方差公式计算所述混合编码信号的方差,所述预置方差公式为:
Figure BDA0002585563350000032
其中,
Figure BDA0002585563350000033
为所述方差;
采用预置标准化公式进行归一化计算,得到所述归一化混合编码信号,所述预置标准化公式为:
Figure BDA0002585563350000034
其中,
Figure BDA0002585563350000035
为所述归一化混合编码信号,ε为预置微小正数。
优选地,还包括:
填充处理模块,用于对所述预置一维扩张卷积块的输入进行零填充处理。
本申请第三方面提供了基于时序卷积网络的混合听诊信号分离设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面任一项所述的基于时序卷积网络的混合听诊信号分离方法。
本申请第四方面提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面任一项所述的基于时序卷积网络的混合听诊信号分离方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请中,提供了基于时序卷积网络的混合听诊信号分离方法,包括:通过预置线性编码网络将预置混合听诊信号进行编码处理,得到混合编码信号;采用预置时序卷积神经网络对混合编码信号进行信号分离,得到源信号掩码,源信号掩码包括心音信号掩码和肺音信号掩码,预置时序卷积神经网络采用预置一维扩张卷积块提取混合编码信号的信号特征;通过预置线性解码网络根据源信号掩码进行信号重构处理,得到目标分离信号,目标分离信号包括心音信号和肺音信号。
本申请提供的基于时序卷积网络的混合听诊信号分离方法,对预置混合听诊信号的主要处理过程为编码-提取信号特征-信号分离-解码,其中编码和解码采用的都是线性化的网络,从而提高了运算速度;采用预置时序卷积神经网络对编码后的混合信号进行信号分离操作,可以通过调整网络灵活改变感受野,这样就能避免普通卷积网络感受野小带来的无法记忆长时信息的问题;网络中实际进行特征提取的是一维扩张卷积块,它可以有效的提取混合信号中不同信号的信号特征,提升分离准确度;提取到的信号特征具有时序性,且网络可以大规模并行处理输入信号。因此,本申请能够解决现有信号分离技术没有利用心肺混合信号的时序特性,导致分离准确度较低的技术问题。
附图说明
图1为本申请实施例提供的基于时序卷积网络的混合听诊信号分离方法的一个流程示意图;
图2为本申请实施例提供的基于时序卷积网络的混合听诊信号分离装置的一个结构示意图;
图3为本申请实施例提供的基于时序卷积网络的混合听诊信号分离操作流程示意图;
图4为本申请实施例提供的基于时序卷积网络的混合听诊信号分离操作结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,请参阅图1,本申请提供的基于时序卷积网络的混合听诊信号分离方法的实施例一,包括:
步骤101、通过预置线性编码网络将预置混合听诊信号进行编码处理,得到混合编码信号。
需要说明的是,预置线性编码网络是由多个卷积块构成的,具体卷积块数量可以表示为L,可设置每个卷积块由内核大小为K=8、步长S=4、1个输入通道、2个输出通道和Relu激活函数组成;每个卷积块的后面是内核大小为1、步长为1、4个输出通道和门控线性单元(GLU)作为激活函数的卷积操作;由于GLU会将通道数量减半,因此,每个卷积块都有2个输出通道,实现以较低的计算成本提高模型的深度和表达能力。进行编码前的信号是混合听诊信号,编码就是将不定长的混合听诊信号序列变成定长的背景变量,如果相对于正式进行信号分离操作而言,编码操作属于预处理操作,是为了便于后续对信号进行特征提取。
步骤102、采用预置时序卷积神经网络对混合编码信号进行信号分离,得到源信号掩码,源信号掩码包括心音信号掩码和肺音信号掩码,预置时序卷积神经网络采用预置一维扩张卷积块提取混合编码信号的信号特征。
需要说明的是,预置时序卷积神经网络根据实际情况设定,设定的内容包括具体网络层数,输入要求等;预置一维扩张卷积块的设计使用了剩余路径和跳过连接路径,一个卷积块的剩余路径作为下一个卷积块的输入,所有卷积块的跳过连接路径相加作为时序卷积网络的输出。本实施例可以设置预置时序卷积神经网络包括8层,输入维度为编码维度,输出维度为编码维度与声源数的乘积,隐藏层维度设置为特征维度的4倍。整个网络主要由一维扩张卷积块组成的全卷积网络构成,时序卷积网络中的每一层都由增加的扩张因子一维卷积块组成,扩张因子成指数增长,从而确保足够大的时间上下文窗口,更加有利于输入信号的远程依赖性。由于每次卷积提取的都是扫描区域的重要特征,特征图会随着卷积加深不断变小,因此,可以对预置一维扩张卷积块的输入进行零填充处理,确保输出信号长度与输入时的长度一致。输出信号连接的是内核大小为1的卷积块,用于进行掩码估计,具体的是通过一维因果卷积块和非线性激活函数估算分离后的心音信号掩码矢量和肺音信号掩码矢量,这样的掩码可以直接提取出原始混合信号中的不同信号,然后通过解码操作就可以得到目标分离信号。本实施例中的时序卷积神经网络用于提取信号序列中的时序信息,其反向传播路径和序列的时间方向不同,能够有效避免循环神经网络模型经常出现的梯度爆炸和梯度消失问题,且可以大规模并行处理的特点能够减少网络的训练和验证时间。
步骤103、通过预置线性解码网络根据源信号掩码进行信号重构处理,得到目标分离信号,目标分离信号包括心音信号和肺音信号。
需要说明的是,请参阅图3,信号重构处理其实就是将预置时序卷积神经网络中输出的源信号掩码提取未经分离的混合编码信号中的不同编码信号,然后通过预置线性解码网络解码得到目标分离信号。预置线性解码网络其实就是预置线性编码网络的逆操作,同样是由L个卷积块构成,卷积块采用的是一维因果卷积,每个卷积块是由内核大小为3、步长为1、2个输入和输出通道以及Relu激活函数组成,最后是由卷积核大小为8,步长为4的转置卷积作为解码输出结束操作,最后进行信号的合成,得到目标分离信号,也就是心音信号和肺音信号。由于输出通道是线性的,没有使用其他激活函数,所以解码网络输出通道直接生成相应的信号波形,完成混合听诊信号的分离。此处预置线性解码网络的设置只需与预置线性编码网络存在“编码-解码”的相对关系即可,其中的具体参数设置可以根据实际情况调整,在此不作赘述。请参阅图4,本实施例若是简单的进行结构描述,可以表述为图4,时序卷积网络分离模型中用Conv表示卷积,输入输出分别为编码器和解码器,输入为混合听诊信号,输出得到分离后的目标分离信号。
本实施例提供的基于时序卷积网络的混合听诊信号分离方法,对预置混合听诊信号的主要处理过程为编码-提取信号特征-信号分离-解码,其中编码和解码采用的都是线性化的网络,从而提高了运算速度;采用预置时序卷积神经网络对编码后的混合信号进行信号分离操作,可以通过调整网络灵活改变感受野,这样就能避免普通卷积网络感受野小带来的无法记忆长时信息的问题;网络中实际进行特征提取的是一维扩张卷积块,它可以有效的提取混合信号中不同信号的信号特征,提升分离准确度;提取到的信号特征具有时序性,且网络可以大规模并行处理输入信号。因此,本实施例能够解决现有信号分离技术没有利用心肺混合信号的时序特性,导致分离准确度较低的技术问题。
作为更进一步地,还包括:将混合编码信号进行全局归一化处理,得到归一化混合编码信号,具体过程包括:
采用预置均值公式计算混合编码信号的均值,预置均值公式为:
Figure BDA0002585563350000071
其中,xi为混合编码信号,m为信号总数,μβ为均值;
采用预置方差公式计算混合编码信号的方差,预置方差公式为:
Figure BDA0002585563350000072
其中,
Figure BDA0002585563350000073
为方差;
采用预置标准化公式进行归一化计算,得到归一化混合编码信号,预置标准化公式为:
Figure BDA0002585563350000074
其中,
Figure BDA0002585563350000075
为归一化混合编码信号,ε为预置微小正数。
需要说明的是,进行全局归一化处理的原因是神经网络会随着网络深度加深或者训练过程,其分布逐渐发生偏移或者变动,整体分布逐渐向非线性函数的取值区间上下限两端靠近,这会造成梯度爆炸或者梯度消失,因此,将混合听诊信号编码后进行全局归一化处理可以将数据标准化,强行将数据分布控制在均值为0,方差为1的标准正态分布,可以有效的避免梯度爆炸和梯度消失的问题。
为了便于理解,请参阅图2,本申请还提供了基于时序卷积网络的混合听诊信号分离装置的实施例,包括:
编码模块201,用于通过预置线性编码网络将预置混合听诊信号进行编码处理,得到混合编码信号;
分离模块202,用于采用预置时序卷积神经网络对混合编码信号进行信号分离,得到源信号掩码,源信号掩码包括心音信号掩码和肺音信号掩码,预置时序卷积神经网络采用预置一维扩张卷积块提取混合编码信号的信号特征;
解码模块203,用于通过预置线性解码网络根据源信号掩码进行信号重构处理,得到目标分离信号,目标分离信号包括心音信号和肺音信号。
进一步地,还包括:
归一化模块204,用于将混合编码信号进行全局归一化处理,得到归一化混合编码信号。
进一步地,归一化模块204具体用于:
采用预置均值公式计算混合编码信号的均值,预置均值公式为:
Figure BDA0002585563350000081
其中,xi为混合编码信号,m为信号总数,μβ为均值;
采用预置方差公式计算混合编码信号的方差,预置方差公式为:
Figure BDA0002585563350000082
其中,
Figure BDA0002585563350000083
为方差;
采用预置标准化公式进行归一化计算,得到归一化混合编码信号,预置标准化公式为:
Figure BDA0002585563350000084
其中,
Figure BDA0002585563350000091
为归一化混合编码信号,ε为预置微小正数。
进一步地,还包括:
填充处理模块205,用于对预置一维扩张卷积块的输入进行零填充处理。
本申请还提供了基于时序卷积网络的混合听诊信号分离设备,设备包括处理器以及存储器:
存储器用于存储程序代码,并将程序代码传输给处理器;
处理器用于根据程序代码中的指令执行上述方法实施例任一项的基于时序卷积网络的混合听诊信号分离方法。
本申请还提供了一种计算机可读存储介质,计算机可读存储介质用于存储程序代码,程序代码用于执行上述方法实施例任一项的基于时序卷积网络的混合听诊信号分离方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.基于时序卷积网络的混合听诊信号分离方法,其特征在于,包括:
通过预置线性编码网络将预置混合听诊信号进行编码处理,得到混合编码信号;
采用预置时序卷积神经网络对所述混合编码信号进行信号分离,得到源信号掩码,所述源信号掩码包括心音信号掩码和肺音信号掩码,所述预置时序卷积神经网络采用预置一维扩张卷积块提取所述混合编码信号的信号特征;
通过预置线性解码网络根据所述源信号掩码进行信号重构处理,得到目标分离信号,所述目标分离信号包括心音信号和肺音信号。
2.根据权利要求1所述的基于时序卷积网络的混合听诊信号分离方法,其特征在于,所述通过预置线性编码网络将预置混合听诊信号进行编码处理,得到混合编码信号,之后还包括:
将所述混合编码信号进行全局归一化处理,得到归一化混合编码信号。
3.根据权利要求2所述的基于时序卷积网络的混合听诊信号分离方法,其特征在于,所述将所述混合编码信号进行全局归一化处理,得到归一化混合编码信号,具体包括:
采用预置均值公式计算所述混合编码信号的均值,所述预置均值公式为:
Figure FDA0002585563340000011
其中,xi为所述混合编码信号,m为信号总数,μβ为所述均值;
采用预置方差公式计算所述混合编码信号的方差,所述预置方差公式为:
Figure FDA0002585563340000012
其中,
Figure FDA0002585563340000013
为所述方差;
采用预置标准化公式进行归一化计算,得到所述归一化混合编码信号,所述预置标准化公式为:
Figure FDA0002585563340000014
其中,
Figure FDA0002585563340000015
为所述归一化混合编码信号,ε为预置微小正数。
4.根据权利要求1所述的基于时序卷积网络的混合听诊信号分离方法,其特征在于,所述采用预置时序卷积神经网络对所述混合编码信号进行信号分离,得到源信号掩码,所述源信号掩码包括心音信号掩码和肺音信号掩码,所述预置时序卷积神经网络采用预置一维扩张卷积块提取所述混合编码信号的信号特征,还包括:
对所述预置一维扩张卷积块的输入进行零填充处理。
5.基于时序卷积网络的混合听诊信号分离装置,其特征在于,包括:
编码模块,用于通过预置线性编码网络将预置混合听诊信号进行编码处理,得到混合编码信号;
分离模块,用于采用预置时序卷积神经网络对所述混合编码信号进行信号分离,得到源信号掩码,所述源信号掩码包括心音信号掩码和肺音信号掩码,所述预置时序卷积神经网络采用预置一维扩张卷积块提取所述混合编码信号的信号特征;
解码模块,用于通过预置线性解码网络根据所述源信号掩码进行信号重构处理,得到目标分离信号,所述目标分离信号包括心音信号和肺音信号。
6.根据权利要求5所述的基于时序卷积网络的混合听诊信号分离装置,其特征在于,还包括:
归一化模块,用于将所述混合编码信号进行全局归一化处理,得到归一化混合编码信号。
7.根据权利要求6所述的基于时序卷积网络的混合听诊信号分离装置,其特征在于,所述归一化模块具体用于:
采用预置均值公式计算所述混合编码信号的均值,所述预置均值公式为:
Figure FDA0002585563340000021
其中,xi为所述混合编码信号,m为信号总数,μβ为所述均值;
采用预置方差公式计算所述混合编码信号的方差,所述预置方差公式为:
Figure FDA0002585563340000022
其中,
Figure FDA0002585563340000023
为所述方差;
采用预置标准化公式进行归一化计算,得到所述归一化混合编码信号,所述预置标准化公式为:
Figure FDA0002585563340000024
其中,
Figure FDA0002585563340000031
为所述归一化混合编码信号,ε为预置微小正数。
8.根据权利要求5所述的基于时序卷积网络的混合听诊信号分离装置,其特征在于,还包括:
填充处理模块,用于对所述预置一维扩张卷积块的输入进行零填充处理。
9.基于时序卷积网络的混合听诊信号分离设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-4任一项所述的基于时序卷积网络的混合听诊信号分离方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-4任一项所述的基于时序卷积网络的混合听诊信号分离方法。
CN202010680233.6A 2020-07-15 2020-07-15 基于时序卷积网络的混合听诊信号分离方法及相关装置 Active CN111755022B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010680233.6A CN111755022B (zh) 2020-07-15 2020-07-15 基于时序卷积网络的混合听诊信号分离方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010680233.6A CN111755022B (zh) 2020-07-15 2020-07-15 基于时序卷积网络的混合听诊信号分离方法及相关装置

Publications (2)

Publication Number Publication Date
CN111755022A CN111755022A (zh) 2020-10-09
CN111755022B true CN111755022B (zh) 2023-05-05

Family

ID=72710972

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010680233.6A Active CN111755022B (zh) 2020-07-15 2020-07-15 基于时序卷积网络的混合听诊信号分离方法及相关装置

Country Status (1)

Country Link
CN (1) CN111755022B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113855063B (zh) * 2021-10-21 2022-11-11 华中科技大学 一种基于深度学习的心音自动诊断系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11373672B2 (en) * 2016-06-14 2022-06-28 The Trustees Of Columbia University In The City Of New York Systems and methods for speech separation and neural decoding of attentional selection in multi-speaker environments
CN110867181B (zh) * 2019-09-29 2022-05-06 北京工业大学 基于scnn和tcnn联合估计的多目标语音增强方法

Also Published As

Publication number Publication date
CN111755022A (zh) 2020-10-09

Similar Documents

Publication Publication Date Title
Chiang et al. Noise reduction in ECG signals using fully convolutional denoising autoencoders
CN106294331B (zh) 音频信息检索方法及装置
Akhter et al. ECG comptression using run length encoding
CN104995675B (zh) 音频帧丢失隐藏
Rebollo-Neira Effective high compression of ECG signals at low level distortion
WO2023221674A1 (zh) 音频编解码方法及相关产品
CN111755022B (zh) 基于时序卷积网络的混合听诊信号分离方法及相关装置
Abo-Zahhad ECG signal compression using discrete wavelet transform
Kumar et al. Efficient compression technique based on temporal modelling of ECG signal using principle component analysis
CN110141201B (zh) 血压估计方法及装置
CN116012916A (zh) 远程光体积描记信号和心率检测模型构建方法及检测方法
Kumar et al. Computational efficient method for ECG signal compression based on modified SPIHT technique
El Bouny et al. Convolutional denoising auto-encoder based awgn removal from ecg signal
Wu et al. Cross-modal perceptionist: Can face geometry be gleaned from voices?
CN116884428A (zh) 基于区块链的线上诊疗及音视频数据智能优化方法和系统
CN110811591A (zh) 一种基于心率变异性的心力衰竭分级方法
Yarga et al. Efficient spike encoding algorithms for neuromorphic speech recognition
CN114305449A (zh) 基于脑电导联互信息量的运动想象分类方法
CN117017297A (zh) 驾驶员疲劳的预测和识别模型建立方法及其应用
CN112017638A (zh) 语音语义识别模型构建方法、语义识别方法、装置及设备
Premalatha et al. Implementation of VLSI based efficient lossless EEG compression architecture using verilog HDL
Gnana Subha et al. An efficient algorithm based on combined encoding techniques for compression of ECG data from multiple leads
Wu et al. The sparse decomposition and compression of ECG and EEG based on matching pursuits
CN114626424A (zh) 一种基于数据增强的无声语音识别方法及装置
CN114638271A (zh) 基于运动想象特征提取的游戏操作方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant