CN111368627B - Cnn结合改进频率小波切片变换的心音分类方法及系统 - Google Patents
Cnn结合改进频率小波切片变换的心音分类方法及系统 Download PDFInfo
- Publication number
- CN111368627B CN111368627B CN201911142557.8A CN201911142557A CN111368627B CN 111368627 B CN111368627 B CN 111368627B CN 201911142557 A CN201911142557 A CN 201911142557A CN 111368627 B CN111368627 B CN 111368627B
- Authority
- CN
- China
- Prior art keywords
- heart sound
- sample entropy
- heart
- neural network
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
- G06F2218/06—Denoising by applying a scale-space analysis, e.g. using wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Abstract
本公开提供了一种CNN结合改进频率小波切片变换的心音分类方法及系统,对获取的心音信号进行预处理,利用隐半马尔克夫模型找到各个心动周期的位置,进行每个心动周期信号的截取;利用改进频率切片小波变换将每个截取到的一维的心动周期信号转换成为二维时频图像;对获取的心音信号分别计算样本熵,并与预设样本熵阈值进行比对,当心音信号的样本熵大于预设样本熵阈值时,利用第一卷积神经网络根据二维时频图像进行网络训练和分类,否则,利用第二卷积神经网络根据二维时频图像进行网络训练和分类;首先利用样本熵分辨受到干扰程度不同的信号,再针对不同的信号利用不同的卷积神经网络模型进行分类,极大的提高了心音信号分类的准确性。
Description
技术领域
本公开涉及心音分类技术领域,特别涉及一种CNN结合改进频率小波切片变换的心音分类方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术,并不必然构成现有技术。
心脑血管疾病早已经是世界上致死人数最多的疾病。心音是反映心脏健康状况的重要生理信号。心音的异常可以反映出许多心脏疾病,并且能够帮助医生对病人病情做出诊断。按照心脏活动可以将心音信号分成四个阶段,分别为第一心音(S1期)、收缩期、第二心音(S2期)和舒张期。由于心脏疾病造成的心脏活动异常会使心音产生变化,常见的相关疾病有二尖瓣狭窄,主动脉瓣关闭不全,主动脉瓣狭窄和二尖瓣反流等等。因此,分辨正常和异常心音在临床上对诊断疾病有着重要的辅助作用。但是由于在临床上采集心音的环境和设备很难一致,采集到的心音中常常包含着许多干扰和杂音。不同数据库中的心音数据有着很大的差异,这是因为采集心音使用了不同的设备。这些问题给分类心音造成了事实上的困难。
本公开发明人发现,(1)目前大多数心音分类研究者都采用了特征选择,机器学习和深度学习的一些算法,比如神经网络、支持向量机、随机森林、决策树和k-近邻,但是心音信号含有较多的干扰信号,直接对其进行提取往往无法训练出较好的模型算法,从而无法实现准确的分类;(2)不同个体的心音信号之间、不同的采样设备之间的差异性较大,单纯的进行心音信号的特征提取和训练,训练好的网络模型往往不能针对多样的心音信号进行准确分类。
发明内容
为了解决现有技术的不足,本公开提供了一种CNN结合改进频率小波切片变换的心音分类方法及系统,首先利用样本熵分辨受到干扰程度不同的信号,再针对不同的信号利用不同的卷积神经网络模型进行分类,极大的提高了心音信号分类的准确性。
为了实现上述目的,本公开采用如下技术方案:
本公开第一方面提供了一种CNN结合改进频率小波切片变换的心音分类方法。
一种CNN结合改进频率小波切片变换的心音分类方法,正常心音信号第一心音持续时长较长,0.1~0.12秒,振幅比第二心音大,40~60赫兹,第二心音持续时长短,0.04~0.05秒,振幅比第一心音小,60~100赫兹,第一心音结束,舒张期结束,收缩期开始,第二心音开始,收缩期结束,舒张期开始。异常心音将导致心音信号频率、复杂度发生改变,本方法利用样本熵区分复杂度不同的信号,进而结合了两个不同的卷积神经网络模型,具体步骤如下:
对获取的心音信号进行预处理,利用隐半马尔克夫模型找到每条心音信号的各个心动周期信号的位置,找到第一心音、第二心音、收缩期、舒张期四个时期,进行每个心动周期信号的截取;
利用改进频率切片小波变换将每个截取到的一维的心动周期信号转换成为二维时频图像;
对获取的心音信号分别计算样本熵,并与预设样本熵阈值进行比对,当心音信号的样本熵大于预设样本熵阈值时,利用第一卷积神经网络根据二维时频图像进行网络训练和分类,否则,利用第二卷积神经网络根据二维时频图像进行网络训练和分类。
作为可能的一些实现方式,所述心音信号包括多条健康人心音信号和多条病人心音信号,来自不同年份的多个不同的数据库,对获取到的心音信号进行重采样统一到预设频率。
作为可能的一些实现方式,所述隐半马尔克夫模型利用四种包络,包括同态包络、希尔伯特包络、小波包络和功率谱密度包络,上述包络序列通过隐半马尔克夫模型找到每个时间点在第一心音、收缩期、第二心音和舒张期的可能性,以上述可能性作为特征,通过逻辑回归模型进行判断,进而确定心音信号的四个分期。
作为可能的一些实现方式,所述改进频率切片小波变换的时域步长设置为50,生成时频图像的大小为73*50。
作为可能的一些实现方式,第一卷积神经网络的第一卷积层包括30个16*9大小的卷积,第二卷积神经网络的第一卷积层包括28个12*9的卷积核。
作为可能的一些实现方式,利用每个心动周期信号的有效时长进行心动周期信号的截取,有效时长的计算公式具体为:
Usefuldurationi=η1*Diastolei-1+S1i+Systolei+S2i+η2*Diastolei
其中,Useful durationi表示某个心音记录中第i个有效时长,S1i、Systolei、S2i和Diastolei分别表示第i个心动周期的S1期、收缩期、S2期和舒张期,Diastolei-1表示第i-1个心动周期中的舒张期,η1和η2表示两个系数,表示包含舒张期的百分比。
作为进一步的限定,所述有效时长包括第i个心动周期的舒张期和第i-1个心动周期的舒张期,使得有效时长中包括全部的S1期和S2期。
作为可能的一些实现方式,所述第一卷积神经网络和第二卷积神经网络均为十二层的神经网络,均包括两个卷积层、两个激励层、一个最大池化层、一个损失层、三个全连接层和输入输出层,两个卷积神经网络的第一卷积层核大小和核数量不同。
作为可能的一些实现方式,预设样本熵阈值的获取方法,具体为:
将获取到的所有的心音信号等分为多个部分,设置多个样本熵候选阈值,每两个相邻的样本熵候选阈值间的数据量一致;
针对不同的样本熵候选阈值进行两个卷积神经网络模型的训练和分类,选取精确度度量和精确度最大时的样本熵候选阈值为最终的预设样本熵阈值。
作为进一步的限定,对于不同时间标准的心音信号数据进行十折交叉验证,每次验证时计算精确度度量和精确度,根据十折交叉验证最终得到的精确度度量和精确度的平均值确定预设样本阈值。
本公开第二方面提供了一种CNN结合改进频率小波切片变换的心音分类系统。
一种CNN结合改进频率小波切片变换的心音分类系统,包括:
预处理模块,被配置为:对获取的心音信号进行预处理,利用隐半马尔克夫模型找到每条心音信号的各个心动周期信号的位置,进行每个心动周期信号的截取,并找到第一心音、第二心音、收缩期、舒张期四个时期;
数据转换模块,被配置为:利用改进频率切片小波变换将每个截取到的一维的心动周期信号转换成为二维时频图像;
网络训练和分类模块,被配置为:对获取的心音信号分别计算样本熵,并与预设样本熵阈值进行比对,当心音信号的样本熵大于预设样本熵阈值时,利用第一卷积神经网络根据二维时频图像进行网络训练和分类,否则,利用第二卷积神经网络根据二维时频图像进行网络训练和分类。
本公开第三方面提供了一种介质,其上存储有程序,该程序被处理器执行时实现如本公开第一方面所述的CNN结合改进频率小波切片变换的心音分类方法中的步骤。
本公开第四方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开第一方面所述的CNN结合改进频率小波切片变换的心音分类方法中的步骤。
与现有技术相比,本公开的有益效果是:
1、本公开所述的内容首先利用样本熵分辨受到干扰程度不同的信号,再针对不同的信号利用不同的卷积神经网络模型进行分类,极大的提高了心音信号分类的准确性。
2、本公开所述的内容根据样本熵值将数据分为两部分,在两部分数据上分别有针对性的训练两个参数不同的卷积神经网络模型,在进行十折交叉验证时,针对不同的样本熵值信号分别利用不同的卷积神经网络模型进行分类,大于样本熵阈值的心音信号采用第一卷积神经网络进行分类,小于样本熵阈值的心音信号采用第二卷积神经网络分类,结果显示,这种方法对于心音信号有这良好的分类能力。
3、本公开采用的心音数据由六个不同的数据库组成,六个数据库由于来自不同的团队和不同的采集设备,有的甚至采集时间跨度超过十年,因此六个数据库彼此之间的差异很大,通过本申请所述的内容能够实现0.94的精确度度量,超过现有的各种心音分类模型。
4、本公开所述的内容通过对心音样本的心动周期中的有效时长进行了分析,利用有效时长进行心动周期的截取,使得每个有效时长中包括第i个心动周期的舒张期和第i-1个心动周期的舒张期是为确保有效时长中包括全部的S1期和S2期,同时避免了覆盖到下一个心动周期的数据,从而极大的提高了采样数据的准确性,进而能够训练出更高效和准确的分类模型。
5、本公开采用改进频率切片小波变换(MFSWT)的方式把每个心跳的心音信号转变成时频图像,由于引入了自适应的频率切片函数,MFSWT没有复杂的参数需要调整,所以更加容易使用,MFSWT对于心音中最重要的S1期和S2期的两个阶段在时频图都展示的非常清楚,定位也很精确,这为下一步利用卷积神经网络进行分类奠定了基础。
6、本公开所述的内容通过样本熵进行数据分类,样本熵可以明显区分形态学特征差异很大的信号,当信号的样本熵较大时,信号中出现的扰动越多,当样本熵较小时,信号越纯净。利用样本熵的区分能力,本公开根据样本熵值的不同采用两个卷积神经网络模型进行分类,这样训练的卷积神经网络模型应当有更好的针对性。
7、本公开所述的内容对于不同的时间标准进行了十折交叉验证的实验,利用精确度度量和精确度最大时的样本熵阈值为最佳的预设阈值,从而能更高效的进行模型的训练,进而实现更准确的心音信号分类。
附图说明
图1为本公开实施例1所述的CNN结合改进频率小波切片变换的心音分类方法流程示意图。
图2为本公开实施例1所述的心音信号的示意图。
图3为本公开实施例1所述的心动周期与有效时长的对比分析图。
图4(a)为本公开实施例1所述的健康人的5s的心音信号示意图。
图4(b)为本公开实施例1所述的健康人的5s的心音信号的时频图。
图4(c)为本公开实施例1所述的病人的5s的心音信号示意图。
图4(d)为本公开实施例1所述的病人的5s的心音信号的时频图。
图5(a)为本公开实施例1所述的样本熵为0.087的心音信号示意图。
图5(b)为本公开实施例1所述的样本熵为7.051的心音信号示意图。
图6为本公开实施例1所述的两个卷积神经网络的选择方法流程示意图。
图7为本公开实施例1所述的精确度度量和精确度随着样本熵阈值变化的折线图。
图8(a)为本公开实施例1所述的病人样本熵统计示意图。
图8(b)为本公开实施例1所述的正常人样本熵统计示意图。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例1:
如图1所示,本公开实施例1提供了一种CNN结合改进频率小波切片变换的心音分类方法,根据样本熵值将数据分为两部分,在两部分数据上分别有针对性的训练两个参数不同的卷积神经网络(卷积神经网络)模型。在进行十折交叉验证时,针对不同的样本熵值信号分别利用不同的卷积神经网络模型(model1和model2)进行分类,大于样本熵阈值的心音信号采用model1进行分类,小于样本熵阈值的心音信号采用model2分类,结果显示,这种方法对于心音信号有这良好的分类能力。
具体包括如下几个方面:
(1)数据选择
本实施例采用2016年心音挑战赛的公开数据库,数据库中包括3240条心音记录,其中健康人记录有2575条,病人的记录有665条。时间长度从5s到120s不等,这些数据由六个不同的数据库组成。六个数据库由于来自不同的团队和不同的采集设备,有的甚至采集时间跨度超过十年,因此六个数据库彼此之间的差异很,如表1所示。这些差异对于心音分类是不可忽视的障碍。
表1:数据库组成
(2)重采样和分段
原始心音信号首先进行重采样统一到1000Hz,之后再利用挑战赛提供的开源隐半马尔克夫模型对原始心音信号进行分段,从而找到心动周期的S1期、收缩期、S2期、舒张期的位置。由于S1期是心脏房室瓣震动产生的,紧随心电图中的R波。S2期是心脏半月瓣关闭产生的,大约发生在心电图的末端T波的位置,如图2所示。因此,心音中的S1期和S2期的间隔基本对应着心电图中的QT间期的时间。正常人的QT间期大约为0.45s左右,并且正常人的心动周期是0.8s左右。但是病人的心动周期和QT间期会发生变化。正常人的而S1期和S2期又是心音中最重要的部分,包含着心音中的大部分信息。
在心脏收缩期和舒张期采集到的信号基本上都是噪音,因为此时心脏活动产生的心音较小,在不严格的检测环境下,淹没在背景噪音之中。第三心音(S3)和第四心音(S4)难以采集,在本实施例所采取的数据库中大部分数据中没有发现,故而不做分析。另外,舒张期时间较长,所含信息较少。因此,本实施例截取的每个心动周期长度应该包含全部的S1期,收缩期,S2期,尽量少的舒张期。本实施例依据如下公式对数据库中的心音样本的心动周期中有效时长进行了分析:
Usefuldurationi=η1*Diastolei-1+S1i+Systolei+S2i+η2*Diastolei (1)
在公式(1)中,Useful durationi表示某个心音记录中第i个有效时长,S1i、Systolei、S2i和Diastolei分别表示第i个心动周期的S1期,收缩期,S2期舒张期,Diastolei-1表示第i-1个心动周期中的舒张期,η1和η2表示两个系数,它表示包含舒张期的百分比,这里设置为0.2。在Ti中包括第i个心动周期的舒张期和第i-1个心动周期的舒张期是为确保有效时长中包括全部的S1期和S2期。
数据库中心动周期持续时间统计如图3中橙色柱状图所示,有效时长持续时间统计如图3中蓝色柱状图所示。从图3中可以看出,有效时长基本都小于0.8s,心动周期从0.3s到2.2s不等,但是整体均值约为0.8s。为了覆盖每个心动周期的全部有效时长,并且尽量避免覆盖到下一个心动周期的数据,本实施例截取每个心动周期的时间长度为0.8s,以便下一步进行改进频率切片小波变换。
(3)改进频率切片小波变换
改进频率切片小波变换(MFSWT)是在频率切片小波变换(Frequency slicewavelet transform,FSWT)的基础上针对低频生物信号改进而来。频率切片小波变换的基础是短时傅里叶变换,它已经很好地用于模态信号分离和阻尼识别,但是在生物信号处理方面存在一些问题。针对这个问题,在频率切片小波变换中引入了信号自适应的频率切片函数(Frequency slice function,FSF)来精确定位生物信号各个成分在时频图中的位置,利用此方法分类心电信号得到了很高的精确度。一般的方法都面临着调参的问题,由于引入了自适应的频率切片函数,MFSWT没有复杂的参数需要调整,所以更加容易使用。
假设是f(t)的傅里叶变换,那么MFSWT可以表示为下式:
在上式中,ω表示频率,t表示时间,“*”表示共轭算子,表示频率切片函数(FSF),定义如下:
在公式(2)中,q被定义为的尺度函数,定义如下式:
在公式(4)中,fmax表示的最大值,sgn(·)表示符号函数,/>表示差分算子。在符号函数中,如果输入小于等于0,则返回0,反之,如果输入大于0,则返回1。由此可以推出,当/>的值变化时,窗长与之正相关,当/>的值比较大时,窗长较大,当/>比较小时,窗长较小。因此,此公式赋予了FSWT信号自适应的特性。频率切片函数这种特性使得MFSWT能够在时频图像上精确地定位信号不同频率成分地表示位置。
在公式(3)中,可以推出根据在[17]中的证明,MFSWT的反变换可以表示为下式:
本实施例利用MFSWT的方法把每个心跳的心音信号转变成时频图像,以便利用卷积神经网络进行分类。图4(a)展示了健康人的5s的心音信号,图4(b)展示了病人的5s的心音信号,以及它们的改进频率切片小波变换的效果图4(b)和图4(d)。其中健康的心音信号数据来自数据库中编号为a0069的数据,病人的心音信号来自于数据库中编号为a0001的数据。
在图4(b)和图4(d)中,MFSWT对于心音中最重要的S1期和S2期的两个阶段在时频图都展示的非常清楚,定位也很精确,这为下一步利用卷积神经网络进行分类奠定了基础。
在本实施例中,截取的窗长为0.8s,利用MFSWT转换成的时频图大小为73*50。数据库中的3240条记录全部截取0.8s长度的S1和S2期之后,转换成二维时频图的数目如表2所示,其中健康人的2575条样本,转换成70317张时频图片,665条病人样本记录,转换成19242张图片。健康人和病人样本记录数目之比为2575/665=3.87。健康人和病人样本总时长之比为55773/17004=3.27。健康人和病人转换后的时频图像数目之比为70317/19242=3.65。数据很不平衡。
表2:转换之后时频图像数目
(4)样本熵
样本熵是在近似熵的基础上提出的,它对时间序列的复杂度更加敏感。并且在很大程度上与时间序列的长度无关。因此更适用于短时生物信号。一段信号的样本熵可以用SampEn(N,r,m)表示。其中,N是时间信号的长度,m是嵌入维数,r是相似容限。
假设一段时间长度为N的信号表示为下式:
XN={x1,x2,x3...xN}(6)
定义m维向量Xm(i)如下式:
Xm(i)={xi,xi+1,xi+2...xi+m-1}i=1,2...N-m+1(7)
定义两个m维向量Xm(i)与Xm(j)(i≠j)之间距离为Di,j如下式:
Di,j=max|x(i+k)-x(j+k)|k=0,1,2...m-1(8)
对于向量Xm(i)统计和其距离小于容限r的向量Xm(j)的数目,记为
定义Bm(r)如下式:
定义样本熵SampEn(N,r,m)如下式:
样本熵是一种信号复杂度的度量,样本熵的值越低表示信号具有越高的规律性。图5(a)的信号来自数据库中e00158,该条数据的样本熵为0.087。图5(b)的信号来自d0009,该条数据的样本熵为7.051。样本熵可以明显区分形态学特征差异很大的信号。当信号的样本熵较大时,信号中出现的扰动越多,当样本熵较小时,信号越纯净。利用样本熵的区分能力,本实施例根据样本熵值的不同采用两个卷积神经网络模型进行分类,这样训练的卷积神经网络模型应当有更好的针对性。
(5)卷积神经网络
近年来,深度学习中的卷积神经网络在图像识别方面备受瞩目。Lecun的工作推动了卷积神经网络的快速发展。卷积神经网络是具有多个隐藏层的前馈神经网络。每层由许多神经单元构成,每个神经单元是一个将输入映射到输出的函数。
第n层的第k个神经元的输入表示如下式:
上式中,和/>分别是第n层第k个神经元的偏差和核。/>表示第n-1层的第i个神经元的输出,conv2D(·,·)表示边界上没有零填充的二维常规卷积。
第n层的第k个神经元的输出表示如下式:
卷积神经网络利用误差逆传播算法对参数进行迭代,并且误差逆传播算法利用梯度下降,以目标的梯度方向对参数进行调整。
以第n层第l个参数的迭代为例,假定该层的输出为事实上真正的输出应为/>则该神经网络的均方误差为:
那么对于以第n层第l个参数的迭代可以用式(14)表示,其中η表示学习率。
本实施例针对心音信号样本熵值的不同分别训练了两个卷积神经网络模型Model1和Model2,两个模型的参数基本相同,都是12层的神经网络,都包括2个卷积层,2个激励层,一个最大池化层,一个损失层,三个全连接层和输入输出层。两个模型不同点在于卷积层中的神经元的数目和大小不同。两个模型的详细参数如表3所示。
表3:卷积神经网络模型参数
(6)评价标准
本实施例利用敏感性(Sensitivity)、特异性(specificity)、精确度以及分类准确度的度量作为评价模型的标准。敏感性(Se)定义如公式(15)所示,其中TP(truepositive)表示真正例,P表示真实情况中的全部正例。
特异性(Sp)定义如公式(16)所示,其中TN表示真反例,N表示真实情况下的全部反例。
精确度(Acc)定义如公式(17)所示,其中(TP+TN)表示真正例和真反例之和,(P+N)表示全部样本。
精确度度量(Macc)定义如公式(18),其中Se与Sp分别为敏感性和特异性。由于数据的不平衡,导致精确度(Acc)不能准确评价模型的性能。所以,Macc是在挑战赛中是用来衡量参赛者模型性能的度量。
(7)实验结果分析
在表3中展示了本实施例训练的两个卷积神经网络模型的具体参数。本实施例在进行交叉验证的时候首先按样本熵对数据集进行分层训练,在样本熵大于阈值的数据中,训练得到Model1,在样本熵小于阈值的数据中,训练得到Model2。
在分类阶段,分类器首先计算心音信号的样本熵,如果样本熵大于阈值,则利用Model1对此心音信号进行分类。如果心音信号的样本熵小于阈值,则利用Model2对此心音信号进行分类,如图6中的流程所示。
如图6所示,本实施例提出的分类的样本熵阈值是分类器的核心内容。当对某一个心音信号进行分类时,样本熵阈值确定了采用Model1和Model2中哪一个来对心音信号进行分类。这直接影响了该条心音的分类结果。因此,本实施例对于不同的时间标准进行了十折交叉验证的实验,以便选取合适的样本熵阈值。
如图7所示,展示了精确度度量(Macc)和精确度(Acc)随着样本熵阈值变化的折线图。当样本熵阈值为2.76时,Macc和Acc的值最大,Macc=0.94,Acc=0.93。在数据库中的心音信号样本熵跨度很大,本实施例样本熵阈值的选取是按照数据等分的原则,基本上每两个相邻阈值内的数据量是基本一致的。因此,在图7中样本熵阈值采用从1.08到3.11。表4展示了当样本熵阈值等于2.76时,进行十折交叉验证的Se、Sp、Acc和Macc具体细节。
表4:十折交叉验证结果
(7)近年实验结果对比分析
在表5中将本实施例提出的方法和最近几年发表的研究结果做了一个对比。其中利用阈值监督和卷积神经网络结合的方法,Macc达到0.9150,该方法是利用了梅尔频率倒谱系数的方法将一维的数据转换成为二维图片之后利用卷积神经网络进行分类。
利用改进频率切片小波变换的方法,结合本实施例提出的分类卷积神经网络模型,可以得到Macc=0.94的结果。
表5:心音分类不同方法交叉验证结果对比
本实施例提出了一种结合改进频率小波切片变换和卷积神经网络的新方法,并在公开的心音数据集上进行交叉验证,得到了较好的结果。
此外,本实施例还利用了信号的样本熵首先对信号进行简单的评估,之后再利用不同的卷积神经网络模型进行分类,之所以这样做是考虑到由于采集到的心音信号容易受到噪音干扰,并且噪音的干扰程度不同。噪音越大,信号的复杂度应当越大,信号的复杂度越大,样本熵的值应该越大。首先利用样本熵分辨受到干扰程度不同的信号,再针对不同的信号进行分类,应当是要比单一的机器学习模型更有效。这有可能是提高了精确度的原因之一。
本实施例统计了数据的样本熵的分布,结果如图8(a)和图8(b)所示,图8(a)展示的是病人样本熵的情况,图8(b)展示的是健康人信号的样本熵的情况。在图8(a)和图8(b)中横坐标是每条信号中检测到的心动周期的数目,纵坐标是样本熵值的大小。病人样本熵值明显有着聚集的情况,并且有着两个聚集中心。本实施例找到的样本熵阈值最好的位置基本上区分出来了这两个不同的聚集部分,这是提高了分类精确度的一个重要原因。
实施例2:
本公开实施例2提供了一种CNN结合改进频率小波切片变换的心音分类系统,包括:
预处理模块,被配置为:对获取的心音信号进行预处理,利用隐半马尔克夫模型找到每条心音信号的各个心动周期信号的位置,进行每个心动周期信号的截取,并找到第一心音、第二心音、收缩期、舒张期四个时期;
数据转换模块,被配置为:利用改进频率切片小波变换将每个截取到的一维的心动周期信号转换成为二维时频图像;
网络训练和分类模块,被配置为:对获取的心音信号分别计算样本熵,并与预设样本熵阈值进行比对,当心音信号的样本熵大于预设样本熵阈值时,利用第一卷积神经网络根据二维时频图像进行网络训练和分类,否则,利用第二卷积神经网络根据二维时频图像进行网络训练和分类。
实施例3:
本公开实施例3提供了一种介质,其上存储有程序,该程序被处理器执行时实现如本公开实施例1所述的CNN结合改进频率小波切片变换的心音分类方法中的步骤。
实施例4:
本公开实施例4提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开实施例1所述的CNN结合改进频率小波切片变换的心音分类方法中的步骤。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (10)
1.一种CNN结合改进频率小波切片变换和样本熵的心音分类方法,其特征在于,步骤如下:
对获取的心音信号进行预处理,利用隐半马尔克夫模型找到每条心音信号的各个心动周期信号的位置,找到第一心音、第二心音、收缩期、舒张期四个时期,进行每个心动周期信号的截取;
利用改进频率切片小波变换将每个截取到的一维的心动周期信号转换成为二维时频图像;
对获取的心音信号分别计算样本熵,并与预设样本熵阈值进行比对,当心音信号的样本熵大于预设样本熵阈值时,利用第一卷积神经网络根据二维时频图像进行网络训练和分类,否则,利用第二卷积神经网络根据二维时频图像进行网络训练和分类。
2.如权利要求1所述的CNN结合改进频率小波切片变换的心音分类方法,其特征在于,所述心音信号包括多条健康人心音信号和多条病人心音信号,来自不同年份的多个不同的数据库,对获取到的心音信号进行重采样统一到预设频率;
或者,所述隐半马尔克夫模型利用四种包络,包括同态包络、希尔伯特包络、小波包络和功率谱密度包络,上述包络序列通过隐半马尔克夫模型找到每个时间点在第一心音、收缩期、第二心音和舒张期的可能性,以上述可能性作为特征,通过逻辑回归模型进行判断,进而确定心音信号的四个分期;
或者,所述改进频率切片小波变换的时域步长设置为50,生成时频图像的大小为73*50;
或者,第一卷积神经网络的第一卷积层包括30个16*9大小的卷积核,第二卷积神经网络的第一卷积层包括28个12*9的卷积核。
3.如权利要求1所述的CNN结合改进频率小波切片变换的心音分类方法,其特征在于,利用每个心动周期信号的有效时长进行心动周期信号的截取,有效时长的计算公式具体为:
Useful durationi=η1*Diastolei-1+S1i+Systolei+S2i+η2*Diastolei
其中,Useful durationi表示某个心音记录中第i个有效时长,S1i、Systolei、S2i和Diastolei分别表示第i个心动周期的S1期、收缩期、S2期和舒张期,Diastolei-1表示第i-1个心动周期中的舒张期,η1和η2表示两个系数,表示包含舒张期的百分比。
4.如权利要求3所述的CNN结合改进频率小波切片变换的心音分类方法,其特征在于,所述有效时长包括第i个心动周期的舒张期和第i-1个心动周期的舒张期,使得有效时长中包括全部的S1期和S2期。
5.如权利要求1所述的CNN结合改进频率小波切片变换的心音分类方法,其特征在于,所述第一卷积神经网络和第二卷积神经网络均为十二层的神经网络,均包括两个卷积层,两个激励层,一个最大池化层,一个损失层,三个全连接层和输入输出层,两个卷积神经网络的第一卷积层核大小和核数量不同。
6.如权利要求1所述的CNN结合改进频率小波切片变换的心音分类方法,其特征在于,预设样本熵阈值的获取方法,具体为:
将获取到的所有的心音信号等分为多个部分,设置多个样本熵候选阈值,每两个相邻的样本熵候选阈值间的数据量一致;
针对不同的样本熵候选阈值进行两个卷积神经网络模型的训练和分类,选取精确度度量和精确度最大时的样本熵候选阈值为最终的预设样本熵阈值。
7.如权利要求6所述的CNN结合改进频率小波切片变换的心音分类方法,其特征在于,对于不同时间标准的心音信号数据进行十折交叉验证,每次验证时计算精确度度量和精确度,根据十折交叉验证最终得到的精确度度量和精确度的平均值确定预设样本阈值。
8.一种CNN结合改进频率小波切片变换的心音分类系统,其特征在于,包括:
预处理模块,被配置为:对获取的心音信号进行预处理,利用隐半马尔克夫模型找到每条心音信号的各个心动周期信号的位置,进行每个心动周期信号的截取,并找到第一心音、第二心音、收缩期、舒张期四个时期;
数据转换模块,被配置为:利用改进频率切片小波变换将每个截取到的一维的心动周期信号转换成为二维时频图像;
网络训练和分类模块,被配置为:对获取的心音信号分别计算样本熵,并与预设样本熵阈值进行比对,当心音信号的样本熵大于预设样本熵阈值时,利用第一卷积神经网络根据二维时频图像进行网络训练和分类,否则,利用第二卷积神经网络根据二维时频图像进行网络训练和分类。
9.一种介质,其上存储有程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的CNN结合改进频率小波切片变换的心音分类方法中的步骤。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一项所述的CNN结合改进频率小波切片变换的心音分类方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911142557.8A CN111368627B (zh) | 2019-11-20 | 2019-11-20 | Cnn结合改进频率小波切片变换的心音分类方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911142557.8A CN111368627B (zh) | 2019-11-20 | 2019-11-20 | Cnn结合改进频率小波切片变换的心音分类方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111368627A CN111368627A (zh) | 2020-07-03 |
CN111368627B true CN111368627B (zh) | 2023-08-22 |
Family
ID=71207958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911142557.8A Active CN111368627B (zh) | 2019-11-20 | 2019-11-20 | Cnn结合改进频率小波切片变换的心音分类方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111368627B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112282739B (zh) * | 2020-11-18 | 2024-04-30 | 中国石油天然气集团有限公司 | 一种随钻井径测量中的岩屑散射体识别方法 |
CN112704503B (zh) * | 2021-01-15 | 2022-08-30 | 苏州大学 | 心电信号噪声处理方法 |
CN113116300A (zh) * | 2021-03-12 | 2021-07-16 | 复旦大学 | 一种基于模型融合的生理信号分类方法 |
CN113076846B (zh) * | 2021-03-26 | 2022-09-02 | 山东大学 | 心音分类识别方法及系统 |
CN113361385B (zh) * | 2021-06-03 | 2022-06-21 | 山东大学 | 心音分类方法及系统、可读存储介质、电子设备 |
CN113345471B (zh) * | 2021-08-02 | 2021-11-02 | 深圳市医友天下科技有限公司 | 基于人工智能心音识别方法、终端和可读存储介质 |
CN116584902B (zh) * | 2023-07-18 | 2024-05-07 | 山东大学 | 基于特征选优及可视化的心音分类装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109893118A (zh) * | 2019-03-05 | 2019-06-18 | 武汉大学 | 一种基于深度学习的心电信号分类诊断方法 |
CN109961017A (zh) * | 2019-02-26 | 2019-07-02 | 杭州电子科技大学 | 一种基于卷积循环神经网络的心音信号分类方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201244691A (en) * | 2011-05-10 | 2012-11-16 | Ind Tech Res Inst | Heart sound signal/heart disease or cardiopathy distinguishing system and method |
-
2019
- 2019-11-20 CN CN201911142557.8A patent/CN111368627B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109961017A (zh) * | 2019-02-26 | 2019-07-02 | 杭州电子科技大学 | 一种基于卷积循环神经网络的心音信号分类方法 |
CN109893118A (zh) * | 2019-03-05 | 2019-06-18 | 武汉大学 | 一种基于深度学习的心电信号分类诊断方法 |
Non-Patent Citations (1)
Title |
---|
An ampermetric glocose biosensor based on a screen-printed electrode and Os-complex mediator for flow injection analysis;Liu,J,et al;Measurement;第44卷(第10期);1878-1883 * |
Also Published As
Publication number | Publication date |
---|---|
CN111368627A (zh) | 2020-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111368627B (zh) | Cnn结合改进频率小波切片变换的心音分类方法及系统 | |
Li et al. | Classification of ECG signals based on 1D convolution neural network | |
Tschannen et al. | Heart sound classification using deep structured features | |
Kao et al. | Automatic phonocardiograph signal analysis for detecting heart valve disorders | |
EP3608918A1 (en) | Parallel implementation of deep neural networks for classifying heart sound signals | |
Dokur et al. | Heart sound classification using wavelet transform and incremental self-organizing map | |
Gupta et al. | Neural network classification of homomorphic segmented heart sounds | |
Ahmad et al. | An efficient heart murmur recognition and cardiovascular disorders classification system | |
Alqudah | Towards classifying non-segmented heart sound records using instantaneous frequency based features | |
Quiceno-Manrique et al. | Selection of dynamic features based on time–frequency representations for heart murmur detection from phonocardiographic signals | |
Pedrosa et al. | Automatic heart sound segmentation and murmur detection in pediatric phonocardiograms | |
Sengur | Support vector machine ensembles for intelligent diagnosis of valvular heart disease | |
Vepa | Classification of heart murmurs using cepstral features and support vector machines | |
Tang et al. | Classification of normal/abnormal heart sound recordings based on multi-domain features and back propagation neural network | |
CN110755108A (zh) | 一种基于智能听诊器的心脏声音分类方法、系统、装置及可读存储介质 | |
Nogueira et al. | Classifying heart sounds using images of MFCC and temporal features | |
EP3427669A1 (en) | Method and system for classifying phonocardiogram signal quality | |
Singh et al. | Short unsegmented PCG classification based on ensemble classifier | |
Banerjee et al. | Multi-class heart sounds classification using 2D-convolutional neural network | |
Al-Assaf | Surface myoelectric signal analysis: dynamic approaches for change detection and classification | |
Prakash et al. | A system for automatic cardiac arrhythmia recognition using electrocardiogram signal | |
CN115486865A (zh) | 一种基于卷积循环神经网络的心音分类方法 | |
Mustafa et al. | Detection of heartbeat sounds arrhythmia using automatic spectral methods and cardiac auscultatory | |
KR101252060B1 (ko) | 은닉 마코프 모델과 심잡음 로그우도를 결합한 심장질환 진단 장치 | |
CN112185545B (zh) | 一种心音段完整性判断模型及心音自适应分段方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |