一种基于LRF-ELM和BLSTM的心电信号分类方法及系统
技术领域
本公开涉及心电信号分类技术领域,特别涉及一种基于LRF-ELM和BLSTM的心电信号分类方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术,并不必然构成现有技术。
心电图是医院利用心电图机连接体表测量人体心脏跳动所产生的电活动并在图像上反映出来的一项技术。一次完整的心跳活动主要包括P波、QRS波和T波。由于心肌细胞膜内外具有电位差,当心肌细胞从心内膜向心外膜顺序除极时,阳离子由膜外进入膜内,使膜内电位由负变正,即产生P波和心室的QRS波;在复极过程中,阳离子又由膜内进入膜外,使膜内电位由正变负,此时产生T波。心电图可以精确地捕捉到人体心脏活动所产生地电信号,因此对能够通过心电图诊断出部分心脏疾病,如心律失常等。近些年来,心电图已经成为临床医生诊断心血管疾病和分析病理不可缺少的工具。因此,对心电信号的识别分类研究无论在计算机领域还是生物医学领域都受到了极大的关注。
在近年来的文献中,对心电信号的识别分类研究主要分为两个方面。第一个分支是首先手工提取心电信号的特征,如统计学特征、形态学特征、时域特征和基于频率的特征等,并以提取的特征向量作为分类器的输入;随着深度学习的快速发展,也有很多专家学者提出了利用深度学习对心电图进行识别的新方法,凭借着其卓越的学习及泛化能力,深度学习已经迅速发展成为心电图智能诊断领域的另一重要分支。
本公开发明人发现,目前对心电信号的识别研究存在如下问题:(1)手工提取特征需要一定的经验知识,人为干预多,容易造成数据丢失等问题;(2)心电数据集往往数据量大,使用单一的深度学习算法内存消耗大,对计算机的硬件配置要求高;(3)基于计算密集型的深度学习方法,计算复杂,运算量大;(4)大多深度学习算法需要通过迭代对参数进行调优,不合适的参数选择会影响提取特征的准确性,进而影响分类效果。因此,利用深度学习进行特征提取时往往需要很长的训练时间。
发明内容
为了解决现有技术的不足,本公开提供了一种基于LRF-ELM和BLSTM的心电信号分类方法及系统,同时考虑了心电信号的时间信息和空间信息,既能够高效快速的提取信号特征,又保证了良好的分类识别性能。
为了实现上述目的,本公开采用如下技术方案:
本公开第一方面提供了一种基于LRF-ELM和BLSTM的心电信号分类方法。
一种基于LRF-ELM(局部感受野的超限学习机)和BLSTM(双向长短期记忆网络)的心电信号分类方法,步骤如下,
获取心电信号数据并进行预处理,得到数据集,以数据集中的心电信号数据为神经网络的输入数据;
以LRF-ELM网络为特征提取器,学习心电信号数据中的空间信息,通过三个堆叠的随机卷积和池化过程,提取心电信号数据中不同维度的特征数据;
将提取到的特征数据经过融合后作为序列学习阶段的输入,采用深度BLSTM网络进行序列学习,并最终输出心电信号分类结果。
作为可能的一些实现方式,所述心电信号数据的预处理方法为进行归一化处理,具体为:
其中,x表示输入样本点,xmax和xmin分别表示样本数据的最大值和最小值。
作为可能的一些实现方式,所述神经网络的第一层为输入层,第二层到底七层分别为:第一随机卷积层、第一池化层、第二随机卷积层、第二池化层、第三随机卷积层和第三池化层。
作为进一步的限定,所述第一随机卷积层包含4个随机滤波器,卷积核大小为17×1,步长为1,参数根据概率分布随机确定,不使用激励函数;
进一步的,所述第二卷积层包含8个随机滤波器,卷积核大小为6×1,步长为1,参数根据概率分布随机确定,不使用激励函数;
进一步的,所述第三卷积层包含3个随机滤波器,卷积核大小为5×1,步长为1,参数根据概率分布随机确定,不使用激励函数;
进一步的,所述第一池化层、第二池化层和第三池化层的池化窗大小均为2,均采用最大化池化方法。
作为更进一步的限定,所述神经网络的第八层为Flatten层,用于将提取到的特征经过融合后作为序列学习阶段的输入。
作为更进一步的限定,所述神经网络的第九层和第十层均为BLSTM层,所述BLSTM层为双向LSTM层,即可以看作两个不同的LSTM层,其输入心电图信号的顺序相反,从初始时间到结束时间和从结束时间到初始时间的心电图信号值分别作为输入数据进入相应的、两个不同的LSTM层,对其参数进行训练学习;
进一步的,两个BLSTM层均包含78个记忆单元,每个记忆单元至少包括输入门、忘记门和输出门;
进一步的,所述输入门控制将新信息的哪些部分保存到单元格状态,所述遗忘门确定历史单元格状态的保留信息,所述输出门控制将更新的单元格状态的哪些部分导出;
进一步的,第十层的BLSTM网络经过Flatten层和全连接层后通过输出层输出多类心电信号的标签。
作为更进一步的限定,在序列学习阶段引入随机失活方法,在BLSTM前向训练阶段,随机失活的值为0.1,在BLSTM反向训练阶段,随机失活的值为0.2。
作为可能的一些实现方式,所述神经网络训练时分别采用随机梯度下降算法、Adam算法、RMSProp算法、Adagrad算法、Adadelta算法、Adamax算法等中的任意一种,并择优选择。
作为可能的一些实现方式,迭代epochs可根据经验人为的进行设定,例如100,即当在训练集上迭代100后终止训练。
作为可能的一些实现方式,如果输入的心电信号采样频率不同,则通过重采样技术将其变化为相同的采样频率,再通过带通滤波器进行滤波,以使输入到神经网络中的测试心电图信号的参数与训练时采用的心电信号参数保持一致。
作为可能的一些实现方式,由于数据集样本数目过大,为防止计算机内存不足,采用分批次训练的方法,批次数目人为的设定,例如20,即表示每次对20个样本进行训练,训练完成后再输入新的20个样本。
本公开第二方面提供了一种基于LRF-ELM和BLSTM的心电信号分类系统。
一种基于LRF-ELM和BLSTM的心电信号分类系统,包括:
预处理模块,被配置为:获取心电信号数据并进行预处理,得到数据集,以数据集中的心电信号数据为神经网络的输入数据;
特征提取模块,被配置为:以LRF-ELM网络为特征提取器,学习心电信号数据中的空间信息,通过三个堆叠的随机卷积和池化过程,提取心电信号数据中不同维度的特征;
序列学习模块,被配置为:将提取到的特征经过融合后作为序列学习阶段的输入,采用深度BLSTM网络进行序列学习,并最终输出心电信号分类结果。
本公开第三方面提供了一种介质,其上存储有程序,该程序被处理器执行时实现如本公开所述的基于LRF-ELM和BLSTM的心电信号分类方法中的步骤。
本公开第四方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开所述的基于LRF-ELM和BLSTM的心电信号分类方法中的步骤。
与现有技术相比,本公开的有益效果是:
1、本公开所述的分类方法能够充分考虑数据的时间信息和空间信息,自动、快速的提取心电信号特征并进行分类,其容易实现,内存消耗少,预测精度高。
2、本公开所述的分类方法通过LRF-ELM和BLSTM结合的方式,同时考虑了心电信号的时间信息和空间信息,既能够高效快速的提取信号特征,又保证了良好的分类识别性能。
3、本公开所述的内容在序列学习阶段引入dropout,在BLSTM前向训练阶段,dropout值为0.1,在BLSTM反向训练阶段,dropout值为0.2,从而防止了神经网络方法中容易出现过拟合地问题。
4、本公开所述的内容通过对采集到的心电信号数据的预处理,从而使得输入到神经网络中的测试心电图信号的参数与训练时采用的心电信号参数保持一致。
5、本公开所述的内容采用分批次训练的方法,防止了因为数据集样本数目过大所带来的计算机内存不足,保证了数据处理的流畅性。
附图说明
图1为本公开实施例1中的LRF-ELM的流程示意图。
图2为本公开实施例1中的BLSTM网络中一个代表性的记忆单元示意图。
图3为本公开实施例1中的循环神经网络的结构示意图。
图4为本公开实施例1中的基于LRF-ELM和BLSTM的心电信号分类方法示意图。
图5为本公开实施例1中的部分原始心电图信号经过深度LRF-ELM提取出的特征信号示意图。
图6为本公开实施例1中的引入dropout和未引入dropout时损失函数地收敛曲线。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例1:
如图1-6所示,本公开实施例1提供了一种基于LRF-ELM和BLSTM的心电信号分类方法,步骤如下,
获取心电信号数据并进行预处理,得到数据集,以数据集中的心电信号数据为神经网络的输入数据;
以LRF-ELM网络为特征提取器,学习心电信号数据中的空间信息,通过三个堆叠的随机卷积和池化过程,提取心电信号数据中不同维度的特征数据;
将提取到的特征数据经过融合后作为序列学习阶段的输入,采用深度BLSTM网络进行序列学习,并最终输出心电信号分类结果。
本实施例在MIT-BIH数据集上对其性能进行验证,在本实施例中,首先对数据集的99863个样本进行划分,按照4:1的比例将数据集中的每类样本分为训练集和测试集,其中训练集和测试集中每类样本数目如表1所示。
表1心跳种类及样本数目
本实施例所述的分类方法主要包括两个阶段:特征提取阶段和序列学习阶段。将LRF-ELM作为一个快速特征提取器,能够学习原始心电信号的空间信息。首先通过三个堆叠的随机卷积和池化过程,提取信号数据不同维度的特征,这些特征经过Flatten层进行融合并作为序列学习阶段的输入,该阶段通过一个深度BLSTM网络实现。
BLSTM充分考虑了信号序列的时间关联特征,在解决长期依赖问题上展现出极佳的优势。所提出的基于LRF-ELM和BLSTM的心电图识别方法的每层结构为:
(1)第一层为输入层。设有单导联心电图数据X:X=[x1,x2,xm],m表示样本点数目。对X进行归一化处理,并将归一化后的数据作为所提出的基于LRF-ELM和BLSTM的心电图识别方法的输入。
归一化方法为:
其中,x表示输入样本点,xmax,xmin分别表示样本数据的最大值和最小值。
(2)第二层为随机卷积层,包含4个随机滤波器,卷积核大小为17×1,步长为1,参数根据一定的概率分布随机确定,不使用激励函数;
(3)第三层为池化层,池化窗大小为2,采用最大化池化方法;
(4)第四层为随机卷积层,包含8个随机滤波器,卷积核大小为6×1,步长为1,参数根据一定的概率分布随机确定,不使用激励函数;
(5)第五层为池化层,池化窗大小为2,采用最大化池化;
(6)第六层为随机卷积层,包含3个随机滤波器,卷积核大小为5×1,步长为1,参数根据一定的概率分布随机确定,不使用激励函数;
(7)第七层为池化层,池化窗大小为2,采用最大化池化方法;
(8)第八层为Flatten层;
(9)第九层为BLSTM层,包含78个记忆单元;每个记忆单元主要包括三个门结构:输入门,忘记门,输出门。输入门控制将新信息的哪些部分保存到单元格状态,遗忘门确定历史单元格状态的保留信息,输出门控制将更新的单元格状态的哪些部分导出。
其中,W和b是权重矩阵和偏差向量,Ct分别代表t时间的遗忘门、输入门、输出门和细胞状态的输出,σ表示logistic sigmoid函数,表示Hadamard乘积。BLSTM分别将输入设置为时间由初始时间到结束时间以及由结束时间到初始时间的心电图信号值,训练两个不同的LSTM网络。
(10)第十层为BLSTM,包含78个记忆单元,该层的输入为第九层的输出。每个记忆单元的结构与第九层结构基本一致;
(11)第十一层为Flatten层;
(12)第十二层为全连接层,激活函数设置为Softmax函数,公式为:
其中,j=1,…,N;
(13)第十三层为输出层,输出的为五类心电信号的标签。
在大部分神经网络方法中,容易出现过拟合的问题,为了解决这一问题,本实施例在序列学习阶段引入dropout,在BLSTM前向训练阶段,dropout值为0.1,在BLSTM反向训练阶段,dropout值为0.2。
本实施例所述的神经网络在训练时分别采用随机梯度下降算法、Adam算法、RMSProp算法、Adagrad算法、Adadelta算法、Adamax算法等中的任意一种,并择优选择。
迭代epochs可根据经验人为的进行设定,例如100,即当在训练集上迭代100后终止训练。
如果输入的ECG信号采样频率不同,则需要通过一定的重采样技术将其变化为相同的采样频率,并且还需要通过带通滤波器进行滤波,以使输入到基于LRF-ELM和BLSTM的心电图识别方法中的测试心电图信号的参数与训练时采用的心电信号参数保持一致。
由于数据集样本数目过大,为防止计算机内存不足,可以采用分批次训练的方法。批次数目人为的设定,例如20,即表示每次对20个样本进行训练,训练完成后再输入新的20个样本。
本实施例同时考虑了心电信号的时间信息和空间信息,既保证了特征提取阶段的高效快速,又能够达到良好的分类性能。
实施例2:
本公开实施例2提供了一种基于LRF-ELM和BLSTM的心电信号分类系统,利用实施例1所述的基于LRF-ELM和BLSTM的心电信号分类方法,包括:
预处理模块,被配置为:获取心电信号数据并进行预处理,得到数据集,以数据集中的心电信号数据为神经网络的输入数据;
特征提取模块,被配置为:以LRF-ELM网络为特征提取器,学习心电信号数据中的空间信息,通过三个堆叠的随机卷积和池化过程,提取心电信号数据中不同维度的特征;
序列学习模块,被配置为:将提取到的特征经过融合后作为序列学习阶段的输入,采用深度BLSTM网络进行序列学习,并最终输出心电信号分类结果。
实施例3:
本公开实施例3提供了一种介质,其上存储有程序,该程序被处理器执行时实现如本公开实施例1所述的基于LRF-ELM和BLSTM的心电信号分类方法中的步骤。
实施例4:
本公开实施例4提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开实施例1所述的基于LRF-ELM和BLSTM的心电信号分类方法中的步骤。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。