CN113080993A - 一种基于改进多基分类器集成的自动心律失常分析方法 - Google Patents

一种基于改进多基分类器集成的自动心律失常分析方法 Download PDF

Info

Publication number
CN113080993A
CN113080993A CN202110343071.1A CN202110343071A CN113080993A CN 113080993 A CN113080993 A CN 113080993A CN 202110343071 A CN202110343071 A CN 202110343071A CN 113080993 A CN113080993 A CN 113080993A
Authority
CN
China
Prior art keywords
classification
data
arrhythmia
training
xgboost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110343071.1A
Other languages
English (en)
Other versions
CN113080993B (zh
Inventor
张蓝天
吴松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xindong Weishi Technology Co ltd
Original Assignee
Beijing Xindong Weishi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xindong Weishi Technology Co ltd filed Critical Beijing Xindong Weishi Technology Co ltd
Priority to CN202110343071.1A priority Critical patent/CN113080993B/zh
Publication of CN113080993A publication Critical patent/CN113080993A/zh
Application granted granted Critical
Publication of CN113080993B publication Critical patent/CN113080993B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种基于改进多基分类器集成的自动心律失常分析方法,包括以下步骤:预处理模块,包括心电信号降噪、心拍识别及截取;分类模块,包括用以对心电图数据进行心律失常自动分类的XGBoost分类模块、GBDT分类模块、BiGRU分类模块;融合模块,用以依据模型集成规则—Stacking,将分类模块产生的第一分类结果、第二分类结果及第三分类结果进行集成,得到集成数据;然后利用浅层神经网络对心律失常集成数据进行分类,得到最终的心率失常分类融合结果。如此,本发明将XGBoost、GBDT、BiGRU三种基分类器的分类结果利用Stacking集成规则进行融合,采用机器学习模型与深度学习模型相结合的方法,提升了心律失常整体分类性能及准确率。

Description

一种基于改进多基分类器集成的自动心律失常分析方法
技术领域
本发明涉及医学信号处理技术领域,具体为一种基于改进多基分类器集成的自动心律失常分析方法。
背景技术
心律指心跳的节奏。正常人的心脏跳动频率每分钟约为60~100次,并且健康的心律应该是十分均匀的,心脏病或心脏神经调节功能不正常时,可出现心律不齐或心律失常。心律失常是心血管疾病常见且最为严重的病症之一,可导致患者突然死亡,严重威胁人类健康。
如今,随着人工智能技术的发展,智能辅助诊断系统因其快速、可靠的特点已成为最具前景的临床诊断解决方案。由于心电远程监护技术的迅速发展和普及,以及当下可穿戴设备的流行我们可以很容易地得到病人的心电信号以及其他生理特征。传统上,医生可以通过观察心电信号中蕴含的信息来判断病人是否患心律失常,然而仅通过观察变化微弱的心电信号来推断病人状态的过程是费力的,并且容易因复杂的心电变化而产生错误的判断。因此,利用计算机来进行智能辅助的诊断系统可以克服对心电信号的评估限制,从而更好的辅助医生对病人心律失常的患病情况进行推断。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于改进多基分类器集成的自动心律失常分析方法,提升心律失常的检测效果。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种基于改进多基分类器集成的自动心律失常分析方法,包括以下步骤:
S1:数据预处理,读入12导联的心电信号的数据,采用小波变换滤除原始心电信号中的工频干扰,采用巴特沃斯带阻滤波器滤除肌电干扰,采用中值滤波滤除原始心电信号中的基线漂移;
S2:心拍数据提取,通过小波变换检测R波位置,进而对R波前后数据点进行固定长度截取,从而完成对心拍数据提取;
S3:基分类器模型构建,包括用以对心电图数据进行心律失常自动分类的XGBoost分类模块、GBDT分类模块、BiGRU分类模块;其中,XGBoost作为第一基分类模块、GBDT作为第二基分类模块、GRU作为第三基分类模块,通过对训练数据进行K折交叉的划分,使得XGBoost输出K个第一分类结果,GBDT输出K个第二分类结果,BiGRU输出K个第三分类结果;
S4:模型融合,依据模型集成规则—Stacking,将分类模块产生的第一分类结果、第二分类结果及第三分类结果进行集成,得到集成数据,然后搭建好浅层神经网络以对心律失常集成数据进行分类;
S5:训练模型参数,初始化所述集成模型的参数,将构建好的数据集拆分为训练集和测试集;利用训练集样本对集成模型进行训练,生成所述集成模型的参数并保存;
S6:模型预测,对测试集样本进行自动识别,获得心律失常的二分类结果。
优选的,步骤S2具体包括:
读取降噪后12导联的心电信号数据,对每个导联心电信号根据同一时刻R波峰值处的位置固定向前截取200个样本点,向后截取400个样本点,使得每个导联的每个心拍固定截取600个点的数据,对相同时刻R波顶点每个导联所截取的600个点的心电信号进行行级上的拼接,此时原始每个心拍的心电信号的数据形成12*600维的样本,作为基分类模型的输入数据X。
优选的,步骤S3具体包括:
XGBoost分类模块,其作为第一分类模快,通过对训练数据进行3折交叉的划分,使得XGBoost输出3个第一分类结果,其中,对每个心电样本的预测表示为:
Figure BDA0002999840060000031
其中xi∈R12*600是第i个心电训练样本,fk表示第k棵树,
Figure BDA0002999840060000032
表示样本xi的预测结果。在建模过程中不断优化目标函数,使其最小,表示为:
Figure BDA0002999840060000033
其中
Figure BDA0002999840060000034
是样本训练误差,Ω(fi)是树的正则项,XGBoost通过将Objt使用二阶泰勒公式展开得:
Figure BDA0002999840060000035
其中,gi、hi表示在第i个样本下泰勒展开式的一阶导数、二阶导数,通过公式8可以得到Objt关于wj的一元二次方程,由此找到使Objt取值最小的wj,表示为:
Figure BDA0002999840060000036
其中,Gj=∑gi;Hj=∑hi,通过上述步骤完成第t棵树的建立,从而完成XGBoost模型的构建,并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 XGBoost、A2 XGBoost、A3 XGBoost和对应的针对测试集的预测结果B1 XGBoost、B2 XGBoost、B3 XGBoost
GBDT分类模块,其作为第二分类模块,通过对训练数据进行3折交叉的划分,使得GBDT输出3个第二分类结果,表示为:
使用负二项对数似然作为损失函数,表示为:
L(y,F)=ylog(P(y=1|x))+(1-y)log(1-P(y=1|x)),y∈{0,1} (5)
计算第m-1棵树的预测函数的当前梯度值:
Figure BDA0002999840060000041
其中Fm-1(x)是第m-1棵树的预测函数,xi∈R12*600是第i个训练集心电样本,y~i为第i个样本的预测分类概率值,
将回归树作为基学习器,进行线性搜索以得到最优叶子节点值,使用Ne wton-Raphson近似:
Figure BDA0002999840060000042
其中Rm,j为第m棵树对应的叶子结点区域,第m棵树的预测概率函数如下:
Figure BDA0002999840060000043
Fm(x)为第m棵树的预测概率函数,预测样本的正分类概率为:
Figure BDA0002999840060000044
通过上述步骤完成第m棵树的建立,从而完成GBDT模型的构建,并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 GBDT、A2 GBDT、A3 GBDT和对应的针对测试集的预测结果B1 GBDT、B2 GBDT、B3 GBDT
BiGRU分类模块,其作为第三分类模块,通过对训练数据进行3折交叉的划分,使得BiGRU输出3个第三分类结果,具体的,所BiGRU深度神经网络采用的公式如下:
zt=σ(Wz·[ht-1,xt]) (10)
rt=σ(Wr·[ht-1,xt]) (11)
Figure BDA0002999840060000051
Figure BDA0002999840060000052
所述公式10-13中:
ht-1表示上一个神经元的输出;xt表示本次神经元的输入;Wz表示更新门的权重;σ表示sigmoid函数;zt表示更新门;rt表示重置门;wr表示重置门的权重;
Figure BDA0002999840060000053
表示当前神经元的候选输出值;w表示输出状态的权重,tanh表示双曲正切函数;表示本次神经元的输出值,采用上述公式1-4分别计算t时刻BiGRU所对应的前向隐层状态ht,和反向隐层状态ht',然后对ht和ht'加权求和得到t时刻的隐层状态ht”,表示为:
ht”=wtht+vtht'+bj (14)
其中,wt、vt分别表示t时刻ht、ht'对应的权重,bj表示待训练的偏置,最后计算心律失常二分类结果,表示为:
Figure BDA0002999840060000054
其中,
Figure BDA0002999840060000055
表示为输出的心律失常预测概率,wi表示为待训练的权重系数矩阵。过上述步骤完成BiGRU模型的构建,并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 BiGRU、A2 BiGRU、A3 BiGRU和对应的针对测试集的预测结果B1 BiGRU、B2 BiGRU、B3 BiGRU
优选的,步骤S4,包括:
依据模型集成规则—Stacking,将各个分类模块产生的针对训练集上的第一分类结果、第二分类结果及第三分类结果进行行级别上的联结,得到集成数据,表示为:
XI=[A1 I,A2 I,A3 I]∈R1,I={XGBoost,GBDT,BiLSTM} (15)
然后对三个分类模块预测结果的行级拼接数据进行列级别上的再次拼接,作为三个数据特征,表示为:
X′=[XXGBoost,XGBDT,XBiLSTM]∈R3 (16)
再把上述得到的三个数据特征,拼接真实的心律失常标签,作为之后的浅层神经网络的输入,表示为:
Figure BDA0002999840060000061
其中,
Figure BDA0002999840060000062
为拼接后的样本数据,负责训练之后的融合模型,Y是训练集样本对应的真实标签;
然后搭建好浅层神经网络以对心律失常集成数据进行分类,其中浅层神经网络模块为3层全连接神经网络,输入的数据为
Figure BDA0002999840060000063
输入3维X数据到3层全连接神经网络中;
第一个全连接层单元的神经元个数为5个,全连接层单元后的激励单元为Relu函数,经过第一层全连接层单元后的特征图维度为5;
第二个全连接层单元的神经元个数为5个,全连接层单元后的激励单元为Relu函数,经过第一层全连接层单元后的特征图维度为5;
第三个全连接层单元的神经元个数为1个,全连接层单元后的激励单元为Sigmoid函数,经过第一层全连接层单元后的特征图维度为1;
所述全连接神经网络采用的公式如下:
Figure BDA0002999840060000071
其中al是第l-1层的输出,al-1,bl-1,Wl-1,f是第l-1层的激活值、偏置、权重和激活函数。
将12导联信号进行上述集成模型的操作后,输出心律失常的预测结果,输出结果的最终表示为:
Figure BDA0002999840060000072
其中,a3,b3,W3,f是第三层神经网络的输入特征、偏置、权重和激活函数。
优选的,步骤S5具体包括:
初始化所述宽深神经网络的参数,将构建好的数据集随机抽取70%数目的样本当作训练集,其他30%的样本视为测试集;利用三个基分类器,对训练集中的样本继续进行3折交叉验证,并将验证的结果作为融合模块的输入,训练融合模块。每迭代一次更新一次训练参数,直至最后三个基模型及最终的集成模型的损失函数稳定在某一数值附近,停止训练并保存当前网络的训练参数和模型结构信息。
优选的,步骤S6具体包括:将测试集样本输入到已训练好的集成模型中,进行自动识别,获得心律失常的二分类预测结果。
(三)有益效果
本发明提供了一种基于改进多基分类器集成的自动心律失常分析方法。具备以下有益效果:
本发明提出了基于改进多基分类器集成的自动心律失常分类方法,适用于临床上辅助医生进行心律失常的检测。传统的心律失常的检测方法仅仅利用了单一的检测模型,并没有利用Stacking策略集成其他模型一同进行检测,本发明提出的方法基于基于改进多基分类器集成的检测模型,通过对病人心电信号特征进行提取,缓解了心律失常检测难度,使得检测过程中可以利用诸多模型的优势,从而让心律失常检测变得更加准确。
附图说明
图1为基于改进多基分类器集成及诊断规则的自动心律失常分类系统及方法的总体示意图;
图2为Stacking模型集成策略原理示意图;
图3为浅层神经网络示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-3,本发明提供一种技术方案:如附图1所示,一种基于改进多基分类器集成及诊断规则的自动心律失常分类系统及方法,包括以下步骤:
S1:数据预处理,读入12导联的心电信号的数据,采用小波变换滤除原始心电信号中的工频干扰,采用巴特沃斯带阻滤波器滤除肌电干扰,采用中值滤波滤除原始心电信号中的基线漂移;
S2:心拍数据提取,读取降噪后12导联的心电信号数据,对每个导联心电信号根据同一时刻R波峰值处的位置固定向前截取200个样本点,向后截取400个样本点,使得每个导联的每个心拍固定截取600个点的数据,对相同时刻R波顶点每个导联所截取的600个点的心电信号进行行级上的拼接,此时原始每个心拍的心电信号的数据形成12*600维的样本,作为宽深神经网络模型的输入数据X;
S3:基分类器模型构建,XGBoost分类模块,其作为第一分类模快,通过对训练数据进行3折交叉的划分,使得XGBoost输出3个第一分类结果。其中,对每个心电样本的预测表示为:
Figure BDA0002999840060000091
其中xi∈R12*600是第i个心电训练样本,fk表示第k棵树,
Figure BDA0002999840060000092
表示样本xi的预测结果。在建模过程中不断优化目标函数,使其最小,表示为:
Figure BDA0002999840060000093
其中
Figure BDA0002999840060000094
是样本训练误差,Ω(fi)是树的正则项。XGBoost通过将Objt使用二阶泰勒公式展开得:
Figure BDA0002999840060000095
其中,gi、hi表示在第i个样本下泰勒展开式的一阶导数、二阶导数,通过公式8可以得到Objt关于wj的一元二次方程,由此找到使Objt取值最小的wj,表示为:
Figure BDA0002999840060000096
其中,Gj=∑gi;Hj=∑hi,通过上述步骤完成第t棵树的建立,从而完成XGBoost模型的构建。并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 XGBoost、A2 XGBoost、A3 XGBoost和对应的针对测试集的预测结果B1 XGBoost、B2 XGBoost、B3 XGBoost
GBDT分类模块,其作为第二分类模块,通过对训练数据进行3折交叉的划分,使得GBDT输出3个第二分类结果,表示为:
使用负二项对数似然作为损失函数,表示为:
L(y,F)=ylog(P(y=1|x))+(1-y)log(1-P(y=1|x)),y∈{0,1} (5)
计算第m-1棵树的预测函数的当前梯度值:
Figure BDA0002999840060000101
其中Fm-1(x)是第m-1棵树的预测函数,xi∈R12*600是第i个训练集心电样本,
Figure BDA0002999840060000102
为第i个样本的预测分类概率值,
将回归树作为基学习器,进行线性搜索以得到最优叶子节点值,使用Newton-Raphson近似:
Figure BDA0002999840060000103
其中Rm,j为第m棵树对应的叶子结点区域,第m棵树的预测概率函数如下:
Figure BDA0002999840060000104
Fm(x)为第m棵树的预测概率函数,预测样本的正分类概率为:
Figure BDA0002999840060000111
过上述步骤完成第m棵树的建立,从而完成GBDT模型的构建。并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 GBDT、A2 GBDT、A3 GBDT和对应的针对测试集的预测结果B1 GBDT、B2 GBDT、B3 GBDT
BiGRU分类模块,其作为第三分类模块,通过对训练数据进行3折交叉的划分,使得BiGRU输出3个第三分类结果,具体的,所BiGRU深度神经网络采用的公式如下:
zt=σ(Wz·[ht-1,xt]) (10)
rt=σ(Wr·[ht-1,xt]) (11)
Figure BDA0002999840060000112
Figure BDA0002999840060000113
所述公式10-13中:
ht-1表示上一个神经元的输出;xt表示本次神经元的输入;Wz表示更新门的权重;σ表示sigmoid函数;zt表示更新门;rt表示重置门;wr表示重置门的权重;
Figure BDA0002999840060000114
表示当前神经元的候选输出值;w表示输出状态的权重,tanh表示双曲正切函数;表示本次神经元的输出值,采用上述公式1-4分别计算t时刻BiGRU所对应的前向隐层状态ht,和反向隐层状态ht',然后对ht和ht'加权求和得到t时刻的隐层状态ht”,表示为:
ht”=wtht+vtht'+bj (14)
其中,wt、vt分别表示t时刻ht、ht'对应的权重,bj表示待训练的偏置,最后计算心律失常二分类结果,表示为:
Figure BDA0002999840060000121
其中,
Figure BDA0002999840060000122
表示为输出的心律失常预测概率,wi表示为待训练的权重系数矩阵。过上述步骤完成BiGRU模型的构建。并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 BiGRU、A2 BiGRU、A3 BiGRU和对应的针对测试集的预测结果B1 BiGRU、B2 BiGRU、B3 BiGRU
S4:模型融合,依据模型集成规则—Stacking,如附图2,将各个分类模块产生的针对训练集上的第一分类结果、第二分类结果及第三分类结果进行行级别上的联结,得到集成数据,表示为:
XI=[A1 I,A2 I,A3 I]∈R1,I={XGBoost,GBDT,BiLSTM} (15)
然后对三个分类模块预测结果的行级拼接数据进行列级别上的再次拼接,作为三个数据特征,表示为:
X′=[XXGBoost,XGBDT,XBiLSTM]∈R3 (16)
再把上述得到的三个数据特征,拼接真实的心律失常标签,作为之后的浅层神经网络的输入,表示为:
Figure BDA0002999840060000131
其中,
Figure BDA0002999840060000132
为拼接后的样本数据,负责训练之后的融合模型,Y是训练集样本对应的真实标签。
然后搭建好浅层神经网络以对心律失常集成数据进行分类,如附图3,其中浅层神经网络模块为3层全连接神经网络,输入的数据为
Figure BDA0002999840060000133
输入3维X数据到3层全连接神经网络中;
第一个全连接层单元的神经元个数为5个,全连接层单元后的激励单元为Relu函数,经过第一层全连接层单元后的特征图维度为5;
第二个全连接层单元的神经元个数为5个,全连接层单元后的激励单元为Relu函数,经过第一层全连接层单元后的特征图维度为5;
第三个全连接层单元的神经元个数为1个,全连接层单元后的激励单元为Sigmoid函数,经过第一层全连接层单元后的特征图维度为1。
所述全连接神经网络采用的公式如下:
Figure BDA0002999840060000134
其中al是第l-1层的输出,al-1,bl-1,Wl-1,f是第l-1层的激活值、偏置、权重和激活函数。
将12导联信号进行上述集成模型的操作后,输出心律失常的预测结果,输出结果的最终表示为:
Figure BDA0002999840060000135
其中,a3,b3,W3,f是第三层神经网络的输入特征、偏置、权重和激活函数;
S5:训练模型参数,初始化所述宽深神经网络的参数,将构建好的数据集随机抽取70%数目的样本当作训练集,其他30%的样本视为测试集;利用三个基分类器,对训练集中的样本继续进行3折交叉验证,并将验证的结果作为融合模块的输入,训练融合模块。每迭代一次更新一次训练参数,直至最后三个基模型及最终的集成模型的损失函数稳定在某一数值附近,停止训练并保存当前网络的训练参数和模型结构信息;
S6:模型预测,将测试集样本输入到已训练好的集成模型中,进行自动识别,获得心律失常的二分类预测结果。
通过上述方法步骤,本发明实施例具有以下有益效果:
1、本发明实施例改进了现有的单一模型在心律失常检测中的应用方法,适用于在临床上辅助心律失常的检测。传统的心律失常检测方法仅仅利用了单一的检测模型,并没有融合其他模型的有益信息,本发明提出的方法基于Stacking策略,通过对病人心电信号特征进行提取,充分利用三个基分类器模型的优点,缓解了心律失常检测难度,使得算法更贴近临床检测实际,从而让心律失常检测变得更加准确。
2、本发明实施例使用Stacking策略作为模型的融合策略,相对于传统的心律失常检测算法中仅单一检测,可以多角度的得挖掘心电信号特征,将深度学习模型与机器学习模型相结合,对于因心电信号变化复杂而导致准确度达不到临床要求的检测可以提供更为可靠的实施效果。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (6)

1.一种基于改进多基分类器集成的自动心律失常分析方法,其特征在于,包括以下步骤:
S1:数据预处理,读入12导联的心电信号的数据,采用小波变换滤除原始心电信号中的工频干扰,采用巴特沃斯带阻滤波器滤除肌电干扰,采用中值滤波滤除原始心电信号中的基线漂移;
S2:心拍数据提取,通过小波变换检测R波位置,进而对R波前后数据点进行固定长度截取,从而完成对心拍数据提取;
S3:基分类器模型构建,包括用以对心电图数据进行心律失常自动分类的XGBoost分类模块、GBDT分类模块、BiGRU分类模块;其中,XGBoost作为第一基分类模块、GBDT作为第二基分类模块、GRU作为第三基分类模块,通过对训练数据进行K折交叉的划分,使得XGBoost输出K个第一分类结果,GBDT输出K个第二分类结果,BiGRU输出K个第三分类结果;
S4:模型融合,依据模型集成规则—Stacking,将分类模块产生的第一分类结果、第二分类结果及第三分类结果进行集成,得到集成数据,然后搭建好浅层神经网络以对心律失常集成数据进行分类。
S5:训练模型参数,初始化所述集成模型的参数,将构建好的数据集拆分为训练集和测试集;利用训练集样本对集成模型进行训练,生成所述集成模型的参数并保存。
S6:模型预测,对测试集样本进行自动识别,获得心律失常的二分类结果。
2.如权利要求2所述的一种基于改进多基分类器集成的自动心律失常分析方法,其特征在于,步骤S2,具体包括:
读取降噪后12导联的心电信号数据,对每个导联心电信号根据同一时刻R波峰值处的位置固定向前截取200个样本点,向后截取400个样本点,使得每个导联的每个心拍固定截取600个点的数据,对相同时刻R波顶点每个导联所截取的600个点的心电信号进行行级上的拼接,此时原始每个心拍的心电信号的数据形成12*600维的样本,作为基分类模型的输入数据X。
3.如权利要求2所述的一种基于改进多基分类器集成的自动心律失常分析方法,其特征在于,步骤S3,具体包括:
XGBoost分类模块,其作为第一分类模快,通过对训练数据进行3折交叉的划分,使得XGBoost输出3个第一分类结果,其中,对每个心电样本的预测表示为:
Figure FDA0002999840050000021
其中xi∈R12*600是第i个心电训练样本,fk表示第k棵树,
Figure FDA0002999840050000022
表示样本xi的预测结果。在建模过程中不断优化目标函数,使其最小,表示为:
Figure FDA0002999840050000023
其中
Figure FDA0002999840050000024
是样本训练误差,Ω(fi)是树的正则项,XGBoost通过将Objt使用二阶泰勒公式展开得:
Figure FDA0002999840050000025
其中,gi、hi表示在第i个样本下泰勒展开式的一阶导数、二阶导数,通过公式8可以得到Objt关于wj的一元二次方程,由此找到使Objt取值最小的wj,表示为:
Figure FDA0002999840050000026
其中,Gj=∑gi;Hj=∑hi,通过上述步骤完成第t棵树的建立,从而完成XGBoost模型的构建,并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 XGBoost、A2 XGBoost、A3 XGBoost和对应的针对测试集的预测结果B1 XGBoost、B2 XGBoost、B3 XGBoost
GBDT分类模块,其作为第二分类模块,通过对训练数据进行3折交叉的划分,使得GBDT输出3个第二分类结果,表示为:
使用负二项对数似然作为损失函数,表示为:
L(y,F)=ylog(P(y=1|x))+(1-y)log(1-P(y=1|x)),y∈{0,1} (5)
计算第m-1棵树的预测函数的当前梯度值:
Figure FDA0002999840050000031
其中Fm-1(x)是第m-1棵树的预测函数,xi∈R12*600是第i个训练集心电样本,
Figure FDA0002999840050000032
为第i个样本的预测分类概率值,
将回归树作为基学习器,进行线性搜索以得到最优叶子节点值,使用Ne wton-Raphson近似:
Figure FDA0002999840050000033
其中Rm,j为第m棵树对应的叶子结点区域,第m棵树的预测概率函数如下:
Figure FDA0002999840050000034
Fm(x)为第m棵树的预测概率函数,预测样本的正分类概率为:
Figure FDA0002999840050000035
通过上述步骤完成第m棵树的建立,从而完成GBDT模型的构建,并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 GBDT、A2 GBDT、A3 GBDT和对应的针对测试集的预测结果B1 GBDT、B2 GBDT、B3 GBDT
BiGRU分类模块,其作为第三分类模块,通过对训练数据进行3折交叉的划分,使得BiGRU输出3个第三分类结果,具体的,所BiGRU深度神经网络采用的公式如下:
zt=σ(Wz·[ht-1,xt]) (10)
rt=σ(Wr·[ht-1,xt]) (11)
Figure FDA0002999840050000041
Figure FDA0002999840050000042
所述公式10-13中:
ht-1表示上一个神经元的输出;xt表示本次神经元的输入;Wz表示更新门的权重;σ表示sigmoid函数;zt表示更新门;rt表示重置门;wr表示重置门的权重;
Figure FDA0002999840050000043
表示当前神经元的候选输出值;w表示输出状态的权重,tanh表示双曲正切函数;表示本次神经元的输出值,采用上述公式1-4分别计算t时刻BiGRU所对应的前向隐层状态ht,和反向隐层状态ht',然后对ht和ht'加权求和得到t时刻的隐层状态ht”,表示为:
ht”=wtht+vtht'+bj (14)
其中,wt、vt分别表示t时刻ht、ht'对应的权重,bj表示待训练的偏置,最后计算心律失常二分类结果,表示为:
Figure FDA0002999840050000044
其中,
Figure FDA0002999840050000045
表示为输出的心律失常预测概率,wi表示为待训练的权重系数矩阵。过上述步骤完成BiGRU模型的构建,并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 BiGRU、A2 BiGRU、A3 BiGRU和对应的针对测试集的预测结果B1 BiGRU、B2 BiGRU、B3 BiGRU
4.如权利要求2所述的一种基于改进多基分类器集成的自动心律失常分析方法,其特征在于,步骤S4,包括:
依据模型集成规则—Stacking,将各个分类模块产生的针对训练集上的第一分类结果、第二分类结果及第三分类结果进行行级别上的联结,得到集成数据,表示为:
XI=[A1 I,A2 I,A3 I]∈R1,I={XGBoost,GBDT,BiLSTM} (15)
然后对三个分类模块预测结果的行级拼接数据进行列级别上的再次拼接,作为三个数据特征,表示为:
X′=[XXGBoost,XGBDT,XBiLSTM]∈R3 (16)
再把上述得到的三个数据特征,拼接真实的心律失常标签,作为之后的浅层神经网络的输入,表示为:
Figure FDA0002999840050000051
其中,
Figure FDA0002999840050000052
为拼接后的样本数据,负责训练之后的融合模型,Y是训练集样本对应的真实标签;
然后搭建好浅层神经网络以对心律失常集成数据进行分类,其中浅层神经网络模块为3层全连接神经网络,输入的数据为
Figure FDA0002999840050000053
输入3维X数据到3层全连接神经网络中;
第一个全连接层单元的神经元个数为5个,全连接层单元后的激励单元为Relu函数,经过第一层全连接层单元后的特征图维度为5;
第二个全连接层单元的神经元个数为5个,全连接层单元后的激励单元为Relu函数,经过第一层全连接层单元后的特征图维度为5;
第三个全连接层单元的神经元个数为1个,全连接层单元后的激励单元为Sigmoid函数,经过第一层全连接层单元后的特征图维度为1;
所述全连接神经网络采用的公式如下:
Figure FDA0002999840050000061
其中al是第l-1层的输出,al-1,bl-1,Wl-1,f是第l-1层的激活值、偏置、权重和激活函数。
将12导联信号进行上述集成模型的操作后,输出心律失常的预测结果,输出结果的最终表示为:
Figure FDA0002999840050000062
其中,a3,b3,W3,f是第三层神经网络的输入特征、偏置、权重和激活函数。
5.如权利要求2所述的一种基于改进多基分类器集成的自动心律失常分析方法,其特征在于,步骤S5,具体包括:
初始化所述宽深神经网络的参数,将构建好的数据集随机抽取70%数目的样本当作训练集,其他30%的样本视为测试集;利用三个基分类器,对训练集中的样本继续进行3折交叉验证,并将验证的结果作为融合模块的输入,训练融合模块。每迭代一次更新一次训练参数,直至最后三个基模型及最终的集成模型的损失函数稳定在某一数值附近,停止训练并保存当前网络的训练参数和模型结构信息。
6.如权利要求2所述的一种基于改进多基分类器集成的自动心律失常分析方法,其特征在于,步骤S6,具体包括:将测试集样本输入到已训练好的集成模型中,进行自动识别,获得心律失常的二分类预测结果。
CN202110343071.1A 2021-03-30 2021-03-30 一种基于改进多基分类器集成的自动心律失常分析方法 Active CN113080993B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110343071.1A CN113080993B (zh) 2021-03-30 2021-03-30 一种基于改进多基分类器集成的自动心律失常分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110343071.1A CN113080993B (zh) 2021-03-30 2021-03-30 一种基于改进多基分类器集成的自动心律失常分析方法

Publications (2)

Publication Number Publication Date
CN113080993A true CN113080993A (zh) 2021-07-09
CN113080993B CN113080993B (zh) 2023-02-03

Family

ID=76671400

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110343071.1A Active CN113080993B (zh) 2021-03-30 2021-03-30 一种基于改进多基分类器集成的自动心律失常分析方法

Country Status (1)

Country Link
CN (1) CN113080993B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114869259A (zh) * 2022-05-12 2022-08-09 长春理工大学 一种基于GP-XGBoost的非接触式心率测量方法
CN115281662A (zh) * 2022-09-26 2022-11-04 北京科技大学 一种慢性踝关节不稳智能辅助诊断系统
EP4216232A1 (en) * 2022-01-25 2023-07-26 GE Precision Healthcare LLC Methods and system for cardiac arrhythmia prediction using transformer-based neural networks

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110507315A (zh) * 2019-09-26 2019-11-29 杭州电子科技大学 一种高效的心电图诊断系统
CN110881969A (zh) * 2019-11-27 2020-03-17 太原理工大学 一种基于Stacking集成学习的心力衰竭预警方法
CN111192680A (zh) * 2019-12-25 2020-05-22 山东众阳健康科技集团有限公司 一种基于深度学习和集成分类的智能辅助诊断方法
US20200178825A1 (en) * 2018-12-05 2020-06-11 General Electric Company System and method for identifying cardiac arrhythmias with deep neural networks
CN111329469A (zh) * 2020-03-05 2020-06-26 广州天嵌计算机科技有限公司 一种心律异常预测方法
CN111557659A (zh) * 2020-05-22 2020-08-21 郑州大学 基于多特征融合与Stacking-DWKNN的心律失常分类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200178825A1 (en) * 2018-12-05 2020-06-11 General Electric Company System and method for identifying cardiac arrhythmias with deep neural networks
CN110507315A (zh) * 2019-09-26 2019-11-29 杭州电子科技大学 一种高效的心电图诊断系统
CN110881969A (zh) * 2019-11-27 2020-03-17 太原理工大学 一种基于Stacking集成学习的心力衰竭预警方法
CN111192680A (zh) * 2019-12-25 2020-05-22 山东众阳健康科技集团有限公司 一种基于深度学习和集成分类的智能辅助诊断方法
CN111329469A (zh) * 2020-03-05 2020-06-26 广州天嵌计算机科技有限公司 一种心律异常预测方法
CN111557659A (zh) * 2020-05-22 2020-08-21 郑州大学 基于多特征融合与Stacking-DWKNN的心律失常分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王波等: "DB-SMOTE及多层堆叠用于心律失常识别", 《西安电子科技大学学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4216232A1 (en) * 2022-01-25 2023-07-26 GE Precision Healthcare LLC Methods and system for cardiac arrhythmia prediction using transformer-based neural networks
CN114869259A (zh) * 2022-05-12 2022-08-09 长春理工大学 一种基于GP-XGBoost的非接触式心率测量方法
CN115281662A (zh) * 2022-09-26 2022-11-04 北京科技大学 一种慢性踝关节不稳智能辅助诊断系统

Also Published As

Publication number Publication date
CN113080993B (zh) 2023-02-03

Similar Documents

Publication Publication Date Title
Wu et al. A study on arrhythmia via ECG signal classification using the convolutional neural network
Gjoreski et al. Machine learning and end-to-end deep learning for the detection of chronic heart failure from heart sounds
CN111160139B (zh) 心电信号的处理方法、装置及终端设备
Houssein et al. An automatic arrhythmia classification model based on improved marine predators algorithm and convolutions neural networks
CN113080993B (zh) 一种基于改进多基分类器集成的自动心律失常分析方法
Luo et al. Patient-specific deep architectural model for ECG classification
CN109998525B (zh) 一种基于判别式深度置信网络的心律失常自动分类方法
US10426364B2 (en) Automatic method to delineate or categorize an electrocardiogram
Pourbabaee et al. Feature leaning with deep convolutional neural networks for screening patients with paroxysmal atrial fibrillation
Chen et al. Multi-information fusion neural networks for arrhythmia automatic detection
Wang An intelligent computer-aided approach for atrial fibrillation and atrial flutter signals classification using modified bidirectional LSTM network
Wu et al. A novel method for classification of ECG arrhythmias using deep belief networks
Javadi et al. Improving ECG classification accuracy using an ensemble of neural network modules
Luo et al. Multi-classification of arrhythmias using a HCRNet on imbalanced ECG datasets
CN111990989A (zh) 一种基于生成对抗及卷积循环网络的心电信号识别方法
CN110619322A (zh) 一种基于多流态卷积循环神经网络的多导联心电异常信号识别方法及系统
Dhull et al. ECG beat classifiers: a journey from ANN to DNN
CN113095302A (zh) 用于心律失常分类的深度模型、利用该模型的方法及装置
CN115281688A (zh) 一种基于多模态深度学习的心脏肥大多标签检测系统
Golrizkhatami et al. Multi-scale features for heartbeat classification using directed acyclic graph CNN
Yadav et al. Analysis of heart disease using parallel and sequential ensemble methods with feature selection techniques: heart disease prediction
CN114847905A (zh) 一种心率失常数据检测识别方法及系统
CN116432070A (zh) 一种基于深度学习神经网络的ecg信号分类系统和方法
Dambal et al. Premature Ventricular Contraction Classification Based on Spiral Search-Manta Ray Foraging and Bi-LSTM
Alsafi et al. [Retracted] An Approach for Cardiac Coronary Detection of Heart Signal Based on Harris Hawks Optimization and Multichannel Deep Convolutional Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant