CN115813401A - 一种基于动态学习的心电图分类方法及系统 - Google Patents
一种基于动态学习的心电图分类方法及系统 Download PDFInfo
- Publication number
- CN115813401A CN115813401A CN202211191075.3A CN202211191075A CN115813401A CN 115813401 A CN115813401 A CN 115813401A CN 202211191075 A CN202211191075 A CN 202211191075A CN 115813401 A CN115813401 A CN 115813401A
- Authority
- CN
- China
- Prior art keywords
- electrocardiogram
- data
- lead
- dynamic
- electrocardiogram data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000003066 decision tree Methods 0.000 claims abstract description 29
- 238000007637 random forest analysis Methods 0.000 claims abstract description 23
- 238000001514 detection method Methods 0.000 claims abstract description 16
- 208000024172 Cardiovascular disease Diseases 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 230000000877 morphologic effect Effects 0.000 claims description 33
- 239000013598 vector Substances 0.000 claims description 26
- 238000013145 classification model Methods 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 230000009466 transformation Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 238000000354 decomposition reaction Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 3
- 208000010125 myocardial infarction Diseases 0.000 description 15
- 238000010586 diagram Methods 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000000747 cardiac effect Effects 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 206010003119 arrhythmia Diseases 0.000 description 3
- 230000006793 arrhythmia Effects 0.000 description 3
- 238000002565 electrocardiography Methods 0.000 description 3
- 208000031225 myocardial ischemia Diseases 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000028161 membrane depolarization Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000005312 nonlinear dynamic Methods 0.000 description 2
- 238000000718 qrs complex Methods 0.000 description 2
- 230000002336 repolarization Effects 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000004903 cardiac system Anatomy 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005183 dynamical system Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001314 paroxysmal effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Images
Landscapes
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
本发明提供一种基于动态学习的心电图分类方法及系统,涉及心电图分类技术领域,该方法包括:获取多个12导联心电图数据和对应的类别标签;对12导联心电图数据进行预处理,从预处理后的12导联心电图数据中提取心电信号的多个心电特征,根据各心电特征与类别标签之间的互信息,选取预设数量的心电特征构建特征子集;根据特征子集和类别标签构建随机森林,将随机森林转化为单棵决策树形成最后的心血管疾病检测模型;利用所构建的心血管疾病检测模型,对接收到的待检测心电图数据进行分类,得到待检测心电图数据所属的类别。通过该方式,可以对待检测心电图数据进行分类,在可解释性和性能上都得到了提升,所得到的分类结果更具参考价值。
Description
技术领域
本发明属于心电图分类技术领域,尤其涉及一种基于动态学习的心电图分类方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成已经成为本领域一般技术人员所公知的现有技术。
心肌缺血、心律失常等心血管疾病具有突发性和高死亡率的特点,是威胁全球人类生命健康的主要致死病因,如果能够早期准确检测心血管疾病,可以提高患者生存机率并改善患者生存质量。无论是在院前还是在院内,静息12导联心电图(ECG)是诊断心血管疾病的一线诊断工具。ECG是心脏电活动在体表的综合表现,每个心电周期由P波、QRS综合波、ST段和T波组成,包含了丰富的心脏信息,例如:心电信号中ST段偏移和T波变化对诊断心肌缺血具有重要价值;心电信号中P波和QRS综合波的形态对心律失常的诊断起到重要作用。ECG的有效分类可以辅助医生检测心血管疾病,然而,许多情况下患者的心电变化微弱并未出现典型变化,因而仅通过目视检查心电图很难准确地对心电图进行分类。
ECG本质上可看作是复杂心脏系统产生的多变量、非平稳时间序列信号,因此,如何挖掘ECG中的辨识性特征是目前仍需解决的问题。此外,模型的可解释性是机器学习模型应用于临床环境需要解决的另一个重要问题。集成学习通过聚合多个基模型可显著提高许多监督机器学习任务的整体性能。然而,这种性能的提升是以牺牲可解释性为代价的,因为集成模型总是比基分类器复杂多,从而导致难以在临床实践中应用。
发明内容
为了解决上述问题,本发明提供一种基于动态学习的心电图分类方法及系统,通过提取心电信号的形态学特征、时频特征和动力学特征构建特征子集,以充分挖掘ECG中的辨识性特征,并通过随机森林构建分类模型,用于对待检测心电图数据进行分类,在可解释性和性能上都得到了提升,所得到的分类结果更具参考价值。
为了实现上述目的,本发明主要包括以下几个方面:
第一方面,本发明实施例提供一种基于动态学习的心电图分类方法,包括:
获取多个12导联心电图数据和对应的类别标签;
对所述12导联心电图数据进行预处理,从预处理后的12导联心电图数据中提取心电信号的多个心电特征,根据各心电特征与类别标签之间的互信息,选取预设数量的心电特征构建特征子集;所述心电特征包括形态学特征、时频特征和动力学特征;
根据所述特征子集和类别标签构建随机森林,将所述随机森林转化为单棵决策树形成最后的分类模型;
将待检测心电图数据输入至所构建的分类模型,输出得到心电图分类结果。
在一种可能的实施方式中,所述对心电图数据进行预处理包括:对所述心电图数据进行滤波处理,滤除所述心电图数据中心电信号的基线干扰和高频干扰。
在一种可能的实施方式中,所述形态学特征包括全局形态特征和单导联形态特征,每个全局形态特征是基于所有的12导联心电图数据计算得到的;每个单导联形态特征是根据每个12导联心电图数据单独获得的。
在一种可能的实施方式中,对12导联心电图数据进行离散小波分解,得到细节系数和近似系数;对所述细节系数和近似系数分别计算其均值、标准差、样本熵和近似熵,作为心电信号的时频特征。
在一种可能的实施方式中,所述动力学特征的提取过程包括:提取心电信号的ST-T段,包括J点、T波顶点和T波终点;将ST-T段进行拼接得到ST-T向量环;采用动态学习算法对ST-T向量环进行动力学建模,生成三维的心电动力学图信号;或者,采用动态学习算法对完整心电信号(除极和复极过程)进行动力学建模,生成三维的改进心电动力学图信号;
根据所述心电动力学图信号或改进心电动力学图信号计算全局频域特征,以及利用小波离散变换对心电动力学图信号进行分析,得到小波变换的统计学特征和熵特征;所述全局频域特征结合小波变换的统计学特征和熵特征构成心电信号的动力学特征。
在一种可能的实施方式中,根据所述特征子集和类别标签构建随机森林,将所述随机森林转化为单棵决策树形成最后的心血管疾病检测模型,包括:创建一组代表原始决策森林的规则连接;然后对规则连接进行分层组织以形成新的决策树;
在创建一组代表原始决策森林的规则连接中,从原始的决策森林中筛选出具有代表性的决策树,提取多棵决策树中根叶点到叶节点的逻辑规则连接并进行合并,以生成代表原始决策森林的连接集;
在创建新的决策树过程中,创建代表规则连接的数据集;每次迭代过程都寻找具有最高信息增益的规则并将其作为分裂节点;将可能满足分裂规则的连接路由到左节点,并将所有不满足分裂规则的连接路由到右节点,如果没有明确要求,则可以路由到所有后代;如果一个节点的所有连接都指向相同的预测类,或者当具有最高信息增益的分裂规则未减少后代节点的连接数量时,将该节点定义为叶节点。
在一种可能的实施方式中,待检测心电图数据可路由到其关联的叶节点,将返回叶节点的平均向量作为类向量的输出,用于预测待检测心电图数据的类概率,根据所述类概率确定心电图分类结果。
第二方面,本发明实施例还提供一种基于动态学习的心电图分类系统,包括:
获取模块,用于获取多个12导联心电图数据和对应的类别标签;
特征选取模块,用于对所述12导联心电图数据进行预处理,从预处理后的12导联心电图数据中提取心电信号的多个心电特征,根据各心电特征与类别标签之间的互信息,选取预设数量的心电特征构建特征子集;所述心电特征包括形态学特征、时频特征和动力学特征;
模型构建模块,用于根据所述特征子集和类别标签构建随机森林,将所述随机森林转化为单棵决策树形成最后的分类模型;
分类模块,用于将待检测心电图数据输入至所构建的分类模型,输出得到心电图分类结果。
第三方面,本发明实施例提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述第一方面和第一方面任一种可能的实施方式中所述的基于动态学习的心电图分类方法的步骤。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述第一方面和第一方面任一种可能的实施方式中所述的基于动态学习的心电图分类方法的步骤。
基于上述技术方案,本发明具有以下有益效果:
本发明通过提取心电信号的形态学特征、时频特征和动力学特征,并根据各心电特征与类别标签之间的互信息,选取预设数量的心电特征构建特征子集,可以充分挖掘ECG中的辨识性特征;
根据特征子集和类别标签构建随机森林,将随机森林转化为单棵决策树形成最后的分类模型,用于对待检测心电图数据进行分类,在可解释性和性能上都得到了提升,所得到的分类结果更具参考价值。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明实施例一中基于动态学习的心血管疾病检测方法的流程示意图;
图2是本发明实施例一中心拍平均面积示意图;
图3是本发明实施例一中单一导联形态学部分特征示意图;
图4(a)是本发明实施例一中健康个体的ECG信号的导联I(左)及其小波系数(右)示意图;
图4(b)是本发明实施例一中健康个体的ECG信号的导联I(左)及其小波系数(右)示意图;
图5(a)-5(b)是本发明实施例一中心肌梗死患者的三维心电动力图和对应的时序图;
图5(c)-5(d)是本发明实施例一中心肌梗死患者的三维心电动力图和对应的时序图;
图6(a)是本发明实施例一中健康个体的心电动力学图信号的F1(X(k))及5级db4离散小波分解系数;
图6(b)是本发明实施例一中心肌梗死患者的心电动力学图信号的F1(X(k))及5级db4离散小波分解系数;
图7是本发明实施例一中不同特征子集对应的性能变化曲线图;
图8是本发明实施例一中心血管疾病检测模型的结构示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一
请参阅图1,本发明实施例提供一种基于动态学习的心电图分类方法,具体包括以下步骤:
S101:获取多个12导联心电图数据和对应的类别标签。
在具体实施中,从多个医院的多台心电图机(可以是不同型号)采集受试者的12导联心电图数据,导出心电图数据的xml格式数据并将不同型号的数据格式进行标准化处理,得到相同形式的12导联心电图数据,受试者包括心血管疾病患者和正常受试者。可以根据需要将12导联心电图数据划分成多个类别,得到对应的类别标签,如类别标签包括患病组和正常组。
在具体应用中,可以从数据库中获取多个12导联心电图数据。心电图记录从Physikalisch-Technische Bundesanstalt(PTB)诊断数据库中获得,该数据库由PhysioBank提供。该数据库包括290名受试者的549条心电图记录,其中包括52名健康受试者和148名心血管疾病患者。每条ECG记录的采样频率为1kHz,16位分辨率为±16.384mV。每次记录由常规的12导联信号(I、II、III、AVR、AVL、AVF、V1、V2、V3、V4、V5、V6)和同时测量的3条Frank导联(X、Y、Z)组成。
以心肌梗死(Miocardial Infarction,MI)的检测为例,选取每个受试者12导联和3导联Frank ECG记录作为研究数据,包括148例患病组(MI)和52例健康对照(HC)。3导联ECG矢量信号用于动态建模以获得动力学特征,利用12导联心电图信号获取心电图的形态学和时频特征。
S102:对所述12导联心电图数据进行预处理,从预处理后的12导联心电图数据中提取心电信号的多个心电特征,根据各心电特征与类别标签之间的互信息,选取预设数量的心电特征构建特征子集;所述心电特征包括形态学特征、时频特征和动力学特征。
在具体实施中,对心电图数据进行预处理包括:对所述心电图数据进行滤波处理,滤除所述心电图数据中心电信号的基线干扰和高频干扰,从预处理后的12导联心电图数据中提取心电信号的形态学特征、时频特征和动力学特征。
1)形态学特征
从12导联心电图数据中提取114个心电图的形态学特征,形态学特征可划分为全局形态学特征和单一导联形态学特征。如表1所示,全局形态学特征指的是所提取的每一个特征都是基于心电图的12导联数据计算得到(6个特征),其中,心拍平均面积如图2中所示;如表2所示,单一导联形态学特征表示从12导联心电图的每一个导联数据中单独计算所获得(108个特征),单一导联形态学部分特征如图3所示。
表1.全局形态学特征
表2.单一导联形态学特征
表2中的i为对应的导联,i∈1,2,...,12分别表示导联{I,II,III,AVR,AVL,AVF,V1,V2,V3,V4,V5,V6}。
2)时频特征
小波函数的选取是小波变换应用的关键。Haar小波、Daubechies小波是常见的小波函数,因为Daubechies 4(db4)的原型与心电动力学图各维度信号具有相似的形态,本实施例使用db4小波函数对心电图和心电动力学图各维度数据进行五级离散小波变换分解。从图4(a)和4(b)中可以看出,心电动力学图及其各级小波系数在心肌梗死患者与健康个体之间存在明显差异。
对12导联心电图进行5级小波变换分解,然后计算心电图各导联的细节系数(D1、D2、D3、D4、D5)和近似系数(A5)的均值、标准差、样本熵和近似熵,将提取得到的共228个特征(4×6×12)作为ECG的小波时频特征。这里,均值反映的是数据集合的中间值,是衡量不同类别间特征是否存在差异的指标。标准差是一种统计度量,反映了一组数据的离散度。熵是一种量化时间序列复杂性和规律性的非线性度量,近似熵(ApEn)和样本熵(SampEn)是根据模式数量来确定数据序列规则性的两种算法,具体公式如下:
其中,ApEn表示近似熵,h∈1,2,...,12,分别表示导联{1,II,III,AVR,AVL,AVF,V1,V2,V3,V4,V5,V6},l∈1,2,...,6,分别表示{D1、D2、D3、D4、D5、A5},N表示采样点数量,Aj为数据序列与第j个长度为m+1模板向量所匹配的采样点数量,Bj为数据序列与第j个长度为m模板向量所匹配的采样点数量。
其中,SampEn表示样本熵,Am(r)为数据序列在容限r范围内与长度为m+1模板向量的匹配概率,Bm(r)为数据序列在容限r范围内与长度为m模板向量的匹配概率。
3)动力学特征
针对心肌缺血这类临床医生检测中更依赖于ST段波形变化的心血管疾病,因此,动力学特征的提取过程包括:通过Pan-Tompkins算法检测和提取心电信号的ST-T段,包括J点、T波顶点和T波端点,将ST-T段进行拼接得到ST-T向量环;采用动态学习算法对ST-T向量环进行动力学建模,生成三维的心电动力学图信号。
针对心律失常这类更看重P波及QRS波变化的心血管疾病,采用动态学习算法对心电信号的除极和复极过程进行动力学建模,生成三维的改进心电动力学图信号。根据所述心电动力学图信号或改进心电动力学图信号计算全局频域特征,以及利用小波离散变换对心电动力学图信号进行分析,得到小波变换的统计学特征和熵特征;所述全局频域特征结合小波变换的统计学特征和熵特征构成心电信号的动力学特征。
在具体实施中,心电信号本质上是由心脏这一复杂非线性动态系统产生的非平稳类周期信号,为了获取心电信号隐匿的动力学模式,利用动态学习算法对采样得到的心电信号进行准确的动力学建模,心电动力学图的生成过程如下:
首先,3维心电向量信号可考虑是由以下公式表示的3维动态系统产生:
其中,X(t)=[x1(t),x2(t),x3(t)]T∈R3代表着三维心电ST-T向量环,F(X(t))=[F1(X(t)),F2(X(t)),F3(X(t))]是非线性系统动态,代表心电向量信号内在的动力学特征,代表X(t)的动力学变化。
然后,利用心电图机采样得到心电时间序列X(k)。基于采样数据的动态学习算法,采用径向基函数(RBF)神经网络辨识器对心电ST-T环内在系统动态进行局部准确神经网络建模,获得关于心电向量信号ST-T环内在的动力学特征F(X(k)):
其中,是心电信号xi的估计值,k表示第k时刻,αi表示为待设计的辨识器增益,代表用于学习系统动力学Fi(·)的RBF神经网络,Ts为采样周期,S为RBF神经网络的回归向量,上标T表示转置,为RBF神经网络权值的估计,并对采用如下自适应学习率,
根据动态学习理论,对于周期、类周期甚至回归数据序列,RBF神经网络中沿采样数据轨迹小邻域内的神经网络子集可准确获取系统的非线性未知动态。因此利用辨识器和权值更新方法可以获取心电图数据序列的非线性动力学F(X(k)):
最后,将上述动力学建模结果进行三维可视化显示,得到心电动力学图(CDG),如图5(a)-5(d)所示。
基于CDG信号计算全局频域特征;
频域特征:首先利用离散快速傅里叶变换对心电动力学图各维数据分解,计算其频谱;然后,利用最小二乘法获取频谱点的拟合指数λk:
如图6(a)-6(b)所示,利用小波离散变换对3维CDG信号进行分析,基于小波系数提取统计学特征和熵特征;将全局频域特征与小波系数的统计学特征和熵特征构成动力学特征集,具体为:计算心电动力学图的频谱拟合指数,同时,基于心电动力学图各维数据及其各级细节系数(D1、D2、D3、D4、D5)和近似系数(A5)提取均值、方差、样本熵、近似熵共85个特征(4×6×3+4×3+1),作为心电动力学特征。
从心电图及其CDG中提取各种多尺度心电特征,如表3所示。共427个心电图特征,其中形态学特征114个,时频特征228个,CDG特征85个。
表3.不同类型的ECG特征
从图7中可以看出,不同类型特征的MI检测性能存在显著差异。值得注意的是,三种特征对应的MI检测性能随着特征数量的增加先增大后减小。结果表明,CDG特征的MI检测性能明显优于ECG时频特征和形态学特征,准确率为92.6%。
表4.具有不同类型特征的MI检测结果
鉴于心电图特征也可以获得良好的检测结果,结合心电图形态特征、心电图时频特征和CDG特征为MI进一步提高检测性能。为了减少模型的冗余功能,避免过度学习,采用两阶段特征选择的方法,筛选出少量有区别的心电特征,表5给出了最终的特征子集,其中的StdF1,6表示为F1(X(k))信号的A5小波分解子带提取的方差特征。心电图形态学特征主要由不同导联的T波振幅组成,ECG时频特征包含熵特征,动力学特征包括统计特征和频域特征。
表5.最终的特征子集
具体地,通过以下方式对获得的多个特征进行特征筛选:
特征选择旨在从原始特征集中选择一个更重要、更有效的特征子集,以降低模型的复杂度和过拟合,提高分类器的性能和泛化能力。互信息法是信息论里一种有价值的信息度量,它表示两个随机变量之间信息量的相关性,采用经典互信息评价定性自变量与因变量之间的相关性,即互信息衡量特征与特定类别之间的相关性。互信息越大,特征与类别之间的相关性越强。
本实施例提出一种基于互信息的两阶段特征选择方法来选择MI诊断的相关特征。首先,从同一类型特征中选择若干特征,通过串联策略进行整合,形成一组新的特征子集;然后将它们送入特征选择的第二阶段,获得最终的特征子集。
S103:根据所述特征子集和类别标签构建随机森林,将所述随机森林转化为单棵决策树形成最后的分类模型。
在具体实施中,给定一个包含n个样本示例、m个特征和c个不同类别的数据集(D={(xi,yi)}|D|=n,xi∈Rm,yi∈1,...,c),xi表示第i个样本对应的特征,yi表示样本i的类别,随机森林聚集K棵决策树,并将m维特征向量映射到c维类中。对应的输出概率向量为:
该方法首先创建一组代表原始决策森林的规则连接;然后对规则连接进行分层组织以形成新的决策树,具体如下:
步骤一:
1)修剪树:为降低模型的复杂度,从已有的多棵随机森林中利用贪婪算法筛选少量的决策树。
3)合并规则连接:以迭代方式获取来自修剪后决策树的逻辑连接并对规则连接进行合并,合并两个连接集CS1和CS2可以通过应用笛卡尔积来完成,如连接与连接通过合并创建一个新的连接(若无法合并,则直接舍弃),从而生成代表决策森林的连接集CSi。
步骤二:
1)创建代表规则连接的数据集:数据集中的每一行表示一个连接规则,规则中将数值型特征映射为两列,一列是特征上限,另一列是特征下限;类别型特征被映射为一个列。数据集中除上述两种类型特征外,还包括一列类概率,用于存储规则连接对不同类别预测的概率值。
2)确定分裂节点(Node)和阈值:创建新树过程中,每次迭代过程都寻找具有最高信息增益的规则并将其作为分裂节点,信息增益公式如下:
其中,r表示规则,CSi表示第i个规则连接集,CSi1表示由第i个规则连接集分裂后的第1个规则连接集,CSi2表示CSi1表示由第i个规则连接集分裂后的第2个规则连接集,entropy(·)表示熵。
3)分裂规则(生成的树是二叉树,只有左节点和右节点):将可能满足分裂规则的连接路由到左节点,并将所有不满足分裂规则的连接路由到右节点。如果没有明确要求,则可以路由到所有后代。
4)停止分裂的条件(即,确定叶节点):如果一个节点的所有连接都指向相同的预测类,或者当具有最高信息增益的分裂规则未减少后代节点的连接数量时,将该节点定义为叶节点。
最终构建的心血管疾病检测模型如图8中所示。
S104:将待检测心电图数据输入至所构建的分类模型,输出得到心电图分类结果。
在具体实施中,待检测心电图数据可路由到其关联的叶节点,将返回叶节点的平均向量作为类向量的输出,用于预测待检测心电图数据的类概率,根据所述类概率确定待检测心电图数据所属的类别。
最终的特征子集和最优参数输入到不同的分类器,包括决策树、随机森林和所提出的方法。表6的结果表明,本文方法的检测性能优于决策树,分别为97.10%vs.95.1%、98.10%vs.96.61%、94.18%vs.90.69%、0.99vs.0.96。最重要的是,与高复杂度的随机森林相比,我们的方法可以在大大降低复杂度的情况下实现更好的MI检测性能。
表6.各分类器的MI检测性能
该方法使生成的决策树具有比原始决策森林更好的预测性能,同时提供临床医生可理解的分类,并保持与决策树相同的复杂性。
实施例二
本发明实施例还提供一种基于动态学习的心电图分类系统,包括:
获取模块,用于获取多个12导联心电图数据和对应的类别标签;
特征选取模块,用于对所述12导联心电图数据进行预处理,从预处理后的12导联心电图数据中提取心电信号的多个心电特征,根据各心电特征与类别标签之间的互信息,选取预设数量的心电特征构建特征子集;所述心电特征包括形态学特征、时频特征和动力学特征;
模型构建模块,用于根据所述特征子集和类别标签构建随机森林,将所述随机森林转化为单棵决策树形成最后的分类模型;
分类模块,用于将待检测心电图数据输入至所构建的分类模型,输出得到心电图分类结果。
本实施例提供的基于动态学习的心电图分类系统用于实现前述的基于动态学习的心电图分类方法,因此基于动态学习的心电图分类系统的具体实施方式可见前文中的基于动态学习的心电图分类方法的实施例部分,在此不再进行赘述。
实施例三
本发明实施例所提供的一种计算机设备的结构示意图。所述计算机设备包括处理器、存储器和总线。
所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时,可以执行如上述图1所示方法实施例中的基于动态学习的心电图分类方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
实施例四
基于同一发明构思,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述方法实施例中所述的基于动态学习的心电图分类方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于动态学习的心电图分类方法,其特征在于,包括:
获取多个12导联心电图数据和对应的类别标签;
对所述12导联心电图数据进行预处理,从预处理后的12导联心电图数据中提取心电信号的多个心电特征,根据各心电特征与类别标签之间的互信息,选取预设数量的心电特征构建特征子集;所述心电特征包括形态学特征、时频特征和动力学特征;
根据所述特征子集和类别标签构建随机森林,将所述随机森林转化为单棵决策树形成最后的分类模型;
将待检测心电图数据输入至所构建的分类模型,输出得到心电图分类结果。
2.如权利要求1所述的基于动态学习的心电图分类方法,其特征在于,所述对心电图数据进行预处理包括:对所述心电图数据进行滤波处理,滤除所述心电图数据中心电信号的基线干扰和高频干扰。
3.如权利要求1所述的基于动态学习的心电图分类方法,其特征在于,所述形态学特征包括全局形态特征和单导联形态特征,每个全局形态特征是基于所有的12导联心电图数据计算得到的;每个单导联形态特征是根据每个12导联心电图数据单独获得的。
4.如权利要求1所述的基于动态学习的心电图分类方法,其特征在于,对12导联心电图数据进行离散小波分解,得到细节系数和近似系数;对所述细节系数和近似系数分别计算其均值、标准差、样本熵和近似熵,作为心电信号的时频特征。
5.如权利要求1所述的基于动态学习的心电图分类方法,其特征在于,所述动力学特征的提取过程包括:提取心电信号的ST-T段,包括J点、T波顶点和T波终点;将ST-T段进行拼接得到ST-T向量环;采用动态学习算法对ST-T向量环进行动力学建模,生成三维的心电动力学图信号;或者,采用动态学习算法对完整的心电信号进行动力学建模,生成三维的改进心电动力学图信号;
根据所述心电动力学图信号或改进心电动力学图信号计算全局频域特征,以及利用小波离散变换对心电动力学图信号进行分析,得到小波变换的统计学特征和熵特征;所述全局频域特征结合小波变换的统计学特征和熵特征构成心电信号的动力学特征。
6.如权利要求1所述的基于动态学习的心电图分类方法,其特征在于,根据所述特征子集和类别标签构建随机森林,将所述随机森林转化为单棵决策树形成最后的心血管疾病检测模型,包括:创建一组代表原始决策森林的规则连接;然后对规则连接进行分层组织以形成新的决策树;
在创建一组代表原始决策森林的规则连接中,从原始的决策森林中筛选出具有代表性的决策树,提取多棵决策树中根叶点到叶节点的逻辑规则连接并进行合并,以生成代表原始决策森林的连接集;
在创建新的决策树过程中,创建代表规则连接的数据集;每次迭代过程都寻找具有最高信息增益的规则并将其作为分裂节点;将可能满足分裂规则的连接路由到左节点,并将所有不满足分裂规则的连接路由到右节点,如果没有明确要求,则可以路由到所有后代;如果一个节点的所有连接都指向相同的预测类,或者当具有最高信息增益的分裂规则未减少后代节点的连接数量时,将该节点定义为叶节点。
7.如权利要求6所述的基于动态学习的心电图分类方法,其特征在于,待检测心电图数据可路由到其关联的叶节点,将返回叶节点的平均向量作为类向量的输出,用于预测待检测心电图数据的类概率,根据所述类概率确定心电图分类结果。
8.一种基于动态学习的心电图分类系统,其特征在于,包括:
获取模块,用于获取多个12导联心电图数据和对应的类别标签;
特征选取模块,用于对所述12导联心电图数据进行预处理,从预处理后的12导联心电图数据中提取心电信号的多个心电特征,根据各心电特征与类别标签之间的互信息,选取预设数量的心电特征构建特征子集;所述心电特征包括形态学特征、时频特征和动力学特征;
模型构建模块,用于根据所述特征子集和类别标签构建随机森林,将所述随机森林转化为单棵决策树形成最后的分类模型;
分类模块,用于将待检测心电图数据输入至所构建的分类模型,输出得到心电图分类结果。
9.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一项所述的基于动态学习的心电图分类方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一项所述的基于动态学习的心电图分类方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211191075.3A CN115813401B (zh) | 2022-09-28 | 2022-09-28 | 一种基于动态学习的心电图分类方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211191075.3A CN115813401B (zh) | 2022-09-28 | 2022-09-28 | 一种基于动态学习的心电图分类方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115813401A true CN115813401A (zh) | 2023-03-21 |
CN115813401B CN115813401B (zh) | 2024-06-21 |
Family
ID=85524144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211191075.3A Active CN115813401B (zh) | 2022-09-28 | 2022-09-28 | 一种基于动态学习的心电图分类方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115813401B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117033973A (zh) * | 2023-08-04 | 2023-11-10 | 电子科技大学 | 一种变流器多工况开路故障诊断方法 |
CN117576486A (zh) * | 2024-01-15 | 2024-02-20 | 广东技术师范大学 | 基于双域加权宽度学习的心电图分类方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1951320A (zh) * | 2006-11-16 | 2007-04-25 | 上海交通大学 | 基于超完备特征的异常心电识别方法 |
CN103549949A (zh) * | 2013-10-21 | 2014-02-05 | 华南理工大学 | 基于确定学习理论的心肌缺血辅助检测方法 |
CN110151165A (zh) * | 2019-04-30 | 2019-08-23 | 杭州电子科技大学 | 一种基于非线性动力学特征的心电向量图分类方法 |
WO2019184960A2 (zh) * | 2018-03-24 | 2019-10-03 | 上海图灵医疗科技有限公司 | 一种心电数据病理特征量化分析方法及装置 |
CN110363177A (zh) * | 2019-07-23 | 2019-10-22 | 上海图灵医疗科技有限公司 | 一种人体生物电信号混沌特征的提取方法 |
CN110384482A (zh) * | 2019-06-26 | 2019-10-29 | 广州视源电子科技股份有限公司 | 心电信号分类方法、装置、计算机设备和存储介质 |
CN111261289A (zh) * | 2018-11-30 | 2020-06-09 | 上海图灵医疗科技有限公司 | 一种基于人工智能模型的心脏疾病的检测方法 |
WO2022193312A1 (zh) * | 2021-03-19 | 2022-09-22 | 京东方科技集团股份有限公司 | 基于多导联的心电信号识别方法和心电信号识别装置 |
-
2022
- 2022-09-28 CN CN202211191075.3A patent/CN115813401B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1951320A (zh) * | 2006-11-16 | 2007-04-25 | 上海交通大学 | 基于超完备特征的异常心电识别方法 |
CN103549949A (zh) * | 2013-10-21 | 2014-02-05 | 华南理工大学 | 基于确定学习理论的心肌缺血辅助检测方法 |
WO2019184960A2 (zh) * | 2018-03-24 | 2019-10-03 | 上海图灵医疗科技有限公司 | 一种心电数据病理特征量化分析方法及装置 |
CN111261289A (zh) * | 2018-11-30 | 2020-06-09 | 上海图灵医疗科技有限公司 | 一种基于人工智能模型的心脏疾病的检测方法 |
CN110151165A (zh) * | 2019-04-30 | 2019-08-23 | 杭州电子科技大学 | 一种基于非线性动力学特征的心电向量图分类方法 |
CN110384482A (zh) * | 2019-06-26 | 2019-10-29 | 广州视源电子科技股份有限公司 | 心电信号分类方法、装置、计算机设备和存储介质 |
CN110363177A (zh) * | 2019-07-23 | 2019-10-22 | 上海图灵医疗科技有限公司 | 一种人体生物电信号混沌特征的提取方法 |
WO2022193312A1 (zh) * | 2021-03-19 | 2022-09-22 | 京东方科技集团股份有限公司 | 基于多导联的心电信号识别方法和心电信号识别装置 |
Non-Patent Citations (1)
Title |
---|
孙庆华;王磊;王聪;王乾;吴伟明;赵媛媛;王喜萍;董潇男;周彬;唐闽;: "基于确定学习及心电动力学图的心肌缺血早期检测研究", 自动化学报, no. 09, 15 September 2020 (2020-09-15) * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117033973A (zh) * | 2023-08-04 | 2023-11-10 | 电子科技大学 | 一种变流器多工况开路故障诊断方法 |
CN117576486A (zh) * | 2024-01-15 | 2024-02-20 | 广东技术师范大学 | 基于双域加权宽度学习的心电图分类方法及系统 |
CN117576486B (zh) * | 2024-01-15 | 2024-03-29 | 广东技术师范大学 | 基于双域加权宽度学习的心电图分类方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115813401B (zh) | 2024-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shi et al. | A hierarchical method based on weighted extreme gradient boosting in ECG heartbeat classification | |
Sharma et al. | Multiscale energy and eigenspace approach to detection and localization of myocardial infarction | |
CN115813401B (zh) | 一种基于动态学习的心电图分类方法及系统 | |
CN109411041B (zh) | 心电信息处理方法和心电工作站系统 | |
CN109411042B (zh) | 心电信息处理方法和心电工作站 | |
EP2224346B1 (en) | Ecg signal analysis tool | |
Liu et al. | Automated detection and localization system of myocardial infarction in single-beat ECG using Dual-Q TQWT and wavelet packet tensor decomposition | |
Shi et al. | Inter-patient heartbeat classification based on region feature extraction and ensemble classifier | |
Diker et al. | A diagnostic model for identification of myocardial infarction from electrocardiography signals | |
Emanet | ECG beat classification by using discrete wavelet transform and Random Forest algorithm | |
CN111631705A (zh) | 心电异常检测方法、模型训练方法、装置、设备及介质 | |
Li et al. | Automated heartbeat classification exploiting convolutional neural network with channel-wise attention | |
CN111956203A (zh) | 心电信号参数化方法、模型训练方法、装置、设备及介质 | |
Tseng et al. | Clustering analysis of aging diseases and chronic habits with multivariate time series electrocardiogram and medical records | |
Houssein et al. | Integration of machine learning and optimization techniques for cardiac health recognition | |
Hong et al. | Gated temporal convolutional neural network and expert features for diagnosing and explaining physiological time series: a case study on heart rates | |
Gregg et al. | 12-Lead ECG interpretation by database comparison | |
Rashkovska et al. | Clustering of heartbeats from ECG recordings obtained with wireless body sensors | |
CN112989971B (zh) | 一种不同数据源的心电数据融合方法及装置 | |
Bashir et al. | Highlighting the current issues with pride suggestions for improving the performance of real time cardiac health monitoring | |
Choudhary et al. | An evaluation of machine learning classifiers for detection of myocardial infarction using wavelet entropy and eigenspace features | |
Sraitih et al. | An overview on machine learning methods for ECG Heartbeat Arrhythmia Classification | |
CN111513702A (zh) | 心电数据的检测方法及存储介质 | |
Mahmood et al. | A comparison between different classifiers for diagnoses of atrial fibrillation | |
Kovalchuk et al. | A novel feature vector for ECG classification using deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |