CN110020636B - 一种基于异常特征值的室性早搏智能分析方法 - Google Patents

一种基于异常特征值的室性早搏智能分析方法 Download PDF

Info

Publication number
CN110020636B
CN110020636B CN201910303529.3A CN201910303529A CN110020636B CN 110020636 B CN110020636 B CN 110020636B CN 201910303529 A CN201910303529 A CN 201910303529A CN 110020636 B CN110020636 B CN 110020636B
Authority
CN
China
Prior art keywords
training
random forest
tree
classification
sample set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910303529.3A
Other languages
English (en)
Other versions
CN110020636A (zh
Inventor
李润川
陈刚
王宗敏
谢天天
张行进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou University
Original Assignee
Zhengzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University filed Critical Zhengzhou University
Publication of CN110020636A publication Critical patent/CN110020636A/zh
Application granted granted Critical
Publication of CN110020636B publication Critical patent/CN110020636B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

本发明涉及一种基于异常特征值的室性早搏智能分析方法,包括以下步骤:1)、信号预处理,用小波滤波器对原始信号进行去噪处理,之后再通过斜率、幅度和宽度的数字分析来定位QRS复合波,最后再从完整的ECG信号中以R峰为中心进行分割提取单个心拍;2)、特征提取,选取QRS复合波面积、RR间期和QRS振幅矢量和作为特征参数用于分类器的输入;3)、模型训练,通过自助法重采样技术,从原始训练样本集中有放回地重复随机抽取k个样本生成新的训练样本集合,然后根据自助样本集生成M个分类树组成随机森林,根据分类树投票多少形成的分数确定新数据的分类结果;本发明具有心电信号中心率失常异常信号识别准确、分类精准的优点。

Description

一种基于异常特征值的室性早搏智能分析方法
技术领域
本发明属于心搏检测分类技术领域,具体涉及一种基于异常特征值的室性早搏智能分析方法。
背景技术
心电图(Electrocardiogram,ECG)是从体表记录心脏每一心动周期所产生的电活动变化的图形,它蕴含了丰富的心脏基本功能和病理信息。因此,其在心脏的安全评测和各种治疗方法的评估等方面具有重大的作用意义,目前是普遍采用的心律失常等多种心脏疾病检查和诊断的重要手段。。期前收缩是临床上最为常见的心律失常,它指的是异位起搏点发出的过早冲动引起的心脏搏动。按起源部位可分为窦性、房性、房室交接处性和室性四种,其中最为普遍和常见的就是室性早搏。
室性早搏的发生与心肌梗死相关的死亡率有关。因此,准确的检测出PVC对于那些可以预防生命危险的病人来说具有重要意义。也因此,最近几年相关PVC的研究成为了比较热门的研究方向。目前,机器学习已经广泛用于医学诊断,用来帮助提高医生诊断治疗的工作效率,让医生能够尽早地诊断出疾病。尽管目前已经开发出用于检测PVC心拍的高度精确的方法,但它们的效率通常伴随着长计算时间和高复杂性。再者,MIT-BIH心律失常数据库中正常心拍类型要远多于PVC心拍类型,所以他们没有考虑去解决因为数据不平衡问题所导致的一些因素,
发明内容
本发明的目的是克服现有技术的不足而提供一种心电信号分类准确、有效对心电信号进行深度学习分类的基于异常特征值的室性早搏智能分析方法。
本发明的技术方案如下:
一种基于异常特征值的室性早搏智能分析方法,包括以下步骤:
1)、信号预处理,用小波滤波器对原始信号进行去噪处理,之后再通过斜率、幅度和宽度的数字分析来定位QRS复合波,最后再从完整的ECG信号中以R峰为中心进行分割提取单个心拍;
2)、特征提取,选取QRS复合波面积、RR间期和QRS振幅矢量和作为特征参数用于分类器的输入;
3)、模型训练,通过自助法重采样技术,从原始训练样本集中有放回地重复随机抽取k个样本生成新的训练样本集合,然后根据自助样本集生成M个分类树组成随机森林,根据分类树投票多少形成的分数确定新数据的分类结果。
进一步,所述步骤3)中所述随机森林的构建方法包括以下步骤:
S21、从原始训练集中使用Bootstraping方法随机有放回采样选出k个样本,共进行Tree_M次采样,生成Tree_M个训练集;
S22、对步骤S21中Tree_M个训练集,分别训练Tree_M个决策树模型;
S23、对于步骤S22中单个决策树模型,假设训练样本特征的个数为m,那么每次分裂时根据基尼指数选择最好的特征进行分裂;
S24、每棵决策树都按着步骤S23的过程分裂下去,直到该节点的所有训练样例都属于同一类,在决策树的分裂过程中不需要剪枝;
S25、将生成的多棵决策树组成随机森林,按多棵树分类器投票决定最终分类结果。
进一步,所述随机森林的构件方法还包括构建随机森林分类器。
进一步,所述随机森林分类器的构建方法为使用基于CART决策树来构建随机森林分类器,具体的,所述CART决策树使用基尼指数来选择划分属性。
与现有技术相比,本发明的有益效果是:
本发明对经过信号预处理和特征提取的心电信号通过构建随机森林决策树模型进行模型训练和特征学习,将心电信号进行精确分类,对心电信号中的室性早搏信号进行准确识别,有效提高心律失常等多种异常心电信号的分类识别。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于异常特征值的室性早搏智能分析方法,包括以下步骤:
1)、信号预处理,用小波滤波器对原始信号进行去噪处理,之后再通过斜率、幅度和宽度的数字分析来定位QRS复合波,最后再从完整的ECG信号中以R峰为中心进行分割提取单个心拍;
2)、特征提取,选取QRS复合波面积、RR间期和QRS振幅矢量和作为特征参数用于分类器的输入;
3)、模型训练,通过自助法重采样技术,从原始训练样本集中有放回地重复随机抽取k个样本生成新的训练样本集合,然后根据自助样本集生成M个分类树组成随机森林,根据分类树投票多少形成的分数确定新数据的分类结果。
进一步,所述步骤3)中所述随机森林的构建方法包括以下步骤:
S21、从原始训练集中使用Bootstraping方法随机有放回采样选出k个样本,共进行Tree_M次采样,生成Tree_M个训练集;
S22、对步骤S21中Tree_M个训练集,分别训练Tree_M个决策树模型;
S23、对于步骤S22中单个决策树模型,假设训练样本特征的个数为m,那么每次分裂时根据基尼指数选择最好的特征进行分裂;
S24、每棵决策树都按着步骤S23的过程分裂下去,直到该节点的所有训练样例都属于同一类,在决策树的分裂过程中不需要剪枝;
S25、将生成的多棵决策树组成随机森林,按多棵树分类器投票决定最终分类结果。
进一步,所述随机森林的构件方法还包括构建随机森林分类器。
进一步,所述随机森林分类器的构建方法为使用基于CART决策树来构建随机森林分类器,具体的,所述CART决策树使用基尼指数来选择划分属性。
本实施例中,CART决策树使用“基尼指数”来选择划分属性;假定当前样本集合D中第k类样本所占的比例为pk(k=1,2,...,K),则数据集D的纯度可用基尼值来度量:
Figure BDA0002032161270000041
Gini(D)反应了从数据集D中随机抽取两个样本,其类别标记不一致的概率;以二分类为例,如果所抽取的样本类别为同一类别,则:
Figure BDA0002032161270000042
如果所抽取的样本类别为两类,并且数量相同,则:
Figure BDA0002032161270000043
因此,Gini(D)越小,则数据集D的纯度越高;
假设离散属性a有V个可能的取值{a1,a2,...,av},若使用a来对样本集D进行划分,则会产生V个分支结点,其中第v个分支结点包含了D中所有在属性a上取值为av的样本,记为Dv,根据式(1)计算出Dv的基尼值,再考虑到不同的分支结点所包含的样本数不同,给分支结点赋予权
Figure BDA0002032161270000044
重,即样本数越多的分支结点的影响越大,于是属性a的基尼指数定义为:
Figure BDA0002032161270000045
则在候选属性集合A中,选择那个使得划分后基尼指数最小的属性作为最优划分属性,即
Figure BDA0002032161270000046
本实施例中,Bagging是并行式集成学习方法,它的基本流程是采样出T个含m个训练样本的其它的算法描述如下表:
Figure BDA0002032161270000047
Figure BDA0002032161270000051
其中ht表示第t个学习器,Dbs是自助采样产生的样本分布。
Bagging可以应用于二分类、多分类和回归等任务,这是它的一个优点。除此之外,它还可以将初始训练集中剩下的样本用作验证集来对泛化性能进行“包外估计(out-of-bag estimate)”,需记录每个基学习器所使用的训练样本。令Dt表示ht实际使用的训练样本集,令Hoob(x)表示对样本x的包外预测,即仅考虑那些未使用x训练的基学习器在x上的预测为
Figure BDA0002032161270000052
则Bagging泛化误差的包外估计为
Figure BDA0002032161270000053
在对预测输出进行判断时,Bagging通常对分类任务使用简单投票法;将hi在样本x上的预测输出表示为一个N维向量
Figure BDA0002032161270000054
其中hi是在类别标记cj上的输出。
绝对多数投票法(majority voting)
Figure BDA0002032161270000055
即若某标记得票过半数,则预测为该标记;否则拒绝预测。
相对多数投票法(plurality voting)
Figure BDA0002032161270000061
即预测为得票最多得标记,若同时有多个标记获得高票,则从中随机选取一个。
加权投票法(weighted voting)
Figure BDA0002032161270000062
与加权平均法类似,wi是hi的权重,通常wi≥0,
Figure BDA0002032161270000063
实验评估
本实施例以准确率(Acc)、阳性预测值(PPV)、灵敏度(Se)、特异性(Sp)以及γ作为算法的评估指标。
以上指标公式以及分类的混淆矩阵如下所示:
Figure BDA0002032161270000064
Figure BDA0002032161270000065
Figure BDA0002032161270000066
Figure BDA0002032161270000067
γ=Se+Sp-1 (12)
混淆矩阵表
Figure BDA0002032161270000068
实验与结果分析
不同随机因子的实验结果分析:
由于随机森林具有随机性,当不设置随机因子时,它会产生不同的分类效果。所以在DS2数据集上对RF的不同因子做了实验分析,其结果见下表:
Figure BDA0002032161270000071
在实验中以2的指数倍增长的速度来研究不同随机因子所造成的影响。很显然在上表中可以看出,当随机因子为4时,RF的性能表现最好,其五个指标值都达到了最高点,分别为99.35%,97.15%,93.67%,99.81%和93.48%。其中Acc值和Sp值波动范围不大,都不超过0.5%,而另外的三个值波动范围都在3%左右。因此,说明随机因子对该实验结果还是有一定影响力的。
本实施例用Acc、PPV、Se、Sp、γ这五个评估指标,比较了K近邻(KNN)、梯度提升树(GBDT)、朴素贝叶斯(NB)、多层感知器(MLP)、决策树(DT)和随机森林(RF)算法在不平衡的二分类数据集(DS2)上性能的差别。其实验结果对比见下表:
表1各种分类器的实验结果分析
Figure BDA0002032161270000072
从表1中的结果可知,与其他算法相比使用NB算法得到的结果相差较大,如NB的PPV值、Se值和γ值分别为63.28%、56.45%、55.83%。说明该算法不适合用于该数据集。结果较好的分别是DT和RF,RF是由多个决策树组合而成,选取投票结果作为最终结果,自然分类效果会好于DT。同样地,GBDT也是由多颗树组成的,它与RF的区别就在于它是由回归树组成,只能串行生长,对于最终的结果而言,采取的是将所有结果累加起来而不是投票的方式;因此,GBDT的分类效果会略差一点。
在表1中可以看出,RF已经有了较高的结果,其Acc值为99.35%,PPV值为97.15%,Se值为93.67%,Sp值为99.81%,γ值为93.48%。但Se值和γ值相对Acc值、PPV值和Sp值偏低。因此,针对此问题做了一些实验。由于44条记录中N远远多于V,所以采取上采样方法,将44条记录中所有的V类型数据按2倍、3倍、4倍的扩展,然后用与DS2中同样的22条记录进行测试,得到的测试数据集分别记为DS2_2V、DS2_3V、DS2_4V。上采样后的数据集中虽然会有很多数据重叠,但由于RF随机性的引入,所以并不用担心过拟合这个问题。根据不同的数据集所做的实验结果见下表:
表2不平衡数据集的实验结果分析
Figure BDA0002032161270000081
Figure BDA0002032161270000091
通过实验对比的分析,从上表可知,随着PVC类数据的不断增加,数据间的不平衡差距也越来越小,得到的所有分类器结果也越来越好。与在DS2上的RF结果相比,这次得到了更好的分类效果,Acc值从99.35%到99.45%,PPV值从97.15%升到99.20%,Se值由93.67%升到98.05%,Sp值由99.81%到99.79%,γ值从93.48%升到97.84%。除了Acc值与Sp值略微变化之外,其他三个结果变动非常大。从而得知,虽然RF可以平衡误差,但当类别比例差别足够大时,数据集不平衡问题依然会对实验造成影响。
尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于异常特征值的室性早搏智能分析方法,其特征在于,包括以下步骤:
1)、信号预处理,用小波滤波器对原始信号进行去噪处理,之后再通过斜率、幅度和宽度的数字分析来定位QRS复合波,最后再从完整的ECG信号中以R峰为中心进行分割提取单个心拍;
2)、特征提取,选取QRS复合波面积、RR间期和QRS振幅矢量和作为特征参数用于分类器的输入;
3)、模型训练,通过自助法重采样技术,从原始训练样本集中有放回地重复随机抽取k个样本生成新的训练样本集合,然后根据自助样本集生成M个分类树组成随机森林,根据分类树投票多少形成的分数确定新数据的分类结果。
2.根据权利要求1所述的基于异常特征值的室性早搏智能分析方法,其特征在于,所述步骤3)中所述随机森林的构建方法包括以下步骤:
S21、从原始训练集中使用Bootstraping方法随机有放回采样选出k个样本,共进行Tree_M次采样,生成Tree_M个训练集;
S22、对步骤S21中Tree_M个训练集,分别训练Tree_M个决策树模型;
S23、对于步骤S22中单个决策树模型,假设训练样本特征的个数为m,那么每次分裂时根据基尼指数选择最好的特征进行分裂;
S24、每棵决策树都按着步骤S23的过程分裂下去,直到该节点的所有训练样例都属于同一类,在决策树的分裂过程中不需要剪枝;
S25、将生成的多棵决策树组成随机森林,按多棵树分类器投票决定最终分类结果。
3.根据权利要求2所述的基于异常特征值的室性早搏智能分析方法,其特征在于:所述随机森林的构件方法还包括构建随机森林分类器。
4.根据权利要求3所述的基于异常特征值的室性早搏智能分析方法,其特征在于:所述随机森林分类器的构建方法为使用基于CART决策树来构建随机森林分类器,具体的,所述CART决策树使用基尼指数来选择划分属性。
CN201910303529.3A 2019-02-28 2019-04-18 一种基于异常特征值的室性早搏智能分析方法 Expired - Fee Related CN110020636B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910153776 2019-02-28
CN201910153776X 2019-02-28

Publications (2)

Publication Number Publication Date
CN110020636A CN110020636A (zh) 2019-07-16
CN110020636B true CN110020636B (zh) 2022-10-04

Family

ID=67191484

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910303529.3A Expired - Fee Related CN110020636B (zh) 2019-02-28 2019-04-18 一种基于异常特征值的室性早搏智能分析方法

Country Status (1)

Country Link
CN (1) CN110020636B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110604578A (zh) * 2019-09-04 2019-12-24 平顶山学院 基于semg的人手手内动作识别方法
CN111557659B (zh) * 2020-05-22 2023-04-28 郑州大学 基于多特征融合与Stacking-DWKNN算法的心律失常分类方法
CN112043252B (zh) * 2020-10-10 2021-09-28 山东大学 基于脉搏信号中呼吸成分的情绪识别系统及方法
CN112633167B (zh) * 2020-12-23 2024-04-16 杭州电子科技大学 一种基于SaO2信号多种基线特征的自动识别SAHS方法
CN114549939B (zh) * 2022-04-26 2022-09-23 汉谷云智(武汉)科技有限公司 一种基于图像特征提取的树木病虫害图片分类方法
CN115883861A (zh) * 2022-11-08 2023-03-31 咪咕动漫有限公司 视频直播方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107395590A (zh) * 2017-07-19 2017-11-24 福州大学 一种基于pca和随机森林分类的入侵检测方法
CN107766883A (zh) * 2017-10-13 2018-03-06 华中师范大学 一种基于加权决策树的优化随机森林分类方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8306942B2 (en) * 2008-05-06 2012-11-06 Lawrence Livermore National Security, Llc Discriminant forest classification method and system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107395590A (zh) * 2017-07-19 2017-11-24 福州大学 一种基于pca和随机森林分类的入侵检测方法
CN107766883A (zh) * 2017-10-13 2018-03-06 华中师范大学 一种基于加权决策树的优化随机森林分类方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于多尺度快速样本熵与随机森林的心电图分析;姜苗苗等;《现代生物医学进展》;20180930(第18期);全文 *
基于极限学习机的室性早搏判别算法的实现;王瑞荣等;《中国生物医学工程学报》;20170420(第02期);全文 *

Also Published As

Publication number Publication date
CN110020636A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
CN110020636B (zh) 一种基于异常特征值的室性早搏智能分析方法
CN107822622B (zh) 基于深度卷积神经网络的心电图诊断方法和系统
Sk et al. Coronary Heart Disease Prediction and Classification using Hybrid Machine Learning Algorithms
Hosseini et al. The comparison of different feed forward neural network architectures for ECG signal diagnosis
CN1816303B (zh) 用于分类心动描记数据的方法
CN111000553B (zh) 一种基于投票集成学习的心电数据智能分类方法
CN112603330B (zh) 心电信号识别分类方法
CN110766099A (zh) 结合判别式深度置信网络和主动学习的心电分类方法
Rohmantri et al. Arrhythmia classification using 2D convolutional neural network
CN116503673B (zh) 一种基于心电图的心律失常识别检测方法及系统
CN109033990B (zh) 基于类内类间距离的cnn模型心拍分类方法
Xie et al. Intelligent analysis of premature ventricular contraction based on features and random forest
Li et al. Research on massive ECG data in XGBoost
Al Rahhal et al. Automatic premature ventricular contractions detection for multi-lead electrocardiogram signal
CN110522446A (zh) 一种准确性高实用性强的脑电信号分析方法
CN117398084A (zh) 基于轻量化混合模型的生理信号实时质量评估方法
Liu et al. FGSQA-Net: A weakly supervised approach to fine-grained electrocardiogram signal quality assessment
De Toro et al. Evolutionary algorithms for multiobjective and multimodal optimization of diagnostic schemes
Bavani et al. Classification of Arrhythmia Disease using Enhanced RNN Model
Sraitih et al. An overview on machine learning methods for ECG Heartbeat Arrhythmia Classification
Chudacek et al. Comparison of seven approaches for holter ECG clustering and classification
Ebrahimpoor et al. Premature Ventricular Contractions Detection by Multi-Domain Feature Extraction and Auto-Encoder-based Feature Reduction
Moqurrab et al. HRIDM: Hybrid Residual/Inception-Based Deeper Model for Arrhythmia Detection from Large Sets of 12-Lead ECG Recordings
Gold et al. Heart failure prediction framework using random forest and J48 with Adaboost algorithms
Wen et al. ECG beat classification using GreyART network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20221004