CN109033990A - 基于类内类间距离的cnn模型心拍分类方法 - Google Patents

基于类内类间距离的cnn模型心拍分类方法 Download PDF

Info

Publication number
CN109033990A
CN109033990A CN201810708608.8A CN201810708608A CN109033990A CN 109033990 A CN109033990 A CN 109033990A CN 201810708608 A CN201810708608 A CN 201810708608A CN 109033990 A CN109033990 A CN 109033990A
Authority
CN
China
Prior art keywords
class
heart
cnn model
model
clapped
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810708608.8A
Other languages
English (en)
Other versions
CN109033990B (zh
Inventor
游大涛
武相军
耿旭东
魏梦凡
原永朋
朱凯歌
任广龙
方旭阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University
CERNET Corp
Original Assignee
Henan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University filed Critical Henan University
Priority to CN201810708608.8A priority Critical patent/CN109033990B/zh
Publication of CN109033990A publication Critical patent/CN109033990A/zh
Application granted granted Critical
Publication of CN109033990B publication Critical patent/CN109033990B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • G06F2218/06Denoising by applying a scale-space analysis, e.g. using wavelet analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

本发明涉及ECG心拍分类技术领域,尤其涉及基于类内类间距离的CNN模型心拍分类方法。基于类内类间距离的CNN模型心拍分类方法,包括:构建心拍特征数学模型;基于心拍特征数学模型,构建共性CNN模型;基于心拍特征数学模型,在共性CNN模型的基础上,采用类内距最小化类间距最大化方法对共性CNN模型进行改进,用以构建个性CNN模型;综合个性CNN模型的输出信息对心拍进行分类。本发明建立了共性CNN模型提取心拍的类间共性特征、类内距最小化类间距最大化的个性CNN模型提取心拍的类别个性特征,解决了由心拍类数据量不平衡导致的不能有效提取心拍特征的问题;将完整的心拍作为CNN的输入特征,实现了模型完全自动充分的提取心拍特征,进而准确的对心拍分类。

Description

基于类内类间距离的CNN模型心拍分类方法
技术领域
本发明涉及ECG心拍分类技术领域,尤其涉及基于类内类间距离的CNN模型心拍分类方法。
背景技术
心脏疾病严重威胁人类的身体健康,世界卫生组织2015年公布的全球十大死亡病因中,因缺血性心脏病(又称冠心病)死亡的人数占876万人,位于第一位;ECG诊断是检测心脏疾病最基础、最常用的方法,而人工诊断不能有效的提取ECG中的特征,导致误诊率比较高,2004-2013年发表在中文医学期刊并经遴选纳入误诊疾病数据库的急性心肌梗死文献共485篇,累及误诊病例7840例,误诊率19.62%;因此,使用计算机挖掘ECG中的深层特征,实现计算机自动ECG诊断成为ECG研究的重要方向,其中ECG心拍分类对ECG自动诊断和临床有重要价值。
研究人员在ECG心拍特征提取方面做了大量的研究工作,研究分为单个心拍特征提取和海量心拍特征提取两个阶段。在单个心拍特征提取中,王超文等(王超文.小波变换应用于QRS波检测的研究[D];天津大学,2000.)使用小波变换检测QRS波准确率达99.71%;陈日清等(陈日清,吴剑,韩永贵,et al.基于双侧累计面积的心电信号P波检测[J].中国医药导刊,2015,(s1):36-9.)使用累计面积法检测P波准确率达99%;宋晋忠等(宋晋忠,严洪,李力,et al.一种基于R波和T波的心电图ST段夹逼检测方法[J].生物医学工程学杂志,2011,28(5):855-9.)根据R波和T波的位置检测ST段准确率达到92%以上;综上所述R波、P波、T波等特征检测准确率很高,这为海量心拍特征的自动提取做了铺垫。在海量心拍特征提取中,颜昊霖等(颜昊霖,安勇,王宏飞,et al.基于卷积神经网络的心电特征提取[J].计算机工程与设计,2017,(04):1024-8.)先人工提取RR间期特征和QRS波群作为CNN的输入特征,经过神经网络的卷积和池化操作提取心拍特征,把平均灵敏度提高到88.51%、平均阳性检测率提高到63.27%;Zhang等(ZHANG Z,DONG J,LUO X,et al.Heartbeatclassification using disease-specific feature selection[J].Computers inBiology&Medicine,2014,46(1):79-89.)先人工提取RR、QT、PR间期等特征作为支持向量机(Support Vector Machine,SVM)的输入,然后训练SVM提取心拍深层特征,把F类心拍灵敏度提高到93.81%;Mar等(MAR T,ZAUNSEDER S,MART NEZ J P,et al.Optimi-zation ofECG classification by means of feature selection[J].IEEE Transactions onBiomedical Engineering,2011,58(8):2168-77.)先人工提取RR间期、QRS时限等特征作为多层感知机(Multi-layer Perceptron,MLP)的输入,然后训练MLP挖掘心拍深层特征,把N类心拍的阳性检测率提高到99.12%;S Kiranyaz等(KIRANYAZ S,INCE T,PULKKINEN J,etal.Personalized long-term ECG classification:A systematic approach[J].ExpertSystems with Applications,2011,38(4):3220-6.)先人工提取了RR间期等特征作为K-means聚类的输入,然后提取ECG中的高维特征,把V类心拍的灵敏度提高到96.89%,阳性检测率提高到99.46%;鄢羽等(鄢羽,孙成.基于聚类分析的心电节拍分类算法[J].计算机应用,2014,34(7):2132-5.)将心拍作为聚类的输入特征,利用心拍的差异性,使用两级聚类分析提取ECG心拍特征,把S类心拍灵敏度提高到89.82%、阳性检测率提高到92.17%。
上述研究提出的方法有四点不足:(1)大部分研究中提供了人工特征(例如:RR间期等),不是完全自动挖掘心拍中的全部特征;(2)只很好的提高了某一心拍类的分类指标,其它指标相对较低;(3)都没有很好的解决由心拍类数据严重不平衡导致的难以有效提取高辨别性心拍特征的问题;(4)没有充分利用各类心拍间的共性信息和个性信息。
发明内容
针对上述问题,本发明提出了基于类内类间距离的CNN模型心拍分类方法,进一步提升ECG自动诊断的性能。
为了实现上述目的,本发明采用以下技术方案:
基于类内类间距离的CNN模型心拍分类方法,包括:
步骤1:构建心拍特征数学模型;
步骤2:基于心拍特征数学模型,构建共性CNN模型;
步骤3:基于心拍特征数学模型,在共性CNN模型的基础上,采用类内距最小化类间距最大化方法对共性CNN模型进行改进,用以构建个性CNN模型;
步骤4:综合个性CNN模型的输出信息对心拍进行分类。
进一步地,所述步骤1包括:
ECG的心拍特征数学模型表示如下:
ρ(Xt)=ρ(Xt)c+ρ(Xt)s (1)
其中,Xt∈RD是t时刻D维ECG心拍向量,ρ(Xt)为心拍特征,ρ(Xt)c为心拍的类间共性特征,ρ(Xt)s为心拍的类别个性特征。
进一步地,所述步骤2包括:
步骤2.1:将训练集X∈RD×T、训练集的4维标注向量Y∈R4×T输入传统CNN模型,基于构建的心拍特征数学模型进行训练;所述训练集由等量的D维4类随机心拍数据组成;
步骤2.2:输出第i层第n个由Ti矩阵组成的卷积函数
i=1,...,3;n=1,...,N的权重的偏移量第j层第m个池化函数 j=1,...,2;m=1,...,M的权重的偏移量输出层的损失函数的权重和fh的偏移量bh∈R;
步骤2.3:根据如下公式采用后向传播算法计算步骤2.2得出的wh的误差项bh的误差项的误差项的误差项的误差项的误差项
其中,ε为收敛阈值,c为类别数,Relu为激活函数;
并依据优化器的学习速率ρ对wh、bh进行调整,得到共性CNN模型;所述优化器采用AdamOptimizer,学习速率ρ=0.0001。
进一步地,所述步骤3包括:
步骤3.1:采用如下公式作为个性CNN模型的损失函数:
其中,表示第t个训练数据属于c类的实际概率值,是第t个训练数据的标注向量; 是基于交叉熵的类间距,当等于Yt时不参与类间距的计算;是基于交叉熵的类内距;
公式(3)进一步表示为:
其中表示实际类型为的训练数据在CNN上输出的期望概率;
步骤3.2:将训练集Xk∈RD×T,k=1,...,4、k类心拍训练集的4维标注向量Yk∈R4×T、共性CNN模型的i=1,...,3;n=1,...,N及其对应的输出权重和偏移量j=1,...,2;m=1,...,M及其对应的输出权重和偏移量及其对应的输出权重和偏移量bh∈R输入传统CNN模型,基于构建的心拍特征数学模型进行训练;
步骤3.3:输出k类心拍对应的i=1,...,3;n=1,...,N及其对应的输出权重和偏移量j=1,...,2;m=1,...,M及其对应的输出权重和偏移量及其对应的输出权重和偏移量bh∈R;
步骤3.4:根据如下公式采用后向传播算法计算步骤3.3得出的wh的误差项bh的误差项的误差项的误差项的误差项的误差项
并依据优化器的学习速率ρ对wh、bh进行调整,得到4类心拍对应的4类个性CNN模型;所述优化器采用AdamOptimizer,学习速率ρ=0.0001。
进一步地,所述步骤4包括:
步骤4.1:使用构建的共性CNN模型和个性CNN模型提取心拍测试集的心拍特征;
步骤4.2:使用4类个性CNN模型分别计算同一心拍测试集的真实值与预测值之间的相似度,心拍测试集中的每个心拍数据均得到4个心拍相似度向量;
步骤4.3:在同一心拍数据对应的4个心拍相似度向量中,将相似度最大的类别作为该心拍的类别。
与现有技术相比,本发明具有的有益效果:
本发明通过构建共性CNN模型用以表达各类心拍的共性信息,解决由数据不均衡导致的共性信息偏差较大的问题;然后在共性CNN模型的基础上,采用类内距最小化类间距最大化方法对传统CNN模型进行改进,用以构建能有效表达相应类个性信息分布的个性CNN模型,解决共性CNN模型因单类数据量不足及缺乏类间距约束带来的类别个性信息表达不充分和辨别性较低的问题;最后综合个性CNN模型的输出信息对心拍进行分类。
本发明建立了共性CNN模型提取心拍的类间共性特征、类内距最小化类间距最大化的个性CNN模型提取心拍的类别个性特征,解决了由心拍类数据量不平衡导致的不能有效提取心拍特征的问题;将完整的心拍作为CNN的输入特征,实现了模型完全自动充分的提取心拍特征,进而准确的对心拍分类。由实验可知,本发明在MIT-BIH数据库上识别4类心拍的各项评价指标全部达到100%。
附图说明
图1为本发明实施例的基于类内类间距离的CNN模型心拍分类方法的基本流程图之一。
图2为本发明实施例的基于类内类间距离的CNN模型心拍分类方法的标准ECG图。
图3为本发明实施例的基于类内类间距离的CNN模型心拍分类方法的四类心拍波形图。
图4为本发明实施例的基于类内类间距离的CNN模型心拍分类方法的识别心拍的CNN结构示意图。
图5为本发明实施例的基于类内类间距离的CNN模型心拍分类方法的基本流程图之二。
具体实施方式
下面结合附图和具体的实施例对本发明做进一步的解释说明:
实施例一:
如图1所示,本发明的一种基于类内类间距离的CNN模型心拍分类方法,包括以下步骤:
步骤S101:构建心拍特征数学模型。
ECG心拍的特征数学模型可以表示如下:
ρ(Xt)=ρ(Xt)c+ρ(Xt)s (1)
其中Xt∈RD是t时刻D维ECG心拍向量,ρ(Xt)为心拍特征,ρ(Xt)c为心拍的类间共性特征,ρ(Xt)s为心拍的类别个性特征。鉴于各类间数据的不均衡性,如果直接训练一个统一的特征生成模型,则必然会导致数据量较小类对应的特征存在辨别性不高的问题;而为每类单独训练特征生成模型又会导致数据量较小类对应的模型训练不充分的问题。
步骤S102:基于心拍特征数学模型,构建共性CNN模型。
这里使用各类等量的组合数据集训练CNN模型,获得能有效表达各类心拍间共性信息的高维投影变换函数,这里命名此CNN模型为共性CNN模型。共性CNN模型算法描述见表1。
表1共性CNN模型训练算法
步骤S102包括:
步骤S1021:将训练集X∈RD×T、训练集的4维标注向量Y∈R4×T输入传统CNN模型,基于构建的心拍特征数学模型进行训练;所述训练集由等量的D维4类随机心拍数据组成;
步骤S1022:输出第i层第n个由Ti矩阵组成的卷积函数i=1,...,3;n=1,...,N的权重的偏移量第j层第m个池化函数j=1,...,2;m=1,...,M的权重的偏移量输出层的损失函数的权重和fh的偏移量bh∈R;作为一种可实施方式,采用交叉熵作为输出层的损失函数;
步骤S1023:根据如下公式采用后向传播算法计算步骤S1022得出的wh的误差项bh的误差项的误差项的误差项的误差项的误差项
其中,ε为收敛阈值,c为类别数,Relu为激活函数;
并依据优化器的学习速率ρ对wh、bh进行调整,得到共性CNN模型;所述优化器采用AdamOptimizer,学习速率ρ=0.0001。
步骤S103:基于心拍特征数学模型,在共性CNN模型的基础上,采用类内距最小化类间距最大化方法对共性CNN模型进行改进,用以构建个性CNN模型。
目前常规的多分类CNN均使用交叉熵作为损失函数,该损失函数的优点是借助降低整体信息损失以提升CNN模型对训练数据真实分布的表达能力。该损失函数的表达式如下:
其中yt,c∈Yt=[yt,1,...,yt,C]表示第t个训练数据属于c类的实际概率值,表示CNN模型输出的第t个训练数据属于c类的期望概率值。
从公式(2)可知,交叉熵损失函数仅关注整体信息而忽略了不同类间的距离信息,这导致其虽然可以使CNN模型学习到训练数据的近似分布,但难以增大该近似分布中不同类别对应的子分布间距离,致使不同子分布间存在交集,进而影响CNN模型的分类性能。为了解决这一问题,本发明提出了一个基于类内距最小化类间距最大化方法的CNN损失函数,该损失函数的具体公式如下:
其中表示第t个训练数据属于c类的实际概率值,是第t个训练练数据的标注向量; 是基于交叉熵的类间距,当等于Yt时不参与类间距的计算;是基于交叉熵的类内距。
鉴于任一训练数据标注向量的元素中,实际类对应元素的概率值为1,其他均为0,所以公式(3)可进一步表示为:
其中表示实际类型为的训练数据在CNN上输出的期望概率。
依据公式(4)可知,该损失函数不仅关注整体的信息损失,而且也关注类间的距离信息。所以在表1的算法学习得到的共性CNN模型系数基础上以最小化的方式训练CNN时,可以合理地推测该损失函数在确保最小化类内距和最大化类间距条件下可尽可能地近似各类数据的真实分布,理论上可以有效地避免类间子分布存在交集的问题。为了便于表述,这里称基于的CNN模型为个性CNN模型。个性CNN模型算法描述见表2。
表2个性CNN模型训练算法
步骤S103包括:
步骤S1031:将训练集Xk∈RD×T,k=1,...,4、k类心拍训练集的4维标注向量Yk∈R4 ×T、共性CNN模型的i=1,...,3;n=1,...,N及其对应的输出权重和偏移量j=1,...,2;m=1,...,M及其对应的输出权重和偏移量及其对应的输出权重和偏移量bh∈R输入传统CNN模型,基于构建的心拍特征数学模型进行训练;
步骤S1032:输出k类心拍对应的i=1,...,3;n=1,...,N及其对应的输出权重和偏移量=1,...,2;m=1,...,M及其对应的输出权重和偏移量及其对应的输出权重和偏移量bh∈R,;
步骤S1033:根据如下公式采用后向传播算法计算步骤S1032得出的wh的误差项bh的误差项的误差项的误差项的误差项的误差项
并依据优化器的学习速率ρ对wh、bh进行调整,得到4类心拍对应的4类个性CNN模型;所述优化器采用AdamOptimizer,学习速率ρ=0.0001。
步骤S104:综合个性CNN模型的输出信息对心拍进行分类。
心拍类判定方法如下:使用构建的共性CNN模型和个性CNN模型提取心拍测试集的心拍特征,包括:通过构建的共性CNN模型提取心拍测试集中心拍的类间共性特征,通过构建的个性CNN模型提取心拍测试集中心拍的类别个性特征;然后使用4类个性CNN模型分别计算同一心拍测试集的真实值与预测值之间的相似度,心拍测试集中的每个心拍数据均得到4个心拍相似度向量,最后在同一心拍数据对应的4个心拍相似度向量中,将相似度最大的类别作为该心拍的类别。
选择交叉熵度量心拍预测值与真实值的相似度。交叉熵可以计算2个分布的距离,交叉熵越小两个概率分布距离越小、相似度越大。交叉熵定义如下:设两个离散随机变量的概率分布P和Q,交叉熵H(P,Q)为:
H(P,Q)=-∑xP(x)log Q(x) (5)
将测试集分别给训练好的四类个性CNN模型,得到H(PN,QN)、H(PS,QS)、H(PV,QV)、H(PF,QF)四个ECG心拍测试集的交叉熵向量(每一个心拍对应一个交叉熵),求出同一个心拍在各类个性CNN模型中交叉熵最小的值,数学模型如下:
H=min[H(PN,QN),H(PS,QS),H(PV,QV),H(PF,QF)] (6)
其中P代表心拍预测概率分布,Q代表心拍真实概率分布,H代表的类即为CNN模型预测的类。
作为一种可实施方式,使用MIT-BIH数据库提供的数据进行了实验。在训练CNN模型之前,先利用DB4小波对MIT-BIH数据库中所用到的数据进行预处理;然后在MIT-BIH数据库提供的心拍数据基础上训练共性CNN模型和个性CNN模型,提取心拍特征判定心拍类型,求出各类实验指标;最后对实验结果进行分析与讨论。
心电图记录的是心脏连续周期搏动产生的微弱生物电信号。一个标准完整的ECG心拍如图2所示,由P波、QRS波、T波和U波组成,心拍时间约0.72s(18*0.04s=0.72s)。
本发明使用国际公认标准的MIT-BIH心电图数据库。它的ECG采样频率为360HZ,一个心拍大约由260个数据点(0.72*360=259.2)组成,因此提取256个点(一个心拍)作为CNN模型的输入特征。它有48条记录,每条记录由头文件[.hea]、数据文件[.dat]、注释文件[.atr]组成,记录时间为30分钟左右,大概有65万个数据点。依据美国医疗仪器促进协会(AAMI)对ECG心拍的分类标准,将ECG心拍分为正常类(N)、室上性心律异常(S)、室性心律异常(V)、融合心跳(F)、未确定(Q)五类。此外,将MIT-BIH数据库中48条记录分为训练集和测试集,提取了5类心拍的数据,并计算了心拍的数量,如表3所示。
表3 MIT-BIH数据库中不同类别心拍数量
表3显示Q类仅有15个心拍,因此舍弃Q类,只研究N、S、V、F四类心拍,同时为了更直观的分辨4类波形的形状,从MIT-BIH数据库4类心拍中随机提取了具有代表性的4个心拍,并绘制成心电波形如图3。从表3还可以看到S类和F类心拍样本较少,为了降低ECG心拍类别不平衡性,通过2点、3点、4点平滑滤波(求平均值)将S类扩大2倍,F类扩大4倍。
心电信号通过导联线采集时,容易受到环境的影响,例如肌电干扰、工频干扰、基线漂移等。因此,对心拍分类之前需要对ECG进行预处理去除噪声干扰。小波不仅可以解决信号的频域问题,也可以解决信号在时域上局部信息很难表达的问题。其中,Daubechies小波具有指数多项式消失距、紧支集和正交等特性,因此使用Daubeachies小波去除噪声干扰。
Daubeachies小波没有明确的数学表达式由两尺度方程计算构造得到,Daubechies小波的两尺度函数为:
随着消失距N增大,虽然波形的光滑性越好,但是hk的数量会增加,计算量增大。4阶消失距对应的小波函数和尺度函数都有连续的导函数。因此本发明使用四阶消失距(N=4)的Daubeachies小波对心电信号进行两次分解和重构去除噪声干扰,其中k=[0,7],k∈Z。
卷积神经网络(CNN)是由卷积层、池化层和全连接层组成的前馈神经网络,它可以稀疏网络连接、减少计算量、挖掘更深的数据特征。
卷积是对特征和权值乘积后的求和,提取更深的特征,它可以将上一层的感受野(局部数据块)映射为下一层的一个神经元,感受野的大小由卷积核决定,每一个神经元的权重个数是卷积核的大小。它有稀疏连接、参数共享、不变性等性质。
池化层可以通过求特征的平均值、最大值等,对特征进行降采样,裁剪原始数据的尺寸,进一步减少全连接中的参数个数,加快神经网络的计算速度、防止过拟合等。
本发明参考LeNet5模型设计了识别心拍的CNN结构,如图4所示。根据MIT-BIH数据库提供的“.atr”文件中标注的心电图R尖峰的位置,提取R尖峰的前128个数据点、R尖峰后129个数据点、R尖峰,组成输入层的256个输入特征(一个心拍)。心拍在CNN模型中,先经过卷积、池化操作进行降维和特征生成,然后在输出层(OUTPUT)上,softmax模型将生成的4维特征向量转化成4维概率分布输出。因为计算心拍交叉熵的预测值概率分布与真实值概率分布的维度需要相同,所以本发明设置4类真实值概率分布为[1,0,0,0]代表N类、[0,1,0,0]代表S类、[0,0,1,0]代表V类、[0,0,0,1]代表F类。
识别ECG心拍的CNN结构参数详细描述如表4。
表4识别心拍的CNN结构参数
本发明另一种基于类内类间距离的CNN模型心拍分类方法如图5所示,具体包括:
从MIT-BIH数据库中提取ECG训练数据集,经过去除噪声、滤波、增加样本后,从每类样本集中随机抽取1500个样本,并将4类数据随机组合,50个ECG样本为一组。使用组合的6000个ECG样本训练共性CNN模型,共迭代120次,计算共性CNN的权值和偏置,传递给识别心拍的个性CNN模型。然后使用类别样本集(每类1500个样本)训练个性CNN模型(例如:N类样本集训练N类CNN模型),得到4类个性CNN模型。
从MIT-BIH数据库中提取测试集,对测试集只进行了去除噪声、滤波,得到4类数据测试心拍样本个数为N类44238个、S类1836个、V类3221个、F类388个,随机组合后共49690个测试样本。将测试集分别传递个4类训练好的模型,得到4个含有49690个交叉熵的向量,求出4个交叉熵向量中同一心拍交叉熵最小的类别。
评估ECG分类的指标是灵敏度Se、阳性检测率P+、平均灵敏度Seave、平均阳性检测率P+ ave和综合指标F1,公式如下:
TP代表该类别被正确分类个数,FN表示该类被错分为其他类的个数,FP表示不属于该类却被分类器分为该类的心拍个数。
使用训练集对模型进行了5次训练得到了5组模型系数,并使用这5组模型系数对测试集进行了预测,其中心拍的预测的各项指标都达到100%。预测结果与其他4个方法做了对比,参见表5,表格中带有“*”的斜体数字是根据相应文献提供的数据和本发明提供的公式计算得到。
表5不同方法对心拍识别分类的性能对比
由表5中数据可知,方法1至方法4所对应的方法表现出明显的一致性和差异性。一致性表现为它们在不同类别上的识别性能均是N类最高、V类次之、S类第三、F类最低;从表3可知各类数据量严重不平衡,其中N类数据量最多、V类次之、S类第三、F类最少;通过上述对比可以看出上述方法在各类上识别性能的高低与各类的数据量具有较强的对应关系;原因在于这些方法在模型学习过程中均未能有效地处理数据严重不均衡这一问题,所以才表现上述一致性。
差异性表现在方法2(颜昊霖,安勇,王宏飞,et al.基于卷积神经网络的心电特征提取[J].计算机工程与设计,2017,(04):1024-8.)的性能高于方法1(ZHANG Z,DONG J,LUOX,et al.Heartbeat classification using disease-specific feature selection[J].Computers in Biology&Medicine,2014,46(1):79-89.),而方法3(KIRANYAZ S,INCE T,PULKKINEN J,et al.Personalized long-term ECG classification:A systematicapproach[J].Expert Systems with Applications,2011,38(4):3220-6.)、方法4(鄢羽,孙成.基于聚类分析的心电节拍分类算法[J].计算机应用,2014,34(7):2132-5.)的整体性能又显著高于方法1、方法2;方法2基于传统CNN模型自动特征生成方法的性能优于方法1基于传统SVM模型特征选取方法,据此可合理推测基于自动特征生成方法的潜力可能高于基于经验的传统特征选取方法。由于方法1、方法2基于传统方法,模型不仅未能充分提取心拍的共性特征,也没有充分的表达个性特征,因此模型识别心拍效果不理想;而方法3、方法4提出的基于聚类思想的关键特征生成方法与方法1、方法2中方法相比,这类方法较为充分的获取了各类心拍的共性信息和个性信息,因此这类方法的分类性能较高,但是仍不甚理想。
本发明正是针对上述问题而提出的。该方法首先以共性CNN模型表述各类心拍间的共性信息,接着以类内距最小化和类间距最大化思路改进传统CNN的目标函数,构建各类心拍的个性CNN模型。在MIT-BIH数据库上的实验结果显示,本发明方法在不同类别均取得了相同性能的识别与分类结果,没有出现上述方法1至方法4的4个方法表现出的一致性问题。此外,与上述4个方法中最高识别性能对应的评价指标相比,本发明方法不仅大幅提升在多类上的识别性能,如使S类的Se提升了10.18%,P+提升了7.83%;将V类的Se提升了3.11%;使F类的Se提升了6.19%,P+提升了10.85%,致使平均Seave提升了6.00%,P+ ave提升了5.37%,综合指标F1提升了5.69%。而且还使N类的各项指标提升至最佳。实验结果表明本发明方法明显优于所有现有方法。
上述分析表明,本发明提出的基于类内类间距离的CNN模型心拍分类方法有效地解决了由数据不均衡导致的在特征生成模型设计中遇到的一系列问题,进而完全解决了在MIT-BIH数据库中ECG四类心拍自动分类中存在的分类错误问题。
以上所示仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (6)

1.基于类内类间距离的CNN模型心拍分类方法,其特征在于,包括:
步骤1:构建心拍特征数学模型;
步骤2:基于心拍特征数学模型,构建共性CNN模型;
步骤3:基于心拍特征数学模型,在共性CNN模型的基础上,采用类内距最小化类间距最大化方法对共性CNN模型进行改进,用以构建个性CNN模型;
步骤4:综合个性CNN模型的输出信息对心拍进行分类。
2.根据权利要求1所述的基于类内类间距离的CNN模型心拍分类方法,其特征在于,所述步骤1包括:
ECG的心拍特征数学模型表示如下:
ρ(Xt)=ρ(Xt)c+ρ(Xt)s (1)
其中,Xt∈RD是t时刻D维ECG心拍向量,ρ(Xt)为心拍特征,ρ(Xt)c为心拍的类间共性特征,ρ(Xt)s为心拍的类别个性特征。
3.根据权利要求2所述的基于类内类间距离的CNN模型心拍分类方法,其特征在于,所述步骤2包括:
步骤2.1:将训练集X∈RD×T、训练集的4维标注向量Y∈R4×T输入传统CNN模型,基于构建的心拍特征数学模型进行训练;所述训练集由等量的D维4类随机心拍数据组成;
步骤2.2:输出第i层第n个由Ti矩阵组成的卷积函数 的权重的偏移量第j层第m个池化函数 的权重的偏移量输出层的损失函数的权重和fh的偏移量bh∈R;
步骤2.3:根据如下公式采用后向传播算法计算步骤2.2得出的wh的误差项bh的误差项的误差项的误差项的误差项的误差项
其中,ε为收敛阈值,c为类别数,Relu为激活函数;
并依据优化器的学习速率ρ对wh、bh进行调整,得到共性CNN模型;所述优化器采用AdamOptimizer,学习速率ρ=0.0001。
4.根据权利要求3所述的基于类内类间距离的CNN模型心拍分类方法,其特征在于,所述步骤3包括:
步骤3.1:采用如下公式作为个性CNN模型的损失函数:
其中,表示第t个训练数据属于c类的实际概率值,是第t个训练数据的标注向量;是基于交叉熵的类间距,当等于Yt时不参与类间距的计算;是基于交叉熵的类内距;
公式(3)进一步表示为:
其中表示实际类型为的训练数据在CNN上输出的期望概率;
步骤3.2:将训练集Xk∈RD×T,k=1,...,4、k类心拍训练集的4维标注向量Yk∈R4×T、共性CNN模型的及其对应的输出权重和偏移量及其对应的输出权重和偏移量及其对应的输出权重和偏移量bh∈R输入传统CNN模型,基于构建的心拍特征数学模型进行训练;
步骤3.3:输出k类心拍对应的及其对应的输出权重和偏移量及其对应的输出权重和偏移量及其对应的输出权重和偏移量bh∈R;
步骤3.4:根据如下公式采用后向传播算法计算步骤3.3得出的wh的误差项bh的误差项的误差项的误差项的误差项的误差项
并依据优化器的学习速率ρ对wh、bh进行调整,得到4类心拍对应的4类个性CNN模型;所述优化器采用AdamOptimizer,学习速率ρ=0.0001。
5.根据权利要求4所述的基于类内类间距离的CNN模型心拍分类方法,其特征在于,所述步骤4包括:
步骤4.1:使用构建的共性CNN模型和个性CNN模型提取心拍测试集的心拍特征;
步骤4.2:使用4类个性CNN模型分别计算同一心拍测试集的真实值与预测值之间的相似度,心拍测试集中的每个心拍数据均得到4个心拍相似度向量;
步骤4.3:在同一心拍数据对应的4个心拍相似度向量中,将相似度最大的类别作为该心拍的类别。
6.根据权利要求5所述的基于类内类间距离的CNN模型心拍分类方法,其特征在于,所述相似度通过交叉熵进行计算。
CN201810708608.8A 2018-07-02 2018-07-02 基于类内类间距离的cnn模型心拍分类方法 Active CN109033990B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810708608.8A CN109033990B (zh) 2018-07-02 2018-07-02 基于类内类间距离的cnn模型心拍分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810708608.8A CN109033990B (zh) 2018-07-02 2018-07-02 基于类内类间距离的cnn模型心拍分类方法

Publications (2)

Publication Number Publication Date
CN109033990A true CN109033990A (zh) 2018-12-18
CN109033990B CN109033990B (zh) 2021-08-17

Family

ID=65521243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810708608.8A Active CN109033990B (zh) 2018-07-02 2018-07-02 基于类内类间距离的cnn模型心拍分类方法

Country Status (1)

Country Link
CN (1) CN109033990B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110840402A (zh) * 2019-11-19 2020-02-28 山东大学 一种基于机器学习的房颤信号识别方法及系统
CN111090723A (zh) * 2019-11-18 2020-05-01 清远电力规划设计院有限公司 一种基于知识图谱的电网安全生产内容推荐方法
CN111449645A (zh) * 2020-03-07 2020-07-28 河南大学 心电图心拍智能分类识别方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243398A (zh) * 2015-09-08 2016-01-13 西安交通大学 基于线性判别分析准则的改进卷积神经网络性能的方法
CN105608425A (zh) * 2015-12-17 2016-05-25 小米科技有限责任公司 对照片进行分类存储的方法及装置
CN106805965A (zh) * 2016-12-19 2017-06-09 深圳先进技术研究院 一种心电信号分类方法及装置
WO2017144763A1 (es) * 2016-02-24 2017-08-31 Universidad De Sevilla Procedimiento para la obtención de datos útiles asociados al patrón de variabilidad de la frecuencia cardiaca
CN107622259A (zh) * 2017-10-20 2018-01-23 山东大学 一种t波检测方法、心电数据分析方法及装置
CN107944493A (zh) * 2017-11-30 2018-04-20 天津大学 一种基于卷积神经网络的第一导联心电图心拍分类方法
CN107981858A (zh) * 2017-11-27 2018-05-04 乐普(北京)医疗器械股份有限公司 基于人工智能的心电图心搏自动识别分类方法
CN108186011A (zh) * 2017-12-13 2018-06-22 深圳竹信科技有限公司 房颤检测方法、装置及可读存储介质
CN108229398A (zh) * 2018-01-04 2018-06-29 中科汇通投资控股有限公司 一种自我学习的人脸验证方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243398A (zh) * 2015-09-08 2016-01-13 西安交通大学 基于线性判别分析准则的改进卷积神经网络性能的方法
CN105608425A (zh) * 2015-12-17 2016-05-25 小米科技有限责任公司 对照片进行分类存储的方法及装置
WO2017144763A1 (es) * 2016-02-24 2017-08-31 Universidad De Sevilla Procedimiento para la obtención de datos útiles asociados al patrón de variabilidad de la frecuencia cardiaca
CN106805965A (zh) * 2016-12-19 2017-06-09 深圳先进技术研究院 一种心电信号分类方法及装置
CN107622259A (zh) * 2017-10-20 2018-01-23 山东大学 一种t波检测方法、心电数据分析方法及装置
CN107981858A (zh) * 2017-11-27 2018-05-04 乐普(北京)医疗器械股份有限公司 基于人工智能的心电图心搏自动识别分类方法
CN107944493A (zh) * 2017-11-30 2018-04-20 天津大学 一种基于卷积神经网络的第一导联心电图心拍分类方法
CN108186011A (zh) * 2017-12-13 2018-06-22 深圳竹信科技有限公司 房颤检测方法、装置及可读存储介质
CN108229398A (zh) * 2018-01-04 2018-06-29 中科汇通投资控股有限公司 一种自我学习的人脸验证方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ION VORNICU: "On the design of a class of CNN"s for ECG classification", 《 2011 20TH EUROPEAN CONFERENCE ON CIRCUIT THEORY AND DESIGN (ECCTD)》 *
黄佼等: ""基于一维卷积神经网络的患者特异性心拍分类方法研究",黄佼等,中国医疗设备,第33卷第3期,第11-14页,2018年3月", 《中国医疗设备》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111090723A (zh) * 2019-11-18 2020-05-01 清远电力规划设计院有限公司 一种基于知识图谱的电网安全生产内容推荐方法
CN111090723B (zh) * 2019-11-18 2023-05-05 清远电力规划设计院有限公司 一种基于知识图谱的电网安全生产内容推荐方法
CN110840402A (zh) * 2019-11-19 2020-02-28 山东大学 一种基于机器学习的房颤信号识别方法及系统
CN111449645A (zh) * 2020-03-07 2020-07-28 河南大学 心电图心拍智能分类识别方法

Also Published As

Publication number Publication date
CN109033990B (zh) 2021-08-17

Similar Documents

Publication Publication Date Title
Liu et al. Classification of heart diseases based on ECG signals using long short-term memory
US9968265B2 (en) Method and system for characterizing cardiovascular systems from single channel data
Jovic et al. Electrocardiogram analysis using a combination of statistical, geometric, and nonlinear heart rate variability features
Yang et al. Spatiotemporal differentiation of myocardial infarctions
Li et al. Multi-label classification of arrhythmia for long-term electrocardiogram signals with feature learning
Luo et al. Multi-classification of arrhythmias using a HCRNet on imbalanced ECG datasets
CN109165556A (zh) 一种基于grnn身份识别方法
CN107890348A (zh) 一种基于深度学习法心电节拍特征自动化提取及分类方法
Hosseini et al. A multi-stage neural network classifier for ECG events
Buscema et al. Computer aided diagnosis for atrial fibrillation based on new artificial adaptive systems
CN109033990A (zh) 基于类内类间距离的cnn模型心拍分类方法
Rohmantri et al. Arrhythmia classification using 2D convolutional neural network
Zhang et al. [Retracted] An ECG Heartbeat Classification Method Based on Deep Convolutional Neural Network
Yeh et al. Heartbeat Case Determination Using Fuzzy Logic Method on ECG Signals.
Lin et al. Feature Selection Algorithm for ECG Signals and Its Application on Heartbeat Case Determining.
Dhyani et al. Analysis of ECG-based arrhythmia detection system using machine learning
CN109157211A (zh) 一种便携式心电在线智能监测诊断系统设计方法
Übeyli Implementing wavelet transform/mixture of experts network for analysis of electrocardiogram beats
Nuryani et al. Premature ventricular contraction detection using swarm-based support vector machine and QRS wave features
Ji et al. Heartbeat Classification Based on Multifeature Combination and Stacking‐DWKNN Algorithm
Liu et al. Automatic detection of ECG abnormalities by using an ensemble of deep residual networks with attention
Biloborodova et al. ECG classification using combination of linear and non-linear features with neural network
Yeh An Analysis of ECG for Determining Heartbeat Case by Using the Principal Component Analysis and Fuzzy Logic.
Liu et al. Automatic classification of arrhythmias using multi-branch convolutional neural networks based on channel-based attention and bidirectional LSTM
Verma Development of interpretable machine learning models to detect arrhythmia based on ecg data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201021

Address after: 475001 new campus of Henan University, Jinming Avenue, Jinming District, Kaifeng City, Henan Province

Applicant after: Henan University

Applicant after: CERNET Co.,Ltd.

Address before: 475004 Jinming Avenue Henan University new campus, Jinming District, Kaifeng, Henan

Applicant before: Henan University

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant