CN111297349A - 一种基于机器学习的心律分类系统 - Google Patents
一种基于机器学习的心律分类系统 Download PDFInfo
- Publication number
- CN111297349A CN111297349A CN202010088214.4A CN202010088214A CN111297349A CN 111297349 A CN111297349 A CN 111297349A CN 202010088214 A CN202010088214 A CN 202010088214A CN 111297349 A CN111297349 A CN 111297349A
- Authority
- CN
- China
- Prior art keywords
- model
- layer
- heart beat
- heart
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000033764 rhythmic process Effects 0.000 title claims abstract description 40
- 238000010801 machine learning Methods 0.000 title claims abstract description 11
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 58
- 238000000605 extraction Methods 0.000 claims abstract description 22
- 238000007781 pre-processing Methods 0.000 claims abstract description 15
- 238000007635 classification algorithm Methods 0.000 claims abstract description 12
- 238000013145 classification model Methods 0.000 claims abstract description 12
- 238000001914 filtration Methods 0.000 claims abstract description 6
- 238000011176 pooling Methods 0.000 claims description 32
- 239000013598 vector Substances 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 20
- 238000005070 sampling Methods 0.000 claims description 11
- 238000012886 linear function Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 21
- 230000035945 sensitivity Effects 0.000 abstract description 8
- 238000012545 processing Methods 0.000 abstract description 7
- 238000004458 analytical method Methods 0.000 abstract description 5
- 230000007774 longterm Effects 0.000 abstract description 2
- 238000010606 normalization Methods 0.000 abstract description 2
- 230000006403 short-term memory Effects 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 19
- 238000000034 method Methods 0.000 description 17
- 238000004422 calculation algorithm Methods 0.000 description 16
- 238000012549 training Methods 0.000 description 15
- 230000004913 activation Effects 0.000 description 7
- 238000004088 simulation Methods 0.000 description 7
- 238000013461 design Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 210000002569 neuron Anatomy 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 208000019622 heart disease Diseases 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 230000010349 pulsation Effects 0.000 description 3
- 206010042602 Supraventricular extrasystoles Diseases 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000000747 cardiac effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 208000009729 Ventricular Premature Complexes Diseases 0.000 description 1
- 206010047289 Ventricular extrasystoles Diseases 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010247 heart contraction Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 238000000718 qrs complex Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000004804 winding Methods 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
- A61B5/318—Heart-related electrical modalities, e.g. electrocardiography [ECG]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
- A61B5/318—Heart-related electrical modalities, e.g. electrocardiography [ECG]
- A61B5/346—Analysis of electrocardiograms
- A61B5/349—Detecting specific parameters of the electrocardiograph cycle
- A61B5/366—Detecting abnormal QRS complex, e.g. widening
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7203—Signal processing specially adapted for physiological signals or for diagnostic purposes for noise prevention, reduction or removal
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
- A61B5/7267—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B2576/00—Medical imaging apparatus involving image processing or analysis
- A61B2576/02—Medical imaging apparatus involving image processing or analysis specially adapted for a particular organ or body part
- A61B2576/023—Medical imaging apparatus involving image processing or analysis specially adapted for a particular organ or body part for the heart
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Heart & Thoracic Surgery (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Cardiology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physiology (AREA)
- Psychiatry (AREA)
- Evolutionary Computation (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
本发明公开了一种基于机器学习的心律分类系统,包括数据采集模块、数据预处理模块以及分类算法模块,数据采集模块采集受试者心电信号,数据预处理模块进行噪声分析与滤除,采用从其左间期采集45%的样本,相应右间期采集55%的样本,完成心拍的分割,最后进行归一化处理。在此基础上,构建了卷积神经网络(CNN)模型和编码解码模型的分类算法模块,利用CNN的良好特征提取能力和长短期记忆(LSTM)的时间序列特征提取能力,构建了分类模型,克服RNN本身无法很好处理远距离依赖的问题。本发明的平均灵敏度和平均精确度大幅度提升,在以避免复杂的特征提取,降低手动提取特征值对分类结果,同时提高心律分类的效果。
Description
技术领域
本发明属于医疗设备技术领域,特别是,更为具体地讲,涉及一种基于机器学习的心律分类系统。
背景技术
近些年,随着物质水平的不断提升,人们越来越重视自身的健康状况。在各类疾病中,心脏病不仅是一种较为常见的疾病类型,更对人类的生命健康造成了较大的威胁。
心电图作为一种常见的心脏病检查手段,可以很好地反应心脏在每一时刻的状态,是作为医生确诊心脏病的一个重要参考依据。但心电图的识别仍然需要经验丰富的医务人员才能准确的诊断出病理所在。因此,利用智能医疗设备通过相关算法,实现及时监控当前病人的心脏跳动状态,对心律进行自动分类,具有很强的现实意义,是国内外学者的研究热点。
传统的心律自动分类的实现,主要可分为四部分:数据采集、数据预处理、特征提取以及分类器分类。
数据采集部分,可以通过相关医学诊断设备对受试者进行心电信号的采集,但由于需要对病人进行隐私保护,在大多数研究者的研究过程中,往往采用公开的心律数据集进行相关研究,常用的数据集为国际标准的MIT-BIH心律数据库。
数据预处理部分主要对采集的心电信号进行相关噪声的分析与滤除,为提高后续分类的效率提供基础。常见的噪声类型包括基线漂移、工频干扰、肌电干扰等。
特征提取部分,主要完成心电信号的波形定位、特征值提取等相关功能,处理结果是作为分类器输入部分的直接数据,对分类器的分类准确度有着至关重要的影响。常用的特征提取方法包括形态学和时间特征、小波变换、主成分分析(PCA)等。
分类器是心律自动分类的核心,是实现心律分类的最直接的技术。常用的分类器包括支持向量机SVM、逻辑回归算法、神经网络以及相关混合算法等。
在传统的分类器实现上,往往通过前三个步骤的输出结果,将提取出的心电信号的特征值作为输入,再利用相关分类算法构建分类模型,完成心律的自动分类。由此可知,提取特征值的质量大大影响了后续分类器的分类效果,同时由于手工提取特征值易产生较大的误差,因此,基于深度学习的心律分类算法在近年来成为学者的研究热点。深度学习由于其良好的特征提取能力,可以根据数据的特点,完成较好的特征提取以及分类两项功能,在一定程度上避免了复杂的特征提取工程,降低手动提取特征值对分类结果的影响。因此,对相关深度学习算法进行选择与设计,提高心律分类的效果,具有很强的理论和现实意义。
发明内容
本发明的目的在于克服现有技术的不足,提出一种基于机器学习的心律分类系统,在以避免复杂的特征提取,降低手动提取特征值对分类结果,同时提高心律分类的效果。
为实现上述发明目的,本发明基于机器学习的心律分类系统,包括:
数据采集模块,可以通过相关医学诊断设备对受试者进行心电信号的采集,得到心电信号;
其特征在于,还包括:
数据预处理模块,主要对采集的心电信号进行相关噪声的分析与滤除,然后以心电信号的每个心拍的R峰位置为中心,从其左间期采集45%的样本,相应右间期采集55%的样本,完成心拍的分割,得到一系列的心拍;最后用线性函数对每一个心拍进行归一化处理:
这样,得到一系列归一化的心拍,每个心拍大小为64(即64个采样值);
分类算法模块,为卷积神经网络(CNN)模型和编码解码模型的混合分类模型,其中,采用卷积神经网络(CNN)模型用来完成对心拍的特征提取,从全连接层输出,编码解码模型用于根据提取的心拍特征,对心拍(心律)进行分类;
所述编码解码模型包括编码器和解码器,其中,编码器采用RNN模型结构,输入为CNN模型全连接层输出的心拍特征(即特征向量),输出为对应目标值的编码,并作为解码器输入,解码器采用LSTM模型结构,输出为对应目标的向量,进而通过softmax函数转为概率值,逐个拍生成心拍类型。
本发明的目的是这样实现的。
本发明基于机器学习的心律分类系统,包括数据采集模块、数据预处理模块以及分类算法模块,数据采集模块采集受试者心电信号,数据预处理模块进行噪声分析与滤除,采用从其左间期采集45%的样本,相应右间期采集55%的样本,完成心拍的分割,最后进行归一化处理,得到一系列归一化的心拍。在此基础上,构建了卷积神经网络(CNN)模型和编码解码模型的分类算法模块,利用CNN的良好特征提取能力和长短期记忆(LSTM)的时间序列特征提取能力,构建了分类模型,克服RNN本身无法很好处理远距离依赖的问题,即当输入数据较多时,会出现梯度消失的问题。本发明的平均灵敏度和平均精确度大幅度提升,在以避免复杂的特征提取,降低手动提取特征值对分类结果,同时提高心律分类的效果。
附图说明
图1是本发明基于机器学习的心律分类系统一种具体实施方式原理框图;
图2是心拍波形组成结构示意图;
图3是四种类型心拍的波形图;
图4是心拍分割示意图;
图5是编码解码模型的组成结构示意图;
图6是CNN模型与编码解码模型组合的混合分类模型结构一种具体实施方式结构示意图;
图7是三种模型下四类不同心律种类对应的F1值曲线图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
图1是本发明基于机器学习的心律分类系统一种具体实施方式原理框图。
在本实施例中,如图1所述,本发明基于机器学习的心律分类系统,其特征在于,包括:数据采集模块1、数据预处理模块2以及分类算法模块3。
1、数据采集模块
数据采集模块1通过相关医学诊断设备对受试者进行心电信号的采集,得到心电信号。
由于病人患病情况具有较强的隐私性,因此在本实施例采用国际公开标准数据集MIT-BIH心律数据库作为训练与测试的数据集。该数据库分别来自48个不同患者的采集结果,共记录了48条心跳记录,每条心跳记录大约30分钟。由于心律异常类型较为复杂,本发明根据推进医疗器械(AAMI)的建议,将心律类型分为五大类型,分别为N(正常搏动),S(室上性异位搏动),V(室性异位搏动),F(融合心拍)和Q(未知心拍)。具体分类情况如表1所示。
表1
如图2所示,一个心拍的波形主要由P波,T波,R峰以及QRS波群等组成。对于表1中的前四种心拍类型,每一类型心拍都具有各自的波形特征与特点,如图3所示,其具体的波形特征分别描述如下:第一类为正常心拍N,R波波峰朝上,且峰值较大,P波与T波波形清晰;第二类室上性异位搏动S,P波出现较早,具有较长的R间期;第三类室性异位搏动V无P波,但具有较宽的QRS波,出现位置提前;第四类融合心拍F波形是S与V的融合形态。各个心拍类型波形具有明显特征,这为使用CNN模型进行特征的自动提取提供了数据基础。由于未知类型Q的训练数据集与其他心拍数据量差别较大,因此在本实施例中,只对前四种类型心拍进行分类。
2、数据预处理模块
在混合分类模型(分类算法模块)的构建与训练过程中,需要对输入心电信号进行相应的预处理,有利于分类效果的提升。因此,本实施例中,在数据预处理部分主要完成四方面的工作,包括相关噪声的分析与滤除、心拍分割、数据集划分以及数据均衡。
在心拍分割部分,主要实现了单独心拍的提取。在MIT-BIH数据库中,每条数据是以记录为单位,其中包含多个心拍。本发明的研究重点为心律异常的分类,因此直接以心拍为单位对其进行模型的构建,这在一定程度上提高了数据总量,有利于模型的训练。在MIT-BIH数据库中,注释文件中包含人工标注好的R峰位置,有利于研究者对其进行心拍的分割。在本发明中,左右各取相应数据完成心拍的分割,具体实现方式如下。将两个相邻心拍R峰之间的样本定义为‘R-R间期’,则可对此间期中的样本进行划分,进而得到单独心拍的样本。本发明以心电信号的每个心拍的R峰位置为中心,从其左间期采集45%的样本,相应右间期采集55%的样本,完成心拍的分割,得到一系列的心拍,具体分割方式如图4所示。
为了提分类高算法的泛化性,用线性函数对每一个心拍进行归一化处理:
这样,得到一系列归一化的心拍,每个心拍大小为64(即64个采样值)。
在数据集划分上,为了提高分类模型的可扩展性,在本实施例中,针对患者间的心拍进行训练与测试。本实施例,将所有记录分为两大类,一类作为模型训练用的训练集,一类作为用于测试模型效果的测试集,划分方式如下:Dataset 1(DS1):101,106,108,109,112,114,115,116,118,119,122,124,201,203,205,207,208,209,215,220,223和230。Dataset 2(DS2):100,103,105,111,113,117,121,123,200,202,210,212,213,214,219,221,222,228,231,232,233和234。按照此方法对数据集进行划分,可以实现利用一部分患者的数据进行模型学习,而用另外不同患者的数据进行模型的检测,这为心律分类的可扩展性提供了数据保证。避免了在实际应用过程中,由于患者间差异过大,需要针对不同患者进行单独训练的问题。
在数据均衡上,主要解决不同类别心拍之间数据量相差较大的问题。根据数据集划分方式以及AAMI心律分类方式,得到的DS1与DS2数据分布情况如表2所示。
类别 | DS1 | DS2 |
N | 45798 | 44196 |
S | 641 | 1836 |
V | 3781 | 3216 |
F | 409 | 379 |
表2
从表2中分布结果来看,各类别之间的数据量相差较大,这为模型的学习提供了难度。为了提高模型训练的准确度,尽可能达到平衡数量的节拍,在本实施例中,采用合成少数过采样技术(SMOTE)对数据进行过采样。SMOTE作为一种具有代表性的过采样方法,主要通过对训练集里面的正例进行插值,来产生额外的正例数据,达到数据均衡的目的。本实施例中,主要对S,V,F三类心拍进行过采样,提高其数据量,实现心拍数量的相对均衡。采用SMOTE技术后的数据分布如表3所示(表3使用SMOTE技术后训练集(DS1)的数据分布情况)。
类别 | 原始数据 | 增强后数据 |
N | 45798 | 45798 |
S | 641 | 41000 |
V | 3781 | 39992 |
F | 409 | 39000 |
表3
3、分类算法模块
本发明中的分类算法模块为卷积神经网络(CNN)模型和编码解码模型的混合分类模型,其中,采用卷积神经网络(CNN)模型用来完成对心拍的特征提取,从全连接层输出,编码解码模型用于根据提取的心拍特征,对心拍(心律)进行分类。
在本实施例中,设计了一个仅包含四层卷积和池化操作的简单CNN模型对心拍进行特征提取,在不影响分类效果的前提下,简化了模型的复杂性。该CNN模型的各层具体实现(模型结构和参数)阐述如表4所示:
名称 | 滤波器尺寸 | 步长 | 滤波器个数 |
第一卷积层Conv1 | 1*3 | 1 | 32 |
第一池化层Maxpooling1 | 1*2 | 2 | 32 |
第二卷积层Conv2 | 1*3 | 1 | 64 |
第二池化层Maxpooling2 | 1*2 | 2 | 64 |
第三卷积层Conv3 | 1*3 | 1 | 128 |
第三池化层Maxpooling3 | 1*2 | 2 | 128 |
第四卷积层Conv4 | 1*3 | 1 | 256 |
第四池化层Maxpooling4 | 1*2 | 2 | 256 |
表4
如图4所示,第一卷积层Conv1的滤波器尺寸为1*3,步长为1,滤波器个数为32,第一池化层Maxpooling1的滤波器尺寸为1*2,步长为2,滤波器个数为32,第二卷积层Conv2的滤波器尺寸为1*3,步长为1,滤波器个数为64,第二池化层Maxpooling2的滤波器尺寸为1*2,步长为2,滤波器个数为64,第三卷积层Conv3的滤波器尺寸为1*3,步长为1,滤波器个数为128,第三池化层Maxpooling3的滤波器尺寸为1*2,步长为2,滤波器个数为128,第四卷积层Conv4的滤波器尺寸为1*3,步长为1,滤波器个数为256,第四池化层Maxpooling4的滤波器尺寸为1*2,步长为2,滤波器个数为256,第一卷积层Conv1对输入的心拍进行卷积,得到的特征依次经过第一池化层Maxpooling1、第二卷积层Conv2、第二池化层Maxpooling2、第三卷积层Conv3、第三池化层Maxpooling3、第四卷积层Conv4、第四池化层Maxpooling4处理后得到的特征,经过全连接层输出心拍特征到编码解码模型进行分类。
卷积层是卷积神经网络的核心,通过卷积核来实现特征学习与提取,通过将输入数据与核函数进行卷积计算,得到相应的特征映射,不同的卷积滤波器对应不同特征值,最终通过激活函数来得到该层的输出。卷积层的具体表达结果由权值k以及偏置b来体现,以第l卷积层第j个神经元的输出结果为例,其实现方式表示如下:
其中,表示连接两个神经元之间的不同卷积核,表示当前层的偏置,对应当前层的输入,同时也为上一层的输出,f(·)是激活函数。激活函数的功能是模拟人的神经系统,即只对部分神经元的输入做出反应,一般为非线性函数,常用的激活函数包括sigmoid,tanh,relu等。在本实施例中,采用relu作为模型的激活函数,其表达式可写为f(x)=max(0,x)
relu激活函数在降低运算量的同时,可以提高算法的收敛速度,克服梯度消失问题。同时正是由于其特点,当算法输入为负数时,该模型完全不激活,导致relu函数死掉。该问题往往可以通过合理的调节模型学习率来进行克服。
在本实施例中,CNN模型在卷积层的选取上,均采用1*3大小的卷积核来实现对1*64大小的心拍进行步长为1的卷积操作,逐层提取不同维度的特征。
池化层又称为下采样层,主要用于减少数据参数,进一步可分为平均池化以及最大池化两种方式。池化操作实现了数据的降维,将低层次局部特征组合为较高层次特征。相应的,以第l层第j个神经元为例,池化层的输出可以定义为
在本实施例中,池化层采用常用的最大池化操作作为池化层的具体实现,设计的池化滤波器的长度均为1*2,针对各层卷积结果进行步长为2的下采样,降低参数数量,提取高维特征。
在模型的学习过程中,通过多次迭代,针对预测值与真实值之间的差异,利用误差的反向传播机制以及梯度下降算法进行更新以及网络优化,不断提高模型的学习准确度,进而完成分类模型的构建。与前述相同,同样以第l层第j个神经元为例,权值更新公式可表示为
同时,E为均方误差,表示预测值与实际值之间的差异,其具体公式为如下所示,其中ti表示实际值。
通过将均方误差分别对权重和偏差求偏导,可得到其与灵敏度Δ之间的表达关系,进而通过梯度下降算法逐层将误差在网络中进行传递,最终完成权值的更新。梯度下降算法的表达式为:
在本发明中,选择编码解码模型用于根据提取的心拍特征,对心拍(心律)进行分类。
所述编码解码模型包括编码器和解码器,其中,编码器采用RNN模型结构,输入为CNN模型全连接层输出的心拍特征(即特征向量),输出为对应目标值的编码,并作为解码器输入,解码器采用LSTM模型结构,输出为对应目标的向量,进而通过sofmax函数转为概率值,逐个拍生成心拍类型。
编码解码模型是一种常用的框架结构,广泛应用于seq2seq问题的解决上。ECG信号本质上是基于时间的序列信号,类似于语音信号。因此编码解码模型可以用作ECG信号的分类器,因为它对时间序列具有良好的适用性。本发明针对CNN提取的特征信息,进一步考虑了其时间序列特征,设计了一种基于编码解码模型的分类器。该模型的原理和具体实现阐述如下。
编码解码模型主要由三部分组成,分别为编码器,语义向量以及解码器。编码器主要完成信息的输入以及编码,将信息归纳为一个记忆模式作为语义向量,解码器将语义向量作为初始输入状态,通过相应的解码算法,完成语义的转换。该模型的框架结构如图5所示。
其中,语义向量主要由输入向量的相关函数映射F(·)来实现,输出为一系列输出向量,在无注意力机制的模型中由语义向量以及上一输出状态共同决定。该模型对应的输入与输出的向量长度没有硬性要求,即可以实现不等长序列的转换与输出。
编码器以及解码器的具体实现方式较为灵活,可选的模型包括卷积神经网络(CNN),递归神经网络(RNN),双向递归神经网络(BiRNN)以及长短期记忆网络(LSTM)等。编码器与解码器的模型算法没有统一的规定,即可以通过模型的不同组合方式来构建多种多样的编码解码模型。
在本发明中,我们将CNN模型与编码解码模型相结合来构建分类模型。原始输入信号通过CNN模型,通过特征提取操作生成对应的特征变量作为编码解码模型的输入,并通过RNN和LSTM模型实现心律的分类。该模型的结构如图6所示。
各部分的输入和输出模型的相关原理描述如下。
编码器:采用RNN模型结构,输入为CNN模型全连接层的训练结果,即特征向量;输出为对应目标值的编码表示,用于初始化解码器输入。
对于编码器的输入部分,各个隐藏状态ht均由当前输入xt和上一时刻状态ht-1共同决定,即
将各个隐层的结果进行有效的合并,即可得到对应的语义向量
在RNN模型中,通常直接将输入部分最后一层隐层的输出结果作为语义向量,即
根据上述步骤,即完成了以RNN为基础算法的编码模型。
解码器:采用LSTM模型结构,输入为编码器的输出表示,输出为对应目标的向量,进而通过sofmax函数转为概率值,逐个节拍的生成心拍类型。
对于解码器的解码部分,主要实现根据语义向量C以及之前状态的输出进行相关预测,即
由于RNN本身无法很好处理远距离依赖的问题,当输入数据较多时,会出现梯度消失的问题,因此,长短时记忆网络(LSTM)应运而生。LSTM在RNN的基础上,主要进行了三个门计算改进,分别为遗忘门、输入门以及输出门。下面分别对这三个门的实现方式进行简要阐述。
遗忘门主要决定保留多少前一时刻的输出作为当前状态的输入。首先利用相关遗忘门权值矩阵与偏置来对信息进行处理,之后通过sigmoid函数来实现是否保留为实际输入。具体表达公式为:
ft=σ(wf*[ht-1,xt]+bf)
其中,wf和bf为遗忘门对应的权重矩阵以及偏置,通过将上一时刻状态ht-1与当前时刻输入xt进行合并连接实现对状态以及输入的处理。
输入门主要决定保留多少当前时刻的输入值作为当前状态的输入。通过对当前输入情况进行保存以及对产生的新信息进行处理,完成新记忆的构建。具体实现方式如下:
it=σ(wi*[ht-1,xt]+bi)
输出门主要决定此时刻的输出状态保留多少作为下一时刻状态的输出。具体实现方式为:
ot=σ(wo*[ht-1,xt]+bo)
ht=ot*tanh(ct)
与卷积神经网络相类似,LSTM的训练方式为通过损失函数对误差进行传播,并分别对各个权重进行求偏导,得到最终的训练模型。
4、仿真分析
本发明基于编码解码模型与卷积神经网络设计了一种混合模型来实现对ECG信号(心电)的异常分类。同时,为了比较模型的分类效果,使用三种不同的算法对心电图心律进行分类,三种算法分别为:一维CNN模型(1-D CNN),CNN与SVM相结合的模型(CNN+SVM),以及CNN与编码解码模型相结合的混合模型(CNN+ED)。在数据集选择上,选择开放使用的MIT-BIH国际标准数据库,通过本发明所用的数据预处理技术完成对数据的初步处理,进而用作模型的训练以及测试。
在评价指标上,基于混淆矩阵的结果分别对比了四类衡量指标的仿真结果,具体包括准确度ACC,灵敏度TPR,特异度TNR,精确度PPV以及F1值。采用真阳性(TP),真阴性(TN),假阳性(FP)和假阴性(FN)四个结果对衡量指标进行相关定义,其具体计算公式分别为:
下面主要对比三种算法模型下对心律分类的仿真效果。三种模型的仿真结果如表5-7所示,其中,表5是使用CNN模型分类的四个指标结果,表6是使用CNN+SVM混合模型分类的四个指标结果,表7是使用CNN+ED模型(本发明模型)分类的四个指标结果。
表5
表6
表7
通过对比三种模型对应的各类衡量指标的平均结果可知,单一CNN网络模型各类别心拍具有较好的准确度和特异度,均在85%以上,而平均灵敏度和平均精确度较低,普遍低于50%。CNN+SVM模型在保证平均准确度和平均特异度的基础上,平均灵敏度和平均精确度的指标均有一定程度上的提升,其中平均准确度基本可以达到70%。CNN+ED模型(本发明)各个衡量指标均有较大程度上的提升,基本可达80%以上,准确度与特异度均有5%左右的提升,平均灵敏度和平均精确度提升幅度最大。可见本发明设计的混合模型具有较好的分类效果。
从分类类别上来看,以F1为衡量指标,由图7可知,在对心拍进行分类时,N类,V类两类的分类效果较好,而S,F两类的分类效果较差。通过对比数据集分布可知,这是由于本身数据量较少,通过过采样得到的数据具有较大的不确定性,导致其分类效果下降。同时,通过对比三种模型的分类效果可得,CNN+ED模型对于S,F类的分类效果有显著提升,其余两类的分类效果提升不大。
总之,仿真结果表明,本发明设计的CNN与编码解码模型相结合的混合模型分类效果最好,但针对单独类别的分类效果还有待提升。虽然本发明采用的CNN模型层数较少,但通过将多种模型相结合的方式,可以提高分类准确度。因此,本发明所用模型基本可以实现对心律的分类,结果较为可靠,可以作为医疗工作者的辅助参考方式。
5、总结
本发明设计了一种结合CNN和编码解码模型的混合模型,用于心律的分类。通过对患者间心拍数据进行仿真分析,验证了其分类的效果。仿真结果表明,本发明构建的分类模型具有良好的分类效果,该模型类别准确度高达97.92%,尤其在V与F类别上具有较好的优势。本发明采用的CNN模型均为4层,通过将其与其他学习模型相结合,可以提高分类准确度,在一定程度上避免了复杂的卷积操作。总之,本发明基本完成了心律分类,能够在自动提取特征参数的前提下,实现对心律种类的分类,有利于心脏疾病的辅助治疗。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
Claims (2)
1.一种基于机器学习的心律分类系统,包括:
数据采集模块,可以通过相关医学诊断设备对受试者进行心电信号的采集,得到心电信号;
其特征在于,还包括:
数据预处理模块,主要对采集的心电信号进行相关噪声的分析与滤除,然后以心电信号的每个心拍的R峰位置为中心,从其左间期采集45%的样本,相应右间期采集55%的样本,完成心拍的分割,得到一系列的心拍;最后用线性函数对每一个心拍进行归一化处理:
这样,得到一系列归一化的心拍,每个心拍大小为64(即64个采样值);
分类算法模块,为卷积神经网络(CNN)模型和编码解码模型的混合分类模型,其中,采用卷积神经网络(CNN)模型用来完成对心拍的特征提取,从全连接层输出,编码解码模型用于根据提取的心拍特征,对心拍(心律)进行分类;
所述编码解码模型包括编码器和解码器,其中,编码器采用RNN模型结构,输入为CNN模型全连接层输出的心拍特征(即特征向量),输出为对应目标值的编码,并作为解码器输入,解码器采用LSTM模型结构,输出为对应目标的向量,进而通过sofmax函数转为概率值,逐个拍生成心拍类型。
2.根据权利要求1所述的心律分类系统,其特征在于,所述卷积神经网络(CNN)模型为仅包含四层卷积和池化操作的简单CNN模型,第一卷积层Conv1的滤波器尺寸为1*3,步长为1,滤波器个数为32,第一池化层Maxpooling1的滤波器尺寸为1*2,步长为2,滤波器个数为32,第二卷积层Conv2的滤波器尺寸为1*3,步长为1,滤波器个数为64,第二池化层Maxpooling2的滤波器尺寸为1*2,步长为2,滤波器个数为64,第三卷积层Conv3的滤波器尺寸为1*3,步长为1,滤波器个数为128,第三池化层Maxpooling3的滤波器尺寸为1*2,步长为2,滤波器个数为128,第四卷积层Conv4的滤波器尺寸为1*3,步长为1,滤波器个数为256,第四池化层Maxpooling4的滤波器尺寸为1*2,步长为2,滤波器个数为256,第一卷积层Conv1对输入的心拍进行卷积,得到的特征依次经过第一池化层Maxpooling1、第二卷积层Conv2、第二池化层Maxpooling2、第三卷积层Conv3、第三池化层Maxpooling3、第四卷积层Conv4、第四池化层Maxpooling4处理后得到的特征,经过全连接层输出心拍特征到编码解码模型进行分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010088214.4A CN111297349A (zh) | 2020-02-12 | 2020-02-12 | 一种基于机器学习的心律分类系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010088214.4A CN111297349A (zh) | 2020-02-12 | 2020-02-12 | 一种基于机器学习的心律分类系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111297349A true CN111297349A (zh) | 2020-06-19 |
Family
ID=71156475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010088214.4A Pending CN111297349A (zh) | 2020-02-12 | 2020-02-12 | 一种基于机器学习的心律分类系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111297349A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111832537A (zh) * | 2020-07-27 | 2020-10-27 | 深圳竹信科技有限公司 | 异常心电信号识别方法及异常心电信号识别装置 |
CN111859784A (zh) * | 2020-06-24 | 2020-10-30 | 天津大学 | 一种基于深度学习神经网络的rcs时间序列特征提取方法 |
CN111887894A (zh) * | 2020-07-24 | 2020-11-06 | 辰浩医疗科技(广东)有限公司 | 一种胎心仪多普勒信号的归一化软件处理方法及系统 |
CN111920405A (zh) * | 2020-09-15 | 2020-11-13 | 齐鲁工业大学 | 一种房颤信号识别系统及方法 |
CN112200232A (zh) * | 2020-09-29 | 2021-01-08 | 上海移视网络科技有限公司 | Qrs识别方法及电子设备 |
CN112617849A (zh) * | 2020-12-31 | 2021-04-09 | 山西三友和智慧信息技术股份有限公司 | 一种基于cnn+lstm的心房颤动检测与分类方法 |
CN112635047A (zh) * | 2020-09-22 | 2021-04-09 | 广东工业大学 | 一种鲁棒的心电r峰检测方法 |
CN112800248A (zh) * | 2021-01-19 | 2021-05-14 | 天河超级计算淮海分中心 | 相似病例检索方法、装置、计算机设备及存储介质 |
CN112826513A (zh) * | 2021-01-05 | 2021-05-25 | 华中科技大学 | 一种基于深度学习和特异性矫正在fecg上胎儿心率检测系统 |
CN112861604A (zh) * | 2020-12-25 | 2021-05-28 | 中国科学技术大学 | 一种与用户无关的肌电动作识别与控制方法 |
CN113180684A (zh) * | 2021-06-03 | 2021-07-30 | 哈尔滨理工大学 | 一种ⅱ导联心电信号分类方法 |
CN113855042A (zh) * | 2021-08-29 | 2021-12-31 | 北京工业大学 | 融合深度和医学特征的基于序列标注的多导联心电信号分类方法 |
CN113995417A (zh) * | 2021-10-20 | 2022-02-01 | 南京邮电大学 | 基于lstm自编码器的心电信号异常预测方法及系统 |
CN115886828A (zh) * | 2021-09-27 | 2023-04-04 | 广州视源电子科技股份有限公司 | 心电分析模型的训练方法、装置、设备及存储介质 |
CN116098595A (zh) * | 2023-01-16 | 2023-05-12 | 广东海纳医疗科技有限公司 | 一种心源性及脑源性猝死监测预防系统和方法 |
-
2020
- 2020-02-12 CN CN202010088214.4A patent/CN111297349A/zh active Pending
Non-Patent Citations (1)
Title |
---|
S. MOUSAVI AND F. AFGHAH: "Inter- and Intra- Patient ECG Heartbeat Classification for Arrhythmia Detection: A Sequence to Sequence Deep Learning Approach", 《ICASSP 2019 - 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)》 * |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111859784A (zh) * | 2020-06-24 | 2020-10-30 | 天津大学 | 一种基于深度学习神经网络的rcs时间序列特征提取方法 |
CN111859784B (zh) * | 2020-06-24 | 2023-02-24 | 天津大学 | 一种基于深度学习神经网络的rcs时间序列特征提取方法 |
CN111887894A (zh) * | 2020-07-24 | 2020-11-06 | 辰浩医疗科技(广东)有限公司 | 一种胎心仪多普勒信号的归一化软件处理方法及系统 |
CN111832537A (zh) * | 2020-07-27 | 2020-10-27 | 深圳竹信科技有限公司 | 异常心电信号识别方法及异常心电信号识别装置 |
CN111920405A (zh) * | 2020-09-15 | 2020-11-13 | 齐鲁工业大学 | 一种房颤信号识别系统及方法 |
CN112635047A (zh) * | 2020-09-22 | 2021-04-09 | 广东工业大学 | 一种鲁棒的心电r峰检测方法 |
CN112200232B (zh) * | 2020-09-29 | 2024-03-22 | 上海移视网络科技有限公司 | Qrs识别方法及电子设备 |
CN112200232A (zh) * | 2020-09-29 | 2021-01-08 | 上海移视网络科技有限公司 | Qrs识别方法及电子设备 |
CN112861604B (zh) * | 2020-12-25 | 2022-09-06 | 中国科学技术大学 | 一种与用户无关的肌电动作识别与控制方法 |
CN112861604A (zh) * | 2020-12-25 | 2021-05-28 | 中国科学技术大学 | 一种与用户无关的肌电动作识别与控制方法 |
CN112617849A (zh) * | 2020-12-31 | 2021-04-09 | 山西三友和智慧信息技术股份有限公司 | 一种基于cnn+lstm的心房颤动检测与分类方法 |
CN112826513A (zh) * | 2021-01-05 | 2021-05-25 | 华中科技大学 | 一种基于深度学习和特异性矫正在fecg上胎儿心率检测系统 |
CN112800248A (zh) * | 2021-01-19 | 2021-05-14 | 天河超级计算淮海分中心 | 相似病例检索方法、装置、计算机设备及存储介质 |
CN113180684A (zh) * | 2021-06-03 | 2021-07-30 | 哈尔滨理工大学 | 一种ⅱ导联心电信号分类方法 |
CN113180684B (zh) * | 2021-06-03 | 2023-10-24 | 哈尔滨理工大学 | 一种ⅱ导联心电信号分类方法 |
CN113855042B (zh) * | 2021-08-29 | 2023-10-03 | 北京工业大学 | 融合深度和医学特征的基于序列标注的多导联心电信号分类方法 |
CN113855042A (zh) * | 2021-08-29 | 2021-12-31 | 北京工业大学 | 融合深度和医学特征的基于序列标注的多导联心电信号分类方法 |
CN115886828A (zh) * | 2021-09-27 | 2023-04-04 | 广州视源电子科技股份有限公司 | 心电分析模型的训练方法、装置、设备及存储介质 |
CN113995417A (zh) * | 2021-10-20 | 2022-02-01 | 南京邮电大学 | 基于lstm自编码器的心电信号异常预测方法及系统 |
CN116098595A (zh) * | 2023-01-16 | 2023-05-12 | 广东海纳医疗科技有限公司 | 一种心源性及脑源性猝死监测预防系统和方法 |
CN116098595B (zh) * | 2023-01-16 | 2023-09-05 | 广东海纳医疗科技有限公司 | 一种心源性及脑源性猝死监测预防系统和方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111297349A (zh) | 一种基于机器学习的心律分类系统 | |
CN111990989A (zh) | 一种基于生成对抗及卷积循环网络的心电信号识别方法 | |
Bhagyalakshmi et al. | GB-SVNN: Genetic BAT assisted support vector neural network for arrhythmia classification using ECG signals | |
Cao et al. | ML-Net: Multi-channel lightweight network for detecting myocardial infarction | |
Kusuma et al. | ECG signals-based automated diagnosis of congestive heart failure using Deep CNN and LSTM architecture | |
CN112906748A (zh) | 基于残差网络的12导联ecg心律失常检测分类模型构建方法 | |
Gawande et al. | Heart diseases classification using convolutional neural network | |
CN115470832B (zh) | 一种基于区块链的心电信号数据处理方法 | |
CN109431492A (zh) | 基于神经网络算法的心电图导联数据模拟重建方法 | |
CN113095302A (zh) | 用于心律失常分类的深度模型、利用该模型的方法及装置 | |
CN110638430A (zh) | 多任务级联神经网络ecg信号心律失常疾病分类模型和方法 | |
CN113349793A (zh) | 一种基于分层注意力模型的心律失常分类方法 | |
CN113901893A (zh) | 基于多重级联深度神经网络的心电信号的识别与分类方法 | |
Liang et al. | Obstructive sleep apnea detection using combination of CNN and LSTM techniques | |
Nainwal et al. | Arrhythmia classification based on improved monarch butterfly optimization algorithm | |
CN115881308A (zh) | 基于时空联合检测的心脏疾病分类模型构建方法 | |
CN115062655A (zh) | 一种多导联心电信号分析方法及多导联心肌梗死分析系统 | |
Singh et al. | Short and noisy electrocardiogram classification based on deep learning | |
CN113491523B (zh) | 一种心电信号特征点检测方法及系统 | |
Wang et al. | Pay attention and watch temporal correlation: a novel 1-D convolutional neural network for ECG record classification | |
Jiang et al. | Heartbeat classification system based on modified stacked denoising autoencoders and neural networks | |
Kovalchuk et al. | A novel feature vector for ECG classification using deep learning | |
CN114091530A (zh) | 心电分类方法、基于域自适应的心电分类模型训练方法 | |
Sangeetha et al. | A CNN based similarity learning for cardiac arrhythmia prediction | |
He et al. | Automatic classification of arrhythmias by residual network and BiGRU with attention mechanism |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200619 |
|
RJ01 | Rejection of invention patent application after publication |