CN114091530A - 心电分类方法、基于域自适应的心电分类模型训练方法 - Google Patents
心电分类方法、基于域自适应的心电分类模型训练方法 Download PDFInfo
- Publication number
- CN114091530A CN114091530A CN202111339975.3A CN202111339975A CN114091530A CN 114091530 A CN114091530 A CN 114091530A CN 202111339975 A CN202111339975 A CN 202111339975A CN 114091530 A CN114091530 A CN 114091530A
- Authority
- CN
- China
- Prior art keywords
- data
- classification
- training
- model
- electrocardiogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 190
- 238000000034 method Methods 0.000 title claims abstract description 91
- 238000013145 classification model Methods 0.000 title claims abstract description 50
- 238000012545 processing Methods 0.000 claims abstract description 51
- 238000007781 pre-processing Methods 0.000 claims abstract description 18
- 238000012360 testing method Methods 0.000 claims description 61
- 238000009826 distribution Methods 0.000 claims description 33
- 238000013527 convolutional neural network Methods 0.000 claims description 29
- 239000013598 vector Substances 0.000 claims description 22
- 230000006978 adaptation Effects 0.000 claims description 19
- 230000003044 adaptive effect Effects 0.000 claims description 16
- 238000005070 sampling Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 238000002565 electrocardiography Methods 0.000 claims description 10
- 238000011478 gradient descent method Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 7
- 230000000747 cardiac effect Effects 0.000 claims description 6
- 230000008929 regeneration Effects 0.000 claims description 3
- 238000011069 regeneration method Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 36
- 238000010586 diagram Methods 0.000 description 23
- 206010003119 arrhythmia Diseases 0.000 description 19
- 230000006793 arrhythmia Effects 0.000 description 18
- 238000004422 calculation algorithm Methods 0.000 description 13
- 230000004913 activation Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000010606 normalization Methods 0.000 description 8
- 238000011176 pooling Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 208000024172 Cardiovascular disease Diseases 0.000 description 2
- 206010042602 Supraventricular extrasystoles Diseases 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000001172 regenerating effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 206010042434 Sudden death Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003183 myoelectrical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000000718 qrs complex Methods 0.000 description 1
- 238000000306 qrs interval Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
- A61B5/318—Heart-related electrical modalities, e.g. electrocardiography [ECG]
- A61B5/346—Analysis of electrocardiograms
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
- A61B5/318—Heart-related electrical modalities, e.g. electrocardiography [ECG]
- A61B5/346—Analysis of electrocardiograms
- A61B5/349—Detecting specific parameters of the electrocardiograph cycle
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
- A61B5/7267—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Cardiology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Mathematical Physics (AREA)
- Surgery (AREA)
- Medical Informatics (AREA)
- Heart & Thoracic Surgery (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Psychiatry (AREA)
- Physiology (AREA)
- Fuzzy Systems (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
本发明涉及计算机技术领域,具体涉及心电分类方法及装置、基于域自适应的心电分类模型训练方法及装置、电子设备以及计算机可读介质。所述心电分类方法包括:获取待处理心电数据,对所述待处理心电数据进行预处理以获取心拍数据;将所述心拍数据输入已训练的心电分类模型,利用特征提取器对所述心拍数据进行卷积处理,以获取特征数据;其中,所述特征提取器包括连续设置的若干个的卷积层;以及利用分类器对所述特征数据进行全连接处理,以获取所述待处理心电数据对应的分类结果;其中,所述分类器包括全连接层。本公开的方案能够有效的提高心电数据分类的准确性,实现对心拍类型的准确判断。
Description
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种心电分类方法、一种基于域自适应的心电分类模型训练方法、一种心电分类装置、一种基于域自适应的心电分类模型训练装置、一种电子设备以及一种计算机可读介质。
背景技术
心电图通过记录人心脏产生的电活动的电位波形来反映心脏的状态,为临床治疗提供很多有价值的信息。在临床环境中,医生可以通过观察心电图来诊断心律失常,这是一种无创的诊断方法,是检测心律失常非常有效的工具。一般来说,可以通过识别心电图记录中的异常心跳并对其进行归类来诊断心律失常。在病人的心电图记录中,只包含极少数的异常心跳,这使得医生很难以人工识别的方式在长期的心电图记录中快速识别异常的心跳。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明的实施例提供了一种心电分类方法、一种基于域自适应的心电分类模型训练方法、一种心电分类装置、一种基于域自适应的心电分类模型训练装置、一种电子设备以及一种计算机可读介质,进而至少在一定程度上提高心电分类的精度。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明实施例的一个方面,提供了一种心电分类方法,包括:
获取待处理心电数据,对所述待处理心电数据进行预处理以获取心拍数据;
将所述心拍数据输入已训练的心电分类模型,利用特征提取器对所述心拍数据进行卷积处理,以获取特征数据;其中,所述特征提取器包括连续设置的若干个的卷积层;以及
利用分类器对所述特征数据进行全连接处理,以获取所述待处理心电数据对应的分类结果;其中,所述分类器包括全连接层。
在本发明的一些实施例中,基于前述方案,所述方法还包括:训练所述心电分类模型,包括:
对心拍样本数据划分训练集和测试集,以及构建基于卷积神经网络的初始模型;
利用训练集对初始模型进行第一阶段预训练,以获取预训练模型;
利用训练集和和测试集对所述预训练模型进行第二阶段域自适应训练,以获取所述心电分类模型。
在本发明的一些实施例中,基于前述方案,所述利用训练集对初始模型进行第一阶段预训练,以获取预训练模型,包括:
将训练集输入模型,利用特征提取器对所述训练集进行卷积处理,以获取特征数据;
利用分类器对所述特征数据进行全连接处理,以获取所述训练集对应的分类结果;
根据分类结果计算分类损失,并利用梯度下降法最小化分类损失,更新模型的网络参数。
在本发明的一些实施例中,基于前述方案,所述计算分类损失包括:
在本发明的一些实施例中,基于前述方案,所述利用训练集和和测试集对所述预训练模型进行第二阶段域自适应训练,以获取所述心电分类模型,包括:
将测试集和训练集输入所述预训练模型,通过特征提取器获取对应的特征向量;
将测试集的特征向量和训练集的特征向量映射到再生核希尔伯特空间中,计算测试集和训练集之间特征分布的最大均值差异;
利用分类器对测试集特征数据和训练集特征数据进行全连接处理,以获取对应的分类结果;
基于训练集的分类结果计算分类损失,基于测试集的分类结构计算熵损失;
结合最大均值差异、分类损失和熵损失构建总损失函数,利用梯度下降法最小化总损失,以更新模型的网络参数。
在本发明的一些实施例中,基于前述方案,所述结合最大均值差异、分类损失和熵损失构建总损失函数,包括:
loss=Lcls+λ*Mk(Ds,Dt)+β*H(Dt)
其中,Lcls表示分类损失,H(Dt)表示熵损失,超参数λ、β表示熵损失和最大均值差异之间的权衡参数,Mk(Ds,Dt)表示最大均值差异。
根据本发明实施例的一个方面,提供了一种基于域自适应的心电分类模型训练方法,包括:
获取样本心电数据,对所述样本心电样本数据进行预处理,并对预处理后的数据划分训练集和测试集;
构建基于卷积神经网络的模型;其中,模型包括:用于提取特征数据的特征提取器,用于根据特征数据进行分类的分类器;特征提取器包括连续设置的若干个的卷积层,所述分类器包括全连接层;
利用训练集对初始模型进行第一阶段预训练,以获取预训练模型;
利用训练集和和测试集对所述预训练模型进行第二阶段域自适应训练,以获取心电分类模型。
根据本发明实施例的一个方面,提供了一种心电分类装置,包括:
预处理模块,用于获取待处理心电数据,对所述待处理心电数据进行预处理以获取心拍数据;
特征提取模块,用于将所述心拍数据输入已训练的心电分类模型,利用特征提取器对所述心拍数据进行卷积处理,以获取特征数据;其中,所述特征提取器包括连续设置的若干个的卷积层;以及
分类模块,用于利用分类器对所述特征数据进行全连接处理,以获取所述待处理心电数据对应的分类结果;其中,所述分类器包括全连接层。
根据本发明实施例的一个方面,提供了一种基于域自适应的心电分类模型训练装置,包括:
样本数据处理模块,用于获取样本心电数据,对所述样本心电样本数据进行预处理,并对预处理后的数据划分训练集和测试集;
模型构建模块,用于构建基于卷积神经网络的模型;其中,模型包括:用于提取特征数据的特征提取器,用于根据特征数据进行分类的分类器;特征提取器包括连续设置的若干个的卷积层,所述分类器包括全连接层;
第一阶段训练模块,用于利用训练集对初始模型进行第一阶段预训练,以获取预训练模型;
第二阶段训练模块,用于利用训练集和和测试集对所述预训练模型进行第二阶段域自适应训练,以获取心电分类模型。
根据本发明实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如任一项实施例所述的心电分类方法。
根据本发明实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如任一项实施例所述的基于域自适应的心电分类模型训练方法。
根据本发明实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的心电分类方法。
根据本发明实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的基于域自适应的心电分类模型训练方法。
在本发明的一些实施例所提供的技术方案中,通过构建基于卷积神经网络的域自适应的分类模型,能够高效的处理心拍数据。通过在特征提取其利用连续设置的多个卷积层进行特征提取,能够准确的获取心拍数据的特征向量,再利用分类器对特征向量进行全连接处理,预设心拍数据属于预设心拍类型的概率,能够有效的提高心电数据分类的准确性,实现对心拍类型的准确判断。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了可以应用本发明实施例的技术方案的示例性系统架构的示意图;
图2示意性示出了根据本发明的一个实施例的心电分类方法的流程示意图;
图3示意性示出了根据本发明的一个实施例心电分类模型架构的示意图;
图4示意性示出了根据本发明的一个实施例的第一预训练阶段的流程示意图;
图5示意性示出了根据本发明的一个实施例的第二自适应训练阶段的的流程示意图;
图6示意性示出了根据本发明的一个实施例的使用域自适应和不使用域自适应(DA)的精确曲线对比的示意图;
图7示意性示出了根据本发明的一个实施例的损失曲线随迭代次数增加的变化情况的示意图;
图8示意性示出了根据本发明的一个实施例的精确度随数据量的增加的变化情况的示意图;
图9(a)示意性示出了根据本发明的一个实施例的域适应前的混淆矩阵的示意图;
图9(b)示意性示出了根据本发明的一个实施例的域适应后的混淆矩阵的示意图;
图10示意性示出了根据本发明的一个实施例的心电分类模型训练方法的流程示意图;
图11示意性示出了根据本发明的一个实施例的心电分类装置的框图;
图12示意性示出了根据本发明的一个实施例的基于域自适应的心电分类模型训练装置的框图;
图13示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
在相关技术中,作为心血管疾病中最常见的一组疾病,心律失常可单独发病,亦可与其他心血管疾病伴发。它可突然发作而致猝死,亦可持续累及心脏而致其衰竭。所以需要对心律失常进行及时地诊断。在临床环境中,医生可以通过观察心电图来诊断心律失常,这是一种无创的诊断方法,是检测心律失常非常有效的工具。心电图通过记录人心脏产生的电活动的电位波形来反映心脏的状态,为临床治疗提供很多有价值的信息。它对心律失常的诊断至关重要。一般来说,通过识别心电图记录中的异常心跳并对其进行归类来诊断心律失常。在病人的心电图记录中,只包含极少数的异常心跳,这使得医生很难在长期的心电图记录中快速识别异常的心跳。为了解决人工分析心电记录效率低的问题,如何结合人工智能实现心电记录的自动分析和准确诊断正成为研究的热点。传统的机器学习方法首先需要从心电记录中手动提取特征,这些特征包括R-R间期、QRS间期等形态学特征、利用小波变换提取的时频特征、高阶统计特征(High Order Statistics,HOS)等。然后采用支持向量机、随机森林、人工神经网络等机器学习算法对心电记录进行分类。但是人工特征提取的实现过程较为复杂,且传统机器学习方法的分类性能也有待提高。在一些技术方案中,利用17层卷积神经网络(Convolutional Neural Networks,CNN)来提取心电信号中的深层特征,并结合专家特征,将这些特征一起送入集成分类器中,分类九种不同的心电信号。或者,在一些技术方案中,首先利用短时傅里叶变换将心电信号转化为频谱图,然后将谱图作为2D-CNN的输入,从而对心律失常进行分类。或者,在一些技术方案中,采用堆叠去噪自动编码器(SDAE)自动学习心跳的语义编码,然后将语义编码送入双向LST(Bi-LSTM)网络进行心跳分类。上述的各方案中虽然能实现一定的分类精度,但其技术方案都只关注患者内范式的心电信号分类,即训练集和测试集数据都来自于同一些病人,这样训练集和测试集就属于同一分布。当在训练集训练的模型分类测试集数据时,可以获得极高的分类精度。但是这并不符合实际情况,因为在实际应用中,心电分类模型根本无法提前获得测试病人的数据进行训练,所以训练数据和待测试的数据一定来自不同的病人,这称作患者间范式。而不同个体之间心电信号形态又各有差异,这使得训练集和测试集之间产生了域移位,因此,在患者间模式下,网络的心电信号分类效果不如患者内模式。上述问题也存在于图像分类中。
鉴于相关技术中存在的问题,为了解决患者间范式中的域移位问题,本发明实施例首先提出了一种心电分类方法,以下对本发明实施例的技术方案的实现细节进行详细阐述。
图1示出了可以应用本发明实施例的技术方案的示例性系统架构的示意图。
如图1所示,系统架构100可以包括终端设备(如图1中所示,智能手机101、平板电脑102和便携式计算机103中的一种或多种,当然也可以是台式计算机等智能终端设备)、网络104和服务器105。网络104用以在终端设备和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线通信链路、无线通信链路等等。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
在本发明的一个实施例中,用户可以通过终端设备103在终端向服务器105端发送对患者心电数据进行分类处理的数据处理请求,该数据处理请求中可以包含待处理的患者心电数据,或者是心电数据的地址。服务器105端在接收到该数据处理请求后,便可以提取心电数据,并对其执行分类操作,获取分类结果并返回终端。
需要说明的是,本发明实施例所提供的数据分类方法一般由服务器105执行,相应地,数据分类装置一般设置于服务器105中。但是,在本发明的其它实施例中,终端设备101也可以与服务器105具有相似的功能,协作执行本发明实施例所提供的心电分类方法。
图2示意性示出了根据本发明的一个实施例的心电分类方法的流程图。该方法可以在由终端设备和服务器端协作执行;或者,也可以由具备与服务器相似功能或计算能力的终端设备在本地执行。
在步骤S11中,获取待处理心电数据,对所述待处理心电数据进行预处理以获取心拍数据。
在本发明的一个实施例中,上述的待处理心电数据可以是对当前患者实时采集的心电数据。在获取待处理心电数据后,可以首先对心电数据进行预处理。具体来说,上述的预处理可以包括:
步骤S21,对所述待处理心电数据进行去噪处理,以获取去噪心电信号;
步骤S22,基于R波的波峰位置对所述去噪心电信号按预设的采样数量进行心拍划分,以获取原始心拍信号;
步骤S23,将各采样点对应的所述原始心拍信号进行归一化处理,映射至预设的数值区间,以获取所述心拍数据。
举例来说,心电信号在采集的过程中很容易引入各种噪声,比如工频干扰、基线漂移、肌电干扰以及电极接触噪声等。这些噪声会影响心电信号的分类精度,为了消除这些噪声,我们采用离散小波变换对心电信号进行去噪。首先利用离散小波变换对含有噪声的心电信号进行8尺度的小波分解,得到各尺度上的小波系数,小波系数计算公式如下:
其中,f(t)为带噪声的心电信号,%j,k为离散小波函数,j,k∈Z。
然后采用软阈值函数来计算阈值,用来过滤每个尺度上小波系数的噪声成分,最后采用离散小波逆变换来重建信号;公式如下:
其中,C为一个与信号无关的常数。
在数据去噪后,我们可以得到去噪的心电信号。针对去噪后的心电信号,根据注释中R波的波峰位置来进行心拍分割。具体划分方法为:以R波波峰为参考点,向前取99个采样点,向后取200个采样点,共300个采样点,对应的时长约为0.83秒,而普通人的心跳周期持续时间为0.6~0.8秒,所以划分的这些心拍中可以包含一个完整的心跳周期。
完成心拍划分后,可以对各采样点进行归一化处理,将心拍的强度值映射到-1~1的范围内,这样有助于神经网络更好的提取特征。归一化公式可以包括:
其中,x为心拍数据,Xmin和Xmax分别为心拍数据采样点中的最小值和最大值。
在步骤S12中,将所述心拍数据输入已训练的心电分类模型,利用特征提取器对所述心拍数据进行卷积处理,以获取特征数据;其中,所述特征提取器包括连续设置的若干个的卷积层。
在本发明的一个实施例中,参考图3所示的模型结构,提取器F包括4个卷积层(conv1-conv4)和一个全连接(fc5),可以用于提取数据的特征向量。其中,conv1层由4个核大小为1×21的卷积核组成,其激活函数采用ReLU,其后跟着一个池大小为1×3的最大池化层;conv2层由16个核大小为1×23的卷积核组成,激活函数同样采用ReLU,其后也跟着一个池大小为1×3的最大池化层;conv3层由32个核大小为1×25的卷积核组成,同样是ReLU激活函数,但池化层采用池大小为1×3的平均池化层;conv4层由64个核大小为1×27的卷积核组成,也采用ReLU激活函数;在conv4层之后可以设置有一Flatten层,用于将conv4层输出的特征数据进行数据压平处理,转换为一维数据;在Flatten层之后设置具有128个神经元的全连接层。
在步骤S13中,利用分类器对所述特征数据进行全连接处理,以获取所述待处理心电数据对应的分类结果;其中,所述分类器包括全连接层。
在本发明的一个实施例中,参考图3所示,分类器可以由一个全连接层(fc6)组成。具体的,可以是具有4个神经元的全连接层,采用softmax激活函数,来预测心拍数据分别属于4种心拍类型的概率。
在本发明的一个实施例中,上述的方法还可以包括:训练所述心电分类模型。具体来说,模型的训练过程可以包括:
步骤S31,对心拍样本数据划分训练集和测试集,以及构建基于卷积神经网络的初始模型;
步骤S32,利用训练集对初始模型进行第一阶段预训练,以获取预训练模型;
步骤S33,利用训练集和和测试集对所述预训练模型进行第二阶段域自适应训练,以获取所述心电分类模型。
在本发明的一个实施例中,对于上述的心拍样本数据,可以使用MIT-BIH心律失常数据库作为我们的心电数据的来源,作为原始心电数据。MIT-BIH数据库包含了在1975到1979年采集的47名病人的48条心电图记录,每条记录时长约30分钟,采样频率为360HZ。每条记录包含两个导联的数据,第一个导联为Ⅱ导联,第二个导联大多为Ⅴ1导联。通常,QRS波群在Ⅱ导联中最明显,所以我们采用的是Ⅱ导联数据。MIT-BIH心律失常数据库中的每个心拍都是由两名心脏病专家独立标记,最后对具有分歧的心拍标记进行共同协商,确定标记类型,非常具有权威性。通常R波波峰位置在注释信息中给定。
对于原始心电数据,可以采用如上述步骤S21-步骤S23的方法进行预处理,得到心拍样本数据。对于心拍样本数据,可以按一定的比例划分训练集和测试集。具体的,将训练集称为源域,测试集称为目标域。源域有ns个带有标记的样本,目标域包含nt个不带标记的样本,假设源域和目标域分别从概率分布p和q中采样,p≠q。由于源域和目标域的概率分布之间存在差异,在源域训练的模型很难在目标域有着出色的表现。
传统的机器学习算法通常假设训练样本和测试样本来自同一概率分布。基于此假设,研究人员设计了相应的模型和判别标准来对测试集样本进行分类。然而,这种假设在心律失常分类中是不合理的。这是因为目前心律失常分类中训练样本和测试样本的分布略有不同,这将影响网络在测试集中的分类性能。如何克服这个问题,并将知识从源域迁移到目标域,这就是本申请的技术方案所关注的。
在本发明的一个实施例中,根据域自适应原理,设计了一个基于CNN的域自适应网络。具体来说,CNN是一类包含卷积计算且具有深度结构的前馈神经网络,它提供了一种端到端的学习模型,可以从数据中学习更具有抽象意义的特征,并对数据进行分类。CNN不仅广泛应用于二维图像数据,对于处理一维信号也具有不错的表现。由于待分类的心电信号是一维数据,故本申请采用一维卷积神经网络(1D-CNN)。
其网络结构如图3所示,该网络由4个卷积层(conv1-conv4)和2个全连接层(fc5-fc6)组成。conv1-fc5组成特征提取器F,用来提取数据的特征向量,而fc6组成分类器C,将数据归类到它应属于的类。网络的详细结构可以包括:该CNN模型的输入是大小为1×300的心拍数据,conv1由4个核大小为1×21的卷积核组成,其激活函数采用ReLU,其后跟着一个池大小为1×3的最大池化层;conv2由16个核大小为1×23的卷积核组成,激活函数同样采用ReLU,其后也跟着一个池大小为1×3的最大池化层;conv3由32个核大小为1×25的卷积核组成,同样是ReLU激活函数,但池化层采用池大小为1×3的平均池化层;conv4由64个核大小为1×27的卷积核组成,也采用ReLU激活函数;然后是Flatten层和具有128个神经元的全连接层后,以上组成特征提取器F,分类器C为具有4个神经元的全连接层,采用softmax激活函数。
在本发明的一个实施例中,对于上述的步骤S32,具体可以包括:
步骤S321,将训练集输入模型,利用特征提取器对所述训练集进行卷积处理,以获取特征数据;
步骤S322,利用分类器对所述特征数据进行全连接处理,以获取所述训练集对应的分类结果;
步骤S323,根据分类结果计算分类损失,并利用梯度下降法最小化分类损失,更新模型的网络参数。
具体而言,在预训练阶段,我们选择源域80%的心拍样本作为训练集来训练网络,而剩下的20%的心拍样本则作为测试集来测试网络的分类性能。参考图4所示,在训练过程中,我们将训练集的心拍送入到神经网络中进行训练,特征提取器F从样本中提取抽象高效的特征,然后分类器C根据提取到的特征对样本进行分类。再根据分类结果计算分类损失Lcls。最后采用小批量梯度下降法(MBGD)来最小化分类损失,并更新网络参数。当训练结束时,预训练后的网络可以准确地对源域测试集的心拍进行分类,但对于目标域心拍并没有很好的分类性能。
其中,对于分类损失Lcls,为了确保源域的分类准确性。我们可以通过最小化在源域标记数据的分类损失Lcls来实现这一点,Lcls计算公式如下:
在本发明的一个实施例中,由于目标域数据没有被标记,因此无法通过微调直接将在源域数据上训练的CNN模型适应到目标域。虽然源域和目标域的概率分布略有不同,但它们的分类任务是相同的。要想分类目标域数据,只能借助在源域数据上训练的分类器,再采用域自适应方法,将知识从带有标记的源域数据迁移到没有标记的目标数据。
对于上述的步骤S33,具体可以包括:
步骤S331,将测试集和训练集输入所述预训练模型,通过特征提取器获取对应的特征向量;
步骤S332,将测试集的特征向量和训练集的特征向量映射到再生核希尔伯特空间中,计算测试集和训练集之间特征分布的最大均值差异;
步骤S333,利用分类器对测试集特征数据和训练集特征数据进行全连接处理,以获取对应的分类结果;
步骤S334,基于训练集的分类结果计算分类损失,基于测试集的分类结构计算熵损失;
步骤S335,结合最大均值差异、分类损失和熵损失构建总损失函数,利用梯度下降法最小化总损失,以更新模型的网络参数。
经过预训练后,网络基本上可以对目标域数据进行分类,但仍需要对网络进行调整,以便在目标域达到更高的分类精度。因此,在域自适应阶段,我们通过最小化总损失loss对预训练的网络进行微调,总损失loss的计算公式如下
loss=Lcls+λ*Mk(Ds,Dt)+β*H(Dt)
其中,Lcls表示分类损失,H(Dt)表示熵损失,超参数λ、β表示熵损失和最大均值差异之间的权衡参数,Mk(Ds,Dt)表示最大均值差异。
与源域一样,目标域数据也被划分为训练集和测试集,划分比例为8:2。前者用于调整网络,后者用于测试最终网络的分类性能。
参考图5所示,可以首先将源域和目标域的训练心拍送入到预先训练的网络中,通过特征提取器F提取它们的特征向量。然后将特征向量映射到RKHS中。根据式(8)可以计算出源域和目标域数据特征分布之间的MK-MMD,而根据网络对源域数据和目标域数据的分类结果,分别计算分类损失Lcls和熵罚H(Dt)。随后,采用MBGD方法最小化总损失loss,以更新网络参数,例如权重以及偏执量。迭代过程完成后,网络学习到可迁移的特征表示,可以将源域数据和目标域数据尽可能地映射到同一概率分布中。
在本发明的一个实施例中,对于上述总损失函数中的熵损失和最大均值差异,通过以下实施例进行说明。
具体来说,如果在网络优化过程只最小化源域数据的分类损失,这通常会导致对源域数据的过拟合,从而在对目标域数据进行分类时表现不佳。为了提高网络在目标域的分类精度,我们希望最小化源域和目标域数据特征分布之间的差异,学习一种可迁移的特征表示。为了训练这种表示,我们考虑了最大均值差异(Maximum Mean Discrepancy,MMD)来作为源域和目标域之间的差异度量。MMD是迁移学习,尤其是域自适应中使用最广泛的一种损失函数,主要用来度量两个不同但相关的分布之间的距离。在计算域差异的过程中,我们通过非线性特征映射将源域和目标域数据映射到再生核希尔伯特空间中。该空间是通过特征核k生成的。然后在此空间中计算源域与目标域特征分布之间的MMD距离。
核k的选择对计算MMD来说至关重要,但选择一个合适的核是很困难的,因为我们不清楚对于该任务来说哪种核是最优的。为了减少核函数选择不当的影响,我们使用MK-MMD来测量源域和目标域之间的差异。定义特征核k为m个核{ku}的凸组合。对每个核前乘一个系数,通过网络学习确定系数的值,从而得到最优的核。多核k的计算公式如下:
其中,βu是核ku的系数。
源域和目标域概率分布之间的MK-MMD的经验近似计算如下:
进一步展开该公式,可以得到以下公式:
基于此,可以利用核函数计算源域分布与目标域分布之间的MK-MMD。
另外,虽然最小化了源域和目标域之间的分布差异,但其仍然存在。因此,CNN分类器仍然不能对未标记的目标域数据进行准确分类。为了进一步提高网络在目标域的分类精度,分类器C的决策边界应能够通过未标记目标数据的低密度区域。为了实现所有类之间的低密度分离,我们采用了熵最小化原理。最小化熵惩罚相当于最小化预测目标数据标签的不确定性,分类器F将进行自我调整,以通过目标域的低密度区域。熵惩罚计算公式如下:
在本公开的其他示例性实施方式中,参考图10所示,示意性示出了根据本发明的一个实施例的基于域自适应的心电分类模型训练方法的流程图。具体来说,可以包括:
步骤S41,获取样本心电数据,对所述样本心电样本数据进行预处理,并对预处理后的数据划分训练集和测试集;
步骤S42,构建基于卷积神经网络的模型;其中,模型包括:用于提取特征数据的特征提取器,用于根据特征数据进行分类的分类器;特征提取器包括连续设置的若干个的卷积层,所述分类器包括全连接层;
步骤S43,利用训练集对初始模型进行第一阶段预训练,以获取预训练模型;
步骤S44,利用训练集和和测试集对所述预训练模型进行第二阶段域自适应训练,以获取心电分类模型。
具体的,以MIT-BIH心律失常数据库作为心电样本数据。预处理过程如上述实施例中所述,可以包括去噪、心跳分割、归一化处理。模型的网络结构参考图3所示,conv1-fc5组成特征提取器F,用来提取数据的特征向量,而fc6组成分类器C,将数据归类到它应属于的类。其中,预训练阶段、自适应训练阶段的损失函数如上述实施例所述。本实施例中不再赘述。
对于本模型训练方法中的基于一维卷积神经网络的心电分类模型来说,对于卷积神经网络来说,随着网络层数的不断增加,每一层提取的特征最终会从一般特征转化为特定特征。域差异越大,较高层提取的源域和目标域数据的特定特征的分布之间的距离就越大,因此特征表示的可迁移性就越差。根据对特征可迁移性的量化研究,conv1-conv2学习的是数据的一般特征,而在conv3-conv4,学习的特征稍微特定化(slightly specific),这些特征可以进行转移。所以在域适应阶段,仅需对conv1-conv4进行微调。在一定程度上,全连接层fc5提取的特征已经特定化,无法安全地迁移,所以我们通过最小化特征分布之间的多核最大均值差异(MK-MMD)来学习可迁移的特征表示。我们通过特征提取器F从源域和目标域数据中提取特征向量,然后再计算源域与目标域特征向量概率分布之间的MK-MMD。FC6为分类器,通过对前面特征提取器F提取到的特征向量进行分析处理,最终得到对心拍数据的分类结果,根据分类结果计算交叉熵损失和熵损失。
在本发明的一个实施例中,为了更好地评价本方法的性能,我们采用了心电分类相关工作中常用的五个评价指标,分别是敏感度(Sen)、阳性预测率(Ppr)、F1分数(F1)、F1-宏分数(F1-macro)和总体准确率(Acc)。其中,Sen、Ppr和F1评价单个类别的分类性能,Acc和F1-macro对整体性能进行评价。评价指标的计算公式为:
灵敏度:Sen=TP/(TP+FN)
阳性预测率:Ppr=TP/(TP+FP)
总体分类精度:Acc=(TP+TN)/(TP+FP+TN+FN)
F1分数:F1=2(Sen*Ppr)/(Sen+Ppr)
其中,TP、FP、TN和FN表示真阳性、假阳性、真阴性和假阴性样本的个数。而F1-macro为待比较各类F1得分的未加权平均值。
对于数据划分,为了满足患者间范式的数据划分要求,利用已知的“使用心电图形态和心跳间隔特征自动分类心跳”的方法来划分MIT-BIH数据库。根据美国医疗设备发展协会(AAMI)的建议,不使用102、104、107和217这四条记录,其余记录将被划分为两个子数据集,即DS1和DS2。DS1是源域数据集,包括101、106、108、109、112、114、115、116、118、119、122、124、201、203、205、207、208、209、215、220和230共22条记录。剩下的100、103、105、111、113、117、121、123、200、202、210、212、213、214、219、221、222、228、231、232、233和234这22条记录构成目标域数据集DS2。这种划分方法更符合实际情况。
对于心拍分类,为了将所提方法与现有方案进行比较,我们采用了在这些方案中使用的心拍分类方法。具体地说,我们严格按照AAMI标准对MIT-BIH数据库中的心拍数据进行分类。在MIT-BIH数据库中有15种不同的心跳类型。根据ANSI/AAMI EC57:1998标准,这15类心拍可进一步被分为以下5类之一(正常搏动(N)、室上异位搏动(SVEB)、室上异位搏动(VEB)、融合搏动(F)和未知搏动(Q))。具体划分方法如表1所示。
表1
由于在AAMI标准中Q类心拍很少,所以我们只关注其他四种类型的心拍。源域DS1总共有50709个心跳样本,目标域DS2有49400个心跳样本。表2显示了两个数据集中4种心拍类型的详细数量。
表2
如表2所示,在MIT-BIH数据库中,N类心拍占总心拍的89.5%,这导致各类心拍数量分布极不均衡。然而,CNN网络是一种基于均衡的训练数据的多分类算法。训练数据越不平衡,CNN的整体分类性能就越差。因此,我们在源域和目标域都只取5000个N类的心拍样本。
在预训练阶段,主要使用如表3所示的网络参数。
表3
在自适应训练阶段,主要使用如表4所示的网络参数。
表4
为了展示所提出的域自适应方法的性能,我们比较了域自适应前后的分类结果。此外,我们还将我们的方法与其他几种心拍分类方法进行了比较,这些方法都使用了患者间范式的数据划分方法,并且在MIT-BIH心律失常数据库上进行了评估。具体地说,我们用源域数据预训练网络,该网络对源域测试集数据的分类准确率超过98%,却在目标域测试集上获得了83.40%的分类准确率。在此基础上,我们使用域自适应方法对预先训练的网络进行微调。分类精度随迭代次数的变化曲线如图6所示。
当采用域自适应方法时,精度曲线逐渐上升,最终趋于稳定。作为对比,我们使用源域数据对预训练的网络进行再次训练,而不使用域自适应方法。结果表明,随着迭代次数的增加,精度曲线基本保持平稳不变。如图6所示,采用域自适应方法得到的精度曲线始终高于未采用域自适应方法得到的曲线,且两者之间的差距逐渐增大。可以看出,域自适应方法提高了患者间范式的分类性能。引入域自适应后,该网络的总体分类准确率达到90.98%,提高了7.58%。
此外,我们还对数据集中的网络损失进行了分析。图7分别描述了分类损失、MK-MMD损失、熵损失和总损失分别随迭代次数增加而变化的曲线。在域自适应阶段,总损失由分类损失、MK-MMD和熵损失三部分组成。我们旨在通过最小化总损失来优化网络。在预训练阶段,我们已经用源域数据预训练了我们的模型,在最小化总损失之前,分类损失已经达到收敛。因此,从图7中可以看出,当最小化总损失时,分类损失曲线不再下降,而是保持平稳。然而,随着迭代次数的增加,MK-MMD损失和熵损失逐渐减小,并最终趋于稳定。总损失曲线也趋于下降。刚开始迭代时,总损失曲线下降速度比较快。网络经过25次迭代后,曲线下降速度逐渐减慢。最后在网络迭代50次后,总损失曲线趋于稳定。由此可以推断出,我们的算法在迭代50次后便可达到收敛。
另外,还研究了数据量对算法精度的影响。我们在源域和目标域分别取100%、75%、50%、25%和13%的训练数据,对我们的域自适应网络进行微调。最终得到的精度曲线如图8所示。从图8中我们可以看出,随着训练数据量的增加,分类精度也在提高。当训练数据量为13%时,最终的分类精度可以达到85.26%。当数据量为25%时,准确率可以达到86.51%。而当训练数据量为50%时,最终分类准确率为90.26%。50%数据对应的准确率曲线已经基本接近采用100%数据时的表现,而75%和100%数据的准确率曲线基本相互重合。
域自适应前后的分类混淆矩阵如图9(a)、图9(b)所示。我们可以根据混淆矩阵计算出各个评价指标的具体数值。表5列出了域自适应前后各评价指标的比较结果。采用域自适应方法后,网络对每类心拍的分类性能有所提升。对于N类心拍,敏感性、阳性预测率和F1分数分别提高了12.48%、1.35%和0.08。在VEB类心拍中,这些指标分别增长了0.49%、5.35%和0.03。对于分类SVEB心拍,这些指标分别有0.58%、20.11%和0.11的提升。对于F类心拍,域自适应方法在各指标上分别实现了28.05%、11.22%和0.16的提升。实验结果表明,该方法有效地减轻了因源域和目标域心拍数据概率分布存在差异而引起的分类性能下降的影响。
表5
表5展示了我们的算法和其他几个先进算法的比较结果。在[26]中提出了一个具有批量加权损失的CNN来对心电信号分类,而[27]将LSTM和CNN结合起来识别ECG。在[28]中提出了一种基于对抗域自适应的新型深度学习方法用于ECG分类。如表5所示,与经典的深度学习算法[26]和[27]相比,我们提出的算法取得了更高的总体分类精度和F1宏分数,这是因为我们不仅使用了深度学习算法中的CNN,还考虑了最小化源域和目标域数据概率分布之间的域差异,尽可能将源域和目标域数据映射为相似的概率分布。这样可以提高网络对目标域数据的分类性能。虽然相较于[28]中采用的对抗域自适应算法,我们算法的总体分类精度略低,但我们的算法在分类VEB、SHEB和F类心拍方面有明显的优势。我们也获得了更高的f1-宏分数,这意味着我们的算法具有均衡的分类性能。这是因为我们不仅减小了源域和目标域概率分布之间的差异,而且通过最小化熵损失来降低网络对目标域数据标签预测的不确定性,这更有利于网络对数据进行准确分类。
根据本发明实施例中的心电分类方法,以及心电分类模型训练方法,将域自适应方法应用到心律失常分类中,开发了基于CNN的深度域自适应网络来对心律失常进行分类,目的是解决在患者间范式下,因域差异存在而引起的分类性能下降的问题。具体来说,通过最小化源域数据和目标域数据概率分布之间的MK-MMD以及根据网络对目标域数据的预测结果计算得到的熵损失,我们缩小了域差异,并学习了可迁移的特征表示。随后,我们在MIT-BIH心律失常数据库上训练并测试了我们提出的域自适应网络。我们采用源域心拍数据对网络进行预训练,在目标域测试集上获得了83.40%的准确率。在此基础上,通过域自适应方法对预训练的网络进行微调,从而提高网络分类性能。经过域自适应后,网络在目标域测试集上的分类准确率提高到90.98%。在域自适应之前,在源域数据上训练的分类器只能对源域数据进行精确分类,而在目标域的分类效果不理想,经过域自适应,源域和目标域分布之间的距离拉近,在目标域的分类性能也得到提升。此外,该方法不需要目标域的任何标注信息,更符合实际。
以下介绍本发明的装置实施例,可以用于执行本发明上述实施例中内容缓存管理方法。对于本发明装置实施例中未披露的细节,请参照本发明上述的多媒体播放控制方法的实施例。
图11示意性示出了根据本发明的一个实施例的心电分类装置的框图。
参照图11所示,根据本发明的一个实施例的心电分类装置110,包括:预处理模块1101、特征提取模块1102、分类模块1103。其中,
所述预处理模块1101可以用于获取待处理心电数据,对所述待处理心电数据进行预处理以获取心拍数据。
所述特征提取模块1102可以用于将所述心拍数据输入已训练的心电分类模型,利用特征提取器对所述心拍数据进行卷积处理,以获取特征数据;其中,所述特征提取器包括连续设置的若干个的卷积层。
所述分类模块1103可以用于利用分类器对所述特征数据进行全连接处理,以获取所述待处理心电数据对应的分类结果;其中,所述分类器包括全连接层。
在本发明的一个实施例中,所述预处理模块1101可以包括:去噪处理单元、心拍划分处理单元、归一化处理单元。其中,
所述去噪处理单元可以用于对所述待处理心电数据进行去噪处理,以获取去噪心电信号。
所述心拍划分处理单元可以用于基于R波的波峰位置对所述去噪心电信号按预设的采样数量进行心拍划分,以获取原始心拍信号。
所述归一化处理单元可以用于将各采样点对应的所述原始心拍信号进行归一化处理,映射至预设的数值区间,以获取所述心拍数据。
在本发明的一个实施例中,所述装置110还可以包括:模型训练模块。
所述模型训练模块可以用于对心拍样本数据划分训练集和测试集,以及构建基于卷积神经网络的初始模型;利用训练集对初始模型进行第一阶段预训练,以获取预训练模型;利用训练集和和测试集对所述预训练模型进行第二阶段域自适应训练,以获取所述心电分类模型。
在本发明的一个实施例中,所述模型训练模块可以包括:将训练集输入模型,利用特征提取器对所述训练集进行卷积处理,以获取特征数据;利用分类器对所述特征数据进行全连接处理,以获取所述训练集对应的分类结果;根据分类结果计算分类损失,并利用梯度下降法最小化分类损失,更新模型的网络参数。
在本发明的一个实施例中,所述计算分类损失包括:
在本发明的一个实施例中,所述模型训练模块可以包括:将测试集和训练集输入所述预训练模型,通过特征提取器获取对应的特征向量;将测试集的特征向量和训练集的特征向量映射到再生核希尔伯特空间中,计算测试集和训练集之间特征分布的最大均值差异;利用分类器对测试集特征数据和训练集特征数据进行全连接处理,以获取对应的分类结果;基于训练集的分类结果计算分类损失,基于测试集的分类结构计算熵损失;结合最大均值差异、分类损失和熵损失构建总损失函数,利用梯度下降法最小化总损失,以更新模型的网络参数。
在本发明的一个实施例中,所述结合最大均值差异、分类损失和熵损失构建总损失函数,包括:
loss=Lcls+λ*Mk(Ds,Dt)+β*H(Dt)
其中,Lcls表示分类损失,H(Dt)表示熵损失,超参数λ、β表示熵损失和最大均值差异之间的权衡参数,Mk(Ds,Dt)表示最大均值差异。
图12示意性示出了根据本发明的一个实施例的基于域自适应的心电分类模型训练装置的框图。
参照图12所示,根据本发明的一个实施例的基于域自适应的心电分类模型训练装置120,包括:样本数据处理模块1201、模型构建模块1202、第一阶段训练模块1203、第二阶段训练模块1204。其中,
所述样本数据处理模块1201可以用于获取样本心电数据,对所述样本心电样本数据进行预处理,并对预处理后的数据划分训练集和测试集。
所述模型构建模块1202可以用于构建基于卷积神经网络的模型;其中,模型包括:用于提取特征数据的特征提取器,用于根据特征数据进行分类的分类器;特征提取器包括连续设置的若干个的卷积层,所述分类器包括全连接层。
所述第一阶段训练模块1203可以用于利用训练集对初始模型进行第一阶段预训练,以获取预训练模型。
所述第二阶段训练模块1204可以用于利用训练集和和测试集对所述预训练模型进行第二阶段域自适应训练,以获取心电分类模型。
上述的心电分类装置、基于域自适应的心电分类模型训练装置中各模块的具体细节已经在对应的心电分类方法、基于域自适应的心电分类模型训练方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
图13示出了适于用来实现本发明实施例的心电分类方法和/或基于域自适应的心电分类模型训练方法的计算机系统的结构示意图。
需要说明的是,图13示出的电子设备的计算机系统900仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图13所示,计算机系统900包括中央处理单元(Central Processing Unit,CPU)901,其可以根据存储在只读存储器(Read-Only Memory,ROM)902中的程序或者从存储部分908加载到随机访问存储器(Random Access Memory,RAM)903中的程序而执行各种适当的动作和处理。在RAM 903中,还存储有系统操作所需的各种程序和数据。CPU 901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(Input/Output,I/O)接口905也连接至总线904。
以下部件连接至I/O接口905:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
特别地,根据本发明的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元(CPU)901执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本发明实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (12)
1.一种心电分类方法,其特征在于,包括:
获取待处理心电数据,对所述待处理心电数据进行预处理以获取心拍数据;
将所述心拍数据输入已训练的心电分类模型,利用特征提取器对所述心拍数据进行卷积处理,以获取特征数据;其中,所述特征提取器包括连续设置的若干个的卷积层;以及
利用分类器对所述特征数据进行全连接处理,以获取所述待处理心电数据对应的分类结果;其中,所述分类器包括全连接层。
2.根据权利要求1所述的心电分类方法,其特征在于,对所述待处理心电数据进行预处理,包括:
对所述待处理心电数据进行去噪处理,以获取去噪心电信号;
基于R波的波峰位置对所述去噪心电信号按预设的采样数量进行心拍划分,以获取原始心拍信号;
将各采样点对应的所述原始心拍信号进行归一化处理,映射至预设的数值区间,以获取所述心拍数据。
3.根据权利要求1所述的心电分类方法,其特征在于,所述方法还包括:训练所述心电分类模型,包括:
对心拍样本数据划分训练集和测试集,以及构建基于卷积神经网络的初始模型;
利用训练集对初始模型进行第一阶段预训练,以获取预训练模型;
利用训练集和和测试集对所述预训练模型进行第二阶段域自适应训练,以获取所述心电分类模型。
4.根据权利要求3所述的心电分类方法,其特征在于,所述利用训练集对初始模型进行第一阶段预训练,以获取预训练模型,包括:
将训练集输入模型,利用特征提取器对所述训练集进行卷积处理,以获取特征数据;
利用分类器对所述特征数据进行全连接处理,以获取所述训练集对应的分类结果;
根据分类结果计算分类损失,并利用梯度下降法最小化分类损失,更新模型的网络参数。
6.根据权利要求3所述的心电分类方法,其特征在于,所述利用训练集和和测试集对所述预训练模型进行第二阶段域自适应训练,以获取所述心电分类模型,包括:
将测试集和训练集输入所述预训练模型,通过特征提取器获取对应的特征向量;
将测试集的特征向量和训练集的特征向量映射到再生核希尔伯特空间中,计算测试集和训练集之间特征分布的最大均值差异;
利用分类器对测试集特征数据和训练集特征数据进行全连接处理,以获取对应的分类结果;
基于训练集的分类结果计算分类损失,基于测试集的分类结构计算熵损失;
结合最大均值差异、分类损失和熵损失构建总损失函数,利用梯度下降法最小化总损失,以更新模型的网络参数。
7.根据权利要求6所述的心电分类方法,其特征在于,所述结合最大均值差异、分类损失和熵损失构建总损失函数,包括:
loss=Lcls+λ*Mk(Ds,Dt)+β*H(Dt)
其中,Lcls表示分类损失,H(Dt)表示熵损失,超参数λ、β表示熵损失和最大均值差异之间的权衡参数,Mk(Ds,Dt)表示最大均值差异。
8.一种基于域自适应的心电分类模型训练方法,其特征在于,包括:
获取样本心电数据,对所述样本心电样本数据进行预处理,并对预处理后的数据划分训练集和测试集;
构建基于卷积神经网络的模型;其中,模型包括:用于提取特征数据的特征提取器,用于根据特征数据进行分类的分类器;特征提取器包括连续设置的若干个的卷积层,所述分类器包括全连接层;
利用训练集对初始模型进行第一阶段预训练,以获取预训练模型;
利用训练集和和测试集对所述预训练模型进行第二阶段域自适应训练,以获取心电分类模型。
9.一种心电分类装置,其特征在于,包括:
预处理模块,用于获取待处理心电数据,对所述待处理心电数据进行预处理以获取心拍数据;
特征提取模块,用于将所述心拍数据输入已训练的心电分类模型,利用特征提取器对所述心拍数据进行卷积处理,以获取特征数据;其中,所述特征提取器包括连续设置的若干个的卷积层;以及
分类模块,用于利用分类器对所述特征数据进行全连接处理,以获取所述待处理心电数据对应的分类结果;其中,所述分类器包括全连接层。
10.一种基于域自适应的心电分类模型训练装置,其特征在于,包括:
样本数据处理模块,用于获取样本心电数据,对所述样本心电样本数据进行预处理,并对预处理后的数据划分训练集和测试集;
模型构建模块,用于构建基于卷积神经网络的模型;其中,模型包括:用于提取特征数据的特征提取器,用于根据特征数据进行分类的分类器;特征提取器包括连续设置的若干个的卷积层,所述分类器包括全连接层;
第一阶段训练模块,用于利用训练集对初始模型进行第一阶段预训练,以获取预训练模型;
第二阶段训练模块,用于利用训练集和和测试集对所述预训练模型进行第二阶段域自适应训练,以获取心电分类模型。
11.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的心电分类方法,和/或,如权利要求8所述的基于域自适应的心电分类模型训练方法。
12.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的心电分类方法,和/或,如权利要求8所述的基于域自适应的心电分类模型训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111339975.3A CN114091530A (zh) | 2021-11-12 | 2021-11-12 | 心电分类方法、基于域自适应的心电分类模型训练方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111339975.3A CN114091530A (zh) | 2021-11-12 | 2021-11-12 | 心电分类方法、基于域自适应的心电分类模型训练方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114091530A true CN114091530A (zh) | 2022-02-25 |
Family
ID=80300321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111339975.3A Pending CN114091530A (zh) | 2021-11-12 | 2021-11-12 | 心电分类方法、基于域自适应的心电分类模型训练方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114091530A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115429284A (zh) * | 2022-09-16 | 2022-12-06 | 山东科技大学 | 心电信号分类方法、系统、计算机设备以及可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111449645A (zh) * | 2020-03-07 | 2020-07-28 | 河南大学 | 心电图心拍智能分类识别方法 |
CN113303814A (zh) * | 2021-06-13 | 2021-08-27 | 大连理工大学 | 基于深度迁移学习的单通道耳脑电自动睡眠分期方法 |
US20230342595A1 (en) * | 2020-01-17 | 2023-10-26 | Shanghai Lepu CloudMed Co., LTD | Heartbeat classification method and device for multi-tag ecg signal labeling |
-
2021
- 2021-11-12 CN CN202111339975.3A patent/CN114091530A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230342595A1 (en) * | 2020-01-17 | 2023-10-26 | Shanghai Lepu CloudMed Co., LTD | Heartbeat classification method and device for multi-tag ecg signal labeling |
CN111449645A (zh) * | 2020-03-07 | 2020-07-28 | 河南大学 | 心电图心拍智能分类识别方法 |
CN113303814A (zh) * | 2021-06-13 | 2021-08-27 | 大连理工大学 | 基于深度迁移学习的单通道耳脑电自动睡眠分期方法 |
Non-Patent Citations (2)
Title |
---|
JIANG FAN等: "Lightweight Neural Networks for Automatic Classification of ECG Signals", 《2022 14TH INTERNATIONAL CONFERENCE ON WIRELESS COMMUNICATIONS AND SIGNAL PROCESSING, WCSP》, 31 December 2022 (2022-12-31) * |
YANRUI JIN等: "A novel Domain Adaptive Residual Network for automatic Atrial Fibrillation Detection", 《KNOWLEDGE-BASED SYSTEMS》, vol. 203, 5 September 2020 (2020-09-05), pages 3 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115429284A (zh) * | 2022-09-16 | 2022-12-06 | 山东科技大学 | 心电信号分类方法、系统、计算机设备以及可读存储介质 |
CN115429284B (zh) * | 2022-09-16 | 2024-05-03 | 山东科技大学 | 心电信号分类方法、系统、计算机设备以及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xu et al. | Interpretation of electrocardiogram (ECG) rhythm by combined CNN and BiLSTM | |
Huang et al. | Accurate classification of ECG arrhythmia using MOWPT enhanced fast compression deep learning networks | |
CN108090509B (zh) | 一种数据长度自适应的心电图分类方法 | |
CN111297349A (zh) | 一种基于机器学习的心律分类系统 | |
CN110974214A (zh) | 一种基于深度学习的自动心电图分类方法、系统及设备 | |
Xiang et al. | ECG-based heartbeat classification using two-level convolutional neural network and RR interval difference | |
Banerjee et al. | A hybrid CNN-LSTM architecture for detection of coronary artery disease from ECG | |
Yao et al. | Interpretation of electrocardiogram heartbeat by CNN and GRU | |
CN115470832A (zh) | 一种基于区块链的心电信号数据处理方法 | |
Prakash et al. | A system for automatic cardiac arrhythmia recognition using electrocardiogram signal | |
Pandey et al. | Classification of electrocardiogram signal using an ensemble of deep learning models | |
Mohebbanaaz et al. | A new transfer learning approach to detect cardiac arrhythmia from ECG signals | |
CN114190950B (zh) | 一种针对含有噪声标签的心电图智能分析方法及心电仪 | |
Wang et al. | Multiscale residual network based on channel spatial attention mechanism for multilabel ECG classification | |
Göker | Welch Spectral Analysis and Deep Learning Approach for Diagnosing Alzheimer's Disease from Resting-State EEG Recordings | |
CN114091530A (zh) | 心电分类方法、基于域自适应的心电分类模型训练方法 | |
CN110786847B (zh) | 心电信号的建库方法和分析方法 | |
Wang et al. | Pay attention and watch temporal correlation: a novel 1-D convolutional neural network for ECG record classification | |
Haroon | ECG arrhythmia classification Using deep convolution neural networks in transfer learning | |
Zhang | Arrhythmias classification based on CNN and LSTM_ATTENTION hybrid model | |
Zhu et al. | A ResNet based multiscale feature extraction for classifying multi-variate medical time series | |
Nankani et al. | Improved diagnostic performance of arrhythmia classification using conditional gan augmented heartbeats | |
CN113143204A (zh) | 心电信号质量评估方法、计算机装置和存储介质 | |
Shafaatfar et al. | Improving the Efficiency of Automatic Cardiac Arrhythmias Classification by a Novel Patient-Specific Feature Space Mapping | |
Zhao et al. | ECG-Based Arrhythmia Detection Using Attention-Based Convolutional Neural Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |