CN115429286A - 一种心电表征自监督学习方法 - Google Patents
一种心电表征自监督学习方法 Download PDFInfo
- Publication number
- CN115429286A CN115429286A CN202211241397.4A CN202211241397A CN115429286A CN 115429286 A CN115429286 A CN 115429286A CN 202211241397 A CN202211241397 A CN 202211241397A CN 115429286 A CN115429286 A CN 115429286A
- Authority
- CN
- China
- Prior art keywords
- formula
- noise
- encoder
- data
- electrocardio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
- A61B5/318—Heart-related electrical modalities, e.g. electrocardiography [ECG]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
- A61B5/318—Heart-related electrical modalities, e.g. electrocardiography [ECG]
- A61B5/346—Analysis of electrocardiograms
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7203—Signal processing specially adapted for physiological signals or for diagnostic purposes for noise prevention, reduction or removal
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/725—Details of waveform analysis using specific filters therefor, e.g. Kalman or adaptive filters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Animal Behavior & Ethology (AREA)
- Medical Informatics (AREA)
- Pathology (AREA)
- Heart & Thoracic Surgery (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Surgery (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Cardiology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physiology (AREA)
- Psychiatry (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
本发明涉及心电数据处理、深度学习、对比学习和对抗学习技术领域,具体涉及一种心电表征自监督学习方法,包括以下步骤:步骤1,基于增噪处理和滤波处理实现心电数据转换处理,心电数据转换处理分为预处理阶段、增噪处理阶段和滤波处理阶段;步骤2,基于对抗学习构建编码器与判别器对抗任务,通过构建心电表征自监督学习模型的对抗学习模块,以实现编码器和判别器的对抗任务;步骤3,基于回归网络构建心电时空回归任务,通过构建心电表征自监督学习模型的回归模块,以实现心电数据时空回归任务;步骤4,基于对比学习构建患者对比任务,构建心电表征自监督学习模型的对比学习模块,以实现患者对比任务。
Description
技术领域
本发明涉及心电数据处理、深度学习、对比学习和对抗学习技术领域,具体涉及一种心电表征自监督学习方法。
背景技术
心血管疾病(Cardiovascular disease,CVD)是威胁全世界人类生命健康的重大疾病之一。根据《中国卫生健康统计年鉴2020》显示,2019年心血管疾病死亡率在我国城市居民中居于第二位,在农村居民中居于首位。心电图(Electrocardiogram,ECG)信号的波形变化可以反映出CVD的病理变化,它是常用于诊断CVD的临床工具,每年有超过3亿的ECG信号数据产生。为了能够有效分析疗CVD的病理变化,大量研究人员开展基于深度神经网络(Deep neura network,DNN)检测ECG信号中CVD的研究,即通过足够充分覆盖未来的ECG样本,学习到的多层权重,从而可以很好的用来预测分析CVD的病理变化,便于推动智能诊断模型在临床应用。然而,DNN的泛化性能十分依赖于有标记数据的数量和质量,但是现有标记数据数量也非常有限,这导致智能诊断模型难以投入临床应用。因此,如何利用大量的无标记ECG数据提高DNN的泛化性能,对于智能诊断的临床应用具有非常重大的意义。
提高DNN泛化性能的关键在于是否能够学习到数据的有效表征。对比学习是一种优秀的自监督表征学习方式,它能够凭借自监督任务从无标记数据中学习到有效表征。其核心是利用数据转换处理,构建正负实例对(来自同一实例的转换视图为正例对,不同实例的转换视图为负例对),通过最大化正例对表征的相似度和最小化负例对表征的相似度来完成表征学习。但是ECG数据为时序信号,且ECG数据具有多个通道,因此无论在数据转换处理还是自监督任务构建,都应当结合其时空特征。此外,对比学习在学习有效表征时,还会学习到因转换处理产生的无效表征,这将降低模型的泛化性能。在构建正负实例对时,由于同一一类别下的不同实例依然互为负例对,因此这些负例对将不利于模型学习有效表征,为此如何构建适用于ECG数据的自监督表征学习方法是一个亟待解决的问题。
因此,本发明提供一种降低噪音干扰,避免学习转换处理产生的无效表征,便于模型学习心电时空表征,实现模型学习心电的语义表征,提高DNN泛化性能的心电表征自监督学习方法,具有广泛的市场前景。
发明内容
针对现有技术的不足,本发明提供一种降低噪音干扰,避免学习转换处理产生的无效表征,便于模型学习心电时空表征,实现模型学习心电的语义表征,提高DNN泛化性能的心电表征自监督学习方法,用于克服现有技术中缺陷。
本发明采用的技术方案为:一种心电表征自监督学习方法,包括以下步骤:步骤1,基于增噪处理和滤波处理实现心电数据转换处理,心电数据转换处理分为预处理阶段、增噪处理阶段和滤波处理阶段;步骤2,基于对抗学习构建编码器与判别器对抗任务,通过构建心电表征自监督学习模型的对抗学习模块,以实现编码器和判别器的对抗任务;步骤3,基于回归网络构建心电时空回归任务,通过构建心电表征自监督学习模型的回归模块,以实现心电数据时空回归任务;步骤4,基于对比学习构建患者对比任务,构建心电表征自监督学习模型的对比学习模块,以实现患者对比任务。
所述的步骤1中预处理包括对心电原始数据进行频率重采样和幅值归一化处理;步骤1中增噪处理阶段包括:以麻省理工学院噪声压力测试数据库为噪声源,随机截取任意噪声源导联下(噪声源2导联)与心电原始数据等长的基线漂移、肌电噪声及工频噪声片段,根据公式(1)分别在心电原始数据中合成上述三种噪声,
公式(1)为公式(1)中xi,l,t第i例第l导联第t时刻下心电数据的采样点幅值,Tabl,t、Tael,t和Tapl,t分别表示用于合成至xi,l,t的基线漂移、肌电噪声及工频噪声等噪声的采样点幅值;
步骤1中滤波处理阶段包括:分别采用巴特沃斯滤波器、有限脉冲响应滤波器和无限脉冲响应滤波器去除心电原始数据中的基线漂移、肌电噪声和工频噪声,根据公式(2)生成去噪后的心电数据,
编码器训练阶段包括:以有梯度编码器E()提取的表征为数据集,训练过程中固定判别器D()的参数,通过最小化公式(5)生产训练有梯度编码器E(),
所述的步骤3中回归模块包括两条支路,每条支路均由有梯度编码器E()和回归网络R()组成;时空回归任务分为表征重组和时空回归两个阶段;表征重组包括:根据公式(6)和公式(7)分别重组两条支路中有梯度编码器E()提取的表征,
训练中通过最小化公式(9)、公式(10)和公式(11)来生成最大化数据与语义令牌的互信息,
公式(11)为LossT=Ei∈N[Lossα+Lossβ]。
所述的步骤4中对比学习模块包括两条对比支路,每条支路均由映射网络P()和预测网络Q()组成;患者对比任务分为构建患者级实例集和对比学习两个阶段;构建患者级实例集阶段包括:根据数据集各个实例所属的患者ID信息,通过公式(12)构建患者级实例集patient_set,
公式(12)为patient_set={p1,…pi,…,pN},
公式(12)中N表示数据集实例数量。pi为患者级实例子集,表示第i个实例所属患者的其他实例,
对比学习阶段包括:以语义令牌和分别作为两条对比支路中映射网络P()的输入,得到映射向量和再以映射向量和作为预测网络Q()的输入,得到预测向量和通过最小化公式(13)、公式(14)、公式(15)和公式(16),最大化相同患者下实例的映射向量与预测向量的余弦相似度,
公式(16)为LossC=Ei∈N[Lossintra+Lossinter],
公式中sg()表示停止梯度;
通过最小化公式(17)实现模型学习信号的时空及语义有效表征,
公式(17)LossF=λ1LossG+λ2LossT+λ3LossC,
公式(17)中λ1、λ2和λ3分别表示LossG、LossT和LossC的权重。
本发明有益效果是:本发明提供一种适用于无监督场景下的心电表征自监督学习方法,该方法利用心电数据转换在保证数据时空特征的同时降低噪声对表征学习的干扰,确保了数据转换的准确率;其次,本发明通过构建心电表征自监督学习模型的对抗学习模块,实现编码器和判别器的对抗任务,从而避免学习转换处理产生的无效表征,并通过构建心电表征自监督学习模型的回归模块,使其时空回归任务和患者对比任务有效学习心电数据的时空和语义表征,达到模型学习心电时空表征的目的;再次,本发明通过构建心电表征自监督学习模型的对比学习模块,使其模型学习心电的语义表征,从而得到的预训练模型,从而有效提高DNN的泛化性能,有利于智能诊断的临床应用。
附图说明
图1为本发明的模型框架图。
图2为本发明的心电数据转换处理方法流程图。
图3为本发明的心电原始数据图、增噪视图和滤波视图。
图4为本发明的数据转换处理方法与其他先进方法比较结果的柱状图。
图5为本发明的自监督学习模型中编码器的结构图。
图6为本发明的自监督学习模型中回归网络的结构图。
图7为本发明的自监督学习模型与其他先进模型预训练结果的表征分布散点对比图。
图8为第一项本发明与已公开的监督学习在类别验证下的混淆矩阵对比图。
图9为第二项本发明与已公开的监督学习在类别验证下的混淆矩阵对比图。
图10为本发明与监督学习在半监督验证下的曲线对比图。
具体实施方式
如图1、2、3、4、5、6、7、8、9、10所示,一种心电表征自监督学习方法,包括以下步骤:步骤1,基于增噪处理和滤波处理实现心电数据转换处理,心电数据转换处理分为预处理阶段、增噪处理阶段和滤波处理阶段;步骤2,基于对抗学习构建编码器与判别器对抗任务,避免学习转换处理产生的无效表征,通过构建心电表征自监督学习模型的对抗学习模块,以实现编码器和判别器的对抗任务;步骤3,基于回归网络构建心电时空回归任务,通过构建心电表征自监督学习模型的回归模块,以实现心电数据时空回归任务;步骤4,基于对比学习构建患者对比任务,构建心电表征自监督学习模型的对比学习模块,提出了不需要负实例对的患者对比任务以提高模型学习语义表征的能力,以实现患者对比任务。
所述的步骤1中预处理包括对心电原始数据进行频率重采样和幅值归一化处理,以增噪处理和滤波处理作为心电数据转换处理方法,从而确保数据的时空特征不受转换影响,并降低噪声对表征学习的干扰;步骤1中增噪处理阶段包括:以麻省理工学院噪声压力测试数据库为噪声源,随机截取任意噪声源导联下(噪声源2导联)与心电原始数据等长的基线漂移、肌电噪声及工频噪声片段,根据公式(1)分别在心电原始数据中合成上述三种噪声,公式(1)为
公式(1)中xi,l,t第i例第l导联第t时刻下心电数据的采样点幅值,Tabl,t、Tael,t和Tapl,t分别表示用于合成至xi,l,t的基线漂移、肌电噪声及工频噪声等噪声的采样点幅值;
步骤1中滤波处理阶段包括:分别采用巴特沃斯滤波器、有限脉冲响应滤波器和无限脉冲响应滤波器去除心电原始数据中的基线漂移、肌电噪声和工频噪声,根据公式(2)生成去噪后的心电数据,
公式(2)中Tdbl,t、Tdel,t和Tdpl,t分别表示从xi,l,t中去除的基线漂移、肌电噪声及工频噪声等噪声的采样点幅值。
所述的步骤2中编码器分为有梯度编码器E()和无梯度编码器二者结构相同,用于提取心电表征;步骤2中判别器D()用于判别信号所属伪标签类别,根据转换方式定义以及公式(3)生成伪标签plδ;以完成数据集的判别任务,即辨别出增噪处理和滤波处理的数据,
公式(3)中δ∈{α,β},α和β分别表示心电原始数据经过增噪处理和滤波处理。
编码器训练阶段包括:以有梯度编码器E()提取的表征为数据集,训练过程中固定判别器D()的参数,通过最小化公式(5)生产训练有梯度编码器E(),
所述的步骤3中回归模块包括两条支路,每条支路均由有梯度编码器E()和回归网络R()组成;时空回归任务分为表征重组和时空回归两个阶段;表征重组包括:根据公式(6)和公式(7)分别重组两条支路中有梯度编码器E()提取的表征,按照提取的表征的长度,分别将两条支路有梯度编码器提取的表征段分割为头片段和尾片段,使其两条支路的头片段表征分别与另一支路的尾片段表征重组,
公式(6)和公式(7)中combine()表示重组操作,ri α和riβ表示有梯度编码器E()提取的表征,K为表征长度,τ为头片段长度;
训练中通过最小化公式(9)、公式(10)和公式(11)来生成最大化数据与语义令牌的互信息,以达到模型学习心电时空表征的目的,
公式(11)为LossT=Ei∈N[Lossα+Lossβ]。
所述的步骤4中对比学习模块包括两条对比支路,每条支路均由映射网络P()和预测网络Q()组成;患者对比任务分为构建患者级实例集和对比学习两个阶段;构建患者级实例集阶段包括:根据数据集各个实例所属的患者ID信息,通过公式(12)构建患者级实例集patient_set,
公式(12)为patient_set={p1,…pi,…,pN},
公式(12)中N表示数据集实例数量。pi为患者级实例子集,表示第i个实例所属患者的其他实例,
对比学习阶段包括:以语义令牌和分别作为两条对比支路中映射网络P()的输入,得到映射向量和再以映射向量和作为预测网络Q()的输入,得到预测向量和通过最小化公式(13)、公式(14)、公式(15)和公式(16),最大化相同患者下实例的映射向量与预测向量的余弦相似度,从而实现患者对比任务,学习心电的语义表征,
公式(16)为LossC=Ei∈N[Lossintra+Lossinter],
公式中sg()表示停止梯度;
通过最小化公式(17)实现模型学习信号的时空及语义有效表征,
公式(17)LossF=λ1LossG+λ2LossT+λ3LossC,
公式(17)中λ1、λ2和λ3分别表示LossG、LossT和LossC的权重。
实施例1,处理流程如图2所示,本实施例包括预处理阶段、增噪处理阶段及滤波处理阶段;本实施例将心电数据集表示为公式(18),
公式(18)为OX={ox1,…oxi,…oxN},
公式(18)中oxi为某一实例原始心电数据,N为实例总数。
在预处理阶段,为了使数据统一标准,降低设备间(数据集间)差异性的影响,本实施例首先根据公式(19)将心电原始数据进行频率重采样(上采样或下采样),使数据的频率均调整为基线频率,
公式(19)中,axi为频率重采样后的心电数据,us()为上采样处理,ds()为下采样处理,fa为数据频率,fb为基线频率。
经过重采样后,利用公式(20)计算数据幅值转换系数,将心电数据根据幅值转换系数进行幅值归一化(幅值介于0到1之间),根据公式(21)转换后生成幅值归一化的视图,
公式(20)和公式(21)中xi为幅值归一化后的心电数据,γ为幅值转换系数,L为导联数,T为数据采样点数。
在增噪处理阶段,本方法以麻省理工学院噪声压力测试数据库为噪声源,随机截取任意噪声源导联下(噪声源2导联)与心电原始信号等长的基线漂移、肌电噪声及工频噪声片段,根据公式(1)分别在心电原始信号中合成上述三种噪声,根据公式(22)转换后的生成增噪视图,
在滤波处理阶段,本方法分别采用巴特沃斯滤波器、有限脉冲响应滤波器和无限脉冲响应滤波器去除心电原始数据中的基线漂移、肌电噪声和工频噪声,根据公式(2)滤除以上噪声,根据公式(23)转换后生成滤波视图,
为了验证本实施例的心电数据转换方法,发明人在Zheng等人提出12导联心律失常心电数据集(Chapman)中实施了本发明的心电数据转换方法,并与Kiyasseh等人和Eldele等人提出的数据转换方法进行比较。实验中将这些数据转换方法分别应用于本发明的表征学习方法,以及Chen(a)等人、Grill等人、Chen(b)等人、Eldele等人和Kiyasseh等人提出的表征学习方法,以验证心电数据转换方法的有效性。图3为心电原始数据分别经过增噪处理和滤波处理后生成的增噪视图和滤波视图。根据表1呈现的转换结果进行对比,记录了本发明心电数据转换处理方法与Kiyasseh等人和Eldele等人提出的数据转换方法应用于上述各表征学习方法的实验结果,评价指标为AUC(越接近于1越好)。本发明在6项实验中实现了5项第一,这说明了本发明的心电数据转换方法更适用于心电场景下的表征学习。图4进一步可视化了本发明数据转换方法(右)与Kiyasseh等人(左),Eldele等人(中)方法的比较,可以看出,本发明的数据转换处理方法可有效提高表征学习的性能。
表1为本发明的数据转换处理方法与其他先进公开方法比较结果的列表。
实施例2,如图1所示,本实施例通过上述一系列自监督任务学习心电的语义和时空有效表征,具体来说,本方法构建的对抗学习模块包括编码器和判别器,通过对抗任务拉近不同视图下编码器提取的表征分布。其中,编码器分为有梯度编码器E()和无梯度编码器用于提取心电数据表征和如式(24)、(25),
公式(24)和公式(25)中δ∈{α,β},α和β分别表示心电数据经过增噪处理和滤波处理。
在编码器训练阶段,以有梯度编码器E()提取的表征为数据集,训练过程中固定判别器D()的参数,通过最小化公式(13)生产训练有梯度编码器E(),
公式(26)为
如图6所示,通过采用纯思法模(Transformer)作为回归网络,由4个多头注意力块和4个前馈块组成,时空回归任务分为表征重组和时空回归两个阶段,在表征重组阶段,根据公式(6)和公式(7)分别重组两条支路中有梯度编码器E()提取的表征ri α和
公式(11)为LossT=Ei∈N[Lossα+Lossβ]。
通过构建对比模块实现患者对比任务,从而学习心电语义表征。对比模块包括两条对比支路,每条支路均由映射网络P()和预测网络Q()组成,二者均由3层MLP构成。患者对比任务分为患者级实例集构建和对比学习两个阶段。在患者级实例集构建阶段,根据数据集各个实例所属的患者ID,通过公式(12)构建患者级实例集patient_set,
公式(12)为patient_set={p1,…pi,…,pN},
在将判别任务由实例层转向患者层,以相同患者下的映射向量与预测向量为正实例对。通过最小化公式(13)、公式(14)、公式(15)和公式(16),,最大化正实例对中映射向量(停止梯度)与预测向量的余弦相似度,从而学习心电数据语义表征,
公式(16)为LossC=Ei∈N[Lossintra+Lossinter],
在优化对抗任务,时空回归任务和患者对比任务中,最小化公式(17)实现模型学习数据的时空及语义有效表征,
公式(17)LossF=λ1LossG+λ2LossT+λ3LossC。
为了验证本发明的心电表征自监督学习模型,发明人在Chapman数据集、Wagner等人提出的大型心电图数据集(PTB-XL)、Ribeiro等人提出的大规模12导联心电图数据集(CODE)和2018年中国生理信号挑战赛数据集(CPSC2018)等四个公开心电数据集实施了本发明,并与Oord等人、Chen(a)等人、Grill等人、Chen(b)等人、Eldele等人和Kiyasseh等人提出的自监督学习模型相对比,从预训练验证、可迁移性验证、类别学习验证和半监督验证等多个角度检验本发明的表征学习能力。图7中a、b和8c分别为Eldele等人、Kiyasseh等人和本发明提出的自监督学习模型在Chapman数据集的预训练实验结果。从图7中的表征分布上可以看出,本发明显然更能区分这四个类别,进一步说明了本发明方法在预训练学习的表征是有效的。根据表2显示出结果进行对比,给出了本发明模型和先进模型的可迁移性验证,本实验分别在4个公开数据上做预训练,并分别迁移至其他3个公开数数据集,通过表2中的评价指标数据,在12个迁移场景中,本发明实现了9项第一,3项第二的结果,说明了本发明方法在预训练学习的表征更有利于模型迁移。图8中a与b以及图9中c与d为本发明(右)与监督学习(左)分别在Chapman、PTB-XL、CODE和CPSC2018数据集上预测类别的混淆矩阵(对角线元素越接近1越好),可以看出本发明的预测精度均优于监督学习,图10为本发明(*线)与监督学习(·线)分别在4个公开数据集上进行半监督验证的实验结果,评价结果为F1分数,可以看出本发明在20%标签数据下可以达到或超过50%标签数据下监督学习的性能。总之,本发明作为一种自监督表征学习方法,进过预训练后可以有效提高DNN模型的泛化能力,有利于心电智能诊断技术应用于临床,减轻医生的工作负担。
表2为本发明的自监督学习模型与其他先进公开模型数据迁移结果的列表。
由技术常识可知,本发明可以通过其它的不脱离其精神实质或必要特征的实施方案来实现。因此,上述公开的实施方案,就各方面而言,都只是举例说明,并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。
本发明通过提供一种降低噪音干扰,避免学习转换处理产生的无效表征,便于模型学习心电时空表征,实现模型学习心电的语义表征,提高DNN泛化性能的心电表征自监督学习方法,使得本发明有利于智能诊断的临床应用。
Claims (6)
1.一种心电表征自监督学习方法,其特征在于,包括以下步骤:
步骤1,基于增噪处理和滤波处理实现心电数据转换处理,心电数据转换处理分为预处理阶段、增噪处理阶段和滤波处理阶段;
步骤2,基于对抗学习构建编码器与判别器对抗任务,通过构建心电表征自监督学习模型的对抗学习模块,以实现编码器和判别器的对抗任务;
步骤3,基于回归网络构建心电时空回归任务,通过构建心电表征自监督学习模型的回归模块,以实现心电数据时空回归任务;
步骤4,基于对比学习构建患者对比任务,构建心电表征自监督学习模型的对比学习模块,以实现患者对比任务。
2.根据权利要求1所述的心电表征自监督学习方法,其特征在于:所述的步骤1中预处理包括对心电原始数据进行频率重采样和幅值归一化处理;步骤1中增噪处理阶段包括:以麻省理工学院噪声压力测试数据库为噪声源,随机截取任意噪声源导联下(噪声源2导联)与心电原始数据等长的基线漂移、肌电噪声及工频噪声片段,根据公式(1)分别在心电原始数据中合成上述三种噪声,
公式(1)中xi,l,t第i列第l导联第t时刻下心电数据的采样点幅值,Tabl,t、Tael,t和Tapl,t分别表示用于合成至xi,l,t的基线漂移、肌电噪声及工频噪声等噪声的采样点幅值;
步骤1中滤波处理阶段包括:分别采用巴特沃斯滤波器、有限脉冲响应滤波器和无限脉冲响应滤波器去除心电原始数据中的基线漂移、肌电噪声和工频噪声,根据公式(2)生成去噪后的心电数据,
公式(2)中Tdbl,t、Tdel,t和Tdpl,t分别表示从xi,l,t中去除的基线漂移、肌电噪声及工频噪声等噪声的采样点幅值。
5.根据权利要求1所述的心电表征自监督学习方法,其特征在于:所述的步骤3中回归模块包括两条支路,每条支路均由有梯度编码器E()和回归网络R()组成;时空回归任务分为表征重组和时空回归两个阶段;表征重组包括:根据公式(6)和公式(7)分别重组两条支路中有梯度编码器E()提取的表征,
训练中通过最小化公式(9)、公式(10)和公式(11)来生成最大化数据与语义令牌的互信息,
公式(11)为LossT=Ei∈N[Lossα+Lossβ]。
6.根据权利要求1所述的心电表征自监督学习方法,其特征在于:所述的步骤4中对比学习模块包括两条对比支路,每条支路均由映射网络P()和预测网络Q()组成;患者对比任务分为构建患者级实例集和对比学习两个阶段;构建患者级实例集阶段包括:根据数据集各个实例所属的患者ID信息,通过公式(12)构建患者级实例集patient_set,
公式(12)为patient_set={p1,…pi,…,pN},
公式(12)中N表示数据集实例数量。pi为患者级实例子集,表示第i个实例所属患者的其他实例,
对比学习阶段包括:以语义令牌和分别作为两条对比支路中映射网络P()的输入,得到映射向量和再以映射向量和作为预测网络Q()的输入,得到预测向量和通过最小化公式(13)、公式(14)、公式(15)和公式(16),最大化相同患者下实例的映射向量与预测向量的余弦相似度,
公式中sg()表示停止梯度;
通过最小化公式(17)实现模型学习信号的时空及语义有效表征,
公式(17)LossF=λ1LossG+λ2LossT+λ3LossC,
公式(17)中λ1、λ2和λ3分别表示LossG、LossT和LossC的权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211241397.4A CN115429286B (zh) | 2022-10-11 | 2022-10-11 | 一种心电表征自监督学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211241397.4A CN115429286B (zh) | 2022-10-11 | 2022-10-11 | 一种心电表征自监督学习方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115429286A true CN115429286A (zh) | 2022-12-06 |
CN115429286B CN115429286B (zh) | 2023-06-16 |
Family
ID=84251597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211241397.4A Active CN115429286B (zh) | 2022-10-11 | 2022-10-11 | 一种心电表征自监督学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115429286B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102779234A (zh) * | 2012-06-28 | 2012-11-14 | 中国科学院苏州纳米技术与纳米仿生研究所 | 一种心电图分类处理方法及装置 |
CN110420019A (zh) * | 2019-07-29 | 2019-11-08 | 西安电子科技大学 | 一种心冲击图信号的深度回归心率估计方法 |
CN111067507A (zh) * | 2019-12-26 | 2020-04-28 | 常熟理工学院 | 基于生成对抗网络和策略梯度的心电信号去噪方法 |
CN111449645A (zh) * | 2020-03-07 | 2020-07-28 | 河南大学 | 心电图心拍智能分类识别方法 |
CN113723519A (zh) * | 2021-08-31 | 2021-11-30 | 平安科技(深圳)有限公司 | 基于对比学习的心电数据处理方法、装置及存储介质 |
CN114119968A (zh) * | 2021-12-16 | 2022-03-01 | 安徽心之声医疗科技有限公司 | 基于深度神经网络的纸质心电图信号区域提取方法及系统 |
US20220084679A1 (en) * | 2020-09-15 | 2022-03-17 | Vuno Inc. | Deep neural network pre-training method for classifying electrocardiogram (ecg) data |
-
2022
- 2022-10-11 CN CN202211241397.4A patent/CN115429286B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102779234A (zh) * | 2012-06-28 | 2012-11-14 | 中国科学院苏州纳米技术与纳米仿生研究所 | 一种心电图分类处理方法及装置 |
CN110420019A (zh) * | 2019-07-29 | 2019-11-08 | 西安电子科技大学 | 一种心冲击图信号的深度回归心率估计方法 |
CN111067507A (zh) * | 2019-12-26 | 2020-04-28 | 常熟理工学院 | 基于生成对抗网络和策略梯度的心电信号去噪方法 |
CN111449645A (zh) * | 2020-03-07 | 2020-07-28 | 河南大学 | 心电图心拍智能分类识别方法 |
US20220084679A1 (en) * | 2020-09-15 | 2022-03-17 | Vuno Inc. | Deep neural network pre-training method for classifying electrocardiogram (ecg) data |
CN113723519A (zh) * | 2021-08-31 | 2021-11-30 | 平安科技(深圳)有限公司 | 基于对比学习的心电数据处理方法、装置及存储介质 |
CN114119968A (zh) * | 2021-12-16 | 2022-03-01 | 安徽心之声医疗科技有限公司 | 基于深度神经网络的纸质心电图信号区域提取方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115429286B (zh) | 2023-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107822622B (zh) | 基于深度卷积神经网络的心电图诊断方法和系统 | |
CN114564991B (zh) | 基于Transformer引导卷积神经网络的脑电信号分类方法 | |
CN111297349A (zh) | 一种基于机器学习的心律分类系统 | |
Jamil et al. | An efficient and robust phonocardiography (pcg)-based valvular heart diseases (vhd) detection framework using vision transformer (vit) | |
CN111291614A (zh) | 基于迁移学习多模型决策融合的儿童癫痫综合症分类方法 | |
Deperlioglu | Heart sound classification with signal instant energy and stacked autoencoder network | |
CN113288162A (zh) | 基于自适应注意力机制的短时心电信号房颤自动检测系统 | |
CN111202512A (zh) | 一种基于小波变换与dcnn的心电图分类方法和装置 | |
Alaskar | Deep learning-based model architecture for time-frequency images analysis | |
Malik et al. | Multi-classification neural network model for detection of abnormal heartbeat audio signals | |
US20230225663A1 (en) | Method for predicting multi-type electrocardiogram heart rhythms based on graph convolution | |
CN116361688A (zh) | 用于心电节律自动分类的多模态特征融合模型构建方法 | |
CN113392733A (zh) | 基于标签对齐的多源域自适应跨被试eeg认知状态评估方法 | |
CN113796889A (zh) | 一种基于深度学习的辅助电子听诊器信号判别方法 | |
Lan et al. | Arrhythmias classification using short-time Fourier transform and GAN based data augmentation | |
CN115736944A (zh) | 一种基于短时单导联心电信号的房颤检测模型mcnn-blstm | |
CN115530788A (zh) | 基于自注意力机制的心律失常分类方法 | |
CN115177262A (zh) | 一种基于深度学习的心音心电联合诊断装置和系统 | |
Li et al. | Arrhythmia classification using biased dropout and morphology-rhythm feature with incremental broad learning | |
CN116898451A (zh) | 用具有多尺度注意力机制的神经网络实现房颤预测的方法 | |
Yuan et al. | Automatic Seizure Detection Using Logarithmic Euclidean-Gaussian Mixture Models (LE-GMMs) and Improved Deep Forest Learning | |
CN110811591A (zh) | 一种基于心率变异性的心力衰竭分级方法 | |
CN115429286B (zh) | 一种心电表征自监督学习方法 | |
CN113842151B (zh) | 一种基于高效多源胶囊网络的跨被试eeg认知状态检测方法 | |
CN113940638B (zh) | 基于频域双特征融合的脉搏波信号识别分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |