CN115429286A - 一种心电表征自监督学习方法 - Google Patents

一种心电表征自监督学习方法 Download PDF

Info

Publication number
CN115429286A
CN115429286A CN202211241397.4A CN202211241397A CN115429286A CN 115429286 A CN115429286 A CN 115429286A CN 202211241397 A CN202211241397 A CN 202211241397A CN 115429286 A CN115429286 A CN 115429286A
Authority
CN
China
Prior art keywords
formula
noise
encoder
data
electrocardio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211241397.4A
Other languages
English (en)
Other versions
CN115429286B (zh
Inventor
王宁
王宗敏
宋洪军
谭健
高健
于婕
冯盼盼
葛昭阳
周艳杰
周兵
汪振华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cloud Ecg Network Technology Shanghai Co ltd
Henan Cloud Ecg Network Technology Co ltd
Zhengzhou University
Original Assignee
Cloud Ecg Network Technology Shanghai Co ltd
Henan Cloud Ecg Network Technology Co ltd
Zhengzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cloud Ecg Network Technology Shanghai Co ltd, Henan Cloud Ecg Network Technology Co ltd, Zhengzhou University filed Critical Cloud Ecg Network Technology Shanghai Co ltd
Priority to CN202211241397.4A priority Critical patent/CN115429286B/zh
Publication of CN115429286A publication Critical patent/CN115429286A/zh
Application granted granted Critical
Publication of CN115429286B publication Critical patent/CN115429286B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • A61B5/346Analysis of electrocardiograms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7203Signal processing specially adapted for physiological signals or for diagnostic purposes for noise prevention, reduction or removal
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/725Details of waveform analysis using specific filters therefor, e.g. Kalman or adaptive filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medical Informatics (AREA)
  • Pathology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Surgery (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Cardiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Psychiatry (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

本发明涉及心电数据处理、深度学习、对比学习和对抗学习技术领域,具体涉及一种心电表征自监督学习方法,包括以下步骤:步骤1,基于增噪处理和滤波处理实现心电数据转换处理,心电数据转换处理分为预处理阶段、增噪处理阶段和滤波处理阶段;步骤2,基于对抗学习构建编码器与判别器对抗任务,通过构建心电表征自监督学习模型的对抗学习模块,以实现编码器和判别器的对抗任务;步骤3,基于回归网络构建心电时空回归任务,通过构建心电表征自监督学习模型的回归模块,以实现心电数据时空回归任务;步骤4,基于对比学习构建患者对比任务,构建心电表征自监督学习模型的对比学习模块,以实现患者对比任务。

Description

一种心电表征自监督学习方法
技术领域
本发明涉及心电数据处理、深度学习、对比学习和对抗学习技术领域,具体涉及一种心电表征自监督学习方法。
背景技术
心血管疾病(Cardiovascular disease,CVD)是威胁全世界人类生命健康的重大疾病之一。根据《中国卫生健康统计年鉴2020》显示,2019年心血管疾病死亡率在我国城市居民中居于第二位,在农村居民中居于首位。心电图(Electrocardiogram,ECG)信号的波形变化可以反映出CVD的病理变化,它是常用于诊断CVD的临床工具,每年有超过3亿的ECG信号数据产生。为了能够有效分析疗CVD的病理变化,大量研究人员开展基于深度神经网络(Deep neura network,DNN)检测ECG信号中CVD的研究,即通过足够充分覆盖未来的ECG样本,学习到的多层权重,从而可以很好的用来预测分析CVD的病理变化,便于推动智能诊断模型在临床应用。然而,DNN的泛化性能十分依赖于有标记数据的数量和质量,但是现有标记数据数量也非常有限,这导致智能诊断模型难以投入临床应用。因此,如何利用大量的无标记ECG数据提高DNN的泛化性能,对于智能诊断的临床应用具有非常重大的意义。
提高DNN泛化性能的关键在于是否能够学习到数据的有效表征。对比学习是一种优秀的自监督表征学习方式,它能够凭借自监督任务从无标记数据中学习到有效表征。其核心是利用数据转换处理,构建正负实例对(来自同一实例的转换视图为正例对,不同实例的转换视图为负例对),通过最大化正例对表征的相似度和最小化负例对表征的相似度来完成表征学习。但是ECG数据为时序信号,且ECG数据具有多个通道,因此无论在数据转换处理还是自监督任务构建,都应当结合其时空特征。此外,对比学习在学习有效表征时,还会学习到因转换处理产生的无效表征,这将降低模型的泛化性能。在构建正负实例对时,由于同一一类别下的不同实例依然互为负例对,因此这些负例对将不利于模型学习有效表征,为此如何构建适用于ECG数据的自监督表征学习方法是一个亟待解决的问题。
因此,本发明提供一种降低噪音干扰,避免学习转换处理产生的无效表征,便于模型学习心电时空表征,实现模型学习心电的语义表征,提高DNN泛化性能的心电表征自监督学习方法,具有广泛的市场前景。
发明内容
针对现有技术的不足,本发明提供一种降低噪音干扰,避免学习转换处理产生的无效表征,便于模型学习心电时空表征,实现模型学习心电的语义表征,提高DNN泛化性能的心电表征自监督学习方法,用于克服现有技术中缺陷。
本发明采用的技术方案为:一种心电表征自监督学习方法,包括以下步骤:步骤1,基于增噪处理和滤波处理实现心电数据转换处理,心电数据转换处理分为预处理阶段、增噪处理阶段和滤波处理阶段;步骤2,基于对抗学习构建编码器与判别器对抗任务,通过构建心电表征自监督学习模型的对抗学习模块,以实现编码器和判别器的对抗任务;步骤3,基于回归网络构建心电时空回归任务,通过构建心电表征自监督学习模型的回归模块,以实现心电数据时空回归任务;步骤4,基于对比学习构建患者对比任务,构建心电表征自监督学习模型的对比学习模块,以实现患者对比任务。
所述的步骤1中预处理包括对心电原始数据进行频率重采样和幅值归一化处理;步骤1中增噪处理阶段包括:以麻省理工学院噪声压力测试数据库为噪声源,随机截取任意噪声源导联下(噪声源2导联)与心电原始数据等长的基线漂移、肌电噪声及工频噪声片段,根据公式(1)分别在心电原始数据中合成上述三种噪声,
公式(1)为
Figure BDA0003884915910000021
公式(1)中xi,l,t第i例第l导联第t时刻下心电数据的采样点幅值,Tabl,t、Tael,t和Tapl,t分别表示用于合成至xi,l,t的基线漂移、肌电噪声及工频噪声等噪声的采样点幅值;
步骤1中滤波处理阶段包括:分别采用巴特沃斯滤波器、有限脉冲响应滤波器和无限脉冲响应滤波器去除心电原始数据中的基线漂移、肌电噪声和工频噪声,根据公式(2)生成去噪后的心电数据,
公式(2)为
Figure BDA0003884915910000022
公式(2)中Tdbl,t、Tdel,t和Tdpl,t分别表示从xi,l,t中去除的基线漂移、肌电噪声及工频噪声等噪声的采样点幅值。
所述的步骤2中编码器分为有梯度编码器E()和无梯度编码器
Figure BDA0003884915910000023
二者结构相同,用于提取心电表征;步骤2中判别器D()用于判别信号所属伪标签类别,根据转换方式定义以及公式(3)生成伪标签plδ
公式(3)为
Figure BDA0003884915910000031
公式(3)中δ∈{α,β},α和β分别表示心电原始数据经过增噪处理和滤波处理。
所述的步骤2中对抗任务分为判别器训练和编码器训练两个阶段;判别器训练阶段包括:以无梯度编码器提取
Figure BDA0003884915910000032
的表征为数据集,训练过程中固定无梯度编码器
Figure BDA0003884915910000033
的参数,通过最小化公式(4)生成训练判别器D(),
公式(4)为
Figure BDA0003884915910000034
公式(4)中N为数据样本量,
Figure BDA0003884915910000035
Figure BDA0003884915910000036
表示无梯度编码器
Figure BDA0003884915910000037
提取的表征;
编码器训练阶段包括:以有梯度编码器E()提取的表征为数据集,训练过程中固定判别器D()的参数,通过最小化公式(5)生产训练有梯度编码器E(),
公式(5)为
Figure BDA0003884915910000038
公式(5)中
Figure BDA0003884915910000039
Figure BDA00038849159100000310
分别为噪声增强和噪声滤除处理后的转换数据,
Figure BDA00038849159100000311
Figure BDA00038849159100000312
表示有梯度编码器E()提取的表征。
所述的步骤3中回归模块包括两条支路,每条支路均由有梯度编码器E()和回归网络R()组成;时空回归任务分为表征重组和时空回归两个阶段;表征重组包括:根据公式(6)和公式(7)分别重组两条支路中有梯度编码器E()提取的表征,
公式(6)为
Figure BDA0003884915910000041
公式(7)为
Figure BDA0003884915910000042
公式(6)和公式(7)中combine()表示重组操作,ri α和riβ表示有梯度编码器E()提取的表征,K为表征长度,τ为头片段长度;
时空预测阶段包括:表征
Figure BDA0003884915910000044
被分为头片段
Figure BDA0003884915910000045
和尾片段
Figure BDA0003884915910000046
以头片段
Figure BDA0003884915910000047
为回归网络R()的输入得到语义令牌
Figure BDA0003884915910000048
用于预测尾片段
Figure BDA0003884915910000049
根据公式(8)生成的fk()表示数据和语义令牌的互信息,
公式(8)为
Figure BDA00038849159100000410
公式(8)中Wk()为
Figure BDA00038849159100000411
映射至
Figure BDA00038849159100000412
的线性函数,其中1≤k≤K-τ;
训练中通过最小化公式(9)、公式(10)和公式(11)来生成最大化数据与语义令牌的互信息,
公式(9)为
Figure BDA00038849159100000413
公式(10)为
Figure BDA00038849159100000414
公式(11)为LossT=Ei∈N[Lossα+Lossβ]。
所述的步骤4中对比学习模块包括两条对比支路,每条支路均由映射网络P()和预测网络Q()组成;患者对比任务分为构建患者级实例集和对比学习两个阶段;构建患者级实例集阶段包括:根据数据集各个实例所属的患者ID信息,通过公式(12)构建患者级实例集patient_set,
公式(12)为patient_set={p1,…pi,…,pN},
公式(12)中N表示数据集实例数量。pi为患者级实例子集,表示第i个实例所属患者的其他实例,
对比学习阶段包括:以语义令牌
Figure BDA0003884915910000051
Figure BDA0003884915910000052
分别作为两条对比支路中映射网络P()的输入,得到映射向量
Figure BDA0003884915910000053
Figure BDA0003884915910000054
再以映射向量
Figure BDA0003884915910000055
Figure BDA0003884915910000056
作为预测网络Q()的输入,得到预测向量
Figure BDA0003884915910000057
Figure BDA0003884915910000058
通过最小化公式(13)、公式(14)、公式(15)和公式(16),最大化相同患者下实例的映射向量与预测向量的余弦相似度,
公式(13)为
Figure BDA0003884915910000059
公式(14)为
Figure BDA00038849159100000510
公式(15)为
Figure BDA00038849159100000511
公式(16)为LossC=Ei∈N[Lossintra+Lossinter],
公式中sg()表示停止梯度;
通过最小化公式(17)实现模型学习信号的时空及语义有效表征,
公式(17)LossF=λ1LossG2LossT3LossC
公式(17)中λ1、λ2和λ3分别表示LossG、LossT和LossC的权重。
本发明有益效果是:本发明提供一种适用于无监督场景下的心电表征自监督学习方法,该方法利用心电数据转换在保证数据时空特征的同时降低噪声对表征学习的干扰,确保了数据转换的准确率;其次,本发明通过构建心电表征自监督学习模型的对抗学习模块,实现编码器和判别器的对抗任务,从而避免学习转换处理产生的无效表征,并通过构建心电表征自监督学习模型的回归模块,使其时空回归任务和患者对比任务有效学习心电数据的时空和语义表征,达到模型学习心电时空表征的目的;再次,本发明通过构建心电表征自监督学习模型的对比学习模块,使其模型学习心电的语义表征,从而得到的预训练模型,从而有效提高DNN的泛化性能,有利于智能诊断的临床应用。
附图说明
图1为本发明的模型框架图。
图2为本发明的心电数据转换处理方法流程图。
图3为本发明的心电原始数据图、增噪视图和滤波视图。
图4为本发明的数据转换处理方法与其他先进方法比较结果的柱状图。
图5为本发明的自监督学习模型中编码器的结构图。
图6为本发明的自监督学习模型中回归网络的结构图。
图7为本发明的自监督学习模型与其他先进模型预训练结果的表征分布散点对比图。
图8为第一项本发明与已公开的监督学习在类别验证下的混淆矩阵对比图。
图9为第二项本发明与已公开的监督学习在类别验证下的混淆矩阵对比图。
图10为本发明与监督学习在半监督验证下的曲线对比图。
具体实施方式
如图1、2、3、4、5、6、7、8、9、10所示,一种心电表征自监督学习方法,包括以下步骤:步骤1,基于增噪处理和滤波处理实现心电数据转换处理,心电数据转换处理分为预处理阶段、增噪处理阶段和滤波处理阶段;步骤2,基于对抗学习构建编码器与判别器对抗任务,避免学习转换处理产生的无效表征,通过构建心电表征自监督学习模型的对抗学习模块,以实现编码器和判别器的对抗任务;步骤3,基于回归网络构建心电时空回归任务,通过构建心电表征自监督学习模型的回归模块,以实现心电数据时空回归任务;步骤4,基于对比学习构建患者对比任务,构建心电表征自监督学习模型的对比学习模块,提出了不需要负实例对的患者对比任务以提高模型学习语义表征的能力,以实现患者对比任务。
所述的步骤1中预处理包括对心电原始数据进行频率重采样和幅值归一化处理,以增噪处理和滤波处理作为心电数据转换处理方法,从而确保数据的时空特征不受转换影响,并降低噪声对表征学习的干扰;步骤1中增噪处理阶段包括:以麻省理工学院噪声压力测试数据库为噪声源,随机截取任意噪声源导联下(噪声源2导联)与心电原始数据等长的基线漂移、肌电噪声及工频噪声片段,根据公式(1)分别在心电原始数据中合成上述三种噪声,公式(1)为
Figure BDA0003884915910000061
公式(1)中xi,l,t第i例第l导联第t时刻下心电数据的采样点幅值,Tabl,t、Tael,t和Tapl,t分别表示用于合成至xi,l,t的基线漂移、肌电噪声及工频噪声等噪声的采样点幅值;
步骤1中滤波处理阶段包括:分别采用巴特沃斯滤波器、有限脉冲响应滤波器和无限脉冲响应滤波器去除心电原始数据中的基线漂移、肌电噪声和工频噪声,根据公式(2)生成去噪后的心电数据,
公式(2)为
Figure BDA0003884915910000062
公式(2)中Tdbl,t、Tdel,t和Tdpl,t分别表示从xi,l,t中去除的基线漂移、肌电噪声及工频噪声等噪声的采样点幅值。
所述的步骤2中编码器分为有梯度编码器E()和无梯度编码器
Figure BDA0003884915910000071
二者结构相同,用于提取心电表征;步骤2中判别器D()用于判别信号所属伪标签类别,根据转换方式定义以及公式(3)生成伪标签plδ;以完成数据集的判别任务,即辨别出增噪处理和滤波处理的数据,
公式(3)为
Figure BDA0003884915910000072
公式(3)中δ∈{α,β},α和β分别表示心电原始数据经过增噪处理和滤波处理。
所述的步骤2中对抗任务分为判别器训练和编码器训练两个阶段;判别器训练阶段包括:以无梯度编码器
Figure BDA0003884915910000073
提取的表征为数据集,训练过程中固定无梯度编码器
Figure BDA0003884915910000074
的参数,通过最小化公式(4)生成训练判别器D(),
公式(4)为
Figure BDA0003884915910000075
公式(4)中N为数据样本量,
Figure BDA0003884915910000076
Figure BDA0003884915910000077
表示无梯度编码器
Figure BDA0003884915910000078
提取的表征;
编码器训练阶段包括:以有梯度编码器E()提取的表征为数据集,训练过程中固定判别器D()的参数,通过最小化公式(5)生产训练有梯度编码器E(),
公式(5)为
Figure BDA0003884915910000079
公式(5)中
Figure BDA00038849159100000710
Figure BDA00038849159100000711
分别为噪声增强和噪声滤除处理后的转换数据,
Figure BDA00038849159100000712
Figure BDA00038849159100000713
表示有梯度编码器E()提取的表征。
所述的步骤3中回归模块包括两条支路,每条支路均由有梯度编码器E()和回归网络R()组成;时空回归任务分为表征重组和时空回归两个阶段;表征重组包括:根据公式(6)和公式(7)分别重组两条支路中有梯度编码器E()提取的表征,按照提取的表征的长度,分别将两条支路有梯度编码器提取的表征段分割为头片段和尾片段,使其两条支路的头片段表征分别与另一支路的尾片段表征重组,
公式(6)为
Figure BDA0003884915910000081
公式(7)为
Figure BDA0003884915910000082
公式(6)和公式(7)中combine()表示重组操作,ri α和riβ表示有梯度编码器E()提取的表征,K为表征长度,τ为头片段长度;
时空预测阶段包括:表征
Figure BDA0003884915910000084
被分为头片段
Figure BDA0003884915910000085
和尾片段
Figure BDA0003884915910000086
以头片段
Figure BDA0003884915910000087
为回归网络R()的输入得到语义令牌
Figure BDA0003884915910000088
用于预测尾片段
Figure BDA0003884915910000089
根据公式(8)生成的fk()表示数据和语义令牌的互信息,
公式(8)为
Figure BDA00038849159100000810
公式(8)中Wk()为
Figure BDA00038849159100000811
映射至
Figure BDA00038849159100000812
的线性函数,其中1≤k≤K-τ;
训练中通过最小化公式(9)、公式(10)和公式(11)来生成最大化数据与语义令牌的互信息,以达到模型学习心电时空表征的目的,
公式(9)为
Figure BDA00038849159100000813
公式(10)为
Figure BDA0003884915910000091
公式(11)为LossT=Ei∈N[Lossα+Lossβ]。
所述的步骤4中对比学习模块包括两条对比支路,每条支路均由映射网络P()和预测网络Q()组成;患者对比任务分为构建患者级实例集和对比学习两个阶段;构建患者级实例集阶段包括:根据数据集各个实例所属的患者ID信息,通过公式(12)构建患者级实例集patient_set,
公式(12)为patient_set={p1,…pi,…,pN},
公式(12)中N表示数据集实例数量。pi为患者级实例子集,表示第i个实例所属患者的其他实例,
对比学习阶段包括:以语义令牌
Figure BDA0003884915910000092
Figure BDA0003884915910000093
分别作为两条对比支路中映射网络P()的输入,得到映射向量
Figure BDA0003884915910000094
Figure BDA0003884915910000095
再以映射向量
Figure BDA0003884915910000096
Figure BDA0003884915910000097
作为预测网络Q()的输入,得到预测向量
Figure BDA0003884915910000098
Figure BDA0003884915910000099
通过最小化公式(13)、公式(14)、公式(15)和公式(16),最大化相同患者下实例的映射向量与预测向量的余弦相似度,从而实现患者对比任务,学习心电的语义表征,
公式(13)为
Figure BDA00038849159100000910
公式(14)为
Figure BDA00038849159100000911
公式(15)为
Figure BDA00038849159100000912
公式(16)为LossC=Ei∈N[Lossintra+Lossinter],
公式中sg()表示停止梯度;
通过最小化公式(17)实现模型学习信号的时空及语义有效表征,
公式(17)LossF=λ1LossG2LossT3LossC
公式(17)中λ1、λ2和λ3分别表示LossG、LossT和LossC的权重。
实施例1,处理流程如图2所示,本实施例包括预处理阶段、增噪处理阶段及滤波处理阶段;本实施例将心电数据集表示为公式(18),
公式(18)为OX={ox1,…oxi,…oxN},
公式(18)中oxi为某一实例原始心电数据,N为实例总数。
在预处理阶段,为了使数据统一标准,降低设备间(数据集间)差异性的影响,本实施例首先根据公式(19)将心电原始数据进行频率重采样(上采样或下采样),使数据的频率均调整为基线频率,
公式(19)为
Figure BDA0003884915910000101
公式(19)中,axi为频率重采样后的心电数据,us()为上采样处理,ds()为下采样处理,fa为数据频率,fb为基线频率。
经过重采样后,利用公式(20)计算数据幅值转换系数,将心电数据根据幅值转换系数进行幅值归一化(幅值介于0到1之间),根据公式(21)转换后生成幅值归一化的视图,
公式(20)为
Figure BDA0003884915910000102
公式(21)为
Figure BDA0003884915910000103
公式(20)和公式(21)中xi为幅值归一化后的心电数据,γ为幅值转换系数,L为导联数,T为数据采样点数。
在增噪处理阶段,本方法以麻省理工学院噪声压力测试数据库为噪声源,随机截取任意噪声源导联下(噪声源2导联)与心电原始信号等长的基线漂移、肌电噪声及工频噪声片段,根据公式(1)分别在心电原始信号中合成上述三种噪声,根据公式(22)转换后的生成增噪视图,
公式(1)为
Figure BDA0003884915910000111
公式(22)为
Figure BDA0003884915910000112
公式(22)中
Figure BDA0003884915910000113
表示增噪处理后的增噪视图。
在滤波处理阶段,本方法分别采用巴特沃斯滤波器、有限脉冲响应滤波器和无限脉冲响应滤波器去除心电原始数据中的基线漂移、肌电噪声和工频噪声,根据公式(2)滤除以上噪声,根据公式(23)转换后生成滤波视图,
公式(2)为
Figure BDA0003884915910000114
公式(23)为
Figure BDA0003884915910000115
公式(23)中
Figure BDA0003884915910000116
表示滤波处理后的滤波视图。
为了验证本实施例的心电数据转换方法,发明人在Zheng等人提出12导联心律失常心电数据集(Chapman)中实施了本发明的心电数据转换方法,并与Kiyasseh等人和Eldele等人提出的数据转换方法进行比较。实验中将这些数据转换方法分别应用于本发明的表征学习方法,以及Chen(a)等人、Grill等人、Chen(b)等人、Eldele等人和Kiyasseh等人提出的表征学习方法,以验证心电数据转换方法的有效性。图3为心电原始数据分别经过增噪处理和滤波处理后生成的增噪视图和滤波视图。根据表1呈现的转换结果进行对比,记录了本发明心电数据转换处理方法与Kiyasseh等人和Eldele等人提出的数据转换方法应用于上述各表征学习方法的实验结果,评价指标为AUC(越接近于1越好)。本发明在6项实验中实现了5项第一,这说明了本发明的心电数据转换方法更适用于心电场景下的表征学习。图4进一步可视化了本发明数据转换方法(右)与Kiyasseh等人(左),Eldele等人(中)方法的比较,可以看出,本发明的数据转换处理方法可有效提高表征学习的性能。
Figure BDA0003884915910000121
表1为本发明的数据转换处理方法与其他先进公开方法比较结果的列表。
实施例2,如图1所示,本实施例通过上述一系列自监督任务学习心电的语义和时空有效表征,具体来说,本方法构建的对抗学习模块包括编码器和判别器,通过对抗任务拉近不同视图下编码器提取的表征分布。其中,编码器分为有梯度编码器E()和无梯度编码器
Figure BDA0003884915910000122
用于提取心电数据表征
Figure BDA0003884915910000123
Figure BDA0003884915910000124
如式(24)、(25),
公式(24)为
Figure BDA0003884915910000125
公式(25)为
Figure BDA0003884915910000126
公式(24)和公式(25)中δ∈{α,β},α和β分别表示心电数据经过增噪处理和滤波处理。
有梯度编码器E()和无梯度编码器
Figure BDA0003884915910000127
的结构相同,如图5、6所示,由4层卷积层组成,判别器D()由3层MLP层成,用于判别数据所属伪标签类别。伪标签plδ根据转换方式定义,为
Figure BDA0003884915910000128
赋予伪标签类别如式(3),
公式(3)为
Figure BDA0003884915910000129
对抗任务中分为判别器训练和编码器训练两个阶段。在判别器训练阶段,以无梯度编码器
Figure BDA00038849159100001210
提取的表征为数据集,训练过程中固定无梯度编码器
Figure BDA00038849159100001211
的参数,通过最小化公式(4)生成训练判别器D(),
公式(4)为
Figure BDA0003884915910000131
在编码器训练阶段,以有梯度编码器E()提取的表征为数据集,训练过程中固定判别器D()的参数,通过最小化公式(13)生产训练有梯度编码器E(),
公式(5)为
Figure BDA0003884915910000132
进一步地,有梯度编码器E()与判别器D()将根据式(26)进行对抗任务,以此拉近
Figure BDA0003884915910000133
Figure BDA0003884915910000134
的表征分布,
公式(26)为
Figure BDA0003884915910000135
如图6所示,通过采用纯思法模(Transformer)作为回归网络,由4个多头注意力块和4个前馈块组成,时空回归任务分为表征重组和时空回归两个阶段,在表征重组阶段,根据公式(6)和公式(7)分别重组两条支路中有梯度编码器E()提取的表征ri α
Figure BDA0003884915910000136
公式(6)为
Figure BDA0003884915910000137
公式(7)为
Figure BDA0003884915910000138
在时空回归阶段,本方法将表征
Figure BDA0003884915910000139
分为头片段
Figure BDA00038849159100001310
和尾片段
Figure BDA00038849159100001311
以头片段
Figure BDA00038849159100001312
为回归网络R()的输入得到语义令牌
Figure BDA0003884915910000141
根据公式(27)生成预测尾片段
Figure BDA0003884915910000142
根据公式(8)生成的fk()表示数据
Figure BDA0003884915910000143
和语义令牌
Figure BDA0003884915910000144
的互信息,
公式(27)为
Figure BDA0003884915910000145
公式(8)为
Figure BDA0003884915910000146
训练中通过最小化公式(9)、公式(10)和公式(11)来生成最大化数据
Figure BDA0003884915910000147
与语义令牌
Figure BDA0003884915910000148
的互信息,以此学习数据的时空表征,
公式(9)为
Figure BDA0003884915910000149
公式(10)为
Figure BDA00038849159100001410
公式(11)为LossT=Ei∈N[Lossα+Lossβ]。
通过构建对比模块实现患者对比任务,从而学习心电语义表征。对比模块包括两条对比支路,每条支路均由映射网络P()和预测网络Q()组成,二者均由3层MLP构成。患者对比任务分为患者级实例集构建和对比学习两个阶段。在患者级实例集构建阶段,根据数据集各个实例所属的患者ID,通过公式(12)构建患者级实例集patient_set,
公式(12)为patient_set={p1,…pi,…,pN},
在对比学习阶段,以语义令牌
Figure BDA00038849159100001411
分别作为对比支路中映射网络P()的输入,得到映射向量
Figure BDA00038849159100001412
如公式(23),再以映射向量
Figure BDA00038849159100001413
作为预测网络Q()的输入,得到预测向量
Figure BDA00038849159100001414
如公式(24),公式(28)为
Figure BDA00038849159100001415
公式(29)为
Figure BDA0003884915910000151
在将判别任务由实例层转向患者层,以相同患者下的映射向量与预测向量为正实例对。通过最小化公式(13)、公式(14)、公式(15)和公式(16),,最大化正实例对中映射向量(停止梯度)与预测向量的余弦相似度,从而学习心电数据语义表征,
公式(13)为
Figure BDA0003884915910000152
公式(14)为
Figure BDA0003884915910000153
公式(15)为
Figure BDA0003884915910000154
公式(16)为LossC=Ei∈N[Lossintra+Lossinter],
在优化对抗任务,时空回归任务和患者对比任务中,最小化公式(17)实现模型学习数据的时空及语义有效表征,
公式(17)LossF=λ1LossG2LossT3LossC
为了验证本发明的心电表征自监督学习模型,发明人在Chapman数据集、Wagner等人提出的大型心电图数据集(PTB-XL)、Ribeiro等人提出的大规模12导联心电图数据集(CODE)和2018年中国生理信号挑战赛数据集(CPSC2018)等四个公开心电数据集实施了本发明,并与Oord等人、Chen(a)等人、Grill等人、Chen(b)等人、Eldele等人和Kiyasseh等人提出的自监督学习模型相对比,从预训练验证、可迁移性验证、类别学习验证和半监督验证等多个角度检验本发明的表征学习能力。图7中a、b和8c分别为Eldele等人、Kiyasseh等人和本发明提出的自监督学习模型在Chapman数据集的预训练实验结果。从图7中的表征分布上可以看出,本发明显然更能区分这四个类别,进一步说明了本发明方法在预训练学习的表征是有效的。根据表2显示出结果进行对比,给出了本发明模型和先进模型的可迁移性验证,本实验分别在4个公开数据上做预训练,并分别迁移至其他3个公开数数据集,通过表2中的评价指标数据,在12个迁移场景中,本发明实现了9项第一,3项第二的结果,说明了本发明方法在预训练学习的表征更有利于模型迁移。图8中a与b以及图9中c与d为本发明(右)与监督学习(左)分别在Chapman、PTB-XL、CODE和CPSC2018数据集上预测类别的混淆矩阵(对角线元素越接近1越好),可以看出本发明的预测精度均优于监督学习,图10为本发明(*线)与监督学习(·线)分别在4个公开数据集上进行半监督验证的实验结果,评价结果为F1分数,可以看出本发明在20%标签数据下可以达到或超过50%标签数据下监督学习的性能。总之,本发明作为一种自监督表征学习方法,进过预训练后可以有效提高DNN模型的泛化能力,有利于心电智能诊断技术应用于临床,减轻医生的工作负担。
Figure BDA0003884915910000161
表2为本发明的自监督学习模型与其他先进公开模型数据迁移结果的列表。
由技术常识可知,本发明可以通过其它的不脱离其精神实质或必要特征的实施方案来实现。因此,上述公开的实施方案,就各方面而言,都只是举例说明,并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。
本发明通过提供一种降低噪音干扰,避免学习转换处理产生的无效表征,便于模型学习心电时空表征,实现模型学习心电的语义表征,提高DNN泛化性能的心电表征自监督学习方法,使得本发明有利于智能诊断的临床应用。

Claims (6)

1.一种心电表征自监督学习方法,其特征在于,包括以下步骤:
步骤1,基于增噪处理和滤波处理实现心电数据转换处理,心电数据转换处理分为预处理阶段、增噪处理阶段和滤波处理阶段;
步骤2,基于对抗学习构建编码器与判别器对抗任务,通过构建心电表征自监督学习模型的对抗学习模块,以实现编码器和判别器的对抗任务;
步骤3,基于回归网络构建心电时空回归任务,通过构建心电表征自监督学习模型的回归模块,以实现心电数据时空回归任务;
步骤4,基于对比学习构建患者对比任务,构建心电表征自监督学习模型的对比学习模块,以实现患者对比任务。
2.根据权利要求1所述的心电表征自监督学习方法,其特征在于:所述的步骤1中预处理包括对心电原始数据进行频率重采样和幅值归一化处理;步骤1中增噪处理阶段包括:以麻省理工学院噪声压力测试数据库为噪声源,随机截取任意噪声源导联下(噪声源2导联)与心电原始数据等长的基线漂移、肌电噪声及工频噪声片段,根据公式(1)分别在心电原始数据中合成上述三种噪声,
公式(1)为
Figure FDA0003884915900000011
公式(1)中xi,l,t第i列第l导联第t时刻下心电数据的采样点幅值,Tabl,t、Tael,t和Tapl,t分别表示用于合成至xi,l,t的基线漂移、肌电噪声及工频噪声等噪声的采样点幅值;
步骤1中滤波处理阶段包括:分别采用巴特沃斯滤波器、有限脉冲响应滤波器和无限脉冲响应滤波器去除心电原始数据中的基线漂移、肌电噪声和工频噪声,根据公式(2)生成去噪后的心电数据,
公式(2)为
Figure FDA0003884915900000012
公式(2)中Tdbl,t、Tdel,t和Tdpl,t分别表示从xi,l,t中去除的基线漂移、肌电噪声及工频噪声等噪声的采样点幅值。
3.根据权利要求1所述的心电表征自监督学习方法,其特征在于:所述的步骤2中编码器分为有梯度编码器E()和无梯度编码器
Figure FDA0003884915900000013
二者结构相同,用于提取心电表征;步骤2中判别器D()用于判别信号所属伪标签类别,根据转换方式定义以及公式(3)生成伪标签plδ
公式(3)为
Figure FDA0003884915900000014
公式(3)中δ∈{α,β},α和β分别表示心电原始数据经过增噪处理和滤波处理。
4.根据权利要求1所述的心电表征自监督学习方法,其特征在于:所述的步骤2中对抗任务分为判别器训练和编码器训练两个阶段;判别器训练阶段包括:以无梯度编码器
Figure FDA0003884915900000021
提取的表征为数据集,训练过程中固定无梯度编码器
Figure FDA0003884915900000022
的参数,通过最小化公式(4)生成训练判别器D(),
公式(4)为
Figure FDA0003884915900000023
公式(4)中N为数据样本量,
Figure FDA0003884915900000024
Figure FDA0003884915900000025
表示无梯度编码器
Figure FDA0003884915900000026
提取的表征;
编码器训练阶段包括:以有梯度编码器E()提取的表征为数据集,训练过程中固定判别器D()的参数,通过最小化公式(5)生产训练有梯度编码器E(),
公式(5)为
Figure FDA0003884915900000027
公式(5)中
Figure FDA0003884915900000028
Figure FDA0003884915900000029
分别为噪声增强和噪声滤除处理后的转换数据,
Figure FDA00038849159000000210
Figure FDA00038849159000000211
表示有梯度编码器E()提取的表征。
5.根据权利要求1所述的心电表征自监督学习方法,其特征在于:所述的步骤3中回归模块包括两条支路,每条支路均由有梯度编码器E()和回归网络R()组成;时空回归任务分为表征重组和时空回归两个阶段;表征重组包括:根据公式(6)和公式(7)分别重组两条支路中有梯度编码器E()提取的表征,
公式(6)为
Figure FDA00038849159000000212
公式(7)为
Figure FDA0003884915900000031
公式(6)和公式(7)中combine()表示重组操作,
Figure FDA0003884915900000032
Figure FDA0003884915900000033
表示有梯度编码器E()提取的表征,K为表征长度,τ为头片段长度;
时空预测阶段包括:表征
Figure FDA0003884915900000034
被分为头片段
Figure FDA0003884915900000035
和尾片段
Figure FDA0003884915900000036
以头片段
Figure FDA0003884915900000037
为回归网络R()的输入得到语义令牌
Figure FDA0003884915900000038
用于预测尾片段
Figure FDA0003884915900000039
根据公式(8)生成的fk()表示数据和语义令牌的互信息,
公式(8)为
Figure FDA00038849159000000310
公式(8)中Wk()为
Figure FDA00038849159000000311
映射至
Figure FDA00038849159000000312
的线性函数,其中1≤k≤K-τ;
训练中通过最小化公式(9)、公式(10)和公式(11)来生成最大化数据与语义令牌的互信息,
公式(9)为
Figure FDA00038849159000000313
公式(10)为
Figure FDA00038849159000000314
公式(11)为LossT=Ei∈N[Lossα+Lossβ]。
6.根据权利要求1所述的心电表征自监督学习方法,其特征在于:所述的步骤4中对比学习模块包括两条对比支路,每条支路均由映射网络P()和预测网络Q()组成;患者对比任务分为构建患者级实例集和对比学习两个阶段;构建患者级实例集阶段包括:根据数据集各个实例所属的患者ID信息,通过公式(12)构建患者级实例集patient_set,
公式(12)为patient_set={p1,…pi,…,pN},
公式(12)中N表示数据集实例数量。pi为患者级实例子集,表示第i个实例所属患者的其他实例,
对比学习阶段包括:以语义令牌
Figure FDA0003884915900000041
Figure FDA0003884915900000042
分别作为两条对比支路中映射网络P()的输入,得到映射向量
Figure FDA0003884915900000043
Figure FDA0003884915900000044
再以映射向量
Figure FDA0003884915900000045
Figure FDA0003884915900000046
作为预测网络Q()的输入,得到预测向量
Figure FDA0003884915900000047
Figure FDA0003884915900000048
通过最小化公式(13)、公式(14)、公式(15)和公式(16),最大化相同患者下实例的映射向量与预测向量的余弦相似度,
公式(13)为
Figure FDA0003884915900000049
公式(14)为
Figure FDA00038849159000000410
公式(15)为
Figure FDA00038849159000000411
公式(16)为
Figure FDA00038849159000000412
公式中sg()表示停止梯度;
通过最小化公式(17)实现模型学习信号的时空及语义有效表征,
公式(17)LossF=λ1LossG2LossT3LossC
公式(17)中λ1、λ2和λ3分别表示LossG、LossT和LossC的权重。
CN202211241397.4A 2022-10-11 2022-10-11 一种心电表征自监督学习方法 Active CN115429286B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211241397.4A CN115429286B (zh) 2022-10-11 2022-10-11 一种心电表征自监督学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211241397.4A CN115429286B (zh) 2022-10-11 2022-10-11 一种心电表征自监督学习方法

Publications (2)

Publication Number Publication Date
CN115429286A true CN115429286A (zh) 2022-12-06
CN115429286B CN115429286B (zh) 2023-06-16

Family

ID=84251597

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211241397.4A Active CN115429286B (zh) 2022-10-11 2022-10-11 一种心电表征自监督学习方法

Country Status (1)

Country Link
CN (1) CN115429286B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102779234A (zh) * 2012-06-28 2012-11-14 中国科学院苏州纳米技术与纳米仿生研究所 一种心电图分类处理方法及装置
CN110420019A (zh) * 2019-07-29 2019-11-08 西安电子科技大学 一种心冲击图信号的深度回归心率估计方法
CN111067507A (zh) * 2019-12-26 2020-04-28 常熟理工学院 基于生成对抗网络和策略梯度的心电信号去噪方法
CN111449645A (zh) * 2020-03-07 2020-07-28 河南大学 心电图心拍智能分类识别方法
CN113723519A (zh) * 2021-08-31 2021-11-30 平安科技(深圳)有限公司 基于对比学习的心电数据处理方法、装置及存储介质
CN114119968A (zh) * 2021-12-16 2022-03-01 安徽心之声医疗科技有限公司 基于深度神经网络的纸质心电图信号区域提取方法及系统
US20220084679A1 (en) * 2020-09-15 2022-03-17 Vuno Inc. Deep neural network pre-training method for classifying electrocardiogram (ecg) data

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102779234A (zh) * 2012-06-28 2012-11-14 中国科学院苏州纳米技术与纳米仿生研究所 一种心电图分类处理方法及装置
CN110420019A (zh) * 2019-07-29 2019-11-08 西安电子科技大学 一种心冲击图信号的深度回归心率估计方法
CN111067507A (zh) * 2019-12-26 2020-04-28 常熟理工学院 基于生成对抗网络和策略梯度的心电信号去噪方法
CN111449645A (zh) * 2020-03-07 2020-07-28 河南大学 心电图心拍智能分类识别方法
US20220084679A1 (en) * 2020-09-15 2022-03-17 Vuno Inc. Deep neural network pre-training method for classifying electrocardiogram (ecg) data
CN113723519A (zh) * 2021-08-31 2021-11-30 平安科技(深圳)有限公司 基于对比学习的心电数据处理方法、装置及存储介质
CN114119968A (zh) * 2021-12-16 2022-03-01 安徽心之声医疗科技有限公司 基于深度神经网络的纸质心电图信号区域提取方法及系统

Also Published As

Publication number Publication date
CN115429286B (zh) 2023-06-16

Similar Documents

Publication Publication Date Title
CN107822622B (zh) 基于深度卷积神经网络的心电图诊断方法和系统
CN114564991B (zh) 基于Transformer引导卷积神经网络的脑电信号分类方法
CN111297349A (zh) 一种基于机器学习的心律分类系统
Jamil et al. An efficient and robust phonocardiography (pcg)-based valvular heart diseases (vhd) detection framework using vision transformer (vit)
CN111291614A (zh) 基于迁移学习多模型决策融合的儿童癫痫综合症分类方法
Deperlioglu Heart sound classification with signal instant energy and stacked autoencoder network
CN113288162A (zh) 基于自适应注意力机制的短时心电信号房颤自动检测系统
CN111202512A (zh) 一种基于小波变换与dcnn的心电图分类方法和装置
Alaskar Deep learning-based model architecture for time-frequency images analysis
Malik et al. Multi-classification neural network model for detection of abnormal heartbeat audio signals
US20230225663A1 (en) Method for predicting multi-type electrocardiogram heart rhythms based on graph convolution
CN116361688A (zh) 用于心电节律自动分类的多模态特征融合模型构建方法
CN113392733A (zh) 基于标签对齐的多源域自适应跨被试eeg认知状态评估方法
CN113796889A (zh) 一种基于深度学习的辅助电子听诊器信号判别方法
Lan et al. Arrhythmias classification using short-time Fourier transform and GAN based data augmentation
CN115736944A (zh) 一种基于短时单导联心电信号的房颤检测模型mcnn-blstm
CN115530788A (zh) 基于自注意力机制的心律失常分类方法
CN115177262A (zh) 一种基于深度学习的心音心电联合诊断装置和系统
Li et al. Arrhythmia classification using biased dropout and morphology-rhythm feature with incremental broad learning
CN116898451A (zh) 用具有多尺度注意力机制的神经网络实现房颤预测的方法
Yuan et al. Automatic Seizure Detection Using Logarithmic Euclidean-Gaussian Mixture Models (LE-GMMs) and Improved Deep Forest Learning
CN110811591A (zh) 一种基于心率变异性的心力衰竭分级方法
CN115429286B (zh) 一种心电表征自监督学习方法
CN113842151B (zh) 一种基于高效多源胶囊网络的跨被试eeg认知状态检测方法
CN113940638B (zh) 基于频域双特征融合的脉搏波信号识别分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant