CN115429286A

CN115429286A - 一种心电表征自监督学习方法

Info

Publication number: CN115429286A
Application number: CN202211241397.4A
Authority: CN
Inventors: 王宁; 王宗敏; 宋洪军; 谭健; 高健; 于婕; 冯盼盼; 葛昭阳; 周艳杰; 周兵; 汪振华
Original assignee: Cloud Ecg Network Technology Shanghai Co ltd; Henan Cloud Ecg Network Technology Co ltd; Zhengzhou University
Current assignee: Cloud Ecg Network Technology Shanghai Co ltd; Henan Cloud Ecg Network Technology Co ltd; Zhengzhou University
Priority date: 2022-10-11
Filing date: 2022-10-11
Publication date: 2022-12-06
Anticipated expiration: 2042-10-11
Also published as: CN115429286B

Abstract

本发明涉及心电数据处理、深度学习、对比学习和对抗学习技术领域，具体涉及一种心电表征自监督学习方法，包括以下步骤：步骤1，基于增噪处理和滤波处理实现心电数据转换处理，心电数据转换处理分为预处理阶段、增噪处理阶段和滤波处理阶段；步骤2，基于对抗学习构建编码器与判别器对抗任务，通过构建心电表征自监督学习模型的对抗学习模块，以实现编码器和判别器的对抗任务；步骤3，基于回归网络构建心电时空回归任务，通过构建心电表征自监督学习模型的回归模块，以实现心电数据时空回归任务；步骤4，基于对比学习构建患者对比任务，构建心电表征自监督学习模型的对比学习模块，以实现患者对比任务。

Description

一种心电表征自监督学习方法

技术领域

本发明涉及心电数据处理、深度学习、对比学习和对抗学习技术领域，具体涉及一种心电表征自监督学习方法。

背景技术

心血管疾病(Cardiovascular disease，CVD)是威胁全世界人类生命健康的重大疾病之一。根据《中国卫生健康统计年鉴2020》显示，2019年心血管疾病死亡率在我国城市居民中居于第二位，在农村居民中居于首位。心电图(Electrocardiogram，ECG)信号的波形变化可以反映出CVD的病理变化，它是常用于诊断CVD的临床工具，每年有超过3亿的ECG信号数据产生。为了能够有效分析疗CVD的病理变化，大量研究人员开展基于深度神经网络(Deep neura network，DNN)检测ECG信号中CVD的研究，即通过足够充分覆盖未来的ECG样本，学习到的多层权重，从而可以很好的用来预测分析CVD的病理变化，便于推动智能诊断模型在临床应用。然而，DNN的泛化性能十分依赖于有标记数据的数量和质量，但是现有标记数据数量也非常有限，这导致智能诊断模型难以投入临床应用。因此，如何利用大量的无标记ECG数据提高DNN的泛化性能，对于智能诊断的临床应用具有非常重大的意义。

提高DNN泛化性能的关键在于是否能够学习到数据的有效表征。对比学习是一种优秀的自监督表征学习方式，它能够凭借自监督任务从无标记数据中学习到有效表征。其核心是利用数据转换处理，构建正负实例对(来自同一实例的转换视图为正例对，不同实例的转换视图为负例对)，通过最大化正例对表征的相似度和最小化负例对表征的相似度来完成表征学习。但是ECG数据为时序信号，且ECG数据具有多个通道，因此无论在数据转换处理还是自监督任务构建，都应当结合其时空特征。此外，对比学习在学习有效表征时，还会学习到因转换处理产生的无效表征，这将降低模型的泛化性能。在构建正负实例对时，由于同一一类别下的不同实例依然互为负例对，因此这些负例对将不利于模型学习有效表征，为此如何构建适用于ECG数据的自监督表征学习方法是一个亟待解决的问题。

因此，本发明提供一种降低噪音干扰，避免学习转换处理产生的无效表征，便于模型学习心电时空表征，实现模型学习心电的语义表征，提高DNN泛化性能的心电表征自监督学习方法，具有广泛的市场前景。

发明内容

针对现有技术的不足，本发明提供一种降低噪音干扰，避免学习转换处理产生的无效表征，便于模型学习心电时空表征，实现模型学习心电的语义表征，提高DNN泛化性能的心电表征自监督学习方法，用于克服现有技术中缺陷。

本发明采用的技术方案为：一种心电表征自监督学习方法，包括以下步骤：步骤1，基于增噪处理和滤波处理实现心电数据转换处理，心电数据转换处理分为预处理阶段、增噪处理阶段和滤波处理阶段；步骤2，基于对抗学习构建编码器与判别器对抗任务，通过构建心电表征自监督学习模型的对抗学习模块，以实现编码器和判别器的对抗任务；步骤3，基于回归网络构建心电时空回归任务，通过构建心电表征自监督学习模型的回归模块，以实现心电数据时空回归任务；步骤4，基于对比学习构建患者对比任务，构建心电表征自监督学习模型的对比学习模块，以实现患者对比任务。

所述的步骤1中预处理包括对心电原始数据进行频率重采样和幅值归一化处理；步骤1中增噪处理阶段包括：以麻省理工学院噪声压力测试数据库为噪声源，随机截取任意噪声源导联下(噪声源2导联)与心电原始数据等长的基线漂移、肌电噪声及工频噪声片段，根据公式(1)分别在心电原始数据中合成上述三种噪声，

公式(1)为

公式(1)中x_i，l，t第i例第l导联第t时刻下心电数据的采样点幅值，Tab_l，t、Tae_l，t和Tap_l，t分别表示用于合成至x_i，l，t的基线漂移、肌电噪声及工频噪声等噪声的采样点幅值；

步骤1中滤波处理阶段包括：分别采用巴特沃斯滤波器、有限脉冲响应滤波器和无限脉冲响应滤波器去除心电原始数据中的基线漂移、肌电噪声和工频噪声，根据公式(2)生成去噪后的心电数据，

公式(2)为

公式(2)中Tdb_l，t、Tde_l，t和Tdp_l，t分别表示从x_i，l，t中去除的基线漂移、肌电噪声及工频噪声等噪声的采样点幅值。

所述的步骤2中编码器分为有梯度编码器E()和无梯度编码器

二者结构相同，用于提取心电表征；步骤2中判别器D()用于判别信号所属伪标签类别，根据转换方式定义以及公式(3)生成伪标签pl^δ；

公式(3)为

公式(3)中δ∈{α，β}，α和β分别表示心电原始数据经过增噪处理和滤波处理。

所述的步骤2中对抗任务分为判别器训练和编码器训练两个阶段；判别器训练阶段包括：以无梯度编码器提取

的表征为数据集，训练过程中固定无梯度编码器

的参数，通过最小化公式(4)生成训练判别器D()，

公式(4)为

公式(4)中N为数据样本量，

和

表示无梯度编码器

提取的表征；

编码器训练阶段包括：以有梯度编码器E()提取的表征为数据集，训练过程中固定判别器D()的参数，通过最小化公式(5)生产训练有梯度编码器E()，

公式(5)为

公式(5)中

和

分别为噪声增强和噪声滤除处理后的转换数据，

和

表示有梯度编码器E()提取的表征。

所述的步骤3中回归模块包括两条支路，每条支路均由有梯度编码器E()和回归网络R()组成；时空回归任务分为表征重组和时空回归两个阶段；表征重组包括：根据公式(6)和公式(7)分别重组两条支路中有梯度编码器E()提取的表征，

公式(6)为

公式(7)为

公式(6)和公式(7)中combine()表示重组操作，r_i ^α和ri^β表示有梯度编码器E()提取的表征，K为表征长度，τ为头片段长度；

时空预测阶段包括：表征

被分为头片段

和尾片段

以头片段

为回归网络R()的输入得到语义令牌

用于预测尾片段

根据公式(8)生成的f_k()表示数据和语义令牌的互信息，

公式(8)为

公式(8)中W_k()为

映射至

的线性函数，其中1≤k≤K-τ；

训练中通过最小化公式(9)、公式(10)和公式(11)来生成最大化数据与语义令牌的互信息，

公式(9)为

公式(10)为

公式(11)为Loss_T＝E_i∈N[Loss_α+Loss_β]。

所述的步骤4中对比学习模块包括两条对比支路，每条支路均由映射网络P()和预测网络Q()组成；患者对比任务分为构建患者级实例集和对比学习两个阶段；构建患者级实例集阶段包括：根据数据集各个实例所属的患者ID信息，通过公式(12)构建患者级实例集patient_set，

公式(12)为patient_set＝{p₁，…p_i，…，p_N}，

公式(12)中N表示数据集实例数量。p_i为患者级实例子集，表示第i个实例所属患者的其他实例，

对比学习阶段包括：以语义令牌

和

分别作为两条对比支路中映射网络P()的输入，得到映射向量

和

再以映射向量

和

作为预测网络Q()的输入，得到预测向量

和

通过最小化公式(13)、公式(14)、公式(15)和公式(16)，最大化相同患者下实例的映射向量与预测向量的余弦相似度，

公式(13)为

公式(14)为

公式(15)为

公式(16)为Loss_C＝E_i∈N[Loss_intra+Loss_inter]，

公式中sg()表示停止梯度；

通过最小化公式(17)实现模型学习信号的时空及语义有效表征，

公式(17)Loss_F＝λ₁Loss_G+λ₂Loss_T+λ₃Loss_C，

公式(17)中λ₁、λ₂和λ₃分别表示Loss_G、Loss_T和Loss_C的权重。

本发明有益效果是：本发明提供一种适用于无监督场景下的心电表征自监督学习方法，该方法利用心电数据转换在保证数据时空特征的同时降低噪声对表征学习的干扰，确保了数据转换的准确率；其次，本发明通过构建心电表征自监督学习模型的对抗学习模块，实现编码器和判别器的对抗任务，从而避免学习转换处理产生的无效表征，并通过构建心电表征自监督学习模型的回归模块，使其时空回归任务和患者对比任务有效学习心电数据的时空和语义表征，达到模型学习心电时空表征的目的；再次，本发明通过构建心电表征自监督学习模型的对比学习模块，使其模型学习心电的语义表征，从而得到的预训练模型，从而有效提高DNN的泛化性能，有利于智能诊断的临床应用。

附图说明

图1为本发明的模型框架图。

图2为本发明的心电数据转换处理方法流程图。

图3为本发明的心电原始数据图、增噪视图和滤波视图。

图4为本发明的数据转换处理方法与其他先进方法比较结果的柱状图。

图5为本发明的自监督学习模型中编码器的结构图。

图6为本发明的自监督学习模型中回归网络的结构图。

图7为本发明的自监督学习模型与其他先进模型预训练结果的表征分布散点对比图。

图8为第一项本发明与已公开的监督学习在类别验证下的混淆矩阵对比图。

图9为第二项本发明与已公开的监督学习在类别验证下的混淆矩阵对比图。

图10为本发明与监督学习在半监督验证下的曲线对比图。

具体实施方式

如图1、2、3、4、5、6、7、8、9、10所示，一种心电表征自监督学习方法，包括以下步骤：步骤1，基于增噪处理和滤波处理实现心电数据转换处理，心电数据转换处理分为预处理阶段、增噪处理阶段和滤波处理阶段；步骤2，基于对抗学习构建编码器与判别器对抗任务，避免学习转换处理产生的无效表征，通过构建心电表征自监督学习模型的对抗学习模块，以实现编码器和判别器的对抗任务；步骤3，基于回归网络构建心电时空回归任务，通过构建心电表征自监督学习模型的回归模块，以实现心电数据时空回归任务；步骤4，基于对比学习构建患者对比任务，构建心电表征自监督学习模型的对比学习模块，提出了不需要负实例对的患者对比任务以提高模型学习语义表征的能力，以实现患者对比任务。

所述的步骤1中预处理包括对心电原始数据进行频率重采样和幅值归一化处理，以增噪处理和滤波处理作为心电数据转换处理方法，从而确保数据的时空特征不受转换影响，并降低噪声对表征学习的干扰；步骤1中增噪处理阶段包括：以麻省理工学院噪声压力测试数据库为噪声源，随机截取任意噪声源导联下(噪声源2导联)与心电原始数据等长的基线漂移、肌电噪声及工频噪声片段，根据公式(1)分别在心电原始数据中合成上述三种噪声，公式(1)为

公式(2)为

所述的步骤2中编码器分为有梯度编码器E()和无梯度编码器

二者结构相同，用于提取心电表征；步骤2中判别器D()用于判别信号所属伪标签类别，根据转换方式定义以及公式(3)生成伪标签pl^δ；以完成数据集的判别任务，即辨别出增噪处理和滤波处理的数据，

公式(3)为

所述的步骤2中对抗任务分为判别器训练和编码器训练两个阶段；判别器训练阶段包括：以无梯度编码器

提取的表征为数据集，训练过程中固定无梯度编码器

的参数，通过最小化公式(4)生成训练判别器D()，

公式(4)为

公式(4)中N为数据样本量，

和

表示无梯度编码器

提取的表征；

公式(5)为

公式(5)中

和

分别为噪声增强和噪声滤除处理后的转换数据，

和

表示有梯度编码器E()提取的表征。

所述的步骤3中回归模块包括两条支路，每条支路均由有梯度编码器E()和回归网络R()组成；时空回归任务分为表征重组和时空回归两个阶段；表征重组包括：根据公式(6)和公式(7)分别重组两条支路中有梯度编码器E()提取的表征，按照提取的表征的长度，分别将两条支路有梯度编码器提取的表征段分割为头片段和尾片段，使其两条支路的头片段表征分别与另一支路的尾片段表征重组，

公式(6)为

公式(7)为

时空预测阶段包括：表征

被分为头片段

和尾片段

以头片段

为回归网络R()的输入得到语义令牌

用于预测尾片段

根据公式(8)生成的f_k()表示数据和语义令牌的互信息，

公式(8)为

公式(8)中W_k()为

映射至

的线性函数，其中1≤k≤K-τ；

训练中通过最小化公式(9)、公式(10)和公式(11)来生成最大化数据与语义令牌的互信息，以达到模型学习心电时空表征的目的，

公式(9)为

公式(10)为

公式(11)为Loss_T＝E_i∈N[Loss_α+Loss_β]。

公式(12)为patient_set＝{p₁，…p_i，…，p_N}，

对比学习阶段包括：以语义令牌

和

分别作为两条对比支路中映射网络P()的输入，得到映射向量

和

再以映射向量

和

作为预测网络Q()的输入，得到预测向量

和

通过最小化公式(13)、公式(14)、公式(15)和公式(16)，最大化相同患者下实例的映射向量与预测向量的余弦相似度，从而实现患者对比任务，学习心电的语义表征,

公式(13)为

公式(14)为

公式(15)为

公式(16)为Loss_C＝E_i∈N[Loss_intra+Loss_inter]，

公式中sg()表示停止梯度；

公式(17)Loss_F＝λ₁Loss_G+λ₂Loss_T+λ₃Loss_C，

实施例1，处理流程如图2所示，本实施例包括预处理阶段、增噪处理阶段及滤波处理阶段；本实施例将心电数据集表示为公式(18)，

公式(18)为OX＝{ox₁，…ox_i，…ox_N}，

公式(18)中ox_i为某一实例原始心电数据，N为实例总数。

在预处理阶段，为了使数据统一标准，降低设备间(数据集间)差异性的影响，本实施例首先根据公式(19)将心电原始数据进行频率重采样(上采样或下采样)，使数据的频率均调整为基线频率，

公式(19)为

公式(19)中，ax_i为频率重采样后的心电数据，us()为上采样处理，ds()为下采样处理，f_a为数据频率，f_b为基线频率。

经过重采样后，利用公式(20)计算数据幅值转换系数，将心电数据根据幅值转换系数进行幅值归一化(幅值介于0到1之间)，根据公式(21)转换后生成幅值归一化的视图，

公式(20)为

公式(21)为

公式(20)和公式(21)中x_i为幅值归一化后的心电数据，γ为幅值转换系数，L为导联数，T为数据采样点数。

在增噪处理阶段，本方法以麻省理工学院噪声压力测试数据库为噪声源，随机截取任意噪声源导联下(噪声源2导联)与心电原始信号等长的基线漂移、肌电噪声及工频噪声片段，根据公式(1)分别在心电原始信号中合成上述三种噪声，根据公式(22)转换后的生成增噪视图，

公式(1)为

公式(22)为

公式(22)中

表示增噪处理后的增噪视图。

在滤波处理阶段，本方法分别采用巴特沃斯滤波器、有限脉冲响应滤波器和无限脉冲响应滤波器去除心电原始数据中的基线漂移、肌电噪声和工频噪声，根据公式(2)滤除以上噪声，根据公式(23)转换后生成滤波视图，

公式(2)为

公式(23)为

公式(23)中

表示滤波处理后的滤波视图。

为了验证本实施例的心电数据转换方法，发明人在Zheng等人提出12导联心律失常心电数据集(Chapman)中实施了本发明的心电数据转换方法，并与Kiyasseh等人和Eldele等人提出的数据转换方法进行比较。实验中将这些数据转换方法分别应用于本发明的表征学习方法，以及Chen(a)等人、Grill等人、Chen(b)等人、Eldele等人和Kiyasseh等人提出的表征学习方法，以验证心电数据转换方法的有效性。图3为心电原始数据分别经过增噪处理和滤波处理后生成的增噪视图和滤波视图。根据表1呈现的转换结果进行对比，记录了本发明心电数据转换处理方法与Kiyasseh等人和Eldele等人提出的数据转换方法应用于上述各表征学习方法的实验结果，评价指标为AUC(越接近于1越好)。本发明在6项实验中实现了5项第一，这说明了本发明的心电数据转换方法更适用于心电场景下的表征学习。图4进一步可视化了本发明数据转换方法(右)与Kiyasseh等人(左)，Eldele等人(中)方法的比较，可以看出，本发明的数据转换处理方法可有效提高表征学习的性能。

表1为本发明的数据转换处理方法与其他先进公开方法比较结果的列表。

实施例2，如图1所示，本实施例通过上述一系列自监督任务学习心电的语义和时空有效表征，具体来说，本方法构建的对抗学习模块包括编码器和判别器，通过对抗任务拉近不同视图下编码器提取的表征分布。其中，编码器分为有梯度编码器E()和无梯度编码器

用于提取心电数据表征

和

如式(24)、(25)，

公式(24)为

公式(25)为

公式(24)和公式(25)中δ∈{α，β}，α和β分别表示心电数据经过增噪处理和滤波处理。

有梯度编码器E()和无梯度编码器

的结构相同，如图5、6所示，由4层卷积层组成，判别器D()由3层MLP层成，用于判别数据所属伪标签类别。伪标签pl^δ根据转换方式定义，为

赋予伪标签类别如式(3)，

公式(3)为

对抗任务中分为判别器训练和编码器训练两个阶段。在判别器训练阶段，以无梯度编码器

提取的表征为数据集，训练过程中固定无梯度编码器

的参数，通过最小化公式(4)生成训练判别器D()，

公式(4)为

在编码器训练阶段，以有梯度编码器E()提取的表征为数据集，训练过程中固定判别器D()的参数，通过最小化公式(13)生产训练有梯度编码器E()，

公式(5)为

进一步地，有梯度编码器E()与判别器D()将根据式(26)进行对抗任务，以此拉近

和

的表征分布，

公式(26)为

如图6所示，通过采用纯思法模(Transformer)作为回归网络，由4个多头注意力块和4个前馈块组成，时空回归任务分为表征重组和时空回归两个阶段，在表征重组阶段，根据公式(6)和公式(7)分别重组两条支路中有梯度编码器E()提取的表征r_i ^α和

公式(6)为

公式(7)为

在时空回归阶段，本方法将表征

分为头片段

和尾片段

以头片段

为回归网络R()的输入得到语义令牌

根据公式(27)生成预测尾片段

根据公式(8)生成的f_k()表示数据

和语义令牌

的互信息，

公式(27)为

公式(8)为

训练中通过最小化公式(9)、公式(10)和公式(11)来生成最大化数据

与语义令牌

的互信息，以此学习数据的时空表征，

公式(9)为

公式(10)为

公式(11)为Loss_T＝E_i∈N[Loss_α+Loss_β]。

通过构建对比模块实现患者对比任务，从而学习心电语义表征。对比模块包括两条对比支路，每条支路均由映射网络P()和预测网络Q()组成，二者均由3层MLP构成。患者对比任务分为患者级实例集构建和对比学习两个阶段。在患者级实例集构建阶段，根据数据集各个实例所属的患者ID，通过公式(12)构建患者级实例集patient_set，

公式(12)为patient_set＝{p₁，…p_i，…，p_N}，

在对比学习阶段，以语义令牌

分别作为对比支路中映射网络P()的输入，得到映射向量

如公式(23)，再以映射向量

作为预测网络Q()的输入，得到预测向量

如公式(24)，公式(28)为

公式(29)为

在将判别任务由实例层转向患者层，以相同患者下的映射向量与预测向量为正实例对。通过最小化公式(13)、公式(14)、公式(15)和公式(16)，，最大化正实例对中映射向量(停止梯度)与预测向量的余弦相似度，从而学习心电数据语义表征，

公式(13)为

公式(14)为

公式(15)为

公式(16)为Loss_C＝E_i∈N[Loss_intra+Loss_inter]，

在优化对抗任务，时空回归任务和患者对比任务中，最小化公式(17)实现模型学习数据的时空及语义有效表征，

公式(17)Loss_F＝λ₁Loss_G+λ₂Loss_T+λ₃Loss_C。

为了验证本发明的心电表征自监督学习模型，发明人在Chapman数据集、Wagner等人提出的大型心电图数据集(PTB-XL)、Ribeiro等人提出的大规模12导联心电图数据集(CODE)和2018年中国生理信号挑战赛数据集(CPSC2018)等四个公开心电数据集实施了本发明，并与Oord等人、Chen(a)等人、Grill等人、Chen(b)等人、Eldele等人和Kiyasseh等人提出的自监督学习模型相对比，从预训练验证、可迁移性验证、类别学习验证和半监督验证等多个角度检验本发明的表征学习能力。图7中a、b和8c分别为Eldele等人、Kiyasseh等人和本发明提出的自监督学习模型在Chapman数据集的预训练实验结果。从图7中的表征分布上可以看出，本发明显然更能区分这四个类别，进一步说明了本发明方法在预训练学习的表征是有效的。根据表2显示出结果进行对比，给出了本发明模型和先进模型的可迁移性验证，本实验分别在4个公开数据上做预训练，并分别迁移至其他3个公开数数据集，通过表2中的评价指标数据，在12个迁移场景中，本发明实现了9项第一，3项第二的结果，说明了本发明方法在预训练学习的表征更有利于模型迁移。图8中a与b以及图9中c与d为本发明(右)与监督学习(左)分别在Chapman、PTB-XL、CODE和CPSC2018数据集上预测类别的混淆矩阵(对角线元素越接近1越好)，可以看出本发明的预测精度均优于监督学习，图10为本发明(*线)与监督学习(·线)分别在4个公开数据集上进行半监督验证的实验结果，评价结果为F1分数，可以看出本发明在20％标签数据下可以达到或超过50％标签数据下监督学习的性能。总之，本发明作为一种自监督表征学习方法，进过预训练后可以有效提高DNN模型的泛化能力，有利于心电智能诊断技术应用于临床，减轻医生的工作负担。

表2为本发明的自监督学习模型与其他先进公开模型数据迁移结果的列表。

由技术常识可知，本发明可以通过其它的不脱离其精神实质或必要特征的实施方案来实现。因此，上述公开的实施方案，就各方面而言，都只是举例说明，并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。

本发明通过提供一种降低噪音干扰，避免学习转换处理产生的无效表征，便于模型学习心电时空表征，实现模型学习心电的语义表征，提高DNN泛化性能的心电表征自监督学习方法，使得本发明有利于智能诊断的临床应用。

Claims

1.一种心电表征自监督学习方法，其特征在于，包括以下步骤：

步骤1，基于增噪处理和滤波处理实现心电数据转换处理，心电数据转换处理分为预处理阶段、增噪处理阶段和滤波处理阶段；

步骤2，基于对抗学习构建编码器与判别器对抗任务，通过构建心电表征自监督学习模型的对抗学习模块，以实现编码器和判别器的对抗任务；

步骤3，基于回归网络构建心电时空回归任务，通过构建心电表征自监督学习模型的回归模块，以实现心电数据时空回归任务；

步骤4，基于对比学习构建患者对比任务，构建心电表征自监督学习模型的对比学习模块，以实现患者对比任务。

2.根据权利要求1所述的心电表征自监督学习方法，其特征在于：所述的步骤1中预处理包括对心电原始数据进行频率重采样和幅值归一化处理；步骤1中增噪处理阶段包括：以麻省理工学院噪声压力测试数据库为噪声源，随机截取任意噪声源导联下(噪声源2导联)与心电原始数据等长的基线漂移、肌电噪声及工频噪声片段，根据公式(1)分别在心电原始数据中合成上述三种噪声，

公式(1)为

公式(1)中x_i，l，t第i列第l导联第t时刻下心电数据的采样点幅值，Tab_l，t、Tae_l，t和Tap_l，t分别表示用于合成至x_i，l，t的基线漂移、肌电噪声及工频噪声等噪声的采样点幅值；

公式(2)为

3.根据权利要求1所述的心电表征自监督学习方法，其特征在于：所述的步骤2中编码器分为有梯度编码器E()和无梯度编码器

公式(3)为

4.根据权利要求1所述的心电表征自监督学习方法，其特征在于：所述的步骤2中对抗任务分为判别器训练和编码器训练两个阶段；判别器训练阶段包括：以无梯度编码器

提取的表征为数据集，训练过程中固定无梯度编码器

的参数，通过最小化公式(4)生成训练判别器D()，

公式(4)为

公式(4)中N为数据样本量，

和

表示无梯度编码器

提取的表征；

公式(5)为

公式(5)中

和

分别为噪声增强和噪声滤除处理后的转换数据，

和

表示有梯度编码器E()提取的表征。

5.根据权利要求1所述的心电表征自监督学习方法，其特征在于：所述的步骤3中回归模块包括两条支路，每条支路均由有梯度编码器E()和回归网络R()组成；时空回归任务分为表征重组和时空回归两个阶段；表征重组包括：根据公式(6)和公式(7)分别重组两条支路中有梯度编码器E()提取的表征，

公式(6)为

公式(7)为

公式(6)和公式(7)中combine()表示重组操作，

和

表示有梯度编码器E()提取的表征，K为表征长度，τ为头片段长度；

时空预测阶段包括：表征

被分为头片段

和尾片段

以头片段

为回归网络R()的输入得到语义令牌

用于预测尾片段

根据公式(8)生成的f_k()表示数据和语义令牌的互信息，

公式(8)为

公式(8)中W_k()为

映射至

的线性函数，其中1≤k≤K-τ；

公式(9)为

公式(10)为

公式(11)为Loss_T＝E_i∈N[Loss_α+Loss_β]。

6.根据权利要求1所述的心电表征自监督学习方法，其特征在于：所述的步骤4中对比学习模块包括两条对比支路，每条支路均由映射网络P()和预测网络Q()组成；患者对比任务分为构建患者级实例集和对比学习两个阶段；构建患者级实例集阶段包括：根据数据集各个实例所属的患者ID信息，通过公式(12)构建患者级实例集patient_set，

公式(12)为patient_set＝{p₁，…p_i，…，p_N}，

对比学习阶段包括：以语义令牌