CN117379058A - 基于深度学习的心电图相似度计算方法、装置和存储介质 - Google Patents
基于深度学习的心电图相似度计算方法、装置和存储介质 Download PDFInfo
- Publication number
- CN117379058A CN117379058A CN202311164682.5A CN202311164682A CN117379058A CN 117379058 A CN117379058 A CN 117379058A CN 202311164682 A CN202311164682 A CN 202311164682A CN 117379058 A CN117379058 A CN 117379058A
- Authority
- CN
- China
- Prior art keywords
- data
- similarity
- deep learning
- training
- case
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013135 deep learning Methods 0.000 title claims abstract description 40
- 238000004364 calculation method Methods 0.000 title claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 74
- 238000000034 method Methods 0.000 claims abstract description 51
- 238000013136 deep learning model Methods 0.000 claims abstract description 17
- 230000009466 transformation Effects 0.000 claims description 24
- 239000013598 vector Substances 0.000 claims description 24
- 238000001914 filtration Methods 0.000 claims description 20
- 238000000605 extraction Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 13
- 238000010586 diagram Methods 0.000 claims description 12
- 238000002372 labelling Methods 0.000 claims description 9
- 230000003321 amplification Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 6
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000009825 accumulation Methods 0.000 claims description 3
- 238000011056 performance test Methods 0.000 claims description 3
- 238000002565 electrocardiography Methods 0.000 claims 1
- 230000000877 morphologic effect Effects 0.000 abstract description 13
- 230000002159 abnormal effect Effects 0.000 abstract description 7
- 230000008859 change Effects 0.000 abstract description 6
- 230000007547 defect Effects 0.000 abstract description 4
- 201000010099 disease Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 208000024172 Cardiovascular disease Diseases 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011524 similarity measure Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 229910015234 MoCo Inorganic materials 0.000 description 1
- 230000006793 arrhythmia Effects 0.000 description 1
- 206010003119 arrhythmia Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013434 data augmentation Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
- A61B5/318—Heart-related electrical modalities, e.g. electrocardiography [ECG]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
- A61B5/318—Heart-related electrical modalities, e.g. electrocardiography [ECG]
- A61B5/346—Analysis of electrocardiograms
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/725—Details of waveform analysis using specific filters therefor, e.g. Kalman or adaptive filters
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
- A61B5/7267—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Heart & Thoracic Surgery (AREA)
- Veterinary Medicine (AREA)
- Pathology (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Cardiology (AREA)
- Physiology (AREA)
- Psychiatry (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Fuzzy Systems (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
本发明公开了一种基于深度学习的模型训练方法,建立深度学习模型,利用大规模穿戴式心电数据进行预训练,以选择一个指标优异且可靠的预训练模型。能够克服传统方法利用形态学特征、统计特征计算相似度的不足。还提出一种基于深度学习的心电图相似度计算方法,使用预训练模型提取心电数据的深度特征,并计算特征间的余弦相似度,随之建立基准点,深度学习的提取特征更加鲁棒可靠,相似度精度更高,针对高维特征采用了余弦相似度的计算方式,优于较传统的形态相似度计算方式。最后绘制个人心电图相似度图,分析心电数据时间变化趋势,给医护人员和使用者参考,快速捕捉到异常心电图。
Description
技术领域
本发明属于心电信号处理与分析领域,更具体地,涉及一种基于深度学习的心电图相似度计算方法、装置和存储介质。
背景技术
心电图相似度是一项用于识别和比较个体心电图之间差异的计算方法,旨在帮助医生进行疾病诊断并监测病情的发展。通过计算心电图之间的相似度,医生可以及时发现异常心电事件,并提供早期警示,以促使患者采取及时的治疗措施,从而降低心血管疾病的风险。
中老年人以及心血管疾病患者为了日常监测自身的心脏状况,可利用医院的标准十二导联心电图机进行监测,但耗时耗力、成本高昂,因此移动健康监测系统应运而生。该系统通过使用可穿戴式传感器持续跟踪记录人体的生理参数,并借助智能分析算法对收集到的穿戴式心电图进行分析。该系统操作简单方便,并且使用者无需经过专业医学培训,从而大大降低了实施成本。
移动健康监测系统对使用者进行长时程检测,并将大量历史心电数据保存在云端数据库中。利用历史心电图建立个体的心电图数据库,通过计算心电图之间的相似度,并且结合采样时间,医护人员以及使用者可以了解个体在一段时间内的心电图变化情况以及发展趋势,提醒病情进展,也可以为个性化医疗和预防提供有力支持。此外心电图相似度的计算可以快速识别当前心电图与使用者历史心电图的差异,差异过大可以提示使用者是否出现异常心电事件。
然而,现有的心电图相似度计算方式主要集中在对形态学特征的计算。这些方法常常依赖于对心拍RR间期、QRS波持续时间等统计特征的分析,或者对提取的时域和频域特征进行组合分析。然而,传统方法仅能提取出心电图的低层特征,存在一些弊端。首先,相似度计算的优劣严重依赖于人工选择的特征,而人工选择的特征可能受到主观因素和先验知识的影响。此外,不同的研究人员可能会选择不同的特征集,导致结果的不一致性和可比性的降低;其次,形态学特征的计算要求整体波形进行强制匹配和对齐,更关注波形的整体形状而忽略了局部细微的变化,因此无法全面准确地捕捉到心电图的细微特征,忽略了病变信息;最后,形态学特征的计算通常在实践中是一项复杂且计算密集的任务,波形匹配步骤繁琐、效率低下。总言之,形态学特征无法直接用于疾病诊断,利用不够鲁棒的形态特征计算的相似度难以确保其可靠性。相较于此,深度学习提取到的深度特征信息更丰富,更具有鲁棒性,不仅包含低层形态特征,还包含疾病诊断特征等。
术语解释:
动量对比学习(Momentum Contrast,MoCo):机器学习中一种常用的无监督学习方式。
无监督学习:机器学习的一种学习范式,其目标是从未标记的数据中发现数据的内在结构、模式或关系,而无需事先提供标签或类别信息的指导。
数据扩增:是指通过对数据进行一系列变换和增强操作,例如常见的数据扩增操作包括平移、旋转、缩放、翻转、裁剪、亮度调整、对比度增强、色彩变换等。
发明内容
本发明的目的在于克服传统方法利用形态学特征、统计特征计算相似度的不足。基于深度学习的相似度计算方式使用高维深度特征可以引入更多有用信息,提高相似度可靠性。首先建立深度学习模型,利用大规模穿戴式心电数据进行预训练,以选择一个指标优异且可靠的预训练模型。随后使用预训练模型提取心电数据的深度特征,并计算特征间的余弦相似度,随之建立基准点。最后绘制个人心电图相似度图,分析心电数据时间变化趋势,给医护人员和使用者参考,快速捕捉到异常心电图。
本发明所采取的技术方案是:
第一方面,本发明实施例提供了一种基于深度学习的模型训练方法,所述基于深度学习的模型训练方法包括:
获取原始心电数据;
将所述原始心电数据进行数据预处理,获得原始训练数据;
搭建深度学习模型;
利用所述原始训练数据对所述深度学习模型进行动量对比学习训练,得到预训练特征提取模型。
进一步地,所述将所述原始心电数据进行数据预处理,获得原始训练数据这一步骤,包括:
使用带通滤波对所述原始心电数据进行滤波去噪;
使用归一化操作对所述原始心电数据进行消除偏移效应,获得原始训练数据。
进一步地,所述使用带通滤波对所述原始心电数据进行滤波去噪这一步骤,具体包括:
设置所述带通滤波为5阶巴特沃兹带通滤波器;
使用所述带通滤波移除所述原始心电数据中的基线漂移和工频干扰。
进一步地,所述利用所述原始训练数据对所述深度学习模型进行动量对比学习训练,得到预训练特征提取模型这一步骤,具体包括:
将所述原始训练数据进行数据扩增,获取不同的变换数据;
将所述变换数据分成第一类变换数据和第二类变换数据;
将所述第一类变换数据输入第一编码器,得到第一特征向量;
将所述第二类变换数据输入第二编码器,得到第二特征向量;
将所述第一特征向量和所述第二特征向量进行对比损失计算,得到损失值;
获取有心电图标注的心电图标注数据;
将所述心电图标注数据输入至所述深度学习模型进行模型性能测试,得到准确率;
回到获取不同的变换数据的步骤,直到所述损失值收敛且所述准确率优异时,模型训练完成,得到预训练特征提取模型。
进一步地,所述将所述第一特征向量和所述第二特征向量进行对比损失计算,得到损失值这一步骤,所使用的公式包括:
LC=-log[p(q,k)] (2)
L=LC+βLD (4)
其中,L是损失函数,k是所述第一特征向量,q和q′是所述第二特征向量;
|B|是批大小,一般设为256;β是调节所述损失函数的超参数权重,一般设为0.1;K为字典的大小,一般设为65536;i是取一系列整数值,以控制累加的次数和范围;是表示第i个所述第一特征向量;τ为温度超参数。
第二方面,本发明实施例提供了一种基于深度学习的心电图相似度计算方法,所述基于深度学习的心电图相似度计算方法包括:
获取来自同一病例的多个病例心电数据,所述病例心电数据包括不同的病例个体心电数据;
对于任一所述病例心电数据,将所述病例个体心电数据执行数据预处理,获得输入数据;
将所述输入数据输入至预训练特征提取模型中进行提取特征,获得相应一个特征矩阵;所述预训练特征提取模型经过权利要求1-5任一项所述的基于深度学习的模型训练方法训练;
计算两两所述特征矩阵之间的相似度,确定病例个体心电数据的相似度;
根据所述病例个体心电数据的相似度,计算所述病例个体心电数据的基准点;
根据所述病例个体心电数据的相似度和所述基准点,绘制相似度散点图。
进一步地,所述计算两两所述特征矩阵之间的相似度,确定病例个体心电数据的相似度这一步骤,所使用的公式包括:
其中,xm是待计算相似度的所述病例个体心电数据,similaritym是所述病例个体心电数据xm的相似度值,xi是除所述病例个体心电数据xm外的所有其余病例个体心电数据,N是所述病例个体心电数据xm的数据量。
进一步地,所述根据所述病例个体心电数据的相似度,计算所述病例个体心电数据的基准点这一步骤,所使用的公式包括:
t=t+1 until t≥maxIter; (10)
point=median(Datasett); (11)
其中,μ和σ分别是所述病例个体心电数据xi的均值和方差,N是所述病例个体心电数据xi的数据量,γ是可选择的阈值,t是迭代次数,maxIter是最大迭代次数,Datasett是每次迭代后的数据库,median(Datasett)是取中值函数,point是所述病例个体心电数据的基准点。
第三方面,本发明实施例还提供了一种基于深度学习的心电图相似度计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至8中任意一项方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至8任意一项方法。
本发明的有益效果是:本发明提出一种基于深度学习的模型训练方法,建立深度学习模型,利用大规模穿戴式心电数据进行预训练,以选择一个指标优异且可靠的预训练模型。能够克服传统方法利用形态学特征、统计特征计算相似度的不足。还提出一种基于深度学习的心电图相似度计算方法,使用预训练模型提取心电数据的深度特征,并计算特征间的余弦相似度,随之建立基准点,深度学习的提取特征更加鲁棒可靠,相似度精度更高,针对高维特征采用了余弦相似度的计算方式,优于较传统的形态相似度计算方式。最后绘制个人心电图相似度图,分析心电数据时间变化趋势,给医护人员和使用者参考,快速捕捉到异常心电图。
附图说明
图1是本发明实施例提供的基于深度学习的模型训练方法的流程图;
图2是本发明实施例提供的算法流程图;
图3是本发明实施例提供的数据预处理效果图;
图4是本发明实施例提供的基于对比学习的预训练模型算法原理图;
图5是本发明实施例提供的某一个体心电图相似度散点图;
图6是本发明实施例提供的另一个体心电图相似度散点图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面结合附图,对本发明实施例作进一步阐述。
第一方面,本发明实施例提供了一种基于深度学习的模型训练方法。
本实施例公开了一种基于深度学习的模型训练方法,能够克服传统方法利用形态学特征、统计特征计算相似度的不足。具体地,该方法包括但不限于以下所有步骤。
本发明实施例公开了一种基于深度学习的模型训练方法,具体地,参考图1,该方法包括:
S100、获取原始心电数据;
S200、将原始心电数据进行数据预处理,获得原始训练数据;
S300、搭建深度学习模型;
S400、利用原始训练数据对深度学习模型进行动量对比学习训练,得到预训练特征提取模型。
可以理解的是,步骤S100中,可以先获取可穿戴设备采集到的原始心电数据并构建数据库。值得强调的是,由于使用者长时程佩戴穿戴式心电设备,因此产生了大量的心电图记录。但只有少部分心电图标注,心内科医生能够结合用户的主诉、症状和发病历史检查部分的心电数据,因此绝大多数心电图是未标注的。
本实施例具体公开了步骤S200将原始心电数据进行数据预处理,获得原始训练数据这一步骤,包括:
S210、使用带通滤波对原始心电数据进行滤波去噪;
S220、使用归一化操作对原始心电数据进行消除偏移效应,获得原始训练数据。
可以理解的是,本实施例中,对心电数据进行滤波去噪、归一化等基本信号预处理,处理后的效果图如图3所示。可穿戴设备所采集到的心电信号噪声干扰多,患者佩戴时肢体的移动会造成信号基线漂移。
本实施例具体公开了步骤S210使用带通滤波对原始心电数据进行滤波去噪这一步骤,具体包括:
S211、设置带通滤波为5阶巴特沃兹带通滤波器;
S212、使用带通滤波移除原始心电数据中的基线漂移和工频干扰。
可以理解的是,本实施例针对上述步骤S200的问题,本发明实施例采用:1)带通滤波:使用0.5Hz到35Hz的5阶巴特沃兹带通滤波器来移除低频的基线漂移和50Hz高频的工频干扰;2)标准化:定义每一导联的均值和标准差,计算数据与均值的差值再除以标准差,以消除偏移效应。
本实施例具体公开了步骤S400利用原始训练数据对深度学习模型进行动量对比学习训练,得到预训练特征提取模型这一步骤,具体包括:
S410、将原始训练数据进行数据扩增,获取不同的变换数据;
S420、将变换数据分成第一类变换数据和第二类变换数据;
S430、将第一类变换数据输入第一编码器,得到第一特征向量;
S440、将第二类变换数据输入第二编码器,得到第二特征向量;
S450、将第一特征向量和第二特征向量进行对比损失计算,得到损失值;
S460、获取有心电图标注的心电图标注数据;
S470、将心电图标注数据输入至深度学习模型进行模型性能测试,得到准确率;
S480、回到获取不同的变换数据的步骤,直到损失值收敛且准确率优异时,模型训练完成,得到预训练特征提取模型。
可以理解的是,本发明实施例为了充分利用未标注的数据,本发明利用无监督学习的方式训练深度学习特征提取模型,并用部分有标注的数据来测试预训练模型性能好坏。输入心电数据长为15s,采样频率为500Hz,大小为[12,7500]。选择的模型架构在残差连接网络框架的基础上,结合多尺度卷积和压缩-激励模块组合为一个1维的深度学习模型。
可以理解的是,深度学习模型具体使用动量对比学习(Momentum Contrast,MoCo)的方式进行训练。MoCo包括一个可学习的编码器fE和一个动量更新参数的编码器fM,两个编码器采用相同的模型架构,初始化参数方式也相同;每个编码器底部都有一个非线性的投影头;除此以外,还包括一个字典维度是K,字典可以认为是K例数据特征集合。
本实施例具体公开了步骤S450将第一特征向量和第二特征向量进行对比损失计算,得到损失值这一步骤,所使用的公式包括:
LC=-log[p(q,k)] (2)
L=LC+βLD (4)
其中,L是损失函数,k是第一特征向量,q和q′是第二特征向量;
|B|是批大小,一般设为256;β是调节损失函数的超参数权重,一般设为0.1;K为字典的大小,一般设为65536;i是取一系列整数值,以控制累加的次数和范围;是表示第i个第一特征向量;τ为温度超参数。
可以理解的是,本发明实施例的算法具体流程如图4所示。输入一个心电数据xquery,称其为锚点。xquery采用多种数据扩增方式,得到变换后的数据xk、xq′和xq。随后xk、xq′和xq分别输入到两个编码器中得到特征向量k、q′和q,即q=fE(xq)、q′=fE(xq′)和k=fm(xk)。由于数据扩增后的数据是同一数据的不同表示,所以认为其应该是相似的,因此互为正样本;而字典中的数据特征不包含锚点数据,所以字典中的特征向量和锚点变换后的数据提取的特征向量应该是不同的,因此互为负样本。锚点数据与字典数据构成了(K+1)个特征向量表示,即维度为(K+1)。其中锚点数据的标签为1,字典中所有负例的标签为0,损失函数L的计算如公式(1)-(4);
动量更新参数的编码器fM更新参数的公式如下:
fM.params=m*fM.params+(1-m)*fE.params (5)
上述式子(1)-(5)中,|B|是批大小,一般设为256;β是调节损失函数的超参数权重,一般设为0.1;K为字典的大小,一般设为65536;d为提取到的特征向量维度,再次设为121维;τ为温度超参数,用于调整损失函数曲线平滑度;动量更新参数的编码器更新参数的公式中,m为动量更新参数的编码器fM更新速率,一般设为0.999;fM.params为动量更新参数的编码器fM的模型参数,fE.params为可学习的编码器的模型参数。
可以理解的是,网络使用所有的无标注心电数据进行训练。网络共迭代100代,网络的权重和字典都使用随机初始化方式。学习率设为0.001。最终,使用了部分标注的心电数据对模型性能进行测试,指标使用准确率(ACC,accuracy)进行评估,损失最终收敛且分类性能优异的模型用于S700中预训练模型的参数迁移。
第二方面,本发明实施例提供了一种基于深度学习的心电图相似度计算方法,基于深度学习的心电图相似度计算方法包括:
S500、获取来自同一病例的多个病例心电数据,病例心电数据包括不同的病例个体心电数据;
S600、对于任一病例心电数据,将病例个体心电数据执行数据预处理,获得输入数据;
S700、将输入数据输入至预训练特征提取模型中进行提取特征,获得相应一个特征矩阵;预训练特征提取模型经过权利要求1-5任一项的基于深度学习的模型训练方法训练;
S800、计算两两特征矩阵之间的相似度,确定病例个体心电数据的相似度;
S900、根据病例个体心电数据的相似度,计算病例个体心电数据的基准点;
SA00、根据病例个体心电数据的相似度和基准点,绘制相似度散点图。
可以理解的是,由于心血管疾病是偶发的,具有瞬过性和突发性的特点,因此个体绝大多数的心电图是正常的,只有少数心电图因心脏状况不佳而表现异常。不同个体由于性别、年龄、地域等的差异,心电图的波形也会存在一定的不同。即使是健康人的心电图,新生儿R波的振幅女性要大于男性,因此心电图诊断会受年龄和性别等的影响。本发明为了消除个体差异,计算相似度时使用的为同一个体的心电图数据库。
可以理解的是,参考图2,是本发明实施例提供的基于深度学习的心电图相似度计算方法的流程图。其主要步骤包括:收集可穿戴式十二导联大规模心电图数据库;心电数据的预处理,包括数据滤波、归一化等;预训练深度模型;预训练完毕将网络参数迁移作为深度特征提取模型的初始化参数;病例心电图数据库经过相同的预处理过程,深度模型提取的特征计算相似度、确定相似度基准点,并绘制相似度散点图。
可以理解的是,本发明实施例得到个体心电图数据库的相似度与基准点后,绘制相似度散点图。本发明实施例能够让人了解当前心电图与使用者历史心电图之间的差异,帮助医生或者使用者快速地掌握当前心脏状况是否发生突发改变,以及反映时间变化趋势。图5为某一个体的心电图相似度散点图,图6为另一个体的心电图相似度散点图,其中,散点图以上传数据时间(采样时间)为横轴,相似度为纵轴,数值为0-1。当相似度为0.8以上可以认为是该个体的正常状况,而异常的点可以为心电图异常。
可以理解的是,本发明提出一种新型基于深度学习特征计算相似度的方法,并且利用z-分数迭代的方法计算出个体基准点。深度学习的提取特征更加鲁棒可靠,相似度精度更高,针对高维特征采用了余弦相似度的计算方式,优于较传统的形态相似度计算方式。
可以理解的是,本发明提出基于对比学习的预训练模型不仅可以用于心电图相似度计算,也可以用于其他下游任务,例如心律失常分类、心电信号重建、心电信号生成等。
可以理解的是,本发明使用的数据为可穿戴设备采集到的原始动态心电数据,该方法能够部署到云端、设备端和手机端,实现快速心电图相似度计算,为移动健康检测系统提供了技术支持,具有实用与推广意义。
本实施例具体公开了步骤S800计算两两特征矩阵之间的相似度,确定病例个体心电数据的相似度这一步骤,所使用的公式包括:
其中,xm是待计算相似度的病例个体心电数据,similaritym是病例个体心电数据xm的相似度值,xi是除病例个体心电数据xm外的所有其余病例个体心电数据,N是病例个体心电数据xm的数据量。
可以理解的是,本发明实施例中,同一个体所有的十二导联心电数据按照S2中的步骤进行滤波去噪归一化后,输入到预训练的模型中进行深度特征提取。当输入数据长度不足15s时进行补零,当输入数据长度大于15s时进行裁剪,统一调整为[12,7500]的心电数据输入到模型中。个体共有N例心电数据,提取到的特征为121维,特征矩阵大小为[N,121]。特征矩阵两两之间计算相似度,对于每一例心电数据而言,总共有(N-1)例相似度,将(N-1)例相似度求和平均作为这一例样本最终相似度。相似度度量的计算采用适用于高维特征计算的余弦相似度度量方式。相似度计算公式如公式(6);
在公式(6)中,xm是待计算相似度的心电数据,N是该个体所有的心电数据,xi是xm除外所有的心电数据。similaritym是xm样本的相似度值。
本实施例具体公开了步骤S900根据病例个体心电数据的相似度,计算病例个体心电数据的基准点这一步骤,所使用的公式包括:
t=t+1 until t≥maxIter; (10)
point=median(Datasett); (11)
其中,μ和σ分别是病例个体心电数据xi的均值和方差,N是病例个体心电数据xi的数据量,γ是可选择的阈值,t是迭代次数,maxIter是最大迭代次数,Datasett是每次迭代后的数据库,median(Datasett)是取中值函数,point是病例个体心电数据的基准点。
可以理解的是,计算完该个体心电图数据库的相似度后{similarity1,similarity2,......similarityN},需要确定该个体的数据库基准点。基准点的确定采用z-分数迭代的方法,假设样本分布服从正态分布,计算出样本的均值μ和方差σ,则每一个数据与均值μ之间的距离除以标准差σ作为该数据的z-分数。
在公式(7)和公式(8)中,μ和σ是样本的均值和方差,xi是心电数据,N是该个体所有的心电数据,z-scorei是xi除的z-分数。
每次迭代只取z-分数小于γ的样本,迭代多次后,认为异常离群数据已经被剔除,剩下的数据为该个体最普通的数据,最终将剩下数据的相似度中值作为该个体的基准点。γ一般取0.9,基准点计算方式如公式(9)-(11);
在公式(9)-(11)中,t是迭代次数,maxIter是最大迭代次数,本发明中取6,Datasett是每次迭代后的数据库,γ是可选择的阈值,本发明中取0.9,median(Datasett)是取中值函数,point是该个体的基准点。
第三方面,本发明实施例还提供了一种基于深度学习的心电图相似度计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述第一方面和第二方面中任意一项方法。
处理器和存储器可以通过总线或者其他方式连接。存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实现上述实施例的第一方面或第二方面的方法所需的非暂态软件程序以及指令存储在存储器中,当被处理器执行时,执行上述实施例中的第一方面或第二方面的方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于使计算机执行如上述第一方面和第二方面的任意一项方法。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上是对本发明的较佳实施进行了具体说明,但本发明并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的前提下还可作出种种的等同变形或替换,这些等同的变形或替换均包含在本发明权利要求所限定的范围内。
Claims (10)
1.一种基于深度学习的模型训练方法,其特征在于,所述基于深度学习的模型训练方法包括:
获取原始心电数据;
将所述原始心电数据进行数据预处理,获得原始训练数据;
搭建深度学习模型;
利用所述原始训练数据对所述深度学习模型进行动量对比学习训练,得到预训练特征提取模型。
2.根据权利要求1所述的基于深度学习的模型训练方法,其特征在于,所述将所述原始心电数据进行数据预处理,获得原始训练数据这一步骤,包括:
使用带通滤波对所述原始心电数据进行滤波去噪;
使用归一化操作对所述原始心电数据进行消除偏移效应,获得原始训练数据。
3.根据权利要求2所述的基于深度学习的模型训练方法,其特征在于,所述使用带通滤波对所述原始心电数据进行滤波去噪这一步骤,具体包括:
设置所述带通滤波为5阶巴特沃兹带通滤波器;
使用所述带通滤波移除所述原始心电数据中的基线漂移和工频干扰。
4.根据权利要求1所述的基于深度学习的模型训练方法,其特征在于,所述利用所述原始训练数据对所述深度学习模型进行动量对比学习训练,得到预训练特征提取模型这一步骤,具体包括:
将所述原始训练数据进行数据扩增,获取不同的变换数据;
将所述变换数据分成第一类变换数据和第二类变换数据;
将所述第一类变换数据输入第一编码器,得到第一特征向量;
将所述第二类变换数据输入第二编码器,得到第二特征向量;
将所述第一特征向量和所述第二特征向量进行对比损失计算,得到损失值;
获取有心电图标注的心电图标注数据;
将所述心电图标注数据输入至所述深度学习模型进行模型性能测试,得到准确率;
回到获取不同的变换数据的步骤,直到所述损失值收敛且所述准确率优异时,模型训练完成,得到预训练特征提取模型。
5.根据权利要求4所述的基于深度学习的模型训练方法,其特征在于,所述将所述第一特征向量和所述第二特征向量进行对比损失计算,得到损失值这一步骤,所使用的公式包括:
LC=-log[p(q,k)] (2)
L=LC+βLD (4)
其中,L是损失函数,k是所述第一特征向量,q和q′是所述第二特征向量;
|B|是批大小,一般设为256;β是调节所述损失函数的超参数权重,一般设为0.1;K为字典的大小,一般设为65536;i是取一系列整数值,以控制累加的次数和范围;是表示第i个所述第一特征向量;τ为温度超参数。
6.一种基于深度学习的心电图相似度计算方法,其特征在于,所述基于深度学习的心电图相似度计算方法包括:
获取来自同一病例的多个病例心电数据,所述病例心电数据包括不同的病例个体心电数据;
对于任一所述病例心电数据,将所述病例个体心电数据执行数据预处理,获得输入数据;
将所述输入数据输入至预训练特征提取模型中进行提取特征,获得相应一个特征矩阵;所述预训练特征提取模型经过权利要求1-5任一项所述的基于深度学习的模型训练方法训练;
计算两两所述特征矩阵之间的相似度,确定病例个体心电数据的相似度;
根据所述病例个体心电数据的相似度,计算所述病例个体心电数据的基准点;
根据所述病例个体心电数据的相似度和所述基准点,绘制相似度散点图。
7.根据权利要求6所述的基于深度学习的心电图相似度计算方法,其特征在于,所述计算两两所述特征矩阵之间的相似度,确定病例个体心电数据的相似度这一步骤,所使用的公式包括:
其中,xm是待计算相似度的所述病例个体心电数据,similaritym是所述病例个体心电数据xm的相似度值,xi是除所述病例个体心电数据xn外的所有其余病例个体心电数据,N是所述病例个体心电数据xm的数据量。
8.根据权利要求6所述的基于深度学习的心电图相似度计算方法,其特征在于,所述根据所述病例个体心电数据的相似度,计算所述病例个体心电数据的基准点这一步骤,所使用的公式包括:
t=t+1 until t≥maxIter; (10)
point=median(Datasett); (11)
其中,μ和σ分别是所述病例个体心电数据xi的均值和方差,N是所述病例个体心电数据xi的数据量,γ是可选择的阈值,t是迭代次数,maxIter是最大迭代次数,Datasett是每次迭代后的数据库,median(Datasett)是取中值函数,point是所述病例个体心电数据的基准点。
9.一种基于深度学习的心电图相似度计算装置,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至8中任意一项方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至8任意一项方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311164682.5A CN117379058A (zh) | 2023-09-08 | 2023-09-08 | 基于深度学习的心电图相似度计算方法、装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311164682.5A CN117379058A (zh) | 2023-09-08 | 2023-09-08 | 基于深度学习的心电图相似度计算方法、装置和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117379058A true CN117379058A (zh) | 2024-01-12 |
Family
ID=89436308
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311164682.5A Pending CN117379058A (zh) | 2023-09-08 | 2023-09-08 | 基于深度学习的心电图相似度计算方法、装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117379058A (zh) |
-
2023
- 2023-09-08 CN CN202311164682.5A patent/CN117379058A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sangaiah et al. | An intelligent learning approach for improving ECG signal classification and arrhythmia analysis | |
Li et al. | Patient-specific ECG classification by deeper CNN from generic to dedicated | |
US10610162B2 (en) | Method for the detecting electrocardiogram anomalies and corresponding system | |
Krasteva et al. | QRS template matching for recognition of ventricular ectopic beats | |
JP5634065B2 (ja) | 生物医学的信号形態分析手法 | |
CN109645980A (zh) | 一种基于深度迁移学习的心律异常分类方法 | |
CN106815570B (zh) | 一种基于动态模式识别的心电信号st-t段识别方法 | |
He et al. | Automatic detection of QRS complexes using dual channels based on U-Net and bidirectional long short-term memory | |
Almutairi et al. | Classification of Obstructive Sleep Apnoea from single-lead ECG signals using convolutional neural and Long Short Term Memory networks | |
EP3251594B1 (en) | Device for detecting electrocardiogram anomalies | |
Liu et al. | Diagnosis of arrhythmias with few abnormal ECG samples using metric-based meta learning | |
Orhan | Real-time CHF detection from ECG signals using a novel discretization method | |
Sumathi et al. | A wavelet transform based feature extraction and classification of cardiac disorder | |
Bulusu et al. | Transient ST-segment episode detection for ECG beat classification | |
CN107239684A (zh) | 一种用于ecg身份识别的特征学习方法和系统 | |
Wu et al. | Personalizing a generic ECG heartbeat classification for arrhythmia detection: a deep learning approach | |
Kaur et al. | On the detection of cardiac arrhythmia with principal component analysis | |
Ge et al. | ECG-signal classification using SVM with multi-feature | |
Singhal et al. | A systematic review on artificial intelligence-based techniques for diagnosis of cardiovascular arrhythmia diseases: challenges and opportunities | |
Tseng et al. | Clustering analysis of aging diseases and chronic habits with multivariate time series electrocardiogram and medical records | |
Poonja et al. | Evaluation of ECG based Recognition of Cardiac Abnormalities using Machine Learning and Deep Learning | |
Jiang et al. | Topological data analysis approach to extract the persistent homology features of ballistocardiogram signal in unobstructive atrial fibrillation detection | |
Márquez et al. | A study on the representation of QRS complexes with the optimum number of Hermite functions | |
CN110786847B (zh) | 心电信号的建库方法和分析方法 | |
Ayushi et al. | A survey of ECG classification for arrhythmia diagnoses using SVM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |