CN117679041A - 基于动态特征融合的心电数据分析系统 - Google Patents
基于动态特征融合的心电数据分析系统 Download PDFInfo
- Publication number
- CN117679041A CN117679041A CN202311645522.2A CN202311645522A CN117679041A CN 117679041 A CN117679041 A CN 117679041A CN 202311645522 A CN202311645522 A CN 202311645522A CN 117679041 A CN117679041 A CN 117679041A
- Authority
- CN
- China
- Prior art keywords
- partition
- feature
- information quantity
- electrocardiographic
- characteristic information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 86
- 238000007405 data analysis Methods 0.000 title claims abstract description 13
- 238000005192 partition Methods 0.000 claims abstract description 227
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000012502 risk assessment Methods 0.000 claims abstract description 20
- 238000000605 extraction Methods 0.000 claims abstract description 18
- 238000012216 screening Methods 0.000 claims abstract description 13
- 238000004364 calculation method Methods 0.000 claims abstract description 5
- 230000004913 activation Effects 0.000 claims description 17
- 238000013528 artificial neural network Methods 0.000 claims description 17
- 238000012549 training Methods 0.000 claims description 14
- 238000000638 solvent extraction Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 8
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 7
- 238000007476 Maximum Likelihood Methods 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 4
- VYMDGNCVAMGZFE-UHFFFAOYSA-N phenylbutazonum Chemical compound O=C1C(CCCC)C(=O)N(C=2C=CC=CC=2)N1C1=CC=CC=C1 VYMDGNCVAMGZFE-UHFFFAOYSA-N 0.000 claims description 2
- 230000000747 cardiac effect Effects 0.000 abstract description 9
- 230000006870 function Effects 0.000 description 17
- 208000010125 myocardial infarction Diseases 0.000 description 12
- 238000011160 research Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 4
- 230000004807 localization Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 208000019622 heart disease Diseases 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000013316 zoning Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000004195 computer-aided diagnosis Methods 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 208000000059 Dyspnea Diseases 0.000 description 1
- 206010013975 Dyspnoeas Diseases 0.000 description 1
- 241000288105 Grus Species 0.000 description 1
- 208000006083 Hypokinesia Diseases 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 206010033557 Palpitations Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 230000005189 cardiac health Effects 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 208000002173 dizziness Diseases 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002565 electrocardiography Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 210000005241 right ventricle Anatomy 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 208000013220 shortness of breath Diseases 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
本发明提供了一种基于动态特征融合的心电数据分析系统,包括采集模块、提取模块、筛选模块、计算模块和融合模块;通过采集模块将采集的目标患者的心电数据并通过提取模块对心电数据进行特征提取后进行分区,通过筛选模块得到每个分区的区内特征信息量,通过计算模块得到每个分区的区间特征信息量,根据每个分区的区间特征信息量通过融合模块对每个分区的区内特征信息量进行动态融合,得到每个分区的心电数据特征融合结果,并根据每个分区的心电数据特征融合结果确定每个分区的目标风险评估等级;与现有技术相比,本发明以目标风险评估等级作为参考指标,通过无创的方式准确高效地评估心脏风险情况。
Description
技术领域
本发明涉及心电数据分析技术领域,特别涉及一种基于动态特征融合的心电数据分析系统。
背景技术
心脏是人体最重要的器官,通过不断地有规律的跳动向人体各个组织输送血液,对保持细胞正常功能和代谢,体液调节、体温调节和人体内环境稳态有重要作用。心脏的健康直接关系到人体的健康,由于个体对心跳的感知并不敏感,并且心脏病的并发症状如:疼痛、气促、心悸、乏力和头晕等症状及其容易被患者自身忽视,很多患者在疾病的晚期也没有明显症状,导致心脏疾病难以被发现。
近年来随着计算机辅助诊疗系统的发展,心电数据自动识别也成为生物医学工程领域的热门研究方向,心电图(Electrocardiogram,ECG)是一个重要的无创、客观的诊断工具,通过计算机辅助诊疗系统对心电图进行分析研究能够为医生提供患者生理状态变化的关键信息,对于心脏疾病的早期诊断具有重要的临床意义。目标心电图最常用的采集方式是通过标准的12导联心电图来采集,12导联心电图是由10个表面电极从心脏的12个不同角度记录。
目前,研究人员在利用心电图进行心脏风险评估上进行广泛的研究,研究早期在进行特征提取和选择的过程通常是手工操作,旨在从心电图波形中筛选出用于评估心脏风险的特征,例如ST段偏差和T波幅度。在特征提取或选择之后,各种各样的传统及其学习分类器被开发用于进行分类,其中传统的及其学习分类器包括K-近邻(K-nearestneighbor,KNN)、决策树(Decisiontree,DT)、支持向量机(Supportvectormachine,SVM)、朴素贝叶斯(Naive Bayes,NB)等。这些方法在心脏风险评估上已经取得了一些进展,但仍存在一些局限。主要是由于人工获取心电图特征的过程通常及其耗费时间和人力资源,并且提取出高质量的心电图特征需要扎实的专业知识,而这些不稳定的因素往往会干扰到最终的风险评估结果。
而深度学习技术能够在无需人工干预的情况下完成特征的自动提取,进而实现更为准确的分类。近年来,包括卷积神经网络(Convolutional neural Network,CNN)、门控循环单元(Gatedrecurrentunit,GRU)、注意力机制和自动编码器在内的深度学习方法,已被广泛地应用在了生物信号数据分析领域并获得了出色的表现。然而,这些方法通常在学习过程中未充分考虑心脏风险评估结果与不同导联信号间关联关系的差异性以及不同样本的特异性,从而限制了模型的分类准确性以及对目标风险评估等级的可解释性。
发明内容
本发明提供了一种基于动态特征融合的心电数据分析系统,其目的是为了提高心脏风险评估的准确度。
为了达到上述目的,本发明提供了一种基于动态特征融合的心电数据分析系统,包括:
采集模块,用于采集目标患者的心电数据;
提取模块,用于通过分区动态特征融合网络中的通道注意力模块分别对心电数据进行特征提取,得到心电特征图,并根据12导联对心电特征图进行分区,将位于同一分区内的心电特征图进行拼接,得到每个分区的心电特征图;
筛选模块,用于分别针对每个分区的心电特征图,通过分区动态特征融合网络中的特征编码器对每个分区的心电特征图进行筛选,得到每个分区的区内特征信息量;
计算模块,用于通过分区动态特征融合网络中的置信度神经网络模块对每个分区的区内特征信息量进行置信度计算,得到每个分区的置信度,并将所有分区的置信度进行拼接并标准化,得到每个分区的区间特征信息量;
融合模块,用于分别针对每个分区,通过Sigmoid激活函数对每个分区的区间特征信息量进行缩放,得到缩放后的区间特征信息量,并将缩放后的区间特征信息量进行拼接,得到总区间特征信息量,将总区间特征信息量乘以分区数,得到第一总特征量,并通过第一总特征量对每个分区的区内特征信息量进行动态融合,得到每个分区的心电数据特征融合结果,并根据每个分区的心电数据特征融合结果确定每个分区的目标风险评估等级。
进一步来说,根据12导联对心电特征图进行分区,包括:
基于12导联对应的观测位将心电特征图进行分区,得到前壁区的心电特征图、侧壁区的心电特征图、下壁区的心电特征图。
进一步来说,通道注意力模块包括:
依次连接的二维卷积层、二维残差块、一维残差块以及全局平均池化层。
进一步来说,分区动态特征融合网络的训练过程包括:
分别针对每个分区,通过分区分类器将每个分区的区内特征信息量进行分类,得到每个分区的预测分布;
通过Sigmoid激活函数对每个分区的预测分布进行缩放,得到缩放后的预测分布,并将缩放后的预测分布进行拼接,得到总预测分布;
通过最大似然估计方法对分区分类器进行训练,获取分区损失值;
分别针对每个分区,通过置信度神经网络模块将每个分区的区内特征信息量进行置信度计算,得到每个分区的置信度,并将所有分区的置信度进行拼接并标准化,得到每个分区的区间特征信息量;
通过均方误差损失对置信度神经网络模块进行训练,得到置信度损失值;
通过Sigmoid激活函数对每个分区的区间特征信息量进行缩放,得到缩放后的区间特征信息量;
将缩放后的区间特征信息量进行拼接,得到总区间特征信息量;
将总区间特征信息量乘以分区数,得到第一总特征量;
将总预测分布乘以分区数,得到第二总特征量;
将第一总特征量和第二总特征量进行计算,得到欧式距离,并通过欧式距离对分类器进行训练,得到分类损失值;
利用分区损失值、置信度损失值和分类损失值对分区动态特征融合网络进行优化,得到训练后的分区动态特征融合网络。
进一步来说,分区损失值用于最小预测分布和真实分布之间的极限散度,分区损失值Larea的表达式为:
其中,A表示分区数,a表示第a个分区,yk表示标签y中的第k个标签,表示第a个分区中第k个标签的预测分布。
进一步来说,置信度损失值Lconf的表达式为:
其中,TCPa表示第a个分区的预测分布中真实标签的最大概率,表示第a个分区的区间特征信息量。
进一步来说,分类损失值Lf的表达式为:
其中,pk表示第k个标签的预测分布。
本发明的上述方案有如下的有益效果:
本发明包括用于采集目标患者的心电数据的采集模块;用于通过分区动态特征融合网络中的通道注意力模块分别对心电数据进行特征提取,得到心电特征图,并根据12导联对心电特征图进行分区,将位于同一分区内的心电特征图进行拼接,得到每个分区的心电特征图的提取模块;用于分别针对每个分区的心电特征图,通过分区动态特征融合网络中的特征编码器对每个分区的心电特征图进行筛选,得到每个分区的区内特征信息量的筛选模块;用于通过分区动态特征融合网络中的置信度神经网络模块对每个分区的区内特征信息量进行置信度计算,得到每个分区的置信度,并将所有分区的置信度进行拼接并标准化,得到每个分区的区间特征信息量的计算模块;用于分别针对每个分区,通过Sigmoid激活函数对每个分区的区间特征信息量进行缩放,得到缩放后的区间特征信息量,并将缩放后的区间特征信息量进行拼接,得到总区间特征信息量,将总区间特征信息量乘以分区数,得到第一总特征量,并通过第一总特征量对每个分区的区内特征信息量进行动态融合,得到每个分区的心电数据特征融合结果,并根据每个分区的心电数据特征融合结果确定每个分区的目标风险评估等级的融合模块;与现有技术相比,本发明以目标风险评估等级作为参考指标,通过无创的方式准确高效地评估心脏风险情况。
本发明的其它有益效果将在随后的具体实施方式部分予以详细说明。
附图说明
图1本发明实施例的原理框图;
图2为为本发明实施例中分区动态特征融合网络的框架图;
图3为本发明实施例中的心脏分区示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是锁定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
本发明针对现有的问题,提供了一种基于动态特征融合的心电数据分析系统。
如图1、2所示,本发明的实施例提供了一种基于动态特征融合的心电数据分析系统,包括:
采集模块,用于采集目标患者的心电数据;
提取模块,用于通过分区动态特征融合网络中的通道注意力模块分别对心电数据进行特征提取,得到心电特征图,并根据12导联对心电特征图进行分区,将位于同一分区内的心电特征图进行拼接,得到每个分区的心电特征图;
筛选模块,用于分别针对每个分区的心电特征图,通过分区动态特征融合网络中的特征编码器对每个分区的心电特征图进行筛选,得到每个分区的区内特征信息量;
计算模块,用于通过分区动态特征融合网络中的置信度神经网络模块对每个分区的区内特征信息量进行置信度计算,得到每个分区的置信度,并将所有分区的置信度进行拼接并标准化,得到每个分区的区间特征信息量;
融合模块,用于分别针对每个分区,通过Sigmoid激活函数对每个分区的区间特征信息量进行缩放,得到缩放后的区间特征信息量,并将缩放后的区间特征信息量进行拼接,得到总区间特征信息量,将总区间特征信息量乘以分区数,得到第一总特征量,并通过第一总特征量对每个分区的区内特征信息量进行动态融合,得到每个分区的心电数据特征融合结果,并根据每个分区的心电数据特征融合结果确定每个分区的目标风险评估等级。
具体来说,在本发明实施例中,目标风险评估等级用于但不限用于判断目标患者的心脏健康状况,在用于判断目标患者的心脏健康状况的情况下,当目标风险评估等级越高时,则表示目标患者在目标风险评估等级越高的位置发生心肌梗塞的概率越大。
具体来说,采集模块用于利用12导联采集目标患者的心电数据,并以预设长度为心拍长度对心电数据进行预处理,预处理包括心拍切割。
具体来说,根据12导联对心电特征图进行分区,包括:
基于12导联对应的观测位将预处理后的心电数据提取的心电特征图进行分区,得到前壁区的心电特征图、侧壁区的心电特征图、下壁区的心电特征图。
在本发明实施例中,采用PTB数据集对发明所提供的分区动态特征融合网络进行训练;首先将PTB数据集进行重新采样到500Hz,然后将重新采样的心电数据分成一些固定长度的心拍,小于该长度的心拍则被丢弃,每个心拍之间没有重叠,由于一个完整的心电波形的持续时间约为0.6秒,为了确保每个心拍包含至少一个完整的心电波形,将每个心拍的固定长度设置为1.2秒约为600个采样点。而对于PTB-XL数据集,直接选择了其500Hz的采样频率版本,以保持与PTB数据集的一致性,同时,考虑到PTB-XL数据集中的每条记录可能包含多个注释,不对其进行分割处理,以确保多标签信息的完整性,基于以上的预处理操作,分别获得以心拍为基本单元的单标记数据集和以心电记录为基本单元的多标签数据集,将单标记数据集和多标签数据集输入待训练的分区动态特征融合网络。
需要说明的是,PTB数据集一共包含549例12导联心电数据,分别来自52位健康受试者和148位心梗患者的368例心电数据,常用于训练和评估不同的心梗检测和心梗定位。其中每个心电数据都包括12个标准导联和3个Frank导联(VX、VY、VZ),在100Hz采样频率下采样。此外,PTB数据集中的心电数据都是由心脏病专家注释的,一个受试者可以提供一个及以上的心电数据,但每个数据只有一个标签,同时PTB数据集中大多数的心电图记录持续时间大约为2分钟,最少的持续30秒;PTBXL数据集是于2020年4月发布的大型公开心电数据集,它有18885名受试者,提供约21837条心电数据,其中有5486条心梗数据和9528条健康数据,与PTB数据集类似,PTBXL数据集中的每条心电数据也都包含12个标准导联,但是每条心电数据都有100Hz和500Hz两个采样频率的版本,同时PTBXL数据集中的每个受试者也都提供了一条以上有注释的心电数据,但与PTB数据集不同,PTBXL数据集中大多数的记录都含有多个注释,并且每条ECG记录的持续时间都为10秒。
在心电特征融合阶段,本发明实施例首先进行了心电数据的特征提取,由于在本发明实施例之前的研究中用于心电特征提取的通道注意力分支的有效性在PTB以及PTB-XL数据集上得到了充分证明,因此本发明实施例所提供的分区动态特征融合网络延用通道注意力机制来提取每个分区内心电数据的重要特征。
如图3所示,本发明实施例应用于心肌梗塞定位并根据心肌梗塞在不同心脏分区发作会引起心电图上不同导联组合异常的先验知识,因此,基于12导联对应的观测位将心电特征图进行分区,得到前壁区的心电特征图、侧壁区的心电特征图、下壁区的心电特征图,前壁区涉及到导联V1~V4,侧壁区涉及到导联I、aVL、V5、V6;下壁区涉及到导联II、III、aVF,并且为了保持特征数据维度的统一,本发明实施例在下壁区还额外添加了导联aVR;而由于后壁区及右心室涉及到的导联V7~V9以及V3R~V5R不被包含在标准12导联内,不对其进行讨论。
基于以上分区以及通道注意力分支提取出的心电特征,通道注意力模块包括:依次连接的二维卷积层、二维残差块、一维残差块以及全局平均池化层;将处于同一分区内的心电特征拼接在一起,以达到早期心电特征融合的目的,从而得到了各个分区的心电特征图。
在本发明实施例中,为了有效区分分区内特征的重要特征和冗余特征并对各个分区特征间的重要性进行评估提出了分区内特征信息量(Intra-partitioned featureinformation,IAPFI)和分区间特征信息量(Inter-partitioned feature information,IRPFI)两个概念。
具体来说,分区动态特征融合网络的训练过程包括:
分别针对每个分区,通过分区分类器将每个分区的区内特征信息量进行分类,得到每个分区的预测分布;
通过Sigmoid激活函数对每个分区的预测分布进行缩放,得到缩放后的预测分布,并将缩放后的预测分布进行拼接,得到总预测分布;
通过最大似然估计方法对分区分类器进行训练,获取分区损失值;
分别针对每个分区,通过置信度神经网络模块将每个分区的区内特征信息量进行置信度计算,得到每个分区的置信度,并将所有分区的置信度进行拼接并标准化,得到每个分区的区间特征信息量;
通过均方误差损失对置信度神经网络模块进行训练,得到置信度损失值;
通过Sigmoid激活函数对每个分区的区间特征信息量进行缩放,得到缩放后的区间特征信息量;
将缩放后的区间特征信息量进行拼接,得到总区间特征信息量;
将总区间特征信息量乘以分区数,得到第一总特征量;
将总预测分布乘以分区数,得到第二总特征量;
将第一总特征量和第二总特征量进行计算,得到欧式距离,并通过欧式距离对分类器进行训练,得到分类损失值;
利用分区损失值、置信度损失值和分类损失值对分区动态特征融合网络进行优化,得到训练后的分区动态特征融合网络。
在本发明实施例中,每个分区的分区特征具有对应的分区内特征信息量,该信息量对分区特征内的所有特征点进行重要性评估并且随着网络的不断优化该信息量也不断被更新,与分区内特征信息量不同,分区间特征信息量是从全局的角度对各个分区重要性判断,每个分区特征具有一个分区内特征信息量用以赋予当前分区一个权重,该权重使得每个分区特征在最终融合时展现出不同的重要程度。
在本发明实施例中分区内特征信息量在融合的过程中,不同样本的不同分区内特征信息量是动态变化的,因此,分区动态特征融合网络通过分区特征编码器来筛选不同分区导联组合内的信息特征,保留重要特征抑制冗余特征,从而获得有效的区内特征信息量,在本发明实施例中,分区特征编码器是一个全连接层,其输入端与通道注意力模块中的全局平局池化层的输出端连接,其输出端与置信度神经网络模块的输入端、置信度神经网络模块的输出端连接,且在本发明实施例中,置信度神经网络模块采用常规的用于计算置信度的神经网络。
为了识别有效的区内特征信息量,通过不同分区分配对应的分区特征编码器:Ea:xa→ha,以达到获取分区特征信息量的目的,其中,ha表示区内特征信息量,此外,为了获得更直观的区内特征信息量,本发明实施例还采用了Sigmoid激活函数对区内特征信息量进行缩放,缩放的表达式为:
其中,σ为Sigmoid激活函数,Ea表示分区特征编码器,xa表示心电数据,表示第a个分区中的第da个区内特征信息量,至此,该分区特征编码器达到了对不同样本的区内特征信息量进行建模的目的。
在本发明实施例中,区间特征信息量除了不同样本的不同分区内特征信息量是动态变化的,不同样本的不同分区能提供的信息量也不是始终保持一致的,所以考虑不同分区间信息量的质量变化对最终的融合是至关重要的。因此,分区动态特征融合网络采用了真实分类概率(True class probability,TCP)来量化不同分区特征表示的分类置信度,并将其用于衡量不同分区能够提供的信息量。当一个分区的特征分类置信度较低时,表示它对目标风险评估等级并不确定,相对应分区特征能够为最终的融合提供有效信息量也就相对较少,反之亦然。
因此,为了获得不同分区的分类置信度,分区动态特征融合网络为三个分区分别提供三个对应的分区分类器:fa:分区分类器也是一个全连接层,该全连接层的输入端与全局平均池化层的输出端连接,对于分区a,分区分类器fa可以看作是一个概率模型,它将观测值xa转换成预测分布/>其中,K表示类别数,并且分区动态特征融合网络使用最大似然估计对该概率模型进行训练,通过最小化预测分布和真实分布之间的极限散度达到对分区分类器进行调优的目的,该分区损失值Larea可以写为:
其中,A表示分区数,a表示第a个分区,yk表示标签y中的第k个标签,表示第a个分区中第k个标签的预测分布,该表达式也被称为交叉熵损失函数。
之后,本发明实施例采用TCP选出预测分布中的真实标签最大概率,作为分区预测测试样本时所能贡献的置信度。对于正确分类的样本,TCP作为最大的Softmax输出能够较好地反映当前分区的分类置信度并且在错误预测时以一个较低的预测值反映模型可能做出了错误的预测。本发明实施例采用的TCP使用与真实标签对应的最大的Softmax输出概率作为置信度,形式上,低于分区a,给定预测分布和相应的标签y,预测分布中真实标签的最大概率TCPa可以写为:
接着,本发明实施例通过在分区动态特征融合网络中引入置信度神经网络模块ga:来近似预测分布中真实标签的最大概率TCPa。
由于TCPa∈(0,1),分区动态特征融合网络在置信度神经网络模块之后采用Sigmoid激活函数,并通过均方误差损失(Mean square error,MSE)来训练置信度神经网络模块ga,该置信度损失值Lconf的表达式为:
其中,TCPa表示第a个分区的预测分布中真实标签的最大概率,表示第a个分区的区间特征信息量,区间特征信息量也可以作为分区的特征权重,/>总的来说,分区动态特征融合网络基于分区分类器和置信度神经网络模块达到逼近区内特征信息量的目的。
本发明实施例对于动态特征融合,每个分区内融合后的心电特征通过上述处理后,可以分别得到分区内动态特征信息量ha和分区间动态特征信息量因此,考虑到分区内的特征质量分布不均,给定一个特征向量/>可以通过分区特征编码器得到区内特征信息量ha,基于此,本发明实施例采用门控策略融合区内特征信息量使得重要特征被保留并抑制冗余特征,其中,⊙表示元素级乘法。
其次,考虑到分类中不同分区的特征质量好坏不一,可以通过分区分类器fa和置信度神经网络模块ga来横梁分类置信度,为了充分利用每个分区分类器fa的信息,在形式上,可以用得到每个分区的预测分布,同时,可以用/>来获取于不同分区的区间特征信息量。
为了分区权重波动范围不稳定,整体权重过大或过小,导致分区信息差异过大影响网络的分类性能,本发明实施例通过sigmoid激活函数对区间特征信息量进行缩放,以获得更直观的特征表示向量/>然后凭借所有分区的区间特征信息量并将其通过softmax激活函数以实现整体分区区间特征信息量/>的缩放,最终,将其乘以分区数以保持区间特征信息量/>之和不变:
其中,τ表示softmax激活函数,[…]表示连接算子;同理,TCPa也可以使用同样的方式进行缩放并乘以分区数得到基于该操作,置信度损失值Lconf被更新为:
总的来说,在分区动态特征融合网络的融合模块中采用一种权重分配策略对每个分区的区内特征信息量进行动态融合:
其中,m表示每个分区的心电数据特征融合结果;
其中,融合模块包括叉乘层和拼接层,叉乘层的输入端用于将输入的每个分区的总特征量进行特征图与向量进行叉乘操作,叉乘层的输出端与拼接层的输入端连接,拼接层的输出端输入目标风险评估等级,并用交叉熵损失Lf训练额外的分类器f:m→y,其中分类损失所以分区动态特征融合网络的整体损失函数可以写为:
其中,α、β、γ用于平衡不同损失的超参数,最终本发明实施例通过优化联合损失L得到训练后的分区动态特征融合网络,需要说明的是,本发明实施例中所采用的分类器均为本领域的常规分类器。
本发明实施例为了全面验证所提供的系统的有效性,将本发明实施例所提供的系统与现有的其他方法进行性能比较,如下:
现有的多特征分支卷积双向递归神经网络(Multiple-feature-branchconvolutional bidirectional recurrent neural network,MFB-CBRNN)采用了基于12导联心电图的多导联心梗检测框架,充分利用12条导联中所包含的心电图波形信息,该方法采用12个多特征分值提取每个导联内部的特征,其中每个分支主要由卷积块组成,为了更有效的特征融合,还是用来双向长短期记忆网络来集成每个导联分支输出的所有特征。
现有的机器学习-残差网络ML-ResNet也采用了多导联分值框架进行心梗的检测和定位,但在设计多特征分支时使用了基于残差的网络结构,该框架中的每个特征分支只要是由三个堆叠的残差块组成,而每个残差块包括三个卷积层和一个残差连接,因此,该网络可以分层学习导联内的特征表示并进行特征融合。
现有的机器学习网络模型ML-Net是一种新的基于多导联框架的通道分支网络,其分支结构被设计为三个并行的卷积网络,利用设置不同的卷积核大小来集成导联内的多尺度特征,与上述两种方法不同的是,ML-Net至使用了12导联心电图中的4个导联的数据来达到适应便携式设备的轻量级需求的目的。
CANet是一种基于多导联框架的通道注意力网络,它通过二维和一维的残差块来提取早期的重要特征和更细粒度的特征,同时,他使用了SE模块和残差连接来进行特征加权并防止有效信息的丢失,而MCA-Net是一个多任务通道注意力网络,他在CANet的基础上通过引入多任务框架充分利用了不用任务间的相关性和互补性,在学习过程种能够获取到更多的信息。
由于这些方法所使用的数据和数据处理手段可能存在差异,本发明实施例为了在模型的分类性能上进行公平的比较统一了所有模型的数据输入并且修改了相应的分类层。
本发明实施例在PTB数据集和PTB-XL数据集上开展了在患者间范式下的对比实验,由于PTB数据集中包含的患者数量较少,本发明实施例采用了5折交叉验证的形式进行相关实验。而PTB-XL数据集的发布者对数据集进行了10折的划分,因此本发明实施例采用了10折交叉验证的形式进行相关实验。本发明实施例将本发明实施例所提供的分区动态特征融合网络和其他四中现有的心梗诊断方法进行性能差异比对,本发明实施例所提供的模型与其他方法在PTB数据集上的性能对比结果如下表1所示,本发明实施例所提供的模型与其他方法在PTBXL数据集上的性能对比结果如下表2所示:
表1
模型 | 灵敏度Sen | 特异性Spe | 准确性Acc |
ML-Net | 33.09±0.04 | 38.04±0.04 | 38.17±0.04 |
MFB-CBRNN | 32.68±0.10 | 37.97±0.09 | 38.10±0.09 |
ML-ResNet | 32.89±0.11 | 40.64±0.10 | 40.85±0.10 |
CANet | 35.18±0.08 | 42.69±0.07 | 42.89±0.07 |
MCA-Net | 35.81±0.12 | 43.04±0.26 | 43.22±0.26 |
本发明 | 36.74±0.11 | 44.78±0.13 | 44.98±0.13 |
表2
通过表1和表2可以看到,本发明实施例所提供的模型的分类性能在两个数据集中都是最高的,这充分证明了本发明实施例所提供的模型在心肌梗塞定位上的先进性;在PTB数据集上,本发明实施例所提供的模型取得了36.74%的灵敏度、44.78%的特异性和44.98%的准确率。在PTB-XL数据集上,本发明实施例所提供的模型取得了80.63%的准确率和73.14%的AUROC;还可以观察到,ML-Net在定位任务中表现相对较差,尤其是在PTB-XL数据集上的表现与其他方法之间存在较大的差距,这表明ML-Net无法较好地学习到心肌梗塞定位任务中的关键信息,并且在捕获较长的心电序列特征的能力上仍有待提高。
本发明还能从表2中看到,ML-ResNet、CANet和MCA-Net的表现相对良好,但与本发明实施例所提供的模型还有一定差距。
具体来说,在Acc上相差大约1~3个百分点主要是因为本发明实施例所提供的模型考虑到了不同样本的特异性导致的不同分区内特征分布的差异以及不同分区所能够提供的有效信息量的差距,使得本发明实施例所提供的模型能够更加侧重于重要特征并忽略冗余特征。而在表2中,MFB-CBRNN和ML-ResNet展现出了较好的特征学习能力,从而达到区分不同位置MI的目的。这主要是由于PTB-XL数据集提供的更长的ECG序列能够给模型提供更多的有效信息,侧面印证基于12导联ECG进行心肌梗塞定位的可靠性。此外,还可以观察到CANet、MCA-Net和本发明实施例所提供的模型在PTB-XL数据集上都取得了较优的分类性能,其中本发明实施例所提供的模型在准确率和AUROC上较CANet、MCA-Net提升了大约1个百分点。相较于PTB数据集上的对比实验,本发明实施例所提供的模型在PTB-XL数据集上的提升幅度稍小,这可能是因为本发明实施例所提供的模型在为不同分区特征分配权重时采用的TCP是多标签中的概率最大的标签,当多个标签对不同分区的权重侧重存在矛盾时可能就会影响到最终权重的分配,从而限制了模型的分类性能。
此外,本发明还通过0.05显著性水平下的T-test显著性检验验证了本发明所提供的模型的优越性,如表3所示:
表3
其中,表中加*的部分代表该对比方法与PDF2-Net在该评估指标上具有显著的性能差异;可以从表3种看到PDF2-Net在PTB-XL数据集上表现出了显著的性能优势。
本发明实施例包括用于采集目标患者的心电数据的采集模块;用于通过分区动态特征融合网络中的通道注意力模块分别对心电数据进行特征提取,得到心电特征图,并根据12导联对心电特征图进行分区,将位于同一分区内的心电特征图进行拼接,得到每个分区的心电特征图的提取模块;用于分别针对每个分区的心电特征图,通过分区动态特征融合网络中的特征编码器对每个分区的心电特征图进行筛选,得到每个分区的区内特征信息量的筛选模块;用于通过分区动态特征融合网络中的置信度神经网络模块对每个分区的区内特征信息量进行置信度计算,得到每个分区的置信度,并将所有分区的置信度进行拼接并标准化,得到每个分区的区间特征信息量的计算模块;用于分别针对每个分区,通过Sigmoid激活函数对每个分区的区间特征信息量进行缩放,得到缩放后的区间特征信息量,并将缩放后的区间特征信息量进行拼接,得到总区间特征信息量,将总区间特征信息量乘以分区数,得到第一总特征量,并通过第一总特征量对每个分区的区内特征信息量进行动态融合,得到每个分区的心电数据特征融合结果,并根据每个分区的心电数据特征融合结果确定每个分区的目标风险评估等级的融合模块;与现有技术相比,本发明以目标风险评估等级作为参考指标,通过无创的方式准确高效地评估心脏风险情况。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (7)
1.一种基于动态特征融合的心电数据分析系统,其特征在于,包括:
采集模块,用于采集目标患者的心电数据;
提取模块,用于通过所述分区动态特征融合网络中的通道注意力模块分别对所述心电数据进行特征提取,得到心电特征图,并根据12导联对所述心电特征图进行分区,将位于同一分区内的心电特征图进行拼接,得到每个所述分区的心电特征图;
筛选模块,用于分别针对每个所述分区的心电特征图,通过所述分区动态特征融合网络中的特征编码器对每个所述分区的心电特征图进行筛选,得到每个所述分区的区内特征信息量;
计算模块,用于通过所述分区动态特征融合网络中的置信度神经网络模块对每个所述分区的区内特征信息量进行置信度计算,得到每个所述分区的置信度,并将所有分区的置信度进行拼接并标准化,得到每个所述分区的区间特征信息量;
融合模块,用于分别针对每个所述分区,通过Sigmoid激活函数对每个分区的区间特征信息量进行缩放,得到缩放后的区间特征信息量,并将缩放后的区间特征信息量进行拼接,得到总区间特征信息量,将所述总区间特征信息量乘以分区数,得到第一总特征量,并在所述分区动态特征融合网络中的融合模块中利用所述第一总特征量对每个所述分区的区内特征信息量进行动态融合,得到每个所述分区的心电数据特征融合结果,并根据每个所述分区的心电数据特征融合结果确定每个分区的目标风险评估等级。
2.根据权利要求1所述的基于动态特征融合的心电数据分析系统,其特征在于,所述根据12导联对所述心电特征图进行分区,包括:
基于12导联对应的观测位将所述心电特征图进行分区,得到前壁区的心电特征图、侧壁区的心电特征图、下壁区的心电特征图。
3.根据权利要求2所述的基于动态特征融合的心电数据分析系统,其特征在于,所述通道注意力模块包括:
依次连接的二维卷积层、二维残差块、一维残差块以及全局平均池化层。
4.根据权利要求3所述的基于动态特征融合的心电数据分析系统,其特征在于,所述分区动态特征融合网络的训练过程包括:
分别针对每个所述分区,通过分区分类器将每个所述分区的区内特征信息量进行分类,得到每个所述分区的预测分布;
通过Sigmoid激活函数对每个所述分区的预测分布进行缩放,得到缩放后的预测分布,并将缩放后的预测分布进行拼接,得到总预测分布;
通过最大似然估计方法对所述分区分类器进行训练,获取分区损失值;
分别针对每个所述分区,通过置信度神经网络模块将每个所述分区的区内特征信息量进行置信度计算,得到每个所述分区的置信度,并将所有分区的置信度进行拼接并标准化,得到每个所述分区的区间特征信息量;
通过均方误差损失对所述置信度神经网络模块进行训练,得到置信度损失值;
通过Sigmoid激活函数对每个所述分区的区间特征信息量进行缩放,得到缩放后的区间特征信息量;
将缩放后的区间特征信息量进行拼接,得到总区间特征信息量;
将所述总区间特征信息量乘以分区数,得到第一总特征量;
将所述总预测分布乘以分区数,得到第二总特征量;
将所述第一总特征量和第二总特征量进行计算,得到欧式距离,并通过所述欧式距离对分类器进行训练,得到分类损失值;
利用所述分区损失值、所述置信度损失值和所述分类损失值对所述分区动态特征融合网络进行优化,得到训练后的分区动态特征融合网络。
5.根据权利要求4所述的基于动态特征融合的心电数据分析系统,其特征在于,所述分区损失值用于最小预测分布和真实分布之间的极限散度,所述分区损失值Larea的表达式为:
其中,A表示分区数,a表示第a个分区,yk表示标签y中的第k个标签,表示第a个分区中第k个标签的预测分布。
6.根据权利要求4所述的基于动态特征融合的心电数据分析系统,其特征在于,所述置信度损失值Lconf的表达式为:
其中,TCPa表示第a个分区的预测分布中真实标签的最大概率,表示第a个分区的区间特征信息量。
7.根据权利要求4所述的基于动态特征融合的心电数据分析系统,其特征在于,所述分类损失值Lf的表达式为:
其中,pk表示第k个标签的预测分布。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311645522.2A CN117679041A (zh) | 2023-12-04 | 2023-12-04 | 基于动态特征融合的心电数据分析系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311645522.2A CN117679041A (zh) | 2023-12-04 | 2023-12-04 | 基于动态特征融合的心电数据分析系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117679041A true CN117679041A (zh) | 2024-03-12 |
Family
ID=90138262
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311645522.2A Pending CN117679041A (zh) | 2023-12-04 | 2023-12-04 | 基于动态特征融合的心电数据分析系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117679041A (zh) |
-
2023
- 2023-12-04 CN CN202311645522.2A patent/CN117679041A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lyon et al. | Computational techniques for ECG analysis and interpretation in light of their contribution to medical advances | |
CN100481096C (zh) | 心脏成像的自动区域心肌评定的方法 | |
US20100217144A1 (en) | Diagnostic and predictive system and methodology using multiple parameter electrocardiography superscores | |
JP2007527743A (ja) | 心臓関連の病気及び状態のための自動診断及び意思決定支援用システム及び方法 | |
WO2009100133A1 (en) | System, method and computer program product for detection of changes in health status and risk of imminent illness | |
Thakkar et al. | Towards automatic and fast annotation of seismocardiogram signals using machine learning | |
Bergquist et al. | Body surface potential mapping: contemporary applications and future perspectives | |
Feng et al. | Unsupervised semantic-aware adaptive feature fusion network for arrhythmia detection | |
Fang et al. | A visually interpretable detection method combines 3-D ECG with a multi-VGG neural network for myocardial infarction identification | |
Seetharam et al. | Cardiovascular imaging and intervention through the lens of artificial intelligence | |
CN115281688A (zh) | 一种基于多模态深度学习的心脏肥大多标签检测系统 | |
Tong et al. | Locating abnormal heartbeats in ECG segments based on deep weakly supervised learning | |
Daydulo et al. | Cardiac arrhythmia detection using deep learning approach and time frequency representation of ECG signals | |
CN111329467A (zh) | 一种基于人工智能的心脏疾病辅助检测方法 | |
Aranda et al. | Performance of Dower's inverse transform and Frank lead system for identification of myocardial infarction | |
Gillette et al. | Medalcare-xl: 16,900 healthy and pathological 12 lead ecgs obtained through electrophysiological simulations | |
Tung et al. | Multi-lead ECG classification via an information-based attention convolutional neural network | |
CN116226724A (zh) | 一种非侵入式冠心病检测系统 | |
CN117679041A (zh) | 基于动态特征融合的心电数据分析系统 | |
CN112842355B (zh) | 基于深度学习目标检测的心电信号心搏检测识别方法 | |
Gopalakrishnan et al. | A Novel Deep Learning-Based Heart Disease Prediction System Using Convolutional Neural Networks (CNN) Algorithm | |
CN113449757A (zh) | 心衰诊断模型的构建方法、构建系统和心衰诊断装置 | |
Vondrak et al. | Detection of myocardial infarction using analysis of vectorcardiographic loops | |
Jayasinghe | A Real-Time Framework for Arrhythmia Classification | |
Yu et al. | Spa-Tem MI: A Spatial-Temporal Network for Detecting and Locating Myocardial Infarction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |