CN117547283B - 心电信号数据分类方法、装置、计算机设备及介质 - Google Patents
心电信号数据分类方法、装置、计算机设备及介质 Download PDFInfo
- Publication number
- CN117547283B CN117547283B CN202410042200.7A CN202410042200A CN117547283B CN 117547283 B CN117547283 B CN 117547283B CN 202410042200 A CN202410042200 A CN 202410042200A CN 117547283 B CN117547283 B CN 117547283B
- Authority
- CN
- China
- Prior art keywords
- data
- feature
- waves
- matrix
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000000605 extraction Methods 0.000 claims abstract description 46
- 230000004927 fusion Effects 0.000 claims abstract description 33
- 239000011159 matrix material Substances 0.000 claims description 42
- 238000000718 qrs complex Methods 0.000 claims description 25
- 230000009467 reduction Effects 0.000 claims description 23
- 239000013598 vector Substances 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000010606 normalization Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 13
- 239000012634 fragment Substances 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 230000003321 amplification Effects 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 7
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 4
- 238000013075 data extraction Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 description 16
- 238000003745 diagnosis Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 5
- 238000012706 support-vector machine Methods 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 206010003119 arrhythmia Diseases 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000002565 electrocardiography Methods 0.000 description 4
- 230000006793 arrhythmia Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000001605 fetal effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000002861 ventricular Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 206010006582 Bundle branch block right Diseases 0.000 description 2
- 206010006578 Bundle-Branch Block Diseases 0.000 description 2
- 208000024172 Cardiovascular disease Diseases 0.000 description 2
- 206010015856 Extrasystoles Diseases 0.000 description 2
- 208000000418 Premature Cardiac Complexes Diseases 0.000 description 2
- 208000004301 Sinus Arrhythmia Diseases 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 208000031225 myocardial ischemia Diseases 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 201000007916 right bundle branch block Diseases 0.000 description 2
- 206010002383 Angina Pectoris Diseases 0.000 description 1
- 206010003658 Atrial Fibrillation Diseases 0.000 description 1
- 101100517651 Caenorhabditis elegans num-1 gene Proteins 0.000 description 1
- 208000007177 Left Ventricular Hypertrophy Diseases 0.000 description 1
- 208000007888 Sinus Tachycardia Diseases 0.000 description 1
- 206010040741 Sinus bradycardia Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001746 atrial effect Effects 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000005802 health problem Effects 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 238000012880 independent component analysis Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000011430 maximum method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 208000010125 myocardial infarction Diseases 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
- A61B5/318—Heart-related electrical modalities, e.g. electrocardiography [ECG]
- A61B5/346—Analysis of electrocardiograms
- A61B5/349—Detecting specific parameters of the electrocardiograph cycle
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
- A61B5/318—Heart-related electrical modalities, e.g. electrocardiography [ECG]
- A61B5/346—Analysis of electrocardiograms
- A61B5/349—Detecting specific parameters of the electrocardiograph cycle
- A61B5/366—Detecting abnormal QRS complex, e.g. widening
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
- A61B5/7267—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Cardiology (AREA)
- General Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Animal Behavior & Ethology (AREA)
- Heart & Thoracic Surgery (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Veterinary Medicine (AREA)
- Computational Linguistics (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Surgery (AREA)
- Medical Informatics (AREA)
- Fuzzy Systems (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Signal Processing (AREA)
- Psychiatry (AREA)
- Physiology (AREA)
Abstract
本发明公开了一种心电信号数据分类方法、装置、计算机设备及介质,包括:获取心电信号数据,对心电信号数据进行显性特征提取,得到第一特征,第一特征包括R波、Q波、S波、P波、T波的波形时限和高度,基于外部注意力的方式,进行深度特征提取,得到第二特征;对第一特征和第二特征进行特征融合,得到融合特征;根据融合特征进行分类,得到分类结果。实现隐式的不同样本之间的关联特征与同一类别的QRS波形特征进行融合,进而进行分类识别,提高心电信号数据分类的准确性。
Description
技术领域
本发明涉及数据处理领域,尤其涉及一种心电信号数据分类方法、装置、计算机设备及介质。
背景技术
心电图检查是目前诊断心血管疾病最简单有效的方法,具有无创、快速、廉价等优点,因此在临床上得到广泛使用。心电图机通过在人体表面安放电极,采样心脏电信号的变化,并将这种信号放大,按心脏激动的时间顺序记录并绘制下来,医生通过分析机器绘制出的波形,得出相应的诊断。传统的人工心电诊断方式,其准确率极大依赖于医生的职业素养与技能水平,因此,研究一种基于人工智能的常见心电图自动分类方法,具有重要的意义。
现有方式中,一般利用离散小波变换、线性预测模型等方法提取在人工诊断中需要参考的特征,如PR间期、PP间期、RR间期、波峰点等等,之后通过支持向量机(Supportvector machine,SVM)或随机森林(Random forest,RF)等分类器对心电信号进行分类。Mohamed Hammad模拟了ECG信号的特性,并根据这些特性采用13个神经网络(NN)分类器、99个支持向量机(SVM)分类器和K-最近邻(KNN)分类器对心电信号进行分类,在正常异常二分类任务中具有优良的性能。樊明辉(2022)等利用基于窗口最值的自适应阈值法,提出了QRS波群检测算法,对心电图中R波形态进行检测,在完成R波检测的基础上,采用最值法并通过斜率限定搜寻Q波和S波,为之后利用相关成果进行诊断提供了基础。尽管这些方法的研究取得了一些成果,但是由于心电信号在人工采集的过程中,受到采集环境和采集设备的影响,不可避免地会存在噪声,由于传统算法的对特征学习的能力有限,即使采用了一些降噪手段,例如小波变换、加权全变分方法(WTV)等,部分噪声仍可能对算法结果有较大的干扰。此外心电信号具有相当的复杂性,其常用诊断结果超过20个,完整的诊断结果超过50个,但传统算法的相关研究大多进行的是单标签2分类评估,或少于5个标签的多标签评估,难以满足实践的需要。并且由于心电特征的选择和提取都是人为进行,相关设计者的专业水平和经验对结果有着比较大的影响,同时面对较为庞大的数据集会消耗大量的时间和精力。
现有方式中,还有一些通过深度学习(Deep Learning,DL)来进行心电信号数据的分类,深度学习是机器学习(Machine Learning,ML)的一个分支,通常使用层数较多的神经网络来学习复杂样本的规律和特征,与传统方法相比,深度学习方法对图像、文本、声音等数据拥有更大强大的表达能力和提取能力。Junxian Cai、Weiwei Sun、Jianfeng Guan等2020年在《IEEE Access》上发表的文章“Multi-ECGNet for ECG Arrythmia Multi-LabelClassification”中提出了一种名为Multi-ECGNet的算法模型,针对55类心脏病症状进行了检测,针对数据集中存在的错误和噪声问题,提出了相应的损失函数解决方案和改进策略,模型的F1分数达到了86.3%;杨小童(2022)等在利用卷积神经网络提取特征的同时,将标签存在的相关关系构建了多标签相关性矩阵,二者共同参与sigmod分类,有效地提高了复杂心电信号的多标签预测的准确率;杨玉瑶(2023)等针对胎儿心电信号,将改进的快速独立成分分析(FastICA)法和奇异值分解(SVD)算法结合,运用一种新的卷积神经网络(CNN)模型识别胎儿心电信号QRS复合波,实现胎儿心电信号的高质量提取与胎儿QRS复合波的智能识别。上述研究虽然相比于传统方法取得了很大的进展,但是使用的数据库较为单一,大部分研究都使用了MIT-BIH心律失常数据库。虽然这个数据库的准确性高,但样本数量较少,同时样本均经过专家挑选,心律失常的各个表现波形较为标准,包含的噪声较少,不能完全反应真实带有较多噪声的临床数据分布。因此还需进一步提高分类的准确率,并且使用其他数据库来增强模型的泛化能力。
发明内容
本发明实施例提供一种心电信号数据分类方法、装置、计算机设备和存储介质,以提高心电信号数据分类的准确性。
为了解决上述技术问题,本申请实施例提供一种心电信号数据分类方法,所述心电信号数据分类方法包括:
获取心电信号数据;
对所述心电信号数据进行显性特征提取,得到第一特征,所述第一特征包括R波、Q波、S波、P波、T波的波形时限和高度;
基于外部注意力的方式,进行深度特征提取,得到第二特征;
对所述第一特征和所述第二特征进行特征融合,得到融合特征;
根据所述融合特征进行分类,得到分类结果。
可选地,所述获取心电信号数据包括:
获取采集到的初步信号数据;
对所述初步信号数据进行数据提取和扩增,得到初始数据;
对所述初始数据进行额外数据编码和填充,得到处理数据;
对所述处理数据设置标签权重,得到所述心电信号数据。
可选地,所述对所述心电信号数据进行显性特征提取,得到第一特征包括:
采用Savitzky-Golay滤波拟合法对所述心电信号数据进行降噪处理,得到降噪信号;
根据所述降噪信号进行关键波段定位,确定关键波段的目标位置,其中,所述关键波段包括R波、Q波、S波、P波、T波;
根据所述目标位置,确定所述第一特征。
可选地,所述基于外部注意力的方式,进行深度特征提取,得到第二特征包括:
根据所述心电信号数据,确定QRS波群的定位结果,并根据定位结果进行样本划分,得到若干目标片段,以使每个所述目标片段包含一个QRS波群;
对所述目标片段进行映射和归一化,得到长度一致的标准片段;
对每个所述标准片段进行位置信息编码,得到编码信息;
采用多头外部注意力网络,对所述编码进行深度特征提取,得到所述第二特征。
可选地,在所述多头外部注意力网络的归一化层中,采用归一化指数函数softmax和范数进行归一化。
为了解决上述技术问题,本申请实施例还提供一种心电信号数据分类装置,包括:
数据获取模块,用于获取心电信号数据;
第一提取模块,用于对所述心电信号数据进行显性特征提取,得到第一特征,所述第一特征包括R波、Q波、S波、P波、T波的波形时限和高度;
第二提取模块,用于基于外部注意力的方式,进行深度特征提取,得到第二特征;
特征融合模块,用于对所述第一特征和所述第二特征进行特征融合,得到融合特征;
特征分类模块,用于根据所述融合特征进行分类,得到分类结果。
可选地,所述数据获取模块包括:
采集单元,用于获取采集到的初步信号数据;
提取扩增单元,用于对所述初步信号数据进行数据提取和扩增,得到初始数据;
编码填充单元,用于对所述初始数据进行额外数据编码和填充,得到处理数据;
权重设置单元,用于对所述处理数据设置标签权重,得到所述心电信号数据。
可选地,所述第一提取模块包括:
降噪单元,用于采用Savitzky-Golay滤波拟合法对所述心电信号数据进行降噪处理,得到降噪信号;
定位单元,用于根据所述降噪信号进行关键波段定位,确定关键波段的目标位置,其中,所述关键波段包括R波、Q波、S波、P波、T波;
第一特征确定单元,用于根据所述目标位置,确定所述第一特征。
可选地,所述第二提取模块包括:
片段划分单元,用于根据所述心电信号数据,确定QRS波群的定位结果,并根据定位结果进行样本划分,得到若干目标片段,以使每个所述目标片段包含一个QRS波群;
片段标准化单元,用于对所述目标片段进行映射和归一化,得到长度一致的标准片段;
片段编码单元,用于对每个所述标准片段进行位置信息编码,得到编码信息;
第二特征提取单元,用于采用多头外部注意力网络,对所述编码进行深度特征提取,得到所述第二特征。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述心电信号数据分类方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述心电信号数据分类方法的步骤。
本发明实施例提供的心电信号数据分类方法、装置、计算机设备及存储介质,通过获取心电信号数据,对心电信号数据进行显性特征提取,得到第一特征,第一特征包括R波、Q波、S波、P波、T波的波形时限和高度,基于外部注意力的方式,进行深度特征提取,得到第二特征;对第一特征和第二特征进行特征融合,得到融合特征;根据融合特征进行分类,得到分类结果。实现隐式的不同样本之间的关联特征与同一类别的QRS波形特征进行融合,进而进行分类识别,提高心电信号数据分类的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图;
图2是本申请的心电信号数据分类方法的一个实施例的流程图;
图3是本申请整体框架图;
图4是根据本申请的心电信号数据分类装置的一个实施例的结构示意图;
图5是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器( Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3 )、MP4( Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4 )播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的心电信号数据分类方法由服务器执行,相应地,心电信号数据分类装置设置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器,本申请实施例中的终端设备101、102、103具体可以对应的是实际生产中的应用系统。
请参阅图2,图2示出本发明实施例提供的一种心电信号数据分类方法,以该方法应用在图1中的服务端为例进行说明,详述如下:
S201:获取心电信号数据。
在本实施例一具体可选实施方式中,步骤S201中,获取心电信号数据包括:
获取采集到的初步信号数据。
对初步信号数据进行数据提取和扩增,得到初始数据。
对初始数据进行额外数据编码和填充,得到处理数据。
对处理数据设置标签权重,得到心电信号数据。
具体地,在一具体示例中,原始数据按照txt文件存储,1个文件代表1个样本,文件第1行为导联名称,第2-5001行为电压数据,位于同一行的数据,代表相同时刻不同导联的测量的电压,共8个导联,另有1个txt文件存储所有样本对应的年龄和性别数据。由于本实施例针对临床实践中最常见的12导联心电图进行研究,因此采用以下公式计算Ⅲ、avR、avL、avF的数据:
;
其中代表第/>导联电压数据,/>代表第/>导联电压数据,/>代表第/>导联电压数据,其余同理。将对应导联对应位置电压数据代入上述公式,可得到新的导联电压数据。
需要说明的是,由于实践中获取数据的设备不同,获得得到的数据维度不同,但各种采集设备采集的数据普遍具有以下3个属性:采样频率f,采样时间t,采样导联数k。对于一次心电采样中,第k个导联的采样点集合可以表示为。
由于神经网络模型要求输入数据的维度必须统一,在本方法模型中为,因此要求采集的数据的导联数包括至少Ⅰ、Ⅱ、V1 、V2 、V3 、V4 、V5、V6共8个导联,每个导联包括至少2500个采样点,采样点数量n与采样频率 f 、采样时间t之间的关系为n=ft。
导联数不足12个可使用上述公式来补充,采样点数量不足5000个可使用线性插值法补充:
;
其中,n代表采样点序列的位置索引,其取值范围为0到num-1,num为原始采样点数量,为采样点序列中第n个点的电压值,补充完毕的采样点序列中共有/>个元素,在该序列中,下标为偶数的采样点为原始采样点,下标为奇数的采样点为补充的采样点。若/>,即补充后的采样点个数大于5000个,则保留前5000个采样点。
本实施例对于额外的辅助数据,即被检测者的性别和年龄,采取如下处理方法:
将性别为“男性”编码为0,性别为“女性”编码为1,一个被检测者的性别年龄属性用一个长度为2的向量表示:
;
被检测者的性别应为“男性”或“女性”之一,若数据缺省,则默认为“男性”。被检测者的年龄应为0-120之间的整数,若出现不合法数据或缺省,则默认为数据集中其他被检测者年龄的算数平均数。
进一步地,不同诊断标签所代表的病症,对于病人诊疗的意义不同。部分标签如“窦性心律不齐”虽然在诊断上视为心律失常,但对病人的生命安全和病情发展威胁不大,其发生原因和影响因素非常复杂,正常人在一定生活条件下也有可能会检出;而部分标签如“ST-T改变”一旦出现,意味着心肌缺血,如果不能准确识别并采取措施,将会产生心绞痛、心梗等症状,对病人的生命产生重大威胁,因此提高模型对高威胁标签的识别能力是非常有必要的。为了尽量贴近临床实践的要求,本实施例从各指标对于损失函数贡献的角度考虑,通过医学方面的先验知识,尝试为威胁程度更高的标签赋予更高的权重。
S202:对心电信号数据进行显性特征提取,得到第一特征,第一特征包括R波、Q波、S波、P波、T波的波形时限和高度。
在本实施例一具体可选实施方式中,步骤S202中,对心电信号数据进行显性特征提取,得到第一特征包括:
采用Savitzky-Golay滤波拟合法对心电信号数据进行降噪处理,得到降噪信号;
根据降噪信号进行关键波段定位,确定关键波段的目标位置,其中,关键波段包括R波、Q波、S波、P波、T波;
根据目标位置,确定第一特征。
具体地,心电传统特征的思路是通过相关算法,首先确认R波、P波、T波等波的波峰位置,进而可以得出各个波段的持续时间,间隔时间,电压高度等数据,进而得出人工诊断所需的PP间期,PR间期,ST段等相关具有实际意义的指标数据。由于心电信号数据在实际采集的过程中很容易收到干扰,而传统特征提取的方法一般不具有学习噪声的能力,因此需要对数据首先进行人为降噪。
本实施例中,针对工频干扰,采用 Savitzky-Golay(S-G)滤波器,在不改变信号趋势的情况下消除噪声干扰、提高数据精度。S-G滤波器是根据特定条件而设计的标准数字滤波器,t时刻滤波后的结果可按下式计算:
;
其中,为平滑窗口长度,决定了窗口中平滑数据点的数量,由人为指定,且必须为奇数;/>是t时刻原始数据的值;/> 是当前窗口内数据多项式拟合系数,在实际使用时一般由Matlab或Python等工具计算得出,可视为已知量;h是多项式系数/>的总和。
针对基线漂移噪声,采用移动窗口平均法校正。移动窗口平均法的原理是利用整个窗口的均值来替代单个窗口。当窗口取值较小时,就相当于对信号的平滑; 当窗口取值选择较大时,就相当于获取整个信号的波动形态。
进一步地,在一具体示例中,根据降噪信号进行关键波段定位,确定关键波段的目标位置包括:
R波:先去除基线,再使除R波外其他波形的振幅减小,判断R波是直立还是倒置,在一个窗口中基于最值法得到R波振幅值,通过单个R波的振幅值进行阈值设定,进而从长程心电数据中定位R波。正常成年人心电图中QRS波持续时间一般为 0.06-0.10s,本实施例选取时间窗口取最大值0.10s。
Q波和S波:完成直立R波检测后, 配合R波两侧斜率限制,通过前向寻找最小值和后向寻找最大值,就可以确定Q波和S波的位置。
P波:在完成R波检测和Q波定位后,从Q波往前寻找最值并判断是否有符合P波特征的点;如有这样的点,则将其作为 P 波。
T波:在 P 波检测完成后,提取S波到P波的心电图片段,计算该段心电信号在时间窗内的最大值和最小值位置; 根据这两点与相邻点的斜率,判断T 波是直立还是倒置,将最大值或最小值的位置作为P波。
进一步地,根据目标位置,确定第一特征包括:
根据确定好的R波、Q波、S波、P波、T波位置,可以直接读出相关波形的时限,高度,直接计算出P-R间期、R-R间期、ST段长度、整体每分钟心率等特征。
S203:基于外部注意力的方式,进行深度特征提取,得到第二特征。
在本实施例一具体可选实施方式中,步骤S203中,基于外部注意力的方式,进行深度特征提取,得到第二特征包括:
根据心电信号数据,确定QRS波群的定位结果,并根据定位结果进行样本划分,得到若干目标片段,以使每个目标片段包含一个QRS波群;
对目标片段进行映射和归一化,得到长度一致的标准片段;
对每个标准片段进行位置信息编码,得到编码信息;
采用多头外部注意力网络,对编码进行深度特征提取,得到第二特征。
可选地,在多头外部注意力网络的归一化层中,采用归一化指数函数softmax和范数进行归一化。
需要说明的是,在数据归一化处理上,传统attention只使用一个softmax 作为中间的归一化层,当某一个特征值特别大(特别小)的时候,它对其他特征的点乘也会变得特别大(特别小),优选地,本实施例使用了 softmax + L1_norm 的这种 doublenormalization 的方式,去避免这个问题。
具体地,如图3所示,本实施例先直接使用由传统方法得出的QRS波群定位结果,对每个样本进行划分,将其划分为若干个片段,每个片段包含一个QRS波群。由于划分得出QRS波群的长度并不完全一致,故使用全连接将每个QRS波群的长度映射为384。再对该向量进行softmax放缩,将向量中元素的值域映射到[-1,1],目的是与下文位置信息取得相同的区间。
;
进一步地,本实施例中位置信息编码采用三角函数式位置编码,其长度与QRS波群向量一致为384,通过注入QRS波群的顺序信息来增强模型输入,计算公式为:
;
其中t表示QRS波群在波形中的位置,i表示位置向量中的第i个元素,Pt则表示位置t对应的位置向量,k为用来控制参数i奇偶性的参数,在本实施例中k的取值范围为0-191,对应2k与2k+1的取值范围为0-383,表示三角函数计算系数。例如计算第0个QRS波群位置向量/>时,t=0,令k=0,依照上述公式i=0或1,可依次计算出/>、/>、,即位置向量中第0个和第1个元素,依此类推可计算出向量/>中剩余位置的元素。
位置向量与QRS波群相加得到模型嵌入向量。
需要说明的是,本实施例在位置信息编码方式上,不同于一般线性做法,选择了三角函数式位置编码,具有以下优点:每个QRS波群的位置编码是唯一的;不同长度的波形中任意相邻两个波形的距离是一致的;模型可以很容易处理更长的波形,并且值有界;位置编码是确定性的。克服了线性做法当序列很长时会使分配的数值非常大,以及测试样本与训练样本长度不同导致的泛化能力下降的问题。
进一步地,本实施例中外部注意力是传统注意力的改进,通过引入全局共享的矩阵,代替传统注意力中的K,V矩阵,保留Q矩阵的计算,可以对不同样本中的同类特征进行建模表达,可以隐式的考虑不同样本之间的关联。计算方式如下:
;
;
其中F为输入矩阵,为需要学习的线性参数矩阵,Q为参与注意力计算的特征图矩阵,/>、/>为需要学习的全局共享的注意力计算参数矩阵 ,模型通过学习训练样本,更新迭代/>、/>、/>三个矩阵的数值。
在通常的 attention 中只使用一个 softmax 作为中间的归一化层,但当某一个特征值特别大(特别小)的时候,它对其他特征的点乘也会变得特别大(特别小),这种情况下,只使用softmax 会破坏 attention 原始的含义。在本实施例中先对列做softmax,再对行做 L1_Norm来避免这个问题。计算方式如下:
;
;
其中表示特征图中第i行第j列的元素,n表示特征图中共有n行n列,softmax值为该特征图中第i行第j列元素的指数与第j列所有元素指数和的比值,/>为该特征图中第i行第j列的元素与第i行所有元素和的比值。
对于每一个注意力头按上述方式计算完毕后,合并计算方式如下:
;
;
其中表示第i个注意力头的输出结果,/>与/>表示完整多头外部注意力模型输出的结果,/>表示对/>各头输出结果进行合并操作,/>表示点乘权重矩阵,/>的值通过学习训练样本更新迭代得到。
可以看出与传统self-attention不同的是,本实施中每个head共享了、/>矩阵,而传统方法的K、V矩阵是独立的。
本实施例中多头外部注意力模块重复3次,将上一层网络的输出作为下一层网络的输入,取最后一层网络输出的首个向量作为包含整体心电信号信息的深度特征向量。
需要说明的是,相比于其他基于Transformer自注意力的方法,本实施例提出外部注意力的方法。已有方法使用的是一个 F 对 F 的注意力形式,这种注意力只会考虑单个样本内部的关联,而会忽略样本之间的潜在联系,这种联系对于心电分类任务来说是有用的,因为分布在不同样本中的同一类别的QRS波形能有着相似的表征。其次,由于已有方法是算 F 对 F 的注意力,它不够灵活,这种不灵活带来的是级别的复杂度。本实施例通过全局共享/>, />矩阵,可以隐式的考虑不同样本之间的关联,同时,由于 M的维度S 是非常灵活的,本实施例可以通过控制 S 的大小,来使得整个 external attention 变得灵活,使得 attention 变成 N 复杂度,减少了训练参数增加训练速度。
S204:对第一特征和第二特征进行特征融合,得到融合特征。
具体地,将上文提取的传统特征与深度特征进行concat拼接操作,再通过全连接映射为长度为17的向量,通过sigmod激活函数映射为17类结果的分类概率。
对于传统特征结果,根据医学先验知识设定标准,可以对一些类别可以进行人工划分,如V5导联的R波高度大于2.5mv,或V1导联的S波加上V5导联的R波高度大于4mv(女性大于3.5mv)时可下左心室高电压的诊断。其结果通过可学习的权重系数调控,与深度学习模型的结果共同参与最终结果的判定,计算方式如下。
;
其中代表第/>类综合判断结果,/>代表神经网络第/>类的判断结果,/>代表医学先验知识第/>类的判断结果,/>与/>为权重系数。
S205:根据融合特征进行分类,得到分类结果。
因为多标签分类问题本质上属于二分类问题,因此本实施例采用选用带有权重的BCE Loss(Binary CrossEntropy Loss),计算方法如下:
;
其中n代表标签数目,本实施例中取17,代表第i个标签的真实值,/>代表模型的计算值, />代表由先验知识确定的权重修正系数。
本实施例根据医学先验知识和临床实践,将17类标签分为3大类。第一大类包括:窦性心律、窦性心动过缓、窦性心动过速、电轴左偏、电轴右偏、窦性心律不齐。这一大类标签通常表现为在各个人群中出现广泛,无明显症状,单独出现时对人体危害较小,因此赋予较小的权重系数。第二大类包括QRS低电压、右束支传导阻滞、完全性右束支传导阻滞、心室高电压、左心室肥大。这一大类标签通常表现为对于某些敏感人群,可能伴随着相关的心脏问题,但对于另一些人群为正常受生活状况影响的偶发现象,危害性一般,因此赋予正常权重系数。第二大类包括ST段改变、T波改变、ST-T改变、心房颤动、室性早搏、房性早搏。这一大类标签通常表现为具有明显症状,对大部分群体一旦检测出则代表心脏大概率有明显健康问题,对生命健康有比较大的威胁,因此赋予较高权重系数。
临床实践表明,不同心血管疾病之间存在着一定的联系,而根据数据的潜在特征涉及对应的数学模型能够有效地提高模型的性能。为了将多标签之间的关联性融入模型中,必须衡量不同标签之间的关联性。本实施例使用了Jaccard相似系数来评估两两标签之间的相似度。
Jaccard相似系数是一种用于衡量两个集合之间相似性的指标。它定义为两个集合的交集大小除以它们的并集大小,其计算公式为:
;
其中,A和B是两个集合,表示两个集合的交集大小,/>表示两个集合的并集大小。
Jaccard相似系数的取值范围为0到1。当两个集合完全不相交时,它们的Jaccard相似系数为0;当两个集合完全重叠时,它们的Jaccard相似系数为1。
该相关性矩阵由所用数据库中所有数据参与计算得出,反应了各个类别之间的关联。将前文所述代表17类分类概率的向量与该相关性矩阵相乘,得到最终分类结果。
应理解,同时并行提取了样本深度学习特征和具有实际物理意义的传统特征, 利用传统特征引入基于医学先验知识的人工分类依据,对于部分类别有更好更直接的分类能力。引入标签相关性矩阵,根据心电学先验知识,使用数学模型一定程度上表达了数据潜在特征之间的相互关联,与神经网络提取的特征共同参与标签判断。引入基于心电临床实践先验知识的标签权重性分析,区分了重要标签和非重要标签,引导模型在整体效果差距不大的前提下尽量关注重要标签,使模型更加具有实践意义,具有更高的分类识别准确率。
本实施例中,获取心电信号数据,对心电信号数据进行显性特征提取,得到第一特征,第一特征包括R波、Q波、S波、P波、T波的波形时限和高度,基于外部注意力的方式,进行深度特征提取,得到第二特征;对第一特征和第二特征进行特征融合,得到融合特征;根据融合特征进行分类,得到分类结果。实现隐式的不同样本之间的关联特征与同一类别的QRS波形特征进行融合,进而进行分类识别,提高心电信号数据分类的准确性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图4示出与上述实施例心电信号数据分类方法一一对应的心电信号数据分类装置的原理框图。如图4所示,该心电信号数据分类装置包括数据获取模块31、第一提取模块32、第二提取模块33、特征融合模块34和特征分类模块35。各功能模块详细说明如下:
数据获取模块31,用于获取心电信号数据;
第一提取模块32,用于对心电信号数据进行显性特征提取,得到第一特征,第一特征包括R波、Q波、S波、P波、T波的波形时限和高度;
第二提取模块33,用于基于外部注意力的方式,进行深度特征提取,得到第二特征;
特征融合模块34,用于对第一特征和第二特征进行特征融合,得到融合特征;
特征分类模块35,用于根据融合特征进行分类,得到分类结果。
可选地,数据获取模块31包括:
采集单元,用于获取采集到的初步信号数据;
提取扩增单元,用于对初步信号数据进行数据提取和扩增,得到初始数据;
编码填充单元,用于对初始数据进行额外数据编码和填充,得到处理数据;
权重设置单元,用于对处理数据设置标签权重,得到心电信号数据。
可选地,第一提取模块32包括:
降噪单元,用于采用Savitzky-Golay滤波拟合法对心电信号数据进行降噪处理,得到降噪信号;
定位单元,用于根据降噪信号进行关键波段定位,确定关键波段的目标位置,其中,关键波段包括R波、Q波、S波、P波、T波;
第一特征确定单元,用于根据目标位置,确定第一特征。
可选地,第二提取模块33包括:
片段划分单元,用于根据心电信号数据,确定QRS波群的定位结果,并根据定位结果进行样本划分,得到若干目标片段,以使每个目标片段包含一个QRS波群;
片段标准化单元,用于对目标片段进行映射和归一化,得到长度一致的标准片段;
片段编码单元,用于对每个标准片段进行位置信息编码,得到编码信息;
第二特征提取单元,用于采用多头外部注意力网络,对编码进行深度特征提取,得到第二特征。
关于心电信号数据分类装置的具体限定可以参见上文中对于心电信号数据分类方法的限定,在此不再赘述。上述心电信号数据分类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图5,图5为本实施例计算机设备基本结构框图。
所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是,图中仅示出了具有组件连接存储器41、处理器42、网络接口43的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器 (Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。当然,所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件,例如心电信号数据分类方法的程序代码等。此外,所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的程序代码或者处理数据,例如运行心电信号数据分类方法的程序代码。
所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的心电信号数据分类方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (9)
1.一种心电信号数据分类方法,其特征在于,包括:
获取心电信号数据;
对所述心电信号数据进行显性特征提取,得到第一特征,所述第一特征包括R波、Q波、S波、P波、T波的波形时限和高度;
基于多头外部注意力的方式,进行深度特征提取,得到第二特征,多头外部注意力模块包含位置向量计算方式、QKV矩阵计算方法、激活方式、多头加权方式,重复3次,将上一层网络的输出作为下一层网络的输入,取最后一层网络输出的首个向量作为包含整体心电信号信息的深度特征向量;
对所述第一特征和所述第二特征进行特征融合,得到融合特征;
根据所述融合特征进行分类,得到分类结果;
其中,所述基于外部注意力的方式,进行深度特征提取,得到第二特征包括:
根据所述心电信号数据,确定QRS波群的定位结果,并根据定位结果进行样本划分,得到若干目标片段,以使每个所述目标片段包含一个QRS波群;
对所述目标片段进行映射和归一化,得到长度一致的标准片段;
对每个所述标准片段进行位置信息编码,得到编码信息;
采用多头外部注意力网络,对所述编码进行深度特征提取,得到所述第二特征;
其中,所述对每个所述标准片段进行位置信息编码,得到编码信息包括:
对所述标准数据进行三角函数式位置编码,得到位置编码;
将位置编码与原数据相加,得到嵌入数据Fin,将所述嵌入数据Fin作为所述编码信息;
其中,所述基于多头外部注意力的方式,进行深度特征提取,得到第二特征包括:
引入参数矩阵Wq、Mk、MV,对于每组嵌入数据Fin,计算矩阵Q=F*Wq;
对于每组矩阵Q计算矩阵
对于得到的K矩阵,通过先对列做softmax,再对行做L1_Norm进行二次归一化;
对归一化后的K矩阵,计算各单头的注意力值headi=MvK;
对所有单头注意力值进行加权合并,得到深度特征输出矩阵Fout;
将矩阵深度特征输出矩阵Fout作为新的嵌入数据Fin,返回所述引入参数矩阵Wq、Mk、MV,对于每组嵌入数据Fin,计算矩阵Q=F*Wq的步骤迭代执行3次,得到最终输出矩阵Fout3;
取最终输出矩阵Fout3的第一个向量,得到所述第二特征。
2.如权利要求1所述的心电信号数据分类方法,其特征在于,所述获取心电信号数据包括:
获取采集到的初步信号数据;
对所述初步信号数据进行数据提取和扩增,得到初始数据;
对所述初始数据进行额外数据编码和填充,得到处理数据;
对所述处理数据设置标签权重,得到所述心电信号数据。
3.如权利要求1所述的心电信号数据分类方法,其特征在于,所述对所述心电信号数据进行显性特征提取,得到第一特征包括:
采用Savitzky-Golay滤波拟合法对所述心电信号数据进行降噪处理,得到降噪信号;
根据所述降噪信号进行关键波段定位,确定关键波段的目标位置,其中,所述关键波段包括R波、Q波、S波、P波、T波;
根据所述目标位置,确定所述第一特征。
4.如权利要求1所述的心电信号数据分类方法,其特征在于,采用多头外部注意力网络进行深度特征提取,在所述多头外部注意力网络的归一化层中,采用归一化指数函数softmax和范数进行归一化。
5.一种心电信号数据分类装置,其特征在于,所述心电信号数据分类装置包括:
数据获取模块,用于获取心电信号数据;
第一提取模块,用于对所述心电信号数据进行显性特征提取,得到第一特征,所述第一特征包括R波、Q波、S波、P波、T波的波形时限和高度;
第二提取模块,用于基于多头外部注意力的方式,进行深度特征提取,得到第二特征,多头外部注意力模块包含位置向量计算方式、QKV矩阵计算方法、激活方式、多头加权方式,重复3次,将上一层网络的输出作为下一层网络的输入,取最后一层网络输出的首个向量作为包含整体心电信号信息的深度特征向量;
特征融合模块,用于对所述第一特征和所述第二特征进行特征融合,得到融合特征;
特征分类模块,用于根据所述融合特征进行分类,得到分类结果;
其中,所述第二提取模块包括:
片段划分单元,用于根据所述心电信号数据,确定QRS波群的定位结果,并根据定位结果进行样本划分,得到若干目标片段,以使每个所述目标片段包含一个QRS波群;
片段标准化单元,用于对所述目标片段进行映射和归一化,得到长度一致的标准片段;
片段编码单元,用于对每个所述标准片段进行位置信息编码,得到编码信息;
第二特征提取单元,用于采用多头外部注意力网络,对所述编码进行深度特征提取,得到所述第二特征;
其中,所述片段编码单元包括:
对所述标准数据进行三角函数式位置编码,得到位置编码;
将位置编码与原数据相加,得到嵌入数据Fin,将所述嵌入数据Fin作为所述编码信息;
其中,所述第二提取模块包括:
引入参数矩阵Wq、Mk、MV,对于每组嵌入数据Fin,计算矩阵Q=F*Wq;
对于每组矩阵Q计算矩阵
对于得到的K矩阵,通过先对列做softmax,再对行做L1_Norm进行二次归一化;
对归一化后的K矩阵,计算各单头的注意力值headi=MvK;
对所有单头注意力值进行加权合并,得到深度特征输出矩阵Fout;
将矩阵深度特征输出矩阵Fout作为新的嵌入数据Fin,返回所述引入参数矩阵Wq、Mk、MV,对于每组嵌入数据Fin,计算矩阵Q=F*Wq的步骤迭代执行3次,得到最终输出矩阵Fout3;
取最终输出矩阵Fout3的第一个向量,得到所述第二特征。
6.如权利要求5所述的心电信号数据分类装置,其特征在于,所述数据获取模块包括:
采集单元,用于获取采集到的初步信号数据;
提取扩增单元,用于对所述初步信号数据进行数据提取和扩增,得到初始数据;
编码填充单元,用于对所述初始数据进行额外数据编码和填充,得到处理数据;
权重设置单元,用于对所述处理数据设置标签权重,得到所述心电信号数据。
7.如权利要求5所述的心电信号数据分类装置,其特征在于,所述第一提取模块包括:
降噪单元,用于采用Savitzky-Golay滤波拟合法对所述心电信号数据进行降噪处理,得到降噪信号;
定位单元,用于根据所述降噪信号进行关键波段定位,确定关键波段的目标位置,其中,所述关键波段包括R波、Q波、S波、P波、T波;
第一特征确定单元,用于根据所述目标位置,确定所述第一特征。
8.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的心电信号数据分类方法。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的心电信号数据分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410042200.7A CN117547283B (zh) | 2024-01-11 | 2024-01-11 | 心电信号数据分类方法、装置、计算机设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410042200.7A CN117547283B (zh) | 2024-01-11 | 2024-01-11 | 心电信号数据分类方法、装置、计算机设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117547283A CN117547283A (zh) | 2024-02-13 |
CN117547283B true CN117547283B (zh) | 2024-05-14 |
Family
ID=89811469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410042200.7A Active CN117547283B (zh) | 2024-01-11 | 2024-01-11 | 心电信号数据分类方法、装置、计算机设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117547283B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107550488A (zh) * | 2017-09-28 | 2018-01-09 | 武汉中旗生物医疗电子有限公司 | 心电伪迹消除方法及装置 |
CN113288163A (zh) * | 2021-06-04 | 2021-08-24 | 浙江理工大学 | 基于注意力机制的多特征融合心电信号分类模型建模方法 |
CN113855042A (zh) * | 2021-08-29 | 2021-12-31 | 北京工业大学 | 融合深度和医学特征的基于序列标注的多导联心电信号分类方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107951485B (zh) * | 2017-11-27 | 2019-06-11 | 深圳市凯沃尔电子有限公司 | 基于人工智能自学习的动态心电图分析方法和装置 |
US20220015711A1 (en) * | 2020-07-20 | 2022-01-20 | Board Of Regents, The University Of Texas System | System and method for automated analysis and detection of cardiac arrhythmias from electrocardiograms |
CN113080988B (zh) * | 2021-03-26 | 2024-01-16 | 京东方科技集团股份有限公司 | 基于注意力机制的12导联心电图整体分类方法和装置 |
-
2024
- 2024-01-11 CN CN202410042200.7A patent/CN117547283B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107550488A (zh) * | 2017-09-28 | 2018-01-09 | 武汉中旗生物医疗电子有限公司 | 心电伪迹消除方法及装置 |
CN113288163A (zh) * | 2021-06-04 | 2021-08-24 | 浙江理工大学 | 基于注意力机制的多特征融合心电信号分类模型建模方法 |
CN113855042A (zh) * | 2021-08-29 | 2021-12-31 | 北京工业大学 | 融合深度和医学特征的基于序列标注的多导联心电信号分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117547283A (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shi et al. | A hierarchical method based on weighted extreme gradient boosting in ECG heartbeat classification | |
Wang et al. | Arrhythmia classification algorithm based on multi-head self-attention mechanism | |
US20230143594A1 (en) | Systems and methods for reduced lead electrocardiogram diagnosis using deep neural networks and rule-based systems | |
US20230293079A1 (en) | Electrocardiogram image processing method and device, medium, and electrocardiograph | |
Xia et al. | Generative adversarial network with transformer generator for boosting ECG classification | |
WO2021057423A1 (zh) | 图像处理方法、图像处理装置以及存储介质 | |
CN110974214A (zh) | 一种基于深度学习的自动心电图分类方法、系统及设备 | |
CN110623658A (zh) | 信号处理方法、信号处理装置、医学设备、存储介质 | |
CN115470828A (zh) | 基于卷积与自注意力机制的多导联心电图分类识别方法 | |
Moses et al. | A survey of data mining algorithms used in cardiovascular disease diagnosis from multi-lead ECG data | |
US20220309268A1 (en) | Attention mechanism-based 12-lead electrocardiogram classification method and apparatus | |
CN115813401B (zh) | 一种基于动态学习的心电图分类方法及系统 | |
Ullah et al. | [Retracted] An Effective and Lightweight Deep Electrocardiography Arrhythmia Recognition Model Using Novel Special and Native Structural Regularization Techniques on Cardiac Signal | |
Al Rahhal et al. | Automatic premature ventricular contractions detection for multi-lead electrocardiogram signal | |
Tong et al. | Locating abnormal heartbeats in ECG segments based on deep weakly supervised learning | |
WO2021071646A1 (en) | Systems and methods for electrocardiogram diagnosis using deep neural networks and rule-based systems | |
Wang et al. | Multiscale residual network based on channel spatial attention mechanism for multilabel ECG classification | |
Hassan et al. | Performance comparison of CNN and LSTM algorithms for arrhythmia classification | |
Zhang et al. | Interpretable detection and location of myocardial infarction based on ventricular fusion rule features | |
Xiao et al. | Integrating multimodal information in machine learning for classifying acute myocardial infarction | |
Tao et al. | A resource-efficient ECG diagnosis model for mobile health devices | |
Li et al. | Diagnosis of atrial fibrillation based on lightweight detail-semantic network | |
Ji et al. | Heartbeat Classification Based on Multifeature Combination and Stacking‐DWKNN Algorithm | |
CN117547283B (zh) | 心电信号数据分类方法、装置、计算机设备及介质 | |
Hong et al. | Gated temporal convolutional neural network and expert features for diagnosing and explaining physiological time series: a case study on heart rates |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |