CN116172572A - 一种基于shap值加权和分段hdbscan的心拍聚类方法及系统 - Google Patents

一种基于shap值加权和分段hdbscan的心拍聚类方法及系统 Download PDF

Info

Publication number
CN116172572A
CN116172572A CN202211663021.2A CN202211663021A CN116172572A CN 116172572 A CN116172572 A CN 116172572A CN 202211663021 A CN202211663021 A CN 202211663021A CN 116172572 A CN116172572 A CN 116172572A
Authority
CN
China
Prior art keywords
data
clustering
beat
clustering method
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211663021.2A
Other languages
English (en)
Inventor
魏守水
陈蒙
梁业松
王颖
火蕊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202211663021.2A priority Critical patent/CN116172572A/zh
Publication of CN116172572A publication Critical patent/CN116172572A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • A61B5/346Analysis of electrocardiograms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • A61B5/346Analysis of electrocardiograms
    • A61B5/349Detecting specific parameters of the electrocardiograph cycle
    • A61B5/353Detecting P-waves
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • A61B5/346Analysis of electrocardiograms
    • A61B5/349Detecting specific parameters of the electrocardiograph cycle
    • A61B5/355Detecting T-waves
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • A61B5/346Analysis of electrocardiograms
    • A61B5/349Detecting specific parameters of the electrocardiograph cycle
    • A61B5/366Detecting abnormal QRS complex, e.g. widening
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Cardiology (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Veterinary Medicine (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提供了一种基于SHAP值加权和分段HDBSCAN的心拍聚类方法及系统,采用SHAP模型计算心电数据库,包括公开数据库和自有数据库中所有类型心拍在分类任务中不同特征的贡献值,并将其作为聚类算法中的权重值;然后本发明采用分段聚类法,基于HDBSCAN算法将QRS波、P波段和T波段分别进行顺序三次聚类以获得最终的聚类结果,此算法不用预设聚类个数,能够有针对性的对不同人群的心电图进行较为准确且稳定的个性化聚类,具有较强的抗干扰性。

Description

一种基于SHAP值加权和分段HDBSCAN的心拍聚类方法及系统
技术领域
本发明涉及信号处理技术领域,具体涉及一种基于SHAP值加权和分段HDBSCAN的心拍聚类方法及系统。
背景技术
心血管疾病一直以来都被视为威胁人们身体健康甚至生命安全的重大疾病,心电图作为临床诊断心血管疾病的主要依据之一,其各波形反映了心脏收缩和舒张的周期性变化过程中所产生的电流情况。典型的心电图包括P波、QRS波、T波,P波反映心房除极过程的电位变化;P-R间期代表激动从窦房结通过房室交界区到心室肌开始除极的时限;QRS波群反映心室除极过程的电位变化;T波代表心室肌复极过程中的电位变化。如果心脏产生病理性变化,则心电信号将在波形周期和形态上发生畸变。
因此,对心电信号心拍进行分析在心电信号智能分析和临床辅助诊断中具有十分重要的作用。生活中的心电数据的异常心拍类型往往是不可预知类型的,采用固定类别训练的分类模型往往不能覆盖所有类别。心拍聚类是一种无监督的心拍分类算法,相对于有监督的心拍分类算法具有良好的泛化性能。尤其是移动心电采集设备出现后,针对24小时甚至更长时间段心电信号的聚类算法很有必要。准确的心拍聚类也可以用于建立心拍字典,进而采用自然语言处理的相关算法做后续分析处理。
现有技术中,心电聚类算法通常基于心拍特征参数或模板匹配将形态相似的心拍成群结对的聚集在一起,得到目标对象的心电信号的特征波形,供技术人员进行分析和辅助诊断。然而,上述聚类方法无法区分不同类型心拍在聚类任务中的不同贡献值,如果将其看做相同权重进行处理,必定会影响聚类结果的准确性;且不能根据每个人的心电图进行个性化聚类,易受噪声干扰、稳定性差,得到的特征波形的准确性不稳定。
发明内容
为了解决现有技术中存在的问题,本发明提供了一种基于SHAP值加权和分段HDBSCAN的心拍聚类方法及系统,采用SHAP模型计算心电数据库,包括公开数据库和自有数据库中所有类型心拍在分类任务中不同特征的贡献值,并将其作为聚类算法中的权重值;然后采用HDBSCAN算法基于聚类目标的密度进行聚类操作,能够有针对性的对不同人群的心电图进行较为准确且稳定的聚类,不限定聚类个数,具有较强的抗干扰性。
为了实现上述目的,本发明采取了如下技术方案:
一方面,本发明提供一种基于SHAP值加权和分段HDBSCAN的心拍聚类方法,包括以下步骤:
获取心电数据库中的心电数据并去噪,所述心电数据库包括公开数据库和自有数据库,并从去噪后的心电数据中提取心拍数据;
对所有心拍数据进行预处理,得到训练数据和测试数据;
对训练数据进行分类,计算所有类型心拍在分类任务中不同特征的贡献值,将其作为聚类算法中的权重值;
将测试数据与权重值融合,得到带权重的心电特征点融合数据;
采用分段聚类法对融合数据按顺序进行三次聚类,生成聚类结果。
进一步地,使用SHAP模型计算心电数据库所有类型心拍在分类任务中不同特征的贡献值,即SHAP值,并将其作为聚类算法中的权重值;所述SHAP模型计算方法,是一个加性的解释模型,可以计算每个特征对分类算法模型输出的边际贡献。
进一步地,所述分段聚类法对融合数据按顺序进行三次聚类,包括,采用HDBSCAN算法分别对QRS波段、P波段和T波段特征点按顺序依次进行三次聚类,每次聚类都在前一次聚类的基础上进行。
进一步地,所述去噪包括:去除工频干扰,去除基线漂移,以及去除运动伪差和肌电干扰。
进一步地,所述预处理为将所有心拍数据进行分割和降采样处理。
进一步地,采用样本数据均衡方法和随机森林算法将训练数据进行分类。
进一步地,所述训练数据采用原始心拍数据,不进行人工特征提取。
第二方面,本发明提供一种基于SHAP值加权和分段HDBSCAN的心拍聚类系统,包括:
提取模块,用于获取心电数据库中的心电数据并去噪,所述心电数据库包括公开数据库和自有数据库,并从去噪后的心电数据中提取心拍数据;
预处理模块,用于对所有心拍数据进行预处理,得到训练数据和测试数据;
权重模块,用于对训练数据进行分类,计算所有类型心拍在分类任务中不同特征的贡献值,将其作为聚类算法中的权重值;
融合模块,用于将测试数据与权重值融合,得到带权重的心电特征点融合数据;
聚类模块,采用分段聚类法对融合数据按顺序进行三次聚类,生成聚类结果。
第三方面,本发明提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如上所述的基于SHAP值加权和分段HDBSCAN的心拍聚类方法。
第四方面,本发明提供一种电子设备,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如上所述的基于SHAP值加权和分段HDBSCAN的心拍聚类方法的指令。
本发明有益效果:
本发明使用SHAP模型计算心电公开数据库和自有数据库中所有类型心拍在分类任务中不同特征的贡献值,即SHAP值,并将其作为聚类算法中的权重值,能够有效提高聚类结果的准确性;SHAP值训练过程中使用原始心拍数据,未进行人工特征提取过程,仅做了降采样以减少计算复杂度。
本发明采用分段聚类法,将QRS波、P波段和T波段分别进行顺序三次聚类以获得最终的聚类结果,此算法不用预设聚类个数,能够有针对性的对不同人群的心电图进行较为准确且稳定的个性化聚类,抗干扰性比较强,可以将明显与其它心拍轨迹不同的心拍单独聚类;同时此算法基于聚类目标的密度而非距离进行聚类,可以避免K-means等算法只能发现球形簇的缺点。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例1的基于SHAP值加权和分段HDBSCAN的心拍聚类方法的流程图。
图2为本发明实施例1中心拍特征点图示例图,(a)为房颤心拍特征点图(1-96特征点),(b)为正常心拍特征点图(1-96特征点)。
图3为本发明实施例1中特征点对11种类别的SHAP贡献均值图。
图4为本发明实施例1的聚类效果图。
图5为本发明实施例1中聚类效果的抗干扰性示意图。
具体实施方式
实施例1
本实施例1提供一种基于SHAP值加权和分段HDBSCAN的心拍聚类方法。
如图1所示,一种基于SHAP值加权和分段HDBSCAN的心拍聚类方法,包括以下步骤:
步骤1:获取心电公开数据库MIT-BIH心律失常数据库中的心电数据并去噪,从心电数据中提取AF心拍及其它共11种心拍数据;
步骤2:对所有心拍数据进行预处理,得到训练数据和测试数据;
步骤3:对训练数据进行分类,计算所有类型心拍在分类任务中不同特征的贡献值,将其作为聚类算法中的权重值;
步骤4:将测试数据与权重值融合,得到带权重的心电特征点融合数据;
步骤5:采用分段聚类法对融合数据按顺序进行三次聚类,生成聚类结果。
具体的,步骤1中,由于房颤心拍的P波段变化成为高频f波,本发明提取数据库中的房颤心拍,将其从正常(N)一类中剥离出来,形成单独的一类。以MIT-BIH心律失常数据库为例,MIT-BIH心律失常数据库的采样频率是360Hz,其中AF心拍没有单独划分,而是以节律片段的形式给出,将MIT-BIH心律失常数据库的48条数据中的所有AF心拍分离出来形成单独一类。
所述去噪包括:去除工频干扰,去除基线漂移,以及去除运动伪差和肌电干扰。
步骤2中,所述预处理,将步骤1中48条数据的所有心拍的心电数据以R峰前0.3s和R峰后0.5s共0.8s数据进行分割,并采用整数倍降采样算法将其降采样到120Hz,本实施例中采用3倍降采样算法,此时每个片段的样本点个数为0.8*360/(360/120)=96,形成特征值为96的训练数据,每个特征点即为心拍样本点,表示数据原始的时域波形特征,如图2所示(a)为房颤心拍特征点图(1-96特征点),(b)为正常心拍特征点图(1-96特征点)。其中整数倍降采样算法分为两步:首先利用数位低通滤波器去除信号中的高频成分防止混叠,然后保留去除高频成分的间隔为3的样本点。
在进行数据分割时,针对不同聚类目的,可以选择不同分割长度,如任务重点是房颤的分类和聚类,则可以选择0.8s左右的分割距离,因为大部分房颤是快速型心律失常。
步骤3中对训练数据进行分类,使用MIT-BIH心律失常数据库能够形成包括正常(N)、房颤(af)、室早(V)、房早(A)、房早伴差传(a)、交界性早搏(J)、室性逸搏(E)、房性逸搏(e)、交界性逸搏(j)、室性融合波(F)和起搏(/)的十一类心拍数据,使用其它数据库可以酌情增减类别。表1为不同类型心拍(MIT-BIH类别名)在分类模型中的类别对照:
表1:不同类型心拍在分类模型中的类别对照
Figure BDA0004014760580000061
本发明采用样本数据均衡方法和随机森林算法将训练数据进行分类,本发明采用了多样本类别如N和af等降采样,少样本类别升采样,得到总体类别为11,分类F1值为0.94。此处的降采样算法采用随机降采样,如N类别样本较多,则随机剔除掉其中一定数量的样本,将剩下来的样本作为训练数据。升采样算法采用residual bootstrap方法进行多次重采样,以增加少样本类别的样本个数。
本发明使用SHAP模型计算MIT-BIH心律失常数据库所有类型心拍在分类任务中不同特征的贡献值,即SHAP值,作为聚类算法中特征的权重。
SHAP是由Shapley值启发的可加性解释模型。训练模型选择随机森林算法,对于每个预测样本,模型都产生一个预测值,SHAP值就是该样本中每个特征所分配到的数值。假设第i个样本为xi,第i个样本的第j个特征为xi,j,模型对第i个样本的预测值为yi,整个模型的基线(通常是所有样本的目标变量的均值)为ybase,那么SHAP值服从以下等式:
yi=ybase+f(xi,1)+f(xi,2)+…+f(xi,k)
其中f(xi,j)为xi,j的SHAP值,表示第i个样本的第j个特征对最终预测分类值yi的贡献值。i取1到35786,35786是训练样本个数,j取1到96,96是特征个数。当f(xi,j)>0,说明该特征提升了预测值,起正向作用;当f(xi,j)<0,说明该特征降低了预测值,有反作用;当f(xi,j)=0,说明特征没有对预测值起作用。
图3显示了特征点对11种类别的SHAP贡献绝对值的均值,即每一个特征作用于11种分类预测值在所有样本点的均值,图中横坐标是贡献度,即权重数,纵坐标是第X个特征点,权重总数最大的二十个。此图只显示最重要的前20个特征点,特征名称对应其在心电特征图中的位置。如第一行显示的是第37个样本点特征分别对类别0,1,2,10,4,3,5,7,9,6,8,即N,Af,V,/,a,A,J,e,F,E,j的预测贡献值的绝对值在所有样本的平均值。
由于R峰和其它波段的心电数值差距较大,本发明采用与特征度量单位无关的随机森林算法进行分类任务用于计算SHAP值,与之类似的XGBOOST等算法分类效果相当。其中,SHAP值训练过程中训练数据采用心拍的原始数据,没有进行人工特征提取,仅做了降采样以减少计算复杂度。
步骤5中,采用分段聚类法,将QRS波、P波段和T波段分别进行顺序三次聚类以获得最终的聚类结果。将96个特征按照QRS段(第31-65个特征值)、P段(前30个特征值)和T段(最后31个特征)的顺序分别采用HDBSCAN算法进行三次聚类,第一次聚类重点关注QRS段,这样可以将有QRS异常的心律失常类型分离出来,如室早、起搏等类型,第二次聚类重点关注P波,可将有P波段异常的心律失常分离出来,如房颤、房早、室早等类型,最后一次聚类重点关注T波段,可以将心梗心拍、室早心拍、逸搏等分离出来,每次聚类都在上次聚类的基础之上进行,且不会因为某个片段的幅值异常影响整体的聚类结果,如R峰幅值较大,会应该小P峰和T峰的作用。图4为聚类效果示意图,如图a,b,c,d分别是聚类之后其中的四个类别,每种类别叠加了多个心拍信号,每条曲线是聚类的一个样本数据,包含96个样本点。图中横坐标是96个特征点,纵坐标是特征点对应的幅值,单位为毫伏。每条曲线代表一条样本数据,是经过作图软件插值后的曲线图,每幅图片是一个聚类的类别,叠加了本类别的所有样本。
本发明采用HDBSCAN算法进行每次的聚类操作,此算法不用预设聚类个数,可以根据每个人的心电图进行个性化聚类,并可以将明显与其它心拍轨迹不同的心拍单独聚类,如图5所示,聚类类别包含两条数据,每条数据的波形形态都与其它样本的波形有明显差异如图4所示,并没有被分类到其它类别,而是单独一类,表现了本聚类算法较强的抗干扰性;同时此算法基于聚类目标的密度而非距离进行聚类,可以避免K-means等算法只能发现球形簇的缺点。
本实施例能够有针对性的对不同人群的心电图进行较为准确且稳定的聚类,与多数算法(如K-means等算法)需预先设定聚类类别的个数不同,本实施例在初始化的时候无需预先设定聚类类别的个数,而且具有较强的抗干扰性。同时在前面SHAP值训练过程中使用原始数据,未进行人工特征提取过程,并且由于每个特征对预测结果的贡献值是已知的,这样在选择特征的时候是有迹可循的,从而使得每个特征点对分类任务及对每种类别的重要程度可解释。
实施例2
本实施例2提供一种基于SHAP值加权和分段HDBSCAN的心拍聚类系统。
一种基于SHAP值加权和分段HDBSCAN的心拍聚类系统,包括:
提取模块,用于获取心电数据库中的心电数据并去噪,从心电数据中提取心拍数据;
预处理模块,用于对所有心拍数据进行预处理,得到训练数据和测试数据;
权重模块,用于对训练数据进行分类,计算所有类型心拍在分类任务中不同特征的贡献值,将其作为聚类算法中的权重值;
融合模块,用于将测试数据与权重值融合,得到带权重的心电特征点融合数据;
聚类模块,采用分段聚类法对融合数据按顺序进行三次聚类,生成聚类结果。
实施例3
本发明实施例3提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如上所述的基于SHAP值加权和分段HDBSCAN的心拍聚类方法,该方法包括:
获取心电数据库中的心电数据并去噪,包括公开数据库和自有数据库,并从去噪后的心电数据中提取心拍数据;
对所有心拍数据进行预处理,得到训练数据和测试数据;
对训练数据进行分类,计算所有类型心拍在分类任务中不同特征的贡献值,将其作为聚类算法中的权重值;
将测试数据与权重值融合,得到带权重的心电特征点融合数据;
采用分段聚类法对融合数据按顺序进行三次聚类,生成聚类结果。
实施例4
本发明实施例4提供一种电子设备,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如上所述的基于SHAP值加权和分段HDBSCAN的心拍聚类方法的指令,该方法包括:
获取心电数据库中的心电数据并去噪,包括公开数据库和自有数据库,并从去噪后的心电数据中提取心拍数据;
对所有心拍数据进行预处理,得到训练数据和测试数据;
对训练数据进行分类,计算所有类型心拍在分类任务中不同特征的贡献值,将其作为聚类算法中的权重值;
将测试数据与权重值融合,得到带权重的心电特征点融合数据;
采用分段聚类法对融合数据按顺序进行三次聚类,生成聚类结果。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明公开的技术方案的基础上,本领域技术人员在不需要付出创造性劳动即可做出的各种修改或变形,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种基于SHAP值加权和分段HDBSCAN的心拍聚类方法,其特征在于,包括以下步骤:
获取心电数据库中的心电数据并去噪,包括公开数据库和自有数据库,并从去噪后的心电数据中提取心拍数据;
对所有心拍数据进行预处理,得到训练数据和测试数据;
对训练数据进行分类,计算所有类型心拍在分类任务中不同特征的贡献值,将其作为聚类算法中的权重值;
将测试数据与权重值融合,得到带权重的心电特征点融合数据;
采用分段聚类法对融合数据按顺序进行三次聚类,生成聚类结果。
2.如权利要求1所述的心拍聚类方法,其特征在于,使用SHAP模型计算心电数据库中所有类型心拍在分类任务中不同特征的贡献值,即SHAP值,并将其作为聚类算法中的权重值;其中,SHAP模型是一个加性的解释模型,可以计算每个特征对分类算法模型输出的边际贡献。
3.如权利要求1所述的心拍聚类方法,其特征在于,所述分段聚类法对融合数据按顺序进行三次聚类,包括,采用HDBSCAN算法分别对QRS波段、P波段和T波段特征点按顺序依次进行三次聚类,每次聚类都在前一次聚类的基础上进行。
4.如权利要求1所述的心拍聚类方法,其特征在于,所述去噪包括:去除工频干扰,去除基线漂移,以及去除运动伪差和肌电干扰。
5.如权利要求1所述的心拍聚类方法,其特征在于,所述预处理为将所有心拍数据进行分割和降采样处理。
6.如权利要求1所述的心拍聚类方法,其特征在于,采用样本数据均衡方法和随机森林算法将训练数据进行分类。
7.如权利要求1所述的心拍聚类方法,其特征在于,所述训练数据采用原始心拍数据,不进行人工特征提取。
8.一种基于SHAP值加权和分段HDBSCAN的心拍聚类系统,其特征在于,包括:
提取模块,用于获取心电数据库中的心电数据并去噪,包括公开数据库和自有数据库,并从心电数据中提取心拍数据;
预处理模块,用于对所有心拍数据进行预处理,得到训练数据和测试数据;
权重模块,用于对训练数据进行分类,计算所有类型心拍在分类任务中不同特征的贡献值,将其作为聚类算法中的权重值;
融合模块,用于将测试数据与权重值融合,得到带权重的心电特征点融合数据;
聚类模块,采用分段聚类法对融合数据按顺序进行三次聚类,生成聚类结果。
9.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如权利要求1-7任一项所述的心拍聚类方法。
10.一种电子设备,其特征在于,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如权利要求1-7任一项所述的心拍聚类方法的指令。
CN202211663021.2A 2022-12-23 2022-12-23 一种基于shap值加权和分段hdbscan的心拍聚类方法及系统 Pending CN116172572A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211663021.2A CN116172572A (zh) 2022-12-23 2022-12-23 一种基于shap值加权和分段hdbscan的心拍聚类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211663021.2A CN116172572A (zh) 2022-12-23 2022-12-23 一种基于shap值加权和分段hdbscan的心拍聚类方法及系统

Publications (1)

Publication Number Publication Date
CN116172572A true CN116172572A (zh) 2023-05-30

Family

ID=86449900

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211663021.2A Pending CN116172572A (zh) 2022-12-23 2022-12-23 一种基于shap值加权和分段hdbscan的心拍聚类方法及系统

Country Status (1)

Country Link
CN (1) CN116172572A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235555A (zh) * 2023-10-17 2023-12-15 北京和兴创联健康科技有限公司 一种基于shap特征聚类技术的脓毒症分型方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235555A (zh) * 2023-10-17 2023-12-15 北京和兴创联健康科技有限公司 一种基于shap特征聚类技术的脓毒症分型方法及系统
CN117235555B (zh) * 2023-10-17 2024-04-02 北京和兴创联健康科技有限公司 一种基于shap特征聚类技术的脓毒症分型方法及系统

Similar Documents

Publication Publication Date Title
CN108714026B (zh) 基于深度卷积神经网络和在线决策融合的细粒度心电信号分类方法
CN107714023B (zh) 基于人工智能自学习的静态心电图分析方法和装置
Javadi et al. Classification of ECG arrhythmia by a modular neural network based on mixture of experts and negatively correlated learning
Engin ECG beat classification using neuro-fuzzy network
Sayadi et al. A model-based Bayesian framework for ECG beat segmentation
Übeyli Combining recurrent neural networks with eigenvector methods for classification of ECG beats
Chen et al. Atrial fibrillation detection using a feedforward neural network
Daqrouq et al. Neural network and wavelet average framing percentage energy for atrial fibrillation classification
Hadjem et al. ST-segment and T-wave anomalies prediction in an ECG data using RUSBoost
CN106815570A (zh) 一种基于动态模式识别的心电信号st‑t段识别方法
Wu et al. Personalizing a generic ECG heartbeat classification for arrhythmia detection: a deep learning approach
JP7487965B2 (ja) グラフ畳み込みに基づく心電図心拍数マルチタイプの予測方法
CN116172572A (zh) 一种基于shap值加权和分段hdbscan的心拍聚类方法及系统
Shukri et al. Investigation on Elman neural network for detection of cardiomyopathy
Afkhami et al. ECG based detection of left ventricular hypertrophy using higher order statistics
Sraitih et al. An overview on machine learning methods for ECG Heartbeat Arrhythmia Classification
CN113288169B (zh) 一种心电波形信号的波形识别方法、装置及设备
Tamil et al. A review on feature extraction & classification techniques for biosignal processing (Part I: Electrocardiogram)
Khandait et al. ECG signal processing using classifier to analyses cardiovascular disease
Lin et al. Multiple cardiac arrhythmia recognition using adaptive wavelet network
Kumari et al. Fuzzy unordered rule induction for evaluating cardiac arrhythmia
de Oliveira et al. Early detection of Ventricular Bigeminy/Trigeminy rhythms
de Oliveira et al. Premature ventricular contraction recognition using blind source separation and ensemble gaussian naive bayes weighted by analytic hierarchy process
Zhang et al. Self-Organized Operational Neural Networks for The Detection of Atrial Fibrillation
Ramesh et al. Selective Feature Coding for Cardiac Arrhythmia Detection through ECG Signal Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination