CN109044301A - 一种面向高血压疾病检测的bcg信号分析方法 - Google Patents

一种面向高血压疾病检测的bcg信号分析方法 Download PDF

Info

Publication number
CN109044301A
CN109044301A CN201810708356.9A CN201810708356A CN109044301A CN 109044301 A CN109044301 A CN 109044301A CN 201810708356 A CN201810708356 A CN 201810708356A CN 109044301 A CN109044301 A CN 109044301A
Authority
CN
China
Prior art keywords
association rules
class association
class
frequent
item collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810708356.9A
Other languages
English (en)
Inventor
周兴社
刘帆
王柱
於志文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN201810708356.9A priority Critical patent/CN109044301A/zh
Publication of CN109044301A publication Critical patent/CN109044301A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/02Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
    • A61B5/021Measuring pressure in heart or blood vessels

Abstract

本发明提供一种面向高血压疾病检测的BCG信号分析方法,其特征在于:对BCG信号进行归一化和滤波处理,计算心跳间期序列;对心跳间期序列进行时域、频域、非线性域分析,提取能精确刻画高血压患者生理状态的特征,并对其进行离散化处理;从离散化特征中挖掘能够表征特征间相互关系的类关联规则;基于挖掘出的类关联规则的分布、冗余度、覆盖度特性,从中挑选一组具有较强分类能力的类关联规则;根据所挑选出的类关联规则的相似性及权重指标,构建基于类关联规则的高血压识别模型,得到分析结果。

Description

一种面向高血压疾病检测的BCG信号分析方法
技术领域
本发明涉及生物医学领域,具体地,涉及一种面向高血压疾病检测的BCG信号分析方法。
背景技术
近年来,高血压作为一种常见且危害极大的心脑血管疾病,已成为威胁人类健康的重要因素。据世界卫生组织有关数据显示,全球25岁以上人口中大约40%患有高血压,共计超过10亿人。高血压会引起中风、心脏病、肾衰竭等一系列重大疾病,每年导致940余万人丧生。高血压具有发病隐匿、难以及时确诊的特点,如何对高血压进行早期精确诊断已成为亟待解决的重点问题。
现有高血压疾病监测方法主要分为两大类:1)基于袖带式血压计等专业医学设备的高血压疾病监测;2)基于智能腕表等可穿戴式设备的高血压疾病监测。前者在监测时需要受试者佩戴专门的袖带,会降低使用过程的舒适性;其次血压时刻处于动态变化,但该类方法只能间断式使用,因此无法准确评估受试者的血压情况。后者虽然可以持续地监测受试者血压状况,但它所采用的模式识别方法仅没有充分考虑特征与特征之间、特征与类别之间的相互关系,会遗漏大量与高血压相关的信息,这使得该种方法的高血压疾病监测准确率往往较低。
发明内容
本发明提供一种面向高血压疾病检测的BCG信号分析方法,以解决非干预式高血压疾病监测准确率较低的问题。
本发明的技术方案为:一种面向高血压疾病检测的BCG信号分析方法,对BCG信号进行归一化和滤波处理,计算心跳间期序列;对心跳间期序列进行时域、频域、非线性域分析,提取能精确刻画高血压患者生理状态的特征,并对其进行离散化处理;从离散化特征中挖掘能够表征特征间相互关系的类关联规则;基于挖掘出的类关联规则的分布、冗余度、覆盖度特性,从中挑选一组具有较强分类能力的类关联规则;根据所挑选出的类关联规则的相似性及权重指标,构建基于类关联规则的高血压识别模型,进而判断该BCG信号所有者的高血压是否异常;包括以下步骤:
S1:对BCG信号进行预处理操作,以消除信号噪音以及受试者个体差异对信号幅值造成的影响,并提取准确的心跳间期序列;
S2:对S1输出的心跳间期序列进行时域、频域、非线性分析,提取能够准确反映受试者生理状态的多维特征,并对其进行离散化处理;
S3:从S2输出的离散化特征中,利用优化的Apriori算法,挖掘能够表征特征间相互关系的类关联规则;
S4:从S3输出的类关联规则中,根据规则的分布、训练集的覆盖度、规则的冗余度指标,挑选出一组具有较强分类能力的类关联规则;
S5:基于S4输出的类关联规则的相似度、权重指标,构建基于类关联规则的高血压识别模型,得到分析结果。
进一步地,一种面向高血压疾病检测的BCG信号分析方法,所述S1中对BCG信号进行预处理操作包括:首先使用Z-score方法对BCG信号进行归一化处理;然后利用椭圆带通滤波器对其进行滤波操作;最后采用交叠滑动窗口算法定位每次心跳的发生时刻,进而提取心跳间期序列。
进一步地,一种面向高血压疾病检测的BCG信号分析方法,所述S2中提取能够刻画高血压患者生理状态的特征并对其进行离散化处理包括:对心跳间期序列进行时域分析,提取中值、均方差与心跳间期序列分布相关的统计信息;对心跳间期序列进行频域分析,计算不同频带所蕴含的信号能量;对心跳间期序列进行非线性域分析,提取样本熵、DFA等能够反映信号复杂度、稳定性的特征;采用等箱分割法将每个特征的值划分成若干区间,并用唯一的标识对每个区间进行标记。
进一步地,一种面向高血压疾病检测的BCG信号分析方法,所述S3中从多维特征中挖掘能够表征特征间相互关系的类关联规则是指:对传统Apriori算法的链接、剪枝关键步骤进行优化处理,并基于此从离散化后的特征序列中挖掘出所有含有类标签且满足指定的支持度、置信度要求的关联规则。
进一步地,一种面向高血压疾病检测的BCG信号分析方法,所述S3在进行类关联规则挖掘前,需要对训练集实例进行规范化表示,第k个实例SLk可表示为:
SLk=<f1,f2,…fi…fn,CL>;
其中,fi表示该实例第i个特征Fi的具体编号值,CL表示该实例所属的类别。
进一步地,一种面向高血压疾病检测的BCG信号分析方法,所述Apriori算法能够对挖掘类关联规则过程中最耗时的步骤进行优化,所述优化内容主要包括:
对频繁k-1项集集合的链接操作进行优化:先将频繁K-1项集集合中的元素按照字典序排序,并分别记其中两个频繁K-1项集为L1与L2,在进行链接操作时,若L1<L2,且L1与L2不可链接,则可证明L1与L2之后的频繁K-1项集均无法链接,因此立即停止尝试将L1与L2之后的频繁K-1项集进行链接操作;
对候选K项集集合的剪枝操作进行优化:记任一候选K项集为C,并将C的任意一个K-1项子集记为C1,在进行剪枝操作时,若C1与频繁K-1项集集合(集合中的元素按字典序排列)中的某个元素Lx不相等,且C1<Lx,则可证明C1与Lx之后的所有频繁K-1项集都不可能相等,也即说明C不可能是频繁K项集,故此时可提前从候选K项集集合中删除C;
在进行链接操作前,提前删除频繁K-1项集集合中不可能链接生成频繁K项集的元素:记数据集中所有频繁1项集分别为F1,F2,…,Fn,分别统计频繁K-1项集集合中每个频繁1项集的父集的个数,并记为N1,N2,…,Nn;可证明若某个频繁K-1项集中包含某个父集个数小于K-1的频繁1项集,则该由该频繁K-1项集链接生成的候选K项集不可能是频繁的,因此可以在进行链接操作前删除该频繁K-1项集,从而减少链接操作次数,提升列关联规则挖掘速度。
进一步地,一种面向高血压疾病检测的BCG信号分析方法,所述S4中从所挖掘的类关联规则中挑选一组具有较强分类能力的类关联规则是指:首先根据类关联规则的支持度与置信度的分布情况将所有类关联规则划分为若干个簇,使得每个簇中的类关联规则具有相似的支持度和置信度;然后从每个簇中挑选出具有较强分类能力的类关联规则;最后基于训练集数据的覆盖度以及每条类关联规则的冗余度,对上述所得类关联规则进行二次筛选,挑选出覆盖度与冗余度均适中的类关联规则集合。
进一步地,一种面向高血压疾病检测的BCG信号分析方法,所述S5中基于挑选出的类关联规则构建高血压识别模型是指:首先计算每条类关联规则的权重以及其与受试者生理状态之间的相似度,并将所有类关联规则根据其类标签进行分组;然后分别从两组中选择与受试者生理状态相似度最高的若干类关联规则;结合所选出的类关联规则的相似度、权重、类标签信息,进而判断该BCG信号所有者的高血压是否异常。
进一步地,一种面向高血压疾病检测的BCG信号分析方法,所述类关联规则与Instance之间的相似度定义为:
其中,Maxi与Mini分别表示第i个离散化特征的最大序号值与最小序号值;Instancei与CARi分别表示该Instance与该类关联规则的第i个离散化特征的实际序号值;N表示该类关联规则所包含的离散化特征的个数。
进一步地,一种面向高血压疾病检测的BCG信号分析方法,对于某条类关联规则(记为CAR)而言,其对于某个类别(记为A)的权重记为W(CAR,A),所述类关联规则的权重定义如下:
其中,N为CAR所包含的离散化特征的个数,W(itemi,A)表示CAR中第i个离散化特征相对于类别A的权重,其定义如下:
其中,函数freq(itemi,A)表示CAR中第i个离散化特征itemi在类标签为A的类关联规则中出现的频率,表示A的补集,即表示类标签不为A。
进一步地,一种面向高血压疾病检测的BCG信号分析方法,所述识别模型按照如下公式进行识别:
其中,CARi与CARj分别表示从Hypertensive组中挑出的第i个类关联规则以及从Healthy组中挑选出的第j个类关联规则,Simi与Simj分别表示CARi、CARj与Instance的相似度。
本发明的有益效果为:所述的高血压疾病监测方法,可以从非干预式设备所采集的含有大量噪音的BCG信号中,提取精确的心跳间期序列,并基于时域分析、频域分析、非线性域分析从中提取能精确刻画高血压患者生理状态的多维特征,然后借助优化后的Apriori算法充分挖掘能够准确表征特征与特征之间、特征与类标签之间相互关系的类关联规则,并从中挑选具有较强分类能力的规则。最后根据这些类关联规则的相似性及权重信息,构建基于多条类关联规则的分类模型,这极大程度上提升了高血压疾病监测的准确性。此外,该方法生成的类关联规则,可以准确反映受试者的生理状态,便于医生更加深入分析患者的健康水平,这对及时诊断高血压疾病以及维持患者健康水平具有重要意义。
附图说明
图1是本发明一种面向高血压疾病检测的BCG信号分析方法总体流程示意图;
图2是本发明实施例中对BCG信号进行预处理操作并准确定位心跳时刻的示意图;
图3是本发明实施例中对所挖掘的两组类关联规则进行对比的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明的实施例及其附图,对本发明中的技术方案进行清楚、完整地描述。
如图1所示,一种面向高血压疾病检测的BCG信号分析方法,对BCG信号进行归一化和滤波处理,计算心跳间期序列;对心跳间期序列进行时域、频域、非线性域分析,提取能精确刻画高血压患者生理状态的特征,并对其进行离散化处理;从离散化特征中挖掘能够表征特征间相互关系的类关联规则;基于挖掘出的类关联规则的分布、冗余度、覆盖度特性,从中挑选一组具有较强分类能力的类关联规则;根据所挑选出的类关联规则的相似性及权重指标,构建基于类关联规则的高血压识别模型,得到分析结果;包括以下步骤:
S1:对BCG信号进行预处理操作,以消除信号噪音以及受试者个体差异对信号幅值造成的影响,并提取准确的心跳间期序列;
其中,对BCG信号进行预处理操作包括:首先使用Z-score方法对BCG信号进行归一化处理;然后利用椭圆带通滤波器对其进行滤波操作;最后采用交叠滑动窗口算法定位每次心跳的发生时刻,进而提取心跳间期序列。
在本发明实例中,受试者个体差异主要指体重差异,不同的体重会导致胸冲击(BCG)信号强度有所不同,影响高血压疾病监测的准确性。原始BCG信号如图2(a)所示。具体地,首先使用Z-socre方法对BCG信号进行归一化处理,如下公式所示:
其中,μ为BCG信号序列的平均值,σ为信号序列的标准差,Xi是BCG信号序列中第i个信号值,Xnor_i是Xi经过归一化处理后的值。然后,设计椭圆带通滤波器对BCG信号进行滤波操作,以消除与心脏跳动无关的频率成分。鉴于心率的正常范围为60~100次/分钟(高血压患者可能比之较高),为尽可能保全BCG信号中心跳相关信息并消除其它信号噪音,本实例将该椭圆带通滤波器的通带转角频率和阻带转角频率分别设置为为5/6Hz及13/6Hz,通带波纹和阻带衰减分别设置为0.2及8,经过椭圆滤波器处理后的BCG信号如图2(b)所示。最后,从处理后的BCG信号中提取心跳间期序列(心跳间期是指相邻两次心跳的时间间隔)。血压的变化由交感神经与副交感神经共同控制,而心跳间期序列的变化被公认为是交感神经与副交感神经相互作用的最直观表现。因此分析心跳间期序列可以间接地反推某受试者是否患有高血压疾病,这也是本发明的理论基础。本发明实施例采用交叠滑动窗口方法监测BCG近似层信号的波峰,从而计算得到初级的心跳间期序列,如图2(c)所示。具体地,滑动窗口采用矩形窗,其窗口大小设置为100采样点(BCG信号采样频率为100Hz),交叠部分为20采样点,从而使得每个窗口大小等于或略小于一次心跳持续时间,从而保证不遗漏任何可能的心跳信息。每个窗口中最大值所对应的时刻即为该窗口内心跳发生的时刻,并将第i个窗口所对应的时刻记为Ti,则心跳时刻序列T可表示为:
T=T1,T2,…Ti…TN
其中,窗口的个数为N。若将第i个心跳间期记为RRi,则初级心跳间期序列RR可表示为:
RR=RR1,RR2,…RRi,…RRN-1
即:RR=T2-T1,T3-T2,…Ti+1-Ti…TN-TN-1
S2:对S1输出的心跳间期序列进行时域、频域、非线性分析,提取能够准确反映受试者生理状态的多维特征,并对其进行离散化处理;
提取能够刻画高血压患者生理状态的特征并对其进行离散化处理包括:对心跳间期序列进行时域分析,提取中值、均方差与心跳间期序列分布相关的统计信息;对心跳间期序列进行频域分析,计算不同频带所蕴含的信号能量;对心跳间期序列进行非线性域分析,提取样本熵、DFA等能够反映信号复杂度、稳定性的特征;采用等箱分割法将每个特征的值划分成若干区间,并用唯一的标识对每个区间进行标记。
本发明实施例从心跳间期序列中提取有效特征以精确刻画高血压模式。首先对心跳间期进行时域、频域、非线性域分析:进行时域分析时,对心跳间期序列进行统计处理,从中提取的时域特征主要包括心跳间期均值、标准差等;进行频域分析时,对心跳间期序列进行Lomb-Scargle(LS)periodogram能量谱密度估计,然后将频谱中0Hz-0.04Hz频带记为超低频(VLF:Very Low Frequency),0.04Hz-0.15Hz频带记为低频(LF:Low Frequency),0.15Hz-0.4Hz频带记为高频(HF:High Frequency),最终从频域中提取的特征主要包括低频和高频比值(LF/HF)、总能量值等;进行非线性域分析时,主要从心跳间期序列中提取Poincare plot、样本熵、去趋势波动分析等特征,其中样本熵的参数r与m分别设定为r=0.15*STD(standard deviation)和m=2,去趋势波动分析的参数s设定为30≤s≤300。本发明实施例采用等箱法进行特征离散化操作。具体地,针对每个特征,分别选取其采样值的5等分点作为分箱的边界,从而将每个特征离散化为5个区间,并为每个区间进行编号。例如,第一个特征F1的五个区间依次编号为1,2,3,4,5,则下一个特征F2的五个区间编号依次为6,7,8,9,10,以此类推完成特征离散化处理。
S3:从S2输出的离散化特征中,利用优化的Apriori算法,挖掘能够表征特征间相互关系的类关联规则。
从多维特征中挖掘能够表征特征间相互关系的类关联规则是指:对传统Apriori算法的链接、剪枝关键步骤进行优化处理,并基于此从离散化后的特征序列中挖掘出所有含有类标签且满足指定的支持度、置信度要求的关联规则。
在进行类关联规则挖掘前,需要对训练集实例进行规范化表示,第k个实例SLk可表示为:
SLk=<f1,f2,…fi…fn,CL>;
其中,fi表示该实例第i个特征Fi的具体编号值,CL表示该实例所属的类别。
所述Apriori算法能够对挖掘类关联规则过程中最耗时的步骤进行优化,所述优化内容主要包括:
对频繁k-1项集集合的链接操作进行优化:先将频繁K-1项集集合中的元素按照字典序排序,并分别记其中两个频繁K-1项集为L1与L2,在进行链接操作时,若L1<L2,且L1与L2不可链接,则可证明L1与L2之后的频繁K-1项集均无法链接,因此立即停止尝试将L1与L2之后的频繁K-1项集进行链接操作;
对候选K项集集合的剪枝操作进行优化:记任一候选K项集为C,并将C的任意一个K-1项子集记为C1,在进行剪枝操作时,若C1与频繁K-1项集集合(集合中的元素按字典序排列)中的某个元素Lx不相等,且C1<Lx,则可证明C1与Lx之后的所有频繁K-1项集都不可能相等,也即说明C不可能是频繁K项集,故此时可提前从候选K项集集合中删除C;
在进行链接操作前,提前删除频繁K-1项集集合中不可能链接生成频繁K项集的元素:记数据集中所有频繁1项集分别为F1,F2,…,Fn,分别统计频繁K-1项集集合中每个频繁1项集的父集的个数,并记为N1,N2,…,Nn;可证明若某个频繁K-1项集中包含某个父集个数小于K-1的频繁1项集,则该由该频繁K-1项集链接生成的候选K项集不可能是频繁的,因此可以在进行链接操作前删除该频繁K-1项集,从而减少链接操作次数,提升列关联规则挖掘速度。
S4:从S3输出的类关联规则中,根据规则的分布、训练集的覆盖度、规则的冗余度指标,挑选出一组具有较强分类能力的类关联规则;
从所挖掘的类关联规则中挑选一组具有较强分类能力的类关联规则是指:首先根据类关联规则的支持度与置信度的分布情况将所有类关联规则划分为若干个簇,使得每个簇中的类关联规则具有相似的支持度和置信度;然后从每个簇中挑选出具有较强分类能力的类关联规则;最后基于训练集数据的覆盖度以及每条类关联规则的冗余度,对上述所得类关联规则进行二次筛选,挑选出覆盖度与冗余度均适中的类关联规则集合。
首先将所有类关联规则划分成若干组,使得每组中的类关联规则的前K项均相同,即具有相同的前缀。其次从每组中分别挑出长度最长、置信度最大、支持度最大所对应的类关联规则,并将此时挑选出来的类关联规则集合记为RuleSet。然后再对RuleSet进行二次筛选,挑选出具有较强分类能力的类关联规则。二次筛选的步骤如下:1)根据支持度、置信度等信息对RuleSet中的类关联规则进行排序:给定两个规则Rule1与Rule2,则Rule1优先于Rule2,当且仅当满足如下条件:
其中,Sup1、Conf1及Length1,Sup2、Conf2及Length2分别表示Rule1与Rule2的支持度、置信度以及长度。2)结合训练集的覆盖度(Coverage)及每条类关联规则的冗余度(Redundancy),从排序后的类关联规则中,从头至尾地逐个地挑选一组包含冗余信息最少且规则数量适中的子集。其中,Coverage与Redundancy分别定义如下:
其中,NC、NT、NCC及NPC分别代表训练集中可以与当前已选规则集合中的任意一条规则匹配的实例的个数,训练集中实例的总个数、训练集中能与当前规则匹配的实例的个数、NCC中能够与其他已选规则匹配的实例的个数。具体地,从头至尾考察排序后的RuleSet中的每条规则时,先判断当前训练集的Coverage是否小于给定的覆盖度阈值C,若不满足条件,则放弃该规则,继续考察下一条规则;若满足条件,则判断当前规则的Redundancy是否小于给定的冗余度阈值R,若不满足条件,则放弃该规则,继续考察下一条规则;若满足条件,则标记该规则、更新Coverage,并继续考察RuleSet中的下一条规则,直到RuleSet中所有规则均已被考察或训练集的Coveragae已经超过阈值C为止,此时由所有被标记的规则组成集合FinalRuleSet即为从步骤S3所得的类关联规则中挑选出的具有较强分类能力的类关联规则集合。需要注意的是:覆盖度阈值C及冗余度阈值R的具体取值需要由具体的数据集而定,通常采用参数网格法对阈值C与R的取值进行优化,使得C与R的取值能使所构建的高血压识别模型取得最高的准确率。
S5:基于S4输出的类关联规则的相似度、权重指标,构建基于类关联规则;
所述S5中基于挑选出的类关联规则构建高血压识别模型是指:首先计算每条类关联规则的权重以及其与受试者生理状态之间的相似度,并将所有类关联规则根据其类标签进行分组;然后分别从两组中选择与受试者生理状态相似度最高的若干类关联规则;结合所选出的类关联规则的相似度、权重、类标签信息,进而判断该BCG信号所有者的高血压是否异常。
根据类标签的取值将S4挑选出的类关联规则分成两组,并将类标签为“高血压”的类关联规则集合记为hypertensive,将类标签为“健康”的类关联规则集合记为Healthy。由图3可知,两组中的类关联规则能够有效区分高血压病人及健康人的生理健康状态,在判断给定实例(记为Instance)是否患有高血压疾病时,分别从两组规则中挑选K条与该Instance最相似的规则。所述类关联规则与Instance之间的相似度定义为:
其中,Maxi与Mini分别表示第i个离散化特征的最大序号值与最小序号值;Instancei与CARi分别表示该Instance与该类关联规则的第i个离散化特征的实际序号值;N表示该类关联规则所包含的离散化特征的个数。
对于某条类关联规则(记为CAR)而言,其对于某个类别(记为A)的权重记为W(CAR,A),所述类关联规则的权重定义如下:
其中,N为CAR所包含的离散化特征的个数,W(itemi,A)表示CAR中第i个离散化特征相对于类别A的权重,其定义如下:
其中,函数freq(itemi,A)表示CAR中第i个离散化特征itemi在类标签为A的类关联规则中出现的频率,表示A的补集,即表示类标签不为A。
所述识别模型按照如下公式进行识别:
其中,CARi与CARj分别表示从Hypertensive组中挑出的第i个类关联规则以及从Healthy组中挑选出的第j个类关联规则,Simi与Simj分别表示CARi、CARj与Instance的相似度。

Claims (10)

1.一种面向高血压疾病检测的BCG信号分析方法,其特征在于:
对BCG信号进行归一化和滤波处理,计算心跳间期序列;对心跳间期序列进行时域、频域、非线性域分析,提取能精确刻画高血压患者生理状态的特征,并对其进行离散化处理;从离散化特征中挖掘能够表征特征间相互关系的类关联规则;基于挖掘出的类关联规则的分布、冗余度、覆盖度特性,从中挑选一组具有较强分类能力的类关联规则;根据所挑选出的类关联规则的相似性及权重指标,构建基于类关联规则的高血压识别模型,得到分析结果;
包括以下步骤:
S1:对BCG信号进行预处理操作,以消除信号噪音以及受试者个体差异对信号幅值造成的影响,并提取准确的心跳间期序列;
S2:对S1输出的心跳间期序列进行时域、频域、非线性分析,提取能够准确反映受试者生理状态的多维特征,并对其进行离散化处理;
S3:从S2输出的离散化特征中,利用优化的Apriori算法,挖掘能够表征特征间相互关系的类关联规则;
S4:从S3输出的类关联规则中,根据规则的分布、训练集的覆盖度、规则的冗余度指标,挑选出一组具有较强分类能力的类关联规则;
S5:基于S4输出的类关联规则的相似度、权重指标,构建基于类关联规则的高血压识别模型,得到分析结果。
2.根据权利要求1所述的一种面向高血压疾病检测的BCG信号分析方法,其特征在于:所述S2中提取能够刻画高血压患者生理状态的特征并对其进行离散化处理包括:对心跳间期序列进行时域分析,提取中值、均方差与心跳间期序列分布相关的统计信息;对心跳间期序列进行频域分析,计算不同频带所蕴含的信号能量;对心跳间期序列进行非线性域分析,提取样本熵、DFA等能够反映信号复杂度、稳定性的特征;采用等箱分割法将每个特征的值划分成若干区间,并用唯一的标识对每个区间进行标记。
3.根据权利要求1所述的一种面向高血压疾病检测的BCG信号分析方法,其特征在于:所述S3中从多维特征中挖掘能够表征特征间相互关系的类关联规则是指:对传统Apriori算法的链接、剪枝关键步骤进行优化处理,并基于此从离散化后的特征序列中挖掘出所有含有类标签且满足指定的支持度、置信度要求的关联规则。
4.根据权利要求4所述的一种面向高血压疾病检测的BCG信号分析方法,其特征在于:所述S3在进行类关联规则挖掘前,需要对训练集实例进行规范化表示,第k个实例SLk可表示为:
SLk=<f1,f2,…fi…fn,CL>;
其中,fi表示该实例第i个特征Fi的具体编号值,CL表示该实例所属的类别。
5.根据权利要求4所述的一种面向高血压疾病检测的BCG信号分析方法,其特征在于:所述Apriori算法能够对挖掘类关联规则过程中最耗时的步骤进行优化,所述优化内容主要包括:
对频繁k-1项集集合的链接操作进行优化:先将频繁K-1项集集合中的元素按照字典序排序,并分别记其中两个频繁K-1项集为L1与L2,在进行链接操作时,若L1<L2,且L1与L2不可链接,则可证明L1与L2之后的频繁K-1项集均无法链接,因此立即停止尝试将L1与L2之后的频繁K-1项集进行链接操作;
对候选K项集集合的剪枝操作进行优化:记任一候选K项集为C,并将C的任意一个K-1项子集记为C1,在进行剪枝操作时,若C1与频繁K-1项集集合(集合中的元素按字典序排列)中的某个元素Lx不相等,且C1<Lx,则可证明C1与Lx之后的所有频繁K-1项集都不可能相等,也即说明C不可能是频繁K项集,故此时可提前从候选K项集集合中删除C;
在进行链接操作前,提前删除频繁K-1项集集合中不可能链接生成频繁K项集的元素:记数据集中所有频繁1项集分别为F1,F2,…,Fn,分别统计频繁K-1项集集合中每个频繁1项集的父集的个数,并记为N1,N2,…,Nn;可证明若某个频繁K-1项集中包含某个父集个数小于K-1的频繁1项集,则该由该频繁K-1项集链接生成的候选K项集不可能是频繁的,因此可以在进行链接操作前删除该频繁K-1项集,从而减少链接操作次数,提升列关联规则挖掘速度。
6.根据权利要求1所述的一种面向高血压疾病检测的BCG信号分析方法,其特征在于:所述S4中从所挖掘的类关联规则中挑选一组具有较强分类能力的类关联规则是指:首先根据类关联规则的支持度与置信度的分布情况将所有类关联规则划分为若干个簇,使得每个簇中的类关联规则具有相似的支持度和置信度;然后从每个簇中挑选出具有较强分类能力的类关联规则;最后基于训练集数据的覆盖度以及每条类关联规则的冗余度,对上述所得类关联规则进行二次筛选,挑选出覆盖度与冗余度均适中的类关联规则集合。
7.根据权利要求2所述的一种面向高血压疾病检测的BCG信号分析方法,其特征在于:所述S5中基于挑选出的类关联规则构建高血压识别模型是指:首先计算每条类关联规则的权重以及其与受试者生理状态之间的相似度,并将所有类关联规则根据其类标签进行分组;然后分别从两组中选择与受试者生理状态相似度最高的若干类关联规则;结合所选出的类关联规则的相似度、权重、类标签信息,进而判断该BCG信号所有者的高血压是否异常。
8.根据权利要求8所述的一种基于BCG信号的高血压疾病监测方法,其特征在于:所述类关联规则与Instance之间的相似度定义为:
其中,Maxi与Mini分别表示第i个离散化特征的最大序号值与最小序号值;Instancei与CARi分别表示该Instance与该类关联规则的第i个离散化特征的实际序号值;N表示该类关联规则所包含的离散化特征的个数。
9.根据权利要求8所述的一种面向高血压疾病检测的BCG信号分析方法,其特征在于:对于某条类关联规则(记为CAR)而言,其对于某个类别(记为A)的权重记为W(CAR,A),所述类关联规则的权重定义如下:
其中,N为CAR所包含的离散化特征的个数,W(itemi,A)表示CAR中第i个离散化特征相对于类别A的权重,其定义如下:
其中,函数freq(itemi,A)表示CAR中第i个离散化特征itemi在类标签为A的类关联规则中出现的频率,表示A的补集,即表示类标签不为A。
10.根据权利要求8所述的一种面向高血压疾病检测的BCG信号分析方法,其特征在于:所述识别模型按照如下公式进行识别:
其中,CARi与CARj分别表示从Hypertensive组中挑出的第i个类关联规则以及从Healthy组中挑选出的第j个类关联规则,Simi与Simj分别表示CARi、CARj与Instance的相似度。
CN201810708356.9A 2018-07-02 2018-07-02 一种面向高血压疾病检测的bcg信号分析方法 Pending CN109044301A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810708356.9A CN109044301A (zh) 2018-07-02 2018-07-02 一种面向高血压疾病检测的bcg信号分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810708356.9A CN109044301A (zh) 2018-07-02 2018-07-02 一种面向高血压疾病检测的bcg信号分析方法

Publications (1)

Publication Number Publication Date
CN109044301A true CN109044301A (zh) 2018-12-21

Family

ID=64818292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810708356.9A Pending CN109044301A (zh) 2018-07-02 2018-07-02 一种面向高血压疾病检测的bcg信号分析方法

Country Status (1)

Country Link
CN (1) CN109044301A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111067508A (zh) * 2019-12-31 2020-04-28 深圳安视睿信息技术股份有限公司 非临床环境下对高血压进行非干预式的监测和评估方法
CN113925496A (zh) * 2021-10-20 2022-01-14 中国人民解放军海军特色医学中心 一种疲劳睡眠分析方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111067508A (zh) * 2019-12-31 2020-04-28 深圳安视睿信息技术股份有限公司 非临床环境下对高血压进行非干预式的监测和评估方法
CN113925496A (zh) * 2021-10-20 2022-01-14 中国人民解放军海军特色医学中心 一种疲劳睡眠分析方法及装置
CN113925496B (zh) * 2021-10-20 2023-12-19 中国人民解放军海军特色医学中心 一种疲劳睡眠分析方法及装置

Similar Documents

Publication Publication Date Title
CN103110417B (zh) 一种心电图自动识别系统
Chua et al. Cardiac state diagnosis using higher order spectra of heart rate variability
Pecchia et al. Remote health monitoring of heart failure with data mining via CART method on HRV features
CN111772585B (zh) 间期颅内脑电信号中癫痫异常群体活动的数据提取方法
CN109620262A (zh) 一种基于可穿戴手环的情绪识别系统及方法
CN109674468A (zh) 一种单导脑电自动睡眠分期方法
CN109171712A (zh) 心房颤动识别方法、装置、设备及计算机可读存储介质
CN104173046B (zh) 一种色彩标记振幅整合脑电图的提取方法
CN109893126A (zh) 基于脑功能网络特征的癫痫发作预测方法
CN107616793A (zh) 一种具有癫痫发作预测功能的脑电监测装置及方法
CN106943118A (zh) 一种脑电信号监测处理方法
CN109497997A (zh) 基于多数据采集的癫痫发作检测设备及预警系统
Kelwade et al. Radial basis function neural network for prediction of cardiac arrhythmias based on heart rate time series
Geng et al. Epileptic seizure detection based on improved wavelet neural networks in long-term intracranial EEG
Wu et al. A new unsupervised detector of high-frequency oscillations in accurate localization of epileptic seizure onset zones
CN109044301A (zh) 一种面向高血压疾病检测的bcg信号分析方法
Barman et al. Rough set based segmentation and classification model for ECG
Sabor et al. Detection of the interictal epileptic discharges based on wavelet bispectrum interaction and recurrent neural network
Yang et al. Automated intra-patient and inter-patient coronary artery disease and congestive heart failure detection using EFAP-Net
CN110070013B (zh) 一种ecg信号噪声污染程度与类别智能评估方法
CN114366060A (zh) 一种基于心率变异性的健康预警方法、装置及电子设备
Deka et al. Stratification of high-risk hypertensive patients using hybrid heart rate variability features and boosting algorithms
CN108577804A (zh) 一种面向高血压病人监测的bcg信号分析方法及系统
CN110432891A (zh) 一种自动化提取心电节拍的特征提取和分类方法
Romaissa et al. Epileptic seizure detection from imbalanced EEG signal

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181221