CN112336310B - 一种基于fcbf和svm融合的心脏疾病诊断系统 - Google Patents

一种基于fcbf和svm融合的心脏疾病诊断系统 Download PDF

Info

Publication number
CN112336310B
CN112336310B CN202011219116.6A CN202011219116A CN112336310B CN 112336310 B CN112336310 B CN 112336310B CN 202011219116 A CN202011219116 A CN 202011219116A CN 112336310 B CN112336310 B CN 112336310B
Authority
CN
China
Prior art keywords
heart
data
module
matching
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011219116.6A
Other languages
English (en)
Other versions
CN112336310A (zh
Inventor
李宗博
杜登斌
杜小军
杜乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuzheng Intelligent Technology Beijing Co ltd
Original Assignee
Wuzheng Intelligent Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuzheng Intelligent Technology Beijing Co ltd filed Critical Wuzheng Intelligent Technology Beijing Co ltd
Priority to CN202011219116.6A priority Critical patent/CN112336310B/zh
Publication of CN112336310A publication Critical patent/CN112336310A/zh
Application granted granted Critical
Publication of CN112336310B publication Critical patent/CN112336310B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Fuzzy Systems (AREA)
  • Evolutionary Computation (AREA)
  • Pathology (AREA)
  • Mathematical Physics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提出了一种基于FCBF和SVM融合的心脏疾病诊断系统。包括:获取模块,获取心脏基本数据信息,设定数据预处理规则,通过该数据预处理规则对心脏基本数据信息进行处理,得到心脏数据集;剔除模块,建立FCBF算法,根据FCBF算法对心脏数据集进行初步特征选择,并建立心脏初步特征子集;模型构建模块,建立SVM算法,通过SVM算法对心脏初步特征子集进行训练,建立数据匹配模型;匹配模块,获取待匹配心脏样本数据,根据数据匹配模型对心脏样本数据进行匹配,并生成对应匹配报告。本发明通过结合FCBF方法对心脏病数据样本进行特征筛选,然后通过SVM算法构建心脏病预测模型,利用网格搜索策略参数调优,计算待识别的心脏病所属分类类别,提高系统率。

Description

一种基于FCBF和SVM融合的心脏疾病诊断系统
技术领域
本发明涉及人工智能领域,尤其涉及一种基于FCBF和SVM融合的心脏疾病诊断系统。
背景技术
心脏病是一种严重威胁人类,特别是50岁以上中老年人健康的常见病,主要体现在它的渐进性和突发性,具有高患病率、高致残率和高死亡率的特点。一般说来,心脏病起病隐匿,病情发展缓慢,一般会在突发前几周先出现心绞痛,且症状轻重不一,胸部出现紧缩感。另外心脏病还有其他相应的并发症状,如眩晕、气促、出汗、寒颤、恶心、昏厥等症状也尤为常见,严重时会造成患者呼吸困难、心力衰竭等,严重危害患者身体健康。
对心脏病进行早期准确诊断是预防突发死亡、合理制定诊疗方案的有效手段。随着人工智能以及机器学习技术的快速发展,智能诊断方式通过自动读取患者特征数据并输入诊断模型来诊断心脏病,为医生提供医疗决策,降低了人为经验错误的可能性,但是这个过程还是需要医生来进行诊断,如果全靠机器进行智能诊断,那么诊断精确度是一个亟需解决的问题,所以,需要对现有的方法进行改进。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
有鉴于此,本发明提出了一种基于FCBF和SVM融合的心脏疾病诊断系统,旨在解决现有技术无法实现通过FCBF和SVM融合的方式来提高系统诊断的精确度的技术问题。
本发明的技术方案是这样实现的:
一方面,本发明提供了一种基于FCBF和SVM融合的心脏疾病诊断系统,所述基于FCBF和SVM融合的心脏疾病诊断系统包括:
获取模块,用于获取心脏基本数据信息,设定数据预处理规则,通过该数据预处理规则对心脏基本数据信息进行处理,得到心脏数据集;
剔除模块,用于建立FCBF算法,根据FCBF算法对心脏数据集进行初步特征选择,获取心脏初步特征数据,并建立心脏初步特征子集;
模型构建模块,用于建立SVM算法,通过SVM算法对心脏初步特征子集进行训练,根据训练结果建立数据匹配模型;
匹配模块,用于获取待匹配心脏样本数据,根据数据匹配模型对心脏样本数据进行匹配,并生成对应匹配报告。
在以上技术方案的基础上,优选的,获取模块包括预处理模块,用于获取心脏基本数据信息,设定数据预处理规则,所述数据预处理规则包括:类型变换、数据填充以及数据删除,通过数据预处理规则对心脏基本数据信息进行预处理,得到预处理之后的心脏基本数据信息建立心脏数据集。
在以上技术方案的基础上,优选的,获取模块包括标记模块,用于根据心脏基本数据信息获取历史心脏基本数据信息以及对应的疾病标记类别,根据历史心脏基本数据信息以及对应的疾病标注类别对心脏基本数据信息进行疾病标记,与心脏数据集进行关联。
在以上技术方案的基础上,优选的,剔除模块包括特征选择模块,用于建立SVM算法,将心脏数据集作为给定数据集,疾病标记作为样本类别,利用SVM算法通过给定数据集以及样本类别计算得到特征子集作为心脏初步特征子集。
在以上技术方案的基础上,优选的,模型构建模块包括训练模块,用于建立SVM算法,设定划分比例,将心脏初步特征子集按照划分比例划分出训练集以及测试集,对训练集以及测试集进行归一化处理,获取SVM核函数,通过SVM核函数对归一化处理的训练集以及测试集进行训练,并根据训练结果建立数据匹配模型。
在以上技术方案的基础上,优选的,模型构建模块包括优化模块,用于建立网格搜索法,并设定网格搜索变量的范围以及搜索步距,根据网格搜索变量的范围以及搜索步距对数据匹配模型进行参数优化,得到优化后的数据匹配模型。
在以上技术方案的基础上,优选的,匹配模块包括匹配报告生成模块,用于获取待匹配心脏样本数据,通过优化后的数据匹配模型对待匹配心脏样本数据进行训练匹配,根据训练匹配结果,生成对应的匹配报告。
更进一步优选的,所述基于FCBF和SVM融合的心脏疾病诊断设备包括:
获取单元,用于获取心脏基本数据信息,设定数据预处理规则,通过该数据预处理规则对心脏基本数据信息进行处理,得到心脏数据集;
剔除单元,用于建立FCBF算法,根据FCBF算法对心脏数据集进行初步特征选择,获取心脏初步特征数据,并建立心脏初步特征子集;
模型构建单元,用于建立SVM算法,通过SVM算法对心脏初步特征子集进行训练,根据训练结果建立数据匹配模型;
匹配单元,用于获取待匹配心脏样本数据,根据数据匹配模型对心脏样本数据进行匹配,并生成对应匹配报告。
本发明的一种基于FCBF和SVM融合的心脏疾病诊断系统相对于现有技术具有以下有益效果:
(1)通过利用FCBF方法删除冗余或不相关的特征完成特征筛选,能够提高后续数据匹配的精确度。
(2)通过利用SVM算法搭建心脏病诊断模型,通过心脏病诊断模型建立对应数据匹配模型,能够实现对数据的精确匹配,提高系统计算效率。
(3)通过利用网格搜索策略参数调优,计算待识别的心脏病所属分类类别,提高疾病预测准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明基于FCBF和SVM融合的心脏疾病诊断系统第一实施例的结构框图;
图2为本发明基于FCBF和SVM融合的心脏疾病诊断系统的第二实施例结构框图;
图3为本发明基于FCBF和SVM融合的心脏疾病诊断系统的第三实施例结构框图;
图4为本发明基于FCBF和SVM融合的心脏疾病诊断系统的第四实施例结构框图;
图5为本发明基于FCBF和SVM融合的心脏疾病诊断系统的第五实施例结构框图;
图6为本发明基于FCBF和SVM融合的心脏疾病诊断设备结构框图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,图1为本发明基于FCBF和SVM融合的心脏疾病诊断系统第一实施例的结构框图。其中,所述基于FCBF和SVM融合的心脏疾病诊断系统包括:获取模块10、剔除模块20、模型构建模块30和匹配模块40。
获取模块10,用于获取心脏基本数据信息,设定数据预处理规则,通过该数据预处理规则对心脏基本数据信息进行处理,得到心脏数据集;
剔除模块20,用于建立FCBF算法,根据FCBF算法对心脏数据集进行初步特征选择,获取心脏初步特征数据,并建立心脏初步特征子集;
模型构建模块30,用于建立SVM算法,通过SVM算法对心脏初步特征子集进行训练,根据训练结果建立数据匹配模型;
匹配模块40,用于获取待匹配心脏样本数据,根据数据匹配模型对心脏样本数据进行匹配,并生成对应匹配报告。
进一步地,如图2所示,基于上述各实施例提出本发明基于FCBF和SVM融合的心脏疾病诊断系统的第二实施例结构框图,在本实施例中,获取模块10还包括:
预处理模块101,用于获取心脏基本数据信息,设定数据预处理规则,所述数据预处理规则包括:类型变换、数据填充以及数据删除,通过数据预处理规则对心脏基本数据信息进行预处理,得到预处理之后的心脏基本数据信息建立心脏数据集。
标记模块102,用于根据心脏基本数据信息获取历史心脏基本数据信息以及对应的疾病标记类别,根据历史心脏基本数据信息以及对应的疾病标注类别对心脏基本数据信息进行疾病标记,与心脏数据集进行关联。
应当理解的是,本实施例中系统首先会获取心脏基本数据信息,设定数据预处理规则,所述数据预处理规则包括:类型变换、数据填充以及数据删除,通过数据预处理规则对心脏基本数据信息进行预处理,得到预处理之后的心脏基本数据信息建立心脏数据集。
应当理解的是,数据预处理即对不规整、不统一的数据进行类型变换,数据填充、数据删除等操作。数据转换包括二值型数据转换(例如性别字段“男”或“女”,即可分别表示“0”或“1”)、多值型数据转换(例如胸痛类型“典型心绞痛”、“非典型心绞痛”、“非心绞痛”、“无症状”,即可转换为“1”、“2”、“3”、“4”)。数据填充即对各项目(患者id、社保id、年龄、性别、胸痛部位、胸痛类型、血压、血清胆固醇、糖尿病史、冠心病史、空腹血糖、达到的最大心率、荧光透视法检查主要血管的数量、缺陷类型、高峰运动ST段的斜率、运动是否诱发的心绞痛、静息心电图、吸烟、饮酒等)相关空值字段进行均值填充,用以提高模型训练的精准性。
应当理解的是,之后系统会根据心脏基本数据信息获取历史心脏基本数据信息以及对应的疾病标记类别,根据历史心脏基本数据信息以及对应的疾病标注类别对心脏基本数据信息进行疾病标记,同时与心脏数据集进行关联。
应当理解的是,疾病类型标注为单一患病,即类别标签只对应类别集合(风湿性心脏病、先天性心脏病、限制型心脏病、慢性肺源性心脏病、高血压性心肌病、甲亢性心脏病、糖尿病心脏病、高原性心脏病、冠心病、心肌病)中的一种。
进一步地,如图3所示,基于上述各实施例提出本发明基于FCBF和SVM融合的心脏疾病诊断系统的第三实施例结构框图,在本实施例中,剔除模块20还包括:
特征选择模块201,用于建立SVM算法,将心脏数据集作为给定数据集,疾病标记作为样本类别,利用SVM算法通过给定数据集以及样本类别计算得到特征子集作为心脏初步特征子集。
应当理解的是,为了建立心脏初步特征子集,本实施例中通过建立SVM算法,将心脏数据集作为给定数据集,疾病标记作为样本类别,利用SVM算法通过给定数据集以及样本类别计算得到特征子集作为心脏初步特征子集。
应当理解的是,利用特征选择单元通过FCBF(Fast Correlation Based Filter)算法对数据集进行初步特征选择,可以有效剔除掉数据集中冗余特征及噪声。本实施例中数据样本涉及数据字段总量70余项,显然存在对模型训练无关的特征字段。特征选择作为机器学习的预处理步骤,可以有效地减少维数,删除不相关的数据,提高学习准确性并提高结果的可理解性。FCBF算法作为一种新颖的启发式序列后向快速滤波方法,利用对称不确定(symmetrical uncertainty,SU)作为度量标准来衡量特征间的相关性,可以有效识别相关特征以及相关特征之间的冗余性,而无需进行成对相关分析,加快了模型训练时的收敛速度并节约了时间开销。
具体步骤如下:给定数据集(xi,ti),i=1,2,…,N,其中xi=[xi1,xi2,…,xid]T∈Rn,ti=[ti1,ti2,…,tim]T∈Rm,样本类别为Y=(y1,y2,…,yN)。
则FCBF算法过程描述如下:
1)初始化特征向量集合T和特征子集S;
2)对于每个ti∈T,计算特征与类别的SU值,即SU(ti,Y),计算公式为
3)筛选出T中SU(ti,Y)>r的特征,并根据SU值大小进行降序排列,最后存入S`中;
4)从S`中选择一个特征ti,将ti存入S集合中,并从S`中删除ti
5)计算ti与tj的对称不确定性值SU(ti,tj),删除tj的冗余特征,如果SU(ti,tj)>SU(ti,Y),则从S`中删除ti
6)重复步骤4)和步骤5),直到S`为空集;
7)最后输出得到的特征子集S;
由上述算法过程可知,如果一个特征与类别之间的不确定性程度高,且与其他已选特征之间的不确定性程度低,则将该特征标记为重要特征,通过迭代计算等操作,得到与类别最相关的特征子集,即筛选出14个特征字段“年龄(心脏病的最重要风险因素,据估计,死于心脏病的人中有82%年满65岁)”、“性别(男性比绝经前的女性患心脏病的风险更高。如果女性患有糖尿病,则与糖尿病男性相比,更容易患心脏病)”、“胸痛类型(心肌没有得到足够的富氧血液时引起的胸痛或不适。常会出现在肩膀,手臂,脖子,下巴或背部,尤其是胸口)”、“血清胆固醇(高水平的低密度脂蛋白(LDL)胆固醇最有可能使动脉狭窄,另外高甘油三酸酯也增加了患心脏病的风险)”、“静息心电图(对于罹患心血管疾病风险较低的人,可以早期得出异常体征信息,并需进一步评估筛查)”、“达到的最大心率(心率过度加快导致心脏血管风险大幅度增加,研究表明心率每分钟增加10次搏动造成心脏死亡风险增加至少20%)”、“运动是否诱发的心绞痛(与心绞痛相关的疼痛,通常会感到紧绷,抓紧或挤压,轻度至重度不等。心绞痛通常在胸部中央,可能会蔓延到一个或两个肩膀,或背部,颈部,下巴或手臂。心绞痛类型有稳定型心绞痛、不稳定型心绞痛、微血管性心绞痛)”、“空腹血糖(胰腺分泌的胰岛素过多或对胰岛素的作用不耐受会导致人体血糖水平升高,增加患心脏病的风险)”等。
进一步地,如图4所示,基于上述各实施例提出本发明基于FCBF和SVM融合的心脏疾病诊断系统的第四实施例结构框图,在本实施例中,模型构建模块30包括:
训练模块301,用于建立SVM算法,设定划分比例,将心脏初步特征子集按照划分比例划分出训练集以及测试集,对训练集以及测试集进行归一化处理,获取SVM核函数,通过SVM核函数对归一化处理的训练集以及测试集进行训练,并根据训练结果建立数据匹配模型。
优化模块302,用于建立网格搜索法,并设定网格搜索变量的范围以及搜索步距,根据网格搜索变量的范围以及搜索步距对数据匹配模型进行参数优化,得到优化后的数据匹配模型。
应当理解的是,本实施例之后会通过SVM算法建立数据匹配模型。作为一种泛化能力较好的智能学习算法,SVM算法是一个有监督的学习模型,主要应用在模式识别、分类以及回归分析等领域。基于结构风险最小化原则,支持向量机利用统计学习理论可以在样本信息有限的情况下,在模型的复杂性和学习能力之间寻找最佳折中,从而获得最优性能。利用SVM实现分类的基本流程如下:
1)将样本数据特征子集按比例划分为带有对应标签类别的训练集(70%)、测试集(30%);
2)归一化处理;通常学习样本不同指标间量纲不同且数值相差较大,往往造成某些大数值信息掩盖重要的小数值信息,因此为提高分类准确率,需对样本数据进行归一化处理。归一化转化公式为Xi、=(Xi-Xmin)/(Xmax-Xmin),其中Xi,Xi、分别表示第i个学习样本的数值和其相对应的归一化后的数值;Xmin,Xmax分别表示各个指标的最小值、最大值。
3)选取合适的核函数;SVM的核函数十分丰富,使用不同的核函数,对学习任务会产生很大变化,最终会影响算法精度。基于此疾病预测任务属非线性类学习任务,因此选取功能强大的径向基核函数RBF,其公式为K(x,xi)=exp(-γ||x-xi||2),γ>0。
4)将划分后的训练集输入模型,训练SVM,即可建立数据匹配模型。
应当理解的是,建立了数据匹配模型之后,为了对模型进一步优化,以此提高数据匹配过程中的精确度,系统还会通过网格搜索法对SVM进行参数调优,进行模型优化。
应当理解的是,关于SVM参数的优化选取,一般通过大量的实验比较来确定参数,这种方法不仅浪费时间,而且不易寻得最优参数。网格搜索法是将待搜索参数在一定的空间范围中划分成网格,通过遍历网格中所有的点来寻找最优参数。这种方法在寻优区间足够大且步距足够小的情况下可以找出全局最优解,具体寻优过程如下:
1)设定网格搜索变量(C,g)的范围及搜索步距。其中C的初始设置为[2-8,28],g的初始设置为[2-9,23],初始步距为0.6。
2)采用K-CV交叉验证方式对各训练集进行训练测试,其中K值设定为6,得到使SVM分类准确率最高的局部最优参数即C=1.05、g=0.00082.最后根据得到的最优局部参数,选择临近搜索区间进行二次寻优,步距与1)中步距相等。上述过程具有不易过早收敛且易于快速定位参数空间等特点,可高效实现参数调优。
进一步地,如图5所示,基于上述各实施例提出本发明基于FCBF和SVM融合的心脏疾病诊断系统的第五实施例结构框图,在本实施例中,匹配模块40包括:
匹配报告生成模块401,用于获取待匹配心脏样本数据,通过优化后的数据匹配模型对待匹配心脏样本数据进行训练匹配,根据训练匹配结果,生成对应的匹配报告。
应当理解的是,最后系统会通过数据匹配模型对获取的待匹配心脏样本数据进行预测,推导可能的疾病类别。将上述实施例中划分后的测试集输入参数优化后的SVM模型,测试模型的准确率。通过比较发现,充分利用FCBF筛选特征数据后,并引入网格空间搜索策略计算最优参数解,能够显著提高SVM基本分类器的准确率,并且在训练过程中加快了模型的收敛速度,节约了计算时间成本,最终可提高预测模型的泛化能力。可见通过收集分析所需心脏病相关数据信息,使用必要的预处理方法,采用合适的机器学习建模方法,在对相关心脏病患者的诊断预测方面,可为临床医生提供一定帮助。
需要说明的是,以上仅为举例说明,并不对本申请的技术方案构成任何限定。
通过上述描述不难发现,本实施例提出了一种基于FCBF和SVM融合的心脏疾病诊断系统,包括:获取模块,用于获取心脏基本数据信息,设定数据预处理规则,通过该数据预处理规则对心脏基本数据信息进行处理,得到心脏数据集;剔除模块,用于建立FCBF算法,根据FCBF算法对心脏数据集进行初步特征选择,获取心脏初步特征数据,并建立心脏初步特征子集;模型构建模块,用于建立SVM算法,通过SVM算法对心脏初步特征子集进行训练,根据训练结果建立数据匹配模型;匹配模块,用于获取待匹配心脏样本数据,根据数据匹配模型对心脏样本数据进行匹配,并生成对应匹配报告。本实施例通过结合FCBF方法对心脏病数据样本进行特征筛选,然后通过SVM算法构建心脏病预测模型,利用网格搜索策略参数调优,计算待识别的心脏病所属分类类别,提高系统率。
此外,本发明实施例还提出一种基于FCBF和SVM融合的心脏疾病诊断设备。如图6所示,该基于FCBF和SVM融合的心脏疾病诊断设备包括:获取单元10、剔除单元20、模型构建单元30以及匹配单元40。
获取单元10,用于获取心脏基本数据信息,设定数据预处理规则,通过该数据预处理规则对心脏基本数据信息进行处理,得到心脏数据集;
剔除单元20,用于建立FCBF算法,根据FCBF算法对心脏数据集进行初步特征选择,获取心脏初步特征数据,并建立心脏初步特征子集;
模型构建单元30,用于建立SVM算法,通过SVM算法对心脏初步特征子集进行训练,根据训练结果建立数据匹配模型;
匹配单元40,用于获取待匹配心脏样本数据,根据数据匹配模型对心脏样本数据进行匹配,并生成对应匹配报告。
此外,需要说明的是,以上所描述的装置实施例仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于FCBF和SVM融合的心脏疾病诊断系统,此处不再赘述。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种基于FCBF和SVM融合的心脏疾病诊断系统,其特征在于,所述基于FCBF和SVM融合的心脏疾病诊断系统包括:
获取模块,用于获取心脏基本数据信息,设定数据预处理规则,通过该数据预处理规则对心脏基本数据信息进行处理,得到心脏数据集,所述获取模块包括预处理模块,用于获取心脏基本数据信息,设定数据预处理规则,所述数据预处理规则包括:类型变换、数据填充以及数据删除,通过数据预处理规则对心脏基本数据信息进行预处理,得到预处理之后的心脏基本数据信息建立心脏数据集,所述获取模块包括标记模块,用于根据心脏基本数据信息获取历史心脏基本数据信息以及对应的疾病标记类别,根据历史心脏基本数据信息以及对应的疾病标注类别对心脏基本数据信息进行疾病标记,与心脏数据集进行关联;
剔除模块,用于建立FCBF算法,根据FCBF算法对心脏数据集进行初步特征选择,获取心脏初步特征数据,并建立心脏初步特征子集,所述剔除模块包括特征选择模块,用于建立SVM算法,将心脏数据集作为给定数据集,疾病标记作为样本类别,利用SVM算法通过给定数据集以及样本类别计算得到特征子集作为心脏初步特征子集;
模型构建模块,用于建立SVM算法,通过SVM算法对心脏初步特征子集进行训练,根据训练结果建立数据匹配模型,所述模型构建模块包括训练模块,用于建立SVM算法,设定划分比例,将心脏初步特征子集按照划分比例划分出训练集以及测试集,对训练集以及测试集进行归一化处理,获取SVM核函数,通过SVM核函数对归一化处理的训练集以及测试集进行训练,并根据训练结果建立数据匹配模型,所述模型构建模块包括优化模块,用于建立网格搜索法,并设定网格搜索变量的范围以及搜索步距,根据网格搜索变量的范围以及搜索步距对数据匹配模型进行参数优化,得到优化后的数据匹配模型;
所述根据网格搜索变量的范围以及搜索步距对数据匹配模型进行参数优化,得到优化后的数据匹配模型,具体包括:
设定网格搜索变量(C,g)的范围及搜索步距,其中C的初始设置为[2-8,28],g的初始设置为[2-9,23],初始步距为0.6;
采用K-CV交叉验证方式对各训练集进行训练测试,其中K值设定为6,得到使SVM分类准确率最高的局部最优参数即C=1.05、g=0.00082.最后根据得到的最优局部参数,选择临近搜索区间进行二次寻优,步距为0.6;
匹配模块,用于获取待匹配心脏样本数据,根据数据匹配模型对心脏样本数据进行匹配,并生成对应匹配报告,所述匹配模块包括匹配报告生成模块,用于获取待匹配心脏样本数据,通过优化后的数据匹配模型对待匹配心脏样本数据进行训练匹配,根据训练匹配结果,生成对应的匹配报告。
2.一种基于FCBF和SVM融合的心脏疾病诊断设备,其特征在于,所述基于FCBF和SVM融合的心脏疾病诊断设备包括:
获取模块,用于获取心脏基本数据信息,设定数据预处理规则,通过该数据预处理规则对心脏基本数据信息进行处理,得到心脏数据集,所述获取模块包括预处理模块,用于获取心脏基本数据信息,设定数据预处理规则,所述数据预处理规则包括:类型变换、数据填充以及数据删除,通过数据预处理规则对心脏基本数据信息进行预处理,得到预处理之后的心脏基本数据信息建立心脏数据集,所述获取模块包括标记模块,用于根据心脏基本数据信息获取历史心脏基本数据信息以及对应的疾病标记类别,根据历史心脏基本数据信息以及对应的疾病标注类别对心脏基本数据信息进行疾病标记,与心脏数据集进行关联;
剔除模块,用于建立FCBF算法,根据FCBF算法对心脏数据集进行初步特征选择,获取心脏初步特征数据,并建立心脏初步特征子集,所述剔除模块包括特征选择模块,用于建立SVM算法,将心脏数据集作为给定数据集,疾病标记作为样本类别,利用SVM算法通过给定数据集以及样本类别计算得到特征子集作为心脏初步特征子集;
模型构建模块,用于建立SVM算法,通过SVM算法对心脏初步特征子集进行训练,根据训练结果建立数据匹配模型,所述模型构建模块包括训练模块,用于建立SVM算法,设定划分比例,将心脏初步特征子集按照划分比例划分出训练集以及测试集,对训练集以及测试集进行归一化处理,获取SVM核函数,通过SVM核函数对归一化处理的训练集以及测试集进行训练,并根据训练结果建立数据匹配模型,所述模型构建模块包括优化模块,用于建立网格搜索法,并设定网格搜索变量的范围以及搜索步距,根据网格搜索变量的范围以及搜索步距对数据匹配模型进行参数优化,得到优化后的数据匹配模型;
所述根据网格搜索变量的范围以及搜索步距对数据匹配模型进行参数优化,得到优化后的数据匹配模型,具体包括:
设定网格搜索变量(C,g)的范围及搜索步距,其中C的初始设置为[2-8,28],g的初始设置为[2-9,23],初始步距为0.6;
采用K-CV交叉验证方式对各训练集进行训练测试,其中K值设定为6,得到使SVM分类准确率最高的局部最优参数即C=1.05、g=0.00082.最后根据得到的最优局部参数,选择临近搜索区间进行二次寻优,步距为0.6;
匹配模块,用于获取待匹配心脏样本数据,根据数据匹配模型对心脏样本数据进行匹配,并生成对应匹配报告,所述匹配模块包括匹配报告生成模块,用于获取待匹配心脏样本数据,通过优化后的数据匹配模型对待匹配心脏样本数据进行训练匹配,根据训练匹配结果,生成对应的匹配报告。
CN202011219116.6A 2020-11-04 2020-11-04 一种基于fcbf和svm融合的心脏疾病诊断系统 Active CN112336310B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011219116.6A CN112336310B (zh) 2020-11-04 2020-11-04 一种基于fcbf和svm融合的心脏疾病诊断系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011219116.6A CN112336310B (zh) 2020-11-04 2020-11-04 一种基于fcbf和svm融合的心脏疾病诊断系统

Publications (2)

Publication Number Publication Date
CN112336310A CN112336310A (zh) 2021-02-09
CN112336310B true CN112336310B (zh) 2024-03-08

Family

ID=74430030

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011219116.6A Active CN112336310B (zh) 2020-11-04 2020-11-04 一种基于fcbf和svm融合的心脏疾病诊断系统

Country Status (1)

Country Link
CN (1) CN112336310B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113223701A (zh) * 2021-05-16 2021-08-06 河海大学 基于Transformer-MHP模型的突发心脏病预测方法

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886184A (zh) * 2014-03-03 2014-06-25 浙江大学 一种心脏病理识别模型的构建方法
CN104200087A (zh) * 2014-06-05 2014-12-10 清华大学 用于机器学习的参数寻优及特征调优的方法及系统
CN105719285A (zh) * 2016-01-19 2016-06-29 东南大学 一种基于方向倒角距离特征的行人检测方法
CN107358253A (zh) * 2017-06-12 2017-11-17 中国地质大学(武汉) 一种基于差分演化的自适应集成学习方法及系统
CN108647614A (zh) * 2018-04-28 2018-10-12 吉林大学 心电图心拍分类识别方法及系统
CN109480833A (zh) * 2018-08-30 2019-03-19 北京航空航天大学 基于人工智能的癫痫患者脑电信号的预处理和识别方法
CN109645990A (zh) * 2018-08-30 2019-04-19 北京航空航天大学 一种癫痫患者脑电信号的计算机模式识别方法
KR20190058858A (ko) * 2017-11-22 2019-05-30 서울대학교병원 스마트장치를 이용한 심혈관 질환의 진단정보 제공방법 및 이를 위한 심음 애플리케이션
CN109871872A (zh) * 2019-01-17 2019-06-11 西安交通大学 一种基于壳向量式svm增量学习模型的流量实时分类方法
CN110008983A (zh) * 2019-01-17 2019-07-12 西安交通大学 一种基于分布式模糊支持向量机的自适应模型的网络流量分类方法
CN111110192A (zh) * 2019-12-26 2020-05-08 北京中润普达信息技术有限公司 一种皮肤异常症状辅助诊断系统
CN111180009A (zh) * 2020-01-03 2020-05-19 山东大学 一种基于基因组分析的癌症分期预测系统
CN111243751A (zh) * 2020-01-17 2020-06-05 河北工业大学 一种基于双重特征选择和XGBoost算法的心脏病预测方法
CN111329455A (zh) * 2020-03-18 2020-06-26 南京润楠医疗电子研究院有限公司 一种非接触式的心血管健康评估方法
WO2020133639A1 (zh) * 2018-12-29 2020-07-02 东北大学 一种管道内检测漏磁数据智能分析系统
CN111710411A (zh) * 2020-05-29 2020-09-25 中润普达(十堰)大数据中心有限公司 一种基于血脂检查指标智能推测疾病系统
CN111770720A (zh) * 2018-01-17 2020-10-13 奥迪思医疗公司 用于实时拉曼光谱法以进行癌症检测的系统和方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9271678B2 (en) * 2011-04-08 2016-03-01 Siemens Aktiengesellschaft Constrained registration for motion compensation in atrial fibrillation ablation procedures
WO2015087148A1 (en) * 2013-12-12 2015-06-18 Indian Institute Of Technology Delhi Hauz Khas Classifying test data based on a maximum margin classifier
US11199904B2 (en) * 2017-10-06 2021-12-14 Holland Bloorview Kids Rehabilitation Hospital Brain-computer interface platform and process for classification of covert speech

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886184A (zh) * 2014-03-03 2014-06-25 浙江大学 一种心脏病理识别模型的构建方法
CN104200087A (zh) * 2014-06-05 2014-12-10 清华大学 用于机器学习的参数寻优及特征调优的方法及系统
CN105719285A (zh) * 2016-01-19 2016-06-29 东南大学 一种基于方向倒角距离特征的行人检测方法
CN107358253A (zh) * 2017-06-12 2017-11-17 中国地质大学(武汉) 一种基于差分演化的自适应集成学习方法及系统
KR20190058858A (ko) * 2017-11-22 2019-05-30 서울대학교병원 스마트장치를 이용한 심혈관 질환의 진단정보 제공방법 및 이를 위한 심음 애플리케이션
CN111770720A (zh) * 2018-01-17 2020-10-13 奥迪思医疗公司 用于实时拉曼光谱法以进行癌症检测的系统和方法
CN108647614A (zh) * 2018-04-28 2018-10-12 吉林大学 心电图心拍分类识别方法及系统
CN109480833A (zh) * 2018-08-30 2019-03-19 北京航空航天大学 基于人工智能的癫痫患者脑电信号的预处理和识别方法
CN109645990A (zh) * 2018-08-30 2019-04-19 北京航空航天大学 一种癫痫患者脑电信号的计算机模式识别方法
WO2020133639A1 (zh) * 2018-12-29 2020-07-02 东北大学 一种管道内检测漏磁数据智能分析系统
CN109871872A (zh) * 2019-01-17 2019-06-11 西安交通大学 一种基于壳向量式svm增量学习模型的流量实时分类方法
CN110008983A (zh) * 2019-01-17 2019-07-12 西安交通大学 一种基于分布式模糊支持向量机的自适应模型的网络流量分类方法
CN111110192A (zh) * 2019-12-26 2020-05-08 北京中润普达信息技术有限公司 一种皮肤异常症状辅助诊断系统
CN111180009A (zh) * 2020-01-03 2020-05-19 山东大学 一种基于基因组分析的癌症分期预测系统
CN111243751A (zh) * 2020-01-17 2020-06-05 河北工业大学 一种基于双重特征选择和XGBoost算法的心脏病预测方法
CN111329455A (zh) * 2020-03-18 2020-06-26 南京润楠医疗电子研究院有限公司 一种非接触式的心血管健康评估方法
CN111710411A (zh) * 2020-05-29 2020-09-25 中润普达(十堰)大数据中心有限公司 一种基于血脂检查指标智能推测疾病系统

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
A comprehensive study of elven feature selection algorithms and their impact on text classification;Suchi Vora 等;《IEEE》;全文 *
An improved clear cell renal cell carcinoma stage prediction model based on gene sets;Li F. 等;《BMC bioinformatics》;全文 *
Applying Improved SVM Classifier for Leukemia Cancer Classification using FCBF;Kavitha KR,et al.;《2017 International Conference on Advances in Computing, Communications and Informatics》;第61-66页 *
Ranjan, G.S.K. ; Kumar Verma,A. ; Radhika,S..K-Nearest Neighbors and Grid Search CV Based Real Time Fault Monitoring System for Industries.《2019 IEEE 5th International Conference for Convergence inTechnology(I2CT)》.2020,全文. *
动态感知敏感时空序列规则的匿名保护;黄慧慧;《中国优秀硕士学位论文全文数据库信息科技辑》;20160515;全文 *
数据流下多维序列的无监督异常检测技术研究;杨东升;《中国优秀硕士学位论文全文数据库信息科技辑》;全文 *

Also Published As

Publication number Publication date
CN112336310A (zh) 2021-02-09

Similar Documents

Publication Publication Date Title
Krishnani et al. Prediction of coronary heart disease using supervised machine learning algorithms
Lutimath et al. Prediction of heart disease using machine learning
JP2018067303A (ja) 診断支援方法、プログラム、及び装置
CN108492877B (zh) 一种基于ds证据理论的心血管病辅助预测方法
Patidar et al. Comparative analysis of machine learning algorithms for heart disease predictions
CN111951965B (zh) 基于时序知识图谱的全景式健康动态监测与预测系统
Baidya et al. A deep prediction of chronic kidney disease by employing machine learning method
CN112336310B (zh) 一种基于fcbf和svm融合的心脏疾病诊断系统
CN115565660A (zh) 一种基于特征识别的医疗影像数据共享管理系统
Nagadeepa et al. Artificial intelligence based cervical cancer risk prediction using m1 algorithms
Nguyen et al. Heart disease classification using novel heterogeneous ensemble
Biswas et al. A robust deep learning based prediction system of heart disease using a combination of five datasets
JP7365747B1 (ja) 階層図ニューラルネットワークに基づく疾患診療過程異常識別システム
Akbaş et al. Assessment of association rules based on certainty factor: an application on heart data set
Manjunathan et al. Cardiovascular disease prediction using enhanced support vector machine algorithm
CN112365992A (zh) 一种基于nrs-lda的医疗体检数据识别分析方法
Ashisha et al. Early Diabetes prediction with optimal feature selection using ML based Prediction Framework
Gholami Developing algorithms for the analysis of retinal Optical Coherence Tomography images
Hemanth et al. Diabetic Retinopathy Prediction and Analysis Using Ensemble Classifier in Deep Learning Technique
Priya et al. A novel intelligent diagnosis and disease prediction algorithm in green cloud using machine learning approach
Almutairi An Optimized Feature Selection and Hyperparameter Tuning Framework for Automated Heart Disease Diagnosis.
CN214505007U (zh) 一种医用心电图智能分析系统
Aggarwal et al. MLPPCA: Heart Disease Detection using Machine learning
Kaliraman et al. Performance of Diverse Machine Learning Algorithms for Heart Disease Prognosis
Kaliraman et al. 1 Performance of Diverse

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant