CN106971067A - 丙种球蛋白无反应型川崎病的预测方法及预测系统 - Google Patents
丙种球蛋白无反应型川崎病的预测方法及预测系统 Download PDFInfo
- Publication number
- CN106971067A CN106971067A CN201710161648.0A CN201710161648A CN106971067A CN 106971067 A CN106971067 A CN 106971067A CN 201710161648 A CN201710161648 A CN 201710161648A CN 106971067 A CN106971067 A CN 106971067A
- Authority
- CN
- China
- Prior art keywords
- classification
- values
- svm
- discrete
- crp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Pathology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明提供的丙种球蛋白无反应型川崎病的预测方法及系统,所述方法包括以下步骤:采集建立SVM模型的21项原始参数;建模原始参数包括:性别,年龄,就诊时发热时间,临床分型,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值,丙球蛋白使用时间,以及临床诊断症状指标;临床诊断症状指标包括:结膜充血,皮疹,口唇皲裂,杨梅舌,颈淋巴结肿大,手足硬肿,指趾脱皮,肛周脱皮,卡疤红肿;对原始参数做离散化处理以获得原始参数对应的SVM特征值;以SVM特征值为基础数据构建SVM模型,并通过SVM模型预测川崎病的丙种球蛋白无反应并发症。本发明可以对病人进行早期干预治疗,促进冠状动脉损伤的恢复,对将来川崎病的诊治具有重要意义和价值。
Description
技术领域
本发明属于超声诊断成像领域,涉及一种丙种球蛋白无反应型川崎病的预测方法及预测系统。
背景技术
川崎病(Kawasakidisease,KD)是一种好发于幼儿的全身性血管炎综合征。1967年由日本学者川崎富作首次报告。大量的流行病学调查显示,本病具有好发于亚洲人群、明显季节性、高发于男性及高发于婴幼儿等特点。目前国际上公认川崎病是儿童后天性心脏病的首位病因。2004年美国心脏病协会根据循证医学依据提出:川崎病血管内皮功能持续性障碍(endothelialdysfunction,ECD),可能是冠状动脉粥样硬化、缺血性心脏病发生的新的危险因素。因此,川崎病血管损伤及内皮功能障碍的预警研究在其并发症防治的过程中具有重要意义。
目前认为在急性期给予大剂量丙种球蛋白(Intravenousimmunoglobulin,IVIG)治疗能降低冠状动脉损伤风险,但有15-20%左右病人为IVIG不敏感型川崎病,而研究表明,IVIG不敏感型川崎病合并冠状动脉损害的几率是IVIG敏感者的九倍。由于丙种球蛋白无反应型川崎病合并冠状动脉损害几率较丙种球蛋白敏感型川崎病高,若能早期发现丙种球蛋白不敏感型川崎病,并对其进行早期干预治疗,可减少冠状动脉损伤机率。
现有技术中,主要采用以下几种方案预警川崎病丙种球蛋白无反应,日本先后有三位学者进行多中心研究提出丙种球蛋白无反应的预测评分系统。KobayashiT对日本13家医疗机构2000年到2006年780名病人数据进行总结,得出丙种球蛋白高危因素评分系统:血清钠:133mmol/L,2分;初始治疗时间≤4天,2分;谷草转氨酶≥100IU/L,2分;中性粒细胞≥80%,2分;C反应蛋白RP≥10mg/dL,1分;年龄≤12个月,1分;血小板计数≤300×109/L,1分,0-3分为低风险,丙种球蛋白不敏感机率只有5%,≥4分为高风险,丙种球蛋白不敏感发生机率为43%,当评分≥7分时,丙种球蛋白不敏感和冠状动脉损害发生机率尤其高,分别为75%和36%。
TetsuyaSano研究了1999-2000年的112名川崎病患儿后提出C反应蛋白≥7mg/dL,总胆红素≥0.9mg/dL,谷草转氨酶≥200IU/L三个指标预测川崎病丙种球蛋白无反应,二个或二个以上指标达到上述标准即提示丙种球蛋白无反应。
EGAMIK对1998-2004的320名日本川崎病病人数据分析后提出:婴儿年龄小于6月,于病程4天之内进行治疗的病人,血小板计数≤300×109/L,C反应蛋白≥8mg/dL,各计1分,谷丙转氨酶≥80IU/L计2分,以3分为界,大于3分为高风险,敏感度为78%,特异度为76%,用此评分预测冠状动脉损害,敏感度为61%,特异度为81%,阳性预测值和阴性预测值分别为25%and87%。
AdrianaH提出当地的丙种球蛋白预测系统:杆状核细胞百分比≥20%(2分),谷丙转氨酶≥60IU/L(1分),根据年龄调整的血红蛋白正常值(zHgb)≤-2.0(1分),0-1分为低风险,2-5分为高风险,这个评分系统敏感度和特异度分别为73.3%和61.9%。
北京儿童医院Pei-peiFu也提出评分标准:多形性皮疹(1分);肛周改变(1分);初始治疗时间≤4天(2分);CRP≥8mg/dl(2分);中性粒细胞比例≥80%(2分),≥4分者为高风险。
韩国学者MyungHyunChoi在研究韩国儿童资料后提出适用于韩国儿童的评分系统:男性,颈部淋巴结肿大,四肢末端改变,血小板计数≤368,000/mm3,总胆红素≥0.4mg/dL,碱性磷酸酶≥227IU/L,乳酸脱氢酶≥268IU/L,C反应蛋白>77.1mg/dL为丙种球蛋白无反应高危因素,每项各计1分,以4分为界限,超过4分为高风险。
然而,国外研究不具有普遍适用性;美国学者Adriana H研究1998-2006年当地医院川崎病人资料后表示:与日本评分系统比较,只有Egami提出的评分标准中的高危因素囊括于研究中的高危因素中,但Egami评分用于当地患儿预测丙种球蛋白无反应型川崎病时,会漏掉60%的病人,只有在预测当地的亚洲人群时特异度和灵敏度能分别达到89.3%和33.3%。而Adriana H评分在不同人群中的敏感度不同,白种人最高,西班牙人次之,而亚洲人最差。Loomba RS也研究发现Egami评分不适应于美国。Sarah Davies也提出Kobayashi评分在美国不适用。各个人种的川崎病患者发病率不一,不同地区存在差异,各单项指标及总评分差异无统计学意义,难以预测川崎病的丙种球蛋白无反应并发症。
发明内容
本发明的目的在于提供一种丙种球蛋白无反应型川崎病的预测方法及预测系统。
为了实现上述发明目的之一,本发明一实施方式提供一种丙种球蛋白无反应型川崎病的预测方法,所述方法包括:
S1、采集建立支持向量机(support vector machine,SVM)模型的21项原始参数;
所述建模原始参数包括:性别,年龄,就诊时发热时间,临床分型,C-反应蛋白(Creactive protein,CRP)检测值,白细胞(white blood cell,WBC)值,血小板数(Platelet,PLT)值,血红蛋白(hemoglobin,Hb)值,谷丙转氨酶(alanine aminotransferase,ALT)值,谷草转氨酶(aspartate aminotransferas,AST)值,白蛋白(albumin,ALB)值,丙球蛋白使用时间,以及临床诊断症状指标;
所述临床诊断症状指标包括:结膜充血,皮疹,口唇皲裂,杨梅舌,颈淋巴结肿大,手足硬肿,指趾脱皮,肛周脱皮,卡疤红肿;
S2、对所述原始参数做离散化处理以获得原始参数对应的SVM特征值;
S3、以SVM特征值为基础数据构建SVM模型,并通过所述SVM模型预测丙种球蛋白无反应型川崎病的发生概率。
作为本发明一实施方式的进一步改进,所述步骤S2具体包括:
将所述21项原始参数中的发热时间、丙球蛋白使用时间使用了具体的数值进行表示,以形成对应的SVM特征值;
将21项原始参数中剩余的其他原始参数转化为仅由“0”,“1”数值表示的离散化类别特征,以形成对应的SVM特征值。
作为本发明一实施方式的进一步改进,所述步骤S2还包括:
调取离散类别库,对应所述离散类别库将21项原始参数中年龄,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值对应的原始参数转化为仅由“0”,“1”数值表示的离散化类别特征,以形成对应的SVM特征值;
所述离散类别库包括:年龄,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值的离散类别。
作为本发明一实施方式的进一步改进,所述步骤S2具体包括:所述离散类别库具体包括:
年龄对应的离散类别为:类别1,<6个月;类别2,≥6个月;
CRP检测值对应的离散类别为:类别1,CRP≤1.0;类别2,1.0<CRP≤3.0;类别3,3.0<CRP<10.0;类别4,CRP≥10.0;
WBC值对应的离散类别为:类别1,WBC<10;类别2,10<=WBC<=20;类别3,WBC>20;
PLT值对应的离散类别为:类别1,PLT≤150.0;类别2,150.0<PLT≤350.0;类别3,PLT>350;
Hb值对应的离散类别为:类别1,Hb<120;类别2,120.0<Hb≤140.0;类别3,Hb>140.0;
ALT值对应的离散类别为:类别1,ALT≤40;类别2,ALT>40;
AST值对应的离散类别为:类别1,AST≤40;类别2,AST>40;
ALB值对应的离散类别为:类别1,ALB<36.0;类别2,36.0<ALB≤55.0;类别3,ALB>55.0。
作为本发明一实施方式的进一步改进,所述步骤S3具体包括:
构建SVM过程中,采用5组交叉验证的方式选取SVM模型的原始参数,并记录最优的原始参数作为模型参数。
为了实现上述发明目的另一,本发明一实施方式提供一种川崎病丙种球蛋白无反应的预测系统,所述系统包括:数据采集模块,用于采集建立SVM模型的21项原始参数;
所述建模原始参数包括:性别,年龄,就诊时发热时间,临床分型,CRP检测值,WBC值,PLT值,HB值,ALT值,AST值,ALB值,丙球蛋白使用时间,以及临床诊断症状指标;
所述临床诊断症状指标包括:结膜充血,皮疹,口唇皲裂,杨梅舌,颈淋巴结肿大,手足硬肿,指趾脱皮,肛周脱皮,卡疤红肿;
离散处理模块,用于对所述原始参数做离散化处理以获得原始参数对应的SVM特征值;
模型构建预测模块,用于以SVM特征值为基础数据构建SVM模型,并通过所述SVM模型预测丙种球蛋白无反应型川崎病的发生概率。
作为本发明一实施方式的进一步改进,所述离散处理模块具体用于:
将所述21项原始参数中的发热时间、丙球蛋白使用时间使用了具体的数值进行表示,以形成对应的SVM特征值;
将21项原始参数中剩余的其他原始参数转化为仅由“0”,“1”数值表示的离散化类别特征,以形成对应的SVM特征值。
作为本发明一实施方式的进一步改进,所述离散处理模块还用于:
调取离散类别库,对应所述离散类别库将21项原始参数中年龄,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值对应的原始参数转化为仅由“0”,“1”数值表示的离散化类别特征,以形成对应的SVM特征值;
所述离散类别库包括:年龄,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值的离散类别。
作为本发明一实施方式的进一步改进,所述离散类别库具体包括:年龄对应的离散类别为:类别1,<6个月;类别2,≥6个月;
CRP检测值对应的离散类别为:类别1,CRP≤1.0;类别2,1.0<CRP≤3.0;类别3,3.0<CRP<10.0;类别4,CRP≥10.0;
WBC值对应的离散类别为:类别1,WBC<10;类别2,10<=WBC<=20;类别3,WBC>20;
PLT值对应的离散类别为:类别1,PLT≤150.0;类别2,150.0<PLT≤350.0;类别3,PLT>350;
Hb值对应的离散类别为:类别1,Hb<120;类别2,120.0<Hb≤140.0;类别3,Hb>140.0;
ALT值对应的离散类别为:类别1,ALT≤40;类别2,ALT>40;
AST值对应的离散类别为:类别1,AST≤40;类别2,AST>40;
ALB值对应的离散类别为:类别1,ALB<36.0;类别2,36.0<ALB≤55.0;类别3,ALB>55.0。
作为本发明一实施方式的进一步改进,模型构建预测模块具体用于:构建SVM过程中,采用5组交叉验证的方式选取SVM模型的原始参数,并记录最优的原始参数作为模型参数。
与现有技术相比,本发明的丙种球蛋白无反应型川崎病的预测方法及预测系统,采集真实的原始参数作为建模的基础数据,可靠性强;进一步的,将原始数据进行离散化处理后获得构建SVM模型的SVM特征值,如此,数据格式统一、提升建模速度;通过SVM模型预测川崎病的丙种球蛋白无反应并发症,提升了预测的概率,如此,可以对丙种球蛋白无反应几率高的病人进行早期干预治疗,缩短川崎病病人发热时间,缓解临床症状,缩短住院日,减少冠状动脉损伤几率,对将来川崎病的诊治具有重要意义和价值。
附图说明
图1是本发明第一实施方式提供的丙种球蛋白无反应型川崎病的预测方法的流程图;
图2是本发明一实施方式中提供的丙种球蛋白无反应型川崎病的预测系统的模块示意图。
具体实施方式
以下将结合附图所示的实施方式对本发明进行详细描述。但实施方式并不限制本发明,本领域的普通技术人员根据这些实施方式所做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。
如图1所示,图1是本发明第一实施方式提供的丙种球蛋白无反应型川崎病的预测方法,所述方法包括:
S1、采集建立SVM模型的21项原始参数;
所述建模原始参数包括:性别,年龄,就诊时发热时间,临床分型,CRP检测值,WBC值,PLT值,HB值,ALT值,AST值,ALB值,丙球蛋白使用时间,以及临床诊断症状指标;所述临床诊断症状指标包括:结膜充血,皮疹,口唇皲裂,杨梅舌,颈淋巴结肿大,手足硬肿,指趾脱皮,肛周脱皮,卡疤红肿。
本发明一具体示例中,开发数据为2006-2014年国内某一地区960例川崎病病例,其中,丙种球蛋白无反应组30例,丙种球蛋白敏感组930例;每一病例均具有对应上述21项原始参数的具体参数值。
进一步的,所述方法还包括:S2、对所述原始参数做离散化处理以获得原始参数对应的SVM特征值。由于原始参数中包含了多种临床检测的原始值,直接在SVM模型中使用原始参数不能反映出该检测值的临床意义。因此,针对所有临床检测的原始参数,采用临床定义的标准参考值的范围,进行临床医学意义上的离散化表示。经过转化,数值型的原始数据被转化为具有临床意义的类别特征。
本发明一具体示例中,由python程序开发,采用统一的特征提取模型对始参数做离散化处理以获得原始参数对应的SVM特征值。
优选的,所述步骤S2具体包括:将所述21项原始参数中的发热时间、丙球蛋白使用时间使用了具体的数值进行表示,以形成对应的SVM特征值;将21项原始参数中剩余的其他原始参数转化为仅由“0”,“1”数值表示的离散化类别特征,以形成对应的SVM特征值。
进一步的,所述步骤S2还包括:根据临床医学知识,调取离散类别库,对应所述离散类别库将21项原始参数中年龄,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值对应的原始参数转化为仅由“0”,“1”数值表示的离散化类别特征,以形成对应的SVM特征值;所述离散类别库包括:年龄,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值的离散类别。
所述离散类别库具体包括:
年龄对应的离散类别为:类别1,<6个月;类别2,≥6个月;
CRP检测值对应的离散类别为:类别1,CRP≤1.0;类别2,1.0<CRP≤3.0;类别3,3.0<CRP<10.0;类别4,CRP≥10.0;
WBC值对应的离散类别为:类别1,WBC<10;类别2,10<=WBC<=20;类别3,WBC>20;
PLT值对应的离散类别为:类别1,PLT≤150.0;类别2,150.0<PLT≤350.0;类别3,PLT>350;
Hb值对应的离散类别为:类别1,Hb<120;类别2,120.0<Hb≤140.0;类别3,Hb>140.0;
ALT值对应的离散类别为:类别1,ALT≤40;类别2,ALT>40;
AST值对应的离散类别为:类别1,AST≤40;类别2,AST>40;
ALB值对应的离散类别为:类别1,ALB<36.0;类别2,36.0<ALB≤55.0;类别3,ALB>55.0。
上述对应所述离散类别库将21项原始参数中年龄,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值对应的原始参数转化为仅由“0”,“1”数值表示的离散化类别特征表示过程中,可以对0、1的表示含义自行定义;例如:{1,0}为男性,{0,1}为女性,同理,临床分型,临床诊断症状指标中,同样可以对0、1的表达方式进行定义,例如:1表示病人出现相应症状,0表示病人未出现相应症状。
为了便于理解,本发明描述一具体示例供参考;一川崎病人病例,其对应的原始参数如下所示:
性别:男;
年龄:28个月;
就诊时发热时间:5天;
临床分型:完全川崎病;
C-反应蛋白(CRP):65.73;
白细胞(WBC):28.91;
血小板数(PLT):600;
血红蛋白(Hb):103;
谷丙转氨酶(ALT):192.4;
谷草转氨酶(AST):84.8;
白蛋白(ALB):35.9;
丙球蛋白使用时间:5天;
结膜充血:是;
皮疹:是;
口唇皲裂:是;
杨梅舌:是;
颈淋巴结肿大:是;
手足硬肿:是;
指趾脱皮:是;
肛周脱皮:是;
卡疤红肿:否;
对上述一个病人的原始参数做离散化处理以获得原始参数对应的SVM特征值如下所示:
性别:{1,0}
年龄:{0,1}
就诊时发热时间:5天;
临床分型:{1,0};
C-反应蛋白(CRP):{0,0,0,1}
白细胞(WBC):{0,0,1};
血小板数(PLT):{0,0,1};
血红蛋白(Hb):{1,0,0}
谷丙转氨酶(ALT):{0,1};
谷草转氨酶(AST):{0,1};
白蛋白(ALB):{1,0,0};
丙球蛋白使用时间:5天;
结膜充血:{1};
皮疹:{1};
口唇皲裂:{1};
杨梅舌:{1};
颈淋巴结肿大:{1};
手足硬肿:{1};
指趾脱皮:{1};
肛周脱皮:{1};
卡疤红肿:{0};
进一步的,所示方法还包括:S3、以SVM特征值为基础数据构建SVM模型,并通过所述SVM模型预测丙种球蛋白无反应型川崎病的发生概率。
支持向量机(support vector machine,SVM)是由Cortes和Vapnik于1995年提出的,它以训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,是一种基于结构风险最小化准则的学习方法。SVM以统计学习理论(StatisticalLearningTheory,SLT)为基础,综合考虑经验风险与置信风险,克服了传统方法过学习和陷入局部最小的问题,具有很好的泛化能力,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,同时,SVM通过核函数方法向高维空间映射时并不增加计算的复杂性,又可以有效地克服维数灾难问题。因此,SVM已经逐渐成为解决模式分类问题的首选工具。
SVM基本思想:对于给定的线性可分训练样本集T={(x,y),i=1,2,...,l},x∈Rn,yi∈{+1,-1},寻找一个决策函数f(x)=sgn(g(x))来将训练集正确地分开,且分类超平面具有好的推广能力。对于线性可分问题,分类超平面(w·x)+b=0必须使分类间隔的最大,可以转化为:
s.t:y(i(w·xi)+b)≥1i=1,2,...,l(2)
对于线性不可分问题则需要通过引入一个非线性映射将低维的输入空间中的线性不可分问题转化为高维特征空间中的线性可分问题,进而用标准分类学习机来求解。为了避免高维空间中的复杂计算,SVM采用核函数k(x,y)代替高维空间中的内积运算于是式(2)的问题可以转换为:
s.t:yi((w·xi)+b)≥1-ξi=1,2,...,l(4)
用Lagrange方法求解得
该式只包含待分类样本与训练样本中的支持向量的内积运算。对非线性问题,可以通过非线性变换转化为某个高维空间中的线性问题,在变换空间求最优分类面,然而这种变换却不易实现。
根据泛函的有关理论,只要一种核函数K(xi,xj)满足Mercer条件,它就对应某一变换空间中的内积。因此,在最优分类面中采用适当的内积函数K(xi,xj)就可以实现某一非线性变换后的线性分类,而计算复杂度却没有增加。相应的分类函数也变为:
也就是前述的支持向量机。
本发明优选实施方式中,构建SVM过程中,采用5组交叉验证的方式选取SVM模型的原始参数,并记录最优的原始参数作为模型参数。
采用5组交叉验证的方式选取SVM模型的原始参数具体包括:将上述960例川崎病原始参数以病例为单位随机分为5组,即每组192例病例,构建SVM过程中,共建立5个SVM模型,每次以其中任意4组训练为一个SVM模型,剩余一组做测试,之后对实验结果进行对比,记录最优的原始参数作为模型参数。如此,可以防止模型过拟合。
本发明具体示例中,将960例川崎病患者采用5组交叉验证的方式建立SVM模型后,取概率大于0.0556时达到最好分类性能,其5次试验的AUC平均值高达0.9967。
所述AUC其对应的英文全称为:AreaUnderCurve,其为评测SVM模型在测试数据上预测好坏的指标,其数值越高,表示SVM模型的预测性能越好。
所述概率是指,给定一个病例,将其具有的原始参数转换为SVM特征值并输入至SVM模型后,预测病例使用丙种球蛋白后,出现无反应的概率。
另外,本发明具体示例中,SVM模型建立过程中,核函数经比较采用径向基核函数(radicalbasisfunctions,简称RBF):k(xi,yi)=exp(-γ||xi-yi||2),其中γ为参数。该核函数是SVM模型的内建机制,通过核函数把输入特征映射到高纬空间,寻找最优分类界面;所述RBF是非线性核,其为核函数其中的一种,本实施方式中,采用RBF作为核函数,可以更好的对数据的非线性关系建模。
结合图2所示,本发明一实施方式提供的丙种球蛋白无反应型川崎病的预测系统,所述系统包括:数据采集模块100、离散处理模块200以及模型构建预测模块300。
数据采集模块100用于采集建立SVM模型的21项原始参数;
所述建模原始参数包括:性别,年龄,就诊时发热时间,临床分型,C-反应蛋白(CRP)检测值,白细胞(WBC)值,血小板数(PLT)值,血红蛋白(Hb)值,谷丙转氨酶(ALT)值,谷草转氨酶(AST)值,白蛋白(ALB)值,丙球蛋白使用时间,以及临床诊断症状指标;所述临床诊断症状指标包括:结膜充血,皮疹,口唇皲裂,杨梅舌,颈淋巴结肿大,手足硬肿,指趾脱皮,肛周脱皮,卡疤红肿。
本发明一具体示例中,开发数据为2006-2014年国内某一地区960例川崎病病例,其中,丙种球蛋白无反应组30例,丙种球蛋白敏感组930例;每一病例均具有对应上述21项原始参数的具体参数值。
离散处理模块200用于对所述原始参数做离散化处理以获得原始参数对应的SVM特征值。由于原始参数中包含了多种临床检测的原始值,直接在SVM模型中使用原始参数不能反映出该检测值的临床意义。因此,针对所有临床检测的原始参数,采用临床定义的标准参考值的范围,进行临床医学意义上的离散化表示。经过转化,数值型的原始数据被转化为具有临床意义的类别特征。
本发明一具体示例中,由python程序开发,采用统一的特征提取模型对始参数做离散化处理以获得原始参数对应的SVM特征值。
优选的,离散处理模块200具体用于将所述21项原始参数中的发热时间、丙球蛋白使用时间使用了具体的数值进行表示,以形成对应的SVM特征值;
将21项原始参数中剩余的其他原始参数转化为仅由“0”,“1”数值表示的离散化类别特征,以形成对应的SVM特征值。
进一步的,离散处理模块200还用于根据临床医学知识,调取离散类别库,对应所述离散类别库将21项原始参数中年龄,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值对应的原始参数转化为仅由“0”,“1”数值表示的离散化类别特征,以形成对应的SVM特征值。
所述离散类别库包括:年龄,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值的离散类别。
所述离散类别库具体包括:
年龄对应的离散类别为:类别1,<6个月;类别2,≥6个月;
CRP检测值对应的离散类别为:类别1,CRP≤1.0;类别2,1.0<CRP≤3.0;类别3,3.0<CRP<10.0;类别4,CRP≥10.0;
WBC值对应的离散类别为:类别1,WBC<10;类别2,10<=WBC<=20;类别3,WBC>20;
PLT值对应的离散类别为:类别1,PLT≤150.0;类别2,150.0<PLT≤350.0;类别3,PLT>350;
Hb值对应的离散类别为:类别1,Hb<120;类别2,120.0<Hb≤140.0;类别3,Hb>140.0;
ALT值对应的离散类别为:类别1,ALT≤40;类别2,ALT>40;
AST值对应的离散类别为:类别1,AST≤40;类别2,AST>40;
ALB值对应的离散类别为:类别1,ALB<36.0;类别2,36.0<ALB≤55.0;类别3,ALB>55.0。
上述对应所述离散类别库将21项原始参数中年龄,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值对应的原始参数转化为仅由“0”,“1”数值表示的离散化类别特征表示过程中,可以对0、1的表示含义自行定义;例如:{1,0}为男性,{0,1}为女性,同理,临床分型,临床诊断症状指标中,同样可以对0、1的表达方式进行定义,例如:1表示病人出现相应症状,0表示病人未出现相应症状。
模型构建预测模块300用于以SVM特征值为基础数据构建SVM模型,并通过所述SVM模型预测丙种球蛋白无反应型川崎病的发生概率。
本发明优选实施方式中,模型构建预测模块300构建SVM过程中,采用5组交叉验证的方式选取SVM模型的原始参数,并记录最优的原始参数作为模型参数。
采用5组交叉验证的方式选取SVM模型的原始参数具体包括:将上述960例川崎病原始参数以病例为单位随机分为5组,即每组192例病例,构建SVM过程中,共建立5个SVM模型,每次以其中任意4组训练为一个SVM模型,剩余一组做测试,之后对实验结果进行对比,记录最优的原始参数作为模型参数。如此,可以防止模型过拟合。
本发明具体示例中,将960例川崎病患者采用5组交叉验证的方式建立SVM模型后,取概率大于0.0556时达到最好分类性能,其5次试验的AUC平均值高达0.9967。
所述AUC其对应的英文全称为:AreaUnderCurve,其为评测SVM模型在测试数据上预测好坏的指标,其数值越高,表示SVM模型的预测性能越好。
所述概率是指,给定一个病例,将其具有的原始参数转换为SVM特征值并输入至SVM模型后,预测病例使用丙种球蛋白后,出现无反应的概率。
另外,本发明具体示例中,SVM模型建立过程中,核函数经比较采用径向基核函数(radicalbasisfunctions,简称RBF):k(xi,yi)=exp(-γ||xi-yi||2),其中γ为参数。该核函数是SVM模型的内建机制,通过核函数把输入特征映射到高纬空间,寻找最优分类界面;所述RBF是非线性核,其为核函数其中的一种,本实施方式中,采用RBF作为核函数,可以更好的对数据的非线性关系建模。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的模块的具体工作过程,可以参考前述方法实施方式中的对应过程,在此不再赘述。
综上所述,本发明的丙种球蛋白无反应型川崎病的预测方法及预测系统,采集真实的原始参数作为建模的基础数据,可靠性强;进一步的,将原始数据进行离散化处理后获得构建SVM模型的SVM特征值,如此,数据格式统一、提升建模速度;通过SVM模型预测川崎病的丙种球蛋白无反应并发症,提升了预测的概率,如此,可以对丙种球蛋白无反应几率高的病人进行早期干预治疗,缩短川崎病病人发热时间,缓解临床症状,缩短住院日,减少冠状动脉损伤几率,对将来川崎病的诊治具有重要意义和价值。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以保存在保存介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,信息推送服务器,或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。
以上所描述的装置实施方式仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施方式方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、信息推送服务器计算机、手持设备或便携式设备、平板型设备、多处理模块系统、基于微处理模块的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括保存设备在内的本地和远程计算机保存介质中。
应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施方式中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
Claims (10)
1.一种丙种球蛋白无反应型川崎病的预测方法,其特征在于,所述方法包括以下步骤:
S1、采集建立SVM模型的21项原始参数;
所述建模原始参数包括:性别,年龄,就诊时发热时间,临床分型,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值,丙球蛋白使用时间,以及临床诊断症状指标;
所述临床诊断症状指标包括:结膜充血,皮疹,口唇皲裂,杨梅舌,颈淋巴结肿大,手足硬肿,指趾脱皮,肛周脱皮,卡疤红肿;
S2、对所述原始参数做离散化处理以获得原始参数对应的SVM特征值;
S3、以SVM特征值为基础数据构建SVM模型,并通过所述SVM模型预测丙种球蛋白无反应型川崎病的发生概率。
2.根据权利要求1所述的丙种球蛋白无反应型川崎病的预测方法,其特征在于,
所述步骤S2具体包括:
将所述21项原始参数中的发热时间、丙球蛋白使用时间使用了具体的数值进行表示,以形成对应的SVM特征值;
将21项原始参数中剩余的其他原始参数转化为仅由“0”,“1”数值表示的离散化类别特征,以形成对应的SVM特征值。
3.根据权利要求2所述的丙种球蛋白无反应型川崎病的预测方法,其特征在于,所述步骤S2还包括:调取离散类别库,对应所述离散类别库将21项原始参数中年龄,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值对应的原始参数转化为仅由“0”,“1”数值表示的离散化类别特征,以形成对应的SVM特征值;
所述离散类别库包括:年龄,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值的离散类别。
4.根据权利要求3所述的丙种球蛋白无反应型川崎病的预测方法,其特征在于,所述离散类别库具体包括:
年龄对应的离散类别为:类别1,<6个月;类别2,≥6个月;
CRP检测值对应的离散类别为:类别1,CRP≤1.0;类别2,1.0<CRP≤3.0;类别3,3.0<CRP<10.0;类别4,CRP≥10.0;
WBC值对应的离散类别为:类别1,WBC<10;类别2,10<=WBC<=20;类别3,WBC>20;
PLT值对应的离散类别为:类别1,PLT≤150.0;类别2,150.0<PLT≤350.0;类别3,PLT>350;
Hb值对应的离散类别为:类别1,Hb<120;类别2,120.0<Hb≤140.0;类别3,Hb>140.0;
ALT值对应的离散类别为:类别1,ALT≤40;类别2,ALT>40;
AST值对应的离散类别为:类别1,AST≤40;类别2,AST>40;
ALB值对应的离散类别为:类别1,ALB<36.0;类别2,36.0<ALB≤55.0;类别3,ALB>55.0。
5.根据权利要求1所述的丙种球蛋白无反应型川崎病的预测方法,所述步骤S3具体包括:
构建SVM过程中,采用5组交叉验证的方式选取SVM模型的原始参数,并记录最优的原始参数作为模型参数。
6.一种丙种球蛋白无反应型川崎病的预测系统,其特征在于,所述系统包括:
数据采集模块,用于采集建立SVM模型的21项原始参数;
所述建模原始参数包括:性别,年龄,就诊时发热时间,临床分型,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值,丙球蛋白使用时间,以及临床诊断症状指标;
所述临床诊断症状指标包括:结膜充血,皮疹,口唇皲裂,杨梅舌,颈淋巴结肿大,手足硬肿,指趾脱皮,肛周脱皮,卡疤红肿;
离散处理模块,用于对所述原始参数做离散化处理以获得原始参数对应的SVM特征值;
模型构建预测模块,用于以SVM特征值为基础数据构建SVM模型,并通过所述SVM模型预测丙种球蛋白无反应型川崎病的发生概率。
7.根据权利要求6所述的丙种球蛋白无反应型川崎病的预测系统,其特征在于,
所述离散处理模块具体用于:
将所述21项原始参数中的发热时间、丙球蛋白使用时间使用了具体的数值进行表示,以形成对应的SVM特征值;
将21项原始参数中剩余的其他原始参数转化为仅由“0”,“1”数值表示的离散化类别特征,以形成对应的SVM特征值。
8.根据权利要求7所述的丙种球蛋白无反应型川崎病的预测系统,其特征在于,
所述离散处理模块还用于:
调取离散类别库,对应所述离散类别库将21项原始参数中年龄,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值对应的原始参数转化为仅由“0”,“1”数值表示的离散化类别特征,以形成对应的SVM特征值;
所述离散类别库包括:年龄,CRP检测值,WBC值,PLT值,Hb值,ALT值,AST值,ALB值的离散类别。
9.根据权利要求8所述的丙种球蛋白无反应型川崎病的预测系统,其特征在于,所述离散类别库具体包括:
年龄对应的离散类别为:类别1,<6个月;类别2,≥6个月;
CRP检测值对应的离散类别为:类别1,CRP≤1.0;类别2,1.0<CRP≤3.0;类别3,3.0<CRP<10.0;类别4,CRP≥10.0;
WBC值对应的离散类别为:类别1,WBC<10;类别2,10<=WBC<=20;类别3,WBC>20;
PLT值对应的离散类别为:类别1,PLT≤150.0;类别2,150.0<PLT≤350.0;类别3,PLT>350;
Hb值对应的离散类别为:类别1,Hb<120;类别2,120.0<Hb≤140.0;类别3,Hb>140.0;
ALT值对应的离散类别为:类别1,ALT≤40;类别2,ALT>40;
AST值对应的离散类别为:类别1,AST≤40;类别2,AST>40;
ALB值对应的离散类别为:类别1,ALB<36.0;类别2,36.0<ALB≤55.0;类别3,ALB>55.0。
10.根据权利要求6所述的丙种球蛋白无反应型川崎病的预测系统,其特征在于,
模型构建预测模块具体用于:构建SVM过程中,采用5组交叉验证的方式选取SVM模型的原始参数,并记录最优的原始参数作为模型参数。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710161648.0A CN106971067A (zh) | 2017-03-17 | 2017-03-17 | 丙种球蛋白无反应型川崎病的预测方法及预测系统 |
CN201710642661.8A CN107480436A (zh) | 2017-03-17 | 2017-07-31 | 丙种球蛋白无反应型川崎病的预测方法及预测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710161648.0A CN106971067A (zh) | 2017-03-17 | 2017-03-17 | 丙种球蛋白无反应型川崎病的预测方法及预测系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106971067A true CN106971067A (zh) | 2017-07-21 |
Family
ID=59328897
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710161648.0A Withdrawn CN106971067A (zh) | 2017-03-17 | 2017-03-17 | 丙种球蛋白无反应型川崎病的预测方法及预测系统 |
CN201710642661.8A Pending CN107480436A (zh) | 2017-03-17 | 2017-07-31 | 丙种球蛋白无反应型川崎病的预测方法及预测系统 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710642661.8A Pending CN107480436A (zh) | 2017-03-17 | 2017-07-31 | 丙种球蛋白无反应型川崎病的预测方法及预测系统 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN106971067A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113257428A (zh) * | 2021-04-29 | 2021-08-13 | 深圳市儿童医院 | 一种川崎病丙球无反应预测方法、存储介质及终端设备 |
CN113380329A (zh) * | 2021-06-08 | 2021-09-10 | 重庆医科大学 | 川崎病患儿首次注射丙种球蛋白抵抗的预测系统及装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110982890B (zh) * | 2019-12-20 | 2020-12-25 | 首都儿科研究所附属儿童医院 | 一种用于预测儿童川崎病治疗反应性的试剂及其应用 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106295229A (zh) * | 2016-08-30 | 2017-01-04 | 青岛大学 | 一种基于医疗数据建模的川崎病分级预测方法 |
CN106339593B (zh) * | 2016-08-31 | 2023-04-18 | 北京万灵盘古科技有限公司 | 基于医疗数据建模的川崎病分类预测方法 |
-
2017
- 2017-03-17 CN CN201710161648.0A patent/CN106971067A/zh not_active Withdrawn
- 2017-07-31 CN CN201710642661.8A patent/CN107480436A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113257428A (zh) * | 2021-04-29 | 2021-08-13 | 深圳市儿童医院 | 一种川崎病丙球无反应预测方法、存储介质及终端设备 |
CN113380329A (zh) * | 2021-06-08 | 2021-09-10 | 重庆医科大学 | 川崎病患儿首次注射丙种球蛋白抵抗的预测系统及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107480436A (zh) | 2017-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Razzak et al. | Big data analytics for preventive medicine | |
Woldaregay et al. | Data-driven blood glucose pattern classification and anomalies detection: machine-learning applications in type 1 diabetes | |
Kausar et al. | Systematic analysis of applied data mining based optimization algorithms in clinical attribute extraction and classification for diagnosis of cardiac patients | |
US9633171B2 (en) | Predicting neonatal hyperbilirubinemia | |
Chantamit-O-Pas et al. | Long short-term memory recurrent neural network for stroke prediction | |
CN107480436A (zh) | 丙种球蛋白无反应型川崎病的预测方法及预测系统 | |
Firdous et al. | A survey on diabetes risk prediction using machine learning approaches | |
Mandava | MDensNet201-IDRSRNet: Efficient cardiovascular disease prediction system using hybrid deep learning | |
CN107423568A (zh) | 川崎病的冠脉损伤并发症的预测方法及预测系统 | |
Ono et al. | Introduction to supervised machine learning in clinical epidemiology | |
Basha et al. | Deep learning neural network (DLNN)-based classification and optimization algorithm for organ inflammation disease diagnosis | |
Ali et al. | Prediction of potential-diabetic obese-patients using machine learning techniques | |
Bali et al. | Artificial Intelligence Applications in Medicine: A Rapid Overview of Current Paradigms | |
Mohapatra et al. | Design of Random Forest Algorithm Based Model for Tachycardia Detection | |
Shanthini et al. | Deep Convolutional Neural Network for The Prognosis of Diabetic Retinopathy | |
MUTUA et al. | Comparative Analysis of Machine Learning Classification Techniques for Neonatal Postprandial Hypoglycemia Symptoms Screening. | |
Xiao et al. | Convolutional Neural Networks (CNN) | |
Osman | ANNMDD: Strength of Artificial Neural Network Types for Medical Diagnosis Domain | |
Yousuff et al. | The Role of Artificial Intelligence for Intelligent Mobile Apps | |
Khalaf | Machine Learning Approaches and Web-Based System to the Application of Disease Modifying Therapy for Sickle Cell | |
Chantamit-o-pas | A Predictive Analysis of Electronic Healthcare Records for Stroke Symptoms | |
Barwal et al. | Comparative analysis of recommendation systems based on medical data sets | |
Shaikh et al. | Heart Disease Prediction using Ensemble Learning | |
Hougham et al. | Artificial Intelligence and Its Potential to Improve the Health of Older Adults | |
Anand et al. | Unexpected Alliance of Cardiovascular Diseases and Artificial Intelligence in Health Care |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20170721 |