CN113611412A - 一种t2dm引起冠心病风险的预测方法、装置及系统 - Google Patents
一种t2dm引起冠心病风险的预测方法、装置及系统 Download PDFInfo
- Publication number
- CN113611412A CN113611412A CN202010912895.1A CN202010912895A CN113611412A CN 113611412 A CN113611412 A CN 113611412A CN 202010912895 A CN202010912895 A CN 202010912895A CN 113611412 A CN113611412 A CN 113611412A
- Authority
- CN
- China
- Prior art keywords
- heart disease
- coronary heart
- t2dm
- risk
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开一种T2DM引起冠心病风险的预测方法、装置及系统。所述T2DM引起冠心病风险的预测方法包括:训练冠心病风险预测分类器;获取冠心病风险预测分类器所需要的待预测者的特征选用身体指标;根据所述特征选用身体指标生成输入特征信息;将输入特征信息输入至已经训练完的冠心病风险预测分类器中,从而获取冠心病风险预测分类器计算出的分类标签,所述分类标签表示所述待预测者可能发展为冠心病的概率。本发明公开了一种T2DM引起冠心病风险的预测方法,该方法用于确定T2DM患者发展为CHD的风险,这在为T2DM患者和临床医生提供CHD风险的预警和个性化诊疗指导方面具有潜在价值。
Description
技术领域
本发明涉及2型糖尿病技术领域,具体涉及一种T2DM引起冠心病风险的预测方法、T2DM引起冠心病风险的预测装置以及T2DM引起冠心病风险的预测系统。
背景技术
糖尿病(DM)是一种由胰腺β细胞的胰岛素分泌异常引起的严重的慢性疾病。
1980年,全球有1.08亿人被诊断出患有糖尿病,而到2019年,这一数字又增加到4.63亿(420万例死亡),根据世界卫生组织(WHO)和国际糖尿病联盟(IDF)的统计,在过去十年中,这一数字正在迅速增长。
目前,它已成为十大死亡原因之一,IDF预测,到2045年,糖尿病患者的人数将攀升至超过7亿成年人。此外,DM可以简单地分为1型(T1DM)和2型(T2DM),这两种类型在临床治疗上完全不同。
由于人口众多,亚洲(尤其是中国)可被视为T2DM的主导地区。T2DM可导致多种并发症,例如大血管疾病(如心血管疾病(CVD))和微血管疾病(如肾脏,视网膜和神经系统疾病)。
更糟糕的是,T2DM可能会导致痴呆和认知障碍,从而降低T2DM患者对糖尿病并发症的敏感性。众所周知,患有T2DM的个体的心脏病(如心力衰竭(HF),心脏功能障碍)的发生率要远远高于没有T2DM的个体。
具体而言,冠心病(CHD)代表最常见和最严重的糖尿病并发症之一。2型糖尿病(T2DM)是一种由胰岛素分泌障碍引起的常见慢性疾病,通常会导致严重后果甚至因并发症而死亡,其中冠心病(CHD)是最常见和最严重的疾病。鉴于T2DM患者的数量十分巨大,因此定量评估T2DM患者发展为冠心病的风险变得越来越重要,然而现在仍没有定量预测方法。
CHD是心肌血管供血不足引发的疾病,表现为高脂血症,心肌梗塞和心绞痛,2015年,约有1,770万人死于冠心病。仅在美国,就有1820万名20岁以上的成年人患有冠心病,占总人口的6.7%,并且冠心病在2017年导致363,452人死亡。因此,冠心病的早期诊断很重要,但并不容易.鉴于冠心病的高患病率和高死亡率,预测个人冠心病的风险很重要。
鉴于有大量的T2DM患者,因此评估T2DM患者发生冠心病的风险非常重要,然而现在仍没有定量预测方法。
介绍因此,希望有一种技术方案来克服或至少减轻现有技术的至少一个上述缺陷。
发明内容
本发明的目的在于提供一种T2DM引起冠心病风险的预测方法来克服或至少减轻现有技术的至少一个上述缺陷。
本发明的一个方面,提供一种T2DM引起冠心病风险的预测方法,所述T2DM引起冠心病风险的预测方法包括:训练冠心病风险预测分类器;获取冠心病风险预测分类器所需要的待预测者的特征选用身体指标;根据所述特征选用身体指标生成输入特征信息;将输入特征信息输入至已经训练完的冠心病风险预测分类器中,从而获取冠心病风险预测分类器计算出的分类标签,所述分类标签表示所述待预测者可能发展为冠心病的概率。
可选地,所述T2DM引起冠心病风险的预测方法进一步包括:
判断所述待预测者可能发展为冠心病的概率是否高于发展阈值,若高于发展阈值,则判定为高概率患者;
根据高概率患者的特征选用身体指标以及冠心病风险预测分类器,获取高概率患者的各个特征选用身体指标所对应的特征贡献度。
可选地,所述根据高概率患者的特征选用身体指标以及冠心病风险预测分类器,获取高概率患者的每个特征选用身体指标所对应的特征贡献度包括:
根据高概率患者的特征选用身体指标生成贡献度特征信息,一个特征选用身体指标对应一个贡献度特征信息;根据高概率患者的贡献度特征信息、输入特征信息以及冠心病风险预测分类器分别获取每个风险特征信息的特征贡献度。
可选地,
所述根据高概率患者的贡献度特征信息、输入特征信息以及冠心病风险预测分类器分别获取每个风险特征信息的特征贡献度包括:
m是特征选用身体指标的总数;
Fk是第k个高概率患者的输入特征信息;
RF表示在冠心病风险预测分类器中待预测者可能发展为冠心病的概率;
Si表示第k个高概率患者的第i个特征选用身体指标的特征贡献度。
可选地,所述训练冠心病风险预测分类器包括:
获取训练集,所述训练集包括多个训练个体,每个训练个体包括多个身体指标,所述身体指标的数量大于或者等于特征选用身体指标;
根据每个训练个体的身体指标获取训练输入特征信息;
根据训练输入特征信息以及第一分类器分别获取每个身体指标的平均重要性;
更新所述训练集,删除所述身体指标中的平均重要性低于阈值的身体指标,剩下的所述身体指标为所述特征选用身体指标;
采用更新后的训练集对冠心病风险预测分类器进行训练,从而获取训练后的冠心病风险预测分类器。
可选地,所述训练冠心病风险预测分类器进一步包括:
对训练后的冠心病风险预测分类器进行准确性验证、真实阳性率验证、错误阳性率验证、准确率验证以及F1分数验证中的一个或者多个。
可选地,所述特征选用身体指标至少包括待预测者的年龄值、LDL-C值、糖尿病病程值、TC值、心率值、舒张压值、血小板值以及高血压病程值。
本申请还提供了一种T2DM引起冠心病风险的预测装置,所述T2DM引起冠心病风险的预测装置包括:
特征选用身体指标获取模块,所述特征选用身体指标用于获取待预测者的至少两个特征选用身体指标;
特征生成模块,所述特征生成模块用于根据所述特征选用身体指标生成输入特征信息;
分类器训练模块,所述分类器训练模块用于训练冠心病风险预测分类器;
特征输入模块,所述特征输入模块用于将输入特征信息输入至已经训练完的冠心病风险预测分类器;
第一标签获取模块,所述第一标签获取模块用于获取冠心病风险预测分类器计算出的分类标签,所述分类标签表示所述待预测者可能发展为冠心病的概率。
可选地,所述T2DM引起冠心病风险的预测装置进一步包括:
判断模块,所述判断模块用于判断所述待预测者可能发展为冠心病的概率是否高于发展阈值,若高于发展阈值,则判定为高概率患者;
特征贡献度获取模块,所述特征贡献度获取模块用于根据高概率患者的特征选用身体指标以及冠心病风险预测分类器,获取高概率患者的每个特征选用身体指标所对应的特征贡献度。
本申请还提供了一种T2DM引起冠心病风险的预测系统,所述T2DM引起冠心病风险的预测系统包括:
T2DM引起冠心病风险的预测装置,所述T2DM引起冠心病风险的预测装置为如上所述的T2DM引起冠心病风险的预测装置;
人机交互模块,所述人机交互模块用于供使用者与所述T2DM引起冠心病风险的预测装置进行通信,以使使用者通过所述人机交互模块为所述T2DM引起冠心病风险的预测装置提供待预测者的特征选用身体指标。
有益效果
本发明公开了一种T2DM引起冠心病风险的预测方法,该方法用于确定T2DM患者发展为CHD的风险,这在为T2DM患者和临床医生提供CHD风险的预警和个性化诊疗指导方面具有潜在价值。
附图说明
图1为本发明的T2DM引起冠心病风险的预测方法的流程示意图;
图2是能够实现根据本申请一个实施例提供的T2DM引起冠心病风险的预测方法的特征选用身体指标的示意图。
图3是图1所示的冠心病风险的预测方法中的冠心病风险预测分类器的验证的示意图。
图4是图1所示的冠心病风险的预测方法中的冠心病风险预测分类器的测试集结果示意图。
图5是使用图1所示的冠心病风险的预测方法的预测示意图。
图6是本申请的T2DM引起冠心病风险的预测系统中的人机交互模块的界面示意图;
图7是一种电子设备,用于实现图1所示的T2DM引起冠心病风险的预测方法。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。
本实施例中所述的“前”、“前端”“前部”均指使用时靠近病灶或手术操作部位的一端或一部分,所述的“后”“后端”“后部”均指使用时远离病灶或手术操作部位的一端或一部分。
如图1所示的T2DM引起冠心病风险的预测方法包括:
步骤1:训练冠心病风险预测分类器;
步骤2:获取冠心病风险预测分类器所需要的待预测者的特征选用身体指标;
步骤3:根据特征选用身体指标生成输入特征信息;
步骤4:将输入特征信息输入至已经训练完的冠心病风险预测分类器中,从而获取冠心病风险预测分类器计算出的分类标签,分类标签表示所述待预测者可能发展为冠心病的概率。
通过上述方法,即可获取待预测者可能发展为冠心病的概率,这在为T2DM患者和临床医生提供CHD风险的预警和个性化诊疗指导方面具有潜在价值。
在本实施例中,T2DM引起冠心病风险的预测方法进一步包括:
步骤5:判断待预测者可能发展为冠心病的概率是否高于发展阈值,若高于发展阈值,则判定为高概率患者;
步骤6:根据高概率患者的特征选用身体指标以及冠心病风险预测分类器,获取高概率患者的各个特征选用身体指标所对应的特征贡献度。
通过步骤6,我们不仅可以判断出这个待预测者是否为高概率患者,还可以获取该待预测者的每个特征选用身体指标对应的特征贡献度,以用特征贡献度的方式表达该特征选用身体指标对待预测者未来可能患有冠心病的影响力。
在本实施例中,步骤6:根据高概率患者的特征选用身体指标以及冠心病风险预测分类器,获取高概率患者的每个特征选用身体指标所对应的特征贡献度包括:
步骤61:根据高概率患者的特征选用身体指标生成贡献度特征信息,一个特征选用身体指标对应一个贡献度特征信息;
步骤62:根据高概率患者的贡献度特征信息、输入特征信息以及冠心病风险预测分类器分别获取每个风险特征信息的特征贡献度。
在本实施例中,步骤62:根据高概率患者的贡献度特征信息、输入特征信息以及冠心病风险预测分类器分别获取每个风险特征信息的特征贡献度包括:
fi k是第k个高概率患者的第i个特征选用身体指标所对应的输入特征信息;
m是特征选用身体指标的总数;
Fk是第k个高概率患者的输入特征信息;
RF表示在冠心病风险预测分类器中待预测者可能发展为冠心病的概率;
Si表示第k个高概率患者的第i个特征选用身体指标的特征贡献度。
举例来说,本实施例中,特征选用身体指标包括待预测者的年龄值、LDL-C值、糖尿病病程值、TC值、心率值、舒张压值、血小板值以及高血压病程值。
通过步骤3,根据所述特征选用身体指标生成输入特征信息,即根据待预测者K的年龄值、LDL-C值、糖尿病病程值、TC值、心率值、舒张压值、血小板值以及高血压病程值生成一个输入特征信息,例如,输入特征信息为Fk{f0 k、f1 k、f2 k、f3 k、f4 k、f5 k、f6 k、f7 k},其中,假设f0 k对应糖尿病病程值;
要获取糖尿病病程值的特征贡献度,则获取如下信息:
Fk={f0 k、f1 k、f2 k、f3 k、f4 k、f5 k、f6 k、f7 k};
将Fk输入至冠心病风险预测分类器,即进行RF(Fk),从而获取在冠心病风险预测分类器中第k个高概率患者可能发展为冠心病的概率;
在本实施例中,步骤1:训练冠心病风险预测分类器包括:
步骤11:获取训练集,训练集包括多个训练个体,每个训练个体包括多个身体指标,身体指标的数量大于或者等于特征选用身体指标;
步骤12:根据每个训练个体的身体指标获取训练输入特征信息;
步骤13:根据训练输入特征信息以及第一分类器分别获取每个身体指标的平均重要性;
步骤14:更新训练集,删除身体指标中的平均重要性低于阈值的身体指标,剩下的身体指标为所述特征选用身体指标;
步骤15:采用更新后的训练集对冠心病风险预测分类器进行训练,从而获取训练后的冠心病风险预测分类器。
通过这种方式,可以对冠心病风险预测分类器进行优化,尽量减少身体指标的数量。
在本实施例中,第一分类器是根据身体指标生成的分类器,其目的也是进行冠心病风险预测,其所获取的标签代表待预测者基于身体指标可能发展为冠心病的概率。
在本实施例中,训练冠心病风险预测分类器进一步包括:
对训练后的冠心病风险预测分类器进行准确性验证、真实阳性率验证、错误阳性率验证、准确率验证以及F1分数验证中的一个或者多个。
在本实施例中,特征选用身体指标至少包括待预测者的年龄值、LDL-C值、糖尿病病程值、TC值、心率值、舒张压值、血小板值以及高血压病程值。
在实际应用过程中,我们首先收集了1273名T2DM患者的数据集,包括304名患有CHD的患和969名未患有CHD的患者。然后,我们随机选择了数据集的4/5作为训练数据集训练冠心病风险预测分类器,并使用其余数据来验证模型的性能。结果表明,该预测模型在训练数据集上的AUC为0.77(五折交叉验证)(5倍交叉验证),在测试数据集上的AUC为0.80。为了进一步证实该模型的性能,我们招募了1253名新的T2DM患者作为完全独立的测试数据集,包括200名CHD患者和1053名非CHD患者,独立测试集的AUC为0.71。此外,我们还建立了一个风险贡献模型来定量评估T2DM个人每个指标的风险贡献,从而能够为特定个人提供个性化诊疗指导。最终,建立了一个系统来为使用者提供在线预测功能。这本申请的T2DM引起冠心病风险的预测方法用于确定T2DM患者发展为CHD的风险,这在为T2DM患者和临床医生提供CHD风险的预警和个性化诊疗指导方面具有潜在价值。
下面以举例的方式对本申请进行进一步解释,可以理解的是,该举例并不构成对本申请的进一步限制。
从2017年1月到2019年6月,研究共招募了1357名T2DM患者。T2DM患者是从潞河医院内分泌科住院患者中招募的。最终,共有1273名患者参加了我们的研究,所有患者均成功接受了医疗史记录,包括吸烟史,饮酒史,药物治疗史,冠心病,高血压和糖尿病史。表1列出了所有包含的身体指标(其中包括特征选用身体指标)。在1273个样本中,有969例无CHD的糖尿病患者(阴性样品)和304例有CHD的糖尿病患者(阳性样品)。接下来,我们随机选择4/5的阳性样本和4/5的阴性样本作为训练数据集。其余样本作为独立的测试数据集。最后,为证实该预测模型的准确性,我们从潞河医院内分泌科门诊招募了1253例全新的T2DM患者(200例阳性和1053例阴性)。
在应用过程中,T2DM的诊断标准符合中国2型糖尿病的预防和治疗指南(2017年版)。冠心病的诊断标准符合稳定型冠心病(SCAD)(2018版)的诊断和治疗指南。高血压是收缩压至少为140mmHg或舒张压为90mmHg或使用降压药。
在实际应用过程中,我们获取了所有参与者的血液信息,具体地,在抽取静脉血样本之前,所有参与者都禁食了一夜。并测量了白细胞总数和差异白细胞,红细胞,血小板,血红蛋白A1c(HbA1c),血清肌酐(SCr),尿酸(UA),血清甘油三酸酯(TG),TC,LDL-C,HDL-C,空腹血糖(FBG),D-二聚体,C反应蛋白(CRP),γ-谷氨酰转肽酶(GGT)。当患者进行口服葡萄糖耐量测试(OGTT)时,我们还收集了0、1、2、3小时的胰岛素和C肽水平。
在本申请中,获取每个身体指标的平均重要性具体为:信息熵可以定量描述一系列数据中包含的信息。在这里,我们使用信息熵函数和基尼不纯度来检查隐藏在每个特征中的信息。如果此系列数据包含更多分类信息,他的得分越高,反之亦然。基于信息熵函数的特征选择方法是通过在Python 3.7的sci-kit-learn 0.22中使用具有500个决策树的随机森林模型实现的。由于决策树分类器基于熵函数进行决策,因此此模型将计算每个特征的平均重要性。
在本申请中,冠心病风险预测分类器采用基于随机森林的预测模型,随机森林(RF)是用于机器学习的集成模型。它使用信息熵函数或基尼不纯度进行判别。在这里,我们提出了一种基于随机森林的预测模型(DCHD,糖尿病性冠心病),其中基尼不纯度作为熵函数,也称为分类和回归树(CART)30。给定数据集D,则决策树节点的基尼不纯度定义为
其中,pi是在数据集D中属于类i的概率,并且i=1,2,…,C。数据集D将基于在此树形节点上的最小基尼增益点标准A=a划分为2个子集,定义为
其中,Di是应用分割标准A=a后的子集(D1={d∈D|d≤a},D2={d∈D|d>a});树的数量设置为500,并且不限制树的深度以便获得更精确和更可靠的模型。通过在Python3.7中使用sci-kit-learn 0.22实现此模型。
本申请的特征贡献度采用如下方式获取:
我们还使用比例方法对每个特征对个人的贡献进行了分析,以分析特征的贡献程度,如下式所示。
fi k是第k个高概率患者的第i个特征选用身体指标所对应的输入特征信息;
m是特征选用身体指标的总数;
Fk是第k个高概率患者的输入特征信息;
RF表示在冠心病风险预测分类器中待预测者可能发展为冠心病的概率;
Si表示第k个高概率患者的第i个特征选用身体指标的特征贡献度。
在本实施例中,更新训练集,删除身体指标中的平均重要性低于阈值的身体指标,剩下的身体指标为特征选用身体指标具体包括:
较少的指标通常会使T2DM患者和临床医生更方便地使用该冠心病风险预测分类器并使该冠心病风险预测分类器更健壮,但同时可能会降低该模型的性能。为了在预测的鲁棒性,便利性和准确性之间找到平衡,此处将基于信息熵函数的特征选择方法应用于具有52个特征的数据集。所有这些特征都被视为随机森林模型的输入特征,并使用500个决策树训练模型。从这个模型中,熵函数代表每个特征的重要性。并且我们发现信息熵函数和基尼不纯度在特征选择上结果基本相同。在这里,我们选择基尼不纯度作为标准函数。该功能得分越高,该功能包含的信息越多。接下来,选择排名前8位的功能(通过平均重要性来获取,前8为分别为年龄,LDL-C,糖尿病病程,TC,心率,舒张压,血小板,高血压病程),它们占所有特征贡献的30%,其余每个功能在区分T2DM患者中的CHD和非CHD方面几乎没有贡献(小于2.3%)。所选特征的信息贡献被排序并显示在图2中。使用这些所选特征构建的冠心病风险预测分类器的性能与原始包括52个特征的冠心病风险预测分类器几乎相同(参见图3,图3左侧为包括52个特征的分类器)。
在进行冠心病风险预测分类器验证包括:通过真阳性(TP),真阴性(TN),假阳性(FP)和假阴性(FN)。在此,TP和TN分别是正确分类的CHD和非CHD的样例。FN代表错误分类为非CHD的CHD样例;被错误分类为CHD的非CHD被定义为FP。接下来,应用几个标准性能指标来描述基于这些指标的模型性能,包括准确性(ACC),真实阳性率(TPR)(也称为召回率),错误阳性率(FPR),准确率和F1分数。
结果在独立测试数据集中,所提出的模型实现了5折交叉验证的AUC为0.77,而AUC为0.80(图3b)。表2中列出了之前介绍的性能得分。
参见图4,为了进一步证实我们的冠心病风险预测分类器的稳健性和性能,我们从门诊内分泌科新招募了1767例T2DM患者。在这些患者中,最终招募了1253名受试者,其中200名患有CHD,1053名没有CHD。结果,我们的模型在新招募的独立测试数据集中实现了0.71的AUC(图4)。此外,表3中列出了此数据集的性能得分。
在本实施例中,根据高概率患者的特征选用身体指标以及冠心病风险预测分类器,获取高概率患者的每个特征选用身体指标所对应的特征贡献度举例来说:
例如,一名T2DM患者,其每个特征的数据如下,年龄:68岁,低密度脂蛋白:1.92,糖尿病病程:20,总胆固醇:3.32,心率:65,舒张压:67,血小板计数:340,高血压病程:3。使用我们的T2DM引起冠心病风险的预测方法,预测该待预测者有发展为冠心病的高风险(0.925)(图5)。通过特征贡献度,计算出的危险因素得分如下:年龄:0.105,低密度脂蛋白:0.26,糖尿病病程:0.125,总胆固醇:0.425,心率:0.3,舒张压:0.16,血小板计数:0.035,高血压病程:0.025(图5)。在第一个条形图中,红色条形的长度代表发展为冠心病的概率,绿色条形的长度代表非冠心病的概率。此外,我们对风险因素的贡献进行了排序,并在底部绘制了图表,这些贡献可以为个人提供日常饮食和临床治疗方面的建议。
本申请的特征选用身体指标基本来自于血液检查以及自我认知,因此,费用较低、方便自测。
本申请还提供了一种T2DM引起冠心病风险的预测装置,所述T2DM引起冠心病风险的预测装置包括特征选用身体指标获取模块、特征生成模块、分类器训练模块、特征输入模块以及第一标签获取模块,特征选用身体指标用于获取待预测者的至少两个特征选用身体指标;特征生成模块用于根据所述特征选用身体指标生成输入特征信息;分类器训练模块用于训练冠心病风险预测分类器;特征输入模块用于将输入特征信息输入至已经训练完的冠心病风险预测分类器;第一标签获取模块用于获取冠心病风险预测分类器计算出的分类标签,分类标签表示待预测者可能发展为冠心病的概率。
在本实施例中,T2DM引起冠心病风险的预测装置进一步包括判断模块以及特征贡献度获取模块,判断模块用于判断待预测者可能发展为冠心病的概率是否高于发展阈值,若高于发展阈值,则判定为高概率患者;特征贡献度获取模块用于根据高概率患者的特征选用身体指标以及冠心病风险预测分类器,获取高概率患者的每个特征选用身体指标所对应的特征贡献度。
本申请还提供了一种T2DM引起冠心病风险的预测系统,所述T2DM引起冠心病风险的预测系统包括T2DM引起冠心病风险的预测装置以及人机交互模块,T2DM引起冠心病风险的预测装置为如上所述的T2DM引起冠心病风险的预测装置;人机交互模块用于供使用者与T2DM引起冠心病风险的预测装置进行通信,以使使用者通过人机交互模块为T2DM引起冠心病风险的预测装置提供待预测者的特征选用身体指标。
在本申请中,人机交互模块为电脑、平板电脑等,其中一个人机交互模块的应用界面如图6所示。
需要说明的是,前述对方法实施例的解释说明也适用于本实施例的装置,此处不再赘述。
本申请还提供了一种电子设备,包括存储器、处理器以及存储在存储器中并能够在处理器上运行的计算机程序,处理器执行计算机程序时实现如上的T2DM引起冠心病风险的预测方法。
如图7所示,电子设备包括输入设备501、输入接口502、中央处理器503、存储器504、输出接口505以及输出设备506。其中,输入接口502、中央处理器503、存储器504以及输出接口505通过总线507相互连接,输入设备501和输出设备506分别通过输入接口502和输出接口505与总线507连接,进而与电子设备的其他组件连接。具体地,输入设备504接收来自外部的输入信息,并通过输入接口502将输入信息传送到中央处理器503;中央处理器503基于存储器504中存储的计算机可执行指令对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器504中,然后通过输出接口505将输出信息传送到输出设备506;输出设备506将输出信息输出到电子设备的外部供用户使用。
也就是说,图3所示的电子设备也可以被实现为包括:存储有计算机可执行指令的存储器;以及一个或多个处理器,该一个或多个处理器在执行计算机可执行指令时可以实现结合图1描述的T2DM引起冠心病风险的预测方法。
在一个实施例中,图3所示的电子设备可以被实现为包括:存储器504,被配置为存储可执行程序代码;一个或多个处理器503,被配置为运行存储器504中存储的可执行程序代码,以执行上述实施例中的T2DM引起冠心病风险的预测方法。
本申请还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时能够实现如上的T2DM引起冠心病风险的预测方法。
本申请虽然以较佳实施例公开如上,但其实并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此,本申请的保护范围应当以本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动,媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数据多功能光盘(DVD)或其他光学存储、磁盒式磁带、磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
此外,显然“包括”一词不排除其他单元或步骤。装置权利要求中陈述的多个单元、模块或装置也可以由一个单元或总装置通过软件或硬件来实现。第一、第二等词语用来标识名称,而不标识任何特定的顺序。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,模块、程序段、或代码的一部分包括一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地标识的方框实际上可以基本并行地执行,他们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或总流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
在本实施例中所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可用于存储计算机程序和/或模块,处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现装置/终端设备的各种功能。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
在本实施例中,装置/终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
Claims (10)
1.一种T2DM引起冠心病风险的预测方法,其特征在于,所述T2DM引起冠心病风险的预测方法包括:
训练冠心病风险预测分类器;
获取冠心病风险预测分类器所需要的待预测者的特征选用身体指标;
根据所述特征选用身体指标生成输入特征信息;
将输入特征信息输入至已经训练完的冠心病风险预测分类器中,从而获取冠心病风险预测分类器计算出的分类标签,所述分类标签表示所述待预测者可能发展为冠心病的概率。
2.如权利要求1所述的T2DM引起冠心病风险的预测方法,其特征在于,所述T2DM引起冠心病风险的预测方法进一步包括:
判断所述待预测者可能发展为冠心病的概率是否高于发展阈值,若高于发展阈值,则判定为高概率患者;
根据高概率患者的特征选用身体指标以及冠心病风险预测分类器,获取高概率患者的各个特征选用身体指标所对应的特征贡献度。
3.如权利要求2所述的T2DM引起冠心病风险的预测方法,其特征在于,所述根据高概率患者的特征选用身体指标以及冠心病风险预测分类器,获取高概率患者的每个特征选用身体指标所对应的特征贡献度包括:
根据高概率患者的特征选用身体指标生成贡献度特征信息,一个特征选用身体指标对应一个贡献度特征信息;根据高概率患者的贡献度特征信息、输入特征信息以及冠心病风险预测分类器分别获取每个风险特征信息的特征贡献度。
4.如权利要求3所述的T2DM引起冠心病风险的预测方法,其特征在于,所述根据高概率患者的贡献度特征信息、输入特征信息以及冠心病风险预测分类器分别获取每个风险特征信息的特征贡献度包括:
fi k是第k个高概率患者的第i个特征选用身体指标所对应的输入特征信息;
m是特征选用身体指标的总数;
Fk是第k个高概率患者的输入特征信息;
RF表示在冠心病风险预测分类器中待预测者可能发展为冠心病的概率;
Si表示第k个高概率患者的第i个特征选用身体指标的特征贡献度。
5.如权利要求4所述的T2DM引起冠心病风险的预测方法,其特征在于,所述训练冠心病风险预测分类器包括:
获取训练集,所述训练集包括多个训练个体,每个训练个体包括多个身体指标,所述身体指标的数量大于或者等于特征选用身体指标;
根据每个训练个体的身体指标获取训练输入特征信息;
根据训练输入特征信息以及第一分类器分别获取每个身体指标的平均重要性;
更新所述训练集,删除所述身体指标中的平均重要性低于阈值的身体指标,剩下的所述身体指标为所述特征选用身体指标;
采用更新后的训练集对冠心病风险预测分类器进行训练,从而获取训练后的冠心病风险预测分类器。
6.如权利要求5所述的T2DM引起冠心病风险的预测方法,其特征在于,所述训练冠心病风险预测分类器进一步包括:
对训练后的冠心病风险预测分类器进行准确性验证、真实阳性率验证、错误阳性率验证、准确率验证以及F1分数验证中的一个或者多个。
7.如权利要求1至6中任意一项所述的T2DM引起冠心病风险的预测方法,其特征在于,所述特征选用身体指标至少包括待预测者的年龄值、LDL-C值、糖尿病病程值、TC值、心率值、舒张压值、血小板值以及高血压病程值。
8.一种T2DM引起冠心病风险的预测装置,其特征在于,所述T2DM引起冠心病风险的预测装置包括:
特征选用身体指标获取模块,所述特征选用身体指标用于获取待预测者的至少两个特征选用身体指标;
特征生成模块,所述特征生成模块用于根据所述特征选用身体指标生成输入特征信息;
分类器训练模块,所述分类器训练模块用于训练冠心病风险预测分类器;
特征输入模块,所述特征输入模块用于将输入特征信息输入至已经训练完的冠心病风险预测分类器;
第一标签获取模块,所述第一标签获取模块用于获取冠心病风险预测分类器计算出的分类标签,所述分类标签表示所述待预测者可能发展为冠心病的概率。
9.如权利要求8所述的T2DM引起冠心病风险的预测装置,其特征在于,所述T2DM引起冠心病风险的预测装置进一步包括:
判断模块,所述判断模块用于判断所述待预测者可能发展为冠心病的概率是否高于发展阈值,若高于发展阈值,则判定为高概率患者;
特征贡献度获取模块,所述特征贡献度获取模块用于根据高概率患者的特征选用身体指标以及冠心病风险预测分类器,获取高概率患者的每个特征选用身体指标所对应的特征贡献度。
10.一种T2DM引起冠心病风险的预测系统,其特征在于,所述T2DM引起冠心病风险的预测系统包括:
T2DM引起冠心病风险的预测装置,所述T2DM引起冠心病风险的预测装置为如权利要求6至9中任意一项所述的T2DM引起冠心病风险的预测装置;
人机交互模块,所述人机交互模块用于供使用者与所述T2DM引起冠心病风险的预测装置进行通信,以使使用者通过所述人机交互模块为所述T2DM引起冠心病风险的预测装置提供待预测者的特征选用身体指标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010912895.1A CN113611412B (zh) | 2020-09-03 | 2020-09-03 | 一种t2dm引起冠心病风险的预测方法、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010912895.1A CN113611412B (zh) | 2020-09-03 | 2020-09-03 | 一种t2dm引起冠心病风险的预测方法、装置及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113611412A true CN113611412A (zh) | 2021-11-05 |
CN113611412B CN113611412B (zh) | 2022-02-22 |
Family
ID=78336335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010912895.1A Active CN113611412B (zh) | 2020-09-03 | 2020-09-03 | 一种t2dm引起冠心病风险的预测方法、装置及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113611412B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117112448A (zh) * | 2023-10-18 | 2023-11-24 | 浙江东安检测技术有限公司 | 基于森林算法的软件测试故障定位方法、系统及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103150611A (zh) * | 2013-03-08 | 2013-06-12 | 北京理工大学 | Ii型糖尿病发病概率分层预测方法 |
CN107992887A (zh) * | 2017-11-28 | 2018-05-04 | 东软集团股份有限公司 | 分类器生成方法、分类方法、装置、电子设备及存储介质 |
CN109117864A (zh) * | 2018-07-13 | 2019-01-01 | 华南理工大学 | 基于异构特征融合的冠心病风险预测方法、模型及系统 |
CN109346179A (zh) * | 2018-12-10 | 2019-02-15 | 陈阳 | 一种冠心病介入术后复发预测模型及其建模方法、装置 |
CN111354464A (zh) * | 2018-12-24 | 2020-06-30 | 深圳先进技术研究院 | Cad预测模型建立方法、装置以及电子设备 |
-
2020
- 2020-09-03 CN CN202010912895.1A patent/CN113611412B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103150611A (zh) * | 2013-03-08 | 2013-06-12 | 北京理工大学 | Ii型糖尿病发病概率分层预测方法 |
CN107992887A (zh) * | 2017-11-28 | 2018-05-04 | 东软集团股份有限公司 | 分类器生成方法、分类方法、装置、电子设备及存储介质 |
CN109117864A (zh) * | 2018-07-13 | 2019-01-01 | 华南理工大学 | 基于异构特征融合的冠心病风险预测方法、模型及系统 |
CN109346179A (zh) * | 2018-12-10 | 2019-02-15 | 陈阳 | 一种冠心病介入术后复发预测模型及其建模方法、装置 |
CN111354464A (zh) * | 2018-12-24 | 2020-06-30 | 深圳先进技术研究院 | Cad预测模型建立方法、装置以及电子设备 |
Non-Patent Citations (4)
Title |
---|
吴贵军: "通过简单临床观察构建胸痛患者冠心病预测模型过程中的风险因素分析", 《现代生物医学进展》 * |
李修颖: "2型糖尿病合并冠心病危险因素的临床分析", 《糖尿病新世界》 * |
李婕等: "冠心病风险因素识别及其预测模型构建", 《中华医学图书情报杂志》 * |
黄春梅: ""老年T2DM合并亚临床甲状腺功能减退患者发生冠心病的危险因素分析"", 《中外医学研究》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117112448A (zh) * | 2023-10-18 | 2023-11-24 | 浙江东安检测技术有限公司 | 基于森林算法的软件测试故障定位方法、系统及介质 |
CN117112448B (zh) * | 2023-10-18 | 2024-01-30 | 浙江东安检测技术有限公司 | 基于森林算法的软件测试故障定位方法、系统及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113611412B (zh) | 2022-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Attia et al. | Prospective validation of a deep learning electrocardiogram algorithm for the detection of left ventricular systolic dysfunction | |
CN111710420B (zh) | 一种基于电子病历大数据的并发症发病风险预测方法、系统、终端以及存储介质 | |
US11404166B2 (en) | Systems and methods for mining of medical data | |
Hess et al. | Diagnostic accuracy of clinical prediction rules to exclude acute coronary syndrome in the emergency department setting: a systematic review | |
Kontos et al. | Ability of troponin I to predict cardiac events in patients admitted from the emergency department | |
Bai et al. | Development of a machine learning model to predict the risk of late cardiogenic shock in patients with ST-segment elevation myocardial infarction | |
Mollura et al. | A novel artificial intelligence based intensive care unit monitoring system: using physiological waveforms to identify sepsis | |
EP3433614A1 (en) | Use of clinical parameters for the prediction of sirs | |
CN114220540A (zh) | 一种糖尿病肾病风险预测模型的构建方法及应用 | |
Kotani et al. | Validation of the diagnostic utility of D-dimer measurement in patients with acute aortic syndrome | |
Akerman et al. | Automated echocardiographic detection of heart failure with preserved ejection fraction using artificial intelligence | |
Isogai et al. | Apical Takotsubo syndrome versus anterior acute myocardial infarction: findings from the Tokyo Cardiovascular Care Unit network registry | |
CN113611412B (zh) | 一种t2dm引起冠心病风险的预测方法、装置及系统 | |
Sundaram et al. | Hospitalization for heart failure in the United States, UK, Taiwan, and Japan: an international comparison of administrative health records on 413,385 individual patients | |
Overmars et al. | Preventing unnecessary imaging in patients suspect of coronary artery disease through machine learning of electronic health records | |
CN113128654A (zh) | 一种用于冠心病预诊断中的改进型随机森林模型及其预诊断系统 | |
Axente et al. | Heart failure prognostic model | |
Shukeri et al. | Levels and diagnostic value of model-based insulin sensitivity in sepsis: A preliminary study | |
Fort et al. | Considerations for using research data to verify clinical data accuracy | |
US20230218238A1 (en) | Noninvasive methods for quantifying and monitoring liver disease severity | |
Zhou et al. | A novel laboratory-based model to predict the presence of obstructive coronary artery disease comparison to coronary artery disease consortium 1/2 score, duke clinical score and diamond-forrester score in china | |
US20180137253A1 (en) | Method and apparatus for determining evaluation factor for physiological condition | |
Hani et al. | Effective prediction of mortality by heart disease among women in jordan using the Chi-Squared Automatic Interaction Detection Model: retrospective validation study | |
Savorgnan et al. | Physiologic profile associated with severe multisystem inflammatory syndrome in children: a retrospective study | |
Kraevsky-Phillips et al. | Unsupervised machine learning identifies symptoms of indigestion as a predictor of acute decompensation and adverse cardiac events in patients with heart failure presenting to the emergency department |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |