CN113782204A - 一种预测药物性肝损伤的方法、系统及存储介质 - Google Patents
一种预测药物性肝损伤的方法、系统及存储介质 Download PDFInfo
- Publication number
- CN113782204A CN113782204A CN202111075341.1A CN202111075341A CN113782204A CN 113782204 A CN113782204 A CN 113782204A CN 202111075341 A CN202111075341 A CN 202111075341A CN 113782204 A CN113782204 A CN 113782204A
- Authority
- CN
- China
- Prior art keywords
- prediction
- model
- xgboost
- drug
- liver injury
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010072268 Drug-induced liver injury Diseases 0.000 title claims abstract description 35
- 208000008964 Chemical and Drug Induced Liver Injury Diseases 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 title claims abstract description 30
- 239000011159 matrix material Substances 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims description 22
- 206010067125 Liver injury Diseases 0.000 claims description 14
- 238000012360 testing method Methods 0.000 claims description 11
- 238000002790 cross-validation Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 6
- 231100000753 hepatic injury Toxicity 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000010187 selection method Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 229940079593 drug Drugs 0.000 abstract description 9
- 239000003814 drug Substances 0.000 abstract description 9
- 238000010801 machine learning Methods 0.000 abstract description 9
- 238000005516 engineering process Methods 0.000 abstract description 3
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 23
- 108010082126 Alanine transaminase Proteins 0.000 description 23
- 231100000234 hepatic damage Toxicity 0.000 description 10
- 230000008818 liver damage Effects 0.000 description 10
- 229940072185 drug for treatment of tuberculosis Drugs 0.000 description 9
- 201000008827 tuberculosis Diseases 0.000 description 9
- AEUTYOVWOVBAKS-UWVGGRQHSA-N ethambutol Chemical compound CC[C@@H](CO)NCCN[C@@H](CC)CO AEUTYOVWOVBAKS-UWVGGRQHSA-N 0.000 description 8
- 238000003066 decision tree Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 230000002365 anti-tubercular Effects 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 229960000285 ethambutol Drugs 0.000 description 4
- 229960005206 pyrazinamide Drugs 0.000 description 4
- IPEHBUMCGVEMRF-UHFFFAOYSA-N pyrazinecarboxamide Chemical compound NC(=O)C1=CN=CC=N1 IPEHBUMCGVEMRF-UHFFFAOYSA-N 0.000 description 4
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 4
- 239000000814 tuberculostatic agent Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 210000004185 liver Anatomy 0.000 description 3
- JQXXHWHPUNPDRT-WLSIYKJHSA-N rifampicin Chemical compound O([C@](C1=O)(C)O/C=C/[C@@H]([C@H]([C@@H](OC(C)=O)[C@H](C)[C@H](O)[C@H](C)[C@@H](O)[C@@H](C)\C=C\C=C(C)/C(=O)NC=2C(O)=C3C([O-])=C4C)C)OC)C4=C1C3=C(O)C=2\C=N\N1CC[NH+](C)CC1 JQXXHWHPUNPDRT-WLSIYKJHSA-N 0.000 description 3
- 229960001225 rifampicin Drugs 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000003759 clinical diagnosis Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 208000006454 hepatitis Diseases 0.000 description 2
- QRXWMOHMRWLFEY-UHFFFAOYSA-N isoniazide Chemical compound NNC(=O)C1=CC=NC=C1 QRXWMOHMRWLFEY-UHFFFAOYSA-N 0.000 description 2
- 230000003908 liver function Effects 0.000 description 2
- 238000007449 liver function test Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 229960005322 streptomycin Drugs 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 208000029462 Immunodeficiency disease Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 229940124976 antitubercular drug Drugs 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 229940000425 combination drug Drugs 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- 230000007813 immunodeficiency Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 208000019423 liver disease Diseases 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 208000008128 pulmonary tuberculosis Diseases 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 210000000115 thoracic cavity Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Theoretical Computer Science (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了一种预测药物性肝损伤的方法、系统及存储介质,涉及机器学习技术领域,具体步骤为:获取数据样本;构建XGBoost预测模型;将所述数据样本输入到所述XGBoost预测模型中,获取预测结果;根据所述预测结果进行预警提示。将药物性肝损伤预测与机器学习技术相结合,基于XGBoost预测模型进行预测,在病人药物性肝损伤发生之前提供预警信号,以帮助临床医生及时调整药物计划,并降低药物性肝损伤的可能性,除此之外,通过混淆矩阵评估预测结果,提升了模型的预测精度。
Description
技术领域
本发明涉及机器学习技术领域,更具体的说是涉及一种预测药物性肝损伤的方法、系统及存储介质。
背景技术
肺结核是一种严重危害人类健康的慢性传染病,治愈肺结核是控制肺结核疫情的重要措施。目前常规使用的治疗肺结核药物为抗结核固定剂量复合制剂(Fixed-DoseCombinations,FDC),是将化疗方案中各种不同抗结核药物按一定剂量制成的一种复方混合制剂。但是抗结核药物会导致药物性肝损伤(Antituberculosis Drug-Induced LiverInjury,AT DILI)。研究数据显示,南山区2013年10月至2014年9月登记治疗的肺结核患者有27%因药物性肝损伤停药。
药物性肝损伤(Drug-induced liver injury,DILI)是指由药物本身或其代谢产物所导致的肝损伤,以往有或无肝脏基础疾病的患者在使用药物后均有可能发生DILI。抗结核药物导致的药物性肝损伤,可大大影响抗结核治疗,有可能导致治疗不成功、治疗效果不佳或疗程延长。在过去的临床诊疗中,医生即使了解引起DILI的原因,也只对已知基础性肝病、免疫缺陷的患者进行规避,在发生DILI后才凭借临床经验结合检验数据来综合判断DILI的程度,采取事后干预和治疗,从而增加肺结核患者身体及经济负担,影响其最终治疗效果。
机器学习(Machine Learning,ML)是一门多领域交叉学科,注重算法的设计,其可以让计算机自动地从数据中“学习”规律,并利用规律对未知数据进行预测。通过机器学习,可以对已有疾病数据进行分析,发现其中规律,进而帮助寻找与疾病有关的特征,从而有效辅助疾病的临床诊断。在现有技术中,将药物性肝损伤预测与机器学习技术相结合还未有尝试,对本领域技术人员来说,如何利用预警模型来预测抗结核药物治疗肺结核患者引发药物性肝损伤的机率是亟待解决的问题。
发明内容
有鉴于此,本发明提供了一种预测药物性肝损伤的方法、系统及存储介质,将药物性肝损伤预测与机器学习技术相结合,利用预警模型来预测抗结核药物治疗肺结核患者引发药物性肝损伤的机率,预警及时且准确,能够最大程度的提高患者治疗依从性及成功率。
为了实现上述目的,本发明采用如下技术方案:一方面,提供一种预测药物性肝损伤的方法,具体步骤包括如下:
获取数据样本;
构建XGBoost预测模型;
将所述数据样本输入到所述XGBoost预测模型中,获取预测结果;
根据所述预测结果进行预警提示。
可选的,所述数据样本分为训练集和测试集。
可选的,构建所述XGBoost预测模型的步骤为:
进行分层k折交叉验证,利用所述训练集训练单树XGBoost模型;
根据所述单树XGBoost模型中每棵树的每个特征的贡献,得到每个特征对所述单树XGBoost模型的相对重要性分数;
将预测变量按相对重要性的降序逐个添加到所述单树XGBoost模型中,形成候选模型;
进行分层k折交叉验证,获得受试者工作特征曲线下面积的平均值,基于向后选择法,选择最终模型;
利用所述训练集训练所述最终模型。
通过采用上述技术方案,具有以下有益的技术效果:XGBoost算法作为预测模型可以很好地处理缺失值,决策树中对缺失数据的高度容忍度使得该模型在处理临床数据时具有鲁棒性,更加方便地应用于临床领域。
可选的,还包括将所述预测结果与真实结果进行对比,将预测不准确的数据放入所述XGBoost预测模型中继续进行训练。
可选的,通过混淆矩阵来评估所述预测结果。
通过采用上述技术方案,具有以下有益的技术效果:利用混淆矩阵评估预测结果,将患者的预测结果与真实结果做对比,将预测不准确的数据和结果放入模型中继续进行训练,提升了模型的预测精度。
另一方面,还提供一种预测药物性肝损伤的系统,包括依次连接的数据获取模块、模型构建模块、预测模块、预警模块;其中,
所述数据获取模块,用于获取数据样本;
所述模型构建模块,用于构建XGBoost预测模型;
所述预测模块,用于将所述数据样本输入到所述XGBoost预测模型中,获取预测结果;
所述预警模块,用于根据所述预测结果进行预警提示。
可选的,还包括结果评估模块,用于通过混淆矩阵对所述预测结果进行评估。
最后,提供一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现一种预测药物性肝损伤的方法的步骤。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种预测药物性肝损伤的方法、系统及存储介质,基于XGBoost预测模型进行预测,在病人药物性肝损伤发生之前提供预警信号,以帮助临床医生及时调整药物计划,并降低药物性肝损伤的可能性,除此之外,通过混淆矩阵评估预测结果,提升了模型的预测精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明的方法流程示意图;
图2为本发明的系统结果示意图;
图3为本发明的单树XGBoost模型选择的前10个重要变量图;
图4为本发明的模型单个决策树运行图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例1公开了一种预测药物性肝损伤的方法,如图1所示,具体步骤包括如下:
获取数据样本;
构建XGBoost预测模型;
将数据样本输入到XGBoost预测模型中,获取预测结果;
根据预测结果进行预警提示。
进一步的,数据样本分为训练集和测试集。
具体的,在本实施例中数据样本包括:
a)收集患者的人口统计学和临床数据,包括性别,年龄,体重,文化程度,收入,身高,乙型肝炎状况,糖尿病状况,
b)收集患者累积服用的每种抗结核药物的总剂量,需收集服用剂量的抗结核药品有:异烟肼(INH)、利福平(RFP)、乙胺丁醇(EMB)、吡嗪酰胺(PZA)和链霉素(SM)。对于未发生肝损伤的患者,收集截至数据统计日期,患者已服用的抗结核药物总量。对于发生肝损伤的患者,收集截至检测到肝损伤时的药物总量。谷丙转胺酶(ALT)的正常数值范围为0-35U/L,将谷丙转胺酶(ALT)>35U/L的情况判定为发生肝损。
c)收集肝功能检查中谷丙转胺酶(ALT)检测结果。包括患者首次发生肝损时谷丙转胺酶(ALT)的数值和患者最后一次肝功能检测时谷丙转胺酶(ALT)的数值。此外,还需要计算患者最后一次肝功能检测时谷丙转胺酶(ALT)的数值与患者首次发生肝损时谷丙转胺酶(ALT)的数值之间的比值。
进一步的,构建XGBoost预测模型的步骤为:
a)重复100次分层10折交叉验证,通过训练集训练单树XGBoost模型,根据模型中每棵树的每个特征的贡献,获得它们对树模型的相对重要性分数,从而获得每个输入特征的相对重要性;
b)选择重要性前15位的预测因子,将预测变量按相对重要性的降序逐个添加到模型中,以形成15个候选模型;
c)重复100次分层10折交叉验证,以获得受试者工作特征曲线(AUC)下面积的平均值,采用向后选择法,根据AUC值来选择最终模型;
d)利用训练集训练所选模型以获得最终结果。
XGBoost是一种基于树提升系统的机器学习算法,使用稀疏感知算法来处理稀疏数据和加权分位数草图以近似树学习,由于决策树是由分层组织的二分法确定组成的简单分类器,其结构也表现出良好的可解释性,此外,该模型可以很好地处理缺失值。决策树中可解释的标准和对缺失数据的高度容忍度使得该模型在处理临床数据时具有鲁棒性,更加方便地应用于临床领域。
进一步的,还包括通过混淆矩阵将预测结果与真实结果进行对比,将预测不准确的数据放入XGBoost预测模型中继续进行训练。混淆矩阵是显示预测结果与实际结果之间关系的列联表,进行结果评估提升了模型的预测精度。
更进一步的,在真实数据集上验证本发明方法的有效性。
在本实施例中提取了2014年至2019年在南山区慢性病防治医院HIS系统登记的757例肺结核病例。部分患者没有连续治疗,或先转院后返回医院,导致记录的治疗时间超过正常范围,累积抗结核药物剂量不明确。此类异常病例无法为接受常规治疗的病例做出预测。因此,根据典型的结核病治疗过程选择300天作为时间窗口,消除了在抗结核治疗开始后300天发现的TB-DILI病例,总共有743名患者的数据最终纳入模型,根据美国胸科学会标准将患者定义为阳性DILI病例:在肝炎症状的情况下,ALT的增加比正常上限(ULN)高3倍,并且在没有症状的情况下,ALT的增加比正常上限(ULN)高5倍。
输入数据:对于未发生肝损伤的患者:数据包括性别,年龄,体重,文化程度,收入,身高,乙型肝炎状况,糖尿病状况,累积抗结核药物剂量和ALT检测结果。对于未发生肝损伤的患者,收集截至最新肝脏检查的处方抗结核药物总量。对于发生TB-DILI的患者,收集截至检测到肝损伤时的药物总量。此外,计算最后一次肝检查前患者的最新ALT测试值,以及最终肝功能测试前最后两次ALT测试值的平均变化率,并分别计算了组合药物的每种成分的累积量(“PZA”,“RFP”,“EMB”,“INH”)。
根据治疗开始的时间,将患者分成训练和验证数据集,将2019年4月之前(607例患者和186例阳性病例)入院的患者用作训练数据集,2019年4月之后(136例患者和95例阳性病例)入院的患者用作验证数据集。
如图3所示,显示了单树XGBoost模型选择的前10个重要变量,显而易见,ALT被证明是预测过程中最重要的因素。
将10个变量逐一放入模型中,形成10个候选模型,经过100次10折交叉验证训练和测试后,发现具有四个变量的模型显示最大AUC值,如表1所示,因此,选择具有四个变量的模型(最近的ALT测试值,最后两个ALT测试值的平均变化率,PZA的累积剂量,EMB的累积剂量)作为最终模型。
表1
基于整个训练集训练所选最终模型,如图4所示显示了模型的单个决策树的内容,决策过程从最近的ALT测试值开始,然后在决策树中的每个节点进行二分确定,最后该过程以输出预测(药物性肝损伤的高风险/低风险)结束。
通过验证数据集(136个案例)对所选XGBoost预测模型进行验证,如表2所示,模型正确预测了70例药物性肝损伤病例,成功预测了33例阴性病例。
通过精确度、召回率、分类准确度、平衡错误率进行模型表现评估,精确度:
召回率:分类准确度:平衡错误率:其中,TP:预测中的真阳性病例数,TN:预测中的真阴性病例数,FP:预测中的假阳性病例数,FN:预测中的假阴性病例数。通过计算,该模型的精度为90%,召回率为74%,分类精度为76%,平衡错误率为77%,F1值为81%。
表2
本发明实施例2公开了一种预测药物性肝损伤的系统,如图2所示,包括依次连接的数据获取模块、模型构建模块、预测模块、预警模块;其中,
数据获取模块,用于获取数据样本;
模型构建模块,用于构建XGBoost预测模型;
预测模块,用于将数据样本输入到XGBoost预测模型中,获取预测结果;
预警模块,用于根据预测结果进行预警提示。
进一步的,还包括结果评估模块,用于通过混淆矩阵对预测结果进行评估。
最后,提供一种计算机存储介质,计算机存储介质上存储有计算机程序,计算机程序被处理器执行时实现一种预测药物性肝损伤的方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (8)
1.一种预测药物性肝损伤的方法,其特征在于,具体步骤包括如下:
获取数据样本;
构建XGBoost预测模型;
将所述数据样本输入到所述XGBoost预测模型中,获取预测结果;
根据所述预测结果进行预警提示。
2.根据权利要求1所述的一种预测药物性肝损伤的方法,其特征在于,所述数据样本分为训练集和测试集。
3.根据权利要求2所述的一种预测药物性肝损伤的方法,其特征在于,构建所述XGBoost预测模型的步骤为:
进行分层k折交叉验证,利用所述训练集训练单树XGBoost模型;
根据所述单树XGBoost模型中每棵树的每个特征的贡献,得到每个特征对所述单树XGBoost模型的相对重要性分数;
将预测变量按相对重要性的降序逐个添加到所述单树XGBoost模型中,形成候选模型;
进行分层k折交叉验证,获得受试者工作特征曲线下面积的平均值,基于向后选择法,选择最终模型;
利用所述训练集训练所述最终模型。
4.根据权利要求1所述的一种预测药物性肝损伤的方法,其特征在于,还包括将所述预测结果与真实结果进行对比,将预测不准确的数据放入所述XGBoost预测模型中继续进行训练。
5.根据权利要求1所述的一种预测药物性肝损伤的方法,其特征在于,通过混淆矩阵来评估所述预测结果。
6.一种预测药物性肝损伤的系统,其特征在于,包括依次连接的数据获取模块、模型构建模块、预测模块、预警模块;其中,
所述数据获取模块,用于获取数据样本;
所述模型构建模块,用于构建XGBoost预测模型;
所述预测模块,用于将所述数据样本输入到所述XGBoost预测模型中,获取预测结果;
所述预警模块,用于根据所述预测结果进行预警提示。
7.根据权利要求6所述的一种预测药物性肝损伤的系统,其特征在于,还包括结果评估模块,用于通过混淆矩阵对所述预测结果进行评估。
8.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-5中任意一项所述的一种预测药物性肝损伤的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111075341.1A CN113782204A (zh) | 2021-09-14 | 2021-09-14 | 一种预测药物性肝损伤的方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111075341.1A CN113782204A (zh) | 2021-09-14 | 2021-09-14 | 一种预测药物性肝损伤的方法、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113782204A true CN113782204A (zh) | 2021-12-10 |
Family
ID=78843724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111075341.1A Pending CN113782204A (zh) | 2021-09-14 | 2021-09-14 | 一种预测药物性肝损伤的方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113782204A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117476231A (zh) * | 2023-11-09 | 2024-01-30 | 中山大学孙逸仙纪念医院 | 基于机器学习的药物性肝损伤风险预测方法、系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109461139A (zh) * | 2018-09-29 | 2019-03-12 | 桂林电子科技大学 | 一种基于动态mri信息融合的肝癌定量分析方法 |
-
2021
- 2021-09-14 CN CN202111075341.1A patent/CN113782204A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109461139A (zh) * | 2018-09-29 | 2019-03-12 | 桂林电子科技大学 | 一种基于动态mri信息融合的肝癌定量分析方法 |
Non-Patent Citations (2)
Title |
---|
TAO ZHONG等: "Predicting Antituberculosis Drug–Induced Liver Injury Using an Interpretable Machine Learning Method: Model Development and Validation Study", JMIR MEDICAL INFORMATICS, vol. 9, no. 7, pages 1 - 12 * |
李琼砚等: "音频音乐与计算机的交融 音频音乐技术", vol. 1, 复旦大学出版社, pages: 102 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117476231A (zh) * | 2023-11-09 | 2024-01-30 | 中山大学孙逸仙纪念医院 | 基于机器学习的药物性肝损伤风险预测方法、系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qin et al. | A machine learning methodology for diagnosing chronic kidney disease | |
EP1724698A2 (en) | A treatment effect prediction system, a treatment effect prediction method, and a computer program product thereof | |
CN109065171B (zh) | 基于集成学习的川崎病风险评估模型的构建方法及系统 | |
EP1418523A2 (en) | Diagnosis support system for diabetes | |
CN106339593A (zh) | 基于医疗数据建模的川崎病分类预测方法 | |
CN112419321A (zh) | X射线图像识别方法、装置、计算机设备及存储介质 | |
CN114724716A (zh) | 进展为2型糖尿病的风险预测的方法、模型训练及装置 | |
US11830589B2 (en) | Disease classification method and disease classification device | |
CN113782204A (zh) | 一种预测药物性肝损伤的方法、系统及存储介质 | |
CN113988680A (zh) | 一种疼痛等级评估系统 | |
CN111223536B (zh) | 一种预测肝素剂量的方法及装置 | |
Pratama et al. | Diagnosis of stroke and diabetes mellitus with classification techniques using decision tree method | |
CN116864062A (zh) | 一种基于互联网的健康体检报告数据分析管理系统 | |
JP6401297B2 (ja) | インスリン分泌能分析装置、当該装置を備えるインスリン分泌能分析システム及びインスリン分泌能分析方法 | |
US20180289292A1 (en) | Detection Systems Using Fingerprint Images for Type 1 Diabetes Mellitus and Type 2 Diabettes Mellitus | |
CN116564521A (zh) | 一种慢性病风险评估模型建立方法、介质及系统 | |
Sang et al. | Study on survival prediction of patients with heart failure based on support vector machine algorithm | |
Jusman et al. | Machine Learning Performances for Covid-19 Images Classification based Histogram of Oriented Gradients Features | |
KR101783689B1 (ko) | 질병 및 약물 특이적 임상 변수의 상보성을 활용한 신약 재창출 기법 및 장치 | |
CN110755084B (zh) | 基于主被动、分阶段动作的运动功能评估方法及设备 | |
Santiko et al. | Naive Bayes Algorithm Using Selection of Correlation Based Featured Selections Features for Chronic Diagnosis Disease | |
Ridwan et al. | Classification of Heart Failure using the Na� ve Bayes Algorithm | |
Berdaly et al. | Comparative machine-learning approach: study for heart diseases | |
Lu | Applying propensity score and support vector machine to construct a predictive model for heart disease | |
Hodapp et al. | Real-time posture and activity recognition by smartshoe |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |