CN108573753A - 一种融合Bagging的XGboost慢性肾病分期预测算法 - Google Patents
一种融合Bagging的XGboost慢性肾病分期预测算法 Download PDFInfo
- Publication number
- CN108573753A CN108573753A CN201810383551.9A CN201810383551A CN108573753A CN 108573753 A CN108573753 A CN 108573753A CN 201810383551 A CN201810383551 A CN 201810383551A CN 108573753 A CN108573753 A CN 108573753A
- Authority
- CN
- China
- Prior art keywords
- xgboost
- bagging
- classification
- algorithms
- fusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了一种融合Bagging的XGboost慢性肾病分期预测算法,该算法在XGboost算法基础上,引入Bagging集成学习算法,通过对原始样本进行k轮集中有放回的抽取训练集,得到k个相互独立的训练集,将每个训练集通过XGboost算法学习到的弱分类器通过一定的规则,组合成一个强分类器,在规则的制定上,引入“投票”机制,即“少数服从多数”原则,每个弱分类器都具有投票权且重要性相同,弱分类器器投出最多票数的类别或者类别之一为最终类别。
Description
技术领域
本发明涉及慢性肾病分类预测算法,特别涉及一种融合Bagging的XGboost慢性肾病分期预测算法。
背景技术
由于慢性肾病早期症状不明显、病因复杂及患者自我意识薄弱,造成慢性肾病知晓率、早期诊断率和治疗率都较低,导致目前慢性肾病防治困难的现状。将数据挖掘技术应用于医疗领域,利用已知的医疗数据建立模型,为疾病诊断和预后提供一定的参考,是传统医学与信息技术相结合的典型应用。Bagging算法是一种将弱分类器组装成强分类器的方法,通过从原始样本进行k轮集中有放回的抽取训练集,得到k个相互独立的训练集,每次使用一个训练集得到一个模型,k个训练集共得到k个模型,若为分类问题,则将上步得到的k个模型采用投票的方式得到分类结果;若为回归问题,计算上述模型的均值作为最后的结果(所有模型的重要性相同)。
发明内容
本发明公开了一种融合Bagging的XGboost慢性肾病分期预测算法。该算法在XGboost算法基础上,引入Bagging集成学习算法,将许多通过XGboost算法学习到的弱分类器通过一定的规则,组合成一个强分类器。在规则的制定上,引入“投票”机制,即“少数服从多数”原则,每个弱分类器都具有投票权且重要性相同,弱分类器器投出最多票数的类别或者类别之一为最终类别。
附图说明
图1为本发明一种融合Bagging的XGboost慢性肾病分期预测算法的原理图;
图2为本发明Bagging算法实现过程图;
具体实施方式
下面结合附图和实施对本发明进一步说明。
如图1所示,本发明公开了一种融合Bagging的XGboost慢性肾病分期预测算法,该算法在XGboost算法基础上,引入Bagging集成学习算法,通过对原始样本进行k轮集中有放回的抽取训练集,得到k个相互独立的训练集,将每个训练集通过XGboost算法学习到的弱分类器通过一定的规则,组合成一个强分类器。在规则的制定上,引入“投票”机制,即“少数服从多数”原则,每个弱分类器都具有投票权且重要性相同,弱分类器器投出最多票数的类别或者类别之一为最终类别。
图2是本发明Bagging算法实现过程图,通过从原始样本进行k轮集中有放回的抽取训练集,得到k个相互独立的训练集,每次使用一个训练集得到一个模型,k个训练集共得到k个模型,若为分类问题,则将上步得到的k个模型采用投票的方式得到分类结果;若为回归问题,计算上述模型的均值作为最后的结果(所有模型的重要性相同)。
Claims (4)
1.本发明公开了一种融合Bagging的XGboost慢性肾病分期预测算法,该算法在XGboost算法基础上,引入Bagging集成学习算法,通过对原始样本进行k轮集中有放回的抽取训练集,得到k个相互独立的训练集,将每个训练集通过XGboost算法学习到的弱分类器通过一定的规则,组合成一个强分类器,在规则的制定上,引入“投票”机制,即“少数服从多数”原则,每个弱分类器都具有投票权,弱分类器器投出最多票数的类别或者类别之一为最终类别(所有模型的重要性相同)。
2.根据权利要求1所述的一种融合Bagging的XGboost慢性肾病分期预测算法,其特征在于:将XGboost算法作为一个弱分类器,同时与Bagging算法相结合,最终构建强分类器。
3.根据权利要求1所述的一种融合Bagging的XGboost慢性肾病分期预测算法,其特征在于:通过对样本多次随机采样,得到采样集1,2,……,m,对于每一个采样集,利用XGboost算法分别构建弱分类器对其进行分类。
4.根据权利要求1所述的一种融合Bagging的XGboost慢性肾病分期预测算法,其特征在于:构建的每一个弱分类器都具有投票权且重要性相同,分类器投出最多票数的类别或者类别之一为最终类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810383551.9A CN108573753A (zh) | 2018-04-26 | 2018-04-26 | 一种融合Bagging的XGboost慢性肾病分期预测算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810383551.9A CN108573753A (zh) | 2018-04-26 | 2018-04-26 | 一种融合Bagging的XGboost慢性肾病分期预测算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108573753A true CN108573753A (zh) | 2018-09-25 |
Family
ID=63574438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810383551.9A Pending CN108573753A (zh) | 2018-04-26 | 2018-04-26 | 一种融合Bagging的XGboost慢性肾病分期预测算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108573753A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109065171A (zh) * | 2018-11-05 | 2018-12-21 | 苏州贝斯派生物科技有限公司 | 基于集成学习的川崎病风险评估模型的构建方法及系统 |
CN109493975A (zh) * | 2018-12-20 | 2019-03-19 | 广州天鹏计算机科技有限公司 | 基于xgboost模型的慢性病复发预测方法、装置和计算机设备 |
CN109614580A (zh) * | 2019-02-21 | 2019-04-12 | 东南大学 | 基于在线Xgboost算法的抗震混合试验模型更新方法 |
CN111554401A (zh) * | 2020-03-26 | 2020-08-18 | 肾泰网健康科技(南京)有限公司 | 一种构建ai慢性肾病筛查模型的方法、慢性肾病筛查方法及系统 |
CN112927795A (zh) * | 2021-02-23 | 2021-06-08 | 山东大学 | 基于bagging算法的乳腺癌预测方法 |
CN113704756A (zh) * | 2021-07-19 | 2021-11-26 | 广州大学 | 基于集成策略的挖矿型恶意代码鲁棒性检测方法、系统及介质 |
US11350887B2 (en) | 2019-08-07 | 2022-06-07 | Fresenius Medical Care Holdings, Inc. | Systems and methods for detection of potential health issues |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140278130A1 (en) * | 2013-03-14 | 2014-09-18 | William Michael Bowles | Method of predicting toxicity for chemical compounds |
WO2016201575A1 (en) * | 2015-06-17 | 2016-12-22 | Uti Limited Partnership | Systems and methods for predicting cardiotoxicity of molecular parameters of a compound based on machine learning algorithms |
CN107332848A (zh) * | 2017-07-05 | 2017-11-07 | 重庆邮电大学 | 一种基于大数据的网络流量异常实时监测系统 |
-
2018
- 2018-04-26 CN CN201810383551.9A patent/CN108573753A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140278130A1 (en) * | 2013-03-14 | 2014-09-18 | William Michael Bowles | Method of predicting toxicity for chemical compounds |
WO2016201575A1 (en) * | 2015-06-17 | 2016-12-22 | Uti Limited Partnership | Systems and methods for predicting cardiotoxicity of molecular parameters of a compound based on machine learning algorithms |
CN107332848A (zh) * | 2017-07-05 | 2017-11-07 | 重庆邮电大学 | 一种基于大数据的网络流量异常实时监测系统 |
Non-Patent Citations (1)
Title |
---|
谢冬青等: ""基于Bagging策略的XGBoost算法在商品购买预测中的应用"", 《现代信息科技》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109065171A (zh) * | 2018-11-05 | 2018-12-21 | 苏州贝斯派生物科技有限公司 | 基于集成学习的川崎病风险评估模型的构建方法及系统 |
CN109493975A (zh) * | 2018-12-20 | 2019-03-19 | 广州天鹏计算机科技有限公司 | 基于xgboost模型的慢性病复发预测方法、装置和计算机设备 |
CN109493975B (zh) * | 2018-12-20 | 2021-10-01 | 广州医科大学附属第一医院 | 基于xgboost模型的慢性病复发预测方法、装置和计算机设备 |
CN109614580A (zh) * | 2019-02-21 | 2019-04-12 | 东南大学 | 基于在线Xgboost算法的抗震混合试验模型更新方法 |
US11350887B2 (en) | 2019-08-07 | 2022-06-07 | Fresenius Medical Care Holdings, Inc. | Systems and methods for detection of potential health issues |
CN111554401A (zh) * | 2020-03-26 | 2020-08-18 | 肾泰网健康科技(南京)有限公司 | 一种构建ai慢性肾病筛查模型的方法、慢性肾病筛查方法及系统 |
CN111554401B (zh) * | 2020-03-26 | 2020-12-29 | 肾泰网健康科技(南京)有限公司 | Ai慢性肾病风险筛查建模方法、慢性肾病风险筛查方法及系统 |
WO2021190300A1 (zh) * | 2020-03-26 | 2021-09-30 | 肾泰网健康科技(南京)有限公司 | Ai慢性肾病风险筛查建模方法、慢性肾病风险筛查方法及系统 |
CN112927795A (zh) * | 2021-02-23 | 2021-06-08 | 山东大学 | 基于bagging算法的乳腺癌预测方法 |
CN113704756A (zh) * | 2021-07-19 | 2021-11-26 | 广州大学 | 基于集成策略的挖矿型恶意代码鲁棒性检测方法、系统及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108573753A (zh) | 一种融合Bagging的XGboost慢性肾病分期预测算法 | |
Gjoreski et al. | Machine learning and end-to-end deep learning for the detection of chronic heart failure from heart sounds | |
US20210374958A1 (en) | Neural network classification | |
TWI813696B (zh) | 處理來自一醫學影像裝置之即時視訊及偵測於該視訊中之物體的系統及方法 | |
Gandhi et al. | Predictions in heart disease using techniques of data mining | |
JP6906347B2 (ja) | 医用画像分類装置、方法およびプログラム | |
CN109003679B (zh) | 一种脑血管出血与缺血预测方法及装置 | |
KR102100698B1 (ko) | 앙상블 학습 알고리즘을 이용한 인공지능 기반 진단 보조 시스템 | |
JP6877486B2 (ja) | 情報処理装置、内視鏡用プロセッサ、情報処理方法およびプログラム | |
CN106504232A (zh) | 一种基于3d卷积神经网络的肺部结节自动检测方法 | |
US10713783B2 (en) | Neural network classification | |
Gupta | Pneumonia detection using convolutional neural networks | |
CN111785366B (zh) | 患者治疗方案的确定方法、装置及计算机设备 | |
Deschepper et al. | A hospital wide predictive model for unplanned readmission using hierarchical ICD data | |
CN106096286A (zh) | 临床路径制定方法及装置 | |
KR102446376B1 (ko) | 사망 또는 패혈증 위험도 예측 방법 및 이를 이용한 사망 또는 패혈증 위험도 예측용 디바이스 | |
KR20200131020A (ko) | 의료기계 학습 시스템 | |
US11935239B2 (en) | Control method, apparatus and program for system for determining lesion obtained via real-time image | |
Soundrapandiyan et al. | AI-based wavelet and stacked deep learning architecture for detecting coronavirus (COVID-19) from chest X-ray images | |
Singh | Pneumonia detection using deep learning | |
Wang et al. | A maintenance hemodialysis mortality prediction model based on anomaly detection using longitudinal hemodialysis data | |
Zeng et al. | A multimodal parallel method for left ventricular dysfunction identification based on phonocardiogram and electrocardiogram signals synchronous analysis | |
US20230290506A1 (en) | Systems and methods for rapidly screening for signs and symptoms of disorders | |
Ghias et al. | Using Machine Learning Algorithms to predict sepsis and its stages in ICU patients | |
Hanif et al. | Upper airway classification in sleep endoscopy examinations using convolutional recurrent neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180925 |