CN117373675A - 一种基于smote算法的慢性阻塞性肺疾病再入院风险预测系统 - Google Patents
一种基于smote算法的慢性阻塞性肺疾病再入院风险预测系统 Download PDFInfo
- Publication number
- CN117373675A CN117373675A CN202311666521.6A CN202311666521A CN117373675A CN 117373675 A CN117373675 A CN 117373675A CN 202311666521 A CN202311666521 A CN 202311666521A CN 117373675 A CN117373675 A CN 117373675A
- Authority
- CN
- China
- Prior art keywords
- patient
- patients
- risk
- admitted
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 title claims abstract description 65
- 238000009792 diffusion process Methods 0.000 claims description 57
- 238000005192 partition Methods 0.000 claims description 44
- 230000000694 effects Effects 0.000 claims description 12
- PXIPVTKHYLBLMZ-UHFFFAOYSA-N Sodium azide Chemical compound [Na+].[N-]=[N+]=[N-] PXIPVTKHYLBLMZ-UHFFFAOYSA-N 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 238000011282 treatment Methods 0.000 abstract description 11
- 230000006399 behavior Effects 0.000 description 51
- 201000010099 disease Diseases 0.000 description 11
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 11
- 230000002685 pulmonary effect Effects 0.000 description 9
- 230000009798 acute exacerbation Effects 0.000 description 7
- 238000011161 development Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000002640 oxygen therapy Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000005713 exacerbation Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 230000000391 smoking effect Effects 0.000 description 5
- 238000000638 solvent extraction Methods 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- 238000003745 diagnosis Methods 0.000 description 4
- 239000003862 glucocorticoid Substances 0.000 description 4
- 230000004199 lung function Effects 0.000 description 4
- 238000000034 method Methods 0.000 description 4
- 206010036790 Productive cough Diseases 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 229940124630 bronchodilator Drugs 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 210000003979 eosinophil Anatomy 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000000474 nursing effect Effects 0.000 description 3
- 230000000241 respiratory effect Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 108010074051 C-Reactive Protein Proteins 0.000 description 2
- 102100032752 C-reactive protein Human genes 0.000 description 2
- 208000017667 Chronic Disease Diseases 0.000 description 2
- 201000006306 Cor pulmonale Diseases 0.000 description 2
- 239000003154 D dimer Substances 0.000 description 2
- 208000000059 Dyspnea Diseases 0.000 description 2
- 206010013975 Dyspnoeas Diseases 0.000 description 2
- 108010049003 Fibrinogen Proteins 0.000 description 2
- 102000008946 Fibrinogen Human genes 0.000 description 2
- 206010020772 Hypertension Diseases 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 206010061876 Obstruction Diseases 0.000 description 2
- 208000004186 Pulmonary Heart Disease Diseases 0.000 description 2
- 208000004756 Respiratory Insufficiency Diseases 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 239000000168 bronchodilator agent Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 239000000428 dust Substances 0.000 description 2
- 108010052295 fibrin fragment D Proteins 0.000 description 2
- 229940012952 fibrinogen Drugs 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 108700025647 major vault Proteins 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 230000037081 physical activity Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000009325 pulmonary function Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 201000004193 respiratory failure Diseases 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000013058 risk prediction model Methods 0.000 description 2
- 208000024794 sputum Diseases 0.000 description 2
- 210000003802 sputum Anatomy 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000009885 systemic effect Effects 0.000 description 2
- 229940037128 systemic glucocorticoids Drugs 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 208000014644 Brain disease Diseases 0.000 description 1
- 206010008479 Chest Pain Diseases 0.000 description 1
- 206010010970 Cor pulmonale chronic Diseases 0.000 description 1
- 206010011224 Cough Diseases 0.000 description 1
- 206010012289 Dementia Diseases 0.000 description 1
- 208000020401 Depressive disease Diseases 0.000 description 1
- 208000032274 Encephalopathy Diseases 0.000 description 1
- 208000018522 Gastrointestinal disease Diseases 0.000 description 1
- 208000003623 Hypoalbuminemia Diseases 0.000 description 1
- 206010024971 Lower respiratory tract infections Diseases 0.000 description 1
- 208000019693 Lung disease Diseases 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 206010047249 Venous thrombosis Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000006578 abscission Effects 0.000 description 1
- 208000036981 active tuberculosis Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000003915 air pollution Methods 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 238000011203 antimicrobial therapy Methods 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 230000004872 arterial blood pressure Effects 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 206010008118 cerebral infarction Diseases 0.000 description 1
- 208000026106 cerebrovascular disease Diseases 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 208000026636 chronic pulmonary heart disease Diseases 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 208000029078 coronary artery disease Diseases 0.000 description 1
- 230000000537 coughlike effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 208000010643 digestive system disease Diseases 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 208000018685 gastrointestinal system disease Diseases 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 235000004280 healthy diet Nutrition 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 229960003444 immunosuppressant agent Drugs 0.000 description 1
- 230000001861 immunosuppressant effect Effects 0.000 description 1
- 239000003018 immunosuppressive agent Substances 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 229960003971 influenza vaccine Drugs 0.000 description 1
- 208000030603 inherited susceptibility to asthma Diseases 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 208000017169 kidney disease Diseases 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 208000019423 liver disease Diseases 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000003141 lower extremity Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 230000001071 malnutrition Effects 0.000 description 1
- 235000000824 malnutrition Nutrition 0.000 description 1
- 238000005399 mechanical ventilation Methods 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000001473 noxious effect Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 208000015380 nutritional deficiency disease Diseases 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 230000000414 obstructive effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 208000020016 psychiatric disease Diseases 0.000 description 1
- 208000037803 restenosis Diseases 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 208000013220 shortness of breath Diseases 0.000 description 1
- 230000036578 sleeping time Effects 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Public Health (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及智慧医疗领域,尤其涉及一种基于smote算法的慢性阻塞性肺疾病再入院风险预测系统,通过采集各待入院预测患者的扩散路径,对各待入院预测患者进行划分,得到多个集合划分,采集表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素,生成表示风险因素行为对再入院行为存在影响的再入院风险要素,根据扩散路径将各待入院预测患者划分成多个集合,保证每个集合划分中包含的风险患者和目标患者对再入院行为均是发生路径相同或相似的患者,从而避免了现有技术中需要将风险患者和目标患者一一比对才能确定是否是相同或相似研究患者,减少解析过程,从而降低了进行再入院风险要素推断的时间和解析资源成本。
Description
技术领域
本发明涉及智慧医疗领域,尤其涉及一种基于smote算法的慢性阻塞性肺疾病再入院风险预测系统。
背景技术
慢性阻塞性肺疾病(Chronic Obstructive Pulmonary Disease,COPD,简称慢阻肺)是以持续呼吸道症状和不完全可逆性气流受限为特征,主要表现为胸闷、气短、咳白色粘液痰伴不完全性气流受限等,通常是因暴露于有害气体或颗粒引起的气道和(或)肺泡异常所致。慢阻肺病情可不断进展,肺功能进行性下降,进而逐步导致患者劳动力减退,重者发展至呼吸衰竭、肺源性心脏病,甚至死亡。根据一项最新的大型流行病学横断面调查结果显示,肺活量定义的慢阻肺患病率达8.6%,我国约有将近1亿慢阻肺患者,40岁以上患病率13.7%,达到了流行趋势,成为仅次于高血压、糖尿病的第三大慢性疾病。一项预测估计到2030年慢阻肺将成为我国第四大死亡原因。随着社会经济与技术的发展,居民生活水平的提高,生活方式的改变,寿命的延长,人口老龄化问题日渐突出,慢阻肺的问题也日益加重,慢阻肺作为我国呼吸衰竭及慢性肺源性心脏病的主要原因,已经成为重点防治的疾病。
调查发现,慢阻肺患者每年约发生0.5-3.5次的急性加重事件,而每次急性加重住院治疗可产生平均高达11598元/人的住院费用,是慢阻肺患者经济的主要支出所在,也是使慢阻肺患者病情进行性加重,肺功能持续性下降,严重影响患者的劳动力和生活质量的主要原因,1年和5年病死率超过20%和50%。对慢阻肺患者30 d内再入院现状进行系统分析时发现,再入院率高达2.6%-82.2%,其再入院可导致每年相关医疗费用花费超过150亿美元。Lin等对美国医疗数据库中99 528例慢阻肺病人相关数据进行调查,结果显示,30 d内再入院率为16.28%。Jacobs等通过对美国全国100万例左右慢阻肺病人再入院数据库进行分析,结果显示,再入院率为19.16%。Njoku等对澳大利亚医疗保健等数据库中2 261例慢阻肺病人再入院情况调查,仅6.68%的病人发生30 d内再入院。张瑞等研究表明老年COPD患者出院后30天内非计划再入院率高达19.77%。再入院与疾病恶化程度和死亡率上升密切相关,但目前我国对慢阻肺患者出院后30 d内再入院的研究较少,如何阻止患者疾病加重、降低再入院率和死亡率是慢性病的挑战。
目前AECOPD的治疗主要包括支气管扩张剂、糖皮质激素、抗微生物治疗、氧疗、机械通气支持、中医药治疗等,虽然能改善患者严重气流阻塞症状,但效果仍然有限。每次AECOPD的发生,伴随着患者肺功能的损害不可逆的下降。况且,慢阻肺急性加重的危险因素有很多,如既往急性加重频率、肺功能情况、临床症状严重程度、合并症、生物标志物、吸烟、年龄、性别、职业粉尘、空气污染、社会地位等,这些指标与慢阻肺急性加重风险或疾病预后密切相关。而肺康复、家庭氧疗、接种流感疫苗、早期接受全身糖皮质激素、规律吸入支气管扩张剂等为保护性因素,可降低患者再次入院的风险。此外,护理人员也需要给予合理的护理干预方案,如帮助患者戒除吸烟,避免接触二手烟、粉尘和化学物质,确保家中空气清洁和通风良好,以减少进一步损害肺功能的风险;加强个人卫生,避免接触感染源;保持健康的饮食,摄入足够的营养素和合适的热量,同时避免过度肥胖或营养不良;进行呼吸训练和适当的体力活动,如步行、游泳等,增强肺部功能和身体耐力;提供情绪支持和心理辅导,帮助患者减轻焦虑、抑郁和应对疾病的困扰。目前随着人们健康意识的提高,临床医务人员面对大量的COPD患者,如何在出院前“精准”识别准备不足或出院后是否继发加重的COPD患者,是我们面临的现实问题,因此制定符合本地区临床实际情况的预测模型十分必要。
发明内容
本公开提供一种基于smote算法的慢性阻塞性肺疾病再入院风险预测系统、装置及电子设备,以至少解决相关技术中进行再入院风险要素推断所需的时间和解析资源成本较高的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种基于smote算法的慢性阻塞性肺疾病再入院风险预测系统,包括:
扩散路径采集模块,被配置为执行采集各待入院预测患者的扩散路径,其中,所述各待入院预测患者包括风险患者和第一目标患者,所述风险患者为已发生风险因素行为的患者,所述第一目标患者为未发生所述风险因素行为的患者,每一待入院预测患者的扩散路径为:根据该待入院预测患者的特征数据预估的该待入院预测患者发生再入院行为的路径;
集合划分模块,被配置为执行按照所述各待入院预测患者的扩散路径,对所述各待入院预测患者进行划分,得到多个集合划分;
人数调整模块,被配置为执行针对风险患者与第一目标患者人数不同的每一集合划分,调整集合划分中第一目标患者的人数,使得集合划分中第一目标患者与风险患者的人数相同;
不一致要素获取模块,被配置为执行根据每一集合划分中第二风险患者的人数和第二目标患者的人数,采集表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素,其中,所述第二风险患者为已发生所述再入院行为的风险患者,所述第二目标患者为已发生所述再入院行为的第一目标患者;
再入院风险预测模块,被配置为执行当所述不一致要素表示所述第二风险患者的总人数大于所述第二目标患者的总人数时,生成表示所述风险因素行为对所述再入院行为存在影响的再入院风险要素。
进一步的,所述不一致要素获取模块中还包括:
当所述不一致要素表示所述第二风险患者的总人数不大于所述第二目标患者的总人数时,生成表示所述风险因素行为对所述再入院行为不存在影响的再入院风险要素。
进一步的,所述采集各待入院预测患者的扩散路径的步骤,包括:
获取各待入院预测患者的特征数据;
基于预先建立的特征数据与表示再入院行为发生路径的路径数值之间的对应关系,获取与每个待入院预测患者的特征数据对应的路径数值;
根据所获取的路径数值,采集每个所述待入院预测患者的扩散路径。
进一步的,每一待入院预测患者具有多种类型的特征数据;
所述根据所获取的路径数值,采集每个所述待入院预测患者的扩散路径的步骤,包括:
对每个所述待入院预测患者所具有的各类型的特征数据对应的路径数值相加,得到路径数值和,作为每个所述待入院预测患者的扩散路径。
进一步的,所述按照所述各待入院预测患者的扩散路径,对所述各待入院预测患者进行划分,得到多个集合划分的步骤,包括:
按照依据所述各待入院预测患者的扩散路径确定的集合划分顺序,将所述各待入院预测患者划分为待入院预测患者人数相同的多个集合划分;或者,
按照所述各待入院预测患者的扩散路径,将所述各待入院预测患者划分到对应不同路径区间的集合划分。
进一步的,所述针对风险患者与第一目标患者人数不同的每一集合划分,调整集合划分中第一目标患者的人数,使得集合划分中第一目标患者与风险患者的人数相同的步骤,包括:
按照以下方式调整风险患者与第一目标患者人数不同的每一集合划分中第一目标患者的人数:
确定集合划分中包含的风险患者的人数,作为第一人数,以及确定集合划分中包含的第一目标患者的人数,作为第二人数;
当所述第一人数小于所述第二人数时,解析所述第二人数与所述第一人数的第一人数差值;从集合划分自身包含的第一目标患者中,过滤掉所述第一人数差值个第一目标患者;
当所述第一人数大于所述第二人数时,解析所述第一人数与所述第二人数的第二人数差值;从集合划分自身包含的第一目标患者中,复制所述第二人数差值个第一目标患者;将复制的第一目标患者加入到集合划分中。
进一步的,所述根据每一集合划分中第二风险患者的人数和第二目标患者的人数,采集表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素的步骤,包括:
根据每一集合划分中第二风险患者的人数和第二目标患者的人数,解析所有集合划分中第二风险患者的第一总人数和第二目标患者的第二总人数;解析所述第一总人数与所述第二总人数间的第三人数差值,作为表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素;或者,
解析所有集合划分中第二风险患者与所述各待入院预测患者的第一人数比值,以及解析所有集合划分中第二目标患者与所述各待入院预测患者的第二人数比值;解析所述第一人数比值与所述第二人数比值的比值差,作为表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素。
根据本公开实施例的第二方面,提供一种基于smote算法的慢性阻塞性肺疾病再入院风险预测电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现上述任一项所述的基于smote算法的慢性阻塞性肺疾病再入院风险预测系统。
根据本公开实施例的第三方面,提供一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述任一项所述的基于smote算法的慢性阻塞性肺疾病再入院风险预测系统。
根据本公开实施例的第四方面,提供一种解析机程序产品,当所述解析机程序产品中的指令由电子设备的处理器执行时,使得电子设备能够执行如上述任一项所述的基于smote算法的慢性阻塞性肺疾病再入院风险预测系统。
本公开的实施例提供的技术方案至少带来以下有益效果:采集各待入院预测患者的扩散路径,其中,各待入院预测患者包括风险患者和第一目标患者,风险患者为已发生风险因素行为的患者,第一目标患者为未发生风险因素行为的患者,每一待入院预测患者的扩散路径为:根据该待入院预测患者的特征数据预估的该待入院预测患者发生再入院行为的路径,并且按照各待入院预测患者的扩散路径,对各待入院预测患者进行划分,得到多个集合划分,以及针对风险患者与第一目标患者人数不同的每一集合划分,调整集合划分中第一目标患者的人数,使得集合划分中第一目标患者与风险患者的人数相同,以及根据每一集合划分中第二风险患者的人数和第二目标患者的人数,采集表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素,其中,第二风险患者为已发生再入院行为的风险患者,第二目标患者为已发生再入院行为的第一目标患者,以及当不一致要素表示第二风险患者的总人数大于第二目标患者的总人数时,生成表示风险因素行为对再入院行为存在影响的再入院风险要素,由于每一个待入院预测患者的扩散路径为根据该待入院预测患者的特征数据预估的该待入院预测患者发生再入院行为的路径,并根据扩散路径将各待入院预测患者划分成多个集合,从而可以保证每个集合划分中包含的风险患者和目标患者对再入院行为而言均是发生路径相同或相似的患者,从而避免了现有技术中需要将风险患者和目标患者一一比对才能确定是否是相同或相似研究患者,减少了解析过程,从而降低了进行再入院风险要素推断的时间和解析资源成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种基于smote算法的慢性阻塞性肺疾病再入院风险预测系统的流程图。
图2是根据一示例性实施例示出的另一种基于smote算法的慢性阻塞性肺疾病再入院风险预测系统的流程图。
图3是根据一示例性实施例示出的一种扩散路径采集系统的流程图。
图4是根据一示例性实施例示出的一种基于smote算法的慢性阻塞性肺疾病再入院风险预测装置的框图。
图5是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的患者,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和系统的例子。
随着医学研究与数学不断的深入发展,预测模型在医学上的发展已经十分成熟,广泛应用于各类疾病的预测中,近年来在构建和应用方面快速发展的smote算法代表了预测工具的巨大进步。传统统计分析方法对不平衡数据处理效果欠佳,不适合构建COPD患者出院30天内非计划再入院的风险预警模型,为了处理数据数量不平衡及分类问题,有不少学者采用smote算法来解决,smote算法是根据少数类样本量的属性特征随机产生相似样本,从而有效地平衡少数类与多数类之间数量,减少数据集过度倾斜,获得预测准确率相对更高。不仅满足了临床上对于整合模型的强烈需求,还能够为临床医生针对疾病状态制定更为规范、合理的诊疗措施提供可靠参考,并且有助于病患了解病情进展并增强依从性,继而进一步促使个性化医疗的稳步发展,目前临床已将smote算法应用于多种疾病的风险预测,通过smote算法成功建立化疗肿瘤患者下呼吸道感染、脑血管介入术后再狭窄等少数类预警模型。然而目前尚无研究报道基于smote算法构建COPD患者出院30天内非计划再入院的预测模型。
本发明以慢性阻塞性肺疾病(COPD)患者作为研究对象,分析一般人口学信息、临床资料等,筛选出COPD患者出院30天内非计划再入院的独立危险因素,以此来构建SMOTE算法风险预测模型,并制定护理策略,目的在于为临床医务人员对COPD患者30天内非计划再入院的风险进行前瞻性评估和病情观察提供指导,也满足了临床上对于预测风险模型整合的需求,同时为COPD患者制定更为规范、合理的诊疗规范及护理干预措施,以期降低COPD患者出院30天内非计划再入院风险,从而推动个体化医疗的稳步发展,改善COPD患者生活质量。
因此,本发明的主要目的是探究我国COPD患者出院30天内非计划再入院的危险因素,并构建一个smote算法的预测模型,为医护人员提供一个简单有效的评估工具,以早期识别COPD出院继发加重再入院的患者,并将其列为重点监护对象。同时,对可以控制的危险因素给予一定的护理干预措施,旨在为临床防治工作提供一定的参考和依据,从而推动个体化医疗的稳步发展,进一步改善COPD患者出院后生活质量,降低30天内非计划再入院风险。
图1是根据一示例性实施例示出的一种基于smote算法的慢性阻塞性肺疾病再入院风险预测系统的工作流程图,如图1所示,包括以下步骤。
S101:采集各待入院预测患者的扩散路径。
本步骤中,各待入院预测患者包括风险患者和第一目标患者,风险患者为已发生风险因素行为的患者,第一目标患者为未发生风险因素行为的患者,每一待入院预测患者的扩散路径为:根据该待入院预测患者的特征数据预估的该待入院预测患者发生再入院行为的路径。
其中,待入院预测患者可以为再入院风险要素推论中的研究患者,可以包括风险患者和第一目标患者,其中,风险患者为满足第一预设条件的患者,第一目标患者为不满足第一预设条件的患者。
本领域技术人员所知的,再入院风险要素推论通常用于分析研究两个事件之间的再入院风险要素,例如,风险因素行为对再入院行为的影响,如,研究吸烟对患肺癌之间的再入院风险要素,或者用户对页面进行点赞与进行页面分享之间的再入院风险要素。
在一个示例实施例中,待入院预测患者可以为任意类型的事物,例如人、动物或建筑物等,需要说明的是,上述关于待入院预测患者的说明只是为了便于更清晰的解释本公开,本领域的技术人员可知的,对于应用上述系统的机器而言,待入院预测患者均是抽象后的数据、符号等。
上述特征数据可以为表示待入院预测患者特征的数据,例如,当待入院预测患者为人时,特征数据可以为年龄、性别、学历、收入、每周的运动时长、每日睡眠时间等数据。在不同的再入院风险要素推断中,相同研究患者的特征数据可以为不同的。例如,当研究吸烟对肺癌的影响时,待入院预测患者为人,特征数据可以为年龄、性别、或每周的运动时长等数据等,当研究的用户的对页面进行点赞对进行页面分享的影响时,特征数据可以为年龄、性别、或用户浏览偏好与当前浏览界面内容的匹配度等数据。
S102:按照各待入院预测患者的扩散路径,对各待入院预测患者进行划分,得到多个集合划分。
本步骤中,可以通过如下两种方式对各待入院预测患者进行划分,得到多个集合划分。
第一种方式:按照依据各待入院预测患者的扩散路径确定的集合划分顺序,将各待入院预测患者划分为待入院预测患者人数相同的多个集合划分。
示例性的,待入院预测患者的人数为2000,则可以按照扩散路径的小到大的顺序,每100个待入院预测患者换分为一个集合划分。
第二种方式:按照各待入院预测患者的扩散路径,将各待入院预测患者划分到对应不同路径区间的集合划分。
由于待入院预测患者的扩散路径为预估的该待入院预测患者发生再入院行为的路径,因此,其取值范围为[0,1]。
示例性的,可以划分10个取值区间,分别为[0,0.1)、[0.1,0.2)、[0.2,0.3)、[0.3,0.4)、[0.4,0.5)、[0.5,0.6)、[0.6,0.7)、[0.7,0.8)、[0.8,0.9)、[0.9,1]。在确定出各待入院预测患者的扩散路径后,可以将扩散路径在0-0.1之间的待入院预测患者确定为同一集的集合划分,同理可以将其按照扩散路径的不同划分进不同的集别。
在本实施例中,各数值可根据医院患者的具体需求设置对应的科室、住院房间信息等。
通过本步骤,可以将扩散路径相同或相似的待入院预测患者划分进同一集合划分,使得同一集合划分中的各待入院预测患者的扩散路径相同或相似,其意味着,同一集合划分中包含的风险患者和目标患者的特征对研究结果的影响的大小相同或相似。
S103:针对风险患者与第一目标患者人数不同的每一集合划分,调整集合划分中第一目标患者的人数,使得集合划分中第一目标患者与风险患者的人数相同。
本步骤中,为了避免风险患者和第一目标患者进行之间匹配覆盖率较低的问题,保证再入院风险要素推断结果的公平性,因此需要使得相同或相似特征的风险患者和第一目标患者的人数相同,而一个集合划分中风险患者与第一目标患者人数相同和不同两种情况,对于相同的情况,可以不做处理,对于不同的情况,需要使得集合划分中第一目标患者与风险患者的人数相同。
在一个实施例中,可以按照以下方式调整风险患者与第一目标患者人数不同的每一集合划分中第一目标患者的人数:
首先,确定集合划分中包含的风险患者的人数,作为第一人数,以及确定集合划分中包含的第一目标患者的人数,作为第二人数,当第一人数小于第二人数时,解析第二人数与第一人数的第一人数差值;从集合划分自身包含的第一目标患者中,过滤掉第一人数差值个第一目标患者,当第一人数大于第二人数时,解析第一人数与第二人数的第二人数差值;从集合划分自身包含的第一目标患者中,复制第二人数差值个第一目标患者;将复制的第一目标患者加入到集合划分中。
示例性的,集合划分中包含的第一目标患者的人数为15,风险患者的人数为20,为了使得风险患者和第一目标患者的人数相同,可以在集合划分包含的15个第一目标患者中随机选择5个第一目标患者,复制其对应的数据后,加入该集合划分,使得集合划分中第一目标患者的人数为20个,与风险患者的人数一致。
S104:根据每一集合划分中第二风险患者的人数和第二目标患者的人数,采集表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素。
本步骤中,第二风险患者为已发生再入院行为的风险患者,第二目标患者为已发生再入院行为的第一目标患者。
在一个实施例中,可以根据每一集合划分中第二风险患者的人数和第二目标患者的人数,解析所有集合划分中第二风险患者的第一总人数和第二目标患者的第二总人数,并且解析第一总人数与第二总人数间的第三人数差值,作为表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素。
示例性的,集合划分A中第二风险患者的人数为10、第二目标患者的人数为5,集合划分B中第二风险患者的人数为20、第二目标患者的人数为10,集合划分C中第二风险患者的人数为30、第二目标患者的人数为5,则所有集合划分中第二风险患者的第一总人数为60,第二目标患者的第二总人数为20,第一总人数与第二总人数间的第三人数差值为40,因此表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素第二风险患者的总人数比第二目标患者的总人数多40。
在一个实施例中,还可以解析所有集合划分中第二风险患者与各待入院预测患者的第一人数比值,以及解析所有集合划分中第二目标患者与各待入院预测患者的第二人数比值;解析第一人数比值与第二人数比值的比值差,作为表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素。
示例性的,各待入院预测患者的人数为200,所有集合划分中第二风险患者的人数为100,所有集合划分中第二目标患者的人数为20,则所有集合划分中第二风险患者与各待入院预测患者的第一人数比值=100/200=0.5,所有集合划分中第二目标患者与各待入院预测患者的第二人数比值=50/200=0.25。第一人数比值与第二人数比值的比值差=0.5-0.25=0.25。则表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素为第二风险患者的总人数的占比比第二风险患者的总人数的占比多25%。
S105:当不一致要素表示第二风险患者的总人数大于第二目标患者的总人数时,生成表示风险因素行为对再入院行为存在影响的再入院风险要素。
本步骤中,当不一致要素表示第二风险患者的总人数大于第二目标患者的总人数时,可以生成表示风险因素行为对再入院行为存在影响的再入院风险要素,可选的,当第一总人数大于第二总人数,或第一人数比大于第二人数比时。
其中,在该实施例中,拟选取某医院收治的COPD患者作为研究对象,根据COPD患者出院30天内是否再入院将其分为再入院组和未再入院组。比较两组COPD患者一般人口学信息、检查检验结果,采用单因素和多因素Logistic回归分析COPD患者出院30天内非计划再入院的危险因素。利用smote算法重新进行样本抽样,其基本思路是是将少量样本通过一定步骤扩充到一定量,得到新的数据集,但并未改变原样本集的空间边界,以此来达到均衡数据集的目的。采用受试者工作特征(receiver operating characteristic curve,ROC)曲线下面积(Area Under Curve,AUC)评价模型的区分度,采用Hosmer-Lemeshow(H-L)检验评价模型的校准度,使用真正类率(tpr)、阳性预测值(PPV)、F分数(F-score)验证预测模型数据的准确性,用以评估模型的临床应用价值。基于smote算法建立COPD患者出院30天内非计划再入院风险预测模型,通过预测模型为临床提供一种定量预测的手段,准确评估和量化COPD患者出院继发加重再入院的风险因素,从而加强监测,为临床防治工作提供更确切的方案,引起临床高度重视,并提供优质保障。
将纳入COPD患者作为研究对象,按照7:3的比例随机拆分为训练集和验证集。训练集用于模型的构建、内部验证与评价,验证集用于评估模型的外部重复性验证。根据COPD患者出院30天内非计划再入院将其分为再入院组和未再入院组。本研究通过医院伦理委员会批准,患者及家属均知悉本次研究的内容,并书面签订同意书。
纳入标准:①符合均符合《慢性阻塞性肺疾病诊治指南(2021年修订版)》中的COPD诊断标准;②年龄≥18岁;③呼吸道症状急性加重,指因呼吸困难、咳嗽和咳痰、脓性痰增多等症状加重需要入院治疗;④使用支气管扩张剂后FEV1/FVC<0.70;⑤知晓研究内容并签署书面知情同意书;⑥人口学特征、临床资料完整。
排除标准:①合并支气管哮喘者;②合并活动性肺结核者;③住院及随访期间死亡者;④合并恶性肿瘤晚期正在接受或不接受治疗预计寿命不超过1年者;⑤近期有手术史、严重肝肾疾病者;⑥遗留明显脑梗后遗症、精神障碍、痴呆等难以沟通或不愿配合参与者;⑦合并自身免疫性疾病或长期应用免疫抑制剂、激素者。
脱落标准:研究期间,患者无论因为何种原因,皆有权利退出本研究,凡是退出本研究的患者,均认为是脱落病例,不纳入研究。①监护人拒绝执行知情同意;②患者研究期间出现严重不良事件,拒绝继续参与研究;③患者参与研究的依从性较差,不配合调查;④研究人员认为患者存在其他不适合原因。
进一步的,为了确保生成的再入院风险要素的准确性,可以设置阈值,仅当第一总人数与第二总人数的差值大于该阈值,或第一人数比与第二人数比的差值大于该阈值时,生成表示风险因素行为对再入院行为存在影响的再入院风险要素。
本公开的实施例提供的上述基于smote算法的慢性阻塞性肺疾病再入院风险预测系统,可以采集各待入院预测患者的扩散路径,其中,各待入院预测患者包括风险患者和第一目标患者,风险患者为已发生风险因素行为的患者,第一目标患者为未发生风险因素行为的患者,每一待入院预测患者的扩散路径为:根据该待入院预测患者的特征数据预估的该待入院预测患者发生再入院行为的路径,并且按照各待入院预测患者的扩散路径,对各待入院预测患者进行划分,得到多个集合划分,以及针对风险患者与第一目标患者人数不同的每一集合划分,调整集合划分中第一目标患者的人数,使得集合划分中第一目标患者与风险患者的人数相同,以及根据每一集合划分中第二风险患者的人数和第二目标患者的人数,采集表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素,其中,第二风险患者为已发生再入院行为的风险患者,第二目标患者为已发生再入院行为的第一目标患者,以及当不一致要素表示第二风险患者的总人数大于第二目标患者的总人数时,生成表示风险因素行为对再入院行为存在影响的再入院风险要素,由于每一个待入院预测患者的扩散路径为根据该待入院预测患者的特征数据预估的该待入院预测患者发生再入院行为的路径,并根据扩散路径将各待入院预测患者划分成多个集合,从而可以保证每个集合划分中包含的风险患者和目标患者对再入院行为而言均是发生路径相同或相似的患者,从而避免了现有技术中需要将风险患者和目标患者一一比对才能确定是否是相同或相似研究患者,减少了解析过程,从而降低了进行再入院风险要素推断的时间和解析资源成本。
其中,在该实施例中,观察指标包括:
(1)一般资料:性别、年龄、饮酒史、吸烟史、文化程度、身体质量指数(Body MassIndex,BMI)、基础疾病(高血压、糖尿病、冠心病、肺性脑病、肺心病、低蛋白血症、下肢静脉血栓、胃肠道疾病、贫血、焦虑抑郁);
生活资料:居住地点(城市、农村)、住房类型(单元房、自建房屋)、基本生活活动能力评定量表、日均中低强度身体活动时间、有无家庭氧疗、有无流感及肺炎疫苗接种;
临床资料:入院7天内血常规的中性粒细胞与淋巴细胞比值(Neutrophil-to-Lymphocyte ratio,NLR)、嗜酸性粒细胞(eosinophil,EOS)绝对计数及相对计数、嗜酸性粒细胞与中性粒细胞比值(Eosinophil-to-Neutrophil ratio,ENR)、纤维蛋白原(Fibrinogen,FIB)、血浆D-二聚体(D-Dimer,D-D)、C反应蛋(C-creation protein,CRP)、检出病原学情况、抗生素使用情况(抗生素使用时间及抗生素种类)、全身糖皮质激素使用情况 、 有无肺动脉压力升高 、 FEV1占预计值百分比(FEV1%predicted,FEV1%Pred)、使用药物的规范性(包括规律性及使用方法的正确性)、氧疗(是否氧疗及每日氧疗是否达到15h)、肺康复(是否肺康复及每日肺康复是否超过 2h)等、入院前1年急性加重次数、出院处方中是否包含吸入性糖皮质激素(Inhaledcorticosteroid,ICS)。
如图2所示,在本发明另一个实施例中,在如图1示出的一种基于smote算法的慢性阻塞性肺疾病再入院风险预测系统的基础上,在步骤S104之后,还可以包括以下步骤:
S106:当不一致要素表示第二风险患者的总人数不大于第二目标患者的总人数时,生成表示风险因素行为对再入院行为不存在影响的再入院风险要素。
本步骤中,当不一致要素表示第二风险患者的总人数不大于第二目标患者的总人数时,说明在特征相同或相似不同患者中是否发生再入院行为与是否发生第一时间无关,即风险因素行为对再入院行为不存在影响。
在一个实施例中,步骤S101具体可以通过如图3所示的扩散路径采集系统实现,包括步骤:
S301:获取各待入院预测患者的特征数据。
本步骤中,各待入院预测患者的特征数可以为预先收集的,可选的,可以从预先建立的特征数据库中读取各待入院预测患者的特征数据。
S302:基于预先建立的特征数据与表示再入院行为发生路径的路径数值之间的对应关系,获取与每个待入院预测患者的特征数据对应的路径数值。
在一个示例实施例中,预先设置待入院预测患者的特征数据与表示再入院行为发生路径的路径数值之间的对应关系可以是根据大数据统计得到的,也可以是根据现有的研究成果获经验确定的。
S303:根据所获取的路径数值,采集每个待入院预测患者的扩散路径。
本步骤中,在确定路径数值之后,可以确定预估的待入院预测患者的发生再入院行为的路径,进而可以根据所获取的路径数值,采集每个待入院预测患者的扩散路径。
在一个示例实施例中,每一待入院预测患者具有多种类型的特征数据,例如,年龄、性别等。上述确定该待入院预测患者的扩散路径可以对每个待入院预测患者所具有的各类型的特征数据对应的路径数值相加,得到路径数值和,作为每个待入院预测患者的扩散路径。
图4是根据一示例性实施例示出的一种基于smote算法的慢性阻塞性肺疾病再入院风险预测装置框图。参照图4,该装置包括扩散路径采集模块401,集合划分模块402、人数调整模块403、不一致要素获取模块404和再入院风险预测模块405。
扩散路径采集模块401,被配置为执行采集各待入院预测患者的扩散路径,其中,各待入院预测患者包括风险患者和第一目标患者,风险患者为已发生风险因素行为的患者,第一目标患者为未发生风险因素行为的患者,每一待入院预测患者的扩散路径为:根据该待入院预测患者的特征数据预估的该待入院预测患者发生再入院行为的路径;
集合划分模块402,被配置为执行按照各待入院预测患者的扩散路径,对各待入院预测患者进行划分,得到多个集合划分;
人数调整模块403,被配置为执行针对风险患者与第一目标患者人数不同的每一集合划分,调整集合划分中第一目标患者的人数,使得集合划分中第一目标患者与风险患者的人数相同;
不一致要素获取模块404,被配置为执行根据每一集合划分中第二风险患者的人数和第二目标患者的人数,采集表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素,其中,第二风险患者为已发生再入院行为的风险患者,第二目标患者为已发生再入院行为的第一目标患者;
再入院风险预测模块405,被配置为执行当不一致要素表示第二风险患者的总人数大于第二目标患者的总人数时,生成表示风险因素行为对再入院行为存在影响的再入院风险要素。
进一步的,再入院风险预测模块405,还被配置为执行当不一致要素表示第二风险患者的总人数不大于第二目标患者的总人数时,生成表示风险因素行为对再入院行为不存在影响的再入院风险要素。
进一步的,扩散路径采集模块401,具体被配置为执行获取各待入院预测患者的特征数据,并且基于预先建立的特征数据与表示再入院行为发生路径的路径数值之间的对应关系,获取与每个待入院预测患者的特征数据对应的路径数值,以及根据所获取的路径数值,采集每个待入院预测患者的扩散路径。
进一步的,每一待入院预测患者具有多种类型的特征数据;
扩散路径采集模块401,具体被配置为执行对每个待入院预测患者所具有的各类型的特征数据对应的路径数值相加,得到路径数值和,作为每个待入院预测患者的扩散路径。
进一步的,集合划分模块402,具体被配置为执行按照依据各待入院预测患者的扩散路径确定的集合划分顺序,将各待入院预测患者划分为待入院预测患者人数相同的多个集合划分;或者,按照各待入院预测患者的扩散路径,将各待入院预测患者划分到对应不同路径区间的集合划分。
进一步的,人数调整模块403,具体被配置为按照以下方式执行调整风险患者与第一目标患者人数不同的每一集合划分中第一目标患者的人数:
确定集合划分中包含的风险患者的人数,作为第一人数,以及确定集合划分中包含的第一目标患者的人数,作为第二人数;
当第一人数小于第二人数时,解析第二人数与第一人数的第一人数差值;从集合划分自身包含的第一目标患者中,过滤掉第一人数差值个第一目标患者;
当第一人数大于第二人数时,解析第一人数与第二人数的第二人数差值;从集合划分自身包含的第一目标患者中,复制第二人数差值个第一目标患者;将复制的第一目标患者加入到集合划分中。
进一步的,不一致要素获取模块404,具体被配置为执行根据每一集合划分中第二风险患者的人数和第二目标患者的人数,解析所有集合划分中第二风险患者的第一总人数和第二目标患者的第二总人数;解析第一总人数与第二总人数间的第三人数差值,作为表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素;或者,解析所有集合划分中第二风险患者与各待入院预测患者的第一人数比值,以及解析所有集合划分中第二目标患者与各待入院预测患者的第二人数比值;解析第一人数比值与第二人数比值的比值差,作为表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该系统的实施例中进行了详细描述,此处将不做详细阐述说明。
图5是根据一示例性实施例示出的一种用于基于smote算法的慢性阻塞性肺疾病再入院风险预测的电子设备500的框图。例如,电子设备500可以被提供为一服务器。参照图5,装置500包括处理组件522,其进一步包括一个或多个处理器,以及由存储器532所代表的存储器资源,用于存储可由处理组件522的执行的指令,例如应用程序。存储器532中存储的应用程序可以包括一个或一个以上的每一个对应于一集指令的模块。此外,处理组件522被配置为执行指令,以执行上述基于smote算法的慢性阻塞性肺疾病再入院风险预测系统。
电子设备500还可以包括一个电源组件526被配置为执行电子设备500的电源管理,一个有线或无线的网络接口550被配置为将电子设备500连接到网络,和一个输入输出接口558。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
本领域技术人员能够理解,本公开所披露的内容可以出现多种变型和改进。例如,以上所描述的各种设备或组件可以通过硬件实现,也可以通过软件、固件、或者三者中的一些或全部的集合实现。
本公开中使用了流程图用来说明根据本公开的实施例的系统的步骤。应当理解的是,前面或后面的步骤不一定按照顺序来精确的进行。相反,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中。
本领域普通技术人员可以理解上述系统中的全部或部分的步骤可通过解析机程序来指令相关硬件完成,程序可以存储于解析机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本公开并不限制于任何特定形式的硬件和软件的结合。
除非另有定义,这里使用的所有术语具有与本公开所属领域的普通技术人员共同理解的相同含义。还应当理解,诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。
以上是对本公开的说明,而不应被认为是对其的限制。尽管描述了本公开的若干示例性实施例,但本领域技术人员将容易地理解,在不背离本公开的新颖教学和优点的前提下可以对示例性实施例进行许多修改。因此,所有这些修改都意图包含在权利要求书所限定的本公开范围内。应当理解,上面是对本公开的说明,而不应被认为是限于所公开的特定实施例,并且对所公开的实施例以及其他实施例的修改意图包含在所附权利要求书的范围内。本公开由权利要求书及其等效物限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (7)
1.一种基于smote算法的慢性阻塞性肺疾病再入院风险预测系统,其特征在于,包括:
扩散路径采集模块,被配置为执行采集各待入院预测患者的扩散路径,其中,所述各待入院预测患者包括风险患者和第一目标患者,所述风险患者为已发生风险因素行为的患者,所述第一目标患者为未发生所述风险因素行为的患者,每一待入院预测患者的扩散路径为:根据该待入院预测患者的特征数据预估的该待入院预测患者发生再入院行为的路径;
集合划分模块,被配置为执行按照所述各待入院预测患者的扩散路径,对所述各待入院预测患者进行划分,得到多个集合划分;
人数调整模块,被配置为执行针对风险患者与第一目标患者人数不同的每一集合划分,调整集合划分中第一目标患者的人数,使得集合划分中第一目标患者与风险患者的人数相同;
不一致要素获取模块,被配置为执行根据每一集合划分中第二风险患者的人数和第二目标患者的人数,采集表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素,其中,所述第二风险患者为已发生所述再入院行为的风险患者,所述第二目标患者为已发生所述再入院行为的第一目标患者;
再入院风险预测模块,被配置为执行当所述不一致要素表示所述第二风险患者的总人数大于所述第二目标患者的总人数时,生成表示所述风险因素行为对所述再入院行为存在影响的再入院风险要素。
2.根据权利要求1所述的基于smote算法的慢性阻塞性肺疾病再入院风险预测系统,其特征在于,所述不一致要素获取模块中还包括:
当所述不一致要素表示所述第二风险患者的总人数不大于所述第二目标患者的总人数时,生成表示所述风险因素行为对所述再入院行为不存在影响的再入院风险要素。
3.根据权利要求1-2任一项所述的基于smote算法的慢性阻塞性肺疾病再入院风险预测系统,其特征在于,所述采集各待入院预测患者的扩散路径的步骤,包括:
获取各待入院预测患者的特征数据;
基于预先建立的特征数据与表示再入院行为发生路径的路径数值之间的对应关系,获取与每个待入院预测患者的特征数据对应的路径数值;
根据所获取的路径数值,采集每个所述待入院预测患者的扩散路径。
4.根据权利要求3所述的基于smote算法的慢性阻塞性肺疾病再入院风险预测系统,其特征在于,每一待入院预测患者具有多种类型的特征数据;
所述根据所获取的路径数值,采集每个所述待入院预测患者的扩散路径的步骤,包括:
对每个所述待入院预测患者所具有的各类型的特征数据对应的路径数值相加,得到路径数值和,作为每个所述待入院预测患者的扩散路径。
5.根据权利要求1-2或4任一项所述的基于smote算法的慢性阻塞性肺疾病再入院风险预测系统,其特征在于,所述按照所述各待入院预测患者的扩散路径,对所述各待入院预测患者进行划分,得到多个集合划分的步骤,包括:
按照依据所述各待入院预测患者的扩散路径确定的集合划分顺序,将所述各待入院预测患者划分为待入院预测患者人数相同的多个集合划分;或者,
按照所述各待入院预测患者的扩散路径,将所述各待入院预测患者划分到对应不同路径区间的集合划分。
6.根据权利要求1-2或4任一项所述的基于smote算法的慢性阻塞性肺疾病再入院风险预测系统,其特征在于,所述针对风险患者与第一目标患者人数不同的每一集合划分,调整集合划分中第一目标患者的人数,使得集合划分中第一目标患者与风险患者的人数相同的步骤,包括:
按照以下方式调整风险患者与第一目标患者人数不同的每一集合划分中第一目标患者的人数:
确定集合划分中包含的风险患者的人数,作为第一人数,以及确定集合划分中包含的第一目标患者的人数,作为第二人数;
当所述第一人数小于所述第二人数时,解析所述第二人数与所述第一人数的第一人数差值;从集合划分自身包含的第一目标患者中,过滤掉所述第一人数差值个第一目标患者;
当所述第一人数大于所述第二人数时,解析所述第一人数与所述第二人数的第二人数差值;从集合划分自身包含的第一目标患者中,复制所述第二人数差值个第一目标患者;将复制的第一目标患者加入到集合划分中。
7.根据权利要求1-2或4任一项所述的基于smote算法的慢性阻塞性肺疾病再入院风险预测系统,其特征在于,所述根据每一集合划分中第二风险患者的人数和第二目标患者的人数,采集表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素的步骤,包括:
根据每一集合划分中第二风险患者的人数和第二目标患者的人数,解析所有集合划分中第二风险患者的第一总人数和第二目标患者的第二总人数;解析所述第一总人数与所述第二总人数间的第三人数差值,作为表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素;或者,
解析所有集合划分中第二风险患者与所述各待入院预测患者的第一人数比值,以及解析所有集合划分中第二目标患者与所述各待入院预测患者的第二人数比值;解析所述第一人数比值与所述第二人数比值的比值差,作为表示所有集合划分中第二风险患者的总人数与第二目标患者的总人数之间差异的不一致要素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311666521.6A CN117373675A (zh) | 2023-12-07 | 2023-12-07 | 一种基于smote算法的慢性阻塞性肺疾病再入院风险预测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311666521.6A CN117373675A (zh) | 2023-12-07 | 2023-12-07 | 一种基于smote算法的慢性阻塞性肺疾病再入院风险预测系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117373675A true CN117373675A (zh) | 2024-01-09 |
Family
ID=89402648
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311666521.6A Pending CN117373675A (zh) | 2023-12-07 | 2023-12-07 | 一种基于smote算法的慢性阻塞性肺疾病再入院风险预测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117373675A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117877738A (zh) * | 2024-03-13 | 2024-04-12 | 简阳市人民医院 | 一种基于知信行健康教育模式的copd患者静脉血栓预防系统 |
CN117912698A (zh) * | 2024-03-18 | 2024-04-19 | 简阳市人民医院 | 一种针对扁桃体术后患者的健康监控方法和系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100009357A1 (en) * | 2006-05-30 | 2010-01-14 | Nevins Joseph R | Prediction of lung cancer tumor recurrence |
AU2013200793A1 (en) * | 2003-06-24 | 2013-03-07 | Genomic Health, Inc. | Prediction of likelihood of cancer recurrence |
CN105589806A (zh) * | 2015-12-17 | 2016-05-18 | 北京航空航天大学 | 一种基于SMOTE+Boosting算法的软件缺陷倾向预测方法 |
CN113408730A (zh) * | 2020-03-17 | 2021-09-17 | 北京达佳互联信息技术有限公司 | 因果关系生成方法、装置及电子设备 |
CN115274118A (zh) * | 2022-08-24 | 2022-11-01 | 冯朝燕 | 一种构建睾丸肿瘤诊断和术后复发风险预测模型的方法 |
CN115512844A (zh) * | 2021-06-03 | 2022-12-23 | 四川大学 | 基于smote技术和随机森林算法的代谢综合征风险预测方法 |
CN116344052A (zh) * | 2023-03-28 | 2023-06-27 | 山西医科大学 | 再入院预测模型训练方法、再入院预测方法、装置及设备 |
CN116564510A (zh) * | 2022-01-25 | 2023-08-08 | 武汉科技大学 | Cabg患者术后再入院风险预测模型 |
CN117079810A (zh) * | 2023-08-09 | 2023-11-17 | 贵州省人民医院 | 一种心血管疾病非计划再住院风险预测方法 |
-
2023
- 2023-12-07 CN CN202311666521.6A patent/CN117373675A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2013200793A1 (en) * | 2003-06-24 | 2013-03-07 | Genomic Health, Inc. | Prediction of likelihood of cancer recurrence |
US20100009357A1 (en) * | 2006-05-30 | 2010-01-14 | Nevins Joseph R | Prediction of lung cancer tumor recurrence |
CN105589806A (zh) * | 2015-12-17 | 2016-05-18 | 北京航空航天大学 | 一种基于SMOTE+Boosting算法的软件缺陷倾向预测方法 |
CN113408730A (zh) * | 2020-03-17 | 2021-09-17 | 北京达佳互联信息技术有限公司 | 因果关系生成方法、装置及电子设备 |
CN115512844A (zh) * | 2021-06-03 | 2022-12-23 | 四川大学 | 基于smote技术和随机森林算法的代谢综合征风险预测方法 |
CN116564510A (zh) * | 2022-01-25 | 2023-08-08 | 武汉科技大学 | Cabg患者术后再入院风险预测模型 |
CN115274118A (zh) * | 2022-08-24 | 2022-11-01 | 冯朝燕 | 一种构建睾丸肿瘤诊断和术后复发风险预测模型的方法 |
CN116344052A (zh) * | 2023-03-28 | 2023-06-27 | 山西医科大学 | 再入院预测模型训练方法、再入院预测方法、装置及设备 |
CN117079810A (zh) * | 2023-08-09 | 2023-11-17 | 贵州省人民医院 | 一种心血管疾病非计划再住院风险预测方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117877738A (zh) * | 2024-03-13 | 2024-04-12 | 简阳市人民医院 | 一种基于知信行健康教育模式的copd患者静脉血栓预防系统 |
CN117877738B (zh) * | 2024-03-13 | 2024-05-07 | 简阳市人民医院 | 一种基于知信行健康教育模式的copd患者静脉血栓预防系统 |
CN117912698A (zh) * | 2024-03-18 | 2024-04-19 | 简阳市人民医院 | 一种针对扁桃体术后患者的健康监控方法和系统 |
CN117912698B (zh) * | 2024-03-18 | 2024-05-17 | 简阳市人民医院 | 一种针对扁桃体术后患者的健康监控方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gülen et al. | Risk factor analysis of anaphylactic reactions in patients with systemic mastocytosis | |
Chalmers et al. | C-reactive protein is an independent predictor of severity in community-acquired pneumonia | |
Field et al. | Airway hyperresponsiveness in children with sickle cell anemia | |
CN117373675A (zh) | 一种基于smote算法的慢性阻塞性肺疾病再入院风险预测系统 | |
Walsh et al. | Exacerbation risk in severe asthma is stratified by inflammatory phenotype using longitudinal measures of sputum eosinophils | |
Han et al. | Frailty and postoperative complications in older Chinese adults undergoing major thoracic and abdominal surgery | |
Kim et al. | Factors associated with plasma IL-33 levels in patients with chronic obstructive pulmonary disease | |
Van Tho et al. | A mixed phenotype of airway wall thickening and emphysema is associated with dyspnea and hospitalization for chronic obstructive pulmonary disease | |
Lu et al. | Obstetrical epidural and spinal anesthesia in multiple sclerosis | |
Creamer et al. | Prognostic factors in chronic hypersensitivity pneumonitis | |
Yavuz et al. | Identifying uncontrolled asthma in children with the childhood asthma control test or exhaled nitric oxide measurement | |
Chen et al. | Risk factors for FEV1 decline in mild COPD and high-risk populations | |
Tomita et al. | A scoring algorithm for predicting the presence of adult asthma: a prospective derivation study | |
JP2019511057A (ja) | Sirsの予測のための臨床パラメータの使用 | |
Suarthana et al. | A diagnostic model for the detection of sensitization to wheat allergens was developed and validated in bakery workers | |
Zhou et al. | Accuracy of six chronic obstructive pulmonary disease screening questionnaires in the Chinese population | |
Sunny et al. | Pre-adolescence DNA methylation is associated with lung function trajectories from pre-adolescence to adulthood | |
Cui et al. | Role of inspiratory capacity on dyspnea evaluation in COPD with or without emphysematous lesions: a pilot study | |
Gao et al. | Diagnostic value of serum baseline tryptase levels in childhood asthma and its correlation with disease severity | |
Louis et al. | Development and validation of a predictive model combining patient-reported outcome measures, spirometry and exhaled nitric oxide fraction for asthma diagnosis | |
Hirsch et al. | Estimating risk of pneumonia in a prospective emergency department cohort | |
Gagatek et al. | Validation of clinical COPD phenotypes for prognosis of long-term mortality in Swedish and Dutch cohorts | |
Lu et al. | The Value of Impulse Oscillometric Parameters and Quantitative HRCT Parameters in Differentiating Asthma–COPD Overlap from COPD | |
Sottile et al. | A model-based approach for assessing bronchodilator responsiveness in children: The conventional cutoff revisited | |
Shahbazi Khamas et al. | Exhaled Volatile Organic Compounds for Asthma Control Classification in Children with Moderate to Severe Asthma: Results from the SysPharmPediA Study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |