CN115132348A - 一种预测脓毒血症患者发生急性肾损伤的概率预测系统 - Google Patents
一种预测脓毒血症患者发生急性肾损伤的概率预测系统 Download PDFInfo
- Publication number
- CN115132348A CN115132348A CN202210611575.1A CN202210611575A CN115132348A CN 115132348 A CN115132348 A CN 115132348A CN 202210611575 A CN202210611575 A CN 202210611575A CN 115132348 A CN115132348 A CN 115132348A
- Authority
- CN
- China
- Prior art keywords
- antibody
- urine
- index
- indexes
- diagnosis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明属于医学诊断技术领域,具体涉及一种预测脓毒血症患者发生急性肾损伤的概率预测系统,用于对脓毒血症患者发生急性肾损伤的概率进行预测,包括如下步骤:步骤1,对脓毒血症患者的诊断指标进行数据预处理,将预处理后的诊断指标输入预测模型,所述预测模型为AdaBoost算法或梯度提升决策树算法;步骤2,所述预测模型计算后输出所述脓毒血症患者发生急性肾损伤的概率。本发明提供的装置和系统,能够在不严格限定输入的诊断指标的格式和种类的前提下,对脓毒血症患者发生急性肾损伤的概率进行准确的预测。本发明适用性好,易于大范围推广使用,具有很好的应用前景。
Description
技术领域
本发明属于医学诊断技术领域,具体涉及一种预测脓毒血症患者发生急性肾损伤的概率预测系统。
背景技术
脓毒症(sepsis)是由细菌等病原微生物侵入机体引起的全身炎症反应综合征。除全身炎症反应综合征和原发感染病灶的表现外,重症患者还常有器官损伤。其中,脓毒血症相关急性肾损伤(sepsis induced acute kidney injury,S-AKI)发病急,病死率高,是导致患者死亡的独立危险因素。然而,S-AKI的诊断只能依赖尿素和肌酐等敏感性较低的实验室指标,导致S-AKI患者往往得不到及时的治疗与干预。因此,对S-AKI进行预测和早期诊断有利于及时给与高危患者关注,对改善患者预后和提高患者生存率有着重要作用。
对于早期诊断脓毒血症患者发生急性肾损伤,现有技术中已经有较多的诊断指标。例如,血清syndecan-1和尿NGAL联合诊断、血清sCD14-ST联合尿NGAL诊断、DNI表示循环中未成熟粒细胞(IGs)的比例、肾阻力指数和中心静脉压联合诊断、血清NT-proBNP和尿液NGAL联合诊断、血浆HBPROC面积和风险分级评分、血清Cys C水平、[TIMP-2]·[IGFBP7]指数、NLR、尿sTREM-1和尿NGAL联合诊断、PCT、尿NGAL和尿IL-18联合诊断。
上述方法中所用的很多指标临床并不常见,检测也不方便,同时需要结合复杂的临床信息综合诊断。因此,为了利用临床常见诊断指标对脓毒血症患者是否会进展为急性肾损伤做出更加准确的预测,仍然有必要开发多指标联合预测脓毒血症患者发生急性肾损伤的方法。目前多指标联合预测浓度血症患者发生急性肾损伤的相关研究还较少。一种方法(Ann Palliat Med,2021.10(2):p.1772-1778.)是用医院HIS系统中的数据,在SPSS中用独立样本t检验和卡方检验分别分析有无肾损伤患者之间连续变量和分类变量有无差异。然后使用单变量逻辑回归分析每个变量与脓毒血症相关急性肾损伤的相关性。然后应用逐步前向逻辑回归分析来确定AKI的独立预测因子,包括单变量分析中的所有显著变量。再使用多元逻辑回归确定16个独立风险因子,利用其回归系数构建预测模型。另一种方法是用MIMIC-Ⅲ中的相关数据进行模型构建及验证,使用最小绝对值收敛和选择算子(LASSO)方法筛选风险特征,然后对这些特征进行多元逻辑回归分析,得到系数,用系数来构建评分模型。最终筛选出来十个危险因素,这些危险因素包括糖尿病,慢性肾脏疾病,充血性心力衰竭,慢性肝病,高碳酸血症,高血糖症,血液低pH值,凝血时间延长,低血压和高乳酸血症(JNephrol,2019.32(6):p.947-956.)。然而,这些现有的方法由于指标、预测模型等因素的限制,导致其必须采用特定的一些临床病历和(或)特定指标进行预测。而在患者的实际就医过程中,有些指标是难以在短时间内获得的。此外,很多医院的管理系统中对各种诊断指标的记录格式不同(例如采用数值记录还是采用阴阳性记录),不一定符合这些模型对输入数据的格式要求。这导致上述多指标联合预测浓度血症患者发生急性肾损伤的相关方法的推广应用受到了较大的限制。
发明内容
针对现有技术中的缺陷,本发明提供一种预测脓毒血症患者发生急性肾损伤的概率预测系统,利用该系统,能够在不严格限定输入数据(诊断指标)的类型的情况下,实现对脓毒血症患者发生急性肾损伤概率的准确预测。
一种计算机设备,用于对脓毒血症患者发生急性肾损伤的概率进行预测,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现对脓毒血症患者发生急性肾损伤的概率进行预测,包括如下步骤:
步骤1,对脓毒血症患者的诊断指标进行数据预处理,将预处理后的诊断指标输入预测模型,所述预测模型为AdaBoost算法或梯度提升决策树算法;
步骤2,所述预测模型计算后输出所述脓毒血症患者发生急性肾损伤的概率。
优选的,所述预测模型为AdaBoost算法。
优选的,步骤1中,所述数据预处理包括数据清洗、数据标准化或数据降维中的至少一种。
优选的,步骤1中,所述数据预处理为数据降维。
优选的,所述数据降维的方法包括如下步骤:
步骤a,采用已标注是否发生急性肾损伤的样本集,用所有诊断指标,构成训练。
步骤b,采用套索算法回归模型,通过惩罚函数对诊断指标进行筛选,得到对预测有意义的诊断指标;
步骤c,采用步骤b得到的诊断指标构成训练集,构建得到用于数据降维的降维模型,所述筛选模型为梯度提升决策树算法;
步骤d,可以采用LDA算法进行数据降维预测,得到用于构建预测模型的诊断指标。但由于本模型构建过程中套索算法筛选出来有意义的指标并不多,所以可以跳过此步。
优选的,步骤1中,所述诊断指标选包括患者基本信息和以下指标中的至少一种:血液生化指标、血液激素类指标、动脉血气、血常规指标、凝血功能指标、血液免疫学指标或尿液检测指标。
优选的,所述患者基本信息选自以下指标中的至少一种:性别或年龄;
所述血液生化指标选自以下指标中的至少一种:白蛋白、球蛋白、酒精、碱性磷酸酶、α-羟丁酸脱氢酶、谷丙转氨酶、血氨、胰淀粉酶、淀粉酶、载脂蛋白A1、载脂蛋白B、谷草转氨酶、β羟丁酸、胆汁酸、直接胆红素、总胆红素、钙、氯、胆固醇、胆碱酯酶、肌酸激酶同工酶质量、二氧化碳结合力、肌酸激酶、肌酐、胱抑素C、葡萄糖6磷酸脱氢酶、谷氨酰转肽酶、空腹血糖、糖化血清白蛋白、高密度胆固醇、糖化血红蛋白、谷丙转氨酶/谷草转氨酶比值、白蛋白/球蛋白比值、同型半胱氨酸、铁、乳酸、乳酸脱氢酶、低密度胆固醇、脂肪酶、脂蛋白a、镁、肌红蛋白、尿钠肽、磷、钾、总蛋白、钠、总铁结合力、甘油三酯、超敏肌钙蛋白或尿酸;
所述血液激素类指标选自以下指标中的至少一种:醛固酮、抗缪勒氏管激素、抗甲状腺过氧化物酶抗体、甲状腺球蛋白抗体、空腹C肽、降钙素、皮质醇、尿游离皮质醇、脱氢表雄酮、雌二醇、卵泡刺激素、生长激素、胰岛素样生长因子-1、空腹胰岛素、黄体生成素、甲状旁腺激素、孕酮、泌乳素、肾素、性激素结合球蛋白、反T3、总T3、游离T3、总T4、游离T4、睾酮、甲状腺球蛋白、促甲状腺激素受体抗体、促肾上腺皮质激素、促甲状腺激素或25-羟基维生素D;
所述动脉血气指标选自以下指标中的至少一种:二氧化碳分压、氧分压或酸碱度;
所述血常规指标选自以下指标中的至少一种:白细胞计数、中性粒细胞绝对值、淋巴细胞绝对值、中性粒细胞百分比、淋巴细胞百分比、单核细胞百分比、嗜酸性粒细胞绝对值、嗜碱性粒细胞、红细胞、红细胞分布宽度数、红细胞比容、平均红细胞体积、平均红细胞血红蛋白量、红细胞平均血红蛋白浓度、网织红细胞、血红蛋白、血小板计数、平均血小板体积、血小板压积、血小板分布宽度或血沉;
所述凝血功能指标选自以下指标中的至少一种:凝血酶原时间、凝血酶时间、活化部分凝血活酶时间、国际标准化比值、血浆纤维蛋白原、纤维蛋白原降解产物、D二聚体或抗凝血酶Ⅲ;
所述免疫学指标选自以下指标中的至少一种:衣原体抗体、巨细胞病毒抗体IgG、巨细胞病毒抗体IgM、EB病毒NA抗体、EB病毒EA抗体、EB病毒VCA抗体、棘球绦虫抗体、幽门螺杆菌抗体、甲肝病毒抗体IgM、乙肝病毒核心抗体、乙肝病毒e抗体、乙肝病毒e抗原、乙肝病毒表面抗原、乙肝病毒表面抗体、丙肝病毒抗体、戊肝病毒抗体、艾滋抗体、梅毒抗体、结核抗体、流感抗原、α1酸性糖蛋白、α1微球蛋白、α1抗胰蛋白酶、甲胎蛋白、抗心磷脂抗体IgA、抗心磷脂抗体IgG、抗心磷脂抗体IgM、抗CCP抗体、抗双链DNA抗体、抗肾小球基底膜抗体筛查、抗JO-1抗体、抗肝细胞胞质1型抗体、抗肝肾微粒体抗体、抗线粒体M2抗体、抗髓过氧化物酶抗体、抗中性粒细胞胞浆抗体、抗核抗体、抗蛋白酶3抗体、抗核糖体P抗体、抗SCL-70、抗Sm抗体、抗Sm/RNP抗体、抗可溶性肝抗原抗体、抗SS-A抗体、抗SS-A/Ro 52抗体、抗SS-B抗体、抗链球菌溶血素“O”抗体、β2-微球蛋白、超敏C反应蛋白、C-反应蛋白、C-端肽I型胶原蛋白、糖类抗原15-3、糖类抗原19-9、糖类抗原72-4、糖类抗原125、癌胚抗原、铜蓝蛋白、补体C3、补体C4、细胞角蛋白19片段、铁蛋白、叶酸、触珠蛋白、IgA定量、IgE定量、IgG亚型、IgG定量、IgM定量、白介素6、κ轻链、游离κ轻链、λ轻链、游离λ轻链、淋巴细胞亚群、神经元特异性烯醇化酶、骨钙素、前白蛋白、降钙素原、前列腺特异性抗原、游离前列腺特异性抗原、类风湿因子、血清淀粉样蛋白A、转铁蛋白或维生素B12;
所述尿液检测指标选自以下指标中的至少一种:24小时尿量、尿淀粉酶、尿钙、尿氯、尿肌酐、尿葡萄糖、尿镁、尿微量白蛋白、尿磷、尿钾、尿蛋白、尿钠、尿尿素、尿尿酸、β2微球蛋白或α1微球蛋白,其中,所述尿钙、尿氯、尿肌酐、尿葡萄糖、尿镁、尿微量白蛋白、尿磷、尿钾、尿蛋白、尿钠、尿尿素、尿尿酸、β2微球蛋白或α1微球蛋白采集自随机尿和/或24小时尿。
本发明还提供一种用于对脓毒血症患者发生急性肾损伤的概率进行预测的系统,包括:
服务器,用于存储脓毒血症患者的诊断指标;
上述计算机设备。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于实现上述对脓毒血症患者发生急性肾损伤的概率进行预测的步骤。
本发明提供了一种对脓毒血症患者发生急性肾损伤的概率进行预测方法。其可以自动进行数据清洗,然后利用临床常用且易得的检验指标进行预测,得到与现有方法预测准确率最高的方法相近的准确率0.84。需要特别说明的是,本发明方法所用的数据可采用入院首次实验室检查数据,通过这些最早获得的临床检测数据进行预测,对早期诊断更加有意义。因此,本发明具有很好的应用前景。
显然,根据本发明的上述内容,按照本领域的普通技术知识和惯用手段,在不脱离本发明上述基本技术思想前提下,还可以做出其它多种形式的修改、替换或变更。
以下通过实施例形式的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。凡基于本发明上述内容所实现的技术均属于本发明的范围。
具体实施方式
需要特别说明的是,实施例中未具体说明的数据采集、传输、储存和处理等步骤的算法,以及未具体说明的硬件结构、电路连接等均可通过现有技术已公开的内容实现。
实施例1用于对脓毒血症患者发生急性肾损伤的概率进行预测的系统本实施例的系统包括通过数据线连接的服务器和计算机设备。
所述服务器用于存储脓毒血症患者的信息和各种诊断指标。在必要时,服务器可将所储存的存储脓毒血症患者的信息和诊断指标传输至计算机设备,用于建模或预测发生急性肾损伤的概率。
所述计算机设备用于对脓毒血症患者发生急性肾损伤的概率进行预测,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现对脓毒血症患者发生急性肾损伤的概率进行预测,包括如下步骤:
步骤1,对脓毒血症患者的诊断指标进行数据预处理,将预处理后的诊断指标输入预测模型,所述预测模型为梯度提升决策树算法。
步骤2,所述预测模型计算后输出所述脓毒血症患者发生急性肾损伤的概率。
步骤1中所述的数据预处理包括但不限于数据清洗、数据标准化或数据降维中的至少一种。
现有技术中,部分医院或临床实验室采用的数据管理系统中对诊断指标的存储方式和数据格式等是不统一的。例如,在一些系统中,部分诊断指标的检测结果采用数值进行存储,而在另一些系统中相同的诊断指标却用阴性(小于某数值)、阳性(大于某数值)、大于符号和小于符号等不同的方式进行存储;部分系统中滴度值采用比例的方式进行存储;荧光模型也是非数值型的;此外部分系统中还有很多空值。因此,针对数据进行清洗和标准化等处理对于得到准确的预测结果非常重要。
根据诊断数据的实际情况,数据清洗和数据标准化可选择如下步骤:
(1)同一患者保留第一条记录;
(2)删除患者姓名,检查日期等信息;
(3)删除没有数据记录或数据记录小于50条的指标;
(4)统一年龄数据格式为整型;
(5)阴阳性指标统一用0,1表示,0表示阴性,1表示阳性;
(6)空值及异常值用均值替换;
(7)删除文本型指标;
(8)删除仍有空值的记录。
在诊断指标的种类数量较多的情况下,可能包含无效、信息重复的指标,此时有必要进行数据降维。数据降维可以通过人工筛选数据,根据专业人员的先验知识挑选出有效和包含信息不重复的诊断指标。此外,数据降维也可以通过计算机程序实现。
所述通过计算机程序实现数据降维的方法包括如下步骤:
步骤a,采用已标注是否发生急性肾损伤的样本集,用所有诊断指标,构成训练。
步骤b,采用套索算法回归模型,通过惩罚函数对诊断指标进行筛选,得到对预测有意义的诊断指标;
步骤c,采用步骤b得到的诊断指标构成训练集,构建得到用于数据降维的降维模型,所述筛选模型为梯度提升决策树算法;
步骤d,可以采用LDA算法进行数据降维预测,得到用于构建预测模型的诊断指标。但由于本模型构建过程中套索算法筛选出来有意义的指标并不多,所以可以跳过此步。
采用上述方法筛选出有效和包含信息不重复的诊断指标后,即可用这些诊断指标建模,得到预测模型。
本申请中,所述诊断指标可以是任何与脓毒血症相关的实验室血液和尿液检测指标。
为了进一步说明本发明的技术方案,下面通过实验例证明本发明的有益效果。
实验例1不同模型的准确率对比
本实验例采用实施例1所述的方法进行建模和预测,对比预测模型采用不同的算法时,预测结果的准确性。
本实验例采用的样本数据经过数据清洗,全部符合条件指标(剩余230项临床常见的诊断指标,1项标注,1400条记录)按5:2的比例随机划分为训练集和测试集。
所述诊断指标包括:患者基本信息、血液生化指标、血液激素类指标、动脉血气、血常规指标、凝血功能指标、血液免疫学指标和尿液检测指标。
所述患者基本信息包括:性别和年龄;
所述血生化指标包括:白蛋白、球蛋白、酒精、碱性磷酸酶、α-羟丁酸脱氢酶、谷丙转氨酶、血氨、胰淀粉酶、淀粉酶、载脂蛋白A1、载脂蛋白B、谷草转氨酶、β羟丁酸、胆汁酸、直接胆红素、总胆红素、钙、氯、胆固醇、胆碱酯酶、肌酸激酶同工酶质量、二氧化碳结合力、肌酸激酶、肌酐、胱抑素C、葡萄糖6磷酸脱氢酶、谷氨酰转肽酶、空腹血糖、糖化血清白蛋白、高密度胆固醇、糖化血红蛋白、谷丙转氨酶/谷草转氨酶比值、白蛋白/球蛋白比值、同型半胱氨酸、铁、乳酸、乳酸脱氢酶、低密度胆固醇、脂肪酶、脂蛋白a、镁、肌红蛋白、尿钠肽、磷、钾、总蛋白、钠、总铁结合力、甘油三酯、超敏肌钙蛋白和尿酸;
所述激素类指标包括:醛固酮、抗缪勒氏管激素、抗甲状腺过氧化物酶抗体、甲状腺球蛋白抗体、空腹C肽、降钙素、皮质醇、尿游离皮质醇、脱氢表雄酮、雌二醇、卵泡刺激素、生长激素、胰岛素样生长因子-1、空腹胰岛素、黄体生成素、甲状旁腺激素、孕酮、泌乳素、肾素、性激素结合球蛋白、反T3、总T3、游离T3、总T4、游离T4、睾酮、甲状腺球蛋白、促甲状腺激素受体抗体、促肾上腺皮质激素、促甲状腺激素和25-羟基维生素D;
所述动脉血气指标包括:二氧化碳分压、氧分压和酸碱度;
所述血常规指标包括:白细胞计数、中性粒细胞绝对值、淋巴细胞绝对值、中性粒细胞百分比、淋巴细胞百分比、单核细胞百分比、嗜酸性粒细胞绝对值、嗜碱性粒细胞、红细胞、红细胞分布宽度数、红细胞比容、平均红细胞体积、平均红细胞血红蛋白量、红细胞平均血红蛋白浓度、网织红细胞、血红蛋白、血小板计数、平均血小板体积、血小板压积、血小板分布宽度和血沉;
所述凝血功能指标包括:凝血酶原时间、凝血酶时间、活化部分凝血活酶时间、国际标准化比值、血浆纤维蛋白原、纤维蛋白原降解产物、D二聚体和抗凝血酶Ⅲ;
所述血液免疫学指标包括:衣原体抗体、巨细胞病毒抗体IgG、巨细胞病毒抗体IgM、EB病毒NA抗体、EB病毒EA抗体、EB病毒VCA抗体、棘球绦虫抗体、幽门螺杆菌抗体、甲肝病毒抗体IgM、乙肝病毒核心抗体、乙肝病毒e抗体、乙肝病毒e抗原、乙肝病毒表面抗原、乙肝病毒表面抗体、丙肝病毒抗体、戊肝病毒抗体、艾滋抗体、梅毒抗体、结核抗体、流感抗原、α1酸性糖蛋白、α1微球蛋白、α1抗胰蛋白酶、甲胎蛋白、抗心磷脂抗体IgA、抗心磷脂抗体IgG、抗心磷脂抗体IgM、抗CCP抗体、抗双链DNA抗体、抗肾小球基底膜抗体筛查、抗JO-1抗体、抗肝细胞胞质1型抗体、抗肝肾微粒体抗体、抗线粒体M2抗体、抗髓过氧化物酶抗体、抗中性粒细胞胞浆抗体、抗核抗体、抗蛋白酶3抗体、抗核糖体P抗体、抗SCL-70、抗Sm抗体、抗Sm/RNP抗体、抗可溶性肝抗原抗体、抗SS-A抗体、抗SS-A/Ro52抗体、抗SS-B抗体、抗链球菌溶血素“O”抗体、β2-微球蛋白、超敏C反应蛋白、C-反应蛋白、C-端肽I型胶原蛋白、糖类抗原15-3、糖类抗原19-9、糖类抗原72-4、糖类抗原125、癌胚抗原、铜蓝蛋白、补体C3、补体C4、细胞角蛋白19片段、铁蛋白、叶酸、触珠蛋白、IgA定量、IgE定量、IgG亚型、IgG定量、IgM定量、白介素6、κ轻链、游离κ轻链、λ轻链、游离λ轻链、淋巴细胞亚群、神经元特异性烯醇化酶、骨钙素、前白蛋白、降钙素原、前列腺特异性抗原、游离前列腺特异性抗原、类风湿因子、血清淀粉样蛋白A、转铁蛋白和维生素B12;
所述尿液检测指标包括:24小时尿量、尿淀粉酶、尿钙、尿氯、尿肌酐、尿葡萄糖、尿镁、尿微量白蛋白、尿磷、尿钾、尿蛋白、尿钠、尿尿素、尿尿酸、β2微球蛋白和α1微球蛋白,其中,所述尿钙、尿氯、尿肌酐、尿葡萄糖、尿镁、尿微量白蛋白、尿磷、尿钾、尿蛋白、尿钠、尿尿素、尿尿酸、β2微球蛋白或α1微球蛋白采集自随机尿和24小时尿。对于诊断指标的标准化,包括标准化和未标准化两种处理方式。所述标准化的步骤为:sklearn.preprocessing.StandardScaler数据标准化函数进行标准化;所述未标准化是指诊断指标未进行前述标准化处理。
另一方面,对于是否进行数据降维,处理方式包括人工筛选数据、全部数据和lasso筛选数据三种方式。所述人工筛选数据是指根据专业人员的先验知识挑选出有效和包含信息不重复的诊断指标,本实验例中人工选出的诊断指标为性别、年龄、C反应蛋白、白介素6、血小板压积、血小板计数、白细胞计数、血浆纤维蛋白原、抗凝血酶Ⅲ、活化部分凝血活酶时间、纤维蛋白原降解产物、国际标准化比值、D二聚体、凝血酶时间和凝血酶原时间。lasso筛选数据是指按照实施例1中所述的步骤a-步骤d的方式进行数据降维。全部数据是指不进行数据降维(即上述230项诊断指标全部用于预测模型的建模)。
诊断指标通过上述方式进行处理后,采用训练集建立预测模型,通过预测模型预测测试集的准确率如下表所示:
注:“GDBT”的参数设置根据现有技术应当为:n_estimators=100,random_state=None,subsample=1.0,max_depth=3,min_samples_split=2;“GDBT(修改参数)”是指将参数修改为:n_estimators=50,random_state=10,subsample=0.6,max_depth=7,min_samples_split=900。
从上表数据中可以看出预测模型所用的算法对预测准确性有着显著的影响。同时,部分算法对于是否标准化、是否数据降维有着极强的敏感度(如SVM、随机梯度下降等),这表明这些算法的预测准确性非常依赖于输入的诊断指标的格式和种类。而部分算法对于是否标准化、是否数据降维则不敏感(如AdaBoost、GDBT)等,这些算法适用性很好,其预测准确性并不严重依赖于输入的诊断指标的格式和种类。综合考虑预测结果的准确性和适用性,预测模型采用AdaBoost或GDBT(梯度提升决策树算法)为较优选择。
通过以上实施例和实验例可以看到,本发明提供的装置和系统,能够在不严格限定输入的诊断指标的格式和种类的前提下,对脓毒血症患者发生急性肾损伤的概率进行准确的预测。本发明适用性好,易于大范围推广使用,具有很好的应用前景。
Claims (9)
1.一种计算机设备,用于对脓毒血症患者发生急性肾损伤的概率进行预测,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现对脓毒血症患者发生急性肾损伤的概率进行预测,包括如下步骤:
步骤1,对脓毒血症患者的诊断指标进行数据预处理,将预处理后的诊断指标输入预测模型,所述预测模型为AdaBoost算法或梯度提升决策树算法;
步骤2,所述预测模型计算后输出所述脓毒血症患者发生急性肾损伤的概率。
2.按照权利要求1所述的计算机设备,其特征在于:所述预测模型为AdaBoost算法。
3.按照权利要求1所述的计算机设备,其特征在于:步骤1中,所述数据预处理包括数据清洗、数据标准化或数据降维中的至少一种。
4.按照权利要求3所述的计算机设备,其特征在于:步骤1中,所述数据预处理为数据降维。
5.按照权利要求3或4所述的计算机设备,其特征在于:所述数据降维的方法包括如下步骤:
步骤a,采用已标注是否发生急性肾损伤的样本集,用所有诊断指标,构成训练。
步骤b,采用套索算法回归模型,通过惩罚函数对诊断指标进行筛选,得到对预测有意义的诊断指标;
步骤c,采用步骤b得到的诊断指标构成训练集,构建得到用于数据降维的降维模型,所述筛选模型为梯度提升决策树算法;
步骤d,可以采用LDA算法进行数据降维预测,得到用于构建预测模型的诊断指标。但由于本模型构建过程中套索算法筛选出来有意义的指标并不多,所以可以跳过此步。
6.按照权利要求1所述的计算机设备,其特征在于:步骤1中,所述诊断指标包括患者基本信息和以下指标中的至少一种:血液生化指标、血液激素类指标、动脉血气分析、血常规指标、凝血功能指标、血液免疫学指标或尿液检测指标。
7.按照权利要求6所述的计算机设备,其特征在于:
所述患者基本信息选自以下指标中的至少一种:性别或年龄;
所述血液生化指标选自以下指标中的至少一种:白蛋白、球蛋白、酒精、碱性磷酸酶、α-羟丁酸脱氢酶、谷丙转氨酶、血氨、胰淀粉酶、淀粉酶、载脂蛋白A1、载脂蛋白B、谷草转氨酶、β羟丁酸、胆汁酸、直接胆红素、总胆红素、钙、氯、胆固醇、胆碱酯酶、肌酸激酶同工酶质量、二氧化碳结合力、肌酸激酶、肌酐、胱抑素C、葡萄糖6磷酸脱氢酶、谷氨酰转肽酶、空腹血糖、糖化血清白蛋白、高密度胆固醇、糖化血红蛋白、谷丙转氨酶/谷草转氨酶比值、白蛋白/球蛋白比值、同型半胱氨酸、铁、乳酸、乳酸脱氢酶、低密度胆固醇、脂肪酶、脂蛋白a、镁、肌红蛋白、尿钠肽、磷、钾、总蛋白、钠、总铁结合力、甘油三酯、超敏肌钙蛋白或尿酸;
所述血液激素类指标选自以下指标中的至少一种:醛固酮、抗缪勒氏管激素、抗甲状腺过氧化物酶抗体、甲状腺球蛋白抗体、空腹C肽、降钙素、皮质醇、尿游离皮质醇、脱氢表雄酮、雌二醇、卵泡刺激素、生长激素、胰岛素样生长因子-1、空腹胰岛素、黄体生成素、甲状旁腺激素、孕酮、泌乳素、肾素、性激素结合球蛋白、反T3、总T3、游离T3、总T4、游离T4、睾酮、甲状腺球蛋白、促甲状腺激素受体抗体、促肾上腺皮质激素、促甲状腺激素或25-羟基维生素D;
所述动脉血气指标选自以下指标中的至少一种:二氧化碳分压、氧分压或酸碱度;
所述血常规指标选自以下指标中的至少一种:白细胞计数、中性粒细胞绝对值、淋巴细胞绝对值、中性粒细胞百分比、淋巴细胞百分比、单核细胞百分比、嗜酸性粒细胞绝对值、嗜碱性粒细胞、红细胞、红细胞分布宽度数、红细胞比容、平均红细胞体积、平均红细胞血红蛋白量、红细胞平均血红蛋白浓度、网织红细胞、血红蛋白、血小板计数、平均血小板体积、血小板压积、血小板分布宽度或血沉;
所述凝血功能指标选自以下指标中的至少一种:凝血酶原时间、凝血酶时间、活化部分凝血活酶时间、国际标准化比值、血浆纤维蛋白原、纤维蛋白原降解产物、D二聚体或抗凝血酶Ⅲ;
所述免疫学指标选自以下指标中的至少一种:衣原体抗体、巨细胞病毒抗体IgG、巨细胞病毒抗体IgM、EB病毒NA抗体、EB病毒EA抗体、EB病毒VCA抗体、棘球绦虫抗体、幽门螺杆菌抗体、甲肝病毒抗体IgM、乙肝病毒核心抗体、乙肝病毒e抗体、乙肝病毒e抗原、乙肝病毒表面抗原、乙肝病毒表面抗体、丙肝病毒抗体、戊肝病毒抗体、艾滋抗体、梅毒抗体、结核抗体、流感抗原、α1酸性糖蛋白、α1微球蛋白、α1抗胰蛋白酶、甲胎蛋白、抗心磷脂抗体IgA、抗心磷脂抗体IgG、抗心磷脂抗体IgM、抗CCP抗体、抗双链DNA抗体、抗肾小球基底膜抗体筛查、抗JO-1抗体、抗肝细胞胞质1型抗体、抗肝肾微粒体抗体、抗线粒体M2抗体、抗髓过氧化物酶抗体、抗中性粒细胞胞浆抗体、抗核抗体、抗蛋白酶3抗体、抗核糖体P抗体、抗SCL-70、抗Sm抗体、抗Sm/RNP抗体、抗可溶性肝抗原抗体、抗SS-A抗体、抗SS-A/Ro 52抗体、抗SS-B抗体、抗链球菌溶血素“O”抗体、β2-微球蛋白、超敏C反应蛋白、C-反应蛋白、C-端肽I型胶原蛋白、糖类抗原15-3、糖类抗原19-9、糖类抗原72-4、糖类抗原125、癌胚抗原、铜蓝蛋白、补体C3、补体C4、细胞角蛋白19片段、铁蛋白、叶酸、触珠蛋白、IgA定量、IgE定量、IgG亚型、IgG定量、IgM定量、白介素6、κ轻链、游离κ轻链、λ轻链、游离λ轻链、淋巴细胞亚群、神经元特异性烯醇化酶、骨钙素、前白蛋白、降钙素原、前列腺特异性抗原、游离前列腺特异性抗原、类风湿因子、血清淀粉样蛋白A、转铁蛋白或维生素B12;
所述尿液检测指标选自以下指标中的至少一种:24小时尿量、尿淀粉酶、尿钙、尿氯、尿肌酐、尿葡萄糖、尿镁、尿微量白蛋白、尿磷、尿钾、尿蛋白、尿钠、尿尿素、尿尿酸、β2微球蛋白或α1微球蛋白,其中,所述尿钙、尿氯、尿肌酐、尿葡萄糖、尿镁、尿微量白蛋白、尿磷、尿钾、尿蛋白、尿钠、尿尿素、尿尿酸、β2微球蛋白或α1微球蛋白采集自随机尿和/或24小时尿。
8.一种用于对脓毒血症患者发生急性肾损伤的概率进行预测的系统,其特征在于,包括:
服务器,用于存储脓毒血症患者的诊断指标;
权利要求1-8任一项所述的计算机设备。
9.一种计算机可读存储介质,其特征在于:其上存储有计算机程序,所述计算机程序用于实现权利要求1-8任一项所述的对脓毒血症患者发生急性肾损伤的概率进行预测的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210611575.1A CN115132348A (zh) | 2022-05-31 | 2022-05-31 | 一种预测脓毒血症患者发生急性肾损伤的概率预测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210611575.1A CN115132348A (zh) | 2022-05-31 | 2022-05-31 | 一种预测脓毒血症患者发生急性肾损伤的概率预测系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115132348A true CN115132348A (zh) | 2022-09-30 |
Family
ID=83378665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210611575.1A Pending CN115132348A (zh) | 2022-05-31 | 2022-05-31 | 一种预测脓毒血症患者发生急性肾损伤的概率预测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115132348A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116564529A (zh) * | 2023-05-17 | 2023-08-08 | 天津大学 | 基于svm的脓毒症肝衰竭早期预测系统 |
CN116646075A (zh) * | 2023-05-23 | 2023-08-25 | 天津大学 | 基于随机森林的脓毒症肾衰竭早期预测系统 |
CN116646074A (zh) * | 2023-05-23 | 2023-08-25 | 天津大学 | 基于逻辑回归的脓毒症心力衰竭早期预测系统 |
CN117577330A (zh) * | 2024-01-15 | 2024-02-20 | 北京大学 | 预测非酒精性脂肪性肝病肝纤维化程度的装置及存储介质 |
CN118067591A (zh) * | 2024-04-17 | 2024-05-24 | 南京佰抗生物科技有限公司 | 一种用于血液分析的耗材 |
-
2022
- 2022-05-31 CN CN202210611575.1A patent/CN115132348A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116564529A (zh) * | 2023-05-17 | 2023-08-08 | 天津大学 | 基于svm的脓毒症肝衰竭早期预测系统 |
CN116646075A (zh) * | 2023-05-23 | 2023-08-25 | 天津大学 | 基于随机森林的脓毒症肾衰竭早期预测系统 |
CN116646074A (zh) * | 2023-05-23 | 2023-08-25 | 天津大学 | 基于逻辑回归的脓毒症心力衰竭早期预测系统 |
CN117577330A (zh) * | 2024-01-15 | 2024-02-20 | 北京大学 | 预测非酒精性脂肪性肝病肝纤维化程度的装置及存储介质 |
CN117577330B (zh) * | 2024-01-15 | 2024-04-02 | 北京大学 | 预测非酒精性脂肪性肝病肝纤维化程度的装置及存储介质 |
CN118067591A (zh) * | 2024-04-17 | 2024-05-24 | 南京佰抗生物科技有限公司 | 一种用于血液分析的耗材 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115132348A (zh) | 一种预测脓毒血症患者发生急性肾损伤的概率预测系统 | |
Finney et al. | Initial evaluation of cystatin C measurement by particle-enhanced immunonephelometry on the Behring nephelometer systems (BNA, BN II) | |
Tate et al. | Practical considerations for the measurement of free light chains in serum | |
US20220276259A1 (en) | Methods for diagnosing systemic lupus erythematosus | |
CN110033860B (zh) | 一种基于机器学习的遗传代谢病检出率提升方法 | |
Huyut et al. | The effectiveness of blood routine parameters and some biomarkers as a potential diagnostic tool in the diagnosis and prognosis of Covid-19 disease | |
CN112017791B (zh) | 一种基于人工神经网络模型确定肝癌患者预后情况的系统 | |
CN113012806B (zh) | 一种妊娠期糖尿病的早期预测方法 | |
Halloran et al. | The molecular phenotype of kidney transplants: insights from the MMDx project | |
CN1777806A (zh) | 疾病预后模型的制作方法、使用该模型的疾病预后预测方法、利用该模型的预后预测装置以及其程序·存储介质 | |
Stowe et al. | Analytical performance of a particle-enhanced nephelometric immunoassay for serum cystatin C using rate analysis | |
Moon et al. | Evaluation of the barricor tube in 28 routine chemical tests and its impact on turnaround time in an outpatient clinic | |
CN117690591A (zh) | 慢性肾病进展风险预测方法、装置、设备及存储介质 | |
Cobbaert et al. | Automated urinalysis combining physicochemical analysis, on-board centrifugation, and digital imaging in one system: a multicenter performance evaluation of the cobas 6500 urine work area | |
El-Gamal et al. | Combined immature platelet fraction and schistocyte count to differentiate pregnancy-associated thrombotic thrombocytopenic purpura from severe preeclampsia/haemolysis, elevated liver enzymes, and low platelet syndrome (SPE/HELLP) | |
Bancal et al. | A new approach to assessing calcium status via a machine learning algorithm | |
Stankiewicz et al. | Diagnostic dilemma and treatment outcome in acute liver failure due to Wilson’s disease | |
Martin et al. | Indicators differentiating thrombotic thrombocytopenic purpura from other thrombotic microangiopathies in a canadian apheresis referral center | |
EP3465210B1 (en) | Methods and systems using c4 gene copy number and cell-bound complement activation products for identification of lupus and pre-lupus | |
Doshi et al. | APOL1 kidney risk variants and long-term kidney function in healthy middle-aged black individuals: The Atherosclerosis Risk in Communities (ARIC) Study | |
Tsen et al. | Evaluation and validation of a duck IgY antibody-based immunoassay for high-sensitivity C-reactive protein: avian antibody application in clinical diagnostics | |
RU2718288C1 (ru) | Способ прогноза скорости развития фиброза у больных хроническим вирусным гепатитом С | |
CN113674860B (zh) | 一种难治性iTTP风险预测装置、系统及其应用 | |
Fuse et al. | Development of machine learning models for predicting unfavorable functional outcomes in patients with chronic subdural hematomas | |
CN116486922B (zh) | 一种基于基因多态性及血浆细胞因子的肺移植排斥预测方法及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |