CN111834003A - 新型冠状肺炎与流感肺炎的初筛诊断方法,系统和设备 - Google Patents
新型冠状肺炎与流感肺炎的初筛诊断方法,系统和设备 Download PDFInfo
- Publication number
- CN111834003A CN111834003A CN202010308533.1A CN202010308533A CN111834003A CN 111834003 A CN111834003 A CN 111834003A CN 202010308533 A CN202010308533 A CN 202010308533A CN 111834003 A CN111834003 A CN 111834003A
- Authority
- CN
- China
- Prior art keywords
- pneumonia
- clinical
- model
- indexes
- influenza
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明提供一种新型冠状肺炎与流感肺炎的初筛方法,系统和设备,基于患者临床症状体征、血常规及血生化检验指标,构建了能够快速识别和区分新型冠状肺炎和甲型流感肺炎的工具,最终根据诊断能力生成最优模型和次优模型,最优模型具备快速精确的初筛能力,次优模型针对欠发达地区医疗资源不能承担血生化检测时,提供基于个人症状体征和血常规构建的初筛识别工具,从而为医疗和公共卫生防控资源的有效投入提供辅助。
Description
技术领域
本发明涉及医学诊断领域,具体涉及一种新型冠状肺炎与流感肺炎的初筛 诊断方法,系统和设备。
背景技术
COVID-19肺炎的主要临床表现与严重急性呼吸综合征(Severe AcuteRespiratory Syndrome,SARS)和中东呼吸综合征(Middle East respiratory syndrome,MERS)类似,为发热、咳嗽和气促等。肺部影像学检查是重要的辅 助诊断方式之一,然而肺部影像学表现特点则为典型的病毒性肺炎特点,早期 表现主要为双肺胸膜下斑片状磨玻璃影,与季节性流感等病毒性肺炎在影像学 上无法区分和鉴别诊断。
与季节性流感相比,COVID-19的病死率更高,SARS-CoV-2病毒的传播力 更强,其对人群带来的威胁以及诊疗所需的医疗资源也更高,但COVID-19的 暴发季与流感季重叠,主要症状和体征、影像学检查结果相似。特别是对于基 层或者许多医疗资源欠发达的地区。这些地区,甚至哪怕是发达国家,也会出 现医疗资源挤兑,造成核酸检测能力饱和的严峻态势,难以应对COVID-19与 季节性流感的同时爆发流行的分诊,会极大影响当地医疗资源的合理分配。因 此如何在诊疗资源有限的前提下,形成和储备快速的分诊工具和鉴别手段,对 于COVID-19与季节性流感所致的肺炎进行快速的识别与初筛,从而合理的进 行医疗资源分配和采取正确的防控措施极为重要和关键。
发明内容
本发明的目的是提供一种新型冠肺炎用与流感肺炎的初筛诊断方法,装置 和设备,可基于简单的个人症状体征和血常规检验指标,构建了能够快速识别 和区分新型冠肺炎和甲型流感肺炎的工具。
为了达到上述目的,本发明一方面提供一种新型冠状肺炎与流感肺炎的初 筛诊断方法,包括以下步骤:
获取新冠肺炎患者和流感肺炎患者的临床指标数据;
利用Logistic回归模型比较两组数据各项指标的OR值,识别出存在差异的 临床指标;
采用随机森林模型对识别后的临床指标的影响权重进行排序,根据排序结 果获取高权重的临床指标作为评估新冠肺炎的风险因素;
将患者按4:1随机分为训练集和测试集,训练集根据所述排序结果选取临床 指标用以构建分类回归树模型,所述分类回归树模型基于各临床指标或各临床 指标的组合建立了决策树,所述测试集用以验证所述分类回归树模型的输出结 果。
进一步的,所述新冠肺炎患者和流感肺炎患者的临床指标数据包括患者的 人口学特征、临床症状和体征、血常规以及血生化检查结果。
进一步的,统计临床指标数据并将变量指标进行转换描述,包括:
将临床指标数据中非确定性指标的统计结果与医学参考值进行比较,生成 低于参考值,正常和高于参考值三种结果;
将临床指标数据中连续变量指标的统计结果转换为四分位数间距(IQR), 并以中位数进行表示;
将临床指标数据中离散变量指标的统计结果转换为概率分布值进行表示。
进一步的,基Logistic回归模型和随机森林模型筛选出所述临床指标数据 中高权重的临床指标,其中:
临床症状和体征中选取第一天最高体温、呼吸道症状出现频率、咳嗽;
血常规指标中选取嗜酸细胞绝对值、红细胞压积、单核细胞百分比;
血生化指标中选取低密度脂蛋白胆固醇、C反应蛋白、肌酸激酶。
进一步的,建立第一决策树模型,所述第一决策树模型以所述临床指标数 据作为节点区分新冠肺炎患者和甲型流感肺炎患者,其中第一节点为低密度脂 蛋白胆固醇、第二节点为肌酸激酶、第三节点为呼吸道症状出现频率、第四节 点为入院第一天最高体温。
进一步的,建立第二决策树模型,所述第二策树模型以所述临床指标数据 作为节点区分新冠肺炎患者和甲型流感肺炎患者,其中第一节点为嗜酸细胞绝 对值、第二节点为单核细胞百分比、第三节点为红细胞压积、第四节点为入院 第一天最高体温、第五节点为呼吸道症状出现频率。
进一步的,采用混淆矩阵(confusion matrix)和ROC曲线下面积(AUC) 验证所述第一模型和第二模型,确定新型冠状肺炎与流感肺炎的初筛的最优模 型。
另一方面,本发明还提供一种新型冠状肺炎与流感肺炎的初筛诊断系统, 包括:
数据获取单元,用以获取新冠肺炎患者和流感肺炎患者的临床指标数据;
临床指标识别单元,用以利用Logistic回归模型比较两组数据各项指标的OR值,识别出存在差异的临床指标;
临床指标评估单元,用以采用随机森林模型对识别后的临床指标的影响权 重进行排序,根据排序结果获取高权重的临床指标作为评估新冠肺炎的风险因 素;
诊断模型建立单元,将患者按4:1随机分为训练集和测试集,训练集根据所 述排序结果选取临床指标用以构建分类回归树模型,所述分类回归树模型基于 各临床指标或各临床指标的组合建立了决策树,所述测试集用以验证所述分类 回归树模型的输出结果。
另一方面,本发明还提供一种计算机设备,包括存储器和处理器,所述存 储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理 器执行如上述方法的步骤。
另一方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储 介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处 理器执行时使所述处理器执行如上述方法的步骤。
本发明提供一种新型冠状肺炎与流感肺炎的初筛方法,装置和系统,基于 患者临床症状体征、血常规及血生化检验指标,构建了能够快速识别和区分新 型冠状肺炎和甲型流感肺炎的工具,最终根据诊断能力生成最优模型和次优模 型,最优模型具备快速精确的初筛能力,次优模型针对欠发达地区医疗资源不 能承担血生化检测时,提供基于个人症状体征和血常规构建的初筛识别工具, 从而为医疗和公共卫生防控资源的有效投入提供辅助。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施 例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述 中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付 出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的新型冠状肺炎与流感肺炎的初筛方法的方法流 程图;
图2a和图2b是本发明一个实施例的随机森林模型的变量重要性度量表。
图3是本发明一个实施例的第一决策模型的树状结构图。
图4是本发明一个实施例的第二决策模型的树状结构图。
图5a是本发明一个实施例的第一决策模型的混淆矩阵图。
图5b是本发明一个实施例的第一决策模型的ROC曲线下面积图。
图6a是本发明一个实施例的第二决策模型的混淆矩阵图。
图6b是本发明一个实施例的第二决策模型的ROC曲线下面积图。
图7是本发明一个实施例的新型冠状肺炎与流感肺炎的初筛系统的系统架 构图。
图8是本发明一个实施例的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造 性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子 集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同 子集,并且可以在不冲突的情况下相互结合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术 领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申 请实施例的目的,不是旨在限制本申请。
图1是本发明一个实施例的新型冠状肺炎与流感肺炎的初筛方法的方法流 程图,如图1所示,本发明的新型冠状肺炎与流感肺炎的初筛方法包括以下步 骤:
S1,获取新冠肺炎患者和流感肺炎患者的临床指标数据。
S2,利用Logistic回归模型比较两组数据各项指标的OR值,识别出存在差 异的临床指标。
S3,采用随机森林模型对识别后的临床指标的影响权重进行排序,根据排序 结果获取高权重的临床指标作为评估新冠肺炎的风险因素。
S4,将患者按4:1随机分为训练集和测试集,训练集根据所述排序结果选取 临床指标用以构建分类回归树模型,所述分类回归树模型基于各临床指标或各 临床指标的组合建立了决策树,所述测试集用以验证所述分类回归树模型的输 出结果。
在步骤S1中,新冠肺炎患者和流感肺炎患者的临床指标数据包括患者的人 口学特征、临床症状和体征、血常规以及血生化检查结果。
在一个具体的实施例中,共纳入306名患者的人口学特征、临床症状和体 征、血常规以及血生化检查结果。其中,其中包括151例COVID-19成人患者 和155例甲型流感成人患者,中位年龄分别为43岁和39岁。
其中人口学特征包括患者的年龄、性别,饮酒与否,吸烟与否,已婚。
临床症状和体征包括患者的入院第一天体温、入院第一天最高体温、入院 第二天最高体温、入院第三天最高体温、入院第一至三天最高体温、呼吸道症 状出现频率、发热、咳嗽、呼吸困难、气喘、口干、咳痰、咽痛、胸闷、胸痛、 腹泻、头疼、头晕、流涕、鼻塞、肌肉酸痛、恶心呕吐、咽痒、乏力、收缩压、 舒张压。
血常规指标包括患者的白细胞计数、中性粒细胞百分比、淋巴细胞百分比、 单核细胞百分比、嗜酸细胞百分比、噬碱细胞百分比、中性粒细胞绝对值、淋 巴细胞绝对值、单核细胞绝对值、嗜酸细胞绝对值、噬碱细胞绝对值、红细胞 计数、血红蛋白浓度、红细胞压积、平均红细胞体积、平均红细胞血红蛋白量、 平均红细胞血红蛋白浓度、红细胞分布宽度、血小板计数、血小板平均体积、 血小板平均宽度、血小板比积。
血生化指标包括患者的总蛋白、白蛋白、前白蛋白、球蛋白、白球比、谷 丙转氨酶、谷草转氢酶、谷草谷丙、γ-谷氨酰转肽酶、碱性磷酸酶、血清总胆 汁酸、甘胆酸测定、总胆红素、直接胆红素、间接胆红素、尿素氮、肌酐、胱 抑素C、尿酸、视黄醇结合蛋白、内生肌酐清除率、葡萄糖、总胆固醇、甘油三 脂、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、载脂蛋白A1、载脂蛋白B、 脂蛋白a、肌酸激酶、肌酸激酶同工酶、乳酸脱氢酶、α-羟丁酸脱氢酶、同型 半胱氨酸、钠、氯、钙、磷、镁、C反应蛋白。
在步骤S2中,获取患者的临床指标数据后,通过Logistic回归模型将临床 指标数据中非确定性指标的统计结果与医学参考值进行比较,生成低于参考值, 正常和高于参考值三种结果;
将临床指标数据中连续变量指标的统计结果转换为四分位数间距(IQR), 并以中位数进行表示;
将临床指标数据中离散变量指标的统计结果转换为概率分布值进行表示。
在一个具体的实施例中,经过比较,在人口学特征中,年龄在151例 COVID-19成人患者和155例甲型流感成人患者之间差异无统计学意义,中位年 龄分别为43岁(IQR 29-56)和39岁(IQR 28-60)。但与甲型流感成人患者相 比,成年男性患COVID-19的风险更高,是女性的1.9倍。
在临床症状和体征中,虽然两种疾病均会引起患者发热(甲型流感发热患 者占比94.2%,COVID-19发热患者占比为82.1%),但根据体温数据显示,甲 型流感肺炎患者入院第一天体温和前三天每日最高体温均比COVID-19患者体 温更高。COVID-19患者相比甲型流感肺炎患者更容易出现腹泻(OR=7.2, 95%CI:1.9~46.6),而甲型流感肺炎患者的呼吸道症状出现频率更高(OR=0.4, 95%CI:0.3~0.5),主要表现为咳嗽、咳痰、流涕、咽痛、胸闷、气喘。
在血常规以及血生化检查中,患者入院时的全血细胞计数显示,COVID-19 患者更容易引起白细胞计数减少(OR=1.3,95%CI:0.7~2.6),淋巴细胞计数减 少(OR=3.3,95%CI:2.0~5.4),嗜酸性粒细胞计数减少(OR=79.0,95%CI: 28.2~330.3),红细胞平均血红蛋白浓度升高(OR=6.2,95%CI:2.7~16.9)和血 小板计数减少(OR=5.4,95%CI:2.2~16.4)
大部分患者的肝功能处于正常水平,但出现丙氨酸氨基转氨酶(ALT)升高 (OR=2.5,95%CI:1.2~5.5)和天冬氨酸氨基转移酶(AST)升高(OR=2.6, 95%CI:1.4~5.3)感染COVID-19风险高。而肝代谢指标结果显示,低密度脂蛋 白浓度升高是感染COVID-19的保护性因素(OR=0.2,95%CI:0.1~0.4)。 COVID-19患者比甲型流感肺炎患者更容易出现心肌酶谱异常,表现为肌酸激酶 降低(OR=19.8,95%CI:6.9~83.8)和乳酸脱氢酶升高(OR=1.7,95%CI: 1.1~2.7)。在感染相关的指标中,大多数患者均会引起C-反应蛋白浓度升高 (236/291[81.1%]),但甲型流感肺炎患者C-反应蛋白浓度升高(93.8%)风险高 于COVID-19患者(68.3%)(OR=0.1,95%CI=0.0-0.3)。
在步骤S3中,通过Logistic回归模型和随机森林模型,对识别后的临床指 标的影响权重进行排序,根据排序结果获取高权重的临床指标作为评估新冠肺 炎的风险因素。
在具体的一个实施例中,如图2a和图2b所示,经过模型的排序,新冠肺 炎患者和甲型流感肺炎患者的临床指标重要度排序通过平均精度下降(Mean Decrease Accuracy)和Gini指数(Mean Decrease Gini)两种变量重要性度量 排序。
经过重要度排序后,在在临床症状和体征中选取入院第一天最高体温(T.day1.max)、呼吸道症状出现频率(RES.)、咳嗽(Cough);在血常规和 血生化指标中选取嗜酸细胞绝对值(EO#)、红细胞压积(HCT)、单核细胞百 分比(MOMO%),低密度脂蛋白胆固醇(LDL)、C反应蛋白(Cys C)、肌 酸激酶(CK),作为建立模型的训练数据。
在步骤S4中,首先将经过重要度排序筛选的临床症状和体征、血常规和血 生化指标数据建立训练集和测试集。训练集用以建立决策树(CART)模型对245 名患者的临床指标数据进行分类。测试集用以对建立的模型进行验证。
在一个具体的实施例中,本发明从筛选后的临床症状和体征、血常规和血 生化指标数据中选取指标建立训练集以训练第一决策树模型,通过对第一决策 树模型的验证确定检测效果最好的第一决策树模型作为最优模型。第二模型的 训练集从临床症状和体征、血常规指标中选取,通过对第二决策树模型确定检 测效果最好的第二决策树模型作为次优模型。此外,本发明还根据临床症状和 体征、血常规和血生化指标数据分别建立第三决策树模型、第四决策树模型和 第五决策树模型,并建立综合三项临床指标数据的总体决策树模型,以对第一 决策树模型和第二决策树模型进行交叉验证。
图3是本发明一个实施例的第一决策模型的树状结构图。如图3所示,该 决策树模型的每个节点均包括了患者总数,新冠肺炎患者数(cases),甲型流 感患者数(cases)和患者的类别判断(class)。第一决策树模型的根节点node0, 包括245个患者,其中121人为新冠肺炎患者124人为甲型流感肺炎患者。
在本实施例中,第一检测模型的第一节点node1和第二节点node2为根节点 Node0的子节点形成两个决策分支。其中,第一节点node1为患者的低密度脂蛋 白胆固醇(LDL)降低,该指标为分类新冠肺炎患者的最优决策指标。第二节 点node2为患者的低密度脂蛋白胆固醇(LDL)正常或升高。
在本实施例中,第三节点node3和第四节点node4作为第二节点node2的子 节点,形成两个决策分支以分类低密度脂蛋白胆固醇(LDL)正常或升高的患 者。第三节点node3为患者的肌酸酶(CK)指标正常,第四节点node4为患者 的肌酸酶(CK)指标降低,该指标是分类新冠肺炎患者的次优决策指标。
在本实施例中,第五节点node5和第六节点node6为第三节点node3的子节 点,形成两个决策分支以分类肌酸酶(CK)指标正常的患者,第五节点Node5 为患者的呼吸道症状出现频率(RES.)大于等于3次,该指标是分类新冠肺炎 患者的第三优选指标,第六节点node6为患者的呼吸道症状出现频率(RES.) 小于3次。
在本实施例中,第7节点node7和第8节点node8为第六节点node6的子节 点,形成两个决策分支以分类呼吸道症状出现频率(RES.)小于3次的患者, 第7节点node7为入院第一天最高体温(T.day1.max)小于38℃,该指标最终将 患者分类为新冠肺炎患者,第8节点node8为入院第一天最高体温(T.day1.max) 大于等于38℃,该指标最终将患者分类为甲型流感肺炎患者。
图4是本发明一个实施例的第二决策模型的树状结构图。如图4所示,该 第二决策树模型的每个节点均包括了患者总数,新冠肺炎患者数(cases),甲 型流感患者数(cases)和患者的类别判断(class)。第二决策树模型的根节点 node0包括245个患者,其中121人为新冠肺炎患者124人为甲型流感肺炎患者。
在本实施例中,第一节点node1和第二节点node2为根节点node0的子节点, 形成两个决策分支。其中,第一节点node1为患者的嗜酸细胞绝对值(EO#)降 低,该指标为分类新冠肺炎患者的最优决策指标。第二节点为患者的嗜酸细胞 绝对值(EO#)正常。
在本实施例中,第三节点node3和第四节点node4作为第二节点node2的子 节点,形成两个决策分支以分类嗜酸细胞绝对值(EO#)正常的患者。其中,第 三节点node3为患者的单核细胞百分比(MOMO%)正常,第四节点node4为 患者的单核细胞百分比(MOMO%)升高或降低,该指标为分类新冠肺炎患者 的次优决策指标。
在本实施例中,第五节点node5和第六节点node6为第三节点node3的子节 点,形成两个决策分支以分类单核细胞百分比(MOMO%)正常的患者。其中, 第五节点node5为患者的红细胞压积(HCT)降低,该指标为分类新冠肺炎患 者的第三优选决策指标。第六节点node6为患者的红细胞压积(HCT)正常。
在本实施例中,第7节点node7和第8节点node8为第六节点node6的子节 点,形成两个决策分支以分类红细胞压积(HCT)正常的患者的。其中,第7 节点node7为患者入院第一天最高体温(T.day1.max)大于等于37℃,第8节点 node8为患者入院第一天最高体温(T.day1.max)小于37℃,该指标为分类新冠 肺炎患者的第四优选决策指标。
在本实施例中,第9节点node9和第10节点node10为第7节点node7的子 节点,形成两个决策分支以分类入院第一天最高体温(T.day1.max)大于等于 37℃的患者。其中,第9节点node9为患者的呼吸道症状出现频率(RES.)小 于1次,该指标最终将患者分类为新冠肺炎患者。第10节点node10为患者的 呼吸道症状出现频率(RES.)大于等于1次,该指标最终将患者分类为甲型流 感肺炎患者。
在本发明的一个实施例中,为验证模型的分类效果,采用61名患者的临床 检验数据对模型进行验证。
图5a是本发明一个实施例的第一决策模型的混淆矩阵图。图5b是本发明 一个实施例的第一决策模型的ROC曲线下面积图。如图5a和图6a所示,显示 了第一决策模型的对测试集患者的分类结果与真实结果的区别,可见第一决策 模型分类全部的新冠肺炎患者,但有4名甲型流感肺炎患者被错分为新冠肺炎 患者。第一决策模型的模型灵敏度为1.00,特异度为0.87,阳性预测值为0.88, 阴性预测值为1.00。模型A的ROC曲线显示,AUC值为0.93。
图6a是本发明一个实施例的第二决策模型的混淆矩阵图,图6b是本发明 一个实施例的第二决策模型的ROC曲线下面积图。如图6a和图6b所示,显示 了第二决策模型的对测试集患者的分类结果与真实结果的区别,可见第二决策 模型分类了全部的新冠肺炎患者,但8名甲型流感肺炎患者被错分为新冠肺炎 患者。模型灵敏度为0.73,特异度为1.00,阳性预测值为1.00,阴性预测值为 0.79。ROC曲线显示,AUC值为0.87。
根据与其他决策模型的对比,第一决策模型对新冠肺炎患者和甲型流感肺 炎患者的预测能力最佳,特别是当需要预测该患者为新冠肺炎患者时,能够最 大程度减少漏诊,为最优模型。第二决策模型对新冠肺炎患者和甲型流感肺炎 患者的预测能力良好,为次优模型。
本方法通过构建基于个人临床体质、血常规指标和血生化指标的新冠肺炎 患者和甲型流感肺炎患的初步筛选诊断模型,根据模型分类诊断能力分为最优 模型和次优模型。次优模型是考虑到血常规为更经济、普遍的实验室技术,因 此更适用于基层和欠发达地区。最优模型分类诊断更准确、灵敏、稳健,可为 临床快速分诊提供技术支撑。
图7是本发明一个实施例的新型冠状肺炎与流感肺炎的初筛系统的系统架 构图。如图7所示,一种新型冠状肺炎与流感肺炎的初筛诊断系统,该系统实 现新型冠状肺炎与流感肺炎的初筛的步骤如上述方法所示,包括:
数据获取单元100,用以获取新冠肺炎患者和流感肺炎患者的临床指标数 据;
临床指标识别单元200,用以利用Logistic回归模型比较两组数据各项指标 的OR值,识别出存在差异的临床指标;
临床指标评估单元300,用以采用随机森林模型对识别后的临床指标的影响 权重进行排序,根据排序结果获取高权重的临床指标作为评估新冠肺炎的风险 因素。
诊断模型建立单元400,将患者按4:1随机分为训练集和测试集,训练集根 据所述排序结果选取临床指标用以构建分类回归树模型,所述分类回归树模型 基于各临床指标或各临床指标的组合建立了决策树,所述测试集用以验证所述 分类回归树模型的输出结果。
图8是本发明一个实施例的一种电子设备的结构示意图。如图8所示,本 发明一个实施例的一种电子设备包括一个或多个输入设备1000、一个或多个输 出设备1000、一个或多个处理器3000和存储器4000。
在本发明一个实施例中,处理器1000、输入设备2000、输出设备3000和 存储器4000可以通过总线或其它方式连接。输入设备2000、输出设备3000可 以是标准的有线或无线通信接口。
处理器1000可以是中央处理模块(Central Processing Unit,CPU),该处理器 还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专 用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者 晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器 也可以是任何常规的处理器等。
存储器4000可以是高速RAM存储器,也可为非不稳定的存储器,例如磁 盘存储器。存储器4000用于存储一组计算机程序,输入设备2000、输出设备 3000和处理器1000可以调用存储器4000中存储的程序代码。
存储器4000存储的计算机程序包括程序指令,所述程序指令当被处理器执 行时使所述处理器执行如上述实施例中所述新型冠状肺炎与流感肺炎的初筛诊 断方法的步骤。
本发明的一个实施例还提供一种计算机可读存储介质。该计算机可读存储 介质可以是高速RAM存储器,也可为非不稳定的存储器,例如磁盘存储器。该 计算机可读存储介质可通过外部计算设备或网络进行连接,以读取该计算机可 读存储介质所存储的一组计算机程序。该计算机可读存储介质存储的计算机程 序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如上述实 施例中所述新型冠状肺炎与流感肺炎的初筛诊断方法的步骤。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例 是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的 范围内可以对上述实施例进行变化、修改、替换和变型。凡在本发明的精神和 原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范 围之内。
Claims (10)
1.新型冠状肺炎与流感肺炎的初筛诊断方法,其特征在于,包括以下步骤:
获取新冠肺炎患者和流感肺炎患者的临床指标数据;
利用Logistic回归模型比较两组数据各项指标的OR值,识别出存在差异的临床指标;
采用随机森林模型对识别后的临床指标的影响权重进行排序,根据排序结果获取高权重的临床指标作为评估新冠肺炎的风险因素;
将患者按4:1随机分为训练集和测试集,训练集根据所述排序结果选取临床指标用以构建分类回归树模型,所述分类回归树模型基于各临床指标或各临床指标的组合建立了决策树,所述测试集用以验证所述分类回归树模型的输出结果。
2.如权利要求1所述的新型冠状肺炎与流感肺炎的初筛诊断方法,其特征在于,所述新冠肺炎患者和流感肺炎患者的临床指标数据包括患者的人口学特征、临床症状和体征、血常规以及血生化检查结果。
3.如权利要求2所述的新型冠状肺炎与流感肺炎的初筛诊断方法,其特征在于,统计临床指标数据并将变量指标进行转换描述,包括:
将临床指标数据中非确定性指标的统计结果与医学参考值进行比较,生成低于参考值,正常和高于参考值三种结果;
将临床指标数据中连续变量指标的统计结果转换为四分位数间距(IQR),并以中位数进行表示;
将临床指标数据中离散变量指标的统计结果转换为概率分布值进行表示。
4.如权利要求3所述的新型冠状肺炎与流感肺炎的初筛诊断方法,其特征在于,基Logistic回归模型和随机森林模型筛选出所述临床指标数据中高权重的临床指标,其中:
临床症状和体征中选取第一天最高体温、呼吸道症状出现频率、咳嗽;
血常规指标中选取嗜酸细胞绝对值、红细胞压积、单核细胞百分比;
血生化指标中选取低密度脂蛋白胆固醇、C反应蛋白、肌酸激酶。
5.如权利要求4所述的新型冠状肺炎与流感肺炎的初筛诊断方法,其特征在于,建立第一决策树模型,所述第一决策树模型以所述临床指标数据作为节点区分新冠肺炎患者和甲型流感肺炎患者,其中第一节点为低密度脂蛋白胆固醇、第二节点为肌酸激酶、第三节点为呼吸道症状出现频率、第四节点为入院第一天最高体温。
6.如权利要求4所述的新型冠状肺炎与流感肺炎的初筛诊断方法,其特征在于,建立第二决策树模型,所述第二策树模型以所述临床指标数据作为节点区分新冠肺炎患者和甲型流感肺炎患者,其中第一节点为嗜酸细胞绝对值、第二节点为单核细胞百分比、第三节点为红细胞压积、第四节点为入院第一天最高体温、第五节点为呼吸道症状出现频率。
7.如权利要求5或6所述任一种新型冠状肺炎与流感肺炎的初筛诊断方法,其特征在于,采用混淆矩阵(confusion matrix)和ROC曲线下面积(AUC)验证所述第一模型和第二模型,确定新型冠状肺炎与流感肺炎的初筛的最优模型。
8.新型冠状肺炎与流感肺炎的初筛诊断系统,其特征在于,包括:
数据获取单元,用以获取新冠肺炎患者和流感肺炎患者的临床指标数据;
临床指标识别单元,用以利用Logistic回归模型比较两组数据各项指标的OR值,识别出存在差异的临床指标;
临床指标评估单元,用以采用随机森林模型对识别后的临床指标的影响权重进行排序,根据排序结果获取高权重的临床指标作为评估新冠肺炎的风险因素;
诊断模型建立单元,将患者按4:1随机分为训练集和测试集,训练集根据所述排序结果选取临床指标用以构建分类回归树模型,所述分类回归树模型基于各临床指标或各临床指标的组合建立了决策树,所述测试集用以验证所述分类回归树模型的输出结果。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010308533.1A CN111834003A (zh) | 2020-04-18 | 2020-04-18 | 新型冠状肺炎与流感肺炎的初筛诊断方法,系统和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010308533.1A CN111834003A (zh) | 2020-04-18 | 2020-04-18 | 新型冠状肺炎与流感肺炎的初筛诊断方法,系统和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111834003A true CN111834003A (zh) | 2020-10-27 |
Family
ID=72913988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010308533.1A Pending CN111834003A (zh) | 2020-04-18 | 2020-04-18 | 新型冠状肺炎与流感肺炎的初筛诊断方法,系统和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111834003A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113161010A (zh) * | 2021-05-14 | 2021-07-23 | 复旦大学附属中山医院 | 一种区分普通感冒、流感以及新冠病毒的辅助诊断系统 |
CN113409947A (zh) * | 2021-07-29 | 2021-09-17 | 四川大学华西医院 | 新冠肺炎重症化预测模型、系统及其建立方法、预测方法 |
CN115201460A (zh) * | 2022-07-18 | 2022-10-18 | 中元汇吉生物技术股份有限公司 | 血液分析仪、血液分析方法及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006020824A2 (en) * | 2004-08-11 | 2006-02-23 | Yale University | Diagnosis and treatment of kawasaki disease and coronavirus infection |
US20070248986A1 (en) * | 2006-04-10 | 2007-10-25 | Academisch Ziekenhuis H.O.D.N. Lumc | Systems and methods for predicting an individual's risk of developing rheumatoid arthritis |
CN109585011A (zh) * | 2018-10-26 | 2019-04-05 | 朱海燕 | 胸痛患者的病症诊断方法及机器可读存储介质 |
US20190355473A1 (en) * | 2017-01-08 | 2019-11-21 | Henry M. Jackson Foundation For The Advancement Of Military Medicine | Systems and methods for using supervised learning to predict subject-specific pneumonia outcomes |
CN110634563A (zh) * | 2019-06-21 | 2019-12-31 | 中国人民解放军总医院 | 一种糖尿病肾病-非糖尿病肾病鉴别诊断装置 |
-
2020
- 2020-04-18 CN CN202010308533.1A patent/CN111834003A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006020824A2 (en) * | 2004-08-11 | 2006-02-23 | Yale University | Diagnosis and treatment of kawasaki disease and coronavirus infection |
US20070248986A1 (en) * | 2006-04-10 | 2007-10-25 | Academisch Ziekenhuis H.O.D.N. Lumc | Systems and methods for predicting an individual's risk of developing rheumatoid arthritis |
US20190355473A1 (en) * | 2017-01-08 | 2019-11-21 | Henry M. Jackson Foundation For The Advancement Of Military Medicine | Systems and methods for using supervised learning to predict subject-specific pneumonia outcomes |
CN109585011A (zh) * | 2018-10-26 | 2019-04-05 | 朱海燕 | 胸痛患者的病症诊断方法及机器可读存储介质 |
CN110634563A (zh) * | 2019-06-21 | 2019-12-31 | 中国人民解放军总医院 | 一种糖尿病肾病-非糖尿病肾病鉴别诊断装置 |
Non-Patent Citations (1)
Title |
---|
路玲等: "影响腹膜透析患者身体机能状态的临床相关因素分析", 《临床肾脏病杂志》, vol. 20, no. 3, pages 213 - 217 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113161010A (zh) * | 2021-05-14 | 2021-07-23 | 复旦大学附属中山医院 | 一种区分普通感冒、流感以及新冠病毒的辅助诊断系统 |
CN113409947A (zh) * | 2021-07-29 | 2021-09-17 | 四川大学华西医院 | 新冠肺炎重症化预测模型、系统及其建立方法、预测方法 |
CN115201460A (zh) * | 2022-07-18 | 2022-10-18 | 中元汇吉生物技术股份有限公司 | 血液分析仪、血液分析方法及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Aktar et al. | Machine learning approach to predicting COVID-19 disease severity based on clinical blood test data: statistical analysis and model development | |
CN111834003A (zh) | 新型冠状肺炎与流感肺炎的初筛诊断方法,系统和设备 | |
CN113327679A (zh) | 一种肺栓塞临床风险及预后评分方法与系统 | |
Altunok et al. | Correlation between sodium, potassium, hemoglobin, hematocrit, and glucose values as measured by a laboratory autoanalyzer and a blood gas analyzer | |
CN109585011A (zh) | 胸痛患者的病症诊断方法及机器可读存储介质 | |
Tang et al. | Prediction of sepsis in COVID-19 using laboratory indicators | |
CN113409947B (zh) | 新冠肺炎重症化预测模型、系统及其建立方法、预测方法 | |
Sabetian et al. | Prediction of patients with COVID-19 requiring intensive care: A cross-sectional study based on machine-learning approach from Iran | |
Ding et al. | Identification of parameters in routine blood and coagulation tests related to the severity of COVID-19 | |
CN115910360A (zh) | 一种烟雾病风险预测模型构建方法 | |
CN115691807A (zh) | 一种慢加急性肝衰竭感染风险预警模型及其构建方法 | |
Baek et al. | Variation in clinical usefulness of biomarkers of acute kidney injury in young children undergoing cardiac surgery | |
Li et al. | Red blood cell distribution width is associated with frailty in older inpatients in China: Sex differences in a cross-sectional study | |
Gençay et al. | Mean platelet volume and platelet distribution width as mortality predictors in ıntensive care unit | |
CN109545377B (zh) | 获取肾小球滤过率的模型的建立方法 | |
CN111007258A (zh) | 一种川崎病早期诊断的试剂及其应用 | |
Hu et al. | Establishment of a diagnostic model of coronary heart disease in elderly patients with diabetes mellitus based on machine learning algorithms | |
Ikeagwulonu et al. | Systematic review of laboratory parameters predicting severity and fatality of COVID-19 hospitalised patients | |
Tanaka et al. | Development of interpretable machine learning models to predict in‐hospital prognosis of acute heart failure patients | |
Lamichhane et al. | Associated Biochemical and Hematological Markers in COVID‐19 Severity Prediction | |
Pavelescu et al. | Hematological profile, inflammatory markers and serum liver enzymes in COVID 19 positive children vs. COVID 19 negative ones—a comparative study | |
Futterman et al. | Use of machine learning to identify clinical variables in pregnant and non-pregnant women with SARS-CoV-2 infection | |
Fukui et al. | A Predictive Rule for COVID-19 Pneumonia Among COVID-19 Patients: A Classification and Regression Tree (CART) Analysis Model | |
Koç et al. | The prognostic importance of neutrophil-toLymphocyte ratio and platelet-toLymphocyte ratio in adult patients with sepsis who underwent hemoperfusion in general intensive care unit | |
Otlu et al. | CRP and LDH Levels Can Be Used for Support the COVID-19 Diagnose in Intensive Care Unit Patients |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |