CN116959653A - 建立基于诊断时效的covid-19分诊系统的方法、该系统及分诊方法 - Google Patents

建立基于诊断时效的covid-19分诊系统的方法、该系统及分诊方法 Download PDF

Info

Publication number
CN116959653A
CN116959653A CN202310756366.0A CN202310756366A CN116959653A CN 116959653 A CN116959653 A CN 116959653A CN 202310756366 A CN202310756366 A CN 202310756366A CN 116959653 A CN116959653 A CN 116959653A
Authority
CN
China
Prior art keywords
date
diagnosis
priority
visit
chronic disease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310756366.0A
Other languages
English (en)
Inventor
陈一君
简文华
梁振宇
关伟杰
梁文华
李时悦
张挪富
郑劲平
何建行
钟南山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Affiliated Hospital of Guangzhou Medical University
Original Assignee
First Affiliated Hospital of Guangzhou Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Affiliated Hospital of Guangzhou Medical University filed Critical First Affiliated Hospital of Guangzhou Medical University
Priority to CN202310756366.0A priority Critical patent/CN116959653A/zh
Publication of CN116959653A publication Critical patent/CN116959653A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种建立基于诊断时效的COVID‑19的分诊系统的方法、该方法所建立的计算机系统以及相关的COVID‑19分诊方法。该计算机系统包括:数据接收模块,用于接收包括就诊者的年龄、慢性病史、症状发作日期和首次就诊日期的信息;数据处理模块,用于将所接收的信息与预设的优先就诊条件进行比对;以及输出模块,用于突出显示符合所述预设的优先就诊条件的就诊者,提示优先就诊;其中,所述预设的优先就诊条件选自以下条件中的一个或多个:(a)患有慢性病并且年龄大于61岁,(b)患有慢性病并且症状发作日至首次就诊日大于4天,和(c)无慢性病但年龄大于51岁。

Description

建立基于诊断时效的COVID-19分诊系统的方法、该系统及分 诊方法
本申请是申请号为202110432543.0、申请日为2021年04月21日、发明名称为“建立基于诊断时效的COVID-19分诊系统的方法、该系统及分诊方法”的发明专利申请的分案申请。
技术领域
本发明涉及疾病的分诊,更具体地,涉及建立基于诊断时效的COVID-19分诊系统的方法、该方法所建立的基于诊断时效的COVID-19分诊系统以及相关的基于诊断时效的COVID-19分诊方法。
背景技术
对新冠病毒感染患者的救治应最大限度地避免轻症向重症及危重症转化,一旦转化为重症和危重症,死亡率将很高。另外,早检测、早发现、早治疗是避免新冠患者由轻症转重症及危重症的根本前提,这是防疫的重中之重。从影像学检查的角度来看,数项研究已经记录了就诊或检查的患者(在症状发作后6-14天内进行影像学检查)更可能有加重的异常肺部CT表现和病变。迄今为止,COVID-19预后与诊断时效(time-efficiency)之间的关系和COVID-19诊断时效在不同人群中的重要性有待得到更深入的分析。
提高COVID-19的诊断时效,意味着要缩短从症状发作到确诊的时间,其中包括:由患者主导的从症状发作到首次就诊的时长,以及医疗机构主导的从首次就诊到确诊的时长。一方面,我们需要患者识别出最早的症状并尽快就诊,但是目前该时间间隔因人而异。另一方面,医院应提高确诊效率,目前在患者中确诊COVID-19所需的时间和逆转录聚合酶链反应(RT-PCR)的核酸检测的次数不尽相同。有些患者需要做2次以上核酸检测才能确诊,大多数患者在2天之内确诊,最长可达7天。
提高诊断时效固然重要,但也会对公共卫生系统带来压力。
因此,基于诊断时效的COVID-19的分诊系统在公共卫生资源不足、公共卫生系统脆弱的地区具有实用意义,以对COVID-19的可疑就诊者进行高效的分诊,避免不良预后的高危患者拖延诊断和治疗。此外,还需要适用于不同人群样本的用于建立高效分诊系统的方法和系统,以建立适合各国或各地区具体情况的分诊系统。
发明内容
本发明分析了诊断时效相关时长的分布和截断值,对不同的诊断时效组进行生存分析和比较,以弥补其他研究中被忽视的方面,更好地公证诊断时效的作用。本发明基于诊断时效和分析中有意义的临床特征进行模型构建,找出需要更高诊断时效的高危人群。本发明的系统的数据接收模块的指标选取及数据处理模块的节点选取,由下文所述分诊系统建立方法推算获得。
基于上述研究,本申请提出了基于诊断时效的COVID-19分诊系统,及用于全新人群样本的建立该种分诊系统的方法和系统。相应地,在一方面,本发明还提供了一种建立基于诊断时效的COVID-19的分诊系统的方法,所述方法包括:(a)收集包括COVID-19确诊者的年龄、慢性病史、症状发作日期、首次就诊日期、确诊日期、入院日期、不良结局、不良结局最早发生日期的信息;(b)计算每个确诊者的诊断时效相关时长,单位以天数计算,包括症状发作日期至确诊日期时长、症状发作日期至首次就诊日期时长和首次就诊日期至确诊日期时长;计算入院日期至不良结局最早发生日期时长,若该时长为负数或大于31天则直接排除该病例;(c)确定诊断时效相关时长的95%分位数,并排除数值大于95%分位数的数据异常病例;(d)以诊断时效相关时长为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,通过Maxstat最大统计量法(maximally selectedrank statistics)分析来确定诊断时效相关时长转化为二分类变量的最佳截断值(cutoff),并将原为连续型变量的诊断时效相关时长变量直接替换为二分类变量,以减小极端或异常的时效相关时长对分诊模型稳定性的影响,并强化变量效应从而增强分诊模型的应用推广性;(e)以包括但不限于二分类转化后的诊断时效相关时长、年龄、性别、吸烟史、慢性病史为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,进行单变量对数秩检验(log-rank test),分别得到所述自变量的对数秩检验p值;(f)以包括二分类转化后的诊断时效相关时长、对数秩检验p值低于设定阈值的变量、年龄、性别、吸烟史、慢性病史共同作为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,进行多变量Cox比例风险回归生存分析,得到各自变量的Cox回归p值;(g)以包括二分类转化后的诊断时效相关时长以及Cox回归p值低于设定阈值的变量为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,进行条件推理树分析,得到决策树模型;(h)根据得到的决策树模型建立用于COVID-19的分诊系统。
在一个具体实施方式中,对于所述步骤(d)中的Maxstat最大统计量法,将minprop(the minimal proportion of observations per group,即每组观测的最小比例)参数值设置为0.15。在一个具体实施方式中,对于所述步骤(d)中的Maxstat最大统计量法,break.time.by参数值为5。
在一个具体实施方式中,对于所述步骤(d)中的Maxstat最大统计量法,在R语言编程中使用surv_cutpoint()函数进行计算,将minprop参数值设置为0.15,将progressbar参数值设置为TRUE,variables参数值命名为“timeStoD”,data参数用于调用包含生存资料(时间,事件)和待分割的连续变量的数据框结构数据集,time参数调用生存时间指标,设定为入院至不良结局发生所需时间,event参数调用生存结局指标,设定为不良结局是否发生的状态,事件值设定为0或1。
在一个具体实施方式中,对于所述步骤(d)中的Maxstat最大统计量法,通过surv_categorize()函数,根据以上surv_cutpoint()函数返回的切割点(cutpoint),分割每个变量值,更新“timeStoD”的变量取值,继而通过summary()函数获得输出的cutpoint值取值,即最佳截断值cutoff。
在一个具体实施方式中,对于所述步骤(d)中的Maxstat最大统计量法,对cutoff有效性进行验证。通过Surv()函数构建生存函数,time、event、data的设定同之前步骤;“~predictors”参数取用上个步骤生成的“timeStoD”指标,设置为“~timeStoD”;使用ggsurvplot()函数,针对上述函数绘制生存曲线,其中data设定不做改变,pval参数值设置为TRUE,risk.table参数值设置为TRUE,conf.int参数值设置为TRUE,surv.median.line参数值设置为″hv″,linetype参数值设置为″strata″;设定break.time.by参数值为5,以达到最佳绘制效果;ggtheme、palette等风格主题或颜色面板的参数不作限定;获得两组生存曲线不存在交错走向,则诊断时效相关指标的二分类切割点(cutoff)取值有效。
在一个实施方式中,对于步骤(e)中的单变量对数秩检验,通过Surv()函数构建生存函数,time、event、data的设定同之前步骤;各项变量逐一进入“~predictors”参数;使用Survdiff()函数逐一纳入上述Surv()生存函数,逐一进行对数秩检验,获得p值;其中将rho参数值设置为0,timefix参数值设置为TRUE。
在一个实施方式中,对于步骤(f)中的多变量Cox比例风险回归生存分析,使用Surv()函数进一步构建多变量的生存函数,time、event、data的设定同之前步骤;所有自变量进入模型;使用coxph()函数纳入上述Surv()生存函数,进行多变量Cox比例风险回归生存分析,获得输出值Pr(>z),即得到各自变量的Cox回归p值。
在一个实施方式中,对于步骤(f)中的多变量Cox比例风险回归生存分析,将singular.ok参数值设置为TRUE,model参数值设置为FALSE,x参数值设置为FALSE,y参数值设置为TRUE,method参数值设置为ties,而ties在″efron″,″breslow″,″exact″三个取值中,设定为″efron″,使用Efron近似作为默认值,因为Efron在处理绑定的结局时间时更准确,计算效率较高。
在一个实施方式中,对于步骤(g)中的条件推理树分析,使用Surv()函数进一步构建多变量的生存函数,time、event、data的设定同之前步骤;符合条件的自变量放入模型;使用ctree()函数纳入上述Surv()生存函数,在条件推理框架中对连续的,截尾的,有序的,标称的变量和多元的响应变量进行递归划分,建立决策树模型。
在一个实施方式中,对于步骤(g)中的条件推理树分析,将subset参数值设置为NULL,weights参数值设置为NULL,xtrafo参数值设置为ptrafo,ytrafo参数值设置为ptrafo,scores参数值设置为NULL。
在一些实施方式中,其中所述对数秩检验p值的设置阈值和所述Cox回归p值的设置阈值为0.05至0.1。在一些实施方式中,其中所述异常病例为缺失年龄、慢性病史、症状发作日期、首次就诊日期、确诊日期、入院日期、不良结局、不良结局最早发生日期中的一个或多个信息的病例。在一些实施方式中,其中所述不良结局包括ICU、重症肺炎、有创通气、死亡中的一种或多种。在一些实施方式中,其中所述重症肺炎是根据《中国急诊重症肺炎临床实践专家共识》评估的。
本发明通过对诊断时效状态进行分层来评估COVID-19患者中不良后果的风险。对根据《中国急诊重症肺炎临床实践专家共识》评估为重症肺炎或入住重症监护病房/有创通气/死亡的重症病例进行了分析。通过最大选择秩统计量研究了诊断时效(由从症状发作到确诊的时长定义,包括从症状发作到首次就诊的时长以及从首次就诊到确诊的时长)的截断值。进行了生存分析(对数秩检验、COX回归、条件推理树)和不同的时效组之间的比较。
发明人通过以上分析发现,从症状发作到确诊、从症状发作到首次就诊以及从首次就诊到确诊的时长的中位数分别为6天、3天和2天,截断值分别为5天、4天和3天。调整年龄、性别、吸烟状况和合并症状况后,年龄(危险比[HR:1.03;95%CI:1.01-1.04)、合并症(HR:1.84;95%CI:1.23-2.73)、从症状发作到确诊的时长>5天(HR:1.69;95%CI:1.10-2.60);年龄(危险比[HR:1.03;95%CI:1.01-1.04)、合并症(HR:1.77;95%CI:1.18-2.68)、从症状发作到首次就诊的时长>4天(HR:1.56;95%CI:1.07-2.26),是COVID-19预后的独立预测因子。由此可见,从症状发作到确诊的时间越长,COVID-19的预后越差,尤其是延迟就诊。CTREE模型显示,诊断时效、年龄、合并症是重要的节点。从症状发作到首次就诊的时长>4天即延迟就诊,差异性分析可见,以男性、高龄、干咳、排痰性咳嗽、呼吸急促、COPD为特征的患者在延迟就诊组中更常见。
本发明另一方面提供了一种基于诊断时效的COVID-19分诊的计算机系统,包括:数据接收模块,用于接收包括就诊者的年龄、慢性病史、症状发作日期和首次就诊日期的信息;数据处理模块,用于将所接收的信息与预设的优先就诊条件进行比对,所述优先就诊包括优先开立医嘱、优先采样、优先送样和优先检测中的一个或多个;以及输出模块,用于突出显示符合所述预设的优先就诊条件的就诊者,提示优先就诊;其中,所述预设的优先就诊条件选自以下条件中的一个或多个:(a)患有慢性病并且年龄大于61岁,(b)患有慢性病并且症状发作日至首次就诊日大于4天,(c)无慢性病但年龄大于51岁。
在一些实施方式中,输出模块被配置成按以下规则设定优先级:(1)将患有慢性病并且年龄大于61岁的就诊者设为第一优先级;(2)将患有慢性病并且症状发作日至首次就诊日大于4天的就诊者设为第二优先级;(3)将无慢性病但年龄大于55岁的就诊者设为第三优先级;并且(4)将无慢性病但年龄大于51岁的就诊者设为第四优先级。在一些实施方式中,所述输出模块被进一步配置成:当就诊者年龄无慢性病但大于51岁时,提示:建议在从症状发作日起不超过5天内提供COVID-19核酸检验诊断结果。在一些实施方式中,所述输出模块被进一步配置成:当就诊者无慢性病但年龄大于55岁时,提示:建议在从首次就诊当日起不超过3天内提供COVID-19核酸检验诊断结果。
在一些实施方式中,所述慢性病史包括COPD、糖尿病、高血压、冠心病、脑血管病、乙肝、肿瘤、慢性肾病和免疫缺陷症中的一种或多种。本发明对以上慢性病的选取,是基于上述1590个患者电子病历中出院诊断对合并慢性病特征进行频数及占比的计算,获得15个高频次且高占比发生的慢性合并症,选取在不良结局病例中可见的慢性合并症,其中所述不良结局包括ICU、重症肺炎、有创通气、死亡中的一种或多种,其中所述重症肺炎是根据《中国急诊重症肺炎临床实践专家共识》评估的。
在一些实施方式中,所述症状包括干咳、咽痛、眼结膜充血、鼻塞、头痛、咯痰、劳累、咯血、气促、恶心、呕吐、腹泻、关节肌肉酸痛、寒战、发热中的一种或多种。本发明对以上症状的选取,是基于上述1590个患者电子病历中入院记录的主诉及回顾性信息收集获得的症状记录,进行频数及占比的计算,选取前15个高频次、高占比发生且稳定复现的症状,从而确定以上症状定义。
本发明通过建立本分诊系统的方法分析发现,从症状发作到确诊、从症状发作到首次就诊以及从首次就诊到确诊的时长的中位数分别为6天、3天和2天,截断值分别为5天、4天和3天。建立方法中的CTREE模型显示,诊断时效、年龄、合并症是重要的节点。
本发明的再一方面还提供了一种基于诊断时效的COVID-19的分诊方法,其包括:(S1)接收包括就诊者的年龄、慢性病史、症状发作日期和首次就诊日期的信息;(S2)将所接收的信息与预设的优先就诊条件进行比对,所述优先就诊包括优先开立医嘱、优先采样、优先送样和优先检测中的一个或多个;(S3)突出显示符合所述预设的优先就诊条件的就诊者,提示优先就诊;其中,所述预设的优先就诊条件选自以下条件中的一个或多个:(a)患有慢性病并且年龄大于61岁,(b)患有慢性病并且症状发作日至首次就诊日大于4天,(c)无慢性病但年龄大于51岁。
在一些实施方式中,步骤S3按以下规则设定优先级:(1)将患有慢性病并且年龄大于61岁的就诊者设为第一优先级;(2)将患有慢性病并且症状发作日至首次就诊日大于4天的就诊者设为第二优先级;(3)将无慢性病但年龄大于55岁的就诊者设为第三优先级;并且(4)将无慢性病但年龄大于51岁的就诊者设为第四优先级。
在一些实施方式中,所述步骤(S3)进一步包括当就诊者无慢性病但年龄大于51岁时,提示:建议在从症状发作日起不超过5天内提供COVID-19核酸检验诊断结果。在一些实施方式中,所述步骤(S3)进一步包括当就诊者无慢性病但年龄大于55岁时,提示:建议在从首次就诊日起不超过3天内提供COVID-19核酸检验诊断结果。
在一些实施方式中,所述慢性病史包括COPD、糖尿病、高血压、冠心病、脑血管病、乙肝、肿瘤、慢性肾病和免疫缺陷症中的一种或多种。本发明的以上慢性病的选取,是基于上述1590个患者电子病历中出院诊断对合并慢性病特征进行频数及占比的计算,获得15个高频次且高占比发生的慢性合并症,选取在不良结局病例中可见的慢性合并症,其中所述不良结局包括ICU、重症肺炎、有创通气、死亡中的一种或多种,其中所述重症肺炎是根据《中国急诊重症肺炎临床实践专家共识》评估的。
在一些实施方式中,所述症状包括干咳、咽痛、眼结膜充血、鼻塞、头痛、咯痰、劳累、咯血、气促、恶心、呕吐、腹泻、关节肌肉酸痛、寒战、发热中的一种或多种。本发明对以上症状的选取,是基于上述1590个患者电子病历中入院记录的主诉及回顾性信息收集获得的症状记录,进行频数及占比的计算,选取前15个高频次、高占比发生且稳定复现的症状,从而确定以上症状定义。
本发明通过建立本分诊系统的方法分析发现,从症状发作到确诊、从症状发作到首次就诊以及从首次就诊到确诊的时长的中位数分别为6天、3天和2天,截断值分别为5天、4天和3天。建立方法中的CTREE模型显示,诊断时效、年龄、合并症是重要的节点。
本发明基于对大量入院记录的分析,提出了上述分诊方法和系统,提取了其中的关键节点信息,使用其能够对就诊者进行高效的基于确诊时效不同需求对分诊,避免延误诊断,促进患者预后并合理分配医疗资源,充分发挥诊断时效研究的价值。并且,通过总结上述研究中使用的逻辑和方法,发明人还确定了建立高效分诊系统的方法,通过该方法可以利用各国的数据快速建立适合各国具体情况的分诊系统。
附图说明
图1:诊断相关时效和结果的时长的频率密度图。
图2:从症状发作到确诊的时长截断点的最大选择对数秩统计。a)根据患者从症状发作到确诊的时长,将患者分为高(右侧部分)和低(左侧部分)两组;截断点(虚线,显示最高点)由最大选择秩统计量定义;b)从症状发作到确诊的时长“高”(下方曲线)和从症状发作到确诊的时长“低”(上方曲线)的患者之间达到严重程度的时间依赖性风险;透明部分表示95%置信区间(95%CI)。最大选择秩统计量允许评估截断点,其通过连续或有序的预测变量将观察值分为两组。讨论了最大选择秩统计量的精确分布的计算,并且基于对线性秩统计的精确分布的算法的扩展,得出了新的分布下界。
图3:从症状发作到首次就诊以及从首次就诊到确诊的时长截断点的最大选择对数秩统计。a)根据患者从症状发作到首次就诊的时长,将患者分为高(右侧部分)和低(左侧部分)两组;截断点(两线相交处及虚线所示处)由最大选择秩统计量定义;b)从症状发作到首次就诊的时长“高”(下方曲线)和从症状发作到首次就诊的时长“低”(上方曲线)的患者之间达到严重程度的时间依赖性风险;透明部分表示95%置信区间(95%CI);c)根据患者从首次就诊到确诊的时长,将患者分为高(右侧部分)和低(左侧部分)两组;截断点(两线相交处及虚线所示处)由最大选择秩统计量定义;d)从首次就诊到确诊的时长“高”(下方曲线)和首次就诊到确诊的时长“低(上方曲线)的患者之间达到严重程度的时间依赖性风险;透明部分表示95%置信区间(95%CI)。最大选择秩统计量允许评估截断点,其通过连续或有序的预测变量将观察值分为两组。讨论了最大选择秩统计量的精确分布的计算,并且基于对线性秩统计的精确分布的算法的扩展,得出了新的分布下界。
图4:31天内总生存曲线。
图5:具有诊断时效和院前因素的COVID-19预后的条件推理树模型。a)根据模型树中显著分离的节点,将达到严重程度的时间依赖性风险分为5个部分;通过相应的时间序列检验(对数秩检验)计算p值;模型包括从症状发作到确诊的时长、年龄和慢性合并症状况;b)根据模型树中显著分离的节点,将达到严重程度的时间依赖性风险分为5个部分;通过相应的时间序列检验(对数秩检验)计算p值;模型包括从症状发作到首次就诊的时长、从首次就诊到确诊的时长、年龄、慢性合并症状况。
具体实施方式
定义
在整个说明书和权利要求书中,除非上下文另有表示,否则词语“包括”以及诸如“包含”和“含有”之类的变体将被理解为包括所述整数、步骤或成分,但不排除任何其他整数、步骤或者成分。当在本文中使用时,术语“包括”可以用术语“包含”或“含有”代替,或者有时在本文中使用术语“具有”代替。
如本文中使用的,术语“分诊”是指根据病人的主要症状及体征、病史等判断病人病情的轻重缓急及其隶属专科,对病情种类和严重程度进行简单、快速的评估与分类,按照分诊优先次序,使患者因为恰当的原因在恰当的时间、恰当的治疗区获得恰当的诊疗与护理的过程。在本发明中,通过分诊可以确定有需要进行优先就诊的患者。优先就诊通常包括优先开立医嘱、优先采样、优先送样和优先检测。
如本文中使用的,术语“诊断时效”是指患者在疾病诊断过程中关键时间点或事件的时间效率。通常,这些关键时间点或事件包括症状发作、首次就诊、确诊(即获得诊断)等。相应地,术语“诊断时效相关时长”可以包括从症状发作到确诊的时长、从症状发作到首次就诊的时长、以及从首次就诊到确诊的时长。所述时长在本发明中特别地以“天”为单位。
如本文中使用的,术语“预后”是指根据经验预测的疾病发展情况。疾病预后是对某种疾病的了解,除了先了解其临床表现、化验及影像学、病因、病理、病情规律等方面之外,重要的是根据治疗时机和方法结合治疗操作中所发现的新情况,对疾病的近期和远期疗效、转归恢复或进展程度的评估。疾病预后与患者的治疗时机、疾病的发生程度、医学水平、合并的疾病、医生的个人能力、体质、年龄、患者是否正视疾病或对疾病的认知能力、是否继续治疗等诸多因素有关,即使接受了同样的治疗,预后也可以有很大的差别。在上述因素中,有些是无法抗拒不可改变的,如年龄、基础情况等;有些则是需要早期干预才可以改善的,如早发现、正视疾病、早干预早治疗,都是有利于预后向好的方向发展。
如本文中使用的,术语“疾病结局”是指疾病发展到一定程度或阶段的结局。在本发明中,“不良结局”可以是指COVID-19发展到严重程度。所述严重程度可以包括根据《中国急诊重症肺炎临床实践专家共识》评估为重症肺炎或发生了入住重症监护病房/有创通气/死亡的情况。
如本文中使用的,术语“中国急诊重症肺炎临床实践专家共识”是指2016年由中国医师协会急诊医师分会发布的《中国急诊重症肺炎临床实践专家共识》。特别地,根据该《共识》,重症肺炎病例(该病例也应相应转入ICU密切观察和积极治疗)的界定标准如下:符合主要标准之一或超过(或等于)3个次要标准,其中主要标准:①接受有创通气;②感染性休克,液体复苏后仍需要血管活性药物;次要标准:①呼吸频率增加(≥30次/min);②动脉氧分压(PaO2)/吸入氧分压(FiO2)≤250mmHg(1mmHg=0.133kPa);③肺部成像显示多叶浸润;④意识障碍和/或定向障碍;⑤血尿素氮≥7mmol/L;⑥低血压,需要液体复苏。
本发明使用了术语“最大选择秩统计量”以及“截断值”。在ROC曲线中,因变量必须是二分类变量,但有时我们可能会面临因变量是生存资料、定量资料等其他情况,此时ROC曲线就无能为力了。在这种情况下,可以考虑利用最大选择秩统计量来寻找界值。具体来说,假定有一个因变量y(y可以是分类资料,也可以是连续资料,还可以是生存资料)和一个自变量x。最大选择秩统计量相当于对x变量的每个值分别划分,每一次划分都将数据分为两组,同时计算一个标准化统计量。该标准化统计量根据因变量的类型不同而不同,但总的来说,它反映了按某值划分后两组的差异情况。全部划分后,可以得到多个标准化统计量,找到其中最大的,其对应的划分值就是最佳切割值(本质还是二分类变量),亦即本文中使用的“截断值”。
在本发明的技术方案中,具体地,可以通过最大选择秩统计量把三种时长(从症状发作到确诊的时长、从症状发作到首次就诊的时长、从首次就诊到确诊的时长)的连续变量变为二分类变量。因为相差一天的区别不大,而且有较大的混杂,故转化为二分类变量能使分析结果更为稳定,而此连续变量的二分类的切割值就是这里所说的截断值。然后用上述方法找到最佳的切割值。再纳入后面的模型计算。
实施例
设计、数据源和数据提取
根据世卫组织的临时指导意见,本发明涉及的这些病例是通过咽拭子和鼻拭子标本的实时RT-PCR分析或高通量测序确诊的。由经验丰富的呼吸科临床医生检查并提取临床数据作为计算机数据库,在分析前通过双重输入进行验证。
数据收集
收集人口统计学、临床、预后特征(即性别、年龄、吸烟状况、原发性既往慢性病、症状)以及入院时的首次检查和胸片结果。至于慢性合并症,记录了慢性阻塞性肺疾病(COPD)、糖尿病、高血压、冠心病、脑血管疾病、乙型肝炎、恶性肿瘤、慢性肾脏疾病、免疫缺陷。
还记录了症状发作日期、首次就诊日期和确诊日期,计算出症状发作日期和首次就诊日期之间以及首次就诊日期和确诊日期之间的时间,如果出现少于1.0天的数字,则从分析中删除。
分析了达到严重程度(作为终点指标)的患者,这些患者包括根据《中国急诊重症肺炎临床实践专家共识》评估为重症肺炎或入住重症监护病房(ICU)/有创通气/死亡的患者,达到其中之一的第一天决定了入院至达到严重程度的时长。
记录了预后结果和入院至终点的时长,但当时长数为负数时,两者都将被删除。结果相关时长超过31天的患者将连同结果缺失的患者一起被排除在预后相关分析之外。
统计分析
本发明对全部样本的人口统计学信息进行了汇总,并对严重和非严重病例的数据进行了比较。对诊断时效(症状发作至确诊时长、症状发作至首次就诊时长、首次就诊至确诊时长)和生存时间(入院至达到严重程度时长)进行了描述性分析,并绘制了频率密度图。最后还对高和低诊断时效之间的人口统计学和临床数据进行了比较。连续数据表示为平均值和范围。采用Wilcoxon秩和检验比较非参数值。分类数据以计数和百分比表示,并使用卡方检验和Fisher精确检验进行比较。
为了将连续变量转化为分类变量,减少极端值带来的不成比例的影响,以使计算模型稳定(“天数”作为计量单位,对于评估预后结果而言过于精确),进行了最大选择秩统计量(Maxstat)分析,以确定诊断时效时长的适当截断点。采用Kaplan-Meier(KM)法绘制不同诊断时效组的生存曲线。在Maxstat分析中,在R语言编程中使用surv_cutpoint()函数进行计算,将minprop参数值设置为0.15,将progressbar参数值设置为TRUE,variables参数值命名为“timeStoD”,data参数用于调用包含生存资料(时间,事件)和待分割的连续变量的数据框结构数据集,time参数调用生存时间指标,设定为入院至不良结局发生所需时间,event参数调用生存结局指标,设定为不良结局是否发生的状态,事件值设定为0或1。通过surv_categorize()函数,根据以上surv_cutpoint()函数返回的切割点(cutpoint),分割每个变量值,更新“timeStoD”的变量取值,继而通过summary()函数获得输出的cutpoint值取值,即最佳截断值cutoff。对cutoff有效性进行验证:通过Surv()函数构建生存函数,time、event、data的设定同之前步骤;“~predictoFs”参数取用上个步骤生成的“timeStoD”指标,设置为“~timeStoD”;使用ggsurvplot()函数,针对上述函数绘制生存曲线,其中data设定不做改变,pyal参数值设置为TRUE,risk.table参数值设置为TRUE,conf.int参数值设置为TRUE,surv.median.line参数值设置为″hv″,linetype参数值设置为″strata″;设定break.time.by参数值为5,以达到最佳绘制效果;ggtheme、palette等风格主题或颜色面板的参数不作限定;获得两组生存曲线不存在交错走向,则诊断时效相关指标的二分类切割点(cutoff)取值有效。
绘制了严重程度患者的总生存曲线。在不违反比例风险假设的情况下,通过对数秩检验和多变量Cox比例风险回归对所有入院前因素(与诊断时效相关的时长、性别、年龄、吸烟状况、是否有既往慢性病)的预后意义都进行了分析。描述了HR和95%置信区间(95%CI)。其中,对于单变量对数秩检验,通过Surv()函数构建生存函数,time、event、data的设定同之前步骤;各项变量逐一进入“~predictors”参数;使用Survdiff()函数逐一纳入上述Surv()生存函数,逐一进行对数秩检验,获得p值;其中将rho参数值设置为0,timefix参数值设置为TRUE。其中,对于多变量Cox比例风险回归生存分析,使用Surv()函数进一步构建多变量的生存函数,time、event、data的设定同之前步骤;所有自变量进入模型;使用coxph()函数纳入上述Surv()生存函数,进行多变量Cox比例风险回归生存分析,获得输出值Pr(>z),即得到各自变量的Cox回归p值。其中,将singular.ok参数值设置为TRUE,model参数值设置为FALSE,x参数值设置为FALSE,y参数值设置为TRUE,method参数值设置为ties,而ties在″efron″,″breslow″,″exact″三个取值中,设定为″efron″,使用Efron近似作为默认值,因为Efron在处理绑定的结局时间时更准确,计算效率较高。
条件推理树分析(Conditional inference tree analysis,CTREE)是一种机器学习方法,作为具有显著性因素(多变量Cox比例风险回归的概率值<0.1)的补充分析而执行,它通常利用树节点上特征排列的多重显著性检验和信息测度(例如基尼系数)来划分与结果最相关的预测因子,并递归地拆分树,将患者划分为具有不同严重程度风险的子样本。CTREE基于一组协变量上的值递归地执行因变量的单变量拆分。CTREE倾向于选择具有许多可能的拆分或许多缺失值的变量,使用显著性测试程序来选择变量,而不是选择使信息度量最大化的变量(例如基尼系数)。其中,使用Surv()函数进一步构建多变量的生存函数,time、event、data的设定同之前步骤;符合条件的自变量放入模型;使用ctree()函数纳入上述Surv()生存函数,在条件推理框架中对连续的,截尾的,有序的,标称的变量和多元的响应变量进行递归划分,建立决策树模型。其中,将subset参数值设置为NULL,weights参数值设置为NULL,xtrafo参数值设置为ptrafo,ytrafo参数值设置为ptrafo,scores参数值设置为NULL。
同时,本本发明比较了在症状发作后4天内就诊的患者与其他患者之间的预后特点和入院初检结果。概率值(P值)<0.05被认为具有统计学意义,并使用R软件(R版本4.0.0https://www.r-project.org/)进行了统计分析。
结果
人口统计学和临床特征
关于整个队列的人口统计学信息的概要如表1所示,并比较了严重和非严重程度之间的数据。
表1按不同严重程度分层的患者的人口统计学和临床特征
数据为平均值±标准差,或带范围的中位数,n(%),其中n是患者样本数,%是可用数据的比例。COPD=慢性阻塞性肺疾病。
在这1590例中,中位年龄为48.0岁,仅647例患者(40.6%)是女性。除住院期间或住院后发热(88.0%)外,最常见的症状为干咳(70.2%)。399例(25.1%)患者至少有一种慢性既往疾病。85%以上的患者至少有一次胸部CT或X线表现异常。在诊断时效和结果相关时长方面也观察到显著差异。
诊断时效或结果相关时长的特征和截断点
本研究进一步分析和描述了诊断时效和结果相关的时长(表2),并绘制了频率密度图(图1)。在这1590例中,从症状发作至确诊、从症状发作至首次就诊、从首次就诊至确诊、从入院至达到严重程度的时长的中位数分别为6、3、2、8天。
表2诊断时效和结果的时长
*在该队列中,共1590例,其中1501例有症状发作日期,1512例有首次就诊日期,935例有确诊日期,1246例有入院日期,234例发展至严重程度并有确切日期。
*根据logit统计方法,考虑年龄、既往疾病和终点因素,上述4种时长是完全随机缺失(MCAR)的。
为了确定时长的截断值,由于缺少结果时长(缺少入院日期或病情转为严重程度的日期,或计算出负数),删除了350个观察结果。此外,11例(5%,11/237)从入院至达到严重程度的天数为显著异常值(远大于第三四分位数加上第一和第三四分位数之间的差异的1.5倍,真实性无法追溯)并排除。因此,在Maxstat分析中,最多保留1229例病例,以确定最佳阈值。
根据最佳对数秩检验P值(图2、图3),症状发作和确诊之间、症状发作和首次就诊之间以及首次就诊和确诊之间的时长的截断值分别为5、4和3天(表3)。
表3诊断时效的截断值和对数秩检验结果
*<0.0005,**<0.0001
预后分析
从总共1229例具有完整预后结果指标(入院日期、终点日期、终点结果)的病例中,进行了进一步的预后分析。绘制了总生存曲线(图4)。单变量对数秩分析显示,年龄、性别、合并症、与诊断时效相关的时长是影响COVID-19预后的可疑因素(P<0.05,表4)。在调整了年龄、性别、吸烟状况和合并症状况之后,多变量Cox比例风险回归分析显示,年龄(危险比[HR]:1.03;95%CI:1.01-1.04)、合并症状况(HR:1.84;95%CI:1.23-2.73)、从症状发作到确诊的时长(HR:1.69;95%CI:1.10-2.60)是COVID-19严重程度的强独立预测因子。在考虑从症状发作到首次就诊和从首次就诊到确诊的时长时,年龄(HR:1.03;95%CI:1.01-1.04)、合并症状况(HR:1.77;95%CI:1.18-2.68)、从症状发作到首次就诊的时长(HR:1.56;95%CI:1.07-2.26)与COVID-19严重程度显著相关(表3)。
表4单变量对数秩分析和多变量Cox比例风险回归分析
***=p<0.001,**=p<0.01,*=p<0.05,#=p<0.1
通过条件推理树进一步分析了多变量COX回归中预后结果与显著因素之间的关系(P<0.1),确定了风险阈值和区分总体生存率的关系。考虑年龄、慢性合并症状况和从症状开始到确诊的时长的CTREE模型表明,年龄超过61岁的既往慢性病患者更可能达到严重程度。对于没有慢性合并症的患者,当症状发作后>5天得到诊断并且年龄超过51岁时,他们也可能有相似的风险达到严重程度(图5a)。
另一个考虑年龄、慢性合并症状况、从症状发作到首次就诊的时长以及从首次就诊到确诊的时长的CTREE模型显示,无慢性合并症、首次就诊后>3天确诊、年龄超过55岁的患者预后最差。在症状发作后>4天就诊的慢性合并症患者排在第二位(图5b)。两个CTREE预后模型均显示,诊断相关的时效时长在疾病进展中起着重要作用,尤其是年龄较大和合并症较多的个体更易发生危险。
此外,通过比较症状发作后4天内就诊患者与其他患者的预后特点及入院初检结果,发现在4天以上就诊的患者中ARDS的发生率较高。同一组中以男性、高龄、干咳、咯痰、气促、COPD为特征的患者较多(P<0.05)(表5)。
表5症状发作后4天内就诊患者与其他患者的预后特点及入院初检结果比较
数据为平均值±标准差,或带范围的中位数,n(%),其中n是患者样本数,%是可用数据的比例。ARDS=急性呼吸窘迫综合征。DIC=弥散性血管内凝血。COPD=慢性阻塞性肺疾病。
本发明是首次深入探讨中国全国范围COVID-19患者的诊断时效对预后及临床特征影响的研究。在综合危险度评估和预后生存模型中,连同诊断时效相关的时长,还考虑了COVID-19患者的院前因素,例如合并症、年龄、性别、吸烟状况等。本发明表明,诊断时效在COVID-19预后中起着至关重要的作用,尤其是老年患者和慢性合并症患者,慢性阻塞性肺病患者更有可能拖延首次就诊。根据本发明,将症状发作和确诊之间的总时间减少到5天以内是有好处的。慢性合并症患者建议在症状发作后4天内就诊。55岁以上的患者应在就诊后3天内确诊。因此,老年患者和慢性合并症患者对诊断时效更加敏感。值得注意的是,在症状发作到首次就诊时长较长的组中,COPD患者明显较多,而COPD患者常出现干咳、咯痰和气促等症状。本发明还在延迟就诊组中发现了更严重、更差的预后或ARDS病例。在全国经实验室确诊的COVID-19病例中,从症状发作到确诊时长较长的患者预后较差,尤其是延迟就诊的患者。诊断时效显示老年患者更为敏感,延迟确诊(如症状发作后5天以上)可能恶化其预后。此外,对于55岁以上的老年患者,应在3天内做出更快的诊断。慢性合并症患者应在症状发作后4天内就诊。正确的分型应通过更仔细地询问病史来确定患者的危险分层,识别病情延迟的患者和更可能出现不良预后的患者,尤其是老年有合并症的患者。患有COPD或任何其他呼吸系统疾病的患者应更清楚其症状的变化,及时就医,并得到更好的指导。

Claims (20)

1.一种建立基于诊断时效的COVID-19的分诊的系统的方法,所述方法包括:
(a)收集包括COVID-19确诊者的年龄、慢性病史、症状发作日期、首次就诊日期、确诊日期、入院日期、不良结局、不良结局最早发生日期的信息;
(b)计算每个确诊者的诊断时效相关时长,单位以天数计算,包括症状发作日期至确诊日期时长、症状发作日期至首次就诊日期时长和首次就诊日期至确诊日期时长;计算入院日期至不良结局最早发生日期时长,若该时长为负数或大于31天则直接排除该病例;
(c)确定诊断时效相关时长的95%分位数,并排除数值大于95%分位数的数据异常病例;
(d)以诊断时效相关时长为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,通过Maxstat最大统计量法分析来确定诊断时效相关时长转化为二分类变量的最佳截断值,并将原为连续型变量的诊断时效相关时长变量直接替换为二分类变量;
(e)以包括二分类转化后的诊断时效相关时长、年龄、性别、吸烟史、慢性病史为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,进行单变量对数秩检验,分别得到所述自变量的对数秩检验p值;
(f)以包括二分类转化后的诊断时效相关时长、对数秩检验p值低于设定阈值的变量、年龄、性别、吸烟史、慢性病史共同作为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,进行多变量Cox比例风险回归生存分析,得到各自变量的Cox回归p值;
(g)以包括二分类转化后的诊断时效相关时长和Cox回归p值低于设定阈值的变量为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,进行条件推理树分析,得到决策树模型;和
(h)根据得到的决策树模型建立用于COVID-19的分诊系统;
其中对于步骤(f)中的多变量Cox比例风险回归生存分析,使用Surv()函数进一步构建多变量的生存函数,data参数用于调用包含生存资料和待分割的连续变量的数据框结构数据集,time参数调用生存时间指标,设定为入院至不良结局发生所需时间,event参数调用生存结局指标,设定为不良结局是否发生的状态,事件值设定为0或1;所有自变量进入模型;使用coxph()函数纳入上述Surv()函数,进行多变量Cox比例风险回归生存分析,获得输出值Pr(>|z|),即得到各自变量的Cox回归p值。
2.根据权利要求1所述的方法,其中对于步骤(f)中的多变量Cox比例风险回归生存分析,将singular.ok参数值设置为TRUE,model参数值设置为FALSE,x参数值设置为FALSE,y参数值设置为TRUE,method参数值设置为ties,而ties在"efron"、"breslow"、"exact"三个取值中,设定为"efron",使用Efron近似作为默认值。
3.根据权利要求1或2所述的方法,其中所述不良结局包括ICU、重症肺炎、有创通气、死亡中的一种或多种。
4.根据权利要求1或2所述的方法,其中所述对数秩检验p值的设置阈值和所述Cox回归p值的设置阈值都为0.05至0.1。
5.根据权利要求1或2所述的方法,其中所述异常病例为缺失年龄、慢性病史、症状发作日期、首次就诊日期、确诊日期、入院日期、不良结局、不良结局最早发生日期中的一个或多个信息的病例。
6.一种基于诊断时效的COVID-19的分诊的计算机系统,其特征在于,包括:
数据接收模块,用于接收包括就诊者的年龄、慢性病史、症状发作日期和首次就诊日期的信息;
数据处理模块,用于将所接收的信息与预设的优先就诊条件进行比对,所述优先就诊包括优先开立医嘱、优先采样、优先送样和优先检测中的一个或多个;以及
输出模块,用于突出显示符合所述预设的优先就诊条件的就诊者,提示优先就诊;
其中,所述预设的优先就诊条件根据权利要求1至5的任一项的方法确定,并且选自以下条件中的一个或多个:
(a)患有慢性病并且年龄大于61岁,
(b)患有慢性病并且症状发作日至首次就诊日大于4天,以及
(c)无慢性病但年龄大于51岁。
7.根据权利要求6所述的分诊的计算机系统,其特征在于,所述输出模块被进一步配置成按以下规则设定优先级:
(1)将患有慢性病并且年龄大于61岁的就诊者设为第一优先级;
(2)将患有慢性病并且症状发作日至首次就诊日大于4天的就诊者设为第二优先级;
(3)将无慢性病但年龄大于55岁的就诊者设为第三优先级;并且
(4)将无慢性病但年龄大于51岁的就诊者设为第四优先级。
8.根据权利要求6所述的分诊的计算机系统,其特征在于,所述输出模块被进一步配置成:当就诊者无慢性病但年龄大于51岁时,提示建议在从症状发作日起不超过5天内提供COVID-19核酸检验诊断结果;或者当就诊者无慢性病但年龄大于55岁时,提示建议在从首次就诊当日起不超过3天内提供COVID-19核酸检验诊断结果。
9.根据权利要求6所述的分诊的计算机系统,其特征在于,所述症状包括干咳、咽痛、眼结膜充血、鼻塞、头痛、咯痰、劳累、咯血、气促、恶心/呕吐、腹泻、关节肌肉酸痛、寒战、发热中的一种或多种。
10.一种基于诊断时效的COVID-19的分诊方法,其包括:
(S1)接收包括就诊者的年龄、慢性病史、症状发作日期和首次就诊日期的信息;
(S2)将所接收的信息与预设的优先就诊条件进行比对,所述优先就诊包括优先开立医嘱、优先采样、优先送样和优先检测中的一个或多个;
(S3)突出显示符合所述预设的优先就诊条件的就诊者,提示优先就诊;
其中,所述预设的优先就诊条件根据权利要求1至6的任一项的方法确定,并且选自以下条件中的一个或多个:
(a)患有慢性病并且年龄大于61岁,
(b)患有慢性病并且症状发作日至首次就诊日大于4天,以及
(c)无慢性病但年龄大于51岁。
11.一种建立基于诊断时效的COVID-19的分诊的系统的方法,所述方法包括:
(a)收集包括COVID-19确诊者的年龄、慢性病史、症状发作日期、首次就诊日期、确诊日期、入院日期、不良结局、不良结局最早发生日期的信息;
(b)计算每个确诊者的诊断时效相关时长,单位以天数计算,包括症状发作日期至确诊日期时长、症状发作日期至首次就诊日期时长和首次就诊日期至确诊日期时长;计算入院日期至不良结局最早发生日期时长,若该时长为负数或大于31天则直接排除该病例;
(c)确定诊断时效相关时长的95%分位数,并排除数值大于95%分位数的数据异常病例;
(d)以诊断时效相关时长为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,通过Maxstat最大统计量法分析来确定诊断时效相关时长转化为二分类变量的最佳截断值,并将原为连续型变量的诊断时效相关时长变量直接替换为二分类变量;
(e)以包括二分类转化后的诊断时效相关时长、年龄、性别、吸烟史、慢性病史为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,进行单变量对数秩检验,分别得到所述自变量的对数秩检验p值;
(f)以包括二分类转化后的诊断时效相关时长、对数秩检验p值低于设定阈值的变量、年龄、性别、吸烟史、慢性病史共同作为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,进行多变量Cox比例风险回归生存分析,得到各自变量的Cox回归p值;
(g)以包括二分类转化后的诊断时效相关时长和Cox回归p值低于设定阈值的变量为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,进行条件推理树分析,得到决策树模型;和
(h)根据得到的决策树模型建立用于COVID-19的分诊系统;
其中对于步骤(g)中的条件推理树分析,使用Surv()函数进一步构建多变量的生存函数,data参数用于调用包含生存资料和待分割的连续变量的数据框结构数据集,time参数调用生存时间指标,设定为入院至不良结局发生所需时间,event参数调用生存结局指标,设定为不良结局是否发生的状态,事件值设定为0或1;符合条件的自变量放入模型;使用ctree()函数纳入上述Surv()函数,在条件推理框架中对连续的、截尾的、有序的、标称的变量和多元的响应变量进行递归划分,建立决策树模型。
12.根据权利要求11所述的方法,其中对于步骤(g)中的条件推理树分析,将subset参数值设置为NULL,weights参数值设置为NULL,xtrafo参数值设置为ptrafo,ytrafo参数值设置为ptrafo,scores参数值设置为NULL。
13.根据权利要求11或12所述的方法,其中所述不良结局包括ICU、重症肺炎、有创通气、死亡中的一种或多种。
14.根据权利要求11或12所述的方法,其中所述对数秩检验p值的设置阈值和所述Cox回归p值的设置阈值都为0.05至0.1。
15.根据权利要求11或12所述的方法,其中所述异常病例为缺失年龄、慢性病史、症状发作日期、首次就诊日期、确诊日期、入院日期、不良结局、不良结局最早发生日期中的一个或多个信息的病例。
16.一种基于诊断时效的COVID-19的分诊的计算机系统,其特征在于,包括:
数据接收模块,用于接收包括就诊者的年龄、慢性病史、症状发作日期和首次就诊日期的信息;
数据处理模块,用于将所接收的信息与预设的优先就诊条件进行比对,所述优先就诊包括优先开立医嘱、优先采样、优先送样和优先检测中的一个或多个;以及
输出模块,用于突出显示符合所述预设的优先就诊条件的就诊者,提示优先就诊;
其中,所述预设的优先就诊条件根据权利要求11至15的任一项的方法确定,并且选自以下条件中的一个或多个:
(a)患有慢性病并且年龄大于61岁,
(b)患有慢性病并且症状发作日至首次就诊日大于4天,以及
(c)无慢性病但年龄大于51岁。
17.根据权利要求16所述的分诊的计算机系统,其特征在于,所述输出模块被进一步配置成按以下规则设定优先级:
(1)将患有慢性病并且年龄大于61岁的就诊者设为第一优先级;
(2)将患有慢性病并且症状发作日至首次就诊日大于4天的就诊者设为第二优先级;
(3)将无慢性病但年龄大于55岁的就诊者设为第三优先级;并且
(4)将无慢性病但年龄大于51岁的就诊者设为第四优先级。
18.根据权利要求16所述的分诊的计算机系统,其特征在于,所述输出模块被进一步配置成:当就诊者无慢性病但年龄大于51岁时,提示建议在从症状发作日起不超过5天内提供COVID-19核酸检验诊断结果;或者当就诊者无慢性病但年龄大于55岁时,提示建议在从首次就诊当日起不超过3天内提供COVID-19核酸检验诊断结果。
19.根据权利要求16所述的分诊的计算机系统,其特征在于,所述症状包括干咳、咽痛、眼结膜充血、鼻塞、头痛、咯痰、劳累、咯血、气促、恶心/呕吐、腹泻、关节肌肉酸痛、寒战、发热中的一种或多种。
20.一种基于诊断时效的COVID-19的分诊方法,其包括:
(S1)接收包括就诊者的年龄、慢性病史、症状发作日期和首次就诊日期的信息;
(S2)将所接收的信息与预设的优先就诊条件进行比对,所述优先就诊包括优先开立医嘱、优先采样、优先送样和优先检测中的一个或多个;
(S3)突出显示符合所述预设的优先就诊条件的就诊者,提示优先就诊;
其中,所述预设的优先就诊条件根据权利要求11至15的任一项的方法确定,并且选自以下条件中的一个或多个:
(a)患有慢性病并且年龄大于61岁,
(b)患有慢性病并且症状发作日至首次就诊日大于4天,以及
(c)无慢性病但年龄大于51岁。
CN202310756366.0A 2021-04-21 2021-04-21 建立基于诊断时效的covid-19分诊系统的方法、该系统及分诊方法 Pending CN116959653A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310756366.0A CN116959653A (zh) 2021-04-21 2021-04-21 建立基于诊断时效的covid-19分诊系统的方法、该系统及分诊方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110432543.0A CN113488123B (zh) 2021-04-21 2021-04-21 建立基于诊断时效的covid-19分诊系统的方法、该系统及分诊方法
CN202310756366.0A CN116959653A (zh) 2021-04-21 2021-04-21 建立基于诊断时效的covid-19分诊系统的方法、该系统及分诊方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN202110432543.0A Division CN113488123B (zh) 2021-04-21 2021-04-21 建立基于诊断时效的covid-19分诊系统的方法、该系统及分诊方法

Publications (1)

Publication Number Publication Date
CN116959653A true CN116959653A (zh) 2023-10-27

Family

ID=77933432

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202310756366.0A Pending CN116959653A (zh) 2021-04-21 2021-04-21 建立基于诊断时效的covid-19分诊系统的方法、该系统及分诊方法
CN202110432543.0A Active CN113488123B (zh) 2021-04-21 2021-04-21 建立基于诊断时效的covid-19分诊系统的方法、该系统及分诊方法
CN202310756401.9A Pending CN116959654A (zh) 2021-04-21 2021-04-21 建立基于诊断时效的covid-19分诊系统的方法、该系统及分诊方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN202110432543.0A Active CN113488123B (zh) 2021-04-21 2021-04-21 建立基于诊断时效的covid-19分诊系统的方法、该系统及分诊方法
CN202310756401.9A Pending CN116959654A (zh) 2021-04-21 2021-04-21 建立基于诊断时效的covid-19分诊系统的方法、该系统及分诊方法

Country Status (1)

Country Link
CN (3) CN116959653A (zh)

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN87216747U (zh) * 1987-12-19 1988-08-03 李碧新 输液报警器
WO2013163134A2 (en) * 2012-04-23 2013-10-31 The Trustees Of Columbia University In The City Of New York Biomolecular events in cancer revealed by attractor metagenes
EP4310502A3 (en) * 2016-03-31 2024-03-27 Abbott Laboratories Decision tree based systems and methods for estimating the risk of acute coronary syndrome
WO2019089740A1 (en) * 2017-11-03 2019-05-09 Dana-Farber Cancer Institute, Inc. Biomarkers of clinical response and benefit to immune checkpoint inhibitor therapy
CN108376564A (zh) * 2018-02-06 2018-08-07 天津艾登科技有限公司 基于随机森林算法的疾病诊断并发症识别方法及系统
CN109448846B (zh) * 2018-09-07 2021-04-30 北京大学 一种基于医保大数据测算罕见病发病率的分析方法
CN111180055B (zh) * 2019-12-31 2023-06-30 重庆亚德科技股份有限公司 一种医院监管系统及方法
CN111157742A (zh) * 2019-12-31 2020-05-15 杭州市妇产科医院 孕妇母血清甲胎蛋白预测妊娠期肝内胆汁淤积症的风险模型建立方法
CN111489827A (zh) * 2020-04-10 2020-08-04 吉林大学 一种基于关联决策树的甲状腺疾病预测建模方法
CN111662973B (zh) * 2020-05-28 2023-08-25 广州医科大学附属第一医院(广州呼吸中心) 与慢性阻塞性肺疾病易感性辅助诊断相关的snp位点及其应用
CN111899884A (zh) * 2020-06-23 2020-11-06 北京左医科技有限公司 智能辅助问诊方法、装置和存储介质
CN112017789B (zh) * 2020-09-09 2023-08-01 平安科技(深圳)有限公司 分诊数据处理方法、装置、设备及介质
CN112133427A (zh) * 2020-09-24 2020-12-25 江苏天瑞精准医疗科技有限公司 一种基于人工智能的胃癌辅助诊断系统
CN114220554A (zh) * 2020-11-11 2022-03-22 医渡云(北京)技术有限公司 传染病的基本再生数的估算方法及装置、介质和设备
CN112530578A (zh) * 2020-12-02 2021-03-19 中国科学院大学宁波华美医院 基于多模态信息融合的病毒性肺炎智能诊断系统
CN112530535B (zh) * 2020-12-15 2023-04-21 山东浪潮智慧医疗科技有限公司 基于健康医疗大数据建立疾病专病队列的方法及装置

Also Published As

Publication number Publication date
CN116959654A (zh) 2023-10-27
CN113488123B (zh) 2023-07-18
CN113488123A (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
Al‐Ostad et al. Incidence and risk factors of sepsis mortality in labor, delivery and after birth: Population‐based study in the USA
De Hond et al. Machine learning for developing a prediction model of hospital admission of emergency department patients: Hype or hope?
Li et al. Improving preeclampsia risk prediction by modeling pregnancy trajectories from routinely collected electronic medical record data
Fika et al. A novel mortality prediction model for the current population in an adult intensive care unit
Wang et al. A time-series feature-based recursive classification model to optimize treatment strategies for improving outcomes and resource allocations of COVID-19 patients
CN115101199A (zh) 用于重症老年患者的可解释公平早期死亡风险评估模型、装置、及其建立方法
Dong et al. Development and validation of risk prediction model for in-hospital mortality among patients hospitalized with acute exacerbation chronic obstructive pulmonary disease between 2015 and 2019
Erdogan et al. How to score acute pancreatitis in the emergency setting: five systems against ED-SAS
Darwiche et al. Machine learning methods for septic shock prediction
Arozullah et al. A rapid staging system for predicting mortality from HIV-associated community-acquired pneumonia
CN117198532A (zh) 一种基于机器学习的icu患者脓毒症风险预测方法及系统
CN113488123B (zh) 建立基于诊断时效的covid-19分诊系统的方法、该系统及分诊方法
Petersen et al. Practical risk scoring system for predicting severity of COVID-19 disease
Van den Wyngaert et al. An exploration of under-registration of chronic kidney disease stages 3–5 in Belgian general practices using logistic regression
Li et al. Improving pre-eclampsia risk prediction by modeling individualized pregnancy trajectories derived from routinely collected electronic medical record data
Montgomery-Csobán et al. Machine learning-enabled maternal risk assessment for women with pre-eclampsia (the PIERS-ML model): a modelling study
CN117497182B (zh) 基于机器学习及体征时序的创伤性脑损伤结局预测系统
Wang et al. RAPID-ED: A predictive model for risk assessment of patient's early in-hospital deterioration from emergency department
Meyer Developing and Applying a Design Framework to Prepare Electronic Health Record Data for Time-Series Modeling
Ha et al. Does the probability of survival calculated by the Trauma and Injury Severity Score method accurately reflect the severity of neurotrauma patients admitted to regional trauma centers in Korea?
Goyes et al. Comparison of the Performance of the CURB-65, A-DROP, and NEWS Scores for the Prediction of Clinical Outcomes in Pneumonia
Liu et al. Early prediction of impending septic shock in children using age-adjusted Sepsis-3 criteria
Smith et al. Online critical-state detection of sepsis among ICU patients using Jensen-Shannon divergence
Zhao et al. Random survival forests for predicting the interactions of multiple physiological risk factors on all-cause mortality
Corfield Early warning scores in pre-hospital and emergency care

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination