CN113488170B - 急性前葡萄膜炎复发风险预测模型构建方法及相关设备 - Google Patents
急性前葡萄膜炎复发风险预测模型构建方法及相关设备 Download PDFInfo
- Publication number
- CN113488170B CN113488170B CN202110750429.2A CN202110750429A CN113488170B CN 113488170 B CN113488170 B CN 113488170B CN 202110750429 A CN202110750429 A CN 202110750429A CN 113488170 B CN113488170 B CN 113488170B
- Authority
- CN
- China
- Prior art keywords
- uveitis
- acute
- patient
- recurrence risk
- recurrence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/20—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开一种急性前葡萄膜炎复发风险预测模型的构建方法及存储介质,急性前葡萄膜炎复发风险预测设备及存储介质;通过包括自变量集合中的各项指标:是否患有强直性脊柱炎、HLA‑B27、MO、HDL和LDL的急性前葡萄膜炎复发风险预测模型,可以实现对急性前葡萄膜炎患者复发风险高低的有效判断。
Description
技术领域
本发明涉及医疗信息预测技术领域,更具体地,涉及一种急性前葡萄膜炎复发风险预测模型构建方法和存储介质、急性前葡萄膜炎复发风险预测设备、装置和存储介质。
背景技术
葡萄膜炎(uveitis)又称色素膜炎,是虹膜、睫状体及脉络膜组织炎症的总称。葡萄膜炎是一种异质性疾病,发病率估计为17-52人/10万人/年,患病率为38-714人/10万人/年。按发病部位可分为前葡萄膜炎、后葡萄膜炎及中间葡萄膜炎,中国三级中心流行病学调查显示,其中前葡萄膜炎(45.6%)最为常见。急性前葡萄膜炎(acute anterior uveitis,AAU)是前葡萄膜炎的一种具体表现。
AAU的主要症状是疼痛、发红和畏光,这些症状会在几天内迅速发展。严重者还可能导致后粘连、继发性青光眼、复杂性白内障等并发症。AAU的多次发作显著增加了眼部发病风险。AAU患者的复发风险不同,有些患者容易复发,但是有些患者可以长时间保持不活动状态。目前来说,医生无法准确告知患者随访时间并告知患者是否有复发风险,故而会使得患者担心AAU会不会复发,从而造成严重的心理负担。
因此研发一种可以进行急性前葡萄膜炎复发风险预测的设备,用于筛选出复发风险高的患者,从而指导后续的干预和治疗方案,是目前亟待解决的技术问题。
发明内容
鉴于上述问题,本发明提出了一种急性前葡萄膜炎复发风险预测模型构建方法、急性前葡萄膜炎复发风险预测设备、装置及存储介质。
第一方面,本发明实施例提供了一种急性前葡萄膜炎复发风险预测模型的构建方法,包括:
获取目标样本集合,其中,所述目标样本集合中的每个样本包括自变量集合和标签,所述标签用于描述样本对应的急性前葡萄膜炎患者是否为复发患者,自变量集合包括样本对应的急性前葡萄膜炎患者的各项指标;和
基于所述目标样本集合,利用机器学算法进行模型训练,获得急性前葡萄膜炎复发风险预测模型;
其中,所述葡萄膜炎复发风险预测模型用于预测急性前葡萄膜炎患者急性前葡萄膜炎复发风险的高低;各项指标包括:是否患有强直性脊柱炎、HLA-B27、MO、HDL和LDL。
可选地,所述获取目标样本集合,包括:
获取样本的各项临床指标;
根据每个样本对应的急性前葡萄膜炎患者的急性前葡萄膜炎发作次数,确定所述每个样本对应的标签;
利用所述每个样本对应的各项临床指标和标签,从临床指标中筛选与急性前葡萄膜炎复发显著相关的候选指标;和
基于每个样本的候选指标,组成每个样本对应的自变量集合。
可选地,所述利用所述每个样本对应的各项临床指标和标签,从临床指标中筛选与急性前葡萄膜炎复发显著相关的候选指标,具体包括:
利用所述每个样本对应的标签,将每个样本划分为复发样本组和非复发样本组;
在第一显著性水平上,确定每项临床指标是否在复发样本组和非复发样本组之间具有显著性差异,将具有显著性差异的临床指标作为第一候选指标;
在第二显著性水平上,确定所述复发样本组和所述非复发样本组中每项临床指标是否与无复发生存时间显著相关,将与无复发生存时间显著相关的临床指标作为第二候选指标;和
从所述第一获选指标和所述第二候选指标中获取候选指标,所述候选指标同时为第一候选指标和第二候选指标。
可选地,所述基于所述目标样本集合,利用机器学算法进行模型训练,获得急性前葡萄膜炎复发风险预测模型,包括:
将所述目标样本集合按照预设比例随机划分为训练样本子集合和测试样本子集合;
基于所述训练样本子集合,利用逻辑回归算法进行模型训练,获得各项指标对应的权重,基于各项指标对应的权重获得急性前葡萄膜炎复发风险预测模型;和
利用所述训练样本子集合和所述测试样本子集合对所述急性前葡萄膜炎复发风险预测模型进行性能评估,若性能评估结果不满足要求,则重新进行模型训练。
所述根据每个样本对应的急性前葡萄膜炎患者的疾病发作次数,确定所述每个样本对应的标签,具体包括:
若所述每个样本对应的急性前葡萄膜炎患者为一次疾病发作,则所述每个样本对应的标签表征样本对应的急性前葡萄膜炎患者为非复发患者;和
若所述每个样本对应的急性前葡萄膜炎患者为两次或两次以上疾病发作,则所述每个样本对应的标签表征样本对应的急性前葡萄膜炎患者为复发患者。
第二方面,本发明实施例还提供了急性前葡萄膜炎复发风险预测设备,所述设备包括:存储器和处理器;所述存储器,用于存储程序指令;所述处理器,用于调用所述程序指令,当所述程序指令被执行时,用于执行以下操作:
获取待测急性前葡萄膜炎患者的自变量集合;
将待测急性前葡萄膜炎患者的自变量集合输入到以上任一项构建方法获得的急性前葡萄膜炎复发风险预测模型,获得待测急性前葡萄膜炎患者的复发风险评分;和
根据所述复发风险评分判断待测急性前葡萄膜炎患者复发风险的高低。
第三方面,本发明实施例还提供一种急性前葡萄膜炎复发风险预测设备,所述设备包括:存储器和处理器;所述存储器,用于存储程序指令;所述处理器,用于调用所述程序指令,当所述程序指令被执行时,用于执行以下操作:
获取待测急性前葡萄膜炎患者的自变量集合;
将待测急性前葡萄膜炎患者的自变量集合输入到预设的急性前葡萄膜炎复发风险预测模型,获得待测急性前葡萄膜炎患者的复发风险评分;和
根据所述复发风险评分判断待测急性前葡萄膜炎患者复发风险的高低;
其中,所述自变量集合包括待测急性前葡萄膜炎患者的各项指标,各项指标包括:是否患有强直性脊柱炎、HLA-B27、MO、HDL和LDL。
可选地,所述预设的急性前葡萄膜炎复发风险预测模型为:Y=AS*0.09230+HLA-B27*0.19863+MO*(-0.59456)+HDL*0.36348+LDL*(-0.12934)+0.3287;
其中,Y代表复发风险评分,*代表乘号,自变量集合中的各项指标的具体取值如下:
待测急性前葡萄膜炎患者患有强直性脊柱炎时,变量AS=1,待测急性前葡萄膜炎患者不患有强直性脊柱炎时,变量AS=0;待测急性前葡萄膜炎患者为HLA-B27阳性时,变量HLA-B27=1,待测急性前葡萄膜炎患者为HLA-B27阴性时,变量HLA-B27=0;MO为待测急性前葡萄膜炎患者单核细胞计数的具体数值;HDL为待测急性前葡萄膜炎患者高密度脂蛋白的具体数值;LDL为待测急性前葡萄膜炎患者低密度脂蛋白的具体数值。
可选地,所述复发风险评分阈值是基于目标样本集合中的样本的复发风险评分确定的,样本的复发风险评分是基于所述急性前葡萄膜炎复发风险预测模型获得的;所述目标样本集合用于模型训练获得所述急性前葡萄膜炎复发风险预测模型。
可选地,所述处理器具体用于:将所述复发风险评分与复发风险评分阈值进行比较,若所述复发风险评分大于所述复发风险评分阈值,则判断所述待测急性前葡萄膜炎患者复发风险高;若所述复发风险评分小于等于所述复发风险评分阈值,则判断所述待测急性前葡萄膜炎患者复发风险低。
第四方面,本发明实施例还提供一种急性前葡萄膜炎复发风险预测装置,包括:
自变量集合获取单元,用于获取待测急性前葡萄膜炎患者的自变量集合;
复发风险评分获取单元,用于将待测急性前葡萄膜炎患者的自变量集合输入到预设的急性前葡萄膜炎复发风险预测模型或者根据以上任一项构建方法获得的急性前葡萄膜炎复发风险预测模型,获得待测急性前葡萄膜炎患者的复发风险评分;和
复发风险判断单元,用于根据所述复发风险评分判断待测急性前葡萄膜炎患者复发风险的高低;
其中,所述自变量集合包括待测急性前葡萄膜炎患者的各项指标,各项指标包括:是否患有强直性脊柱炎、HLA-B27、MO、HDL和LDL。
第五方面,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以上所述的构建方法;或者所述计算机程序被处理器执行时实现以上任一项所述的急性前葡萄膜炎复发风险预测设备中的处理器执行的步骤。
本发明实施例提供的技术方案,通过包括自变量集合中的各项指标(是否患有强直性脊柱炎、HLA-B27、MO、HDL和LDL)的急性前葡萄膜炎复发风险预测模型,可以实现对急性前葡萄膜炎患者复发风险高低的有效判断,判断结果可以指导急性前葡萄膜炎患者后续的干预和治疗方案调整,例如对于复发风险较高的急性前葡萄膜炎患者,可以鼓励患者严格遵循随访计划,医生也可适当延长复发风险高的患者激素类药物或免疫抑制剂的使用周期。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他的附图。
图1示出了根据本发明一个实施例中的病症风险预测模型的构建方法的流程图。
图2示出了根据本发明一个实施例中的步骤101获取目标样本集合的流程图。
图3示出了根据本发明一个实施例中的步骤203利用所述每个样本对应的各项临床指标和标签,从临床指标中筛选与急性前葡萄膜炎复发显著相关的候选指标的方法流程图。
图4示出了根据本发明一个实施例中的步骤102基于所述目标样本集合,利用机器学算法进行模型训练,获得急性前葡萄膜炎复发风险预测模型的方法流程图。
图5示出了根据本发明一个实施例中的一种计算机设备的内部结构图。
图6示出了根据本发明一个实施例中的急性前葡萄膜炎复发风险预测方法的流程示意图。
图7示出了根据本发明一个急性前葡萄膜炎复发风险预测装置的结构框图。
图8示出了根据本发明实验例1中233例患者AAU数据中临床指标的不同构成和与无复发生存时间显著相关性分析结果图。
图9示出了根据本发明实验例1中的急性前葡萄膜炎复发风险预测模型在训练队列测试的性能评估结果图。
图10示出了根据本发明实验例1中的急性前葡萄膜炎复发风险预测模型在测试队列的性能评估结果图。
图11示出了根据本发明对比例1中的急性前葡萄膜炎复发风险预测模型、HLA-B27、强直性脊柱炎在整体队列的性能评估和比较结果图。
图12示出了根据本发明实验例1中的急性前葡萄膜炎复发风险预测模型在整体队列上的绘制的ROC曲线。
图13示出了根据本发明对比例1中的急性前葡萄膜炎复发风险预测模型在整体队列上的绘制的ROC曲线。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的一种急性前葡萄膜炎复发风险预测模型的构建方法的流程示意图,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。在本实施例中,该方法包括以下步骤。
步骤101,获取目标样本集合,其中,所述目标样本集合中的每个样本包括自变量集合和标签,所述标签用于描述样本对应的急性前葡萄膜炎患者是否为复发患者,自变量集合包括样本对应的急性前葡萄膜炎患者的各项指标;其中各项指标包括:是否患有强直性脊柱炎、HLA-B27、MO、HDL和LDL。
在本发明实施例中,目标样本集合中的每个样本对应一个急性前葡萄膜炎患者,每个样本包括自变量集合和标签,其中的自变量集合包括该急性前葡萄膜炎患者对应的各项指标,具体来说本实施例中的各项指标包括:是否患有强直性脊柱炎、HLA-B27、MO、HDL和LDL。其中的标签用于指示样本对应的急性前葡萄膜炎患者是否为复发患者。
本发明实施例中的指标HLA-B27指的是急性前葡萄膜炎患者的HLA-B27抗原检测结果,包括HLA-B27阳性或HLA-B27阴。HLA-B27是人体白细胞抗原,属于HLA-B位点之一。
本发明实施例中的指标MO指的是急性前葡萄膜炎患者的单核细胞的检查结果,具体来说是单核细胞绝对值,在化验结果单上一般以MO#或MONO#表示,单核细胞绝对值的正常范围为(0.12~0.8)×10^9/L。单核细胞(monocytes)是血液中最大的血细胞,也是体积最大的白细胞,是机体防御系统的一个重要组成部分。
本发明实施例中的指标HDL指的是急性前葡萄膜炎患者的高密度脂蛋白的检查结果,在化验结果单上一般以HDL-C表示,HDL的正常范围为(0.7~2.0)mmol/L。
本发明实施例中的指标LDL指的是急性前葡萄膜炎患者的低密度脂蛋白的检查结果,在化验结果单上一般以LDL-C表示,LDL的正常范围为(0~3.4)mmol/L。
步骤102,基于所述目标样本集合,利用机器学算法进行模型训练,获得急性前葡萄膜炎复发风险预测模型;其中所述葡萄膜炎复发风险预测模型用于预测急性前葡萄膜炎患者急性前葡萄膜炎复发风险的高低。
本发明实施例中,利用机器学习算法进行模型训练,得到的急性前葡萄膜炎复发风险预测模型为分类模型。在一个实施例中,其中的机器学习算法为有监督的机器学习算法。在一个实施例中,机器学习算法可以包括支持向量机算法、朴素贝叶斯算法、决策树算法、随机森林算法、神经网络算法和回归算法中的至少一种。
本发明实施例中的构建方法利用包括指标是否患有强直性脊柱炎、HLA-B27、MO、HDL和LDL的目标样本集合和机器学习算法进行模型训练得到急性前葡萄膜炎复发风险预测模型;最终得到的模型可以实现对急性前葡萄膜炎患者复发风险高低的有效判断,从而可以用于高复发患者的筛选,指导临床干预和治疗方案;同时可以避免复发风险不确定给患者带来的心理负担。
在一个实施例中,如图2所示,其中步骤101获取目标样本集合,具体包括以下步骤:
步骤201,获取样本的各项临床指标。
在本发明实施例中,获取样本的各项临床指标具体来说是获取样本对应的急性前葡萄膜炎患者的临床特征和实验室检查指标。
步骤202,根据每个样本对应的急性前葡萄膜炎患者的急性前葡萄膜炎发作次数,确定所述每个样本对应的标签。
在本发明实施例中,样本的标签是根据样本对应的患者在一个观察期间内急性前葡萄膜炎发作次数来确定的,一次疾病发作的患者视为非复发患者,二次及上疾病发作的患者视为复发患者。
步骤203,利用所述每个样本对应的各项临床指标和标签,从临床指标中筛选与急性前葡萄膜炎复发显著相关的候选指标。
步骤204,基于每个样本的候选指标,组成每个样本对应的自变量集合。
在本发明实施例中,从所有临床指标中筛选出与急性前葡萄膜炎复发显著相关的候选指标,每个样本对应的候选指标构成样本对应的自变量集合,用于后续步骤102中的急性前葡萄膜炎复发风险预测模型的训练。由于候选指标与急性葡萄膜炎复发显著相关,因此使得训练出的模型对急性前葡萄膜炎患者复发风险预测结果准确性更高。
在一个具体实施例中,如图3所示,步骤203,利用所述每个样本对应的各项临床指标和标签,从临床指标中筛选与急性前葡萄膜炎复发显著相关的候选指标,具体包括以下步骤:
步骤301,利用所述每个样本对应的标签,将每个样本划分为复发样本组和非复发样本组;
步骤302,在第一显著性水平上,确定每项临床指标是否在复发样本组和非复发样本组之间具有显著性差异,将具有显著性差异的临床指标作为第一候选指标;
步骤303,在第二显著性水平上,确定所述复发样本组和所述非复发样本组中每项临床指标是否与无复发生存时间显著相关,将与无复发生存时间显著相关的临床指标作为第二候选指标;
步骤304,从所述第一获选指标和所述第二候选指标中获取候选指标,所述候选指标同时为第一候选指标和第二候选指标。
在本发明实施例中,显著性差异是统计学上的专有名词,它是从统计学的角度对数据差异性的评价。其中的第一显著性水平和第二显著性水平可以相同也可以不同。通常情况下,显著性水平为0.05水平或0.01水平。无复发生存时间(recurrence-freesurvival,RFS),也称无复发生存期,通常的定义是是指初次手术至最早出现复发证据的时间;在本发明实施中,对于复发样本组的患者来说从患者就医到患者首次复发之间的时间作为该患者的无复发生存时间,对于非复发样本组的患者则记录最后一次随访时间作为该患者的无复发生存时间。
在本发明实施中,步骤302针对每项临床指标在复发样本组和非复发样本组之间进行显著性差异分析,具体来说是采用显著性检验进行分析。在一个具体实施例中,对于数据呈不同分布方式的临床指标采用不同的检验方法进行检验:若临床指标数据呈正态分布时(例如指标MO、HDL和LDL),采用学生t检验(Student’s t-test);若临床指标数据呈非正态分布时(例如指标年龄),采用威尔科克森符号秩检验(Wilcoxon signed-rank test);若临床指标为分类数据时(例如指标是否患有强直性脊柱炎和HLA-B27),采用卡方检验。检验的具体过程为常规技术手段,在此不做赘述。
在本发明实施中,步骤303针对每项临床指标在复发样本组中确定每项临床指标是否与无复发生存时间显著相关。在一个具体实施例中,针对每项临床指标,采用生存分析方法确定每项临床指标是否与无复发生存时间显著相关。在一个优选的实施例中,采用单因素cox比例风险回归模型(Cox proportional hazards regression model)获得与无复发生存时间显著相关的临床指标作为第二候选指标。
在本发明实施例中,步骤304从所述第一获选指标和所述第二候选指标中获取候选指标,最终得到的候选指标同时满足第一候选指标和第二候选指标的条件。因此,本发明实施例中用于构建复发风险预测模型的候选指标是通过双重筛选条件得到的,候选指标与无复发生存时间显著性相关,同时可以判断出哪些候选指标是促进复发的指标,哪些指标是抑制复发的指标,可以指导后续临床干预手段。
在一个实施例中,如图4所示,步骤102基于所述目标样本集合,利用机器学算法进行模型训练,获得急性前葡萄膜炎复发风险预测模型,包括以下步骤:
步骤401,将所述目标样本集合按照预设比例随机划分为训练样本子集合和测试样本子集合。
在本发明实施例中,预设比例指的是训练样本子集合和测试样本子集合中的样本数量的比值;在一个具体实施例中,预设比例为1:1。在其他实施例预设比例还可以是7:3。本领域技术人员可以根据需要进行设定,在此不做赘述。
步骤402,基于所述训练样本子集合,利用逻辑回归算法进行模型训练,获得各项指标对应的权重,基于各项指标对应的权重获得急性前葡萄膜炎复发风险预测模型。
在本发明实施例中,基于训练样本子集合中的样本,利用逻辑回归算法进行模型训练,具体来说是获取到各项指标的权重,然后基于各项指标的权重得到对应的逻辑回归模型,该逻辑回归模型即为急性前葡萄膜炎复发风险预测模型。
在一个实施例中,急性前葡萄膜炎复发风险预测模型为:Y=W0+W1*AS+W2*HLA-B27+W3*MO+W4*HDL+W5*LDL;其中,Y代表复发风险评分,*代表乘号,W0、W1、W2、W3、W4和W5代表模型的参数;AS代表是否患有强直性脊柱炎,HLA-B27代表是否为HLA-B27阳性;MO代表单核细胞的检查值,HDL代表高密度脂蛋白的检查值,LDL代表低密度脂蛋白的检查值。
步骤403,利用所述训练样本子集合和所述测试样本子集合对所述急性前葡萄膜炎复发风险预测模型进行性能评估,若性能评估结果不满足要求,则重新进行模型训练。
在本发明实施例中,利用训练样本子集合和测试样本子集合对得到的模型进行性能评估,直至性能评估结构满足要求为止。具体地的性能评估方式是:基于得到的急性前葡萄膜炎复发风险预测模型,在训练样本子集合和测试样本子集合上绘制ROC曲线,如果ROC曲线中的特异度TPR、敏感度TNR、准确度ACC、AUC值分别大于各自的预设值,则确定模型性能满足要求。其中预设值根据本领域的常规经验进行设定,在此不做具体限制。例如,在一个具体的实施例中,其中的AUC值大于0.7认为模型满足要求。
在一个实施例中,在急性前葡萄膜炎复发风险预测模型不满足要求时,可以通过对目标样本集合中的样本的指标数据进行检查,对明显错误的指标数据进行处理(例如可以是剔除样本或者根据实际需要将数据进行修正)之后再进行模型训练;也可以通过增加目标样本集合中的样本数量并重新进行模型训练。
在一个实施例中,提供了一种急性前葡萄膜炎复发风险预测模型的构建装置,包括:样本集合获取单元和模型获取单元;
样本集合获取单元,获取目标样本集合,其中,所述目标样本集合中的每个样本包括自变量集合和标签,所述标签用于描述样本对应的急性前葡萄膜炎患者是否为复发患者,自变量集合包括样本对应的急性前葡萄膜炎患者的各项指标;
模型获取单元,基于所述目标样本集合,利用机器学算法进行模型训练,获得急性前葡萄膜炎复发风险预测模型;
其中,所述葡萄膜炎复发风险预测模型用于预测急性前葡萄膜炎患者急性前葡萄膜炎复发风险的高低;各项指标包括:是否患有强直性脊柱炎、HLA-B27、MO、HDL和LDL。
关于一种急性前葡萄膜炎复发风险预测模型的构建装置的具体限定可以参见上文中对于一种急性前葡萄膜炎复发风险预测模型的构建方法的限定,在此不再赘述。上述病症风险预测模型的构建装置中的各个单元可全部或部分通过软件、硬件及其组合来实现。上述各单元可以以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个单元对应的操作。
在本发明实施例中,提供了一种电子设备,该电子设备可以为计算机设备,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种急性前葡萄膜炎复发风险预测模型的构建方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,提供了一种电子设备,该电子设备具体来说是一种急性前葡萄膜炎复发风险预测模型的构建设备,所述设备包括:所述存储器,用于存储程序指令;所述处理器,用于调用所述程序指令,当所述程序指令被执行时,用于执行以下步骤:获取目标样本集合,其中,所述目标样本集合中的每个样本包括自变量集合和标签,所述标签用于描述样本对应的急性前葡萄膜炎患者是否为复发患者,自变量集合包括样本对应的急性前葡萄膜炎患者的各项指标;基于所述目标样本集合,利用机器学算法进行模型训练,获得急性前葡萄膜炎复发风险预测模型;其中,所述葡萄膜炎复发风险预测模型用于预测急性前葡萄膜炎患者急性前葡萄膜炎复发风险的高低;各项指标包括:是否患有强直性脊柱炎、HLA-B27、MO、HDL和LDL。关于一种急性前葡萄膜炎复发风险预测模型的构建设备的具体限定可以参见上文中对于一种急性前葡萄膜炎复发风险预测模型的构建方法的限定,在此不再赘述。
本实施例中的电子设备具体来说可以为一种计算机设备。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取目标样本集合,其中,所述目标样本集合中的每个样本包括自变量集合和标签,所述标签用于描述样本对应的急性前葡萄膜炎患者是否为复发患者,自变量集合包括样本对应的急性前葡萄膜炎患者的各项指标;基于所述目标样本集合,利用机器学算法进行模型训练,获得急性前葡萄膜炎复发风险预测模型;其中,所述葡萄膜炎复发风险预测模型用于预测急性前葡萄膜炎患者急性前葡萄膜炎复发风险的高低;各项指标包括:是否患有强直性脊柱炎、HLA-B27、MO、HDL和LDL。
在一个实施例中,提供了一种电子设备,该电子设备具体来说是一种急性前葡萄膜炎复发风险预测设备,存储器和处理器;所述存储器,用于存储程序指令;所述处理器,用于调用所述程序指令,当所述程序指令被执行时,用于执行急性前葡萄膜炎复发风险预测方法的步骤。
图6为本发明实施例提供的一种急性前葡萄膜炎复发风险预测方法的流程示意图,如图4所示,在本实施例中急性前葡萄膜炎复发风险预测方法包括以下步骤。
步骤601,获取待测急性前葡萄膜炎患者的自变量集合。
在本发明实施例中,具体来说自变量集合包括待测急性前葡萄膜炎患者的各项指标,各项指标具体包括:是否患有强直性脊柱炎、HLA-B27、MO、HDL和LDL。
步骤602,将待测急性前葡萄膜炎患者的自变量集合输入到急性前葡萄膜炎复发风险预测模型,获得待测急性前葡萄膜炎患者的复发风险评分。
在本发明实施例中,其中的急性前葡萄膜炎风险预测模型根据前述实施例中的构建方法获得,急性前葡萄膜炎风险预测模型是用来判断急性前葡萄膜炎患者复发风险高低的模型。
步骤603,根据所述复发风险评分判断待测急性前葡萄膜炎患者复发风险的高低。
在本发明实施例中,所述根据所述复发风险评分判断待测急性前葡萄膜炎患者复发风险的高低时,具体来说是将所述复发风险评分与复发风险评分阈值进行比较,若所述复发风险评分大于所述复发风险评分阈值,则判断所述待测急性前葡萄膜炎患者复发风险高;若所述复发风险评分小于等于所述复发风险评分阈值,则判断所述待测急性前葡萄膜炎患者复发风险低。
在一个实施例中,所述复发风险评分阈值是基于目标样本集合中的样本的复发风险评分确定的,样本的复发风险评分是基于所述急性前葡萄膜炎风险预测模型获得的;所述目标样本集合用于模型训练获得所述急性前葡萄膜炎风险预测模型。在一个具体实施例中,复发风险评分阈值是通过所述急性前葡萄膜炎风险预测模型获得所述训练样本子集合中的每个样本的复发风险评分,并对所述训练样本子集合中的每个样本的复发风险评分进行ROC分析获得的。
在一个实施例中,急性前葡萄膜炎风险预测模型可以是静态的模型。在一个具体实施例中,急性前葡萄膜炎风险预测模型为:Y=AS*0.09230+HLA-B27*0.19863+MO*(-0.59456)+HDL*0.36348+LDL*(-0.12934)+0.3287;其中,
其中,Y代表复发风险评分,*代表乘号,自变量集合中的各项指标的具体取值如下:
待测急性前葡萄膜炎患者患有强直性脊柱炎时,变量AS=1,待测急性前葡萄膜炎患者不患有强直性脊柱炎时,变量AS=0;待测急性前葡萄膜炎患者为HLA-B27阳性时,变量HLA-B27=1,待测急性前葡萄膜炎患者为HLA-B27阴性时,变量HLA-B27=0;MO为待测急性前葡萄膜炎患者单核细胞计数的具体数值;HDL为待测急性前葡萄膜炎患者高密度脂蛋白的具体数值;LDL为待测急性前葡萄膜炎患者低密度脂蛋白的具体数值。
在一个实施例中,根据上述急性前葡萄膜炎复发风险预测模型,将训练样本子集合中0%假阳性率和100%真阳性率的点的复发风险评分作为复发风险评分阈值。
在一个实施例中,如图7所示,提供了一种急性前葡萄膜炎复发风险预测装置,包括:自变量集合获取单元701、复发风险评分获取702和复发风险判断单元703;其中:
自变量集合获取单元701,用于获取待测急性前葡萄膜炎患者的自变量集合;
复发风险评分获取单元702,用于将待测急性前葡萄膜炎患者的自变量集合输入到预设的急性前葡萄膜炎复发风险预测模型或者根据以上任一项构建方法获得的急性前葡萄膜炎复发风险预测模型,获得待测急性前葡萄膜炎患者的复发风险评分;
复发风险判断单元703,用于根据所述复发风险评分判断待测急性前葡萄膜炎患者复发风险的高低;
其中,所述自变量集合包括待测急性前葡萄膜炎患者的各项指标,各项指标包括:是否患有强直性脊柱炎、HLA-B27、MO、HDL和LDL。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待测急性前葡萄膜炎患者的自变量集合;
将待测急性前葡萄膜炎患者的自变量集合输入到急性前葡萄膜炎复发风险预测模型,获得待测急性前葡萄膜炎患者的复发风险评分;和
根据所述复发风险评分判断待测急性前葡萄膜炎患者复发风险的高低。
在计算机可读存储介质中,急性前葡萄膜炎复发风险预测模型可以是根据本发明实施例中所述的构建方法获得的,也可以是本发明实施例中的静态模型。
实验例1
在本实验例中,数据在正态分布时表示为平均值±标准差(SD),在非正态分布时表示为中位数和四分位距(IQR),分类时表示为百分比。使用Wilcoxon符号秩检验(非正态分布变量)、Student's t检验(正态分布变量)和卡方检验(分类或二元变量)进行两组比较中基线特征的统计显著性,除非在图例中另有说明。所有基线特征均按发作次数分层。使用单因素Cox比例风险回归评估潜在的复发相关风险因素。产生了危险比(HR)和95%置信区间(CI)。使用带有R包“stats”的逻辑回归模型为个体化复发风险分层建立了复发风险预测模型。无复发生存率采用Kaplan-Meier法估计,组间生存分布比较采用log-rank检验。使用受试者工作特征(AUROC)曲线分析下的面积确定个体变量和确定的风险因素面板的复发预测性能,并使用Delong检验进行比较。除非另有说明,否则统计显著性水平为0.05,测试为2侧。所有统计分析均使用R软件(4.0.3版)和Bioconductor(3.13版)进行。
1、研究人群和显著性差异检验
从温州医科大学附属眼科医院回顾性检索了233例根据国际葡萄膜炎研究组AAU标准诊断为AAU的患者。在回顾性观察期间,对患者的前葡萄膜炎复发进行了纵向随访。复发通常通过在预定的门诊就诊时观察炎症复发或通过评估患者向诊所报告的急性症状来确定。通过电话随访在病历系统中没有复发记录的患者。在其他医院或诊所确认复发的患者将记录其复发时间。如果时间未知,则将排除患者记录。
我们根据疾病发作次数对233例患者的临床指标进行了总结,并对所有临床指标在非复发组(一次性疾病法作组)和复发组(两次或以上疾病发作组)做了显著性差异分析,具体结果见表1。
表1
/>
P-value上标为a时,对应的指标数据呈正态分布,数据表示为平均值±标准偏差(SD),使用学生t检验(Student’s t-test)比较特征。P-value上标为b时,对应的指标数据非正态分布,数据以中位数和四分位距(interquartile range,IQR)表示,使用威尔科克森符号秩检验(Wilcoxon signed-rank test)比较特征。P-value上标为c时,对应的指标数据是分类数据,数据以数字和百分比的形式呈现,使用卡方检验(Chi-square test)比较特征。本文中的比较特征指的是在非复发组和复发组做显著性差异分析。
在表1中的英语缩写的具体含义如下:NEU,中性粒细胞计数;LYM,淋巴细胞计数;NLR,新生粒细胞与淋巴细胞的比率;MO,单核细胞计数;EO,嗜酸性粒细胞计数;BASO,嗜碱性粒细胞计数;CRP,C反应蛋白;SAA,血清淀粉样蛋白A;AST,天冬氨酸转氨酶;ALT,丙氨酸转氨酶;AST/ALT,天冬氨酸转氨酶转丙氨酸转氨酶;GGT,谷氨酰转肽酶;ALP,碱性磷酸酶;TP,总蛋白;ALB,白蛋白;GLB,球蛋白;A/G,白蛋白转球蛋白;TBIL,总胆红素;DBIL,直接胆红素;IBIL,间接胆红素;GLU,葡萄糖;UA,尿酸;Crea,肌酐;TG,甘油三酯;TCH,总胆固醇;HDL,高密度脂蛋白;LDL,低密度脂蛋白;RF,类风湿因子;VD(25-OH),25-羟基维生素D;ESR,红细胞沉降率。
如表1所示,在233例AAU患者中,73例(31.33%)患者在随访过程中出现复发。所有患者的中位年龄(+IQR)为39.70(32.12-49.16)岁。所有患者中有150名(64.38%)为男性,这符合急性前葡萄膜炎的年龄和性别特征。共94例(40.34%)患AS(Ankylosingspondylitis,强直性脊柱炎),非复发组55例(34.38%)患AS,在复发组中39例(53.42%)患AS(P=0.006)。共有129名(70.88%)患者为HLA-B27阳性,在非复发组中80名(65.57%)患者为HLA-B27阳性,在复发组中49名(81.67%)患者为HLA-B27阳性(P=0.025);这些数据表明HLAB27和AS阳性的患者更容易复发。单核细胞MO(±SD)10^9/L在非复发组中为0.53±0.19,在复发组中为0.45±0.20(P=0.007)。在非复发组中甘油三酯TG(+IQR)mmol/L的中位数为1.47(0.94-2.1),在复发组的中位数为1.01(0.74-1.53)(P=0.023)。在非复发组HDL(±SD)mmol/L平均数为1.29±0.28,在复发组平均数为1.47±0.34(P=0.004)。在非复发组中低密度脂蛋白LDL(±SD)mmol/L平均数为3.02±0.80,在复发组平均数为2.63±0.77(P=0.004)。
由以上数据可知,临床指标Ankylosing spondylitis(是否患有强直性脊柱炎)、HLA-B27、MO、TG、HDL和LDL,在0.05水平上在非复发组和复发组之间有显著性差异。
2、与无复发生存时间显著相关性分析
图8中包括A和B共2个子图,其中子图A为热图,显示了233例患者AAU数据中临床指标的不同构成,红色字体的代表的是重要的临床指标。子图B为森林图,显示采用单因素cox比例风险回归模型(Cox proportional hazards regression model)对38项临床指标与无复发生存时间进行显著相关性分析结果,获得每项临床指标的HRs和95%的置信区间和P值(P value)。如子图B所示,Ankylosing spondylitis、HLA-B27、MO、HDL和LDL五个临床指标与无复发生存时间显著相关。其中MO(HR=0.074,95%CI=0.01-0.541,P=0.01)和LDL(HR=0.583,95%CI=0.36-0.945,P=0.029)与患者高存活率相关,其他三个临床指标HDL(HR=4.985,95%CI=1.845-13.471,P=0.002)、强直性脊柱炎(HR=1.668,95%CI=1.049-2.654,P=0.031)和HLA-B27(HR=0.002)1.94,95%CI=1.004-3.747,P=0.049)与患者的复发风险增加显著相关。
3、复发风险预测模型的构建
采用在非复发组和复发组具显著性差异,并且与无复发生存时间具有显著相关性的临床指标(Ankylosing spondylitis、HLA-B27、MO、HDL和LDL)作为复发风险预测模型(5RF-panel)的特征。
对原始数据集(233名患者)进行清洗,去除五个指标不完整的样本,共保留111名患者样本进行复发风险预测模型的构建。111名患者随机平均分配到训练队列(n=56)和测试队列。在训练队列中,使用选出的五个临床指标进行采用逻辑回归方法构建复发风险预测模型;具体模型如下:
5RF-panelscore=Ankylosing spondylitis*0.09230+HLA-B27*0.19863
+MO*(-0.59456)+HDL*0.36348+LDL*(-0.12934)+0.3287
其中,5RF-panelscore代表复发风险评分,*代表乘号,自变量集合中的各项指标的具体取值如下:待测急性前葡萄膜炎患者患有强直性脊柱炎时,变量AS=1,待测急性前葡萄膜炎患者不患有强直性脊柱炎时,变量AS=0;待测急性前葡萄膜炎患者为HLA-B27阳性时,变量HLA-B27=1,待测急性前葡萄膜炎患者为HLA-B27阴性时,变量HLA-B27=0;MO为待测急性前葡萄膜炎患者单核细胞计数的具体数值;HDL为待测急性前葡萄膜炎患者高密度脂蛋白的具体数值;LDL为待测急性前葡萄膜炎患者低密度脂蛋白的具体数值。
在训练队列中,采用0%假阳性率和100%真阳性率的点的复发风险评分作为截断值(cut-off),训练队列、测试队列和整体队列(111名患者),将患者分为低风险组和高风险组。
4、性能测试
(1)训练队列性能测试
为了确定复发风险预测模型的有效性,我们估计了训练队列中每个患者的复发分险评分5RF-panelscore。具体验证结果如图9所示,在图9中包括A、B、C、D、E和F共6个子图,其中子图A为复发风险评分5RF-panelscore、传统临床特征和复发风险预测模型的临床指标对应的患者在训练队列的分布。由子图B可以看出,复发风险评分5RF-panelscore与MO(Pearsonr=-0.47,p<0.001)和LDL(Pearson r=-0.59,p<0.001)呈显著负相关,但与HDL呈显著正相关(Pearson r=0.55,p<0.001)。复发组和非复发组的5RF-panelscore分布有显著差异(Wilcoxon test p<0.001),非复发组5RF-panelscore的中位数显著低于复发组(0.234vs0.421)。为了确定5RF-panelscore对患者复发的预测能力,进行了ROC曲线下面积(AUC)的计算,如子图C所示,显然5RF-panelscore在训练队列中提供了很好的预测能力,AUC为0.837(95%CI=0.728-0.947)。我们使用方法中定义的截断值将训练队列分为高风险组(n=19)和低风险(n=37)组。本验证例中使用Kaplan-Meier(K-M)曲线和对数秩检验(log-ranktest)进行生存分析,如子图D所示,其中低风险组无复发生存期达到3年的百分比为89.2%,高风险组为39.0%;低风险组患者的无复发比例显著高于高危组(log-rank P<0.001,HR=45.874,95%CI=5.232-402.2)。如子图E和F所示,我们进一步发现复发风险预测模型的临床指标水平在两个风险组之间也存在显著差异;如子图E所示,MO(Wilcoxontest,p=0.043)和LDL(Wilcoxon test,p=0.003)在低风险组中的指数往往高于高风险组,而HDL(Wilcoxon test,p=0.002)在高风险组中具有更高的指数;同时如子图F所示,Ankylosing spondylitis和HLA-B27跨越两个风险亚组,而两个风险亚组在Ankylosingspondylitis指数(Chi-square test p=0.034)和HLA-B27(Chi-square test p=0.022)中的比例差异很大。
(2)测试队列性能测试
为了确定复发风险预测模型的可重复性和稳定性,使用测试队列来验证。我们首先使用从训练队列中获得的风险预测模型计算复发风险评分5RF-panelscore。具体验证结果如图10所示,在图10中包括A、B、C、D、E和F共6个子图,子图A为复发风险评分5RF-panelscore、传统临床特征和复发风险预测模型的临床指标对应的患者在测试队列中的分布。此外,由子图B可以看出,复发风险评分5RF-panelscore与MO(Pearson r=-0.55,p<0.001)、LDL(Pearson r=-0.43,p<0.001)呈相似的显著负相关性,与HDL呈相似的显著正相关性(Pearson r=0.65,p<0.001);复发组的5RF-panelscore显著高于非复发组(中位数0.535对0.316,Wilcoxon test,p<0.001)。为了进一步证实测试队列的预测能力,如子图C所示我们发现5RF-panelscore也提供了0.725(95%CI=0.561-0.889)的AUC。我们使用方法中定义的截断值将测试队列分为低风险组(n=24)和高风险组(n=31)。本验证例中使用Kaplan-Meier(K-M)曲线和对数秩检验(log-rank test)进行生存分析,如子图D所示,无复发生存时间差异显著(log-rank p=0.024,HR=51.982,95%CI=4.438-608.9);低分险组无复发生存时间达到3年的百分比为85.1%,高风险组相应的百分比为55.7%。如子图E和F所示,我们进一步发现复发风险预测模型的临床指标水平在两个风险组之间也存在显著差异,其中MO(Wilcoxon test,p<0.001)和LDL(Wilcoxon test,p<0.001)的相似分布在高风险组中具有较低的指数,但HDL(Wilcoxon检验p<0.001)在低风险组中具有较低的指数;HLA-B27在低风险组和高风险组之间存在显著差异(Chi-square p=0.003)。
(3)与HLA-B27和强直性脊柱炎(Ankylosing spondylitis)的预测性能的比较
在图11中包括A、B、C、D、E和F共6个子图。为了比较复发风险预测模型和传统临床指标(如HLA-B27和强直性脊柱炎)的复发风险预测能力,我们对整体队列(111名患者)上进行了ROC曲线分析,结果如子图A所示,复发风险评分5RF-panelscore的AUC最佳为0.766(95%CI=0.668-0.863),高于HLA-B27(AUC=0.596,95%CI=0.51-0.681,DeLong's检验p=0.003)和强直性脊柱炎(AUC=0.581,95%CI=0.476-0.687,DeLong检验p=0.003)。子图B为复发风险预测模型和两个传统指标在不同风险组下的Kaplan-Meier(K-M)曲线的比较,与HLA-B27 No亚组和强直性脊柱炎No亚组相比,复发风险预测模型的低风险组患者的预后最好;同时,低风险组和高风险组(log-rank,p<0.001)无复发生存率与强直性脊柱炎组(log-rank,p=0.2)和HLA-B27亚组(log-rank,p=0.07)相比差异最大。如图子图C所示,在进一步研究复发风险评分5RF-panelscore与HLA-B27和强直性脊柱炎定义的传统临床亚群的关系后,我们发现5RF-panelscore仍然能够有效地将患者划分为高风险组和低风险组,强直性脊柱炎(Yes)组(log-rank p=0.002,HR=32.963,95%CI=2.658-408.9)和强直性脊柱炎(No)组(log-rank,p=0.008,HR=72.089,95%CI=6.801-746.1)。强直性脊柱炎(Yes)组中的低风险组和高风险组的3年无复发生存率分别为94.4%和49.7%,而强直性脊柱炎(No)组相应的3年无复发生存率分别为83.1%和39.8%。此外,强直性脊柱炎(Yes)组(Wilcoxon test p=0.006)和强直性脊柱炎(No)亚组(Wilcoxon test,p=0.005)中,高风险组和低风险组的5RF-panelscore分布存在显著差异;在强直性脊柱炎两个亚组中,高风险组的复发风险评分中位数显著高于低风险组(Yes:0.506vs 0.316,No:0.385vs 0.24)。如子图E和子F所示,在HLA-B27亚组上显示出相同的有效区分能力。5RF-panelscore能够将患者分为高风险组和低风险组在HLA-B27(Yes)组(log-rank p=0.002,HR=29.825,95%CI=4.104-216.8)和HLA-B27(No)组(log-rank p=0.007,HR=136.175,95%CI=4.1-4523)。HLA-B27(Yes)组的低风险组和高风险组的3年生存率分别为81.6%和51.1%,而HLA-B27(No)组相应的3年生存率分别为92.9%和33.3%。同时,HLA-B27(Yes)亚组(Wilcoxon testp=0.022)和HLA-B27(No)亚组(Wilcoxon test,p=0.004)的5RF-panelscore分布在高风险组和低风险组之间存在显著差异,并且在两个强直性脊柱炎亚组中,高风险组的5RF-panelscore中位数显著高于低风险组(Yes:0.425vs 0.316,No:0.492vs 0.134)。
综合上述结果可知,在训练队列中,5RF-panelscore提供了很好的预测能力,AUC为0.837(95%CI=0.728-0.947);在测试队列中,它还提供了0.725的AUC(95%CI=0.561-0.889)。我们可以看到这个复发风险预测模型可以将患者大大分为低风险组和高风险组。当原发性AAU患者来到医院时,临床医生可以使用复发风险预测模型对患者的复发风险进行评分。如果评分5RF-panelscore高于我们设定的阈值,则可以判断为高危患者。一旦判断患者有较高的复发风险,应注意鼓励患者严格遵循随访计划。医生也可适当延长激素类药物或免疫抑制剂的使用周期。
当我们对AAU的整体队列(111名患者)进行ROC曲线分析时。5RF-panelscore的最佳AUC为0.766(95%CI=0.668-0.863),高于HLA-B27(AUC=0.596,95%CI=0.51-0.681)和强直性脊柱炎(AUC=0.581,95%CI=0.476-0.687)。我们发现了的新因素(例如HDL、LDL和MO)在该模型中起着重要作用。这也提示患者低盐低脂饮食可能对预防AAU复发具有重要意义。我们根据患者的AS和HLA-B27状态测试了5RF-panelscore的诊断功效。强直性脊柱炎(Yes)组低风险和高风险的3年生存率分别为94.4%和49.7%,强直性脊柱炎(No)组则分别为83.1%和39.8%,HLA-B27(Yes)组分别为81.6%和51.1%,HLA-B27(No)组分别为92.9%和33.3%。我们发现在每个亚组中,低风险组和高风险组的复发率存在显著差异。我们的模型适用于各种类型的急性前葡萄膜炎患者。
图12示出了本实验例中的急性前葡萄膜炎复发风险预测模型在整体队列上的绘制的ROC曲线。
对比例1
在实验例1的基础上,替换复发风险预测模型中的部分临床指标构建新的模型,本对比例中用于构建模型的临床指标包括:Ankylosing spondylitis、HLA-B27、MO、HDL和TG;在整体队列(111名患者)的队列中进行绘制性能测试,绘制ROC曲线如图13所示,本对比例的AUC值为0.698(95%CI=0.531-0.865),明显低于实验例1。
实验例1中所用的模型即为本发明实施例中的急性前葡萄膜炎复发风险预测模型,即自变量集合所各项指标为是否患有强直性脊柱炎、HLA-B27、MO、HDL和LDL。实验例中模型在训练队列和测试队列上AUC值均大于0.7,因此说明其对急性前葡萄膜炎患者是否复发具有很好的预测效果。在对比例1中模型采用与本发明实施例不同的自变量集合(具体来说各项指标不同),对比例中的模型在整体队列(111名患者)中的AUC值明显低于实验例的AUC值。综上可知,实验例1中应用的模型是相对于对比例中的其他组合来说,对于急性前葡萄膜炎患者是否复发具有更好的预测效果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上对本发明所提供的一种计算机设备进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (6)
1.一种急性前葡萄膜炎复发风险预测模型的构建方法,其特征在于,包括:
获取目标样本集合,其中,所述目标样本集合中的每个样本包括自变量集合和标签,所述标签用于描述样本对应的急性前葡萄膜炎患者是否为复发患者,自变量集合包括样本对应的急性前葡萄膜炎患者的各项指标;和
基于所述目标样本集合,利用机器学算法进行模型训练,获得急性前葡萄膜炎复发风险预测模型;
其中,所述葡萄膜炎复发风险预测模型用于预测急性前葡萄膜炎患者急性前葡萄膜炎复发风险的高低;各项指标包括:是否患有强直性脊柱炎、HLA-B27、MO、HDL和LDL;所述获取目标样本集合,包括:
获取样本的各项临床指标;
根据每个样本对应的急性前葡萄膜炎患者的急性前葡萄膜炎发作次数,确定所述每个样本对应的标签;
利用所述每个样本对应的各项临床指标和标签,从临床指标中筛选与急性前葡萄膜炎复发显著相关的候选指标;和
基于每个样本的候选指标,组成每个样本对应的自变量集合;所述利用所述每个样本对应的各项临床指标和标签,从临床指标中筛选与急性前葡萄膜炎复发显著相关的候选指标,具体包括:
利用所述每个样本对应的标签,将每个样本划分为复发样本组和非复发样本组;
在第一显著性水平上,确定每项临床指标是否在复发样本组和非复发样本组之间具有显著性差异,将具有显著性差异的临床指标作为第一候选指标;
在第二显著性水平上,确定所述复发样本组和所述非复发样本组中每项临床指标是否与无复发生存时间显著相关,将与无复发生存时间显著相关的临床指标作为第二候选指标;和
从所述第一候选指标和所述第二候选指标中获取候选指标,所述候选指标同时为第一候选指标和第二候选指标;
所述基于所述目标样本集合,利用机器学算法进行模型训练,获得急性前葡萄膜炎复发风险预测模型,包括:
将所述目标样本集合按照预设比例随机划分为训练样本子集合和测试样本子集合;
基于所述训练样本子集合,利用逻辑回归算法进行模型训练,获得各项指标对应的权重,基于各项指标对应的权重获得急性前葡萄膜炎复发风险预测模型;和
利用所述训练样本子集合和所述测试样本子集合对所述急性前葡萄膜炎复发风险预测模型进行性能评估,若性能评估结果不满足要求,则重新进行模型训练。
2.一种急性前葡萄膜炎复发风险预测设备,其特征在于,所述设备包括:存储器和处理器;
所述存储器,用于存储程序指令;
所述处理器,用于调用所述程序指令,当所述程序指令被执行时,用于执行以下操作:
获取待测急性前葡萄膜炎患者的自变量集合;
将待测急性前葡萄膜炎患者的自变量集合输入到根据权利要求1构建方法获得的急性前葡萄膜炎复发风险预测模型,获得待测急性前葡萄膜炎患者的复发风险评分;和
根据所述复发风险评分判断待测急性前葡萄膜炎患者复发风险的高低。
3.一种急性前葡萄膜炎复发风险预测设备,其特征在于,所述设备包括:存储器和处理器;
所述存储器,用于存储程序指令;
所述处理器,用于调用所述程序指令,当所述程序指令被执行时,用于执行以下操作:
获取待测急性前葡萄膜炎患者的自变量集合;
将待测急性前葡萄膜炎患者的自变量集合输入到根据权利要求1构建方法获得的急性前葡萄膜炎复发风险预测模型,获得待测急性前葡萄膜炎患者的复发风险评分;和
根据所述复发风险评分判断待测急性前葡萄膜炎患者复发风险的高低;
其中,所述自变量集合包括待测急性前葡萄膜炎患者的各项指标,各项指标包括:是否患有强直性脊柱炎、HLA-B27、MO、HDL和LDL;所述急性前葡萄膜炎复发风险预测模型为:Y=AS * 0.09230 + HLA-B27 * 0.19863 + MO * (-0.59456) + HDL * 0.36348 + LDL * (-0.12934) + 0.3287;
其中,Y代表复发风险评分,*代表乘号,自变量集合中的各项指标的具体取值如下:
待测急性前葡萄膜炎患者患有强直性脊柱炎时,变量AS=1,待测急性前葡萄膜炎患者不患有强直性脊柱炎时,变量AS=0;待测急性前葡萄膜炎患者为HLA-B27阳性时,变量HLA-B27=1,待测急性前葡萄膜炎患者为HLA-B27阴性时,变量HLA-B27=0;MO为待测急性前葡萄膜炎患者单核细胞计数的具体数值;HDL为待测急性前葡萄膜炎患者高密度脂蛋白的具体数值;LDL为待测急性前葡萄膜炎患者低密度脂蛋白的具体数值。
4.根据权利要求2-3任一项所述的设备,其特征在于,所述处理器具体用于:
将所述复发风险评分与复发风险评分阈值进行比较,若所述复发风险评分大于所述复发风险评分阈值,则判断所述待测急性前葡萄膜炎患者复发风险高;若所述复发风险评分小于等于所述复发风险评分阈值,则判断所述待测急性前葡萄膜炎患者复发风险低。
5.一种急性前葡萄膜炎复发风险预测装置,其特征在于,包括:
自变量集合获取单元,用于获取待测急性前葡萄膜炎患者的自变量集合;
复发风险评分获取单元,用于将待测急性前葡萄膜炎患者的自变量集合输入到根据权利要求1构建方法获得的急性前葡萄膜炎复发风险预测模型,获得待测急性前葡萄膜炎患者的复发风险评分;和
复发风险判断单元,用于根据所述复发风险评分判断待测急性前葡萄膜炎患者复发风险的高低;
其中,所述自变量集合包括待测急性前葡萄膜炎患者的各项指标,各项指标包括:是否患有强直性脊柱炎、HLA-B27、MO、HDL和LDL。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1所述的构建方法;或者所述计算机程序被处理器执行时实现权利要求2-3任一项所述的急性前葡萄膜炎复发风险预测设备中的处理器执行的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110750429.2A CN113488170B (zh) | 2021-07-02 | 2021-07-02 | 急性前葡萄膜炎复发风险预测模型构建方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110750429.2A CN113488170B (zh) | 2021-07-02 | 2021-07-02 | 急性前葡萄膜炎复发风险预测模型构建方法及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113488170A CN113488170A (zh) | 2021-10-08 |
CN113488170B true CN113488170B (zh) | 2023-07-25 |
Family
ID=77939598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110750429.2A Active CN113488170B (zh) | 2021-07-02 | 2021-07-02 | 急性前葡萄膜炎复发风险预测模型构建方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113488170B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117747100B (zh) * | 2023-12-11 | 2024-05-14 | 南方医科大学南方医院 | 一种预测阻塞性睡眠呼吸暂停发生风险的系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111554402A (zh) * | 2020-04-24 | 2020-08-18 | 山东省立医院 | 基于机器学习的原发性肝癌术后复发风险预测方法及系统 |
CN111862079A (zh) * | 2020-07-31 | 2020-10-30 | 复旦大学附属肿瘤医院 | 基于影像组学的高级别浆液性卵巢癌复发风险预测系统 |
CN113436741A (zh) * | 2021-07-16 | 2021-09-24 | 四川大学华西医院 | 基于组织特异增强子区域dna甲基化的肺癌复发预测方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103778336A (zh) * | 2014-01-23 | 2014-05-07 | 北京市神经外科研究所 | 一种颅内动脉瘤栓塞后复发风险的预测方法及系统 |
US10874738B2 (en) * | 2015-07-14 | 2020-12-29 | Immunext Inc. | Anti-CD154 antibody having improved binding, functional and safety characteristics |
CN109938918B (zh) * | 2019-03-07 | 2022-01-07 | 温州小梁医学科技有限公司 | 一种降低眼内vegf浓度的方法及装置 |
CN110317782B (zh) * | 2019-07-18 | 2023-06-13 | 天津瑞博斯生物技术有限公司 | 提高间充质干细胞复苏后存活的方法和所用的冻存液 |
-
2021
- 2021-07-02 CN CN202110750429.2A patent/CN113488170B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111554402A (zh) * | 2020-04-24 | 2020-08-18 | 山东省立医院 | 基于机器学习的原发性肝癌术后复发风险预测方法及系统 |
CN111862079A (zh) * | 2020-07-31 | 2020-10-30 | 复旦大学附属肿瘤医院 | 基于影像组学的高级别浆液性卵巢癌复发风险预测系统 |
CN113436741A (zh) * | 2021-07-16 | 2021-09-24 | 四川大学华西医院 | 基于组织特异增强子区域dna甲基化的肺癌复发预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113488170A (zh) | 2021-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Electronic health records and polygenic risk scores for predicting disease risk | |
WO2020245727A1 (en) | A method of evaluating autoimmune disease risk and treatment selection | |
Chadaga et al. | Clinical and laboratory approach to diagnose COVID-19 using machine learning | |
US20190324036A1 (en) | Panels for testing for sepsis | |
US20150095069A1 (en) | Algorithms to Identify Patients with Hepatocellular Carcinoma | |
JP2016517556A (ja) | 健康学習システム及び方法 | |
CN114127558A (zh) | 用于评估对感染的免疫反应的系统和方法 | |
Luo et al. | The selection of indicators from initial blood routine test results to improve the accuracy of early prediction of COVID-19 severity | |
US11676722B1 (en) | Method of early detection, risk stratification, and outcomes prediction of a medical disease or condition with machine learning and routinely taken patient data | |
CN114724716A (zh) | 进展为2型糖尿病的风险预测的方法、模型训练及装置 | |
EP3797427A1 (en) | Panels for testing sepsis | |
CN113488170B (zh) | 急性前葡萄膜炎复发风险预测模型构建方法及相关设备 | |
Tuncer et al. | Scat-NET: COVID-19 diagnosis with a CNN model using scattergram images | |
Diakou et al. | Multiple sclerosis and computational biology | |
Hassoun et al. | Setting up of a machine learning algorithm for the identification of severe liver fibrosis profile in the general US population cohort | |
US20200176118A1 (en) | Methods and systems for septic shock risk assessment | |
CN113488108B (zh) | 一种新型的用于急性前葡萄膜炎个体化复发风险预测的方法及其装置 | |
Deng et al. | Characterizing risk of in-hospital mortality following subarachnoid hemorrhage using machine learning: a retrospective study | |
De Grandi et al. | Highly Elevated Plasma γ‐Glutamyltransferase Elevations: A Trait Caused by γ‐Glutamyltransferase 1 Transmembrane Mutations | |
Arya et al. | Explainable AI for enhanced interpretation of liver cirrhosis biomarkers | |
Liu et al. | Laboratory Testing Implications of Risk-Stratification and Management of COVID-19 Patients | |
Brinati et al. | Artificial intelligence in laboratory medicine | |
Yördan et al. | Hybrid AI-Based Chronic Kidney Disease Risk Prediction | |
EP3404665B1 (en) | Systems and methods for aggregation of automatically generated laboratory test results | |
Surian et al. | A digital twin model incorporating generalized metabolic fluxes to predict chronic kidney disease in type 2 diabetes mellitus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |