CN116386901B

CN116386901B - 乙肝临床治愈预测模型构建方法及装置、预测方法及装置

Info

Publication number: CN116386901B
Application number: CN202310655438.2A
Authority: CN
Inventors: 侯金林; 樊蓉; 赵思如; 梁携儿
Original assignee: Southern Hospital Southern Medical University
Current assignee: Southern Hospital Southern Medical University
Priority date: 2023-06-05
Filing date: 2023-06-05
Publication date: 2024-01-30
Anticipated expiration: 2043-06-05
Also published as: CN116386901A

Abstract

本发明公开了一种乙肝临床治愈预测模型构建方法及装置、预测方法及装置。模型构建方法包括：获取样本预测对象的样本特征信息，该样本特征信息包括按照随访时序记录的样本预测对象的乙肝表面抗原定量信息；将样本预测对象分为临床治愈组与非临床治愈组；拟合该临床治愈组的样本特征信息，获得临床治愈组平均轮廓；拟合非临床治愈组的样本特征信息，获得非临床治愈组平均轮廓；基于临床治愈组平均轮廓和非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型，获得训练后的乙肝临床治愈预测模型。该模型构建方法使用具有时序特征的单个临床标志物进行预测模型构建，能够有效对慢乙肝患者的临床治愈概率进行精准预测。

Description

乙肝临床治愈预测模型构建方法及装置、预测方法及装置

技术领域

本发明涉及信息处理技术领域，具体涉及一种乙肝临床治愈预测模型构建方法及装置、预测方法及装置。

背景技术

慢性乙型肝炎（慢乙肝）病毒感染是重大的公共卫生问题，临床治愈是目前最新慢乙肝防治指南推荐的理想治疗目标。核苷（酸）类似物药物与干扰素类药物的初始联合治疗、序贯治疗、序贯联合治疗等多种策略可一定程度上提高特定人群的临床治愈发生率。另外，目前众多乙肝新药物临床试验也展示了较为良好的治疗结果，包括RNA干扰药物、病毒进入抑制剂及治疗性乙肝疫苗等。

对慢乙肝患者是否能实现临床治愈进行预测，有助于上述临床策略或新药随机试验的受试者筛选与分层模型设计，以平衡各组受试者特征，提高临床试验效率。同时，临床治愈概率低的患者可选择持续原有治疗选择，避免无效的治疗方案更改。然而，当前对慢乙肝患者是否能实现临床治愈通常是通过临床医生根据经验进行预估，准确性差。当前缺乏高准确性的乙肝临床治愈预测模型，难以对慢乙肝患者的临床治愈概率进行精准预测。

发明内容

有鉴于此，本发明实施例提供了一种乙肝临床治愈预测模型构建方法及装置、预测方法及装置，以解决当前没有有效方法对慢乙肝患者的临床治愈概率进行精准预测的问题。

根据第一方面，本发明实施例提供了一种乙肝临床治愈预测模型构建方法，该方法包括：获取样本预测对象的样本特征信息；所述样本特征信息包括按照随访时序记录的所述样本预测对象的乙肝表面抗原定量信息；将样本预测对象分为临床治愈组与非临床治愈组；拟合所述临床治愈组的样本特征信息，获得所述临床治愈组对应的临床治愈组平均轮廓；以及拟合所述非临床治愈组的样本特征信息，获得所述非临床治愈组对应的非临床治愈组平均轮廓；基于所述临床治愈组平均轮廓和所述非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型，获得训练后的所述乙肝临床治愈预测模型；训练后的所述乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率。

在一些实施例中，所述获取样本预测对象的样本特征信息的步骤，包括：从特定数据库中获取所述样本预测对象按照随访时序记录的临床数据；从所述临床数据中筛选出符合预设条件的临床数据，以作为所述样本预测对象的样本特征信息；所述预设条件包括：在随访过程中至少包含两次乙肝表面抗原定量信息。

在一些实施例中，所述拟合所述临床治愈组的样本特征信息，获得所述临床治愈组对应的临床治愈组平均轮廓，包括：利用线性混合效应模型，拟合所述临床治愈组的乙肝表面抗原定量信息的时间变化特征，获得所述临床治愈组对应的临床治愈组平均轮廓；所述拟合所述非临床治愈组的样本特征信息，获得所述非临床治愈组对应的非临床治愈组平均轮廓，包括：利用线性混合效应模型，拟合所述非临床治愈组的乙肝表面抗原定量信息的时间变化特征，获得所述非临床治愈组对应的非临床治愈组平均轮廓。

在一些实施例中，所述基于所述临床治愈组平均轮廓和所述非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型，获得训练后的所述乙肝临床治愈预测模型之后，还包括：基于样本预测对象的样本特征信息，通过训练后的所述乙肝临床治愈预测模型获取生存曲线；根据所述生存曲线评估训练后的所述乙肝临床治愈预测模型的预测能力。

根据第二方面，本发明实施例提供了一种基于乙肝临床治愈预测模型构建方法的乙肝临床治愈预测方法，其特征在于，所述方法包括：获取待预测对象的目标预测信息；所述目标预测信息包括按照随访时序记录的所述目标预测对象的乙肝表面抗原定量信息；将所述目标预测信息输入训练后的乙肝临床治愈预测模型中，获取所述待预测对象的慢乙肝临床治愈概率，其中，训练后的乙肝临床治愈预测模型用于根据所述目标预测信息构建所述待预测对象对应的目标轮廓，并将所述目标轮廓与自身包含的临床治愈组平均轮廓和非临床治愈组平均轮廓进行比对，输出待预测对象的慢乙肝临床治愈概率。

在一些实施例中，将所述目标预测信息输入训练后的乙肝临床治愈预测模型中，获取所述待预测对象的慢乙肝临床治愈概率之后，还包括：根据所述待预测对象的慢乙肝临床治愈概率确定针对所述预测对象的个性化处理策略。

根据第三方面，本发明实施例提供了一种乙肝临床治愈预测模型构建装置，该装置包括：样本获取模块，用于获取样本预测对象的样本特征信息；所述样本特征信息包括按照随访时序记录的所述样本预测对象的乙肝表面抗原定量信息；分组模块，用于将样本预测对象分为临床治愈组与非临床治愈组；拟合模块，拟合所述临床治愈组的样本特征信息，获得所述临床治愈组对应的临床治愈组平均轮廓，还用于拟合所述非临床治愈组的样本特征信息，获得所述非临床治愈组对应的非临床治愈组平均轮廓；训练模块，用于基于所述临床治愈组平均轮廓和所述非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型，获得训练后的所述乙肝临床治愈预测模型；训练后的所述乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率。

根据第四方面，本发明实施例提供了一种基于乙肝临床治愈预测模型的乙肝临床治愈预测装置，该装置包括：目标获取模块，用于获取待预测对象的目标预测信息；所述目标预测信息包括按照随访时序记录的所述目标预测对象的乙肝表面抗原定量信息；预测模块，用于将所述目标预测信息输入训练后的乙肝临床治愈预测模型中，获取所述待预测对象的慢乙肝临床治愈概率，其中，训练后的乙肝临床治愈预测模型用于根据所述目标预测信息构建所述待预测对象对应的目标轮廓，并将所述目标轮廓与自身包含的临床治愈组平均轮廓和非临床治愈组平均轮廓进行比对，输出待预测对象的慢乙肝临床治愈概率。

根据第五方面，本发明实施例提供了一种计算机设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行如第一方面所述的乙肝临床治愈预测模型构建方法的步骤，或者，执行如第二方面所述的乙肝临床治愈预测方法的步骤。

根据第六方面，本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如第一方面所述的乙肝临床治愈预测模型构建方法的步骤，或者，执行如第一方面所述的乙肝临床治愈预测方法的步骤。

本发明技术方案，具有如下优点。

本发明实施例提供一种乙肝临床治愈预测模型构建方法及装置、预测方法及装置，包括：获取样本预测对象的样本特征信息，该样本特征信息包括按照随访时序记录的所述样本预测对象的乙肝表面抗原定量信息；将样本预测对象分为临床治愈组与非临床治愈组；拟合该临床治愈组的样本特征信息，获得临床治愈组对应的临床治愈组平均轮廓，以及拟合非临床治愈组的样本特征信息，获得非临床治愈组对应的非临床治愈组平均轮廓；基于临床治愈组平均轮廓和非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型，获得训练后的乙肝临床治愈预测模型，该训练后的乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率，该乙肝临床治愈预测模型构建过程中使用多个时间点的单个临床标志物（乙肝表面抗原定量信息）进行预测模型构建，能够有效对慢乙肝患者的临床治愈概率进行精准预测，实现对预测对象的临床治愈概率分层，提高临床治愈发生率。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种乙肝临床治愈预测模型构建方法的流程图。

图2为本发明实施例提供的一种训练集和验证集的临床特征的示例图。

图3为本发明实施例提供的一种获取样本预测对象的样本特征信息的方法的流程图。

图4为本发明实施例提供的一种训练集的KM生存曲线的示例图。

图5为本发明实施例提供的一种验证集的KM生存曲线的示例图。

图6为本发明实施例提供的一种针对各亚组的ROC曲线下面积数据的示例图。

图7为本发明实施例提供的一种乙肝临床治愈预测方法的流程图。

图8为本发明实施例提供的一种乙肝临床治愈预测模型构建装置的结构示意图。

图9为本发明实施例提供的一种基于乙肝临床治愈预测模型的乙肝临床治愈预测装置的结构示意图。

图10为本发明实施例还提供了一种计算机设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例提供的一种乙肝临床治愈预测模型构建方法的流程图。如图1所示，该方法包括：步骤S1-步骤S4。

步骤S1、获取样本预测对象的样本特征信息。

其中，样本预测对象是长时间随访的接受长期抗病毒治疗的慢性乙型肝炎人群。

样本特征信息源于样本预测对象的临床资料，利用样本预测对象随访期间所产生的庞大的所有标志物信息构建，即该样本特征信息是具有时序特征的纵向数据。本发明实施例中，该样本特征信息至少包括按照随访时序记录的样本预测对象的乙肝表面抗原定量信息。

需要说明的是，本实施例中所使用的是乙肝表面抗原定量信息，其包含的是具体的乙肝表面抗原含量的数值，而非仅是阳性或阴性的定性描述，数据准确性更高。

本发明实施例中，该乙肝临床治愈预测模型的构建过程中仅涉及乙肝表面抗原这一个简单易得的临床标志物，有利于临床实际普及与推广。并且，相比于大多数仅利用单个时间点的指标信息构建的预测模型，本发明利用患者随访期间所产生的所有乙肝表面抗原数据构建模型，构建出来的乙肝临床治愈预测模型的准确性和实用性都会增加。

步骤S2、将样本预测对象分为临床治愈组与非临床治愈组。

其中，临床治愈是指慢乙肝的各种症状已经完全消失，慢乙肝疾病本身不会再对患者日常生活造成影响，或者通过相关治疗，慢乙肝疾病本身并没有痊愈，但是患者的生存质量已经得到明显改善，不需要再给予过度治疗。

在一个实施方式中，可以基于样本预测对象连续两次随访的乙肝表面抗原的数据将样本预测对象分为临床治愈组与非临床治愈组。其中，临床治愈组中样本预测对象的连续两次随访的乙肝表面抗原低于预设数值，且该连续两次随访的时间间隔大于预设时间间隔。该预设数值和预设时间间隔可以根据实际应用情况进行设置，例如预设数值可以设置为0.05 IU/ml，该预设时间间隔一般大于或等于6个月，可以设置为6个月或者8个月。

在一个实施方式中，为了方便后续的模型训练过程，可以先将样本预测对象分为训练集和验证集，再将训练集中的样本特征信息分为临床治愈组与非临床治愈组，以及和验证集中的样本特征信息也分为临床治愈组与非临床治愈组。其中，训练集用于参与下述步骤S3和S4（乙肝临床治愈预测模型的构建与训练过程），验证集用于获得训练后的乙肝临床治愈预测模型之后，验证该训练后的乙肝临床治愈预测模型的预测性能。

图2为本发明实施例提供的一种训练集和验证集的临床特征的示例图。该临床特征是指样本预测对象的样本特征信息的整体表现。如图2所示，在一个实施例中，训练集中非临床治愈组的样本预测对象的数量（n）为3616，临床治愈组的样本预测对象的数量73；验证集中非临床治愈组的样本预测对象的数量为5691，临床治愈组的样本预测对象的数量127；p值表示显著性检验的概率值，p小于0.05时则说明两组比较具有统计学意义。该临床特征包含访视次数、访视时长、男性占比、年龄等多项，其中，aMAP评分是一个根据年龄、性别、白蛋白、总胆红素和血小板计算的肝细胞癌（hepatocellular carcinoma，HCC）风险评分，该aMAP评分已在当前的国际合作中被证明在不同病因以及不同种族的患者中具有良好的预测性能。训练集和验证集中，临床治愈组与非临床治愈组具有相似的年龄、性别和肝细胞癌风险评分，且两组间的血小板、总胆红素、肝脏硬度测量值无明显差别。临床治愈组的患者基线时乙肝表面抗原水平和E抗原阳性患者比例更低。

步骤S3、拟合临床治愈组的样本特征信息获得临床治愈组对应的临床治愈组平均轮廓，以及拟合非临床治愈组的样本特征信息，获得非临床治愈组对应的非临床治愈组平均轮廓。

其中，临床治愈组平均轮廓是拟合临床治愈组的样本特征信息获得的平均轮廓；非临床治愈组对应的非临床治愈组平均轮廓是拟合临床治愈组的样本特征信息获得的平均轮廓。

本发明实施例中采用纵向判别分析（Longitudinal Discriminant Analysis,LoDA）进行初始的乙肝临床治愈预测模型的构建，其中，纵向判别分析是一种基于线性混合效应模型（Multivariate Linear Mixed Effect Models, MLMM）利用患者生物标志物的纵向分布进行建模的算法，可用于预测临床治愈。该算法针对发生或未发生临床治愈的患者分别拟合两个不同的MLMM。预测时，LoDA方法通过评估待预测患者的实际标志物纵向分布与发生组和未发生组MLMM的相似度，从而输出分组概率值。

在一个实施方式中，拟合临床治愈组的样本特征信息获得临床治愈组对应的临床治愈组平均轮廓，以及拟合非临床治愈组的样本特征信息，获得非临床治愈组对应的非临床治愈组平均轮廓，包括：利用线性混合效应模型拟合临床治愈组的样本特征信息，获得临床治愈组对应的临床治愈组平均轮廓，以及利用线性混合效应模型（拟合非临床治愈组的样本特征信息，获得非临床治愈组对应的非临床治愈组平均轮廓。

该线性混合效应模型的网络结构如下。

；

；其中，当拟合MLMM时，/>，i代表某位患者，τ代表该患者的某一次随访，μ和γ分别表示拟合变量的线性混合效应模型中的固定系数和随机系数，MVN为正态分布。/>，/>，/>，/>，/>使用贝叶斯马尔可夫链蒙特卡洛算法（Markov-Chain Monte-Carlo, MCMC）进行测算，/>为计算方差和协方差时的模型内部参数。

步骤S4、基于临床治愈组平均轮廓和非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型，获得训练后的乙肝临床治愈预测模型。

其中，训练后的乙肝临床治愈预测模型中包含临床治愈组平均轮廓和非临床治愈组平均轮廓，该训练后的乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率。

在一个实施方式中，训练后的乙肝临床治愈预测模型可以采用边际预测方法（使用对待预测对象观察到的纵向数据的边际分布来预测他们的治愈概率）分别比较待预测对象的特征信息拟合出的轮廓与临床治愈组平均轮廓和非临床治愈组平均轮廓的相似度，给出待预测对象的慢乙肝临床治愈概率，该概率的数值范围为0-1。

其中，边际预测方法是预测待预测对象的分组概率值的最常用方法。当一名新的待预测对象在τ时增加一次随访数据，该待预测对象该次随访的分组概率值将基于边际预测方法计算得出预测评分。边际预测方法的过程如下。

；该公式中，F为分组预测概率；marg表示边际预测法；G表示一位待预测对象；g为组别，g∈{0，1}，其中0表示临床治愈组，1表示非临床治愈组；h为加和号角标；ω={ω₀,ω₁}，ω是长度2的向量，ω表示待预测对象属于每组的先验概率权重比；θ_h、θ_g表示模型学习过程中产生的参数。

本发明实施例提供一种乙肝临床治愈预测模型构建方法，包括：首先，获取样本预测对象的样本特征信息，该样本特征信息包括按照随访时序记录的所述样本预测对象的乙肝表面抗原定量信息；然后，将样本预测对象分为临床治愈组与非临床治愈组；拟合该临床治愈组的样本特征信息，获得临床治愈组对应的临床治愈组平均轮廓，以及拟合非临床治愈组的样本特征信息，获得非临床治愈组对应的非临床治愈组平均轮廓；最后，基于临床治愈组平均轮廓和非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型，获得训练后的乙肝临床治愈预测模型，该训练后的乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率，该乙肝临床治愈预测模型构建过程中使用多个时间点的单个临床标志物（乙肝表面抗原定量信息）进行预测模型构建，能够有效对慢乙肝患者的临床治愈概率进行精准预测，实现对预测对象的临床治愈概率分层，有利于协助医疗机构给与预测对象个体化的、高效的、方便的治疗方案，提高临床治愈发生率。

图3为本发明实施例提供的一种获取样本预测对象的样本特征信息的方法的流程图。如图3所示，获取样本预测对象的样本特征信息的步骤，包括：下述步骤S11-步骤S12。

步骤S11、从特定数据库中获取样本预测对象按照随访时序记录的临床数据。

其中，特定数据库是指医疗机构的内部数据库，其包含样本预测对象的按照随访时序记录的临床数据。

在一个实施方式中，该特定数据库中包含预先获取的10175例长期抗病毒治疗的慢性乙型肝炎患者于2014年5月至2022年8月随访的临床资料。

步骤S12、从临床数据中筛选出符合预设条件的临床数据，以作为样本预测对象的样本特征信息。

其中，预设条件包括：在随访过程中至少包含两次乙肝表面抗原定量信息。

在一个实施方式中，为了保证样本预测信息的质量和有效性，可以剔除随访时间小于第一预设时长的样本预测对象的样本特征信息，因为随访时间过短会导致样本特征信息（时序序列）的纵向深度过短，参考意义受限，其中，第一预设时长可以根据实际应用情况进行设定，例如可以设定为6个月。需要说明的是，在实际应用中，随访间隔一般小于或等于6个月，因此，第一预设时长设置为6个月的情况下，随访时长大于第一预设时长的临床数据中至少包含两次乙肝表面抗原定量信息。

在一个实施方式中，为了保证样本预测信息的质量和有效性，还可以剔除在第二预设时长内临床治愈的样本预测对象的样本特征信息，一是因为该类样本预测对象的样本特征信息会给整体数据带来较大波动；二是因为本发明的目标是实现临床治愈的预测，该样本预测对象在短时间内就已经实现临床治愈，对发明的参考意义较小；其中，第二预设时长可以根据实际应用情况进行设定，例如可以设定为6个月。

在一个实施方式中，基于临床治愈组平均轮廓和非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型，获得训练后的乙肝临床治愈预测模型之后，需要对该训练后的乙肝临床治愈预测模型的预测能力进行验证，以确定该模型的性能。因此，在获得训练后的乙肝临床治愈预测模型之后，还包括：下述步骤一和步骤二。

步骤一、基于样本预测对象的样本特征信息，通过训练后的乙肝临床治愈预测模型获取生存曲线。

其中，生存曲线（Kaplan Meier生存曲线）是被评为低概率组、高概率组的治愈事件发生率比较，两组发生率相差越大，则说明模型的区别能力越好，即模型性能预测越好。

在一个实施方式中，由于样本预测对象的样本特征信息被分为了训练集和验证集，因此，可以通过训练后的乙肝临床治愈预测模型（纵向预测模型）分别获取训练集和验证集的生存曲线。

图4为本发明实施例提供的一种训练集的KM生存曲线的示例图。如图4所示，上面的图中，纵轴为临床治愈累计发生概率，横轴为随访时间，p表示置信度，p小于0.0001说明该生存曲线具有参考意义；虚线表示临床治愈低概率组中临床治愈累计发生率，实线表示临床治愈高概率组中临床治愈累计发生率。下面的表中，表示在不同的随访月份中，训练集中被预测为实现临床治愈低概率的样本的数量，以及被预测为实现临床治愈高概率的样本的数量。

图5为本发明实施例提供的一种验证集的KM生存曲线的示例图。如图5所示，上面的图中，纵轴为临床治愈累计发生概率，横轴为随访时间，p表示对数秩检验统计方法中的显著性检验概率值，p小于0.05时则说明该生存曲线具有参考意义。虚线表示临床治愈低概率组中临床治愈累计发生率，实线表示临床治愈高概率组中临床治愈累计发生率。下面的表中，表示在不同的随访月份中，训练集中被预测为实现临床治愈低概率的样本的数量，以及被预测为实现临床治愈高概率的样本的数量。

步骤二、根据生存曲线评估训练后的乙肝临床治愈预测模型的预测能力。

在一个实施方式中，根据生存曲线评估训练后的乙肝临床治愈预测模型的预测能力的方法，包括：基于生存曲线确定预设随访时间的低概率组与高概率组的临床治愈累计发生概率的差值，在该差值大于预设发生率的情况下，确定该训练后的乙肝临床治愈预测模型的预测能力符合期望预测能力。

其中，预设随访时间可以根据实际应用过程进行设置，例如，第50个月，或者第60个月，本实施例中不进行具体限定。预设发生率可以根据实际应用过程进行设置，本实施例中不进行具体限定。期望预测能力是指预先希望乙肝临床治愈预测模型能够达到的预测能力。

本发明实施例中，基于样本预测对象的样本特征信息，通过训练后的乙肝临床治愈预测模型获取生存曲线，再根据生存曲线评估训练后的乙肝临床治愈预测模型的预测能力，能够有效确定该训练后的乙肝临床治愈预测模型的预测能力。

本发明实施例还提供另一种评估训练后的乙肝临床治愈预测模型的预测能力的方法。该方法中，将训练后的乙肝临床治愈预测模型的这种纵向预测模型，与仅用基线乙肝表面抗原的比例风险回归模型（proportional hazards model，简称COX模型）进行比较，COX回归单因素纳入了性别、年龄、肝硬化、谷丙转氨酶、血小板、总胆红素、甲胎蛋白、aMAP肝癌风险评分、乙肝E抗原和DNA定量等多种特征，通过多因素分析显示仅有基线乙肝表面抗原为预测临床治愈的最佳标志物。

本实施例中，可以通过比较各亚组受试者工作特征曲线（Receiver OperatingCharacteristic，ROC曲线）的下面积数据来比较不同模型的预测能力。各亚组指的是训练集或验证集中各类型的样本预测对象，例如，年龄大于45岁的样本预测对象、患有肝硬化的样本预测对象等等。

图6为本发明实施例提供的一种针对各亚组的ROC曲线下面积数据的示例图。曲线下面积数据的区间为0-1，用于评价模型的性能，该数据值越接近1，则表示模型的性能越好。如图6所示，通过定量数据显示，无论是在训练集还是验证集中，本模型在各亚组间对乙肝抗病毒治疗患者发生临床治愈的预测能力均优于传统的仅用基线乙肝表面抗原所构建的模型。此外，两种模型的区分度比较也显示本模型在各亚组间对乙肝抗病毒治疗患者发生临床治愈的鉴别能力均优于传统的仅用基线乙肝表面抗原所构建的模型，且可降低假阳性与假阴性。

本发明实施中，训练后的乙肝临床治愈预测模型的预测对象为慢乙肝抗病毒治疗患者，其预测效能稳定，不受患者年龄、有无肝硬化、E抗原阴性或阳性和入组乙肝表面抗原等因素影响。

图7为本发明实施例提供的一种乙肝临床治愈预测方法的流程图。如图7所示，该方法包括：步骤S5-步骤S6。

步骤S5、获取待预测对象的目标预测信息。

其中，待预测对象是指待进行临床治愈预测的对象。目标预测信息至少包括按照随访时序记录的目标预测对象的乙肝表面抗原定量信息。

步骤S6、将目标预测信息输入训练后的乙肝临床治愈预测模型中，获取待预测对象的慢乙肝临床治愈概率。

其中，训练后的乙肝临床治愈预测模型用于根据目标预测信息构建待预测对象对应的目标轮廓，并将目标轮廓与自身包含的临床治愈组平均轮廓和非临床治愈组平均轮廓进行比对，输出待预测对象的慢乙肝临床治愈概率。

在一个实施方式中，训练后的乙肝临床治愈预测模型根据目标预测信息构建待预测对象对应的目标轮廓，包括：训练后的乙肝临床治愈预测模型利用线性混合效应模型，根据目标预测信息构建待预测对象对应的目标轮廓。

在一个实施方式中，训练后的乙肝临床治愈预测模型将目标轮廓与自身包含的临床治愈组平均轮廓和非临床治愈组平均轮廓进行比对，输出待预测对象的慢乙肝临床治愈概率，包括：训练后的乙肝临床治愈预测模型边际预测方法将目标轮廓与自身包含的临床治愈组平均轮廓和非临床治愈组平均轮廓进行比对，输出待预测对象的慢乙肝临床治愈概率。

本发明实施例提供一种乙肝临床治愈预测方法，包括：首先获取待预测对象的目标预测信息，该目标预测信息包括按照随访时序记录的目标预测对象的乙肝表面抗原定量信息，然后将目标预测信息输入训练后的乙肝临床治愈预测模型中，获取待预测对象的慢乙肝临床治愈概率，其中，该训练后的乙肝临床治愈预测模型的构建过程中使用多个时间点的单个临床标志物（乙肝表面抗原定量信息）进行预测模型构建，因此，基于该训练后的乙肝临床治愈预测模型的乙肝临床治愈预测方法能够有效对预测对象的临床治愈概率分层，提高临床治愈发生率。

在一个实施方式中，目标预测信息输入训练后的乙肝临床治愈预测模型中，获取待预测对象的慢乙肝临床治愈概率之后，还包括：根据待预测对象的慢乙肝临床治愈概率确定针对预测对象的个性化处理策略。

其中，个性化处理策略是针对预测对象的个性化治疗方案。

在一些实施例中，在慢乙肝临床治愈概率小于预设概率的情况下，针对预测对象的个性化处理策略可以是维持原有抗病毒治疗；在慢乙肝临床治愈概率大于或等于预设概率的情况下，针对预测对象的个性化处理策略可以是停止治疗处理或者是使用对该待预测对象有效果的乙肝新药物。

在一些实施中，针对乙肝患者的临床治疗中，核苷（酸）类似物药物与干扰素类药物的初始联合治疗、序贯治疗、序贯联合治疗等多种策略可一定程度上提高特定人群的临床治愈发生率。此外，目前众多乙肝新药物临床试验展示了较为良好的结果，包括RNA干扰药物、病毒进入抑制剂及治疗性乙肝疫苗等。准确预测慢乙肝患者临床治愈一方面有助于临床策略或新药随机试验的受试者筛选与分层模型设计，以平衡各组受试者特征，并极有可能提高试验临床发生率，增大试验效率。而识别为临床治愈发生概率低的乙肝患者则可继续维持原有抗病毒治疗。

图8为本发明实施例提供的一种乙肝临床治愈预测模型构建装置的结构示意图。如图8所示，该装置包括：样本获取模块81、分组模块82、拟合模块83和训练模块84。

样本获取模块81，用于获取样本预测对象的样本特征信息.

其中，样本特征信息包括按照随访时序记录的样本预测对象的乙肝表面抗原定量信息。

在一个实施方式中，样本获取模块81还用于从特定数据库中获取样本预测对象按照随访时序记录的临床数据；从临床数据中筛选出符合预设条件的临床数据，以作为样本预测对象的样本特征信息；其中，预设条件包括随访时间大于第一预设时长以及未治愈持续时间大于第二预设时长。

分组模块82，用于将样本预测对象分为临床治愈组与非临床治愈组。

拟合模块83，拟合所述临床治愈组的样本特征信息，获得所述临床治愈组对应的临床治愈组平均轮廓，还用于拟合所述非临床治愈组的样本特征信息，获得所述非临床治愈组对应的非临床治愈组平均轮廓。

训练模块84，用于基于临床治愈组平均轮廓和非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型，获得训练后的乙肝临床治愈预测模型。其中，训练后的乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率。

在一个实施方式中，该乙肝临床治愈预测模型构建装置还包括评估模块，该评估模块用于基于样本预测对象的样本特征信息，通过训练后的乙肝临床治愈预测模型获取生存曲线；根据生存曲线评估训练后的乙肝临床治愈预测模型的预测能力。

本发明实施例提供一种乙肝临床治愈预测模型构建装置，包括：样本获取模块，用于获取样本预测对象的样本特征信息，该样本特征信息包括按照随访时序记录的样本预测对象的乙肝表面抗原定量信息；分组模块用于将样本预测对象分为临床治愈组与非临床治愈组；拟合模块用于拟合该临床治愈组的样本特征信息，获得临床治愈组对应的临床治愈组平均轮廓，以及拟合非临床治愈组的样本特征信息，获得非临床治愈组对应的非临床治愈组平均轮廓；训练模块用于基于临床治愈组平均轮廓和非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型，获得训练后的乙肝临床治愈预测模型，该训练后的乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率，该乙肝临床治愈预测模型构建过程中使用多个时间点的单个临床标志物（乙肝表面抗原定量信息）进行预测模型构建，能够有效对预测对象的临床治愈概率分层，提高临床治愈发生率。

图9为本发明实施例提供的一种基于乙肝临床治愈预测模型的乙肝临床治愈预测装置的结构示意图。如图9所示，该装置包括：目标获取模块91和预测模块92。

目标获取模块91，用于获取待预测对象的目标预测信息，其中，目标预测信息包括按照随访时序记录的目标预测对象的乙肝表面抗原定量信息。

预测模块92，用于将目标预测信息输入训练后的乙肝临床治愈预测模型中，获取待预测对象的慢乙肝临床治愈概率，其中，训练后的乙肝临床治愈预测模型用于根据目标预测信息构建待预测对象对应的目标轮廓，并将目标轮廓与自身包含的临床治愈组平均轮廓和非临床治愈组平均轮廓进行比对，输出待预测对象的慢乙肝临床治愈概率。

本发明实施例提供一种基于乙肝临床治愈预测模型的乙肝临床治愈预测装置，包括：目标获取模块用于获取待预测对象的目标预测信息，该目标预测信息包括按照随访时序记录的目标预测对象的乙肝表面抗原定量信息，然后将目标预测信息输入训练后的乙肝临床治愈预测模型中，预测模块用于获取待预测对象的慢乙肝临床治愈概率，其中，该训练后的乙肝临床治愈预测模型的构建过程中使用多个时间点的单个临床标志物（乙肝表面抗原定量信息）进行预测模型构建，因此，基于该训练后的乙肝临床治愈预测模型的乙肝临床治愈预测方法能够有效对预测对象的临床治愈概率分层，提高临床治愈发生率。

图10为本发明实施例还提供了一种计算机设备的结构示意图。如图10所示，该计算机设备可以包括处理器1001和存储器1002，其中处理器1001和存储器1002可以通过总线或者其他方式连接，图10中以通过总线连接为例。

处理器1001可以为中央处理器（Central Processing Unit，CPU）。处理器1001还可以为其他通用处理器、数字信号处理器（Digital Signal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现场可编程门阵列（Field-Programmable Gate Array，FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片，或者上述各类芯片的组合。

存储器1002作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块，如本发明实施例中的乙肝临床治愈预测模型构建方法对应的程序指令/模块，或者本发明实施例中的乙肝临床治愈预测方法对应的程序指令/模块。处理器1001通过运行存储在存储器1002中的非暂态软件程序、指令以及模块，从而执行处理器的各种功能应用以及数据处理，即实现上述方法实施例中的乙肝临床治愈预测模型构建方法，或者实现上述方法实施例中的乙肝临床治愈预测方法。

存储器1002可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储处理器1001所创建的数据等。此外，存储器1002可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中，存储器1002可选包括相对于处理器1001远程设置的存储器，这些远程存储器可以通过网络连接至处理器1001。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

一个或者多个模块存储在存储器1002中，当被处理器1001执行时，执行前述实施例中的乙肝临床治愈预测模型构建方法或者乙肝临床治愈预测方法。

上述计算机设备具体细节可以对应参阅图1所示的实施例中对应的相关描述和效果进行理解，此处不再赘述。

本领域技术人员可以理解，实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述存储介质可为磁碟、光盘、只读存储记忆体（Read-Only Memory，ROM）、随机存储记忆体（Random AccessMemory，RAM）、快闪存储器（Flash Memory）、硬盘（Hard Disk Drive，缩写：HDD）或固态硬盘（Solid-State Drive，SSD)等；所述存储介质还可以包括上述种类的存储器的组合。

虽然结合附图描述了本发明的实施例，但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型，这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims

1.一种乙肝临床治愈预测模型构建方法，其特征在于，所述方法包括：

获取样本预测对象的样本特征信息；所述样本特征信息包括按照随访时序记录的所述样本预测对象的乙肝表面抗原定量信息；其中，样本预测对象是长时间随访的接受长期抗病毒治疗的慢性乙型肝炎人群；

将样本预测对象分为临床治愈组与非临床治愈组；其中，临床治愈组中样本预测对象的连续两次随访的乙肝表面抗原低于预设数值，且该连续两次随访的时间间隔大于预设时间间隔；

拟合所述临床治愈组的样本特征信息，获得所述临床治愈组对应的临床治愈组平均轮廓；以及拟合所述非临床治愈组的样本特征信息，获得所述非临床治愈组对应的非临床治愈组平均轮廓；

基于所述临床治愈组平均轮廓和所述非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型，获得训练后的所述乙肝临床治愈预测模型；训练后的所述乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率；

所述拟合所述临床治愈组的样本特征信息，获得所述临床治愈组对应的临床治愈组平均轮廓，包括：

利用线性混合效应模型，拟合所述临床治愈组的乙肝表面抗原定量信息的时间变化特征，获得所述临床治愈组对应的临床治愈组平均轮廓；

所述拟合所述非临床治愈组的样本特征信息，获得所述非临床治愈组对应的非临床治愈组平均轮廓，包括：

利用线性混合效应模型，拟合所述非临床治愈组的乙肝表面抗原定量信息的时间变化特征，获得所述非临床治愈组对应的非临床治愈组平均轮廓；

线性混合效应模型的网络结构如下：

；

；其中，当拟合MLMM时，/>，i代表某位患者，τ代表该患者的某一次随访，μ和γ分别表示拟合变量的线性混合效应模型中的固定系数和随机系数，MVN为正态分布，/>，/>，/>，/>，/>使用贝叶斯马尔可夫链蒙特卡洛算法进行测算，/>为计算方差和协方差时的模型内部参数；

训练后的乙肝临床治愈预测模型采用边际预测方法分别比较待预测对象的特征信息拟合出的轮廓与临床治愈组平均轮廓和非临床治愈组平均轮廓的相似度，给出待预测对象的慢乙肝临床治愈概率，该概率的数值范围为0-1；

当一名新的待预测对象在τ时增加一次随访数据，该待预测对象该次随访的分组概率值将基于边际预测方法计算得出预测评分，边际预测方法的过程如下；

2.根据权利要求1所述的方法，其特征在于，所述获取样本预测对象的样本特征信息的步骤，包括：

从特定数据库中获取所述样本预测对象按照随访时序记录的临床数据；

从所述临床数据中筛选出符合预设条件的临床数据，以作为所述样本预测对象的样本特征信息；所述预设条件包括：在随访过程中至少包含两次乙肝表面抗原定量信息。

3.根据权利要求1所述的方法，其特征在于，所述基于所述临床治愈组平均轮廓和所述非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型，获得训练后的所述乙肝临床治愈预测模型之后，所述方法还包括：

基于样本预测对象的样本特征信息，通过训练后的所述乙肝临床治愈预测模型获取生存曲线；

根据所述生存曲线评估训练后的所述乙肝临床治愈预测模型的预测能力。

4.一种基于如权利要求1-3中任一项所述的乙肝临床治愈预测模型构建方法的乙肝临床治愈预测方法，其特征在于，所述方法包括：

获取待预测对象的目标预测信息；所述目标预测信息包括按照随访时序记录的所述目标预测对象的乙肝表面抗原定量信息；

将所述目标预测信息输入训练后的乙肝临床治愈预测模型中，获取所述待预测对象的慢乙肝临床治愈概率，其中，训练后的乙肝临床治愈预测模型用于根据所述目标预测信息构建所述待预测对象对应的目标轮廓，并将所述目标轮廓与自身包含的临床治愈组平均轮廓和非临床治愈组平均轮廓进行比对，输出待预测对象的慢乙肝临床治愈概率；

训练后的乙肝临床治愈预测模型根据目标预测信息构建待预测对象对应的目标轮廓，包括：训练后的乙肝临床治愈预测模型利用线性混合效应模型，根据目标预测信息构建待预测对象对应的目标轮廓；

线性混合效应模型的网络结构如下：

；

当一名新的待预测对象在τ时增加一次随访数据，该待预测对象该次随访的分组概率值将基于边际预测方法计算得出预测评分，边际预测方法的过程如下;

5.根据权利要求4所述的方法，其特征在于，将所述目标预测信息输入训练后的乙肝临床治愈预测模型中，获取所述待预测对象的慢乙肝临床治愈概率之后，还包括：

根据所述待预测对象的慢乙肝临床治愈概率确定针对所述预测对象的个性化处理策略。

6.一种乙肝临床治愈预测模型构建装置，其特征在于，所述装置包括：

样本获取模块，用于获取样本预测对象的样本特征信息；所述样本特征信息包括按照随访时序记录的所述样本预测对象的乙肝表面抗原定量信息；其中，样本预测对象是长时间随访的接受长期抗病毒治疗的慢性乙型肝炎人群；

分组模块，用于将样本预测对象分为临床治愈组与非临床治愈组；其中，临床治愈组中样本预测对象的连续两次随访的乙肝表面抗原低于预设数值，且该连续两次随访的时间间隔大于预设时间间隔；

拟合模块，拟合所述临床治愈组的样本特征信息，获得所述临床治愈组对应的临床治愈组平均轮廓，还用于拟合所述非临床治愈组的样本特征信息，获得所述非临床治愈组对应的非临床治愈组平均轮廓；

训练模块，用于基于所述临床治愈组平均轮廓和所述非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型，获得训练后的所述乙肝临床治愈预测模型；训练后的所述乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率；

线性混合效应模型的网络结构如下：

；

7.一种基于乙肝临床治愈预测模型的乙肝临床治愈预测装置，其特征在于，所述装置包括：

目标获取模块，用于获取待预测对象的目标预测信息；所述目标预测信息包括按照随访时序记录的所述目标预测对象的乙肝表面抗原定量信息；

预测模块，用于将所述目标预测信息输入训练后的乙肝临床治愈预测模型中，获取所述待预测对象的慢乙肝临床治愈概率，其中，训练后的乙肝临床治愈预测模型用于根据所述目标预测信息构建所述待预测对象对应的目标轮廓，并将所述目标轮廓与自身包含的临床治愈组平均轮廓和非临床治愈组平均轮廓进行比对，输出待预测对象的慢乙肝临床治愈概率；

线性混合效应模型的网络结构如下：

；

8.一种计算机设备，其特征在于，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行如权利要求1-3任一项所述的乙肝临床治愈预测模型构建方法的步骤，或者，执行如权利要求4或5所述的乙肝临床治愈预测方法的步骤。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-3任一项所述的乙肝临床治愈预测模型构建方法的步骤，或者，执行如权利要求4或5所述的乙肝临床治愈预测方法的步骤。