CN116386901B - 乙肝临床治愈预测模型构建方法及装置、预测方法及装置 - Google Patents
乙肝临床治愈预测模型构建方法及装置、预测方法及装置 Download PDFInfo
- Publication number
- CN116386901B CN116386901B CN202310655438.2A CN202310655438A CN116386901B CN 116386901 B CN116386901 B CN 116386901B CN 202310655438 A CN202310655438 A CN 202310655438A CN 116386901 B CN116386901 B CN 116386901B
- Authority
- CN
- China
- Prior art keywords
- clinical cure
- prediction
- hepatitis
- group
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000002672 hepatitis B Diseases 0.000 title claims abstract description 195
- 238000000034 method Methods 0.000 title claims abstract description 110
- 208000000419 Chronic Hepatitis B Diseases 0.000 claims abstract description 53
- 239000000427 antigen Substances 0.000 claims abstract description 50
- 102000036639 antigens Human genes 0.000 claims abstract description 50
- 108091007433 antigens Proteins 0.000 claims abstract description 50
- 238000012549 training Methods 0.000 claims abstract description 33
- 238000010276 construction Methods 0.000 claims abstract description 15
- 208000006454 hepatitis Diseases 0.000 claims description 63
- 231100000283 hepatitis Toxicity 0.000 claims description 63
- 230000000694 effects Effects 0.000 claims description 25
- 238000011282 treatment Methods 0.000 claims description 25
- 230000004083 survival effect Effects 0.000 claims description 21
- 230000015654 memory Effects 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 18
- 238000009826 distribution Methods 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 7
- 238000011269 treatment regimen Methods 0.000 claims description 7
- 230000000840 anti-viral effect Effects 0.000 claims description 6
- 230000007774 longterm Effects 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 5
- 238000005259 measurement Methods 0.000 claims description 5
- 239000003550 marker Substances 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 12
- 239000003814 drug Substances 0.000 description 9
- 238000012795 verification Methods 0.000 description 9
- 238000012360 testing method Methods 0.000 description 7
- 230000001186 cumulative effect Effects 0.000 description 6
- 229940079593 drug Drugs 0.000 description 6
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 4
- 241000700721 Hepatitis B virus Species 0.000 description 3
- 238000008050 Total Bilirubin Reagent Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 208000019425 cirrhosis of liver Diseases 0.000 description 3
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 206010016654 Fibrosis Diseases 0.000 description 2
- 102000014150 Interferons Human genes 0.000 description 2
- 108010050904 Interferons Proteins 0.000 description 2
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000007882 cirrhosis Effects 0.000 description 2
- 238000002648 combination therapy Methods 0.000 description 2
- 238000011284 combination treatment Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 229940079322 interferon Drugs 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000002547 new drug Substances 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 1
- 108010082126 Alanine transaminase Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 238000013382 DNA quantification Methods 0.000 description 1
- 102000013529 alpha-Fetoproteins Human genes 0.000 description 1
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 238000001325 log-rank test Methods 0.000 description 1
- 238000002620 method output Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Chemical & Material Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Toxicology (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种乙肝临床治愈预测模型构建方法及装置、预测方法及装置。模型构建方法包括:获取样本预测对象的样本特征信息,该样本特征信息包括按照随访时序记录的样本预测对象的乙肝表面抗原定量信息;将样本预测对象分为临床治愈组与非临床治愈组;拟合该临床治愈组的样本特征信息,获得临床治愈组平均轮廓;拟合非临床治愈组的样本特征信息,获得非临床治愈组平均轮廓;基于临床治愈组平均轮廓和非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型,获得训练后的乙肝临床治愈预测模型。该模型构建方法使用具有时序特征的单个临床标志物进行预测模型构建,能够有效对慢乙肝患者的临床治愈概率进行精准预测。
Description
技术领域
本发明涉及信息处理技术领域,具体涉及一种乙肝临床治愈预测模型构建方法及装置、预测方法及装置。
背景技术
慢性乙型肝炎(慢乙肝)病毒感染是重大的公共卫生问题,临床治愈是目前最新慢乙肝防治指南推荐的理想治疗目标。核苷(酸)类似物药物与干扰素类药物的初始联合治疗、序贯治疗、序贯联合治疗等多种策略可一定程度上提高特定人群的临床治愈发生率。另外,目前众多乙肝新药物临床试验也展示了较为良好的治疗结果,包括RNA干扰药物、病毒进入抑制剂及治疗性乙肝疫苗等。
对慢乙肝患者是否能实现临床治愈进行预测,有助于上述临床策略或新药随机试验的受试者筛选与分层模型设计,以平衡各组受试者特征,提高临床试验效率。同时,临床治愈概率低的患者可选择持续原有治疗选择,避免无效的治疗方案更改。然而,当前对慢乙肝患者是否能实现临床治愈通常是通过临床医生根据经验进行预估,准确性差。当前缺乏高准确性的乙肝临床治愈预测模型,难以对慢乙肝患者的临床治愈概率进行精准预测。
发明内容
有鉴于此,本发明实施例提供了一种乙肝临床治愈预测模型构建方法及装置、预测方法及装置,以解决当前没有有效方法对慢乙肝患者的临床治愈概率进行精准预测的问题。
根据第一方面,本发明实施例提供了一种乙肝临床治愈预测模型构建方法,该方法包括:获取样本预测对象的样本特征信息;所述样本特征信息包括按照随访时序记录的所述样本预测对象的乙肝表面抗原定量信息;将样本预测对象分为临床治愈组与非临床治愈组;拟合所述临床治愈组的样本特征信息,获得所述临床治愈组对应的临床治愈组平均轮廓;以及拟合所述非临床治愈组的样本特征信息,获得所述非临床治愈组对应的非临床治愈组平均轮廓;基于所述临床治愈组平均轮廓和所述非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型,获得训练后的所述乙肝临床治愈预测模型;训练后的所述乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率。
在一些实施例中,所述获取样本预测对象的样本特征信息的步骤,包括:从特定数据库中获取所述样本预测对象按照随访时序记录的临床数据;从所述临床数据中筛选出符合预设条件的临床数据,以作为所述样本预测对象的样本特征信息;所述预设条件包括:在随访过程中至少包含两次乙肝表面抗原定量信息。
在一些实施例中,所述拟合所述临床治愈组的样本特征信息,获得所述临床治愈组对应的临床治愈组平均轮廓,包括:利用线性混合效应模型,拟合所述临床治愈组的乙肝表面抗原定量信息的时间变化特征,获得所述临床治愈组对应的临床治愈组平均轮廓;所述拟合所述非临床治愈组的样本特征信息,获得所述非临床治愈组对应的非临床治愈组平均轮廓,包括:利用线性混合效应模型,拟合所述非临床治愈组的乙肝表面抗原定量信息的时间变化特征,获得所述非临床治愈组对应的非临床治愈组平均轮廓。
在一些实施例中,所述基于所述临床治愈组平均轮廓和所述非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型,获得训练后的所述乙肝临床治愈预测模型之后,还包括:基于样本预测对象的样本特征信息,通过训练后的所述乙肝临床治愈预测模型获取生存曲线;根据所述生存曲线评估训练后的所述乙肝临床治愈预测模型的预测能力。
根据第二方面,本发明实施例提供了一种基于乙肝临床治愈预测模型构建方法的乙肝临床治愈预测方法,其特征在于,所述方法包括:获取待预测对象的目标预测信息;所述目标预测信息包括按照随访时序记录的所述目标预测对象的乙肝表面抗原定量信息;将所述目标预测信息输入训练后的乙肝临床治愈预测模型中,获取所述待预测对象的慢乙肝临床治愈概率,其中,训练后的乙肝临床治愈预测模型用于根据所述目标预测信息构建所述待预测对象对应的目标轮廓,并将所述目标轮廓与自身包含的临床治愈组平均轮廓和非临床治愈组平均轮廓进行比对,输出待预测对象的慢乙肝临床治愈概率。
在一些实施例中,将所述目标预测信息输入训练后的乙肝临床治愈预测模型中,获取所述待预测对象的慢乙肝临床治愈概率之后,还包括:根据所述待预测对象的慢乙肝临床治愈概率确定针对所述预测对象的个性化处理策略。
根据第三方面,本发明实施例提供了一种乙肝临床治愈预测模型构建装置,该装置包括:样本获取模块,用于获取样本预测对象的样本特征信息;所述样本特征信息包括按照随访时序记录的所述样本预测对象的乙肝表面抗原定量信息;分组模块,用于将样本预测对象分为临床治愈组与非临床治愈组;拟合模块,拟合所述临床治愈组的样本特征信息,获得所述临床治愈组对应的临床治愈组平均轮廓,还用于拟合所述非临床治愈组的样本特征信息,获得所述非临床治愈组对应的非临床治愈组平均轮廓;训练模块,用于基于所述临床治愈组平均轮廓和所述非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型,获得训练后的所述乙肝临床治愈预测模型;训练后的所述乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率。
根据第四方面,本发明实施例提供了一种基于乙肝临床治愈预测模型的乙肝临床治愈预测装置,该装置包括:目标获取模块,用于获取待预测对象的目标预测信息;所述目标预测信息包括按照随访时序记录的所述目标预测对象的乙肝表面抗原定量信息;预测模块,用于将所述目标预测信息输入训练后的乙肝临床治愈预测模型中,获取所述待预测对象的慢乙肝临床治愈概率,其中,训练后的乙肝临床治愈预测模型用于根据所述目标预测信息构建所述待预测对象对应的目标轮廓,并将所述目标轮廓与自身包含的临床治愈组平均轮廓和非临床治愈组平均轮廓进行比对,输出待预测对象的慢乙肝临床治愈概率。
根据第五方面,本发明实施例提供了一种计算机设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如第一方面所述的乙肝临床治愈预测模型构建方法的步骤,或者,执行如第二方面所述的乙肝临床治愈预测方法的步骤。
根据第六方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如第一方面所述的乙肝临床治愈预测模型构建方法的步骤,或者,执行如第一方面所述的乙肝临床治愈预测方法的步骤。
本发明技术方案,具有如下优点。
本发明实施例提供一种乙肝临床治愈预测模型构建方法及装置、预测方法及装置,包括:获取样本预测对象的样本特征信息,该样本特征信息包括按照随访时序记录的所述样本预测对象的乙肝表面抗原定量信息;将样本预测对象分为临床治愈组与非临床治愈组;拟合该临床治愈组的样本特征信息,获得临床治愈组对应的临床治愈组平均轮廓,以及拟合非临床治愈组的样本特征信息,获得非临床治愈组对应的非临床治愈组平均轮廓;基于临床治愈组平均轮廓和非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型,获得训练后的乙肝临床治愈预测模型,该训练后的乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率,该乙肝临床治愈预测模型构建过程中使用多个时间点的单个临床标志物(乙肝表面抗原定量信息)进行预测模型构建,能够有效对慢乙肝患者的临床治愈概率进行精准预测,实现对预测对象的临床治愈概率分层,提高临床治愈发生率。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种乙肝临床治愈预测模型构建方法的流程图。
图2为本发明实施例提供的一种训练集和验证集的临床特征的示例图。
图3为本发明实施例提供的一种获取样本预测对象的样本特征信息的方法的流程图。
图4为本发明实施例提供的一种训练集的KM生存曲线的示例图。
图5为本发明实施例提供的一种验证集的KM生存曲线的示例图。
图6为本发明实施例提供的一种针对各亚组的ROC曲线下面积数据的示例图。
图7为本发明实施例提供的一种乙肝临床治愈预测方法的流程图。
图8为本发明实施例提供的一种乙肝临床治愈预测模型构建装置的结构示意图。
图9为本发明实施例提供的一种基于乙肝临床治愈预测模型的乙肝临床治愈预测装置的结构示意图。
图10为本发明实施例还提供了一种计算机设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种乙肝临床治愈预测模型构建方法的流程图。如图1所示,该方法包括:步骤S1-步骤S4。
步骤S1、获取样本预测对象的样本特征信息。
其中,样本预测对象是长时间随访的接受长期抗病毒治疗的慢性乙型肝炎人群。
样本特征信息源于样本预测对象的临床资料,利用样本预测对象随访期间所产生的庞大的所有标志物信息构建,即该样本特征信息是具有时序特征的纵向数据。本发明实施例中,该样本特征信息至少包括按照随访时序记录的样本预测对象的乙肝表面抗原定量信息。
需要说明的是,本实施例中所使用的是乙肝表面抗原定量信息,其包含的是具体的乙肝表面抗原含量的数值,而非仅是阳性或阴性的定性描述,数据准确性更高。
本发明实施例中,该乙肝临床治愈预测模型的构建过程中仅涉及乙肝表面抗原这一个简单易得的临床标志物,有利于临床实际普及与推广。并且,相比于大多数仅利用单个时间点的指标信息构建的预测模型,本发明利用患者随访期间所产生的所有乙肝表面抗原数据构建模型,构建出来的乙肝临床治愈预测模型的准确性和实用性都会增加。
步骤S2、将样本预测对象分为临床治愈组与非临床治愈组。
其中,临床治愈是指慢乙肝的各种症状已经完全消失,慢乙肝疾病本身不会再对患者日常生活造成影响,或者通过相关治疗,慢乙肝疾病本身并没有痊愈,但是患者的生存质量已经得到明显改善,不需要再给予过度治疗。
在一个实施方式中,可以基于样本预测对象连续两次随访的乙肝表面抗原的数据将样本预测对象分为临床治愈组与非临床治愈组。其中,临床治愈组中样本预测对象的连续两次随访的乙肝表面抗原低于预设数值,且该连续两次随访的时间间隔大于预设时间间隔。该预设数值和预设时间间隔可以根据实际应用情况进行设置,例如预设数值可以设置为0.05 IU/ml,该预设时间间隔一般大于或等于6个月,可以设置为6个月或者8个月。
在一个实施方式中,为了方便后续的模型训练过程,可以先将样本预测对象分为训练集和验证集,再将训练集中的样本特征信息分为临床治愈组与非临床治愈组,以及和验证集中的样本特征信息也分为临床治愈组与非临床治愈组。其中,训练集用于参与下述步骤S3和S4(乙肝临床治愈预测模型的构建与训练过程),验证集用于获得训练后的乙肝临床治愈预测模型之后,验证该训练后的乙肝临床治愈预测模型的预测性能。
图2为本发明实施例提供的一种训练集和验证集的临床特征的示例图。该临床特征是指样本预测对象的样本特征信息的整体表现。如图2所示,在一个实施例中,训练集中非临床治愈组的样本预测对象的数量(n)为3616,临床治愈组的样本预测对象的数量73;验证集中非临床治愈组的样本预测对象的数量为5691,临床治愈组的样本预测对象的数量127;p值表示显著性检验的概率值,p小于0.05时则说明两组比较具有统计学意义。该临床特征包含访视次数、访视时长、男性占比、年龄等多项,其中,aMAP评分是一个根据年龄、性别、白蛋白、总胆红素和血小板计算的肝细胞癌(hepatocellular carcinoma,HCC)风险评分,该aMAP评分已在当前的国际合作中被证明在不同病因以及不同种族的患者中具有良好的预测性能。训练集和验证集中,临床治愈组与非临床治愈组具有相似的年龄、性别和肝细胞癌风险评分,且两组间的血小板、总胆红素、肝脏硬度测量值无明显差别。临床治愈组的患者基线时乙肝表面抗原水平和E抗原阳性患者比例更低。
步骤S3、拟合临床治愈组的样本特征信息获得临床治愈组对应的临床治愈组平均轮廓,以及拟合非临床治愈组的样本特征信息,获得非临床治愈组对应的非临床治愈组平均轮廓。
其中,临床治愈组平均轮廓是拟合临床治愈组的样本特征信息获得的平均轮廓;非临床治愈组对应的非临床治愈组平均轮廓是拟合临床治愈组的样本特征信息获得的平均轮廓。
本发明实施例中采用纵向判别分析(Longitudinal Discriminant Analysis,LoDA)进行初始的乙肝临床治愈预测模型的构建,其中,纵向判别分析是一种基于线性混合效应模型(Multivariate Linear Mixed Effect Models, MLMM)利用患者生物标志物的纵向分布进行建模的算法,可用于预测临床治愈。该算法针对发生或未发生临床治愈的患者分别拟合两个不同的MLMM。预测时,LoDA方法通过评估待预测患者的实际标志物纵向分布与发生组和未发生组MLMM的相似度,从而输出分组概率值。
在一个实施方式中,拟合临床治愈组的样本特征信息获得临床治愈组对应的临床治愈组平均轮廓,以及拟合非临床治愈组的样本特征信息,获得非临床治愈组对应的非临床治愈组平均轮廓,包括:利用线性混合效应模型拟合临床治愈组的样本特征信息,获得临床治愈组对应的临床治愈组平均轮廓,以及利用线性混合效应模型(拟合非临床治愈组的样本特征信息,获得非临床治愈组对应的非临床治愈组平均轮廓。
该线性混合效应模型的网络结构如下。
;
;其中,当拟合MLMM时,/>,i代表某位患者,τ代表该患者的某一次随访,μ和γ分别表示拟合变量的线性混合效应模型中的固定系数和随机系数,MVN为正态分布。/>,/>,/>,/>,/>使用贝叶斯马尔可夫链蒙特卡洛算法(Markov-Chain Monte-Carlo, MCMC)进行测算,/>为计算方差和协方差时的模型内部参数。
步骤S4、基于临床治愈组平均轮廓和非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型,获得训练后的乙肝临床治愈预测模型。
其中,训练后的乙肝临床治愈预测模型中包含临床治愈组平均轮廓和非临床治愈组平均轮廓,该训练后的乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率。
在一个实施方式中,训练后的乙肝临床治愈预测模型可以采用边际预测方法(使用对待预测对象观察到的纵向数据的边际分布来预测他们的治愈概率)分别比较待预测对象的特征信息拟合出的轮廓与临床治愈组平均轮廓和非临床治愈组平均轮廓的相似度,给出待预测对象的慢乙肝临床治愈概率,该概率的数值范围为0-1。
其中,边际预测方法是预测待预测对象的分组概率值的最常用方法。当一名新的待预测对象在τ时增加一次随访数据,该待预测对象该次随访的分组概率值将基于边际预测方法计算得出预测评分。边际预测方法的过程如下。
;该公式中,F为分组预测概率;marg表示边际预测法;G表示一位待预测对象;g为组别,g∈{0,1},其中0表示临床治愈组,1表示非临床治愈组;h为加和号角标;ω={ω0,ω1},ω是长度2的向量,ω表示待预测对象属于每组的先验概率权重比;θh、θg表示模型学习过程中产生的参数。
本发明实施例提供一种乙肝临床治愈预测模型构建方法,包括:首先,获取样本预测对象的样本特征信息,该样本特征信息包括按照随访时序记录的所述样本预测对象的乙肝表面抗原定量信息;然后,将样本预测对象分为临床治愈组与非临床治愈组;拟合该临床治愈组的样本特征信息,获得临床治愈组对应的临床治愈组平均轮廓,以及拟合非临床治愈组的样本特征信息,获得非临床治愈组对应的非临床治愈组平均轮廓;最后,基于临床治愈组平均轮廓和非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型,获得训练后的乙肝临床治愈预测模型,该训练后的乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率,该乙肝临床治愈预测模型构建过程中使用多个时间点的单个临床标志物(乙肝表面抗原定量信息)进行预测模型构建,能够有效对慢乙肝患者的临床治愈概率进行精准预测,实现对预测对象的临床治愈概率分层,有利于协助医疗机构给与预测对象个体化的、高效的、方便的治疗方案,提高临床治愈发生率。
图3为本发明实施例提供的一种获取样本预测对象的样本特征信息的方法的流程图。如图3所示,获取样本预测对象的样本特征信息的步骤,包括:下述步骤S11-步骤S12。
步骤S11、从特定数据库中获取样本预测对象按照随访时序记录的临床数据。
其中,特定数据库是指医疗机构的内部数据库,其包含样本预测对象的按照随访时序记录的临床数据。
在一个实施方式中,该特定数据库中包含预先获取的10175例长期抗病毒治疗的慢性乙型肝炎患者于2014年5月至2022年8月随访的临床资料。
步骤S12、从临床数据中筛选出符合预设条件的临床数据,以作为样本预测对象的样本特征信息。
其中,预设条件包括:在随访过程中至少包含两次乙肝表面抗原定量信息。
在一个实施方式中,为了保证样本预测信息的质量和有效性,可以剔除随访时间小于第一预设时长的样本预测对象的样本特征信息,因为随访时间过短会导致样本特征信息(时序序列)的纵向深度过短,参考意义受限,其中,第一预设时长可以根据实际应用情况进行设定,例如可以设定为6个月。需要说明的是,在实际应用中,随访间隔一般小于或等于6个月,因此,第一预设时长设置为6个月的情况下,随访时长大于第一预设时长的临床数据中至少包含两次乙肝表面抗原定量信息。
在一个实施方式中,为了保证样本预测信息的质量和有效性,还可以剔除在第二预设时长内临床治愈的样本预测对象的样本特征信息,一是因为该类样本预测对象的样本特征信息会给整体数据带来较大波动;二是因为本发明的目标是实现临床治愈的预测,该样本预测对象在短时间内就已经实现临床治愈,对发明的参考意义较小;其中,第二预设时长可以根据实际应用情况进行设定,例如可以设定为6个月。
在一个实施方式中,基于临床治愈组平均轮廓和非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型,获得训练后的乙肝临床治愈预测模型之后,需要对该训练后的乙肝临床治愈预测模型的预测能力进行验证,以确定该模型的性能。因此,在获得训练后的乙肝临床治愈预测模型之后,还包括:下述步骤一和步骤二。
步骤一、基于样本预测对象的样本特征信息,通过训练后的乙肝临床治愈预测模型获取生存曲线。
其中,生存曲线(Kaplan Meier生存曲线)是被评为低概率组、高概率组的治愈事件发生率比较,两组发生率相差越大,则说明模型的区别能力越好,即模型性能预测越好。
在一个实施方式中,由于样本预测对象的样本特征信息被分为了训练集和验证集,因此,可以通过训练后的乙肝临床治愈预测模型(纵向预测模型)分别获取训练集和验证集的生存曲线。
图4为本发明实施例提供的一种训练集的KM生存曲线的示例图。如图4所示,上面的图中,纵轴为临床治愈累计发生概率,横轴为随访时间,p表示置信度,p小于0.0001说明该生存曲线具有参考意义;虚线表示临床治愈低概率组中临床治愈累计发生率,实线表示临床治愈高概率组中临床治愈累计发生率。下面的表中,表示在不同的随访月份中,训练集中被预测为实现临床治愈低概率的样本的数量,以及被预测为实现临床治愈高概率的样本的数量。
图5为本发明实施例提供的一种验证集的KM生存曲线的示例图。如图5所示,上面的图中,纵轴为临床治愈累计发生概率,横轴为随访时间,p表示对数秩检验统计方法中的显著性检验概率值,p小于0.05时则说明该生存曲线具有参考意义。虚线表示临床治愈低概率组中临床治愈累计发生率,实线表示临床治愈高概率组中临床治愈累计发生率。下面的表中,表示在不同的随访月份中,训练集中被预测为实现临床治愈低概率的样本的数量,以及被预测为实现临床治愈高概率的样本的数量。
步骤二、根据生存曲线评估训练后的乙肝临床治愈预测模型的预测能力。
在一个实施方式中,根据生存曲线评估训练后的乙肝临床治愈预测模型的预测能力的方法,包括:基于生存曲线确定预设随访时间的低概率组与高概率组的临床治愈累计发生概率的差值,在该差值大于预设发生率的情况下,确定该训练后的乙肝临床治愈预测模型的预测能力符合期望预测能力。
其中,预设随访时间可以根据实际应用过程进行设置,例如,第50个月,或者第60个月,本实施例中不进行具体限定。预设发生率可以根据实际应用过程进行设置,本实施例中不进行具体限定。期望预测能力是指预先希望乙肝临床治愈预测模型能够达到的预测能力。
本发明实施例中,基于样本预测对象的样本特征信息,通过训练后的乙肝临床治愈预测模型获取生存曲线,再根据生存曲线评估训练后的乙肝临床治愈预测模型的预测能力,能够有效确定该训练后的乙肝临床治愈预测模型的预测能力。
本发明实施例还提供另一种评估训练后的乙肝临床治愈预测模型的预测能力的方法。该方法中,将训练后的乙肝临床治愈预测模型的这种纵向预测模型,与仅用基线乙肝表面抗原的比例风险回归模型(proportional hazards model,简称COX模型)进行比较,COX回归单因素纳入了性别、年龄、肝硬化、谷丙转氨酶、血小板、总胆红素、甲胎蛋白、aMAP肝癌风险评分、乙肝E抗原和DNA定量等多种特征,通过多因素分析显示仅有基线乙肝表面抗原为预测临床治愈的最佳标志物。
本实施例中,可以通过比较各亚组受试者工作特征曲线(Receiver OperatingCharacteristic,ROC曲线)的下面积数据来比较不同模型的预测能力。各亚组指的是训练集或验证集中各类型的样本预测对象,例如,年龄大于45岁的样本预测对象、患有肝硬化的样本预测对象等等。
图6为本发明实施例提供的一种针对各亚组的ROC曲线下面积数据的示例图。曲线下面积数据的区间为0-1,用于评价模型的性能,该数据值越接近1,则表示模型的性能越好。如图6所示,通过定量数据显示,无论是在训练集还是验证集中,本模型在各亚组间对乙肝抗病毒治疗患者发生临床治愈的预测能力均优于传统的仅用基线乙肝表面抗原所构建的模型。此外,两种模型的区分度比较也显示本模型在各亚组间对乙肝抗病毒治疗患者发生临床治愈的鉴别能力均优于传统的仅用基线乙肝表面抗原所构建的模型,且可降低假阳性与假阴性。
本发明实施中,训练后的乙肝临床治愈预测模型的预测对象为慢乙肝抗病毒治疗患者,其预测效能稳定,不受患者年龄、有无肝硬化、E抗原阴性或阳性和入组乙肝表面抗原等因素影响。
图7为本发明实施例提供的一种乙肝临床治愈预测方法的流程图。如图7所示,该方法包括:步骤S5-步骤S6。
步骤S5、获取待预测对象的目标预测信息。
其中,待预测对象是指待进行临床治愈预测的对象。目标预测信息至少包括按照随访时序记录的目标预测对象的乙肝表面抗原定量信息。
步骤S6、将目标预测信息输入训练后的乙肝临床治愈预测模型中,获取待预测对象的慢乙肝临床治愈概率。
其中,训练后的乙肝临床治愈预测模型用于根据目标预测信息构建待预测对象对应的目标轮廓,并将目标轮廓与自身包含的临床治愈组平均轮廓和非临床治愈组平均轮廓进行比对,输出待预测对象的慢乙肝临床治愈概率。
在一个实施方式中,训练后的乙肝临床治愈预测模型根据目标预测信息构建待预测对象对应的目标轮廓,包括:训练后的乙肝临床治愈预测模型利用线性混合效应模型,根据目标预测信息构建待预测对象对应的目标轮廓。
在一个实施方式中,训练后的乙肝临床治愈预测模型将目标轮廓与自身包含的临床治愈组平均轮廓和非临床治愈组平均轮廓进行比对,输出待预测对象的慢乙肝临床治愈概率,包括:训练后的乙肝临床治愈预测模型边际预测方法将目标轮廓与自身包含的临床治愈组平均轮廓和非临床治愈组平均轮廓进行比对,输出待预测对象的慢乙肝临床治愈概率。
本发明实施例提供一种乙肝临床治愈预测方法,包括:首先获取待预测对象的目标预测信息,该目标预测信息包括按照随访时序记录的目标预测对象的乙肝表面抗原定量信息,然后将目标预测信息输入训练后的乙肝临床治愈预测模型中,获取待预测对象的慢乙肝临床治愈概率,其中,该训练后的乙肝临床治愈预测模型的构建过程中使用多个时间点的单个临床标志物(乙肝表面抗原定量信息)进行预测模型构建,因此,基于该训练后的乙肝临床治愈预测模型的乙肝临床治愈预测方法能够有效对预测对象的临床治愈概率分层,提高临床治愈发生率。
在一个实施方式中,目标预测信息输入训练后的乙肝临床治愈预测模型中,获取待预测对象的慢乙肝临床治愈概率之后,还包括:根据待预测对象的慢乙肝临床治愈概率确定针对预测对象的个性化处理策略。
其中,个性化处理策略是针对预测对象的个性化治疗方案。
在一些实施例中,在慢乙肝临床治愈概率小于预设概率的情况下,针对预测对象的个性化处理策略可以是维持原有抗病毒治疗;在慢乙肝临床治愈概率大于或等于预设概率的情况下,针对预测对象的个性化处理策略可以是停止治疗处理或者是使用对该待预测对象有效果的乙肝新药物。
在一些实施中,针对乙肝患者的临床治疗中,核苷(酸)类似物药物与干扰素类药物的初始联合治疗、序贯治疗、序贯联合治疗等多种策略可一定程度上提高特定人群的临床治愈发生率。此外,目前众多乙肝新药物临床试验展示了较为良好的结果,包括RNA干扰药物、病毒进入抑制剂及治疗性乙肝疫苗等。准确预测慢乙肝患者临床治愈一方面有助于临床策略或新药随机试验的受试者筛选与分层模型设计,以平衡各组受试者特征,并极有可能提高试验临床发生率,增大试验效率。而识别为临床治愈发生概率低的乙肝患者则可继续维持原有抗病毒治疗。
图8为本发明实施例提供的一种乙肝临床治愈预测模型构建装置的结构示意图。如图8所示,该装置包括:样本获取模块81、分组模块82、拟合模块83和训练模块84。
样本获取模块81,用于获取样本预测对象的样本特征信息.
其中,样本特征信息包括按照随访时序记录的样本预测对象的乙肝表面抗原定量信息。
在一个实施方式中,样本获取模块81还用于从特定数据库中获取样本预测对象按照随访时序记录的临床数据;从临床数据中筛选出符合预设条件的临床数据,以作为样本预测对象的样本特征信息;其中,预设条件包括随访时间大于第一预设时长以及未治愈持续时间大于第二预设时长。
分组模块82,用于将样本预测对象分为临床治愈组与非临床治愈组。
拟合模块83,拟合所述临床治愈组的样本特征信息,获得所述临床治愈组对应的临床治愈组平均轮廓,还用于拟合所述非临床治愈组的样本特征信息,获得所述非临床治愈组对应的非临床治愈组平均轮廓。
训练模块84,用于基于临床治愈组平均轮廓和非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型,获得训练后的乙肝临床治愈预测模型。其中,训练后的乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率。
在一个实施方式中,该乙肝临床治愈预测模型构建装置还包括评估模块,该评估模块用于基于样本预测对象的样本特征信息,通过训练后的乙肝临床治愈预测模型获取生存曲线;根据生存曲线评估训练后的乙肝临床治愈预测模型的预测能力。
本发明实施例提供一种乙肝临床治愈预测模型构建装置,包括:样本获取模块,用于获取样本预测对象的样本特征信息,该样本特征信息包括按照随访时序记录的样本预测对象的乙肝表面抗原定量信息;分组模块用于将样本预测对象分为临床治愈组与非临床治愈组;拟合模块用于拟合该临床治愈组的样本特征信息,获得临床治愈组对应的临床治愈组平均轮廓,以及拟合非临床治愈组的样本特征信息,获得非临床治愈组对应的非临床治愈组平均轮廓;训练模块用于基于临床治愈组平均轮廓和非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型,获得训练后的乙肝临床治愈预测模型,该训练后的乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率,该乙肝临床治愈预测模型构建过程中使用多个时间点的单个临床标志物(乙肝表面抗原定量信息)进行预测模型构建,能够有效对预测对象的临床治愈概率分层,提高临床治愈发生率。
图9为本发明实施例提供的一种基于乙肝临床治愈预测模型的乙肝临床治愈预测装置的结构示意图。如图9所示,该装置包括:目标获取模块91和预测模块92。
目标获取模块91,用于获取待预测对象的目标预测信息,其中,目标预测信息包括按照随访时序记录的目标预测对象的乙肝表面抗原定量信息。
预测模块92,用于将目标预测信息输入训练后的乙肝临床治愈预测模型中,获取待预测对象的慢乙肝临床治愈概率,其中,训练后的乙肝临床治愈预测模型用于根据目标预测信息构建待预测对象对应的目标轮廓,并将目标轮廓与自身包含的临床治愈组平均轮廓和非临床治愈组平均轮廓进行比对,输出待预测对象的慢乙肝临床治愈概率。
本发明实施例提供一种基于乙肝临床治愈预测模型的乙肝临床治愈预测装置,包括:目标获取模块用于获取待预测对象的目标预测信息,该目标预测信息包括按照随访时序记录的目标预测对象的乙肝表面抗原定量信息,然后将目标预测信息输入训练后的乙肝临床治愈预测模型中,预测模块用于获取待预测对象的慢乙肝临床治愈概率,其中,该训练后的乙肝临床治愈预测模型的构建过程中使用多个时间点的单个临床标志物(乙肝表面抗原定量信息)进行预测模型构建,因此,基于该训练后的乙肝临床治愈预测模型的乙肝临床治愈预测方法能够有效对预测对象的临床治愈概率分层,提高临床治愈发生率。
图10为本发明实施例还提供了一种计算机设备的结构示意图。如图10所示,该计算机设备可以包括处理器1001和存储器1002,其中处理器1001和存储器1002可以通过总线或者其他方式连接,图10中以通过总线连接为例。
处理器1001可以为中央处理器(Central Processing Unit,CPU)。处理器1001还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器1002作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的乙肝临床治愈预测模型构建方法对应的程序指令/模块,或者本发明实施例中的乙肝临床治愈预测方法对应的程序指令/模块。处理器1001通过运行存储在存储器1002中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的乙肝临床治愈预测模型构建方法,或者实现上述方法实施例中的乙肝临床治愈预测方法。
存储器1002可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器1001所创建的数据等。此外,存储器1002可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器1002可选包括相对于处理器1001远程设置的存储器,这些远程存储器可以通过网络连接至处理器1001。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个模块存储在存储器1002中,当被处理器1001执行时,执行前述实施例中的乙肝临床治愈预测模型构建方法或者乙肝临床治愈预测方法。
上述计算机设备具体细节可以对应参阅图1所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random AccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (9)
1.一种乙肝临床治愈预测模型构建方法,其特征在于,所述方法包括:
获取样本预测对象的样本特征信息;所述样本特征信息包括按照随访时序记录的所述样本预测对象的乙肝表面抗原定量信息;其中,样本预测对象是长时间随访的接受长期抗病毒治疗的慢性乙型肝炎人群;
将样本预测对象分为临床治愈组与非临床治愈组;其中,临床治愈组中样本预测对象的连续两次随访的乙肝表面抗原低于预设数值,且该连续两次随访的时间间隔大于预设时间间隔;
拟合所述临床治愈组的样本特征信息,获得所述临床治愈组对应的临床治愈组平均轮廓;以及拟合所述非临床治愈组的样本特征信息,获得所述非临床治愈组对应的非临床治愈组平均轮廓;
基于所述临床治愈组平均轮廓和所述非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型,获得训练后的所述乙肝临床治愈预测模型;训练后的所述乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率;
所述拟合所述临床治愈组的样本特征信息,获得所述临床治愈组对应的临床治愈组平均轮廓,包括:
利用线性混合效应模型,拟合所述临床治愈组的乙肝表面抗原定量信息的时间变化特征,获得所述临床治愈组对应的临床治愈组平均轮廓;
所述拟合所述非临床治愈组的样本特征信息,获得所述非临床治愈组对应的非临床治愈组平均轮廓,包括:
利用线性混合效应模型,拟合所述非临床治愈组的乙肝表面抗原定量信息的时间变化特征,获得所述非临床治愈组对应的非临床治愈组平均轮廓;
线性混合效应模型的网络结构如下:
;
;其中,当拟合MLMM时,/>,i代表某位患者,τ代表该患者的某一次随访,μ和γ分别表示拟合变量的线性混合效应模型中的固定系数和随机系数,MVN为正态分布,/>,/>,/>,/>,/>使用贝叶斯马尔可夫链蒙特卡洛算法进行测算,/>为计算方差和协方差时的模型内部参数;
训练后的乙肝临床治愈预测模型采用边际预测方法分别比较待预测对象的特征信息拟合出的轮廓与临床治愈组平均轮廓和非临床治愈组平均轮廓的相似度,给出待预测对象的慢乙肝临床治愈概率,该概率的数值范围为0-1;
当一名新的待预测对象在τ时增加一次随访数据,该待预测对象该次随访的分组概率值将基于边际预测方法计算得出预测评分,边际预测方法的过程如下;
;该公式中,F为分组预测概率;marg表示边际预测法;G表示一位待预测对象;g为组别,g∈{0,1},其中0表示临床治愈组,1表示非临床治愈组;h为加和号角标;ω={ω0,ω1},ω是长度2的向量,ω表示待预测对象属于每组的先验概率权重比;θh、θg表示模型学习过程中产生的参数。
2.根据权利要求1所述的方法,其特征在于,所述获取样本预测对象的样本特征信息的步骤,包括:
从特定数据库中获取所述样本预测对象按照随访时序记录的临床数据;
从所述临床数据中筛选出符合预设条件的临床数据,以作为所述样本预测对象的样本特征信息;所述预设条件包括:在随访过程中至少包含两次乙肝表面抗原定量信息。
3.根据权利要求1所述的方法,其特征在于,所述基于所述临床治愈组平均轮廓和所述非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型,获得训练后的所述乙肝临床治愈预测模型之后,所述方法还包括:
基于样本预测对象的样本特征信息,通过训练后的所述乙肝临床治愈预测模型获取生存曲线;
根据所述生存曲线评估训练后的所述乙肝临床治愈预测模型的预测能力。
4.一种基于如权利要求1-3中任一项所述的乙肝临床治愈预测模型构建方法的乙肝临床治愈预测方法,其特征在于,所述方法包括:
获取待预测对象的目标预测信息;所述目标预测信息包括按照随访时序记录的所述目标预测对象的乙肝表面抗原定量信息;
将所述目标预测信息输入训练后的乙肝临床治愈预测模型中,获取所述待预测对象的慢乙肝临床治愈概率,其中,训练后的乙肝临床治愈预测模型用于根据所述目标预测信息构建所述待预测对象对应的目标轮廓,并将所述目标轮廓与自身包含的临床治愈组平均轮廓和非临床治愈组平均轮廓进行比对,输出待预测对象的慢乙肝临床治愈概率;
训练后的乙肝临床治愈预测模型根据目标预测信息构建待预测对象对应的目标轮廓,包括:训练后的乙肝临床治愈预测模型利用线性混合效应模型,根据目标预测信息构建待预测对象对应的目标轮廓;
线性混合效应模型的网络结构如下:
;
;其中,当拟合MLMM时,/>,i代表某位患者,τ代表该患者的某一次随访,μ和γ分别表示拟合变量的线性混合效应模型中的固定系数和随机系数,MVN为正态分布,/>,/>,/>,/>,/>使用贝叶斯马尔可夫链蒙特卡洛算法进行测算,/>为计算方差和协方差时的模型内部参数;
训练后的乙肝临床治愈预测模型采用边际预测方法分别比较待预测对象的特征信息拟合出的轮廓与临床治愈组平均轮廓和非临床治愈组平均轮廓的相似度,给出待预测对象的慢乙肝临床治愈概率,该概率的数值范围为0-1;
当一名新的待预测对象在τ时增加一次随访数据,该待预测对象该次随访的分组概率值将基于边际预测方法计算得出预测评分,边际预测方法的过程如下;
;该公式中,F为分组预测概率;marg表示边际预测法;G表示一位待预测对象;g为组别,g∈{0,1},其中0表示临床治愈组,1表示非临床治愈组;h为加和号角标;ω={ω0,ω1},ω是长度2的向量,ω表示待预测对象属于每组的先验概率权重比;θh、θg表示模型学习过程中产生的参数。
5.根据权利要求4所述的方法,其特征在于,将所述目标预测信息输入训练后的乙肝临床治愈预测模型中,获取所述待预测对象的慢乙肝临床治愈概率之后,还包括:
根据所述待预测对象的慢乙肝临床治愈概率确定针对所述预测对象的个性化处理策略。
6.一种乙肝临床治愈预测模型构建装置,其特征在于,所述装置包括:
样本获取模块,用于获取样本预测对象的样本特征信息;所述样本特征信息包括按照随访时序记录的所述样本预测对象的乙肝表面抗原定量信息;其中,样本预测对象是长时间随访的接受长期抗病毒治疗的慢性乙型肝炎人群;
分组模块,用于将样本预测对象分为临床治愈组与非临床治愈组;其中,临床治愈组中样本预测对象的连续两次随访的乙肝表面抗原低于预设数值,且该连续两次随访的时间间隔大于预设时间间隔;
拟合模块,拟合所述临床治愈组的样本特征信息,获得所述临床治愈组对应的临床治愈组平均轮廓,还用于拟合所述非临床治愈组的样本特征信息,获得所述非临床治愈组对应的非临床治愈组平均轮廓;
训练模块,用于基于所述临床治愈组平均轮廓和所述非临床治愈组平均轮廓训练初始的乙肝临床治愈预测模型,获得训练后的所述乙肝临床治愈预测模型;训练后的所述乙肝临床治愈预测模型用于预测待预测对象的慢乙肝临床治愈概率;
所述拟合所述临床治愈组的样本特征信息,获得所述临床治愈组对应的临床治愈组平均轮廓,包括:
利用线性混合效应模型,拟合所述临床治愈组的乙肝表面抗原定量信息的时间变化特征,获得所述临床治愈组对应的临床治愈组平均轮廓;
所述拟合所述非临床治愈组的样本特征信息,获得所述非临床治愈组对应的非临床治愈组平均轮廓,包括:
利用线性混合效应模型,拟合所述非临床治愈组的乙肝表面抗原定量信息的时间变化特征,获得所述非临床治愈组对应的非临床治愈组平均轮廓;
线性混合效应模型的网络结构如下:
;
;其中,当拟合MLMM时,/>,i代表某位患者,τ代表该患者的某一次随访,μ和γ分别表示拟合变量的线性混合效应模型中的固定系数和随机系数,MVN为正态分布,/>,/>,/>,/>,/>使用贝叶斯马尔可夫链蒙特卡洛算法进行测算,/>为计算方差和协方差时的模型内部参数;
训练后的乙肝临床治愈预测模型采用边际预测方法分别比较待预测对象的特征信息拟合出的轮廓与临床治愈组平均轮廓和非临床治愈组平均轮廓的相似度,给出待预测对象的慢乙肝临床治愈概率,该概率的数值范围为0-1;
当一名新的待预测对象在τ时增加一次随访数据,该待预测对象该次随访的分组概率值将基于边际预测方法计算得出预测评分,边际预测方法的过程如下;
;该公式中,F为分组预测概率;marg表示边际预测法;G表示一位待预测对象;g为组别,g∈{0,1},其中0表示临床治愈组,1表示非临床治愈组;h为加和号角标;ω={ω0,ω1},ω是长度2的向量,ω表示待预测对象属于每组的先验概率权重比;θh、θg表示模型学习过程中产生的参数。
7.一种基于乙肝临床治愈预测模型的乙肝临床治愈预测装置,其特征在于,所述装置包括:
目标获取模块,用于获取待预测对象的目标预测信息;所述目标预测信息包括按照随访时序记录的所述目标预测对象的乙肝表面抗原定量信息;
预测模块,用于将所述目标预测信息输入训练后的乙肝临床治愈预测模型中,获取所述待预测对象的慢乙肝临床治愈概率,其中,训练后的乙肝临床治愈预测模型用于根据所述目标预测信息构建所述待预测对象对应的目标轮廓,并将所述目标轮廓与自身包含的临床治愈组平均轮廓和非临床治愈组平均轮廓进行比对,输出待预测对象的慢乙肝临床治愈概率;
训练后的乙肝临床治愈预测模型根据目标预测信息构建待预测对象对应的目标轮廓,包括:训练后的乙肝临床治愈预测模型利用线性混合效应模型,根据目标预测信息构建待预测对象对应的目标轮廓;
线性混合效应模型的网络结构如下:
;
;其中,当拟合MLMM时,/>,i代表某位患者,τ代表该患者的某一次随访,μ和γ分别表示拟合变量的线性混合效应模型中的固定系数和随机系数,MVN为正态分布,/>,/>,/>,/>,/>使用贝叶斯马尔可夫链蒙特卡洛算法进行测算,/>为计算方差和协方差时的模型内部参数;
训练后的乙肝临床治愈预测模型采用边际预测方法分别比较待预测对象的特征信息拟合出的轮廓与临床治愈组平均轮廓和非临床治愈组平均轮廓的相似度,给出待预测对象的慢乙肝临床治愈概率,该概率的数值范围为0-1;
当一名新的待预测对象在τ时增加一次随访数据,该待预测对象该次随访的分组概率值将基于边际预测方法计算得出预测评分,边际预测方法的过程如下;
;该公式中,F为分组预测概率;marg表示边际预测法;G表示一位待预测对象;g为组别,g∈{0,1},其中0表示临床治愈组,1表示非临床治愈组;h为加和号角标;ω={ω0,ω1},ω是长度2的向量,ω表示待预测对象属于每组的先验概率权重比;θh、θg表示模型学习过程中产生的参数。
8.一种计算机设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-3任一项所述的乙肝临床治愈预测模型构建方法的步骤,或者,执行如权利要求4或5所述的乙肝临床治愈预测方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-3任一项所述的乙肝临床治愈预测模型构建方法的步骤,或者,执行如权利要求4或5所述的乙肝临床治愈预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310655438.2A CN116386901B (zh) | 2023-06-05 | 2023-06-05 | 乙肝临床治愈预测模型构建方法及装置、预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310655438.2A CN116386901B (zh) | 2023-06-05 | 2023-06-05 | 乙肝临床治愈预测模型构建方法及装置、预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116386901A CN116386901A (zh) | 2023-07-04 |
CN116386901B true CN116386901B (zh) | 2024-01-30 |
Family
ID=86967924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310655438.2A Active CN116386901B (zh) | 2023-06-05 | 2023-06-05 | 乙肝临床治愈预测模型构建方法及装置、预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116386901B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113436727A (zh) * | 2021-06-30 | 2021-09-24 | 华中科技大学 | 基于病人检测信息对潜在治疗方案治愈概率打分的方法 |
WO2022036869A1 (zh) * | 2020-08-17 | 2022-02-24 | 中山大学孙逸仙纪念医院 | 乳腺癌新辅助化疗后病理学完全缓解概率预测方法及系统 |
CN114724700A (zh) * | 2022-03-08 | 2022-07-08 | 复旦大学附属中山医院 | 淋巴细胞计数恢复预测模型构建方法、装置及电子设备 |
CN115862850A (zh) * | 2023-02-23 | 2023-03-28 | 南方医科大学南方医院 | 基于纵向多维数据的肝细胞癌监测模型的建模方法及装置 |
CN116167462A (zh) * | 2023-04-23 | 2023-05-26 | 南方医科大学南方医院 | 肝细胞癌预测模型构建方法、肝细胞癌预测方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016094330A2 (en) * | 2014-12-08 | 2016-06-16 | 20/20 Genesystems, Inc | Methods and machine learning systems for predicting the liklihood or risk of having cancer |
-
2023
- 2023-06-05 CN CN202310655438.2A patent/CN116386901B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022036869A1 (zh) * | 2020-08-17 | 2022-02-24 | 中山大学孙逸仙纪念医院 | 乳腺癌新辅助化疗后病理学完全缓解概率预测方法及系统 |
CN113436727A (zh) * | 2021-06-30 | 2021-09-24 | 华中科技大学 | 基于病人检测信息对潜在治疗方案治愈概率打分的方法 |
CN114724700A (zh) * | 2022-03-08 | 2022-07-08 | 复旦大学附属中山医院 | 淋巴细胞计数恢复预测模型构建方法、装置及电子设备 |
CN115862850A (zh) * | 2023-02-23 | 2023-03-28 | 南方医科大学南方医院 | 基于纵向多维数据的肝细胞癌监测模型的建模方法及装置 |
CN116167462A (zh) * | 2023-04-23 | 2023-05-26 | 南方医科大学南方医院 | 肝细胞癌预测模型构建方法、肝细胞癌预测方法及装置 |
Non-Patent Citations (2)
Title |
---|
"抗-HBc定量的临床意义与应用";尹雪如 等;《临床肝胆病杂志》;第35卷(第10期);2156-2158 * |
"核苷类药物治疗慢性乙型肝炎患者肾功能变化的临床研究";马倩倩;《中国优秀博士论文全文数据库》;1-86 * |
Also Published As
Publication number | Publication date |
---|---|
CN116386901A (zh) | 2023-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Overgaard et al. | Regression analysis of censored data using pseudo-observations: an update | |
Balakrishnan et al. | Piecewise linear approximations for cure rate models and associated inferential issues | |
CN113674858B (zh) | 在线医疗处方用药智能检查方法、装置、设备及存储介质 | |
Sauerbrei et al. | A new strategy for meta‐analysis of continuous covariates in observational studies | |
Gebre-Medhin et al. | Dose-volume analysis of radiation-induced trismus in head and neck cancer patients | |
Roberts et al. | Optimal design in pediatric pharmacokinetic and pharmacodynamic clinical studies | |
Balakrishnan et al. | Likelihood inference for flexible cure rate models with gamma lifetimes | |
Cancho et al. | The geometric Birnbaum–Saunders regression model with cure rate | |
CN113517046A (zh) | 一种电子病历中异构数据特征融合方法及基于融合特征的预测方法、系统及可读存储介质 | |
WO2020119098A1 (zh) | 一种健康评估方法、装置及计算机可读存储介质 | |
Inácio et al. | Nonparametric Bayesian estimation of the three‐way receiver operating characteristic surface | |
CN116092681B (zh) | 确定健康指数评分的方法、系统、电子设备及存储介质 | |
EP4411740A1 (en) | Model construction method and apparatus, device and medium | |
CN111026877A (zh) | 基于概率软逻辑的知识验证模型构建与分析方法 | |
Birrell et al. | Estimating trends in incidence, time-to-diagnosis and undiagnosed prevalence using a CD4-based Bayesian back-calculation | |
Falconieri et al. | Developing risk models for multicenter data using standard logistic regression produced suboptimal predictions: a simulation study | |
CN116578704A (zh) | 文本情感分类方法、装置、设备及计算机可读介质 | |
Van der Elst et al. | Estimating the reliability of repeatedly measured endpoints based on linear mixed‐effects models. A tutorial | |
CN116386901B (zh) | 乙肝临床治愈预测模型构建方法及装置、预测方法及装置 | |
Sgheiza et al. | The effect of reference sample composition and size on dental age interval estimates | |
Sears et al. | Estimating body mass in New World “monkeys”(Platyrrhini, Primates), with a consideration of the Miocene platyrrhine, Chilecebus carrascoensis | |
CN104268144B (zh) | 一种电子病历查询语句的构造方法 | |
CN106844325A (zh) | 医疗信息处理方法和医疗信息处理装置 | |
CN111063430B (zh) | 一种疾病预测方法及装置 | |
Boulet et al. | Bayesian variable selection based on clinical relevance weights in small sample studies—Application to colon cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |