CN113723415B - 一种生存时长预测方法、装置、设备及介质 - Google Patents

一种生存时长预测方法、装置、设备及介质 Download PDF

Info

Publication number
CN113723415B
CN113723415B CN202110987850.5A CN202110987850A CN113723415B CN 113723415 B CN113723415 B CN 113723415B CN 202110987850 A CN202110987850 A CN 202110987850A CN 113723415 B CN113723415 B CN 113723415B
Authority
CN
China
Prior art keywords
feature
target
sub
sample
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110987850.5A
Other languages
English (en)
Other versions
CN113723415A (zh
Inventor
梁爽
赵成
刘岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN202110987850.5A priority Critical patent/CN113723415B/zh
Publication of CN113723415A publication Critical patent/CN113723415A/zh
Application granted granted Critical
Publication of CN113723415B publication Critical patent/CN113723415B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10088Magnetic resonance imaging [MRI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)

Abstract

本发明公开了一种生存时长预测方法、装置、设备及介质,由于本发明实施例中,可以基于待预测的患者的多模态磁共振图像、基因组学数据以及待检测的临床数据,分别确定对应的目标影像特征值集、目标基因特征值集以及目标临床特征值集,并根据该目标影像特征值集、目标基因特征值集、目标临床特征值集以及预先训练完成的模型,确定该患者的目标生存时长信息,提高了对患者的生存时长的预测的准确性,提高用户体验。

Description

一种生存时长预测方法、装置、设备及介质
技术领域
本发明涉及医疗技术领域,尤其涉及一种生存时长预测方法、装置、设备及介质。
背景技术
伴随着医疗水平的逐步提高,患者基于不同的治疗方案延长自己寿命的欲望也越来越强烈,若能够根据用户的病例信息确定用户能够生存的时间,能够方便医生针对确定的该用户的生存时长的不同采取不同的治疗方案,比如,脑胶质瘤是中枢神经系统最常见的颅脑恶性肿瘤,其具有发病率高、复发率高、死亡率高以及治愈率低的特点,若能够准确且智能的确定脑胶质瘤患者的生存时长,能够有效的提高确定治疗方案的效率,给人们的生活带来极大的便利。
目前的对患者的生存时长的推测多是凭借医生的临床经验或者患者群体样本生存时长统计,但基于医生的临床经验或者患者群体样本生存时长统计来确定患者生存时长的方法往往误差较大,且无法做到个性化预测。尽管存在基于单一的临床检验数据或者磁共振图像(Magnetic Resonance Imaging,MRI)的影像信息预测的患者生存时长,但是忽略了其他影响因素的作用,因此对患者的生存时长的预测的准确性不高,影响用户体验。
发明内容
本发明提供了一种生存时长预测方法、装置、设备及介质,用以解决现有技术中预测的患者的生存时长的准确性不高,影响用户体验的问题。
第一方面,本发明提供了一种生存时长预测方法,所述方法包括:
确定待预测的患者的多模态磁共振图像中的肿瘤区域,基于图像处理算法以及预先保存的第一特征,确定所述肿瘤区域对应的目标影像特征值集;
根据基因组学数据中包含所述患者包含的基因对应的基因突变状态以及预先保存的第二特征,确定目标基因特征值集,并根据预先保存的所述待预测的患者的临床数据以及预先保存的第三特征,确定目标临床特征值集,其中,所述目标临床特征值集中包含年龄特征值以及性别特征值;
根据所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的模型,确定所述待预测的患者的目标生存时长信息。
进一步地,所述确定待预测的患者的多模态磁共振图像中的肿瘤区域包括:
将待预测的患者的多模态磁共振图像输入到预先训练完成的语义分割模型中,获得所述多模态磁共振图像中的肿瘤区域。
进一步地,所述基于图像处理算法以及预先保存的第一特征,确定所述肿瘤区域对应的目标影像特征值集包括:
基于图像处理算法,确定所述肿瘤区域对应的每个特征的第一特征值;
根据所述肿瘤区域的每个特征中与所述预先保存的第一特征匹配的特征对应的第一特征值,确定目标影像特征值集。
进一步地,所述根据基因组学数据中包含所述患者包含的基因对应的基因突变状态以及预先保存的第二特征,确定目标基因特征值集包括:
确定基因组学数据中包含所述患者包含的每个基因对应的基因突变状态的特征的第二特征值;
根据所述每个基因对应的基因突变状态的特征中与所述预先保存的第二特征匹配的特征对应的第二特征值,确定目标基因特征值集。
进一步地,所述根据预先保存的所述待预测的患者的临床数据以及预先保存的第三特征,确定目标临床特征值集包括:
确定预先保存的所述待预测的患者的临床数据中包含的每个数据对应特征的第三特征值;
根据所述每个数据对应特征中与预先保存的第三特征匹配的特征对应的第三特征值,确定目标临床特征值集。
进一步地,所述根据所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的模型,确定所述待预测的患者的目标生存时长信息包括:
基于所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的风险等级预测模型,确定目标风险等级特征值;
基于所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集、所述目标风险等级特征值以及预先训练完成的生存时长预测模型,确定所述待预测的患者的目标生存时长信息。
进一步地,所述根据所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的模型,确定所述待预测的患者的目标生存时长信息包括:
获取所述目标影像特征值集中与预先保存第一子特征匹配的第一目标子特征值,并获取所述目标影像特征值集中与预先保存的第二子特征匹配的第二目标子特征值,其中,所述第一子特征与所述第二子特征的数量的和值不小于所述预先保存的第一特征的数量;
获取所述目标基因特征值集中与预先保存第三子特征匹配的第三目标子特征值,并获取所述目标基因特征值集中与预先保存第四子特征匹配的第四目标子特征值,其中,所述第三子特征与所述第四子特征的数量的和值不小于所述预先保存的第二特征的数量;
获取所述目标临床特征值集中与预先保存第五子特征匹配的第五目标子特征值,并获取所述目标临床特征值集中与预先保存第六子特征匹配的第六目标子特征值,其中,所述第五子特征与所述第六子特征的数量的和值不小于所述预先保存的第三特征的数量;
基于所述第一目标子特征值、所述第三目标子特征值、所述第五目标子特征值以及预先训练完成的风险等级预测模型,确定目标风险等级特征值;
基于所述第二目标子特征值、所述第四目标子特征值、所述第六目标子特征值、所述目标风险等级特征值以及预先训练完成的生存时长预测模型,确定所述待预测的患者的目标生存时长信息。
进一步地,确定预先保存的子特征的过程包括:
预先保存的子特征的过程包括:
基于每个样本患者的肿瘤区域对应的每个第一样本特征的第一样本特征值、每个样本患者的每个基因对应的基因突变的第二样本特征对应的第二样本特征值以及每个样本患者的临床数据中包含的每个数据对应的第三样本特征对应的第三样本特征值、递归特征消除算法以及交叉验证,确定第一子特征、第三子特征以及第五子特征;
基于每个样本患者的肿瘤区域对应的每个第一样本特征的第一样本特征值、每个样本患者的每个基因对应的基因突变的第二样本特征对应的第二样本特征值以及每个样本患者的临床数据中包含的每个数据对应的第三样本特征对应的第三样本特征值以及COX比例风险模型,确定第二子特征、第四子特征以及第六子特征。
进一步地,所述训练所述风险等级预测模型的过程包括:
获取第一训练集中的任一第一样本特征集,其中,所述第一样本特征集中预先标注有样本患者对应的样本第一风险等级信息,其中,所述第一样本特征集包含样本患者的第一子特征对应的特征值、第三子特征对应的特征值以及第五子特征对应的特征值;
将所述第一样本特征集输入到原始风险等级预测模型中,输出样本第二风险等级信息;
根据所述样本第一风险等级信息和所述样本第二风险等级信息,对所述风险等级预测模型进行训练。
进一步地,训练所述生存时长预测模型的过程包括:
获取第二训练集中的任一第二样本特征集,其中,所述第二样本特征集中预先标注有样本患者对应的样本第一生存时长标识值,其中,所述第二样本特征集中包含样本患者的第二子特征对应的特征值、第四子特征对应的特征值、第六子特征对应的特征值以及预先保存的风险等级对应的特征的特征值;
将所述二样本特征集输入到原始生存时长预测模型中,输出样本第二生存时长标识值;
根据所述样本第二生存时长标识值和所述样本第一生存时长标识值,对所述生存时长预测模型进行训练。
第二方面,本发明还提供了一种生存时长预测装置,所述装置包括:
确定装置,用于确定待预测的患者的多模态磁共振图像中的肿瘤区域,基于图像处理算法以及预先保存的第一特征,确定所述肿瘤区域对应的目标影像特征值集;根据基因组学数据中包含所述患者包含的基因对应的基因突变状态以及预先保存的第二特征,确定目标基因特征值集,并根据预先保存的所述待预测的患者的临床数据以及预先保存的第三特征,确定目标临床特征值集,其中,所述目标临床特征值集中包含年龄特征值以及性别特征值;
预测装置,用于根据所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的模型,确定所述待预测的患者的目标生存时长信息。
进一步地,所述确定模块,具体用于将待预测的患者的多模态磁共振图像输入到预先训练完成的语义分割模型中,获得所述多模态磁共振图像中的肿瘤区域。
进一步地,所述确定模块,具体用于基于图像处理算法,确定所述肿瘤区域对应的每个特征的第一特征值;根据所述肿瘤区域的每个特征中与所述预先保存的第一特征匹配的特征对应的第一特征值,确定目标影像特征值集。
进一步地,所述确定模块,具体用于确定基因组学数据中包含所述患者包含的每个基因对应的基因突变状态的特征的第二特征值;根据所述每个基因对应的基因突变状态的特征中与所述预先保存的第二特征匹配的特征对应的第二特征值,确定目标基因特征值集。
进一步地,所述确定模块,具体用于确定预先保存的所述待预测的患者的临床数据中包含的每个数据对应特征的第三特征值;根据所述每个数据对应特征中与预先保存的第三特征匹配的特征对应的第三特征值,确定目标临床特征值集。
进一步地,所述预测模块,具体用于基于所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的风险等级预测模型,确定目标风险等级特征值;基于所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集、所述目标风险等级特征值以及预先训练完成的生存时长预测模型,确定所述待预测的患者的目标生存时长信息。
进一步地,所述预测模块,具体用于获取所述目标影像特征值集中与预先保存第一子特征匹配的第一目标子特征值,并获取所述目标影像特征值集中与预先保存的第二子特征匹配的第二目标子特征值,其中,所述第一子特征与所述第二子特征的数量的和值不小于所述预先保存的第一特征的数量;获取所述目标基因特征值集中与预先保存第三子特征匹配的第三目标子特征值,并获取所述目标基因特征值集中与预先保存第四子特征匹配的第四目标子特征值,其中,所述第三子特征与所述第四子特征的数量的和值不小于所述预先保存的第二特征的数量;获取所述目标临床特征值集中与预先保存第五子特征匹配的第五目标子特征值,并获取所述目标临床特征值集中与预先保存第六子特征匹配的第六目标子特征值,其中,所述第五子特征与所述第六子特征的数量的和值不小于所述预先保存的第三特征的数量;基于所述第一目标子特征值、所述第三目标子特征值、所述第五目标子特征值以及预先训练完成的风险等级预测模型,确定目标风险等级特征值;基于所述第二目标子特征值、所述第四目标子特征值、所述第六目标子特征值、所述目标风险等级特征值以及预先训练完成的生存时长预测模型,确定所述待预测的患者的目标生存时长信息。
进一步地,所述确定模块,还用于基于每个样本患者的肿瘤区域对应的每个第一样本特征的第一样本特征值、每个样本患者的每个基因对应的基因突变的第二样本特征对应的第二样本特征值以及每个样本患者的临床数据中包含的每个数据对应的第三样本特征对应的第三样本特征值、递归特征消除算法以及交叉验证,确定第一子特征、第三子特征以及第五子特征;基于每个样本患者的肿瘤区域对应的每个第一样本特征的第一样本特征值、每个样本患者的每个基因对应的基因突变的第二样本特征对应的第二样本特征值以及每个样本患者的临床数据中包含的每个数据对应的第三样本特征对应的第三样本特征值以及COX比例风险模型,确定第二子特征、第四子特征以及第六子特征。
进一步地,所述装置还包括:
训练模块,用于获取第一训练集中的任一第一样本特征集,其中,所述第一样本特征集中预先标注有样本患者对应的样本第一风险等级信息,其中,所述第一样本特征集包含样本患者的第一子特征对应的特征值、第三子特征对应的特征值以及第五子特征对应的特征值;将所述第一样本特征集输入到原始风险等级预测模型中,输出样本第二风险等级信息;根据所述样本第一风险等级信息和所述样本第二风险等级信息,对所述风险等级预测模型进行训练。
进一步地,所述训练模块,还用于获取第二训练集中的任一第二样本特征集,其中,所述第二样本特征集中预先标注有样本患者对应的样本第一生存时长标识值,其中,所述第二样本特征集中包含样本患者的第二子特征对应的特征值、第四子特征对应的特征值、第六子特征对应的特征值以及预先保存的风险等级对应的特征的特征值;将所述二样本特征集输入到原始生存时长预测模型中,输出样本第二生存时长标识值;根据所述样本第二生存时长标识值和所述样本第一生存时长标识值,对所述生存时长预测模型进行训练。
第三方面,本发明还提供了一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述生存时长预测方法的步骤。
第四方面,本发明还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一所述生存时长预测方法的步骤。
本发明实施例中,确定待预测的患者的多模态磁共振图像中的肿瘤区域,基于图像处理算法以及预先保存的第一特征,确定该肿瘤区域对应的目标影像特征值集,根据基因组学数据中包含该患者包含的基因对应的基因突变状态以及预先保存的第二特征,确定目标基因特征值集,并根据预先保存的该待预测的患者的临床数据以及预先保存的第三特征,确定目标临床特征值集,其中,该目标临床特征值集中包含年龄特征值以及性别特征值,根据该目标影像特征值集、该目标基因特征值集、该目标临床特征值集以及预先训练完成的模型,确定该患者的目标生存时长信息。由于本发明实施例中,可以基于待预测的患者的多模态磁共振图像、基因组学数据以及待检测的临床数据,分别确定对应的目标影像特征值集、目标基因特征值集以及目标临床特征值集,并根据该目标影像特征值集、目标基因特征值集、目标临床特征值集以及预先训练完成的模型,确定该患者的目标生存时长信息,提高了对患者的生存时长的预测的准确性,提高了用户体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种生存时长预测方法的过程示意图;
图2为本发明实施例提供的一种保存的基因与突变率的对应关系的示意图;
图3为本发明实施例提供的一种COX比例风险模型进行特征值选择的结果示意图;
图4为本发明实施例提供的一种确定生存时长的过程示意图;
图5为本发明实施例提供的一种生存时长预测装置结构示意图;
图6为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
为了提高对患者的生存时长的预测的准确性,提高用户体验,本发明实施例提供了一种生存时长预测方法、装置、设备及介质。
实施例1:
图1为本发明实施例提供的一种生存时长预测方法的过程示意图,该过程包括以下步骤:
S101:确定待预测的患者的多模态磁共振图像中的肿瘤区域,基于图像处理算法以及预先保存的第一特征,确定所述肿瘤区域对应的目标影像特征值集。
本发明实施例提供的生存时长预测方法应用于电子设备,该电子设备可以是智能终端、PC或者服务器等设备。其中,该生存时长预测方法预测的为肿瘤患者的生存时长。
在本发明实施例中,由于多模态磁共振图像能够提供患者整个肿瘤的全面视图,且患者的生存时长受肿瘤的影响,因此为了确定待预测的患者的生存时长,可以先获得待检测的患者的多模态磁共振图像,然后确定该多模态磁共振图像的肿瘤区域。
其中,该多模态磁共振图像中包含Flair序列、T1序列、T1c序列以及T2序列中的一种或者多种模态。具体的,该肿瘤区域可以通过医生手动分割获得,也就是说,电子设备可以直接获得分割完成的待预测的患者的多模态磁共振图像中的肿瘤区域。
电子设备在获得该肿瘤区域后,为了确定该待检测患者的肿瘤区域的特征,在本发明实施例中,可以基于图像处理算法,确定该肿瘤区域对应的特征,由于肿瘤区域对应的特征的数量可能很多,且有一些肿瘤区域对应的特征可能对患者生存时长的影响并不大,因此,在本发明实施例中,可以预先保存第一特征,其中,该第一特征为在肿瘤区域的特征中筛选出来的,对患者生存时长影响比较大的特征,具体的,该第一特征可以根据临床经验进行确定。根据该肿瘤区域对应的特征以及该预先保存的第一特征,确定肿瘤区域对应的目标影像特征值集,其中,该肿瘤区域对应的特征包含肿瘤区域各个模态的一阶统计量特征值、形状特征值以及纹理特征值等等。其中,基于图像处理算法,确定该肿瘤区域对应的特征为现有技术,在此不做赘述。
S102:根据基因组学数据中包含所述患者包含的基因对应的基因突变状态以及预先保存的第二特征,确定目标基因特征值集,并根据预先保存的所述待预测的患者的临床数据以及预先保存的第三特征,确定目标临床特征值集,其中,所述目标临床特征值集中包含年龄特征值以及性别特征值。
在本发明实施例中,由于患者的生存时长受基因的影响,因此为了确定待预测患者的生存时长,电子设备可以获得该待检测的患者的基因组学数据,其中,该基因组学数据中包含该待检测的患者包含的基因对应的基因突变状态,其中,该基因突变状态包括野生型(wildtype)以及突变型(mutant)。由于每个待预测的患者存在多个基因,且每个基因对应一个基因突变状态,因此,在本发明实施例中,可以将各个基因对应的基因突变状态确定为该待预测患者的基因对应的特征。
为了准确的确定待预测的患者的基因的基因突变状态对应的特征,在发明实施例中,根据基因组学数据,确定该基因组学数据中包含的待预测的患者包含的所有基因对应的基因突变状态,由于患者包含的所有基因的数量可能很多,且有一些基因对应的基因突变状态可能对患者生存时长的影响并不大,因此,在本发明实施例中,可以预先保存第二特征,其中,该第二特征为对患者生存时长影响比较大的特征,具体的,该第二特征可以根据临床经验进行确定。
根据该患者包含的所有基因的基因突变状态以及该预先保存的第二特征,确定待预测患者的目标基因特征值集。其中,该目标基因特征值集中可以包含基因对应的基因突变状态的特征值,其中,可以将野生型的基因突变状态的特征值设置为0,将突变型的基因突变状态的特征值设置为1;也可以将突变型的基因突变状态的特征值设置为0,将野生型的基因突变状态的特征值设置为1。
在本发明实施例中,由于患者的生存时长还受年龄以及性别等因素的影响,因此,可以基于电子设备中预先保存的所述待预测的患者的临床数据,其中,该临床数据中包含患者的姓名信息、年龄信息等等。为了确定临床数据对应的特征,在发明实施例中,根据预先保存的该待预测的患者的临床数据,确定该待预测的患者的临床数据对应的所有特征。由于患者包含的所有临床数据对应的所有特征的数量可能很多,且有一些临床数据对应的特征可能对患者生存时长的影响并不大,因此,在本发明实施例中,可以预先保存第三特征,其中,该第三特征为所有临床数据对应的所有特征中对患者生存时长影响比较大的特征,具体的,该第三特征可以根据临床经验进行确定。
根据预先保存的该待预测的患者的临床数据以及该预先保存的第三特征,确定待预测患者的确定目标临床特征值集,其中,该目标临床特征值集可以中包含年龄特征值以及性别特征值,其中,该年龄特征值可以为25、40等等,该性别特征值可以为1或者0,其中,可以预先设置男性对应的性别特征值为1,女性对应的性别特征值为0,也可以预先设置女性对应的性别特征值为1,男性对应的性别特征值为0。
S103:根据所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的模型,确定所述患者的目标生存时长信息。
为了准确的预测患者的生存时长,在本发明实施例中,存在预先训练完成的模型,可以根据该目标影像特征值集、目标基因特征值集、目标临床特征值集以及预先训练完成的模型,确定患者的目标生存时长。其中,该患者的目标生存时长信息可以为3年、1个月等等具体的时间,也可以为长期、中期、短期等等。
具体的,在本发明实施例中,可以将生存时长不小于预设的第一生存时长阈值的生存时长信息设置为长期,将生存时长小于预设的第一生存时长阈值且不小于预设的第二生存时长阈值的生存时长信息设置为中期,将生存时长小于预设的第三生存时长阈值的生存时长信息设置为短期,其中,该第一生存时长阈值大于第二生存时长阈值,该第二生存时长阈值大小第三生存时长阈值。其中,该第一生存时长阈值可以为400天、300天等等,该第二生存时长阈值可以为200天、150天等等,该第三生存时长阈值可以为50天、30天等等,具体的,该第一生存时长阈值、第二生存时长阈值以及第三生存时长阈值的设置可以根据需求进行设置。
由于本发明实施例中,可以基于待预测的患者的多模态磁共振图像、基因组学数据以及待检测的临床数据,分别确定对应的目标影像特征值集、目标基因特征值集以及目标临床特征值集,并根据该目标影像特征值集、目标基因特征值集、目标临床特征值集以及预先训练完成的模型,确定该患者的目标生存时长,提高了对患者的生存时长的预测的准确性,提高了用户体验。
实施例2:
为了确定多模态磁共振图像中的肿瘤区域,在上述实施例的基础上,在本发明实施例中,所述确定待预测的患者的多模态磁共振图像中的肿瘤区域包括:
将待预测的患者的多模态磁共振图像输入到预先训练完成的语义分割模型中,获得所述多模态磁共振图像中的肿瘤区域。
为了确定多模态磁共振图像中的肿瘤区域,在本发明实施例中,预先训练有语义分割模型,该语义分割模型用于获得待预测的患者的多模态磁共振图像中的肿瘤区域。具体的,在本发明实施例中,将该待预测的患者的多模态磁共振图像输入到预先训练完成的语义分割模型中,获得该多模态磁共振图像中的肿瘤区域。其中,该语义分割模型的训练过程为现有技术,在此不做赘述。
实施例3:
为了确定目标影像特征值集,在上述各实施例的基础上,在本发明实施例中,基于图像处理算法以及预先保存的第一特征,确定所述肿瘤区域对应的目标影像特征值集包括:
基于图像处理算法,确定所述肿瘤区域对应的每个特征的第一特征值;
根据所述肿瘤区域的每个特征中与所述预先保存的第一特征匹配的特征对应的第一特征值,确定目标影像特征值集。
在本发明实施例中,为了确定肿瘤区域对应的特征的特征值,在确定待检测患者的多模态磁共振图像中的肿瘤区域后,基于图像处理算法,确定该肿瘤区域对应的每个特征的第一特征值。由于在确定患者的生存时长的过程中,针对所有的患者,只有肿瘤区域对应的公共特征对患者的生存时长的确定才有意义,因此,该肿瘤区域对应的每个特征为每个患者都拥有的公共特征。为了从肿瘤区域对应的每个特征中筛选出对患者生存时长影响程度比较大的特征,将该待预测的患者的肿瘤区域对应的每个特征与预先保存的第一特征进行匹配,根据该肿瘤区域的每个特征中与该预先保存的第一特征匹配的特征对应的第一特征值,确定目标影像特征值集。
比如,基于图像处理算法,确定该肿瘤区域对应的每个特征包括:肿瘤面积为1cm2、肿瘤体积1cm3,该预先保存的第一特征为肿瘤面积,则将肿瘤面积对应的第一特征值1cm2确定为目标影像特征值集。
实施例4:
为了确定目标基因特征值集,在上述各实施例的基础上,在本发明实施例中,所述根据基因组学数据中包含所述患者包含的基因对应的基因突变状态以及预先保存的第二特征,确定目标基因特征值集包括:
确定基因组学数据中包含所述患者包含的每个基因对应的基因突变状态的特征的第二特征值;
根据所述每个基因对应的基因突变状态的特征中与所述预先保存的第二特征匹配的特征对应的第二特征值,确定目标基因特征值集。
在本发明实施例中,为了确定基因对应的基因突变状态的特征的特征值,确定基因组学数据中包含的患者包含的每个基因对应的基因突变状态的特征的第二特征值。由于在确定患者的生存时长的过程中,针对所有的患者,只有公共基因对应的基因突变状态的特征对患者的生存时长的确定才有意义,因此,该每个基因对应的基因突变状态的特征为每个患者都拥有的每个公共基因的基因突变状态,为了从基因对应的基因突变状态的特征中筛选出对患者生存时长影响程度比较大的特征,将该待预测的患者的包含的基因对应的基因突变状态的特征与预先保存的第二特征进行匹配,根据该待预测的患者的包含的基因对应的基因突变状态的特征中与该预先保存的第二特征匹配的特征对应的第二特征值,确定目标基因特征值集。
比如,根据基因组学数据,确定该患者包含的基因对应的基因突变状态的特征包括:IDH对应的基因突变状态的特征的第二特征值为1、TP53对应的基因突变状态的特征的第二特征值为0,该预先保存的第二特征为IDH对应的基因突变状态的特征,则将DH对应的基因突变状态的特征的第二特征值1确定为目标基因特征值集。
实施例5:
为了确定目标临床特征值集,在上述各实施例的基础上,在本发明实施例中,根据预先保存的所述待预测的患者的临床数据以及预先保存的第三特征,确定目标临床特征值集包括:
确定预先保存的所述待预测的患者的临床数据中包含的每个数据对应特征的第三特征值;
根据所述每个数据对应特征中与预先保存的第三特征匹配的特征对应的第三特征值,确定目标临床特征值集。
在本发明实施例中,为了确定待预测的患者的临床数据的特征的特征值,确定预先保存的该待预测的患者的临床数据中包含的每个数据对应的特征的第三特征值。由于在确定患者的生存时长的过程中,针对所有的患者,只有临床数据中的公共数据对应的特征对患者的生存时长的确定才有意义,因此,该每个数据对应的特征为临床数据中包含的每个公共数据对应的特征,为了从该待预测的患者的临床数据中包含的每个数据的特征中筛选出对患者生存时长影响程度比较大的特征,将该每个数据的特征与预先保存的第三特征进行匹配,根据该每个数据的特征中与该预先保存的第三特征匹配的特征对应的第三特征值,确定目标临床特征值集。
比如,基于预先保存的该待预测的患者的临床数据,确定该患者的临床数据中包含的每个数据对应特征的第三特征值包括:年龄对应的特征的第三特征值为40、患病时长对应的特征的第三特征值为3,性别对应的特征的第三特征值为1,该预先保存的第三特征为年龄对应的特征,以及性别对应的特征,则将年龄对应的特征的第三特征值40以及别对应的特征的第三特征值1,确定为目标临床特征值集。
实施例6:
为了实现对患者的目标生存时长进行预测,在上述各实施例的基础上,在本发明实施例中,所述根据所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的模型,确定所述待预测的患者的目标生存时长信息包括:
基于所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的风险等级预测模型,确定目标风险等级特征值;
基于所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集、所述目标风险等级特征值以及预先训练完成的生存时长预测模型,确定所述待预测的患者的目标生存时长信息。
在本发明实施例中,在确定目标影像特征值集、目标基因特征值集以及目标临床特征值集后,可以基于该目标影像特征值集、目标基因特征值集以及目标临床特征值集以及预先训练完成的模型,确定患者的目标生存时长。其中,由于该目标影像特征值集、目标基因特征值集以及目标临床特征值集中这三个特征集中的每个特征集中都可能包含多个特征,因此,待预测的患者的目标影像特征值集、目标基因特征值集以及目标临床特征值集可以用构成一个向量,也就是说,可以用一个向量表示该预测的患者的目标影像特征值集、目标基因特征值集以及目标临床特征值集,具体的,该目标影像特征值集、目标基因特征值集以及目标临床特征值集中的每个特征值为该向量中的每个分量。
为了提高生存时长预测的准确性,具体的,在本发明实施例中,在确定目标生存时长的过程中,先将确定的目标影像特征值集、目标基因特征值集以及目标临床特征值集先输入到预先训练完成的风险等级预测模型中,输出该患者的目标风险等级特征值,然后将该目标影像特征值集、目标基因特征值集以及目标临床特征值集以及该患者的目标风险等级特征值输入到预先训练完成的生存时长预测模型中,确定该患者的目标生存时长。
实施例7:
为了准确的预测患者的目标生存时长,在上述各实施例的基础上,在本发明实施例中,所述根据所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的模型,确定所述待预测的患者的目标生存时长信息包括:
获取所述目标影像特征值集中与预先保存第一子特征匹配的第一目标子特征值,并获取所述目标影像特征值集中与预先保存的第二子特征匹配的第二目标子特征值,其中,所述第一子特征与所述第二子特征的数量的和值不小于所述预先保存的第一特征的数量;
获取所述目标基因特征值集中与预先保存第三子特征匹配的第三目标子特征值,并获取所述目标基因特征值集中与预先保存第四子特征匹配的第四目标子特征值,其中,所述第三子特征与所述第四子特征的数量的和值不小于所述预先保存的第二特征的数量;
获取所述目标临床特征值集中与预先保存第五子特征匹配的第五目标子特征值,并获取所述目标临床特征值集中与预先保存第六子特征匹配的第六目标子特征值,其中,所述第五子特征与所述第六子特征的数量的和值不小于所述预先保存的第三特征的数量;
基于所述第一目标子特征值、所述第三目标子特征值、所述第五目标子特征值以及预先训练完成的风险等级预测模型,确定目标风险等级特征值;
基于所述第二目标子特征值、所述第四目标子特征值、所述第六目标子特征值、所述目标风险等级特征值以及预先训练完成的生存时长预测模型,确定所述待预测的患者的目标生存时长信息。
在本发明实施例中,在确定患者的目标生存时长的过程中,可以将确定的目标影像特征值集、目标基因特征值集以及目标临床特征值集先输入到预先训练完成的风险等级预测模型中,输出该患者的目标风险等级特征值,然后将该目标影像特征值集、目标基因特征值集以及目标临床特征值集以及该患者的目标风险等级特征值输入到预先训练完成的生存时长预测模型中,确定该患者的目标生存时长,由于对患者的目标风险等级的影响比较大的特征与对患者的目标生存时长影响比较大的特征可能不完全相同,因此,在本发明实施例中,可以在将目标影像特征值集、目标基因特征值集以及目标临床特征值集输入到预先训练完成的风险等级预测模型之前,可以先从目标影像特征值集、目标基因特征值集以及目标临床特征值集中筛选出部分对风险等级影响比较大的特征对应的特征值,然后将该对风险等级影响比较大的特征对应的特征值输入到预先训练完成的风险等级预测模型中,进而确定目标风险等级特征值。在将目标影像特征值集、目标基因特征值集以及目标临床特征值集输入到预先训练完成的生存时长预测模型之前,先从目标影像特征值集、目标基因特征值集以及目标临床特征值集中筛选出部分对生存时长影响比较大的特征对应的特征值,然后将该对生存时长影响比较大的特征对应的特征值输入到预先训练完成的生存时长预测模型中,进而确定待预测的患者的目标生存时长信息。
具体的,在从目标影像特征值集、目标基因特征值集以及目标临床特征值集中筛选出部分对风险等级影响比较大的特征对应的特征值的过程中,电子设备中预先保存了第一子特征、第三子特征以及第五子特征,该第一子特征用于在目标影像特征值集中筛选出部分对风险等级影响比较大的特征对应的特征值,具体的,获取该目标影像特征值集中与预先保存第一子特征匹配的第一目标子特征值;该第三子特征用于在目标基因特征值集中筛选出部分对风险等级影响比较大的特征对应的特征值,具体的,获取该目标基因特征值集中与预先保存第三子特征匹配的第三目标子特征值;该第五子特征用于在目标基因特征值集中筛选出部分对风险等级影响比较大的特征对应的特征值,具体的,获取该目标基因特征值集中与预先保存第五子特征匹配的第五目标子特征值。
在确定第一目标子特征值、第三目标子特征值以及第五目标子特征值之后,将该第一目标子特征值、第三目标子特征值以及第五目标子特征值输入到预先训练完成的风险等级预测模型,确定目标风险等级特征值,也就是说,基于该第一目标子特征值、第三目标子特征值、第五目标子特征值以及预先训练完成的风险等级预测模型,确定目标风险等级特征值。
在从目标影像特征值集、目标基因特征值集以及目标临床特征值集中筛选出部分对生存时长影响比较大的特征对应的特征值的过程中,电子设备中预先保存了第二子特征、第四子特征以及第六子特征,该第二子特征用于在目标影像特征值集中筛选出部分对生存时长影响比较大的特征对应的特征值,具体的,获取该目标影像特征值集中与预先保存第二子特征匹配的第二目标子特征值;
该第四子特征用于在目标基因特征值集中筛选出部分对生存时长影响比较大的特征对应的特征值,具体的,获取该目标基因特征值集中与预先保存第四子特征匹配的第四目标子特征值;该第六子特征用于在目标临床特征值集中筛选出部分对生存时长影响比较大的特征对应的特征值,具体的,获取该目标基因特征值集中与预先保存第六子特征匹配的第六目标子特征值。
在确定第二目标子特征值、第四目标子特征值以及第六目标子特征值之后,将该第二目标子特征值、第四目标子特征值以及第六目标子特征值输入到预先训练完成的生存时长预测模型,确定待预测的患者的目标生存时长信息,也就是说,基于该第二目标子特征值、第四目标子特征值、第六目标子特征值以及预先训练完成的生存时长预测模型,确定待预测的患者的目标生存时长信息。
实施例6:
为了确定预先保存的第一子特征、第二子特征、第三子特征、第四子特征、第五子特征以及第六子特征,在上述各实施例的基础上,在本发明实施例中,预先保存的子特征的过程包括:
基于每个样本患者的肿瘤区域对应的每个第一样本特征的第一样本特征值、每个样本患者的每个基因对应的基因突变的第二样本特征对应的第二样本特征值以及每个样本患者的临床数据中包含的每个数据对应的第三样本特征对应的第三样本特征值、递归特征消除算法以及交叉验证,确定第一子特征、第三子特征以及第五子特征;
基于每个样本患者的肿瘤区域对应的每个第一样本特征的第一样本特征值、每个样本患者的每个基因对应的基因突变的第二样本特征对应的第二样本特征值以及每个样本患者的临床数据中包含的每个数据对应的第三样本特征对应的第三样本特征值以及COX比例风险模型,确定第二子特征、第四子特征以及第六子特征。
在本发明实施例中,预先获得了很多的样本患者对应的多模态磁共振图像、基因组学数据以及临床数据,为了方便描述,将样本患者对应的多模态磁共振图像称为样本多模态磁共振图像,将该样本多模态磁共振图像中的对应的肿瘤区域对应的特征称为第一样本特征,将该第一样本特征对应的特征值确定为第一样本特征值;将样本患者对应的基因组学数据称为样本基因组学数据,将该样本基因组学数据中包含的基因对应的基因突变状态的特征称为第二样本特征,将该第二样本特征对应的特征值确定为第二样本特征值;将样本患者对应的临床数据中包含的数据对应的特征称为第三样本特征,将该第三样本特征对应的特征值确定为第三样本特征值。
为了确定第一子特征、第三子特征以及第五子特征,在本发明实施例中,可以基于样本多模态磁共振图像,获得样本患者的肿瘤区域对应每个第一样本特征,其中,该肿瘤区域对应每个第一样本特征也就是每个样本患者的肿瘤区域对应的所有公共特征,其中,该公共特征可以为肿瘤的面积、肿瘤的体积、肿瘤的纹理等所有样本患者都能提取待的特征,在本发明实施例中,可以将该肿瘤区域对应的所有第一样本特征确定为第一子特征。
在本发明实施例中,可以基于样本患者对应的基因组学数据,确定该样本患者包含的每个基因对应的基因突变的第二样本特征,其中,该每个基因对应的基因突变状态的第二样本特征也就是每个样本患者拥有的所有公共基因的基因突变状态对应的特征,其中,该公共基因可以为IDH、TP53、ATRX等所有样本患者都拥有的基因,在本发明实施例中,可以将样本患者包含的所有第二样本特征确定为第三子特征。
由于样本患者的基因组学数据中的基因太多,若将每个基因对应的第二样本特征都确定为第三子特征,则会加重后续电子设备的确定待预测的患者的生存时长时的工作负担,因此,为了减轻电子设备的工作负担,可以在样本患者的每个基因中筛选出部分基因,也就是说,可以在基因组学数据中的所有公共基因中筛选出部分基因,将该部分基因的基因突变状态确定对应的特征确定为第三子特征。在基因组学数据中的所有公共基因中筛选出部分基因的过程中,由于突变率越大的基因,对患者生存时长的影响越大,因此,为了提高生存时长预测的准确性,在本发明实施例中,可以在基因组学数据中的所有公共基因中筛选出突变率大的基因,并将该突变率大的基因的基因突变状态对应的特征确定为第三子特征,也就是说,将突变率大的基因对应的第二样本特征确定为第三子特征。具体的,可以根据预先保存的基因与突变率的对应关系,确定该公共基因中突变率大于预先设定的突变率阈值的目标基因,并将该目标基因的基因突变状态对应的特征确定为第三子特征,也就是说,将目标基因对应的第二样本特征确定为第三子特征,其中,该预先设定的突变率阈值可以为30%或者40%等等,具体的,该突变率阈值可以根据需求进行设置。
比如,根据基因组学数据确定样本患者包含的公共基因有IDH、TP53、ATRX、TTN、PTEN,且该公共基因对应的突变率分别为46.51%、40.86%、26.69%、23.81%以及18.49%,且该预先设定的突变率阈值为30%,公共基因中突变率大于预先设定的突变率阈值的目标基因为IDH以及TP53,则该第三子特征为IDH的基因突变状态对应的特征以及TP53的基因突变状态对应的特征。
图2为本发明实施例提供的一种保存的基因与突变率的对应关系的示意图,现针对图2进行说明:
预先保存了各个基因与突变率的对应关系,比如,简称为IDH的基因对应的基因的突变率为46.51%;简称为TP53的基因对应的基因的突变率为40.86%;简称为ATRX的基因对应的基因的突变率为26.69%。
在本发明实施例中,可以基于样本患者对应的样本临床数据确定样本患者的样本临床数据中每个数据对应的第三样本特征,其中,该每个数据对应的第三样本特征为每个样本患者的临床数据中都包含的公共数据,该公共数据可以为年龄、性别等所有样本患者都拥有的临床数据,在本发明实施例中,可以将样本患者包含的所有第三样本特征确定为第五子特征。
由于所有第一样本特征、所有第二样本特征或突变率大于预先设定的突变率阈值的目标基因对应的第二样本特征、以及所有第三样本特征中的特征的数量太多,且为了提高后续确定患者生存时长的准确性,可以从所有第一样本特征、所有第二样本特征或突变率大于预先设定的突变率阈值的目标基因对应的第二样本特征、以及所有第三样本特征中筛选出部分特征分别确定为第一子特征、第三子特征以及第五子特征,具体的,可以基于该每个样本患者对应的第一样本特征对应的第一样本特征值、该每个样本患者的第二样本特征对应的第二样本特征值、该每个样本患者的第三样本特征对应的第三样本特征值、递归特征消除算法以及交叉验证对该所有第一样本特征、所有第二样本特征或突变率大于预先设定的突变率阈值的目标基因对应的第二样本特征、以及所有第三样本特征进行特征选择,也就是说,对肿瘤区域对应的所有公共特征、样本患者包含的所有公共基因的基因突变状态对应的特征以及样本患者的样本临床数据中每个公共数据对应的特征中进行特征选择,将被选择的特征分别确定为第一子特征、第三子特征以及第五子特征,其中,该交叉验证用于确定从所有第一样本特征、所有第二样本特征或突变率大于预先设定的突变率阈值的目标基因对应的第二样本特征、以及所有第三样本特征中筛选的特征的最佳个数,其中,该最佳个数为从这些特征中筛选出来的特征值的总个数,该交叉验证可以为5折交叉验证。其中,该递归特征消除算法用于筛选特征。其中,基于递归特征消除算法以及交叉验证进行特征选择的过程为现有技术,在此不做赘述。
为了确定第二子特征、第四子特征以及第六子特征,在本发明实施例中,可以直接将所有第一样本特征、所有第二样本特征或突变率大于预先设定的突变率阈值的目标基因对应的第二样本特征、以及所有第三样本特征分别确定为第二子特征、第四子特征以及第六子特征,为了提高预测患者生存时长的准确性,可以将所有第一样本特征、所有第二样本特征或突变率大于预先设定的突变率阈值的目标基因对应的第二样本特征、以及所有第三样本特征进一步筛选。
在对该所有第一样本特征、所有第二样本特征或突变率大于预先设定的突变率阈值的目标基因对应的第二样本特征、以及所有第三样本特征进一步筛选的过程中,可以基于该所有第一样本特征、所有第二样本特征或突变率大于预先设定的突变率阈值的目标基因对应的第二样本特征、以及所有第三样本特征以及COX比例风险模型进行特征选择,采用被选择的所有第一样本特征、所有第二样本特征或突变率大于预先设定的突变率阈值的目标基因对应的第二样本特征、以及所有第三样本特征分别确定为第二子特征、第四子特征以及第六子特征。
其中,基于COX比例风险模型进行特征选择的过程为现有技术,在此不做赘述。
图3为本发明实施例提供的一种COX比例风险模型进行特征值选择的结果示意图,现针对图3进行说明:
基于所有第一样本特征、所有第二样本特征或突变率大于预先设定的突变率阈值的目标基因对应的第二样本特征、以及所有第三样本特征以及COX比例风险模型进行特征选择后,被选择的影像的特征包括:T1_shape_Sphericity,T1_glcm_Coerrelation,T1_gldm_LargeDependenceLowGrayLevelEmphasis以及T2_glszm_LargeArealLowGrayLevelEmphasis;被选择的临床特征为年龄(age);被选择的基因的特征为IDH。
在本发明实施例中,在确定第一子特征和第二子特征之后,将该第一子特征与该第二子特征中所有类型的特征确定为预先保存的第一特征,其中,由于该第一子特征以及第二子特征都是基于样本患者的样本肿瘤区域对应的所有第一样本特征筛选出来的特征,因此,该第一子特征中包含的特征与该第二子特征包含的特征可以相同,也可能不相同,且该第一子特征与该第二子特征的数量的和值不小于该预先保存的第一特征的数量。
比如,该第一子特征中包含的特征包含特征A、特征B,该第二子特征中包含的特征包含特征A、特征C,则该预先保存的第一特征中包含特征A、特征B和特征C。
在本发明实施例中,在确定第三子特征和第四子特征之后,将该第三子特征与第四子特征中所有类型的特征确定为预先保存的第二特征,其中,由于该第三子特征以及第四子特征都是基于样本患者的所有公共基因的基因突变状态对应的第二样本特征中筛选出来的特征,因此,该第三子特征中包含的特征与该第四子特征包含的特征可以相同,也可能不相同,且该第三子特征与该第四子特征的数量的和值不小于该预先保存的第二特征的数量。
比如,该第三子特征中包含的特征包含特征A、特征D,该第二子特征中包含的特征包含特征B、特征C,则该预先保存的第二特征中包含特征A、特征B、特征C和特征D。
在本发明实施例中,在确定第五子特征和第六子特征之后,将该第五子特征与第六子特征中所有类型的特征确定为预先保存的第三特征,其中,由于该第五子特征以及第六子特征都是基于样本患者的样本临床数据中每个公共数据对应的第三样本特征中筛选出来的特征,因此,该第五子特征中包含的特征与该第六子特征中包含的特征可以相同,也可能不相同,因此,该第五子特征与该第六子特征的数量的和值不小于该预先保存的第三特征的数量。
比如,该第五子特征中包含的特征包含特征A、特征B,该第六子特征中包含的特征包含特征B、特征C,则该预先保存的第三特征中包含特征A、特征B和特征C。
实施例9:
为了训练风险等级预测模型,在上述各实施例的基础上,在本发明实施例中,训练所述风险等级预测模型的过程包括:
获取第一训练集中的任一第一样本特征集,其中,所述第一样本特征集中预先标注有样本患者对应的样本第一风险等级信息,其中,所述第一样本特征集包含样本患者的样本第一子特征对应的特征值、样本第三子特征对应的特征值以及样本第五子特征对应的特征值;
将所述第一样本特征集输入到原始风险等级预测模型中,输出所述第一样本特征集中样本第二风险等级信息;
根据所述样本第一风险等级信息和所述样本第二风险等级信息,对所述风险等级预测模型进行训练。
为了实现基于风险等级预测模型获得该待预测的患者的风险等级,需要对风险等级预测模型进行训练,在对风险等级预测模型进行训练的过程中,预先获得第一训练集中的任一第一样本特征集,该第一样本特征集中包含样本患者对应的样本患者的第一子特征对应的特征值、第三子特征对应的特征值以及第五子特征对应的特征值,且该第一样本特征集中预先标注有样本患者对应的样本第一风险等级信息。然后将该第一样本特征集输入到原始的风险等级预测模型进行训练,输出样本第二风险等级信息,并根据样本第二风险等级信息和该样本第一风险等级信息进行优化,直至训练完成。具体的,根据样本第二风险等级信息和该样本第一风险等级的偏差,从而对该风险等级预测模型中的参数进行调整,经过大量训练后,满足预设的收敛条件,则说明该风险等级预测模型训练完成。
实施例10:
为了训练生存时长预测模型,在上述各实施例的基础上,在本发明实施例中,训练所述生存时长预测模型的过程包括:
获取第二训练集中的任一第二样本特征集,其中,所述第二样本特征集中预先标注有样本患者对应的样本第一生存时长标识值,其中,所述第二样本特征集中包含样本患者的第二子特征对应的特征值、第四子特征对应的特征值以及第六子特征对应的特征值以及预先保存的风险等级对应的特征的特征值;
将所述二样本特征集输入到原始生存时长预测模型中,输出样本第二生存时长标识值;
根据所述样本第二生存时长标识值和所述样本第一生存时长标识值,对所述生存时长预测模型进行训练。
为了实现基于生存时长预测模型获得该待预测的患者的生存时长,需要对生存时长预测模型进行训练,在对生存时长预测模型进行训练的过程中,预先获得第二训练集中的任一第二样本特征集,该第二样本特征集中包含样本患者的第二子特征对应的特征值、第四子特征对应的特征值以及第六子特征对应的特征值以及该预先保存的风险等级对应的特征的特征值,且该第二样本特征集中预先标注有样本患者对应的样本第一生存时长标识值。然后将该第二样本特征集输入到原始的生存时长预测模型进行训练,输出样本第二生存时长标识值,并根据样本第二生存时长标识值和该样本第一风险等级信息进行优化,直至训练完成。具体的,根据样本第二风险等级信息和该样本第一生存时长标识值的偏差,从而对该生存时长预测模型中的参数进行调整,经过大量训练后,满足预设的收敛条件,则说明该风生存时长预测模型训练完成。
图4为本发明实施例提供的一种确定生存时长的过程示意图,现针对图4进行说明:
先进行多组学数据获取,也就是说,获得待预测的患者的多模态磁共振图像、基因组学数据、临床数据,并进行多组学特征获取,也就是说,根据该多模态磁共振图像、基因组学数据、临床数据、预先保存的第一特征、预先保存的第二特征、预先保存的第三特征,进行多组学特征提取,获得目标影像特征值集、目标基因特征值集以及目标临床特征值集,再确定脑胶质瘤风险等级,也就是说,将该目标影像特征值集、目标基因特征值集以及目标临床特征值集输入到预先训练完成的风险等级预测模型中,确定该待预测的患者的目标风险等级特征值,然后将目标风险等级特征值、目标影像特征值集、目标基因特征值集以及目标临床特征值集输入到预先训练完成的生存时长预测模型中,获得该待预测的患者的目标生存时长。
实施例11:
图5为本发明实施例提供的一种生存时长预测装置结构示意图,该装置包括:
确定装置501,用于确定待预测的患者的多模态磁共振图像中的肿瘤区域,基于图像处理算法以及预先保存的第一特征,确定所述肿瘤区域对应的目标影像特征值集;根据基因组学数据中包含所述患者包含的基因对应的基因突变状态以及预先保存的第二特征,确定目标基因特征值集,并根据预先保存的所述待预测的患者的临床数据以及预先保存的第三特征,确定目标临床特征值集,其中,所述目标临床特征值集中包含年龄特征值以及性别特征值;
预测装置502,用于根据所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的模型,确定所述待预测的患者的目标生存时长信息。
在一种可能的实施方式中,所述确定模块501,具体用于将待预测的患者的多模态磁共振图像输入到预先训练完成的语义分割模型中,获得所述多模态磁共振图像中的肿瘤区域。
在一种可能的实施方式中,所述确定模块501,具体用于基于图像处理算法,确定所述肿瘤区域对应的每个特征的第一特征值;根据所述肿瘤区域的每个特征中与所述预先保存的第一特征匹配的特征对应的第一特征值,确定目标影像特征值集。
在一种可能的实施方式中,所述确定模块501,具体用于确定基因组学数据中包含所述患者包含的每个基因对应的基因突变状态的特征的第二特征值;根据所述每个基因对应的基因突变状态的特征中与所述预先保存的第二特征匹配的特征对应的第二特征值,确定目标基因特征值集。
在一种可能的实施方式中,所述确定模块501,具体用于确定预先保存的所述待预测的患者的临床数据中包含的每个数据对应特征的第三特征值;根据所述每个数据对应特征中与预先保存的第三特征匹配的特征对应的第三特征值,确定目标临床特征值集。
在一种可能的实施方式中,所述预测模块502,具体用于基于所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的风险等级预测模型,确定目标风险等级特征值;基于所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集、所述目标风险等级特征值以及预先训练完成的生存时长预测模型,确定所述待预测的患者的目标生存时长信息。
在一种可能的实施方式中,所述预测模块502,具体用于获取所述目标影像特征值集中与预先保存第一子特征匹配的第一目标子特征值,并获取所述目标影像特征值集中与预先保存的第二子特征匹配的第二目标子特征值,其中,所述第一子特征与所述第二子特征的数量的和值不小于所述预先保存的第一特征的数量;
获取所述目标基因特征值集中与预先保存第三子特征匹配的第三目标子特征值,并获取所述目标基因特征值集中与预先保存第四子特征匹配的第四目标子特征值,其中,所述第三子特征与所述第四子特征的数量的和值不小于所述预先保存的第二特征的数量;获取所述目标临床特征值集中与预先保存第五子特征匹配的第五目标子特征值,并获取所述目标临床特征值集中与预先保存第六子特征匹配的第六目标子特征值,其中,所述第五子特征与所述第六子特征的数量的和值不小于所述预先保存的第三特征的数量;基于所述第一目标子特征值、所述第三目标子特征值、所述第五目标子特征值以及预先训练完成的风险等级预测模型,确定目标风险等级特征值;基于所述第二目标子特征值、所述第四目标子特征值、所述第六目标子特征值、所述目标风险等级特征值以及预先训练完成的生存时长预测模型,确定所述待预测的患者的目标生存时长信息。
在一种可能的实施方式中,所述确定模块501,还用于基于每个样本患者的肿瘤区域对应的每个第一样本特征的第一样本特征值、每个样本患者的每个基因对应的基因突变的第二样本特征对应的第二样本特征值以及每个样本患者的临床数据中包含的每个数据对应的第三样本特征对应的第三样本特征值、递归特征消除算法以及交叉验证,确定第一子特征、第三子特征以及第五子特征;
基于每个样本患者的肿瘤区域对应的每个第一样本特征的第一样本特征值、每个样本患者的每个基因对应的基因突变的第二样本特征对应的第二样本特征值以及每个样本患者的临床数据中包含的每个数据对应的第三样本特征对应的第三样本特征值以及COX比例风险模型,确定第二子特征、第四子特征以及第六子特征。
在一种可能的实施方式中,所述装置还包括:
训练模块503,用于获取第一训练集中的任一第一样本特征集,其中,所述第一样本特征集中预先标注有样本患者对应的样本第一风险等级信息,其中,所述第一样本特征集包含样本患者的第一子特征对应的特征值、第三子特征对应的特征值以及第五子特征对应的特征值;将所述第一样本特征集输入到原始风险等级预测模型中,输出样本第二风险等级信息;根据所述样本第一风险等级信息和所述样本第二风险等级信息,对所述风险等级预测模型进行训练。
在一种可能的实施方式中,所述训练模块503,还用于获取第二训练集中的任一第二样本特征集,其中,所述第二样本特征集中预先标注有样本患者对应的样本第一生存时长标识值,其中,所述第二样本特征集中包含样本患者的第二子特征对应的特征值、第四子特征对应的特征值、第六子特征对应的特征值以及预先保存的风险等级对应的特征的特征值;将所述二样本特征集输入到原始生存时长预测模型中,输出样本第二生存时长标识值;根据所述样本第二生存时长标识值和所述样本第一生存时长标识值,对所述生存时长预测模型进行训练。
实施例12:
在上述各实施例的基础上,本发明实施例还提供了一种电子设备,如图6所示,包括:处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信。
所述存储器603中存储有计算机程序,当所述程序被所述处理器601执行时,使得所述处理器601执行如下步骤:
确定待预测的患者的多模态磁共振图像中的肿瘤区域,基于图像处理算法以及预先保存的第一特征,确定所述肿瘤区域对应的目标影像特征值集;
根据基因组学数据中包含所述患者包含的基因对应的基因突变状态以及预先保存的第二特征,确定目标基因特征值集,并根据预先保存的所述待预测的患者的临床数据以及预先保存的第三特征,确定目标临床特征值集,其中,所述目标临床特征值集中包含年龄特征值以及性别特征值;
根据所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的模型,确定所述待预测的患者的目标生存时长信息。
进一步地,所述处理器601,还用于将待预测的患者的多模态磁共振图像输入到预先训练完成的语义分割模型中,获得所述多模态磁共振图像中的肿瘤区域。
进一步地,所述处理器601,还用于基于图像处理算法,确定所述肿瘤区域对应的每个特征的第一特征值;根据所述肿瘤区域的每个特征中与所述预先保存的第一特征匹配的特征对应的第一特征值,确定目标影像特征值集。
进一步地,所述处理器601,还用于确定基因组学数据中包含所述患者包含的每个基因对应的基因突变状态的特征的第二特征值;根据所述每个基因对应的基因突变状态的特征中与所述预先保存的第二特征匹配的特征对应的第二特征值,确定目标基因特征值集。
进一步地,所述处理器601,还用于确定预先保存的所述待预测的患者的临床数据中包含的每个数据对应特征的第三特征值;根据所述每个数据对应特征中与预先保存的第三特征匹配的特征对应的第三特征值,确定目标临床特征值集。
进一步地,所述处理器601,还用于基于所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的风险等级预测模型,确定目标风险等级特征值;基于所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集、所述目标风险等级特征值以及预先训练完成的生存时长预测模型,确定所述待预测的患者的目标生存时长信息。
进一步地,所述处理器601,还用于获取所述目标影像特征值集中与预先保存第一子特征匹配的第一目标子特征值,并获取所述目标影像特征值集中与预先保存的第二子特征匹配的第二目标子特征值,其中,所述第一子特征与所述第二子特征的数量的和值不小于所述预先保存的第一特征的数量;获取所述目标基因特征值集中与预先保存第三子特征匹配的第三目标子特征值,并获取所述目标基因特征值集中与预先保存第四子特征匹配的第四目标子特征值,其中,所述第三子特征与所述第四子特征的数量的和值不小于所述预先保存的第二特征的数量;获取所述目标临床特征值集中与预先保存第五子特征匹配的第五目标子特征值,并获取所述目标临床特征值集中与预先保存第六子特征匹配的第六目标子特征值,其中,所述第五子特征与所述第六子特征的数量的和值不小于所述预先保存的第三特征的数量;基于所述第一目标子特征值、所述第三目标子特征值、所述第五目标子特征值以及预先训练完成的风险等级预测模型,确定目标风险等级特征值;基于所述第二目标子特征值、所述第四目标子特征值、所述第六目标子特征值、所述目标风险等级特征值以及预先训练完成的生存时长预测模型,确定所述待预测的患者的目标生存时长信息。
进一步地,所述处理器601,还用于基于每个样本患者的肿瘤区域对应的每个第一样本特征的第一样本特征值、每个样本患者的每个基因对应的基因突变的第二样本特征对应的第二样本特征值以及每个样本患者的临床数据中包含的每个数据对应的第三样本特征对应的第三样本特征值、递归特征消除算法以及交叉验证,确定第一子特征、第三子特征以及第五子特征;
基于每个样本患者的肿瘤区域对应的每个第一样本特征的第一样本特征值、每个样本患者的每个基因对应的基因突变的第二样本特征对应的第二样本特征值以及每个样本患者的临床数据中包含的每个数据对应的第三样本特征对应的第三样本特征值以及COX比例风险模型,确定第二子特征、第四子特征以及第六子特征。
进一步地,所述处理器601,还用于获取第一训练集中的任一第一样本特征集,其中,所述第一样本特征集中预先标注有样本患者对应的样本第一风险等级信息,其中,所述第一样本特征集包含样本患者的第一子特征对应的特征值、第三子特征对应的特征值以及第五子特征对应的特征值;将所述第一样本特征集输入到原始风险等级预测模型中,输出样本第二风险等级信息;根据所述样本第一风险等级信息和所述样本第二风险等级信息,对所述风险等级预测模型进行训练。
进一步地,所述处理器601,还用于获取第二训练集中的任一第二样本特征集,其中,所述第二样本特征集中预先标注有样本患者对应的样本第一生存时长标识值,其中,所述第二样本特征集中包含样本患者的第二子特征对应的特征值、第四子特征对应的特征值、第六子特征对应的特征值以及预先保存的风险等级对应的特征的特征值;将所述二样本特征集输入到原始生存时长预测模型中,输出样本第二生存时长标识值;根据所述样本第二生存时长标识值和所述样本第一生存时长标识值,对所述生存时长预测模型进行训练。
上述服务器提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口602用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括中央处理器、网络处理器(NetworkProcessor,NP)等;还可以是数字指令处理器(Digital Signal Processing,DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
实施例13:
在上述各实施例的基础上,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有可由电子设备执行的计算机程序,当所述程序在所述电子设备上运行时,使得所述电子设备执行时实现如下步骤:
所述存储器中存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行如下步骤:
确定待预测的患者的多模态磁共振图像中的肿瘤区域,基于图像处理算法以及预先保存的第一特征,确定所述肿瘤区域对应的目标影像特征值集;
根据基因组学数据中包含所述患者包含的基因对应的基因突变状态以及预先保存的第二特征,确定目标基因特征值集,并根据预先保存的所述待预测的患者的临床数据以及预先保存的第三特征,确定目标临床特征值集,其中,所述目标临床特征值集中包含年龄特征值以及性别特征值;
根据所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的模型,确定所述待预测的患者的目标生存时长信息。
进一步地,所述确定待预测的患者的多模态磁共振图像中的肿瘤区域包括:
将待预测的患者的多模态磁共振图像输入到预先训练完成的语义分割模型中,获得所述多模态磁共振图像中的肿瘤区域。
进一步地,所述基于图像处理算法以及预先保存的第一特征,确定所述肿瘤区域对应的目标影像特征值集包括:
基于图像处理算法,确定所述肿瘤区域对应的每个特征的第一特征值;
根据所述肿瘤区域的每个特征中与所述预先保存的第一特征匹配的特征对应的第一特征值,确定目标影像特征值集。
进一步地,所述根据基因组学数据中包含所述患者包含的基因对应的基因突变状态以及预先保存的第二特征,确定目标基因特征值集包括:
确定基因组学数据中包含所述患者包含的每个基因对应的基因突变状态的特征的第二特征值;
根据所述每个基因对应的基因突变状态的特征中与所述预先保存的第二特征匹配的特征对应的第二特征值,确定目标基因特征值集。
进一步地,所述根据预先保存的所述待预测的患者的临床数据以及预先保存的第三特征,确定目标临床特征值集包括:
确定预先保存的所述待预测的患者的临床数据中包含的每个数据对应特征的第三特征值;
根据所述每个数据对应特征中与预先保存的第三特征匹配的特征对应的第三特征值,确定目标临床特征值集。
进一步地,所述根据所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的模型,确定所述待预测的患者的目标生存时长信息包括:
基于所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的风险等级预测模型,确定目标风险等级特征值;
基于所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集、所述目标风险等级特征值以及预先训练完成的生存时长预测模型,确定所述待预测的患者的目标生存时长信息。
进一步地,所述根据所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的模型,确定所述待预测的患者的目标生存时长信息包括:
获取所述目标影像特征值集中与预先保存第一子特征匹配的第一目标子特征值,并获取所述目标影像特征值集中与预先保存的第二子特征匹配的第二目标子特征值,其中,所述第一子特征与所述第二子特征的数量的和值不小于所述预先保存的第一特征的数量;
获取所述目标基因特征值集中与预先保存第三子特征匹配的第三目标子特征值,并获取所述目标基因特征值集中与预先保存第四子特征匹配的第四目标子特征值,其中,所述第三子特征与所述第四子特征的数量的和值不小于所述预先保存的第二特征的数量;
获取所述目标临床特征值集中与预先保存第五子特征匹配的第五目标子特征值,并获取所述目标临床特征值集中与预先保存第六子特征匹配的第六目标子特征值,其中,所述第五子特征与所述第六子特征的数量的和值不小于所述预先保存的第三特征的数量;
基于所述第一目标子特征值、所述第三目标子特征值、所述第五目标子特征值以及预先训练完成的风险等级预测模型,确定目标风险等级特征值;
基于所述第二目标子特征值、所述第四目标子特征值、所述第六目标子特征值、所述目标风险等级特征值以及预先训练完成的生存时长预测模型,确定所述待预测的患者的目标生存时长信息。
进一步地,确定预先保存的子特征的过程包括:
基于每个样本患者的肿瘤区域对应的每个第一样本特征的第一样本特征值、每个样本患者的每个基因对应的基因突变的第二样本特征对应的第二样本特征值以及每个样本患者的临床数据中包含的每个数据对应的第三样本特征对应的第三样本特征值、递归特征消除算法以及交叉验证,确定第一子特征、第三子特征以及第五子特征;
基于每个样本患者的肿瘤区域对应的每个第一样本特征的第一样本特征值、每个样本患者的每个基因对应的基因突变的第二样本特征对应的第二样本特征值以及每个样本患者的临床数据中包含的每个数据对应的第三样本特征对应的第三样本特征值以及COX比例风险模型,确定第二子特征、第四子特征以及第六子特征。
进一步地,训练所述风险等级预测模型的过程包括:
获取第一训练集中的任一第一样本特征集,其中,所述第一样本特征集中预先标注有样本患者对应的样本第一风险等级信息,其中,所述第一样本特征集包含样本患者的第一子特征对应的特征值、第三子特征对应的特征值以及第五子特征对应的特征值;
将所述第一样本特征集输入到原始风险等级预测模型中,输出样本第二风险等级信息;
根据所述样本第一风险等级信息和所述样本第二风险等级信息,对所述风险等级预测模型进行训练。
进一步地,训练所述生存时长预测模型的过程包括:
获取第二训练集中的任一第二样本特征集,其中,所述第二样本特征集中预先标注有样本患者对应的样本第一生存时长标识值,其中,所述第二样本特征集中包含样本患者的第二子特征对应的特征值、第四子特征对应的特征值、第六子特征对应的特征值以及预先保存的风险等级对应的特征的特征值;
将所述二样本特征集输入到原始生存时长预测模型中,输出样本第二生存时长标识值;
根据所述样本第二生存时长标识值和所述样本第一生存时长标识值,对所述生存时长预测模型进行训练。
由于本发明实施例中,可以基于待预测的患者的多模态磁共振图像、基因组学数据以及待检测的临床数据,分别确定对应的目标影像特征值集、目标基因特征值集以及目标临床特征值集,并根据该目标影像特征值集、目标基因特征值集、目标临床特征值集以及预先训练完成的模型,确定该患者的目标生存时长信息,提高了对患者的生存时长的预测的准确性,提高了用户体验。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (11)

1.一种生存时长预测方法,其特征在于,所述方法包括:
确定待预测的患者的多模态磁共振图像中的肿瘤区域,基于图像处理算法以及预先保存的第一特征,确定所述肿瘤区域对应的目标影像特征值集;其中,所述第一特征为肿瘤区域对应的特征中对患者生存时长影响较大的特征;
根据基因组学数据中包含所述患者包含的基因对应的基因突变状态以及预先保存的第二特征,确定目标基因特征值集,并根据预先保存的所述待预测的患者的临床数据以及预先保存的第三特征,确定目标临床特征值集,其中,所述目标临床特征值集中包含年龄特征值以及性别特征值;所述第二特征为基因对应的基因突变状态的特征中对患者生存时长影响较大的特征,所述第三特征为所有临床数据对应的所有特征中对患者生存时长影响较大的特征;
根据所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的模型,确定所述待预测的患者的目标生存时长信息,包括:
获取所述目标影像特征值集中与预先保存的第一子特征匹配的第一目标子特征值,并获取所述目标影像特征值集中与预先保存的第二子特征匹配的第二目标子特征值,其中,所述第一子特征与所述第二子特征的数量的和值不小于所述预先保存的第一特征的数量;第一子特征用于在目标影像特征值集中筛选出对风险等级影响较大的特征对应的特征值,第二子特征用于在目标影像特征值集中筛选出对生存时长影响较大的特征对应的特征值;
获取所述目标基因特征值集中与预先保存的第三子特征匹配的第三目标子特征值,并获取所述目标基因特征值集中与预先保存的第四子特征匹配的第四目标子特征值,其中,所述第三子特征与所述第四子特征的数量的和值不小于所述预先保存的第二特征的数量;第三子特征用于在目标基因特征值集中筛选出对风险等级影响较大的特征对应的特征值,第四子特征用于在目标基因特征值集中筛选出对生存时长影响较大的特征对应的特征值;
获取所述目标临床特征值集中与预先保存的第五子特征匹配的第五目标子特征值,并获取所述目标临床特征值集中与预先保存的第六子特征匹配的第六目标子特征值,其中,所述第五子特征与所述第六子特征的数量的和值不小于所述预先保存的第三特征的数量;第五子特征用于在目标临床特征值集中筛选出对风险等级影响较大的特征对应的特征值,第六子特征用于在目标临床特征值集中筛选出对生存时长影响较大的特征对应的特征值;
基于所述第一目标子特征值、所述第三目标子特征值、所述第五目标子特征值以及预先训练完成的风险等级预测模型,确定目标风险等级特征值;
基于所述第二目标子特征值、所述第四目标子特征值、所述第六目标子特征值、所述目标风险等级特征值以及预先训练完成的生存时长预测模型,确定所述待预测的患者的目标生存时长信息。
2.根据权利要求1所述的方法,其特征在于,所述确定待预测的患者的多模态磁共振图像中的肿瘤区域包括:
将待预测的患者的多模态磁共振图像输入到预先训练完成的语义分割模型中,获得所述多模态磁共振图像中的肿瘤区域。
3.根据权利要求1所述的方法,其特征在于,所述基于图像处理算法以及预先保存的第一特征,确定所述肿瘤区域对应的目标影像特征值集包括:
基于图像处理算法,确定所述肿瘤区域对应的每个特征的第一特征值;
根据所述肿瘤区域的每个特征中与所述预先保存的第一特征匹配的特征对应的第一特征值,确定目标影像特征值集。
4.根据权利要求1所述的方法,其特征在于,所述根据基因组学数据中包含所述患者包含的基因对应的基因突变状态以及预先保存的第二特征,确定目标基因特征值集包括:
确定基因组学数据中包含所述患者包含的每个基因对应的基因突变状态的特征的第二特征值;
根据所述每个基因对应的基因突变状态的特征中与所述预先保存的第二特征匹配的特征对应的第二特征值,确定目标基因特征值集。
5.根据权利要求1所述的方法,其特征在于,所述根据预先保存的所述待预测的患者的临床数据以及预先保存的第三特征,确定目标临床特征值集包括:
确定预先保存的所述待预测的患者的临床数据中包含的每个数据对应特征的第三特征值;
根据所述每个数据对应特征中与预先保存的第三特征匹配的特征对应的第三特征值,确定目标临床特征值集。
6.根据权利要求1所述的方法,其特征在于,确定预先保存的子特征的过程包括:
基于每个样本患者的肿瘤区域对应的每个第一样本特征的第一样本特征值、每个样本患者的每个基因对应的基因突变状态的第二样本特征对应的第二样本特征值以及每个样本患者的临床数据中包含的每个数据对应的第三样本特征对应的第三样本特征值,通过递归特征消除算法以及交叉验证进行特征选择,分别确定第一子特征、第三子特征以及第五子特征;
基于每个样本患者的肿瘤区域对应的每个第一样本特征的第一样本特征值、每个样本患者的每个基因对应的基因突变状态的第二样本特征对应的第二样本特征值以及每个样本患者的临床数据中包含的每个数据对应的第三样本特征对应的第三样本特征值,通过COX比例风险模型进行特征选择,分别确定第二子特征、第四子特征以及第六子特征。
7.根据权利要求1所述的方法,其特征在于,训练所述风险等级预测模型的过程包括:
获取第一训练集中的任一第一样本特征集,其中,所述第一样本特征集中预先标注有样本患者对应的样本第一风险等级信息,其中,所述第一样本特征集包含样本患者的第一子特征对应的特征值、第三子特征对应的特征值以及第五子特征对应的特征值;
将所述第一样本特征集输入到原始风险等级预测模型中,输出样本第二风险等级信息;
根据所述样本第一风险等级信息和所述样本第二风险等级信息,对所述风险等级预测模型进行训练。
8.根据权利要求1或6所述的方法,其特征在于,训练所述生存时长预测模型的过程包括:
获取第二训练集中的任一第二样本特征集,其中,所述第二样本特征集中预先标注有样本患者对应的样本第一生存时长标识值,其中,所述第二样本特征集中包含样本患者的第二子特征对应的特征值、第四子特征对应的特征值、第六子特征对应的特征值以及预先保存的风险等级对应的特征的特征值;
将所述第二样本特征集输入到原始生存时长预测模型中,输出样本第二生存时长标识值;
根据所述样本第二生存时长标识值和所述样本第一生存时长标识值,对所述生存时长预测模型进行训练。
9.一种生存时长预测装置,用于实现如权利要求1所述的生存时长预测方法,其特征在于,所述装置包括:
确定模块,用于确定待预测的患者的多模态磁共振图像中的肿瘤区域,基于图像处理算法以及预先保存的第一特征,确定所述肿瘤区域对应的目标影像特征值集;根据基因组学数据中包含所述患者包含的基因对应的基因突变状态以及预先保存的第二特征,确定目标基因特征值集,并根据预先保存的所述待预测的患者的临床数据以及预先保存的第三特征,确定目标临床特征值集,其中,所述目标临床特征值集中包含年龄特征值以及性别特征值;
预测模块,用于根据所述目标影像特征值集、所述目标基因特征值集、所述目标临床特征值集以及预先训练完成的模型,确定所述待预测的患者的目标生存时长信息。
10.一种电子设备,其特征在于,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-8中任一所述方法的步骤。
11.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-8中任一所述方法的步骤。
CN202110987850.5A 2021-08-26 2021-08-26 一种生存时长预测方法、装置、设备及介质 Active CN113723415B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110987850.5A CN113723415B (zh) 2021-08-26 2021-08-26 一种生存时长预测方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110987850.5A CN113723415B (zh) 2021-08-26 2021-08-26 一种生存时长预测方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN113723415A CN113723415A (zh) 2021-11-30
CN113723415B true CN113723415B (zh) 2023-07-18

Family

ID=78678153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110987850.5A Active CN113723415B (zh) 2021-08-26 2021-08-26 一种生存时长预测方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113723415B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874647A (zh) * 2017-01-06 2017-06-20 吴安华 一种脑胶质母细胞瘤患者生存期预测系统
CN107582097A (zh) * 2017-07-18 2018-01-16 中山大学附属第医院 一种基于多模态超声组学的智能辅助决策系统
CN112011616A (zh) * 2020-09-02 2020-12-01 复旦大学附属中山医院 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型
CN112215826A (zh) * 2020-10-19 2021-01-12 天津大学 一种基于深度图像特征预测胶质瘤分子亚型及预后方法
CN112687327A (zh) * 2020-12-28 2021-04-20 中山依数科技有限公司 一种基于多任务和多模态的癌症生存分析系统
CN112927799A (zh) * 2021-04-13 2021-06-08 中国科学院自动化研究所 融合多示例学习和多任务深度影像组学的生存期分析系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2238267A2 (en) * 2008-01-24 2010-10-13 Université de Lausanne Method for predicting and diagnosing brain tumor

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874647A (zh) * 2017-01-06 2017-06-20 吴安华 一种脑胶质母细胞瘤患者生存期预测系统
CN107582097A (zh) * 2017-07-18 2018-01-16 中山大学附属第医院 一种基于多模态超声组学的智能辅助决策系统
CN112011616A (zh) * 2020-09-02 2020-12-01 复旦大学附属中山医院 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型
CN112215826A (zh) * 2020-10-19 2021-01-12 天津大学 一种基于深度图像特征预测胶质瘤分子亚型及预后方法
CN112687327A (zh) * 2020-12-28 2021-04-20 中山依数科技有限公司 一种基于多任务和多模态的癌症生存分析系统
CN112927799A (zh) * 2021-04-13 2021-06-08 中国科学院自动化研究所 融合多示例学习和多任务深度影像组学的生存期分析系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MACC1 upregulation promotes gastric cancer tumor cell metastasis and predicts a poor prognosis;Qiu-ping XIE et al.;《Journal of Zhejiang University-Science B(Biomedicine & Biotechnology)》;第17卷(第05期);全文 *
基于基因多态性的肺癌患者生命质量和生存时间影响因素研究;苏彤;《中国博士学位论文全文数据库 医药卫生科技辑(月刊)》(第02期);全文 *
肝癌患者糖脂代谢基因突变及术后生存预测模型的研究;任智慧;《中国博士学位论文全文数据库 医药卫生科技辑(月刊)》(第08期);全文 *

Also Published As

Publication number Publication date
CN113723415A (zh) 2021-11-30

Similar Documents

Publication Publication Date Title
CN106815481B (zh) 一种基于影像组学的生存期预测方法及装置
CN111161279B (zh) 医学图像分割方法、装置及服务器
JP2020513615A (ja) 深層学習ニューラルネットワークの分散化された診断ワークフロー訓練
EP3111422B1 (en) System and method for auto-contouring in adaptive radiotherapy
Aranguren et al. Improving the segmentation of magnetic resonance brain images using the LSHADE optimization algorithm
US20210319555A1 (en) Method and apparatus for classifying a brain anomaly based on a 3d mri image
CN111862096B (zh) 图像分割方法、装置、电子设备及存储介质
CN110604550A (zh) 一种肿瘤放疗后正常组织器官并发症的预测方法
CN112232407A (zh) 病理图像样本的神经网络模型训练方法、装置
CN113240661B (zh) 基于深度学习的腰椎骨分析方法、装置、设备及存储介质
CN113793301B (zh) 基于稠密卷积网络模型的眼底影像分析模型的训练方法
CN112927799A (zh) 融合多示例学习和多任务深度影像组学的生存期分析系统
CN111080654A (zh) 图像的病变区域分割方法、装置及服务器
CN116385373A (zh) 结合稳定学习与混合增强的病理学图像分类方法及系统
CN115272797A (zh) 分类器的训练方法、使用方法、装置、设备及存储介质
CN114661913A (zh) 一种基于预训练语言模型的实体关系抽取方法及装置
CN113723415B (zh) 一种生存时长预测方法、装置、设备及介质
CN109657710B (zh) 数据筛选方法、装置、服务器及存储介质
CN115187512B (zh) 肝细胞癌大血管侵犯风险预测方法、系统、装置及介质
CN113678147A (zh) 搜索方法以及信息处理系统
Manzanera et al. Patient-specific 3d cellular automata nodule growth synthesis in lung cancer without the need of external data
CN110349664B (zh) 基于循环神经网络的肿瘤预测装置、终端设备及存储介质
EP3660736B1 (en) Image analysis for evaluating the effect of a drug
CN113506287A (zh) 全视野病理切片图像分类方法、装置、设备及存储介质
CN112734697A (zh) 图像处理方法、装置、存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant