WO2024066722A1

WO2024066722A1 - 目标模型的获取方法、预后评估值确定方法、装置、设备及介质

Info

Publication number: WO2024066722A1
Application number: PCT/CN2023/110353
Authority: WO
Inventors: 张振中
Original assignee: 京东方科技集团股份有限公司
Priority date: 2022-09-27
Filing date: 2023-07-31
Publication date: 2024-04-04
Also published as: CN115762796A

Abstract

一种目标模型的获取方法、预后评估值确定方法、装置、设备及介质，所述方法包括：获取多个样本用户各自对应的样本组，样本组包括多种模态的样本信息，基于多个样本组，对预设模型进行迭代训练，得到目标模型，目标模型用于预测目标对象的预后评估值；其中，在每一次迭代训练中，可以利用预设模型，分别对当前样本组中多种模态的样本信息进行特征提取，并基于提取到的各样本特征，确定预测预后评估值和一致性表达值；其中，一致性表达值用于表征各样本特征对应同一目标疾病的一致性程度；基于预测预后评估值、当前样本组对应的预后评估标签，以及一致性表达值，对预设模型的参数进行更新。

Description

目标模型的获取方法、预后评估值确定方法、装置、设备及介质

本申请要求在2022年9月27日提交中国专利局、申请号为202211186768.3、发明名称为“目标模型的获取方法、预后评估值确定方法、装置、设备及介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本公开涉及信息处理技术领域，特别是涉及一种目标模型的获取方法、预后评估值确定方法、装置、设备及介质。

背景技术

脑胶质瘤起源于神经胶质细胞，是最常见的中枢神经系统肿瘤，约占颅脑肿瘤的50％～60％，发生率有逐年上升的趋势，脑胶质瘤患者在术后一般需要进行预后评估。

在预后评估中，传统的预后是基于病灶部位的大小、波及范围等作为预后预测因素来评估，有一定的局限性。

概述

本公开提供了一种目标模型获取方法，所述方法包括：

获取多个样本用户各自对应的样本组，所述样本组包括多种模态的样本信息，所述多种模态的样本信息包括核磁共振MR样本图像、临床样本信息和基因样本信息中的至少两者；

基于多个所述样本组，对预设模型进行迭代训练，得到所述目标模型，所述目标模型用于预测目标对象的预后评估值；

其中，在每一次迭代训练中执行以下步骤：

利用所述预设模型，分别对当前样本组中多种模态的样本信息进行特征提取，并基于提取到的各样本特征，确定预测预后评估值和一致性表达值；其中，所述一致性表达值用于表征各所述样本特征对应同一目标疾病的一致性程度；

基于所述预测预后评估值、所述当前样本组对应的预后评估标签，以及所述一致性表达值，对所述预设模型的参数进行更新。

在一种可选的示例中，所述基于所述预测预后评估值、所述当前样本组对应的预后评估标签，以及所述一致性表达值，对所述预设模型的参数进行更新，包括：

获取所述预测预后评估值与所述预后评估标签之间的差异；

以最小化所述差异、最大化所述一致性表达值为目标，对所述预设模型的参数进行更新。

在一种可选的示例中，所述以最小化所述差异、最大化所述一致性表达值为目标，对所述预设模型的参数进行更新，包括：

基于所述差异和所述所述一致性表达值，构建如下损失函数：
loss＝∑_i(y′_i-y_i)²-consistency；

基于所述损失函数的损失值，以最小化所述差异、最大化所述一致性表达值为目标，对所述预设模型的参数进行更新；

其中，所述loss表示损失值、y'_i表示所述预测预后评估值、y_i表示所述预后评估标签、consistency表示一致性表达值。

在一种可选的示例中，所述基于提取到的各样本特征，确定一致性表达值，包括：

对每个所述样本特征进行转置，得到每个所述样本特征对应的转置特征；

对两个不同的样本特征，对其中一个所述样本特征与另一个样本特征对应的转置特征进行融合，得到对应的融合特征值；

基于各个所述融合特征值，确定所述一致性表达值。

在一种可选的示例中，多种模态的样本信息包括多个子样本信息，所述利用所述预设模型，分别对当前样本组中多种模态的样本信息进行特征提取，包括：

对每种模态的样本信息，分别对该种模态的样本信息中多个所述子样本信息进行特征提取，得到对应的多个子特征向量；

对每种模态的样本信息对应的多个所述子特征向量进行特征融合，得到该种模态的样本信息对应的样本特征。

在一种可选的示例中，所述对每种模态的样本信息对应的多个所述子特征向量进行特征融合，得到该种模态的样本信息对应的样本特征，包括：

确定每两个子特征向量之间的注意力值，所述注意力值用于表征两个子特征向量之间的紧密程度；

基于所述注意力值，对多个所述子特征向量进行融合，得到所述该种模态的样本信息对应的样本特征。

在一种可选的示例中，所述基于所述注意力值，对多个所述子特征向量进行融合，得到所述该种模态的样本信息对应的样本特征，包括：

针对每个所述子特征向量，基于该子特征向量与其他全部子特征向量之间的注意力值，将其他全部子特征向量融合进该子特征向量，得到该子特征向量的融合后子向量；

对多个所述融合后子向量进行再融合，得到所述该种模态的样本信息对应的样本特征。

在一种可选的示例中，所述预设模型的参数包括第一参数矩阵，所述MR样本图像包括多个切片样本图像，所述确定每两个子特征向量之间的注意力值，包括：

针对所述MR样本图像所包括的每个切片样本图像，基于所述第一参数矩阵的当前值，确定每两个所述切片样本图像对应的的子特征向量之间的注意力值。

在一种可选的示例中，所述预设模型的参数包括第二参数矩阵和第三参数矩阵，所述对每种模态的样本信息对应的多个所述子特征向量进行特征融合，得到该种模态的样本信息对应的样本特征，包括：

针对所述临床样本信息中的每个临床子样本信息，基于所述第二参数矩阵的当前值，对各个所述临床子样本信息对应的子特征向量进行特征融合，得到所述临床样本信息对应的样本特征；

针对所述基因样本信息中的每个基因子样本信息，基于所述第三参数矩阵的当前值，对各个所述基因子样本信息对应的子特征向量进行特征融合，得到所述基因样本信息对应的样本特征。

在一种可选的示例中，所述预设模型的参数包括与所述临床样本信息对应的参数集，所述临床样本信息包括数值型的子样本信息和非数值型的子样本信息，所述利用所述预设模型，分别对当前样本组中多种模态的样本信息进行特征提取，包括：

对所述当前样本组中的临床样本信息，将所述非数值型的子样本信息转换为第一子特征向量；

基于所述参数集中各个参数的当前值，将所述数值型的子样本信息映射至目标空间，得到对应的第二子特征向量；所述参数集中的参数用于确定所述目标空间的维度以及每个空间点上的值；

将所述第一子特征向量和所述第二子向量进行融合，得到所述临床样本信息对应的样本特征。

在一种可选的示例中，所述参数集包括第一参数向量、第二参数向量和第四参数矩阵，所述基于所述参数集中各个参数的当前值，将所述数值型的子样本信息映射至目标空间，得到对应的第二子特征向量，包括：

基于所述第一参数向量的当前值，将所述数值型的子样本信息映射至所述目标空间中的第一维度，得到所述第一维度的映射值；其中，所述第一参数向量用于确定所述目标空间在所述第一维度上的空间点的值；

基于所述第一维度映射值、所述第二参数向量的当前值和所述第四参数矩阵的当前值，确定所述第二子特征向量；其中，所述第二参数向量用于确定所述目标空间在第二维度上的空间点的值，所述第四参数矩阵用于为所述第一维度和所述第二维度上的每个空间位置赋予参数。

在一种可选的示例中，所述参数集还包括多个第三参数向量，在所述基于所述第一维度映射值、所述第二参数向量的当前值和所述第四参数矩阵的当前值，确定所述第二子特征向量之后，所述方法还包括：

基于所述第二子特征向量和多个所述第三参数向量，按照以下公式修正所述第二子特征向量：

其中，va为修正后的第二子特征向量，sa为所述第二子特征向量，a₁、a₂和a₃分别为所述第三参数向量；

将所述第一子特征向量和所述第二子向量进行融合，得到所述临床样本信息对应的样本特征，包括：

将所述第一子特征向量和修正后的第二子向量进行融合，得到所述临床样本信息对应的样本特征。

在一种可选的示例中，所述预设模型的参数包括与每种模态的样本信息对应的维度参数矩阵，所述基于提取到的各样本特征，确定预测预后评估值和一致性表达值，包括：

基于每种模态的样本信息对应的样本特征和所述维度参数矩阵，对该种模态的样本信息对应的样本特征进行维度变换，得到转换后样本特征；

基于多种模态的样本信息各自对应的转换后样本特征，确定所述预测预后评估值和所述一致性表达值。

在一种可选的示例中，所述预设模型包括融合模块、预测分支、一致性表达分支、以及与每种模态的样本信息各自对应的数据处理模块；所述利用所述预设模型，分别对当前样本组中多种模态的样本信息进行特征提取，并基于提取到的各样本特征，确定预测预后评估值和一致性表达值，包括：

对当前样本组中每种模态的样本信息，利用该模态的样本信息对应的数据处理模块，对对应的样本信息进行特征提取；

利用所述融合模块，对各个所述数据处理模块输出的样本特征进行融合；

利用所述预测分支，确定所述融合模块输出后的特征对应的所述预测预后评估值；

利用所述一致性表达分支，确定各个所述数据处理模块输出的样本特征对应的所述一致性表达值。

在一种可选的示例中，所述基因样本信息包括异柠檬酸脱氢酶、染色体1p/19q联合缺失状态、端粒酶逆转录酶基因启动子、O6-甲基鸟嘌呤-DNA甲基转移酶启动子区甲基化中的至少一种基因的信息；

所述临床样本信息包括：性别、年龄、组织学诊断、肿瘤分级、用药信息、恶性肿瘤病史中的至少一种临床信息。

本公开实施例，还提供了一种预后评估值确定方法，所述方法包括：

获取待测对象的多种模态的信息，所述多种模态的信息包括核磁共振MR图像、临床信息和基因信息；

将所述多种模态的信息输入至目标模型，得到待测对象的预后评估值；其中，所述目标模型是根据所述的目标模型的获取方法得到的。

采用本公开实施例的技术方案，可以获取多个样本用户各自对应的样本组，并基于多个样本组，对预设模型进行迭代训练，得到目标模型，目标模型用于预测目标对象的预后评估值；其中，在每一次迭代训练中，可以利用预设模型，分别对当前样本组中多种模态的样本信息进行特征提取，并基于提取到的各样本特征，确定预测预后评估值和一致性表达值；接着，基于预测预后评估值、当前样本组对应的预后评估标签，以及一致性表达值，对预设模型的参数进行更新。

一方面，由于本公开的样本组包括多种模态的样本信息，具体可以包括核磁共振MR样本图像、临床样本信息和基因样本信息中的至少两者，由此可以利用样本用户的不同维度的信息为参考因素，预测预后评估值，从而实现快速的多因素的预后分析。

另一方面，由于在训练过程中，以一致性表达值作为预设模型的参数更新依据，而一致性表达值用于表征各个样本特征对应同一目标疾病的一致性程度，其中，提取到的样本特征可以理解为是一种进行预后预测的预后因素，这样，随着训练的推进，预设模型可以提取到每种模态的信息与目标疾病有关的预后因素(样本特征)，而逐渐摒弃各种模态的信息中与目标疾病不相关的预后因素，而使得模型所选出的预后因素具有临床上的重要性，进而可以帮助提高模型的可解释性，从而目标模型输出的结果具有较高的预后参考价值。

上述说明仅是本公开技术方案的概述，为了能够更清楚了解本公开的技术手段，而可依照说明书的内容予以实施，并且为了让本公开的上述和其它目的、特征和优点能够更明显易懂，以下特举本公开的具体实施方式。

附图简述

为了更清楚地说明本公开实施例或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。需要说明的是，附图中的比例仅作为示意并不代表实际比例。

图1示意性地示出了目标模型的获取方法的步骤流程图；

图2示意性地示出了一种预设模型的结构示意图；

图3示意性地示出本公开的影像数据处理模块的结构示意图；

图4示意性地示出了图3中的ResNet网络的结构示意图；

图5示意性地示出了一种预后评估值确定方法的步骤流程图；

图6示意性地示出了一种目标模型的获取装置的结构示意图；

图7示意性地示出了一种预后评估值确定装置的结构示意图；

图8示意性地示出了本公开的电子设备的结构框图。

详细描述

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

相关技术中，对于疾病的预后一般是基于病灶大小及有无强化来评估，有一定的局限性。以脑胶质瘤为例，脑胶质瘤起源于神经胶质细胞，是最常见的中枢神经系统肿瘤，约占颅脑肿瘤的50％～60％，发生率有逐年上升的趋势。世界卫生组织将胶质瘤分为低级别(Ⅰ和Ⅱ)和高级别(Ⅲ和Ⅳ)。高级别胶质瘤(HGG)预后较差。Ⅳ级胶质母细胞瘤恶性度最高，10年的生存率不到3％，中位生存约12～14个月。以往的研究通过肿瘤的部位、大小、切除范围及传统影像学方法等作为预后预测因子，来评估神经胶质瘤的预后，有一定的局限性。

然而，采用多因素分析法评估时，需要研究者对众多患者在诊疗、术后过程中进行跟踪随访，收集诊疗信息、患者的生理指标信息，再分析筛选出影像预后的因素，而这一工作需耗费大的人力物力。耗时耗力，单是人工分析筛选预后的因素便会花费很长的时间，存在效率低的问题。

有鉴于此，本公开提出了一种预后评估的方式，具体构思在于，以多种模态的样本信息为训练样本，训练得到目标模型，使用该目标模型进行预后评估，其中，多种模态的样本信息包括核磁共振MR样本图像、临床样本信息和基因样本信息中的至少两者，这样，便可以丰富信息来源，使得可以从多个维度筛选预后因素；而在模型训练过程中，以一致性表达值为因素，更新预设模型的参数，从而可以以多种模态的信息中与目标疾病密切相关的预后因素被筛选出，以提高预后因素的临床重要性，从而而目标模型输出的结果具有较高的预后参考价值。

参照图1所示，示出了本公开的目标模型的获取方法的步骤流程图，如图1所示，具体可以包括以下步骤：

步骤S101：获取多个样本用户各自对应的样本组，样本组包括多种模态的样本信息，多种模态的样本信息包括核磁共振MR样本图像、临床样本信息和基因样本信息中的至少两者；

步骤S102：基于多个样本组，对预设模型进行迭代训练，得到目标模型，目标模型用于预测目标对象的预后评估值；

其中，在步骤S102的每一次迭代训练中执行以下步骤：

步骤S1021：利用预设模型，分别对当前样本组中多种模态的样本信息进行特征提取，并基于提取到的各样本特征，确定预测预后评估值和一致性表达值。其中，一致性表达值用于表征多种模态的样本信息对应同一目标疾病的一致性程度。

步骤S1022：基于预测预后评估值、当前样本组对应的预后评估标签，以及一致性表达值，对预设模型的参数进行更新。

本实施例中，样本用户可以是指明确知道罹患目标疾病的预后生存期和预后生存质量的用户。其中，目标疾病可以是临床已知疾病的任一种疾病，例如上文所阐述的颅脑肿瘤、常见的肝胆肺肿瘤等，在此不做特别限制。

其中，样本用户的年龄、性别可以尽量多样化。其中，多种模态的样本信息可以包括核磁共振MR样本图像、临床样本信息和基因样本信息中的至少两者。不同模态的样本信息可以用于反映样本用户在罹患目标疾病后在相应维度上的表征，例如，MR样本信息可以反映样本用户罹患目标疾病后在器官组织上的形态表征，临床样本信息可以反映样本用户罹患目标疾病后在诊断治疗上的表征，而基因样本信息可以反映样本用户罹患目标疾病后某些基因的表达状态的表征。

其中，MR样本图像可以用于反映样本用户罹患目标疾病后对应的器官组织的形态特征，具体地，核磁共振MR样本图像可以直接从MR成像设备、存储器或任何其它合适的来源获取，例如，可以在获得对应权限后，从医疗数据库中调取样本用户的MR样本图像。需要说明的是，该MR样本图像是与样本用户罹患目标疾病有关的图像，如样本用户罹患的是脑胶质瘤，则MR样本图像是样本用户的脑部MR图像，可以反映脑部组织的形态特征。再如，样本用户罹患的是肝部肿瘤，则MR样本图像可以是用户的腹部MR图像，可以反映腹腔内组织的形态特征。

其中，临床样本信息可以包括样本用户接收诊断和治疗过程中的信息，如药物信息、住院信息、治疗方案信息、主治医生信息、医院信息等。

其中，基因样本信息可以包括与目标疾病的发生、预后有关的基因的信息，具体地，基因样本信息中每种基因的信息包括该基因的名称、该基因的表达状态，这是因为，疾病的发作和预后可以体现在一些基因的表达上，例如，对于脑胶质瘤而言，以TERT(telomerase reverse tranase，端粒酶逆转录酶)基因为例，其是编码端粒酶复合体的重要基因之一，TERT基因在绝大多数非肿瘤细胞中没有转录活性，但是在73％的肿瘤中存在TERT基因突变，如启动子突变、基因易位和DNA扩增等。也就是说上述基因的表达类别与肿瘤具有一定的关联性。

本实施例中，可以将核磁共振MR样本图像、临床样本信息和基因样本信息中的至少两者作为样本用户的一个样本组，一种具体示例中，样本组中的MR样本图像可以是必须的，即可以将临床样本信息和基因样本信息中的任一个或两个与MR样本图像进行组合，从而得到样本组。具体地，样本组可以包括核磁共振MR样本图像和临床样本信息，或者，可以包括核磁共振MR样本图像和基因样本信息，或者可以包括核磁共振MR样本图像、临床样本信息和基因样本信息。

其中，可以以多个样本组为训练样本，对预设模型进行迭代训练，具体的，在每一次训练时，可以批量向预设模型输入多个样本组，或者一次输入一个样本组。

本实施例中，在每一次迭代训练中，可以利用预设模型，分别对当前样本组中多种模态的样本信息进行特征提取，其中，当前样本组是指当次输入到预设模型的样本组，在每次向预设模型输入多个样本组的情况下，当前样本组是指当次输入的多个样本组中的任一样本组。

其中，预设模型可以用于对当前样本组中的每种模态的样本信息进行特征提取，从而得到每种样本信息对应的样本特征，具体地，针对MR图像样本，则提取到的特征是影响组学特征向量，针对临床样本信息，提取到的特征是对临床信息进行特征向量转换后的特征向量，针对基因样本信息，提取到的特征是对基因信息进行特征向量转换后得到的特征向量。

其中，可以依据每种模态信息提取到的样本特征，确定当前样本组对应的样本对象的预测预后评估值，具体实施时，可以对多种模态信息对应的样本特征进行特征融合后，基于融合后的特征确定预测预后评估值。

实际中，不同模态的样本信息应该均包含是目标疾病的描述，各自应当包含大量关于目标疾病一致的信息，但是，不同模态的样本信息也包含了和目标疾病不相关的信息，例如MR样本图像除了包含病灶部位也包含了其他正常组织部位的影像，而正常组织部位的影像在其他模态的样本信息中可能没有相关信息，例如在临床样本信息中便不包含这部分信息，因此预设模型应该在训练过程中，学习到摒弃这部分无用信息。

因此，在本实施例中，预设模型可以基于多种模态信息对应的样本特征，确定一致性表达值，将一致性表达值纳入到损失函数的构建，以对预设模型的参数进行更新，从而使得预设模型不断基于一致性表达值，增强提取到的样本特征对目标疾病的表达程度。

这样，一致性表达值可以用于表征多种模态信息对应的样本特征反应目标疾病的一致性程度，也就是说提取出的各个样本特征是否均一致性地表达了目标疾病。

示例地，当一致性表达值较高时，表征从MR样本图像、临床样本信息和基因样本信息中提取到的样本特征均是用于表达目标疾病的特征，对于MR样本图像而言，提取到的样本特征便是用于表达目标疾病的病灶部位处的特征，而对临床样本信息而言，提取到的样本特征便是目标疾病的诊断、治疗方案的表达，以及目标疾病在患者年龄、从事职业等上的表达，对基因样本信息而言，提取到的样本特征便是用于表征目标疾病在相关基因上的表达。

其中，本公开的预后评估标签是样本对象的真实预后情况，若需要对预后生存期进行预估，则预后评估标签是样本对象的真实预后生存期，预测预后评估值可以表示为预后年限；若需要需要对预后生存质量进行预估，则预后评估标签是样本对象的真实预后生存质量等级，包括高等级、低等级和中等级，预测预后评估值可以表示为预后生存质量等级。

采用本实施例的技术方案，在对预设模型的参数更新时，将一致性表达值、预测预后评估值、预后评估标签纳入损失函数的构建，如此，随着模型的训练，一方面，可以基于一致性表达值，增强提取到的样本特征对目标疾病的表达程度，从而使得用于确定预后评估值所依据的预后因素是与目标疾病强相关的，由此，可以提高预后因素的临床重要性，从而使得预后评估值可以更具医学参考价值。另一方面，可以基于预测预后评估值与预后评估标签之间的差异，不断更新预设模型的参数，由此随着训练的深入，模型预测的预测预后评估值可以无限趋近预后评估标签，进而使得预后评估值可以愈加接近真实情况下的预后评估值，由此，可以进一步提高预后评估值的临床参考价值。

再一方面，本公开利用多种模态的样本信息对预后进行预测，由此可以利用不同模态的样本信息之间的互补性，作为目标疾病的预后因素，从而丰富了预后因素的数据来源，提高了预后评估值的医学可参考性。

在一种可选的实施方式中，在目标疾病是神经胶质瘤的情况下，基因样本信息可以包括异柠檬酸脱氢酶IDH、染色体1p/19q联合缺失状态、端粒酶逆转录酶基因启动子、O6-甲基鸟嘌呤-DNA甲基转移酶启动子区甲基化中的至少一种基因的信息；临床样本信息包括：性别、年龄、组织学诊断、肿瘤分级、用药信息、恶性肿瘤病史中的至少一种临床信息。

其中，基因样本信息中每种基因的信息可以包括基因的名称和基因的表达类别，表达类别可以依据不同的基因有所不同。具体地，IDH基因的信息中表达类别为突变型和野生型，1p/19q基因的表达状态包括缺失态和未缺失态，O6-甲基鸟嘌呤-DNA甲基转移酶启动子区MGMT的表达类别为甲基化和未甲基化，端粒酶逆转录酶基因TERT启动子的表达类别包括突变型和野生型，具体的各类基因的信息见下表1所示：

表1-基因样本信息

其中，临床样本信息中可以包括样本对象的性别、年龄、组织学诊断、肿瘤分级、用药信息、恶性肿瘤病史中的一种或多种，当然，在实际情况中，也可以不仅限于上述所述的临床信息，也可以包括过多的临床信息，如样本对象的职业、所在地区等信息，只要与目标疾病的发生和预后有一定关联的信息都可以作为临床信息。

在一个示例中，临床样本信息可以如下表2所述：

表2-临床样本信息

在一种实施例中，多种模态的样本信息可以包括MR样本图像、临床样本信息和基因样本信息，也就是说每个样本组均包括MR样本图像、临床样本信息和基因样本信息，这样，在每一次的迭代训练中均需要对三种模态的样本信息进行特征提取。

在训练过程中，每一次的迭代训练中均包括特征的提取、基于模型的输出构建损失函数进行参数更新的阶段。

其中，每种模态的样本信息均可以包括多种子样本信息，在特征提取的阶段，可以对每种模态的样本信息中的每个子样本信息进行特征提取，之后，对一种模态的样本信息中的多子样本信息的特征进行特征融合，得到该种模态的样本信息对应的样本特征。

下面，对两个阶段进行分别介绍：

阶段1：特征的提取阶段。

如上所述，在一种实施方式中，每种模态的样本信息包括多个子样本信息，对每种模态的样本信息，分别对该种模态的样本信息中多个子样本信息进行特征提取，得到对应的多个子特征向量；接着，对每种模态的样本信息对应的多个子特征向量进行特征融合，得到该种模态的样本信息对应的样本特征。

其中，对每个子样本信息的特征提取，可以如上述实施例所述，在得到子样本信息对应的子特征向量后，可以按照以下过程进行特征融合得到样本特征：

其中，对于MR样本图像而言，子样本信息可以是MR样本图像的一个切片图像，则在特征提取时，可以对每个切片图像进行特征提取，得到每个切片图像对应的子特征向量，之后对各个切片图像对应的子特征向量进行融合，得到MR样本图像的样本特征。

其中，对于临床样本信息而言，子样本信息可以是临床样本信息中的一种临床信息，如临床信息中的年龄、性别、肿瘤分级均可以作为一个子样本信息，在特征提取时，分别对每种信息进行特征提取，具体来说，是将每种信息转换为特征向量，得到每种信息对应的子特征向量，之后对临床样本信息中各种临床信息对应的子特征向量进行融合，得到临床样本信息的样本特征。

其中，对基因样本信息而言，子样本信息可以是基因样本信息中的一种基因的信息，如IDH的信息、TERT基因启动子的信息，则可以将每种基因的信息转换为子特征向量，之后对基因样本信息中各种基因的信息对应的子特征向量进行融合，得到基因样本信息的样本特征。

在一种可选示例中，在对每种模态的样本信息对应的各个子特征向量进行融合时，可以直接按照各个子特征向量各自对应的预设权重进行融合，例如，可以预先为每个切片图像人工设置预设权重，对每种临床信息也预先设置权重，对每种基因的信息也预先设置对应的预设权重，该预设权重可以表征该种子样本信息对预后的重要性，由此，可以基于各个子特征向量的重要性进行特征融合，从而融合到对预后评估较为重要的特征，以此可以提高预后评估的医学价值。

在又一种示例中，可以在预设模型中融合注意力机制，对于每种模态的样本信息而言，可以通过该注意力机制确定各个子特征向量之间的关联程度，接着基于关联程度对各个子特征向量进行融合，从而可以融合该模态的样本信息中相互关联的程度较高的特征，提高预后因素之间的关联性，由此，使得目标模型进行预后评估的预后因素是联系紧密的因素，进一步提高临床重要性，使得目标模型具有临床可解释性。

具体实施时，可以确定每两个子特征向量之间的注意力值，基于注意力值，对多个子特征向量进行融合，得到该种模态的样本信息对应的样本特征。

如上所述，注意力值用于表征两个子特征向量之间的紧密程度。

其中，在基于每两个子特征向量之间的注意力值，对各个子特征向量进行融合时，在一种示例中，可以基于每两个子特征向量之间的注意力值，将该两个字特征向量进行融合，得到一个融合向量，由此，得到多个融合向量，接着，再将多个融合向量融合得到样本特征。例如，子特征向量包括向量i、向量j和向量k，融合时，可以将向量i和向量j融合，得到融合向量ij；同理，得到融合向量ik、融合向量jk，之后对融合向量ij、融合向量ik、融合向量jk进行融合，得到样本特征。

在又一种示例中，可以针对每个子特征向量，基于该子特征向量与其他全部子特征向量之间的注意力值，将其他全部子特征向量融合进该子特征向量，得到该子特征向量的融合后子向量；对多个融合后子向量进行再融合，得到该种模态的样本信息对应的样本特征。

示例地，子特征向量包括向量i、向量j和向量k，融合时，可以按照向量i与向量j之间的注意力值，以及向量i与向量k之间的注意力值，向量j和向量k融合到向量i，得到融合后子向量i'；同理得到融合后子向量j'和融合后子向量k'，接着将融合后子向量i'、融合后子向量j'和融合后子向量k'融合后得到样本特征。

其中，对于临床样本信息而言，可以按照如下过程确定注意力值，以及基于注意力值进行特征融合：

在确定每两种子特征向量之间的注意力值时，可以基于多种临床信息之间的平均注意力值以及该两种子特征向量确定，其中，多种临床信息之间的平均注意力值可以参照以下公式(一)获取；

其中，va表示年龄对应的子特征向量，vg表示性别对应的子特征向量，vh表示组织学诊断对应的子特征向量，vhom表示恶性肿瘤病史对应的子特征向量，vd用药信息对应的子特征向量，vgr表示肿瘤分级信息对应的子特征向量；S表示平均注意力值。

接着，可以按照参照以下公式(二)确定每两种子特征向量之间的注意力值：

其中，Si表示子特征向量vi和子特征向量vj之间的注意力值。

相应地，在进行特征融合时，可以将一个子特征向量与其他的全部子特征向量融合后，再对各个得到的融合后子向量进行融合；具体地，以临床信息中的年龄信息对应的子特征向量的融合为例，可以按照以下公式(三)确定年龄信息对应的融合后子向量：

公式(三)中，va_att为年龄信息对应的融合后子向量。

其中，对于基因样本信息而言，其确定注意力值以及基于注意力值进行特征融合的过程可以参照上述临床样本信息进行，在此不再赘述。

其中，对于MR样本图像而言，可以按照如下过程确定注意力值，以及基于注意力值进行特征融合：

在一种示例中，在特征提取和特征融合阶段，由于需要提取出临床重要性较高的预后因素，也即是提取出临床重要性较高的特征向量，该示例中，可以为特征提取和特征融合阶段均设置参数矩阵，参数矩阵可以随着模型训练而被不断更新，从而提取出重要性较高的预后因素。

具体地，如上所述，MR样本图像包括多个切片样本图像，每个切片样本图像即为一个子样本信息。具体地，针对MR样本图像所包括的每个切片样本图像，可以基于第一参数矩阵的当前值，确定每两个切片样本图像对应的的子特征向量之间的注意力值；接着，可以注意力值，对各个子特征向量进行融合。

具体实施时，可以按照以下公式(四)确定每两个切片样本图像对应的的子特征向量之间的注意力值：

公式(四)中，Q和K是第一参数矩阵，其中，Q和K的值可以不同，实际中，Q和K可以是512×512的参数矩阵，v_i是第i个切片样本图像对应的子特征向量，v_j是第j个切片样本图像对应的子特征向量，α_i,j是第i个切片样本图像和第j个切片样本图像之间的注意力值；

接着，可以按照以下公式(五)，对每个子特征向量，基于该子特征向量与其他全部子特征向量之间的注意力值，将其他全部子特征向量融合进该子特征向量，得到该子特征向量的融合后子向量：

公式(五)中，是第i个切片样本图像对应的融合后子向量，n表示切片样本图像的总数量。

之后，按照以下公式(六)对各个融合后子向量进行融合，得到MR样本图像的样本特征：

SV表示MR样本图像的样本特征，SV_i表示第i个切片样本图像对应的融合后子向量。

在进一步的实施例中，由于为特征提取和特征融合阶段均设置参数矩阵，参数矩阵可以随着模型训练而被不断更新，从而提取出重要性较高的预后因素。其中，对于临床样本信息和基因样本信息，可以在进行子特征向量的融合时，进一步基于设置的参数矩阵进行融合。

其中，针对临床样本信息中的每个临床子样本信息，基于第二参数矩阵的当前值，对各个临床子样本信息对应的子特征向量进行特征融合，得到临床样本信息对应的样本特征；

针对基因样本信息中的每个基因子样本信息，基于第三参数矩阵的当前值，对各个基因子样本信息对应的子特征向量进行特征融合，得到基因样本信息对应的样本特征。

具体地，在由上述公式(三)得到子特征向量对应的每个融合后子向量后，可以基于第二参数矩阵的当前值，对各个临床子样本信息对应的子特征向量对应的融合后子向量进行特征融合，得到临床样本信息对应的样本特征，具体地，可以按照以下公式(七)和公式(八)进行融合：

S₁＝vp^T·(va_att+vg_att+vh_att+vgr_att+vd_att+vhom_att)
公式(八)；

其中，CV表示临床样本信息对应的样本特征，vp是第二参数矩阵，其可以是128×1的参数向量。

其中，对于每个基因子样本信息对应的融合后子向量的融合，也可以参照上述公式(七)和公式(八)进行，其中，第二参数矩阵和第三参数矩阵均可以是128×1的参数向量，第二参数矩阵和第三参数矩阵中的参数随着预设模型的更新而被更新，即是根据损失函数的损失值，对其进行更新。

在一种更进一步的示例中，临床样本信息包括数值型的子样本信息和非数值型的子样本信息，在特征提取阶段，可以基于上述为预设模型设置的参数集，对数值型的子样本信息，按照模型的参数集将其映射到一个向量空间，并在训练过程中，不断更新参数集中的参数，从而使得不同的样本对象的数值型的临床信息可以在一个空间范围内映射，进而提取到数值型的临床信息的综合性预后因素。例如，对年龄相同的不同患者而言，患者A的样本组在输入预设模型训练后，更新后参数集中的参数，之后，患者B的样本组输入预设模型训练时，基于更新后的参数集的参数对年龄进行向量映射，这样，年龄相同的不同患者其在训练过程中，对应的特征向量便可以不同，而是在一定空间范围内变化，由此，可以在预后评估中，得到年龄段对预后的影响。

具体实施时，针对临床样本信息，在每次迭代训练中，可以对当前样本组中的临床样本信息，将非数值型的子样本信息转换为第一子特征向量；并基于参数集中各个参数的当前值，将数值型的子样本信息映射至目标空间，得到对应的第二子特征向量；将第一子特征向量和第二子向量进行融合，得到临床样本信息对应的样本特征。

本实施例中，参数集中的参数用于确定目标空间的维度以及每个空间点上的值。

其中，非数值型的子样本信息可以是指字符串格式的子样本信息或者文字类型的子样本信息，例如，性别“男”便是文字类型的子样本信息，肿瘤分级便是字符串类型的子样本信息，对于非数值型的子样本信息，可以提前预置这些子样本信息对应的特征向量，之后，对于当前样本组中的临床样本信息，可以查表获取当前样本组中非数值型的子样本信息对应的第一子特征向量，表中包括各种非数值型的子样本信息对应的特征向量，其可以理解为是一个固定的特征向量。

其中，数值型的子样本信息可以是数值类型的子样本信息，例如，年龄“62”便是数值类型的子样本信息，对于此种类型的子样本信息，可以基于参数集中各个参数的当前值，将数值型的子样本信息映射至目标空间，目标空间可以是一个向量空间，该向量空间可以是一个二维空间，包括二维空间上的第一维度上的多个值，以及第二维度上的多个值，也就是说，可以件给一个数值分散到该目标空间中的各个位置上，得到数值对应的第二子特征向量。

这样，参数集中的各个参数，便可以理解为是将数值分散到目标空间中的各个位置上的权重值。

其中，对第一子特征向量和第二子向量进行融合，得到临床样本信息对应的样本特征的过程，可以参照上述示例所述，例如，第一子特征向量和第二子向量共构成多个子特征向量，按照上述对多个子特征向量的融合方式进行融合即可。

具体而言，参数集中包括第一参数向量、第二参数向量和第四参数矩阵，在基于参数集中各个参数的当前值，将数值型的子样本信息映射至目标空间，得到对应的第二子特征向量时，可以基于第一参数向量的当前值，将数值型的子样本信息映射至目标空间中的第一维度，得到第一维度的映射值；基于第一维度映射值、第二参数向量的当前值和第四参数矩阵的当前值，确定第二子特征向量；

其中，第一参数向量用于确定目标空间在第一维度上的空间点的值；第二参数向量用于确定目标空间在第二维度上的空间点的值，第四参数矩阵用于为第一维度和第二维度上的每个空间位置赋予参数。

第一参数向量可以理解为是将数值分散到目标空间中第一维度上的各个位置上的权重值；第二参数向量可以理解为是将数值分散到目标空间中第二维度上的各个位置上的权重值，第四参数矩阵可以理解为是将数值分散到目标空间中的每个位置上的权重值。

具体地，可以按照以下公式(九)，基于第一参数向量的当前值，将数值型的子样本信息映射至目标空间中的第一维度，得到第一维度的映射值：
temp_a＝sigmoid(w×a) 公式(九)

公式(九)中，w是第一参数向量，实际中可以是128×1维度的参数向量，a是数值型的子样本信息，例如a是年龄数值“62”。

接着，可以按照以下公式(十)，基于第一维度映射值、第二参数向量的当前值和第四参数矩阵的当前值，确定第二子特征向量：
sa＝W×temp_a+b 公式(十)

公式(十)中，b是第二参数向量，实际中可以是128×1维度的参数向量，W第四参数矩阵，实际中可以是128的参数矩阵，Sa是第二子特征向量。

当然，在又一种实施例中，参数集还包括多个第三参数向量，在确定第二子特征向量后，还可以对该第二子特向量进行修正，具体可以按照以下公式(十一)进行修正：

其中va为修正后的第二子特征向量，sa为所述第二子特征向量，a₁、a₂和a₃分别为第三参数向量，具体地，这三个第三参数向量可以均为128*1的参数向量，其中，三个第三参数向量之间允许存在差异。

相应地，可以将第一子特征向量和修正后的第二子向量进行融合，得到临床样本信息对应的样本特征。

在一种可选的示例中，在对多种模态的样本信息各自对应的样本特征进行融合时，可以将各个样本特征映射到同一个空间后进行融合。具体地，预设模型的参数包括与每种模态的样本信息对应的维度参数矩阵，这样，可以基于每种模态的样本信息对应的样本特征和对应的维度参数矩阵，对该种模态的样本信息对应的样本特征进行维度变换，得到转换后样本特征；基于多种模态的样本信息各自对应的转换后样本特征，确定预测预后评估值和一致性表达值。

其中，每个维度参数矩阵用于调整该种模态的样本信对应的样本特征的维度，具体地，可以按照以下公式(十二)至公式(十四)，分别对种模态的样本信对应的样本特征进行维度调整：
PV₁＝M₁·SV   公式(十二)
PV₂＝M₂·CV    公式(十三)
PV₃＝M₃·GV    公式(十四)

其中，PV₁是MR样本图像对应的转换后样本特征，PV₂是临床样本信对应的转换后样本特征，PV₃是基因样本信息对应的转换后样本特征；

其中，SV是MR样本图像对应的样本特征，CV是临床样本信对应的样本特征，GV是基因样本信息对应的样本特征。

其中，M₁是MR样本图像对应的维度参数矩阵，其可以是64×512的参数矩阵，M₂是临床样本信息对应的维度参数矩阵，其可以64×128的参数矩阵，M₃是基因样本信息对应的维度参数矩阵，其可以是64×128的参数矩阵。

阶段2：参数更新的阶段。

本公开中，需要基于预测预后评估值、当前样本组对应的预后评估标签，以及一致性表达值，对预设模型的参数进行更新。具体实施时，可以获取预测预后评估值与预后评估标签之间的差异；以最小化差异、最大化一致性表达值为目标，对预设模型的参数进行更新。

预测预后评估值与预后评估标签之间的差异，可以反应预设模型预测的预后评估值与真实的预后评估值之间的距离，一致性表达值可以表征各样本特征对应同一目标疾病的一致性程度，在训练过程中，训练目标可以是预测预后评估值与预后评估标签之间的差异最小化，以及一致性程度的最大化。

这样，可以最小化差异、最大化一致性表达值为目标，对预设模型的参数进行更新。

具体实施时，在以最小化所述差异、最大化所述一致性表达值为目标，对所述预设模型的参数进行更新时，可以基于差异和一致性表达值，构建如下公式(十五)所示的损失函数：
loss＝∑_i(y′_i-y_i)²-consistency 公式(十五)

并基于所述损失函数的损失值，以最小化差异、最大化一致性表达值为目标，对预设模型的参数进行更新；其中，所述loss表示损失值、y'_i表示所述预测预后评估值、y_i表示所述预后评估标签、consistency表示一致性表达值。

从上述损失函数可看出，训练目标是损失值的最小，则为了使得损失值可以最小，则需要最小化差异以及最大化一致性表达值，需要说明的是，本公开的一致性表达值可以是0-1之间的数值。

在一种示例中，一致性表达值的确定过程可以如下：

首先，对每个样本特征进行转置，得到每个所述样本特征对应的转置特征；接着，对两个不同的样本特征，对其中一个样本特征与另一个样本特征对应的转置特征进行融合，得到对应的融合特征值；基于各个融合特征值，确定一致性表达值。

在一种实施例中，可以基于以下公式(十六)确定各个样本特征对应的转置特征：
PV^T·PV＝1 公式(十六)；

公式(十六)中，PV为样本特征，PV^T是转置特征，二者之间的点乘的结果为1；也就是说通过转置，可以对样本特征进行归一化处理。

接着，可以按照以下公式(十七)对其中一个样本特征与另一个样本特征对应的转置特征进行融合，得到对应的融合特征值：

公式(十八)中，是样本特征1的转置特征，PV₂是样本特征2，二者之间的点乘的结果为0-1之间的特征。

其中，以样本信息包括MR样本信息、临床样本信息和基因样本信息为例，可以按照公式(十八)确定一致性表达值：

其中，PV₁是MR样本图像的样本特征，PV₂是临床样本信息的样本特征，PV₃是基因样本信息的样本特征，是MR样本图像的样本特征对应的转置特征，是临床样本信息的样本特征对应的转置特征，是基因样本信息的样本特征对应的转置特征。

参照图2所示，示出了本公开的一种预设模型的结构示意图，如图2所示，可以包括融合模块、预测分支、一致性表达分支、以及与每种模态的样本信息各自对应的数据处理模块。

其中，在利用预设模型，分别对当前样本组中多种模态的样本信息进行特征提取，并基于提取到的各样本特征，确定预测预后评估值和一致性表达值时，可以对当前样本组中每种模态的样本信息，利用该模态的样本信息对应的数据处理模块，对对应的样本信息进行特征提取；以及利用融合模块，对各个数据处理模块输出的样本特征进行融合；之后，利用预测分支，确定融合模块输出后的特征对应的预测预后评估值；接着，利用一致性表达分支，确定各个数据处理模块输出的样本特征对应的一致性表达值。

也就是说，本公开的每种模态的样本信息都输入到对应的数据处理模块，由对应的数据处理模块对该模态的样本信息进行特征提取，之后，将提取到的样本特征输入至融合模块，由融合模块对各个样本特征进行融合，接着，将融合后的样本特征输入到预测模块，预测模块基于融合后的样本特征确定预测预后评估值。

下面，结合图2所示的预设模型，对本公开的目标模型的获取方法进行示例性说明：

S1，准备训练样本，训练样本包括多个样本用户各自对应的样本组，每个样本组包括样本用户的MR样本图像、临床样本信息以及基因样本信息。

S2，将多个样本组输入到预设模型，其中，样本组中的MR样本图像输入至影像数据处理模块，临床样本信息输入至临床数据处理模块，基因样本信息输入到基因数据处理模块，以进行多种模态的样本信息的特征提取，得到每种模态的样本信息对应的样本特征。

具体地，影像数据处理模块用于对MR样本图像中的多个切片子样本图像进行特征提取，提取后，对各个切片子样本图像各自对应的子特征向量进行特征融合，得到MR样本图像对应的样本特征。

参照图3和图4所示，图3示出了影像数据处理模块的结构示意图，图4示出了图3中的ResNet网络的结构示意图。

如图3所示，包括多个切片样本图像，如包括Slice1-Slice n，每个切片样本图像均输入到对应的ResNet网络，由ResNet网络对切片样本图像进行特性提取。

其中，如图4所示，本示例中输入的每张切片样本图像的大小为256×256，首先经过一个步长为2的7*7的卷积核和一个步长为2的3*3的最大池化步骤，这样，256*256的输入切片图像则变为64*64大小的特征图，有效减少了存储所需要的大小，之后依次进入多个ResNet_Block和下采样模块。具体为，依次进入3个ResNet_Block、下采样模块构成的网络层1；3个ResNet_Block、1个下采样模块构成的网络层2；5个ResNet_Block、1个下采样模块构成的网络层3；2个ResNet_Block构成的网络层4；随后接平均池化层，最终输出每张切片样本图像的子特征向量，该子特征向量可以为512×1的向量。

接着，各个子特征向量进入自注意力层，通过自注意力层确定每两个子特征向量之间的注意力值，接着将每两个子特征向量之间的注意力值输入至特征表示层，特征表示层基于注意力值按照上述公式公式(四)和公式(五)得到MR样本图像对应的样本特征。

其中，如图4所示，每个ResNet_Block如右侧所示，依次包括步长为1的3×3的卷积、Batch Norm正则化、ReLU激活函数、步长为1的3×3的卷积以及Batch Norm正则化。下采样模块结构与ResNet_Block类似，但使用步长为2的3×3的卷积，Batch Norm正则化，ReLU激活函数，步长为1的3×3的卷积，Batch Norm正则化，下采样(步长为2的1×1的卷积和Batch Norm正则化)。

具体地，临床数据处理模块用于对临床样本信息中的多中临床信息进行特征转换，得到临床样本信息对应的样本特征。

其中，本示例使用性别、年龄、组织学诊断、肿瘤分级、用药信息、恶性肿瘤病史作为临床样本信息，然后将信息映射成子特征向量。对于性别、组织学诊断、肿瘤分级、用药信息、恶性肿瘤病史等字符型的子样本信息可以用vg,vh,vgr,vd,vhom来表示子特向量；具体地，可以采用lookup查表方法来完成字符型的子样本信息的向量映射。

最终利用公式(七)对各个子特征向量进行融合，得到临床样本信息对应的样本特征。

而对于年龄这种数值型的子样本信息，可以按照公式(九)和公式(十)以及公式(十一)得到数值型的子样本信息对应的子特征向量。

具体地，基因数据处理模块用于对基因样本信息中的多种基因的信息进行特征转换，得到基因样本信息对应的样本特征。

与临床样本信息中字符型的子样本信息类似，可以采用lookup查表方法来完成每种基因的信息的向量映射，得到每种基因的信息对应的子特征向量，之后，利用公式(七)对各个子特征向量进行融合，得到基因样本信息对应的样本特征。

S3，将多种模态的样本信息各自对应的样本特征输入到融合模块，该融合模块可以利用公式(十二)至公式(十四)对各个样本特征进行融合，以及基于公式(十六)至公式(十八)得到本次输入到预设模型的样本组对应的一致性表达值。

S4，将融合模块输出的融合后的样本特征输入到预测模块，由预测模块基于融合后的样本特征确定预测预后评估值。

S5，基于融合模块输出的一致性表达值、预测模块输出的预测预后评估值，以及本次输入到预设模型的样本组对应的预后评估标签，构建公式(十五)所示的损失函数，以最小化差异、最大化一致性表达值为目标，对预设模型的参数进行更新。

在更新预设模型的参数时，可以对上述提到的第一参数矩阵、第二参数矩阵、第三参数矩阵、第四参数矩阵以及参数集中的第一参数向量、第二参数向量和三个第三参数向量进行同步更新，由此便可以基于两个优化目标，在一次训练中同时影响三个模态的数据处理模块、融合模块以及预测模块的准确性。

S6，将多次更新后的预设模型，或者在预测预后评估值与预后评估标签之间的差异小于预设差异，一致性表达值高于或等于预设表达值的情况下，停止训练，将停止训练时的预设模型作为目标模型，利用该目标模型即可以预测患者的预后评估值。

相应地，参照图5所示，示出了本公开的一种预后评估值确定方法的步骤流程图，如图5所示，具体可以包括以下步骤：

步骤S501：获取待测对象的多种模态的信息，所述多种模态的信息包括核磁共振MR图像、临床信息和基因信息；

步骤S502：将所述多种模态的信息输入至目标模型，得到待测对象的预后评估值；其中，所述目标模型是上述实施例所述的目标模型的获取方法得到的。

本实施例中，在得到目标模型后，可以利用目标模型即预测患者的预后评估值，则实际中，可以获取待测对象的多种模态的信息，具体的待测对象的多种模态的信息与训练预设模型所用到的模态可以一致，如训练预设模型所用到的样本组中包括MR样本图像、临床样本信息和基因样本信息，则待测对象的多种模态的信息也可以包括待测对象的MR图像、临床信息和基因信息。

由于目标模型在训练过程中，以一致性表达值作为预设模型的参数更新依据，而一致性表达值用于表征各个样本特征对应同一目标疾病的一致性程度，这样，随着训练的推进，预设模型可以提取到与目标疾病有关的预后因素(样本特征)，而逐渐摒弃各种模态的信息中与目标疾病不相关的预后因素，而使得模型所选出的预后因素具有临床上的重要性，进而可以帮助提高模型的可解释性，从而目标模型输出的结果具有较高的预后参考价值。

当然，在一些可选示例中，由于目标模型包括与每种模态的样本信息对应的数据处理模块，以及与多个数据处理模块连接的融合模块，由于数据处理模块和融合模块是从多种模态的样本信息中提取与目标疾病的表达强相关的样本特征，因此，在一种应用中，可以在得到目标模型后，将目标模型中的数据处理模块和融合模块单独提取出来作为一个特征提取模型，该特征提取模型可以用于从多种模态的信息中提取与目标疾病强相关的特征，从而可以独立应用于预后过程中的预后因素的筛选。

采用本公开实施例的技术方案，具有以下优点：

第一，通过一致性表达值，可以将不同模态的信息映射到反目标疾病的重要表达信息的空间中，使得不同模态的信息提取出的特征在该空间中更加接近，从而可以提高不同模态的信息的互补性，降低噪声(不重要信息)的影响，以及对目标疾病的临床重要性，从而使得目标模型具有医学可解释性，其预测的预后评估值具有较高的医学参考价值。

第二，不同模态的信息之间可以进行信息互补，从而丰富了预后因素的数据来源，从多个维度对目标疾病的表达进行诠释，从而进一步提高了预后评估值的医学可参考性。

第三，通过自注意力机制组合同一模态内的信息，从而增强目标模型的非线性表示能力。

第四，无需用户人工多次筛选预后因素，提高了预后因素确定的效率，降低了人力成本。

基于相同的发明构思，本公开还提供一种目标模型的获取装置，参照图6所示，示出了该目标模型的获取装置的结构示意图，如图6所示，具体可以包括以下模块：

样本获取模块601，用于获取多个样本用户各自对应的样本组，所述样本组包括多种模态的样本信息，所述多种模态的样本信息包括核磁共振MR样本图像、临床样本信息和基因样本信息中的至少两者；

训练模块602，用于基于多个所述样本组，对预设模型进行迭代训练，得到所述目标模型，所述目标模型用于预测目标对象的预后评估值；其中，在每一次迭代训练中执行以下步骤：

可选地，所述训练模块602包括参数更新单元，参数更新单元包括：

差异确定子单元，用于获取所述预测预后评估值与所述预后评估标签之间的差异；

参数更新子单元，用于以最小化所述差异、最大化所述一致性表达值为目标，对所述预设模型的参数进行更新。

可选地，所述参数更新子单元，具体用于：

基于所述差异和所述所述一致性表达值，构建如下损失函数：
loss＝∑_i(y′_i-y_i)²-consistency

其中，所述loss表示损失值、表示所述预测预后评估值、表示所述预后评估标签、consistency表示一致性表达值。

可选地，所述基于提取到的各样本特征，确定一致性表达值的步骤，包括：

基于各个所述融合特征值，确定所述一致性表达值。

可选地，每种模态的样本信息包括多个子样本信息，所述利用所述预设模型，分别对当前样本组中多种模态的样本信息进行特征提取的步骤，包括以下步骤：

可选地，所述对每种模态的样本信息对应的多个所述子特征向量进行特征融合，得到该种模态的样本信息对应的样本特征的步骤，包括：

可选地，所述基于所述注意力值，对多个所述子特征向量进行融合，得到所述该种模态的样本信息对应的样本特征的步骤，包括：

可选地，所述预设模型的参数包括第一参数矩阵，所述MR样本图像包括多个切片样本图像，所述确定每两个子特征向量之间的注意力值的步骤，包括：

可选地，所述预设模型的参数包括第二参数矩阵和第三参数矩阵，所述对每种模态的样本信息对应的多个所述子特征向量进行特征融合，得到该种模态的样本信息对应的样本特征的步骤，包括：

可选地，所述预设模型的参数包括与所述临床样本信息对应的参数集，所述临床样本信息包括数值型的子样本信息和非数值型的子样本信息，所述利用所述预设模型，分别对当前样本组中多种模态的样本信息进行特征提取的步骤，包括：

可选地，所述参数集包括第一参数向量、第二参数向量和第四参数矩阵，所述基于所述参数集中各个参数的当前值，将所述数值型的子样本信息映射至目标空间，得到对应的第二子特征向量的步骤，包括：

可选地，所述参数集还包括多个第三参数向量，所述装置还包括：

修正模块，用于基于所述第二子特征向量和多个所述第三参数向量，按照以下公式修正所述第二子特征向量：

将所述第一子特征向量和所述第二子向量进行融合，得到所述临床样本信息对应的样本特征的步骤，包括：

可选地，所述预设模型的参数包括与每种模态的样本信息对应的维度参数矩阵，所述基于提取到的各样本特征，确定预测预后评估值和一致性表达值的步骤，包括：

可选地，所述预设模型包括融合模块、预测分支、一致性表达分支、以及与每种模态的样本信息各自对应的数据处理模块；所述利用所述预设模型，分别对当前样本组中多种模态的样本信息进行特征提取，并基于提取到的各样本特征，确定预测预后评估值和一致性表达值的步骤，包括：

可选地，所述基因样本信息包括异柠檬酸脱氢酶、染色体1p/19q联合缺失状态、端粒酶逆转录酶基因启动子、O6-甲基鸟嘌呤-DNA甲基转移酶启动子区甲基化中的至少一种基因的信息；

参照图7所示，示出了一种预后评估值确定装置的结构示意图，如图7所示，所述装置包括：

信息获取模块701，用于获取待测对象的多种模态的信息，所述多种模态的信息包括核磁共振MR图像、临床信息和基因信息；

输入模块702，用于将所述多种模态的信息输入至目标模型，得到待测对象的预后评估值；其中，所述目标模型是根据所述的目标模型的获取方法得到的。

基于相同的发明构思，本公开还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行时实现所述的目标模型获取方法，或执行时实现所述的预后评估值确定方法。

参照图8所示，示出了本公开实施例的一种电子设备800的结构框图，如图8所示，本发明实施例提供的一种电子设备，该电子设备800可以用于执行分类模型获取方法或者TERT基因启动子的突变类别确定方法。

电子设备800可以包括存储器801、处理器802及存储在存储器上并可在处理器上运行的计算机程序，所述处理器802被配置为执行所述的图像处理方法。

如图8所示，在一实施例中，该电子设备800完整的可以包括输入装置803、输出装置804以及数据采集装置805，其中，在执行本公开实施例的图像处理方法时，数据采集装置805可以获取多种模态的信息，接着输入装置803可以获得数据采集装置805多种模态的信息，该多种模态的信息可以由处理器802进行处理，该处理具体可以执行上述的目标模型的获取方法以及上述的预后评估值确定方法，输出装置804可以输出目标模型，或者可以输出目标模型输出的预后评估值结果。

当然，在一实施例中，存储器801可以包括易失性存储器和非易失性存储器，其中，易失性存储器可以理解为是随机存取记忆体，用来存储和保存数据的。非易失性存储器是指当电流关掉后，所存储的数据不会消失的电脑存储器，当然，本公开的目标模型的获取方法，或者预后评估值确定方法的计算机程序可以存储在易失性存储器和非易失性存储器中，或者存在二者中的任意一个中。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上对本公开所提供的一种目标模型获取方法、预后评估值确定方法、装置、设备及介质进行了详细介绍，本文中应用了具体个例对本公开的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本公开的方法及其核心思想；同时，对于本领域的一般技术人员，依据本公开的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本公开的限制。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

本文中所称的“一个实施例”、“实施例”或者“一个或者多个实施例”意味着，结合实施例描述的特定特征、结构或者特性包括在本公开的至少一个实施例中。此外，请注意，这里“在一个实施例中”的词语例子不一定全指同一个实施例。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本公开的实施例可以在没有这些具体细节的情况下被实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

最后应说明的是：以上实施例仅用以说明本公开的技术方案，而非对其限制；尽管参照前述实施例对本公开进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围。

Claims

一种目标模型的获取方法，其特征在于，所述方法包括：

获取多个样本用户各自对应的样本组，所述样本组包括多种模态的样本信息，所述多种模态的样本信息包括核磁共振MR样本图像、临床样本信息和基因样本信息中的至少两者；

基于多个所述样本组，对预设模型进行迭代训练，得到所述目标模型，所述目标模型用于预测目标对象的预后评估值；

其中，在每一次迭代训练中执行以下步骤：

利用所述预设模型，分别对当前样本组中多种模态的样本信息进行特征提取，并基于提取到的各样本特征，确定预测预后评估值和一致性表达值；其中，所述一致性表达值用于表征各所述样本特征对应同一目标疾病的一致性程度；

基于所述预测预后评估值、所述当前样本组对应的预后评估标签，以及所述一致性表达值，对所述预设模型的参数进行更新。
根据权利要求1所述的方法，其特征在于，所述基于所述预测预后评估值、所述当前样本组对应的预后评估标签，以及所述一致性表达值，对所述预设模型的参数进行更新，包括：

获取所述预测预后评估值与所述预后评估标签之间的差异；

以最小化所述差异、最大化所述一致性表达值为目标，对所述预设模型的参数进行更新。
根据权利要求2所述的方法，其特征在于，所述以最小化所述差异、最大化所述一致性表达值为目标，对所述预设模型的参数进行更新，包括：

基于所述差异和所述所述一致性表达值，构建如下损失函数：
loss＝∑_i(y′_i-y_i)²-consistency；

基于所述损失函数的损失值，以最小化所述差异、最大化所述一致性表达值为目标，对所述预设模型的参数进行更新；

其中，所述loss表示损失值、y'_i表示所述预测预后评估值、y_i表示所述预后评估标签、consistency表示一致性表达值。
根据权利要求1所述的方法，其特征在于，所述基于提取到的各样本特征，确定一致性表达值，包括：

对每个所述样本特征进行转置，得到每个所述样本特征对应的转置特征；

对两个不同的样本特征，对其中一个所述样本特征与另一个样本特征对应的转置特征进行融合，得到对应的融合特征值；

基于各个所述融合特征值，确定所述一致性表达值。
根据权利要求1所述的方法，其特征在于，每种模态的样本信息包括多个子样本信息，所述利用所述预设模型，分别对当前样本组中多种模态的样本信息进行特征提取，包括：

对每种模态的样本信息，分别对该种模态的样本信息中多个所述子样本信息进行特征提取，得到对应的多个子特征向量；

对每种模态的样本信息对应的多个所述子特征向量进行特征融合，得到该种模态的样本信息对应的样本特征。
根据权利要求5所述的方法，其特征在于，所述对每种模态的样本信息对应的多个所述子特征向量进行特征融合，得到该种模态的样本信息对应的样本特征，包括：

确定每两个子特征向量之间的注意力值，所述注意力值用于表征两个子特征向量之间的紧密程度；

基于所述注意力值，对多个所述子特征向量进行融合，得到所述该种模态的样本信息对应的样本特征。
根据权利要求5所述的方法，其特征在于，所述基于所述注意力值，对多个所述子特征向量进行融合，得到所述该种模态的样本信息对应的样本特征，包括：

针对每个所述子特征向量，基于该子特征向量与其他全部子特征向量之间的注意力值，将其他全部子特征向量融合进该子特征向量，得到该子特征向量的融合后子向量；

对多个所述融合后子向量进行再融合，得到所述该种模态的样本信息对应的样本特征。
根据权利要求6所述的方法，其特征在于，所述预设模型的参数包括第一参数矩阵，所述MR样本图像包括多个切片样本图像，所述确定每两个子特征向量之间的注意力值，包括：

针对所述MR样本图像所包括的每个切片样本图像，基于所述第一参数矩阵的当前值，确定每两个所述切片样本图像对应的的子特征向量之间的注意力值。
根据权利要求5-8任一所述的方法，其特征在于，所述预设模型的参数包括第二参数矩阵和第三参数矩阵，所述对每种模态的样本信息对应的多个所述子特征向量进行特征融合，得到该种模态的样本信息对应的样本特征，包括：

针对所述临床样本信息中的每个临床子样本信息，基于所述第二参数矩阵的当前值，对各个所述临床子样本信息对应的子特征向量进行特征融合，得到所述临床样本信息对应的样本特征；

针对所述基因样本信息中的每个基因子样本信息，基于所述第三参数矩阵的当前值，对各个所述基因子样本信息对应的子特征向量进行特征融合，得到所述基因样本信息对应的样本特征。
根据权利要求1-8任一所述的方法，其特征在于，所述预设模型的参数包括与所述临床样本信息对应的参数集，所述临床样本信息包括数值型的子样本信息和非数值型的子样本信息，所述利用所述预设模型，分别对当前样本组中多种模态的样本信息进行特征提取，包括：

对所述当前样本组中的临床样本信息，将所述非数值型的子样本信息转换为第一子特征向量；

基于所述参数集中各个参数的当前值，将所述数值型的子样本信息映射至目标空间，得到对应的第二子特征向量；所述参数集中的参数用于确定所述目标空间的维度以及每个空间点上的值；

将所述第一子特征向量和所述第二子向量进行融合，得到所述临床样本信息对应的样本特征。
根据权利要求10所述的方法，其特征在于，所述参数集包括第一参数向量、第二参数向量和第四参数矩阵，所述基于所述参数集中各个参数的当前值，将所述数值型的子样本信息映射至目标空间，得到对应的第二子特征向量，包括：

基于所述第一参数向量的当前值，将所述数值型的子样本信息映射至所述目标空间中的第一维度，得到所述第一维度的映射值；其中，所述第一参数向量用于确定所述目标空间在所述第一维度上的空间点的值；

基于所述第一维度映射值、所述第二参数向量的当前值和所述第四参数矩阵的当前值，确定所述第二子特征向量；其中，所述第二参数向量用于确定所述目标空间在第二维度上的空间点的值，所述第四参数矩阵用于为所述第一维度和所述第二维度上的每个空间位置赋予参数。
根据权利要求11所述的方法，其特征在于，所述参数集还包括多个第三参数向量，在所述基于所述第一维度映射值、所述第二参数向量的当前值和所述第四参数矩阵的当前值，确定所述第二子特征向量之后，所述方法还包括：

基于所述第二子特征向量和多个所述第三参数向量，按照以下公式修正所述第二子特征向量：

其中，va为修正后的第二子特征向量，sa为所述第二子特征向量，a₁、a₂和a₃分别为所述第三参数向量；

将所述第一子特征向量和所述第二子向量进行融合，得到所述临床样本信息对应的样本特征，包括：

将所述第一子特征向量和修正后的第二子向量进行融合，得到所述临床样本信息对应的样本特征。
根据权利要求1所述的方法，其特征在于，所述预设模型的参数包括与每种模态的样本信息对应的维度参数矩阵，所述基于提取到的各样本特征，确定预测预后评估值和一致性表达值，包括：

基于每种模态的样本信息对应的样本特征和所述维度参数矩阵，对该种模态的样本信息对应的样本特征进行维度变换，得到转换后样本特征；

基于多种模态的样本信息各自对应的转换后样本特征，确定所述预测预后评估值和所述一致性表达值。
根据权利要求1所述的方法，其特征在于，所述预设模型包括融合模块、预测分支、一致性表达分支、以及与每种模态的样本信息各自对应的数据处理模块；所述利用所述预设模型，分别对当前样本组中多种模态的样本信息进行特征提取，并基于提取到的各样本特征，确定预测预后评估值和一致性表达值，包括：

对当前样本组中每种模态的样本信息，利用该模态的样本信息对应的数据处理模块，对对应的样本信息进行特征提取；

利用所述融合模块，对各个所述数据处理模块输出的样本特征进行融合；

利用所述预测分支，确定所述融合模块输出后的特征对应的所述预测预后评估值；

利用所述一致性表达分支，确定各个所述数据处理模块输出的样本特征对应的所述一致性表达值。
一种预后评估值确定方法，其特征在于，所述方法包括：

获取待测对象的多种模态的信息，所述多种模态的信息包括核磁共振MR图像、临床信息和基因信息；

将所述多种模态的信息输入至目标模型，得到待测对象的预后评估值；

其中，所述目标模型是根据权利要求1-14任一所述的方法得到的。
一种目标模型的获取装置，其特征在于，所述装置包括：

样本获取模块，用于获取多个样本用户各自对应的样本组，所述样本组包括多种模态的样本信息，所述多种模态的样本信息包括核磁共振MR样本图像、临床样本信息和基因样本信息中的至少两者；

训练模块，用于基于多个所述样本组，对预设模型进行迭代训练，得到所述目标模型，所述目标模型用于预测目标对象的预后评估值；

其中，在每一次迭代训练中执行以下步骤：

利用所述预设模型，分别对当前样本组中多种模态的样本信息进行特征提取，并基于提取到的各样本特征，确定预测预后评估值和一致性表达值；其中，所述一致性表达值用于表征各所述样本特征对应同一目标疾病的一致性程度；

基于所述预测预后评估值、所述当前样本组对应的预后评估标签，以及所述一致性表达值，对所述预设模型的参数进行更新。
一种预后评估值确定装置，其特征在于，所述装置包括：

信息获取模块，用于获取待测对象的多种模态的信息，所述多种模态的信息包括核磁共振MR图像、临床信息和基因信息；

输入模块，用于将所述多种模态的信息输入至目标模型，得到待测对象的预后评估值；

其中，所述目标模型是根据权利要求1-14任一所述的方法得到的。
一种电子设备，其特征在于，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行时实现如权利要求1-14任一所述的目标模型电话获取方法，或执行时实现如权利要求15所述的预后评估值确定方法。
一种计算机可读存储介质，其特征在于，其存储的计算机程序使得处理器执行如权利要求1-14任一所述的目标模型的获取方法，或执行时实现如权利要求15所述的预后评估值确定方法。