CN114862798A

CN114862798A - 一种用于肿瘤病理辅助诊断的多视图表示学习方法

Info

Publication number: CN114862798A
Application number: CN202210499011.3A
Authority: CN
Inventors: 董文波; 孙仕亮; 赵静; 殷敏智
Original assignee: East China Normal University
Current assignee: East China Normal University
Priority date: 2022-05-09
Filing date: 2022-05-09
Publication date: 2022-08-05

Abstract

本发明公开了一种用于肿瘤病理辅助诊断的多视图表示学习方法，其特点是该方法采用深度高斯过程对病理图像的多视图特征信息进行表示建模，然后在给定充足量训练集的情况下，训练得到多视图深度高斯病理诊断模型，由此获得肿瘤病理图像诊断能力，具体包括：建立肿瘤病理图像的数据集、提取病理图像不同视图的特征信息、确定用以病理诊断的模型及优化和训练等步骤。本发明与现有技术相比具有自动综合使用病理图像中的信息来避免颜色正则化后造成的信息缺失，提升病理图像诊断的准确性，提高病理诊断的效率和精度。

Description

一种用于肿瘤病理辅助诊断的多视图表示学习方法

技术领域

本发明涉及多视图表示学习技术领域，尤其是一种基于变分推理和深度高斯过程的肿瘤病理辅助诊断的多视图表示学习方法。

背景技术

近年来，随着数字化技术的快速发展，数字病理学已经成为一种潜在的新的诊断标准，即使用数字玻片扫描仪将载玻片数字化为全玻片图像。随着扫描仪技术变得越来越可靠，全玻片图像也越来越多。病理图像诊断的出现促进了计算机辅助诊断，为病理学家提供了数字化的工作流程，病理图像诊断的结果可以用来提高病理学家的效率和准确性，最终提供更好的患者诊断。然而，在分析病理图像时，由于颜色不一致，就有可能显著影响图像分析，颜色不一致是有不同的原因造成的，例如使用不同的化学物质染色，颜色浓度的变化，或者不同供应商的扫描仪存在差异。因此，需要对颜色进行归一化来应对这些变化。然而，这又会忽略大量的图像信息，这些信息可能对于计算机自动识别病理图像是有利的。在图像处理中，可以根据图像的外观提取不同的图像特征表示，如颜色、纹理和形状等特征。不同的特征表示从不同的角度清楚的描述了图像信息，这些图像特征具有独特的识别信息和较强的鲁棒性。因此，考虑这些图像特征来避免信息的过度缺乏，综合各种图像表征提供的信息是提高病理图像识别精度的关键因素，而如何利用这些特征是一项具有挑战性的任务。

深度高斯过程是一种基于统计学习和贝叶斯理论的重要机器学习方法，该模型是高斯过程和深度学习的成功结合，不仅保留了高斯过程本身的出色特性，而且受益于深度学习的层次结构，克服了高斯过程的局限性，获得了更强大的数据映射能力。深度高斯过程是基于核方法的贝叶斯概率模型，它比深度模型更具鲁棒性和可解释性。

多视图学习是一种利用多源信息的重要技术，多源异构特性导致不同视图之间的关联复杂且难以预知，甚至领域专家在面对复杂多源信息时也难以有效利用。多视图学习的核心问题是如何利用不同视图之间的一致性和互补性，准确的发现数据的内在模式以提高数据分析的有效性。多视图表示学习旨在从不同的视图数据中学习到一个更综合性的特征表示。现有的研究结果显示了多视图表示学习对于下游任务的优势。虽然将不同的视图整合到一个更综合的表示中是重要的，但是由于不同视图背后的复杂关联性，联合探索多个视图仍然是一个挑战。

变分推理是概率模型求解中的一种常用技术，被广泛用于模型的后验密度估计。它一般通过定义一个由潜在变量上的自由参数索引的灵活分布簇，将复杂的推理问题转化为高维优化问题，然后通过求解优化问题来得到变分参数。

现有技术的病理图像分析，由于病理图像的颜色不一致，严重影响了病理图像的正确分析，大大制约了数字病理学科的发展。然而，基于变分推理和多视图学习的多视图深度高斯过程的数学模型，将其应用到病理图像诊断中尚未见有相关技术的公开报道。

发明内容

本发明的目的是针对现有技术的不足而提供一种用于肿瘤病理辅助诊断的多视图表示学习方法，采用一种与多视图学习相结合的深度高斯过程模型的方法，以深度高斯过程对病理图像的多视图特征信息进行表示建模，基于变分推理和多视图学习的多视图深度高斯过程的数学模型，构建了一套病理图像多个视图信息的特征提取框架，将病理图像的多个视图的特征信息融入病理诊断模型，在给定充足量训练集的情况下，训练得到多视图深度高斯病理诊断模型，由此获得肿瘤病理图像诊断能力，不仅可以根据视图之间的差异性提取不同视图独有的特征，还可以提取视图之间的共同特征，从而满足多视图学习中的一致性和互补性原则学习到更综合的表示，最终提升病理图像诊断的准确性，能够自动综合使用病理图像中的信息来避免颜色正则化后造成的信息缺失，从而减轻病理医生的诊断负担，提高病理诊断的效率和精度。

实现本发明目的的具体技术方案是：一种用于肿瘤病理辅助诊断的多视图表示学习方法，其特点是该方法具体包括下述步骤：

步骤一：建立肿瘤病理图像的数据集

所述数据集格式为：使用数字切片扫描仪扫描病理载玻片得到的病理全切片数字图像。

步骤二：提取病理图像不同视图的特征信息

提取病理图像的不同图像特征，比如纹理特征，灰度特征，形状特征等作为不同的视图进行多视图学习，以弥补单一视图特征造成的信息缺乏。

步骤三：确定用以病理诊断的模型

采用多视图深度高斯过程模型，深度高斯过程是高斯过程的深度扩展，网络的每一层是一个高斯过程映射。多视图深度高斯过程模型使用深度高斯过程，将病理图像的不同视图特征转化为同一空间的嵌入表示。根据不同视图数据的多样性和差异性，多视图深度高斯过程模型可以针对不同的视图构建不同深度的网络结构，从而可以从不同的视图中提取内在信息，融合到一个综合表示中，并自适应的平衡不同视图之间的一致性和互补性。

步骤四：确定多视图深度高斯病理诊断模型的优化目标

多视图深度高斯病理诊断模型建立在病理图像不同视图特征的学习上，对于不同视图的学习，采用不同深度的深度高斯过程来进行建模，最终学习到多视图数据的综合表示。由下述(1)式建立潜在变量和观测变量的联合概率分布：

其中，

表示潜在变量的集合；H_v表示对视图v的特征建模深度；H表示公共特征的建模深度；X^<v>表示视图v的数据；V表示视图的数量。

使用变分推理的方法去近似求解模型，变分推理是贝叶斯近似推断方法中的一类方法，将后验推断问题巧妙的转化为优化问题进行求解，具有较好的收敛性和可扩展性，更适合求解大规模近似推断问题，变分推理的目标是给定观测数据，由下述(2)式求解潜在变量的后验分布：

步骤五：训练多视图深度高斯病理诊断模型

采取贝叶斯训练过程来训练模型，使用一个简单的变分分布Ω(Z；λ)来近似后验分布，λ是变分分布的参数，被优化来取得最好的近似效果；使用Kullback-Leibler(KL)散度来衡量变分分布和后验分布之间的匹配程度，KL＝0说明完美匹配；最小化KL散度等价于最大化证据下界(Evidence Lower BOund,ELBO)，该下界是根据杰森不等式(Jensen’sinequality)从logp(X^<1>,…,X^<V>)推导得来。

通过推导将目标函数写成关于一个已知分布期望的形式，采用梯度下降算法优化模型的目标函数，具体训练包括如下步骤：

步骤a1：随机初始化模型参数；

步骤a2：设置网络的层数H，H_v等超参数，潜空间的维度

Q_H，batch size，最大迭代次数；

步骤a3：使用梯度下降算法更新模型的参数；

步骤a4：当训练达到最大迭代次数后，终止模型的训练。

步骤六：训练完毕后，进行病理诊断

模型训练完毕后，得到病理图像的多视图表示，将表示向量输入支持向量机分类器中进行医学病理的辅助诊断，即预测患者是否患有癌症，具体包括如下步骤：

步骤b1：模型训练完毕后，取模型根节点的表示向量作为最终学习到的多视图表示；

步骤b2：将学习到的多视图表示输入到预训练的支持向量机分类器进行病理诊断；

步骤b3：通过分类器的输出结果，完成病理诊断，即预测患者是否患有癌症。

所述多视图深度高斯病理诊断模型具有如下结构：

病理图像经过图像处理技术提取不同的图像特征，比如纹理特征、灰度特征等，然后不同图像特征作为不同的视图，经过多视图深度高斯过程提取不同视图的公共特征，最后该公共表示特征被输入到支持向量机中实现病理诊断。其中，不同视图特征的建模，以及不同视图的公共特征的建模采用下述(3)～(6)式描述：

X^<v,h-1>＝f^<v,h>(X^<v,h>)+ε^<v,h>,ε^<v,h>～N(0,(σ^<v,h>)²I),h＝2,…,H_v,v∈{1,…,V},(5)；

X^<v>＝f^<v,1>(X^<v,1>)+ε^<v,1>,ε^<v,1>～N(0,(σ^<v,1>)²I),v∈{1,…,V}, (6)；

其中，

是共享潜在变量；

是含有不同层结构的深度高斯过程在不同视图上的输出，包含了视图独有的信息；X^<v,h-1>是每个视图独有的潜在变量；X^<v>是模型的输入，即为原始的视图数据；

是模型的输出，它包含了所视图输入数据的公共特征表示；f是均值函数为0，协方差函数为k的高斯过程。

使用自动相关判别平方指数核作为协方差核函数，如下述(7)式所描述：

其中，

α_q为超参数；Q为输入x的特征维度。

根据贝叶斯训练过程，使用一个简单的变分分布Ω(Z；λ)来近似后验分布，λ是变分分布的参数，被优化来取得最好的近似效果；使用Kullback-Leibler(KL)散度来衡量变分分布和后验分布之间的匹配程度，KL＝0说明完美匹配；最小化KL散度等价于最大化证据下界(Evidence Lower BOund,ELBO)，该下界是根据杰森不等式(Jensen’s inequality)从logp(X^<1>,…,X^<V>)推导得来，如下述(8)式所描述：

通过推导，将分布Ω(Z；λ)定义为下述(9)式：

其中，U^<v,h>和

是在变分推理中引入诱导点的输出，因此，q(U^<v,h>)和

的形式不必有限制，

和p(f^<v,h>|U^<v,h>,X^<v,h-1>)在推导中会被抵消，而

和q(X^<v,h>)的定义分别如下述式(10)和式(11)所描述：

将公式(9)带入公式(8)，然后经过推导，可以将目标函数写成关于一个已知分布期望的形式，并采用梯度下降算法优化模型的目标函数，如下述(12)式所描述：

其中，X^<v>是视图v的输入数据；Z是潜在变量集合；g和r函数是关于相关变量的期望；H表示分布的熵。

本发明与现有技术相比具有以下的有益效果和显著的技术进步：

1)采用多视图学习和深度高斯过程的结合，不仅可以根据视图(多于两个视图)之间的差异性提取不同视图独有的特征，还可以提取视图之间的共同特征，从而满足多视图学习中的一致性和互补性原则学习到更综合的表示，最终提升病理图像诊断的准确性。

2)可自动综合使用病理图像中的信息来避免颜色正则化后造成的信息缺失，从而减轻病理医生的诊断负担，提高病理诊断的效率和精度，初步实验结果也验证了本发明超越了经验丰富的病理学家的诊断结果。

附图说明

图1为本发明流程图；

图2为深度高斯过程的概率图模型；

图3为基于多视图表示学习的病理图像诊断模型框架图。

具体实施方式

本发明创建了一种能够将病理图像的多个视图的特征信息融入诊断的模型，该多视图深度高斯病理诊断模型构建了一套病理图像多个视图信息的特征提取框架，同时推导了多视图深度高斯诊断模型的建模过程和无监督训练过程，给出了详细的推导算法，并指导性的给出了应用方法。为了更好的理解本发明的创造性，对本发明中所涉及的有关内容作如下解释：

1)病理图像诊断

病理诊断是指病理学家对手术切除的病理标本进行固定和染色，然后在显微镜下进行组织学检查，最后根据分类标准进行诊断。准确的病理诊断在患者的整个治疗计划中起着最重要的作用，被称为疾病(肿瘤)诊断的“金标准”。然而，在世界大部分地区，缺乏病理学家是一个明显的问题。病理学家每天需要检查和处理大量病理切片，迫切需要一种方法来帮助自己减少耗时费力的诊断工作。

2)深度高斯过程

深度高斯过程是一种基于统计学习和贝叶斯理论的重要机器学习方法，该模型是高斯过程和深度学习的成功结合，不仅保留了高斯过程本身的出色特性，而且受益于深度学习的层次结构，克服了高斯过程的局限性，获得了更强大的数据映射能力，深度高斯过程是基于核方法的贝叶斯概率模型，它比深度模型更具鲁棒性和可解释性。本发明中使用的多视图深度高斯过程与传统的深度高斯模型不同。传统的深度高斯过程(见图2)一般适合处理单视图数据，对于多视图数据，只能将不同的视图串联为一个单视图。然而，该操作忽略了每个视图独有的统计特性，合成的视图没有意义，很难发掘存在于不同视图底层间的非线性关系。同时，也会增加特征空间的维度，从而给学习带来困难。而本发明(见图3)建立多视图深度高斯过程病理诊断模型，不仅可以根据视图之间的差异性提取不同视图独有的特征，还可以提取视图之间的共同特征，从而满足多视图学习中的一致性和互补性原则学习到更综合的表示。

参阅图2，深度高斯过程的图模型是一个层次图结构，这里主要关注无监督学习场景。该层次图结构由多层潜在变量组成，并采用高斯过程映射的层次结构，即在模型的深层结构中，每个节点都是一个高斯过程，高斯过程的输入由另一个高斯过程控制。图2中的结构对应了三种节点：即叶子节点Y、中间潜在节点X_l和根节点X_L。根节点是未观测的，叶子节点是观测数据。假定最右层表示观测数据

其中N是样本的数量，D_Y表示样本的维度。中间潜在节点为

l＝1,...,L-1，其中L是潜在层的层数，Q_l是潜空间的维度。根节点为

在这个深度结构中，所有的中间节点X_l作为右层的输入，左层的输出。根据以上定义，深度高斯过程通过下述(13)～(15)式及图2所示的深度高斯过程进行建模：

X_L～N(0,I)， (15)

其中，f_l是协方差函数为k_l高斯过程，即f_l(x)～GP(0,k_l(x,x')),l＝1,...,L。然而，深度高斯过程模型的求解是非常困难的，因为需要估计给定观测数据情况下潜在变量的后验分布。目前通常的做法是使用变分推理来近似求解。

3)变分推理

假设X＝{x₁,…,x_N}是观测数据的集合，Z＝{z₁,…,z_M}表示所有潜变量和模型参数，N和M分别是样本总数和潜变量个数。X和Z的联合分布可以表达为p(X,Z)＝p(X)p(Z|X)。在概率模型中，通常需要推理出潜变量的后验分布，但是，直接采用贝叶斯公式计算p(Z|X)在实际应用中几乎不可行。

变分推理是一种可以近似推理真实后验分布p(Z|X)的实用方法，在变分推理中，通常通过假设一个常用的约束族分布q(Z)，优化其中的参数，使假设的分布与真实的p(Z|X)尽可能接近。变分推理使用Kullback-Leibler(KL)散度来度量两个分布之间的差异性，它优化的目标是最小化q(Z)和p(Z|X)之间的KL散度，使近似分布尽可能逼近真实后验。变分推理将问题转换为最大化证据下界以推导近似分布q(Z)。近似分布q(Z)和真实分布p(Z|X)之间的KL散度表达式可以具体的分解如下述(16)～(17)式：

因为KL≥0，所以可以得到：

log p(X)≥E_q[log p(Z,X)]-E_q[log q(Z)]， (17)；

其中，E_q[log p(Z,X)]-E_q[log q(Z)]称为模型的证据下界(Evidence LowerBOund,ELBO)。

4)多视图学习

在实际问题中存在大量对应着多组数据源的样本，即多视图数据。多视图数据是对相同对象不同角度或不同形式的描述，弥补了单个视图信息不足造成的偏差，可以帮助人们更全面的理解对象，更准确的表达对象。例如，在网页分类任务中，网页可由其内容和超链接结构两个视图共同描述；在图片分类任务中，图片可以颜色，纹理，形状等不同的图像特征及相关的文本描述表示；视频可以用图像和语音来描述。对象的不同视图通常是互补的，并且没有一个视图能够充分的描述对象。因此，充分利用不同视图的信息具有重要意义，一个被很好设计的多视图学习策略将会带来学习性能的显著提升。

参阅图1，按下述步骤构建多视图深度高斯病理诊断模型以及用于肿瘤病理辅助诊断的：

步骤一：建立肿瘤病理图像的数据集

步骤二：提取病理图像不同视图的特征信息

提取病理图像的不同图像特征，比如纹理特征、灰度特征和形状特征等作为不同的视图进行多视图学习，以弥补单一视图特征造成的信息缺乏。

步骤三：确定用以病理诊断的模型

采用多视图深度高斯过程模型；深度高斯过程是高斯过程的深度扩展，网络的每一层是一个高斯过程映射。多视图深度高斯过程模型使用深度高斯过程，将病理图像的不同视图特征转化为同一空间的嵌入表示。根据不同视图数据的多样性和差异性，所提模型可以针对不同的视图构建不同深度的网络结构，从而可以从不同的视图中提取内在信息，融合到一个综合表示中，并自适应的平衡不同视图之间的一致性和互补性。

步骤四：确定多视图深度高斯病理诊断模型的优化目标

多视图深度高斯病理诊断模型建立在病理图像不同视图特征的学习上，对于不同视图的学习，采用不同深度的深度高斯过程来进行建模，最终学习到多视图数据的综合表示，建立如下述(1)式描述的潜在变量和观测变量的联合概率分布：

其中，

使用变分推理的方法去近似求解模型，变分推理是贝叶斯近似推断方法中的一类方法，将后验推断问题巧妙的转化为优化问题进行求解，具有较好的收敛性和可扩展性，更适合求解大规模近似推断问题。变分推理的目标是给定观测数据，求潜在变量的后验分布，以如下述(2)式描述：

步骤五：训练多视图深度高斯病理诊断模型

采取贝叶斯训练过程来训练模型，使用一个简单的变分分布Ω(Z；λ)来近似后验分布，λ是变分分布的参数，被优化来取得最好的近似效果；使用Kullback-Leibler(KL)散度来衡量变分分布和后验分布之间的匹配程度。KL＝0说明完美匹配；最小化KL散度等价于最大化证据下界(Evidence Lower BOund,ELBO)。该下界是根据杰森不等式(Jensen’sinequality)从logp(X^<1>,…,X^<V>)推导得来。通过推导将目标函数写成关于一个已知分布期望的形式，采用梯度下降算法优化模型的目标函数，具体训练包括如下步骤：

步骤a1：随机初始化模型参数；

步骤a2：设置网络的层数H，H_v等超参数，潜空间的维度

Q_H，batch size，最大迭代次数；

步骤a3：使用梯度下降算法更新模型的参数；

步骤a4：当训练达到最大迭代次数后，终止模型的训练。

步骤六：训练完毕后，进行病理诊断。

模型训练完毕后，得到病理图像的多视图表示，将表示向量输入支持向量机分(Support Vector Machine,SVM)类器中进行医学病理的辅助诊断，即预测患者是否患有癌症，具体包括如下步骤：

步骤b2：将学习到的多视图表示输入到预训练的支持向量机分类器进行病理辅助诊断；

步骤b3：通过分类器的输出结果，完成病理辅助诊断，即预测患者是否患有癌症。

通过以下具体实施例对本发明作进一步的详细说明。

实施例1

参阅图1，具体实施过程如下：

1)将原始病理图像进行相应的预处理，图像预处理包括使用不同的图像特征提取器，比如纹理、灰度、形状等，提取不同的图像特征，将不同的图像特征作为不同的视图。

2)得到数据后，首先制定学习率等超参数，接着初始化多视图深度高斯病理诊断模型的参数，将多视图数据作为训练数据输入到多视图深度高斯病理诊断模型中，最后学习模型的参数。

3)得到一个新的病理图像，同训练数据一样，作相应的预处理，作为测试数据。

4)将测试数据输入模型，利用之前学习到的多视图深度高斯病理诊断模型，通过调整新的变分下界，得到更新后的模型，从而得到测试数据的特征表示。

5)得到的测试数据的特征表示，输入到训练好的支持向量机分类器中，进行病理诊断，即预测是否患有癌症。

参阅图3，首先给定模型的超参数，初始化模型所有的参数，然后更新图3中的多视图深度高斯病理诊断模型的参数，模型学习的具体算法如下：

1、根据输入数据确定网络结构(如图3所示)，初始化所有的超参数，包括网络层数、特征维度等；

2、划分训练集和测试集；

3、设定epoch，batch size，学习率等超参数，设置迭代停止条件；

4、While(停止条件不满足)

a)for each batch in训练集：

i，计算变分后验分布的参数；

ii，计算模型根节点的均值；

b)运行batch++；

5、根据模型根节点的均值计算最终输出的特征表示。

通过以上的多视图深度高斯病理诊断模型的学习过程可以知道，该模型的学习是一个迭代的过程，迭代的终止条件就是运行次数超标或者目标函数持续没有变化。选取的深度高斯过程模型是基于核方法的贝叶斯概率模型，它比深度模型更具鲁棒性和可解释性。同时，模型中的核函数是解决非线性模型分析问题的有效途径，可以发现和学习数据之间的关系。核函数是针对特定的应用问题设计的，它易于集成与问题相关的先验知识，并具有更好的抗过拟合控制，以保证泛化性能。本发明还选取平均场近似来对后验分布进行更加简单有效的推理。由此，模型可以获得一个稳定的训练过程。

本发明的实验数据来源自于某儿童医学中心的现实医学数据，周围神经母细胞瘤是一组起源于原始交感神经节的胚胎性肿瘤，它们通常影响儿童，是儿童时期最常见的颅外实体瘤。根据国际神经母细胞瘤病理分类，周围神经母细胞瘤可以分为四个基本形态：1)神经母细胞瘤；2)混合型神经节神经母细胞瘤；3)神经节神经瘤；4)结节性神经节神经母细胞瘤。进一步的，神经母细胞瘤又可分为三个亚型：未分化型，低分化型和分化型。为了隐私保护，所有公开的病理图像数据，都隐去了病人的个人信息。根据将要进行的下游分析，由5位经验丰富的病理学家对病理图像数据进行手工注释。对于每种肿瘤类型，医生将原始病理图像划分为300张768×768个不重叠的子切片。对于每个768×768子切片，将其划分为144个64×64非重叠子切片。因此，对于每种肿瘤类型，总共有43200个病理切片。在病理图像表示学习任务中，本发明首先提取病理图像的不同特征作为不同的视图，因为它们属于图像的不同模态，在特征表示上具有较大的差异。在数据集上训练并测试后，得出本实施例的诊断性能详见下表1的病理辅助诊断结果：

表1不同方法在测试数据集上的病理辅助诊断结果

上述表1是本发明和一些多视图方法在测试数据集上的病理辅助诊断结果，其中MvDGPID(Multi-view Deep Gaussian Pathology Image Diagnosis)为本发明，CCA(Canonical Correlation Analysis)是经典的多视图方法，KCCA(Kernel CCA)是CCA的核方法扩展版本，DCCA(Deep CCA)是CCA的深度扩展版本，VCCA(Deep Variational CCA)是CCA的深度变分扩展版本，MULPP(Multi-view Uncorrelated Locality PreservingProjection)考虑了不同视图之间的局部特征映射保留，AE²-Nets(Autoencoder inAutoencoder Networks)通过自编码网络将不同的视图进行整合，最后学习共同潜在表示。结果表明本发明的模型，其病理诊断结果好于所有的对比方法。同时，使用的视图特征越多，病理诊断结果越精确。

本发明的保护内容不局限于以上实施例。在不背离发明构思的精神和范围下，本领域技术人员能够想到的变化和优点都被包括在本发明中，并且以所附的权利要求书为保护范围。