WO2021184195A1

WO2021184195A1 - 医学图像重建方法、医学图像重建网络训练方法和装置

Info

Publication number: WO2021184195A1
Application number: PCT/CN2020/079678
Authority: WO
Inventors: 胡圣烨; 王书强; 陈卓; 申妍燕; 张炽堂
Original assignee: 中国科学院深圳先进技术研究院
Priority date: 2020-03-17
Filing date: 2020-03-17
Publication date: 2021-09-23
Also published as: US20230032472A1

Abstract

本申请提供一种医学图像重建方法、医学图像重建网络训练方法和装置。该医学图像重建网络训练方法包括：对真实图像样本进行特征编码提取，得到所述真实图像样本的特征编码向量；通过图像重建网络，基于所述特征编码向量进行图像重建得到第一图像，基于所述真实图像样本的第一隐层向量进行图像重建得到第二图像；通过图像判别网络对所述真实图像样本、所述第一图像和所述第二图像进行图像判别，并根据图像判别结果对所述图像重建网络进行优化。

Description

医学图像重建方法、医学图像重建网络训练方法和装置

技术领域

本申请实施例属于图像处理技术领域，尤其涉及一种医学图像重建方法、医学图像重建网络训练方法和装置。

背景技术

功能性磁共振成像(functional magnetic resonance imaging，fMRI)是一种新兴的神经影像学方式，其原理是利用磁振造影来测量神经元活动所引发之血液动力的改变。它作为一种非介入的技术，能够对特定的大脑活动皮层区域进行准确定位，并捕获能够反映神经元活动的血氧变化。但由于fMRI图像采集成本高、扫描时间长，且一些特殊患者无法进行(比如体内金属物品者不能接受扫描)，在特定的应用场景下，能获取的影像数量往往是有限的，这极大地限制了深度学习等依赖于大量数据的人工智能方法在医学影像分析领域的应用。

一个极具前景的解决方法是通过现有的人工智能方法利用有限的真实图像样本，学习从高斯隐层向量中重建相应医学影像，从而达到增强样本量，支撑后续图像分析任务的目的。而生成对抗网络是当前性能较佳的生成模型，逐渐成为了深度学习的研究热点，并开始应用到医学图像领域中。

技术问题

传统的生成对抗网络可以通过学习真实数据分布，生成带有多样性的新图像，但也存在网络训练困难，不易达到最优收敛的问题。

技术解决方案

本申请实施例一方面提供一种医学图像重建网络训练方法，其包括：

对真实图像样本进行特征编码提取，得到所述真实图像样本的特征编码向量；

通过图像重建网络，基于所述特征编码向量进行图像重建得到第一图像，基于所述真实图像样本的第一隐层向量进行图像重建得到第二图像；

通过图像判别网络对所述真实图像样本、所述第一图像和所述第二图像进行图像判别，并根据图像判别结果对所述图像重建网络进行优化。

在一个实施例中，所述对真实图像样本进行特征编码提取，得到所述真实图像样本的特征编码向量，包括：

基于图像编码网络对所述真实图像样本进行特征提取，得到所述真实图像样本的特征编码向量。

在一个实施例中，所述基于图像编码网络对所述真实图像样本进行特征提取，得到所述真实图像样本的特征编码向量，包括：

通过所述图像编码网络的多个三维卷积层对所述真实图像样本进行分层特征提取；

通过线性函数对提取到的特征进行处理，得到所述真实图像样本的特征编码向量。

在一个实施例中，所述线性函数为分段线性函数。

在一个实施例中，所述分段线性函数为ReLU函数。

在一个实施例中，所述方法还包括：

通过编码特征判别网络对所述特征编码向量和所述第一隐层向量进行向量判别；

基于向量判别结果对所述图像编码网络进行优化。

在一个实施例中，所述基于向量判别结果对所述图像编码网络进行优化，包括：

基于所述向量判别结果对所述图像编码网络进行对抗训练。

在一个实施例中，所述基于所述向量判别结果对所述图像编码网络进行对抗训练，包括：

计算所述第二图像与所述真实图像样本之间的逐体素差异，并通过梯度下降法更新所述图像编码网络的网络参数，直至所述逐体素差异小于或等于预设阈值，实现对所述图像编码网络的训练，其中所述逐体素差异为所述图像编码网络的第一损失函数；

其中，所述第一损失函数为：

其中，L _C为所述第一损失函数，z _e为所述特征编码向量，z _r为所述第一隐层向量，C表征所述图像编码网络，E为数学期望。

在一个实施例中，所述根据图像判别结果对所述图像重建网络进行优化，包括：

根据所述图像判别结果对所述图像重建网络进行对抗训练。

在一个实施例中，所述根据所述图像判别结果对所述图像重建网络进行对抗训练，包括：

根据所述图像判别结果、结构相似性度量损失函数和感知度量损失函数，确定所述图像重建网络的第二损失函数，并通过梯度下降法更新所述图像重建网络的网络参数，对所述图像重建网络进行训练；

其中，所述第二损失函数为：

其中，L _G为所述第二损失函数，z _e为所述特征编码向量，z _r为所述第一隐层向量，C表征所述图像编码网络，D为所述图像判别网络，G为所述图像重建网络，E为数学期望，L _SSIM为结构相似性度量损失函数，L _perceptual代表感知度量损失函数，X _real表征所述真实图像，λ ₁和λ ₂为权重系数，Φ为Gram矩阵，L _D为图像判别网络的损失函数。

在一个实施例中，所述通过图像生成网络，基于所述特征编码向量进行图像重建得到第一图像，基于所述真实图像样本的第一隐层向量进行图像重建得到第二图像，包括：

将所述特征编码向量和所述第一隐层向量输入所述图像重建网络，得到所述第一图像和所述第二图像；其中，所述图像生成网络的卷积层为近邻上采样的三维可分离卷积层。

本申请实施例第二方面提供一种医学图像重建方法，其包括：

获取待重建图像的第二隐层向量；

通过训练后的图像重建网络，基于所述第二隐层向量对所述待重建图像进行图像重建。

本申请实施例第三方面提供一种医学图像重建网络训练装置，其包括：

特征编码提取模块，用于对真实图像样本进行特征编码提取，得到所述真实图像样本的特征编码向量；

第一图像重建模块，用于通过图像重建网络，基于所述特征编码向量进行图像重建得到第一图像，基于所述真实图像样本的第一隐层向量进行图像重建得到第二图像；

第一优化模块，用于通过图像判别网络对所述真实图像样本、所述第一图像和所述第二图像进行图像判别，并根据图像判别结果对所述图像生成网络进行优化。

本申请实施例第四方面提供一种医学图像重建装置，其包括：

隐层向量获取模块，用于获取待重建图像的第二隐层向量；

第二图像重建模块，用于通过训练后的图像重建网络，基于所述第二隐层向量对所述带重建图像进行图像重建。

本申请实施例第五方面提供一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如下步骤：

通过图像判别网络对所述真实图像样本、所述第一图像和所述第二图像进行图像判别，并根据图像判别结果对所述图像生成网络进行优化。

在一个实施例中，所述处理器执行所述计算机可读指令时还实现如下步骤：

基于向量判别结果对所述图像编码网络进行优化。

本申请实施例第六方面提供一种终端设备，所述终端设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如下步骤：

获取待重建图像的第二隐层向量；

本申请实施例第七方面提供一种计算机存储介质，所述计算机可读存储介质存储有计算机可读指令，其中，所述计算机可读指令被处理器执行时实现如下步骤：

本申请实施例第八方面提供一种计算机存储介质，所述计算机可读存储介质存储有计算机可读指令，其中，所述计算机可读指令被处理器执行时实现如下步骤：

获取待重建图像的第二隐层向量；

本申请实施例第九方面提供了一种计算机程序产品，当计算机程序产品在终端设备上运行时，使得终端设备执行上述第一方面中任一项的方法，或使得终端设备执行上述第二方面中任一项的方法。

有益效果

本申请实施例，对真实图像样本进行特征编码提取，得到上述真实图像样本的特征编码向量，通过图像重建网络，基于上述特征编码向量进行图像重建得到第一图像，基于上述真实图像样本的隐层向量进行图像重建得到第二图像，同时通过图像判别网络对上述真实图像样本、上述第一图像和上述第二图像进行图像判别，并根据图像判别结果对上述图像重建网络进行优化，将优化后的图像重建网络用于图像重建工作，为生成对抗网络引入来自于真实图像中的先验知识引导，从而稳定对图像重建网络的训练，易于达到最优收敛，从而解决生成对抗网络训练困难的问题。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例提供的应用场景示意图；

图2是本申请一实施例提供的医学图像重建网络训练方法的流程示意图；

图3是本申请一实施例提供的医学图像重建网络训练方法的流程示意图；

图4是本申请一实施例提供的医学图像重建网络训练方法的流程示意图；

图5是本申请一实施例提供的医学图像重建方法的流程示意图；

图6是本申请一实施例提供的医学图像重建的流程示意图；

图7是本申请一实施例提供的医学图像重建网络训练装置的结构示意图；

图8是本申请一实施例提供的医学图像重建装置的结构示意图；

图9是本申请一实施例提供的终端设备的结构示意图。

本发明的实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

应当理解，当在本申请说明书和所附权利要求书中使用时，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本申请说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外，在本申请说明书和所附权利要求书的描述中，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”，除非是以其他方式另外特别强调。

功能性磁共振成像fMRI是一种新兴的神经影像学方式，其原理是利用磁振造影来测量神经元活动所引发之血液动力的改变。它作为一种非介入的技术，能够对特定的大脑活动皮层区域进行准确定位，并捕获能够反映神经元活动的血氧变化。但由于fMRI图像采集成本高、扫描时间长，且一些特殊患者无法进行(比如体内金属物品者不能接受扫描)，在特定的应用场景下，能获取的影像数量往往是有限的，这极大地限制了深度学习等依赖于大量数据的人工智能方法在医学影像分析领域的应用。

一个极具前景的解决方法是通过现有的人工智能方法利用有限的真实图像样本，学习从高斯隐层向量中重建相应医学影像，从而达到增强样本量，支撑后续图像分析任务的目的。而生成对抗网络是当前性能较佳的生成模型，它最早由Lan Goodfellow等人于2014年提出，可以通过生成器捕捉真实数据的潜在分布，从而达到从隐层空间中生成真实数据分布样本的目的。此后，生成对抗网络逐渐成为了深度学习的研究热点，并开始应用到各个领域中。除了从隐层向量中重建原始图像，另一种解决思路是从一个模态的医学图像合成另一个模态的医学图像，如从同一患者的CT图像合成对应的PET图像。有许多学者在此方面进行了大量工作，然而跨模态合成的解决思路需要大量另一模态的图像数据对模型进行训练，并且其合成样本的多样性有限。因此，最受关注的思路仍然是如何从隐层向量中稳定重建相应医学图像。

尽管在这个方法中，生成对抗网络可以通过学习真实数据分布，生成带有多样性的新图像，但它最大的问题在于网络训练困难，不易达到最优收敛。生成对抗网络的目的是使生成器拟合的数据分布接近真实的数据分布，本申请发明人在研究中发现没有任何先验知识引入的生成网络根本不知道真实数据分布的情况，只能根据判别器的真假反馈一次次地试探。而作为另一性能强大的生成模型变分自编码网络则不存在这个问题，它可以先抽取真实图像的编码特征向量，同时通过重采样的进行变分推理，根据变分结果对隐向量进行解码生成。

基于变分自编码器的作用机理启发，本申请实施例将变分自编码器的编码特征向量作为一种关于真实图像的特征先验知识引入到生成对抗网络的训练中，给予生成网络一个较明确的优化方向，从而解决其训练难、耗时长且易崩溃的问题。并且我们发现简单地拼凑组合变分自编码器和生成对抗网络是不行的，这是由于变分推理与生成对抗网络的目标函数之间存在优化冲突，二者无法同时达到最优收敛。为了解决这个问题，本申请进一步引入了单独的编码判别器，从而将变分自编码器的优化过程也纳入到了“生成-对抗”的体系下，解决变分推理与生成对抗网络的目标函数之间存在的优化冲突。

举例说明，本申请实施例可以应用到如图1所示的示例性场景中。其中，终端10和服务器20构成上述医学图像重建网络训练方法、医学图像重建方法的应用场景。

具体的，终端10用于获取被检体的真实图像样本，并将该真实图像样本发送给服务器20；服务器20用于对真实图像样本进行特征编码提取，得到真实图像样本的特征编码向量，通过图像重建网络，基于特征编码向量进行图像重建得到第一图像，基于真实图像样本的隐层向量进行图像重建得到第二图像，通过图像判别网络对真实图像样本、第一图像和第二图像进行图像判别，并根据图像判别结果对图像重建网络进行优化，将优化后的图像生成网络用于图像重建工作，为生成对抗网络引入来自于真实图像中的先验知识引导，从而稳定对图像重建网络的训练，易于达到最优收敛，从而解决生成对抗网络训练困难的问题。

以下结合图1对本申请的医学图像重建网络训练方法进行详细说明。

图2是本申请一实施例提供的医学图像重建网络训练方法的示意性流程图，参照图2，该医学图像重建网络训练方法的详述如下：

在步骤101中，对真实图像样本进行特征编码提取，得到所述真实图像样本的特征编码向量。

一个实施例中，步骤101中可以通过图像编码网络对上述真实图像样本进行特征提取，得到上述真实图像样本的特征编码向量。

示例性的，参见图3，上述通过图像编码网络对上述真实图像样本进行特征提取，得到上述真实图像样本的特征编码向量，具体可以包括：

在步骤1011中，通过上述图像编码网络的多个三维卷积层对上述真实图像样本进行分层特征提取。

在步骤1012中，通过线性函数对提取到的特征进行处理，得到所述真实图像样本的特征编码向量。

一个示例场景中，可以将真实图像样本展成时间序列上的三维影像，并将该三维影像依次输入到图像编码网络中，利用图像编码网络的多个三维卷积层对该三维影像进行分层特征抽取，并通过线性函数综合三维影像的线性特征和非线性特征，得到真实图像样本的特征编码表示向量。

其中，上述线性函数为分段线性函数。具体的，通过分段线性函数对三维影像的线性特征和非线性特征进行处理，得到真实图像样本的特征编码表示向量。

例如，分段线性函数可以为ReLU函数。具体的，通过ReLU函数对三维影像的线性特征和非线性特征进行处理，得到真实图像样本的特征编码表示向量。

在步骤102中，通过图像重建网络，基于所述特征编码向量进行图像重建得到第一图像，基于所述真实图像样本的第一隐层向量进行图像重建得到第二图像。

一个实施例中，可以将上述特征编码向量和上述第一隐层向量输入到上述图像重建网络，得到上述第一图像和上述第二图像；其中，本申请实施例中的图像生成网络的卷积层为近邻上采样的三维可分离卷积层。

示例性的，可以将从真实图像样本抽取得到的特征编码向量与从真实图像样本的高斯分布中采样得到的第一隐层向量作为图像重建网络的输入，分别从特征编码向量和第一隐层向量中逐级重建得到第一图像与第二图像。本实施例中，利用带有近邻上采样的三维可分离卷积层代替传统图像重建网络中的反卷积层，能够降低可学习参数的数量，并能够提高生成的fMRI图像的质量，使得重建图像的伪影更少、结构更加清晰等。

在步骤103中，通过图像判别网络对所述真实图像样本、所述第一图像和所述第二图像进行图像判别，并根据图像判别结果对所述图像重建网络进行优化。

具体的，可以将真实图像样本、第一图像与第二图像三者均作为图像判别网络的输入，并根据图像判别网络的判别结果对图像重建网络进行优化，构建“生成-对抗”训练，并将经过优化训练后的图像重建网络用于图像重建。

其中，在步骤103中对所述图像重建网络进行优化后，将该图像重建网络继续用于步骤102中所述的图像重建得到第一图像和第二图像，并在得到第一图像和第二图像后再次执行步骤103，依次循环执行。

上述医学图像重建网络训练方法，对真实图像样本进行特征编码提取，得到上述真实图像样本的特征编码向量，通过图像重建网络，基于上述特征编码向量进行图像重建得到第一图像，基于上述真实图像样本的隐层向量进行图像重建得到第二图像，同时通过图像判别网络对上述真实图像样本、上述第一图像和上述第二图像进行图像判别，并根据图像判别结果对上述图像重建网络进行优化，将优化后的图像重建网络用于图像重建工作，为生成对抗网络引入来自于真实图像中的先验知识引导，从而稳定对图像重建网络的训练，易于达到最优收敛，从而解决生成对抗网络训练困难的问题。

图4为本申请一实施例提供的医学图像重建网络训练方法的示意性流程图，参照图4，基于图2所示的实施例，该医学图像重建网络训练方法还可以包括：

在步骤104中，通过编码特征判别网络对所述特征编码向量和所述第一隐层向量进行向量判别。

在步骤105中，基于向量判别结果对所述图像编码网络进行优化。

其中，在步骤101中得到特征编码向量后，可以将特征编码向量和真实图像样本的第一隐层向量，通过步骤104和步骤105对图像编码网络进行优化后，将优化后的图像编码网络作为步骤101中的图像编码网络，可以用于再次执行步骤101；如此循环反复对图像编码网络进行优化。

一个实施例中，可以基于所述向量判别结果对所述图像编码网络进行对抗训练，从而对上述图像编码网络进行优化。

具体的，可以构建与图像判别网络结构相同的编码特征判别网络，将从真实图像样本中编码得到的特征编码向量与从高斯分布中采样得到的第一隐层向量作为编码特征判别网络的输入，使编码特征判别网络与图像编码网络也构成“生成-对抗”的训练关系，以代替变分推理，解决变分推理与生成对抗目标函数的训练冲突问题。

一个实施例中，上述基于所述向量判别结果对所述图像编码网络进行对抗训练，具体可以包括：计算所述第二图像与所述真实图像样本之间的逐体素差异，并通过梯度下降法更新所述图像编码网络的网络参数，直至所述逐体素差异小于或等于预设阈值，实现对所述图像编码网络的训练，其中所述逐体素差异为所述图像编码网络的第一损失函数。

示例性的，对于图像编码网络的训练优化，引入编码特征判别网络代替原本的变分推理过程。在对上述图像编码网络的训练过程中，首先计算重建fMRI图像与真实fMRI图像的逐体素差异，随后通过梯度下降法更新上述图像编码网络的网络参数，使该逐体素差异小于或等于第一预设阈值即可；其次，选取Wasserstein距离作为第一损失函数中真实图像分布与重建图像分布的度量工具，同时引入梯度惩罚项裁剪判别器网络梯度，进一步稳定网络训练。

示例性的，第一损失函数可以为：

一个实施例中，步骤103中所述的根据图像判别结果对所述图像重建网络进行优化，具体可以为：根据所述图像判别结果对所述图像重建网络进行对抗训练。

其中，上述根据所述图像判别结果对所述图像重建网络进行对抗训练，可以包括：根据所述图像判别结果、结构相似性度量损失函数和感知度量损失函数，确定所述图像重建网络的第二损失函数，并通过梯度下降法更新所述图像重建网络的网络参数，对所述图像重建网络进行训练。

示例性的，根据图像判别结果对图像重建网络进行对抗训练，具体而言，如果图像判别网络的判别结果越接近于真实图像，则只需对图像重建网络利用梯度下降法对网络参数进行第一预设幅度更新或不更新；如若图像判别网络的判别结果越接近于重建图像，则需对图像重建网络对网络参数进行第二预设幅度更新，且第二预设幅度大于第一预设幅度。此外，除了选取Wasserstein距离作为第二损失函数中真实图像分布与重建图像分布的度量工具，还引入结构相似性度量损失与感知度量损失，可以确保重建图像的特征更加符合真实图像。

示例性的，第二损失函数可以为：

本实施例中，可以通过图像重叠率(SOR)技术指标来评估图像重建网络重建的重建图像与真实图像的接近程度。在对图像重建网络训练优化完成后，通过训练后的图像重建网络可从高斯隐层向量中重建出高质量的医学图像样本，起到增强图像样本量的作用，便于后续的分析工作。

以下结合图1对本申请的医学图像重建方法进行详细说明。

图5是本申请一实施例提供的医学图像重建方法的示意性流程图，参照图5，该医学图像重建方法的详述如下：

在步骤201中，获取待重建图像的第二隐层向量。

在步骤202中，通过训练后的图像重建网络，基于所述第二隐层向量对所述待重建图像进行图像重建。

上述医学图像重建方法，对真实图像样本进行特征编码提取，得到上述真实图像样本的特征编码向量，通过图像重建网络，基于上述特征编码向量进行图像重建得到第一图像，基于上述真实图像样本的隐层向量进行图像重建得到第二图像，同时通过图像判别网络对上述真实图像样本、上述第一图像和上述第二图像进行图像判别，并根据图像判别结果对上述图像重建网络进行训练优化，并通过训练优化后的图像重建网络基于第二隐层向量对待重建图像进行图像重建，为生成对抗网络引入来自于真实图像中的先验知识引导，从而稳定对图像重建网络的训练，易于达到最优收敛，从而解决生成对抗网络训练困难的问题，且重建出的图像更接近于真实图像。

参见图6，在本实施例中，医学图像重建的过程可以包括以下步骤：

在步骤301中，基于图像编码网络对真实图像样本进行特征提取，得到真实图像样本的特征编码向量。

在步骤302中，通过图像重建网络，基于特征编码向量进行图像重建得到第一图像，基于真实图像样本的第一隐层向量进行图像重建得到第二图像。

在步骤303中，通过图像判别网络对真实图像样本、第一图像和第二图像进行图像判别，并根据图像判别结果对图像重建网络进行训练优化。其中，将训练优化后的图像重建网络作为步骤302中的图像重建网络进行下一次图像重建。

在步骤304中，通过编码特征判别网络对步骤301中的特征编码向量和真实图像样本的第一隐层向量进行向量判别。

在步骤305中，基于向量判别结果，对图像编码网络进行优化，并将优化后的图像编码网络作为步骤301中的图像编码网络对下一真实图像样本进行特征提取。

在步骤306中，在通过真实图像样本对图像重建网络训练优化完成后，获取待重建图像的第二隐层向量。

在步骤307中，通过训练后的图像重建网络，基于第二隐层向量对待重建图像进行图像重建。

以下以大鼠脑区的真实fMRI图像为例对本申请实施例进行说明，但并不以此为限。

第一步，将大鼠脑区的真实fMRI图像x _real展成时间序列上的三维影像，并依次输入到图像编码网络中，利用图像编码网络的多个三维卷积层对三维影像进行分层特征抽取，并通过ReLU函数综合线性和非线性特征，输出真实fMRI图像的特征编码向量z _e。

第二步，将真实fMRI图像抽取得到的特征编码向量z _e与从高斯分布中采样得到的隐层向量z _r二者均作为图像重建网络的输入，分别从z _e和z _r中逐级重建fMRI图像x _rec与x _rand。图像重建网络的卷积为带有近邻上采样的三维可分离卷积层，利用带有近邻上采样的三维可分离卷积操作代替传统的反卷积层，能够降低可学习参数的数量，并提高重建得到的fMRI图像质量，使重建图像的伪影更少、脑区结构更加清晰等。

第三步，将真实fMRI图像x _real、图像x _rec与图像x _rand三者均作为图像判别网络的输入，并根据图像判别网络的判别结果对图像重建器进行优化，构建“生成-对抗”训练。同时，构建与图像判别网络结构相同的编码特征判别网络，将从真实fMRI图像x _real中编码得到的特征表示向量z _e与从高斯分布中采样得到的隐层向量z _r作为其输入，使编码特征判别网络与图像编码网络也构成“生成-对抗”的训练关系，以代替变分推理，解决变分推理与生成对抗目标函数的训练冲突问题。

第四步，选取最优的损失函数进行网络的训练与优化。对于图像编码网络的训练优化，本实施例巧妙地引入编码特征判别网络代替了传统的变分推理过程，只需最小化重建fMRI图像与真实fMRI图像的逐体素差异即可；而且，本申请选取Wasserstein距离作为损失函数中真实图像分布与重建图像分布的度量工具，同时引入梯度惩罚项裁剪判别器网络梯度，进一步稳定图像编码网络训练。对于图像重建器网络的训练，本申请除了选取Wasserstein距离之外，还引入结构相似性度量损失与感知度量损失，确保重建图像在大鼠腹侧被盖区(VTA)、前额皮质(PFC)等关键区域的特征符合真实图像。各个网络的损失函数公式如下：

图像编码网络的损失函数为：

图像判别网络的损失函数为：

图像重建网络的损失函数为：

其中，L _SSIM为结构相似性度量损失函数，L _perceptual代表感知度量损失函数，分别为：

最后本方案拟通过图像重叠率(SOR)技术指标来评估重建图像与真实图像的接近程度。在图像重建网络训练优化完成后，通过训练后的图像重建网络从待重建图像的高斯隐层向量中重建出高质量的医学图像样本，起到增强图像样本量的作用，便于后续的分析工作。

本申请实施例，提出了一种融合变分自编码器和生成对抗网络的医学图像重建网络训练方法，与传统的生成对抗网络相比，本申请通过融合变分自编码器引入了来自于真实图像的先验知识引导，从而解决生成对抗网络训练困难的难题。

本申请实施例在变分自编码器和生成对抗网络之间新增了一个单独的编码判别网络，其目标在于代替变分推理的功能，使变分编码器的编码特征向量以一种对抗训练的方式逼近原始高斯隐层向量，从而解决变分推理与生成对抗网络的目标函数之间的冲突。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

对应于上文实施例应用于医学图像重建网络训练方法，图7示出了本申请实施例提供的医学图像重建网络训练装置的结构框图，为了便于说明，仅示出了与本申请实施例相关的部分。

参见图7，本申请实施例中的医学图像重建网络训练装置可以包括特征编码提取模块401、第一图像重建模块402和优化模块403。

其中，特征编码提取模块401，用于对真实图像样本进行特征编码提取，得到所述真实图像样本的特征编码向量；

第一图像重建模块402，用于通过图像重建网络，基于所述特征编码向量进行图像重建得到第一图像，基于所述真实图像样本的第一隐层向量进行图像重建得到第二图像；

第一优化模块403，用于通过图像判别网络对所述真实图像样本、所述第一图像和所述第二图像进行图像判别，并根据图像判别结果对所述图像重建网络进行优化。

可选的，特征编码提取模块401可以用于：基于图像编码网络对所述真实图像样本进行特征提取，得到所述真实图像样本的特征编码向量。

可选的，特征编码提取模块401可以具体用于：

可选的，所述线性函数为分段线性函数。

可选的，所述分段线性函数为ReLU函数。

可选的，所述医学图像重建网络训练装置还可以包括第二优化模块；所述第二优化模块用于：

基于向量判别结果对所述图像编码网络进行优化。

可选的，所述基于向量判别结果对所述图像编码网络进行优化，包括：

基于所述向量判别结果对所述图像编码网络进行对抗训练。

可选的，所述基于所述向量判别结果对所述图像编码网络进行对抗训练，包括：

计算所述第二图像与所述真实图像样本之间的逐体素差异，并通过梯度下降法更新所述图像编码网络的网络参数，直至所述逐体素差异小于或等于预设阈值；

其中，所述逐体素差异为所述图像编码网络的第一损失函数，所述第一损失函数为：

可选的，所述第一优化模块403可以用于：

根据所述图像判别结果对所述图像重建网络进行对抗训练。

可选的，所述根据所述图像判别结果对所述图像重建网络进行对抗训练，可以包括：

其中，所述第二损失函数为：

可选的，所述第一图像重建模块402具体可以用于：

对应于上文实施例应用于图像重建练方法，图8示出了本申请实施例提供的医学图像重建装置的结构框图，为了便于说明，仅示出了与本申请实施例相关的部分。

参见图8，本申请实施例中的医学图像重建装置可以包括隐层向量获取模块501和第二图像重建模块502。

其中，隐层向量获取模块501，用于获取待重建图像的第二隐层向量；

第二图像重建模块502，用于通过训练后的图像重建网络，基于所述第二隐层向量对所述待重建图像进行图像重建。

需要说明的是，上述装置/单元之间的信息交互、执行过程等内容，由于与本申请方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本申请实施例还提供了一种终端设备，参见图9，该终端设备600可以包括：至少一个处理器610、存储器620以及存储在所述存储器620中并可在所述至少一个处理器610上运行的计算机程序，所述处理器610执行所述计算机程序时实现上述任意各个方法实施例中的步骤，例如图2所示实施例中的步骤101至步骤103，或如图5所示实施例中的步骤201至步骤202。或者，处理器610执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能，例如图7所示模块401至403的功能，或如图8所示模块501至502的功能。

示例性的，计算机程序可以被分割成一个或多个模块/单元，一个或者多个模块/单元被存储在存储器620中，并由处理器610执行，以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序段，该程序段用于描述计算机程序在终端设备600中的执行过程。

本领域技术人员可以理解，图9仅仅是终端设备的示例，并不构成对终端设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如输入输出设备、网络接入设备、总线等。

处理器610可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器620可以是终端设备的内部存储单元，也可以是终端设备的外部存储设备，例如插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。所述存储器620用于存储所述计算机程序以及终端设备所需的其他程序和数据。所述存储器620还可以用于暂时地存储已经输出或者将要输出的数据。

总线可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外部设备互连(Peripheral Component，PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture，EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，本申请附图中的总线并不限定仅有一根总线或一种类型的总线。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述医学图像重建网络训练方法各个实施例中的步骤，或实现上述医学图像重建方法各个实施例中的步骤。

本申请实施例提供了一种计算机程序产品，当计算机程序产品在移动终端上运行时，使得移动终端执行时实现上述医学图像重建网络训练方法各个实施例中的步骤，或实现上述医学图像重建方法各个实施例中的步骤。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括：能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区，根据立法和专利实践，计算机可读介质不可以是电载波信号和电信信号。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置/网络设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/网络设备实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

一种医学图像重建网络训练方法，其中，所述医学图像重建网络训练方法包括：

对真实图像样本进行特征编码提取，得到所述真实图像样本的特征编码向量；

通过图像重建网络，基于所述特征编码向量进行图像重建得到第一图像，基于所述真实图像样本的第一隐层向量进行图像重建得到第二图像；

通过图像判别网络对所述真实图像样本、所述第一图像和所述第二图像进行图像判别，并根据图像判别结果对所述图像重建网络进行优化。
如权利要求1所述的医学图像重建网络训练方法，其中，所述对真实图像样本进行特征编码提取，得到所述真实图像样本的特征编码向量，包括：

基于图像编码网络对所述真实图像样本进行特征提取，得到所述真实图像样本的特征编码向量。
如权利要求2所述的医学图像重建网络训练方法，其中，所述基于图像编码网络对所述真实图像样本进行特征提取，得到所述真实图像样本的特征编码向量，包括：

通过所述图像编码网络的多个三维卷积层对所述真实图像样本进行分层特征提取；

通过线性函数对提取到的特征进行处理，得到所述真实图像样本的特征编码向量。
如权利要求3所述的医学图像重建网络训练方法，其中，所述线性函数为分段线性函数。
如权利要求4所述的医学图像重建网络训练方法，其中，所述分段线性函数为ReLU函数。
如权利要求2所述的医学图像重建网络训练方法，其中，所述方法还包括：

通过编码特征判别网络对所述特征编码向量和所述第一隐层向量进行向量判别；

基于向量判别结果对所述图像编码网络进行优化。
如权利要求6所述的医学图像重建网络训练方法，其中，所述基于向量判别结果对所述图像编码网络进行优化，包括：

基于所述向量判别结果对所述图像编码网络进行对抗训练。
如权利要求7所述的医学图像重建网络训练方法，其中，所述基于所述向量判别结果对所述图像编码网络进行对抗训练，包括：

计算所述第二图像与所述真实图像样本之间的逐体素差异，并通过梯度下降法更新所述图像编码网络的网络参数，直至所述逐体素差异小于或等于预设阈值；

其中，所述逐体素差异为所述图像编码网络的第一损失函数，所述第一损失函数为：

L _C为所述第一损失函数，z _e为所述特征编码向量，z _r为所述第一隐层向量，C表征所述图像编码网络，E为数学期望。
如权利要求1所述的医学图像重建网络训练方法，其中，所述根据图像判别结果对所述图像重建网络进行优化，包括：

根据所述图像判别结果对所述图像重建网络进行对抗训练。
如权利要求9所述的医学图像重建网络训练方法，其中，所述根据所述图像判别结果对所述图像重建网络进行对抗训练，包括：

根据所述图像判别结果、结构相似性度量损失函数和感知度量损失函数，确定所述图像重建网络的第二损失函数，并通过梯度下降法更新所述图像重建网络的网络参数，对所述图像重建网络进行训练；

其中，所述第二损失函数为：

L _G为所述第二损失函数，z _e为所述特征编码向量，z _r为所述第一隐层向量，C表征所述图像编码网络，D为所述图像判别网络，G为所述图像重建网络，E为数学期望，L _SSIM为结构相似性度量损失函数，L _perceptual代表感知度量损失函数，X _real表征所述真实图像，λ ₁和λ ₂为权重系数，Φ为Gram矩阵，L _D为图像判别网络的损失函数。
如权利要求1所述的医学图像重建网络训练方法，其中，所述通过图像生成网络，基于所述特征编码向量进行图像重建得到第一图像，基于所述真实图像样本的第一隐层向量进行图像重建得到第二图像，包括：

将所述特征编码向量和所述第一隐层向量输入所述图像重建网络，得到所述第一图像和所述第二图像；其中，所述图像生成网络的卷积层为近邻上采样的三维可分离卷积层。
一种医学图像重建方法，其中，所述医学图像重建方法包括：

获取待重建图像的第二隐层向量；

通过训练后的图像重建网络，基于所述第二隐层向量对所述待重建图像进行图像重建。
一种医学图像重建网络训练装置，其中，所述医学图像重建网络训练装置包括：

特征编码提取模块，用于对真实图像样本进行特征编码提取，得到所述真实图像样本的特征编码向量；

第一图像重建模块，用于通过图像重建网络，基于所述特征编码向量进行图像重建得到第一图像，基于所述真实图像样本的第一隐层向量进行图像重建得到第二图像；

第一优化模块，用于通过图像判别网络对所述真实图像样本、所述第一图像和所述第二图像进行图像判别，并根据图像判别结果对所述图像生成网络进行优化。
一种医学图像重建装置，其中，所述医学图像重建装置包括：

隐层向量获取模块，用于获取待重建图像的第二隐层向量；

第二图像重建模块，用于通过训练后的图像重建网络，基于所述第二隐层向量对所述带重建图像进行图像重建。
一种终端设备，其中，所述终端设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如下步骤：

对真实图像样本进行特征编码提取，得到所述真实图像样本的特征编码向量；

通过图像重建网络，基于所述特征编码向量进行图像重建得到第一图像，基于所述真实图像样本的第一隐层向量进行图像重建得到第二图像；

通过图像判别网络对所述真实图像样本、所述第一图像和所述第二图像进行图像判别，并根据图像判别结果对所述图像生成网络进行优化。
如权利要求15所述的终端设备，其中，所述对真实图像样本进行特征编码提取，得到所述真实图像样本的特征编码向量，包括：

基于图像编码网络对所述真实图像样本进行特征提取，得到所述真实图像样本的特征编码向量。
如权利要求16所述的终端设备，其中，所述处理器执行所述计算机可读指令时还实现如下步骤：

通过编码特征判别网络对所述特征编码向量和所述第一隐层向量进行向量判别；

基于向量判别结果对所述图像编码网络进行优化。
一种终端设备，其中，所述终端设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如下步骤：

获取待重建图像的第二隐层向量；

通过训练后的图像重建网络，基于所述第二隐层向量对所述待重建图像进行图像重建。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，其中，所述计算机可读指令被处理器执行时实现如下步骤：

对真实图像样本进行特征编码提取，得到所述真实图像样本的特征编码向量；

通过图像重建网络，基于所述特征编码向量进行图像重建得到第一图像，基于所述真实图像样本的第一隐层向量进行图像重建得到第二图像；

通过图像判别网络对所述真实图像样本、所述第一图像和所述第二图像进行图像判别，并根据图像判别结果对所述图像生成网络进行优化。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，其中，所述计算机可读指令被处理器执行时实现如下步骤：

获取待重建图像的第二隐层向量；

通过训练后的图像重建网络，基于所述第二隐层向量对所述待重建图像进行图像重建。