CN113129296A

CN113129296A - 基于变换域下去噪自动编码器作为先验的图像处理方法

Info

Publication number: CN113129296A
Application number: CN202110474769.7A
Authority: CN
Inventors: 李彦明; 郑海荣; 刘新; 万丽雯; 胡战利; 周瑾洁
Original assignee: Shenzhen National Research Institute of High Performance Medical Devices Co Ltd
Current assignee: Shenzhen National Research Institute of High Performance Medical Devices Co Ltd
Priority date: 2021-04-29
Filing date: 2021-04-29
Publication date: 2021-07-16
Anticipated expiration: 2041-04-29

Abstract

本发明公开了一种基于变换域下去噪自动编码器作为先验的图像处理方法。该方法包括：利用原始图像和多通道变换特征构造具有多尺度和多视角特性的多通道张量空间，构建训练数据集；基于所述训练数据集训练去噪自动编码器网络，以将图像变换域与原始像素域相结合，获得变换域中图像，并使用变换域中图像学习所述多通道张量空间中的先验信息；将从所述多通道张量空间中学习的先验信息引入到处理图像复原问题的迭代过程进行求解，获得优化的去噪自动编码器网络。利用本发明获得的重建图像，在保持了更多纹理细节的情况下，提高了图像的质量，更能满足诊断需求。

Description

基于变换域下去噪自动编码器作为先验的图像处理方法

技术领域

本发明涉及医学图像处理技术领域，更具体地，涉及一种基于变换域下去噪自动编码器作为先验的图像处理方法。

背景技术

近年来，医学图像处理被广泛应用于临床指导。例如，X射线计算机断层扫描(CT)在医院和诊所中用于诊断和干预。由于受到射线照射，X射线CT可能引起癌症或遗传疾病的潜在风险。X-CT医学影像图像具有组织结构密度分辨率高，对人体损害小等优点，对病理学和解剖学的研究非常重要。但是在X-CT机扫描过程和传输图像过程中，会产生图像模糊不清或者边界不明显等现象，致使X-CT医学影像图像的可读性不高，医生无法准确诊断。因此减少X射线剂量是必要的。最新技术通常利用两种方式来试图解决此问题：减少X射线管的工作电流和曝光时间，或减少采样视图的数量。前一种方法可以解决由低信噪比(SNR)投影引入的噪声问题。后一种方法通常更安全，但是，它产生的投影数据不足，即视图稀疏且含有噪声。X射线剂量在X-CT医学影像图像中是一个关键的指标，X射线剂量越大，则图像越清晰。但是伴随着X射线剂量的增加，对人体的伤害也持续加大。目前，很多医院的设备已经达到了最小剂量的要求，但是最小剂量的CT会伴随着质量不高且有噪声的情况。在实现低剂量的情况下(对人体伤害最小的情况下)得到质量较高的CT图像对于医疗诊断领域具有重要的科学意义和广阔的应用前景。

Chen Hu等人于2017年在IEEE 14th International Symposium on BiomedicalImaging(ISBI 2017)会议上发表文章“Low-dose CT denoising with convolutionalneural network”，成功将深度神经网络应用于低剂量CT去噪领域。这是一种在不访问原始投影数据的情况下通过深度神经网络对低剂量CT图像进行降噪的方案。深度卷积神经网络经过训练，可以将小剂量的CT图像逐步转换为正常剂量的CT图像。但该方案所用数据集是成对的一一对应的低高剂量的CT图像对，其中，低剂量图像是通过用空白扫描通量将泊松噪声施加到模拟正常剂量正弦图的每个检测器元素中来生成相应的低剂量图像。

Eunhee Kang等人于2018年在IEEE Transactions on Medical Imaging刊上发表文章“Deep Convolutional Framelet Denosing for Low-Dose CT via WaveletResidual Network”，提出了一种基于小波残差网络的去噪方案。该方案将深度学习的表达能力与基于小波框架的去噪算法的性能保证协同起来。但该方案的低剂量CT图同样也是基于高剂量图像来进行模拟生成的。

ZhanliHu等人于2016年在Physics in Medicine and Biology刊上发表文章“Afeature refinement approach for statistical interior CT reconstruction”，提出了一种用于计算机断层摄影的统计内部断层摄影方法。该方案着重考虑本地投影数据的统计性质，并恢复在传统的总变量(TV)最小化重建中丢失的精细结构。所提出的方法利用压缩感测框架，该框架仅假设内部感兴趣区域(ROI)为分段常数或多项式，并且不需要任何其他先验知识。为了整合投影数据的统计分布特性，在惩罚加权最小二乘(PWLS-TV)的标准下建立了目标函数。在提出的方法中，首先将基于内部投影外推的FBP重建用作初始猜测，以减轻截断伪像并提供扩展的视野。

经分析，现有的CT图像处理主要缺陷是：考虑到对患者发射X射线的潜在风险，低剂量CT在是临床医学中常用的诊断凭证，但在CT成像时低剂量的显像剂会导致重建图像产生大量量子噪声和模糊的形态特征；在现有的基于深度学习的图像重建方案中，所用数据集是成对的一一对应的低高剂量的CT图像对，但是现实生活中，干净的一一对应的CT图像很少。在现有技术中，低剂量图像是通过用空白扫描通量将泊松噪声施加到模拟正常剂量正弦图的每个检测器元素中来生成相应的低剂量图像，计算过程复杂、效率低。

发明内容

本发明的目的是克服上述现有技术的缺陷，提供一种基于变换域下去噪自动编码器作为先验的图像处理方法，是利用无监督学习的先验信息用于低剂量图像去噪的新技术方案。

根据本发明的第一方面，提供一种基于变换域下去噪自动编码器作为先验的图像处理方法。该方法包括以下步骤：

步骤S1：利用原始图像和多通道变换特征构造具有多尺度和多视角特性的多通道张量空间，构建训练数据集；

步骤S2，基于所述训练数据集训练去噪自动编码器网络，以将图像变换域与原始像素域相结合，获得变换域中图像，并使用变换域中图像学习所述多通道张量空间中的先验信息；

步骤S3，将从所述多通道张量空间中学习的先验信息引入到处理图像复原问题的迭代过程进行求解，获得优化的去噪自动编码器网络。

根据本发明的第二方面，提供一种图像处理方法。该方法包括：对待处理图像进行变换获得变换域图像；

将所述待处理图像和图像变换域相结合，输入到根据本发明获得的优化的去噪自动编码器网络，输出重建图像。

与现有技术相比，本发明的优点在于，所提供的基于变换域下去噪自动编码器作为先验的图像处理方法，核心思想是通过变换域增强经典的去噪自动编码器(DAE)，该编码器从多个视图中捕获互补信息，在保持了更多纹理细节的情况下，提高了图像的质量，使处理后的图像变得更清晰，更能满足诊断需求。

通过以下参照附图对本发明的示例性实施例的详细描述，本发明的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例，并且连同其说明一起用于解释本发明的原理。

图1是根据本发明一个实施例的基于变换域下去噪自动编码器作为先验的图像处理方法的流程图；

图2是根据本发明一个实施例的基于变换域下去噪自动编码器作为先验的图像处理方法的总体过程示意图；

图3是根据本发明一个实施例的基于变换域下去噪自动编码器作为先验的网络学习流程图；

图4是根据本发明一个实施例的实验结果示意图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它例子可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

本发明提供的基于变换域下去噪自动编码器作为先验的图像处理方法可应用于磁共振成像、计算机断层成像、正电子发射计算机断层成像等多种类型的图像重建，例如图像去噪、去块、去马赛克等。为清楚起见，下文以CT图像去噪为例进行说明。

本发明受像素域和小波域联合利用先验的显著性能的启发，提出了一种基于变换域下去噪自动编码器作为先验(TDAEP-CT)的CT去噪算法，核心思想是通过变换域增强经典的去噪自动编码器(DAE)，该编码器从多个视图中捕获互补信息。简言之，该方法包括：使用非正交小波系数来形成多通道特征图像(如4通道特征图像)；通过叠加像素域下的原始图像和小波域下的多通道特征图像，得到多通道张量(如5通道张量)；使用该多通道张量作为网络输入来训练转换后的DAE(或称为TDAE)；基于训练好的自动编码器获得优化的图像先验，并借助辅助变量技术将其结合到迭代恢复过程中。

具体地，参见图1所述，以CT图像去噪为例，所提供的基于变换域下去噪自动编码器作为先验的图像处理方法包括以下步骤。

步骤S110，对一一不对应的CT图像进行配准，生成多通道的CT张量，并构建训练数据集。

例如，参见图2所示，该步骤包括：首先是对一一不对应的CT图像进行归一化的处理，使其在训练阶段时大小保持一致，然后对CT图像进行小波变换(例如使用1级非正交小波系数来形成4通道特征图像)，将四张小波的图像与一张原图堆叠形成一个5维的CT图像张量。其中，一一不对应的CT图像如图2(a)所示，CT图像进行小波变换的过程如图2(b)所示，5维的CT图像张量的形成如图2(c)所示。

如图2(a)所示，该实施例用小波变换(WT)来产生变化域。小波变换可以有效地分析图像特征，尤其是图像细节。尽管小波变换在信息检索任务中取得了成功，但仍有改进的余地。在传统的离散小波变换中，伪吉布斯现象发生在提取信号的不连续性附近。它在重建信号的奇异点附近引起交替的欠拍和过冲，并在处理后的图像中产生块状伪影。这些实际缺陷可以通过使用TIWT(平移不变小波变换或称循环纺纱)来缓解，其核心思想是“平均化”依赖性。TIWT计算图像和小波基函数的所有(循环)翻译版本之间的内积。复原可以通过阈值和平均算子依次实现。利用TIWT可以避免去噪过程中的伪吉布斯现象，并且在去除噪声和恢复降低的高频分量方面获得了比DWT(离散小波变换)更好的增益。

在一个实施例中，过完备小波变换由N个正交小波变换构成，每一正交小波变换都由小波基函数的循环移位构成。将

为基本正交小波变换矩阵，{W_i ^T|i∈{0,...,N-1}}表示可能的小波变换矩阵，将圆形图像移位应用到基函数

中，TIWT矩阵及其逆过程被表示为：

因此，

WW^Tx＝x WW^T＝I (2)

值得注意的是，W^TW≠I并且W不是正交的。

在1级2D-TIWT之后，原始图像被分解成4个子带图像：近似部分LL和包括水平分量HL、垂直分量LH和对角分量HH(每个分量具有原始图像的1/4大小)的细节部分。低频分量是包含原始图像大部分信息的子带LL。表示为HL、LH和HH的子带包含最精细尺度的细节小波系数，对应于原始图像的较高频率的细节信息。应注意的是，在2D-TIWT分解之后，每个子带图像总是具有与原始输入图像几乎相同的尺寸。由四个子带组成的2D逆平移不变小波变换可以完全重构原始图像。在该实施例中，通过TIWT学习具有多尺度和多视角特性的图像先验。

从变换域获得的多面数据提供了更多的轮廓先验信息，这对处理复原任务有很大帮助。本发明实施例构造了一个由小波域和像素域元素组成的多面数据，形成一个张量作为网络输入。图2(c)描述了变换域中5通道张量的形成过程。在一个实施例中，最终的训练数据是

其中，前一个分量Ix是原始图像，后一个分量Wx代表四个子带图像的组合。

步骤S120，利用训练数据集训练去噪自动编码器，以学习变换域中的先验。

在此步骤，以基于CT图像的增强的经典去噪自动编码器(TDAEP-CT)为例说明网络设计过程。

具体地，基于DAE的基础上，Bigdeli等人提出(Denoising Autoencoder Prior，DAEP)，其使用DAE误差的幅值作为图像复原的先验信息。假设DAE为

它的输出为

利用高斯噪声和期望二次损失对其最优值进行训练，表示为：

其中，期望

是进行整体图像x和带标准差σ_η的高斯噪声η。可推导得到：

其中，p(x)为真实数据密度，

为局部高斯核。由式(3)可知，各点x处的最优DAE重构函数是由密度函数p的一种卷积给出的，也就是邻域x内各点的加权平均。

此外，对于高斯密度

存在

因此自动编码器误差

正比于平滑密度的对数似然梯度，即：

其中，*为卷积算子。因此，DAEP采用先验信息的迁移特性，并利用该均值偏移向量的大小作为图像先验的负对数似然，表示为：

如方程式(5)，DAE从给定的一组数据样本中学习一个均值漂移矢量场，该场与先验对数的斜率成比例。因此，Bigdeli等人提出了一种新的先验，称为深度均值漂移先验(DMSP)。以梯度下降的方式利用它来实现贝叶斯风险最小化。DMSP的公式表示为：

▽prior(x)＝▽log∫g_σ(η)p(x+η)dη＝[(A_σ(x)-x)]/σ² (7)

通过扩展原始的DMSP，并集成了多模型聚合和多渠道网络学习，也可采用高维嵌入网络，该网络先于派生，并通过可变增强技术将所学的先验信息应用于单通道MRI重建。

本发明提供的TDAEP-CT主要包含两个过程：学习5通道张量空间中的先验信息，而不是原始CT像素空间；从5通道张量空间中学习的先验信息引入到处理CT图像复原问题的迭代过程中。

首先，在学习阶段，从由5通道张量及其噪声版本组成的数据对训练TDAE网络。相应地，TDAEP先验被定义为：

其中，x是原始图像，变换域中5通道张量表示为

其中，前一个分量Ix是原始图像，后一个分量Wx代表四个子带图像的组合。DAE为

它的输出为

其中

表示二范数。

本发明的最大创新是学习变换域中的先验信息并将其应用于图像复原任务。在图像复原任务中，将图像小波域与原始像素域相结合，以获得变换域中的图像，并使用它来驱动网络提取图像先验信息。

下文将说明TDAEP在图像特征提取方面优于DAEP。使用图像变换域能够增强图像恢复过程。这项工作的最大创新是学习变换域中的先验信息并将其应用于IR(图像重建)任务。

其中，y＝Mx+n为图像退化公式，x是原始图像，M是退化因子/算子，y是产生的退化之后的图像，n是加性噪声，参数λ是控制数据保真度项和正则化项之间的折衷。

考虑到分别或联合从像素域和小波域获得先验的方式，R(x)，R(Wx)和

分别表示为三种正则项。具体地，从小波域提取的正则项如下:

其中Wx代表四个子带图像的组合。然后，所提出的正则项的优越性可以从以下不等式中导出：

与分别在像素或小波域中获得的先验诱导正则化相比，本发明通过叠加将它们联合学习为张量，伴随着具有较低惩罚的损失函数。较好的学习能力有助于网络有效提取冗余特征信息，产生更紧凑的表示。变换域的多尺度和多视角特性是通过同时向像素域和小波域添加人工噪声来实现的。它们相互补充，以获得更高质量的先验信息。

虽然方程中的TDAEP，公式(5)和(6)提供了有希望的正则化特征，但仍有挑战要解决。具体地说，梯度计算成本很大，并且其推导涉及复杂的操作，即，

或者，为了简化计算，将TDAE网络

替换为可接受的网络

设

TDAEP就可以变为

其梯度变为：

因此，在一个实施例中，通过以下两个等式来训练和使用网络:

在这种情况下，

接近高斯噪声η。

本发明的网络架构设计可使用多种类型的端到端卷积神经网络，如ResNet，densente和DualPathNet。其中，基本层和构造块是设计最佳架构的两种流行工具。特别是，ResNet引入了快速连接方案，使得最后一个剩余块直接流入下一个。因此，它改善了信息流，避免了消失梯度。由于ResNet在VDSR、EDSR和SRGAN中的良好性能，TDAE网络的体系结构在本发明中使用ResNet作为构建模块。

在一个实施例中，TDAE网络的输入和输出都是5维张量。网络的主体包括五个构件，每个构件由“CONV+BN+ReLU”、“CONV+BN”和“ReLU”组件组成。缩写“CONV”、“BN”和“ReLU”分别代表卷积层、用于加速网络学习的批量归一化和校正线性单元。除了最后一层的滤波器数量为5之外，每个卷积层的核心滤波器数量被设置为320。每个卷积层的核大小设置为3×3。可以看出，除了网络输入输出和附加的ResNet块之外，它的结构类似于DnCNN(去噪卷积神经网络)。需说明的是，在TDAE，可采用更复杂的网络保证更高效的学习能力。

步骤S130，通过迭代求解获得优化的去噪自动编码器网络。

在一个实施例中，采用近端梯度法来处理网络的非线性和得到的模型方程。具体地，模型可以通过标准最小二乘最小化来近似，表示为：

其中，

方程函数G(x)是

-李普希茨光滑的，即k代表迭代次数指数。这里，在实验中根据经验设定β＝1。假设β＝1，方程(16)则是标准的LS(最小二乘)问题，可以通过如下计算梯度来解决：

可以得到：

其中R表示在第一通道图像和中间ITIWT结果上使用的平均算子。

已经在网络训练阶段被学习。此外，利用网络估计

来更新梯度分量

和方程(18)的LS解算器或者直到最终的x^k+1-value收敛。

图3是用于TDAEP学习的网络流程图，其中，输入为5通道图像，外加人工高斯噪声；中间部分示意出了是20层网络，由5个残差“块”、1个“CONV+ReLU”、3个“CONV+BN+ReLU”和1个“CONV”组成，“块”的具体结构参见图3的上半部分。

为进一步验证本发明的效果，进行了仿真实验。结果如图4所示，从左至右依次是低剂量CT图、高剂量CT图和根据本发明去噪后的CT图。可以看出，本发明方法可以有效提高图像的峰值信噪比和结构相似度，同时，可以在一定程度上恢复图像细节信息。大量实验表明，本发明对CT去噪的效果显著，并可应用于去块、去马赛克等其他类型的图像重建。

综上所述，本发明在变换域提取先验，即在像素域和中间小波域联合提取受损对象的先验，而不是分别在像素域或小波域，由原始图像和多通道变换特征构造具有多尺度和多视角特性的通道张量。特别地，通过采用平移不变小波变换(TIWT)，可以有效地优化噪声和高频分量。此外，网络设计过程中采用不同的噪声加权策略，使设计过程对不同的复原任务更加鲁棒和稳定，该策略有利于避免陷入局部极小值，使迭代过程更加稳定。进一步地，在学习了基于TDAE网络的高维先验后，采用交替优化和近似梯度下降技术解决非凸图像恢复最小化问题。

本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言-诸如Smalltalk、C++、Python等，以及常规的过程式编程语言-诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络-包括局域网(LAN)或广域网(WAN)-连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本发明的各个方面。

这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是，通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。