CN116670707A

CN116670707A - 用于训练和调谐神经网络模型以进行去噪的方法和系统

Info

Publication number: CN116670707A
Application number: CN202180072203.XA
Authority: CN
Inventors: F·贝格纳; C·维尔克; N·D·施内尔巴切尔; T·克勒; K·M·布朗
Original assignee: Koninklijke Philips NV
Current assignee: Koninklijke Philips NV
Priority date: 2020-10-22
Filing date: 2021-10-14
Publication date: 2023-08-29
Also published as: US20230394630A1; EP4232997A1; JP2023546208A; WO2022084157A1

Abstract

本公开内容的一个实施例可以提供一种用于训练和调谐神经网络模型的方法，包括：将模拟噪声添加到对象的初始图像以生成有噪声的图像(601、603)，所述模拟噪声采取与所述初始图像中的所述自然噪声相同的形式；通过使用所述初始图像作为真实情况来在所述有噪声的图像上训练神经网络模型(605)，其中，在所述神经网络模型中，提取或生成调谐变量，所述调谐变量定义在使用期间被移除的噪声的量；识别针对所述调谐变量的第一值(607)，所述第一值使针对所述初始图像的训练代价函数最小化；并且将第二值分配给所述调谐变量(611)，所述第二值不同于所述第一值，其中，所述神经网络模型在使用所述第二值时比使用所述第一值时在所述有噪声的图像中识别出更多的噪声。

Description

用于训练和调谐神经网络模型以进行去噪的方法和系统

技术领域

本公开内容总体上涉及用于训练和调谐神经网络模型以对图像进行去噪的系统和方法，以及用于使用经训练的神经网络对图像进行去噪的系统和方法。

背景技术

在常规情况下，在大多数成像模态中，在采集物理或重建中存在一些影响，从而导致最终图像中的特定伪影(例如，噪声)。为了以有监督的方式训练去噪神经网络模型，将成对的有噪声的图像样本和无噪声的图像样本呈现给神经网络模型，并且该网络试图通过对有噪声的图像进行去噪以恢复到对应的无噪声的真实情况图像，从而使代价函数最小化。这可以通过预测噪声图像来实现，当从有噪声的图像中减去噪声图像时，产生或近似出无噪声图像。

然而，在CT扫描的背景中，用作真实情况的样本“无噪声”图像并不是真正无噪声的，并且已经是次优的，因为临床应用的辐射剂量是有限的。这对于能够用于训练的“无噪声”图像产生了噪声基线。另外，即使当能够施加高剂量辐射时(如在尸体扫描的情况下)，成像工具的机械装置仍然会引入噪声，例如，用于该机械装置的扫描器可能受限于管电流。

一些现有的方法是用高质量的迭代重建来重建真实情况样本。然而，这些方法在开发模拟的干净的图像的过程中可能会引入其他图像伪影，然后这些其他图像伪影可能会被引入到使用AI网络进行去噪的任何图像中，而AI网络是使用这样的图像作为真实情况进行训练的。正因如此，AI网络可能无法学会检测真正的底层解剖结构。

需要一种用次优的有噪声的真实情况图像来训练AI神经网络模型而使得网络仍然能够生成无噪声图像的方法。还需要这样一种用于对图像进行去噪的方法，该方法能够生成比用真实情况图像训练时更好的图像质量。

在背景技术部分中提供的描述不应仅仅因为是在背景技术部分中提到的或者与背景技术部分相关联而被认为是现有技术。背景技术部分可以包括描述主题技术的一个或多个方面的信息。

发明内容

提供了一种用于训练神经网络模型的方法，在所述方法中，使用包含自然噪声的初始图像来训练网络。在这样的方法中，将模拟噪声添加到初始图像，并且在一些实施例中，添加的模拟噪声采取与对应的图像中的自然噪声相同的形式。然后训练神经网络模型以在应用缩放因子的同时移除呈自然噪声形式的噪声。

然后，通过识别缩放因子的第一值来优化网络模型，这通过使神经网络模型的输出与初始图像之间的差异最小化来使针对网络的代价函数最小化。在优化之后，修改缩放因子而使得移除比重建真实情况图像所需的噪声更多的噪声。

本公开内容的一个实施例可以提供一种用于训练和调谐神经网络模型的方法。所述方法可以包括提供对象的初始图像，所述初始图像包含自然噪声。所述方法还可以包括将模拟噪声添加到所述对象的所述初始图像以生成有噪声的图像，所述模拟噪声采取与所述初始图像中的所述自然噪声相同的形式。所述方法还可以包括通过使用所述初始图像作为真实情况来在所述有噪声的图像上训练神经网络模型。在所述神经网络模型中，提取或生成调谐变量，所述调谐变量定义在使用期间被移除的噪声的量。所述方法还可以包括识别针对所述调谐变量的第一值，所述第一值使针对所述初始图像的训练代价函数最小化。所述方法还可以包括将第二值分配给所述调谐变量，所述第二值不同于所述第一值。所述神经网络模型在使用所述第二值时比使用所述第一值时在所述有噪声的图像中识别出更多的噪声。

本公开内容的另一实施例可以提供一种神经网络训练和调谐系统。所述系统可以包括：存储多个指令的存储器；以及耦合到所述存储器的处理器电路。所述处理器电路被配置为运行所述指令以：提供对象的初始图像，所述初始图像包含自然噪声；将模拟噪声添加到所述对象的所述初始图像以生成有噪声的图像，所述模拟噪声采取与所述初始图像中的所述自然噪声相同的形式；通过使用所述初始图像作为真实情况来在所述有噪声的图像上训练神经网络模型，其中，在所述神经网络模型中，提取或生成调谐变量，所述调谐变量定义在使用期间被移除的噪声的量；识别针对所述调谐变量的第一值，所述第一值使针对所述初始图像的训练代价函数最小化；并且将第二值分配给所述调谐变量，所述第二值不同于所述第一值，其中，所述神经网络模型在使用所述第二值时比使用所述第一值时在所述有噪声的图像中识别出更多的噪声。

附图说明

图1是根据本公开内容的一个实施例的系统的示意图。

图2图示了根据本公开内容的一个实施例的成像设备。

图3是根据本公开内容的一个实施例的处理设备的示意图。

图4A-4B图示了根据本公开内容的一个实施例的初始图像和有噪声的图像的示意性示例。

图5A-5C图示了根据本公开内容的一个实施例的去噪的示例结果。

图6和图7图示了根据本公开内容的实施例的方法的流程图。

具体实施方式

根据本公开内容的原理的说明性实施例的描述旨在结合附图来进行阅读，附图被认为是整个书面描述的部分。在本文公开的实施例的描述中，对方向或取向的任何引用仅仅是为了便于描述，而决不是为了以任何方式限制本公开内容的范围。相关术语(例如，“下”、“上”、“水平”、“垂直”、“上面”、“下面”、“向上”、“向下”、“顶部”和“底部”及其派生词(例如，“水平地”、“朝下”、“朝上”等))应被解释为指的是随后描述的或者在所讨论的附图中示出的取向。这些相关术语仅是为了便于描述，除非明确指出，否则不要求以特定的取向构造或操作该装置。诸如“附接”、“附着”、“连接”、“耦合”、“互连”等术语指的是这样一种关系，其中，结构通过中间结构直接或间接地彼此固定或附接，以及可移动的或刚性的附接或关系，除非另有明确描述。另外，通过参考示例性实施例来说明本公开内容的特征和益处。因此，本公开内容不应明显限于图示出一些可能的非限制性特征组合的示例性实施例，这些特征组合可以单独存在，也可以以其它特征组合的形式存在；本公开内容的范围由所附权利要求书来限定。

本公开内容描述了目前预想到的实践本公开内容的最佳模式。该描述并不旨在以限制的意义来理解，而是通过参考附图来提供仅出于说明目的而呈现的本公开内容的示例，以告知本领域普通技术人员本公开内容的优点和构造。在附图的各个视图中，相同的附图标记表示相同或相似的部分。

重要的是，要注意，所公开的实施例仅仅是本文中的创新教导的许多有利使用的一个示例。一般而言，本申请的说明书中的陈述不一定限制各种要求保护的公开内容的任意方面。此外，一些陈述可能适用于一些创造性特征，但不适用于其他特征。一般而言，除非另有说明，否则在不失一般性的情况下，单数元素可以是复数，并且反之亦然。

为了以有监督的方式训练去噪神经网络模型，将成对的有噪声的图像样本和无噪声的图像样本呈现给网络模型，并且通过代价函数来惩罚在训练期间对噪声的错误预测。通过使用噪声生成工具模拟噪声来从无噪声图像样本生成有噪声的图像。在一个示例中，对于计算机断层摄影(CT)，临床评估的噪声生成工具允许系统为形成原始数据集的现有临床真实情况无噪声图像产生高度逼真的噪声。

然而，临床真实情况图像并不是真正无噪声的。正因如此，它们可能已经是次优的，因为临床应用的辐射剂量受到放射科医师根据“ALARA”(尽可能低的合理可实现量)原则的限制。这在真实情况图像中产生了噪声基线，从而无法获得训练所需的真正的无噪声的图像。

本公开内容教导了可以用次优的、有噪声的真实情况图像来训练网络的方法，这种方法通过使用网络预测过度校正图像而仍然得到无噪声的或接近无噪声的图像。以这种方式，本公开内容有助于克服医学图像去噪领域中缺乏无噪声真实情况图像的问题。

本公开内容可以使用残差学习方法，这意味着训练去噪网络来预测输入图像中的噪声，然后减去该噪声以产生去噪图像。这可能不同于直接去噪，在直接去噪中，网络被训练为从输入直接预测去噪图像。然而，本文描述的系统和方法可以应用在任一背景中。

如图1所示，根据本公开内容的一个实施例的系统可以包括处理设备100和成像设备200。

处理设备100可以训练神经网络模型来对图像进行去噪。处理设备100可以包括存储器113和处理器电路111。存储器113可以存储多个指令。处理器电路111可以耦合到存储器113，并且可以被配置为运行指令。处理设备100还可以包括输入部115和输出部117。输入部115可以从成像设备200接收信息(例如，初始图像311)。输出部117可以向用户输出信息。输出部可以包括监视器或显示器。

在一些实施例中，处理设备100可以涉及成像设备200。在一些实施例中，成像设备200可以包括图像数据处理设备和用于在扫描对象(例如，患者)时生成CT投影数据的能谱CT扫描单元。例如，图2图示了根据本公开内容的实施例的示例性成像设备200。虽然示出了CT成像设备，并且以下讨论是在CT图像的背景中进行的，但是类似的方法可以应用在其他成像设备的背景中，并且可以以多种方式采集这些方法可以应用到的图像。

在根据本公开内容的实施例的成像设备中，CT扫描单元可以适于执行对对象的多个轴向扫描和/或螺旋扫描，以便生成CT投影数据。在根据本公开内容的实施例的成像设备中，CT扫描单元可以包括能量分辨光子计数图像探测器。CT扫描单元可以包括辐射源，该辐射源在采集投影数据时发射用于穿过对象的辐射。

例如，CT扫描单元(例如，计算机断层摄影(CT)扫描器)可以包括固定机架202和旋转机架204，旋转机架204可以由固定机架202可旋转地支撑。当采集投影数据时，旋转机架204可以围绕针对对象的检查区域206绕纵轴旋转。CT扫描单元可以包括支撑物(例如，卧榻)以支撑在检查区域206中的患者。

CT扫描单元可以包括辐射源208(例如，X射线管)，辐射源208可以由旋转机架204支撑并且被配置为与旋转机架204一起旋转。辐射源可以包括阳极和阴极。施加在阳极和阴极之间的源电压可以将电子从阴极加速到阳极。电子流可以提供从阴极到阳极的电流，从而产生穿过检查区域206的辐射。

CT扫描单元可以包括探测器210。该探测器可以跨检查区域206以角度弧与辐射源208相对。探测器可以包括一维或二维像素阵列(例如，直接转换探测器像素)。探测器可以适于探测穿过检查区域的辐射并生成指示该辐射的能量的信号。

成像设备200还可以包括生成器211和213。生成器211可以基于来自探测器210的信号来生成断层摄影投影数据209。生成器213可以接收断层摄影投影数据209并基于断层摄影投影数据209来生成对象的初始图像311。可以将初始图像311输入到处理设备100的输入部115。

图3是根据本公开内容的一个实施例的处理设备100的示意图。图4A和图4B示出了将模拟噪声317、337添加到图像311、331以用于使用图3的处理设备100来训练神经网络模型510的添加过程。

如图3所示，处理设备100可以包括多个功能块131、133、135、137和139。

参考图3，可以例如经由输入部115将对象的初始图像311提供给块131。如图4A所示，初始图像311可以包含自然噪声315。参考图3和图4A，块131可以将模拟噪声317添加到对象的初始图像311以生成有噪声的图像313。模拟噪声317可以采取与初始图像311中的自然噪声315相同的形式。

在一些实施例中，参考图3和图4B，可以将对象的多幅额外初始图像331提供给块131。额外初始图像331中的每幅额外初始图像都可以包含自然噪声335。块131可以进一步将模拟噪声337添加到额外初始图像331中的每幅额外初始图像，以形成多幅额外的有噪声的图像333。模拟噪声337可以采取与多幅额外初始图像331的每幅额外初始图像中的自然噪声335相同的形式。在一些实施例中，额外初始图像331中的至少一幅额外初始图像中的自然噪声335的形式可以不同于初始图像311中的自然噪声315的形式。

当提到采取与自然噪声相同的形式的模拟噪声时，该形式涉及噪声的统计模型或数学模型。正因如此，可以产生模拟噪声而使得它在数学上无法与在对应的初始图像中出现的自然噪声区分开来。

在一些实施例中，模拟噪声317可以试图仿效与实际生成对应的初始图像311的过程不同的成像过程的结果。正因如此，如果初始图像311是在标准条件下以标准辐射剂量(即，100％剂量)获取的，那么可以添加模拟噪声317来仿效以例如标准辐射剂量的一半(即，50％剂量)获取的相同内容的图像。因为这样的噪声模拟工具可以添加噪声来模拟沿着若干这样的变量的替代成像过程。

如图3所示，块133可以使用初始图像311作为真实情况来在有噪声的图像313上训练神经网络模型510。在一些实施例中，块133可以使用对应的额外初始图像331作为针对那些训练迭代的真实情况来在额外的有噪声的图像333中的每幅额外的有噪声的图像上训练神经网络模型510。

在神经网络模型510中，提取或生成调谐变量。调谐变量可以是确定要移除多少由神经网络模型510识别的噪声的缩放因子。块135可以接收经训练的神经网络模型510。块135可以识别或接收针对调谐变量的第一值513，第一值513用于使针对初始图像311的训练代价函数最小化。

可以在模型中隐含地给出调谐变量。例如，在一些实施例中，可以将网络的最终层中的最终值乘以一些权重，然后进行求和。此时，调谐变量可以是这些权重的分量。下面将更详细地讨论对这样的调谐变量的推导。在一些实施例中，调谐变量可以是应用于网络内部的所有权重的标量因子。在其他实施例中，调谐变量本身可以是一系列因素。例如在神经网络模型或多个组合的神经网络模型预测多个不相关分量的情况下就是如此。

通过隔离调谐变量，神经网络模型510能够单独确定有噪声的图像313中的哪些元素是噪声315、317，并且通过选择针对调谐变量的适当值来确定要移除多少采取这些元素的形式的噪声。然而，因为初始图像311中的噪声315采取与在有噪声的图像313中模拟的噪声317相同的形式，所以神经网络模型510无法区分这两种类型的噪声。

因此，因为模拟噪声317是高度逼真的，所以网络模型510无法学会将该模拟噪声与真实情况图像311中的噪声315区分开的任何机制，而是只能使用非常简单的方式来获得满意的结果(其预测满足训练代价函数)。网络510然后使用调谐变量来缩放其噪声预测，以实现理想的结果。

由代价函数驱动的对调谐变量的“正确”预测将降低最终的噪声水平，但是移除过多的噪声也将移除噪声315中属于真实情况图像311的部分，因此这将被代价函数所阻止。因此，通过应用通过使代价函数最小化而生成的调谐变量的第一值513，识别和/或移除了足够的噪声315、317，使得实现了模拟噪声移除与真实噪声移除之间的平衡。

正因如此，使用针对调谐变量的第一值513使得得到了有噪声的输出图像。然后，块137可以将第二值515分配给调谐变量。第二值515可以不同于第一值513，并且神经网络模型510在使用第二值515时可以比在使用第一值513时识别出更多的噪声。正因如此，在神经网络模型510识别出图像中采取识别出的形式的噪声315、317之后，使用第二值515比使用第一值513移除了更多的噪声，使得所得到的去噪图像315比初始图像311更干净。

在一个实施例中，输出部117可以向用户提供经训练的神经网络模型510，并且向用户提供针对调谐变量的潜在的第二值的范围514。正因如此，用户可以为调谐变量选择最优的第二值515。

另外，如上所述，完全不同的真实情况图像311、331可以具有采取彼此不同的形式的噪声315、335。正因如此，当对噪声317、337进行模拟并将其添加到图像时，模拟噪声采取的形式或模式与真实情况图像中的噪声315、335相匹配。这允许神经网络模型一旦被训练就可以检测完全不同的模式的噪声。在一些实施例中，可以将完全不同的调谐变量应用于从完全不同的训练图像311、331中提取的不同模式的噪声。

块139可以将具有第二值515的经训练的神经网络模型510应用于待去噪的图像391。待去噪的图像391可以包括诸如初始图像311、有噪声的图像313以及除了初始图像311和有噪声的图像313之外的二次图像之类的图像。例如，待去噪的图像391可以是新的临床采集的待去噪的图像。

块139可以将神经网络模型510配置为对图像391进行去噪。在一些实施例中，块139可以将神经网络模型510配置为预测有噪声的图像313中的噪声并从有噪声的图像313中移除预测的噪声以生成干净的或去噪的图像315。典型地，如果神经网络模型510是有效的，那么使用应用于有噪声的图像313的第二值515应当得到比初始图像311更干净的去噪图像315。

在另一实施例中，除了神经网络模型510之外，还可以使用滤波器来进一步对预测的噪声进行整形。如果模拟噪声在训练期间具有略微不同的噪声功率谱，那么这能够是有帮助的，这将促使神经网络模型510朝着模拟噪声改变其预测。

图5A-5C图示了根据本公开内容的一个实施例的去噪的样本结果。

图5A示出了有噪声的图像391，下面描述的方法可以应用于这幅有噪声的图像391，以便实现本文描述的神经网络模型510。然后将有噪声的图像391输入到应用了去噪卷积神经网络(CNN)510的系统，该去噪卷积神经网络510是使用本文讨论的方法来训练的。如上面所讨论的，当使用针对调谐变量的第一值513对这样的有噪声的图像391进行去噪时，输出非常类似于上面讨论的初始图像311、331(其包括噪声基线)中存在的噪声水平。在图5B的图像中，使用针对调谐变量的第一值513从输入中减去所预测的噪声，这样产生了CNN基线结果。

图5C示出了使用针对调谐变量的第二值515得到的去噪图像的示例。在图5C的图像中，减去了更多的残渣，从而得到了几乎没有噪声的“过校正”图像。

对于某些损失函数，能够以数学方式预测针对调谐变量的理想值。在一个示例中，在对神经网络模型510的训练期间，该方法试图使针对给定样本的以下值最小化，其中，该样本是图像的3D片块：

(n_ij,sim-f(μ_j,real+n_j,real+n_ij,sim))²

在这种背景下，μ_j,real是图像的第j个真实的无噪声的片块，n_j,real是存在于第j个片块上的真实噪声，它因此是真实情况的部分，并且n_ij,sim是在第j个片块上模拟的第i个噪声，它是针对该片块的假定真实“残差”，其中，被设计为f(·)的函数是本文描述的神经网络。

假定网络做得很好，那么网络(即，f(μ_j,real+n_j,real+n_ij,sim))逼近我们的真正的“残差”，并且生成了估计然而，如果模拟噪声模拟得很好，那么神经网络模型510就无法区分真实噪声与模拟噪声，使得/>

鉴于此，将网络应用于样本的结果应当是：

如上面所讨论的，神经网络模型510能够学习使用可学习因子β来缩放其输出。这个缩放因子能够被移到网络之外。另外，真实的噪声和估计与模拟的噪声和估计是不相关的，并且我们能够假定它们的均值为零。

因此我们能够得到：

这大致等于：

基于该模型，如上面所讨论的，网络将固有地学习针对可学习因子β的合适值，这将使函数的代价项最小化。因此，在模型中使用的可学习因子β的最佳值将不会引起随后完全移除噪声，因为这不是将使仅与用于训练的模拟噪声相关的代价函数部分最小化的β值。由网络基于输入图像预测的噪声改为通过因子β<1.0来进行缩放。

基于此，如果针对调谐变量的第一值λ(对于这个特定的代价函数，λ将是1.0)不完全地移除了残差，并且我们的去噪的最终输出是输出＝输入–λ*残差，那么我们将第二值分配给调谐变量λ，使得λ>＝1.0。

如果我们假设在重建之前不对原始数据应用进一步的去噪，那么我们能够针对给定训练场景估计β的值：

然后，我们能够将其剪裁为剂量分数α(即，用于模拟比原始剂量水平更低的剂量水平的因子)，以便在训练期间使用的CT图像中获得更多的噪声，在这种情况下：

因此，被最小化的代价函数是：

以这种方式，对于1-α，可学习因子β被最小化，其中，α是用于训练的剂量因子。然后通过来计算用于增大预测的噪声减法的最优调谐变量λ，它以乘法方式补偿可学习因子β。因此，如果α是0.5，那么针对调谐变量/>的最优值是2，而如果α是0.25，那么针对的最优值是1.33。

图6是根据本公开内容的一个实施例的方法的流程图。

在根据一个实施例的示例性方法中，在图6的601中，可以将对象的初始图像311提供给处理设备100。初始图像311通常具有至少一些自然噪声315。然后，在图6的603中，可以将模拟噪声317添加到对象的初始图像311以生成有噪声的图像313。模拟噪声317通常采取与初始图像中已经存在的自然噪声315相同或相似的形式。

然后，在添加了模拟噪声317之后，在图6的605中，可以通过使用初始图像311作为真实情况来在有噪声的图像313上训练神经网络模型510。用于优化使用神经网络生成的神经网络模型510的代价函数通常包括能够用于在训练期间使函数值最小化的调谐变量。然后，在图6的607中，可以识别或接收神经网络模型510中的针对调谐变量的第一值513。第一值513是使代价函数最小化的值，因此通过训练过程来自动生成。

通常，训练神经网络模型510的方法的第一部分可以重复多次。因此，步骤601-605可以用不同的初始图像来重复多次。随着时间的推移，当训练方法试图使代价函数最小化时，可以在607中识别第一值513。注意，随着额外的训练图像变得可用，该方法可以继续重复步骤601-605，从而改善和细化针对第一值513的选定值。

在识别了针对调谐变量的第一值513之后，可以寻找第二值515，以便调谐模型并改善神经网络模型510的输出。在一些实施例中，神经网络模型510可以在训练期间识别第二值515。在其他实施例中，例如，如图6所示，在609处，经训练的神经网络模型510可以识别要提供给用户或实现该模型的系统的潜在的第二值的范围。

然后，在图6的611中，可以将第二值515分配给调谐变量。这可以在被网络模型510本身选择之后发生，或者在被用户选择之后发生。通常，选择第二值515或从中提取第二值的范围，使得神经网络模型510在应用第二值515时比在应用第一值513时在图像中识别出更多的噪声。以这种方式，使用第二值515来识别要从图像中移除的噪声会使得比使用第一值513时的情况移除更多的噪声。

在一个实施例中，在图6的613中，可以通过使用针对经调谐的调谐变量的第二值515将经训练的神经网络模型510应用于对象的有噪声的图像313，以预测正被评估的有噪声的图像313中的噪声。这可以允许与最初提供的真实情况图像311相比而评估神经网络模型510的有效性。在另一实施例中，在图6的613中，可以使用针对经调谐的调谐变量的第二值515将经训练的神经网络模型510应用于对象的初始图像311，以预测初始图像311中的噪声，从而评估神经网络模型510在原始提供的图像中的功效。

在一些实施例中，可以公式化地选择第二值515，或者从公式化地确定的范围中选择第二值515，如上面所讨论的那样。这种选择的基础可以包括例如用于模拟被添加到训练数据中的额外噪声的剂量因子。

然后，在图6的615中，基于所得到的图像(即，干净的或去噪的图像315)来评估经训练的神经网络模型510。在一个示例中，可以例如通过在初始图像311中生成噪声图像并从有噪声的图像313中减去噪声图像来进行图像315的生成。

图6的方法示出了在步骤601-605中训练神经网络模型510的一次迭代。如上面所讨论的，这些最初的几个步骤可以重复多次，随后是该方法中所示的调谐过程。正因如此，应当理解，执行许多次这样的迭代，每次迭代都包括成对的真实情况图像311、331和其中已经添加了模拟噪声的对应的有噪声的图像313、333。在这些图像的每幅图像中，可以模拟在有噪声的图像中模拟的噪声317、337，使得它采取与对应的真实情况图像中的噪声315、335相同的形式。以这种方式，可以以神经网络模型510无法区分真实情况图像311、331中的噪声315、335与对应的有噪声的图像313、333中的对应的模拟噪声317、337的方式来训练神经网络模型510。

在一些实施例中，可以将真实情况图像311、331中的噪声315、335所采取的形式故意选择为彼此不同，使得可以将神经网络模型510训练为识别医学成像中常见的各种潜在的噪声模式。

图7是根据本公开内容的另一实施例的用于对图像进行去噪的方法的流程图。

在根据一个实施例的示例性方法中，在图7的701中，可以接收通过使用辐射源208和探测由源208发射的辐射的辐射敏感探测器210而获得的对象的断层摄影投影数据209。在703处，使用断层摄影投影数据209来形成要使用经训练的神经网络进行去噪的图像391。然后，在705中，可以将待去噪的图像391提供给处理设备100。

在707中，接收经训练的神经网络模型510(例如，上面讨论的网络模型)，经训练的神经网络模型510被配置为预测对象的图像中的噪声。在709中，可以识别或接收神经网络模型510中的针对调谐变量的第一值513。调谐变量的第一值513是在网络模型训练期间使用的使训练代价函数最小化的针对调谐变量的值。应当理解，对第一值513的识别可以通过向实施去噪方法的系统提供这样的值来进行，或者可以通过简单地提供其中存在第一值513的网络模型来进行，并且第一值513是在训练期间被确定的，并且其中，在使用神经网络模型510期间要应用的第二值515以所描述的方式不同于第一值。

因此，在711中，可以选择不同于第一值513的调谐变量的第二值515。该第二值515不同于在训练期间使神经网络模型510的代价函数最小化的第一值513，并且被选择为使得通过使用第二值515在有噪声的图像中识别或预测的噪声比通过使用第一值513预测的噪声更多。

然后，在图7的713中，通过使用针对经调谐的调谐变量的第二值515将经训练的神经网络模型510应用于对象的图像391，以对图像391进行去噪。然后，在图7的715中，经训练的神经网络模型510可以生成干净的或去噪的图像315，可以将所述干净的或去噪的图像315输出给用户。可以通过以下操作来生成干净的图像：在有噪声的图像391中生成预测的噪声的图，然后从该图像中减去噪声；或者替代地，从图像中直接移除识别的噪声。

在一些实施例中，将针对调谐变量的实际第二值515连同神经网络模型510一起提供给用户，使得第二值是模型的理想化值。在其他实施例中，可以提供潜在的第二值515的范围，使得用户或实施该模型的系统可以针对特定图像391或正被分析的场景选择理想化的第二值。

应当理解，虽然在CT扫描图像的背景下描述了本文描述的方法，但是也可以预想到各种成像技术(包括各种医学成像技术)，并且使用本文描述的方法能够有效地对使用各种各样的成像技术生成的图像进行去噪。

根据本公开内容的方法可以作为计算机实施的方法在计算机上实施，或者在专用硬件中实施，或者在这两者的组合中实施。根据本公开内容的方法的可执行代码可以被存储在计算机程序产品上。计算机程序产品的示例包括存储设备、光学存储设备、集成电路、服务器、在线软件等。优选地，计算机程序产品可以包括被存储在计算机可读介质上的非瞬态程序代码，所述非瞬态程序代码用于在所述程序产品在计算机上被运行时执行根据本公开内容的方法。在实施例中，计算机程序可以包括计算机程序代码，所述计算机程序代码适于当计算机程序在计算机上运行时执行根据本公开内容的方法的所有步骤。计算机程序可以被实施在计算机可读介质上。

虽然已经关于所描述的若干实施例以一定的长度和一定的特殊性描述了本公开内容，但是这并不旨在将本公开内容限制到任何这样的细节或实施例或任何特定的实施例，而是应当参照所附权利要求来解释本公开内容，以便鉴于现有技术提供对这些权利要求的最广泛的可能解读，并且因此有效地涵盖本公开内容的预期范围。

本文记载的所有示例和条件语言均旨在用于教学目的，以帮助读者理解本公开内容的原理和发明人为进一步发展本领域所贡献的构思，并且应被解释为不限于这些具体记载的示例和条件。此外，本文记载本公开内容的原理、方面和实施例的所有陈述及其具体示例旨在涵盖其结构和功能等同物。另外，本文旨在使这样的等同物包括当前已知的等同物以及将来开发的等同物，即，开发的执行相同功能的任何元件，而不管结构如何。

Claims

1.一种用于训练和调谐神经网络模型的方法，包括：

提供对象的初始图像，所述初始图像包含自然噪声；

将模拟噪声添加到所述对象的所述初始图像以生成有噪声的图像，所述模拟噪声采取与所述初始图像中的所述自然噪声相同的形式；

通过使用所述初始图像作为真实情况来在所述有噪声的图像上训练神经网络模型，其中，在所述神经网络模型中，提取或生成调谐变量，所述调谐变量定义在使用期间被移除的噪声的量；

识别针对所述调谐变量的第一值，所述第一值使针对所述初始图像的训练代价函数最小化；并且

将第二值分配给所述调谐变量，所述第二值不同于所述第一值，其中，所述神经网络模型在使用所述第二值时比使用所述第一值时在所述有噪声的图像中识别出更多的噪声。

2.根据权利要求1所述的方法，还包括：提供对象的多幅额外初始图像；将所述模拟噪声添加到所述初始图像中的每幅初始图像以形成多幅额外的有噪声的图像，其中，所述模拟噪声采取与所述多幅额外初始图像的每幅额外初始图像中的所述自然噪声相同的形式；并且通过使用对应的初始图像作为真实情况来在所述额外的有噪声的图像中的每幅额外的有噪声的图像上训练所述神经网络模型。

3.根据权利要求2所述的方法，其中，所述额外初始图像中的至少一幅额外初始图像中的所述自然噪声的形式不同于所述初始图像中的所述自然噪声的形式。

4.根据权利要求1所述的方法，还包括：将具有针对所述调谐变量的所述第二值的经训练的神经网络模型应用于待去噪的二次图像。

5.根据权利要求1所述的方法，还包括：向用户提供所述经训练的神经网络模型，并且为所述调谐变量提供潜在的第二值的范围。

6.根据权利要求1所述的方法，其中，所述神经网络模型在所述初始图像中生成噪声图像，并且从所述有噪声的图像中减去所述噪声图像以生成干净的图像。

7.根据权利要求1所述的方法，其中，所述调谐变量是缩放因子，所述缩放因子确定有多少由所述神经网络模型识别的噪声将被移除。

8.一种去噪方法，包括：

执行根据权利要求1所述的方法；

通过使用针对所述调谐变量的所述第二值来将经训练的神经网络模型应用于所述对象的有噪声的图像，以预测所述有噪声的图像中的噪声；并且

从所述有噪声的图像中移除预测的噪声以生成去噪图像。

9.根据权利要求8所述的方法，还包括：向用户输出所述去噪图像。

10.根据权利要求8所述的方法，还包括：

接收通过使用辐射源和用于探测由所述辐射源发射的辐射的辐射敏感探测器而获得的对象的断层摄影投影数据；并且

基于所述断层摄影投影数据来生成所述对象的待去噪的图像。

11.一种神经网络训练和调谐系统，包括：

存储器，其存储多个指令；

处理器电路，其耦合到所述存储器并被配置为运行所述指令以：

提供对象的初始图像，所述初始图像包含自然噪声；

12.根据权利要求11所述的系统，其中，所述处理器电路还被配置为：

提供对象的多幅额外初始图像；

将所述模拟噪声添加到所述初始图像中的每幅初始图像以形成多幅额外的有噪声的图像，其中，所述模拟噪声采取与所述多幅额外初始图像的每幅额外初始图像中的所述自然噪声相同的形式；并且

通过使用对应的初始图像作为真实情况来在所述额外的有噪声的图像中的每幅额外的有噪声的图像上训练所述神经网络模型。

13.根据权利要求12所述的系统，其中，所述额外初始图像中的至少一幅额外初始图像中的所述自然噪声的形式不同于所述初始图像中的所述自然噪声的形式。

14.一种去噪系统，包括：

根据权利要求12所述的神经网络训练和调谐系统；

其中，所述处理器电路还被配置为运行所述指令以：

从所述有噪声的图像中移除预测的噪声以生成去噪图像。

15.根据权利要求14所述的系统，还包括成像设备，所述成像系统被配置为：

接收通过使用辐射源和用于探测由所述源发射的辐射的辐射敏感探测器而获得的对象的断层摄影投影数据；并且

基于所述断层摄影投影数据来生成所述对象的初始图像。