具体实施方式
尽管在此已经示出和描述了本发明的各种实施方式,但是对于本领域技术人员容易理解的是,这些实施方式仅以示例的方式提供。在不脱离本发明的情况下,本领域技术人员可以想到许多变化、改变和替代。应当理解,可以采用本文所述的本发明的实施方式的各种替代方案。
镓基对比剂(GBCA)被广泛用于磁共振成像(MRI)检查中,并且在包括血管造影术、多发性硬化和肿瘤检测的多种应用中,对于监测治疗和研究病理学是必不可少的。最近,在大脑和体内的镓沉积延长的识别,已引起人们对使用GBCA的安全性的担忧。减少GBCA剂量可减少沉积程度,但也会减少对比度增强和肿瘤显眼性。因此,保留对比剂增强作用的减少剂量检查与需要重复进行对比剂给药(例如,多发性硬化症患者)以及镓沉积的高风险(例如,儿童)的患者非常相关。
尽管本文主要提供了基于MRI、镓基对比剂、MRI数据示例,但应理解,本方法可用于其他成像方式环境和/或其他对比增强的成像中。例如,目前描述的方法可用于其他类型的断层扫描仪获取的数据,包括但不限于计算机断层扫描(CT)、单光子发射计算机断层扫描(SPECT)扫描仪、正电子发射断层扫描(PET)、功能磁共振成像(fMRI)或各种其他类型的成像扫描仪或技术,其中可以使用对比剂来增强对比度。
深度学习(DL)框架已被用于减少GBCA剂量水平,同时又保持了体积MRI的图像质量和对比度增强。作为示例,DL模型可以使用U-net编码器-解码器架构来增强来自低剂量对比度图像的图像对比度。但是,常规的DL模型可能只适用于来自单个临床部位的扫描,而不考虑具有不同临床工作流程的不同部位的通用性。此外,常规的DL模型可能评估3D体积中单个2D切片的图像质量,即使临床医生经常需要体积图像以从各种角度或取向可视化复杂的3D增强结构(例如血管和肿瘤)。
本公开提供了可以解决常规系统的各种缺点的系统和方法,包括上面所认识的那些。本公开的方法和系统能够在实际临床设置中改进模型的鲁棒性和部署。例如,所提供的方法和系统能够适应于不同的临床部位,每个部位具有不同的MRI扫描仪硬件和成像协议。另外,所提供的方法和系统可以提供改进的性能,同时保留多平面重新格式化(MPR)能力以维持临床医生的工作流程并实现复杂增强的微结构的斜向可视化。
本文的方法和系统可以提供对DL模型的增强,以解决临床设置中的现实世界中的可变性。DL模型是在来自不同医院,跨不同MRI平台,具有不同扫描平面、扫描时间和分辨率以及具有不同GBCA给药机制的患者扫描中进行训练和测试的。在这些设置中,可以通过跨数据异构性改进通用性来改进DL模型的鲁棒性。
多平面重新格式化(MPR)
在常规的DL管道中,可以使用标准2D数据增强(例如旋转和翻转)分别处理和训练来自3D体积的2D切片。2D模型的选择通常受训练期间的存储器限制以及推断(inference)期间的性能要求的激励。在一些情况下,DL框架可以以“2.5D”方式处理数据,其中将多个相邻切片输入到网络中,并预测中心切片。但是,2D和2.5D处理都可能忽略采集的真实体积性质。由于3D体积通常在临床工作流程中重新格式化为任意平面(例如,斜视图,来自与扫描平面/取向倾斜的取向/角度的视图),并且部位可能会使用不同的扫描取向作为其MRI协议的一部分,2D处理可能导致在重新格式化的体积图像中出现带有条纹伪像的图像(例如,重新格式化为与扫描平面正交的平面)。
本文描述的方法和系统可以有益地消除重新格式化图像中的伪像(例如,条纹伪像),从而通过减少的对比剂量来增强图像质量。如上所述,在标准临床工作流程中,常见的是将3D体积图像重新格式化以在多个平面(例如,正交或倾斜平面)中查看图像。在一些情况下,尽管训练模型以增强2.5D图像可以减少采集平面中的条纹伪像,但重新格式化为其他取向仍可能导致条纹伪像。本文所述的方法和系统可以实现在任何选定平面或观察方向(例如,斜视图)上的无伪像的可视化。另外,可以训练模型以学习复杂或复杂的3D增强结构,例如血管或肿瘤。
图1示出了用于处理和重构MRI体积图像数据的工作流程的示例。如示例中所示,输入图像110可以是在没有对比剂的情况下(例如,对比前图像切片101)和/或在减少的对比剂量下(例如,低剂量图像切片103)获取的图像切片。在一些情况下,原始输入图像可以是2D图像切片。例如,U-net编码器-解码器111模型的深度学习(DL)模型可用于预测推断结果112。尽管DL模型111可以是经过训练以在每个切片内产生增强图像的2D模型,但是它可能会跨切片产生不一致的图像增强,例如图像重新格式化中的条纹伪像。例如,当推断结果被重新格式化113以在正交方向114上产生重新格式化图像时,由于输入的2D图像110与扫描平面匹配,所以重新格式化图像114可能包含例如在正交方向上的条纹伪像的重新格式化伪像。
通过采用多平面重新格式化(MPR)方法120并使用2.5D训练模型131可以减轻这种重新格式化伪像。MPR方法可以在多个取向上有益地增加输入的体积数据。如图1所示,选定数量的对比前或低剂量图像110的输入切片可以在通道方向上堆叠以创建2.5D体积输入图像。用于形成2.5D体积输入图像的输入切片的数量可以是任何数量,例如可以堆叠至少两个、三个、四个、五个、六个、七个、八个、九个、十个切片。在一些情况下,可以基于感兴趣区域中的生理或生物化学上重要的结构,例如其中非常需要没有伪像的体积图像的微观结构,来确定输入切片的数量。例如,可以选择输入切片的数量,使得微观结构(例如,血管或肿瘤)可以主要包含在输入的2.5D体积图像中。替代地或附加地,切片的数量可以基于经验数据确定或由用户选择。在一些情况下,可以根据计算系统的计算能力和/或存储器存储来优化切片的数量。
接下来,可以将输入的2.5D体积图像重新格式化为多个轴,例如主轴(例如矢状、冠状和轴向),以产生多个重新格式化的体积图像121。用于重新格式化2.5D体积图像的多个取向可以在不需要与主轴对齐的任何合适方向上。另外,用于重新格式化体积图像的取向的数量可以是大于1、2、3、4、5等的任何数量,只要多个重新格式化的体积图像中的至少一个沿着与扫描平面倾斜或垂直的取向即可。
在推断阶段,可以将多个重新格式化的体积图像中的每一个旋转一系列角度以产生多个旋转的重新格式化体积图像122,从而进一步增强输入数据。例如,三个重新格式化的体积图像121(例如,矢状、冠状和轴向)中的每一个都可以在0-90°之间旋转五个等距角,从而产生15个体积图像122。应该注意角度步长和角度范围可以在任何合适的范围内。例如,角度步长可能不是恒定的,旋转角度的数量可能会根据不同的应用程序、情况或部署方案而变化。在另一个示例中,可以在大于、小于或部分重叠0-90°的任何角度范围内旋转体积图像。旋转角度的数量对预测的MPR图像的影响将在后面描述。
然后,可以将多个旋转的体积2.5D图像122馈送到2.5D训练模型131进行推断。2.5D训练模型的输出包括多个对比度增强的2.5D体积图像。在一些情况下,被称为“MPR重构”的最终推断结果132可以是旋转回到原始采集/扫描平面之后的多个对比度增强的2.5D体积图像的平均值。例如,可以将15个增强的2.5D体积图像旋转回以与扫描平面对准,并且这种体积图像的平均值是MPR重构或最终推断结果132。可以旋转多个预测的2.5D体积图像以将其对准原始扫描平面或相同取向,从而可以计算多个2.5D体积图像的平均值。多个增强的2.5D立体图像可以被旋转以与可能在原始扫描平面中或可以不在原始扫描平面中的相同方向对准。MPR重构方法有利地允许将3D上下文添加到网络,同时受益于2D处理的性能提升。
如图1所示,当将MPR重构图像132重新格式化133为与原始获取平面正交的平面时,重新格式化图像135不存在条纹伪像。可以通过例如峰值信噪比(PSNR)和结构相似度(SSIM)的定量图像质量度量来量化预测的MPR重构图像的质量。针对常规模型111和提出的模型131计算图像质量度量,并且在图3中图示了示出重新格式化图像114、135和真实(ground truth)140的质量的结果的示例。
数据采集
在示例中,在IRB批准和患者同意下,扫描协议在两个站点中实施。图2示出了从这两个站点收集的数据的示例。从站点1招募了24个患者(16个培训,8个测试),从站点2招募了28个患者(23个培训,5个测试)。扫描仪硬件和协议之间的差异在表1中突出显示。特别是,两个站点使用了不同的扫描仪硬件,并且扫描协议具有很大的可变性。值得注意的是,站点1使用动力注射来给药GBCA,而站点2使用手动注射,从而导致增强时间和强度的差异。
作为收集用于训练模型的数据的示例,可以执行具有减小的剂量水平的多次扫描以及全剂量扫描。具有减少的剂量水平的多次扫描可以包括例如低剂量(例如,10%)的对比剂增强的MRI,并且可以执行对比前(例如,零对比度)。例如,对于每个参与者,均获得了两个3D T1加权图像:对比前和对比后10%的剂量对比(0.01mmol/kg)。为了进行培训和临床验证,将剩余的90%的标准对比剂量(全剂量当量,100%剂量)给药,并获得第三3D T1加权图像(100%剂量)。执行信号归一化以消除可能导致跨不同扫描仪平台和医院站点的不同采集之间的信号强度变化的系统差异(例如,发射和接收增益)。然后,执行剂量前、10%剂量和100%剂量图像之间的非线性仿射共配。DL模型使用U-Net编码器-解码器体系结构,其基本假设是将对比前图像和低剂量对比增强图像之间的对比相关信号非线性缩放为全剂量对比图像。另外,可以将来自其他对比度(例如T2和T2-FLAIR)的图像包括作为输入的一部分,以改进模型预测。
图5示出了用于为图2、图3和图10至图12所示的研究或实验收集数据的扫描过程或扫描协议500的示例。在图示的扫描协议中,每个患者在单次成像过程中进行了三次扫描。扫描1是对比前3D T1加权MRI,然后是扫描2,具有标准剂量0.1mmol/kg的10%。来自扫描1和扫描2的图像用作DL网络的输入。在对其余90%的对比剂量进行给药(即全剂量)后,从扫描3获得了真实图像。
在推断期间,在部署所提供的系统之后,仅可以执行一次没有对比剂的扫描(例如,与扫描1类似),或者可以执行对比剂剂量减少的扫描(例如,与扫描2类似)。然后,可以由训练的模型来处理这种输入图像数据,以输出具有增强的对比度的预测的MPR重构图像。在一些情况下,在将模型部署到临床部位之后,可以允许用户(例如,医师)选择减少的剂量水平,该减少的剂量水平可以是0%至30%范围内的任何水平,以获取医学图像数据。应该注意的是,取决于实际实施和用户期望的剂量减少水平,减少的剂量水平可以是大于30%的范围内的任何数量。
站点间通用性
可以通过使用相同的扫描协议评估来自单个站点的患者来限制常规模型。在实际的临床环境中,每个站点都可以基于扫描仪硬件的能力和标准过程来定制其协议。例如,在站点2上训练的模型在站点1的案例中可能表现不佳(图2,中间)。
所提供的DL模型可以具有改进的通用性。可以使用专有训练管道来训练DL模型。例如,训练管道可以包括首先将每个图像缩放到1mm3的标称分辨率和256×256的平面内矩阵尺寸,然后应用MPR处理。由于DL模型是完全卷积的,因此可以在不重新采样的情况下以采集的原始分辨率运行推断。
基于定性和定量结果,MPR处理、分辨率重采样和站点间训练的添加导致模型的鲁棒性和通用性大大改进。在可选实施方式中,模型可以是完全的3D模型。例如,模型可以是基于3D补丁的模型,其可以减轻MPR处理和存储器使用。所提供的训练方法和模型框架可以应用于具有不同扫描仪平台和/或跨不同的MRI供应商的不同站点。
网络架构和流程
图6示意性地图示了与使用常规方法611预测的MRI图像相比具有改进质量的MPR重构图像624的另一示例。用于处理和重构MRI体积图像数据623和重新格式化的MPR重构图像624的工作流600可以与如图1所述的相同。例如,输入图像610可以包括多个2D图像切片,其在没有对比剂的情况下(例如,对比前图像切片)和/或在减小的对比剂量的情况下(例如,低剂量图像切片)获取。可以在扫描平面(例如,轴向)中或沿着扫描取向来获取输入图像。堆叠选定数量的图像切片以形成2.5D体积输入图像,其使用多平面重构(MPR)方法620进行进一步处理,如上所述。
例如,可以将输入的2.5D体积图像重新格式化为多个轴(例如主轴(例如,矢状、冠状和轴向)),以产生多个重新格式化的体积图像(例如,SAG、AX、COR)。应当注意,可以将2.5D立体图像重新格式化为可以与主轴对准或可以不与主轴对准的任何取向。
多个重新格式化的体积图像中的每一个可以旋转一系列角度以生成多个旋转的重新格式化图像。例如,三个重新格式化的体积图像(例如,矢状、冠状和轴向)中的每一个都可以在0-90°之间旋转五个角度,从而产生15个旋转的重新格式化体积图像。多个重新格式化的体积图像(例如,矢状、冠状和轴向)可以以相同的角度旋转或可以不以相同的角度旋转或旋转为相同数量的取向或不旋转为相同数量的取向。
然后,可以由训练的模型621处理多个旋转的体积图像122,以生成多个增强的体积图像。在一些情况下,MPR重构图像623或推断结果图像是旋转回原始采集平面后多个推断体积的平均。当将MPR重构图像重新格式化以在选定的方向(例如,垂直于/倾斜于扫描平面)观看时,与使用单一推断方法611和/或单一推断模型获得的重新格式化图像相比,重新格式化图像624可能不包含条纹伪像。
网络架构和数据处理
使用多平面重构(MPR)技术,可以用例如来自多个取向(例如,三个主轴)的体积图像(例如,增强的2.5D图像)训练深度学习模型。该模型可以是训练的深度学习模型,用于增强使用减少的对比剂量获取的体积MRI图像的质量。在一些实施方式中,该模型可以包括可以采用任何类型的神经网络模型的人工神经网络,例如前馈神经网络、径向基函数网络、递归神经网络、卷积神经网络、深度残差学习网络等。在一些实施方式中,机器学习算法可以包括深度学习算法,例如卷积神经网络(CNN)。机器学习算法的示例可以包括支持向量机(SVM)、朴素贝叶斯分类、随机森林、深度学习模型(例如神经网络)或其他监督的学习算法或无监督的学习算法。模型网络可以是可包括多个层的深度学习网络,例如CNN。例如,CNN模型可以至少包括输入层、多个隐藏层和输出层。CNN模型可以包括任何总数的层以及任何数量的隐藏层。神经网络的最简单架构始于输入层,然后是一系列中间层或隐藏层,最后是输出层。隐藏的或中间的层可以充当可学习的特征提取器,而在该示例中的输出层提供具有增强的质量(例如,增强的对比度)的2.5D立体图像。神经网络的每一层可以包括多个神经元(或节点)。神经元接收直接来自输入数据(例如,低质量图像数据,以减小的对比剂量获取的图像数据等)或其他神经元的输出的输入,并执行特定的操作,例如求和。在一些情况下,从输入到神经元的连接与权重(或加权因子)相关联。在一些情况下,神经元可以总结所有输入对及其相关权重的乘积。在一些情况下,加权和被偏置。在一些情况下,可以使用阈值或激活函数来控制神经元的输出。激活函数可以是线性的或非线性的。激活函数可以是例如整流线性单元(ReLU)激活函数或其他函数,例如饱和双曲线正切、恒等式、二元阶跃、逻辑、arcTan、softsign、参数整流线性单元、指数线性单元、softPlus、弯曲恒等式,softExponential、Sinusoid、Sinc、高斯、Sigmoid函数或其任何组合。
在一些实施方式中,网络可以是编码器-解码器网络或U-net编码器-解码器网络。U-net是自动编码器,其中来自网络的一半编码器的输出与网络的一半解码器中的镜像副本联结在一起。U-net可以通过对操作符进行上采样来代替池化操作,从而改进输出的分辨率。
在一些实施方式中,可以使用监督学习来训练用于增强体积图像质量的模型。例如,为了训练深度学习网络,可以提供来自多个受试者、扫描仪、临床站点或数据库的成对的对比前和低剂量图像作为输入并且全剂量图像作为真实。
在一些情况下,可以在训练或推断之前对输入数据集进行预处理。图7示出了根据本文的一些实施方式的预处理方法700的示例。如示例中所示,可以依次预处理包括原始对比前、低剂量和全剂量图像(即,真实)的输入数据,以产生预处理图像数据710。可以从标准的临床工作流程,例如基于DICOM的软件应用或其他成像软件应用接收原始图像数据。作为示例,可以使用如图5中所述的扫描协议来获取输入数据701。例如,可以进行三个扫描,包括具有零对比剂的第一扫描,具有减少剂量水平的第二扫描和具有全剂量的第三扫描。但是,用于训练模型的减少剂量图像数据可以包括以各种减少剂量水平获取的图像,例如不超过1%、5%、10%、15%、20%、大于20%或低于1%的任何数,或介于两者之间的任何数。例如,输入数据可以包括从两次扫描获取的图像数据,两次扫描包括作为真实数据的全剂量扫描和以减小的水平的成对的扫描(例如,零剂量或如上所述的任何水平)。可替代地,可以使用多于三个的扫描来获取输入数据,其中在不同剂量的对比剂量下进行多次扫描。另外,输入数据可以包括从模拟获得的增强数据集。例如,来自临床数据库的图像数据可用于产生低质量图像数据,该低质量图像数据模仿以减少的对比剂量获取的图像数据。在示例中,可以将伪像添加到原始图像数据以模仿从以减少的对比剂量获取的图像重构的图像数据。
在所示的示例中,可以执行预处理算法(例如,颅骨剥离703),以通过使用基于DL库从颅外和非脑组织中消除信号来将大脑图像与颅骨或非脑组织分离。基于组织、器官和使用应用,可以采用其他合适的预处理算法来改进处理速度和诊断准确性。在一些情况下,为了考虑到三个扫描之间的患者运动,可以将低剂量和全剂量图像共同配准到对比前图像705。在一些情况下,假定对于不同的采集中发射和接收增益可能会有所不同,可以通过直方图均衡707来执行信号归一化。可以在对比前、低剂量和全剂量之间执行相对强度缩放以用于扫描内图像归一化。由于多机构数据集包含具有不同体素和矩阵大小的图像,因此可以将3D体积内插为0.5mm3的各向同性分辨率,并且在适用的情况下,将每个切片处的零填充图像内插为512×512的尺寸。图像数据可能具有足够高的分辨率,以使DL网络能够学习小的增强结构,例如病变和转移。在一些情况下,缩放和配准参数可以在颅骨剥离的图像上估计,然后应用于原始图像709。从颅骨剥离的脑估计的预处理参数可以应用于原始图像以获得预处理图像体积710。
接下来,预处理的图像数据710用于训练编码器-解码器网络以重构对比度增强的图像。可以假设全剂量下的对比度信号是低剂量和对比前图像之间的噪声对比度吸收的非线性缩放版本,从而对网络进行训练。该模型可能未明确要求低剂量和对比前之间的差异图像。
图8示出了根据本文一些实施方式的U-Net风格的编码器-解码器网络架构800的示例。在所示的示例中,每个编码器块均具有三个2D卷积层(3×3),其具有ReLU,之后是maxpool(2×2),以将特征空间下采样两倍。解码器模块具有类似的结构,其中maxpool替换为上采样层。为了恢复在下采样期间丢失的空间信息并防止分辨率损失,使用跳过连接将解码器层与相应编码器层的功能联结在一起。可以使用L1(平均绝对误差)和结构相似性指数(SSIM)损失的组合来训练网络。这种U-Net样式的编码器/解码器网络体系结构可能能够在低剂量和零剂量之间生成10倍的线性比例的对比度吸收,而不会与增强信号一起拾取噪声。
如图8所示,到网络的输入数据可以是使用如上所述的MPR方法产生的多个增强的体积图像。在该示例中,每个对比前和低剂量图像的七个切片在通道方向上堆叠以创建14通道输入体积数据,用于训练模型以预测中央全剂量切片803。
增强和加权的L1损失
在一些情况下,即使在应用信号归一化和缩放后,低剂量图像和对比前图像之间的差异也可能具有类似增强的噪声扰动,这可能会误导网络的训练。为了使网络更加关注实际的增强区域,可以使用增强掩码(enhancement mask)对L1损耗进行加权。掩码本质上是连续的,并且是根据低剂量图像和对比前图像之间的颅骨剥离差异(在0和1之间进行归一化)计算的。增强掩码可以视为对比度吸收的归一化平滑形式。
感知损失和对抗损失
期望训练网络以专注于增强以及高频和纹理细节方面的结构信息,这对于做出可靠的诊断决策至关重要。L1和结构相似性索引(SSIM)损耗的简单组合可能趋于抑制高频信号信息,并且获得的结果可能具有更平滑的外观,这被认为是图像分辨率的损失。为了解决这个问题,来自卷积网络(例如,由19层组成的VGG-19网络,包括6个卷积层、3个完全连接层、5个MaxPool层和1个在ImageNet数据集上经过预训练的SoftMax层)引起的感知损失被采用。感知损失在样式转移和超分辨率任务中有效。例如,可以通过在真实和预测上获取层激活的均方误差(MSE),根据VGG-19网络的第三块(例如,block3 conv3)的第三卷积层计算出感知损失。
在一些情况下,为了进一步改进总体感知质量,通过与编码器-解码器网络并行训练的鉴别器引入对抗损失,以预测产生的图像是真实的还是伪造的。图9示出了根据本文一些实施方式的鉴别器900的示例。鉴别器900具有一系列具有漏ReLU激活的光谱归一化卷积层,并预测32×32色块。与预测二进制值(例如,伪造为0,真实为1)的传统的鉴别器不同,“色块鉴别器”900预测概率矩阵,这有助于训练过程的稳定性和更快的收敛。频谱归一化卷积层采用权重归一化技术进一步稳定鉴别器训练。如图9所示,色块鉴别器可以用MSE损失进行训练,并且可以将高斯噪声添加到输入中以实现平滑收敛。
用于配置网络模型的函数可以表述为:
G*=argminG[λGANLGAN(G)+λL1LL1(Menh.G)+λSSIMLSSIM(G)+λVGGLVGG(G)]
其中,Menh是增强掩码,并且对抗损失LGAN可以写为LGAN=maxDLGAN(G,D),其中G是U-Net产生器,D是色块鉴别器。损耗权重λL、λSSIM、λVGG和λGAN可以凭经验确定。利用上述过程和方法,训练了单个模型以对来自各种机构和扫描仪的图像进行准确的预测。
示例
图3示出了评估所提供模型的通用性和准确性的研究分析结果的示例。在所示的示例中,结果示出了对来自站点1的测试用例的真实性(左)、原始模型(中)和建议的模型(右)推断结果的比较(红色箭头示出了明显的缺陷)。仅在来自站点2的数据上训练了常规模型。该示例与图2所示的MRI扫描数据一致。在两个站点的数据上训练提供的模型,并使用了MPR处理和分辨率重采样。在这项研究中,结果定性地示出了MPR处理对测试集的一个示例的影响。通过平均许多MPR重构的结果,可以抑制表现为伪增强的条纹伪像。如图3所示,将一张真实对比度增强的图像(左)与来自在站点2上训练的模型(中间)以及在站点1和站点2上同时训练的模型(右)的推断结果进行比较。通过考虑分辨率的差异和其他协议偏差,所提供的模型证明了通用性方面的定量改进。对于所有常规模型和提出的模型,都计算了定量图像质量指标,例如峰值信噪比(PSNR)和结构相似性(SSIM)。传统模型和提出模型的测试集上的平均PSNR和SSIM分别为32.81dB(38.12dB)和0.872(0.951)。使用本公开中的方法和系统可以实现更好的图像质量。
在如图3所示的研究中,如本文其他地方所述的深度学习(DL)框架被应用于低剂量(例如,10%)的对比剂增强MRI。对于每位参与者,均获得了两个3D T1加权图像:对比前和对比后10%的剂量(0.01mmol/kg)。为了进行培训和临床验证,将剩余的90%的标准对比剂量(全剂量当量,100%剂量)给药,并获得第三3D T1加权图像(100%剂量)。进行信号归一化以消除可能导致跨不同扫描仪平台和医院站点的不同采集之间的信号强度变化的系统差异(例如,发射和接收增益)。然后,在剂量前、10%剂量和100%剂量的图像之间进行非线性仿射共同配准。DL模型使用了U-Net编码器-解码器体系结构,其基本假设是将对比前图像和低剂量对比增强图像之间的对比相关信号非线性缩放为全剂量对比图像。来自其他对比度(例如,T2和T2-FLAIR)的图像可以作为输入的一部分被包括,以改进模型预测。
作为结合图10至图13的实验的另一个示例,在图10中示出了来自三个机构、三个不同的制造商和八个不同的扫描仪模型的研究数据集的数据分布和异质性。这项研究回顾性识别了640名患者(323名女性;52±16岁),他们接受了来自三个机构、三个扫描仪制造商和八个扫描仪模型的临床脑部MRI检查,使用了不同的机构扫描协议,其包括不同的成像平面、场强、体素大小、矩阵大小、脂肪抑制的使用、对比剂和注射方法。临床指征包括疑似肿瘤、术后肿瘤随访、常规脑以及需要使用GBCA进行MRI检查的其他指征。每个受试者均接受3D对比前T1w成像,然后以10%(0.01mmol/kg)标准剂量(0.1mmol/kg)的低剂量对比增强T1w扫描。为了进行培训和评估,使用剩余的90%(0.09mmol/kg)的总剂量获得了第三3DT1w图像,其被认为是真实。所有三个获取均在一次成像过程中完成,与标准协议相比,患者未接受任何其他镓剂量。
在640个案例中,使用56个案例训练如图11所示的模型并使用13个验证案例对超参数进行了微调,并根据经验找到了损失权重的最佳组合。为了确保模型跨站点和供应商都能很好地泛化,培训和验证集由来自所有机构和扫描仪制造商的大约相等数量的研究组成(请参见图10)。其余571个案例被保留以进行测试和模型评估。该模型是使用带有Tensorflow后端的Keras在Python 3.5中实现的,并在Nvidia Tesla V100(SXM2 32GB)GPU上进行了100个时期的训练,批处理大小为8。模型优化使用Adam优化器进行,学习率为0.001。
使用多个指标对模型进行定量评估。峰值信噪比(PSNR)是像素差异的缩放形式,而结构相似性指数(SSIM)对局部结构的变化敏感,因此捕获预测图像相对于真实的结构方面。使用571个测试案例,使用PSNR和SSIM指标对模型进行了定量评估,这些指标是在真实的全剂量图像和合成图像之间进行计算的。将这些值与低剂量和全剂量图像之间的PSNR和SSIM值进行比较。还计算并比较了每个站点和每个扫描器指标,以证明模型通用性。
从测试集中,识别出来自具有不同类型和等级的肿瘤增强病例(术前或术后)的26名患者(13名男性;58±15岁)的图像的子集,并用于深入评估模型性能。就异质性而言,这些增强的肿瘤病例与训练数据集相似,并且使用与如图5所示相同的扫描协议获取。进行二进制评估,以发现增强模式是否一致,而没有任何假阳性或假阴性(以真实的全剂量图像为参考)。当存在时,合成图像中的图像伪像被记录,并且借助于所提供的模型证明图像伪像被减少。
为了进一步验证模型预测与全剂量真实相似,对26个增强肿瘤病例进行了自动肿瘤分割。应用模型的变体,仅使用对比后图像来分割肿瘤核心。根据分割模型的要求,将真实和预测的全剂量图像进行颅骨剥离,内插至1mm3分辨率并共同配准到解剖模板。通过计算真实的分段掩码和使用合成图像创建的掩码之间的预测肿瘤核心的Dice分数来执行评估。
图11示意性地图示了用于单调改进图像质量的系统和方法。示出了具有增强的额叶肿瘤的矢状采集的MR图像的示例。如面板a所示,可以在2.5D模型结果的轴向格式中看到垂直条纹,其由MPR训练和推断所固定,如面板b所示。如面板c所示,增加感知损失和对抗损失会进一步改进肿瘤内部的质地,并恢复总体感官质量。此外,如面板d所示,使用平滑增强掩码对L1损失进行加权可以使增强模式与真实相匹配。指标相对于真实的单调增加(如面板e所示)也图示了模型的改进。下表示出了针对26个肿瘤增强病例的每种建议技术解决方案的模型改进。
指标 |
UNet 2D(35) |
UNet 2.5D |
+MPR |
+VGG&GAN |
+增强掩码* |
PSNR(dB) |
31.84±4.88 |
32.38±4.67 |
33.56±5.19 |
34.28±4.88 |
35.22±4.79 |
SSIM |
0.88±0.06 |
0.89±0.06 |
0.90±0.06 |
0.92±0.05 |
0.93±0.04 |
图12示出了对比前、低剂量、全剂量的真实和合成图像,以及来自不同站点和扫描仪的病例的定量指标。指标表明,示出了使用建议的技术改进的模型的性能要优于原始模型(指标为31.84±4.88dB,0.88±0.06)。表现最佳的模型结合SSIM、感知、对抗和增强加权的L1损失使用MPR进行五次旋转。对于512×512×300的体积,在GeForce RTX 2080(16GB)GPU上,最佳模型的预处理和推断大约需要135秒。
图13示出了不同转数以及对图像质量和性能的相应影响的示例。如图13所示,MPR中的转角数量的影响提供了更大角度的角度可以减少肿瘤内部的水平条纹(更好的质量),同时还可以增加推断时间。当将训练的模型部署到物理站点时,可以基于期望的图像质量和部署环境(例如,计算能力、存储器存储等)来确定旋数和不同角度。
系统总览
所提供的用于低剂量对比增强MRI的DL框架能够减少用于对比增强MRI的GBCA剂量,同时保留图像质量并避免对比度增强的退化。DL模型的鲁棒性和通用性被改进,从而可以更好地适应跨异构患者和现场人群的各种应用。图4示意性地图示了其中可以实现本公开的成像增强器440的磁共振成像(MRI)系统400。MRI系统400可以包括磁体系统403、连接至磁体系统的患者运输台405以及可操作地耦合至磁体系统的控制器401。在一个示例中,患者可能躺在患者运输台405上,磁体系统403会绕过患者。控制器401可以控制由磁体系统403提供的磁场和射频(RF)信号,并且可以从磁体系统403中的检测器接收信号。
MRI系统400可以进一步包括计算机系统410和通过网络430可操作地耦合到控制器401的一个或多个数据库。计算机系统410可以用于实现体积MR成像增强器440。体积MR成像增强器440可以实现本文描述的DL框架和方法。例如,体积MR成像增强器可采用本文描述的MPR重构方法和各种其他训练算法以及数据处理方法。计算机系统410可以用于使用训练数据集产生成像增强器。尽管所示图将控制器和计算机系统示为单独的组件,但是控制器和计算机系统可以集成到单个组件中。
计算机系统410可以包括膝上型计算机、台式计算机、中央服务器、分布式计算系统等。处理器可以是硬件处理器,例如中央处理单元(CPU)、图形处理单元(GPU)、通用处理单元(可以是单核或多核处理器)、或用于并行处理的多个处理器。处理器可以是任何合适的集成电路,例如计算平台或微处理器、逻辑设备等。尽管参考处理器描述了本公开内容,但是其他类型的集成电路和逻辑设备也可适用。处理器或机器可能不受数据操作能力的限制。处理器或机器可以执行512位、256位、128位、64位、32位或16位数据操作。
MRI系统400可以包括一个或多个数据库420,该一个或多个数据库420可以利用任何合适的数据库技术。例如,结构化查询语言(SQL)或“NoSQL”数据库可用于存储重构/重新格式化的图像数据、原始收集数据、重构的图像数据、训练数据集、训练的模型(例如超参数)、权重系数、旋转角度、旋转数、重新格式化的方向等。一些数据库可以使用各种标准数据结构来实现,例如阵列、哈希、(链接的)列表、结构、结构化文本文件(例如,XML)、表格、JSON、NOSQL等。这样的数据结构可以存储在存储器和/或(结构化)文件中。在另一个替代方案中,可以使用面向受试者的数据库。受试者数据库可包含许多受试者集合,这些受试者集合通过通用属性分组和/或链接在一起;它们可能通过一些公共属性与其他受试者集合相关。面向受试者的数据库的执行类似于关系数据库,不同的是受试者不仅是数据片段,而且还可能具有封装在给定受试者中的其他类型的功能。如果本公开内容的数据库被实现为数据结构,则本公开内容的数据库的使用可以被集成到另一个组件中,例如本发明的组件。而且,数据库可以实现为数据结构、受试者和关系结构的混合。数据库可以通过标准数据处理技术进行整合和/或分布。数据库的部分,例如表格,可以被导出和/或导入,从而分散和/或集成。
网络430可以在MRI平台中的组件之间建立连接以及MRI系统到外部系统的连接。网络430可以包括使用无线和/或有线通信系统的局域网和/或广域网的任何组合。例如,网络430可以包括互联网以及移动电话网络。在一个实施方式中,网络430使用标准通信技术和/或协议。因此,网络430可以包括使用例如以太网、802.11、微波接入全球互通(WiMAX)、2G/3G/4G移动通信协议、异步传输模式(ATM)、无限宽带、PCI Express高级交换等技术的链路。网络430上使用的其他网络协议可包括多协议标签交换(MPLS)、传输控制协议/互联网协议(TCP/IP)、用户数据报协议(UDP)、超文本传输协议(HTTP)、简单邮件传输协议(SMTP)、文件传输协议(FTP)等。通过网络交换的数据可使用包括二进制形式的图像数据(例如,便携式网络图形(PNG))、超文本标记语言(HTML)、可扩展标记语言(XML)等)的技术和/或格式来表示。此外,所有或部分链路可使用常规的加密技术进行加密,例如安全套接字层(SSL)、传输层安全性(TLS)、互联网协议安全性(IPsec)等。在另一个实施方式中,网络上的实体可使用定制的和/或专用的数据通信技术来代替或补充上述技术。
每当术语“至少”、“大于”或“大于或等于”在一系列两个或更多个数值中的第一个数值之前时,术语“至少”、“大于”或“大于或等于”应用于该系列数值中的每个数值。例如,大于或等于1、2或3相当于大于或等于1、大于或等于2或者大于或等于3。
每当术语“不超过”、“小于”或“小于或等于”在一系列两个或更多个数值中的第一个数值之前时,术语“不超过”、“小于”或“小于或等于”应用于该系列数值中的每个数值。例如,小于或等于3、2或1相当于小于或等于3、小于或等于2或者小于或等于1。
如本文所用,A和/或B包含A或B中的一个或多个,及其组合,例如A和B。应当理解,尽管术语“第一”、“第二”、“第三”等在本文中用于描述各种元件、组件、区域和/或部分,但是这些元件、组件、区域和/或部分不应受这些术语的限制。这些术语仅用于区分一个元素、组件、区域或部分与另一元素、组件、区域或部分。因此,在不脱离本发明的教导的情况下,本文中讨论的第一元件、组件、区域或部分可以被称为第二元件、组件、区域或部分。
本文使用的术语仅出于描述特定实施方式的目的,而非意在限制本发明。如本文所用,除非上下文另外明确指出,单数形式“一个”、“一种”和“该”包括复数个指代物。将进一步理解,当在本说明书中使用时,术语“包括”和/或“包含”或“包括”和/或“包括”指定所陈述的特征、区域、整体、步骤、操作、元件和/或组件的存在,但不排除一个或多个其他特征、区域、整体、步骤、操作、元件、组件和/或其组合的存在或添加。
在整个说明书中,对“一些实施方式”或“一个实施方式”的引用表示结合该实施方式描述的特定特征、结构或特性包括在至少一个实施方式中。因此,在整个说明书中各处出现的短语“在一些实施方式中”或“在一个实施方式中”不一定都指的是同一个实施方式。此外,在一个或多个实施方式中,可以以任何合适的方式来组合特定特征、结构或特性。
虽然本文已经示出并描述了本发明的优选实施方式,但是对于本领域技术人员容易理解的是,这些实施方式仅以示例的方式提供。这并不意味着本发明受到本说明书中提供的具体示例的限制。虽然已经参考前述说明书描述了本发明,但是本文中对实施方式的描述和阐述并不旨在解释为限制性意义。本领域技术人员在不脱离本发明的情况下现将想到多种变化、改变和替代。此外,应当理解,本发明的所有方面并不限于本文根据各种条件和变量所提出的具体描述、配置或相对比例。应当理解,本文所述的本发明实施方式的各种替代方案可用于实施本发明。因此,预计本发明还应涵盖任何这样的替代方案、修改、更改或等同物。以下权利要求旨在限定本发明的范围,并由此涵盖这些权利要求范围内的方法和结构及其等同物。