具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
针对现有技术中存在的技术问题,在本申请一些实施例中,提供了一种解决方案,以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为本申请一示例性实施例提供的医学影像的多器官分割方法的流程示意图,如图1所示,该方法包括:
步骤101、获取包含多种器官的医学影像。
步骤102、利用神经网络模型,获取所述医学影像的特征图以及所述医学影像图在潜空间的多器官特异性先验分布。
步骤103、根据所述多器官特异性先验分布,对所述医学影像的特征图进行调制。
步骤104、根据调制后的特征图,对所述医学影像进行多器官分割,得到图像分割结果。
本实施例提供的多器官分割方法,可用于从医学影像中将多种器官分割出来。其中,医学影像是指基于CT技术对可能包含多种器官的部位进行轴向断层扫描成像得到的图像。多种器官成像后,其具有的特征可反映在对应的医学影像上。其中,多种器官,是指多种不同种类的器官。例如,腹部的器官包括:胰腺、肝脏、胆囊等多种器官。在进行多器官分割时,神经网络模型可从腹部造影图像中分别分割出胰腺、肝脏、胆囊所在的图像区域。
其中,医学影像的特征图(feature map),用于抽象地描述从医学影像中提取到的特征。在计算特征图的过程中,可采用归一化的方式,将批量样本的均值和方差固定在一定的范围内。因此,该特征图可用于表达多器官之间较为平均的特征,弱化了多器官之间的差异性表达。在本实施例中,可采用多器官特异性先验分布,强化多器官之间的差异性。
其中,任一器官的器官特异性(organ-specific),是指该器官与其他器官之间的差异,该差异可表现为外观差异以及空间结构差异中的至少一种。多器官特异性,用于描述多种器官之间存在的差异,例如胰腺与肝脏之间的外观差异,胰腺与肝脏以及胰腺与胆囊之间的空间结构的差异。
其中,潜空间(Latent Space),又称为隐空间,用于采用低维度的压缩数据来表达数据的隐藏分布。该潜空间具有连续性、低维度的特点。潜空间中的任一点,可代表数据的一种表达。在本实施例中,潜空间可以是n维轴对齐的高斯潜空间,其中,n为正整数,n可根据实际需求进行设置。在一些实施例中,可设置n为64。
在本实施例中,潜空间用于表达多器官特异性的隐藏分布。给定医学影像的情况下,假设多器官的特异性语义信息的生成过程服从一个由隐变量控制隐藏的过程,那么神经网络模型可学习找到该隐变量的能力,从而根据学习到的能力,获取医学影像的多器官特异性的隐藏分布。其中,神经网络模型根据输入的医学影像图在潜空间中寻找隐藏分布的能力,可预先通过训练学习到,具体训练过程将在后续实施例中进行说明。
其中,多器官特异性分布,用于描述多器官特异性的多样性。在不同的造影图像中,由于可能产生的病变或者个体差异,将导致多器官的特异性也不同。例如,以腹部造影为例,在一些样本中,胰腺、肝脏、肾脏之间的特异性,可以表现为第一种特异性;在另一些样本中,胰腺、肝脏、肾脏之间的特异性,可以表现为第二种特异性。
神经网络模型可根据输入的医学影像,在潜空间中找到多器官特异性的隐藏分布。潜空间是连续的,因而使得该隐藏分布中,可包括训练过程中观测到的多器官差异性,也可包括在训练过程中未观测到的多器官差异性。在潜空间中,从多器官特异性分布中任意采样一点,可得到多器官的一种特异性表达。在本实施例中,该隐藏分布作为一种先验信息指导分割过程,因此可描述为多器官特异性先验分布。
在获取多器官特异性先验分布后,神经网络模型可根据该多器官特异性先验分布,对医学影像的特征图进行调制。其中,调制是指,向医学影像的特征图中传递特定信息,以更新特征图。
其中,根据多器官特异性先验分布,对医学影像的特征图进行调制时,可从多器官特异性先验分布中,获取多器官的特异性语义信息,并将该特异性语义信息传递到特征图中。从而,神经网络模型可根据调制后的特征图,对医学影像进行多器官分割。在分割过程中,多器官的特异性语义信息可对特征图表达的多器官的特征进行补充,从而强化多器官之间的差异,并指导精细化的分割过程。
本实施例中,获取包含多种器官的医学影像后,可利用神经网络获取医学影像的特征图以及医学影像在潜空间的多器官特异性先验分布,并根据多器官特异性先验分布,对医学影像的特征图进行调制,得到调制后的特征图。其中,调制后的特征图中进一步融合了多器官的特异性信息,该特异性信息作为先验信息,可对多器官的识别以及区分过程形成指导。从而,可基于调制后的特征图,准确地分辨出医学影像图中的不同器官之间的区别,并较为精确地将多种不同器官从医学影像图中分割出来,降低对医学影像中的多种器官进行分割所需的计算成本。
在一些示例性的实施例中,本申请采用的神经网络模型,可基于图2示意的网络结构或其变形结构实现,本实施例不做限制。
如图2所示,神经网络模型主要包括:与输入层分别连接的分割分支以及调制分支。其中,分割分支包括:依次连接的特征编码器以及解码器;调制分支包括:依次连接的先验编码器以及空间特征变换生成器(Hierarchical spatial feature transformer,HSFT)。其中,空间特征变换生成器与解码器连接,使得神经网络模型大致形成了呈V型的网络(即,V-Net)。
医学影像图输入神经网络模型后,可分别被输入特征编码器以及先验编码器。
其中,特征编码器,提取输入的医学影像的特征图。其中,特征编码器可基于卷积神经网络或者图卷积神经网络实现,本实施例包含但不限于此。通常,编码网络包含归一化层,以将不同变化范围的值映射到指定范围中。通常,该范围为[0,1]。当包含归一化层时,编码网络可在提取特征图的过程中压缩部分数据,以提升模型的训练速度。
其中,先验编码器,用于将输入的医学影像编码到潜空间,并根据学习到的潜空间编码参数,获取医学影像在潜空间的多器官特异性先验分布。医学影像的多器官特异性分布,可通过如图2所示的低纬的高斯空间进行表达。
其中,先验编码器的潜空间编码参数,可根据医学影像样本以及后验的多器官特异性分割标签学习得到。为便于说明,可将先验编码器的网络模型表达为Zp=Fφ(Zp|x),其中,x为输入的图像,Zp为输入图像在潜空间的多器官特异性先验分布,φ为潜空间编码参数,φ可通过训练学习得到,具体训练过程将在后续实施例中进行说明。
在一些实施例中,根据多器官特异性先验分布,对医学影像的特征图进行调制时,可对多器官特异性先验分布进行采样,得到多器官特异性向量,如图2所示的采样得到的向量z0。该向量z0,可采用期望和方差进行表示。
其中,对多器官特异性先验分布进行采样的方式可以是随机采样,也可以按照指定的概率密度进行采样,本实施例不做限制。采样得到的任一多器官特异性向量,用于描述多器官的一种特异性表达。
获取多器官特异性向量后,可采用图2示意的空间特征变换生成器,对多器官特异性向量进行空间特征变换,得到仿射变换参数。其中,该仿射变换参数,用于描述多器官特异性语义信息。
在一些实施例中,当采用低维度的高斯空间表达多器官特异性分布时,从多器官特异性分布中采样得到的多器官特异性向量通常维度较低。为便于空间特征变换生成器进行计算,可对多器官特异性向量进行维度提升。如图2所示,先验编码器与空间特征变换生成器之间包含线性映射层,可采用该线性映射层对多器官特异性向量进行线性映射,得到与空间特征变换生成器的输入层的尺度相匹配的多器官特异性向量。
基于上述实施方式获取仿射变换参数后,神经网络模型可基于该仿射变换参数,对医学影像的特征图进行调制。在调制的过程,可基于仿射变换参数对特征图进行仿射变换,从而将多器官语义信息添加到特征图中。
如图2所示,分割分支中的特征编码器可包含多个编码层,多个编码层的空间尺度逐渐减小,从而在特征提取的过程中,不断对输入数据执行下采样操作,以增大特征图的感受野。相应地,分割分支中的解码器可包含多个解码层,多个解码层的空间尺度逐渐增大。解码器在解码的过程中,将不断对输入的特征图进行上采样,以使得特征图恢复至与医学影像相同的尺寸,以便于多器官分割。基于该结构,分割网络在对特征图进行解码的过程中,不同解码层可输出不同空间尺度的特征图。
可选地,调制分支可对任意一个或者任意多个空间尺度的特征图进行调制。相应地,空间特征变换生成器,可以包含一个或者多个空间特征变换层。若包含一个空间特征变换层,则该空间特征变换层,可输出特定空间尺度对应的仿射变换参数,以对特定空间尺度的特征图进行调制。若包含多个空间特征变换层,则空间特征变换层的数量,可以与解码层的数量相同,或者可少于解码层的数量,以在两个或者两个以上的空间尺度下对特征图进行调制。
其中,任一空间特征变换层,与解码器中空间尺度相同的解码层连接。例如,尺度为w1*h1的特征变换层,与尺度为w1*h1的解码层连接;尺度为w2*h2的特征变换层,与尺度为w2*h2的解码层连接。从而,根据多器官特异性语义信息,对医学影像的特征图进行调制时,可按照空间尺度的对应关系,将至少一个不同空间尺度各自对应的仿射变换参数,输入解码器中的至少一个解码层,以对至少一个不同空间尺度各自的特征图进行调制。
在这种实施方式中,通过在一个或者多个不同空间尺度上计算多器官的特异性语义信息,可使得计算得到的特异性语义信息中,准确地保留多器官在不同空间尺度下的相对位置关系,即:在不同空间尺度上确保多器官之间的空间结构相对不变。从而,在基于计算得到的仿射变换参数对不同尺度的特征图进行调制时,能够较为准确地在任一尺度的特征图中添加多器官在该尺度下的空间结构信息,从而实现在空间维度(Spatial-wise)实现对特征图的调制。
在一些实施例中,如图2所示, 空间特征变换生成器中空间特征变换层的数量与解码层的数量相同,且尺度一一对应。基于该结构,调制分支可利用多个空间特征变换层,在多个不同空间尺度上计算多器官特异性向量包含的多器官特异性语义信息,从而得到该多个不同空间尺度各自对应的仿射变换参数。根据多器官特异性语义信息,对医学影像的特征图进行调制时,按照空间尺度的对应关系,将该多个不同空间尺度各自对应的仿射变换参数,逐层输入中的多个解码层,以对多个不同空间尺度各自的特征图进行调制。
其中,在任一空间尺度的解码层中,可采用空间尺度的仿射参数对该空间尺度下的特征图中进行逐元素线性计算,以实现特征维度(Feature-wise)的特征调制。
在这种实施方式中,通过空间维度以及特征维度的调制,一方面可保留多器官在空间上的相对位置关系,另一方面,可根据仿射变换参数强化不同空间尺度下的多器官的差异化特征,从而提升多器官图像分割结果的准确性。
在空间特征变换生成器中,任一空间特征变换层可执行上采样计算、线性变换参数计算以及平移参数计算操作。以下以第i个空间尺度对应的空间特征变换层SFT(i)为例进行示例性说明,i为正整数,i∈[1,2,…k],k表示空间特征变换生成器的总层数。
在SFT(i)中,可对输入的第一多器官特异性向量进行上采样,得到与空间尺度i匹配的第二多器官特异性向量。
其中,第一多器官特异性向量为多器官特异性先验分布中采样得到的多器官特异性向量,或者为前一个空间特征变换层上采样后输出的多器官特异性向量。当i=1时,第一多器官特异性向量为多器官特异性先验分布中采样并线性映射得到的多器官特异性向量z0。当i≠1时,第一多器官特异性向量为前一层输出的多器官特异性向量z(i-1)。
确定第二多器官特异性向量后,SFT(i)可利用预先学习的空间特征变换参数,在空间尺度上计算第二多器官特异性向量中的多器官的特异性语义信息,得到第i个空间尺度对应的仿射变换参数。SFT(i)中,用于执行上采样计算的函数或网络可描述为gi,用于计算线性变换参数的函数或网络可描述为fi,用于计算平移参数的网络可描述为hi。其中,SFT(i)可在训练过程中对hi以及fi进行学习。
其中,SFT(i)的计算过程可采用以下公式1描述:
zi=gi[z(i-1)]
ai=fi(zi)
βi=hi(zi) 公式1
其中,z(i-1)表示前一层输出的多器官特异性向量,zi表示本层上采样后的多器官特异性向量,zi用于输入SFT(i+1)、fi以及hi。ai表示第i个空间尺度对应的线性变换参数,βi表示第i个空间尺度对应的平移参数。
响应的,在第i个空间尺度上,采用仿射参数对该空间尺度下的特征图中进行逐元素线性计算的过程,可采用以下公式2进行表示:
其中,
表示输入第i个解码层的特征图,第i个解码层输出的调制后的特征图
,
表示逐元素乘法计算。
基于调制后的特征图
,解码器可对医学影像图中的多种器官进行检测以及分
割。调制后的特征图中,多器官的差异性得到强化,采用一个神经网络模型即可实现对多种
不同器官的差异化分割,极大降低了多器官分割所需的计算成本。
除前述实施例提供的多器官分割方法之外,本申请实施例还提供一种神经网络模型训练方法,用于训练神经网络模型从医学影像中分割出多种器官的能力。以下将结合附图进行示例性说明。
图3为本申请一示例性实施例提供的神经网络模型训练方法的流程示意图,如图3所示,该方法包括:
步骤301、获取包含多器官的医学影像样本。
步骤302、利用神经网络模型,获取该医学影像样本的特征图以及该医学影像样本在潜空间的多器官特异性先验分布;以及,在该医学影像样本的多器官分割标签的监督下,获取该医学影像样本的多器官特异性后验分布。
步骤303、根据该多器官特异性后验分布,对该医学影像样本的特征图进行调制。
步骤304、根据调制后的特征图,对该医学影像样本进行多器官分割,得到图像分割结果。
步骤305、根据该多器官特异性先验分布以及该多器官特异性后验分布之间的误差,确定潜空间编码损失;以及,根据该医学影像样本的图像分割结果与该多器官分割标签之间的误差确定分割损失。
步骤306、根据该潜空间编码损失和该分割损失,对该神经网络模型进行优化。
可选地,医学影像样本的多器官分割标签包括:多种器官各自的分割标签,例如胰腺图像的分割标签、肝脏区域的分割标签、肾脏区域的分割标签等等。其中,分割标签可采用蒙版(mask)进行标注,可通过在蒙版中设置不同的颜色值,来对不同种类的器官的分割标签进行区分。
不同于前述实施例的记载,在训练阶段,采用多器官特异性后验分布,对医学影像样本的特征图进行调制。具体调制过程可参考前述实施例的记载,此处不赘述。
可选地,神经网络模型,获取医学影像样本在潜空间的多器官特异性先验分布时,可将该医学影像样本输入该神经网络模型中的先验编码器;利用该先验编码器,根据学习到的潜空间编码参数,将该医学影像样本编码到潜空间中,得到该多器官特异性先验分布;其中,该潜空间编码参数是待学习的参数。
可选地,在训练阶段,如图2所示,可在神经网络模型中设置一后验编码器。在一些实施例中,先验编码器和后验编码器,可基于条件变分自编码器(conditionalvariational auto-encoder ,cVAE)实现。
其中,后验编码器的输入为医学影像样本以及该医学影像样本的多器官分割标签,其中多器官分割标签可作为医学影像样本的多器官特异性分布的部分后验信息,以指导后验编码器能够较为准确地获取医学影像样本在潜空间中的多器官特异性分布。在医学影像样本的多器官分割标签的监督下,后验编码器可将医学影像样本编码到潜空间中,得到多器官特异性分布。在本实施例中,为便于描述和区分,将输入先验编码器针对医学影像样本输出的多器官特异性分布描述为多器官特异性先验分布,将后验编码器针对医学影像样本以及医学影像样本的多器官分割标签生成的多器官特异性分布描述为多器官特异性后验分布。
为便于说明,可将后验编码器描述为Zq=Fγ(Zq|x,y),其中, x为输入的图像,y为包含多器官特异性信息的分割标签,Zp为输入图像在潜空间的多器官特异性后验分布,γ为潜空间编码参数,γ可通过训练学习得到。在y的指导下,后验编码器可快速准确地学习得到γ。
在一些实施例中,先验编码器和后验编码器,可基于条件变分自编码器(conditional variational auto-encoder ,cVAE)实现。
可选地,根据该多器官特异性先验分布,对该医学影像样本的特征图进行调制时,可对该多器官特异性后验分布进行采样,得到多器官特异性向量;采用空间特征变换生成器,对该多器官特异性向量进行空间特征变换,得到仿射变换参数;该仿射变换参数,用于描述该多器官特异性语义信息;根据该仿射变换参数,对该医学影像样本的特征图进行调制。具体可参考前述实施例的记载,此处不再赘述。
在训练阶段,神经网络模型的损失,可至少包括分割损失以及潜空间编码损失。其中,分割损失可根据分割结果以及预设的分割标签进行计算。潜空间编码损失,可采用后验的编码结果和先验编码器的编码结果进行计算。以下将进行示例性说明。
对于先验编码器而言,需要学习在未提供后验信息的情况下观测到医学影像样本在潜空间中的多样性分布的能力。因此,在计算潜空间编码损失时,可根据多器官特异性先验分布以及该多器官特异性后验分布之间的误差,确定潜空间编码损失。以及,可根据医学影像样本的分割结果y`与多器官分割标签y之间的误差确定分割损失。根据潜空间编码损失和分割损失,可对神经网络模型进行优化。
其中,分割损失可基于交叉熵(Cross Entropy)损失函数、对数损失函数、KL(Kullback-Leiber)散度损失以及平方误差损失函数中的至少一种进行计算,本实施例不做限制。潜空间编码损失可采用KL散度损失进行计算,以使得先验编码器和后验编码器的输出的分布逐渐近似。在一些实施例中,神经网络模型的联合损失可如以下公式3所示:
其中,
以及
为加权因子,
表示分割损失,
表示潜空间编码损失,
表示多器官特异性后验分布,
表示多器官特异性先验分布。
通过多轮次迭代训练后,若
收敛到指定值或者指定范围,则停止迭代,并输出训
练完成的神经网络模型。
在一些场景中,可将前述各实施例提供的医学影像的多器官分割方法、神经网络模型训练方法封装为可供第三方使用的软件工具,例如SaaS(Software-as-a-Service,软件即服务)工具。其中,该SaaS工具可实现为插件或者应用程序。该插件或者应用程序可以被部署在服务器上,并可向客户端等第三方用户开放指定的接口。为便于描述,在本实施例中,将该指定的接口描述为第一接口。进而,客户端等第三方用户通过调用该第一接口,便捷地访问并使用服务端设备提供的上述方法。其中,该服务器可以是常规服务器或者云服务器,本实施例不做限制。
以医学影像的多器官分割方法对应的SaaS工具为例,服务器可响应客户端对第一接口的调用请求,从该第一接口的接口参数中获取包含多种器官的医学影像;利用神经网络模型,获取所述医学影像的特征图以及所述医学影像在潜空间的多器官特异性先验分布;根据所述多器官特异性先验分布,对所述医学影像的特征图进行调制;根据调制后的特征图,对所述医学影像进行多器官分割,得到图像分割结果;将所述多种器官的分割结果发送至所述客户端,以使所述客户端展示所述分割结果。
以神经网络模型训练方法对应的SaaS工具为例,服务器可响应客户端对第一接口的调用请求,从第一接口的接口参数中获取训练数据集,该训练数据集包括:包含多种器官的医学影像样本;利用神经网络模型,获取所述医学影像样本的特征图以及所述医学影像样本在潜空间的多器官特异性先验分布;以及,在所述医学影像样本的多器官分割标签的监督下,获取所述医学影像样本的多器官特异性后验分布;根据所述多器官特异性后验分布,对所述医学影像样本的特征图进行调制;根据调制后的特征图,对所述医学影像样本进行多器官分割,得到图像分割结果;根据所述多器官特异性先验分布以及所述多器官特异性后验分布之间的误差,确定潜空间编码损失;以及,根据所述医学影像样本的分割结果与所述多器官分割标签之间的误差确定分割损失;根据所述潜空间编码损失和所述分割损失,对所述神经网络模型进行优化。当误差收敛到指定值或者指定范围时,可输出该神经网络模型,并将该神经网络模型发送至客户端以供使用。
在这种实施方式中,服务器可基于其上运行的SaaS工具,向客户端提供医学影像中的多器官分割服务或者神经网络模型训练服务,降低了客户端的计算压力以及计算成本。
需要说明的是,上述实施例所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤101至步骤104的执行主体可以为设备A;又比如,步骤101和102的执行主体可以为设备A,步骤103的执行主体可以为设备B;等等。
另外,在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。
需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
除器官分割场景之外,本申请上述以及下述各实施例提供的分割方法,还可以扩展到其他场景中,以对空间中的复杂物体进行分割。例如,可应用在人群中的人物个体分割、海报中的商品分割、自动驾驶场景中的场景实体分割等等,本实施例不做限制。以下将结合图4,对本申请实施例提供的医学影像的多器官分割方法的一种典型应用场景进行示例性说明。
在一种典型的应用场景中,本申请实施例提供的医学影像的多器官分割方法可应用于胸腔以及腹部的多器官分割过程。以下以腹部造影图像的多器官分割为例。在获取到患者的腹部的CT造影图像后,可将腹部造影图像输入电子设备。电子设备可利用神经网络模型,获取所述腹部造影图像的特征图以及所述腹部造影图像在潜空间的多器官特异性先验分布;根据所述多器官特异性先验分布,获取所述腹部造影图像的多器官特异性语义信息;根据所述多器官特异性语义信息,对所述腹部造影图像的特征图进行调制;根据调制后的特征图,对所述腹部造影图像进行多器官分割,得到图像分割结果。多种器官在图像上的分割结果可采用不同颜色进行区分,如图4所示的肝脏、肾脏、脾脏、胰腺的分割结果。
在这种实施方式中,可利用神经网络获取腹部造影图像的特征图以及腹部造影图像在潜空间的多器官特异性先验分布,并根据多器官特异性先验分布,对腹部造影图像的特征图进行调制,得到调制后的特征图。其中,调制后的特征图中进一步融合了腹部多器官的特异性信息,该特异性信息作为先验信息,可对多器官的识别以及区分过程形成指导。从而,可基于调制后的特征图,准确地分辨出医学影像图中的不同器官之间的区别,并较为精确地将多种不同器官从腹部造影图像中分割出来,降低对腹部造影图像中的多种器官进行分割所需的计算成本。
图5是本申请一示例性实施例提供的电子设备的结构示意图,如图5所示,该电子设备包括:存储器501以及处理器502。
存储器501,用于存储计算机程序,并可被配置为存储其它各种数据以支持在电子设备上的操作。这些数据的示例包括用于在电子设备上操作的任何应用程序或方法的指令。
存储器501可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
处理器502,与存储器501耦合,用于执行存储器501中的计算机程序,以用于:获取包含多器官的医学影像;利用神经网络模型,获取所述医学影像的特征图以及所述医学影像在潜空间的多器官特异性先验分布;根据所述多器官特异性先验分布,对所述医学影像的特征图进行调制;根据调制后的特征图,对所述医学影像进行多器官分割,得到图像分割结果。
可选地,处理器502在利用神经网络模型,获取所述医学影像在潜空间的多器官特异性先验分布时,具体用于:将所述医学影像输入所述神经网络模型中的先验编码器;利用所述先验编码器,根据学习到的潜空间编码参数,将所述医学影像编码到潜空间中,得到所述多器官特异性先验分布;其中,所述潜空间编码参数,根据医学影像样本以及后验的多器官特异性分割标签学习得到。
可选地,处理器502在根据所述多器官特异性先验分布,对所述医学影像的特征图进行调制时,具体用于:对所述多器官特异性先验分布进行采样,得到多器官特异性向量;采用空间特征变换生成器,对所述多器官特异性向量进行空间特征变换,得到仿射变换参数;所述仿射变换参数,用于描述所述多器官特异性语义信息;根据所述仿射变换参数,对所述医学影像的特征图进行调制。
可选地,所述空间特征变换生成器包括:具有不同空间尺度的多个空间特征变换层;处理器502在采用空间特征变换生成器,对所述多器官特异性向量进行空间特征变换,得到仿射变换参数时,具体用于:利用所述多个空间特征变换层,在多个不同空间尺度上计算所述多器官特异性向量中的多器官的特异性语义信息,得到所述多个不同空间尺度各自对应的仿射变换参数。
可选地,任一空间特征变换层,与解码器中具有相同空间尺度的解码层连接;处理器502在根据所述多器官特异性语义信息,对所述医学影像的特征图进行调制时,具体用于:按照空间尺度的对应关系,将所述多个不同空间尺度各自对应的仿射变换参数,输入所述解码器中的多个解码层,以对所述多个不同空间尺度各自的特征图进行调制;在任一空间尺度的解码层中,采用所述空间尺度的仿射参数对所述空间尺度下的特征图中进行逐元素线性计算,以实现特征维度的特征调制。
可选地,处理器502在利用所述多个空间特征变换层,在多个不同空间尺度上计算所述多器官特异性向量中的多器官的特异性语义信息,得到所述多个不同空间尺度各自对应的仿射变换参数时,具体用于:在任一空间尺度对应的空间特征变换层中,对输入的第一多器官特异性向量进行上采样,得到与所述空间尺度匹配的第二多器官特异性向量;所述第一多器官特异性向量为所述多器官特异性先验分布中采样得到的多器官特异性向量,或者为前一个空间特征变换层上采样后输出的多器官特异性向量;利用预先学习的空间特征变换参数,在所述空间尺度上计算所述第二多器官特异性向量中的多器官的特异性语义信息,得到所述空间尺度对应的仿射变换参数。
进一步,如图5所示,该电子设备还包括:通信组件503、显示器504、电源组件505等其它组件。图5中仅示意性给出部分组件,并不意味着电子设备只包括图5所示组件。
其中,通信组件503被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如WiFi,2G、3G、4G或5G,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件可基于近场通信(NFC)技术、射频识别(RFID)技术、红外数据协会(IrDA)技术、超宽带(UWB)技术、蓝牙(BT)技术和其他技术来实现。
其中,显示器504包括屏幕,其屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。该触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与该触摸或滑动操作相关的持续时间和压力。
其中,电源组件505,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。
本实施例中,电子设备获取包含多种器官的医学影像后,可利用神经网络获取医学影像的特征图以及医学影像在潜空间的多器官特异性先验分布,并根据多器官特异性先验分布,对医学影像的特征图进行调制,得到调制后的特征图。其中,调制后的特征图中进一步融合了多器官的特异性信息,该特异性信息作为先验信息,可对多器官的识别以及区分过程形成指导。从而,可基于调制后的特征图,准确地分辨出医学影像图中的不同器官之间的区别,并较为精确地将多种不同器官从医学影像图中分割出来,降低对医学影像中的多种器官进行分割所需的计算成本。
需要说明的是,图5示意的电子设备,除了可根据前述实施例记载的数据处理逻辑执行数据处理操作之外,还可按照如下记载的医学影像的多器官分割方法执行如下操作:处理器502具体用于:响应客户端对第一接口的调用请求,从所述第一接口的接口参数中获取包含多种器官的医学影像;利用神经网络模型,获取包含多器官的医学影像;利用神经网络模型,获取所述医学影像的特征图以及所述医学影像在潜空间的多器官特异性先验分布;根据所述多器官特异性先验分布,对所述医学影像的特征图进行调制;根据调制后的特征图,对所述医学影像进行多器官分割,得到图像分割结果;将所述多种器官的分割结果发送至所述客户端,以使所述客户端展示所述分割结果。
图5示意的电子设备还可按照如下记载的神经网络模型训练方法执行如下操作:处理器502具体用于:获取包含多器官的医学影像样本;利用神经网络模型,获取所述医学影像样本的特征图以及所述医学影像样本在潜空间的多器官特异性先验分布;以及,在所述医学影像样本的多器官分割标签的监督下,获取所述医学影像样本的多器官特异性后验分布;根据所述多器官特异性后验分布,对所述医学影像样本的特征图进行调制;根据调制后的特征图,对所述医学影像样本进行多器官分割,得到图像分割结果;根据所述多器官特异性先验分布以及所述多器官特异性后验分布之间的误差,确定潜空间编码损失;以及,根据所述医学影像样本的分割结果与所述多器官分割标签之间的误差确定分割损失;根据所述潜空间编码损失和所述分割损失,对所述神经网络模型进行优化。
图5示意的电子设备还可按照如下记载的腹部造影图像的多器官分割方法执行如下操作:处理器502具体用于:获取包含多器官的腹部造影图像;利用神经网络模型,获取所述腹部造影图像的特征图以及所述腹部造影图像在潜空间的多器官特异性先验分布;根据所述多器官特异性先验分布,获取所述腹部造影图像的多器官特异性语义信息;根据所述多器官特异性语义信息,对所述腹部造影图像的特征图进行调制;根据调制后的特征图,对所述腹部造影图像进行多器官分割,得到图像分割结果。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被执行时能够实现上述方法实施例中的各步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程电子设备的处理器以产生一个机器,使得通过计算机或其他可编程电子设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程电子设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程电子设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器 (CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM) 和/或非易失性内存等形式,如只读存储器 (ROM) 或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。