CN113808182B

CN113808182B - 一种2d与3d图像配准方法及装置

Info

Publication number: CN113808182B
Application number: CN202111374305.5A
Authority: CN
Inventors: 舒丽霞; 李萌; 蔺嫦燕; 陈彧; 濮欣; 许尚栋
Original assignee: BEIJING INSTITUTE OF HEART LUNG AND BLOOD VESSEL DISEASES; Beijing Anzhen Hospital
Current assignee: BEIJING INSTITUTE OF HEART LUNG AND BLOOD VESSEL DISEASES; Beijing Anzhen Hospital
Priority date: 2021-11-19
Filing date: 2021-11-19
Publication date: 2022-04-15
Anticipated expiration: 2041-11-19
Also published as: CN113808182A

Abstract

本发明公开了一种2D与3D图像配准方法及装置，包括：获取待配准的一幅2D图像和一幅3D图像；将所述2D图像和3D图像输入预先训练的2D图像特征提取模型和3D图像特征提取模型中，获取同维度的包含2D空间信息的2D图像特征数据和包含3D空间信息的3D图像的特征数据；将所述2D图像的特征数据及所述3D图像的特征数据输入到预先训练的配准模型中，对所述2D图像的特征数据及所述3D图像的特征数据进行配准，得到配准所述2D图像与所述3D图像的空间变换；基于所述空间变换，将所述3D图像映射并叠加到所述2D图像对应空间位置上。本发明直接对图像对进行配准，无需配准前图像预处理，最大程度简化了2D和3D图像配准流程。

Description

一种2D与3D图像配准方法及装置

技术领域

本发明涉及图像配准领域，尤其涉及一种2D与3D图像配准方法及装置。

背景技术

2D图像和3D图像配准，即寻找一个空间变换，将2D图像和3D图像中相同的空间位置准确地叠加在一起的过程。2D和3D图像配准广泛应用于各种场景，比如在介入治疗、智能制造、机器人定位等领域，通常需要将预先已知的3D图像与实时获取的2D图像进行配准，以实现手术的精准导航、机械臂的安全自主交互、汽车的自主动态避障路径规划等功能。

现有2D与3D图像配准技术主要采用如下两种方案：1、将3D图像投影到2D空间生成2D投影图像，遍历所有可能的投影变换，构建一个投影图像库，然后从中寻找与待配准2D图像最为匹配的2D投影图像，从而实现2D与3D图像的配准。构建完整的投影图像库经常需要成百上千个小时，过程极为繁琐耗时。2、利用多张2D图像重建3D图像，通过匹配重建3D图像与待配准的3D图像，间接实现2D和3D图像的配准。现实中很难即时获得多张2D图像以重建3D图像，即使能获得少量2D图像，所重建的3D图像比较粗糙，进而影响2D与3D图像的最终配准精度。因此，亟需一种新的2D与3D图像配准技术，直接在2D与3D图像对上进行配准，以避开繁琐、耗时、难以满足条件等诸多配准前的预处理。

发明内容

为此，我们考虑将待配准的2D图像和3D图像分别拉伸为2D图像的1D特征序列和3D图像的1D特征序列，并将2D图像和3D图像的空间信息分别嵌入到各自的1D特征序列中，得到包含空间信息的2D图像1D特征序列和包含空间信息3D图像1D特征序列，然后配准包含空间信息的2D图像1D特征序列和包含空间信息3D图像1D特征序列，进而实现2D和3D图像的配准。如此便可以直接在2D和3D图像上进行配准，无需配准前的图像预处理过程。

有鉴于此，本发明提供了一种2D和3D图像配准方法，包括：

获取待配准的一幅2D图像和一幅3D图像；

将所述2D图像和3D图像分别输入预先训练的2D图像特征提取网络模型和3D图像特征提取网络模型中，获取包含2D空间信息的2D图像的特征数据和包含3D空间信息的3D图像的特征数据，所述2D图像的特征数据与所述3D图像的特征数据具有相同的维度；

将所述包含2D空间信息的2D图像的特征数据及所述包含3D空间信息的3D图像的特征数据输入到预先训练的配准模型中，对所述包含空间信息的2D图像的特征数据及所述包含空间信息的3D图像的特征数据进行配准，得到配准所述2D图像与所述3D图像的空间变换；

基于所述空间变换，将所述3D图像映射并叠加到所述2D图像对应空间位置上。

基于上述配准方法，本发明还提供了一种2D和3D图像配准装置，包括：

数据获取单元，用于：获取待配准的一幅2D图像和一幅3D图像；

特征提取单元，用于：将所述2D图像和3D图像分别输入预先训练的2D图像特征提取网络模型和3D图像特征提取网络模型中，获取包含2D空间信息的2D图像的特征数据和包含3D空间信息的3D图像的特征数据，所述2D图像的特征数据与所述3D图像的特征数据具有相同的维度；

图像配准单元，用于：将所述包含2D空间信息的2D图像的特征数据及所述包含3D空间信息的3D图像的特征数据输入到预先训练的配准模型中，对所述包含空间信息的2D图像的特征数据及所述包含空间信息的3D图像的特征数据进行配准，得到配准所述2D图像与所述3D图像的空间变换；

图像叠加单元，用于：基于所述空间变换，将所述3D图像映射并叠加到所述2D图像对应空间位置上。

相对于现有2D与3D图像配准技术，本发明直接在输入的待配准图像对上进行图像配准，没有在配准前对待配准的2D图像或3D图像做任何的图像预处理，避开了繁琐、耗时、难以满足条件等诸多配准前的预处理工作，最大程度简化了2D和3D图像配准的流程。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1是本发明实施例1、实施例2、实施例3和实施例4提供的一种2D和3D图像配准方法流程示意图；

图2是本发明实施例1和实施例2提供的特征提取模型示意图；

图3是本发明实施例1和实施例3提供的配准模型示意图；

图4是本发明实施例2和实施例4提供的配准模型示意图；

图5是本发明实施例3和实施例4提供的特征提取模型示意图；

图6是本发明实施例5、实施例6、实施例7和实施例8提供的一种2D和3D图像配准装置结构示意图；

图7是本发明实施例5和实施例6提供的特征提取单元示意图；

图8是本发明实施例5和实施例7提供的图像配准单元示意图；

图9是本发明实施例6和实施例8提供的图像配准单元示意图；

图10是本发明实施例7和实施例8提供的特征提取单元示意图。

具体实施方式

为使本发明的目的、技术手段和有益效果更加清楚完整，下面结合附图对本发明的具体实施方式进行描述。

实施例1

本发明实施例提供了一种2D和3D图像配准方法，其流程示意图如图1所示，包括以下步骤：

S1、获取待配准的一幅2D图像和一幅3D图像。

S2、将所述2D图像和3D图像分别输入预先训练的2D图像特征提取网络模型和3D图像特征提取网络模型中，获取包含2D空间信息的2D图像的特征数据和包含3D空间信息的3D图像的特征数据，所述2D图像的特征数据与所述3D图像的特征数据具有相同的维度。

图2显示了S2中特征提取模型S21的网络结构：

S211、2D图像特征提取网络模型S211，从所述2D图像间接提取包含有2D空间信息的2D图像的1D特征数据，2D图像特征提取网络模型S211依次具体包括：

S2111、2D图像2D特征提取模块，采用2D图像卷积神经网络提取2D图像的2D特征数据，2D图像卷积神经网络由输入层、卷积层、激活函数、池化层、全连接层组成；

S2112、特征数据维度转换模块，用于将所述2D图像的2D特征数据转换成1D特征数据，采用公式(1)进行转换：

这里f表示2D图像的2D特征数据，L₂*W₂为2D图像的2D特征数据大小，d₂表示2D图像的2D特征数据的通道数；

表示转换后的2D图像的1D特征数据，S₂＝L₂*W₂表示转换后的2D图像的1D特征序列长度；

S2113、2D图像1D特征与通道转置模块，采用公式(2)对2D图像的1D特征与通道进行转置：

其中S₂为转置前2D图像的1D特征序列长度，d₂为转置前2D图像的1D特征的通道数,m＝0，1，…，S₂-1,n＝0，1，…，d₂-1；

表示转置前的2D图像的1D特征数据，

表示转置后的2D图像的1D特征数据；

S2114、特征数据位置嵌入模块，用于对所述转置后的2D图像的1D特征数据的位置信息进行编码，并将位置编码嵌入到所述转置后的2D图像的1D特征数据中；

首先，采用如下公式进行位置编码：

其中，PE表示位置编码函数；S₂为转置后2D图像的1D特征的通道数；i表示特征值在2D图像1D特征序列中的位置，i＝0，1，…，d₂-1；j表示特征值在2D图像的1D特征通道中的位置，j＝0，1，…，S₂-1；

然后，将位置编码嵌入到2D图像的1D特征数据中，嵌入公式如下：

其中，

表示转置后的2D图像的1D特征数据，X₂表示嵌入位置编码后的2D图像的1D特征数据。

S212、3D图像特征提取网络模型S212，从所述3D图像间接提取包含有3D空间信息的3D图像的1D特征数据，所述3D图像特征提取网络模型依次具体包括：

S2121、3D图像3D特征提取模块，采用3D图像卷积神经网络提取3D图像的3D特征数据，3D图像卷积神经网络由输入层、卷积层、激活函数、池化层、全连接层组成；

S2122、特征数据维度转换模块，用于将所述3D图像的3D特征数据转换成1D特征数据，采用公式(6)进行转换：

这里f表示3D图像的3D特征数据，L₃*W₃*H₃为3D图像的3D特征数据大小，d₃表示3D图像的3D特征的通道数；

表示转换后3D图像的1D特征数据，S₃＝L₃*W₃*H₃表示转换后3D图像的1D特征长度；

S2123、3D图像1D特征与通道转置模块，采用公式(7)对3D图像的1D特征与通道进行转置：

其中S₃为转置前3D图像的1D特征序列长度，d₃为转置前3D图像的1D特征的通道数,m＝0，1，…，S₃-1,n＝0，1，…，d₃-1；

表示转置前的3D图像的1D特征数据，

表示转置后的3D图像的1D特征数据；

S2124、特征数据位置嵌入模块，用于对所述转置后的3D图像的1D特征数据的位置信息进行编码，并将位置编码嵌入到所述3D图像的1D特征数据中；

首先，采用如下公式进行位置编码：

其中，PE表示位置编码函数；S₃为转置后3D图像的1D特征的通道数；i表示特征值在3D图像的1D特征序列中的位置，i＝0，1，…，d₃-1；j表示特征值在3D图像的1D特征通道中的位置，j＝0，1，…，S₃-1；

然后，将位置编码嵌入到3D图像的1D特征数据中，嵌入公式如下：

其中，

表示转置后的3D图像的1D特征数据，X₃表示嵌入位置编码后的3D图像的1D特征数据。

S3、将所述包含2D空间信息的2D图像的特征数据及所述3D包含空间信息的3D图像的特征数据输入到预先训练的配准模型中，对所述包含空间信息的2D图像的特征数据及所述包含空间信息的3D图像的特征数据进行配准，得到配准所述2D图像与所述3D图像的空间变换；

图3显示了S3中配准模型S31的网络结构：

S31、所述配准模型依次包括：特征长度归一化网络、特征交叉融合网络和空间变换计算网络；

S311、特征长度归一化网络：

采用一维卷积网络，将所述包含2D空间信息的2D图像的1D特征序列和所述包含2D空间信息的3D图像的1D特征序列分别归一化为相同的序列长度；归一化后的序列长度S₀取值靠近所述包含空间信息的2D图像的1D特征序列长度和所述包含空间信息的3D图像的1D特征序列长度的几何平均数，同时能被后述多头交叉注意力网络中的头数所整除；

S312、特征交叉融合网络：

采用多头交叉注意力网络，学习从2D图像到3D图像的交叉融合特征和从3D图像到2D图像的交叉融合特征，具体包括：

S3121、2D图像到3D图像交叉融合特征计算网络，采用2D到3D图像的多头交叉注意力网络，将长度归一化后的包含空间信息的2D图像的1D特征数据

传递给长度归一化后的包含空间信息的3D图像的1D特征数据

得到所述2D图像到所述3D图像的交叉融合特征X_2-3，具体计算如下：

其中，LN表示层标准化，mul表示交叉注意力网络的头数，即传递次数，

表示为将

传递给

的第i头交叉注意力网络层，

表示为将

通过第i头注意力网络传递给

后得到的第i头交叉融合特征，

表示

传递给

的第i-1头交叉融合特征，

表示最终得到的

传递给

的第i头交叉融合特征，

表示由θ参数化的第i头交叉注意力网络的前馈层；

将特征X_β传递给特征X_α的交叉注意力CM_β-α(X_α，X_β)的计算公式如下：

其中，

和

为待训练的交叉注意力网络参数；d_k表示交叉注意力网络中键的通道数，具体取值依据模型需要自行设定；

S3122、3D图像到2D图像交叉融合特征计算网络，采用3D到2D图像的多头交叉注意力网络，将长度归一化后的包含空间信息的3D图像的1D特征数据

传递给长度归一化后的包含空间信息的2D图像的1D特征数据

得到所述3D图像到所述2D图像的交叉融合特征X_3-2，具体计算如下：

表示为将

传递给

的第i头交叉注意力网络层，

表示为将

通过第i头注意力网络传递给

后得到的第i头交叉融合特征，

表示

传递给

的第i-1头交叉融合特征，

表示最终得到的

传递给

的第i头交叉融合特征，

表示由θ参数化的第i头交叉注意力网络的前馈层；

S313、空间变换计算网络：

用于计算配准所述2D图像与所述3D图像的空间变换，具体如下：

S3131、特征组合模型，将所述2D图像到3D图像的交叉融合特征X_2-3与所述3D图像到2D图像的交叉融合特征X_3-2组合为特征X，Y＝[X_3-2；X_2-3]，组合特征X的序列长度保持所述归一化后的序列长度S₀不变，组合特征X的通道数d＝2d_v,d_v表示交叉注意力网络中值的通道数，具体取值依据模型需要自行设定；也可以如后述实施例2中S322一样进行特征组合；

S3132、特征解析网络，采用自注意力网络对组合特征X进行解析，组合特征X的自注意力计算公式如下：

其中，

表示组合特征X经自注意力网络解析后得到的解析特征；W_Q，W_K和W_V为待训练的自注意力网络参数，d表示组合特征X的通道数；

S3133、空间变换输出网络，先通过一个卷积层，将解析特征的通道数调整为1；再通过一个由全连接层、激活层、标准化层组成的全连接网络，输出配准所述2D图像与所述3D图像的空间变换。

S4、基于所述空间变换，将所述3D图像映射并叠加到所述2D图像对应空间位置上。

以上即为本发明实施例1提供的一种2D和3D图像配准方法的具体实施方式。相较于现有2D与3D图像配准技术，此方法直接在输入的待配准图像对上进行图像配准，没有在配准前对待配准的2D图像或3D图像做任何的图像预处理，避开了繁琐、耗时、难以满足条件等诸多配准前的预处理工作，最大程度简化了2D和3D图像配准的流程。

实施例2

S1、获取待配准的一幅2D图像和一幅3D图像。

图2显示了S2中特征提取模型S21的网络结构，包括S211即2D图像特征提取网络模型和S212即3D图像特征提取网络模型，其中：

S211、所述2D图像特征提取网络模型从所述2D图像间接提取包含有2D空间信息的2D图像的1D特征数据，依次具体包括：S2111即2D图像2D特征提取模块，S2112即特征数据维度转换模块、S2113即2D图像1D特征与通道转置模块和S2114即特征数据位置嵌入模块；

S212、所述3D图像特征提取网络模型从所述3D图像间接提取包含有3D空间信息的3D图像的1D特征数据，依次具体包括：S2121即3D图像3D特征提取模块、S2122即特征数据维度转换模块、S2123即3D图像1D特征与通道转置模块和S2124即特征数据位置嵌入模块；

所述特征提取模型S21与实施例1中所述特征提取模型S21完全相同。

S3、将所述包含2D空间信息的2D图像的特征数据及所述包含3D空间信息的3D图像的特征数据输入到预先训练的配准模型中，对所述包含空间信息的2D图像的特征数据及所述包含空间信息的3D图像的特征数据进行配准，得到配准所述2D图像与所述3D图像的空间变换。

图4显示了S3中配准模型S32的网络结构，具体包括：特征通道归一化网络、特征组合网络、特征解析网络和空间变换输出网络，其中：

S321、特征通道归一化网络，用于将所述包含2D空间信息的2D图像的1D特征通道和所述包含3D空间信息的3D图像的1D特征通道归一化为相同的通道数；归一化后的通道数d₀取值为所述包含空间信息的2D图像的1D特征序列长度d₂和所述包含空间信息的3D图像的1D特征序列长度d₃的几何平均数；

S322、特征组合网络，用于将所述包含2D空间信息的2D图像的1D特征数据X₂和所述包含3D空间信息的3D图像的1D特征数据X₃组合起来，得到组合特征Y＝[X₂；X₃]；组合特征Y的通道数保持所述归一化后的通道数d₀不变，组合特征Y的序列长度S＝S₂+S₃,S₂和S₃分别表示特征X₂和X₃的序列长度；也可以如前述实施例1中S3131一样进行特征组合；

S323、特征解析网络，用于解析组合特征Y；采用组合特征Y的自注意力对Y进行解析，组合特征Y的自注意力计算公式如下：

其中，

表示组合特征Y经自注意力网络解析后得到的解析特征；W_Q，W_K和W_V为待训练的自注意力网络参数，d₀为所述组合特征Y的通道数；

S324、空间变换输出网络，用于输出配准空间变换；所述空间变换输出网络由一个卷积层和一个全连接网络构成；先通过一个卷积层，将解析特征的通道数调整为1；再通过由全连接层、激活层、标准化层组成的全连接网络，输出配准所述2D图像与所述3D图像的空间变换。

以上即为本发明实施例2提供的一种2D和3D图像配准方法的具体实施方式。相较于现有2D与3D图像配准技术，此方法直接在输入的待配准图像对上进行图像配准，无需任何配准前的图像预处理工作，最大程度简化了2D和3D图像配准的流程。

实施例3

S1、获取待配准的一幅2D图像和一幅3D图像。

S2、将所述2D图像和3D图像分别输入预先训练的2D图像特征提取网络模型和3D图像特征提取网络模型中，获取包含2D空间信息的2D图像的特征数据和包含3D空间信息的3D图像的特征数据，所述2D图像的特征数据与所述3D图像的特征数据具有相同的空间维度。

图5显示了步骤S2中特征提取模型S22的网络结构，包括2D图像特征提取网络模型和3D图像特征提取网络模型，其中：

S221、2D图像特征提取网络模型，从所述2D图像直接提取包含有2D空间信息的2D图像的1D特征数据，具体包括：n1个2D图像处理单元和1个时间卷积单元；其中，每个2D图像处理单元由n2个卷积单元和1个最大池化单元组成；每个卷积单元又包括：一个卷积核大小为3*3和步长为1的卷积层、一个批标准化层和一个激活层；每个最大池化单元由一个卷积核大小为3*3、步长为2的最大池化层构成；每个时间卷积单元则由一个卷积核大小为n3*n3、步长为1的时间卷积层构成；n1、n2和n3的取值依据需要自行确定；

S222、3D图像特征提取网络模型，从所述3D图像直接提取包含有3D空间信息的3D图像的1D特征数据，具体包括：n4个3D图像处理单元和1个时间卷积单元；其中，每个3D图像处理单元由n5个卷积单元和1个最大池化单元组成；每个卷积单元又包括：一个卷积核大小为3*3*3和步长为1的卷积层、一个批标准化层和一个激活层；每个池化单元由一个卷积核大小为3*3*3、步长为2的最大池化层构成；每个时间卷积单元则由一个卷积核大小为n6*n6*n6、步长为1的时间卷积层构成；n4、n5和n6的取值依据需要自行确定。

图3显示了S3中配准模型S31的网络结构，依次包括：S311即特征长度归一化网络、S312即特征交叉融合网络和S313即空间变换计算网络，其中：

S312、所述特征交叉融合网络包括：S3121即2D到3D图像交叉融合特征计算网络和S3122即3D到2D图像交叉融合特征计算网络；

S313、所述空间变换计算网络包括：S3131即特征组合模型、S3132即特征解析网络和S3133空间变换输出网络；

所述配准模型S31与实施例1中所述配准网络模型S31完全相同。

以上即为本发明实施例3提供的一种2D和3D图像配准方法的具体实施方式。相较于现有2D与3D图像配准技术，此方法直接在输入的待配准图像对上进行图像配准，无需任何配准前的图像预处理工作，最大程度简化了2D和3D图像配准的流程。

实施例4

S1、获取待配准的一幅2D图像和一幅3D图像。

S2、将所述2D图像和3D图像分别输入预先训练的2D图像特征提取网络模型和3D图像特征提取网络模型中，获取包含2D空间信息的2D图像的特征数据和包含3D空间信息的3D图像的特征数据，所述包含空间信息的2D图像的特征数据与所述包含空间信息的3D图像特征具有相同的空间维度；

图5显示了步骤S2中特征提取模型S22的网络结构，包括2D图像特征提取网络模型S221和3D图像特征提取网络模型S222，其中：

S221、2D图像特征提取网络模型从所述2D图像直接提取包含有2D空间信息的2D图像的1D特征数据；

S222、3D图像特征提取网络模型从所述3D图像直接提取包含有3D空间信息的3D图像的1D特征数据；

所述特征提取模型S22与实施例3中所述特征提取模型S22完全相同。

S3、将所述包含2D空间信息的2D图像的特征数据及所述包含3D空间信息的3D图像的特征数据输入到预先训练的配准模型中，对所述包含空间信息的2D图像的特征数据及所述包含空间信息的3D图像的特征数据进行配准，得到配准所述2D图像与所述3D图像的空间变换；

图4显示了S3中配准模型S32的网络结构，依次包括：S321即特征通道归一化网络、S322即特征组合网络、S323即特征解析网络和S324即空间变换输出网络；

所述配准模型S32与实施例2中所述配准模型S32完全相同。

以上即为本发明实施例4提供的一种2D和3D图像配准方法的具体实施方式。相较于现有2D与3D图像配准技术，此方法直接在输入的待配准图像对上进行图像配准，无需任何配准前的图像预处理工作，最大程度简化了2D和3D图像配准的流程。

实施例5

基于实施例1提供的一种2D和3D图像配准方法，本发明实施例提供了一种2D和3D图像配准装置，其结构示意图如图6所示，该装置包括以下单元：

图像获取单元D1，获取待配准的一幅2D图像和一幅3D图像。

特征提取单元D2，将所述2D图像和3D图像分别输入预先训练的2D图像特征提取子单元和3D图像特征提取子单元中，获取包含2D空间信息的2D图像的特征数据和包含3D空间信息的3D图像的特征数据，所述包含空间信息的2D图像的特征数据与所述包含空间信息的3D图像的特征数据具有相同的空间维度；

图7显示了D2中特征提取单元D21的结构，包括2D图像特征提取子单元D211和3D图像特征提取子单元D212两个部分，其中：

2D图像特征提取子单元D211，用于：从所述2D图像间接提取包含有2D空间信息的2D图像的1D特征数据，2D图像特征提取子单元D211依次具体包括：

2D图像2D特征提取子单元D2111，采用2D图像卷积神经网络提取2D图像的2D特征数据，2D图像卷积神经网络由输入层、卷积层、激活函数、池化层、全连接层组成；

特征数据维度转换子单元D2112，用于将所述2D图像的2D特征数据转换成1D特征数据，采用公式(20)进行转换：

这里f表示2D图像的2D特征数据，L₂*W₂为2D图像的2D特征数据大小，d₂表示2D图像的2D特征的通道数；

2D图像1D特征与通道转置子单元D2113，采用公式(21)对2D图像的1D特征与通道进行转置：

表示转置前的2D图像的1D特征数据，

表示转置后的2D图像的1D特征数据；

特征数据位置嵌入子单元D2114，用于对所述转置后2D图像的1D特征数据的位置信息进行编码，并将位置编码嵌入到所述转置后的2D图像的1D特征数据中；

首先，采用如下公式进行位置编码：

其中，PE表示位置编码函数；S₂为转置后2D图像的1D特征的通道数；i表示特征值在2D图像的1D特征序列中的位置，i＝0，1，…，d₂-1；j表示特征值在2D图像的1D特征通道中的位置，j＝0，1，…，S₂-1；

其中，

3D图像特征提取子单元D212，用于：从所述3D图像间接提取包含有3D空间信息的3D图像的1D特征数据，所述3D图像特征提取子单元D212依次具体包括：

3D图像3D特征提取子单元D2121，采用3D图像卷积神经网络提取3D图像的3D特征数据，3D图像卷积神经网络由输入层、卷积层、激活函数、池化层、全连接层组成；

特征数据维度转换子单元D2122，用于将所述3D图像的3D特征数据转换成1D特征数据，采用公式(25)进行转换：

表示转换后的3D图像的1D特征数据，S₃＝L₃*W₃*H₃表示转换后的3D图像的1D特征长度；

3D图像1D特征与通道转置子单元D2123，采用公式(26)对3D图像的特征与通道进行转置：

表示转置前的3D图像的1D特征数据，

表示转置后的3D图像的1D特征数据；

特征数据位置嵌入子单元D2124，用于对所述转置后的3D图像的1D特征数据的位置信息进行编码，并将位置编码嵌入到所述3D图像的1D特征数据中；

首先，采用如下公式进行位置编码：

其中，

图像配准单元D3，将所述包含2D空间信息的2D图像的特征数据及所述包含3D空间信息的3D图像的特征数据输入到预先训练的配准单元中，对所述包含空间信息的2D图像的特征数据及所述包含空间信息的3D图像的特征数据进行配准，得到配准所述2D图像与所述3D图像的空间变换。

图8显示了D3中图像配准单元D31的网络结构，图像配准单元D31依次包括：特征长度归一化子单元D311、特征交叉融合子单元D312和空间变换计算子单元D313，其中：

特征长度归一化子单元D311：

采用一维卷积网络，将所述包含空间信息的2D图像的1D特征序列和所述包含空间信息的3D图像的1D特征序列分别归一化为相同的序列长度；归一化后的序列长度S₀取值靠近所述包含空间信息的2D图像的1D特征序列长度和所述包含空间信息的3D图像的1D特征序列长度的几何平均数，同时能被后述多头交叉注意力网络中的头数所整除。

特征交叉融合子单元D312：

2D图像到3D图像交叉融合特征计算子单元D3121，采用2D到3D图像的多头交叉注意力网络，将长度归一化后的包含空间信息的2D图像的1D特征数据

传递给长度归一化后的包含空间信息的3D图像的1D特征数据

表示为将

传递给

的第i头交叉注意力网络层，

表示为将

通过第i头注意力网络传递给

后得到的第i头交叉融合特征，

表示

传递给

的第i-1头交叉融合特征，

表示最终得到的

传递给

的第i头交叉融合特征，

表示由θ参数化的第i头交叉注意力网络的前馈层；

其中，

和

3D图像到2D图像交叉融合特征计算子单元D3122，采用3D到2D图像的多头交叉注意力网络，将长度归一化后的包含空间信息的3D图像的1D特征数据

传递给长度归一化后的包含空间信息的2D图像的1D特征数据

表示为将

传递给

的第i头交叉注意力网络层，

表示为将

通过第i头注意力网络传递给

后得到的第i头交叉融合特征，

表示

传递给

的第i-1头交叉融合特征，

表示最终得到的

传递给

的第i头交叉融合特征，

表示由θ参数化的第i头交叉注意力网络的前馈层。

空间变换计算子单元D313：

用于计算配准所述2D图像与所述3D图像的空间变换，具体结构如下：

特征组合子单元D3131，将所述2D图像到3D图像的交叉融合特征X_2-3与所述3D图像到2D图像的交叉融合特征X_3-2组合为特征X，X＝[X_3-2；X_2-3]，组合特征X的序列长度保持所述归一化后的序列长度S₀不变，组合特征X的通道数d＝2d_v,d_v表示交叉注意力网络中值的通道数，具体取值依据模型需要自行设定；也可以如后述实施例2中S322一样进行特征组合；

特征解析子单元D3132，采用自注意力网络对组合特征X进行解析，组合特征X的自注意力计算公式如下：

其中，

空间变换输出子单元D3133，先通过一个卷积层，将解析特征的通道数调整为1；再通过一个由全连接层、激活层、标准化层组成的全连接网络，输出配准所述2D图像与所述3D图像的空间变换。

图像叠加单元D4，基于所述空间变换，将所述3D图像映射并叠加到所述2D图像对应空间位置上。

以上即为本发明实施例5提供的一种2D和3D图像配准装置的具体结构。相较于现有2D与3D图像配准技术，此装置直接在输入的待配准图像对上进行图像配准，没有在配准前对待配准的2D图像或3D图像做任何的图像预处理，避开了繁琐、耗时、难以满足条件等诸多配准前的预处理工作，最大程度简化了2D和3D图像配准的流程。

实施例6

基于实施例2提供的一种2D和3D图像配准方法，本发明实施例提供了一种2D和3D图像配准装置，其结构示意图如图6所示，该装置包括以下单元：

图像获取单元D1，用于：获取待配准的一幅2D图像和一幅3D图像。

特征提取单元D2，用于：将所述2D图像和3D图像分别输入预先训练的2D图像特征提取子单元和3D图像特征提取子单元中，获取包含2D空间信息的2D图像的特征数据和包含3D空间信息的3D图像的特征数据，所述包含空间信息的2D图像的特征数据与所述包含空间信息的3D图像的特征数据具有相同的空间维度。

图7显示了D2中特征提取单元D21的结构，包括有2D图像特征提取子单元D211和3D图像特征提取子单元D212，其中：

2D图像特征提取子单元D211，用于：从所述2D图像间接提取包含有2D空间信息的2D图像的1D特征数据，依次具体包括：2D图像2D特征提取子单元D2111，特征数据维度转换子单元D2112、2D图像1D特征与通道转置子单元D2113和特征数据位置嵌入子单元D2114；

3D图像特征提取子单元D212，用于：从所述3D图像间接提取包含有3D空间信息的3D图像的1D特征数据，依次具体包括：3D图像3D特征提取子单元D2121、特征数据维度转换子单元D2122、3D图像1D特征与通道转置子单元D2123和特征数据位置嵌入子单元D2124；

所述特征提取单元D21与实施例5中所述特征提取单元D21完全相同。

图像配准单元D3，用于：将所述包含2D空间信息的2D图像的特征数据及所述包含3D空间信息的3D图像的特征数据输入到预先训练的配准单元中，对所述包含空间信息的2D图像的特征数据及所述包含空间信息的3D图像的特征数据进行配准，得到配准所述2D图像与所述3D图像的空间变换。

图9显示了D3中图像配准单元D32的网络结构，具体包括：特征通道归一化子单元D321、特征组合子单元D322、特征解析子单元D323和空间变换输出子单元D324，其中：

特征通道归一化子单元D321，用于：将所述包含空间信息的2D图像的1D特征通道和所述包含空间信息的3D图像的1D特征通道归一化为相同的通道数；归一化后的通道数d₀取值为所述包含空间信息的2D图像的1D特征序列长度d₂和所述包含空间信息的3D图像的1D特征序列长度d₃的几何平均数；

特征组合子单元D322，用于：将所述包含空间信息的2D图像的1D特征数据X₂和所述包含空间信息的3D图像的1D特征数据X₃组合起来，得到组合特征Y＝[X₂；X₃]；组合特征Y的通道数保持所述归一化后的通道数d₀不变，组合特征Y的序列长度S＝S₂+S₃,S₂和S₃分别表示特征X₂和X₃的序列长度；也可以如前述实施例5中D3131一样进行特征组合；

特征解析子单元D323，用于：解析组合特征Y；采用组合特征Y的自注意力对Y进行解析，组合特征Y的自注意力计算公式如下：

其中，

空间变换输出子单元D324，用于：输出配准空间变换；空间变换输出子单元D324由一个卷积层和一个全连接网络构成；先通过一个卷积层，将解析特征的通道数调整为1；再通过由全连接层、激活层、标准化层组成的全连接网络，输出配准所述2D图像与所述3D图像的空间变换。

图像叠加单元D4，用于：基于所述空间变换，将所述3D图像映射并叠加到所述2D图像对应空间位置上。

以上即为本发明实施例6提供的一种2D和3D图像配准装置的具体结构。相较于现有2D与3D图像配准技术，此装置直接在输入的待配准图像对上进行图像配准，无需任何配准前的图像预处理工作，最大程度简化了2D和3D图像配准的流程。

实施例7

基于实施例3提供的一种2D和3D图像配准方法，本发明实施例提供了一种2D和3D图像配准装置，其结构示意图如图6所示，该装置包括以下单元：

特征提取单元D2，用于：将所述2D图像和3D图像分别输入预先训练的2D图像特征提取网络模型和3D图像特征提取网络模型中，获取包含2D空间信息的2D图像的特征数据和包含3D空间信息的3D图像的特征数据，所述包含空间信息的2D图像的特征数据与所述包含空间信息的3D图像的特征数据具有相同的空间维度。

图10显示了D2中特征提取单元D22的结构，包括2D图像特征提取子单元D221和3D图像特征提取子单元D222，其中：

2D图像特征提取子单元D221，用于：从所述2D图像直接提取包含有2D空间信息的2D图像的1D特征数据，具体包括：n1个2D图像处理单元和1个时间卷积单元；其中，每个2D图像处理单元由n2个卷积单元和1个最大池化单元组成；每个卷积单元又包括：一个卷积核大小为3*3和步长为1的卷积层、一个批标准化层和一个激活层；每个最大池化单元由一个卷积核大小为3*3、步长为2的最大池化层构成；每个时间卷积单元则由一个卷积核大小为n3*n3、步长为1的时间卷积层构成；n1、n2和n3的取值依据需要自行确定；

3D图像特征提取子单元D222，用于：从所述3D图像直接提取包含有3D空间信息的3D图像的1D特征数据，具体包括：n4个3D图像处理单元和1个时间卷积单元；其中，每个3D图像处理单元由n5个卷积单元和1个最大池化单元组成；每个卷积单元又包括：一个卷积核大小为3*3*3和步长为1的卷积层、一个批标准化层和一个激活层；每个池化单元由一个卷积核大小为3*3*3、步长为2的最大池化层构成；每个时间卷积单元则由一个卷积核大小为n6*n6*n6、步长为1的时间卷积层构成；n4、n5和n6的取值依据需要自行确定。

图8显示了D3中图像配准单元D31的结构，依次包括：特征长度归一化子单元D311、特征交叉融合子单元D312和空间变换计算子单元D313，其中：

特征交叉融合子单元D312包括：2D到3D图像交叉融合特征计算子单元D3121和3D到2D图像交叉融合特征计算子单元D3122；

空间变换计算子单元D313，包括：特征组合子单元D3131、特征解析子单元D3132 z和空间变换输出子单元D3133；

所述图像配准单元D31与实施例5中所述图像配准单元D31结构完全相同。

以上即为本发明实施例7提供的一种2D和3D图像配准装置的具体结构。相较于现有2D与3D图像配准技术，此装置直接在输入的待配准图像对上进行图像配准，无需任何配准前的图像预处理工作，最大程度简化了2D和3D图像配准的流程。

实施例8

基于实施例4提供的一种2D和3D图像配准方法，本发明实施例提供了一种2D和3D图像配准装置，其结构示意图如图6所示，该装置包括以下单元：

特征提取单元D2，用于：将所述2D图像和3D图像分别输入预先训练的2D图像特征提取子单元和3D图像特征提取子单元中，获取包含2D空间信息的2D图像的特征数据和包含3D空间信息的3D图像的特征数据，所述包含空间信息的2D图像的特征数据与所述包含空间信息的3D图像的特征数据具有相同的空间维度；

图10显示了D2中特征提取单元D22的网络结构，包括：2D图像特征提取子单元D221和3D图像特征提取子单元D222，其中：

2D图像特征提取子单元D221，用于：从所述2D图像直接提取包含有2D空间信息的2D图像的1D特征数据；

3D图像特征提取子单元D222，用于：从所述3D图像直接提取包含有3D空间信息的3D图像的1D特征数据；

所述特征提取单元D22与实施例3中所述特征提取单元D22完全相同。

图像配准单元D3，用于：将所述包含2D空间信息的2D图像的特征数据及所述包含3D空间信息的3D图像的特征数据输入到预先训练的配准单元中，对所述包含空间信息的2D图像的特征数据及所述包含空间信息的3D图像的特征数据进行配准，得到配准所述2D图像与所述3D图像的空间变换；

图9显示了D3中配准模型D32的网络结构，依次包括：特征通道归一化子单元D321、特征组合子单元D322、特征解析子单元D323和空间变换输出子单元D324；

图像配准模型D32与实施例6中所述配准模型D32完全相同。

以上即为本发明实施例8提供的一种2D和3D图像配准装置的具体结构。相较于现有2D与3D图像配准技术，此装置直接在输入的待配准图像对上进行图像配准，无需任何配准前的图像预处理工作，最大程度简化了2D和3D图像配准的流程。

上述实施例将2D和3D图像皆拉伸为1D特征数据后进行配准，也可以从2D图像中提取2D特征数据，从3D图像中提取2D特征数据，然后在2D图像的2D特征数据和3D图像的2D特征数据上进行配准，同样也可以避开配准前的图像预处理工作。

以上所述仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制。虽然本发明以较佳实施例揭露如上，然而并非用以限定本发明。任何熟悉本领域的技术人员，在不脱离本发明技术方案范围情况下，都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰，或修改为等同变化的等效实施例。因此，凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰，均仍属于本发明技术方案保护的范围内。

Claims

1.一种2D与3D图像配准方法，其特征在于，包括：

获取待配准的一幅2D图像和一幅3D图像；

2.根据权利要求1所述的方法，其特征在于，将所述2D图像和3D图像分别输入预先训练的2D图像特征提取网络模型和3D图像特征提取网络模型中，获取包含2D空间信息的2D图像的特征数据和包含3D空间信息的3D图像特征，所述2D图像的特征数据与所述3D图像的特征数据具有相同的维度，其中：

所述2D图像特征提取网络模型从所述2D图像间接提取包含有2D空间信息的2D图像1D特征，所述2D图像特征提取网络模型依次具体包括：2D图像2D特征提取模块、特征数据维度转换模块，和特征数据位置嵌入模块，其中：

所述2D图像2D特征提取模块，采用2D图像卷积神经网络提取2D图像的2D特征数据，2D图像卷积神经网络由输入层、卷积层、激活函数、池化层、全连接层组成；

所述特征数据维度转换模块，用于将所述2D图像的2D特征数据转换成1D特征数据，采用公式(1)进行转换：

所述特征数据位置嵌入模块，用于对所述2D图像的1D特征数据的位置信息进行编码，并将位置编码嵌入到所述2D图像的1D特征数据中；

首先，采用如下公式进行位置编码：

其中，PE表示位置编码函数；d₂表示2D图像的1D特征数据的通道数，即所述2D图像的2D特征数据的通道数；i表示特征值在2D图像的1D特征序列中的位置，i＝0，1，…，S₂-1；j表示特征值在2D图像的1D特征通道中的位置，j＝0，1，…，d₂-1；

其中，

表示2D图像的1D特征数据，d₂表示2D图像的1D特征数据的通道数，X₂表示嵌入位置编码后的2D图像的1D特征数据；

所述3D图像特征提取网络模型从所述3D图像间接提取包含有3D空间信息的3D图像的1D特征数据，所述3D图像特征提取网络模型依次具体包括：3D图像3D特征提取模块、特征数据维度转换模块、和特征数据位置嵌入模块，其中：

所述3D图像3D特征提取模块，采用3D图像卷积神经网络提取3D图像的3D特征数据，3D图像卷积神经网络由输入层、卷积层、激活函数、池化层、全连接层组成；

所述特征数据维度转换模块，用于将所述3D图像的3D特征数据转换成1D特征数据，采用公式(5)进行转换：

这里f表示3D图像的3D特征数据，L₃*W₃*H₃为3D图像的3D特征数据大小，d₃表示3D图像的3D特征数据的通道数；

所述特征数据位置嵌入模块，用于对所述3D图像的1D特征数据的位置信息进行编码，并将位置编码嵌入到所述3D图像的1D特征数据中；

首先，采用如下公式进行位置编码：

其中，PE表示位置编码函数，d₃表示3D图像的1D特征数据的通道数，即所述3D图像的3D特征数据的通道数,i表示特征值在3D图像的1D特征序列中的位置i＝0，1，…，S₃-1；j表示特征值在3D图像的1D特征通道中的位置，j＝0，1，…，d₃-1；

其中，

表示3D图像的1D特征数据，d₃表示3D图像的1D特征数据的通道数，X₃表示嵌入位置编码后的3D图像的1D特征数据。

3.根据权利要求2所述的方法，其特征在于，在所述2D图像特征提取网络模型的特征数据维度转换模块和特征数据位置嵌入模块之间增加一个2D图像1D特征与通道转置模块，在所述3D图像特征提取网络模型的特征数据维度转换模块和特征数据位置嵌入模块之间增加一个3D图像1D特征与通道转置模块；

采用公式(9)分别对2D图像和3D图像的1D特征与通道进行转置：

XT(n，m)＝X_(S，d) ^T(m，n) (9)

其中S为转置前1D特征序列长度，d为转置前1D特征的通道数，m＝0，1，…，S-1；n＝0，1，…，d-1,X表示转置前的1D特征数据，XT表示转置后的1D特征数据；

特征与通道转置之后，位置嵌入随之调整。

4.根据权利要求1所述的方法，其特征在于，将所述2D图像和3D图像分别输入预先训练的2D图像特征提取网络模型和3D图像特征提取网络模型中，获取包含2D空间信息的2D图像的特征数据和包含3D空间信息的3D图像的特征数据所述2D图像的特征数据与所述3D图像的特征数据具有相同的维度，其中：

所述2D图像特征提取网络模型从所述2D图像直接提取包含有2D空间信息的2D图像1D特征，所述2D图像特征提取网络模型具体包括：n1个2D图像处理单元和1个时间卷积单元；其中，每个2D图像处理单元由n2个卷积单元和1个最大池化单元组成；每个卷积单元又包括：一个卷积核大小为3*3和步长为1的卷积层、一个批标准化层和一个激活层；每个最大池化单元由一个卷积核大小为3*3、步长为2的最大池化层构成；每个时间卷积单元则由一个卷积核大小为n3*n3、步长为1的时间卷积层构成；n1、n2和n3的取值依据需要自行确定；

所述3D图像特征提取网络模型从所述3D图像直接提取包含有3D空间信息的3D图像1D特征，所述3D图像特征提取网络模型具体包括：n4个3D图像处理单元和1个时间卷积单元；其中，每个3D图像处理单元由n5个卷积单元和1个最大池化单元组成；每个卷积单元又包括：一个卷积核大小为3*3*3和步长为1的卷积层、一个批标准化层和一个激活层；每个池化单元由一个卷积核大小为3*3*3、步长为2的最大池化层构成；每个时间卷积单元则由一个卷积核大小为n6*n6*n6、步长为1的时间卷积层构成；n4、n5和n6的取值依据需要自行确定。

5.根据权利要求3或4所述的方法，其特征在于，将所述包含2D空间信息的2D图像的特征数据及所述包含3D空间信息的3D图像的特征数据输入到预先训练的配准模型中，对所述包含空间信息的2D图像的特征数据及所述包含空间信息的3D图像的特征数据进行配准，得到配准所述2D图像与所述3D图像的空间变换，其中，

所述配准模型依次包括：特征长度归一化网络、特征交叉融合网络和空间变换计算网络；

所述特征长度归一化网络；

采用一维卷积网络，将所述包含2D空间信息的2D图像的1D特征序列和所述包含3D空间信息的3D图像的1D特征序列分别归一化为相同的序列长度；归一化后的序列长度S₀取值靠近所述包含空间信息的2D图像的1D特征序列长度S₂和所述包含空间信息的3D图像的1D特征序列长度S₃的几何平均数，同时能被后述多头交叉注意力网络中的头数所整除；

所述特征交叉融合网络；

采用多头交叉注意力网络，学习从2D图像到3D图像的交叉融合特征和从3D图像到2D图像的交叉融合特征，具体包括：2D图像到3D图像交叉融合特征计算网络和3D图像到2D图像交叉融合特征计算网络：

所述2D图像到3D图像交叉融合特征计算网络，采用2D到3D图像的多头交叉注意力网络，将长度归一化后的包含2D空间信息的2D图像的1D特征数据

传递给长度归一化后的包含3D空间信息的3D图像的1D特征数据

表示为将

传递给

的第i头交叉注意力网络层，

表示为将

通过第i头注意力网络传递给

后得到的第i头交叉融合特征，

表示

传递给

的第i-1头交叉融合特征，

表示最终得到的

传递给

的第i头交叉融合特征，

表示由θ参数化的第i头交叉注意力网络的前馈层；

其中，

和

所述3D图像到2D图像交叉融合特征计算网络，采用3D到2D图像的多头交叉注意力网络，将长度归一化后的包含3D空间信息的3D图像的1D特征数据

传递给长度归一化后的包含2D空间信息的2D图像的1D特征数据

表示为将

传递给

的第i头交叉注意力网络层，

表示为将

通过第i头注意力网络传递给

后得到的第i头交叉融合特征，

表示

传递给

的第i-1头交叉融合特征，

表示最终得到的

传递给

的第i头交叉融合特征，

表示由θ参数化的第i头交叉注意力网络的前馈层；

所述空间变换计算网络，用于计算配准所述2D图像与所述3D图像的空间变换，具体如下：

步骤A、将所述2D图像到3D图像的交叉融合特征X_2-3与所述3D图像到2D图像的交叉融合特征X_3-2组合为特征X，X＝[X_3-2；X_2-3]，组合特征X的序列长度保持所述归一化后的序列长度S₀不变，组合特征X的通道数d＝2d_v；d_v表示交叉注意力网络中值的通道数，具体取值依据模型需要自行设定；

步骤B、采用自注意力网络对组合特征X进行解析，组合特征X的自注意力计算公式如下：

其中，

步骤C、先通过一个卷积层，将解析特征的通道数调整为1；再通过一个由全连接层、激活层、标准化层组成的全连接网络，输出配准所述2D图像与所述3D图像的空间变换。

6.根据权利要求3或4所述的方法，其特征在于，将所述包含2D空间信息的2D图像的特征数据及所述包含3D空间信息的3D图像的特征数据输入到预先训练的配准模型中，对所述包含空间信息的2D图像的特征数据及所述包含空间信息的3D图像的特征数据进行配准，得到配准所述2D图像与所述3D图像的空间变换，其中：

所述配准模型依次包括：特征通道归一化网络、特征组合网络、特征解析网络和空间变换输出网络，其中：

所述特征通道归一化网络，用于将所述包含空间信息的2D图像的1D特征通道和所述包含空间信息的3D图像的1D特征通道归一化为相同的通道数；归一化后的通道数d₀取值为所述包含空间信息的2D图像的1D特征序列长度d₂和所述包含空间信息的3D图像的1D特征序列长度d₃的几何平均数；

所述特征组合网络，用于将所述包含空间信息的2D图像的1D特征数据X₂和所述包含空间信息的3D图像的1D特征数据X₃组合起来，得到组合特征Y＝[X₂；X₃]；组合特征Y的通道数保持所述归一化后的通道数d₀不变，组合特征Y的序列长度S＝S₂+S₃,S₂和S₃分别表示特征X₂和X₃的序列长度；

所述特征解析网络，用于解析组合特征Y；采用组合特征Y的自注意力对Y进行解析，组合特征Y的自注意力计算公式如下：

其中，

所述空间变换输出网络，用于输出配准空间变换；所述空间变换输出网络由一个卷积层和一个全连接网络构成；先通过一个卷积层，将解析特征的通道数调整为1；再通过由全连接层、激活层、标准化层组成的全连接网络，输出配准所述2D图像与所述3D图像的空间变换。

7.一种2D与3D图像配准装置，其特征在于，包括：

图像获取单元，用于：获取待配准的一幅2D图像和一幅3D图像；

特征提取单元，用于：将所述2D图像和3D图像分别输入预先训练的2D图像特征提取子单元和3D图像特征提取子单元中，获取包含2D空间信息的2D图像的特征数据和包含3D空间信息的3D图像的特征数据，所述2D图像的特征数据与所述3D图像的特征数据具有相同的维度；

图像配准单元，用于：将所述包含2D空间信息的2D图像的特征数据及所述包含3D空间信息的3D图像的特征数据输入到预先训练的配准单元中，对所述包含空间信息的2D图像的特征数据及所述包含空间信息的3D图像的特征数据进行配准，得到配准所述2D图像与所述3D图像的空间变换；

8.根据权利要求7所述的装置，其特征在于，所述特征提取单元包括：2D图像特征提取子单元1和3D图像特征提取子单元1，其中：

所述2D图像特征提取子单元1从所述2D图像间接提取包含有2D空间信息的2D图像的1D特征数据，所述2D图像特征提取子单元1依次具体包括：2D图像2D特征提取子单元、特征数据维度转换子单元，和特征数据位置嵌入子单元，其中：

所述2D图像2D特征提取子单元，用于：提取2D图像的2D特征数据；采用2D图像卷积神经网络提取2D图像的2D特征数据，2D图像卷积神经网络由输入层、卷积层、激活函数、池化层、全连接层组成；

所述特征数据维度转换子单元，用于：将所述2D图像的2D特征数据转换成1D特征数据，采用公式(19)进行转换：

所述特征数据位置嵌入子单元，用于：对所述2D图像的1D特征数据的位置信息进行编码，并将位置编码嵌入到所述2D图像的1D特征数据中；

首先采用如下公式进行位置编码：

其中，PE表示位置编码函数；d₂表示2D图像的1D特征数据的通道数，即所述2D图像的2D特征数据的通道数；i₂表示特征值在2D图像的1D特征序列中的位置，i₂＝0，1，…，s₂-1；j₂表示特征值在2D图像的1D特征通道中的位置，j₂＝0，1，…，d₂-1；

其中，

所述3D图像特征提取子单元1从所述3D图像间接提取包含有3D空间信息的3D图像的1D特征数据，所述3D图像特征提取子单元1依次具体包括：3D图像3D特征提取子单元、特征数据维度转换子单元，和特征数据位置嵌入子单元，其中：

所述3D图像3D特征提取子单元1，用于：提取3D图像的3D特征数据；采用3D图像卷积神经网络提取3D图像的3D特征数据，3D图像卷积神经网络由输入层、卷积层、激活函数、池化层、全连接层组成；

所述特征数据维度转换子单元，用于：将所述3D图像的3D特征数据转换成1D特征数据，采用公式(23)进行转换：

所述特征数据位置嵌入子单元，用于：对所述3D图像的1D特征数据的位置信息进行编码，并将位置编码嵌入到所述3D图像的1D特征数据中；

首先，采用如下公式进行位置编码：

其中，PE表示位置编码函数，d₃表示3D图像的1D特征数据的通道数，即所述3D图像的3D特征数据的通道数,i₃表示特征值在3D图像的1D特征序列中的位置，i₃＝0，1，…，S₃-1；j₃表示特征值在3D图像的1D特征通道中的位置，j₃＝0，1，…，d₃-1；

其中，

9.根据权利要求8所述的装置，其特征在于，在所述2D图像2D特征提取子单元中特征数据维度转换子单元和特征数据位置嵌入子单元之间增加一个2D图像1D特征与通道转置子单元，在所述3D图像3D特征提取子单元中特征数据维度转换子单元和特征数据位置嵌入子单元之间增加一个3D图像1D特征与通道转置子单元；

采用公式(27)分别对2D图像和3D图像的1D特征与通道进行转置：

XT(n，m)＝X_(s，d) ^T(m，n) (27)

其中S为转置前1D特征序列长度，d为转置前1D特征的通道数，m＝0，1，…，S-1；n＝0，1，…，d-1；X_(S，d)表示转置前的1D特征数据，XT表示转置后的1D特征数据；

特征与通道转置之后，位置嵌入随之调整。

10.根据权利要求7所述的装置，其特征在于，所述特征提取单元包括：2D图像特征提取子单元2和3D图像特征提取子单元2，其中：

所述2D图像特征提取子单元2，用于：从所述2D图像直接提取包含有2D空间信息的2D图像的1D特征数据；所述2D图像特征提取子单元2具体包括：n1个2D图像处理单元和1个时间卷积单元；其中，每个2D图像处理单元由n2个卷积单元和1个最大池化单元组成；每个卷积单元又包括：一个卷积核大小为3*3和步长为1的卷积层、一个批标准化层和一个激活层；每个最大池化单元由一个卷积核大小为3*3、步长为2的最大池化层构成；每个时间卷积单元则由一个卷积核大小为n3*n3、步长为1的时间卷积层构成；n1、n2和n3的取值依据需要自行确定；

所述3D图像特征提取子单元2，用于：从所述3D图像直接提取包含有3D空间信息的3D图像的1D特征数据；所述3D图像特征提取子单元2具体包括：n4个3D图像处理单元和1个时间卷积单元；其中，每个3D图像处理单元由n5个卷积单元和1个最大池化单元组成；每个卷积单元又包括：一个卷积核大小为3*3*3和步长为1的卷积层、一个批标准化层和一个激活层；每个池化单元由一个卷积核大小为3*3*3、步长为2的最大池化层构成；每个时间卷积单元则由一个卷积核大小为n6*n6*n6、步长为1的时间卷积层构成；n4、n5和n6的取值依据需要自行确定。

11.根据权利要求9或10所述的装置，其特征在于，所述配准单元依次包括：特征长度归一化子单元、特征交叉融合子单元，和空间变换计算子单元；

所述特征长度归一化子单元，用于：采用一维卷积网络，将所述包含2D空间信息的2D图像的1D特征序列和所述包含3D空间信息的3D图像的1D特征序列分别归一化为相同的序列长度；归一化后的序列长度S₀取值靠近所述包含空间信息的2D图像的1D特征序列长度S₂和所述包含空间信息的3D图像的1D特征序列长度S₃的几何平均数，同时能被后述多头交叉注意力网络中的头数所整除；

所述特征交叉融合子单元，用于：采用多头交叉注意力网络，学习从2D图像到3D图像的交叉融合特征和从3D图像到2D图像的交叉融合特征；所述特征交叉融合子单元具体又包括：2D图像到3D图像交叉融合特征计算子单元和3D图像到2D图像交叉融合特征计算子单元；

所述2D图像到3D图像交叉融合特征计算子单元，用于：学习从2D图像到3D图像的交叉融合特征；采用2D到3D图像的多头交叉注意力网络，将长度归一化后的包含2D空间信息的2D图像的1D特征数据

传递给长度归一化后的包含3D空间信息的3D图像的1D特征数据

表示为将

传递给

的第i头交叉注意力网络层，

表示为将

通过第i头注意力网络传递给

后得到的第i头交叉融合特征，

表示

传递给

的第i-1头交叉融合特征，

表示最终得到的

传递给

的第i头交叉融合特征，

表示由θ参数化的第i头交叉注意力网络的前馈层；

其中，

和

所述3D图像到2D图像交叉融合特征计算网络，采用3D到2D图像的多头交叉注意力网络，将长度归一化后的包含3D空间信息的3D图像的1D特征

传递给长度归一化后的包含2D空间信息的2D图像的1D特征数据

表示为将

传递给

的第i头交叉注意力网络层，

表示为将

通过第i头注意力网络传递给

后得到的i头交叉融合特征，

表示

传递给

的第i-1头交叉融合特征，

表示最终得到的

传递给

的第i头交叉融合特征，

表示由θ参数化的第i头交叉注意力网络的前馈层；

所述空间变换计算子单元，用于：输出配准所述2D图像与所述3D图像的空间变换，具体包括：

特征组合子单元1，用于：将所述2D图像到3D图像的交叉融合特征X_2-3与所述3D图像到2D图像的交叉融合特征X_3-2组合为特征X，X＝[X_3-2；X_2-3]，组合特征X的序列长度保持所述归一化后的序列长度S₀不变，组合特征X的通道数d＝2d_v,d_v表示交叉注意力网络中值的通道数，具体取值依据模型需要自行设定；

特征解析子单元1，用于：解析所述组合特征X；采用组合特征X的自注意力对所述组合特征X进行解析，所述组合特征X的自注意力计算公式如下：

其中，

空间变换输出单元1，用于：输出配准空间变换；所述空间变换输出子单元1由一个卷积层和一个全连接网络构成；先通过一个卷积层，将解析特征的通道数调整为1；再通过一个由全连接层、激活层、标准化层组成的全连接网络，输出配准所述2D图像与所述3D图像的空间变换。

12.根据权利要求9或10所述的装置，其特征在于，所述配准单元依次包括：特征通道归一化子单元、特征组合子单元2、特征解析子单元2，和空间变换输出子单元2；

所述特征通道归一化子单元，用于：将所述包含2D空间信息的2D图像的1D特征通道和所述包含3D空间信息的3D图像的1D特征通道归一化为相同的通道数；归一化后的通道数d₀取值为所述包含空间信息的2D图像的1D特征序列长度d₂和所述包含空间信息的3D图像的1D特征序列长度d₃的几何平均数；

所述特征组合子单元2，用于：将所述包含2D空间信息的2D图像1D特征X₂和所述包含3D空间信息的3D图像1D特征X₃组合起来，得到组合特征Y＝[X₂；X₃]；组合特征Y的通道数保持所述归一化后的通道数d₀不变，组合特征Y的序列长度S＝S₂+S₃，S₂和S₃分别表示特征X₂和X₃的序列长度；

所述特征解析子单元2，用于：解析组合特征Y；采用组合特征Y的自注意力对Y进行解析，组合特征Y的自注意力计算公式如下：

其中，

所述空间变换输出子单元2，用于：输出配准空间变换；所述空间变换输出子单元2由一个卷积层和一个全连接网络构成；先通过一个卷积层，将解析特征的通道数调整为1；再通过一个由全连接层、激活层、标准化层组成的全连接网络，输出配准所述2D图像与所述3D图像的空间变换。