CN112650974B

CN112650974B - 一种高效的转置卷积计算方法

Info

Publication number: CN112650974B
Application number: CN202011617770.2A
Authority: CN
Inventors: 王中风; 杨培祥; 毛文东; 林军
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2020-12-30
Filing date: 2020-12-30
Publication date: 2023-10-13
Anticipated expiration: 2040-12-30
Also published as: CN112650974A

Abstract

本申请公开了一种高效的转置卷积计算方法，基于预设的转置卷积核的尺寸参数、转置卷积的步长和转换阶数确定转置卷积总体架构，对用于原特征图的提取的滑动窗口进行了设计，根据设计后的滑动窗口提取特征图子图，对所述特征图子图进行转换，转换转置卷积核，并进行计算，对中间子矩阵进行转换，进而获得转置卷积结果。本申请实现在不需要补零的操作下，对原特征图进行转置卷积运算，提高运算效率；提出转换阶数的设置，扩大适用范围，进一步降低计算复杂度。

Description

一种高效的转置卷积计算方法

技术领域

本申请涉及数据处理技术领域，尤其涉及一种高效的转置卷积计算方法。

背景技术

转置卷积是一种特殊的卷积，现有技术中，在用硬件加速器执行转置卷积运算之前，通常会先按照一定比例进行补零操作，来扩展输入特征图的尺寸，然后再进行卷积运算。

如图1所示，原先的输入特征图数据中相应位置被补入大量的零，白格为补入的零，扩展到尺寸相对较大的新特征图数据，然后通过滑动窗口在新特征图数据上按照设置的滑动步长进行数据提取，被提取的数据再与旋转后的转置卷积核进行相乘再求和，滑动窗口的尺寸与转置卷积核大小一致，被提取的数据为滑动窗口覆盖的数据，当滑动窗口滑过新特征图所有数据后，便得到转置卷积的计算结果。

现有方案通常需要在原输入特征图中插入大量的零，而这些零又都参与实际的运算，使得在处理数据时，增加了大量不必要的运算操作，降低对有效数据处理的速度，从而降低转置卷积的运算效率。

发明内容

本申请提供了一种高效的转置卷积计算方法，以解决转置卷积运算效率低的问题。

一种高效的转置卷积计算方法，包括：

基于预设的转置卷积核的尺寸参数、转置卷积的步长和转换阶数确定转置卷积总体架构；

将原特征图和所述转置卷积核输入所述转置卷积总体架构，输出转置卷积计算结果；

其中，所述转置卷积总体架构包括第一提取转换模块、转置卷积计算模块和第二转换输出模块；

所述第一提取转换模块包括提取单元、第一转换单元和第二转换单元，所述提取单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置滑动窗口的尺寸和滑动窗口的步长，然后根据所述滑动窗口的尺寸和所述滑动窗口的步长，利用滑动窗口机制在原特征图上提取多个特征图子图；所述第一转换单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第一转换矩阵，根据所述第一转换矩阵对所述转置卷积核进行转换，获得第二转置卷积核；所述第二转换单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第二转换矩阵，根据所述第二转换矩阵对所述特征图子图进行转换，获得第二特征图子矩阵；

所述转置卷积计算模块被配置为将所述第二特征图子矩阵与第二转置卷积核上的元素一一对应相乘，获得中间子矩阵；

所述第二转换输出模块被配置为包括第三转换单元和输出单元，所述第三转换单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第三转换矩阵，根据所述第三转换矩阵对所述中间子矩阵进行转换，获得输出子矩阵；所述输出单元将所述输出子矩阵依次排列成输出特征图，输出转置卷积计算结果。

具体地，所述根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第一转换矩阵，具体为：

根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第一转换矩阵的尺寸；

根据所述第一转换矩阵的尺寸设置所述第一转换矩阵；

所述根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第二转换矩阵，具体为：

根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第二转换矩阵的尺寸；

根据所述第二转换矩阵的尺寸设置所述第二转换矩阵；

所述根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第三转换矩阵，具体为：

根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第三转换矩阵的尺寸；

根据所述第三转换矩阵的尺寸设置所述第三转换矩阵。

具体地，根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数，通过计算公式获取各项参数，其中计算公式为：

E_r＝k+(r-1)×s

O_r＝s×r

S_r＝r

其中，k为所述转置卷积核的尺寸参数，s为所述转置卷积的步长，r为所述转换阶数，k、s和r均为正整数，为数学符号的上取整符号；

根据所述各项参数，确定所述第一转换矩阵的尺寸、所述第二转换矩阵的尺寸、所述第三转换矩阵的尺寸、所述滑动窗口的尺寸和所述滑动窗口的步长，

其中，

所述第一转换矩阵的尺寸为E_r×k；

所述第二转换矩阵的尺寸为I_r×E_r；

所述第三转换矩阵的尺寸为E_r×O_r；

在一维计算形式中，所述滑动窗口的尺寸为1×I_r；

在二维计算形式中，所述滑动窗口的尺寸为I_r×I_r；

所述滑动窗口的步长为S_r，S_r＝r。

具体地，所述根据所述第一转换矩阵对所述转置卷积核进行转换，获得第二转置卷积核，具体分为两种计算形式：一维计算形式和二维计算形式；

对于一维计算形式，具体为：将所述第一转换矩阵和所述转置卷积核依次相乘，得到所述第二转置卷积核；

对于二维计算形式，具体为：将所述第一转换矩阵、所述转置卷积核和所述第一转换矩阵的转置矩阵依次相乘，得到所述第二转置卷积核。

具体地，根据所述第二转换矩阵对所述特征图子图进行转换，获得第二特征图子矩阵，具体分为两种计算形式：一维计算形式和二维计算形式；

对于一维计算形式，具体为：将所述第二转换矩阵的转置矩阵和所述特征图子图依次相乘，得到所述第二特征图子矩阵；

对于二维计算形式，具体为：将所述第二转换矩阵的转置矩阵、所述特征图子图和所述第二转换矩阵依次相乘，得到所述第二特征图子矩阵。

具体地，所述根据所述第三转换矩阵对所述中间子矩阵进行转换，获得输出子矩阵，具体分为两种计算形式：一维计算形式和二维计算形式；

对于一维计算形式，具体为：将所述第三转换矩阵的转置矩阵和所述中间子矩阵依次相乘，得到所述输出子矩阵；

对于二维计算形式，具体为：将所述第三转换矩阵的转置矩阵、所述中间子矩阵和所述第三转换矩阵依次相乘，得到所述输出子矩阵。

本申请通过预设的转置卷积核的尺寸参数、转置卷积的步长和转换阶数，设置第一转换矩阵、第二转换矩阵和第三转换矩阵，进而对转置卷积核、通过滑动窗口提取的特征图子图和运算过程中获得的中间子矩阵进行转换，从而可以实现在不需要补零的操作下，只需要对原特征图进行转置卷积运算；并且提出转换阶数的设置，扩大了适用范围，进一步降低计算复杂度。

附图说明

为了更清楚地说明本申请的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请现有转置卷积原理示意图；

图2为本申请一种高效的转置卷积计算方法的流程图；

图3为本申请实施例公开的针对T₁(2²，4²)转置卷积计算的流程示意图；

图4为本申请实施例公开的针对T₂(4²，4²)转置卷积计算的流程示意图；

图5为本申请实施例公开的针对T₃(6²，4²)转置卷积计算的流程示意图。

具体实施方式

参见图2，为本申请一种高效的转置卷积计算方法的流程图，该方法包括如下步骤：

所述第一提取转换模块包括提取单元、第一转换单元和第二转换单元，

所述提取单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置滑动窗口的尺寸和滑动窗口的步长，然后根据所述滑动窗口的尺寸和所述滑动窗口的步长，利用滑动窗口机制在原特征图上提取多个特征图子图；

所述第一转换单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第一转换矩阵的尺寸，根据所述第一转换矩阵的尺寸设置所述第一转换矩阵，其中第一转换矩阵中元素的值可以根据实际自行设置，根据所述第一转换矩阵对所述转置卷积核进行转换，获得第二转置卷积核，具体分为两种计算形式：一维计算形式和二维计算形式；

所述第二转换单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第二转换矩阵的尺寸，根据所述第二转换矩阵的尺寸设置所述第二转换矩阵，其中第二转换矩阵中元素的值可以根据实际自行设置，根据所述第二转换矩阵对所述特征图子图进行转换，获得第二特征图子矩阵，具体分为两种计算形式：一维计算形式和二维计算形式；

所述第二转置卷积核与所述第二特征图子矩阵的尺寸均一致，即第二转置卷积核与所述第二特征图子矩阵为行数和列数相同的矩阵，如均为E_r×E_r矩阵；将所述第二转置卷积核与所述第二特征图子矩阵上的元素一一对应相乘，即将第二转置卷积核上的第i行第j列元素与第二特征图子矩阵上的第i行第j列元素一一对应相乘，i和j为正整数。

所述第二转换输出模块被配置为包括第三转换单元和输出单元，

所述第三转换单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第三转换矩阵的尺寸，根据所述第三转换矩阵的尺寸设置所述第三转换矩阵，其中第三转换矩阵中元素的值可以根据实际自行设置，根据所述第三转换矩阵对所述中间子矩阵进行转换，获得输出子矩阵，具体分为两种计算形式：一维计算形式和二维计算形式；

对于二维计算形式，具体为：将所述第三转换矩阵的转置矩阵、所述中间子矩阵和所述第三转换矩阵依次相乘，得到所述输出子矩阵；

所述输出单元将所述输出子矩阵依次排列成输出特征图，输出转置卷积计算结果。

E_r＝k+(r-1)×s

O_r＝s×r

S_r＝r

其中，

所述第一转换矩阵的尺寸为E_r×k；

所述第二转换矩阵的尺寸为I_r×E_r；

所述第三转换矩阵的尺寸为E_r×O_r；

在一维计算形式中，所述滑动窗口的尺寸为1×I_r；

在二维计算形式中，所述滑动窗口的尺寸为I_r×I_r；

所述滑动窗口的步长为S_r，S_r＝r。

具体地，根据所述滑动窗口的尺寸和所述滑动窗口的步长，利用滑动窗口机制在原特征图上提取多个特征图子图，以二维计算形式为例，按照滑动窗口的尺寸在原特征图上提取相同尺寸的特征图子图，如滑动窗口的尺寸为I_r×I_r，那么所提取的特征图子图的尺寸也为I_r×I_r；按照滑动窗口的步长S_r进行滑动提取，即每次在原特征图上滑动步长S_r后，提取滑动窗口所覆盖的尺寸为I_r×I_r的特征图子图，最后当滑动窗口滑过原特征图上的所有数据后，完成对特征图子图的提取。

整个转置卷积计算过程，分别对每一个特征图子图进行计算，最后将得到的输出子矩阵按照次序进行排列，进而获得输出特征图，得到转置卷积计算结果。

本申请一种高效的转置卷积计算方法，可以用公式表达，公式有两种计算形式，一维计算形式和二维计算形式。

一维计算形式表示为T_r(O_r，k)，r表示转换阶数，与计算复杂度降低的程度有关，它的取值范围为正整数，具体值可以由决策者根据实际应用自行决定，O_r为输出子矩阵的尺寸，k为转置卷积核的大小，具体运算过程通过以下公式表示：

Y＝A^T[(H.g)⊙(P^T.d)]

其中，Y为输出子矩阵，其尺寸为O_r×1；d为特征图子图，其原始尺寸为1×I_r，在用上述公式计算之前，先进行转置，d转置后尺寸为I_r×1；g为转置卷积核，其原始尺寸为1×k，在用上述公式计算之前，先进行转置，g转置后尺寸为k×1；⊙表示矩阵元素一一对应相乘，所相乘的两个矩阵尺寸都为E_r×1，(H.g)⊙(P^T.d)的运算结果为中间子矩阵，其尺寸为E_r×1；H为第一转换矩阵，H的尺寸为E_r×k；P为第二转换矩阵，P^T为第二转换矩阵的转置矩阵，P的尺寸为I_r×E_r，P^T的尺寸为E_r×I_r；A为第三转换矩阵，A^T为第三转换矩阵的转置矩阵，A的尺寸为E_r×O_r，A^T的尺寸为O_r×E_r。S_r为滑动窗口的步长。

堆叠一维计算形式，可以得到二维计算形式，表示为具体运算过程通过以下公式来表示：

Y＝A^T[(H.g.H^T)⊙(P^T.d.P)]A

其中，Y为输出子矩阵，其尺寸为O_r×O_r；d为特征图子图，其尺寸为I_r×I_r；g为转置卷积核，其尺寸为k×k；⊙表示矩阵元素一一对应相乘，所相乘的两个矩阵尺寸都为E_r×E_r，(H.g)⊙(P^T.d)的运算结果为中间子矩阵，其尺寸为E_r×E_r；H为第一转换矩阵，H^T为第一转换矩阵H的转置矩阵，H的尺寸为E_r×k，H^T的尺寸为k×E_r；P为第二转换矩阵，P^T为第二转换矩阵P的转置矩阵，P的尺寸为I_r×E_r，P^T的尺寸为E_r×I_r；A为第三转换矩阵，A^T为第三转换矩阵A的转置矩阵，A的尺寸为E_r×O_r，A^T的尺寸为O_r×E_r。S_r为滑动窗口的步长。

对于以上两种计算形式的相关参数I_r、E_r、O_r和S_r可以由如下计算公式获取：

E_r＝k+(r-1)×s

O_r＝s×r

S_r＝r

其中，k为所述转置卷积核的大小，s为所述转置卷积的步长，r为所述转换阶数，k、s和r均为正整数，为数学符号的上取整符号。

针对不同的运算需求，上述两种计算形式可以通过控制k、s和r的大小，来控制I_r、E_r、O_r和S_r等参数，进而满足不同的运算需求，即基于预设的转置卷积核的尺寸参数、转置卷积的步长和转换阶数可以获取相关参数，进而确定第一转换矩阵的尺寸、第二转换矩阵的尺寸、第三转换矩阵的尺寸、滑动窗口的尺寸和滑动窗口的步长。

需要说明的是，在转置卷积的计算过程中，本技术领域人员能够按照一定的转换规则，使用转换矩阵对转置卷积计算过程中的相关矩阵进行转换，其转换规则是本技术领域人员根据实际所需预先设置，所以在第一转换矩阵的尺寸、第二转换矩阵的尺寸和第三转换矩阵的尺寸确定的前提下，本领域技术人员可以自行设置第一转换矩阵、第二转换矩阵和第三转换矩阵中所有元素的值。

作为实施例，若转置卷积的步长为2(s＝2)，转置卷积核的尺寸为1×3，(k＝3)，转换阶数为1(r＝1)，采用一维计算形式，即针对T₁(2，3)计算过程中，滑动窗口的尺寸为1×2，滑动窗口的步长为1，第一转换矩阵的尺寸为3×3，第二转换矩阵的尺寸为2×3，第三转换矩阵的尺寸为3×2，可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为：

若转置卷积的步长为2(s＝2)，转置卷积核的尺寸为3×3(k＝3)，转换阶数为1(r＝1)，采用二维计算形式，即针对T₁(2²，3²)计算过程中，滑动窗口的尺寸为2×2，滑动窗口的步长为1，第一转换矩阵的尺寸为3×3，第二转换矩阵的尺寸为2×3，第三转换矩阵的尺寸为3×2，此时这三个矩阵即T₁(2²，3²)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T₁(2，3)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。

实验表明，T₁(2，3)计算过程中，针对一个特征图子图中的2个数据，需执行3次乘法操作，可得到一个输出子矩阵中的2个输出值。现有的技术方案，针对一个特征图子图中的3个数据，执行3次乘法操作，只能得到1个输出值。若想要得到2个输出值，现有的技术方案总共需要执行6次乘法操作。

T₁(2²，3²)计算过程中，针对一个特征图子图中的4个数据，需执行9(3×3)次乘法操作，可得到一个输出子矩阵中的4个输出值。现有的技术方案，针对一个特征图子图中的9个数据，执行9次乘法操作，只能得到1个输出值。若想要得到4个输出值，现有的技术方案总共需要执行36次乘法操作。因此，本发明方案提出的转置卷积计算方法极大地提高了计算效率。

若转置卷积的步长为2(s＝2)，转置卷积核的尺寸为1×3(k＝3)，转换阶数为2(r＝2)，采用一维计算形式，即针对T₂(4，3)计算过程中，滑动窗口的尺寸为1×3，滑动窗口的步长为2，第一转换矩阵的尺寸为5×3，第二转换矩阵的尺寸为3×5，第三转换矩阵的尺寸为5×4，可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为：

若转置卷积的步长为2(s＝2)，转置卷积核的尺寸为3×3(k＝3)，转换阶数为2(r＝2)，采用二维计算形式，即针对T₂(4²，3²)计算过程中，滑动窗口的尺寸为3×3，滑动窗口的步长为2，第一转换矩阵的尺寸为5×3，第二转换矩阵的尺寸为3×5，第三转换矩阵的尺寸为5×4，此时这三个矩阵即T₂(4²，3²)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T₂(4，3)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。

实验表明，T₂(4，3)计算过程中，针对一个特征图子图中的3个数据，需执行5次乘法操作，可得到一个输出子矩阵中的4个输出值。现有的技术方案，针对一个特征图子图中的3个数据，执行3次乘法操作，只能得到1个输出值。若想要得到4个输出值，现有的技术方案总共需要执行12次乘法操作。

T₂(4²，3²)计算过程中，针对一个特征图子图中的9个数据，需执行25(5×5)次乘法操作，可得到一个输出子矩阵中的16个输出值。现有的技术方案，针对一个特征图子图中的9个数据，执行9次乘法操作，只能得到1个输出值。若想要得到16个输出值，现有的技术方案总共需要执行144次乘法操作。因此，本发明方案提出的转置卷积计算方法极大地提高了计算效率。

若转置卷积的步长为2(s＝2)，转置卷积核的尺寸为1×3(k＝3)，转换阶数为3(r＝3)，采用一维计算形式，即针对T₃(6，3)计算过程中，滑动窗口的尺寸为1×4，滑动窗口的步长为3，第一转换矩阵的尺寸为7×3，第二转换矩阵的尺寸为4×7，第三转换矩阵的尺寸为7×6，可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为：

若转置卷积的步长为2(s＝2)，转置卷积核的尺寸为3×3(k＝3)，转换阶数为3(r＝3)，采用二维计算形式，即针对T₃(6²，3²)计算过程中，滑动窗口的尺寸为4×4，滑动窗口的步长为3，第一转换矩阵的尺寸为7×3，第二转换矩阵的尺寸为4×7，第三转换矩阵的尺寸为7×6，此时这三个矩阵即T₃(6²，3²)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T₃(6，3)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。

实验表明，T₃(6，3)计算过程中，针对一个特征图子图中的4个数据，需执行7次乘法操作，可得到一个输出子矩阵中的6个输出值。现有的技术方案，针对一个特征图子图中的3个数据，执行3次乘法操作，只能得到1个输出值。若想要得到6个输出值，现有的技术方案总共需要执行18次乘法操作。

T₃(6²，3²)计算过程中，针对一个特征图子图中的16个数据，需执行49(7×7)次乘法操作，可得到一个输出子矩阵中的36个输出值。现有的技术方案，针对一个特征图子图中的9个数据，执行9次乘法操作，只能得到1个输出值。若想要得到36个输出值，现有的技术方案总共需要执行324次乘法操作。因此，本发明方案提出的转置卷积计算方法极大地提高了计算效率。

若转置卷积的步长为2(s＝2)，转置卷积核的尺寸为1×4(k＝4)，转换阶数为1(r＝1)，采用一维计算形式，即针对T₁(2，4)计算过程中，滑动窗口的尺寸为1×3，滑动窗口的步长为1，第一转换矩阵的尺寸为4×4，第二转换矩阵的尺寸为3×4，第三转换矩阵的尺寸为4×2，可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为：

参见图3，为本申请实施例公开的针对T₁(2²，4²)转置卷积计算的流程示意图，若转置卷积的步长为2(s＝2)，转置卷积核的尺寸为4×4(k＝4)，转换阶数为1(r＝1)，采用二维计算形式，即针对T₁(2²，4²)计算过程中，滑动窗口的尺寸为3×3，滑动窗口的步长为1，第一转换矩阵的尺寸为4×4，第二转换矩阵的尺寸为3×4，第三转换矩阵的尺寸为4×2，此时这三个矩阵即T₁(2²，4²)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T₁(2，4)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。

实验表明，T₁(2，4)计算过程中，针对一个特征图子图中的3个数据，需执行4次乘法操作，可得到一个输出子矩阵中的2个输出值。现有的技术方案，针对一个特征图子图中的4个数据，执行4次乘法操作，只能得到1个输出值。若想要得到2个输出值，现有的技术方案总共需要执行8次乘法操作。

T₁(2²，4²)计算过程中，针对一个特征图子图中的9个数据，需执行16(4×4)次乘法操作，可得到一个输出子矩阵中的4个输出值。现有的技术方案，针对一个特征图子图中的16个数据，执行16次乘法操作，只能得到1个输出值。若想要得到4个输出值，现有的技术方案总共需要执行64次乘法操作。因此，本发明方案提出的转置卷积计算方法极大地提高了计算效率。

若转置卷积的步长为2(s＝2)，转置卷积核的尺寸为1×4(k＝4)，转换阶数为2(r＝2)，采用一维计算形式，即针对T₂(4，4)计算过程中，滑动窗口的尺寸为1×4，滑动窗口的步长为2，第一转换矩阵的尺寸为6×4，第二转换矩阵的尺寸为4×6，第三转换矩阵的尺寸为6×4，可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为：

参见图4，为本申请实施例公开的针对T₂(4²，4²)转置卷积计算的流程示意图，若转置卷积的步长为2(s＝2)，转置卷积核的尺寸为4×4(k＝4)，转换阶数为2(r＝2)，采用二维计算形式，即针对T₂(4²，4²)计算过程中，滑动窗口的尺寸为4×4，滑动窗口的步长为2，第一转换矩阵的尺寸为6×4，第二转换矩阵的尺寸为4×6，第三转换矩阵的尺寸为6×4，此时这三个矩阵即T₂(4²，4²)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T₂(4，4)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。

实验表明，T₂(4，4)计算过程中，针对一个特征图子图中的4个数据，需执行6次乘法操作，可得到一个输出子矩阵中的4个输出值。现有的技术方案，针对一个特征图子图中的4个数据，执行4次乘法操作，只能得到1个输出值。若想要得到4个输出值，现有的技术方案总共需要执行16次乘法操作。

T₂(4²，4²)计算过程中，针对一个特征图子图中的16个数据，需执行36(6×6)次乘法操作，可得到一个输出子矩阵中的16个输出值。现有的技术方案，针对一个特征图子图中的16个数据，执行16次乘法操作，只能得到1个输出值。若想要得到16个输出值，现有的技术方案总共需要执行256次乘法操作。因此，本发明方案提出的转置卷积计算方法极大地提高了计算效率。

若转置卷积的步长为2(s＝2)，转置卷积核的尺寸为1×4(k＝4)，转换阶数为3(r＝3)，采用一维计算形式，即针对T₃(6，4)计算过程中，滑动窗口的尺寸为1×5，滑动窗口的步长为3，第一转换矩阵的尺寸为8×4，第二转换矩阵的尺寸为5×8，第三转换矩阵的尺寸为8×6，可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为：

/>

参见图5，为本申请实施例公开的针对T₃(6²，4²)转置卷积计算的流程示意图，若转置卷积的步长为2(s＝2)，转置卷积核的尺寸为4×4(k＝4)，转换阶数为3(r＝3)，采用二维计算形式，即针对T₃(6²，4²)计算过程中，滑动窗口的尺寸为5×5，滑动窗口的步长为3，第一转换矩阵的尺寸为8×4，第二转换矩阵的尺寸为5×8，第三转换矩阵的尺寸为8×6，此时这三个矩阵即T₃(6²，4²)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T₃(6，4)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。

实验表明，T₃(6，4)计算过程中，针对一个特征图子图中的5个数据，需执行8次乘法操作，可得到一个输出子矩阵中的6个输出值。现有的技术方案，针对一个特征图子图中的4个数据，执行4次乘法操作，只能得到1个输出值。若想要得到6个输出值，现有的技术方案总共需要执行24次乘法操作。

T₃(6²，4²)计算过程中，针对一个特征图子图中的25个数据，需执行64(8×8)次乘法操作，可得到一个输出子矩阵中的36个输出值。现有的技术方案，针对一个特征图子图中的16个数据，执行16次乘法操作，只能得到1个输出值。若想要得到36个输出值，现有的技术方案总共需要执行576次乘法操作。因此，本发明方案提出的转置卷积计算方法极大地提高了计算效率。

若转置卷积的步长为2(s＝2)，转置卷积核的尺寸为1×5(k＝5)，转换阶数为1(r＝1)，采用一维计算形式，即针对T₁(2，5)计算过程中，滑动窗口的尺寸为1×3，滑动窗口的步长为1，第一转换矩阵的尺寸为5×5，第二转换矩阵的尺寸为3×5，第三转换矩阵的尺寸为5×2，可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为：

/>

若转置卷积的步长为2(s＝2)，转置卷积核的尺寸为5×5(k＝5)，转换阶数为1(r＝1)，采用二维计算形式，即针对T₁(2²，5²)计算过程中，滑动窗口的尺寸为3×3，滑动窗口的步长为1，第一转换矩阵的尺寸为5×5，第二转换矩阵的尺寸为3×5，第三转换矩阵的尺寸为5×2，此时这三个矩阵即T₁(2²，5²)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T₁(2，5)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。

实验表明，T₁(2，5)计算过程中，针对一个特征图子图中的3个数据，需执行5次乘法操作，可得到一个输出子矩阵中的2个输出值。现有的技术方案，针对一个特征图子图中的5个数据，执行5次乘法操作，只能得到1个输出值。若想要得到2个输出值，现有的技术方案总共需要执行10次乘法操作。

T₁(2²，5²)计算过程中，针对一个特征图子图中的9个数据，需执行25(5×5)次乘法操作，可得到一个输出子矩阵中的4个输出值。现有的技术方案，针对一个特征图子图中的25个数据，执行25次乘法操作，只能得到1个输出值。若想要得到4个输出值，现有的技术方案总共需要执行100次乘法操作。因此，本发明方案提出的转置卷积计算方法极大地提高了计算效率。

若转置卷积的步长为2(s＝2)，转置卷积核的尺寸为1×5(k＝5)，转换阶数为2(r＝2)，采用一维计算形式，即针对T₂(4，5)计算过程中，滑动窗口的尺寸为1×4，滑动窗口的步长为2，第一转换矩阵的尺寸为7×5，第二转换矩阵的尺寸为4×7，第三转换矩阵的尺寸为7×4，可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为：

/>

若转置卷积的步长为2(s＝2)，转置卷积核的尺寸为5×5(k＝5)，转换阶数为2(r＝2)，采用二维计算形式，即针对T₂(4²，5²)计算过程中，滑动窗口的尺寸为4×4，滑动窗口的步长为2，第一转换矩阵的尺寸为7×5，第二转换矩阵的尺寸为4×7，第三转换矩阵的尺寸为7×4，此时这三个矩阵即T₂(4²，5²)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T₂(4，5)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。

实验表明，T₂(4，5)计算过程中，针对一个特征图子图中的4个数据，需执行7次乘法操作，可得到一个输出子矩阵中的4个输出值。现有的技术方案，针对一个特征图子图中的5个数据，执行5次乘法操作，只能得到1个输出值。若想要得到4个输出值，现有的技术方案总共需要执行20次乘法操作。

T₂(4²，5²)计算过程中，针对一个特征图子图中的16个数据，需执行49(7×7)次乘法操作，可得到一个输出子矩阵中的16个输出值。现有的技术方案，针对一个特征图子图中的25个数据，执行25次乘法操作，只能得到1个输出值。若想要得到16个输出值，现有的技术方案总共需要执行400次乘法操作。因此，本发明方案提出的转置卷积计算方法极大地提高了计算效率。

若转置卷积的步长为3(s＝3)，转置卷积核的尺寸为1×5(k＝5)，转换阶数为1(r＝1)，采用一维计算形式，即针对T₁(3，5)计算过程中，滑动窗口的尺寸为1×3，滑动窗口的步长为1，第一转换矩阵的尺寸为5×5，第二转换矩阵的尺寸为3×5，第三转换矩阵的尺寸为5×3，可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为：

若转置卷积的步长为3(s＝3)，转置卷积核的尺寸为5×5(k＝5)，转换阶数为1(r＝1)，采用二维计算形式，即针对T₁(3²，5²)计算过程中，滑动窗口的尺寸为3×3，滑动窗口的步长为1，第一转换矩阵的尺寸为5×5，第二转换矩阵的尺寸为3×5，第三转换矩阵的尺寸为5×3，此时这三个矩阵即T₁(3²，5²)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T₁(3，5)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。

实验表明，T₁(3，5)计算过程中，针对一个特征图子图中的3个数据，需执行5次乘法操作，可得到一个输出子矩阵中的3个输出值。现有的技术方案，针对一个特征图子图中的5个数据，执行5次乘法操作，只能得到1个输出值。若想要得到3个输出值，现有的技术方案总共需要执行15次乘法操作。

T₁(3²，5²)计算过程中，针对一个特征图子图中的9个数据，需执行25(5×5)次乘法操作，可得到一个输出子矩阵中的9个输出值。现有的技术方案，针对一个特征图子图中的25个数据，执行25次乘法操作，只能得到1个输出值。若想要得到9个输出值，现有的技术方案总共需要执行225次乘法操作。因此，本发明方案提出的转置卷积计算方法极大地提高了计算效率。

若转置卷积的步长为3(s＝3)，转置卷积核的尺寸为1×5(k＝5)，转换阶数为2(r＝2)，采用一维计算形式，即针对T₂(6，5)计算过程中，滑动窗口的尺寸为1×4，滑动窗口的步长为2，第一转换矩阵的尺寸为8×5，第二转换矩阵的尺寸为4×8，第三转换矩阵的尺寸为8×6，可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为：

若转置卷积的步长为3(s＝3)，转置卷积核的尺寸为5×5(k＝5)，转换阶数为2(r＝2)，采用二维计算形式，即针对T₂(6²，5²)计算过程中，滑动窗口的尺寸为4×4，滑动窗口的步长为2，第一转换矩阵的尺寸为8×5，第二转换矩阵的尺寸为4×8，第三转换矩阵的尺寸为8×6，此时这三个矩阵即T₂(6²，5²)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T₂(6，5)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。

实验表明，T₂(6，5)计算过程中，针对一个特征图子图中的4个数据，需执行8次乘法操作，可得到一个输出子矩阵中的6个输出值。现有的技术方案，针对一个特征图子图中的5个数据，执行5次乘法操作，只能得到1个输出值。若想要得到6个输出值，现有的技术方案总共需要执行30次乘法操作。

T₂(6²，5²)计算过程中，针对一个特征图子图中的16个数据，需执行64(8×8)次乘法操作，可得到一个输出子矩阵中的36个输出值。现有的技术方案，针对一个特征图子图中的25个数据，执行25次乘法操作，只能得到1个输出值。若想要得到36个输出值，现有的技术方案总共需要执行900次乘法操作。因此，本发明方案提出的转置卷积计算方法极大地提高了计算效率。

由以上几个例子可以看出，在转置卷积的步长s和转置卷积核的尺寸k不变，以及采用的计算形式一样的情况下，随着转换阶数r的增大，计算效率也会逐渐增大。

本申请通过预设的转置卷积核的尺寸、转置卷积的步长和转换阶数，设置第一转换矩阵、第二转换矩阵和第三转换矩阵，进而对转置卷积核、通过滑动窗口提取的特征图子图和运算过程中获得的中间子矩阵进行转换，从而可以实现在不需要补零的操作下，只需要对原特征图进行转置卷积运算；并且提出转换阶数的设置，扩大了适用范围，进一步降低计算复杂度。

以上结合具体实施方式和范例性实例对本申请进行了详细说明，不过这些说明并不能理解为对本申请的限制。本领域技术人员理解，在不偏离本申请精神和范围的情况下，可以对本申请技术方案及其实施方式进行多种等价替换、修饰或改进，这些均落入本申请的范围内。本申请的保护范围以所附权利要求为准。

Claims

1.一种高效的转置卷积计算方法，其特征在于，所述方法包括：

所述第二转换输出模块被配置为包括第三转换单元和输出单元，所述第三转换单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第三转换矩阵，根据所述第三转换矩阵对所述中间子矩阵进行转换，获得输出子矩阵；所述输出单元将所述输出子矩阵依次排列成输出特征图，输出转置卷积计算结果；

其中，

所述根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第一转换矩阵，具体为：

根据所述第一转换矩阵的尺寸设置所述第一转换矩阵；

根据所述第二转换矩阵的尺寸设置所述第二转换矩阵；

根据所述第三转换矩阵的尺寸设置所述第三转换矩阵；

根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数，通过计算公式获取各项参数，其中计算公式为：

E_r＝k+(r-1)×s

O_r＝s×r

S_r＝r

其中，

所述第一转换矩阵的尺寸为E_r×k；

所述第二转换矩阵的尺寸为I_r×E_r；

所述第三转换矩阵的尺寸为E_r×O_r；

在一维计算形式中，所述滑动窗口的尺寸为1×I_r；

在二维计算形式中，所述滑动窗口的尺寸为I_r×I_r；

所述滑动窗口的步长为S_r，S_r＝r。

2.根据权利要求1所述的高效的转置卷积计算方法，其特征在于，所述根据所述第一转换矩阵对所述转置卷积核进行转换，获得第二转置卷积核，具体分为两种计算形式：一维计算形式和二维计算形式；

3.根据权利要求1所述的高效的转置卷积计算方法，其特征在于，根据所述第二转换矩阵对所述特征图子图进行转换，获得第二特征图子矩阵，具体分为两种计算形式：一维计算形式和二维计算形式；

4.根据权利要求1所述的高效的转置卷积计算方法，其特征在于，所述根据所述第三转换矩阵对所述中间子矩阵进行转换，获得输出子矩阵，具体分为两种计算形式：一维计算形式和二维计算形式；