CN112650974B - 一种高效的转置卷积计算方法 - Google Patents
一种高效的转置卷积计算方法 Download PDFInfo
- Publication number
- CN112650974B CN112650974B CN202011617770.2A CN202011617770A CN112650974B CN 112650974 B CN112650974 B CN 112650974B CN 202011617770 A CN202011617770 A CN 202011617770A CN 112650974 B CN112650974 B CN 112650974B
- Authority
- CN
- China
- Prior art keywords
- size
- conversion
- conversion matrix
- matrix
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 180
- 238000006243 chemical reaction Methods 0.000 claims abstract description 341
- 239000011159 matrix material Substances 0.000 claims abstract description 308
- 230000017105 transposition Effects 0.000 claims abstract description 29
- 238000010586 diagram Methods 0.000 claims abstract description 18
- 238000000034 method Methods 0.000 claims description 55
- 238000000605 extraction Methods 0.000 claims description 14
- 230000009466 transformation Effects 0.000 claims description 13
- 230000007246 mechanism Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 3
- 230000008569 process Effects 0.000 description 46
- 238000002474 experimental method Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/52—Multiplying; Dividing
- G06F7/523—Multiplying only
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Complex Calculations (AREA)
Abstract
本申请公开了一种高效的转置卷积计算方法,基于预设的转置卷积核的尺寸参数、转置卷积的步长和转换阶数确定转置卷积总体架构,对用于原特征图的提取的滑动窗口进行了设计,根据设计后的滑动窗口提取特征图子图,对所述特征图子图进行转换,转换转置卷积核,并进行计算,对中间子矩阵进行转换,进而获得转置卷积结果。本申请实现在不需要补零的操作下,对原特征图进行转置卷积运算,提高运算效率;提出转换阶数的设置,扩大适用范围,进一步降低计算复杂度。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种高效的转置卷积计算方法。
背景技术
转置卷积是一种特殊的卷积,现有技术中,在用硬件加速器执行转置卷积运算之前,通常会先按照一定比例进行补零操作,来扩展输入特征图的尺寸,然后再进行卷积运算。
如图1所示,原先的输入特征图数据中相应位置被补入大量的零,白格为补入的零,扩展到尺寸相对较大的新特征图数据,然后通过滑动窗口在新特征图数据上按照设置的滑动步长进行数据提取,被提取的数据再与旋转后的转置卷积核进行相乘再求和,滑动窗口的尺寸与转置卷积核大小一致,被提取的数据为滑动窗口覆盖的数据,当滑动窗口滑过新特征图所有数据后,便得到转置卷积的计算结果。
现有方案通常需要在原输入特征图中插入大量的零,而这些零又都参与实际的运算,使得在处理数据时,增加了大量不必要的运算操作,降低对有效数据处理的速度,从而降低转置卷积的运算效率。
发明内容
本申请提供了一种高效的转置卷积计算方法,以解决转置卷积运算效率低的问题。
一种高效的转置卷积计算方法,包括:
基于预设的转置卷积核的尺寸参数、转置卷积的步长和转换阶数确定转置卷积总体架构;
将原特征图和所述转置卷积核输入所述转置卷积总体架构,输出转置卷积计算结果;
其中,所述转置卷积总体架构包括第一提取转换模块、转置卷积计算模块和第二转换输出模块;
所述第一提取转换模块包括提取单元、第一转换单元和第二转换单元,所述提取单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置滑动窗口的尺寸和滑动窗口的步长,然后根据所述滑动窗口的尺寸和所述滑动窗口的步长,利用滑动窗口机制在原特征图上提取多个特征图子图;所述第一转换单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第一转换矩阵,根据所述第一转换矩阵对所述转置卷积核进行转换,获得第二转置卷积核;所述第二转换单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第二转换矩阵,根据所述第二转换矩阵对所述特征图子图进行转换,获得第二特征图子矩阵;
所述转置卷积计算模块被配置为将所述第二特征图子矩阵与第二转置卷积核上的元素一一对应相乘,获得中间子矩阵;
所述第二转换输出模块被配置为包括第三转换单元和输出单元,所述第三转换单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第三转换矩阵,根据所述第三转换矩阵对所述中间子矩阵进行转换,获得输出子矩阵;所述输出单元将所述输出子矩阵依次排列成输出特征图,输出转置卷积计算结果。
具体地,所述根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第一转换矩阵,具体为:
根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第一转换矩阵的尺寸;
根据所述第一转换矩阵的尺寸设置所述第一转换矩阵;
所述根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第二转换矩阵,具体为:
根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第二转换矩阵的尺寸;
根据所述第二转换矩阵的尺寸设置所述第二转换矩阵;
所述根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第三转换矩阵,具体为:
根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第三转换矩阵的尺寸;
根据所述第三转换矩阵的尺寸设置所述第三转换矩阵。
具体地,根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数,通过计算公式获取各项参数,其中计算公式为:
Er=k+(r-1)×s
Or=s×r
Sr=r
其中,k为所述转置卷积核的尺寸参数,s为所述转置卷积的步长,r为所述转换阶数,k、s和r均为正整数,为数学符号的上取整符号;
根据所述各项参数,确定所述第一转换矩阵的尺寸、所述第二转换矩阵的尺寸、所述第三转换矩阵的尺寸、所述滑动窗口的尺寸和所述滑动窗口的步长,
其中,
所述第一转换矩阵的尺寸为Er×k;
所述第二转换矩阵的尺寸为Ir×Er;
所述第三转换矩阵的尺寸为Er×Or;
在一维计算形式中,所述滑动窗口的尺寸为1×Ir;
在二维计算形式中,所述滑动窗口的尺寸为Ir×Ir;
所述滑动窗口的步长为Sr,Sr=r。
具体地,所述根据所述第一转换矩阵对所述转置卷积核进行转换,获得第二转置卷积核,具体分为两种计算形式:一维计算形式和二维计算形式;
对于一维计算形式,具体为:将所述第一转换矩阵和所述转置卷积核依次相乘,得到所述第二转置卷积核;
对于二维计算形式,具体为:将所述第一转换矩阵、所述转置卷积核和所述第一转换矩阵的转置矩阵依次相乘,得到所述第二转置卷积核。
具体地,根据所述第二转换矩阵对所述特征图子图进行转换,获得第二特征图子矩阵,具体分为两种计算形式:一维计算形式和二维计算形式;
对于一维计算形式,具体为:将所述第二转换矩阵的转置矩阵和所述特征图子图依次相乘,得到所述第二特征图子矩阵;
对于二维计算形式,具体为:将所述第二转换矩阵的转置矩阵、所述特征图子图和所述第二转换矩阵依次相乘,得到所述第二特征图子矩阵。
具体地,所述根据所述第三转换矩阵对所述中间子矩阵进行转换,获得输出子矩阵,具体分为两种计算形式:一维计算形式和二维计算形式;
对于一维计算形式,具体为:将所述第三转换矩阵的转置矩阵和所述中间子矩阵依次相乘,得到所述输出子矩阵;
对于二维计算形式,具体为:将所述第三转换矩阵的转置矩阵、所述中间子矩阵和所述第三转换矩阵依次相乘,得到所述输出子矩阵。
本申请通过预设的转置卷积核的尺寸参数、转置卷积的步长和转换阶数,设置第一转换矩阵、第二转换矩阵和第三转换矩阵,进而对转置卷积核、通过滑动窗口提取的特征图子图和运算过程中获得的中间子矩阵进行转换,从而可以实现在不需要补零的操作下,只需要对原特征图进行转置卷积运算;并且提出转换阶数的设置,扩大了适用范围,进一步降低计算复杂度。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请现有转置卷积原理示意图;
图2为本申请一种高效的转置卷积计算方法的流程图;
图3为本申请实施例公开的针对T1(22,42)转置卷积计算的流程示意图;
图4为本申请实施例公开的针对T2(42,42)转置卷积计算的流程示意图;
图5为本申请实施例公开的针对T3(62,42)转置卷积计算的流程示意图。
具体实施方式
参见图2,为本申请一种高效的转置卷积计算方法的流程图,该方法包括如下步骤:
基于预设的转置卷积核的尺寸参数、转置卷积的步长和转换阶数确定转置卷积总体架构;
将原特征图和所述转置卷积核输入所述转置卷积总体架构,输出转置卷积计算结果;
其中,所述转置卷积总体架构包括第一提取转换模块、转置卷积计算模块和第二转换输出模块;
所述第一提取转换模块包括提取单元、第一转换单元和第二转换单元,
所述提取单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置滑动窗口的尺寸和滑动窗口的步长,然后根据所述滑动窗口的尺寸和所述滑动窗口的步长,利用滑动窗口机制在原特征图上提取多个特征图子图;
所述第一转换单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第一转换矩阵的尺寸,根据所述第一转换矩阵的尺寸设置所述第一转换矩阵,其中第一转换矩阵中元素的值可以根据实际自行设置,根据所述第一转换矩阵对所述转置卷积核进行转换,获得第二转置卷积核,具体分为两种计算形式:一维计算形式和二维计算形式;
对于一维计算形式,具体为:将所述第一转换矩阵和所述转置卷积核依次相乘,得到所述第二转置卷积核;
对于二维计算形式,具体为:将所述第一转换矩阵、所述转置卷积核和所述第一转换矩阵的转置矩阵依次相乘,得到所述第二转置卷积核。
所述第二转换单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第二转换矩阵的尺寸,根据所述第二转换矩阵的尺寸设置所述第二转换矩阵,其中第二转换矩阵中元素的值可以根据实际自行设置,根据所述第二转换矩阵对所述特征图子图进行转换,获得第二特征图子矩阵,具体分为两种计算形式:一维计算形式和二维计算形式;
对于一维计算形式,具体为:将所述第二转换矩阵的转置矩阵和所述特征图子图依次相乘,得到所述第二特征图子矩阵;
对于二维计算形式,具体为:将所述第二转换矩阵的转置矩阵、所述特征图子图和所述第二转换矩阵依次相乘,得到所述第二特征图子矩阵。
所述转置卷积计算模块被配置为将所述第二特征图子矩阵与第二转置卷积核上的元素一一对应相乘,获得中间子矩阵;
所述第二转置卷积核与所述第二特征图子矩阵的尺寸均一致,即第二转置卷积核与所述第二特征图子矩阵为行数和列数相同的矩阵,如均为Er×Er矩阵;将所述第二转置卷积核与所述第二特征图子矩阵上的元素一一对应相乘,即将第二转置卷积核上的第i行第j列元素与第二特征图子矩阵上的第i行第j列元素一一对应相乘,i和j为正整数。
所述第二转换输出模块被配置为包括第三转换单元和输出单元,
所述第三转换单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第三转换矩阵的尺寸,根据所述第三转换矩阵的尺寸设置所述第三转换矩阵,其中第三转换矩阵中元素的值可以根据实际自行设置,根据所述第三转换矩阵对所述中间子矩阵进行转换,获得输出子矩阵,具体分为两种计算形式:一维计算形式和二维计算形式;
对于一维计算形式,具体为:将所述第三转换矩阵的转置矩阵和所述中间子矩阵依次相乘,得到所述输出子矩阵;
对于二维计算形式,具体为:将所述第三转换矩阵的转置矩阵、所述中间子矩阵和所述第三转换矩阵依次相乘,得到所述输出子矩阵;
所述输出单元将所述输出子矩阵依次排列成输出特征图,输出转置卷积计算结果。
具体地,根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数,通过计算公式获取各项参数,其中计算公式为:
Er=k+(r-1)×s
Or=s×r
Sr=r
其中,k为所述转置卷积核的尺寸参数,s为所述转置卷积的步长,r为所述转换阶数,k、s和r均为正整数,为数学符号的上取整符号;
根据所述各项参数,确定所述第一转换矩阵的尺寸、所述第二转换矩阵的尺寸、所述第三转换矩阵的尺寸、所述滑动窗口的尺寸和所述滑动窗口的步长,
其中,
所述第一转换矩阵的尺寸为Er×k;
所述第二转换矩阵的尺寸为Ir×Er;
所述第三转换矩阵的尺寸为Er×Or;
在一维计算形式中,所述滑动窗口的尺寸为1×Ir;
在二维计算形式中,所述滑动窗口的尺寸为Ir×Ir;
所述滑动窗口的步长为Sr,Sr=r。
具体地,根据所述滑动窗口的尺寸和所述滑动窗口的步长,利用滑动窗口机制在原特征图上提取多个特征图子图,以二维计算形式为例,按照滑动窗口的尺寸在原特征图上提取相同尺寸的特征图子图,如滑动窗口的尺寸为Ir×Ir,那么所提取的特征图子图的尺寸也为Ir×Ir;按照滑动窗口的步长Sr进行滑动提取,即每次在原特征图上滑动步长Sr后,提取滑动窗口所覆盖的尺寸为Ir×Ir的特征图子图,最后当滑动窗口滑过原特征图上的所有数据后,完成对特征图子图的提取。
整个转置卷积计算过程,分别对每一个特征图子图进行计算,最后将得到的输出子矩阵按照次序进行排列,进而获得输出特征图,得到转置卷积计算结果。
本申请一种高效的转置卷积计算方法,可以用公式表达,公式有两种计算形式,一维计算形式和二维计算形式。
一维计算形式表示为Tr(Or,k),r表示转换阶数,与计算复杂度降低的程度有关,它的取值范围为正整数,具体值可以由决策者根据实际应用自行决定,Or为输出子矩阵的尺寸,k为转置卷积核的大小,具体运算过程通过以下公式表示:
Y=AT[(H.g)⊙(PT.d)]
其中,Y为输出子矩阵,其尺寸为Or×1;d为特征图子图,其原始尺寸为1×Ir,在用上述公式计算之前,先进行转置,d转置后尺寸为Ir×1;g为转置卷积核,其原始尺寸为1×k,在用上述公式计算之前,先进行转置,g转置后尺寸为k×1;⊙表示矩阵元素一一对应相乘,所相乘的两个矩阵尺寸都为Er×1,(H.g)⊙(PT.d)的运算结果为中间子矩阵,其尺寸为Er×1;H为第一转换矩阵,H的尺寸为Er×k;P为第二转换矩阵,PT为第二转换矩阵的转置矩阵,P的尺寸为Ir×Er,PT的尺寸为Er×Ir;A为第三转换矩阵,AT为第三转换矩阵的转置矩阵,A的尺寸为Er×Or,AT的尺寸为Or×Er。Sr为滑动窗口的步长。
堆叠一维计算形式,可以得到二维计算形式,表示为具体运算过程通过以下公式来表示:
Y=AT[(H.g.HT)⊙(PT.d.P)]A
其中,Y为输出子矩阵,其尺寸为Or×Or;d为特征图子图,其尺寸为Ir×Ir;g为转置卷积核,其尺寸为k×k;⊙表示矩阵元素一一对应相乘,所相乘的两个矩阵尺寸都为Er×Er,(H.g)⊙(PT.d)的运算结果为中间子矩阵,其尺寸为Er×Er;H为第一转换矩阵,HT为第一转换矩阵H的转置矩阵,H的尺寸为Er×k,HT的尺寸为k×Er;P为第二转换矩阵,PT为第二转换矩阵P的转置矩阵,P的尺寸为Ir×Er,PT的尺寸为Er×Ir;A为第三转换矩阵,AT为第三转换矩阵A的转置矩阵,A的尺寸为Er×Or,AT的尺寸为Or×Er。Sr为滑动窗口的步长。
对于以上两种计算形式的相关参数Ir、Er、Or和Sr可以由如下计算公式获取:
Er=k+(r-1)×s
Or=s×r
Sr=r
其中,k为所述转置卷积核的大小,s为所述转置卷积的步长,r为所述转换阶数,k、s和r均为正整数,为数学符号的上取整符号。
针对不同的运算需求,上述两种计算形式可以通过控制k、s和r的大小,来控制Ir、Er、Or和Sr等参数,进而满足不同的运算需求,即基于预设的转置卷积核的尺寸参数、转置卷积的步长和转换阶数可以获取相关参数,进而确定第一转换矩阵的尺寸、第二转换矩阵的尺寸、第三转换矩阵的尺寸、滑动窗口的尺寸和滑动窗口的步长。
需要说明的是,在转置卷积的计算过程中,本技术领域人员能够按照一定的转换规则,使用转换矩阵对转置卷积计算过程中的相关矩阵进行转换,其转换规则是本技术领域人员根据实际所需预先设置,所以在第一转换矩阵的尺寸、第二转换矩阵的尺寸和第三转换矩阵的尺寸确定的前提下,本领域技术人员可以自行设置第一转换矩阵、第二转换矩阵和第三转换矩阵中所有元素的值。
作为实施例,若转置卷积的步长为2(s=2),转置卷积核的尺寸为1×3,(k=3),转换阶数为1(r=1),采用一维计算形式,即针对T1(2,3)计算过程中,滑动窗口的尺寸为1×2,滑动窗口的步长为1,第一转换矩阵的尺寸为3×3,第二转换矩阵的尺寸为2×3,第三转换矩阵的尺寸为3×2,可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为:
若转置卷积的步长为2(s=2),转置卷积核的尺寸为3×3(k=3),转换阶数为1(r=1),采用二维计算形式,即针对T1(22,32)计算过程中,滑动窗口的尺寸为2×2,滑动窗口的步长为1,第一转换矩阵的尺寸为3×3,第二转换矩阵的尺寸为2×3,第三转换矩阵的尺寸为3×2,此时这三个矩阵即T1(22,32)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T1(2,3)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。
实验表明,T1(2,3)计算过程中,针对一个特征图子图中的2个数据,需执行3次乘法操作,可得到一个输出子矩阵中的2个输出值。现有的技术方案,针对一个特征图子图中的3个数据,执行3次乘法操作,只能得到1个输出值。若想要得到2个输出值,现有的技术方案总共需要执行6次乘法操作。
T1(22,32)计算过程中,针对一个特征图子图中的4个数据,需执行9(3×3)次乘法操作,可得到一个输出子矩阵中的4个输出值。现有的技术方案,针对一个特征图子图中的9个数据,执行9次乘法操作,只能得到1个输出值。若想要得到4个输出值,现有的技术方案总共需要执行36次乘法操作。因此,本发明方案提出的转置卷积计算方法极大地提高了计算效率。
若转置卷积的步长为2(s=2),转置卷积核的尺寸为1×3(k=3),转换阶数为2(r=2),采用一维计算形式,即针对T2(4,3)计算过程中,滑动窗口的尺寸为1×3,滑动窗口的步长为2,第一转换矩阵的尺寸为5×3,第二转换矩阵的尺寸为3×5,第三转换矩阵的尺寸为5×4,可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为:
若转置卷积的步长为2(s=2),转置卷积核的尺寸为3×3(k=3),转换阶数为2(r=2),采用二维计算形式,即针对T2(42,32)计算过程中,滑动窗口的尺寸为3×3,滑动窗口的步长为2,第一转换矩阵的尺寸为5×3,第二转换矩阵的尺寸为3×5,第三转换矩阵的尺寸为5×4,此时这三个矩阵即T2(42,32)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T2(4,3)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。
实验表明,T2(4,3)计算过程中,针对一个特征图子图中的3个数据,需执行5次乘法操作,可得到一个输出子矩阵中的4个输出值。现有的技术方案,针对一个特征图子图中的3个数据,执行3次乘法操作,只能得到1个输出值。若想要得到4个输出值,现有的技术方案总共需要执行12次乘法操作。
T2(42,32)计算过程中,针对一个特征图子图中的9个数据,需执行25(5×5)次乘法操作,可得到一个输出子矩阵中的16个输出值。现有的技术方案,针对一个特征图子图中的9个数据,执行9次乘法操作,只能得到1个输出值。若想要得到16个输出值,现有的技术方案总共需要执行144次乘法操作。因此,本发明方案提出的转置卷积计算方法极大地提高了计算效率。
若转置卷积的步长为2(s=2),转置卷积核的尺寸为1×3(k=3),转换阶数为3(r=3),采用一维计算形式,即针对T3(6,3)计算过程中,滑动窗口的尺寸为1×4,滑动窗口的步长为3,第一转换矩阵的尺寸为7×3,第二转换矩阵的尺寸为4×7,第三转换矩阵的尺寸为7×6,可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为:
若转置卷积的步长为2(s=2),转置卷积核的尺寸为3×3(k=3),转换阶数为3(r=3),采用二维计算形式,即针对T3(62,32)计算过程中,滑动窗口的尺寸为4×4,滑动窗口的步长为3,第一转换矩阵的尺寸为7×3,第二转换矩阵的尺寸为4×7,第三转换矩阵的尺寸为7×6,此时这三个矩阵即T3(62,32)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T3(6,3)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。
实验表明,T3(6,3)计算过程中,针对一个特征图子图中的4个数据,需执行7次乘法操作,可得到一个输出子矩阵中的6个输出值。现有的技术方案,针对一个特征图子图中的3个数据,执行3次乘法操作,只能得到1个输出值。若想要得到6个输出值,现有的技术方案总共需要执行18次乘法操作。
T3(62,32)计算过程中,针对一个特征图子图中的16个数据,需执行49(7×7)次乘法操作,可得到一个输出子矩阵中的36个输出值。现有的技术方案,针对一个特征图子图中的9个数据,执行9次乘法操作,只能得到1个输出值。若想要得到36个输出值,现有的技术方案总共需要执行324次乘法操作。因此,本发明方案提出的转置卷积计算方法极大地提高了计算效率。
若转置卷积的步长为2(s=2),转置卷积核的尺寸为1×4(k=4),转换阶数为1(r=1),采用一维计算形式,即针对T1(2,4)计算过程中,滑动窗口的尺寸为1×3,滑动窗口的步长为1,第一转换矩阵的尺寸为4×4,第二转换矩阵的尺寸为3×4,第三转换矩阵的尺寸为4×2,可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为:
参见图3,为本申请实施例公开的针对T1(22,42)转置卷积计算的流程示意图,若转置卷积的步长为2(s=2),转置卷积核的尺寸为4×4(k=4),转换阶数为1(r=1),采用二维计算形式,即针对T1(22,42)计算过程中,滑动窗口的尺寸为3×3,滑动窗口的步长为1,第一转换矩阵的尺寸为4×4,第二转换矩阵的尺寸为3×4,第三转换矩阵的尺寸为4×2,此时这三个矩阵即T1(22,42)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T1(2,4)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。
实验表明,T1(2,4)计算过程中,针对一个特征图子图中的3个数据,需执行4次乘法操作,可得到一个输出子矩阵中的2个输出值。现有的技术方案,针对一个特征图子图中的4个数据,执行4次乘法操作,只能得到1个输出值。若想要得到2个输出值,现有的技术方案总共需要执行8次乘法操作。
T1(22,42)计算过程中,针对一个特征图子图中的9个数据,需执行16(4×4)次乘法操作,可得到一个输出子矩阵中的4个输出值。现有的技术方案,针对一个特征图子图中的16个数据,执行16次乘法操作,只能得到1个输出值。若想要得到4个输出值,现有的技术方案总共需要执行64次乘法操作。因此,本发明方案提出的转置卷积计算方法极大地提高了计算效率。
若转置卷积的步长为2(s=2),转置卷积核的尺寸为1×4(k=4),转换阶数为2(r=2),采用一维计算形式,即针对T2(4,4)计算过程中,滑动窗口的尺寸为1×4,滑动窗口的步长为2,第一转换矩阵的尺寸为6×4,第二转换矩阵的尺寸为4×6,第三转换矩阵的尺寸为6×4,可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为:
参见图4,为本申请实施例公开的针对T2(42,42)转置卷积计算的流程示意图,若转置卷积的步长为2(s=2),转置卷积核的尺寸为4×4(k=4),转换阶数为2(r=2),采用二维计算形式,即针对T2(42,42)计算过程中,滑动窗口的尺寸为4×4,滑动窗口的步长为2,第一转换矩阵的尺寸为6×4,第二转换矩阵的尺寸为4×6,第三转换矩阵的尺寸为6×4,此时这三个矩阵即T2(42,42)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T2(4,4)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。
实验表明,T2(4,4)计算过程中,针对一个特征图子图中的4个数据,需执行6次乘法操作,可得到一个输出子矩阵中的4个输出值。现有的技术方案,针对一个特征图子图中的4个数据,执行4次乘法操作,只能得到1个输出值。若想要得到4个输出值,现有的技术方案总共需要执行16次乘法操作。
T2(42,42)计算过程中,针对一个特征图子图中的16个数据,需执行36(6×6)次乘法操作,可得到一个输出子矩阵中的16个输出值。现有的技术方案,针对一个特征图子图中的16个数据,执行16次乘法操作,只能得到1个输出值。若想要得到16个输出值,现有的技术方案总共需要执行256次乘法操作。因此,本发明方案提出的转置卷积计算方法极大地提高了计算效率。
若转置卷积的步长为2(s=2),转置卷积核的尺寸为1×4(k=4),转换阶数为3(r=3),采用一维计算形式,即针对T3(6,4)计算过程中,滑动窗口的尺寸为1×5,滑动窗口的步长为3,第一转换矩阵的尺寸为8×4,第二转换矩阵的尺寸为5×8,第三转换矩阵的尺寸为8×6,可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为:
/>
参见图5,为本申请实施例公开的针对T3(62,42)转置卷积计算的流程示意图,若转置卷积的步长为2(s=2),转置卷积核的尺寸为4×4(k=4),转换阶数为3(r=3),采用二维计算形式,即针对T3(62,42)计算过程中,滑动窗口的尺寸为5×5,滑动窗口的步长为3,第一转换矩阵的尺寸为8×4,第二转换矩阵的尺寸为5×8,第三转换矩阵的尺寸为8×6,此时这三个矩阵即T3(62,42)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T3(6,4)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。
实验表明,T3(6,4)计算过程中,针对一个特征图子图中的5个数据,需执行8次乘法操作,可得到一个输出子矩阵中的6个输出值。现有的技术方案,针对一个特征图子图中的4个数据,执行4次乘法操作,只能得到1个输出值。若想要得到6个输出值,现有的技术方案总共需要执行24次乘法操作。
T3(62,42)计算过程中,针对一个特征图子图中的25个数据,需执行64(8×8)次乘法操作,可得到一个输出子矩阵中的36个输出值。现有的技术方案,针对一个特征图子图中的16个数据,执行16次乘法操作,只能得到1个输出值。若想要得到36个输出值,现有的技术方案总共需要执行576次乘法操作。因此,本发明方案提出的转置卷积计算方法极大地提高了计算效率。
若转置卷积的步长为2(s=2),转置卷积核的尺寸为1×5(k=5),转换阶数为1(r=1),采用一维计算形式,即针对T1(2,5)计算过程中,滑动窗口的尺寸为1×3,滑动窗口的步长为1,第一转换矩阵的尺寸为5×5,第二转换矩阵的尺寸为3×5,第三转换矩阵的尺寸为5×2,可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为:
/>
若转置卷积的步长为2(s=2),转置卷积核的尺寸为5×5(k=5),转换阶数为1(r=1),采用二维计算形式,即针对T1(22,52)计算过程中,滑动窗口的尺寸为3×3,滑动窗口的步长为1,第一转换矩阵的尺寸为5×5,第二转换矩阵的尺寸为3×5,第三转换矩阵的尺寸为5×2,此时这三个矩阵即T1(22,52)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T1(2,5)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。
实验表明,T1(2,5)计算过程中,针对一个特征图子图中的3个数据,需执行5次乘法操作,可得到一个输出子矩阵中的2个输出值。现有的技术方案,针对一个特征图子图中的5个数据,执行5次乘法操作,只能得到1个输出值。若想要得到2个输出值,现有的技术方案总共需要执行10次乘法操作。
T1(22,52)计算过程中,针对一个特征图子图中的9个数据,需执行25(5×5)次乘法操作,可得到一个输出子矩阵中的4个输出值。现有的技术方案,针对一个特征图子图中的25个数据,执行25次乘法操作,只能得到1个输出值。若想要得到4个输出值,现有的技术方案总共需要执行100次乘法操作。因此,本发明方案提出的转置卷积计算方法极大地提高了计算效率。
若转置卷积的步长为2(s=2),转置卷积核的尺寸为1×5(k=5),转换阶数为2(r=2),采用一维计算形式,即针对T2(4,5)计算过程中,滑动窗口的尺寸为1×4,滑动窗口的步长为2,第一转换矩阵的尺寸为7×5,第二转换矩阵的尺寸为4×7,第三转换矩阵的尺寸为7×4,可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为:
/>
若转置卷积的步长为2(s=2),转置卷积核的尺寸为5×5(k=5),转换阶数为2(r=2),采用二维计算形式,即针对T2(42,52)计算过程中,滑动窗口的尺寸为4×4,滑动窗口的步长为2,第一转换矩阵的尺寸为7×5,第二转换矩阵的尺寸为4×7,第三转换矩阵的尺寸为7×4,此时这三个矩阵即T2(42,52)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T2(4,5)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。
实验表明,T2(4,5)计算过程中,针对一个特征图子图中的4个数据,需执行7次乘法操作,可得到一个输出子矩阵中的4个输出值。现有的技术方案,针对一个特征图子图中的5个数据,执行5次乘法操作,只能得到1个输出值。若想要得到4个输出值,现有的技术方案总共需要执行20次乘法操作。
T2(42,52)计算过程中,针对一个特征图子图中的16个数据,需执行49(7×7)次乘法操作,可得到一个输出子矩阵中的16个输出值。现有的技术方案,针对一个特征图子图中的25个数据,执行25次乘法操作,只能得到1个输出值。若想要得到16个输出值,现有的技术方案总共需要执行400次乘法操作。因此,本发明方案提出的转置卷积计算方法极大地提高了计算效率。
若转置卷积的步长为3(s=3),转置卷积核的尺寸为1×5(k=5),转换阶数为1(r=1),采用一维计算形式,即针对T1(3,5)计算过程中,滑动窗口的尺寸为1×3,滑动窗口的步长为1,第一转换矩阵的尺寸为5×5,第二转换矩阵的尺寸为3×5,第三转换矩阵的尺寸为5×3,可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为:
若转置卷积的步长为3(s=3),转置卷积核的尺寸为5×5(k=5),转换阶数为1(r=1),采用二维计算形式,即针对T1(32,52)计算过程中,滑动窗口的尺寸为3×3,滑动窗口的步长为1,第一转换矩阵的尺寸为5×5,第二转换矩阵的尺寸为3×5,第三转换矩阵的尺寸为5×3,此时这三个矩阵即T1(32,52)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T1(3,5)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。
实验表明,T1(3,5)计算过程中,针对一个特征图子图中的3个数据,需执行5次乘法操作,可得到一个输出子矩阵中的3个输出值。现有的技术方案,针对一个特征图子图中的5个数据,执行5次乘法操作,只能得到1个输出值。若想要得到3个输出值,现有的技术方案总共需要执行15次乘法操作。
T1(32,52)计算过程中,针对一个特征图子图中的9个数据,需执行25(5×5)次乘法操作,可得到一个输出子矩阵中的9个输出值。现有的技术方案,针对一个特征图子图中的25个数据,执行25次乘法操作,只能得到1个输出值。若想要得到9个输出值,现有的技术方案总共需要执行225次乘法操作。因此,本发明方案提出的转置卷积计算方法极大地提高了计算效率。
若转置卷积的步长为3(s=3),转置卷积核的尺寸为1×5(k=5),转换阶数为2(r=2),采用一维计算形式,即针对T2(6,5)计算过程中,滑动窗口的尺寸为1×4,滑动窗口的步长为2,第一转换矩阵的尺寸为8×5,第二转换矩阵的尺寸为4×8,第三转换矩阵的尺寸为8×6,可将第一转换矩阵、第二转换矩阵及第三转换矩阵分别设置为:
若转置卷积的步长为3(s=3),转置卷积核的尺寸为5×5(k=5),转换阶数为2(r=2),采用二维计算形式,即针对T2(62,52)计算过程中,滑动窗口的尺寸为4×4,滑动窗口的步长为2,第一转换矩阵的尺寸为8×5,第二转换矩阵的尺寸为4×8,第三转换矩阵的尺寸为8×6,此时这三个矩阵即T2(62,52)的第一转换矩阵、第二转换矩阵、第三转换矩阵与T2(6,5)的第一转换矩阵、第二转换矩阵、第三转换矩阵分别一一对应相等。
实验表明,T2(6,5)计算过程中,针对一个特征图子图中的4个数据,需执行8次乘法操作,可得到一个输出子矩阵中的6个输出值。现有的技术方案,针对一个特征图子图中的5个数据,执行5次乘法操作,只能得到1个输出值。若想要得到6个输出值,现有的技术方案总共需要执行30次乘法操作。
T2(62,52)计算过程中,针对一个特征图子图中的16个数据,需执行64(8×8)次乘法操作,可得到一个输出子矩阵中的36个输出值。现有的技术方案,针对一个特征图子图中的25个数据,执行25次乘法操作,只能得到1个输出值。若想要得到36个输出值,现有的技术方案总共需要执行900次乘法操作。因此,本发明方案提出的转置卷积计算方法极大地提高了计算效率。
由以上几个例子可以看出,在转置卷积的步长s和转置卷积核的尺寸k不变,以及采用的计算形式一样的情况下,随着转换阶数r的增大,计算效率也会逐渐增大。
本申请通过预设的转置卷积核的尺寸、转置卷积的步长和转换阶数,设置第一转换矩阵、第二转换矩阵和第三转换矩阵,进而对转置卷积核、通过滑动窗口提取的特征图子图和运算过程中获得的中间子矩阵进行转换,从而可以实现在不需要补零的操作下,只需要对原特征图进行转置卷积运算;并且提出转换阶数的设置,扩大了适用范围,进一步降低计算复杂度。
以上结合具体实施方式和范例性实例对本申请进行了详细说明,不过这些说明并不能理解为对本申请的限制。本领域技术人员理解,在不偏离本申请精神和范围的情况下,可以对本申请技术方案及其实施方式进行多种等价替换、修饰或改进,这些均落入本申请的范围内。本申请的保护范围以所附权利要求为准。
Claims (4)
1.一种高效的转置卷积计算方法,其特征在于,所述方法包括:
基于预设的转置卷积核的尺寸参数、转置卷积的步长和转换阶数确定转置卷积总体架构;
将原特征图和所述转置卷积核输入所述转置卷积总体架构,输出转置卷积计算结果;
其中,所述转置卷积总体架构包括第一提取转换模块、转置卷积计算模块和第二转换输出模块;
所述第一提取转换模块包括提取单元、第一转换单元和第二转换单元,所述提取单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置滑动窗口的尺寸和滑动窗口的步长,然后根据所述滑动窗口的尺寸和所述滑动窗口的步长,利用滑动窗口机制在原特征图上提取多个特征图子图;所述第一转换单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第一转换矩阵,根据所述第一转换矩阵对所述转置卷积核进行转换,获得第二转置卷积核;所述第二转换单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第二转换矩阵,根据所述第二转换矩阵对所述特征图子图进行转换,获得第二特征图子矩阵;
所述转置卷积计算模块被配置为将所述第二特征图子矩阵与第二转置卷积核上的元素一一对应相乘,获得中间子矩阵;
所述第二转换输出模块被配置为包括第三转换单元和输出单元,所述第三转换单元根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第三转换矩阵,根据所述第三转换矩阵对所述中间子矩阵进行转换,获得输出子矩阵;所述输出单元将所述输出子矩阵依次排列成输出特征图,输出转置卷积计算结果;
其中,
所述根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第一转换矩阵,具体为:
根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第一转换矩阵的尺寸;
根据所述第一转换矩阵的尺寸设置所述第一转换矩阵;
所述根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第二转换矩阵,具体为:
根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第二转换矩阵的尺寸;
根据所述第二转换矩阵的尺寸设置所述第二转换矩阵;
所述根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第三转换矩阵,具体为:
根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数设置第三转换矩阵的尺寸;
根据所述第三转换矩阵的尺寸设置所述第三转换矩阵;
根据所述转置卷积核的尺寸参数、所述转置卷积的步长和所述转换阶数,通过计算公式获取各项参数,其中计算公式为:
Er=k+(r-1)×s
Or=s×r
Sr=r
其中,k为所述转置卷积核的尺寸参数,s为所述转置卷积的步长,r为所述转换阶数,k、s和r均为正整数,为数学符号的上取整符号;
根据所述各项参数,确定所述第一转换矩阵的尺寸、所述第二转换矩阵的尺寸、所述第三转换矩阵的尺寸、所述滑动窗口的尺寸和所述滑动窗口的步长,
其中,
所述第一转换矩阵的尺寸为Er×k;
所述第二转换矩阵的尺寸为Ir×Er;
所述第三转换矩阵的尺寸为Er×Or;
在一维计算形式中,所述滑动窗口的尺寸为1×Ir;
在二维计算形式中,所述滑动窗口的尺寸为Ir×Ir;
所述滑动窗口的步长为Sr,Sr=r。
2.根据权利要求1所述的高效的转置卷积计算方法,其特征在于,所述根据所述第一转换矩阵对所述转置卷积核进行转换,获得第二转置卷积核,具体分为两种计算形式:一维计算形式和二维计算形式;
对于一维计算形式,具体为:将所述第一转换矩阵和所述转置卷积核依次相乘,得到所述第二转置卷积核;
对于二维计算形式,具体为:将所述第一转换矩阵、所述转置卷积核和所述第一转换矩阵的转置矩阵依次相乘,得到所述第二转置卷积核。
3.根据权利要求1所述的高效的转置卷积计算方法,其特征在于,根据所述第二转换矩阵对所述特征图子图进行转换,获得第二特征图子矩阵,具体分为两种计算形式:一维计算形式和二维计算形式;
对于一维计算形式,具体为:将所述第二转换矩阵的转置矩阵和所述特征图子图依次相乘,得到所述第二特征图子矩阵;
对于二维计算形式,具体为:将所述第二转换矩阵的转置矩阵、所述特征图子图和所述第二转换矩阵依次相乘,得到所述第二特征图子矩阵。
4.根据权利要求1所述的高效的转置卷积计算方法,其特征在于,所述根据所述第三转换矩阵对所述中间子矩阵进行转换,获得输出子矩阵,具体分为两种计算形式:一维计算形式和二维计算形式;
对于一维计算形式,具体为:将所述第三转换矩阵的转置矩阵和所述中间子矩阵依次相乘,得到所述输出子矩阵;
对于二维计算形式,具体为:将所述第三转换矩阵的转置矩阵、所述中间子矩阵和所述第三转换矩阵依次相乘,得到所述输出子矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011617770.2A CN112650974B (zh) | 2020-12-30 | 2020-12-30 | 一种高效的转置卷积计算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011617770.2A CN112650974B (zh) | 2020-12-30 | 2020-12-30 | 一种高效的转置卷积计算方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112650974A CN112650974A (zh) | 2021-04-13 |
CN112650974B true CN112650974B (zh) | 2023-10-13 |
Family
ID=75364584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011617770.2A Active CN112650974B (zh) | 2020-12-30 | 2020-12-30 | 一种高效的转置卷积计算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112650974B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023044707A1 (en) * | 2021-09-24 | 2023-03-30 | Intel Corporation | Methods and apparatus to accelerate convolution |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109754062A (zh) * | 2017-11-07 | 2019-05-14 | 上海寒武纪信息科技有限公司 | 卷积扩展指令的执行方法以及相关产品 |
CN110766128A (zh) * | 2018-07-26 | 2020-02-07 | 北京深鉴智能科技有限公司 | 卷积计算单元、计算方法及神经网络计算平台 |
CN110826709A (zh) * | 2019-10-18 | 2020-02-21 | 华中科技大学 | 一种基于三维相变存储器的3d卷积运算装置及方法 |
WO2020186703A1 (en) * | 2019-03-20 | 2020-09-24 | Huawei Technologies Co., Ltd. | Convolutional neural network-based image processing method and image processing apparatus |
-
2020
- 2020-12-30 CN CN202011617770.2A patent/CN112650974B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109754062A (zh) * | 2017-11-07 | 2019-05-14 | 上海寒武纪信息科技有限公司 | 卷积扩展指令的执行方法以及相关产品 |
CN110766128A (zh) * | 2018-07-26 | 2020-02-07 | 北京深鉴智能科技有限公司 | 卷积计算单元、计算方法及神经网络计算平台 |
WO2020186703A1 (en) * | 2019-03-20 | 2020-09-24 | Huawei Technologies Co., Ltd. | Convolutional neural network-based image processing method and image processing apparatus |
CN110826709A (zh) * | 2019-10-18 | 2020-02-21 | 华中科技大学 | 一种基于三维相变存储器的3d卷积运算装置及方法 |
Non-Patent Citations (1)
Title |
---|
卷积神经网络压缩与前向推理加速技术研究;吴焕;《中国优秀硕士学位论文全文数据库 信息科技辑》(第01期);I140-790 * |
Also Published As
Publication number | Publication date |
---|---|
CN112650974A (zh) | 2021-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11449729B2 (en) | Efficient convolutional neural networks | |
CN105426345A (zh) | 一种矩阵求逆运算方法 | |
CN109284822A (zh) | 一种神经网络运算装置及方法 | |
CN111639699B (zh) | 一种图像特征提取的方法、系统、设备及可读存储介质 | |
Meng et al. | Efficient winograd convolution via integer arithmetic | |
JPH0572621B2 (zh) | ||
US20220164663A1 (en) | Activation Compression Method for Deep Learning Acceleration | |
CN105260773A (zh) | 一种图像处理装置以及图像处理方法 | |
CN112748483B (zh) | 一种基于深度学习的气温预报偏差订正方法及装置 | |
CN112650974B (zh) | 一种高效的转置卷积计算方法 | |
JP2020024524A (ja) | ニューラルネットワークの全結合層を畳み込み層に置き換えるプログラム | |
Chen et al. | An alternating manifold proximal gradient method for sparse PCA and sparse CCA | |
CN112258410B (zh) | 一种可微分的低秩学习网络图像修复方法 | |
CN112016522B (zh) | 一种视频数据处理方法、系统及相关组件 | |
Meher | Unified systolic-like architecture for DCT and DST using distributed arithmetic | |
CN103401650B (zh) | 一种(n,1,m)有误码卷积码的盲识别方法 | |
CN106776475A (zh) | 一种三项加权分数傅里叶变换的实现装置 | |
CN111563535A (zh) | 一种基于秩为r的离散非负矩阵分解聚类方法 | |
US11928176B2 (en) | Time domain unrolling sparse matrix multiplication system and method | |
CN112766471B (zh) | 运算装置及相关产品 | |
CN115298669A (zh) | 机器学习加速器的功率减小 | |
CN108776994B (zh) | 基于真三维显示系统的Roesser模型及其实现方法 | |
CN110689119A (zh) | 一种应用于深度卷积神经网络中的特征提取方法 | |
CN114118344A (zh) | 应用于Transformer神经网络的硬件加速器及其计算方法 | |
Bevilacqua et al. | On computing efficient data-sparse representations of unitary plus low-rank matrices |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |