CN112686269B - 池化方法、装置、设备和存储介质 - Google Patents
池化方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN112686269B CN112686269B CN202110061141.4A CN202110061141A CN112686269B CN 112686269 B CN112686269 B CN 112686269B CN 202110061141 A CN202110061141 A CN 202110061141A CN 112686269 B CN112686269 B CN 112686269B
- Authority
- CN
- China
- Prior art keywords
- pooling
- size
- target
- image
- pooled
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011176 pooling Methods 0.000 title claims abstract description 383
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000004891 communication Methods 0.000 claims description 13
- 230000008707 rearrangement Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Landscapes
- Image Processing (AREA)
Abstract
本发明提供了一种池化方法、装置、设备和存储介质,所述方法包括:获取待池化图像的初始尺寸和目标输出尺寸;根据初始尺寸和目标输出尺寸,确定池化参数;根据初始尺寸和目标输出尺寸,或者,根据池化参数对待池化图像进行重排,得到重排图像,使得重排图像满足池化的条件;根据池化参数对重排图形进行池化,得到具有目标输出尺寸的目标图像。本发明实施例中,根据待池化图像的初始尺寸和目标输出尺寸,确定池化参数;在待池化图像为不同尺寸图像的情况下,无需用户再次设置待池化图像的池化参数,减少了用户的操作,提高了图像池化的效率。
Description
技术领域
本发明涉及图像处理技术领域,特别是涉及池化方法、装置、设备和存储介质。
背景技术
在对图像进行处理的过程中,为了去除图像中的冗余信息,对图像特征进行压缩,通常需要对图像进行池化操作。
图像池化的过程中,需要根据待池化图像的尺寸设置滑窗参数、步长等各种池化参数,使用上述池化参数对待池化图像进行池化。然而,当对不同尺寸的图像进行池化操作时,需要用户自行设置每个图像的池化参数,这样,增加了用户的操作,导致图像池化的效率较低。
发明内容
本发明实施例的目的在于提供一种池化方法、装置、设备和存储介质,解决池化的效率较低的技术问题。具体技术方案如下:
在本发明实施例的第一方面,首先提供了一种池化方法,包括以下步骤:
获取待池化图像的初始尺寸和目标输出尺寸;
根据所述初始尺寸和所述目标输出尺寸,确定池化参数;
根据所述初始尺寸和所述目标输出尺寸,或者,根据所述池化参数对所述待池化图像进行重排,得到重排图像,使得重排图像满足池化的条件;
根据所述池化参数对所述重排图形进行池化,得到具有所述目标输出尺寸的目标图像。
在本发明实施例的第二方面,还提供了一种池化装置,所述装置包括:
获取模块,用于获取待池化图像的初始尺寸和目标输出尺寸;
确定模块,用于根据所述初始尺寸和所述目标输出尺寸,确定池化参数;
重排模块,用于根据所述初始尺寸和所述目标输出尺寸,或者,根据所述池化参数对所述待池化图像进行重排,得到重排图像,使得重排图像满足池化的条件;
池化模块,用于根据所述池化参数对所述重排图形进行池化,得到具有所述目标输出尺寸的目标图像。
在本发明实施例的第三方面,还提供了一种设备,所述设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的指令,当其在计算机上运行时,使得计算机执行上述任一实施例所述的池化方法。
在本发明实施例的第四方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一实施例所述的池化方法。
本发明实施例中,根据待池化图像的初始尺寸和目标输出尺寸,确定池化参数;在待池化图像为不同尺寸图像的情况下,无需用户再次设置待池化图像的池化参数,减少了用户的操作,提高了图像池化的效率。此外,通过对待池化图像进行重排,得到重排图像,将池化步长为非统一步长数值的池化转变为池化步长为统一步长数值的池化,并使用池化参数对重排图形进行池化,得到具有目标输出尺寸的目标图像,通过上述使用池化参数对重排图像进行池化的方式,提高了图像池化的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例中池化方法的流程图;
图2a-图2b为本发明实施例中池化方法的一应用场景示意图;
图3为本发明实施例中池化装置的一结构示意图;
图4为本发明实施例中池化方法的另一应用场景示意图;
图5为本发明实施例中池化装置的另一结构示意图;
图6为本发明实施例中池化装置的结构示意图;
图7为本发明实施例中设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
请参阅图1,图1为本发明实施例中池化方法的流程图。本实施例提供的池化方法,包括以下步骤:
S101,获取待池化图像的初始尺寸和目标输出尺寸。
本步骤中,上述初始尺寸可以理解为是待池化图像的尺寸,上述目标输出尺寸可以理解为是目标图像的尺寸,其中,目标图像即池化后的待池化图像。
应理解,上述初始尺寸和目标输出尺寸可以是自定义设置的经验值,本实施例对初始尺寸和目标输出尺寸的具体数值不作限定。
S102,根据所述初始尺寸和所述目标输出尺寸,确定池化参数。
本步骤中,初始尺寸包括初始高度和初始宽度,这里,可以将待池化图像的图像高度称为初始高度,可以将待池化图像的图像宽度称为初始宽度。
目标输出尺寸包括目标输出高度和目标输出宽度,这里,可以将目标图像的高度称为目标输出高度,可以将目标图像的宽度称为目标输出宽度。
本步骤中,使用相关公式对初始尺寸和目标输出尺寸进行计算,得到待池化图像的池化参数,具体的技术方案请参阅后续实施例。
S103,根据所述初始尺寸和所述目标输出尺寸,或者,根据所述池化参数对所述待池化图像进行重排,得到重排图像。
本步骤中,一种可选的实施方式为,基于待池化图像的初始尺寸和目标图像的输出尺寸,对待池化图像进行重排,也可以理解为待池化图像进行重塑,得到重排图像,具体如何使用初始尺寸和目标输出尺寸,对待池化图像进行重排,得到重排图像的技术方案,请参阅后续实施例。
另一种可选的实施方式为,基于待池化图像的池化参数对待池化图像进行重排,得到重排图像,具体的技术方案,请参阅后续实施例。
应理解,该重排图像为满足池化的条件的图像。
S104,根据所述池化参数对所述重排图形进行池化,得到具有所述目标输出尺寸的目标图像。
本步骤中,使用池化参数对重排图像进行池化,需要说明的是,对重排图像进行池化操作能降低重排图像中的冗余信息,降低重排图像的数据大小,通过对重排图像进行池化,得到目标图像。
本发明实施例中,根据待池化图像的初始尺寸和目标输出尺寸,确定池化参数;在待池化图像为不同尺寸图像的情况下,无需用户再次设置待池化图像的池化参数,减少了用户的操作,提高了图像池化的效率。此外,通过对待池化图像进行重排,得到重排图像,将池化步长为非统一步长数值的池化转变为池化步长为统一步长数值的池化,并使用池化参数对重排图形进行池化,得到具有目标输出尺寸的目标图像,通过上述使用池化参数对重排图像进行池化的方式,提高了图像池化的效率。
可选地,所述根据所述初始尺寸和所述目标输出尺寸,确定池化参数包括:
根据所述待池化图像在池化方向上的初始高度和目标输出高度,确定第一步长和滑窗高度;根据所述待池化图像在池化方向上的初始宽度和目标输出宽度,确定第二步长和滑窗宽度。
如上所述,初始尺寸包括初始宽度和初始高度,目标输出尺寸包括目标输出宽度和目标输出高度。应理解,池化参数包括步长参数和滑窗参数,步长参数表征池化过程中的池化步长,步长参数可以为1个或多个,该步长参数包括第一步长和第二步长,在第一步长和第二步长为同一步长的情况下,确定步长参数为1个;滑窗参数表征池化过程中的滑窗,该滑窗参数包括滑窗宽度和滑窗高度。
本实施例中,待池化图像至少包括第一池化方向和第二池化方向,其中,一个池化方向可以是基于图像高度形成的从图像下方至图像上方的方向;另一个池化方向可以是基于图像宽度形成的从图像左方至图像右方的方向。
应理解,至少在一个池化方向上,初始尺寸和目标输出尺寸不同,为便于技术方案的阐述,后续实施例的应用场景为待池化图像在一个池化方向上进行池化。
本实施例中,可以根据初始高度和目标输出高度,确定第一步长和滑窗高度。可以根据初始宽度和目标输出宽度,确定第二步长和滑窗宽度。
以下,具体说明如何根据初始高度和目标输出高度,确定第一步长和滑窗高度:
可选地,所述根据所述待池化图像在池化方向上的初始高度和目标输出高度,确定第一步长和滑窗高度包括:
对高度比值向下取整,得到第一步长;将所述初始高度减去第一数值,得到所述滑窗高度。
本实施例中,使用以下公式计算第一步长:
stride_H=floor(input_size_H/output_size_H)
其中,stride_H为第一步长,(input_size_H/output_size_H)为高度比值,该高度比值为初始高度除以目标输出高度,input_size_H为初始高度,output_size_H为目标输出高度。
Floor函数用于向下取整,例如,在高度比值为3.4的情况下,对高度比值向下取整,得到第一步长为整数3,可以用公式表示为Floor(3.4)=3。
本实施例中,使用以下公式计算滑窗高度:
kernel_size_H=input_size_H-(output_size_H-1)*stride_H
其中,kernel_size_H为滑窗高度,input_size_H为初始高度,(output_size_H-1)*stride_H为第一数值,该第一数值为高度数值与第一步长的乘积,(output_size_H-1)为高度数值,高度数值为目标输出高度减去第一预设数值,上述公式中第一预设数值为1。
以下,具体说明如何根据初始宽度和目标输出宽度,确定第二步长和滑窗宽度:
可选地,所述根据所述待池化图像在池化方向上的初始宽度和目标输出宽度,确定第二步长和滑窗宽度包括:
对宽度比值向下取整,得到第二步长;将所述初始宽度减去第二数值,得到所述滑窗宽度。
本实施例中,使用以下公式计算第二步长:
stride_W=floor(input_size_W/output_size_W)
其中,stride_W为第二步长,(input_size_W/output_size_W)为宽度比值,该宽度比值为初始宽度除以目标输出宽度,input_size_W为初始宽度,output_size_W为目标输出宽度。
本实施例中,使用以下公式计算滑窗宽度:
kernel_size_W=input_size_W-(output_size_W-1)*stride_W
其中,kernel_size_W为滑窗宽度,input_size_W为初始宽度,(output_size_W-1)*stride_W为第二数值,该第二数值为宽度数值与第二步长的乘积,(output_size_W-1)为宽度数值,宽度数值为目标输出宽度减去第一预设数值,上述公式中第一预设数值为1。
上述实施例使用相关公式对初次尺寸和目标输出尺寸进行计算,得到池化参数,这样,在图像池化过程中,用户不必针对不同的待池化图像设置对应的步长参数,提高了图像池化的效率。
在得到待池化参数后,可以使用以下2种方式对待池化图像进行池化。
第一种使用池化参数对待池化图像进行池化的方式为:
可选地,所述根据所述初始尺寸和所述目标输出尺寸,得到重排图像包括:
根据所述初始尺寸和所述目标输出尺寸,确定所述待池化图像中的N个待拼接元素;按照待池化图像的池化方向,将每一所述待拼接元素添加至对应的拼接位置,得到重排图像。
可选地,所述根据所述初始尺寸和所述目标输出尺寸,确定所述待池化图像中的N个待拼接元素包括:
根据所述初始尺寸和所述目标输出尺寸,确定所述待池化图像在每个池化步骤对应的池化元素;将所述池化元素中重复的元素确定为待拼接元素。
出于清楚阐述本实施例的目的,请参阅图2a,图2a所示的应用场景中,待池化图像的初始高度为2,初始宽度为6;目标图像的目标输出高度为2,目标输出高度为2,目标输出宽度为4;池化过程中的第一步长为1,第二步长为2;池化过程中滑窗的滑窗高度为2,滑窗宽度为2,这里可以将每一个单元格称为池化元素。
在上述应用场景下,如图2a所述,需要通过4个池化步骤对待池化图像进行池化,以得到目标图像。其中,第一个池化步骤为对待池化图像的第1列和第2列包含的池化元素进行池化;第二个池化步骤为对待池化图像的第2列和第3列包含的池化元素进行池化;第三个池化步骤为对待池化图像的第4列和第5列包含的池化元素进行池化;第四个池化步骤为对待池化图像的第5列和第6列包含的池化元素进行池化。
如上所述,可以得到,在一次池化过程中,待池化图像第2列包含的池化元素和第5列包含的池化元素进行了2次池化。其中,第2列包含的池化元素在第一个池化步骤和第二个池化步骤进行了池化;第5列包含的池化元素在第三个个池化步骤和第四个池化步骤进行了池化。这里,可以将所有池化元素中重复的元素确定为待拼接元素,即可以将第2列包含的池化元素和第5列包含的池化元素为待拼接元素。
可以将待拼接元素添加至对应的待拼接位置,如图2b所示,每一待拼接元素对应的拼接位置位于待拼接元素和待拼接元素相邻的后一元素之间。这里,可以将第2列包含的池化元素称为第一待拼接元素,将第5列包含的池化元素称为第二待拼接元素。那么,第一待拼接元素对应的待拼接位置为待池化图像的第2列和第3列之间,第二待拼接元素对应的待拼接位置为待池化图像的第5列和第6列之间,可以在待池化图像的第2列和第3列之间插入第一待拼接元素,在待池化图像的第5列和第6列之间插入第二待拼接元素,对图像进行重排,得到重排图像。
应理解,重排图像满足普通池化的条件,其中,池化步长为统一步长数值,即可以通过普通池化对该重排图像进行池化,得到目标图像。
以下,具体说明如何确定每个池化步骤对应的池化元素:
可选地,所述根据所述初始尺寸和所述目标输出尺寸,确定所述待池化图像在每个池化步骤对应的池化元素包括:
将预设值与所述初始宽度的乘积,除以所述目标输出宽度,得到第三数值;对所述第三数值向下取整,确定待池化图像在所述池化步骤中的起点数值;计算所述预设值与第三预设数值的和,得到第一和值;将所述第一和值与所述初始宽度的乘积,除以所述目标输出宽度,得到第四数值;对所述第四数值向上取整,确定待池化图像在所述池化步骤中的终点数值。
本实施例中,对于任一池化步骤而言,可以通过以下公式确定该池化步骤对应的起点数值:
iStartW=floor(ow*inSizeW/outsizeW)
其中,iStartW为起点数值,ow为该池化步骤对应的预设值,inSizeW为初始宽度,outsizeW为目标输出宽度,floor函数为向下取整。
应理解,在一些实施例中,ow的值为池化步骤的排序值与1的差值,例如第一个池化步骤对应的ow为0,第二个池化步骤对应的ow为1。
应理解,上述起点数值与第二预设数值的和表征池化步骤的池化起点,该池化起点可以理解为该池化步骤中首次池化的池化元素,其中,第二预设数值可以为1。例如,一池化步骤对应的起点数值为0,该起点数值与第二预设数值的和为1,表示该池化步骤的池化起点位于待池化图像的第1列。
本实施例中,对于一池化步骤而言,可以通过以下公式确定该池化步骤对应的终点数值:
iENDW=ceil((ow+1)*inSizeW/outsizeW)
其中,iENDW为终点数值,ow为该池化步骤对应的预设值,inSizeW为初始宽度,outsizeW为目标输出宽度,ceil函数为向上取整。
应理解,上述终端数值可以表征池化步骤的池化终点,上述池化终点可以理解为该池化步骤中最后池化的池化元素。例如,一池化步骤对应的终端数值为2,表示该池化步骤的池化终点位于待池化图像的第2列。
示例性的,如图2a所示,一种可能存在的应用场景为,待池化图像的初始宽度为6,目标输出宽度为4,预设值为池化步骤的排序值与1的差值。对于第一个池化步骤,可以通过上述公式计算得到起点数值为floor(0*6/4)=0,即第一个池化步骤对应的起点数值为0。通过上述公式计算终点数值为ceil((0+1)*6/4)=2即第一个池化步骤对应的终点数值为2。那么,第一个池化步骤对应的池化起点为1,即池化起点位于待池化图像的第1列;第一个池化步骤对应的池化终点为2,即池化起点位于待池化图像的第2列。
可选地,所述根据所述池化参数对所述重排图形进行池化,得到具有所述目标输出尺寸的目标图像包括:
在所述步长参数包括多个步长的情况下,使用第一目标步长和滑窗对所述重排图形进行池化,得到所述目标图像。
为便于理解,请参阅图2b,如图2b所示的应用场景中,待池化图像的初始高度为2,初始宽度为6;目标图像的目标输出高度为2,目标输出宽度为4。通过上述实施例可以得到第一步长为1,第二步长为2,滑窗高度为2,滑窗宽度为2,重排图像的高度为2,宽度为8。
上述应用场景中,可以将第一步长和第二步长中数值较大的步长确定为第一目标步长,即第二步长,使用第一目标步长和滑窗对重排图像进行池化,得到高度为2,宽度为4的目标图像。其中,该滑窗基于滑窗参数生成,滑窗的高度为2,宽度为2。
可选的,请参阅图3,在第一种使用池化参数对待池化图像进行池化的方式中,上述情况下,池化装置包括运算单元、重塑单元、存储器和池化单元。
运算单元用于对初始尺寸和目标输出尺寸进行运算,得到步长参数和滑窗参数;重塑单元用于根据步长参数和滑窗参数对待池化图像进行拼接操作,得到重排图像,并将重排图像存储至存储器;存储器用于将重排图像发送至池化单元;池化单元用于使用步长参数和滑窗参数对重排图像进行池化,并将池化后得到的目标图像存储至存储器。
第二种使用池化参数对待池化图像进行池化的方式为:
可选地,所述根据所述池化参数对所述待池化图像进行重排,得到重排图像包括:
基于所述步长参数,确定所述待池化图像在每个池化步骤对应的池化元素;基于每个池化步骤的排序,确定K个目标池化分组;基于所述K个目标池化分组对应的池化元素,将所述待池化图像转换为K个像素序列,得到所述重排图像。
可选地,所述基于所述步长参数,确定所述待池化图像在每个池化步骤对应的池化元素包括:
基于所述步长参数确定K个步长;依据所述K个步长,为每个池化步骤配置对应的步长;基于每个池化步骤对应的步长,确定所述待池化图像在每个池化步骤对应的池化元素。
本实施例中,一种可选的实施方式为,为每个池化步骤配置对应的步长,应理解,相邻池化步骤配置的步长不同,例如,步长参数包括2个步长,一个步长为1,另一个步长为2,这种情况下,若第一个池化步骤的步长为1,则第二个池化步骤的步长为2,第三个池化步骤的步长为1。
进而,基于滑窗和该池化步骤对应的步长,确定该池化步骤对应的池化元素,其中,每个池化步骤对应的池化元素的数量基于滑窗参数确定,例如,滑窗高度为1,滑窗宽度为2,则每个池化步骤对应的池化元素的数量为滑窗高度与滑窗宽度的乘积,每个池化步骤对应的池化元素的数量为6。
示例性的,请参阅图4,在图4所示的一应用场景中,待池化图像的初始高度为1,初始宽度为10;目标图像的目标输出高度为1,目标输出宽度为4。基于上述实施例的内容可以得到,第一步长为2,第二步长为3,滑窗高度为1,滑窗宽度为3。
这种情况下,第一个池化步骤的步长为0,可以确定第一个池化步骤对应的池化元素为待池化图像的第1列包含池化元素至第3列包含池化元素;第二个池化步骤配置的步长为2,可以确定第二个池化步骤对应的池化元素为待池化图像的第3列包含池化元素至第5列包含池化元素。
另一种可选的实施方式为,可以根据初始尺寸和所述目标输出尺寸,使用相应的公式得到每个池化步骤对应的起点数值和终点数值,进而基于起点数值和终点数值确定每个池化步骤对应的池化元素。该实施方式具体的技术方案已在前述实施例说明,在此不重复阐述。
本实施例中,可以根据待池化图像对应的池化步骤的排序,对所有池化步骤进行分类,得到K个目标池化分组,其中,每个目标池化分组包括L个池化步骤,且目标池化分组中相邻的池化步骤的排序数值的差值为K;K和L均为正整数,且K的数值与步长的数量相同。
示例性的,请参阅图4,在图4所示的应用场景中,存在2个步长,即第一步长和第二步长。由于第三个池化步骤的排序数值3与第一个池化步骤的排序数值1的差值为2,因此可以将第一个池化步骤和第二个池化步骤划分至一个目标池化分组,这里,将该目标池化分组称为第一目标池化分组。基于相同的原理,可以将第二个池化步骤和第四个池化步骤划分至另一个目标池化分组,这里,将该目标池化分组称为第二目标池化分组。
本实施例中,基于K个目标池化分组对应的池化元素,将待池化图像转换为K个像素序列。
示例性的,在图4所示的应用场景中,可以基于第一目标池化分组对应的池化元素和第二目标池化分组对应的池化元素,将待池化图像转换为2个像素序列,其中,第一个像素序列包括第一目标池化分组对应的池化元素,即待池化图像第1列至第3列和第6列至第8列包含的池化元素;第二个像素序列包括第二目标池化分组对应的池化元素,即待池化图像第3列至第5列和第8列至第10列包含的池化元素。
以下,具体说明如何对K个像素序列进行池化:
可选地,所述根据所述池化参数对所述重排图形进行池化,得到具有所述目标输出尺寸的目标图像包括:
使用滑窗和第二目标步长对所述K个像素序列进行池化,得到K个池化序列;基于目标元素对应的池化步骤的排序,将所述K个池化序列拼接为目标图像。
可选地,所述使用滑窗和第二目标步长对所述K个像素序列进行池化包括:
基于每个所述像素序列中的目标起点元素,使用滑窗和第二目标步长对所述像素序列进行池化。
本实施例中,可以将像素序列中排序最先的池化步骤确定为目标池化步骤,将目标池化步骤中的起点元素确定为目标起点元素,基于每个像素序列中的目标起点元素,使用滑窗和第二目标步长对像素序列进行池化,得到K个池化序列,其中,第二目标步长为步长参数中的步长之和。
示例性的,在图4所示的应用场景中,第二像素序列包括第二个池化步骤对应的元素和第四个池化步骤对应的元素,由于第二个池化步骤的排序先于第四个池化步骤,因此可以将第二个池化步骤确定为目标池化步骤。第二个池化步骤的起点元素为待池化图像第3列包含的元素,因此可以将目标起点元素设置为第3列包含的元素,使用第二目标步长和滑窗,以第3列为池化起点,对第二像素序列进行池化,得到池化序列。
本实施例中,可以将池化序列中的元素称为目标元素,且每一目标元素对应一个池化步骤,将所有的目标元素按照对应的池化步骤的排序进行拼接,得到目标图像。
例如,在图4所示的应用场景中,第一像素序列包括第一个池化步骤对应的元素和第三个池化步骤对应的元素,对第一像素序列进行池化得到的第一池化序列包括2个目标元素,其中,一个目标元素对应第一个池化步骤,另一个目标元素对应第三个池化步骤。基于相同的原理,第二池化序列包括2个目标元素,其中,一个目标元素对应第二个池化步骤,另一个目标元素对应第四个池化步骤。
这种情况下,将所有的目标元素按照对应的池化步骤的排序进行拼接,得到目标图像,该目标图像包括4个元素,其中该目标图像第1列的元素对应第一个池化步骤,第2列的元素对应第二个池化步骤,第3列的元素对应第三个池化步骤,第4列的元素对应第四个池化步骤。
可选地,请参阅图5,在上述情况下,池化装置包括运算单元、重塑单元、存储器、池化单元和拼接单元。
运算单元用于对初始尺寸和目标输出尺寸进行运算,得到步长参数和滑窗参数;重塑单元用于将待池化图像转换为K个像素序列,并将K个像素序列存储至存储器;存储器用于将K个像素序列一并发送至池化单元;池化单元用于对K个像素序列进行池化,并将池化后的池化序列发送至拼接单元;拼接单元用于将K个池化序列进行拼接,得到目标图像,并将目标图像存储至存储器。
如图6所示,本发明实施例还提供了一种池化装置200,包括:
获取模块201,用于获取待池化图像的初始尺寸和目标输出尺寸;
确定模块202,用于根据所述初始尺寸和所述目标输出尺寸,确定池化参数;
重排模块203,用于根据所述初始尺寸和所述目标输出尺寸,或者,根据所述池化参数对所述待池化图像进行重排,得到重排图像;
池化模块204,用于根据所述池化参数对所述重排图形进行池化,得到具有所述目标输出尺寸的目标图像。
可选地,所述确定模块202包括:
第一确定单元,用于根据所述待池化图像在池化方向上的初始高度和目标输出高度,确定第一步长和滑窗高度;
第二确定单元,用于根据所述待池化图像在池化方向上的初始宽度和目标输出宽度,确定第二步长和滑窗宽度。
可选地,所述第一确定单元,还用于:
对高度比值向下取整,得到第一步长;
将所述初始高度减去第一数值,得到所述滑窗高度。
可选地,所述第二确定单元,还用于:
对宽度比值向下取整,得到第二步长;
将所述初始宽度减去第二数值,得到所述滑窗宽度。
可选地,所述重排模块203,还用于:
根据所述初始尺寸和所述目标输出尺寸,确定所述待池化图像中的N个待拼接元素;
按照待池化图像的池化方向,将每一所述待拼接元素添加至对应的拼接位置,得到重排图像。
可选地,所述重排模块203,还用于:
根据所述初始尺寸和所述目标输出尺寸,确定所述待池化图像在每个池化步骤对应的池化元素;
将所述池化元素中重复的元素确定为待拼接元素。
可选地,所述重排模块203,还用于:
将预设值与所述初始宽度的乘积,除以所述目标输出宽度,得到第三数值;
对所述第三数值向下取整,确定待池化图像在所述池化步骤中的起点数值;
计算所述预设值与第三预设数值的和,得到第一和值;
将所述第一和值与所述初始宽度的乘积,除以所述目标输出宽度,得到第四数值;
对所述第四数值向上取整,确定待池化图像在所述池化步骤中的终点数值。
可选地,所述池化模块204,还用于:
在所述步长参数包括多个步长的情况下,使用第一目标步长和滑窗对所述重排图形进行池化,得到所述目标图像。
可选地,所述重排模块203,还用于;
基于所述步长参数,确定所述待池化图像在每个池化步骤对应的池化元素;
基于每个池化步骤的排序,确定K个目标池化分组;
基于所述K个目标池化分组对应的池化元素,将所述待池化图像转换为K个像素序列,得到所述重排图像。
可选地,所述重排模块203,还用于;
基于所述步长参数确定K个步长;
依据所述K个步长,为每个池化步骤配置对应的步长;
基于每个池化步骤对应的步长,确定所述待池化图像在每个池化步骤对应的池化元素。
可选地,所述池化模块204,还用于:
使用滑窗和第二目标步长对所述K个像素序列进行池化,得到K个池化序列;
基于所述目标元素对应的池化步骤的排序,将所述K个池化序列拼接为池化序列。
可选地,所述池化模块204,还用于:
基于每个所述像素序列中的目标起点元素,使用滑窗和第二目标步长对所述像素序列进行池化。
本发明实施例还提供了一种设备,如图7所示,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信;
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序;
所述计算机程序被处理器执行时,用于获取待池化图像的初始尺寸和目标输出尺寸;
根据所述初始尺寸和所述目标输出尺寸,确定池化参数;
根据所述初始尺寸和所述目标输出尺寸,或者,根据所述池化参数对所述待池化图像进行重排,得到重排图像;
根据所述池化参数对所述重排图形进行池化,得到具有所述目标输出尺寸的目标图像。
上述设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一实施例所述的池化方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一实施例所述的池化方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (13)
1.一种池化方法,其特征在于,包括以下步骤:
获取待池化图像的初始尺寸和目标输出尺寸;
根据所述初始尺寸和所述目标输出尺寸,确定池化参数;
根据所述初始尺寸和所述目标输出尺寸,或者,根据所述池化参数对所述待池化图像进行重排,得到重排图像,使得重排图像满足池化的条件;
根据所述池化参数对所述重排图形进行池化,得到具有所述目标输出尺寸的目标图像;
所述初始尺寸包括初始宽度和初始高度,所述目标输出尺寸包括目标输出宽度和目标输出高度,所述池化参数包括步长参数和滑窗参数,所述步长参数包括第一步长和第二步长,所述滑窗参数包括滑窗宽度和滑窗高度;
所述第一步长和所述滑窗高度通过如下步骤计算得到:对高度比值向下取整,得到第一步长,所述高度比值为所述初始高度除以所述目标输出高度;将所述初始高度减去第一数值,得到所述滑窗高度,所述第一数值为高度数值与所述第一步长的乘积,所述高度数值为所述目标输出高度减去第一预设数值;
所述第二步长和所述滑窗宽度通过如下步骤计算得到:对宽度比值向下取整,得到第二步长,所述宽度比值为所述初始宽度除以所述目标输出宽度;将所述初始宽度减去第二数值,得到所述滑窗宽度,所述第二数值为宽度数值与所述第二步长的乘积,所述宽度数值为所述目标输出宽度减去第一预设数值。
2.根据权利要求1所述的方法,其特征在于,所述根据所述初始尺寸和所述目标输出尺寸,确定池化参数包括:
根据所述待池化图像在池化方向上的初始高度和目标输出高度,确定第一步长和滑窗高度;
根据所述待池化图像在池化方向上的初始宽度和目标输出宽度,确定第二步长和滑窗宽度。
3.根据权利要求1所述的方法,其特征在于,所述根据所述初始尺寸和所述目标输出尺寸,得到重排图像包括:
根据所述初始尺寸和所述目标输出尺寸,确定所述待池化图像中的N个待拼接元素,N为正整数;
按照待池化图像的池化方向,将每一所述待拼接元素添加至对应的拼接位置,得到重排图像,所述拼接位置位于所述待拼接元素和所述待拼接元素相邻的后一元素之间。
4.根据权利要求3所述的方法,其特征在于,所述根据所述初始尺寸和所述目标输出尺寸,确定所述待池化图像中的N个待拼接元素包括:
根据所述初始尺寸和所述目标输出尺寸,确定所述待池化图像在每个池化步骤对应的池化元素,每一池化步骤对应的池化元素基于所述池化步骤的池化起点和池化终点确定;
将所述池化元素中重复的元素确定为待拼接元素。
5.根据权利要求4所述的方法,其特征在于,所述初始尺寸包括初始宽度,所述目标输出尺寸包括目标输出宽度,所述根据所述初始尺寸和所述目标输出尺寸,确定所述待池化图像在每个池化步骤对应的池化元素包括:
将预设值与所述初始宽度的乘积,除以所述目标输出宽度,得到第三数值,所述预设值与池化步骤的顺序对应;
对所述第三数值向下取整,确定待池化图像在所述池化步骤中的起点数值,所述起点数值与第二预设数值的和表征所述池化步骤的池化起点;
计算所述预设值与第三预设数值的和,得到第一和值;
将所述第一和值与所述初始宽度的乘积,除以所述目标输出宽度,得到第四数值;
对所述第四数值向上取整,确定待池化图像在所述池化步骤中的终点数值,所述终点数值表征所述池化步骤的池化终点。
6.根据权利要求5所述的方法,其特征在于,所述池化参数包括步长参数和滑窗参数,所述根据所述池化参数对所述重排图形进行池化,得到具有所述目标输出尺寸的目标图像包括:
在所述步长参数包括多个步长的情况下,使用第一目标步长和滑窗对所述重排图形进行池化,得到所述目标图像,其中,所述第一目标步长为数值最大的步长,所述滑窗基于所述滑窗参数生成。
7.根据权利要求1所述的方法,其特征在于,所述池化参数包括步长参数和滑窗参数,所述根据所述池化参数对所述待池化图像进行重排,得到重排图像包括:
基于所述步长参数,确定所述待池化图像在每个池化步骤对应的池化元素,每个池化步骤对应的池化元素的数量基于所述滑窗参数确定;
基于每个池化步骤的排序,确定K个目标池化分组,每个所述目标池化分组包括L个池化步骤,且所述目标池化分组中相邻的池化步骤的排序数值的差值为K,K和L均为正整数;
基于所述K个目标池化分组对应的池化元素,将所述待池化图像转换为K个像素序列,得到所述重排图像。
8.根据权利要求7所述的方法,其特征在于,所述基于所述步长参数,确定所述待池化图像在每个池化步骤对应的池化元素包括:
基于所述步长参数确定K个步长;
依据所述K个步长,为每个池化步骤配置对应的步长;
基于每个池化步骤对应的步长,确定所述待池化图像在每个池化步骤对应的池化元素。
9.根据权利要求7所述的方法,其特征在于,所述根据所述池化参数对所述重排图形进行池化,得到具有所述目标输出尺寸的目标图像包括:
使用滑窗和第二目标步长对所述K个像素序列进行池化,得到K个池化序列,所述K个池化序列包括M个目标元素,每个所述目标元素对应一个池化步骤,所述第二目标步长为所述步长参数中的步长之和,M为正整数;
基于所述目标元素对应的池化步骤的排序,将所述K个池化序列拼接为目标图像。
10.根据权利要求9所述的方法,其特征在于,所述使用滑窗和第二目标步长对所述K个像素序列进行池化包括:
基于每个所述像素序列中的目标起点元素,使用滑窗和第二目标步长对所述像素序列进行池化,所述目标起点元素为目标池化步骤对应的起点元素,所述目标池化步骤为所述像素序列中排序最先的池化步骤。
11.一种池化装置,其特征在于,所述装置包括:
获取模块,用于获取待池化图像的初始尺寸和目标输出尺寸;
确定模块,用于根据所述初始尺寸和所述目标输出尺寸,确定池化参数;
重排模块,用于根据所述初始尺寸和所述目标输出尺寸,或者,根据所述池化参数对所述待池化图像进行重排,得到重排图像,使得重排图像满足池化的条件;
池化模块,用于根据所述池化参数对所述重排图形进行池化,得到具有所述目标输出尺寸的目标图像;
所述初始尺寸包括初始宽度和初始高度,所述目标输出尺寸包括目标输出宽度和目标输出高度,所述池化参数包括步长参数和滑窗参数,所述步长参数包括第一步长和第二步长,所述滑窗参数包括滑窗宽度和滑窗高度;
所述第一步长和所述滑窗高度通过如下步骤计算得到:对高度比值向下取整,得到第一步长,所述高度比值为所述初始高度除以所述目标输出高度;将所述初始高度减去第一数值,得到所述滑窗高度,所述第一数值为高度数值与所述第一步长的乘积,所述高度数值为所述目标输出高度减去第一预设数值;
所述第二步长和所述滑窗宽度通过如下步骤计算得到:对宽度比值向下取整,得到第二步长,所述宽度比值为所述初始宽度除以所述目标输出宽度;将所述初始宽度减去第二数值,得到所述滑窗宽度,所述第二数值为宽度数值与所述第二步长的乘积,所述宽度数值为所述目标输出宽度减去第一预设数值。
12.一种设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-10中任一项所述的池化方法。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时,实现如权利要求1-10中任一项所述的池化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110061141.4A CN112686269B (zh) | 2021-01-18 | 2021-01-18 | 池化方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110061141.4A CN112686269B (zh) | 2021-01-18 | 2021-01-18 | 池化方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112686269A CN112686269A (zh) | 2021-04-20 |
CN112686269B true CN112686269B (zh) | 2024-06-25 |
Family
ID=75458291
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110061141.4A Active CN112686269B (zh) | 2021-01-18 | 2021-01-18 | 池化方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112686269B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105975931A (zh) * | 2016-05-04 | 2016-09-28 | 浙江大学 | 一种基于多尺度池化的卷积神经网络人脸识别方法 |
CN106407891A (zh) * | 2016-08-26 | 2017-02-15 | 东方网力科技股份有限公司 | 基于卷积神经网络的目标匹配方法及装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030014379A1 (en) * | 1999-07-01 | 2003-01-16 | Isaac Saias | Adaptive and reliable system and method for operations management |
CN108197536B (zh) * | 2017-12-20 | 2019-12-17 | 深圳云天励飞技术有限公司 | 图像处理方法及装置、计算机装置及可读存储介质 |
CN109165733A (zh) * | 2018-07-11 | 2019-01-08 | 中国人民解放军国防科技大学 | 多输入多输出矩阵最大值池化向量化实现方法 |
CN109308679B (zh) * | 2018-08-13 | 2022-08-30 | 深圳市商汤科技有限公司 | 一种图像风格转换方法及装置、设备、存储介质 |
CN110188725A (zh) * | 2019-06-05 | 2019-08-30 | 中国科学院长春光学精密机械与物理研究所 | 高分辨率遥感图像的场景识别系统及模型生成方法 |
CN111429514B (zh) * | 2020-03-11 | 2023-05-09 | 浙江大学 | 一种融合多帧时序点云的激光雷达3d实时目标检测方法 |
CN112149694B (zh) * | 2020-08-28 | 2024-04-05 | 特斯联科技集团有限公司 | 一种基于卷积神经网络池化模块的图像处理方法、系统、存储介质及终端 |
-
2021
- 2021-01-18 CN CN202110061141.4A patent/CN112686269B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105975931A (zh) * | 2016-05-04 | 2016-09-28 | 浙江大学 | 一种基于多尺度池化的卷积神经网络人脸识别方法 |
CN106407891A (zh) * | 2016-08-26 | 2017-02-15 | 东方网力科技股份有限公司 | 基于卷积神经网络的目标匹配方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112686269A (zh) | 2021-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108063818B (zh) | 数据下载方法、装置、终端和计算机可读存储介质 | |
CN110851987B (zh) | 基于加速比预测计算时长的方法、装置和存储介质 | |
CN113435328B (zh) | 视频片段处理方法、装置、电子设备及可读存储介质 | |
CN106685429B (zh) | 整数压缩方法及装置 | |
CN105760458A (zh) | 一种图片处理方法及电子设备 | |
CN111338616A (zh) | 协议解析代码的生成方法、装置及电子设备 | |
CN112686269B (zh) | 池化方法、装置、设备和存储介质 | |
CN112199450B (zh) | 一种关系图谱构建方法、装置及电子设备 | |
CN117236253A (zh) | 一种fpga布线方法、装置、计算机设备及存储介质 | |
CN108965295B (zh) | 一种文件压缩合并方法及相关装置 | |
CN116009898A (zh) | K8s部署任务的状态确定方法、装置、设备及介质 | |
CN110888799A (zh) | 一种软件测试方法及装置 | |
CN109784481B (zh) | 一种基于神经网络的调整方法、装置及设备 | |
CN111884932B (zh) | 一种链路确定方法、装置、设备和计算机可读存储介质 | |
CN109257798B (zh) | 一种ZigBee设备的连网方法及装置 | |
CN112596842A (zh) | 一种针对安卓系统sdk开发的屏幕适配方法及相关装置 | |
CN110020268B (zh) | 页面返回方法及装置 | |
CN111274640A (zh) | 样板间应用方法、装置及电子设备 | |
CN105988804B (zh) | 一种软件转移方法及终端 | |
CN109005413B (zh) | 一种算术编码中的概率估计方法、装置及电子设备 | |
CN104572033A (zh) | 系统生成方法及装置 | |
CN114900606B (zh) | 变焦跟踪曲线的校准方法、装置、电子装置和存储介质 | |
CN111666733B (zh) | 一种文档中的单元格处理方法和装置 | |
CN111723230B (zh) | 一种图片拼接的方法、装置、电子设备及存储介质 | |
CN111817895B (zh) | 一种主控节点切换方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |