CN115797182A - 一种特征图插值方法、装置、设备和存储介质 - Google Patents
一种特征图插值方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN115797182A CN115797182A CN202211729842.1A CN202211729842A CN115797182A CN 115797182 A CN115797182 A CN 115797182A CN 202211729842 A CN202211729842 A CN 202211729842A CN 115797182 A CN115797182 A CN 115797182A
- Authority
- CN
- China
- Prior art keywords
- interpolation
- grid
- points
- adjacent
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000010586 diagram Methods 0.000 claims abstract description 54
- 238000001514 detection method Methods 0.000 claims description 40
- 238000000605 extraction Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 16
- 230000004927 fusion Effects 0.000 claims description 12
- 238000011176 pooling Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 230000007547 defect Effects 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/14—Transformations for image registration, e.g. adjusting or mapping for alignment of images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4007—Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开一种特征图插值方法、装置、设备和存储介质,该方法包括:在当前特征图对应的各子区域的各方格中确定方格插值点的方格差值坐标以及方格插值点的四个临近点的临近坐标和临近特征值;根据方格插值坐标、临近坐标和临近特征值确定方格插值点对应的第一双线性插值和第一最近邻插值;基于方格插值点的临近点的第一特征值标准差对第一双线性插值和第一最近邻插值进行融合,得到方格插值点的目标插值;根据各子区域内各方格内方格插值点的目标插值确定各子区域内的区域插值,并根据各子区域内的区域插值确定目标特征图。上述技术方案,对当前特征图进行插值得到目标特征图,目标特征图弥补了当前特征图的高频边缘细节容易丢失的缺陷。
Description
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种特征图插值方法、装置、设备和存储介质。
背景技术
基于目标检测模型对待测图像进行目标检测时,首先需要基于目标检测模型中的卷积网络确定待测图像的特征图,再根据锚框确定感兴趣区域的特征图,进而基于目标检测模型中的全连接网络对感兴趣区域对应的特征图进行处理,实现对待测图像的分类和偏移量的预测。感兴趣区域对应的特征图是由各种尺度的锚框筛选和修正得到的,带有浮点数且大小不一致,而全连接层所需的特征图的维度固定,因此,在全连接层对感兴趣区域对应的特征图进行处理前,需要将感兴趣区域对应的特征图转换至全连接层所需的维度。
现有技术中,可以对锚框筛选和修正得到的感兴趣区域对应的特征图进行取整,得到第一特征图,再根据第一特征图的维度和全连接层所需的维度,对第一特征图进行缩放,得到第二特征图,此时第二特征图仍然可能存在浮点数,因此,可以继续对第二特征图进行取整,得到可以输入全连接层的目标特征图。
但是,对锚框筛选和修正得到的感兴趣区域对应的特征图进行两次取整后,导致待测图像和特征图不能精准匹配,进而影响目标检测精度。
发明内容
本发明提供一种特征图插值方法、装置、设备和存储介质,在不损失特征图细节的前提下实现对特征图的缩放。
第一方面,本发明实施例提供了一种特征图插值方法,包括:在当前特征图对应的各子区域的各方格中确定方格插值点的方格差值坐标,以及所述方格插值点的四个临近点的临近坐标和临近特征值,其中,所述临近坐标是对所述方格差值坐标进行向上取整和向下取整得到的;根据各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值确定各所述方格内所述方格插值点对应的第一双线性插值和第一最近邻插值;确定各所述方格内所述方格插值点的临近点的第一特征值标准差后,根据所述第一特征值标准差对所述第一双线性插值和所述第一最近邻插值进行融合,得到各所述方格内所述方格插值点的目标插值;根据各所述子区域内各所述方格内所述方格插值点的目标插值确定各所述子区域内的区域插值,并根据各所述子区域内的所述区域插值确定目标特征图。
本发明实施例的技术方案,提供一种特征图插值方法,包括:在当前特征图对应的各子区域的各方格中确定方格插值点的方格差值坐标,以及所述方格插值点的四个临近点的临近坐标和临近特征值,其中,所述临近坐标是对所述方格差值坐标进行向上取整和向下取整得到的;根据各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值确定各所述方格内所述方格插值点对应的第一双线性插值和第一最近邻插值;确定各所述方格内所述方格插值点的临近点的第一特征值标准差后,根据所述第一特征值标准差对所述第一双线性插值和所述第一最近邻插值进行融合,得到各所述方格内所述方格插值点的目标插值;根据各所述子区域内各所述方格内所述方格插值点的目标插值确定各所述子区域内的区域插值,并根据各所述子区域内的所述区域插值确定目标特征图。上述技术方案,在将当前特征图划分为多个子区域并将各子区域分别划分为多个方格后,可以确定各方格中的方格插值点的方格插值坐标以及方格插值点对应的临近点的临近坐标和临近特征值,方格插值点的方格插值坐标以及临近点临近坐标和临近特征值可以用于确定对当前特征图进行插值的方格插值点的方格特征值,为特征图插值提供了数据基础,分别基于两种插值方式对方格插值点的方格插值坐标以及临近点临近坐标和临近特征值进行处理,得到方格插值点对应的第一双线性插值和第一最近邻插值,确定方格插值点的四个临近点的临近特征值的标准差即方格插值点的四个临近点的第一特征标准差后,根据第一特征标准差对第一双线性插值和第一最近邻插值进行融合,得到方格插值点更加精确的方格特征值,即目标特征值,方格内方格插值点对应的目标特征值可以实现对方格的插值,在对各方格实现插值的基础上,进一步可以对各子区域进行插值,确定各子区域对应的特征值,并根据所有子区域的特征值确定目标特征图,目标特征图弥补了特征图的高频边缘细节容易丢失的缺陷,提升目标检测的精度。
进一步地,在当前特征图对应的各子区域的各方格中确定方格差值点的方格差值坐标之前,还包括:基于检测模型对应的划分方式将所述当前特征图划分为多个子区域;基于预设规格将各所述子区域划分为多个方格。
进一步地,在基于检测模型对应的划分方式将当前特征图划分为多个子区域之前,还包括:确定检测模型中特征提取层确定的特征图的第一维度以及全连接层所需的特征图的第二维度;根据所述第一维度和所述第二维度确定所述检测模型对应的所述划分方式。
进一步地,确定各所述方格内的方格插值点的方格插值坐标,包括:根据所述第一维度和所述第二维度确定各所述方格内的方格插值点的方格插值坐标。
进一步地,根据各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值确定各所述方格内所述方格插值点对应的第一双线性插值和第一最近邻插值,包括:基于最大池化对各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值进行处理,得到各所述方格内所述方格插值点对应的第一双线性插值;基于最近距离对各所述方格内所述方格插值点的方格插值坐标和所述临近点的临近坐标进行处理,得到各所述方格内所述方格插值点对应的第一最近邻插值。
进一步地,根据所述第一特征值标准差对所述第一双线性插值和所述第一最近邻插值进行融合,得到各所述方格内所述方格插值点的目标插值,包括:根据所述第一特征值标准差确定所述第一双线性插值的第一权重为所述第一最近邻插值的第二权重为其中,σ为第一特征值标准差;根据所述第一权重和所述第一双线性插值、所述第二权重和所述第一最近邻插值确定所述方格内所述方格插值点的所述目标插值。
进一步地,根据各所述子区域内各所述方格内所述方格插值点的目标插值确定各所述子区域内的区域插值,包括:确定各所述子区域内的区域插值点的区域插值坐标;根据各所述子区域内的区域插值点的区域插值坐标以及所述子区域内各所述方格内所述方格插值点的方格插值坐标和目标插值,确定各所述子区域内所述区域插值点对应的区域插值。
第二方面,本发明实施例还提供一种特征图插值装置,包括:第一确定模块,用于在当前特征图对应的各子区域的各方格中确定方格差值点的方格差值坐标,以及所述方格插值点的四个临近点的临近坐标和临近特征值,其中,所述临近坐标是对所述方格差值坐标进行向上取整和向下取整得到的;第二确定模块,用于根据各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值确定各所述方格内所述方格插值点对应的第一双线性插值和第一最近邻插值;融合模块,用于确定各所述方格内所述方格插值点的临近点的第一特征值标准差后,根据所述第一特征值标准差对所述第一双线性插值和所述第一最近邻插值进行融合,得到各所述方格内所述方格插值点的目标插值;执行模块,用于根据各所述子区域内各所述方格内所述方格插值点的目标插值确定各所述子区域内的区域插值,并根据各所述子区域内的所述区域插值确定目标特征图。
第三方面,本发明实施例还提供了一种计算机设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面中任一项所述的特征图插值方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行第一方面中任一所述的特征图插值方法。
第五方面,本申请提供一种计算机程序产品,该计算机程序产品包括计算机指令,当计算机指令在计算机上运行时,使得计算机执行如第一方面提供的特征图插值方法。
需要说明的是,上述计算机指令可以全部或者部分存储在计算机可读存储介质上。其中,计算机可读存储介质可以与特征图插值装置的处理器封装在一起的,也可以与特征图插值装置的处理器单独封装,本申请对此不做限定。
本申请中第二方面、第三方面、第四方面以及第五方面的描述,可以参考第一方面的详细描述;并且,第二方面、第三方面、第四方面、以及第五方面的描述的有益效果,可以参考第一方面的有益效果分析,此处不再赘述。
在本申请中,上述特征图插值装置的名字对设备或功能模块本身不构成限定,在实际实现中,这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本申请类似,属于本申请权利要求及其等同技术的范围之内。
本申请的这些方面或其他方面在以下的描述中会更加简明易懂。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种特征图插值方法的流程图;
图2为本发明实施例提供的另一种特征图插值方法的流程图;
图3为本发明实施例提供的另一种特征图插值方法中基于预设规格将子区域划分为多个方格的示意图;
图4为本发明实施例提供的一种特征图插值装置的结构示意图;
图5为本发明实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
本申请的说明书以及附图中的术语“第一”和“第二”等是用于区别不同的对象,或者用于区别对同一对象的不同处理,而不是用于描述对象的特定顺序。
此外,本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选的还包括其他没有列出的步骤或单元,或可选的还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
在本申请的描述中,除非另有说明,“多个”的含义是指两个或两个以上。
图1为本发明实施例提供的一种特征图插值方法的流程图,本实施例可适用于需要提升特征图插值缩放效果的情况,该方法可以由特征图插值装置来执行,如图1所示,具体包括如下步骤:
步骤110、在当前特征图对应的各子区域的各方格中确定方格插值点的方格差值坐标,以及所述方格插值点的四个临近点的临近坐标和临近特征值。
其中,所述临近坐标是对所述方格差值坐标进行向上取整和向下取整得到的。
目标检测模型对待测图像进行目标检测时,特征提取层对待测图像进行处理得到特征图,全连接层根据特征图确定待测图像的类别和偏移量。全连接层所需的特征图的维度与特征提取层得到的特征图的维度不一致,因此,需要对特征提取层得到的特征图进行缩放,以使缩放得到的特征图的维度与全连接层所需的特征图的维度一致。
在具体的算法所构建的目标检测模型中,特征提取层对待测图像进行处理可以得到第一维度的特征图,而全连接层所需的特征图的维度为第二维度。因此,需要对第一维度的特征图进行缩放,得到第二维度的特征图。
初始特征图可以定义为第一维度的特征图中锚框所框选出的感兴趣区域对应的特征图,当前特征图可以理解为第二维度的特征图中锚框所框选出的感兴趣区域对应的特征图。
具体地,首先可以根据目标检测模型确定划分方式,具体而言,可以根据目标检测模型中特征提取层对待测图像进行处理得到的特征图的第一维度和全连接层所需的特征图的第二维度确定划分方式,并基于划分方式将当前特征图划分为多个子区域。根据预设规格将各子区域划分为多个方格,例如,可以将各子区域划分为2×2的四个方格。
方格插值点的插值点坐标可以通过初始特征图中各特征点的特征坐标以及由第一维度和第二维度确定的缩放比例确定。方格插值点的插值点坐标是初始特征图中特征点的特征坐标经过缩放得到的,插值点坐标往往是浮点数。因此,可以对插值点坐标中的横坐标和纵坐标分别向上和向下取整,得到四个整数坐标,这四个整数坐标即为方格插值点的四个临近点的临近坐标。进而可以根据临近点的临近坐标确定临近点的临近特征值。
本发明实施例中,在将当前特征图划分为多个方格后,可以确定各方格中的方格插值点以及方格插值点对应的临近点,进而可以确定方格插值点的方格插值坐标以及临近点的临近坐标和临近特征值,方格插值点的方格插值坐标以及临近点临近坐标和临近特征值可以用于确定对当前特征图进行插值的方格插值点的方格特征值,为特征图插值提供了数据基础。
步骤120、根据各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值确定各所述方格内所述方格插值点对应的第一双线性插值和第一最近邻插值。
具体地,可以基于最大池化对方格插值点的方格插值坐标、临近点的临近坐标和临近特征值进行处理,得到方格插值点对应的第一双线性插值。可以基于最近距离对方格插值点的方格插值坐标和临近点的临近坐标进行处理,得到方格插值点对应的第一最近邻插值。
本发明实施例中,分别基于两种插值方式确定各方格中的方格插值点对应的第一双线性插值和第一最近邻插值,在现有技术中,可以将第一双线性插值或者第一最近邻插值确定为方格插值点对应的方格特征值,当然,本申请为了确定方格插值点更加精确的方格特征值,需要对第一双线性插值和第一最近邻插值进行进一步处理。
步骤130、确定各所述方格内所述方格插值点的临近点的第一特征值标准差后,根据所述第一特征值标准差对所述第一双线性插值和所述第一最近邻插值进行融合,得到各所述方格内所述方格插值点的目标插值。
方格插值点的临近点的第一特征值标准差可以理解为方格插值点的四个临近点的临近特征值的标准差。
具体地,可以确定方格插值点的四个临近点的临近特征值的标准差,即方格插值点的临近点的第一特征值标准差。方格插值点的临近点的第一特征值标准差作为衡量特征图边缘高频细节的主成分,其数值与特征图包含边缘细节的成分成正比例关系,方格插值点的临近点的第一特征值标准差的数值越大,表明特征图中包含的边缘高频占比越高,作为低通滤波器的双线性插值占的比重越小。因此,可以根据方格插值点的临近点的第一特征值标准差确定第一双线性插值和第一最近邻插值融合的权重,例如,可以确定第一双线性插值对应的第一权重以及第一最近邻插值对应的第二权重。进而,可以基于第一双线性插值对应的第一权重和第一最近邻插值对应的第二权重对第一双线性插值和第一最近邻插值进行融合,得到目标插值。
本发明实施例中,在确定方格插值点的临近点的第一特征值标准差后,可以根据第一特征标准差确定第一双线性特征插值和第一最近邻插值融合所需的第一权重和第二权重,进而可以基于第一双线性特征插值及其对应的第一权重以及第一最近邻插值及其对应的第二权重对第一双线性插值和第一最近邻插值进行融合,得到目标插值,实现对第一双线性插值和第一最近邻插值的融合,得到方格插值点更加精确的方格特征值,即目标特征值。
步骤140、根据各所述子区域内各所述方格内所述方格插值点的目标插值确定各所述子区域内的区域插值,并根据各所述子区域内的所述区域插值确定目标特征图。
在确定各方格内方格插值点的目标插值后,可以进一步根据子区域内各方格内的方格插值点的方格插值坐标和目标插值在子区域内进行插值,确定子区域内的区域插值。进而,可以将子区域内的区域插值确定为该子区域对应的特征值,并根据所有子区域的特征值确定目标特征图,实现对当前特征图的缩放,得到包含更多高频边缘细节信息的目标特征图。
本发明实施例中,在对各方格实现插值的基础上,进一步对各子区域进行插值,实现确定各子区域对应的特征值,进而根据所有子区域的特征值确定目标特征图,弥补了特征图的高频边缘细节容易丢失的缺陷,提升了目标检测的精度。
本发明实施例提供的特征图插值方法,包括:在当前特征图对应的各子区域的各方格中确定方格插值点的方格差值坐标,以及所述方格插值点的四个临近点的临近坐标和临近特征值,其中,所述临近坐标是对所述方格差值坐标进行向上取整和向下取整得到的;根据各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值确定各所述方格内所述方格插值点对应的第一双线性插值和第一最近邻插值;确定各所述方格内所述方格插值点的临近点的第一特征值标准差后,根据所述第一特征值标准差对所述第一双线性插值和所述第一最近邻插值进行融合,得到各所述方格内所述方格插值点的目标插值;根据各所述子区域内各所述方格内所述方格插值点的目标插值确定各所述子区域内的区域插值,并根据各所述子区域内的所述区域插值确定目标特征图。上述技术方案,在将当前特征图划分为多个子区域并将各子区域分别划分为多个方格后,可以确定各方格中的方格插值点的方格插值坐标以及方格插值点对应的临近点的临近坐标和临近特征值,方格插值点的方格插值坐标以及临近点临近坐标和临近特征值可以用于确定对当前特征图进行插值的方格插值点的方格特征值,为特征图插值提供了数据基础,分别基于两种插值方式对方格插值点的方格插值坐标以及临近点临近坐标和临近特征值进行处理,得到方格插值点对应的第一双线性插值和第一最近邻插值,确定方格插值点的四个临近点的临近特征值的标准差即方格插值点的四个临近点的第一特征标准差后,根据第一特征标准差对第一双线性插值和第一最近邻插值进行融合,得到方格插值点更加精确的方格特征值,即目标特征值,方格内方格插值点对应的目标特征值可以实现对方格的插值,在对各方格实现插值的基础上,进一步可以对各子区域进行插值,确定各子区域对应的特征值,并根据所有子区域的特征值确定目标特征图,目标特征图弥补了特征图的高频边缘细节容易丢失的缺陷,提升目标检测的精度。
图2为本发明实施例提供的另一种特征图插值方法的流程图,本实施例是在上述实施例的基础上进行具体化。如图2所示,在本实施例中,该方法还可以包括:
步骤210、确定检测模型中特征提取层确定的特征图的第一维度以及全连接层所需的特征图的第二维度;根据所述第一维度和所述第二维度确定所述检测模型对应的所述划分方式。
检测模型可以为用于进行目标检测的目标检测模型,特征提取层可以用于提取待测图像的至少一个特征图,并对特征图进行融合,得到第一维度的特征图。全连接层可以用于根据第二维度的特征图确定待测图像的类别信息和偏移量。具体地,在确定检测模型后,即可以确定特征提取层确定的特征图的第一维度以及全连接层所需的特征图的第二维度。为了使得特征提取层确定的第一维度的特征图可以用于全连接层,可以根据由第一维度和第二维度确定的缩放比例对第一维度的特征图进行缩放,得到第二维度的特征图,此时第二维度的特征图中的特征点的特征坐标可能为浮点数,因此,需要对第二维度的特征图进行插值。
基于待测图像进行目标检测时,往往只需要感兴趣区域对应的特征图。因此,可以将第一维度的特征图中锚框所框选出的感兴趣区域确定为初始特征图,根据缩放比例对初始特征图进行缩放可以得到当前特征图,此处的当前特征图即为第二维度的特征图中锚框所框选出的感兴趣区域对应的特征图。
为了确定对当前特征图进行插值时的插值点,需要对当前特征图进行划分,而划分方式可以根据特征提取层确定的特征图的第一维度以及全连接层所需的特征图的第二维度确定。例如,特征提取层确定的特征图的第一维度为14×14,全连接层所需的特征图的第二维度为7×7时,可以确定划分方式为,将当前特征图划分为7×7的子区域。
本发明实施例中,通过确定检测模型的特征提取层确定的特征图的第一维度以及全连接层所需的特征图的第二维度,可以确定检测模型对应的划分方式,该划分方式可以用于对当前特征图进行区域划分。
步骤220、基于检测模型对应的划分方式将所述当前特征图划分为多个子区域;基于预设规格将各所述子区域划分为多个方格。
具体地,可以基于前述根据检测模型确定的划分方式将当前特征图划分为多个子区域,为了在多个子区域内进行插值,需要将各子区域再次划分为多个方格。当然,可以基于预设规格将子区域划分为多个方格。图3为本发明实施例提供的另一种特征图插值方法中基于预设规格将子区域划分为多个方格的示意图,如图3所示,预设规格为2×2时,可以将各子区域分别划分为2×2的四个方格。在实际应用中,预设规格还可以为3×3等,可以根据实际需求进行选择,在此不做具体限定。
本发明实施例中,可以根据检测模型对应的划分方式将当前特征图划分为多个子区域,进而可以基于预设规则将各子区域分别划分为多个方格,实现对当前特征图的插值前准备。
步骤230、在当前特征图对应的各子区域的各方格中确定方格插值点的方格差值坐标,以及所述方格插值点的四个临近点的临近坐标和临近特征值。
其中,临近坐标是对所述方格差值坐标进行向上取整和向下取整得到的。
一种实施方式中,步骤230具体可以包括:
在当前特征图对应的各子区域的各方格中根据所述第一维度和所述第二维度确定各所述方格内的方格插值点的方格插值坐标;对所述方格差值坐标进行向上取整和向下取整得到四个临近点的临近坐标,根据所述临近坐标确定所述临近特征值。
具体地,可以在初始特征图中确定各特征点的特征坐标,再根据缩放比例对特征坐标进行缩放,得到当前特征图中方格插值点的方格插值坐标。特征提取层确定第一维度的特征图后,基于锚框在第一维度的特征图中进行框选,得到感兴趣区域对应的第一维度的特征图。按照缩放比例对感兴趣区域对应的第一维度的特征图进行缩放后,可以得到感兴趣区域对应的第二维度的特征图,即当前特征图。因此,对感兴趣区域对应的第一维度的特征图中的所有特征点的特征坐标按照缩放比例进行缩放,可以得到当前特征图中方格插值点的方格插值坐标。例如,初始特征图中特征点的特征坐标为(m,n),缩放比例为5时,可以确定方格插值点的插值点坐标为(m/5,n/5),插值点坐标往往是浮点数。方格插值点的插值点坐标为(ax,ay)时,对插值点坐标中的横坐标和纵坐标分别向上和向下取整,得到四个整数坐标(ax1,ay1)、(ax2,ay2)、(ax3,ay3)、(ax4,at4),这四个整数坐标即为方格插值点的四个临近点的临近坐标,根据临近点的临近坐标可以确定临近点的临近特征值为F(ax1,at1)、F(ax2,ay2)、F(ax3,ay3)、F(ax4,ay4)。
本发明实施例中,可以确定当前特征图的各子区域内的各方格中的方格插值点的方格插值坐标以及方格插值点对应的临近点的临近坐标和临近特征值,方格插值点的方格插值坐标以及临近点临近坐标和临近特征值可以用于确定对当前特征图进行插值的方格插值点的方格特征值,为特征图插值提供了数据基础。
步骤240、根据各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值确定各所述方格内所述方格插值点对应的第一双线性插值和第一最近邻插值。
一种实施方式中,步骤240具体可以包括:基于最大池化对各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值进行处理,得到各所述方格内所述方格插值点对应的第一双线性插值;基于最近距离对各所述方格内所述方格插值点的方格插值坐标和所述临近点的临近坐标进行处理,得到各所述方格内所述方格插值点对应的第一最近邻插值。
具体地,可以基于最大池化对方格插值点的方格插值坐标、方格插值点的对应的四个临近点的临近坐标和临近特征值进行处理得到方格插值点对应的第一双线性插值,具体可以基于公式1确定方格插值点对应的第一双线性插值。
其中,Hl(x,y)表示第一双线性插值。
可以基于最近距离对方格插值点的方格插值坐标、方格插值点的对应的四个临近点的临近坐标和临近特征值进行处理得到方格插值点对应的第一最近邻插值。具体而言,可以确定各临近点与方格插值点的距离d1,d2,d3,d4,并将最小距离对应的临近点的临近特征值确定为第一最近邻插值。具体可以基于公式2确定方格插值点对应的第一最近邻插值。
Hn(x,y)=Fj(x,y),Dj=min{d1,d2,d3,d4},j=1,2,3,4 公式2
其中,Hn(x,y)表示第一最近邻插值,d1,d2,d3,d4表示方格插值点的四个临近点与方格插值点的距离,Dj表示最小距离,Fj(x,y)表示最小距离对应的临近点的临近特征值。
本发明实施例中,分别基于两种插值方式确定各方格中的方格插值点对应的第一双线性插值和第一最近邻插值,当然,为了确定方格插值点更加精确的方格特征值,需要对第一双线性插值和第一最近邻插值进行进一步处理。
步骤250、确定各所述方格内所述方格插值点的临近点的第一特征值标准差后,根据所述第一特征值标准差对所述第一双线性插值和所述第一最近邻插值进行融合,得到各所述方格内所述方格插值点的目标插值。
一种实施方式中,步骤250具体可以包括:确定各所述方格内所述方格插值点的临近点的第一特征值标准差;根据所述第一特征值标准差确定所述第一双线性插值的第一权重为所述第一最近邻插值的第二权重为其中,σ为第一特征值标准差;根据所述第一权重和所述第一双线性插值、所述第二权重和所述第一最近邻插值确定所述方格内所述方格插值点的所述目标插值。
具体地,可以确定方格插值点的四个临近点的临近特征值的标准差,即方格插值点的临近点的第一特征值标准差。具体而言,可以基于公式3和公式4确定方格插值点的临近点的第一特征值标准差。
σ作为衡量特征图边缘高频细节的主成分,σ的数值与特征图包含边缘细节的成分成正比例关系,σ的值越大,表明特征图中包含的边缘高频占比越高,作为低通滤波器的双线性插值占的比重越小。因此,可以根据σ确定第一双线性插值和第一最近邻插值融合的权重,可以根据σ确定第一双线性插值对应的第一权重为第一最近邻插值对应的第二权重为进而,可以基于第一双线性插值对应的第一权重和第一最近邻插值对应的第二权重对第一双线性插值和第一最近邻插值进行融合,得到目标插值H(x,y)=wlHl(x,y)+wnHn(x,y)。
本发明实施例中,方格插值点的四个临近点的临近特征值的标准差即方格插值点的临近点的第一特征值标准差,根据第一特征标准差确定第一双线性特征插值和第一最近邻插值融合所需的第一权重和第二权重,基于第一双线性特征插值及其对应的第一权重以及第一最近邻插值及其对应的第二权重对第一双线性插值和第一最近邻插值进行融合,得到目标插值,实现对第一双线性插值和第一最近邻插值的融合,得到方格插值点更加精确的方格特征值,即目标特征值。
步骤260、根据各所述子区域内各所述方格内所述方格插值点的目标插值确定各所述子区域内的区域插值,并根据各所述子区域内的所述区域插值确定目标特征图。
一种实施方式中,步骤260具体可以包括:确定各所述子区域内的区域插值点的区域插值坐标;根据各所述子区域内的区域插值点的区域插值坐标以及所述子区域内各所述方格内所述方格插值点的方格插值坐标和目标插值,确定各所述子区域内所述区域插值点对应的区域插值;根据各所述子区域内的所述区域插值确定目标特征图。
如前所述,在确定各方格内方格插值点的目标插值后,可以基于最大池化或者平均池化确定子区域内的区域插值。进而,可以将子区域内的区域插值确定为该子区域对应的特征值,并根据所有子区域的特征值确定目标特征图,实现对当前特征图的缩放,得到包含更多高频边缘细节信息的目标特征图。
本发明实施例中,在对各方格实现插值的基础上,进一步对各子区域进行插值,确定各子区域对应的特征值,根据所有子区域的特征值确定目标特征图,目标特征图弥补了特征图的高频边缘细节容易丢失的缺陷,使得输入全连接层的特征图与待测图像的匹配度更高,进而使得全连接层可以确定待测图像更加精确的类别信息和偏移量,提升目标检测的精度。
本发明实施例提供的特征图插值方法,包括:确定检测模型中特征提取层确定的所述当前特征图的第一维度以及全连接层所需的所述目标特征图的第二维度;根据所述第一维度和所述第二维度确定所述检测模型对应的所述划分方式;基于检测模型对应的划分方式将所述当前特征图划分为多个子区域;基于预设规格将各所述子区域划分为多个方格;在当前特征图对应的各子区域的各方格中确定方格插值点的方格差值坐标,以及所述方格插值点的四个临近点的临近坐标和临近特征值;根据各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值确定各所述方格内所述方格插值点对应的第一双线性插值和第一最近邻插值;确定各所述方格内所述方格插值点的临近点的第一特征值标准差后,根据所述第一特征值标准差对所述第一双线性插值和所述第一最近邻插值进行融合,得到各所述方格内所述方格插值点的目标插值;根据各所述子区域内各所述方格内所述方格插值点的目标插值确定各所述子区域内的区域插值,并根据各所述子区域内的所述区域插值确定目标特征图。上述技术方案,首先可以根据检测模型的特征提取层确定的特征图的第一维度以及全连接层所需的特征图的第二维度,确定检测模型对应的划分方式,其次可以基于检测模型对应的划分方式将第二维度的特征图中锚框所框选出的感兴趣区域对应的特征图即当前特征图划分为多个子区域,再基于预设规格将各子区域划分为多个方格,进而可以确定各方格中的方格插值点的方格插值坐标以及方格插值点对应的临近点的临近坐标和临近特征值,方格插值点的方格插值坐标以及临近点临近坐标和临近特征值可以用于确定对当前特征图进行插值的方格插值点的方格特征值,为特征图插值提供了数据基础,分别基于两种插值方式对方格插值点的方格插值坐标以及临近点临近坐标和临近特征值进行处理,得到方格插值点对应的第一双线性插值和第一最近邻插值,确定方格插值点的四个临近点的临近特征值的标准差即方格插值点的四个临近点的第一特征标准差后,根据第一特征标准差确定第一双线性特征插值和第一最近邻插值融合所需的第一权重和第二权重,基于第一双线性特征插值及其对应的第一权重以及第一最近邻插值及其对应的第二权重对第一双线性插值和第一最近邻插值进行融合,得到目标插值,实现对第一双线性插值和第一最近邻插值的融合,得到方格插值点更加精确的方格特征值,即目标特征值,方格内方格插值点对应的目标特征值可以实现对方格的插值,在对各方格实现插值的基础上,进一步可以对各子区域进行插值,确定各子区域对应的特征值,并根据所有子区域的特征值确定目标特征图,目标特征图弥补了特征图的高频边缘细节容易丢失的缺陷,使得输入全连接层的特征图与待测图像的匹配度更高,进而使得全连接层可以确定待测图像更加精确的类别信息和偏移量,提升目标检测的精度。
图4为本发明实施例提供的一种特征图插值装置的结构示意图,该装置可以适用于需要提升特征图插值缩放效果的情况。该装置可以通过软件和/或硬件实现,并一般集成在计算机设备中。
如图4所示,该装置包括:第一确定模块410,用于在当前特征图对应的各子区域的各方格中确定方格差值点的方格差值坐标,以及所述方格插值点的四个临近点的临近坐标和临近特征值,其中,所述临近坐标是对所述方格差值坐标进行向上取整和向下取整得到的;第二确定模块420,用于根据各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值确定各所述方格内所述方格插值点对应的第一双线性插值和第一最近邻插值;融合模块430,用于确定各所述方格内所述方格插值点的临近点的第一特征值标准差后,根据所述第一特征值标准差对所述第一双线性插值和所述第一最近邻插值进行融合,得到各所述方格内所述方格插值点的目标插值;执行模块440,用于根据各所述子区域内各所述方格内所述方格插值点的目标插值确定各所述子区域内的区域插值,并根据各所述子区域内的所述区域插值确定目标特征图。
本实施例提供的特征图插值装置,在当前特征图对应的各子区域的各方格中确定方格插值点的方格差值坐标,以及所述方格插值点的四个临近点的临近坐标和临近特征值,其中,所述临近坐标是对所述方格差值坐标进行向上取整和向下取整得到的;根据各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值确定各所述方格内所述方格插值点对应的第一双线性插值和第一最近邻插值;确定各所述方格内所述方格插值点的临近点的第一特征值标准差后,根据所述第一特征值标准差对所述第一双线性插值和所述第一最近邻插值进行融合,得到各所述方格内所述方格插值点的目标插值;根据各所述子区域内各所述方格内所述方格插值点的目标插值确定各所述子区域内的区域插值,并根据各所述子区域内的所述区域插值确定目标特征图。上述技术方案,在将当前特征图划分为多个子区域并将各子区域分别划分为多个方格后,可以确定各方格中的方格插值点的方格插值坐标以及方格插值点对应的临近点的临近坐标和临近特征值,方格插值点的方格插值坐标以及临近点临近坐标和临近特征值可以用于确定对当前特征图进行插值的方格插值点的方格特征值,为特征图插值提供了数据基础,分别基于两种插值方式对方格插值点的方格插值坐标以及临近点临近坐标和临近特征值进行处理,得到方格插值点对应的第一双线性插值和第一最近邻插值,确定方格插值点的四个临近点的临近特征值的标准差即方格插值点的四个临近点的第一特征标准差后,根据第一特征标准差对第一双线性插值和第一最近邻插值进行融合,得到方格插值点更加精确的方格特征值,即目标特征值,方格内方格插值点对应的目标特征值可以实现对方格的插值,在对各方格实现插值的基础上,进一步可以对各子区域进行插值,确定各子区域对应的特征值,并根据所有子区域的特征值确定目标特征图,目标特征图弥补了特征图的高频边缘细节容易丢失的缺陷,提升目标检测的精度。
在上述实施例的基础上,该装置还包括:划分模块,用于基于检测模型对应的划分方式将所述当前特征图划分为多个子区域;基于预设规格将各所述子区域划分为多个方格;划分方式确定模块,用于确定检测模型中特征提取层确定的特征图的第一维度以及全连接层所需的特征图的第二维度;根据所述第一维度和所述第二维度确定所述检测模型对应的所述划分方式。
在上述实施例的基础上,第一确定模块410,具体用于:在当前特征图对应的各子区域的各方格中根据所述第一维度和所述第二维度确定各所述方格内的方格插值点的方格插值坐标;对所述方格差值坐标进行向上取整和向下取整得到四个临近点的临近坐标,根据所述临近坐标确定所述临近特征值。
在上述实施例的基础上,第二确定模块420,具体用于:基于最大池化对各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值进行处理,得到各所述方格内所述方格插值点对应的第一双线性插值;基于最近距离对各所述方格内所述方格插值点的方格插值坐标和所述临近点的临近坐标进行处理,得到各所述方格内所述方格插值点对应的第一最近邻插值。
在上述实施例的基础上,融合模块430,具体用于:确定各所述方格内所述方格插值点的临近点的第一特征值标准差;根据所述第一特征值标准差确定所述第一双线性插值的第一权重为所述第一最近邻插值的第二权重为其中,σ为第一特征值标准差;根据所述第一权重和所述第一双线性插值、所述第二权重和所述第一最近邻插值确定所述方格内所述方格插值点的所述目标插值。
在上述实施例的基础上,执行模块440,具体用于:确定各所述子区域内的区域插值点的区域插值坐标;根据各所述子区域内的区域插值点的区域插值坐标以及所述子区域内各所述方格内所述方格插值点的方格插值坐标和目标插值,确定各所述子区域内所述区域插值点对应的区域插值;根据各所述子区域内的所述区域插值确定目标特征图。
本发明实施例所提供的特征图插值装置可执行本发明任意实施例所提供的特征图插值方法,具备执行特征图插值方法相应的功能模块和有益效果。
值得注意的是,上述特征图插值装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
图5为本发明实施例提供的一种计算机设备的结构示意图。图5示出了适于用来实现本发明实施方式的示例性计算机设备5的框图。图5显示的计算机设备5仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机设备5以通用计算电子设备的形式表现。计算机设备5的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备5典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备5访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备5可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备5也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备5交互的设备通信,和/或与使得该计算机设备5能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备5还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图5所示,网络适配器20通过总线18与计算机设备5的其它模块通信。应当明白,尽管图5中未示出,可以结合计算机设备5使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及页面显示,例如实现本发实施例所提供的特征图插值方法,该方法包括:在当前特征图对应的各子区域的各方格中确定方格插值点的方格差值坐标,以及所述方格插值点的四个临近点的临近坐标和临近特征值,其中,所述临近坐标是对所述方格差值坐标进行向上取整和向下取整得到的;根据各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值确定各所述方格内所述方格插值点对应的第一双线性插值和第一最近邻插值;确定各所述方格内所述方格插值点的临近点的第一特征值标准差后,根据所述第一特征值标准差对所述第一双线性插值和所述第一最近邻插值进行融合,得到各所述方格内所述方格插值点的目标插值;根据各所述子区域内各所述方格内所述方格插值点的目标插值确定各所述子区域内的区域插值,并根据各所述子区域内的所述区域插值确定目标特征图。
当然,本领域技术人员可以理解,处理器还可以实现本发明任意实施例所提供的特征图插值方法的技术方案。
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现例如本发实施例所提供的特征图插值方法,该方法包括:在当前特征图对应的各子区域的各方格中确定方格插值点的方格差值坐标,以及所述方格插值点的四个临近点的临近坐标和临近特征值,其中,所述临近坐标是对所述方格差值坐标进行向上取整和向下取整得到的;根据各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值确定各所述方格内所述方格插值点对应的第一双线性插值和第一最近邻插值;确定各所述方格内所述方格插值点的临近点的第一特征值标准差后,根据所述第一特征值标准差对所述第一双线性插值和所述第一最近邻插值进行融合,得到各所述方格内所述方格插值点的目标插值;根据各所述子区域内各所述方格内所述方格插值点的目标插值确定各所述子区域内的区域插值,并根据各所述子区域内的所述区域插值确定目标特征图。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
另外,本发明技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种特征图插值方法,其特征在于,包括:
在当前特征图对应的各子区域的各方格中确定方格插值点的方格差值坐标,以及所述方格插值点的四个临近点的临近坐标和临近特征值,其中,所述临近坐标是对所述方格差值坐标进行向上取整和向下取整得到的;
根据各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值确定各所述方格内所述方格插值点对应的第一双线性插值和第一最近邻插值;
确定各所述方格内所述方格插值点的临近点的第一特征值标准差后,根据所述第一特征值标准差对所述第一双线性插值和所述第一最近邻插值进行融合,得到各所述方格内所述方格插值点的目标插值;
根据各所述子区域内各所述方格内所述方格插值点的目标插值确定各所述子区域内的区域插值,并根据各所述子区域内的所述区域插值确定目标特征图。
2.根据权利要求1所述的特征图插值方法,其特征在于,在当前特征图对应的各子区域的各方格中确定方格差值点的方格差值坐标之前,还包括:
基于检测模型对应的划分方式将所述当前特征图划分为多个子区域;
基于预设规格将各所述子区域划分为多个方格。
3.根据权利要求1所述的特征图插值方法,其特征在于,在基于检测模型对应的划分方式将当前特征图划分为多个子区域之前,还包括:
确定检测模型中特征提取层确定的特征图的第一维度以及全连接层所需的特征图的第二维度;
根据所述第一维度和所述第二维度确定所述检测模型对应的所述划分方式。
4.根据权利要求3所述的特征图插值方法,其特征在于,确定各所述方格内的方格插值点的方格插值坐标,包括:
根据所述第一维度和所述第二维度确定各所述方格内的方格插值点的方格插值坐标。
5.根据权利要求1所述的特征图插值方法,其特征在于,根据各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值确定各所述方格内所述方格插值点对应的第一双线性插值和第一最近邻插值,包括:
基于最大池化对各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值进行处理,得到各所述方格内所述方格插值点对应的第一双线性插值;
基于最近距离对各所述方格内所述方格插值点的方格插值坐标和所述临近点的临近坐标进行处理,得到各所述方格内所述方格插值点对应的第一最近邻插值。
7.根据权利要求2所述的特征图插值方法,其特征在于,根据各所述子区域内各所述方格内所述方格插值点的目标插值确定各所述子区域内的区域插值,包括:
确定各所述子区域内的区域插值点的区域插值坐标;
根据各所述子区域内的区域插值点的区域插值坐标以及所述子区域内各所述方格内所述方格插值点的方格插值坐标和目标插值,确定各所述子区域内所述区域插值点对应的区域插值。
8.一种特征图插值装置,其特征在于,包括:
第一确定模块,用于在当前特征图对应的各子区域的各方格中确定方格差值点的方格差值坐标,以及所述方格插值点的四个临近点的临近坐标和临近特征值,其中,所述临近坐标是对所述方格差值坐标进行向上取整和向下取整得到的;
第二确定模块,用于根据各所述方格内所述方格插值点的方格插值坐标、所述临近点的临近坐标和临近特征值确定各所述方格内所述方格插值点对应的第一双线性插值和第一最近邻插值;
融合模块,用于确定各所述方格内所述方格插值点的临近点的第一特征值标准差后,根据所述第一特征值标准差对所述第一双线性插值和所述第一最近邻插值进行融合,得到各所述方格内所述方格插值点的目标插值;
执行模块,用于根据各所述子区域内各所述方格内所述方格插值点的目标插值确定各所述子区域内的区域插值,并根据各所述子区域内的所述区域插值确定目标特征图。
9.一种计算机设备,其特征在于,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的特征图插值方法。
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行权利要求1-7中任一所述的特征图插值方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211729842.1A CN115797182B (zh) | 2022-12-30 | 2022-12-30 | 一种特征图插值方法、装置、设备和存储介质 |
PCT/CN2023/130463 WO2024139756A1 (zh) | 2022-12-30 | 2023-11-08 | 一种特征图插值方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211729842.1A CN115797182B (zh) | 2022-12-30 | 2022-12-30 | 一种特征图插值方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115797182A true CN115797182A (zh) | 2023-03-14 |
CN115797182B CN115797182B (zh) | 2024-07-12 |
Family
ID=85428375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211729842.1A Active CN115797182B (zh) | 2022-12-30 | 2022-12-30 | 一种特征图插值方法、装置、设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN115797182B (zh) |
WO (1) | WO2024139756A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024139756A1 (zh) * | 2022-12-30 | 2024-07-04 | 中科信息安全共性技术国家工程研究中心有限公司 | 一种特征图插值方法、装置、设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011077587A (ja) * | 2009-09-29 | 2011-04-14 | Seiko Epson Corp | 画像処理装置、画像処理方法およびプログラム |
CN102567948A (zh) * | 2010-12-27 | 2012-07-11 | 北大方正集团有限公司 | 像素颜色处理方法和装置 |
CN103489205A (zh) * | 2013-09-25 | 2014-01-01 | 华南理工大学 | 一种基于锥束x光fdk算法的混合插值方法 |
CN109635821A (zh) * | 2018-12-04 | 2019-04-16 | 北京字节跳动网络技术有限公司 | 图像区域的特征提取方法、装置、设备及可读介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110633595B (zh) * | 2018-06-21 | 2022-12-02 | 北京京东尚科信息技术有限公司 | 一种利用双线性插值的目标检测方法和装置 |
CN115797182B (zh) * | 2022-12-30 | 2024-07-12 | 长春吉大正元信息技术股份有限公司 | 一种特征图插值方法、装置、设备和存储介质 |
-
2022
- 2022-12-30 CN CN202211729842.1A patent/CN115797182B/zh active Active
-
2023
- 2023-11-08 WO PCT/CN2023/130463 patent/WO2024139756A1/zh unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011077587A (ja) * | 2009-09-29 | 2011-04-14 | Seiko Epson Corp | 画像処理装置、画像処理方法およびプログラム |
CN102567948A (zh) * | 2010-12-27 | 2012-07-11 | 北大方正集团有限公司 | 像素颜色处理方法和装置 |
CN103489205A (zh) * | 2013-09-25 | 2014-01-01 | 华南理工大学 | 一种基于锥束x光fdk算法的混合插值方法 |
CN109635821A (zh) * | 2018-12-04 | 2019-04-16 | 北京字节跳动网络技术有限公司 | 图像区域的特征提取方法、装置、设备及可读介质 |
Non-Patent Citations (1)
Title |
---|
龚昌来;杨冬涛;: "一种改进的双线性插值图像放大算法", 激光与红外, no. 08, pages 900 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024139756A1 (zh) * | 2022-12-30 | 2024-07-04 | 中科信息安全共性技术国家工程研究中心有限公司 | 一种特征图插值方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2024139756A1 (zh) | 2024-07-04 |
CN115797182B (zh) | 2024-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3910543A2 (en) | Method for training object detection model, object detection method and related apparatus | |
CN112598762B (zh) | 三维车道线信息生成方法、装置、电子设备和介质 | |
TWI601020B (zh) | 圖表分析系統及圖表分析方法 | |
EP3916634A2 (en) | Text recognition method and device, and electronic device | |
CN107564077B (zh) | 一种绘制道路网的方法及装置 | |
CN111967467A (zh) | 图像目标检测方法、装置、电子设备和计算机可读介质 | |
WO2024001360A1 (zh) | 绿幕抠图方法、装置及电子设备 | |
WO2024139756A1 (zh) | 一种特征图插值方法、装置、设备和存储介质 | |
CN113239925A (zh) | 一种文本检测模型训练方法、文本检测方法及装置、设备 | |
CN114092642B (zh) | 一种三维户型模型生成方法、装置及设备 | |
CN113762109B (zh) | 一种文字定位模型的训练方法及文字定位方法 | |
CN108573510B (zh) | 一种栅格地图矢量化方法及设备 | |
CN115129278A (zh) | 图像显示控制方法、系统、可读存储介质及电子设备 | |
CN117252837A (zh) | 一种晶圆测试的数据处理方法、装置、介质和电子设备 | |
CN114723640B (zh) | 障碍物信息生成方法、装置、电子设备和计算机可读介质 | |
CN108475412A (zh) | 用于可穿戴设备的图像处理器 | |
CN113506356B (zh) | 面积图的绘制方法、装置、可读介质和电子设备 | |
CN115511701A (zh) | 一种地理信息的转换方法及装置 | |
CN115127565A (zh) | 高精地图数据生成方法、装置、电子设备及存储介质 | |
KR101768913B1 (ko) | 지리 정보 데이터 분할 방법, 분할 장치 및 이를 수행하는 프로그램을 기록하는 기록매체 | |
CN114170282A (zh) | 点云融合方法、装置、电子设备和介质 | |
CN109816595A (zh) | 图像处理方法和装置 | |
CN117611761B (zh) | 一种用于cad图纸的地图要素绘制方法、系统、设备及介质 | |
CN116758198B (zh) | 图像重建方法、装置、设备及存储介质 | |
CN117171277B (zh) | 一种电子地图的标记加载方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |