CN113255648B - 一种基于图像识别的滑动窗口框选方法及终端 - Google Patents
一种基于图像识别的滑动窗口框选方法及终端 Download PDFInfo
- Publication number
- CN113255648B CN113255648B CN202110685166.1A CN202110685166A CN113255648B CN 113255648 B CN113255648 B CN 113255648B CN 202110685166 A CN202110685166 A CN 202110685166A CN 113255648 B CN113255648 B CN 113255648B
- Authority
- CN
- China
- Prior art keywords
- target
- detection
- frame
- detection frames
- frames
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010187 selection method Methods 0.000 title claims abstract description 11
- 238000001514 detection method Methods 0.000 claims abstract description 437
- 238000009432 framing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 239000003086 colorant Substances 0.000 claims description 7
- 238000000034 method Methods 0.000 claims description 6
- 230000008602 contraction Effects 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims 2
- 230000009286 beneficial effect Effects 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 3
- 210000000887 face Anatomy 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 210000000857 visual cortex Anatomy 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Abstract
本发明公开了一种基于图像识别的滑动窗口框选方法及终端,采用滑动窗口对待识别图像进行分类识别,得到大于第一置信度阈值的检测框,从其中获取置信度最大的第一检测框并标记为目标检测框,将与其的重叠区域面积比例大的所有第二检测框标记为待选检测框;将其余检测框重复执行上述步骤,直至所有待选检测框都标记为待选检测框或者目标检测框;将所有待选检测框分别去除与对应的目标检测框的重叠区域之后的子检测框进行分类识别以得到子检测框的置信度,将子检测框的置信度大于第二置信度阈值的待选检测框的标记修改为目标检测框。本发明不仅能够删除冗余的检测框,还能尽可能的保证所有的目标物均能被检测到,即能准确的框选出所有目标物。
Description
技术领域
本发明涉及图像处理技术领域,特别涉及一种基于图像识别的滑动窗口框选方法及终端。
背景技术
图像识别技术是人工智能的一个重要领域。它是指对图像进行对象识别,以识别各种不同模式的目标和对像的技术。
对于图像来说,每个物体所对应的图像都有其自己的特征,对于人类大脑来说,当视觉信息通过视网膜进入大脑时,视觉皮层将感觉输入转换成连贯的感知,这些连贯的感知可以理解为是物体的心理表征,并由大脑内的神经元进行不同的物体区分。
基于此,现有的图像识别技术中越来越多的应用到借鉴人类的神经网络算法。在此基础上,在一些应用场景下,还需要将物体识别之后并进行框选出来,比如在一张图像上有多个人脸,现在要将所有的人脸都框选出来,此时,采用滑动窗口对进行人脸识别时,有可能会得到多个符合置信度阈值的检测框,但有的检测框可能包括多个目标人脸,也有可能多个检测框为同一目标人脸,即现有算法在针对一张图像存在多个目标物时无法准确的框选出所有目标物。
发明内容
本发明所要解决的技术问题是:提供一种基于图像识别的滑动窗口框选方法及终端,以准确的框选出所有目标物。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于图像识别的滑动窗口框选方法,包括步骤:
步骤S1、采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框以及每一个检测框的置信度;
步骤S2、从所有检测框中获取置信度最大的第一检测框,将与所述第一检测框的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框,将所述第一检测框标记为目标检测框,并记录每一个所述待选检测框所对应的所述目标检测框;
步骤S3、将未被标记为所述待选检测框或者所述目标检测框中的其余检测框重复执行步骤S2,直至所有所述待选检测框都标记为所述待选检测框或者所述目标检测框;
步骤S4、将所有所述待选检测框分别去除与对应的所述目标检测框的重叠区域之后的子检测框进行分类识别以得到所述子检测框的置信度,判断所述子检测框的置信度是否大于第二置信度阈值,若是,则将所述待选检测框的标记修改为所述目标检测框,否则删除所述待选检测框。
为了解决上述技术问题,本发明采用的另一种技术方案为:
一种基于图像识别的滑动窗口框选终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
步骤S1、采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框以及每一个检测框的置信度;
步骤S2、从所有检测框中获取置信度最大的第一检测框,将与所述第一检测框的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框,将所述第一检测框标记为目标检测框,并记录每一个所述待选检测框所对应的所述目标检测框;
步骤S3、将未被标记为所述待选检测框或者所述目标检测框中的其余检测框重复执行步骤S2,直至所有所述待选检测框都标记为所述待选检测框或者所述目标检测框;
步骤S4、将所有所述待选检测框分别去除与对应的所述目标检测框的重叠区域之后的子检测框进行分类识别以得到所述子检测框的置信度,判断所述子检测框的置信度是否大于第二置信度阈值,若是,则将所述待选检测框的标记修改为所述目标检测框,否则删除所述待选检测框。
本发明的有益效果在于:一种基于图像识别的滑动窗口框选方法及终端,在采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框时,基于置信度最大的第一检测框作为目标检测框,并将与第一检测的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框进行保留而非删除,在后续去除对应的目标检测框的重叠区域之后的子检测框进行分类识别而得到的置信度大于第二置信度阈值时,则认为待选检测框还存在有目标检测框之外的出目标物,因此将其作为目标检测框,从而避免目标物靠的太近而导致被遮挡的目标物没有被检测到;并将未被标记为待选检测框或者目标检测框中的其余检测框重复执行上述步骤,以得到目标检测框,从而不仅能够删除冗余的检测框,还能尽可能的保证所有的目标物均能被检测到,即能准确的框选出所有目标物。
附图说明
图1为本发明实施例的一种基于图像识别的滑动窗口框选方法的流程示意图;
图2为本发明实施例的一种基于图像识别的滑动窗口框选终端的结构示意图。
标号说明:
1、一种基于图像识别的滑动窗口框选终端;2、处理器;3、存储器。
具体实施方式
为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。
请参照图1,一种基于图像识别的滑动窗口框选方法,包括:
步骤S1、采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框以及每一个检测框的置信度;
步骤S2、从所有检测框中获取置信度最大的第一检测框,将与所述第一检测框的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框,将所述第一检测框标记为目标检测框,并记录每一个所述待选检测框所对应的所述目标检测框;
步骤S3、将未被标记为所述待选检测框或者所述目标检测框中的其余检测框重复执行步骤S2,直至所有所述待选检测框都标记为所述待选检测框或者所述目标检测框;
步骤S4、将所有所述待选检测框分别去除与对应的所述目标检测框的重叠区域之后的子检测框进行分类识别以得到所述子检测框的置信度,判断所述子检测框的置信度是否大于第二置信度阈值,若是,则将所述待选检测框的标记修改为所述目标检测框,否则删除所述待选检测框,所述第二置信度阈值小于所述第一置信度阈值。
从上述描述可知,本发明的有益效果在于:在采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框时,基于置信度最大的第一检测框作为目标检测框,并将与第一检测的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框进行保留而非删除,在后续去除对应的目标检测框的重叠区域之后的子检测框进行分类识别而得到的置信度大于第二置信度阈值时,则认为待选检测框还存在有目标检测框之外的出目标物,因此将其作为目标检测框,从而避免目标物靠的太近而导致被遮挡的目标物没有被检测到;并将未被标记为待选检测框或者目标检测框中的其余检测框重复执行上述步骤,以得到目标检测框,从而不仅能够删除冗余的检测框,还能尽可能的保证所有的目标物均能被检测到,即能准确的框选出所有目标物。
进一步地,所述步骤S3具体包括:
从未被标记为所述待选检测框或者所述目标检测框中的其余检测框中获取置信度最大的第三检测框,将所述待选检测框和所述其余检测框中筛选出与所述第三检测框的重叠区域面积比例大于重叠率阈值的所有第四检测框标记为待选检测框,依次类推,直至所有所述待选检测框都标记为所述待选检测框或者所述目标检测框。
从上述描述可知,若将待选检测框不与后续剩余最大的检测框进行一个重叠区域的判断,则待选检测框去除之前对应的目标检测框的重叠区域之后的子检测框有可能和后续剩余最大的检测框为同一目标物,从而导致目标检测框的重复,因此将待选检测框继续与后续剩余最大的检测框进行一个重叠区域的判断,以准确的删除冗余的检测框。
进一步地,所述步骤S4之后还包括:
步骤S5、从所述目标检测框的第一边上逐步向着对应的第二边的方向缩小第二预设大小并得到缩小后的子目标框的置信度,若连续多次缩小后的子目标框的置信度小于所述目标检测框的置信度,则执行步骤S6,否则执行步骤S7;
步骤S6、从所述目标检测框的第一边上逐步向着对应的第二边的方向扩大所述第二预设大小并得到扩大后的子目标框的置信度,将扩大后的子目标框的置信度与目标检测框的置信度进行比较并进行不断的扩大,直至当前次数区间内扩大后的子目标框的置信度大于前后两个次数区间扩大后的子目标框的置信度为止,从当前次数区间内扩大后的子目标框中选择置信度最高的子目标框作为下一次缩小或扩大的所述目标检测框之后执行步骤S8,所述次数区间为连续的预设次数组成的区间;
步骤S7、继续往同一方向进行缩小并进行前后两个次数区间的置信度比较,直至当前次数区间内缩小后的子目标框的置信度大于前后两个次数区间缩小后的子目标框的置信度为止,从当前次数区间内缩小后的子目标框中选择置信度最高的子目标框作为下一次缩小或扩大的所述目标检测框之后执行步骤S8;
步骤S8、对所述目标检测框的其他三个边分别作为第一边以分别执行步骤S4至步骤S7,将最终经过扩大或缩小后所得到的子目标框所在区域确定为最终的目标检测框。
从上述描述可知,不同于常规的滑动分类,在确定了置信度最高的目标检测框之后,采用单边控制法并通过置信度的比较来对所要框选的四条边进行分别确认,同时采用次数区间即多次连续最高来减少误差,从而更加准确的框选出目标物。
进一步地,所述预设次数为[2,4]。
从上述描述可知,在以2、3或4次之间选择整个次数区间的长度,可以保持准确性和计算要求之间的均衡。
进一步地,对不同的目标物的目标检测框采用不同的颜色进行显示。
从上述描述可知,对不同的目标物采用不同的颜色进行框选,以便于用户查看确认。
请参照图2,一种基于图像识别的滑动窗口框选终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
步骤S1、采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框以及每一个检测框的置信度;
步骤S2、从所有检测框中获取置信度最大的第一检测框,将与所述第一检测框的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框,将所述第一检测框标记为目标检测框,并记录每一个所述待选检测框所对应的所述目标检测框;
步骤S3、将未被标记为所述待选检测框或者所述目标检测框中的其余检测框重复执行步骤S2,直至所有所述待选检测框都标记为所述待选检测框或者所述目标检测框;
步骤S4、将所有所述待选检测框分别去除与对应的所述目标检测框的重叠区域之后的子检测框进行分类识别以得到所述子检测框的置信度,判断所述子检测框的置信度是否大于第二置信度阈值,若是,则将所述待选检测框的标记修改为所述目标检测框,否则删除所述待选检测框。
从上述描述可知,本发明的有益效果在于:在采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框时,基于置信度最大的第一检测框作为目标检测框,并将与第一检测的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框进行保留而非删除,在后续去除对应的目标检测框的重叠区域之后的子检测框进行分类识别而得到的置信度大于第二置信度阈值时,则认为待选检测框还存在有目标检测框之外的出目标物,因此将其作为目标检测框,从而避免目标物靠的太近而导致被遮挡的目标物没有被检测到;并将未被标记为待选检测框或者目标检测框中的其余检测框重复执行上述步骤,以得到目标检测框,从而不仅能够删除冗余的检测框,还能尽可能的保证所有的目标物均能被检测到,即能准确的框选出所有目标物。
进一步地,所述步骤S3具体包括:
从未被标记为所述待选检测框或者所述目标检测框中的其余检测框中获取置信度最大的第三检测框,将所述待选检测框和所述其余检测框中筛选出与所述第三检测框的重叠区域面积比例大于重叠率阈值的所有第四检测框标记为待选检测框,依次类推,直至所有所述待选检测框都标记为所述待选检测框或者所述目标检测框。
从上述描述可知,若将待选检测框不与后续剩余最大的检测框进行一个重叠区域的判断,则待选检测框去除之前对应的目标检测框的重叠区域之后的子检测框有可能和后续剩余最大的检测框为同一目标物,从而导致目标检测框的重复,因此将待选检测框继续与后续剩余最大的检测框进行一个重叠区域的判断,以准确的删除冗余的检测框。
进一步地,所述步骤S4之后还包括:
步骤S5、从所述目标检测框的第一边上逐步向着对应的第二边的方向缩小第二预设大小并得到缩小后的子目标框的置信度,若连续多次缩小后的子目标框的置信度小于所述目标检测框的置信度,则执行步骤S6,否则执行步骤S7;
步骤S6、从所述目标检测框的第一边上逐步向着对应的第二边的方向扩大所述第二预设大小并得到扩大后的子目标框的置信度,将扩大后的子目标框的置信度与目标检测框的置信度进行比较并进行不断的扩大,直至当前次数区间内扩大后的子目标框的置信度大于前后两个次数区间扩大后的子目标框的置信度为止,从当前次数区间内扩大后的子目标框中选择置信度最高的子目标框作为下一次缩小或扩大的所述目标检测框之后执行步骤S8,所述次数区间为连续的预设次数组成的区间;
步骤S7、继续往同一方向进行缩小并进行前后两个次数区间的置信度比较,直至当前次数区间内缩小后的子目标框的置信度大于前后两个次数区间缩小后的子目标框的置信度为止,从当前次数区间内缩小后的子目标框中选择置信度最高的子目标框作为下一次缩小或扩大的所述目标检测框之后执行步骤S8;
步骤S8、对所述目标检测框的其他三个边分别作为第一边以分别执行步骤S4至步骤S7,将最终经过扩大或缩小后所得到的子目标框所在区域确定为最终的目标检测框。
从上述描述可知,不同于常规的滑动分类,在确定了置信度最高的目标检测框之后,采用单边控制法并通过置信度的比较来对所要框选的四条边进行分别确认,同时采用次数区间即多次连续最高来减少误差,从而更加准确的框选出目标物。
进一步地,所述预设次数为[2,4]。
从上述描述可知,在以2、3或4次之间选择整个次数区间的长度,可以保持准确性和计算要求之间的均衡。
进一步地,所述步骤S4之后还包括:对不同的目标物的目标检测框采用不同的颜色进行显示。
从上述描述可知,对不同的目标物采用不同的颜色进行框选,以便于用户查看确认。
请参照图1,本发明的实施例一为:
一种基于图像识别的滑动窗口框选方法,包括:
步骤S1、采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框以及每一个检测框的置信度;
采用现有的滑动窗口对待识别图像进行目标物的分类识别之后,根据预先设置的第一置信度阈值比如0.8,就得到多个达到上述阈值的检测框。
步骤S2、从所有检测框中获取置信度最大的第一检测框,将与第一检测框的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框,将第一检测框标记为目标检测框,并记录每一个待选检测框所对应的目标检测框;
其中,重叠区域面积比例是指一检测框与第一检测框的重叠区域占自身区域的面积比例,在本实施例中,重叠率阈值为0.3-0.6,比如0.5,即一检测框的一半在第一检测框则标记为待选检测框。
比如经过对待识别图像进行分类识别之后置信度大于0.8之后的检测框包括A至H,其中,所有检测框中置信度最大的是检测框A,而检测框B和C与检测框A的重叠区域面积比例大于预设的0.5,则将检测框B和C标记为待选检测框,此时,检测框A为目标检测框。
步骤S3、将未被标记为待选检测框或者目标检测框中的其余检测框重复执行步骤S2,直至所有待选检测框都标记为待选检测框或者目标检测框;
其中,步骤S3具体包括:
从未被标记为待选检测框或者目标检测框中的其余检测框中获取置信度最大的第三检测框,将待选检测框和其余检测框中筛选出与第三检测框的重叠区域面积比例大于重叠率阈值的所有第四检测框标记为待选检测框,依次类推,直至所有待选检测框都标记为待选检测框或者目标检测框。
即未被标记为待选检测框或者目标检测框中的其余检测框为检测框D至H,其中,置信度最高的是检测框D,则从检测框B、C、E、F、G和H中与检测框D的重叠区域面积比例大于0.5的检测框包括B、F和H,因此将检测框F和H标记为待选检测框,此时,检测框D为目标检测框。依次类推,最终目标检测框包括A、D和E,待选检测框有B、C、F、G和H,待选检测框B分别对应目标检测框A和D,待选检测框C分别对应目标检测框A,待选检测框F分别对应目标检测框D,待选检测框F分别对应目标检测框E,待选检测框H分别对应目标检测框D。
步骤S4、将所有待选检测框分别去除与对应的目标检测框的重叠区域之后的子检测框进行分类识别以得到子检测框的置信度,判断子检测框的置信度是否大于第二置信度阈值,若是,则将待选检测框的标记修改为目标检测框,否则删除待选检测框,第二置信度阈值小于第一置信度阈值。
在本实施例中,第二置信度阈值为0.6,在将所有待选检测框分别去除与对应的目标检测框的重叠区域之后的子检测框进行分类识别之后,只有待选检测框B的两个置信度均大于0.6,此时检测框B去除与检测框A的重叠区域之后的子检测框的置信度为0.65,而去除检测框D之后的为0.75,由此待选检测框B中的目标物既非检测框A中的目标物也非检测框D中的目标物。由此,将待选检测框B的标记修改为目标检测框。而当比如检测框B去除与检测框A的重叠区域之后的子检测框的置信度为0.5,则认为检测框B中的目标物可能与检测框A为同一目标物。
即最终目标检测框包括A、B、D和E。
其中,步骤S4之后还包括:
步骤S5、从目标检测框的第一边上逐步向着对应的第二边的方向缩小第二预设大小并得到缩小后的子目标框的置信度,若连续多次缩小后的子目标框的置信度小于目标检测框的置信度,则执行步骤S6,否则执行步骤S7;
其中,连续多次在本实施例中为连续3次。
步骤S6、从目标检测框的第一边上逐步向着对应的第二边的方向扩大第二预设大小并得到扩大后的子目标框的置信度,将扩大后的子目标框的置信度与目标检测框的置信度进行比较并进行不断的扩大,直至当前次数区间内扩大后的子目标框的置信度大于前后两个次数区间扩大后的子目标框的置信度为止,从当前次数区间内扩大后的子目标框中选择置信度最高的子目标框作为下一次缩小或扩大的目标检测框之后执行步骤S8,次数区间为连续的预设次数组成的区间;
在本实施例中,次数区间之间的大小比较为区间内的平均值的比较。比如在扩大后的置信度分别为0.85、0.88、0.86、0.87、0.88、0.88、0.86、0.85以及0.85,其中第一个区间的置信度为0.85、0.86和0.86,第二个区间的置信度为0.87、0.88和0.88,第三个区间置信度为0.86、0.85以及0.85。由此,第二个区间的平均值最大,则将第二区间中的第一个置信度为0.88所对应的子目标框作为下一次缩小或扩大的目标检测框。
步骤S7、继续往同一方向进行缩小并进行前后两个次数区间的置信度比较,直至当前次数区间内缩小后的子目标框的置信度大于前后两个次数区间缩小后的子目标框的置信度为止,从当前次数区间内缩小后的子目标框中选择置信度最高的子目标框作为下一次缩小或扩大的目标检测框之后执行步骤S8;
步骤S8、对目标检测框的其他三个边分别作为第一边以分别执行步骤S4至步骤S7,将最终经过扩大或缩小后所得到的子目标框所在区域确定为最终的目标检测框。
S9、对不同的目标物的目标检测框采用不同的颜色进行显示。
由此,目标检测框的四边都经过上述的优化,从而更加准确的框选出目标物。
从上述描述可知,在以2、3或4次之间选择整个次数区间的长度,可以保持准确性和计算要求之间的均衡。
请参照图2,本发明的实施例二为:
一种基于图像识别的滑动窗口框选终端1,包括存储器3、处理器2及存储在存储器3上并可在处理器2上运行的计算机程序,处理器2执行计算机程序时实现上述实施例一的步骤。
综上所述,本发明提供的一种基于图像识别的滑动窗口框选方法及终端,基于置信度最大的第一检测框作为目标检测框,并将与第一检测的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框进行保留而非删除,在后续去除对应的目标检测框的重叠区域之后的子检测框进行分类识别而得到的置信度大于第二置信度阈值时,则认为待选检测框还存在有目标检测框之外的出目标物,因此将其作为目标检测框,从而避免目标物靠的太近而导致被遮挡的目标物没有被检测到,并将未被标记为待选检测框或者目标检测框中的其余检测框重复执行上述步骤,且将待选检测框继续与后续剩余最大的检测框进行一个重叠区域的判断,以得到目标检测框,从而不仅能够删除冗余的检测框,还能尽可能的保证所有的目标物均能被检测到,即能准确的框选出所有目标物;同时,通过单边控制对所得到的目标物的检测框进行调整,以得到更加准确的检测框。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种基于图像识别的滑动窗口框选方法,其特征在于,包括:
步骤S1、采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框以及每一个检测框的置信度;
步骤S2、从所有检测框中获取置信度最大的第一检测框,将与所述第一检测框的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框,将所述第一检测框标记为目标检测框,并记录每一个所述待选检测框所对应的所述目标检测框;
步骤S3、从未被标记为所述待选检测框或者所述目标检测框的其余检测框中获取置信度最大的第三检测框,将所述待选检测框和所述其余检测框中筛选出与所述第三检测框的重叠区域面积比例大于重叠率阈值的所有第四检测框标记为待选检测框,依次类推,直至所有所述待选检测框都标记为所述待选检测框或者所述目标检测框;
步骤S4、将所有所述待选检测框分别去除与对应的所述目标检测框的重叠区域之后的子检测框进行分类识别以得到所述子检测框的置信度,判断所述子检测框的置信度是否大于第二置信度阈值,若是,则将所述待选检测框的标记修改为所述目标检测框,否则删除所述待选检测框,所述第二置信度阈值小于所述第一置信度阈值。
2.根据权利要求1所述的一种基于图像识别的滑动窗口框选方法,其特征在于,所述步骤S4之后还包括:
步骤S5、从所述目标检测框的第一边上逐步向着对应的第二边的方向缩小第二预设大小并得到缩小后的子目标框的置信度,若连续多次缩小后的子目标框的置信度小于所述目标检测框的置信度,则执行步骤S6,否则执行步骤S7;
步骤S6、从所述目标检测框的第一边上逐步向着对应的第二边的方向扩大所述第二预设大小并得到扩大后的子目标框的置信度,将扩大后的子目标框的置信度与目标检测框的置信度进行比较并进行不断地扩大,直至当前次数区间内扩大后的子目标框的置信度平均值大于前后两个次数区间扩大后的子目标框的置信度平均值为止,从当前次数区间内扩大后的子目标框中选择置信度最高的子目标框作为下一次缩小或扩大的所述目标检测框之后执行步骤S8,所述次数区间为连续的预设次数组成的区间;
步骤S7、继续往同一方向进行缩小并进行前后两个次数区间的置信度平均值比较,直至当前次数区间内缩小后的子目标框的置信度平均值大于前后两个次数区间缩小后的子目标框的置信度平均值为止,从当前次数区间内缩小后的子目标框中选择置信度最高的子目标框作为下一次缩小或扩大的所述目标检测框之后执行步骤S8;
步骤S8、对所述目标检测框的其他三个边分别作为第一边以分别执行步骤S4至步骤S7,将最终经过扩大或缩小后所得到的子目标框所在区域确定为最终的目标检测框。
3.根据权利要求2所述的一种基于图像识别的滑动窗口框选方法,其特征在于,所述预设次数为2次、3次或4次。
4.根据权利要求1所述的一种基于图像识别的滑动窗口框选方法,其特征在于,所述步骤S4之后还包括:对不同的目标物的目标检测框采用不同的颜色进行显示。
5.一种基于图像识别的滑动窗口框选终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
步骤S1、采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框以及每一个检测框的置信度;
步骤S2、从所有检测框中获取置信度最大的第一检测框,将与所述第一检测框的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框,将所述第一检测框标记为目标检测框,并记录每一个所述待选检测框所对应的所述目标检测框;
步骤S3、从未被标记为所述待选检测框或者所述目标检测框的其余检测框中获取置信度最大的第三检测框,将所述待选检测框和所述其余检测框中筛选出与所述第三检测框的重叠区域面积比例大于重叠率阈值的所有第四检测框标记为待选检测框,依次类推,直至所有所述待选检测框都标记为所述待选检测框或者所述目标检测框;
步骤S4、将所有所述待选检测框分别去除与对应的所述目标检测框的重叠区域之后的子检测框进行分类识别以得到所述子检测框的置信度,判断所述子检测框的置信度是否大于第二置信度阈值,若是,则将所述待选检测框的标记修改为所述目标检测框,否则删除所述待选检测框,所述第二置信度阈值小于所述第一置信度阈值。
6.根据权利要求5所述的一种基于图像识别的滑动窗口框选终端,其特征在于,所述步骤S4之后还包括:
步骤S5、从所述目标检测框的第一边上逐步向着对应的第二边的方向缩小第二预设大小并得到缩小后的子目标框的置信度,若连续多次缩小后的子目标框的置信度小于所述目标检测框的置信度,则执行步骤S6,否则执行步骤S7;
步骤S6、从所述目标检测框的第一边上逐步向着对应的第二边的方向扩大所述第二预设大小并得到扩大后的子目标框的置信度,将扩大后的子目标框的置信度与目标检测框的置信度进行比较并进行不断地扩大,直至当前次数区间内扩大后的子目标框的置信度平均值大于前后两个次数区间扩大后的子目标框的置信度平均值为止,从当前次数区间内扩大后的子目标框中选择置信度最高的子目标框作为下一次缩小或扩大的所述目标检测框之后执行步骤S8,所述次数区间为连续的预设次数组成的区间;
步骤S7、继续往同一方向进行缩小并进行前后两个次数区间的置信度平均值比较,直至当前次数区间内缩小后的子目标框的置信度平均值大于前后两个次数区间缩小后的子目标框的置信度平均值为止,从当前次数区间内缩小后的子目标框中选择置信度最高的子目标框作为下一次缩小或扩大的所述目标检测框之后执行步骤S8;
步骤S8、对所述目标检测框的其他三个边分别作为第一边以分别执行步骤S4至步骤S7,将最终经过扩大或缩小后所得到的子目标框所在区域确定为最终的目标检测框。
7.根据权利要求6所述的一种基于图像识别的滑动窗口框选终端,其特征在于,所述预设次数为2次、3次或4次。
8.根据权利要求5所述的一种基于图像识别的滑动窗口框选终端,其特征在于,所述步骤S4之后还包括:对不同的目标物的目标检测框采用不同的颜色进行显示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110685166.1A CN113255648B (zh) | 2021-06-21 | 2021-06-21 | 一种基于图像识别的滑动窗口框选方法及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110685166.1A CN113255648B (zh) | 2021-06-21 | 2021-06-21 | 一种基于图像识别的滑动窗口框选方法及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113255648A CN113255648A (zh) | 2021-08-13 |
CN113255648B true CN113255648B (zh) | 2023-12-19 |
Family
ID=77188926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110685166.1A Active CN113255648B (zh) | 2021-06-21 | 2021-06-21 | 一种基于图像识别的滑动窗口框选方法及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113255648B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114444621A (zh) * | 2022-04-11 | 2022-05-06 | 北京航空航天大学杭州创新研究院 | 一种基于模板匹配的棋类局面转化方法、装置及存储介质 |
CN115145451B (zh) * | 2022-06-28 | 2023-06-30 | 网易(杭州)网络有限公司 | 一种终端设备上的框选方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108009544A (zh) * | 2017-12-13 | 2018-05-08 | 北京小米移动软件有限公司 | 目标检测方法及装置 |
CN108960174A (zh) * | 2018-07-12 | 2018-12-07 | 广东工业大学 | 一种目标检测结果优化方法及装置 |
GB202004114D0 (en) * | 2020-03-20 | 2020-05-06 | Imagination Tech Ltd | Apparatus and method for processing detection boxes |
CN111738263A (zh) * | 2020-08-24 | 2020-10-02 | 北京易真学思教育科技有限公司 | 目标检测方法、装置、电子设备及存储介质 |
CN112052787A (zh) * | 2020-09-03 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 基于人工智能的目标检测方法、装置及电子设备 |
-
2021
- 2021-06-21 CN CN202110685166.1A patent/CN113255648B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108009544A (zh) * | 2017-12-13 | 2018-05-08 | 北京小米移动软件有限公司 | 目标检测方法及装置 |
CN108960174A (zh) * | 2018-07-12 | 2018-12-07 | 广东工业大学 | 一种目标检测结果优化方法及装置 |
GB202004114D0 (en) * | 2020-03-20 | 2020-05-06 | Imagination Tech Ltd | Apparatus and method for processing detection boxes |
CN111738263A (zh) * | 2020-08-24 | 2020-10-02 | 北京易真学思教育科技有限公司 | 目标检测方法、装置、电子设备及存储介质 |
CN112052787A (zh) * | 2020-09-03 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 基于人工智能的目标检测方法、装置及电子设备 |
Non-Patent Citations (1)
Title |
---|
改进的非极大值抑制算法的目标检测;赵文清 等;中国图象图形学报;第23卷(第11期);第1676-1685页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113255648A (zh) | 2021-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4744918B2 (ja) | 顔検出方法および装置並びにプログラム | |
JP6330385B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
CN111582201A (zh) | 一种基于几何注意力感知的车道线检测系统 | |
CN113255648B (zh) | 一种基于图像识别的滑动窗口框选方法及终端 | |
JP2004348674A (ja) | 領域検出方法及びその装置 | |
CN103984948B (zh) | 一种基于人脸图像融合特征的软双层年龄估计方法 | |
JP2007047965A (ja) | デジタル画像の対象物検出方法および装置並びにプログラム | |
JP2003030667A (ja) | イメージ内で目を自動的に位置決めする方法 | |
WO2004095358A1 (en) | Human figure contour outlining in images | |
EP2797052A2 (en) | Detecting a saliency region in an image | |
JP4757598B2 (ja) | 顔検出方法および装置並びにプログラム | |
JP2012190159A (ja) | 情報処理装置、情報処理方法及びプログラム | |
US20210256717A1 (en) | Edge-guided ranking loss for monocular depth prediction | |
EP2626835A1 (en) | Object tracking apparatus and control method thereof | |
JP6266468B2 (ja) | 対象検出装置 | |
US20040022440A1 (en) | Method and apparatus for image processing | |
JP2004220555A (ja) | 画像から被写体領域を抽出する装置、方法、プログラムおよびプログラムを記録した記録媒体 | |
CN103065302B (zh) | 一种基于离群数据挖掘的图像显著性检测方法 | |
JP2011170890A (ja) | 顔検出方法および装置並びにプログラム | |
JP4749884B2 (ja) | 顔判別装置の学習方法、顔判別方法および装置並びにプログラム | |
KR20060121503A (ko) | 무인 감시 로봇에서 중요 얼굴 추적 장치 및 방법 | |
CN113255649B (zh) | 一种基于图像识别的图像分割框选方法及终端 | |
JP4795737B2 (ja) | 顔検出方法および装置並びにプログラム | |
CN113222867B (zh) | 基于多模板图像的图像数据增强方法及系统 | |
KR20180082680A (ko) | 분류기를 학습시키는 방법 및 이를 이용한 예측 분류 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |