CN106780507B - 一种基于超像素分割的滑动窗口快速目标检测方法 - Google Patents
一种基于超像素分割的滑动窗口快速目标检测方法 Download PDFInfo
- Publication number
- CN106780507B CN106780507B CN201611041207.9A CN201611041207A CN106780507B CN 106780507 B CN106780507 B CN 106780507B CN 201611041207 A CN201611041207 A CN 201611041207A CN 106780507 B CN106780507 B CN 106780507B
- Authority
- CN
- China
- Prior art keywords
- pixel
- super
- sliding window
- active region
- window
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于超像素分割的滑动窗口快速目标检测方法,其主要由图像超像素分割、滑动窗口初始化、滑动窗口超像素激活、激活区域评价和基于超像素激活区域的滑窗搜索五部分构成。有益效果:能够方便地改变超像素的尺寸和内部的特征一致性,从而改变同一滑动窗口所激活的超像素区域,实现提高目标检测精度的目的;能够将其覆盖像素点对应的超像素区域纳入滑动窗口,由于超像素的特征一致性保证了其对目标边界较好的分割效果,因此本发明能够保证激活区域与目标边界有较好理想的符合度。能够在一定范围内增大窗口的滑动步长,同时保证其对应的激活区域不变,从而达到提高算法运行效率的目的。
Description
技术领域
本发明属于图像处理与计算机视觉领域,涉及一种基于超像素分割的滑动窗口快速目标检测方法。
背景技术
视觉是人类获取外界信息的重要途径,而图像则是信息的重要载体。随着图像处理技术的日益发展,图像的尺寸、分辨率逐渐增大,其包含的信息也在不断丰富。研究表明,人类在观察图像时视线通常在图像所包含的物体之间移动,而对背景等其他区域并不感兴趣,大部分的视觉技术,如行人检测、人脸识别、目标跟踪和目标识别等,也是作用于上述包含物体的区域。因此如何在整幅图像中快速、有效地检测感兴趣物体区域具有重要的研究意义。
目标检测是图像理解、目标识别领域的重要内容,其主要任务包括从一幅给定图像中定位目标,其中基于滑窗搜索的方法在目标检测中得到广泛应用。上述方法将分类函数应用于不同位置、尺度和长宽比下的窗口,对窗口所覆盖的图像区域进行评价,具有最大响应的窗口视为物体的预测区域。但基于滑窗搜索的方法在实际应用中主要面临两个问题:
1、由于窗口滑动步长的影响,窗口所覆盖的矩形区域通常不能够对目标的边缘进行较好的覆盖,如图2中白色实线所示。为提高窗口的覆盖准确性,如果降低窗口的滑动步长,又会造成搜索效率的下降;
2、如何有效地训练具有位置判别特征的泛化分类器。
针对第一个问题,已有的改进大都采用启发式算法,首先对目标在图像中的分布进行初步估计,在概率高的区域进行精细搜索,在概率低的区域进行粗略搜索,从而达到提高搜索效率的目的,但其搜索精度依赖于初始的位置分布精度,且会增大目标误检和漏检的概率。基于滑窗搜索的算法虽然效率较低,但仍具有精度高,漏检率低的优点。因此采用结合上述两种搜索方式的优点,发展一种运行速度快、误检率低的搜索方法,同时保证目标检测结果与实际尽可能吻合,具有十分重要的意义。
发明内容
要解决的技术问题
为了避免现有技术的不足之处,本发明提出一种基于超像素分割的滑动窗口快速目标检测方法,弥补现有的滑窗搜索算法在运行速度、目标检测精度的不足。
技术方案
一种基于超像素分割的滑动窗口快速目标检测方法,其特征在于步骤如下:
步骤1、图像超像素分割:采用SLIC算法将图像分割为互不重合超像素的图像块,每个图像块有唯一的标记信息i,N表示超像素的总数目,i=0,1,2,…N-1;
步骤2、滑动窗口初始化:将滑动窗口的尺度分别设置为图像尺寸的1/2,1/3或1/4;每个尺度的滑动窗口的长宽比分别设置为1:1,2:1,1:2,3:2,2:3,16:9或9:16,得到21组尺寸/长宽比的滑动窗口;
步骤3、滑动窗口超像素激活:将其中一个滑动窗口作为初始窗口,将初始窗口所覆盖像素点对应的超像素集合作为实际的滑动窗口为超像素激活区域;所述超像素集合中所有像素点横坐标的最小值作为激活区域的左边界,最大值作为激活区域的右边界,所有像素点纵坐标的最小值作为激活区域的上边界,最大值作为激活区域的下边界;
步骤4、激活区域评价:采用目标评价函数计算当前的超像素激活区域包含有目标概率;
步骤5:将滑动窗口滑动至下一个区域,再重复步骤3~步骤4得到下一个区域的目标概率;
步骤6、基于超像素激活区域的滑窗搜索:
对21组尺寸/长宽比的滑动窗口重复步骤3~步骤5,得到每个滑动窗口在不同位置的目标概率;
将得到的21组评价概率由高到低进行排列,取每组内排列前三的评价概率的3个滑动窗口作为目标的检测候选滑动窗口,21种组合共生成63个目标候选区域;
以0.5作为窗口覆盖率阈值,采用非极大值抑制算法对63个目标候选区域筛选出具有全局最大概率的超像素激活区域,作为最终的目标检测区域。窗口覆盖率γ:
其中,i≠j且1≤i,j≤63,pi,pj分别表示第i,j个超像素激活区域;|·|表示对应区域的像素个数。
有益效果
本发明提出的一种基于超像素分割的滑动窗口快速目标检测方法,其主要由图像超像素分割、滑动窗口初始化、滑动窗口超像素激活、激活区域评价和基于超像素激活区域的滑窗搜索五部分构成。
与现有技术相比,本发明具有以下有益效果:
1.通过控制图像分割算法参数,本发明能够方便地改变超像素的尺寸和内部的特征一致性,从而改变同一滑动窗口所激活的超像素区域,实现提高目标检测精度的目的;
2.当滑动窗口未能与目标边界较好吻合时,本发明能够将其覆盖像素点对应的超像素区域纳入滑动窗口,由于超像素的特征一致性保证了其对目标边界较好的分割效果,因此本发明能够保证激活区域与目标边界有较好理想的符合度。
3.由于超像素具有一定的尺寸,本发明能够在一定范围内增大窗口的滑动步长,同时保证其对应的激活区域不变,从而达到提高算法运行效率的目的。
本发明的方法易于实现,其应用价值主要体现在以下几个方面:
1.可以在保证搜索精度的前提下,显著提升搜索步长设置,从而加速传统基于像素点的滑窗搜索算法;
2.本发明可以方便地嵌入现有的滑窗搜索算法,在不改变算法实施方式的前提下提高现有算法对目标的检测精度。
附图说明
图1为本发明的流程图;
图2为本发明的超像素激活窗口与原初始窗口的对比示意图;
图3为本发明的不同阶段的算法效果图,其中,(a)为输入图像的超像素分割效果图,(b)、(c)分别为不同尺度/长宽比组合下的目标检测结果,(d)为应用非极大值抑制后的最终检测结果。
具体实施方式
现结合实施例、附图对本发明作进一步描述:
参见图1,本发明为一种基于超像素分割的滑动窗口快速目标检测方法,其主要由图像超像素分割、滑动窗口初始化、滑动窗口超像素激活、激活区域评价和基于超像素激活区域的滑窗搜索五部分构成。
该方法具体包括步骤如下:
1.图像超像素分割
选取包含目标的图像作为待处理图像,应用SLIC(Simple Linear IterativeClustering)算法将图像分割为尺寸相当、内部元素特征相似的超像素。超像素互不重合,且有唯一的标记信息i(i=0,1,2,…N-1),N表示超像素的总数目。简要做法如下:
1)按固定采样步长s初始化聚类中心点,每个像素的标记设为-1,距最近中心点的距离设为正无穷;
2)对每一个中心点,计算其2s×2s邻域中每个像素点距此中心点的距离,并与该像素点已有的距离进行比较,较小的值设为当前像素点的距离,并保持像素点标记与该聚类中心点标记一致;
3)更新聚类中心点,计算分割误差;
4)重复执行步骤2)和3),直到误差满足条件。
2.滑动窗口初始化
为使滑动窗口能够尽可能完整地覆盖图像中的目标,需给滑动窗口设置不同的尺度和长宽比。在本发明中,滑动窗口的尺度分别设置为图像尺寸的1/2,1/3,1/4,每个尺度的滑动窗口的长宽比分别设置为1:1,2:1,1:2,3:2,2:3,16:9,9:16,共有21组尺寸/长宽比组合情况。选定一组组合参数,生成初始化滑动窗口。
3.滑动窗口超像素激活
将其中一个滑动窗口作为初始窗口,将初始窗口所覆盖像素点对应的超像素区域的集合作为实际的滑动窗口,即超像素激活区域。超像素集合中所有像素点横坐标的最小值作为激活区域的左边界,最大值作为激活区域的右边界;同理,计算所有像素点纵坐标的最小值作为激活区域的上边界,最大值作为激活区域的下边界。当初始窗口由于滑动步长的影响未能与目标边界较好符合时,由于其能够覆盖一部分的超像素像素点,而超像素内部具有较好的特征一致性,其对边界的分割效果较为理想,因此将这些像素点对应的超像素区域纳入滑动窗口,能够保证激活区域与目标边界有良好的符合度,如图2中白色虚线所示。
当每个超像素均只包含1个像素点时,本方法退化为传统的滑动窗口搜索算法,因此本是对传统算法的一般化。
4.激活区域评价
采用目标评价函数对当前的超像素激活区域进行评价,计算其中包含有目标的概率。目标评价函数的选取同传统滑动窗口算法一致,此处不再赘述。
5.将滑动窗口滑动至下一个区域,再重复步骤3~步骤4得到下一个区域的目标概率;
6.基于超像素激活区域的滑窗搜索
生成新一组尺度/长宽比组合,重复执行步骤3和步骤4,直到所有组合完成遍历。针对每一组合,将其产生的超像素激活区域按照评价概率由高到低进行排列,取最高的3组区域作为目标的检测候选区域,21种组合共生成63个目标候选区域。
最后以0.5作为窗口覆盖率阈值,采用非极大值抑制算法(NMS,Non-MaximalSuppression)筛选出具有全局最大概率的超像素激活区域,作为最终的目标检测区域。窗口覆盖率γ定义如下:
其中,i≠j且1≤i,j≤63,pi,pj分别表示第i,j个超像素激活区域。|·|表示对应区域的像素个数。
Claims (1)
1.一种基于超像素分割的滑动窗口快速目标检测方法,其特征在于步骤如下:
步骤1、图像超像素分割:采用SLIC算法将图像分割为互不重合超像素的图像块,每个图像块有唯一的标记信息i,N表示超像素的总数目,i=0,1,2,…N-1;
步骤2、滑动窗口初始化:将滑动窗口的尺度分别设置为图像尺寸的1/2,1/3或1/4;每个尺度的滑动窗口的长宽比分别设置为1:1,2:1,1:2,3:2,2:3,16:9或9:16,得到21组尺寸/长宽比的滑动窗口;
步骤3、滑动窗口超像素激活:将其中一个滑动窗口作为初始窗口,将初始窗口所覆盖像素点对应的超像素集合作为实际的滑动窗口为超像素激活区域;所述超像素集合中所有像素点横坐标的最小值作为激活区域的左边界,最大值作为激活区域的右边界,所有像素点纵坐标的最小值作为激活区域的上边界,最大值作为激活区域的下边界;
步骤4、激活区域评价:采用目标评价函数计算当前的超像素激活区域包含有目标概率;
步骤5:将滑动窗口滑动至下一个区域,再重复步骤3~步骤4得到下一个区域的目标概率;
步骤6、基于超像素激活区域的滑窗搜索:
对21组尺寸/长宽比的滑动窗口重复步骤3~步骤5,得到每个滑动窗口在不同位置的目标概率;
将得到的21组评价概率由高到低进行排列,取每组内排列前三的评价概率的3个滑动窗口作为目标的检测候选滑动窗口,21种组合共生成63个目标候选区域;
以0.5作为窗口覆盖率阈值,采用非极大值抑制算法对63个目标候选区域筛选出具有全局最大概率的超像素激活区域,作为最终的目标检测区域;
所述窗口覆盖率γ:
其中,i≠j且1≤i,j≤63,pi,pj分别表示第i,j个超像素激活区域;|·|表示对应区域的像素个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611041207.9A CN106780507B (zh) | 2016-11-24 | 2016-11-24 | 一种基于超像素分割的滑动窗口快速目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611041207.9A CN106780507B (zh) | 2016-11-24 | 2016-11-24 | 一种基于超像素分割的滑动窗口快速目标检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106780507A CN106780507A (zh) | 2017-05-31 |
CN106780507B true CN106780507B (zh) | 2019-05-10 |
Family
ID=58974553
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611041207.9A Active CN106780507B (zh) | 2016-11-24 | 2016-11-24 | 一种基于超像素分割的滑动窗口快速目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106780507B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107895384A (zh) * | 2017-12-01 | 2018-04-10 | 中国科学院长春光学精密机械与物理研究所 | 目标提取方法及装置 |
CN108492297B (zh) * | 2017-12-25 | 2021-11-19 | 重庆师范大学 | 基于深度级联卷积网络的mri脑肿瘤定位与瘤内分割方法 |
CN110276724A (zh) * | 2018-03-14 | 2019-09-24 | 上海箩箕技术有限公司 | 图像处理方法 |
CN110900611A (zh) * | 2019-12-13 | 2020-03-24 | 合肥工业大学 | 一种新型机械臂目标定位及路径规划方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103870834A (zh) * | 2014-04-03 | 2014-06-18 | 张琰 | 基于分层分割的滑动窗搜索方法 |
CN104680538A (zh) * | 2015-03-09 | 2015-06-03 | 西安电子科技大学 | 基于超像素的sar图像cfar目标检测方法 |
CN105427314A (zh) * | 2015-11-23 | 2016-03-23 | 西安电子科技大学 | 基于贝叶斯显著性的sar图像目标检测方法 |
-
2016
- 2016-11-24 CN CN201611041207.9A patent/CN106780507B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103870834A (zh) * | 2014-04-03 | 2014-06-18 | 张琰 | 基于分层分割的滑动窗搜索方法 |
CN104680538A (zh) * | 2015-03-09 | 2015-06-03 | 西安电子科技大学 | 基于超像素的sar图像cfar目标检测方法 |
CN105427314A (zh) * | 2015-11-23 | 2016-03-23 | 西安电子科技大学 | 基于贝叶斯显著性的sar图像目标检测方法 |
Non-Patent Citations (1)
Title |
---|
"超像素和阈值分割相结合的显著目标检测算法";张晴 等,;《现代电子技术》;20160715;全文 |
Also Published As
Publication number | Publication date |
---|---|
CN106780507A (zh) | 2017-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106780507B (zh) | 一种基于超像素分割的滑动窗口快速目标检测方法 | |
CN105118049A (zh) | 一种基于超像素聚类的图像分割方法 | |
CN108536851B (zh) | 一种基于移动轨迹相似度比较的用户身份识别方法 | |
CN102609934B (zh) | 一种基于深度图像的多目标分割和跟踪方法 | |
CN105809651B (zh) | 基于边缘非相似性对比的图像显著性检测方法 | |
CN107103326A (zh) | 基于超像素聚类的协同显著性检测方法 | |
CN103679702A (zh) | 一种基于图像边缘矢量的匹配方法 | |
CN106682679B (zh) | 一种基于水平集超像素和贝叶斯框架的显著性检测方法 | |
CN104123529A (zh) | 人手检测方法及系统 | |
JP2013025799A (ja) | 画像検索方法、システム、及びプログラム | |
CN107123130A (zh) | 一种基于超像素和混合哈希的核相关滤波目标跟踪方法 | |
CN106447679A (zh) | 一种基于迭代图割和自适应聚类的显著性检测方法 | |
CN110288612A (zh) | 铭牌定位与校正方法及设备 | |
CN104851089A (zh) | 一种基于三维光场的静态场景前景分割方法和装置 | |
CN104463138A (zh) | 基于视觉结构属性的文本定位方法及系统 | |
CN104182728A (zh) | 一种基于模式识别的车标自动定位与识别方法 | |
CN103854290A (zh) | 一种结合骨架特征点和分布场描述子的扩展目标跟踪方法 | |
CN105426816A (zh) | 一种处理人脸图像的方法及装置 | |
CN105469088B (zh) | 一种适用于目标识别的物体预测区域优化方法 | |
CN104866853A (zh) | 一种足球比赛视频中的多运动员的行为特征提取方法 | |
CN110516527B (zh) | 一种基于实例分割的视觉slam回环检测改进方法 | |
Eum et al. | Vehicle detection from airborne LiDAR point clouds based on a decision tree algorithm with horizontal and vertical features | |
CN108921228A (zh) | 一种眼底图像血管分割的评价方法 | |
CN102831419B (zh) | 一种快速的街景图像中车牌的检测模糊方法 | |
CN112053439B (zh) | 图像中实例属性信息确定方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |