CN107633500A - 一种新的图像目标检测流程 - Google Patents

一种新的图像目标检测流程 Download PDF

Info

Publication number
CN107633500A
CN107633500A CN201610569827.3A CN201610569827A CN107633500A CN 107633500 A CN107633500 A CN 107633500A CN 201610569827 A CN201610569827 A CN 201610569827A CN 107633500 A CN107633500 A CN 107633500A
Authority
CN
China
Prior art keywords
target
grid
training
testing process
image object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610569827.3A
Other languages
English (en)
Inventor
单志辉
刘宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Inspectors Image Recognition Technology Co Ltd
Original Assignee
Nanjing Inspectors Image Recognition Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Inspectors Image Recognition Technology Co Ltd filed Critical Nanjing Inspectors Image Recognition Technology Co Ltd
Priority to CN201610569827.3A priority Critical patent/CN107633500A/zh
Publication of CN107633500A publication Critical patent/CN107633500A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种新的图像目标检测流程,将检测图片划分成若干网格,通过目标局部检测整体目标,主要包括以下步骤:通过部件模型判断网格区域是否为目标局部,确定目标的大致位置;位置回归模型确定目标准确位置;整体模型判断是否为目标整体。该方法更符合人眼检索目标的方法:利用局部、整体和周边信息判断目标。实验表明,该方法的计算窗口比滑动窗口方法少,使得时间开销更少,并且检测准确率相当。

Description

一种新的图像目标检测流程
技术领域
本发明涉及计算机视觉的目标检测领域,特别是一种图像目标检测流程。
背景技术
图像目标类别检测是指在图像中发现特定类别目标的准确位置,这一直是计算机视觉的研究重点。传统方法采用不同尺度不同大小的窗口在图像上滑动,对每一个窗口使用选定的分类器进行目标判别,该方法需要判别大量窗口,因此速度较慢。
为了取代传统的滑动窗口方法,近年来出现一种预选窗口的方法,和霍夫森林(Hough Forest)目标检测方法,预选窗口方法是先产生一系列的预选窗口,然后将预选窗口送给分类器进行目标判别,虽然该方法在一定程度上能减少窗口的数量,但预选窗口数量仍然较多,同时产生预选窗口的过程也需要时间开销;霍夫森林方法首先确定目标局部块,然后使用目标局部块的位移预测整体目标的位置,该方法将局部块的判别过程与整体目标位置的预测过程交织在同一个随机森林模型中,因此检测结果准确率不高。
发明内容
本发明的目的是提出一种新的图像目标检测流程,来取代传统的滑动窗口寻找目标的方法。
为实现上述发明目的,本发明采用下述技术方案予以实现:
将检测图像先划分成大小不同的网格,利用一个个网格检测目标整体,所述方法包括以下步骤:
1.输入图像的某一网格区域,采用部件模型判断是否为目标局部,若为局部则计算返回目标的大致位置;
2.根据目标大致位置,采用位置回归模型计算确定目标的准确位置;
3.根据目标准确位置,采用整体模型判断该区域是否为目标整体,至此,一个网格检测结束。
附图说明
图1——本发明所述图像网格划分示例图。
图2——本发明所述目标检测流程示意图。
具体实施方式
下面将结合附图对本发明实施例的技术方案进行详细描述。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明所述目标检测流程区别于传统方法,将检测图像首先划分成大小不同的网格,在一个个网格区域检测目标局部,然后在目标局部周围一定范围内预测目标整体位置,这种逻辑更符合人眼利用局部、整体或周边信息检索目标的方法。所述网格划分示例如图1所示,但在实际划分时网格之间存在一定比例的交叠,网格大小由实际情况决定。
图2为本发明所述图像目标检测流程示意图,利用图像局部检测目标整体的流程主要包括以下步骤:
步骤一:输入一个测试图片的网格区域,采用部件模型检测是否为目标局部,返回目标的大致位置;
所述部件模型的功能是检测图片是否为目标的局部,将某一个网格区域输入给部件模型,预测结果不为正,则认为该网格区域不是目标局部,结束该网格的检测,如果预测结果为正,则以该网格为中心生成一个长宽为该网格β倍的窗口W1,矩形窗口W1则为目标的大致位置。
部件模型的训练样本:若训练图片中一个网格与某个特定目标的交叠率达到阈值α,则该网格为正样本;若一个网格与某个特定目标的交叠率小于α,则该网格为负样本。
步骤二,采用位置回归模型确定目标的准确位置;
所述位置回归模型的功能是确定目标的准确位置,输入窗口W1所对应的图片块,预测目标的准确位置矩形框P1。
位置回归模型的训练样本:若训练图片中某一网格与特定目标的交叠率达到阈值α,则以该网格为中心生成一个长宽为该网格β倍的窗口W1,计算目标相对于W1的位置坐标R1,窗口W1对应的图片块和相对坐标R1为训练样本。
步骤三,采用整体模型对目标整体进行判别。
整体模型的功能是判断图片块是否为目标整体,输入目标准确位置矩形框P1对应的图片块,输出判别结果,至此,该网格检测结束。
整体模型的训练样本:目标整体对应的图片块为正样本;与目标交叠率小于阈值γ的图片块为负样本。
上述步骤一、二、三中的模型采用的分类器和回归器类型可以是支持向量机(SVM)、随机森林和深度神经网络等。
本发明与现有技术相比具有以下优点:
1.本发明所述图像目标检测流程的检测窗口数量要远小于传统的滑动窗口方法,计算量减少,时间开销更少,检测准确率相当;
2.本发明所述的图像目标检测流程更符合人眼检索目标的方法:充分利用局部、整体或周边的信息。

Claims (4)

1.一种新的图像目标检测流程,其特征在于包括以下步骤:
步骤一:输入图像的某一网格区域,采用部件模型判断是否为目标局部,若为局部则计算返回目标的大致位置,所述目标的大致位置由网格区域为中心扩展所得;
步骤二:根据目标大致位置,采用位置回归模型计算确定目标的准确位置;
步骤三:根据目标准确位置,采用整体模型判断该区域是否为目标整体。
2.根据权利要求1所述的图像目标检测流程,其特征在于,所述步骤一中的部件模型为训练所得,模型训练样本:若训练图片中一个网格与某个特定目标的交叠率达到某一阈值α,则该网格为正样本;反之,该网格为负样本。
3.根据权利要求1所述的图像目标检测流程,其特征在于,所述步骤二中的位置回归模型为训练所得,模型训练样本:若训练图片中某一网格与特定目标的交叠率达到一定阈值α,则以该网格为中心生成一个长宽为该网格β倍的窗口W1,计算目标相对于W1的位置坐标R1,窗口W1对应的图片块和相对坐标R1为训练样本。
4.根据权利要求1所述的图像目标检测流程,其特征在于,所述步骤三中的整体模型为训练所得,模型训练样本:目标整体对应的图片块为正样本;与目标交叠率小于某一阈值的图片块为负样本。
CN201610569827.3A 2016-07-14 2016-07-14 一种新的图像目标检测流程 Pending CN107633500A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610569827.3A CN107633500A (zh) 2016-07-14 2016-07-14 一种新的图像目标检测流程

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610569827.3A CN107633500A (zh) 2016-07-14 2016-07-14 一种新的图像目标检测流程

Publications (1)

Publication Number Publication Date
CN107633500A true CN107633500A (zh) 2018-01-26

Family

ID=61112263

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610569827.3A Pending CN107633500A (zh) 2016-07-14 2016-07-14 一种新的图像目标检测流程

Country Status (1)

Country Link
CN (1) CN107633500A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111368703A (zh) * 2020-02-29 2020-07-03 上海电力大学 一种基于fpn的台标检测与识别的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609720A (zh) * 2012-01-31 2012-07-25 中国科学院自动化研究所 一种基于位置校正模型的行人检测方法
CN103617433A (zh) * 2013-12-02 2014-03-05 西北工业大学 基于简化直推式学习法的在线目标跟踪方法
US20150154441A1 (en) * 2013-12-02 2015-06-04 Huawei Technologies Co., Ltd. Method and apparatus for generating strong classifier for face detection
CN105654505A (zh) * 2015-12-18 2016-06-08 中山大学 一种基于超像素的协同跟踪算法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609720A (zh) * 2012-01-31 2012-07-25 中国科学院自动化研究所 一种基于位置校正模型的行人检测方法
CN103617433A (zh) * 2013-12-02 2014-03-05 西北工业大学 基于简化直推式学习法的在线目标跟踪方法
US20150154441A1 (en) * 2013-12-02 2015-06-04 Huawei Technologies Co., Ltd. Method and apparatus for generating strong classifier for face detection
CN105654505A (zh) * 2015-12-18 2016-06-08 中山大学 一种基于超像素的协同跟踪算法和系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111368703A (zh) * 2020-02-29 2020-07-03 上海电力大学 一种基于fpn的台标检测与识别的方法

Similar Documents

Publication Publication Date Title
CN110059554B (zh) 一种基于交通场景的多支路目标检测方法
CN111640089B (zh) 一种基于特征图中心点的缺陷检测方法及装置
CN103324937B (zh) 标注目标的方法和装置
CN110288017B (zh) 基于动态结构优化的高精度级联目标检测方法与装置
CN109284779A (zh) 基于深度全卷积网络的物体检测方法
CN110490099B (zh) 一种基于机器视觉的地铁公共地点人流量分析方法
CN105260749B (zh) 基于方向梯度二值模式和软级联svm的实时目标检测方法
CN104268591A (zh) 一种面部关键点检测方法及装置
CN105989347A (zh) 客观题智能阅卷方法及系统
CN109740416B (zh) 目标跟踪方法及相关产品
CN105913454A (zh) 一种视频图像中运动目标的像素坐标轨迹预测方法
CN103455794A (zh) 一种基于帧融合技术的动态手势识别方法
CN109087337B (zh) 基于分层卷积特征的长时间目标跟踪方法及系统
CN104217192A (zh) 基于深度图像的手定位方法和设备
CN104049760A (zh) 一种人机交互命令的获取方法及系统
CN103456009B (zh) 目标检测方法与装置、监控系统
CN109727226A (zh) 一种基于机器学习的位置表自动生成方法
CN108305242A (zh) 一种用于工业生产线的智能视觉检测方法、系统及装置
CN103150558A (zh) 一种基于机器视觉的显示终端操作响应匹配检测方法
CN113657423A (zh) 适用于小体积零件与堆叠零件的目标检测方法及其应用
CN109544516A (zh) 图像检测方法及装置
CN113702393B (zh) 一种本安型矿用输送带表面损伤检测系统及检测方法
CN104766100A (zh) 基于机器学习的红外小目标图像背景预测方法与装置
CN110222704A (zh) 一种弱监督目标检测方法及装置
CN106771329A (zh) 一种无人机减速过程中运行速度的检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180126

RJ01 Rejection of invention patent application after publication