CN108319961B - 一种基于局部特征点的图像roi快速检测方法 - Google Patents
一种基于局部特征点的图像roi快速检测方法 Download PDFInfo
- Publication number
- CN108319961B CN108319961B CN201810065820.7A CN201810065820A CN108319961B CN 108319961 B CN108319961 B CN 108319961B CN 201810065820 A CN201810065820 A CN 201810065820A CN 108319961 B CN108319961 B CN 108319961B
- Authority
- CN
- China
- Prior art keywords
- image
- feature points
- roi
- points
- orb
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
针对现有图像感兴趣区域(Region of interest,ROI)检测算法中存在算法原理较复杂、时间复杂度较大以及实时性较低的问题,本发明提出了一种新的基于局部特征点的ROI快速检测方法,本方法包括如下步骤:步骤1、图像预处理,即对输入图像生成金字塔影像;步骤2、在金字塔影像上提取ORB或SIFT特征点;步骤3、对所提特征点的坐标值按水平和垂直方向排序;步骤4、通过计算K个近邻点的均值来确定ROI的坐标;步骤5、提取图像ROI。本方法具有高实时性且鲁棒性好,能够快速、准确地检测出图像感兴趣区域。
Description
技术领域
本发明属于计算机视觉领域,特别涉及一种基于局部特征点的图像ROI快速检测方法。
背景技术
随着计算机视觉技术的发展,目标检测技术日趋成熟,越来越多的场合使用目标检测技术进行目标定位,但对一些待检测区域比较集中的应用,比如在农作物病害图像检测、生产线品质检测等,若在整体图像上提取特征进行检测,则面临着其计算量大、检测速度慢且检测准确率低的问题。因此基于ROI的目标识别、图像检测方法得到了广泛的应用,同时有效选取图像ROI更是其成功的关键。
图像ROI快速检测技术旨在提取出待检测图像中的目标感兴趣区域,缩小特征提取范围以减小计算量,同时提高检测速度和检测准确率。目前基于ROI的目标检测方法主要有角点提取法、颜色增强提取法、RGB颜色分量提取法以及SURF特征提取法等。
角点提取法是一种通过提取角点得到凸包区域的低层次图像信息与使用超像素聚类得到显著图的中层次图像信息相结合的自底向上的ROI检测方法。此方法不仅需要计算低层和高层图像信息,而且还需将两层信息进行加权融合,故其计算量大,难以进行实时应用。
颜色增强技术提取法是一种通过颜色增强技术提取ROI的方法,但实际应用中颜色受光照、像素影响很大,增加了检测的难度,而且针对复杂背景的图像,该方法误检率很大且稳定性不佳。
RGB颜色分量提取法先将图像从RGB色彩空间变换到HSV色彩空间中进行色彩修正,再变换回RGB空间利用R、G、B分量的线性组合生成视觉显著性图,最后对生成的视觉显著性图进行阈值分割得到ROI。但该方法检测效率高但对边缘和颜色相近区域检测误差较大,同时还需寻找最优参数,其鲁棒性不高。
基于SURF(Speed Up RobustFeatures)特征贡献度矩阵的图像ROI选取方法融合并归一化了ROI 的颜色、纹理以及形状等底层特征,利用非线性高斯距离函数进行相似度匹配。该方法计算量小且在简单背景下拥有较高的检测率,但其存在冗余计算且在复杂背景下检测效果不佳。
综上所述,目前的ROI检测技术在速度、算法原理精简性、稳定性、检测精确度等方面都还难以满足实际的应用需求,因此对其进一步的研究具有重要意义。
发明内容
针对在图像整体上提取特征时计算量大和和效率低的问题,本发明提出了一种新的基于局部特征点的图像感兴趣区域(Region of interest,ROI)的快速检测方法。该方法先对图像预处理,即对输入图像生成金字塔影像,再在金字塔影像上提取ORB或SIFT特征
点。然后对所提特征点的坐标值按水平和垂直方向排序,通过计算K个近邻点的均值来确定 ROI的坐标。最后提取图像ROI。本方法具有高实时性且鲁棒性好,能够快速、准确地检测出 图像感兴趣区域,其实际应用广泛且具有成本低、计算量小、算法复杂度小、稳定性好的特 点。
本发明的技术解决方案包括如下步骤:
步骤1、图像预处理,即对输入图像生成金字塔影像;
步骤2、在金字塔影像上提取ORB或SIFT特征点;
步骤3、对所提特征点的坐标值按水平和垂直方向排序;
步骤4、通过计算K个近邻点的均值来确定ROI的坐标;
步骤5、提取图像ROI。
步骤1中考虑到基于FAST算法提取的特征点不具有尺度不变性故先做预处理,将图像降采样生成金字塔影像,使算法具备尺度不变性。
步骤2中首先初始化零矩阵,当提取的ORB特征点数目小于给定阈值时则提取SIFT特征点,然后将所提取的特征点保存到初始化矩阵中。由于只提取ORB特征点或者SIFT特征点而不用生成特征描述向量,这就加快了ROI检测的速度。
步骤3中对存入矩阵的特征点按照升序排列。抽取矩阵中的xi值和yi值,分别组成向量X和Y,再对向量X和Y进行升序排列,得到有序向量X'和Y';
步骤4中通过计算k个近邻点的均值来确定ROI的坐标。从排序后的向量X'和Y'中分别 选择前k个值和后k个值作为候选坐标值(k为近邻点的数目),再通过计算这k个近邻点均值 的方法来确定图像ROI的坐标点。
步骤5中可根据步骤4得到的绝对坐标点O1和O2获得图像ROI的相对坐标点O1 '(x00,y00)和O2 '(x11-x00,y11-y00),这样就可以准确确定图像的ROI,从而提高了检测准确率。
本发明与现有技术相比,其显著优点是:1)本发明方法速度快,在提取图像局部特征点时,只提取ORB特征点或者SIFT特征点而不用生成特征描述向量,这就加快了ROI检测的速度;2)本发明方法算法复杂度低,通过计算k近邻点的均值来确定ROI的坐标点,有效降低了特征提取时的计算量和该算法的时间复杂度。3)本发明方法采用局部特征点,其实用性强且检测准确率高。
附图说明
图1为本发明的基于局部特征点的图像ROI快速检测流程图;
图2为本发明的检测结果统计表;
图3为本发明检测的马铃薯病害图像、人脸图像和动物图像的ROI效果图。
具体实施方式
下面结合附图及具体实施对本发明方案作进一步说明。
基于局部特征点的图像ROI快速检测流程图如图1,包括图像预处理,即对输入图像生成金字塔影像、在金字塔影像上提取ORB或SIFT特征点、对所提特征点的坐标值按水平和垂直方向排序、通过计算K个近邻点的均值来确定ROI的坐标、提取图像ROI。具体步骤如下:
步骤1、图像预处理,即对输入图像降采样生成金字塔影像。
步骤2、在金字塔影像上提取ORB或SIFT特征点,具体实现方法为:
(1)初始化。
假设提取的图像特征点的数目为S,保存特征点坐标值的矩阵记为,FK,大小为S×S, 初值为零,即:
需要说明的是,特征点坐标仅保存在FK的主对角线上,其余位置始终置零。
(2)判断且保存特征点坐标值。
当S orb ≥T时,Sorb为提取的ORB特征点数目,T为是否提取SIFT特征点而设定的阈值,将步骤1中提取的ORB特征点 的坐标值存入矩阵FK中,此时FK变为:
否则,提取图像的SIFT特征点,并存入矩阵FK中,则FK变为:
式(2)中,m为ORB特征点的数目,式(3)中,n为SIFT特征点的数目,其中,xi、yi分别表示 特征点在垂直方向和水平方向的坐标值。
步骤3、对步骤2所提特征点的坐标值按水平和垂直方向排序。具体过程为:(1)抽取矩阵FK'中的xi值和yi值,分别组成向量X=[x1,x2,...,x m ]和Y=[y 1,y 2,...,y m ];
(2)对向量X和Y进行升序排列,得到有序向量X'=[x1 ',x2 ',...,x m ']和Y'=[y 1 ',y 2 ',...,y m ']。
步骤4、通过计算K个近邻点的均值来确定ROI的坐标。具体过程为:
(1)从排序后的向量X'和Y'中分别选择前k个值和后k个值作为候选坐标值,k为近邻点的数目,同时存入向量KP x =[x1 ',x2 '...,xk ',xm-k ',xm-k+1 ',...,xm '] 和KP y =[y1 ',y2 ',...yk ',ym-k ',ym-k+1 ',...,ym ']
(2)假设ROI左上角与右下角的绝对坐标分别为O 1(x 00,y 00)和O 2(x 11,y 11),其值按公式计算:
公式的含义为:当局部特征点的数目小于给定阈值t时,选择k=1并分别以xi和yi的最小值与最大值作为图像ROI的坐标点;否则,选择k>1个近邻点并计算其均值作为图像ROI的坐标点。其中,t 为选择 k=1 或 k=torb/k=tsift而设定的阈值,由于不同样本提取的局部特征点个数不同,故t是不可固定的;
步骤5、提取图像ROI。具体过程为:
(1)根据步骤4计算得到的ROI的绝对坐标点O1和O2,可得图像ROI的相对坐标点为O1'(x00,y00)和O2'(x11-x00,y11-y00)。
(2)根据O1 '和O2 '坐标点确定的矩形框区域作为图像的ROI。
图2是使用本方法检测的马铃薯病害图像、人脸图像和动物图像的ROI效果图。如图所示,该方法将检测出的马铃薯病害区域、人脸区域和动物头像区域全都用矩形框较精确的标记了出来。因此,本方法不仅应用范围广,而且检测精确度也较好。
实验结果如表1所示。表1是用该方法对自建库中200张图像进行500次ROI提取的运行时间统计。据统计,实验中阈值T与不同目标图像提取的ORB特征数有关,据本次实验统计,阈值T>=300实验效果较好。基于局部特征点的图像ROI快速检测方法的检测时间分布在20-30ms之间。由此本方法具有具有良好的实时性。
Claims (5)
1.一种基于局部特征点的图像ROI快速检测方法,包括如下步骤:
步骤1、图像预处理,即对输入图像生成金字塔影像;
步骤2、在金字塔影像上提取ORB或SIFT特征点,提取的图像特征点数目为S;
步骤3、对所提特征点的坐标值按水平和垂直方向排序;
步骤4、通过计算K个近邻点的均值来确定ROI的坐标,其具体过程为:
(1)从排序后的向量X'和Y'中分别选择前k个值和后k个值作为候选坐标值,k为近邻点的数目,同时存入向量KP x =[x1 ',x2 ',...,xk ',xm-k ',xm-k+1 ',...,xm '] 和KP y =[y1 ',y2 ',...yk ',ym-k ',ym-k+1 ',...,ym ']
(2)假设ROI左上角与右下角的绝对坐标分别为O 1(x 00,y 00)和O 2(x 11,y 11),其值按公式计算:
公式的含义为:当局部特征点的数目小于给定阈值t时,选择k=1并分别以xi和yi的最小值与最大值作为图像ROI的坐标点;否则,选择k>1个近邻点并计算其均值作为图像ROI的坐标点;其中,t为选择k=1或k=torb/k=tsift而设定的阈值;
步骤5、提取图像ROI。
2.根据权利要求1所述的方法,其特征在于,步骤1为图像预处理,即对输入图像生成金字塔影像,具体实现方法为:
(1)对图像降采样,生成金字塔影像。
3.根据权利要求1所述的方法,其特征在于,步骤2在金字塔影像上提取ORB或SIFT特征点,具体实现方法为:
(1)初始化;
假设提取的图像特征点的数目为S,保存特征点坐标值的矩阵记为FK,大小为S×S,初值为零,即:
需要说明的是,特征点坐标仅保存在FK的主对角线上,其余位置始终置零;
(2)判断且保存特征点坐标值;
当S orb ≥T时,Sorb为提取的ORB特征点数目,T为是否提取SIFT特征点而设定的阈值,将步骤1中提取的ORB特征点的坐标值存入矩阵FK中,此时FK变为:
否则,提取图像的SIFT特征点,并存入矩阵FK中,则FK变为:
式(3)中,m为ORB特征点的数目,式(4)中,n为SIFT特征点的数目,其中,xi、yi分别表示特征点在垂直方向和水平方向的坐标值。
4.根据权利要求1所述方法,其特征在于,步骤3对步骤2所提特征点的坐标值按水平和垂直方向排序,具体过程为:
(1)抽取矩阵FK'中的xi值和yi值,分别组成向量X=[x1,x2,...,x m ]和Y=[y 1,y 2,...,y m ];
(2)对向量X和Y进行升序排列,得到有序向量X'=[x1 ',x2 ',...,x m ']和Y'=[y 1 ',y 2 ',...,y m ']。
5.根据权利要求1所述方法,其特征在于,步骤5为提取图像ROI,具体过程为:
(1)根据步骤4计算得到的ROI的绝对坐标点O1和O2,可得图像ROI的相对坐标点为O1 '(x00,y00)和O2 '(x11-x00,y11-y00);
(2)根据O1 '和O2 '坐标点确定的矩形框区域作为图像的ROI。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810065820.7A CN108319961B (zh) | 2018-01-23 | 2018-01-23 | 一种基于局部特征点的图像roi快速检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810065820.7A CN108319961B (zh) | 2018-01-23 | 2018-01-23 | 一种基于局部特征点的图像roi快速检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108319961A CN108319961A (zh) | 2018-07-24 |
CN108319961B true CN108319961B (zh) | 2022-03-25 |
Family
ID=62888132
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810065820.7A Active CN108319961B (zh) | 2018-01-23 | 2018-01-23 | 一种基于局部特征点的图像roi快速检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108319961B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110084736A (zh) * | 2019-04-29 | 2019-08-02 | 绍兴聚量数据技术有限公司 | 一种基于surf和金字塔算法的水印检测方法及系统 |
CN110852319A (zh) * | 2019-11-08 | 2020-02-28 | 深圳市深视创新科技有限公司 | 快速通用型roi匹配方法 |
CN111126384A (zh) * | 2019-12-12 | 2020-05-08 | 创新奇智(青岛)科技有限公司 | 基于特征融合的商品分类系统及分类方法 |
CN116883516B (zh) * | 2023-09-07 | 2023-11-24 | 西南科技大学 | 相机参数标定方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722890A (zh) * | 2012-06-07 | 2012-10-10 | 内蒙古科技大学 | 基于光流场模型的非刚性心脏图像分级配准方法 |
CN105427333A (zh) * | 2015-12-22 | 2016-03-23 | 厦门美图之家科技有限公司 | 视频序列图像的实时配准方法、系统及拍摄终端 |
CN106683046A (zh) * | 2016-10-27 | 2017-05-17 | 山东省科学院情报研究所 | 用于警用无人机侦察取证的图像实时拼接方法 |
CN107133640A (zh) * | 2017-04-24 | 2017-09-05 | 河海大学 | 基于局部图像块描述子和费舍尔向量的图像分类方法 |
CN107329962A (zh) * | 2016-04-29 | 2017-11-07 | 成都理想境界科技有限公司 | 图像检索数据库生成方法、增强现实的方法及装置 |
-
2018
- 2018-01-23 CN CN201810065820.7A patent/CN108319961B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722890A (zh) * | 2012-06-07 | 2012-10-10 | 内蒙古科技大学 | 基于光流场模型的非刚性心脏图像分级配准方法 |
CN105427333A (zh) * | 2015-12-22 | 2016-03-23 | 厦门美图之家科技有限公司 | 视频序列图像的实时配准方法、系统及拍摄终端 |
CN107329962A (zh) * | 2016-04-29 | 2017-11-07 | 成都理想境界科技有限公司 | 图像检索数据库生成方法、增强现实的方法及装置 |
CN106683046A (zh) * | 2016-10-27 | 2017-05-17 | 山东省科学院情报研究所 | 用于警用无人机侦察取证的图像实时拼接方法 |
CN107133640A (zh) * | 2017-04-24 | 2017-09-05 | 河海大学 | 基于局部图像块描述子和费舍尔向量的图像分类方法 |
Non-Patent Citations (2)
Title |
---|
WiFi网络下的三维空间定位技术研究;董莹莹;《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》;20131115;论文第50页 * |
提高Wi-Fi室内定位系统性能的AP布局方法研究;贺良云;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20160615;论文第22页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108319961A (zh) | 2018-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110929560B (zh) | 融合目标检测与跟踪的视频半自动目标标注方法 | |
CN107316031B (zh) | 用于行人重识别的图像特征提取方法 | |
CN106960451B (zh) | 一种提升图像弱纹理区域特征点数量的方法 | |
Wang et al. | RGB-D salient object detection via minimum barrier distance transform and saliency fusion | |
CN108319961B (zh) | 一种基于局部特征点的图像roi快速检测方法 | |
CN110334762B (zh) | 一种基于四叉树结合orb和sift的特征匹配方法 | |
CN106991689B (zh) | 基于fhog和颜色特征的目标跟踪方法及gpu加速 | |
Yu et al. | A cascade rotated anchor-aided detector for ship detection in remote sensing images | |
CN109101981B (zh) | 一种街景场景下基于全局图像条纹码的回环检测方法 | |
CN107066969A (zh) | 一种人脸识别方法 | |
CN105718882A (zh) | 一种分辨率自适应特征提取与融合的行人重识别方法 | |
Uchiyama et al. | Toward augmenting everything: Detecting and tracking geometrical features on planar objects | |
CN104809731A (zh) | 一种基于梯度二值化的旋转尺度不变场景匹配方法 | |
CN104123554A (zh) | 基于mmtd的sift图像特征提取方法 | |
CN106600613B (zh) | 基于嵌入式gpu的改进lbp红外目标检测方法 | |
Liang et al. | Robust sea-sky-line detection for complex sea background | |
Fang et al. | He-slam: A stereo slam system based on histogram equalization and orb features | |
Hu et al. | Fast face detection based on skin color segmentation using single chrominance Cr | |
CN103336964A (zh) | 一种基于模值差镜像不变性的sift图像匹配方法 | |
Kovacs et al. | Orientation based building outline extraction in aerial images | |
CN112101283A (zh) | 一种交通标志智能识别方法及系统 | |
CN112926500B (zh) | 一种结合头部和整体信息的行人检测方法 | |
Qiu et al. | An optimized license plate recognition system for complex situations | |
CN111178158B (zh) | 一种骑车人检测方法及系统 | |
CN108932726A (zh) | 一种目标跟踪方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |