CN110807473A - 目标检测方法、装置及计算机存储介质 - Google Patents

目标检测方法、装置及计算机存储介质 Download PDF

Info

Publication number
CN110807473A
CN110807473A CN201910969646.3A CN201910969646A CN110807473A CN 110807473 A CN110807473 A CN 110807473A CN 201910969646 A CN201910969646 A CN 201910969646A CN 110807473 A CN110807473 A CN 110807473A
Authority
CN
China
Prior art keywords
similarity
target
template image
candidate region
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910969646.3A
Other languages
English (en)
Other versions
CN110807473B (zh
Inventor
张诚成
马子昂
卢维
林辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN201910969646.3A priority Critical patent/CN110807473B/zh
Publication of CN110807473A publication Critical patent/CN110807473A/zh
Application granted granted Critical
Publication of CN110807473B publication Critical patent/CN110807473B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/431Frequency domain transformation; Autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种目标检测方法、装置及计算机存储介质,该目标检测方法包括获取模板图像;从待检测的当前帧图像中确定目标候选区域;基于感知哈希特征计算目标候选区域与模板图像之间的第一相似度;基于FHOG特征计算目标候选区域与模板图像的第二相似度;基于第一相似度与第二相似度进行共同决策,以从当前帧图像的目标候选区域中确定与模板图像对应的当前目标区域。通过上述方式,本发明可以精确确定当前目标区域。

Description

目标检测方法、装置及计算机存储介质
技术领域
本发明涉及图像目标检测领域,特别是涉及一种目标检测方法、装置及计算机存储介质。
背景技术
无人机(Unmanned Aerial Vehicle,UAV)自主飞行控制技术是当今无人机领域的研究热点。降落技术是无人机飞行控制技术的重要组成。视觉定位可以很好的将无人机返回的图像序列进行分析,计算出地面目标在每一帧图像上的二维坐标位置,再将图像坐标系转换为世界坐标系,即可得到地面目标的实际位置。
现有技术中一般通过感知哈希算法来比对地面目标与模板图像来确定地面目标是否为无人机所需进行降落的位置。但是由于感知哈希算法不具有几何旋转不变性。考虑无人机应用场景,地面目标可能处于任意旋转方向,因此传统的哈希算法无法满足要求。其次,哈希算法无法适用地面目标局部光照变化较大的情况,此时地面目标与模板图像差异很大,造成误检测。
发明内容
本发明提供一种目标检测方法、装置及计算机存储介质,以解决现有技术中无法精准确定地面目标的问题。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种目标检测方法,所述方法包括:获取模板图像;从待检测的当前帧图像中确定目标候选区域;基于感知哈希特征计算所述目标候选区域与所述模板图像之间的第一相似度;基于FHOG特征计算所述目标候选区域与所述模板图像的第二相似度;基于所述第一相似度与所述第二相似度进行共同决策,以从所述当前帧图像的所述目标候选区域中确定与所述模板图像对应的当前目标区域。
为解决上述技术问题,本发明采用的另一个技术方案是:提供一种目标检测装置,所述装置包括:获取模块,用于获取模板图像;确定模块,用于从待检测的当前帧图像中确定目标候选区域;计算模块,用于基于感知哈希特征计算所述目标候选区域与所述模板图像之间的第一相似度,并基于FHOG特征计算所述目标候选区域与所述模板图像的第二相似度;决策模块,基于所述第一相似度与所述第二相似度进行共同决策,以从所述当前帧图像的所述目标候选区域中确定与所述模板图像对应的当前目标区域。
为解决上述技术问题,本发明采用的另一个技术方案是:提供一种目标检测装置,所述装置包括处理器和存储器,存储器中存储有计算机程序,处理器用于执行计算机程序以实现上述目标检测方法的步骤。
为解决上述技术问题,本发明采用的另一个技术方案是:提供一种计算机存储介质,其中存储有计算机程序,计算机程序被执行时实现上述目标检测方法的步骤。
区别于现有技术,本发明通过从当前帧图像中确定目标候选区域,通过感知哈希特征与FHOG特征的共同决策来从目标候选区域中确定当前目标区域,一方面,基于感知哈系特征的比对具有速度快以及对图像亮度、对比度、颜色、尺寸鲁棒性较好的特点,另一方面,基于FHOG特征的比对能够减少光照变化和阴影对图像的影响。因此本发明能够在不同的采集角度与采集环境下所获取的目标候选区域中快速确定当前目标区域,从而可以在不同环境下精准确定地面目标。
附图说明
为更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的目标检测方法第一实施例的流程示意图;
图2是图1步骤S12的子步骤一实施例的流程示意图;
图3是图1步骤S13的子步骤一实施例的流程示意图;
图4是图1步骤S14的子步骤一实施例的流程示意图;
图5是图1步骤S15的子步骤一实施例的流程示意图;
图6是本发明提供的目标检测方法第二实施例的流程示意图;
图7是本发明提供的目标检测装置一实施例的结构示意图
图8是本发明提供的目标检测装置另一实施例的结构示意图;
图9是本发明计算机存储介质一实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
具体请参阅图1,图1是本发明目标检测方法第一实施例的流程示意图,本实施例目标检测方法包括以下步骤。
S11,获取模板图像。
获取模板图像,具体地,模板图像为所需查找的地面目标的标准图像,该模板图像可以是预先提供的,也可以是在检测过程中更新生成的。
具体的,获取模板图像包括计算模板图像在多个旋转角度下的感知哈希特征。具体地,获取感知哈希特征在下述实施例中会具体进行说明,这里不再赘述。
在具体实施例中,计算模板图像的多个旋转角度的感知哈希特征包括模板图像的多个旋转角度的多个感知哈希特征。
如模板图像在0度,90度,180度以及270度旋转角度下的多个感知哈希特征。也可以是0度,50度,80度,150度等等旋转角度下个的多个感知哈希特征,即多个旋转角度可以是有相同的角度间隔也可以有不同的角度间隔,这里不做限定。
具体地,获取模板图像还包括计算所述模板图像的FHOG特征,具体地,获取FHOG特征在下述实施例中也会具体有进行说明,这里不再赘述。
S12,从待检测的当前帧图像中确定目标候选区域。
从待检测的当前帧图像确定目标候选区域,由于所获取到当前帧图像的尺寸或者区域较大,因此需要从当前帧图像中确定目标候选区域。
请参阅图2,图2是本发明目标检测方法中第一实施例中步骤S12的子步骤;其具体步骤如下:
S121,对当前帧图像进行区域搜索,以获得搜索区域。
基于当前帧图像的先前帧图像的中的先前目标区域为基准,并在先前目标区域的基础对当前帧图像进行区域搜索,从而确定搜索区域。
在获取到搜索区域后,具体可以对搜索区域进行灰度化、自适应阈值、边缘加深等处理操作,从而去除当搜索区域的噪声数据,提高数据的精确性。
S122,对搜索区域进行轮廓提取。
对搜索区域进行轮廓提取,以获取到搜索区域的轮廓,具体该轮廓可以如矩形轮廓、梯形轮廓或者其他不规则的四边形轮廓。也可以是例如三角形或者五边形等等其他多边形的轮廓,进一步可以是圆形或者椭圆形等轮廓,这里均不作限定。
S123,确定轮廓与模板图像对应的搜索区域作为目标候选区域。
提取到搜索区域的轮廓后,判断搜索区域的轮廓是否与模板图像的轮廓对应。
具体而言,以模块图像的轮廓为矩形为例。确定轮廓为矩形的搜索区域作为目标候选区域。
由于考虑受到采集角度以及光照的影响,所采集的当前帧图像具有一定的畸变,同时搜索区域的轮廓可能会发生改变,因此以模块图像的轮廓为矩形为例,如果搜索区域的轮廓为四边形,也可以确定该搜索区域为目标候选区域。
相似的,以模块图像的轮廓为圆形为例,如果搜索区域的轮廓为椭圆形或者其他不规则环形,也可以确定该搜索区域为目标候选区域。
上述实施例中,通过当前帧图像进行区域搜索,从而确定搜索区域,并提取搜索区域的轮廓确定是否与模板图像对应,从而从搜索区域中确定候选区域。
S13,基于感知哈希特征计算目标候选区域与模板图像之间的第一相似度。
基于感知哈希特征计算目标候选区域与模板图像之间的第一相似度。
具体地,以模板图像为例,感知哈希特征可以通过对模板图像进预处理,首先将模板图像缩小到预设的像素尺寸,如到8*8的像素图像,在其他实施例中,也可以是其他的像素数量的像素图像,这里不做限定。并灰度化得到灰度图像。随后计算灰度图像的离散余弦(Discrete Cosine Transform,DCT)变换得到灰度图像中每个像素点DCT值,并计算所有像素点的DCT平均值。随后根据灰度图像的DCT矩阵设置0或1的64位哈希值,将每个像素点DCT值与DCT平均值进行比较,如果DCT值大于或等于DCT平均值,则将该像素点记为1,如果DCT值小于DCT平均值,则将该像素点记为0,由此生成模板图像对应的哈希字符串,将该哈希字符串作为模板图像的感知哈希特征。通过上述方式,从而可以得到模板图像的感知哈希特征。
相似的,通过对目标候选区域进行相同的处理从而可以得到目标候选区域的感知哈希特征。
在具体实施例中,第一相似度由模板图像的感知哈希特征和目标候选区域的感知哈希特征之间的汉明距离表示。
请参阅图3,图3是本发明目标检测方法中第一实施例中步骤S13的子步骤;其具体步骤如下:
S131,计算目标候选区域的感知哈希特征。
计算目标候选区域的感知哈希特征,其计算方法与对模板图像的计算方法相同,这里不再赘述。
S132,计算目标候选区域的感知哈希特征与模板图像在多个旋转角度下的感知哈希特征之间的汉明距离。
具体地,汉明距离指是两个字符串对应位置的不同字符的个数。换而言之,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。
如1011101与1001001之间的汉明距离是2。
具体地,可以通过异或运算计算出目标候选区域与模板图像的汉明距离。由于采取的异或运算,汉明距离越小,则代表目标候选区域与模板图像的相似度越高。
由于模板图像具有多个旋转角度下的哈希特征。因此需要计算目标候选区域与多个旋转角度的模板图像的汉明距离,从而得到多个汉明距离。
S133,选择汉明距离中的最小值作为第一相似度。
具体地,在获取到多个汉明距离后,选取汉明距离中的最小值作为第一相似度。
上述实施例中,考虑到由于无人机的特性,因此所获取到的当前帧图像可能是在不同角度下采集得到的,对应的候选区域也会发生相应的旋转,因此计算模板图像多个旋转角度的感知哈希特征,并与候选区域一一计算得到汉明距离,取最小值以作为第一相似度。从而减少由于当前帧图像的采集角度所导致的误差。
S14,基于FHOG特征计算目标候选区域与模板图像的第二相似度。
HOG(histogram of gradient)特征着重关注于图像的局部信息,通过计算和统计图像局部区域的梯度方向直方图来构造特征。在一幅图像中,局部目标的表象和形状能够被梯度或边缘的方向密度分布很好地描述。因此采用HOG特征可以更好地解图像的细节。
以模板图像为例,提取HOG特征时,首先将模板图像分成小的联通区域(cell),计算cell内各个像素点的梯度(大小和方向),并对其进行统计获得梯度直方图。然后把这些直方图组合起来构成特征描述器。为提高性能,把局部直方图在图像更大的范围内(block)进行对比度归一化,减少光照变化和阴影的影响。
FHOG是对HOG的进一步改进,FHOG提取无方向HOG和有方向HOG,并对其进行归一化截断和PCA降维,进行提速。
在具体实施例中,对图像进行FHOG是本领域的常用技术,这里以对图像的一个cell的FHOG特征提取过程进行说明,其中cell为图像的像素区域(联通区域),但是不作为本发明中对目标候选区域与模板图像FHOG提取的唯一方式。
下述以模板图像为例:
一、计算模板图像中的一个cell中每个像素点的梯度,包括梯度值和梯度方向,构造9维hog特征向量。使用CX=[-1,0,1],Gy=[-1,0,1]T卷积核进行x方向和y方向的梯度值计算,则每个像素点的梯度Gx,y和梯度方向α(x,y)分别为:
Figure BDA0002231640390000071
Figure BDA0002231640390000072
二、归一化阶段获得36维特征向量。
已知C(i,j)是第(i,j)个cell的九维特征向量,与其相邻的特征向量为:
定义Nβ,γ为:
Nβ,γ-(||c(i,j)||2+||C(i+β,j)||2+||C(i+β,j+γ)||2+||C(i,j+γ)||)1/2
则36维特征向量H(i,j)为:
Figure BDA0002231640390000074
三、PCA降维获得13维特征向量。
四、计算有方向梯度,得到18维特征向量。
具体地,第二相似度由目标候选区域的FHOG特征与模板图像的FHOG特征进行矩阵相乘而获得的响应值表示。
请参阅图4,图4是本发明目标检测方法中第一实施例中步骤S14的子步骤;其具体步骤如下:
S141,筛选出第一相似度大于或等于第一相似度阈值的目标候选区域。
具体地,在上述实施例中已经获取到第一相似度,为减少后续的计算量,可以进一步对目标候选区域进行筛选,以确定第一相似度大于或等于第一相似度阈值的目标候选区域,从而减少目标候选区域的数量,减少后续FHOG特征提取的运算量。
在其他实施例中,也可以不进行筛选,直接对所有的目标候选区域进行FHOG特征提取。
S142,对筛选出的目标候选区域进行仿射变换,以使得仿射变换后的目标候选区域的尺寸与模板图像一致。
对筛选出的目标候选区域进行仿射变换,以使得仿射变换后的目标候选区域的尺寸与模板图像一致。
如模板图像的长宽分别为w和h。
则将筛选出的目标候选区域进行仿射变换,以使得目标候选区域的长宽也为w和h。
S143,提取仿射变换后的目标候选区域的FHOG特征;
提取仿射变换后的候选区域的FHOG特征,在一具体实施例中,长宽为w和h的目标候选区域的FHOG特征的大小为(w/cell)*(h/cell)*31维。FHOG特征的具体提取方法结合上述实施例与本领域公知常识较为容易得到,这里不再赘述。
S144,对模板图像的FHOG特征与目标候选区域的FHOG特征进行矩阵相乘得到响应值。
在获取到模板图像的FHOG特征与目标候选区域的FHOG特征后,对模板图像的FHOG特征与目标候选区域的FHOG特征进行矩阵相乘以得到响应值。
S145,归一化处理响应值,以得到第二相似度。
对响应值进行归一化处理,从而得到目标候选区域与模板图像的第二相似度。
S15,基于第一相似度与第二相似度进行共同决策,以从当前帧图像的目标候选区域中确定与模板图像对应的当前目标区域。
为考虑无人机在获取当前帧图像时,由于光照角度等影响,采用单独的感知哈希特征或者FHOG特征无法准确的确定当前目标区域。因此通过共同决策来增加当前目标区域的准确性。
具体地,基于第一相似度与第二相似度进行共同决策,以从当前帧图像的目标候选区域中确定与模板图像对应的当前目标区域。
请参阅图5,图5是本发明目标检测方法中第一实施例中步骤S15的子步骤;其具体步骤如下:
S151,将第一相似度和第二相似度代入预设的判别函数,以计算出第三相似度,其中第三相似度分别与第一相似度和第二相似度正相关。
在获得第一相似度和第二相似度后,直接将第一相似度与第二相似度代入预设的判别函数,从而计算出第三相似度,具体地,第三相似度分别与第一相似度和第二相似度正相关。即如果第一相似度和/或第二相似度越大,则第三相似度也越大。
S152,将第二相似度大于或等于第二相似度阈值且第三相似度大于或等于的第三相似度阈值的所有目标候选区域中的第三相似度最大的目标候选区域作为当前目标区域。
具体地,将第二相似度大于或等于第二相似度阈值的目标候选区域筛选出来,进一步基于第三相似度对筛选出来的目标候选区域进行进一步筛选,以确定第三相似度大于或等于第三相似度阈值的目标候选区域,并比较筛选出的目标候选区域的第三相似度,将第三相似度最大的目标候选区域作为当前目标区域。
即对所有目标候选区域进行筛选,以确定第二相似度大于或等于第二相似度阈值且第三相似度大于或等于第三相似度阈值的目标候选区域。并对所筛选出的目标候选区域基于第三相似度进一步比较,以确定第三相似度最大的目标候选区域作为当前目标区域。
在其他实施例中,如果第二相似度小于第二相似度阈值或者第三相似度小于第三相似度阈值。则确定目标候选区域均无法作为当前目标区域。
综上所述,上述实施例中通过基于轮廓从当前帧图像中确定目标候选区域,由于采集角度与采集环境(如光照与高度等因素)导致所获取的目标候选区域可能出现畸变等情况,通过感知哈希特征与FHOG特征的共同决策来从目标候选区域中确定当前目标区域,一方面,基于感知哈系特征的比对具有速度快以及对图像亮度、对比度、颜色、尺寸鲁棒性较好的特点,另一方面,基于FHOG特征的比对能够减少光照变化和阴影对图像的影响。因此本发明能够在不同的采集角度与采集环境下所获取的目标候选区域中快速确定当前目标区域。
在具体实施例中,在确定当前目标区域后,进一步将当前目标区域作为模板图像,并重新计算模板图像在多个旋转角度下的感知哈希特征。
上述实施例中,由于当前目标区域会由于环境变化而产生变化,如光照等等外界环境,因此采用固定的模板图像可能会由于环境变化剧烈导致无法作为良好的标准模板。本发明通过将最新获取的当前目标区域作为新的模板图像,从而可以对模板图像依据环境进行实施更新。
请参阅图6,图6是本发明目标检测方法的第二实施例的流程示意图,基于第一实施例中的步骤S15,即无法基于第一相似度与第二相似度进行共同决策的步骤中从当前帧图像的目标候选区域中确定当前目标区域的情况下的方法。
在具体应用场景中,本发明可以具体应用于无人机的精准降落场景。在无人机降落时,实时对地面进行采集获取当前帧图像,并从当前帧图像中获得候选区域图像,进一步从候选区域图像中确定当前目标区域,无人机则可以根据所述确定的当前目标区域进行精准降落。
具体地,无人机在降落过程中需要实时对地面进行图像采集。如果在降落过程中,若在先前帧图像可以确定先前目标区域,但是在当前帧图像无法确定当前目标区域,则表示当前目标区域可能被遮掩。
可以实现对当前目标区域的重检测,其具体步骤如下:
S21,基于先前帧图像中已确定的先前目标区域的位置在当前帧图像中确定扩展候选区域,其中扩展候选区域的尺寸相较于先前目标区域扩大预设倍数。
基于先前帧图像中已经确定的先前目标区域的位置在当前帧图像中确定扩展候选区域,由于先前目标区域可能被遮掩,如果基于轮廓对当前帧图像获取候选目标区域可能无法成功,如先前目标区域的轮廓为四边形,在遮掩后可能变为五边形。因此无法从当前帧图像获取候选目标区域。因此,可以基于先前帧图像中已经确定的先前目标区域的位置在当前帧图像中确定扩展候选区域,且扩展候选区域的尺寸相较于先前目标区域扩大预设倍数,使得扩展候选区域可以包含先前目标区域所在的区域。
具体地,预设倍数为大于1的倍数,如1.5或者2等等。
S22,对先前目标区域的外围进行填充处理,以使得填充后的先前目标区域的尺寸与扩展候选区域一致。
由于扩展候选区域的尺寸相较于先前目标区域扩大预设倍数,因此需要对先前目标区域的外围进行填充处理,以使得填充后的先前目标区域的尺寸与扩展候选区域一致。
具体地,可以通过对先前目标区域的外围进行补0操作。从而使得填充后的先前目标区域的尺寸与扩展候选区域一致。
S23,分别将填充后的先前目标区域和扩展候选区域从笛卡尔坐标系转换成对数极坐标系,并分别进行FHOG特征提取。
分别将填充后的先前目标区域和扩展候选区域从笛卡尔坐标系转换成对数极坐标系,从而将笛卡尔坐标系下的尺度和旋转变换转化为平移变化。并分别进行FHOG特征提取。
S24,分别对先前目标区域和扩展候选区域的FHOG特征进行傅里叶变化后进行相位相关,以分别得到对应的互功率谱。
随后分别对先前目标区域和扩展候选区域的FHOG特征进行傅里叶变化后进行相位相关,以分别得到对应的互功率谱。
S25,分别对先前目标区域和扩展候选区域的互功率谱进行傅里叶反变化,以分别得到对应的脉冲函数;
进一步,分别对先前目标区域和扩展候选区域的互功率谱进行傅里叶反变化,以分别得到对应的脉冲函数。
S26,分别对先前目标区域和扩展候选区域的脉冲函数进行统计,以分别得到对应的平均峰值相关能量指标。
分别对先前目标区域和扩展候选区域的脉冲函数进行统计,以分别得到对应的平均峰值相关能量指标。
S27,若扩展候选区域的平均峰值相关能量指标与先前目标区域的平均峰值相关能量指标的比例大于或等于预设的比例阈值,则将扩展候选区域作为当前目标区域。
如果扩展候选区域的平均峰值相关能量指标与先前目标区域的平均峰值相关能量指标的比例大于或等于预设的比例阈值,将扩展候选区域作为当前目标区域,即可以认为重检测成功。
上述实施例中,通过基于先前目标区域获取扩展候选区域,而非基于轮廓确定扩展候选区域,并直接从扩展候选区域进行特征提取,从而解决由于目标区域的遮掩无法从当前帧图像确定当前目标区域的问题。
如图7所示,本发明还提供一种目标检测装置300,该目标检测装置300包括获取模块31,确定模块32,计算模块33以及决策模块34。
其中,获取模块31用于获取模板图像;确定模块32用于从待检测的当前帧图像中确定目标候选区域;计算模块33用于基于感知哈希特征计算目标候选区域与模板图像之间的第一相似度,并基于FHOG特征计算目标候选区域与模板图像的第二相似度;决策模块34基于第一相似度与第二相似度进行共同决策,以从当前帧图像的目标候选区域中确定与模板图像对应的当前目标区域。
上述目标检测方法一般由目标检测装置实现,因而本发明还提出一种目标检测装置。请参阅图8,图8是本发明目标检测装置100一实施例的结构示意图。本实施例目标检测装置100包括处理器42和存储器41;存储器41中存储有计算机程序,处理器42用于执行计算机程序以实现如上述目标检测方法的步骤。
上述目标检测方法的逻辑过程以计算机程序呈现,在计算机程序方面,若其作为独立的软件产品销售或使用时,其可存储在计算机存储介质中,因而本发明提出一种计算机存储介质。请参阅图9,图9是本发明计算机存储介质200一实施例的结构示意图,本实施例计算机存储介质200中存储有计算机程序51,计算机程序被处理器执行时实现上述配网方法或控制方法。
该计算机存储介质200具体可以为U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory,)、磁碟或者光盘等可以存储计算机程序的介质,或者也可以为存储有该计算机程序的服务器,该服务器可将存储的计算机程序发送给其他设备运行,或者也可以自运行该存储的计算机程序。该计算机存储介质200从物理实体上来看,可以为多个实体的组合,例如多个服务器、服务器加存储器、或存储器加移动硬盘等多种组合方式。
以上所述仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (12)

1.一种目标检测方法,其特征在于,所述方法包括:
获取模板图像;
从待检测的当前帧图像中确定目标候选区域;
基于感知哈希特征计算所述目标候选区域与所述模板图像之间的第一相似度;
基于FHOG特征计算所述目标候选区域与所述模板图像的第二相似度;
基于所述第一相似度与所述第二相似度进行共同决策,以从所述当前帧图像的所述目标候选区域中确定与所述模板图像对应的当前目标区域。
2.根据权利要求1所述的方法,其特征在于,所述从待检测的当前帧图像中确定目标候选区域的步骤包括:
对所述当前帧图像进行区域搜索,以获得搜索区域;
对所述搜索区域进行轮廓提取;
确定所述轮廓与所述模板图像对应的所述搜索区域作为所述目标候选区域。
3.根据权利要求1所述的方法,其特征在于,所述第一相似度由所述模板图像的感知哈希特征和所述目标候选区域的感知哈希特征之间的汉明距离表示。
4.根据权利要求3所述的方法,其特征在于,所述获取模板图像的步骤包括:
计算所述模板图像在多个旋转角度下的感知哈希特征;
所述基于感知哈希特征计算所述目标候选区域与所述模板图像之间的第一相似度的步骤包括:
计算所述目标候选区域的感知哈希特征;
计算所述目标候选区域的感知哈希特征与所述模板图像在所述多个旋转角度下的感知哈希特征之间的汉明距离;
选择所述汉明距离中的最小值作为所述第一相似度。
5.根据权利要求1所述的方法,其特征在于,所述第二相似度由所述目标候选区域的FHOG特征与所述模板图像的FHOG特征进行矩阵相乘而获得的响应值表示。
6.根据权利要求5所述的方法,其特征在于,所述获取模板图像的步骤包括:
计算所述模板图像的FHOG特征;
所述基于FHOG特征计算所述目标候选区域与所述模板图像的第二相似度的步骤包括:
筛选出所述第一相似度大于或等于第一相似度阈值的所述目标候选区域;
对筛选出的所述目标候选区域进行仿射变换,以使得仿射变换后的所述目标候选区域的尺寸与所述模板图像一致;
提取仿射变换后的所述目标候选区域的FHOG特征;
对所述模板图像的FHOG特征与所述目标候选区域的FHOG特征进行矩阵相乘得到响应值;
归一化处理所述响应值,以得到所述第二相似度。
7.根据权利要求1所述的方法,其特征在于,所述基于所述第一相似度与所述第二相似度进行共同决策的步骤包括:
将所述第一相似度和所述第二相似度代入预设的判别函数,以计算出第三相似度,其中所述第三相似度分别与所述第一相似度和所述第二相似度正相关;
将所述第二相似度大于或等于第二相似度阈值且所述第三相似度大于或等于的第三相似度阈值的所有所述目标候选区域中的第三相似度最大的所述目标候选区域作为所述目标区域。
8.根据权利要求7所述的方法,其特征在于,所述目标检测方法还包括:
将所述目标区域作为所述模板图像。
9.根据权利要求1所述的方法,其特征在于,若所述基于所述第一相似度与所述第二相似度进行共同决策的步骤无法从所述当前帧图像的所述目标候选区域中确定出所述当前目标区域,则所述方法进一步包括:
基于先前帧图像中已确定的先前目标区域的位置在所述当前帧图像中确定扩展候选区域,其中所述扩展候选区域的尺寸相较于所述先前目标区域扩大预设倍数;
对所述先前目标区域的外围进行填充处理,以使得填充后的所述先前目标区域的尺寸与所述扩展候选区域一致;
分别将填充后的所述先前目标区域和所述扩展候选区域从笛卡尔坐标系转换成对数极坐标系,并分别进行FHOG特征提取;
分别对所述先前目标区域和扩展候选区域的FHOG特征进行傅里叶变化后进行相位相关,以分别得到对应的互功率谱;
分别对所述先前目标区域和扩展候选区域的互功率谱进行傅里叶反变化,以分别得到对应的脉冲函数;
分别对所述先前目标区域和扩展候选区域的脉冲函数进行统计,以分别得到对应的平均峰值相关能量指标;
若所述扩展候选区域的平均峰值相关能量指标与所述先前目标区域的平均峰值相关能量指标的比例大于或等于预设的比例阈值,则将所述扩展候选区域作为所述当前目标区域。
10.一种目标检测装置,其特征在于,所述装置包括:
获取模块,用于获取模板图像;
确定模块,用于从待检测的当前帧图像中确定目标候选区域;
计算模块,用于基于感知哈希特征计算所述目标候选区域与所述模板图像之间的第一相似度,并基于FHOG特征计算所述目标候选区域与所述模板图像的第二相似度;
决策模块,基于所述第一相似度与所述第二相似度进行共同决策,以从所述当前帧图像的所述目标候选区域中确定与所述模板图像对应的当前目标区域。
11.一种目标检测装置,其特征在于,所述装置包括处理器和存储器;所述存储器中存储有计算机程序,所述处理器用于执行所述计算机程序以实现如权利要求1-9中任一项所述方法的步骤。
12.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序被执行时实现如权利要求1-9中任一项所述方法的步骤。
CN201910969646.3A 2019-10-12 2019-10-12 目标检测方法、装置及计算机存储介质 Active CN110807473B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910969646.3A CN110807473B (zh) 2019-10-12 2019-10-12 目标检测方法、装置及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910969646.3A CN110807473B (zh) 2019-10-12 2019-10-12 目标检测方法、装置及计算机存储介质

Publications (2)

Publication Number Publication Date
CN110807473A true CN110807473A (zh) 2020-02-18
CN110807473B CN110807473B (zh) 2023-01-03

Family

ID=69488381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910969646.3A Active CN110807473B (zh) 2019-10-12 2019-10-12 目标检测方法、装置及计算机存储介质

Country Status (1)

Country Link
CN (1) CN110807473B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111457895A (zh) * 2020-03-31 2020-07-28 彩虹无人机科技有限公司 一种无人机光电载荷的目标尺寸计算与显示方法
CN111737519A (zh) * 2020-06-09 2020-10-02 北京奇艺世纪科技有限公司 识别机器人账号的方法、装置、电子设备及计算机可读存储介质
CN112507921A (zh) * 2020-12-16 2021-03-16 平安银行股份有限公司 基于目标区域的图形搜索方法、系统、电子装置及存储介质
CN113240739A (zh) * 2021-04-29 2021-08-10 三一重机有限公司 一种挖掘机、属具的位姿检测方法、装置及存储介质
CN113361509A (zh) * 2021-08-11 2021-09-07 西安交通大学医学院第一附属医院 用于面神经麻痹检测的图像处理方法
CN113704532A (zh) * 2020-11-25 2021-11-26 天翼智慧家庭科技有限公司 一种提升图片检索召回率的方法和系统
CN114004866A (zh) * 2022-01-04 2022-02-01 天津大学四川创新研究院 一种基于图像相似度差异的蚊虫识别系统与方法
CN114093051A (zh) * 2020-08-05 2022-02-25 中国联合网络通信集团有限公司 通信线路巡检方法、设备与系统、计算机可读存储介质
CN114898382A (zh) * 2021-10-12 2022-08-12 北京九章云极科技有限公司 一种图像处理方法及装置
CN115375929A (zh) * 2022-10-25 2022-11-22 杭州华橙软件技术有限公司 目标模板集合的更新方法、装置及计算机可读存储介质
CN116128804A (zh) * 2022-11-28 2023-05-16 深圳技术大学 多尺度多方向的无人机图像角点检测方法、系统及终端

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844669A (zh) * 2016-03-28 2016-08-10 华中科技大学 一种基于局部哈希特征的视频目标实时跟踪方法
CN107154024A (zh) * 2017-05-19 2017-09-12 南京理工大学 基于深度特征核相关滤波器的尺度自适应目标跟踪方法
CN107516322A (zh) * 2017-08-11 2017-12-26 浙江大学 一种基于对数极空间的图像物体大小和旋转估计计算方法
CN108491498A (zh) * 2018-03-20 2018-09-04 山东神博数字技术有限公司 一种基于多特征检测的卡口图像目标搜索方法
CN109493367A (zh) * 2018-10-29 2019-03-19 浙江大华技术股份有限公司 一种对目标对象进行跟踪的方法和设备
CN110008844A (zh) * 2019-03-12 2019-07-12 华南理工大学 一种融合slic算法的kcf长期手势跟踪方法
CN110287890A (zh) * 2019-06-26 2019-09-27 银河水滴科技(北京)有限公司 一种基于步态特征和行人重识别特征的识别方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844669A (zh) * 2016-03-28 2016-08-10 华中科技大学 一种基于局部哈希特征的视频目标实时跟踪方法
CN107154024A (zh) * 2017-05-19 2017-09-12 南京理工大学 基于深度特征核相关滤波器的尺度自适应目标跟踪方法
CN107516322A (zh) * 2017-08-11 2017-12-26 浙江大学 一种基于对数极空间的图像物体大小和旋转估计计算方法
CN108491498A (zh) * 2018-03-20 2018-09-04 山东神博数字技术有限公司 一种基于多特征检测的卡口图像目标搜索方法
CN109493367A (zh) * 2018-10-29 2019-03-19 浙江大华技术股份有限公司 一种对目标对象进行跟踪的方法和设备
CN110008844A (zh) * 2019-03-12 2019-07-12 华南理工大学 一种融合slic算法的kcf长期手势跟踪方法
CN110287890A (zh) * 2019-06-26 2019-09-27 银河水滴科技(北京)有限公司 一种基于步态特征和行人重识别特征的识别方法及装置

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111457895A (zh) * 2020-03-31 2020-07-28 彩虹无人机科技有限公司 一种无人机光电载荷的目标尺寸计算与显示方法
CN111457895B (zh) * 2020-03-31 2022-04-22 彩虹无人机科技有限公司 一种无人机光电载荷的目标尺寸计算与显示方法
CN111737519A (zh) * 2020-06-09 2020-10-02 北京奇艺世纪科技有限公司 识别机器人账号的方法、装置、电子设备及计算机可读存储介质
CN111737519B (zh) * 2020-06-09 2023-10-03 北京奇艺世纪科技有限公司 识别机器人账号的方法、装置、电子设备及计算机可读存储介质
CN114093051B (zh) * 2020-08-05 2023-10-31 中国联合网络通信集团有限公司 通信线路巡检方法、设备与系统、计算机可读存储介质
CN114093051A (zh) * 2020-08-05 2022-02-25 中国联合网络通信集团有限公司 通信线路巡检方法、设备与系统、计算机可读存储介质
CN113704532B (zh) * 2020-11-25 2024-04-26 天翼数字生活科技有限公司 一种提升图片检索召回率的方法和系统
CN113704532A (zh) * 2020-11-25 2021-11-26 天翼智慧家庭科技有限公司 一种提升图片检索召回率的方法和系统
CN112507921A (zh) * 2020-12-16 2021-03-16 平安银行股份有限公司 基于目标区域的图形搜索方法、系统、电子装置及存储介质
CN112507921B (zh) * 2020-12-16 2024-03-19 平安银行股份有限公司 基于目标区域的图形搜索方法、系统、电子装置及存储介质
CN113240739B (zh) * 2021-04-29 2023-08-11 三一重机有限公司 一种挖掘机、属具的位姿检测方法、装置及存储介质
CN113240739A (zh) * 2021-04-29 2021-08-10 三一重机有限公司 一种挖掘机、属具的位姿检测方法、装置及存储介质
CN113361509A (zh) * 2021-08-11 2021-09-07 西安交通大学医学院第一附属医院 用于面神经麻痹检测的图像处理方法
CN114898382B (zh) * 2021-10-12 2023-02-21 北京九章云极科技有限公司 一种图像处理方法及装置
CN114898382A (zh) * 2021-10-12 2022-08-12 北京九章云极科技有限公司 一种图像处理方法及装置
CN114004866B (zh) * 2022-01-04 2022-03-22 天津大学四川创新研究院 一种基于图像相似度差异的蚊虫识别系统与方法
CN114004866A (zh) * 2022-01-04 2022-02-01 天津大学四川创新研究院 一种基于图像相似度差异的蚊虫识别系统与方法
CN115375929A (zh) * 2022-10-25 2022-11-22 杭州华橙软件技术有限公司 目标模板集合的更新方法、装置及计算机可读存储介质
CN115375929B (zh) * 2022-10-25 2023-02-07 杭州华橙软件技术有限公司 目标模板集合的更新方法、装置及计算机可读存储介质
CN116128804A (zh) * 2022-11-28 2023-05-16 深圳技术大学 多尺度多方向的无人机图像角点检测方法、系统及终端
CN116128804B (zh) * 2022-11-28 2024-02-27 深圳技术大学 多尺度多方向的无人机图像角点检测方法、系统及终端

Also Published As

Publication number Publication date
CN110807473B (zh) 2023-01-03

Similar Documents

Publication Publication Date Title
CN110807473B (zh) 目标检测方法、装置及计算机存储介质
Lee et al. Simultaneous traffic sign detection and boundary estimation using convolutional neural network
CN109522908B (zh) 基于区域标签融合的图像显著性检测方法
Xie et al. Multilevel cloud detection in remote sensing images based on deep learning
Alsmadi et al. Fish recognition based on robust features extraction from size and shape measurements using neural network
US8798377B2 (en) Efficient scale-space extraction and description of interest points
WO2019071976A1 (zh) 基于区域增长和眼动模型的全景图像显著性检测方法
Wang et al. Recognition and localization of occluded apples using K-means clustering algorithm and convex hull theory: a comparison
Yang et al. Robust semantic template matching using a superpixel region binary descriptor
Patterson et al. Object detection from large-scale 3d datasets using bottom-up and top-down descriptors
CN107862680A (zh) 一种基于相关滤波器的目标跟踪优化方法
Yan et al. Salient object detection in hyperspectral imagery using spectral gradient contrast
Bai et al. Principal pixel analysis and SVM for automatic image segmentation
Okorie et al. Region-based image registration for remote sensing imagery
CN111709317A (zh) 一种基于显著性模型下多尺度特征的行人重识别方法
JP5290915B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN113379789B (zh) 一种复杂环境下运动目标跟踪方法
Chen et al. Image segmentation based on mathematical morphological operator
Fowlkes et al. How much does globalization help segmentation?
CN116415210A (zh) 图像侵权检测方法、装置及存储介质
Liang et al. Sketch-based retrieval using content-aware hashing
Wu et al. An accurate feature point matching algorithm for automatic remote sensing image registration
Ren et al. SAR image matching method based on improved SIFT for navigation system
Davarzani et al. Robust image description with weighted and adaptive local binary pattern features
CN110796684B (zh) 目标跟踪方法以及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant