CN103399893B - 一种基于分层感知的目标检索方法 - Google Patents

一种基于分层感知的目标检索方法 Download PDF

Info

Publication number
CN103399893B
CN103399893B CN201310311320.4A CN201310311320A CN103399893B CN 103399893 B CN103399893 B CN 103399893B CN 201310311320 A CN201310311320 A CN 201310311320A CN 103399893 B CN103399893 B CN 103399893B
Authority
CN
China
Prior art keywords
particle
retrieved
target
video
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310311320.4A
Other languages
English (en)
Other versions
CN103399893A (zh
Inventor
陈宗海
项俊平
赵宇宙
郭明玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN201310311320.4A priority Critical patent/CN103399893B/zh
Publication of CN103399893A publication Critical patent/CN103399893A/zh
Application granted granted Critical
Publication of CN103399893B publication Critical patent/CN103399893B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种基于分层感知的目标检索方法,首先,在待检索视频的单帧图像中匹配被检索目标:通过布设“搜索粒子群”,寻找与待检索目标相似度度量高于一定值的粒子,这些粒子所在区域就是目标的大致位置,实现了低分辨率的目标感知;通过布设“聚焦粒子群”,进行多尺度、多邻域的粒子相似度匹配,得到目标的精确匹配位置。然后,综合被检索视频中多帧图像的匹配结果,确定待检索目标是否出现在被检索视频中。本发明可实现在视频片段或单帧图像中定位被检索目标,可以有效消除因视角、形变、尺度、色彩分布等造成的目标定位不准,可以在不进行视频目标前景/背景检测的前提下,从视频的第一帧开始进行目标检索和定位。

Description

一种基于分层感知的目标检索方法
技术领域
本发明涉及图像模式识别领域,尤其涉及一种基于分层感知的目标检索方法。
背景技术
基于内容的目标检索技术是指通过计算机对图像(或视频)的内容进行分析,自动地提取出图像(或视频)中包括颜色、纹理、空间等各种特征信息,经过相似性判别和推理,最后检索出与其相类似的目标。随着图像和视频信息量的不断增加,这种基于内容的目标检索技术的研究具有重大的理论价值和广阔的应用前景,其关键技术在于对目标特征信息的提取和匹配。
目标的特征匹配就是目标间的特征值进行相似性度量,目前特征匹配大致分为两种:完全匹配和相似性匹配。所谓完全匹配是指目标特征值的精确匹配,两者完全相同;相似性匹配是指当目标特征值满足某些条件时,就认为两个目标相同。因为技术手段的差异性,相似目标间的特征值不可能是完全一样的,因此,相似性匹配是目前目标检索的主要方法之一,如何在匹配过程中消除不同目标的视角、形变、尺度、色彩分布等方面的差异性是需要重点考虑的问题,也是各种目标检索方法效果存在差别的主因之一。
一个好的目标检索方法应该符合人类视觉系统的感知和判断。人类视觉系统是分层次感知目标的,首先是低分辨率的目标搜索,其次是高分辨率的目标定位,实现对目标的深层次理解和感知。
发明内容
本发明技术解决问题:克服现有技术的不足,提供一种基于分层感知的目标检索方法,通过模拟人类视觉系统感知和推理机制,达到提高目标定位和检索精度的目的。
本发明技术解决方案:一种基于分层感知的目标检索方法,本发明所述的目标检索是指给定待检索目标图像后,在被检索视频中寻找待检索目标,计算出目标在视频图像中的精确位置。为实现上述目的,本发明采用分层感知策略,将目标搜索过程当作灰色系统的白化过程,并给出匹配度的可视化定性描述。实现步骤如下:
步骤(1)将待检索目标归一化后用直方图分布进行描述;
步骤(2)构造被检索视频单帧图像的空间闭包椭圆镞区域,定义为搜索粒子群,用直方图分布描述粒子,寻找与待检索目标相似度度量高于一定值的粒子,这些粒子所在区域就是目标可能处于的大致位置,实现了低分辨率的目标感知;
步骤(3)通过在上述目标的大致位置附件随机生成2W个多尺度、多邻域椭圆镞区域,定义为聚焦粒子群,用直方图分布描述粒子,进行多尺度、多邻域的粒子相似度匹配,得到目标在被检索视频的单帧图像中的精确匹配位置,实现高分辨率的目标定位;
步骤(4)综合被检索视频中多帧图像的匹配结果,确定待检索目标是否出现在被检索视频中,并给出匹配度的可视化灰色定性描述图。
所述步骤(1)的具体实现为:
步骤(1.1)将待检测目标按比例缩小到宽80像素、高152像素,并将其看做粒子s'=(x',y',Hx',Hy')=(40,76,40,76),所述粒子定义如下:粒子s=(x,y,Hx,Hy)是目标可能覆盖范围的一个椭圆描述子,其中(x,y)是椭圆Os的中心坐标,(Hx,Hy)分别是椭圆的长轴半长和短轴半长。
步骤(1.2)将粒子s'用直方图刻画,所述粒子直方图分布定义如下:本发明中采用HSV空间中的大小为8×8×4的直方图来描述粒子s所在椭圆区域Os的图像特征,直方图由函数h(xi)=j,xi∈Os,j∈{1,2,...,256}确定,Os中像素的色彩分布py={py (v)}v=1,...,m由下式确定:
p y ( v ) = f &Sigma; i = 1 I k ( | | y - x i | | a ) &delta; &lsqb; h ( x i ) - v &rsqb; , k ( r ) = 1 - r 2 r < 1 0 o t h e r - - - ( 1 )
其中,I是Os中像素的个数,δ是Kronecker delta函数,参数归一化因子以确保m=8×8×4=256。
所述步骤(2)具体实现步骤如下:
步骤(2.1)布设搜索粒子群,所述搜索粒子群布设如下:在第i帧图像Pi中均匀选择N1个点作为“基本粒子群”Si 1={sij 1,j=1,...,N1}的中心,粒子长轴半长Hx均相等、短轴半长Hy均相等,Hx和Hy取满足如下两个条件的最小值:(a)粒子所在椭圆镞为Pi的闭包,即满足(b)粒子两两重合度不小于10%,即再在Pi中设置粒子群Si 1的翻转粒子群Si 2={sij 2,j=1,...,N1},使得sij 2与sij 1中心重合,sij 2的长轴半长Hx'等于sij 1的短轴半长Hy、sij 2的短轴半长Hy'等于sij 1的长轴半长Hx,Si 1∪Si 2组成了搜索粒子群;
步骤(2.2)在搜索粒子群中,通过计算两个粒子分布之间的相似性度量,寻找与待检索目标相似度度量高于某个设定值的粒子,两个粒子分布p={p(v)}v=1,...,m和q={q(v)}v=1,...,m之间的相似性度量为如下的Bhattacharyya系数:
&rho; &lsqb; p , q &rsqb; = &Sigma; v = 1 m p ( v ) q ( v ) - - - ( 2 )
步骤(2.3)记录下相似度高于设定值的粒子信息,这些粒子所在区域就是目标可能处于的大致位置,这些区域的并集就是步骤(4)需考虑的搜索范围,其它区域不再进行搜索。
所述步骤(3)通过在上述目标的大致位置布设“聚焦粒子群”,进行多尺度、多邻域的粒子相似度匹配,实现高分辨率的目标定位,得到目标在待检索视频的单帧图像中的精确匹配位置。具体实现步骤如下:
步骤(3.1)“聚焦粒子群”中的粒子是满足步骤(3)条件的搜索粒子的多尺度、多邻域拓展,确定聚焦粒子群如下:对搜索粒子群中的粒子j(记为sj=(xj,yj,Hx,j,Hy,j)),按如下步骤生成聚焦粒子群Si,j 3∪Si,j 4
步骤(3.1.1)随机生成W个不重复的取值于[0.8,1]的随机数{αk}k=1,...,W和W个不重复的取值于[0.1,0.3]的随机数{βk}k=1,...,W,则其中:
sj,k 1={xj×(1-βk),yj×(1-βk),Hx,j×αk,Hy,j×αk},
sj,k 2={xj×(1-βk),yj×(1+βk),Hx,j×αk,Hy,j×αk},
sj,k 3={xj×(1+βk),yj×(1-βk),Hx,j×αk,Hy,j×αk},
sj,k 4={xj×(1+βk),yj×(1+βk),Hx,j×αk,Hy,j×αk},
sj,k 5={xj,yj,Hx,j×αk,Hy,j×αk};
步骤(3.1.2)随机生成W个不重复的取值于[1,1.2]的随机数{αk}k=1,...,W和W个不重复的取值于[0.1,0.3]的随机数{βk}k=1,...,W,则其中:
sj,k 1={xj×(1-βk),yj×(1-βk),Hx,j×αk,Hy,j×αk},
sj,k 2={xj×(1-βk),yj×(1+βk),Hx,j×αk,Hy,j×αk},
sj,k 3={xj×(1+βk),yj×(1-βk),Hx,j×αk,Hy,j×αk},
sj,k 4={xj×(1+βk),yj×(1+βk),Hx,j×αk,Hy,j×αk},
sj,k 5={xj,yj,Hx,j×αk,Hy,j×αk}。
步骤(3.2)计算聚焦粒子群中的粒子与带检索目标粒子相似度度量,根据度量值进行定性映射,映射值满足一定条件的所有聚焦粒子所在位置的均值,就是在待检索视频的单帧图像中的精确匹配位置,自此实现了单帧图像中的目标定位。粒子的相似性度量是粒子椭圆区域图像的匹配度,人类对匹配度的感知是定性的,定性映射定义如下:
所述步骤(4)综合被检索视频中多帧图像的匹配结果,确定待检索目标是否出现在被检索视频中,并给出匹配度的可视化定性描述图具体实现步骤如下:
步骤(4.1)在被检索视频Dest的M帧图像中,将匹配的帧序号依次排列。若存在连续T0帧均匹配的情形,则判定待检索目标出现在被检索视频中,出现时刻由连续匹配帧序列的首末帧序号标记;否则判定待检索目标未出现在被检索视频中。
步骤(4.2)给出匹配度的可视化定性描述图,用于直观显示目标在被检索图像G中的局部相似度,所述匹配度的可视化定性描述图是指由下式定义的灰度图:
{(x,y,f(x,y))|x∈[0,width],y∈[0,height]} (4)
其中,f(x,y)为定性白化权函数,width、height分别为图像的宽和高。这里将待检索目标在被检索图像G中的位置信息表示成如下区间灰数四元组:
&CircleTimes; G = ( &CircleTimes; x , &CircleTimes; y , &CircleTimes; H x , &CircleTimes; H y ) = ( &lsqb; 0 , w i d t h &rsqb; , &lsqb; 0 , h e i g h t &rsqb; , &lsqb; 0 , w i d t h / 2 &rsqb; , &lsqb; 0 , h e i g h t / 2 &rsqb; ) - - - ( 5 )
其中依次对应匹配对象在G中的中心横坐标x、中心纵坐标y、长轴半长Hx和短轴半长Hy的灰数。假设服从各变量独立的多元高斯分布,G中布设的粒子群为{(xi,yi,Hx,i,Hy,i),i=1,...,N},粒子群与待检索目标的相似性度量值为{ρi,i=1,...,N},则定义的白化权函数如下:
f ( x , y ) = Q ( max i = 1 , ... , N ( 1 2 &pi; &sigma; i , x exp ( - ( x - x i 2 &sigma; i , x ) 2 ) &times; 1 2 &pi; &sigma; i , y exp ( - ( y - y i 2 &sigma; i , y ) 2 ) ) ) - - - ( 6 )
1 2 &pi; &sigma; i , x = &rho; i , 1 2 &pi; &sigma; i , y = &rho; i - - - ( 7 )
由定义可知,该白化权函数取值于定性集合。
本发明与现有技术相比优点在于:
(1)本发明可实现在视频片段或单帧图像中定位被检索目标,从而实现视频库或图像库中的目标检索;
(2)本发明模拟人类视觉的分层感知模型,模拟人类对灰色系统的定性描述思维,是一种对拟人模型应用的探索;
(3)本发明可以有效消除因视角、形变、尺度、色彩分布等造成的目标定位不准;
(4)本发明可以在不进行视频目标前景/背景检测的前提下,从视频的第一帧开始进行目标检索和定位。
附图说明
图1为本发明的整体思路流程框图;
图2为本发明中目标匹配流程图;
图3为目标匹配效果示意图,其中(a)为带检索目标图像,(b)为被检索视频中某一帧的匹配目标图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。附图1是本发明整体思路的流程框图,附图2是本发明所提出的目标匹配的流程图。所述一种基于分层感知和灰色定性推理的目标检索方法包括以下步骤:
步骤S101:将待检索目标用直方图分布进行描述,计算待检测目标的直方图分布。对由人工选定或目标检测算法获取的待检测目标Target,依据(1)式计算其HSV色彩直方图分布q={q(v)}v=1,...,m
步骤S102:布设“搜索粒子群”,计算被检索视频中单帧图像“搜索粒子群”的直方图分布。设被检索视频Dest共有M帧图像,在每帧图像Pi(i=1,...,M)中,按如下所述方法生成“搜索粒子群”Si 1∪Si 2:在待检测目标Target的第i帧图像Pi中均匀选择N1个点作为“基本粒子群”Si 1={sij 1,j=1,...,N1}的中心,粒子长轴半长Hx均相等、短轴半长Hy均相等,Hx和Hy取满足如下两个条件的最小值:(1)粒子所在椭圆镞为Pi的闭包,即满足粒子两两重合度不小于10%,即 再在Pi中设置粒子群Si 1的翻转粒子群Si 2={sij 2,j=1,...,N1},使得sij 2与sij 1中心重合,sij 2的长轴半长Hx'等于sij 1的短轴半长Hy、sij 2的短轴半长Hy'等于sij 1的长轴半长Hx,Si 1∪Si 2组成了搜索粒子群。对Si 1∪Si 2中的每个粒子,依据(1)式计算其HSV色彩直方图分布pi,j={pi,j (v)}v=1,...,m,i=1,...,M,j=1,...,2×N1
步骤S103:筛选“搜索粒子群”,得到目标的大致位置。依据(2)式计算Target与Si 1∪Si 2中的每个粒子的直方图分布相似性度量值,并计算度量值{ρ[pi,j,q],j=1,...,2×N1}的均值μi,1和方差σi,1,将所有满足ρ[pi,j,q]>ρi,1i,1的j组成的集合按相似度从大到小排序后记为Bi,1
步骤S104:布设“聚焦粒子群”,计算被检索视频中单帧图像“聚焦粒子群”的直方图分布。对Bi,1中的粒子j(记为sj=(xj,yj,Hx,j,Hy,j)),按如下所述方法生成“聚焦粒子群”Si,j 3∪Si,j 4
(1)随机生成W个不重复的取值于[0.8,1]的随机数{αk}k=1,...,W和W个不重复的取值于[0.1,0.3]的随机数{βk}k=1,...,W,则其中:
sj,k 1={xj×(1-βk),yj×(1-βk),Hx,j×αk,Hy,j×αk},
sj,k 2={xj×(1-βk),yj×(1+βk),Hx,j×αk,Hy,j×αk},
sj,k 3={xj×(1+βk),yj×(1-βk),Hx,j×αk,Hy,j×αk},
sj,k 4={xj×(1+βk),yj×(1+βk),Hx,j×αk,Hy,j×αk},
sj,k 5={xj,yj,Hx,j×αk,Hy,j×αk};
(2)随机生成W个不重复的取值于[1,1.2]的随机数{αk}k=1,...,W和W个不重复的取值于[0.1,0.3]的随机数{βk}k=1,...,W,则其中:
sj,k 1={xj×(1-βk),yj×(1-βk),Hx,j×αk,Hy,j×αk},
sj,k 2={xj×(1-βk),yj×(1+βk),Hx,j×αk,Hy,j×αk},
sj,k 3={xj×(1+βk),yj×(1-βk),Hx,j×αk,Hy,j×αk},
sj,k 4={xj×(1+βk),yj×(1+βk),Hx,j×αk,Hy,j×αk},
sj,k 5={xj,yj,Hx,j×αk,Hy,j×αk}。
对Si,j 3∪Si,j 4中的每个粒子,依据(1)式计算其HSV色彩直方图分布pi,j,k={pi,j,k (v)}v=1,...,m,i=1,...,M,k=1,...,10×W;
步骤S105:筛选“聚焦粒子群”,进行推理。对Bi,1中的粒子j,依据(2)式计算Target与Si,j 3∪Si,j 4中的每个粒子的直方图分布相似性度量值,得到度量值集合Di,j={ρ[p(s),q]|s∈Si,j 3∪Si,j 4},根据(3)式计算Di,j取值,按下列推理规则决策匹配情况:"如果存在ρ∈Di,j使得Q(ρ)=0,则匹配,且s0=mean{s|s∈Si,j 3∪Si,j 4,Q(ρ[p(s),q])=0},,转步骤S107;否则,若对所有j均未找到匹配位置,转步骤S106";其中,s0=(x0,y0,Hx,0,Hy,0)为匹配的目标位置,mean表示取均值,由下式确定:mean{s|s∈Si,j 3∪Si,j 4}={(mean(x),mean(y),mean(Hx),mean(Hy))|(x,y,Hx,Hy)∈Si,j 3∪Si,j 4};
步骤S106:判定当前帧图像中没有与待检测目标相匹配的图像区域,转步骤S108;
步骤S107:判定当前帧图像中存在与待检测目标相匹配的图像区域,该区域由s0=(x0,y0,Hx,0,Hy,0)标示,实现高分辨率的单帧图像目标定位,转步骤S108;
步骤S108:综合被检索视频中多帧图像的匹配结果,确定待检索目标是否出现在被检索视频中,并给出匹配度的可视化定性描述图。在被检索视频Dest的M帧图像中,将匹配的帧序号依次排列。若存在连续T0帧均匹配的情形,则判定待检索目标出现在被检索视频中,出现时刻由连续匹配帧序列的首末帧序号标记;否则判定待检索目标未出现在被检索视频中。对每一帧图像,由(4)式可以作出匹配度的定性描述图,用于可视化直观显示目标在被检索图像中的局部相似度,用于计算定性描述图的粒子群由步骤S102~步骤S107中所有使用过的粒子组成。
在本实施例中,取W=3。
如图3所示,(a)中椭圆所标区域为待检索目标,(b)中椭圆所标区域为由本实施例方法计算得到的“某一帧被检索图像”中的匹配目标,在目标被部分遮挡的情况下实现了目标的精确匹配。
本发明未详细阐述部分属于本领域技术人员的公知技术。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (4)

1.一种基于分层感知的目标检索方法,其特征在于实现步骤如下:
步骤(1)将待检索目标归一化后用直方图分布进行描述;
步骤(2)构造被检索视频单帧图像的空间闭包椭圆镞区域,定义为搜索粒子群,用直方图分布描述粒子,寻找与待检索目标相似度度量高于一定值的粒子,这些粒子所在区域就是目标可能处于的大致位置,实现了低分辨率的目标感知;
步骤(3)通过在上述目标的大致位置附近随机生成2W个多尺度、多邻域椭圆镞区域,定义为聚焦粒子群,用直方图分布描述粒子,进行多尺度、多邻域的粒子相似度匹配,得到目标在被检索视频的单帧图像中的精确匹配位置,实现高分辨率的目标定位;
步骤(4)综合被检索视频中多帧图像的匹配结果,确定待检索目标是否出现在被检索视频中,并给出匹配度的可视化灰色定性描述图;
所述步骤(2)具体实现步骤如下:
步骤(2.1)布设搜索粒子群,所述搜索粒子群布设如下:在第i帧图像Pi中均匀选择N1个点作为“基本粒子群”Si 1={sij 1,j=1,...,N1}的中心,粒子长轴半长Hx均相等、短轴半长Hy均相等,Hx和Hy取满足如下两个条件的最小值:(a)粒子所在椭圆镞为Pi的闭包,即满足(b)粒子两两重合度不小于10%,即j≠k;再在Pi中设置粒子群Si 1的翻转粒子群Si 2={sij 2,j=1,...,N1},使得sij 2与sij 1中心重合,sij 2的长轴半长Hx'等于sij 1的短轴半长Hy、sij 2的短轴半长Hy'等于sij 1的长轴半长Hx,Si 1∪Si 2组成了搜索粒子群;
步骤(2.2)在搜索粒子群中,通过计算两个粒子分布之间的相似性度量,寻找与待检索目标相似度度量高于某个设定值的粒子,两个粒子分布p={p(v)}v=1,...,m和q={q(v)}v=1,...,m之间的相似性度量为如下的Bhattacharyya系数:
&rho; &lsqb; p , q &rsqb; = &Sigma; v = 1 m p ( v ) q ( v ) - - - ( 2 )
步骤(2.3)记录下相似度高于设定值的粒子信息,这些粒子所在区域就是目标可能处于的大致位置,这些区域的并集就是步骤(3)需考虑的搜索范围,其它区域不再进行搜索。
2.根据权利要求1所述的基于分层感知的目标检索方法,其特征在于:所述步骤(1)的具体实现为:
步骤(1.1)将待检测目标按比例缩小到宽80像素、高152像素,并将其看做粒子所述粒子定义如下:粒子s=(x,y,Hx,Hy)是目标可能覆盖范围的一个椭圆描述子,其中(x,y)是椭圆Os的中心坐标,(Hx,Hy)分别是椭圆的长轴半长和短轴半长;
步骤(1.2)将粒子so用直方图刻画,所述粒子直方图分布定义如下:采用HSV空间中的大小为8×8×4的直方图来描述粒子s所在椭圆区域Os的图像特征,直方图由函数h(xi)=j,xi∈Os,j∈{1,2,...,256}确定,Os中像素的色彩分布py={py (v)}v=1,...,m由下式确定:
p y ( v ) = f &Sigma; i = 1 I k ( | | y - x i | | a ) &delta; &lsqb; h ( x i ) - v &rsqb; , k ( r ) = 1 - r 2 r < 1 0 o t h e r - - - ( 1 )
其中,I是Os中像素的个数,δ是Kronecker delta函数,参数归一化因子以确保m=8×8×4=256。
3.根据权利要求1所述的基于分层感知的目标检索方法,其特征在于:所述步骤(3)通过在上述目标的大致位置布设聚焦粒子群,进行多尺度、多邻域的粒子相似度匹配,实现高分辨率的目标定位,得到目标在待检索视频的单帧图像中的精确匹配位置,具体实现步骤如下:
步骤(3.1)聚焦粒子群中的粒子是满足步骤(2)条件的搜索粒子的多尺度、多邻域拓展,确定聚焦粒子群如下:对搜索粒子群中的粒子j(记为sj=(xj,yj,Hx,j,Hy,j)),按如下步骤生成聚焦粒子群Si,j 3∪Si,j 4
步骤(3.1.1)随机生成W个不重复的取值于[0.8,1]的随机数{αk}k=1,...,W和W个不重复的取值于[0.1,0.3]的随机数{βk}k=1,...,W,则其中:
sj,k 1={xj×(1-βk),yj×(1-βk),Hx,j×αk,Hy,j×αk},
sj,k 2={xj×(1-βk),yj×(1+βk),Hx,j×αk,Hy,j×αk},
sj,k 3={xj×(1+βk),yj×(1-βk),Hx,j×αk,Hy,j×αk},
sj,k 4={xj×(1+βk),yj×(1+βk),Hx,j×αk,Hy,j×αk},
sj,k 5={xj,yj,Hx,j×αk,Hy,j×αk};
步骤(3.1.2)随机生成W个不重复的取值于[1,1.2]的随机数{αk}k=1,...,W和W个不重复的取值于[0.1,0.3]的随机数{βk}k=1,...,W,则其中:
sj,k 1={xj×(1-βk),yj×(1-βk),Hx,j×αk,Hy,j×αk},
sj,k 2={xj×(1-βk),yj×(1+βk),Hx,j×αk,Hy,j×αk},
sj,k 3={xj×(1+βk),yj×(1-βk),Hx,j×αk,Hy,j×αk},
sj,k 4={xj×(1+βk),yj×(1+βk),Hx,j×αk,Hy,j×αk},
sj,k 5={xj,yj,Hx,j×αk,Hy,j×αk};
步骤(3.2)计算聚焦粒子群中的粒子与带检索目标粒子相似度度量,根据度量值进行定性映射,映射值满足一定条件的所有聚焦粒子所在位置的均值,就是在待检索视频的单帧图像中的精确匹配位置;自此实现了单帧图像中的目标定位,粒子的相似性度量是粒子椭圆区域图像的匹配度,人类对匹配度的感知是定性的,定性映射定义如下:
4.根据权利要求1所述的基于分层感知的目标检索方法,其特征在于:所述步骤(4)综合被检索视频中多帧图像的匹配结果,确定待检索目标是否出现在被检索视频中,并给出匹配度的可视化定性描述图,具体实现步骤如下:
步骤(4.1)在被检索视频Dest的M帧图像中,将匹配的帧序号依次排列,若存在连续T0帧均匹配的情形,则判定待检索目标出现在被检索视频中,出现时刻由连续匹配帧序列的首末帧序号标记;否则判定待检索目标未出现在被检索视频中;
步骤(4.2)给出匹配度的可视化定性描述图,用于直观显示目标在被检索图像G中的局部相似度,所述匹配度的可视化定性描述图是指由下式定义的灰度图:
{(x,y,f(x,y))|x∈[0,width],y∈[0,height]} (4)
其中,f(x,y)为定性白化权函数,width、height分别为图像的宽和高,这里将待检索目标在被检索图像G中的位置信息表示成如下区间灰数四元组:
&CircleTimes; G = ( &CircleTimes; x , &CircleTimes; y , &CircleTimes; H x , &CircleTimes; H y ) = ( &lsqb; 0 , w i d t h &rsqb; , &lsqb; 0 , h e i g h t &rsqb; , &lsqb; 0 , w i d t h / 2 &rsqb; , &lsqb; 0 , h e i g h t / 2 &rsqb; ) - - - ( 5 )
其中依次为匹配对象在G中的中心横坐标x、中心纵坐标y、长轴半长Hx和短轴半长Hy的灰数;假设服从各变量独立的多元高斯分布,G中布设的粒子群为{(xi,yi,Hx,i,Hy,i),i=1,...,N},粒子群与待检索目标的相似性度量值为{ρi,i=1,...,N},则表示的白化权函数如下:
f ( x , y ) = Q ( m a x i = 1 , ... , N ( 1 2 &pi; &sigma; i , x exp ( - ( x - x i 2 &sigma; i , x ) 2 ) &times; 1 2 &pi; &sigma; i , y exp ( - ( y - y i 2 &sigma; i , y ) 2 ) ) ) - - - ( 6 )
1 2 &pi; &sigma; i , x = &rho; i , 1 2 &pi; &sigma; i , y = &rho; i - - - ( 7 )
由上式可知,该白化权函数取值于定性集合。
CN201310311320.4A 2013-07-23 2013-07-23 一种基于分层感知的目标检索方法 Active CN103399893B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310311320.4A CN103399893B (zh) 2013-07-23 2013-07-23 一种基于分层感知的目标检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310311320.4A CN103399893B (zh) 2013-07-23 2013-07-23 一种基于分层感知的目标检索方法

Publications (2)

Publication Number Publication Date
CN103399893A CN103399893A (zh) 2013-11-20
CN103399893B true CN103399893B (zh) 2017-02-08

Family

ID=49563523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310311320.4A Active CN103399893B (zh) 2013-07-23 2013-07-23 一种基于分层感知的目标检索方法

Country Status (1)

Country Link
CN (1) CN103399893B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108629226B (zh) * 2017-03-15 2021-10-22 纵目科技(上海)股份有限公司 一种基于图像分层技术的车辆检测方法及系统
CN113378804A (zh) * 2021-08-12 2021-09-10 中国科学院深圳先进技术研究院 一种自助采样的检测方法、装置、终端设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101789005A (zh) * 2010-01-22 2010-07-28 深圳创维数字技术股份有限公司 一种基于感兴趣区域的图像检索方法
CN102156702A (zh) * 2010-12-17 2011-08-17 南方报业传媒集团 一种由粗到精的视频事件的快速定位方法
CN102509118A (zh) * 2011-09-28 2012-06-20 安科智慧城市技术(中国)有限公司 一种监控视频检索方法
CN102662949A (zh) * 2012-02-27 2012-09-12 安科智慧城市技术(中国)有限公司 一种基于多特征融合的指定目标检索方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6826316B2 (en) * 2001-01-24 2004-11-30 Eastman Kodak Company System and method for determining image similarity
US8295551B2 (en) * 2009-04-08 2012-10-23 Samsung Electronics Co., Ltd. System and method of adaptive vertical search range tracking for motion estimation in digital video
US8290248B2 (en) * 2009-12-31 2012-10-16 Mitsubishi Electric Research Laboratories, Inc. Determining disparity search range in stereo videos

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101789005A (zh) * 2010-01-22 2010-07-28 深圳创维数字技术股份有限公司 一种基于感兴趣区域的图像检索方法
CN102156702A (zh) * 2010-12-17 2011-08-17 南方报业传媒集团 一种由粗到精的视频事件的快速定位方法
CN102509118A (zh) * 2011-09-28 2012-06-20 安科智慧城市技术(中国)有限公司 一种监控视频检索方法
CN102662949A (zh) * 2012-02-27 2012-09-12 安科智慧城市技术(中国)有限公司 一种基于多特征融合的指定目标检索方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于生物视觉的物体识别方法研究现状分析;郭明玮;《Science Research》;20110803;916-923 *

Also Published As

Publication number Publication date
CN103399893A (zh) 2013-11-20

Similar Documents

Publication Publication Date Title
CN109903331B (zh) 一种基于rgb-d相机的卷积神经网络目标检测方法
CN104200521B (zh) 基于模型先验的高分辨率sar图像建筑物目标三维重建方法
CN112084869A (zh) 一种基于紧致四边形表示的建筑物目标检测方法
CN109376637A (zh) 基于视频监控图像处理的人数统计系统
CN111160291B (zh) 基于深度信息与cnn的人眼检测方法
CN104715251B (zh) 一种基于直方图线性拟合的显著目标检测方法
CN111027497B (zh) 基于高分辨率光学遥感影像的弱小目标快速检测方法
CN107464256A (zh) 一种目标检测与可能性判别修正的关联方法
CN108492298A (zh) 基于生成对抗网络的多光谱图像变化检测方法
JP2018072938A (ja) 目的物個数推定装置、目的物個数推定方法及びプログラム
CN104657980A (zh) 一种改进的基于Meanshift的多通道图像分割算法
CN104517095A (zh) 一种基于深度图像的人头分割方法
CN101976436A (zh) 一种基于差分图修正的像素级多聚焦图像融合方法
CN104599288A (zh) 一种基于肤色模板的特征跟踪方法及装置
CN107944354A (zh) 一种基于深度学习的车辆检测方法
CN105046701A (zh) 一种基于构图线的多尺度显著目标检测方法
CN111274964B (zh) 一种基于无人机视觉显著性分析水面污染物的检测方法
Somawirata et al. Road detection based on the color space and cluster connecting
CN106887002A (zh) 一种红外图像序列显著性检测方法
CN112329764A (zh) 一种基于tv-l1模型的红外弱小目标检测方法
Laupheimer et al. The importance of radiometric feature quality for semantic mesh segmentation
CN103399893B (zh) 一种基于分层感知的目标检索方法
CN107341449A (zh) 一种基于云块特征变化的静止气象卫星降水估算方法
CN106127813A (zh) 基于视觉感知能量的监控视频运动片段分割方法
CN110738229B (zh) 一种细粒度图像分类方法、装置及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant