CN115375929A - 目标模板集合的更新方法、装置及计算机可读存储介质 - Google Patents
目标模板集合的更新方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN115375929A CN115375929A CN202211312762.6A CN202211312762A CN115375929A CN 115375929 A CN115375929 A CN 115375929A CN 202211312762 A CN202211312762 A CN 202211312762A CN 115375929 A CN115375929 A CN 115375929A
- Authority
- CN
- China
- Prior art keywords
- target
- template
- candidate
- current frame
- frame image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种目标模板集合的更新方法、装置及计算机可读存储介质,该更新方法包括:在获取到当前帧图像后,基于目标模板集合对当前帧图像进行跟踪处理,得到当前帧图像中目标对象所在的目标区域,其中,目标模板集合包括多个目标模板;对目标区域在当前帧图像中的位置、目标区域的尺寸中的至少一个进行扰动处理,以在当前帧图像中生成多个候选区域;分别提取每个候选区域的图像特征,得到多个候选模板;在多个候选模板中,确定与目标模板集合中的多个目标模板最相似的目标候选模板;根据目标候选模板,对目标模板集合进行更新。本申请所提供的更新方法能够降低跟踪过程中发生漂移的风险。
Description
技术领域
本申请属于目标跟踪技术领域,特别是涉及一种目标模板集合的更新方法、装置及计算机可读存储介质。
背景技术
视觉目标跟踪作为计算机视觉领域的重要分支,是为了模拟人眼在目标运动估计以及跟踪方面的能力,广泛应用于智能监控、辅助驾驶、人机交互等领域。
在目前的视觉目标跟踪算法中,通常根据最新获取的目标区域确定目标模板,然后在接下来的图像中选取与目标模板最相似的区域作为跟踪的目标区域,接着再根据这个最新的目标区域确定目标模板,对下一帧图像进行跟踪处理,以此类推。但是由于获得的目标区域与实际目标对象所在的区域存在偏差,因此目前的这种算法会导致误差累积,进而引起漂移问题。
发明内容
本申请提供一种目标模板集合的更新方法、装置及计算机可读存储介质,能够降低跟踪过程中发生漂移的风险。
本申请实施例第一方面提供一种目标模板集合的更新方法,所述方法包括:在获取到当前帧图像后,基于目标模板集合对所述当前帧图像进行跟踪处理,得到所述当前帧图像中目标对象所在的目标区域,其中,所述目标模板集合包括多个目标模板;对所述目标区域在所述当前帧图像中的位置、所述目标区域的尺寸中的至少一个进行扰动处理,以在所述当前帧图像中生成多个候选区域;分别提取每个所述候选区域的图像特征,得到多个候选模板;在所述多个候选模板中,确定与所述目标模板集合中的所述多个目标模板最相似的目标候选模板;根据所述目标候选模板,对所述目标模板集合进行更新。
本申请实施例第二方面提供一种更新装置,所述更新装置包括处理器、存储器以及通信电路,所述处理器分别耦接所述存储器、所述通信电路,所述存储器中存储有程序数据,所述处理器通过执行所述存储器内的所述程序数据以实现上述方法中的步骤。
本申请实施例第三方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序能够被处理器执行以实现上述方法中的步骤。
有益效果是:在本申请中,先对目标区域进行扰动处理,生成多个候选区域,然后分别提取每个候选区域的图像特征,得到多个候选模板,在多个候选模板中,目标候选模板与目标模板集合中多个目标模板的相似度最高,因此目标候选模板所对应的候选区域是目标对象真正所在的区域的可能性很高,因此根据目标候选模板对目标模板集合进行更新,可以避免目标模板集合被污染,降低后续跟踪过程中发生漂移的风险。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:
图1是本申请目标模板集合的更新方法一实施方式的流程示意图;
图2是本申请目标模板集合的更新方法一实施方式中步骤S140的流程示意图;
图3是本申请目标模板集合的更新方法一实施方式中步骤S150的流程示意图;
图4是本申请目标模板集合的更新方法一实施方式中步骤S151的流程示意图;
图5是本申请目标模板集合的更新方法一实施方式的流程示意图;
图6是本申请目标模板集合的更新方法一实施方式的流程示意图;
图7是本申请更新装置一实施方式的结构示意图;
图8是本申请更新装置另一实施方式的结构示意图;
图9是本申请计算机可读存储介质一实施方式的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
需要说明的是,本申请中的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
参阅图1,图1是本申请目标模板集合的更新方法一实施方式的流程示意图,该方法包括:
S110:在获取到当前帧图像后,基于目标模板集合对当前帧图像进行跟踪处理,得到当前帧图像中目标对象所在的目标区域,其中,目标模板集合包括多个目标模板。
具体地,当前帧图像是目标视频中当前待处理的图像。目标模板集合包括多个目标模板,每个目标模板均是目标对象的图像特征。具体而言,目标模板本质上是一个向量,为了便于说明,将所有的目标模板从1开始进行标号,则标号为i的目标模板可记为ti,其中,1≤i≤n,n为目标模板集合中目标模板的数量。其中,将向量ti中元素的个数记为d,即d为图像特征的特征维度,也就是说,ti∈Rd。同时将目标模板集合记为T,则T=[t1,t2,……tn],且T∈Rd×n,即目标模板集合T是一个d行n列的矩阵。
其中,在获取到当前帧图像后,根据目标模板集合中的多个目标模板,对当前帧图像中的目标对象进行跟踪,即在当前帧图像中找出一个区域,其对应的图像特征与目标模板集合中的多个目标模板最相似,该区域即为目标对象坐在的目标区域,其中,目标对象所在的目标区域是目标对象的检测框所框选的区域。
S120:对目标区域在当前帧图像中的位置、目标区域的尺寸中的至少一个进行扰动处理,以在当前帧图像中生成多个候选区域。
具体地,对目标区域在当前帧图像中的位置进行扰动处理指的是,根据目标区域在当前帧图像中的位置,生成多个不完全相同的位置,该多个不完全相同的位置就是多个候选区域在当前帧图像中的位置,其中多个不完全相同的位置也可能包括目标区域在当前帧图像中的位置。
其中,目标区域在当前帧图像中的位置具体可以是目标区域中的某一点在当前帧图像中的位置,例如,目标区域的中心点在当前帧图像中的位置,或者目标区域的某一方向(例如左上角)上的顶点在当前帧图像中的位置。其中为了便于说明,以下均以目标区域在当前帧图像中的位置为目标区域的中心点在当前帧图像中的位置进行说明,对应地,候选区域在当前帧图像中的位置为候选区域的中心点在当前帧图像中的位置。其中如果用x0表示目标区域的中心点在基于当前帧图像建立的坐标系中的横坐标,y0表示目标区域的中心点在基于当前帧图像建立的坐标系中的纵坐标,x’表示候选区域的中心点在基于当前帧图像建立的坐标系中的横坐标,y’表示候选区域的中心点在基于当前帧图像建立的坐标系中的纵坐标,则将目标区域在当前帧图像中的位置记为(x0,y0),将候选区域在当前帧图像中的位置记为(x’,y’),则目标区域在当前帧图像中的位置和候选区域在当前帧图像中的位置可记为:x’= x0+△x,y’= y0+△y,其中△x为候选区域相对目标区域在基于当前帧图像建立的坐标系的x方向上的偏移量,△y为候选区域相对目标区域在基于当前帧图像建立的坐标系的y方向上的偏移量。可以理解的是,每个候选区域有对应有一个△x和一个△y。
对目标区域的尺寸进行扰动处理指的是,根据目标区域的尺寸,生成多个不完全相同的尺寸,该多个不完全相同的尺寸就是多个候选区域的尺寸,其中,生成的多个不完全相同的尺寸中也有可能包括目标区域的尺寸。
其中,将目标区域的尺寸记为w×h,其中,w为目标区域的宽,h为目标区域的高,将候选区域的尺寸记为w’×h’,w’为候选区域的宽,h’为候选区域的高,则候选区域的尺寸和目标区域的尺寸的关系可记为:w’=k1×w,h’= k2×h,其中,k1为宽度方向上的缩放因子,k2为高度方向上的缩放因子。可以理解的是,每个候选区域有对应有一个k1和k2。
其中,步骤S120可以只对目标区域在当前帧图像中的位置进行扰动处理,或者只对目标区域的尺寸进行扰动处理。可以理解的是,当只对目标区域在当前帧图像中的位置进行扰动处理时,多个候选区域的尺寸与目标区域的尺寸均相同,多个候选区域的位置完全不同,且多个候选区域中可以有一个候选区域的位置与目标区域的位置相同,也可以是所有候选区域的位置都与目标区域的位置不同;当只对目标区域的尺寸进行扰动处理时,多个候选区域中心点的位置与目标区域中心点的位置都相同,多个候选区域的尺寸完全不同,且多个候选区域中可以有一个候选区域的尺寸与目标区域的尺寸相同,也可以是所有候选区域的尺寸都与目标区域的尺寸不同。
而当步骤S120既对目标区域在当前帧图像中的位置进行扰动处理,也对目标区域的尺寸进行扰动处理时,两个候选区域的尺寸可以相同,但是尺寸相同的两个候选区域的中心点的位置需要不同;两个候选区域的中心点位置可以相同,但中心点位置相同的两个候选区域的尺寸需要不同。
总而言之,步骤S120只要保证生成的多个候选区域中不存在两个完全相同的候选区域即可。同时生成的多个候选区域中可以包括目标区域,也可以不包括目标区域。
在一应用场景中,候选区域相对目标区域在x方向上的偏移量△x、在y方向上的偏移量△y、候选区域相对目标区域在宽度方向上的缩放因子k1、在高度方向上的缩放因子k2均符合高斯分布。也就是说,在满足高斯分布的前提下,确定每个候选区域对应的△x、△y、k1以及k2。
其中,△x、△y、k1以及k2具体可以是符合零均值高斯分布。当然在其他应用场景中,△x、△y、k1以及k2也可以符合例如均匀分布等其他分布。
S130:分别提取每个候选区域的图像特征,得到多个候选模板。
具体地,对每个候选区域处的图像进行特征提取,并将提取到的每个特征都作为候选模板,也就是说,候选模板与目标模板一样,本质上也是一个向量,其中候选模板的维度与目标模板的维度相同,均为d。
其中为了便于说明,将所有的候选模板从1开始标号,则标号为i的候选模板可记为ci,其中,1≤i≤N,N为候选模板的数量,其中,ci∈Rd,并构建候选模板集合C,其中C=[c1,c2,……cN],且C∈Rd×N,即候选模板集合C是一个d行N列的矩阵。
S140:在多个候选模板中,确定与目标模板集合中的多个目标模板最相似的目标候选模板。
具体地,将多个候选模板中,与目标模板集合中的多个目标模板最相似的候选模板定义为目标候选模板。
参阅图2,在本实施方式中,步骤S140包括S141、S142和S143,具体地:
S141:分别确定每个候选模板基于目标模板集合的稀疏表示系数向量。
具体地,将多个候选模板基于目标模板集合进行如下的联合稀疏表示:
min||X||1,2,s.t.C=TX,其中,C=[c1,c2,……cN],T=[t1,t2,……tn]。
上述联合稀疏表示的目的是找出矩阵X,使得在C=TX的条件下, ||X||1,2最小,其中,||X||1,2表示矩阵X的l12范数。其中,确定矩阵X的l12范数的过程属于现有技术,在此不做具体介绍。
其中,矩阵X可以表示为[X1,X2,……XN],X∈Rn×N,其中,Xi为标号为i的候选模板基于目标模板集合的稀疏表示系数向量,其中,Xi=[xi 1,xi 2,……xi n],xi t与在将多个目标模板进行线性组合得到标号为i的候选模板时,标号为t的目标模板的系数相关,也就是说,xi 1与标号为1的目标模板相关,xi 2与标号为2的目标模板相关,xi n与标号为n的目标模板相关。
S142:分别根据每个候选模板的稀疏表示系数向量,确定每个候选模板的重构误差。
具体地,在得到每个候选模板的稀疏表示系数向量后,可以利用如下公式分别确定每个候选模板的重构误差:
S143:将重构误差最小的候选模板,确定为目标候选模板。
具体地,候选模板对应的重构误差越小,表示该候选模板与目标模板集合中多个目标模板的相似度越高,因此重构误差最小的候选模板就是与目标模板集合中多个目标模板最相似的候选模板。
其中,根据目标候选模板对应的稀疏表示系数向量,还可以在目标模板集合中确定与目标候选模板最相似的目标模板。
具体地,假设目标候选模板是标号为m的候选模板,其对应的稀疏表示系数向量Xm=[xm 1,xm 2,……xm n],如果在xm 1,xm 2,……xm n中,xm t最大,则说明在所有目标模板中,标号为t的目标模板与目标候选模板的相似度越高。
在其他实施方式中,步骤S140确定与目标模板集合中的多个目标模板最相似的目标候选模板的过程还可以是:分别针对每个候选模板而言,都执行如下步骤:
(a)分别确定候选模板与目标模板集合中每个目标模板之间的距离。
具体地,可以是分别确定候选模板与每个目标模板之间的欧式距离,可以理解的是,候选模板与目标模板之间的欧式距离越小,表明候选模板与目标模板的相似度越高。
(b)确定距离的平均值,得到候选模板对应的平均距离值。
可以理解的是,候选模板对应的平均距离值越低,表明候选模板与目标模板集合中多个目标模板的相似度越高。
在针对每个候选模板都执行上述步骤后,每个候选模板都对应有一个平均距离值,其中将对应平均距离值最小的候选模板,确定为与目标模板集合中的多个目标模板最相似的目标候选模板。
总而言之,本申请对步骤S140确定目标候选模板的具体过程不做限制。
S150:根据目标候选模板,对目标模板集合进行更新。
在基于目标模板集合对当前帧图像进行跟踪处理时,得到的目标区域与目标对象真正所处的区域可能存在一定的偏差,如果直接根据目标区域对目标模板集合进行更新,会对目标模板集合造成污染,特别是当跟踪算法出现漂移或者目标对象被遮挡时,直接根据目标区域对目标模板集合进行更新会加重对目标模板集合的污染。
而在本实施方式中,先对目标区域进行扰动处理,生成多个候选区域,然后分别提取每个候选区域的图像特征,得到多个候选模板,在多个候选模板中,目标候选模板与目标模板集合中多个目标模板的相似度最高,因此目标候选模板所对应的候选区域是目标对象真正所在的区域的可能性较高,因此根据目标候选模板对目标模板集合进行更新,可以避免目标模板集合被污染,降低后续跟踪过程中发生漂移的风险。
参阅图3,在本实施方式中,步骤S150包括S151和S152,具体地:
S151:在目标模板集合中,将满足第二预设要求的两个目标模板进行融合处理。
S152:将目标候选模板加入目标模板集合。
具体地,为了保证在将目标候选模板加入目标模板集合中后,目标模板集合中模板的数量不变,将满足第二预设要求的两个目标模板进行融合处理。
其中,本实施方式将两个目标模板进行融合处理本质上就是,根据两个长度相等的向量,得到另一个长度相同的向量,该过程可以表示如下:
满足第二预设要求的两个目标模板可以分别表示为(a1,a2,……ad)、(b1,b2,……bd),其中d为向量中元素的个数,然后融合后的向量为(c1,c2,……cd),在一应用场景中,c1=(a1+ b1)/2,c2=(a2+ b2)/2,以此类推,cd=(ad+ bd)/2。其中,可以采用现有技术中任一项融合技术将满足第二预设要求的两个目标模板进行融合处理,关于该过程,在此不做过多介绍。
参阅图4,在本实施方式中,步骤S151具体包括:
S1511:在目标模板集合中,确定任意两个目标模板的相似度。
在一应用场景中,确定任意两个目标模板之间的欧式距离,并根据该欧式距离,确定两个目标模板之间的相似度,其中,两个目标模板之间的欧式距离越小,表明两个目标模板越相似,即两者之间的相似度越高。
在其他应用场景中,还可以根据两个目标模板之间的夹角,确定两个目标模板的相似度。总而言之,本申请对于确定任意两个目标模板之间的相似度的具体过程不做限制。
S1512:将相似度最高的两个目标模板,确定为满足第二预设要求,并进行融合处理。
具体地,本实施方式将相似度最高的两个目标模板进行融合处理,可以拉大目标模板集合中模板之间的差异,可以提高后续目标跟踪的准确率。
需要说明的是,在其他实施方式中,步骤S151在将满足第二预设要求的两个目标模板进行融合处理时,可以将目标模板集合中相似度最低的两个目标模板进行融合处理,或者将目标模板集合中对应采集时间最早的两个目标模板进行融合处理。
或者在其他实施方式中,也可以不需要判断两个目标模板之间是否满足第二预设要求,而是随机将目标模板集合中的两个目标模板进行融合处理。
或者在其他实施方式中,也可以不进行融合处理,此时在将目标候选模板加入目标模板集合之前,去除目标模板集合中的一个目标模板,其中可以是随机去除目标模板集合中的一个目标模板,也可以是去除目标模板集合中满足一定要求的目标模板,例如采集时间最早的目标模板,或者是与目标候选模板最相似或者最不相似的目标模板。
或者在其他实施方式中,在将目标候选模板加入目标模板集合之前,也可以不对目标模板集合进行任何处理,此时在将目标候选模板加入目标模板集合之后,目标模板集合中目标模板的数量会增多,后续当目标模板的数量增多至第一数量阈值时,对目标模板集合中的目标模板进行清理,使得清理后目标模板集合中目标模板的数量为第二数量阈值(第二数量阈值小于第一数量阈值),其中,清理的过程可以是随机去除若干个目标模板,或者去除采集时间最早的若干个目标模板,或者对目标模板进行融合处理等等。
参阅图5,在本申请另一实施方式中,目标模板集合的更新方法包括:
S210:在获取到当前帧图像后,基于目标模板集合对当前帧图像进行跟踪处理,得到当前帧图像中目标对象所在的目标区域,其中,目标模板集合包括多个目标模板。
S220:对目标区域在当前帧图像中的位置、目标区域的尺寸中的至少一个进行扰动处理,以在当前帧图像中生成多个候选区域。
S230:分别提取每个候选区域的图像特征,得到多个候选模板。
S240:在多个候选模板中,确定与目标模板集合中的多个目标模板最相似的目标候选模板。
S250:在目标模板集合中,确定满足第一预设要求的目标模板。
S260:判断满足第一预设要求的目标模板与目标候选模板的相似度是否小于相似度阈值。
若判断结果为小于,则执行步骤S270,否则执行步骤S280。
S270:根据目标候选模板,对目标模板集合进行更新。
S280:不对目标模板集合进行任何更新。
其中,步骤S210-S240与上述步骤S110-S140对应相同,步骤S270与上述的步骤S150相同,具体可参见上述相关内容,在此不再赘述。
与上述实施方式不同的是,在根据目标候选模板对目标模板集合进行更新之前,需要判断是否有必要对目标模板集合进行更新,该过程是:
由于目标候选模板对应的候选区域是目标对象真正所在的区域的可能性较高,但是如果目标模板集合中满足第一预设要求的目标模板与目标候选模板的相似度小于相似度阈值,则说明目标模板集合中可能存在已经无法准确表征目标对象的对象特征的目标模板,进而需要根据目标候选模板,对目标模板集合进行更新,但是如果目标模板集合中满足第一预设要求的目标模板与目标候选模板的相似度不小于相似度阈值,则说明目标模板集合中的目标模板依然能够准确地表征目标对象的对象特征,此时则无需对目标模板集合进行更新,即无需进行任何处理。
在本实施方式中,步骤S250具体包括:在目标模板集合中,将与目标候选模板最相似的目标模板,确定为满足第一预设要求的目标模板。
具体地,如果连目标模板集合中与目标候选模板最相似的目标模板与目标候选模板的相似度都小于相似度阈值,则说明目标模板集合中存在已经无法准确表征目标对象的对象特征的目标模板的可能性很高,进而说明需要根据目标候选模板,对目标模板集合进行更新。
在一应用场景中,在确定与目标候选模板最相似的目标模板时,可以采用上述实施方式中的方式,具体为:根据目标候选模板对应的稀疏表示系数向量,在目标模板集合中确定与目标候选模板最相似的目标模板。关于该过程可参见上述相关内容,在此不再赘述。
在另一应用场景中,在目标模板集合中,确定与目标候选模板最相似的目标模板的过程还可以是:分别确定每个目标模板与目标候选模板之间的欧式距离,然后将对应欧式距离最小的目标模板,确定为与目标候选模板最相似的目标模板。
总而言之,本申请对于在目标模板集合中,确定与目标候选模板最相似的目标模板的过程不做具体限制。
在其他实施方式中,步骤S250还可以是:在目标模板集合中,将与目标候选模板最不相似的目标模板确定为满足第一预设要求,或者在目标模板集合中,将采集时间最早或者最晚的目标模板确定为满足第一预设要求。或者在其他实施方式中,步骤S250还可以是随机从目标模板集合中随机确定一个目标模板,确定其满足第一预设要求。总而言之,第一预设要求可以结合实际场景进行设定,在此不做限制。
参阅图6,在本申请又一实施方式中,目标模板集合的更新方法包括:
S301:获取当前帧图像。
S302:判断当前帧图像对应的跟踪序列索引是否大于预设阈值。
若判断结果为否,则执行步骤S303,若判断结果为是,则执行步骤S304。
S303:确定当前帧图像中目标对象所在的目标区域,并将目标区域对应的图像特征,确定为当前帧图像对应的目标模板而加入目标模板集合中。
S304:基于目标模板集合对当前帧图像进行跟踪处理,得到当前帧图像中目标对象所在的目标区域,其中,目标模板集合包括多个目标模板。
S305:对目标区域在当前帧图像中的位置、目标区域的尺寸中的至少一个进行扰动处理,以在当前帧图像中生成多个候选区域。
S306:分别提取每个候选区域的图像特征,得到多个候选模板。
S307:在多个候选模板中,确定与目标模板集合中的多个目标模板最相似的目标候选模板。
S308:在目标模板集合中,确定满足第一预设要求的目标模板。
S309:判断满足第一预设要求的目标模板与目标候选模板的相似度是否小于相似度阈值。
若判断结果为小于,则执行步骤S310,否则执行步骤S311。
S310:根据目标候选模板,对目标模板集合进行更新。
S311:不对目标模板集合进行任何更新。
与上述实施方式不同的是,如果当前帧图像在目标视频中对应的跟踪序列索引小于或者等于n(预设阈值),则利用当前帧图像构建目标模板集合,否则才执行步骤S304。可以理解的是,通过该方案,可以使得目标模板集合中目标模板的数量为n个。
其中,如果在对目标视频进行跟踪处理的过程中,从第一帧图像开始,对目标视频中的每一帧图像都进行分析处理,则目标视频中第一帧图像对应的跟踪序列索引为一,目标视频中第二帧图像对应的跟踪序列索引为二,目标视频中第二帧图像对应的跟踪序列索引为三,以此类推。
但是在跟踪处理的过程中,从第一帧图像开始,不是对每一帧图像都进行分析处理,例如按照从前到后的顺序,依次只对第一帧图像、第三帧图像、第五帧图像、第七帧图像等进行处理,则目标视频中第一帧图像对应的跟踪序列索引为一,第三帧图像对应的跟踪序列索引为二,第五帧图像对应的跟踪序列索引为三,以此类推。
在一应用场景中,步骤S303具体包括:响应于当前帧图像对应的跟踪序列索引为一,对当前帧图像进行目标检测,得到目标对象所在的目标区域,并将目标区域对应的图像特征,确定为当前帧图像对应的目标模板而加入目标模板集合中;否则,基于跟踪序列索引为一的图像对应的目标模板,对当前帧图像进行跟踪处理,得到当前帧图像中目标对象所在的目标区域,并将目标区域对应的图像特征,确定为当前帧图像对应的目标模板而加入目标模板集合中。
具体地,在利用当前帧图像构建目标模板集合时,如果当前帧图像对应的跟踪序列索引为一,则利用目标检测算法对当前帧图像进行目标检测,从而得到当前帧图像中的目标对象,进而将目标对象所在区域的图像特征作为目标模板,加入目标模板集合中。需要说明的是,在其他实施方式中,如果当前帧图像对应的跟踪序列索引为一,还可以采用手工标注的方式确定当前帧图像中的目标对象。
但是如果当前帧图像对应的跟踪序列索引如果不是一,则借助视觉跟踪算法,基于跟踪序列索引为一的图像对应的目标模板对当前帧图像进行跟踪处理,从而得到当前帧图像的目标对象。其中,视觉跟踪算法可以选用基于衍生模型或生成模型的方法、基于相关滤波或孪生网络的方法等等,本申请对视觉跟踪算法的具体内容不做限制。
需要说明的是,在其他实施方式中,在利用当前帧图像构建目标模板集合时,可以无需判断当前帧图像对应的跟踪序列索引是否为一,此时直接利用目标检测算法对当前帧图像进行目标检测,从而得到当前帧图像中的目标对象。
或者,在其他实施方式中,目标模板集合也可以由预设人员预先设定好,此时在获取到当前帧图像后,直接基于目标模板集合对当前帧图像进行跟踪处理,无需再判断是否需要构建目标模板集合。
参阅图7,图7是本申请更新装置一实施方式的结构示意图。该更新装置200包括处理器210、存储器220以及通信电路230,处理器210分别耦接存储器220、通信电路230,存储器220中存储有程序数据,处理器210通过执行存储器220内的程序数据以实现上述任一项实施方式中的方法步骤,其中详细的步骤可参见上述实施方式,在此不再赘述。
其中,更新装置200可以是电脑、手机等任一项具有图像处理能力的装置,在此不做限制。
参阅图8,图8是本申请更新装置另一实施方式的结构示意图。该更新装置300包括跟踪模块310、生成模块320、提取模块330、确定模块340以及更新模块350。
跟踪模块310用于在获取到当前帧图像后,基于目标模板集合对当前帧图像进行跟踪处理,得到当前帧图像中目标对象所在的目标区域,其中,目标模板集合包括多个目标模板。
生成模块320与跟踪模块310连接,用于对目标区域在当前帧图像中的位置、目标区域的尺寸中的至少一个进行扰动处理,以在当前帧图像中生成多个候选区域。
提取模块330与生成模块320连接,用于分别提取每个候选区域的图像特征,得到多个候选模板。
确定模块340与提取模块330连接,用于在多个候选模板中,确定与目标模板集合中的多个目标模板最相似的目标候选模板。
更新模块350与确定模块340连接,用于根据目标候选模板,对目标模板集合进行更新。
其中,更新装置300可以是电脑、手机等任一项具有图像处理能力的装置,在此不做限制。
在一些实施例中,更新装置300还可以包括其他功能模块,且更新装置300可以应用于移动机器人、智能摄像机等。
其中,更新装置300在工作时执行上述任一项实施方式中的方法步骤,详细的步骤可参见上述内容,在此不再赘述。
参阅图9,图9是本申请计算机可读存储介质一实施方式的结构示意图。该计算机可读存储介质400存储有计算机程序410,计算机程序410能够被处理器执行以实现上述任一项方法中的步骤。
其中,计算机可读存储介质400具体可以为U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等可以存储计算机程序410的装置,或者也可以为存储有该计算机程序410的服务器,该服务器可将存储的计算机程序410发送给其他设备运行,或者也可以自运行该存储的计算机程序410。
以上所述仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (11)
1.一种目标模板集合的更新方法,其特征在于,所述方法包括:
在获取到当前帧图像后,基于目标模板集合对所述当前帧图像进行跟踪处理,得到所述当前帧图像中目标对象所在的目标区域,其中,所述目标模板集合包括多个目标模板;
对所述目标区域在所述当前帧图像中的位置、所述目标区域的尺寸中的至少一个进行扰动处理,以在所述当前帧图像中生成多个候选区域;
分别提取每个所述候选区域的图像特征,得到多个候选模板;
在所述多个候选模板中,确定与所述目标模板集合中的所述多个目标模板最相似的目标候选模板;
根据所述目标候选模板,对所述目标模板集合进行更新。
2.根据权利要求1所述的方法,其特征在于,所述在所述多个候选模板中,确定与所述目标模板集合中的所述多个目标模板最相似的目标候选模板的步骤,包括:
分别确定每个所述候选模板基于所述目标模板集合的稀疏表示系数向量;
分别根据每个所述候选模板的所述稀疏表示系数向量,确定每个所述候选模板的重构误差;
将所述重构误差最小的所述候选模板,确定为所述目标候选模板。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据所述目标候选模板对应的所述稀疏表示系数向量,在所述目标模板集合中确定与所述目标候选模板最相似的所述目标模板。
4.根据权利要求1所述的方法,其特征在于,在所述根据所述目标候选模板,对所述目标模板集合进行更新之前,还包括:
在所述目标模板集合中,确定满足第一预设要求的所述目标模板;
响应于满足所述第一预设要求的所述目标模板与所述目标候选模板的相似度小于相似度阈值,执行所述根据所述目标候选模板,对所述目标模板集合进行更新的步骤;
否则,不对所述目标模板集合进行更新。
5.根据权利要求4所述的方法,其特征在于,所述在所述目标模板集合中,确定满足第一预设要求的所述目标模板的步骤,包括:
在所述目标模板集合中,将与所述目标候选模板最相似的所述目标模板,确定为满足所述第一预设要求的所述目标模板。
6.根据权利要求1所述的方法,其特征在于,所述根据所述目标候选模板,对所述目标模板集合进行更新的步骤,包括:
在所述目标模板集合中,将满足第二预设要求的两个所述目标模板进行融合处理;
将所述目标候选模板加入所述目标模板集合。
7.根据权利要求6所述的方法,其特征在于,所述在所述目标模板集合中,将满足第二预设要求的两个所述目标模板进行融合处理的步骤,包括:
在所述目标模板集合中,确定任意两个所述目标模板的相似度;
将所述相似度最高的两个所述目标模板,确定为满足所述第二预设要求的两个所述目标模板,并进行所述融合处理。
8.根据权利要求1所述的方法,其特征在于,在所述在获取到当前帧图像后,基于目标模板集合对所述当前帧图像进行跟踪处理,得到所述当前帧图像中目标对象所在的目标区域之前,还包括:
响应于所述当前帧图像对应的跟踪序列索引大于预设阈值,执行所述在获取到当前帧图像后,基于目标模板集合对所述当前帧图像进行跟踪处理,得到所述当前帧图像中目标对象所在的目标区域的步骤;
否则,确定所述当前帧图像中所述目标对象所在的目标区域,并将所述目标区域对应的图像特征,确定为所述当前帧图像对应的所述目标模板而加入所述目标模板集合中。
9.根据权利要求8所述的方法,其特征在于,所述确定所述当前帧图像中所述目标对象所在的目标区域的步骤,包括:
响应于所述当前帧图像对应的跟踪序列索引为一,对所述当前帧图像进行目标检测,得到所述目标对象所在的目标区域,并将所述目标区域对应的图像特征,确定为所述当前帧图像对应的所述目标模板而加入所述目标模板集合中;
否则,基于所述跟踪序列索引为一的图像对应的所述目标模板,对所述当前帧图像进行跟踪处理,得到所述当前帧图像中所述目标对象所在的目标区域,并将所述目标区域对应的图像特征,确定为所述当前帧图像对应的所述目标模板而加入所述目标模板集合中。
10.一种更新装置,其特征在于,所述更新装置包括处理器、存储器以及通信电路,所述处理器分别耦接所述存储器、所述通信电路,所述存储器中存储有程序数据,所述处理器通过执行所述存储器内的所述程序数据以实现如权利要求1-9任一项所述方法中的步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序能够被处理器执行以实现如权利要求1-9任一项所述方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211312762.6A CN115375929B (zh) | 2022-10-25 | 2022-10-25 | 目标模板集合的更新方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211312762.6A CN115375929B (zh) | 2022-10-25 | 2022-10-25 | 目标模板集合的更新方法、装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115375929A true CN115375929A (zh) | 2022-11-22 |
CN115375929B CN115375929B (zh) | 2023-02-07 |
Family
ID=84073985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211312762.6A Active CN115375929B (zh) | 2022-10-25 | 2022-10-25 | 目标模板集合的更新方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115375929B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115937629A (zh) * | 2022-12-02 | 2023-04-07 | 北京小米移动软件有限公司 | 模板图像的更新方法、更新装置、可读存储介质及芯片 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106056627A (zh) * | 2016-05-30 | 2016-10-26 | 河海大学 | 一种基于局部鉴别性稀疏表示的鲁棒目标跟踪方法 |
US20160370227A1 (en) * | 2014-12-30 | 2016-12-22 | Huazhong University Of Science And Technology | Moving platform borne infrared image-spectrum associated detection system and method |
CN106408592A (zh) * | 2016-09-09 | 2017-02-15 | 南京航空航天大学 | 一种基于目标模板更新的目标跟踪方法 |
CN109671103A (zh) * | 2018-12-12 | 2019-04-23 | 易视腾科技股份有限公司 | 目标跟踪方法及装置 |
CN109685830A (zh) * | 2018-12-20 | 2019-04-26 | 浙江大华技术股份有限公司 | 目标跟踪方法、装置和设备及计算机存储介质 |
CN110705334A (zh) * | 2018-07-09 | 2020-01-17 | 翔升(上海)电子技术有限公司 | 目标追踪方法、装置、设备和介质 |
CN110807473A (zh) * | 2019-10-12 | 2020-02-18 | 浙江大华技术股份有限公司 | 目标检测方法、装置及计算机存储介质 |
CN110930434A (zh) * | 2019-11-21 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 目标对象跟踪方法、装置、存储介质和计算机设备 |
CN114219831A (zh) * | 2021-11-12 | 2022-03-22 | 深圳市优必选科技股份有限公司 | 目标跟踪方法、装置、终端设备及计算机可读存储介质 |
-
2022
- 2022-10-25 CN CN202211312762.6A patent/CN115375929B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160370227A1 (en) * | 2014-12-30 | 2016-12-22 | Huazhong University Of Science And Technology | Moving platform borne infrared image-spectrum associated detection system and method |
CN106056627A (zh) * | 2016-05-30 | 2016-10-26 | 河海大学 | 一种基于局部鉴别性稀疏表示的鲁棒目标跟踪方法 |
CN106408592A (zh) * | 2016-09-09 | 2017-02-15 | 南京航空航天大学 | 一种基于目标模板更新的目标跟踪方法 |
CN110705334A (zh) * | 2018-07-09 | 2020-01-17 | 翔升(上海)电子技术有限公司 | 目标追踪方法、装置、设备和介质 |
CN109671103A (zh) * | 2018-12-12 | 2019-04-23 | 易视腾科技股份有限公司 | 目标跟踪方法及装置 |
CN109685830A (zh) * | 2018-12-20 | 2019-04-26 | 浙江大华技术股份有限公司 | 目标跟踪方法、装置和设备及计算机存储介质 |
CN110807473A (zh) * | 2019-10-12 | 2020-02-18 | 浙江大华技术股份有限公司 | 目标检测方法、装置及计算机存储介质 |
CN110930434A (zh) * | 2019-11-21 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 目标对象跟踪方法、装置、存储介质和计算机设备 |
CN114219831A (zh) * | 2021-11-12 | 2022-03-22 | 深圳市优必选科技股份有限公司 | 目标跟踪方法、装置、终端设备及计算机可读存储介质 |
Non-Patent Citations (2)
Title |
---|
HORST POSSEGGER 等: "In defense of color-based model-free tracking", 《CVPR2015》 * |
张博 等: "利用视觉显著性和扰动模型的上下文感知跟踪", 《光学精密工程》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115937629A (zh) * | 2022-12-02 | 2023-04-07 | 北京小米移动软件有限公司 | 模板图像的更新方法、更新装置、可读存储介质及芯片 |
CN115937629B (zh) * | 2022-12-02 | 2023-08-29 | 北京小米移动软件有限公司 | 模板图像的更新方法、更新装置、可读存储介质及芯片 |
Also Published As
Publication number | Publication date |
---|---|
CN115375929B (zh) | 2023-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108960211B (zh) | 一种多目标人体姿态检测方法以及系统 | |
US6826292B1 (en) | Method and apparatus for tracking moving objects in a sequence of two-dimensional images using a dynamic layered representation | |
EP3709266A1 (en) | Human-tracking methods, apparatuses, systems, and storage media | |
EP2660753B1 (en) | Image processing method and apparatus | |
CN111144213B (zh) | 一种对象检测方法和相关设备 | |
Zhan et al. | DF-VO: What should be learnt for visual odometry? | |
CN108846855B (zh) | 目标跟踪方法及设备 | |
CN106251348B (zh) | 一种面向深度相机的自适应多线索融合背景减除方法 | |
CN113869293A (zh) | 车道线识别方法、装置、电子设备和计算机可读介质 | |
CN115375929B (zh) | 目标模板集合的更新方法、装置及计算机可读存储介质 | |
CN112613387A (zh) | 一种基于YOLOv3的交通标志检测方法 | |
CN111476814B (zh) | 目标跟踪方法、装置、设备及存储介质 | |
CN115527050A (zh) | 图像特征匹配方法、计算机设备和可读存储介质 | |
CN114267029A (zh) | 一种车道线检测方法、装置、设备及存储介质 | |
Xie et al. | pmbqa: Projection-based blind point cloud quality assessment via multimodal learning | |
CN108961268B (zh) | 一种显著图计算方法及相关装置 | |
CN116310899A (zh) | 基于YOLOv5改进的目标检测方法及装置、训练方法 | |
CN115409863A (zh) | 工件焊缝提取方法、装置、计算机可读介质及电子设备 | |
CN115830342A (zh) | 检测框的确定方法、装置、存储介质及电子装置 | |
CN112016513B (zh) | 视频语义分割方法、模型训练方法、相关装置及电子设备 | |
CN114220045A (zh) | 对象识别方法、装置及计算机可读存储介质 | |
CN115115535A (zh) | 深度图的去噪方法、装置、介质及设备 | |
CN112819859A (zh) | 一种应用于智慧安防的多目标跟踪方法及装置 | |
CN112991357B (zh) | 图像分割方法、系统、计算机设备、可读存储介质与船舶 | |
CN116385431B (zh) | 基于红外热成像与点云结合的数控机床设备故障检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |