CN113011324B - 基于特征图匹配和超像素图排序的目标跟踪方法及装置 - Google Patents
基于特征图匹配和超像素图排序的目标跟踪方法及装置 Download PDFInfo
- Publication number
- CN113011324B CN113011324B CN202110290895.7A CN202110290895A CN113011324B CN 113011324 B CN113011324 B CN 113011324B CN 202110290895 A CN202110290895 A CN 202110290895A CN 113011324 B CN113011324 B CN 113011324B
- Authority
- CN
- China
- Prior art keywords
- frame image
- previous frame
- current frame
- image
- super
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/48—Matching video sequences
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于特征图匹配和超像素图排序的目标跟踪方法及装置,所述方法包括:提取连续两帧的图像对的特征并进行特征点匹配;对前一帧图像进行超像素以及对当前帧图像进行超像素分割;确定超像素图排序的指示向量,使用半监督的图排序技术得到当前帧图像的排序结果,进而获得当前帧图像的二进制分割掩码;根据当前帧图像的二进制分割掩码对目标进行定位和跟踪;本发明的优点在于:目标跟踪过程中将分割和跟踪一体化,实现更便捷的分割与跟踪功能。
Description
技术领域
本发明涉及特征图匹配技术、超像素图排序技术、视频跟踪技术领域,更具体涉及基于特征图匹配和超像素图排序的目标跟踪方法及装置。
背景技术
当前,随着虚拟现实医学图像分类和活动分析、图像分割与视频跟踪等作为人工智能领域的关键技术,精确实现分割或者跟踪的技术是计算机视觉更可靠、更可用的保障,但是往往人们把分割和跟踪作为两个任务来解决,没有考虑将分割和跟踪一体化,视频序列无法实现更便捷的分割与跟踪的功能。
特征图匹配可以很好的获取图与图之间关系的重要方式,江等人在2015年发表文献《A Local Sparse Model for Matching Problem》,进行特征图匹配方面的研究,通过结构化的特征表示,可以准确的建立两帧之间关系,从而很好的为后续的半监督分割提供准确的查询节点。但是其仅仅提出用于解决特征图匹配问题的模型,没有考虑将分割和跟踪一体化,视频序列无法实现更便捷的分割与跟踪的功能。
流形排序的目标是以半监督的方式学习一个排序函数,该函数定义了未标记的节点和查询之间的相关性。现有技术主要使用这种排序方式来预测节点之间的相关性来实现图像的显著性检测,将流形排序用在对分割结果进行排序进而实现目标跟踪,对于实现分割和跟踪一体化十分有意义,但是现有技术鲜少考虑将流形排序用在目标跟踪上,更没有考虑将分割和跟踪一体化。
综上所述,现有目标跟踪技术大多是把分割和跟踪作为两个任务来解决,没有考虑将分割和跟踪一体化,视频序列无法实现更便捷的分割与跟踪的功能。
发明内容
本发明所要解决的技术问题在于现有技术目标跟踪是把分割和跟踪作为两个任务来解决,没有考虑将分割和跟踪一体化,因此视频序列无法实现更便捷的分割与跟踪的功能。
本发明通过以下技术手段实现解决上述技术问题:基于特征图匹配和超像素图排序的目标跟踪方法,所述方法包括:
步骤a:提取连续两帧的图像对的特征并进行特征点匹配;
步骤b:对前一帧图像进行超像素分割得到前一帧的超像素块,对当前帧图像进行超像素分割得到当前帧的超像素块,将前一帧图像的特征点按超像素块的分割结果映射到前一帧的二进制分割掩码上,若前一帧图像的特征点在前一帧中所占用的超像素块与前一帧的二进制分割掩码相对应为前景时,则当前帧图像的对应特征点在当前帧中所占用的超像素块为前景,反之为背景;
步骤c:确定超像素图排序的指示向量,使用半监督的图排序技术得到当前帧图像的排序结果,进而获得当前帧图像的二进制分割掩码;
步骤d:根据当前帧图像的二进制分割掩码对目标进行定位和跟踪。
本发明提取图像对特征并进行特征点匹配;对每帧图像进行超像素分割并将匹配结果在前一帧的分割结果上进行映射;根据映射结果得到特征点所属超像素为前景还是背景,由此确定超像素图排序的指示向量;使用半监督的图排序技术得到当前帧目标的分割结果;根据分割结果对目标进行定位和跟踪,将分割和跟踪一体化,实现更便捷的分割与跟踪功能,提高跟踪效果。
在本文同样依靠这种方式建立两帧节点之间的联系,利用背景或者前景种子节点进行预测,从而将目标从背景中分割出来。
进一步地,所述步骤a,包括:
分别提取连续两帧的图像对的特征点,基于特征点构造前一帧图像的内部关系图Gt-1=(Vt-1,Et-1,Qt-1,Rt-1)以及当前帧图像的内部关系图Gt=(Vt,Et,Qt,Rt),其中,Vt-1表示前一帧图像的特征点集合,Et-1表示前一帧图像中特征点与特征点之间的关系集合,Qt-1表示前一帧图像的特征点关联的属性向量,Rt-1表示前一帧图像中特征点与特征点之间形成的每个边eih∈Et-1的权重值集合;
构建用于求解前一帧图像与当前帧图像的特征点之间的匹配关系的通用目标函数
其中,A表示前一帧图像与当前帧图像的特征点之间的匹配关系矩阵,vec(A)=(A11…A1n,…,Am1…Amn)T∈Rmn×1是A的向量形式,Amn表示节点vm∈Gt对应于节点vn∈Gt-1,m是当前帧图像的特征点总数,n是前一帧图像的特征点总数,W是用于表征前一帧图像与当前帧图像的特征点匹配程度的亲和矩阵,s.t.表示使得...满足...,是subject to的缩写,表示任意;
根据通用目标函数,设定一对一匹配约束条件,构建如下待求目标函数公式
s.t.||A||1,2=1,A≥0
通过公式更新前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的元素,直到待求目标函数收敛得到最优解,其中,Ai'j表示更新后的前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的第i行第j列元素,λ表示拉格朗日乘子且λ=vec(A)TWvec(A),T∈Rm×n是向量[Wvec(A)]的矩阵形式,Tij是矩阵T的第i行第j列元素,()T表示矩阵的转置。
进一步地,所述步骤b,包括:
对每一帧图像使用简单线性迭代聚类算法进行超像素分割,得到前一帧图像的超像素块表示为和当前帧图像的超像素块/>Nt-1表示前一帧图像的超像素的个数,Nt表示当前帧图像的超像素的个数,/>表示前一帧图像的第Nt-1个超像素块,/>表示当前帧图像的第Nt个超像素块;
将前一帧图像的特征点Pt-1=(p1 t-1,p2 t-1…pn t-1)按照超像素的分割结果映射到前一帧图像的二进制分割掩码M(t-1)上,pi t-1表示前一帧图像的第i个特征点,若pi t-1在前一帧图像中所占用的超像素块bkt-1与前一帧图像的二进制分割掩码M(t-1)相对应为前景时,则认为当前帧图像的第i个特征点pi t所占用的超像素块bjt为前景,反之为背景。
进一步地,所述步骤c,包括:
通过流形排序公式获取当前帧图像的排序结果,其中,f表示每个节点的排序值且/>sij表示亲和矩阵S中的第i行第j列的元素且/>xi表示当前帧图像的超像素块的特征描述子矩阵/>中的第i个元素,σ为尺度参数,d表示特征的维数,Nt表示当前帧的超像素的块数;dii是度矩阵D=diag{d11,...dNN}中的元素,且dii=∑jsij,μ是平衡参数,ui是指示向量/>中的第i个元素,ui=1表示第i个超像素块是前景或者背景,ui=0表示第i个超像素块不确定其是前景还是背景;
若映射到前景的节点个数与映射到背景的节点个数都不为空,则以背景节点为指示向量进行流形排序得到的排序结果与以前景节点为指示向量进行流形排序得到的排序结果进行融合得到最终排序结果M(i)=Mb(i)×Mf(i)i=1,2,…,Nt,
将最终排序结果作为当前帧图像的二进制分割掩码M(t)。
本发明还提供基于特征图匹配和超像素图排序的目标跟踪装置,所述装置包括:
特征匹配模块,用于提取连续两帧的图像对的特征并进行特征点匹配;
超像素分割模块,用于对前一帧图像进行超像素分割得到前一帧的超像素块,对当前帧图像进行超像素分割得到当前帧的超像素块,将前一帧图像的特征点按超像素块的分割结果映射到前一帧的二进制分割掩码上,若前一帧图像的特征点在前一帧中所占用的超像素块与前一帧的二进制分割掩码相对应为前景时,则当前帧图像的对应特征点在当前帧中所占用的超像素块为前景,反之为背景;
排序模块,用于确定超像素图排序的指示向量,使用半监督的图排序技术得到当前帧图像的排序结果,进而获得当前帧图像的二进制分割掩码;
跟踪模块,用于根据当前帧图像的二进制分割掩码对目标进行定位和跟踪。
进一步地,所述特征匹配模块,还用于:
分别提取连续两帧的图像对的特征点,基于特征点构造前一帧图像的内部关系图Gt-1=(Vt-1,Et-1,Qt-1,Rt-1)以及当前帧图像的内部关系图Gt=(Vt,Et,Qt,Rt),其中,Vt-1表示前一帧图像的特征点集合,Et-1表示前一帧图像中特征点与特征点之间的关系集合,Qt-1表示前一帧图像的特征点关联的属性向量,Rt-1表示前一帧图像中特征点与特征点之间形成的每个边eih∈Et-1的权重值集合;
构建用于求解前一帧图像与当前帧图像的特征点之间的匹配关系的通用目标函数
其中,A表示前一帧图像与当前帧图像的特征点之间的匹配关系矩阵,vec(A)=(A11…A1n,…,Am1…Amn)T∈Rmn×1是A的向量形式,Amn表示节点vm∈Gt对应于节点vn∈Gt-1,m是当前帧图像的特征点总数,n是前一帧图像的特征点总数,W是用于表征前一帧图像与当前帧图像的特征点匹配程度的亲和矩阵,s.t.表示使得...满足...,是subject to的缩写,表示任意;
根据通用目标函数,设定一对一匹配约束条件,构建如下待求目标函数公式
s.t.||A||1,2=1,A≥0
通过公式更新前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的元素,直到待求目标函数收敛得到最优解,其中,Ai'j表示更新后的前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的第i行第j列元素,λ表示拉格朗日乘子且λ=vec(A)TWvec(A),T∈Rm×n是向量[Wvec(A)]的矩阵形式,Tij是矩阵T的第i行第j列元素,()T表示矩阵的转置。
进一步地,所述超像素分割模块,还用于:
对每一帧图像使用简单线性迭代聚类算法进行超像素分割得到前一帧图像的超像素块表示为和当前帧图像的超像素块/>Nt-1表示前一帧图像的超像素的个数,Nt表示当前帧图像的超像素的个数,/>表示前一帧图像的第Nt-1个超像素块,/>表示当前帧图像的第Nt个超像素块;
将前一帧图像的特征点Pt-1=(p1 t-1,p2 t-1…pn t-1)按照超像素的分割结果映射到前一帧图像的二进制分割掩码M(t-1)上,pi t-1表示前一帧图像的第i个特征点,若pi t-1在前一帧图像中所占用的超像素块bkt-1与前一帧图像的二进制分割掩码M(t-1)相对应为前景时,则认为当前帧图像的第i个特征点pi t所占用的超像素块bjt为前景,反之为背景。
进一步地,所述排序模块,还用于:
通过流形排序公式获取当前帧图像的排序结果,其中,f表示每个节点的排序值且/>sij表示亲和矩阵S中的第i行第j列的元素且/>xi表示当前帧图像的超像素块的特征描述子矩阵/>中的第i个元素,σ为尺度参数,d表示特征的维数,Nt表示当前帧的超像素的块数;dii是度矩阵D=diag{d11,...dNN}中的元素,且dii=∑jsij,μ是平衡参数,ui是指示向量/>中的第i个元素,ui=1表示第i个超像素块是前景或者背景,ui=0表示第i个超像素块不确定其是前景还是背景;
若映射到前景的节点个数与映射到背景的节点个数都不为空,则以背景节点为指示向量进行流形排序得到的排序结果与以前景节点为指示向量进行流形排序得到的排序结果进行融合得到最终排序结果M(i)=Mb(i)×Mf(i)i=1,2,…,Nt,
将最终排序结果作为当前帧图像的二进制分割掩码M(t)。
本发明的优点在于:本发明提取图像对特征并进行特征点匹配;对每帧图像进行超像素分割并将匹配结果在前一帧的分割结果上进行映射;根据映射结果得到特征点所属超像素为前景还是背景,由此确定超像素图排序的指示向量;使用半监督的图排序技术得到当前帧目标的分割结果;根据分割结果对目标进行定位和跟踪,将分割和跟踪一体化,实现更便捷的分割与跟踪功能,提高跟踪效果。
附图说明
图1为本发明实施例所公开的基于特征图匹配和超像素图排序的目标跟踪方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
基于特征图匹配和超像素图排序的目标跟踪方法,所述方法包括:
步骤a:提取连续两帧的图像对的特征并进行特征点匹配;
步骤b:对前一帧图像进行超像素分割得到前一帧的超像素块,对当前帧图像进行超像素分割得到当前帧的超像素块,将前一帧图像的特征点按超像素块的分割结果映射到前一帧的二进制分割掩码上,若前一帧图像的特征点在前一帧中所占用的超像素块与前一帧的二进制分割掩码相对应为前景时,则当前帧图像的对应特征点在当前帧中所占用的超像素块为前景,反之为背景;
步骤c:确定超像素图排序的指示向量,使用半监督的图排序技术得到当前帧图像的排序结果,进而获得当前帧图像的二进制分割掩码;
步骤d:根据当前帧图像的二进制分割掩码对目标进行定位和跟踪。以下详细介绍每个步骤的具体实施过程:
步骤a:给定连续两帧的图像对It-1和It,首先使用SIFT算法分别提取n和m个特征点Pt-1=(p1 t-1,p2 t-1…pn t-1)和Pt=(p1 t,p2 t…pm t)。然后提取图像中每个特征点的特征描述符,基于特征点构造一个图像的内部关系图G=(V,E,Q,R),It-1的关系图可表达为Gt-1=(Vt -1,Et-1,Qt-1,Rt-1),类似的,可以为It构造图Gt=(Vt,Et,Qt,Rt),目的是利用图的结构信息找到图像对之间的基于特征点的对应关系。图G中节点V代表特征点P,每个节点vi∈V具有一个关联的属性向量qi∈Q,边E表示特征点与特征点之间的关系,每个边eih∈E的权重值为rih∈R。
基于这种形式的图表示,可以将上述特征点匹配问题转化成找到两个图节点之间的对应关系。令A∈{0,1}n×m表示两个图之间的对应解,其中Aij=1表示节点vi∈G对应于节点vj'∈G'。为了获得最佳的A,定义了一个亲和矩阵W。W的对角元素Wij,ij表示一元亲和关系fa(ai,aj),代表节点vi∈V与节点vj'∈V'的匹配程度。非对角元素Wij,hk包含成对亲和关系fr(rih,rjk),这种成对关系可度量G中的成对节点(vi,vh)与G'中的成对节点(vj',vk')的匹配程度。可以通过优化如下的通用目标函数获得最优的A,
此处vec(A)=(A11…A1n,…,Am1…Amn)T∈Rmn×1是A的向量形式,Z是向量vec(Z)的矩阵形式,亲和矩阵W∈Rnm×nm反映了图Gt-1和图Gt的点和点之间以及边和边之间的相似性,s.t.表示使得...满足...,是subject to的缩写,表示任意,约束条件为Aij任意一行的和都为1,任意一列的和都不大于1。
不难发现通过上面所描述的问题是二次分配问题(即QAP问题),对于这种问题常用的方法就是借助一些松弛模型来找到一些近似解。对于图像匹配问题,可以通过求解以下稀疏松弛匹配问题,从而得到最优解。
s.t.||A||1,2=1,A≥0
由于局部稀疏匹配算法是非参的,具有最优性和收敛性,所提出的基于块的局部稀疏匹配模型可以通过简单的多重更新算法被有效解决,提出的算法进行如下的更新直到收敛即可得到最优的解。
其中提出的算法进行如下的更新直到收敛即可得到最优的解。
Ai'j表示更新后的前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的第i行第j列元素,λ表示拉格朗日乘子且λ=vec(A)TWvec(A),T∈Rm×n是向量[Wvec(A)]的矩阵形式,Tij是矩阵T的第i行第j列元素,()T表示矩阵的转置。
步骤b:根据匹配的结果认为,如果前一帧的特征点pi t-1在目标上,则与之对应的当前帧的特征点pi t也在目标上。为了将特征图匹配的特征点应用到图排序上,首先对每一帧图像使用简单线性迭代聚类(SLIC)算法进行超像素分割得到前一帧的超像素块表示为和当前帧的超像素块/>Nt-1表示前一帧图像的超像素的个数,Nt表示当前帧图像的超像素的个数,/>表示前一帧图像的第Nt-1个超像素块,表示当前帧图像的第Nt个超像素块。
此时,将前一帧图像的特征点Pt-1=(p1 t-1,p2 t-1…pn t-1)按照超像素的分割结果映射到前一帧图像的二进制分割掩码M(t-1)上,pi t-1表示前一帧图像的第i个特征点,若pi t-1在前一帧图像中所占用的超像素块bkt-1与前一帧图像的二进制分割掩码M(t-1)相对应为前景时,则认为当前帧图像的第i个特征点pi t所占用的超像素块bjt为前景,反之为背景。
步骤c:根据步骤b所描述的映射规则,即前一帧的映射结果为前景,就认为所对应的当前帧的特征点对应的超像素块属于前景,反之属于背景。接下来具体的超像素图排序技术的具体做法如下:
用表示当前帧的超像素块的特征描述子,d表示特征的维数,Nt表示当前帧的超像素的块数,定义一个指示向量/>ui=1表示第i个超像素块是前景还是背景,ui=0表示第i个超像素块不确定其是前景或者是背景。使用表示每个节点的排序值。首先构造亲和矩阵S,其中边的权重计算如下,
其中xi,xj表示当前帧所构的图中任意两个节点对的特征描述子,σ为尺度参数。
由如下流形排序公式,查询的最优排序通过求解以下优化问题来计算
其中度矩阵为D=diag{d11,...dNN},dii=∑jsij,μ是平衡参数。
经过一系列变换,最终f*=(D-αS)-1u,可以得到最终的排序结果,进而获得图像的分割掩码M(t)。
若映射到前景的节点个数与映射到背景的节点个数都不为空,则以背景节点为指示向量进行流形排序得到的排序结果与以前景节点为指示向量进行流形排序得到的排序结果进行融合得到最终排序结果M(i)=Mb(i)×Mf(i)i=1,2,…,Nt,
将最终排序结果作为当前帧图像的二进制分割掩码M(t)。
步骤d:由步骤c中的得到分割结果,由分割结果确定包围框,实现目标跟踪。并重复步骤a到步骤d直到整个视频序列结束。
通过以上技术方案,本发明提取图像对特征并进行特征点匹配;对每帧图像进行超像素分割并将匹配结果在前一帧的分割结果上进行映射;根据映射结果得到特征点所属超像素为前景还是背景,由此确定超像素图排序的指示向量;使用半监督的图排序技术得到当前帧目标的分割结果;根据分割结果对目标进行定位和跟踪,将分割和跟踪一体化,实现更便捷的分割与跟踪功能,提高跟踪效果。
实施例2
与本发明实施例1相对应的,本发明实施例2还提供基于特征图匹配和超像素图排序的目标跟踪装置,所述装置包括:
特征匹配模块,用于提取连续两帧的图像对的特征并进行特征点匹配;
超像素分割模块,用于对前一帧图像进行超像素分割得到前一帧的超像素块,对当前帧图像进行超像素分割得到当前帧的超像素块,将前一帧图像的特征点按超像素块的分割结果映射到前一帧的二进制分割掩码上,若前一帧图像的特征点在前一帧中所占用的超像素块与前一帧的二进制分割掩码相对应为前景时,则当前帧图像的对应特征点在当前帧中所占用的超像素块为前景,反之为背景;
排序模块,用于确定超像素图排序的指示向量,使用半监督的图排序技术得到当前帧图像的排序结果,进而获得当前帧图像的二进制分割掩码;
跟踪模块,用于根据当前帧图像的二进制分割掩码对目标进行定位和跟踪。
具体的,所述特征匹配模块,还用于:
分别提取连续两帧的图像对的特征点,基于特征点构造前一帧图像的内部关系图Gt-1=(Vt-1,Et-1,Qt-1,Rt-1)以及当前帧图像的内部关系图Gt=(Vt,Et,Qt,Rt),其中,Vt-1表示前一帧图像的特征点集合,Et-1表示前一帧图像中特征点与特征点之间的关系集合,Qt-1表示前一帧图像的特征点关联的属性向量,Rt-1表示前一帧图像中特征点与特征点之间形成的每个边eih∈Et-1的权重值集合;
构建用于求解前一帧图像与当前帧图像的特征点之间的匹配关系的通用目标函数
其中,A表示前一帧图像与当前帧图像的特征点之间的匹配关系矩阵,vec(A)=(A11…A1n,…,Am1…Amn)T∈Rmn×1是A的向量形式,Amn表示节点vm∈Gt对应于节点vn∈Gt-1,m是当前帧图像的特征点总数,n是前一帧图像的特征点总数,W是用于表征前一帧图像与当前帧图像的特征点匹配程度的亲和矩阵,s.t.表示使得...满足...,是subject to的缩写,表示任意;
根据通用目标函数,设定一对一匹配约束条件,构建如下待求目标函数公式
s.t.||A||1,2=1,A≥0
通过公式更新前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的元素,直到待求目标函数收敛得到最优解,其中,Ai'j表示更新后的前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的第i行第j列元素,λ表示拉格朗日乘子且λ=vec(A)TWvec(A),T∈Rm×n是向量[Wvec(A)]的矩阵形式,Tij是矩阵T的第i行第j列元素,()T表示矩阵的转置。
具体的,所述超像素分割模块,还用于:
对每一帧图像使用简单线性迭代聚类算法进行超像素分割得到前一帧图像的超像素块表示为和当前帧图像的超像素块/>Nt-1表示前一帧图像的超像素的个数,Nt表示当前帧图像的超像素的个数,/>表示前一帧图像的第Nt-1个超像素块,/>表示当前帧图像的第Nt个超像素块;
将前一帧图像的特征点Pt-1=(p1 t-1,p2 t-1…pn t-1)按照超像素的分割结果映射到前一帧图像的二进制分割掩码M(t-1)上,pi t-1表示前一帧图像的第i个特征点,若pi t-1在前一帧图像中所占用的超像素块bkt-1与前一帧图像的二进制分割掩码M(t-1)相对应为前景时,则认为当前帧图像的第i个特征点pi t所占用的超像素块bjt为前景,反之为背景。
具体的,所述排序模块,还用于:
通过流形排序公式获取当前帧图像的排序结果,其中,f表示每个节点的排序值且/>sij表示亲和矩阵S中的第i行第j列的元素且/>xi表示当前帧图像的超像素块的特征描述子矩阵/>中的第i个元素,σ为尺度参数,d表示特征的维数,Nt表示当前帧的超像素的块数;dii是度矩阵D=diag{d11,...dNN}中的元素,且dii=∑jsij,μ是平衡参数,ui是指示向量/>中的第i个元素,ui=1表示第i个超像素块是前景或者背景,ui=0表示第i个超像素块不确定其是前景还是背景;/>
若映射到前景的节点个数与映射到背景的节点个数都不为空,则以背景节点为指示向量进行流形排序得到的排序结果与以前景节点为指示向量进行流形排序得到的排序结果进行融合得到最终排序结果M(i)=Mb(i)×Mf(i)i=1,2,…,Nt,
将最终排序结果作为当前帧图像的二进制分割掩码M(t)。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (6)
1.基于特征图匹配和超像素图排序的目标跟踪方法,其特征在于,所述方法包括:
步骤a:提取连续两帧的图像对的特征并进行特征点匹配;
步骤b:对前一帧图像进行超像素分割得到前一帧的超像素块,对当前帧图像进行超像素分割得到当前帧的超像素块,将前一帧图像的特征点按超像素块的分割结果映射到前一帧的二进制分割掩码上,若前一帧图像的特征点在前一帧中所占用的超像素块与前一帧的二进制分割掩码相对应为前景时,则当前帧图像的对应特征点在当前帧中所占用的超像素块为前景,反之为背景;
步骤c:确定超像素图排序的指示向量,使用半监督的图排序技术得到当前帧图像的排序结果,进而获得当前帧图像的二进制分割掩码;具体过程为:
通过流形排序公式获取当前帧图像的排序结果,其中,f表示每个节点的排序值且sij表示亲和矩阵S中的第i行第j列的元素且xi表示当前帧图像的超像素块的特征描述子矩阵中的第i个元素,σ为尺度参数,d表示特征的维数,Nt表示当前帧的超像素的块数;dii是度矩阵D=diag{d11,...dNN}中的元素,且dii=∑jsij,μ是平衡参数,ui是指示向量中的第i个元素,ui=1表示第i个超像素块是前景或者背景,ui=0表示第i个超像素块不确定其是前景还是背景;
若映射到前景的节点个数与映射到背景的节点个数都不为空,则以背景节点为指示向量进行流形排序得到的排序结果与以前景节点为指示向量进行流形排序得到的排序结果进行融合得到最终排序结果M(i)=Mb(i)×Mf(i)i=1,2,…,Nt,
将最终排序结果作为当前帧图像的二进制分割掩码M(t);
步骤d:根据当前帧图像的二进制分割掩码对目标进行定位和跟踪。
2.根据权利要求1所述的基于特征图匹配和超像素图排序的目标跟踪方法,其特征在于,所述步骤a,包括:
分别提取连续两帧的图像对的特征点,基于特征点构造前一帧图像的内部关系图Gt-1=(Vt-1,Et-1,Qt-1,Rt-1)以及当前帧图像的内部关系图Gt=(Vt,Et,Qt,Rt),其中,Vt-1表示前一帧图像的特征点集合,Et-1表示前一帧图像中特征点与特征点之间的关系集合,Qt-1表示前一帧图像的特征点关联的属性向量,Rt-1表示前一帧图像中特征点与特征点之间形成的每个边eih∈Et-1的权重值集合;
构建用于求解前一帧图像与当前帧图像的特征点之间的匹配关系的通用目标函数
其中,A表示前一帧图像与当前帧图像的特征点之间的匹配关系矩阵,vec(A)=(A11...A1n,...,Am1...Amn)T∈Rmn×1是A的向量形式,Amn表示节点vm∈Gt对应于节点vn∈Gt-1,m是当前帧图像的特征点总数,n是前一帧图像的特征点总数,W是用于表征前一帧图像与当前帧图像的特征点匹配程度的亲和矩阵,s.t.表示使得...满足...,是subject to的缩写,表示任意;
根据通用目标函数,设定一对一匹配约束条件,构建如下待求目标函数公式
s.t.||A||1,2=1,A≥0
3.根据权利要求1所述的基于特征图匹配和超像素图排序的目标跟踪方法,其特征在于,所述步骤b,包括:
对每一帧图像使用简单线性迭代聚类算法进行超像素分割得到前一帧图像的超像素块表示为和当前帧图像的超像素块Nt-1表示前一帧图像的超像素的个数,Nt表示当前帧图像的超像素的个数,表示前一帧图像的第Nt-1个超像素块,表示当前帧图像的第Nt个超像素块;
将前一帧图像的特征点Pt-1=(p1 t-1,p2 t-1…pn t-1)按照超像素的分割结果映射到前一帧图像的二进制分割掩码M(t-1)上,pi t-1表示前一帧图像的第i个特征点,若pi t-1在前一帧图像中所占用的超像素块bk t-1与前一帧图像的二进制分割掩码M(t-1)相对应为前景时,则认为当前帧图像的第i个特征点pi t所占用的超像素块bj t为前景,反之为背景。
4.基于特征图匹配和超像素图排序的目标跟踪装置,其特征在于,所述装置包括:
特征匹配模块,用于提取连续两帧的图像对的特征并进行特征点匹配;
超像素分割模块,用于对前一帧图像进行超像素分割得到前一帧的超像素块,对当前帧图像进行超像素分割得到当前帧的超像素块,将前一帧图像的特征点按超像素块的分割结果映射到前一帧的二进制分割掩码上,若前一帧图像的特征点在前一帧中所占用的超像素块与前一帧的二进制分割掩码相对应为前景时,则当前帧图像的对应特征点在当前帧中所占用的超像素块为前景,反之为背景;
排序模块,用于确定超像素图排序的指示向量,使用半监督的图排序技术得到当前帧图像的排序结果,进而获得当前帧图像的二进制分割掩码;所述排序模块,还用于:
通过流形排序公式获取当前帧图像的排序结果,其中,f表示每个节点的排序值且sij表示亲和矩阵S中的第i行第j列的元素且xi表示当前帧图像的超像素块的特征描述子矩阵中的第i个元素,σ为尺度参数,d表示特征的维数,Nt表示当前帧的超像素的块数;dii是度矩阵D=diag{d11,...dNN}中的元素,且dii=∑jsij,μ是平衡参数,ui是指示向量中的第i个元素,ui=1表示第i个超像素块是前景或者背景,ui=0表示第i个超像素块不确定其是前景还是背景;
若映射到前景的节点个数与映射到背景的节点个数都不为空,则以背景节点为指示向量进行流形排序得到的排序结果与以前景节点为指示向量进行流形排序得到的排序结果进行融合得到最终排序结果M(i)=Mb(i)×Mf(i)i=1,2,…,Nt,
将最终排序结果作为当前帧图像的二进制分割掩码M(t);
跟踪模块,用于根据当前帧图像的二进制分割掩码对目标进行定位和跟踪。
5.根据权利要求4所述的基于特征图匹配和超像素图排序的目标跟踪装置,其特征在于,所述特征匹配模块,还用于:
分别提取连续两帧的图像对的特征点,基于特征点构造前一帧图像的内部关系图Gt-1=(Vt-1,Et-1,Qt-1,Rt-1)以及当前帧图像的内部关系图Gt=(Vt,Et,Qt,Rt),其中,Vt-1表示前一帧图像的特征点集合,Et-1表示前一帧图像中特征点与特征点之间的关系集合,Qt-1表示前一帧图像的特征点关联的属性向量,Rt-1表示前一帧图像中特征点与特征点之间形成的每个边eih∈Et-1的权重值集合;
构建用于求解前一帧图像与当前帧图像的特征点之间的匹配关系的通用目标函数
其中,A表示前一帧图像与当前帧图像的特征点之间的匹配关系矩阵,vec(A)=(A11...A1n,...,Am1...Amn)T∈Rmn×1是A的向量形式,Amn表示节点vm∈Gt对应于节点vn∈Gt-1,m是当前帧图像的特征点总数,n是前一帧图像的特征点总数,W是用于表征前一帧图像与当前帧图像的特征点匹配程度的亲和矩阵,s.t.表示使得...满足...,是subject to的缩写,表示任意;
根据通用目标函数,设定一对一匹配约束条件,构建如下待求目标函数公式
s.t.||A||1,2=1,A≥0
6.根据权利要求4所述的基于特征图匹配和超像素图排序的目标跟踪装置,其特征在于,所述超像素分割模块,还用于:
对每一帧图像使用简单线性迭代聚类算法进行超像素分割得到前一帧图像的超像素块表示为和当前帧图像的超像素块Nt-1表示前一帧图像的超像素的个数,Nt表示当前帧图像的超像素的个数,表示前一帧图像的第Nt-1个超像素块,表示当前帧图像的第Nt个超像素块;
将前一帧图像的特征点Pt-1=(p1 t-1,p2 t-1…pn t-1)按照超像素的分割结果映射到前一帧图像的二进制分割掩码M(t-1)上,pi t-1表示前一帧图像的第i个特征点,若pi t-1在前一帧图像中所占用的超像素块bk t-1与前一帧图像的二进制分割掩码M(t-1)相对应为前景时,则认为当前帧图像的第i个特征点pi t所占用的超像素块bj t为前景,反之为背景。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110290895.7A CN113011324B (zh) | 2021-03-18 | 2021-03-18 | 基于特征图匹配和超像素图排序的目标跟踪方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110290895.7A CN113011324B (zh) | 2021-03-18 | 2021-03-18 | 基于特征图匹配和超像素图排序的目标跟踪方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113011324A CN113011324A (zh) | 2021-06-22 |
CN113011324B true CN113011324B (zh) | 2023-03-24 |
Family
ID=76409696
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110290895.7A Active CN113011324B (zh) | 2021-03-18 | 2021-03-18 | 基于特征图匹配和超像素图排序的目标跟踪方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113011324B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107833243A (zh) * | 2017-11-02 | 2018-03-23 | 兰州理工大学 | 基于超像素局部加权度量与反稀疏模型的跟踪方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104616247B (zh) * | 2015-02-10 | 2017-11-21 | 天津大学 | 一种用于基于超像素sift航拍地图拼接的方法 |
CN108537819A (zh) * | 2017-03-03 | 2018-09-14 | 防城港市港口区思达电子科技有限公司 | 超像素运动目标检测方法 |
CN106997597B (zh) * | 2017-03-22 | 2019-06-25 | 南京大学 | 一种基于有监督显著性检测的目标跟踪方法 |
CN107145870B (zh) * | 2017-05-10 | 2020-01-21 | 成都优孚达信息技术有限公司 | 一种视频中人脸的识别系统 |
CN109034001B (zh) * | 2018-07-04 | 2021-06-25 | 安徽大学 | 一种基于时空线索的跨模态视频显著性检测方法 |
CN109215061B (zh) * | 2018-11-06 | 2022-04-19 | 广东工业大学 | 一种人脸毛孔跟踪方法及系统 |
CN110111338B (zh) * | 2019-04-24 | 2023-03-31 | 广东技术师范大学 | 一种基于超像素时空显著性分割的视觉跟踪方法 |
US20210004962A1 (en) * | 2019-07-02 | 2021-01-07 | Qualcomm Incorporated | Generating effects on images using disparity guided salient object detection |
-
2021
- 2021-03-18 CN CN202110290895.7A patent/CN113011324B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107833243A (zh) * | 2017-11-02 | 2018-03-23 | 兰州理工大学 | 基于超像素局部加权度量与反稀疏模型的跟踪方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113011324A (zh) | 2021-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108132968B (zh) | 网络文本与图像中关联语义基元的弱监督学习方法 | |
CN111898547B (zh) | 人脸识别模型的训练方法、装置、设备及存储介质 | |
WO2023000574A1 (zh) | 一种模型训练方法、装置、设备及可读存储介质 | |
CN108537264B (zh) | 基于深度学习的异源图像匹配方法 | |
CN108090472B (zh) | 基于多通道一致性特征的行人重识别方法及其系统 | |
CN108876797B (zh) | 一种基于Spiking-SOM神经网络聚类的图像分割系统及方法 | |
CN112347970B (zh) | 一种基于图卷积神经网络的遥感影像地物识别方法 | |
CN109299707A (zh) | 一种基于模糊深度聚类的无监督行人再识别方法 | |
CN112784913B (zh) | 一种基于图神经网络融合多视图信息的miRNA-疾病关联预测方法及装置 | |
CN109033107A (zh) | 图像检索方法和装置、计算机设备和存储介质 | |
CN110378366A (zh) | 一种基于耦合知识迁移的跨域图像分类方法 | |
CN112507901A (zh) | 一种基于伪标签自纠正的无监督行人重识别方法 | |
CN110765882B (zh) | 一种视频标签确定方法、装置、服务器及存储介质 | |
CN110751027B (zh) | 一种基于深度多示例学习的行人重识别方法 | |
CN110717953A (zh) | 基于cnn-lstm组合模型的黑白图片的着色方法和系统 | |
CN108846404A (zh) | 一种基于相关约束图排序的图像显著性检测方法及装置 | |
WO2023040195A1 (zh) | 对象识别方法、网络的训练方法及装置、设备、介质及产品 | |
CN112906517B (zh) | 一种自监督的幂律分布人群计数方法、装置和电子设备 | |
CN116090504A (zh) | 图神经网络模型训练方法及装置、分类方法、计算设备 | |
CN112069412B (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
CN113297936A (zh) | 一种基于局部图卷积网络的排球群体行为识别方法 | |
CN113378938A (zh) | 一种基于边Transformer图神经网络的小样本图像分类方法及系统 | |
CN113011324B (zh) | 基于特征图匹配和超像素图排序的目标跟踪方法及装置 | |
CN116758349A (zh) | 基于多尺度超像素节点聚合图卷积残差网络的高光谱图像分类方法 | |
CN113076963B (zh) | 一种图像识别方法、装置和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |