CN113011324B - 基于特征图匹配和超像素图排序的目标跟踪方法及装置 - Google Patents

基于特征图匹配和超像素图排序的目标跟踪方法及装置 Download PDF

Info

Publication number
CN113011324B
CN113011324B CN202110290895.7A CN202110290895A CN113011324B CN 113011324 B CN113011324 B CN 113011324B CN 202110290895 A CN202110290895 A CN 202110290895A CN 113011324 B CN113011324 B CN 113011324B
Authority
CN
China
Prior art keywords
frame image
previous frame
current frame
image
super
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110290895.7A
Other languages
English (en)
Other versions
CN113011324A (zh
Inventor
江波
张盼盼
肖云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University
Original Assignee
Anhui University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University filed Critical Anhui University
Priority to CN202110290895.7A priority Critical patent/CN113011324B/zh
Publication of CN113011324A publication Critical patent/CN113011324A/zh
Application granted granted Critical
Publication of CN113011324B publication Critical patent/CN113011324B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/48Matching video sequences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于特征图匹配和超像素图排序的目标跟踪方法及装置,所述方法包括:提取连续两帧的图像对的特征并进行特征点匹配;对前一帧图像进行超像素以及对当前帧图像进行超像素分割;确定超像素图排序的指示向量,使用半监督的图排序技术得到当前帧图像的排序结果,进而获得当前帧图像的二进制分割掩码;根据当前帧图像的二进制分割掩码对目标进行定位和跟踪;本发明的优点在于:目标跟踪过程中将分割和跟踪一体化,实现更便捷的分割与跟踪功能。

Description

基于特征图匹配和超像素图排序的目标跟踪方法及装置
技术领域
本发明涉及特征图匹配技术、超像素图排序技术、视频跟踪技术领域,更具体涉及基于特征图匹配和超像素图排序的目标跟踪方法及装置。
背景技术
当前,随着虚拟现实医学图像分类和活动分析、图像分割与视频跟踪等作为人工智能领域的关键技术,精确实现分割或者跟踪的技术是计算机视觉更可靠、更可用的保障,但是往往人们把分割和跟踪作为两个任务来解决,没有考虑将分割和跟踪一体化,视频序列无法实现更便捷的分割与跟踪的功能。
特征图匹配可以很好的获取图与图之间关系的重要方式,江等人在2015年发表文献《A Local Sparse Model for Matching Problem》,进行特征图匹配方面的研究,通过结构化的特征表示,可以准确的建立两帧之间关系,从而很好的为后续的半监督分割提供准确的查询节点。但是其仅仅提出用于解决特征图匹配问题的模型,没有考虑将分割和跟踪一体化,视频序列无法实现更便捷的分割与跟踪的功能。
流形排序的目标是以半监督的方式学习一个排序函数,该函数定义了未标记的节点和查询之间的相关性。现有技术主要使用这种排序方式来预测节点之间的相关性来实现图像的显著性检测,将流形排序用在对分割结果进行排序进而实现目标跟踪,对于实现分割和跟踪一体化十分有意义,但是现有技术鲜少考虑将流形排序用在目标跟踪上,更没有考虑将分割和跟踪一体化。
综上所述,现有目标跟踪技术大多是把分割和跟踪作为两个任务来解决,没有考虑将分割和跟踪一体化,视频序列无法实现更便捷的分割与跟踪的功能。
发明内容
本发明所要解决的技术问题在于现有技术目标跟踪是把分割和跟踪作为两个任务来解决,没有考虑将分割和跟踪一体化,因此视频序列无法实现更便捷的分割与跟踪的功能。
本发明通过以下技术手段实现解决上述技术问题:基于特征图匹配和超像素图排序的目标跟踪方法,所述方法包括:
步骤a:提取连续两帧的图像对的特征并进行特征点匹配;
步骤b:对前一帧图像进行超像素分割得到前一帧的超像素块,对当前帧图像进行超像素分割得到当前帧的超像素块,将前一帧图像的特征点按超像素块的分割结果映射到前一帧的二进制分割掩码上,若前一帧图像的特征点在前一帧中所占用的超像素块与前一帧的二进制分割掩码相对应为前景时,则当前帧图像的对应特征点在当前帧中所占用的超像素块为前景,反之为背景;
步骤c:确定超像素图排序的指示向量,使用半监督的图排序技术得到当前帧图像的排序结果,进而获得当前帧图像的二进制分割掩码;
步骤d:根据当前帧图像的二进制分割掩码对目标进行定位和跟踪。
本发明提取图像对特征并进行特征点匹配;对每帧图像进行超像素分割并将匹配结果在前一帧的分割结果上进行映射;根据映射结果得到特征点所属超像素为前景还是背景,由此确定超像素图排序的指示向量;使用半监督的图排序技术得到当前帧目标的分割结果;根据分割结果对目标进行定位和跟踪,将分割和跟踪一体化,实现更便捷的分割与跟踪功能,提高跟踪效果。
在本文同样依靠这种方式建立两帧节点之间的联系,利用背景或者前景种子节点进行预测,从而将目标从背景中分割出来。
进一步地,所述步骤a,包括:
分别提取连续两帧的图像对的特征点,基于特征点构造前一帧图像的内部关系图Gt-1=(Vt-1,Et-1,Qt-1,Rt-1)以及当前帧图像的内部关系图Gt=(Vt,Et,Qt,Rt),其中,Vt-1表示前一帧图像的特征点集合,Et-1表示前一帧图像中特征点与特征点之间的关系集合,Qt-1表示前一帧图像的特征点关联的属性向量,Rt-1表示前一帧图像中特征点与特征点之间形成的每个边eih∈Et-1的权重值集合;
构建用于求解前一帧图像与当前帧图像的特征点之间的匹配关系的通用目标函数
Figure BDA0002982606600000031
Figure BDA0002982606600000032
其中,A表示前一帧图像与当前帧图像的特征点之间的匹配关系矩阵,vec(A)=(A11…A1n,…,Am1…Amn)T∈Rmn×1是A的向量形式,Amn表示节点vm∈Gt对应于节点vn∈Gt-1,m是当前帧图像的特征点总数,n是前一帧图像的特征点总数,W是用于表征前一帧图像与当前帧图像的特征点匹配程度的亲和矩阵,s.t.表示使得...满足...,是subject to的缩写,
Figure BDA0002982606600000033
表示任意;
根据通用目标函数,设定一对一匹配约束条件,构建如下待求目标函数公式
Figure BDA0002982606600000041
s.t.||A||1,2=1,A≥0
其中,
Figure BDA0002982606600000042
通过公式
Figure BDA0002982606600000043
更新前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的元素,直到待求目标函数收敛得到最优解,其中,Ai'j表示更新后的前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的第i行第j列元素,λ表示拉格朗日乘子且λ=vec(A)TWvec(A),T∈Rm×n是向量[Wvec(A)]的矩阵形式,Tij是矩阵T的第i行第j列元素,()T表示矩阵的转置。
进一步地,所述步骤b,包括:
对每一帧图像使用简单线性迭代聚类算法进行超像素分割,得到前一帧图像的超像素块表示为
Figure BDA0002982606600000044
和当前帧图像的超像素块/>
Figure BDA0002982606600000045
Nt-1表示前一帧图像的超像素的个数,Nt表示当前帧图像的超像素的个数,/>
Figure BDA0002982606600000046
表示前一帧图像的第Nt-1个超像素块,/>
Figure BDA0002982606600000047
表示当前帧图像的第Nt个超像素块;
将前一帧图像的特征点Pt-1=(p1 t-1,p2 t-1…pn t-1)按照超像素的分割结果映射到前一帧图像的二进制分割掩码M(t-1)上,pi t-1表示前一帧图像的第i个特征点,若pi t-1在前一帧图像中所占用的超像素块bkt-1与前一帧图像的二进制分割掩码M(t-1)相对应为前景时,则认为当前帧图像的第i个特征点pi t所占用的超像素块bjt为前景,反之为背景。
进一步地,所述步骤c,包括:
通过流形排序公式
Figure BDA0002982606600000051
获取当前帧图像的排序结果,其中,f表示每个节点的排序值且/>
Figure BDA0002982606600000052
sij表示亲和矩阵S中的第i行第j列的元素且/>
Figure BDA0002982606600000053
xi表示当前帧图像的超像素块的特征描述子矩阵/>
Figure BDA0002982606600000054
中的第i个元素,σ为尺度参数,d表示特征的维数,Nt表示当前帧的超像素的块数;dii是度矩阵D=diag{d11,...dNN}中的元素,且dii=∑jsij,μ是平衡参数,ui是指示向量/>
Figure BDA0002982606600000055
中的第i个元素,ui=1表示第i个超像素块是前景或者背景,ui=0表示第i个超像素块不确定其是前景还是背景;
若映射到前景的节点个数不为空,则以前景节点为指示向量进行流形排序得到最终排序结果
Figure BDA0002982606600000056
若映射到背景的节点个数不为空,则以背景节点为指示向量进行流形排序得到最终排序结果
Figure BDA0002982606600000057
若映射到前景的节点个数与映射到背景的节点个数都不为空,则以背景节点为指示向量进行流形排序得到的排序结果与以前景节点为指示向量进行流形排序得到的排序结果进行融合得到最终排序结果M(i)=Mb(i)×Mf(i)i=1,2,…,Nt
将最终排序结果作为当前帧图像的二进制分割掩码M(t)
本发明还提供基于特征图匹配和超像素图排序的目标跟踪装置,所述装置包括:
特征匹配模块,用于提取连续两帧的图像对的特征并进行特征点匹配;
超像素分割模块,用于对前一帧图像进行超像素分割得到前一帧的超像素块,对当前帧图像进行超像素分割得到当前帧的超像素块,将前一帧图像的特征点按超像素块的分割结果映射到前一帧的二进制分割掩码上,若前一帧图像的特征点在前一帧中所占用的超像素块与前一帧的二进制分割掩码相对应为前景时,则当前帧图像的对应特征点在当前帧中所占用的超像素块为前景,反之为背景;
排序模块,用于确定超像素图排序的指示向量,使用半监督的图排序技术得到当前帧图像的排序结果,进而获得当前帧图像的二进制分割掩码;
跟踪模块,用于根据当前帧图像的二进制分割掩码对目标进行定位和跟踪。
进一步地,所述特征匹配模块,还用于:
分别提取连续两帧的图像对的特征点,基于特征点构造前一帧图像的内部关系图Gt-1=(Vt-1,Et-1,Qt-1,Rt-1)以及当前帧图像的内部关系图Gt=(Vt,Et,Qt,Rt),其中,Vt-1表示前一帧图像的特征点集合,Et-1表示前一帧图像中特征点与特征点之间的关系集合,Qt-1表示前一帧图像的特征点关联的属性向量,Rt-1表示前一帧图像中特征点与特征点之间形成的每个边eih∈Et-1的权重值集合;
构建用于求解前一帧图像与当前帧图像的特征点之间的匹配关系的通用目标函数
Figure BDA0002982606600000061
Figure BDA0002982606600000062
其中,A表示前一帧图像与当前帧图像的特征点之间的匹配关系矩阵,vec(A)=(A11…A1n,…,Am1…Amn)T∈Rmn×1是A的向量形式,Amn表示节点vm∈Gt对应于节点vn∈Gt-1,m是当前帧图像的特征点总数,n是前一帧图像的特征点总数,W是用于表征前一帧图像与当前帧图像的特征点匹配程度的亲和矩阵,s.t.表示使得...满足...,是subject to的缩写,
Figure BDA0002982606600000078
表示任意;
根据通用目标函数,设定一对一匹配约束条件,构建如下待求目标函数公式
Figure BDA0002982606600000071
s.t.||A||1,2=1,A≥0
其中,
Figure BDA0002982606600000072
通过公式
Figure BDA0002982606600000073
更新前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的元素,直到待求目标函数收敛得到最优解,其中,Ai'j表示更新后的前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的第i行第j列元素,λ表示拉格朗日乘子且λ=vec(A)TWvec(A),T∈Rm×n是向量[Wvec(A)]的矩阵形式,Tij是矩阵T的第i行第j列元素,()T表示矩阵的转置。
进一步地,所述超像素分割模块,还用于:
对每一帧图像使用简单线性迭代聚类算法进行超像素分割得到前一帧图像的超像素块表示为
Figure BDA0002982606600000074
和当前帧图像的超像素块/>
Figure BDA0002982606600000075
Nt-1表示前一帧图像的超像素的个数,Nt表示当前帧图像的超像素的个数,/>
Figure BDA0002982606600000076
表示前一帧图像的第Nt-1个超像素块,/>
Figure BDA0002982606600000077
表示当前帧图像的第Nt个超像素块;
将前一帧图像的特征点Pt-1=(p1 t-1,p2 t-1…pn t-1)按照超像素的分割结果映射到前一帧图像的二进制分割掩码M(t-1)上,pi t-1表示前一帧图像的第i个特征点,若pi t-1在前一帧图像中所占用的超像素块bkt-1与前一帧图像的二进制分割掩码M(t-1)相对应为前景时,则认为当前帧图像的第i个特征点pi t所占用的超像素块bjt为前景,反之为背景。
进一步地,所述排序模块,还用于:
通过流形排序公式
Figure BDA0002982606600000081
获取当前帧图像的排序结果,其中,f表示每个节点的排序值且/>
Figure BDA0002982606600000082
sij表示亲和矩阵S中的第i行第j列的元素且/>
Figure BDA0002982606600000083
xi表示当前帧图像的超像素块的特征描述子矩阵/>
Figure BDA0002982606600000084
中的第i个元素,σ为尺度参数,d表示特征的维数,Nt表示当前帧的超像素的块数;dii是度矩阵D=diag{d11,...dNN}中的元素,且dii=∑jsij,μ是平衡参数,ui是指示向量/>
Figure BDA0002982606600000085
中的第i个元素,ui=1表示第i个超像素块是前景或者背景,ui=0表示第i个超像素块不确定其是前景还是背景;
若映射到前景的节点个数不为空,则以前景节点为指示向量进行流形排序得到最终排序结果
Figure BDA0002982606600000086
若映射到背景的节点个数不为空,则以背景节点为指示向量进行流形排序得到最终排序结果
Figure BDA0002982606600000087
若映射到前景的节点个数与映射到背景的节点个数都不为空,则以背景节点为指示向量进行流形排序得到的排序结果与以前景节点为指示向量进行流形排序得到的排序结果进行融合得到最终排序结果M(i)=Mb(i)×Mf(i)i=1,2,…,Nt
将最终排序结果作为当前帧图像的二进制分割掩码M(t)
本发明的优点在于:本发明提取图像对特征并进行特征点匹配;对每帧图像进行超像素分割并将匹配结果在前一帧的分割结果上进行映射;根据映射结果得到特征点所属超像素为前景还是背景,由此确定超像素图排序的指示向量;使用半监督的图排序技术得到当前帧目标的分割结果;根据分割结果对目标进行定位和跟踪,将分割和跟踪一体化,实现更便捷的分割与跟踪功能,提高跟踪效果。
附图说明
图1为本发明实施例所公开的基于特征图匹配和超像素图排序的目标跟踪方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
基于特征图匹配和超像素图排序的目标跟踪方法,所述方法包括:
步骤a:提取连续两帧的图像对的特征并进行特征点匹配;
步骤b:对前一帧图像进行超像素分割得到前一帧的超像素块,对当前帧图像进行超像素分割得到当前帧的超像素块,将前一帧图像的特征点按超像素块的分割结果映射到前一帧的二进制分割掩码上,若前一帧图像的特征点在前一帧中所占用的超像素块与前一帧的二进制分割掩码相对应为前景时,则当前帧图像的对应特征点在当前帧中所占用的超像素块为前景,反之为背景;
步骤c:确定超像素图排序的指示向量,使用半监督的图排序技术得到当前帧图像的排序结果,进而获得当前帧图像的二进制分割掩码;
步骤d:根据当前帧图像的二进制分割掩码对目标进行定位和跟踪。以下详细介绍每个步骤的具体实施过程:
步骤a:给定连续两帧的图像对It-1和It,首先使用SIFT算法分别提取n和m个特征点Pt-1=(p1 t-1,p2 t-1…pn t-1)和Pt=(p1 t,p2 t…pm t)。然后提取图像中每个特征点的特征描述符,基于特征点构造一个图像的内部关系图G=(V,E,Q,R),It-1的关系图可表达为Gt-1=(Vt -1,Et-1,Qt-1,Rt-1),类似的,可以为It构造图Gt=(Vt,Et,Qt,Rt),目的是利用图的结构信息找到图像对之间的基于特征点的对应关系。图G中节点V代表特征点P,每个节点vi∈V具有一个关联的属性向量qi∈Q,边E表示特征点与特征点之间的关系,每个边eih∈E的权重值为rih∈R。
基于这种形式的图表示,可以将上述特征点匹配问题转化成找到两个图节点之间的对应关系。令A∈{0,1}n×m表示两个图之间的对应解,其中Aij=1表示节点vi∈G对应于节点vj'∈G'。为了获得最佳的A,定义了一个亲和矩阵W。W的对角元素Wij,ij表示一元亲和关系fa(ai,aj),代表节点vi∈V与节点vj'∈V'的匹配程度。非对角元素Wij,hk包含成对亲和关系fr(rih,rjk),这种成对关系可度量G中的成对节点(vi,vh)与G'中的成对节点(vj',vk')的匹配程度。可以通过优化如下的通用目标函数获得最优的A,
Figure BDA0002982606600000111
Figure BDA0002982606600000112
此处vec(A)=(A11…A1n,…,Am1…Amn)T∈Rmn×1是A的向量形式,Z是向量vec(Z)的矩阵形式,亲和矩阵W∈Rnm×nm反映了图Gt-1和图Gt的点和点之间以及边和边之间的相似性,s.t.表示使得...满足...,是subject to的缩写,
Figure BDA0002982606600000116
表示任意,约束条件为Aij任意一行的和都为1,任意一列的和都不大于1。
不难发现通过上面所描述的问题是二次分配问题(即QAP问题),对于这种问题常用的方法就是借助一些松弛模型来找到一些近似解。对于图像匹配问题,可以通过求解以下稀疏松弛匹配问题,从而得到最优解。
Figure BDA0002982606600000113
s.t.||A||1,2=1,A≥0
其中
Figure BDA0002982606600000114
的设定可以引导局部稀疏匹配,由此会形成一对一匹配约束。
由于局部稀疏匹配算法是非参的,具有最优性和收敛性,所提出的基于块的局部稀疏匹配模型可以通过简单的多重更新算法被有效解决,提出的算法进行如下的更新直到收敛即可得到最优的解。
其中提出的算法进行如下的更新直到收敛即可得到最优的解。
Figure BDA0002982606600000115
Ai'j表示更新后的前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的第i行第j列元素,λ表示拉格朗日乘子且λ=vec(A)TWvec(A),T∈Rm×n是向量[Wvec(A)]的矩阵形式,Tij是矩阵T的第i行第j列元素,()T表示矩阵的转置。
步骤b:根据匹配的结果认为,如果前一帧的特征点pi t-1在目标上,则与之对应的当前帧的特征点pi t也在目标上。为了将特征图匹配的特征点应用到图排序上,首先对每一帧图像使用简单线性迭代聚类(SLIC)算法进行超像素分割得到前一帧的超像素块表示为
Figure BDA0002982606600000121
和当前帧的超像素块/>
Figure BDA0002982606600000122
Nt-1表示前一帧图像的超像素的个数,Nt表示当前帧图像的超像素的个数,/>
Figure BDA0002982606600000123
表示前一帧图像的第Nt-1个超像素块,
Figure BDA0002982606600000124
表示当前帧图像的第Nt个超像素块。
此时,将前一帧图像的特征点Pt-1=(p1 t-1,p2 t-1…pn t-1)按照超像素的分割结果映射到前一帧图像的二进制分割掩码M(t-1)上,pi t-1表示前一帧图像的第i个特征点,若pi t-1在前一帧图像中所占用的超像素块bkt-1与前一帧图像的二进制分割掩码M(t-1)相对应为前景时,则认为当前帧图像的第i个特征点pi t所占用的超像素块bjt为前景,反之为背景。
步骤c:根据步骤b所描述的映射规则,即前一帧的映射结果为前景,就认为所对应的当前帧的特征点对应的超像素块属于前景,反之属于背景。接下来具体的超像素图排序技术的具体做法如下:
Figure BDA0002982606600000125
表示当前帧的超像素块的特征描述子,d表示特征的维数,Nt表示当前帧的超像素的块数,定义一个指示向量/>
Figure BDA0002982606600000126
ui=1表示第i个超像素块是前景还是背景,ui=0表示第i个超像素块不确定其是前景或者是背景。使用
Figure BDA0002982606600000127
表示每个节点的排序值。首先构造亲和矩阵S,其中边的权重计算如下,
Figure BDA0002982606600000128
其中xi,xj表示当前帧所构的图中任意两个节点对的特征描述子,σ为尺度参数。
由如下流形排序公式,查询的最优排序通过求解以下优化问题来计算
Figure BDA0002982606600000131
其中度矩阵为D=diag{d11,...dNN},dii=∑jsij,μ是平衡参数。
经过一系列变换,最终f*=(D-αS)-1u,可以得到最终的排序结果,进而获得图像的分割掩码M(t)
若映射到前景的节点个数不为空,则以前景节点为指示向量进行流形排序得到最终排序结果
Figure BDA0002982606600000132
若映射到背景的节点个数不为空,则以背景节点为指示向量进行流形排序得到最终排序结果
Figure BDA0002982606600000133
若映射到前景的节点个数与映射到背景的节点个数都不为空,则以背景节点为指示向量进行流形排序得到的排序结果与以前景节点为指示向量进行流形排序得到的排序结果进行融合得到最终排序结果M(i)=Mb(i)×Mf(i)i=1,2,…,Nt
将最终排序结果作为当前帧图像的二进制分割掩码M(t)
步骤d:由步骤c中的得到分割结果,由分割结果确定包围框,实现目标跟踪。并重复步骤a到步骤d直到整个视频序列结束。
通过以上技术方案,本发明提取图像对特征并进行特征点匹配;对每帧图像进行超像素分割并将匹配结果在前一帧的分割结果上进行映射;根据映射结果得到特征点所属超像素为前景还是背景,由此确定超像素图排序的指示向量;使用半监督的图排序技术得到当前帧目标的分割结果;根据分割结果对目标进行定位和跟踪,将分割和跟踪一体化,实现更便捷的分割与跟踪功能,提高跟踪效果。
实施例2
与本发明实施例1相对应的,本发明实施例2还提供基于特征图匹配和超像素图排序的目标跟踪装置,所述装置包括:
特征匹配模块,用于提取连续两帧的图像对的特征并进行特征点匹配;
超像素分割模块,用于对前一帧图像进行超像素分割得到前一帧的超像素块,对当前帧图像进行超像素分割得到当前帧的超像素块,将前一帧图像的特征点按超像素块的分割结果映射到前一帧的二进制分割掩码上,若前一帧图像的特征点在前一帧中所占用的超像素块与前一帧的二进制分割掩码相对应为前景时,则当前帧图像的对应特征点在当前帧中所占用的超像素块为前景,反之为背景;
排序模块,用于确定超像素图排序的指示向量,使用半监督的图排序技术得到当前帧图像的排序结果,进而获得当前帧图像的二进制分割掩码;
跟踪模块,用于根据当前帧图像的二进制分割掩码对目标进行定位和跟踪。
具体的,所述特征匹配模块,还用于:
分别提取连续两帧的图像对的特征点,基于特征点构造前一帧图像的内部关系图Gt-1=(Vt-1,Et-1,Qt-1,Rt-1)以及当前帧图像的内部关系图Gt=(Vt,Et,Qt,Rt),其中,Vt-1表示前一帧图像的特征点集合,Et-1表示前一帧图像中特征点与特征点之间的关系集合,Qt-1表示前一帧图像的特征点关联的属性向量,Rt-1表示前一帧图像中特征点与特征点之间形成的每个边eih∈Et-1的权重值集合;
构建用于求解前一帧图像与当前帧图像的特征点之间的匹配关系的通用目标函数
Figure BDA0002982606600000151
Figure BDA0002982606600000152
/>
其中,A表示前一帧图像与当前帧图像的特征点之间的匹配关系矩阵,vec(A)=(A11…A1n,…,Am1…Amn)T∈Rmn×1是A的向量形式,Amn表示节点vm∈Gt对应于节点vn∈Gt-1,m是当前帧图像的特征点总数,n是前一帧图像的特征点总数,W是用于表征前一帧图像与当前帧图像的特征点匹配程度的亲和矩阵,s.t.表示使得...满足...,是subject to的缩写,
Figure BDA0002982606600000157
表示任意;
根据通用目标函数,设定一对一匹配约束条件,构建如下待求目标函数公式
Figure BDA0002982606600000153
s.t.||A||1,2=1,A≥0
其中,
Figure BDA0002982606600000154
通过公式
Figure BDA0002982606600000155
更新前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的元素,直到待求目标函数收敛得到最优解,其中,Ai'j表示更新后的前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的第i行第j列元素,λ表示拉格朗日乘子且λ=vec(A)TWvec(A),T∈Rm×n是向量[Wvec(A)]的矩阵形式,Tij是矩阵T的第i行第j列元素,()T表示矩阵的转置。
具体的,所述超像素分割模块,还用于:
对每一帧图像使用简单线性迭代聚类算法进行超像素分割得到前一帧图像的超像素块表示为
Figure BDA0002982606600000156
和当前帧图像的超像素块/>
Figure BDA0002982606600000161
Nt-1表示前一帧图像的超像素的个数,Nt表示当前帧图像的超像素的个数,/>
Figure BDA0002982606600000162
表示前一帧图像的第Nt-1个超像素块,/>
Figure BDA0002982606600000163
表示当前帧图像的第Nt个超像素块;
将前一帧图像的特征点Pt-1=(p1 t-1,p2 t-1…pn t-1)按照超像素的分割结果映射到前一帧图像的二进制分割掩码M(t-1)上,pi t-1表示前一帧图像的第i个特征点,若pi t-1在前一帧图像中所占用的超像素块bkt-1与前一帧图像的二进制分割掩码M(t-1)相对应为前景时,则认为当前帧图像的第i个特征点pi t所占用的超像素块bjt为前景,反之为背景。
具体的,所述排序模块,还用于:
通过流形排序公式
Figure BDA0002982606600000164
获取当前帧图像的排序结果,其中,f表示每个节点的排序值且/>
Figure BDA0002982606600000165
sij表示亲和矩阵S中的第i行第j列的元素且/>
Figure BDA0002982606600000166
xi表示当前帧图像的超像素块的特征描述子矩阵/>
Figure BDA0002982606600000167
中的第i个元素,σ为尺度参数,d表示特征的维数,Nt表示当前帧的超像素的块数;dii是度矩阵D=diag{d11,...dNN}中的元素,且dii=∑jsij,μ是平衡参数,ui是指示向量/>
Figure BDA0002982606600000168
中的第i个元素,ui=1表示第i个超像素块是前景或者背景,ui=0表示第i个超像素块不确定其是前景还是背景;/>
若映射到前景的节点个数不为空,则以前景节点为指示向量进行流形排序得到最终排序结果
Figure BDA0002982606600000169
若映射到背景的节点个数不为空,则以背景节点为指示向量进行流形排序得到最终排序结果
Figure BDA00029826066000001610
若映射到前景的节点个数与映射到背景的节点个数都不为空,则以背景节点为指示向量进行流形排序得到的排序结果与以前景节点为指示向量进行流形排序得到的排序结果进行融合得到最终排序结果M(i)=Mb(i)×Mf(i)i=1,2,…,Nt
将最终排序结果作为当前帧图像的二进制分割掩码M(t)
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (6)

1.基于特征图匹配和超像素图排序的目标跟踪方法,其特征在于,所述方法包括:
步骤a:提取连续两帧的图像对的特征并进行特征点匹配;
步骤b:对前一帧图像进行超像素分割得到前一帧的超像素块,对当前帧图像进行超像素分割得到当前帧的超像素块,将前一帧图像的特征点按超像素块的分割结果映射到前一帧的二进制分割掩码上,若前一帧图像的特征点在前一帧中所占用的超像素块与前一帧的二进制分割掩码相对应为前景时,则当前帧图像的对应特征点在当前帧中所占用的超像素块为前景,反之为背景;
步骤c:确定超像素图排序的指示向量,使用半监督的图排序技术得到当前帧图像的排序结果,进而获得当前帧图像的二进制分割掩码;具体过程为:
通过流形排序公式
Figure FDA0003904863680000011
获取当前帧图像的排序结果,其中,f表示每个节点的排序值且
Figure FDA0003904863680000012
sij表示亲和矩阵S中的第i行第j列的元素且
Figure FDA0003904863680000013
xi表示当前帧图像的超像素块的特征描述子矩阵
Figure FDA0003904863680000014
中的第i个元素,σ为尺度参数,d表示特征的维数,Nt表示当前帧的超像素的块数;dii是度矩阵D=diag{d11,...dNN}中的元素,且dii=∑jsij,μ是平衡参数,ui是指示向量
Figure FDA0003904863680000015
中的第i个元素,ui=1表示第i个超像素块是前景或者背景,ui=0表示第i个超像素块不确定其是前景还是背景;
若映射到前景的节点个数不为空,则以前景节点为指示向量进行流形排序得到最终排序结果
Figure FDA0003904863680000021
若映射到背景的节点个数不为空,则以背景节点为指示向量进行流形排序得到最终排序结果
Figure FDA0003904863680000022
若映射到前景的节点个数与映射到背景的节点个数都不为空,则以背景节点为指示向量进行流形排序得到的排序结果与以前景节点为指示向量进行流形排序得到的排序结果进行融合得到最终排序结果M(i)=Mb(i)×Mf(i)i=1,2,…,Nt
将最终排序结果作为当前帧图像的二进制分割掩码M(t)
步骤d:根据当前帧图像的二进制分割掩码对目标进行定位和跟踪。
2.根据权利要求1所述的基于特征图匹配和超像素图排序的目标跟踪方法,其特征在于,所述步骤a,包括:
分别提取连续两帧的图像对的特征点,基于特征点构造前一帧图像的内部关系图Gt-1=(Vt-1,Et-1,Qt-1,Rt-1)以及当前帧图像的内部关系图Gt=(Vt,Et,Qt,Rt),其中,Vt-1表示前一帧图像的特征点集合,Et-1表示前一帧图像中特征点与特征点之间的关系集合,Qt-1表示前一帧图像的特征点关联的属性向量,Rt-1表示前一帧图像中特征点与特征点之间形成的每个边eih∈Et-1的权重值集合;
构建用于求解前一帧图像与当前帧图像的特征点之间的匹配关系的通用目标函数
Figure FDA0003904863680000023
Figure FDA0003904863680000024
其中,A表示前一帧图像与当前帧图像的特征点之间的匹配关系矩阵,vec(A)=(A11...A1n,...,Am1...Amn)T∈Rmn×1是A的向量形式,Amn表示节点vm∈Gt对应于节点vn∈Gt-1,m是当前帧图像的特征点总数,n是前一帧图像的特征点总数,W是用于表征前一帧图像与当前帧图像的特征点匹配程度的亲和矩阵,s.t.表示使得...满足...,是subject to的缩写,
Figure FDA0003904863680000031
表示任意;
根据通用目标函数,设定一对一匹配约束条件,构建如下待求目标函数公式
Figure FDA0003904863680000032
s.t.||A||1,2=1,A≥0
其中,
Figure FDA0003904863680000033
通过公式
Figure FDA0003904863680000034
更新前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的元素,直到待求目标函数收敛得到最优解,其中,A′ij表示更新后的前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的第i行第j列元素,λ表示拉格朗日乘子且λ=vec(A)TWvec(A),T∈Rm×n是向量[Wvec(A)]的矩阵形式,Tij是矩阵T的第i行第j列元素,()T表示矩阵的转置。
3.根据权利要求1所述的基于特征图匹配和超像素图排序的目标跟踪方法,其特征在于,所述步骤b,包括:
对每一帧图像使用简单线性迭代聚类算法进行超像素分割得到前一帧图像的超像素块表示为
Figure FDA0003904863680000035
和当前帧图像的超像素块
Figure FDA0003904863680000036
Nt-1表示前一帧图像的超像素的个数,Nt表示当前帧图像的超像素的个数,
Figure FDA0003904863680000037
表示前一帧图像的第Nt-1个超像素块,
Figure FDA0003904863680000038
表示当前帧图像的第Nt个超像素块;
将前一帧图像的特征点Pt-1=(p1 t-1,p2 t-1…pn t-1)按照超像素的分割结果映射到前一帧图像的二进制分割掩码M(t-1)上,pi t-1表示前一帧图像的第i个特征点,若pi t-1在前一帧图像中所占用的超像素块bk t-1与前一帧图像的二进制分割掩码M(t-1)相对应为前景时,则认为当前帧图像的第i个特征点pi t所占用的超像素块bj t为前景,反之为背景。
4.基于特征图匹配和超像素图排序的目标跟踪装置,其特征在于,所述装置包括:
特征匹配模块,用于提取连续两帧的图像对的特征并进行特征点匹配;
超像素分割模块,用于对前一帧图像进行超像素分割得到前一帧的超像素块,对当前帧图像进行超像素分割得到当前帧的超像素块,将前一帧图像的特征点按超像素块的分割结果映射到前一帧的二进制分割掩码上,若前一帧图像的特征点在前一帧中所占用的超像素块与前一帧的二进制分割掩码相对应为前景时,则当前帧图像的对应特征点在当前帧中所占用的超像素块为前景,反之为背景;
排序模块,用于确定超像素图排序的指示向量,使用半监督的图排序技术得到当前帧图像的排序结果,进而获得当前帧图像的二进制分割掩码;所述排序模块,还用于:
通过流形排序公式
Figure FDA0003904863680000041
获取当前帧图像的排序结果,其中,f表示每个节点的排序值且
Figure FDA0003904863680000042
sij表示亲和矩阵S中的第i行第j列的元素且
Figure FDA0003904863680000043
xi表示当前帧图像的超像素块的特征描述子矩阵
Figure FDA0003904863680000044
中的第i个元素,σ为尺度参数,d表示特征的维数,Nt表示当前帧的超像素的块数;dii是度矩阵D=diag{d11,...dNN}中的元素,且dii=∑jsij,μ是平衡参数,ui是指示向量
Figure FDA0003904863680000051
中的第i个元素,ui=1表示第i个超像素块是前景或者背景,ui=0表示第i个超像素块不确定其是前景还是背景;
若映射到前景的节点个数不为空,则以前景节点为指示向量进行流形排序得到最终排序结果
Figure FDA0003904863680000052
若映射到背景的节点个数不为空,则以背景节点为指示向量进行流形排序得到最终排序结果
Figure FDA0003904863680000053
若映射到前景的节点个数与映射到背景的节点个数都不为空,则以背景节点为指示向量进行流形排序得到的排序结果与以前景节点为指示向量进行流形排序得到的排序结果进行融合得到最终排序结果M(i)=Mb(i)×Mf(i)i=1,2,…,Nt
将最终排序结果作为当前帧图像的二进制分割掩码M(t)
跟踪模块,用于根据当前帧图像的二进制分割掩码对目标进行定位和跟踪。
5.根据权利要求4所述的基于特征图匹配和超像素图排序的目标跟踪装置,其特征在于,所述特征匹配模块,还用于:
分别提取连续两帧的图像对的特征点,基于特征点构造前一帧图像的内部关系图Gt-1=(Vt-1,Et-1,Qt-1,Rt-1)以及当前帧图像的内部关系图Gt=(Vt,Et,Qt,Rt),其中,Vt-1表示前一帧图像的特征点集合,Et-1表示前一帧图像中特征点与特征点之间的关系集合,Qt-1表示前一帧图像的特征点关联的属性向量,Rt-1表示前一帧图像中特征点与特征点之间形成的每个边eih∈Et-1的权重值集合;
构建用于求解前一帧图像与当前帧图像的特征点之间的匹配关系的通用目标函数
Figure FDA0003904863680000061
Figure FDA0003904863680000062
其中,A表示前一帧图像与当前帧图像的特征点之间的匹配关系矩阵,vec(A)=(A11...A1n,...,Am1...Amn)T∈Rmn×1是A的向量形式,Amn表示节点vm∈Gt对应于节点vn∈Gt-1,m是当前帧图像的特征点总数,n是前一帧图像的特征点总数,W是用于表征前一帧图像与当前帧图像的特征点匹配程度的亲和矩阵,s.t.表示使得...满足...,是subject to的缩写,
Figure FDA0003904863680000063
表示任意;
根据通用目标函数,设定一对一匹配约束条件,构建如下待求目标函数公式
Figure FDA0003904863680000064
s.t.||A||1,2=1,A≥0
其中,
Figure FDA0003904863680000065
通过公式
Figure FDA0003904863680000066
更新前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的元素,直到待求目标函数收敛得到最优解,其中,A′ij表示更新后的前一帧图像与当前帧图像的特征点之间的匹配关系矩阵中的第i行第j列元素,λ表示拉格朗日乘子且λ=vec(A)TWvec(A),T∈Rm×n是向量[Wvec(A)]的矩阵形式,Tij是矩阵T的第i行第j列元素,()T表示矩阵的转置。
6.根据权利要求4所述的基于特征图匹配和超像素图排序的目标跟踪装置,其特征在于,所述超像素分割模块,还用于:
对每一帧图像使用简单线性迭代聚类算法进行超像素分割得到前一帧图像的超像素块表示为
Figure FDA0003904863680000071
和当前帧图像的超像素块
Figure FDA0003904863680000072
Nt-1表示前一帧图像的超像素的个数,Nt表示当前帧图像的超像素的个数,
Figure FDA0003904863680000073
表示前一帧图像的第Nt-1个超像素块,
Figure FDA0003904863680000074
表示当前帧图像的第Nt个超像素块;
将前一帧图像的特征点Pt-1=(p1 t-1,p2 t-1…pn t-1)按照超像素的分割结果映射到前一帧图像的二进制分割掩码M(t-1)上,pi t-1表示前一帧图像的第i个特征点,若pi t-1在前一帧图像中所占用的超像素块bk t-1与前一帧图像的二进制分割掩码M(t-1)相对应为前景时,则认为当前帧图像的第i个特征点pi t所占用的超像素块bj t为前景,反之为背景。
CN202110290895.7A 2021-03-18 2021-03-18 基于特征图匹配和超像素图排序的目标跟踪方法及装置 Active CN113011324B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110290895.7A CN113011324B (zh) 2021-03-18 2021-03-18 基于特征图匹配和超像素图排序的目标跟踪方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110290895.7A CN113011324B (zh) 2021-03-18 2021-03-18 基于特征图匹配和超像素图排序的目标跟踪方法及装置

Publications (2)

Publication Number Publication Date
CN113011324A CN113011324A (zh) 2021-06-22
CN113011324B true CN113011324B (zh) 2023-03-24

Family

ID=76409696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110290895.7A Active CN113011324B (zh) 2021-03-18 2021-03-18 基于特征图匹配和超像素图排序的目标跟踪方法及装置

Country Status (1)

Country Link
CN (1) CN113011324B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107833243A (zh) * 2017-11-02 2018-03-23 兰州理工大学 基于超像素局部加权度量与反稀疏模型的跟踪方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616247B (zh) * 2015-02-10 2017-11-21 天津大学 一种用于基于超像素sift航拍地图拼接的方法
CN108537819A (zh) * 2017-03-03 2018-09-14 防城港市港口区思达电子科技有限公司 超像素运动目标检测方法
CN106997597B (zh) * 2017-03-22 2019-06-25 南京大学 一种基于有监督显著性检测的目标跟踪方法
CN107145870B (zh) * 2017-05-10 2020-01-21 成都优孚达信息技术有限公司 一种视频中人脸的识别系统
CN109034001B (zh) * 2018-07-04 2021-06-25 安徽大学 一种基于时空线索的跨模态视频显著性检测方法
CN109215061B (zh) * 2018-11-06 2022-04-19 广东工业大学 一种人脸毛孔跟踪方法及系统
CN110111338B (zh) * 2019-04-24 2023-03-31 广东技术师范大学 一种基于超像素时空显著性分割的视觉跟踪方法
US20210004962A1 (en) * 2019-07-02 2021-01-07 Qualcomm Incorporated Generating effects on images using disparity guided salient object detection

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107833243A (zh) * 2017-11-02 2018-03-23 兰州理工大学 基于超像素局部加权度量与反稀疏模型的跟踪方法

Also Published As

Publication number Publication date
CN113011324A (zh) 2021-06-22

Similar Documents

Publication Publication Date Title
CN108132968B (zh) 网络文本与图像中关联语义基元的弱监督学习方法
CN111898547B (zh) 人脸识别模型的训练方法、装置、设备及存储介质
WO2023000574A1 (zh) 一种模型训练方法、装置、设备及可读存储介质
CN108537264B (zh) 基于深度学习的异源图像匹配方法
CN108090472B (zh) 基于多通道一致性特征的行人重识别方法及其系统
CN108876797B (zh) 一种基于Spiking-SOM神经网络聚类的图像分割系统及方法
CN112347970B (zh) 一种基于图卷积神经网络的遥感影像地物识别方法
CN109299707A (zh) 一种基于模糊深度聚类的无监督行人再识别方法
CN112784913B (zh) 一种基于图神经网络融合多视图信息的miRNA-疾病关联预测方法及装置
CN109033107A (zh) 图像检索方法和装置、计算机设备和存储介质
CN110378366A (zh) 一种基于耦合知识迁移的跨域图像分类方法
CN112507901A (zh) 一种基于伪标签自纠正的无监督行人重识别方法
CN110765882B (zh) 一种视频标签确定方法、装置、服务器及存储介质
CN110751027B (zh) 一种基于深度多示例学习的行人重识别方法
CN110717953A (zh) 基于cnn-lstm组合模型的黑白图片的着色方法和系统
CN108846404A (zh) 一种基于相关约束图排序的图像显著性检测方法及装置
WO2023040195A1 (zh) 对象识别方法、网络的训练方法及装置、设备、介质及产品
CN112906517B (zh) 一种自监督的幂律分布人群计数方法、装置和电子设备
CN116090504A (zh) 图神经网络模型训练方法及装置、分类方法、计算设备
CN112069412B (zh) 信息推荐方法、装置、计算机设备及存储介质
CN113297936A (zh) 一种基于局部图卷积网络的排球群体行为识别方法
CN113378938A (zh) 一种基于边Transformer图神经网络的小样本图像分类方法及系统
CN113011324B (zh) 基于特征图匹配和超像素图排序的目标跟踪方法及装置
CN116758349A (zh) 基于多尺度超像素节点聚合图卷积残差网络的高光谱图像分类方法
CN113076963B (zh) 一种图像识别方法、装置和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant