CN112308877B

CN112308877B - 基于异质模型拟合的运动分割方法

Info

Publication number: CN112308877B
Application number: CN202011165026.3A
Authority: CN
Inventors: 王菡子; 林舒源; 江斓; 严严
Original assignee: Xiamen University
Current assignee: Xiamen University
Priority date: 2020-10-27
Filing date: 2020-10-27
Publication date: 2022-05-17
Anticipated expiration: 2040-10-27
Also published as: CN112308877A

Abstract

基于异质模型拟合的运动分割方法，涉及计算机视觉技术。首先，使用基于密度估计技术的投票方法，通过对异质模型假设质量的评价，生成高质量的累积相关矩阵。在此基础上，利用信息论构造稀疏亲和矩阵的方法，有效地抑制了不同目标之间的关联值。最后，利用归一化谱聚类算法对融合后的稀疏亲和矩阵进行分割，得到准确的分割结果。解决现有技术存在的真实场景中外界的光照变化、运动物体的表观和遮挡，可能会导致跟踪点包含异常值和噪声等问题。

Description

基于异质模型拟合的运动分割方法

技术领域

本发明涉及计算机视觉技术，具体是涉及一种基于异质模型拟合的运动分割方法。

背景技术

运动分割是计算机视觉领域一个具有挑战性的研究课题。运动分割的任务是根据不同的运动属性对视频序列中的运动对象进行分组。这是视频分割和场景理解的重要步骤。运动分割已被广泛应用于视频处理[1]、视觉监控[2]、目标识别[3]和动态场景理解[4,5]等。在实际应用中，真实场景中运动目标的跟踪点轨迹往往会受到遮挡和透视效果的破坏，这对有效地分割运动对象提出了很大的挑战。

在过去的几十年里，学者们提出了许多运动分割方法[6-10]。这些方法大致可分为基于两帧的方法和基于多帧的方法。与基于两帧的方法相比，基于多帧的方法通常可以捕获多帧之间的运动信息以获得更精确的结果。现有的基于多帧的方法可以进一步分为基于子空间的方法[11-14]和基于相似性的方法[9,10,15,16]。基于子空间的方法将跟踪点的聚类问题转化为跟踪点的标记问题。每个跟踪点由相应子空间中其他跟踪点的线性组合表示。与此相反，基于相似性的方法则使用谱聚类来分割与跟踪点对应的相似性矩阵，该矩阵包含所有跟踪点对之间的相似性。以上方法大多依赖于跟踪点的质量，也就是说，跟踪点的质量反映了运动目标的特性。然而，真实场景中外界的光照变化、运动物体的表观和遮挡，可能会导致跟踪点包含异常值和噪声。

参考文献：

[1]Junjue Wang,Brandon Amos,Anupam Das,Padmanabhan Pillai,NormanSadeh,and Mahadev Satyanarayanan.Enabling live video analytics with ascalable and privacy-aware framework.ACM Transactions on MultimediaComputing,Communications,and Applications,14(3):1–24,2018.

[2]Xiaobai Liu,Yadong Mu,Yu-Gang Jiang,and Jiebo Luo.Vscc’2017:Visualanalysis for smart and connected communities.In Proceedings of the ACMInternational Conference on Multimedia,pages 1976–1977,2017.

[3]Xindi Shang,Junbin Xiao,Donglin Di,and Tat-Seng Chua.Relationunderstanding in videos:A grand challenge overview.In Proceedings of the ACMInternational Conference on Multimedia,pages 2652–2656,2019.

[4]Ali Elqursh and Ahmed Elgammal.Online motion segmentation usingdynamic label propagation.Proceedings of the IEEE International Conference onComputer Vision,pages 2008–2015,2013.

[5]Stefano Alletto,Giuseppe Serra,and Rita Cucchiara.Motionsegmentation using visual and bio-mechanical features.In Proceedings of theACM International Conference on Multimedia,pages 476–480,2016.

[6]Gerald Khne,Stephan Richter,and Markus Beier.Motion-basedsegmentation and contour-based classification of video objects.In Proceedingsof the ACM international conference on Multimedia,pages 41–50,2001.

[7]Yong Dian Jian and Chu Song Chen.Two-view motion segmentation withmodel selection and outlier removal by ransac-enhanced dirichlet processmixture models.International Journal of Computer Vision,88(3):489–501,2010.

[8]Bryan Poling and Gilad Lerman.A new approach to two-view motionsegmentation using global dimension minimization.International Journal ofComputer Vision,2013.

[9]Zhuwen Li,Jiaming Guo,Loong Fah Cheong,and Steven ZhiyingZhou.Perspective motion segmentation via collaborative clustering.InProceedings of the IEEE International Conference on Computer Vision,volume 2,pages 1369–1376,2013.

[10]Heechul Jung,Jeongwoo Ju,and Junmo Kim.Rigid motion segmentationusing randomized voting.In Proceedings of the IEEE Conference on ComputerVision and Pattern Recognition,pages 1210–1217,2014.

[11]Shankar Rao,Roberto Tron,Rene Vidal,and Yi Ma.Motion segmentationin the presence of outlying,incomplete,or corrupted trajectories.IEEETransactions on Pattern Analysis and Machine Intelligence,32(10):1832–1845,2010.

[12]Tat-Jun Chin,Hanzi Wang,and David Suter.The ordered residualkernel for robust motion subspace clustering.In Proceedings of the Advancesin Neural Information Processing Systems,pages 333–341,2009.

[13]Jiashi Feng,Zhouchen Lin,Huan Xu,and Shuicheng Yan.Robustsubspace segmentation with block-diagonal prior.In Proceedings of the IEEEConference on Computer Vision and Pattern Recognition,pages 3818–3825,2014.

[14]Ren Vidal,Roberto Tron,and Richard Hartley.Multiframe motionsegmentation with missing data using PowerFactorization andGPCA.International Journal of Computer Vision,79(1):85–105,2008.

[15]Ralf Dragon,Bodo Rosenhahn,and Jorn Ostermann.Multiscaleclustering of frame-to-frame correspondences for motion segmentation.InProceedings of the European Conference on Computer Vision,pages 445–458,2012.

[16]Peter Ochs,Jitendra Malik,and Thomas Brox.Segmentation of movingobjects by long term video analysis.IEEE Transactions on Pattern Analysis andMachine Intelligence,36(6):1187–1200,2013.

发明内容

本发明的目的在于针对现有技术存在的真实场景中外界的光照变化、运动物体的表观和遮挡，可能会导致跟踪点包含异常值和噪声等问题,提供一种结果准确的基于异质模型拟合的运动分割方法。

本发明包括以下步骤：

A.准备一个运动分割数据集(一个包含

个连续帧的视频，其中，每个连续帧包含一组跟踪点X)。给定指定异质参数模型V(仿射矩阵A、基础矩阵F与单应性矩阵H)。

B.对于每一个参数模型v∈V，计算参数模型v的累积相关矩阵Θ^(v)；

C.根据步骤B中的累积相关矩阵Θ^(v)，利用信息论获取自适应阈值来移除不显著的矩阵元素，得到精密累积相关矩阵

D.根据步骤D中的

构造稀疏亲和矩阵，以有效抑制不同目标之间的关联值；

E.根据步骤D中的稀疏亲和矩阵Ω^(v)，利用归一化谱聚类算法对融合后的稀疏亲和矩阵进行分割；

F.输出分割结果。

在步骤B中，所述对于每一个参数模型v∈V，计算参数模型v的累积相关矩阵Θ^(v)的具体步骤为：

B1.在每一个连续帧

中，随机采样跟踪点，生成M个模型假设；其中，仿射矩阵A、基础矩阵F与单应性矩阵H生成的模型假设，分别对应

B2.计算该模型假设集的残差信息。点

到模型假设集的残差向量定义如下：

其中，v∈V。这里，V代表不同的参数模型(仿射矩阵A、基础矩阵F与单应性矩阵H)。

之后，降序排列该残差向量元素，得到一个置换：

满足

这里，

描述了数据点与模型假设的偏好关系。

B3.计算跟踪点两两之间的相关性Φ，跟踪点

与

的相关性定义如下：

其中，|·∩·|表示两个置换之间共享相同索引的元素的交集；

表示置换的前c项；c是窗口大小，实验设置为c＝0.1×M；

B4.根据步骤B3所计算的跟踪点之间的相关性，构造相关矩阵Φ^(v)f：

B5.根据步骤B4计算的相关矩阵Φ^(v)f，利用基于密度估计技术的投票方法，计算该连续帧的投票分数D^(v)f，步骤如下：

给定第j个模型假设

使用密度估计方法计算投票分数

其中，

是Epanechnikov核函数；

是带宽；

是使用IKOSE估计的内点尺度。

每对连续帧的累积投票分数D^(v)f的公式如下：

B6.根据步骤B5得到的累积投票分数，计算累积相关矩阵Θ^(v)，如下所示：

B7.执行步骤B1～B6处理所有连续帧，利用相关矩阵集Φ^(v)与连续帧的投票分数集D^(v)，计算所有参数模型v∈V的累积相关矩阵Θ^(v)。

在步骤C中，所述利用信息论获取自适应阈值来移除不显著的矩阵元素，得到精密累积相关矩阵

的具体步骤如下：

首先定义Θ^(v)第j列(即

)与

的第i项(即

)的最大值之间的间隙μ_i：

其中，γ是一个参数，用于调整相关矩阵的稀疏性。

接着，先验概率p(μ_i)计算如下:

先验概率的熵测量如下：

将熵作为一个自适应阈值，用于去除不重要的元素：

其中，τ是无穷小的正数。

表示精密相关矩阵。

在步骤D中，所述构造稀疏亲和矩阵Ω^(v)如下：

在步骤E中，所述根据步骤D中的稀疏亲和矩阵Ω^(v)，利用归一化谱聚类算法对融合后的稀疏亲和矩阵进行分割的具体步骤可为：将D^(v)定义为稀疏亲和矩阵Ω^(v)的对角矩阵，Ω^(v)的对称归一化拉普拉斯矩阵L^(v)计算如下：

假设L^(v)的特征值分解(EVD)为Q^(v)TQ^(v)，则L^(v)的分解转化为如下优化函数：

其中，trace(·)表示迹运算；Q^(v)和I分别是特征向量矩阵和单位矩阵。

根据Q^(v)，得到融合谱嵌入矩阵Q：

Q＝Σ_v∈VQ^(v) (公式15)

将单位长度内的每一行Q规范化，形成矩阵Z，如下所示：

最后，使用一种简单而有效的K-means算法将Z聚类成k簇，即将跟踪点分割成k个运动组。

本发明提出一种基于异质模型拟合的运动分割方法。首先，使用基于密度估计技术的投票方法，通过对异质模型假设质量的评价，生成高质量的累积相关矩阵。在此基础上，利用信息论构造稀疏亲和矩阵的方法，有效地抑制了不同目标之间的关联值。最后，利用归一化谱聚类算法对融合后的稀疏亲和矩阵进行分割，得到准确的分割结果。

附图说明

图1为本发明实施例的流程图。(a)带有跟踪点(用黄色标记)的输入视频序列。(b)通过采样最小子集生成三种类型的模型假设(以红色标记)。(c)构造了相应的三个参数模型的相关矩阵。(d)生成累积相关矩阵。(e)构造了稀疏亲和矩阵。(f)根据融合后的稀疏亲和矩阵对多个运动目标进行分割。(g)最终分割结果。不同运动物体的跟踪点用不同的颜色标记。

图2为本发明在Hopkins155(a-d)、Hopkins12(e-h)和MTPV62(i-l)数据集部分结果图。

图3为本发明在KT3DMoSeg数据集上的部分结果。(a)为正确的标注结果，(b)为本发明的方法的分割结果。第一行到第四行为别为Seq013 Clip01，Seq011 Clip01，Seq009Clip03和Seq038 Clip01。不同运动物体的跟踪点用不同的颜色标记。

具体实施方式

以下实施例将结合附图对本发明作进一步的说明，但本发明的保护范围不限于下述的实施例。

参见图1，本发明实施例的包括以下步骤：

S1.准备一个运动分割数据集(一个包含

S2.对于每一个参数模型v∈V，计算参数模型v的累积相关矩阵Θ^(v)，具体步骤为：

S2-1.在每一个连续帧

S2-2.计算该模型假设集的残差信息。点

到模型假设集的残差向量定义如下：

之后，降序排列该残差向量元素，得到一个置换：

满足

这里，

描述了数据点与模型假设的偏好关系。

S2-3.计算跟踪点两两之间的相关性Φ，跟踪点

与

的相关性定义如下：

其中|·∩·|表示两个置换之间共享相同索引的元素的交集。

表示置换的前c项；c是窗口大小，实验设置为c＝0.1×M。

S2-4.根据S2-3所计算的跟踪点之间的相关性，构造相关矩阵Φ^(v)f：

S2-5.根据S2-4计算的相关矩阵Φ^(v)f，利用基于密度估计技术的投票方法，计算该连续帧的投票分数D^(v)f。步骤如下：

给定第j个模型假设

使用密度估计方法计算投票分数

其中，

是Epanechnikov核函数；

是带宽；

是使用IKOSE估计的内点尺度。

每对连续帧的累积投票分数D^(v)f的公式如下：

S2-6.根据步骤S2-5得到的累积投票分数，计算累积相关矩阵Θ^(v)，如下所示：

S2-7.执行步骤(B1-B6)处理所有连续帧，利用相关矩阵集Φ^(v)与连续帧的投票分数集D^(v)，计算所有参数模型v∈V的累积相关矩阵Θ^(v)。

S3.根据步骤B中的累积相关矩阵Θ^(v)，利用信息论获取自适应阈值来移除不显著的矩阵元素，得到精密累积相关矩阵

具体步骤如下：

首先定义Θ^(v)第j列(即

)与

的第i项(即

)的最大值之间的间隙μ_i：

其中，γ是一个参数，用于调整相关矩阵的稀疏性。

接着，先验概率p(μ_i)计算如下：

先验概率的熵测量如下：

将熵作为一个自适应阈值，用于去除不重要的元素：

其中，τ是无穷小的正数。

表示精密相关矩阵。

S4.根据步骤D中的

构造稀疏亲和矩阵，以有效抑制不同目标之间的关联值。

构造稀疏亲和矩阵Ω^(v)：

S5.根据步骤D中的稀疏亲和矩阵Ω^(v)，利用归一化谱聚类算法对融合后的稀疏亲和矩阵进行分割。

将D^(v)定义为稀疏亲和矩阵Ω^(v)的对角矩阵，Ω^(v)的对称归一化拉普拉斯矩阵L^(v)计算如下：

根据Q^(v)，得到融合谱嵌入矩阵Q：

Q＝Σ_v∈VQ^(v) (公式15)

将单位长度内的每一行Q规范化，形成矩阵Z，如下所示：

S6.输出分割结果。

本发明在4个具有挑战性的数据集(Hopkins155、Hopkins12、MTPV62和KT3DMoSeg)上进行运动分割的部分的结果如图2～3所示。图2(a-d)为本发明的方法在Hopkins155数据集上的结果；图2(e-h)为本发明的方法在Hopkins12数据集上的结果；图2(i-l)为本发明的方法在MTPV62数据集上的结果，不同运动物体的跟踪点可用不同的颜色标记。图3(b)为本发明的方法在KT3DMoSeg数据集上的结果。

由实验结果所示，本发明所提出的基于异质模型拟合的运动分割方法获得了较准确的分割结果。