CN113034537B

CN113034537B - 基于多几何模型融合的结构一致性运动分割方法和系统

Info

Publication number: CN113034537B
Application number: CN202110220558.0A
Authority: CN
Inventors: 许倩倩; 姜阳邦彦; 马坷; 杨智勇; 李朝鹏; 操晓春; 黄庆明
Original assignee: Institute of Computing Technology of CAS
Current assignee: Institute of Computing Technology of CAS
Priority date: 2021-02-26
Filing date: 2021-02-26
Publication date: 2023-03-07
Anticipated expiration: 2041-02-26
Also published as: CN113034537A

Abstract

本发明提出一种基于多几何模型融合的结构一致性运动分割方法，包括：根据目标视频中多个几何模型的跟踪点的已知轨迹信息，获取各跟踪点之间的相似度，构建为基础相似度矩阵；更新该基础相似度矩阵直至收敛；对该基础相似度矩阵进行聚合得到共识相似度矩阵；对该共识相似度矩阵进行谱聚类得到运动分割标签；通过该运动分割标签对该几何模型进行运动分割。还提出一种基于多几何模型融合的结构一致性运动分割系统，以及一种数据处理装置。

Description

基于多几何模型融合的结构一致性运动分割方法和系统

技术领域

本发明涉及计算机视觉的运动分割领域，特别涉及一种基于几何模型融合的运动分割方法及系统。

背景技术

运动分割是计算机视觉领域的一项重要技术，是视频目标检测、视频目标跟踪和分割、视觉监控等多种计算机视觉应用的上游任务。运动分割的目标是将多个运动对象分组成不同的簇，运动对象通常用视频序列中跟踪的特征点的轨迹集来表示。由于现实场景较为复杂，存在透视效应、运动物体的特征点分散、小物体等因素，因此很难进行高质量的运动分割。

根据每次分割涉及的帧数，运动分割相关技术可以分为基于两帧的方法和基于多帧的方法。与基于两帧的方法相比，基于多帧的方法利用视频片段中的所有帧获取运动信息，具有较高的性能。现有的基于多帧的方法主要分为三类。第一类是基于子空间的方法，通常基于仿射几何模型下轨迹位于多个子空间的并集这一假设，探索轨迹的子空间结构，其经典方法包括基于代数、信息论和谱聚类的模型。第二类是探索多模型拟合的方法，在存在数据损坏和异常值的情况下，利用多个模型假设估计模型参数。这类方法通常基于一致性学习、偏好融合、超图学习和能量最小化进行实现。第三类方法是基于融合的方法，聚合多个模型从而输出单一的结果。其中，通过聚合仿射几何模型、单应性几何模型和基本几何模型克服每种单一模型的不足，进而获得更高的性能。为了使运动分割模型能够处理各种真实场景，需要将这些基本模型进行整合，以得到一致的分割结果。现有的基于融合的方法在子集约束下得到具有成对一致的谱嵌入，忽略了相似度级别的结构一致性，因此保留了部分与真实情况不一致的相似度，导致分割结果变差。

发明内容

针对上述问题，本发明提出一种基于多几何模型融合的结构一致性运动分割方法，包括：根据目标视频中多个几何模型的跟踪点的已知轨迹信息，获取各跟踪点之间的相似度，构建为基础相似度矩阵；更新该基础相似度矩阵直至收敛；对该基础相似度矩阵进行聚合得到共识相似度矩阵；对该共识相似度矩阵进行谱聚类得到运动分割标签；通过该运动分割标签对该几何模型进行运动分割。

本发明所述的结构一致性运动分割方法，其中构建该基础相似度矩阵

的步骤具体包括：

获取该目标视频的F个连续帧中的N个跟踪点的轨迹

对于该目标视频的V个几何模型中的任一个，在每两个连续帧中随机采样M个最小数据点子集对该几何模型进行估计，以生成M个模型假设，并在F个连续帧中共采样得到M×(F-1)个模型假设；

为跟踪点的坐标；

根据每个

和每个模型假设之间的Sampson距离获取二者的残差向量，其中，第v个几何模型下第f个连续帧对中的第i个跟踪点的残差向量

基于

采用有序残差核得到两个跟踪点之间的相似度矩阵A^(v)，并除以整个目标视频中跟踪点对应的共现次数进行归一化，将从V个几何模型中得到的相似度生成矩阵，使用∈-近邻方法将该矩阵稀疏化，生成基础相似度矩阵

其中

本发明所述的结构一致性运动分割方法，其中更新

前对

进行初始化及矩阵元素分解，具体包括：

对于该目标视频的k个拟分割的运动数，

的每个矩阵元素A^(v)都为k-块对角矩阵，将数据点根据所属运动进行排序，得到

其中，

非单位矩阵，n_i表示第i类运动中跟踪点的个数，且满足∑_in_i＝N；

设置A^(v)的对角线元素为零，使用共享块对角掩码矩阵S和幅值矩阵G^(v)的逐元素乘积对每个几何模型的A^(v)进行分解，得到A^(v)＝S⊙G^(v)；其中，S中每个矩阵元素的上界值为S_max，G^(v)中每个矩阵元素的下界值为G_min，G_min≥0；

对于S施加k-块对角结构约束，最小化S对应的图拉普拉斯矩阵L_S的最小k个特征根，该约束等价于最小化S为最小化图拉普拉斯矩阵L_S与一新增变量U的内积，其中，U的迹为k，其特征根非负且均小于等于1；

初始化各变量

T为转置符号。

本发明所述的结构一致性运动分割方法，其中更新

的步骤具体包括：

固定S和U，更新

其中，

表示矩阵逐元素除法，a₁为第一更新参数；

固定G^(v)和U，更新S使得S中的元素

为：

其中，

a₂为第二更新参数；

固定S和G^(v)，更新

其中V为S的图拉普拉斯矩阵L_S的特征根对应的特征向量，l为前k个特征根中最后一个与后一个特征根不相等的特征根的序号，h为后N-k个特征根中首个与后一个特征根不相等的特征根的序号；

重复对S、G^(v)、U的更新步骤，直至S、G^(v)、U改变量的绝对值均不大于预设阈值。

本发明所述的结构一致性运动分割方法，其中通过聚合得到共识相似度矩阵A的步骤具体包括：

本发明还提出一种基于多几何模型融合的结构一致性运动分割系统，包括：基础相似度矩阵构建模块，用于根据目标视频中多个几何模型的跟踪点的已知轨迹信息，获取各跟踪点之间的相似度，构建为基础相似度矩阵；并更新该基础相似度矩阵直至收敛；共识相似度矩阵构建模块，用于对该基础相似度矩阵进行聚合得到共识相似度矩阵；运动分割模块，用于对该共识相似度矩阵进行谱聚类得到运动分割标签；通过该运动分割标签对该几何模型进行运动分割。

本发明所述的结构一致性运动分割系统，其中该基础相似度矩阵构建模块具体包括：获取该目标视频的F个连续帧中的N个跟踪点的轨迹X；对于该目标视频的几何模型生成M个模型假设，并在F个连续帧中共采样得到M×(F-1)个模型假设；

为跟踪点的数据点；获取每个

和每个模型假设之间的残差向量

基于

采用有序残差核得到两个跟踪点之间的相似度矩阵A^(v)，生成基础相似度矩阵

本发明所述的结构一致性运动分割方法，其中该共识相似度矩阵构建模块具体包括：矩阵元素分解模块，用于对A^(v)进行分解，获得的相关分解矩阵，该相关分解矩阵包括：共享块对角掩码矩阵S、幅值矩阵G^(v)和新增变量U；矩阵初始化模块，用于初始化S、G^(v)和U；矩阵更新模块，用于更新S、G^(v)和U以更新

矩阵聚合模块，用于通过聚合得到的共识相似度矩阵A。

本发明还提出一种计算机可读存储介质，存储有计算机可执行指令，当该计算机可执行指令被执行时，实现如前所述的基于多几何模型融合的结构一致性运动分割方法。

本发明还提出一种数据处理装置，包括如前所述的计算机可读存储介质，当该数据处理装置的处理器调取并执行该计算机可读存储介质中的计算机可执行指令时，执行对目标视频的基于多几何模型融合的结构一致性运动分割方法。

附图说明

图1是本发明的基于多几何模型融合的结构一致性运动分割方法流程图。

图2是本发明的数据处理装置示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图，对本发明进一步详细说明。应当理解，此处所描述的具体实施方法仅仅用以解释本发明，并不用于限定本发明。

发明人在进行运动分割算法研究时，发现现有的基于融合的方法在子集约束下得到具有成对一致的谱嵌入，忽略了相似度级别的一致性，因此仍然不能得到与实际情况一致的结果。具体而言，仿射、单应性和基本几何模型存在不同的关联问题：仿射模型很难处理透视效果；单应模型得到的同一刚体运动的不同平面之间的相似度较弱，不利于分散对象的分组；基本模型可以发现轨迹之间更丰富的信息，但是可能检测到假阳性相似度，导致相似度矩阵中含有重叠子空间结构。因此，仅通过简单的融合操作学习特定于模型的谱嵌入容易受到错误的相似度的影响，例如，不相关运动轨迹间过大的基本相似度，或者由离群值引起的非零相似度。因此，如何从这些基础模型得到的相似度中自动选择有价值的模式成为关键问题。此外，由于理想的相似度矩阵是块对角的，本发明通过探究多个基础相似度矩阵的结构一致性来学习其共识相似度矩阵。

本发明的目的是解决多几何模型运动分割方法中如何从多个基础几何模型中自动选择有价值的模式的问题，现有的基于融合的方法在子集约束下得到具有成对一致的谱嵌入，忽略了相似度级别的结构一致性，因此保留了部分与真实情况不一致的相似度，导致分割结果变差。为此，本发明提出一种新的基于多几何模型融合的结构一致性运动分割方法，通过构造一个共识相似度矩阵来实现所有几何模型之间的相似度级别的分割一致性。

本发明利用基础相似度矩阵之间共享的块对角结构信息，来选择相似关系中有价值的模式，即满足语义一致性的元素，利用乘性分解将基础相似度矩阵分解为共享的结构掩码矩阵与不共享的幅值矩阵的逐元素乘积，并使用一个结构正则化项约束共享结构掩码矩阵使其具有块对角结构，确保了多个相似度矩阵的结构一致性；还提出了求解该问题的具有全局收敛性的交替优化方法。

图1是本发明的基于多几何模型融合的结构一致性运动分割方法流程图。如图1所示，本发明提出的基于多几何模型融合的结构一致性运动分割方法，包括以下步骤：

S1、使用给定的轨迹信息从目标视频的V个几何模型中构建基础相似度矩阵

具体包括：

S11、给定目标视频的F个连续帧中的N个跟踪点的轨迹

拟合V个几何模型的参数得到模型假设。对于每一个几何模型，在每两个连续帧中随机采样M个最小数据点子集对模型进行估计，生成M个模型假设。因此，每个几何模型中可以采样得到M×(F-1)个模型假设。

S12、基于得到的模型假设，根据每个

和每个模型假设之间的Sampson距离计算二者的残差。可得，第v个几何模型下第f个连续帧对中的第i个跟踪点的残差向量为：

S13、采用有序残差核(ORK)计算得到两个跟踪点之间的相似性，并除以整个帧中对应的共现次数进行归一化。作为习惯性步骤，使用∈-近邻方法将相似度矩阵稀疏化，从而得到相似度矩阵

其中，相似度

为所有N×N的实数方阵的集合。

S2、初始化相关矩阵变量并对每个几何模型的A^(v)进行分解；具体包括：

S21、理想情况下，属于不同运动的点之间的相似度应该为0。因此，每个A^(v)至少有k个连通分量(k为拟分割的运动数)，即每个A^(v)都为k-块对角矩阵。当将数据点根据其所属运动进行排序时，A^(v)可表示为：

其中

非单位矩阵，n_i表示第i类运动中跟踪点的个数，且满足∑_in_i＝N。显然，所有A^(v)的n_i均相同，因此其具有一致的块对角结构。

S22、使用共享块对角掩码矩阵S和幅值矩阵G^(v)的逐元素乘积对每个模型的A^(v)进行分解，即A^(v)＝S⊙G^(v)。在本发明中，期望S专注于捕获所有A^(v)共享的一致结构，期望G^(v)保持该结构中元素的幅值大小，从而从所有基础相似度矩阵中尽可能挖掘具有一致共识的元素。

S23、对于矩阵S中的每个元素，使用预定义的上界值S_max限制其大小，防止其主导乘法并且强迫其聚焦于结构信息。

S24、对于矩阵G^(v)中的每个元素，使用一个非负的下界值G_min避免G^(v)产生非零元素，防止S⊙G^(v)对应位置出现零元素，破坏结构。

S25、考虑到A^(v)的对角线项的值不会影响之后的谱聚类，因此在分割前手动将这些对角线元素设置为零。这也产生S和G^(v)的一个约束条件，即它们的对角线元素应为零。

S25、对于S施加k-块对角结构约束保证其结构一致性，即最小化S对应的图拉普拉斯矩阵L_S的最小k个特征根。该约束等价于最小化图拉普拉斯矩阵L_S与一新增变量U的内积，且U需满足迹为k、特征根非负同时均小于等于1。

S26、初始化各变量

其中，1_N为元素均为1，长度为N的列向量，

为元素均为1，长度为N的行向量，T为转置符号，

为N×N的全1方阵，I_N为N×N的单位矩阵。

S3、分别按给定规则更新相关矩阵变量直至收敛；

S31、固定S和U，更新G^(v)。新的G^(v)为

其中

代表矩阵逐元素除法。

S32、固定G^(v)和U，更新S。新的S中的元素为：

其中

S33、固定S和G^(v)，更新U。新的U为

其中V为S的图拉普拉斯矩阵L_S的特征根(升序排列)对应的特征向量，l为前k个特征根中最后一个与后一个特征根不相等的特征根的序号，h为后N-k个特征根中首个与后一个特征根不相等的特征根的序号。

S34、重复步骤S31-S33，直至S、G^(v)、U改变量的绝对值均不大于预设阈值(如0.001)。该算法具有全局收敛性质，即对S、G^(v)、U的任意初始值均可收敛到一最优点，不会围绕最优点震荡。

S4、按给定规则聚合得到共识相似度矩阵

S5、对共识相似度矩阵A进行谱聚类得到运动分割标签y；

S6、以运动分割标签y对目标视频进行运动分割。

图2是本发明的数据处理装置示意图。如图2所示，本发明实施例还提供一种计算机可读存储介质，以及一种数据处理装置。本发明的计算机可读存储介质存储有计算机可执行指令，计算机可执行指令被数据处理装置的处理器执行时，实现上述基于多几何模型融合的结构一致性运动分割方法。本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器、FPGA、ASIC等)完成，所述程序可以存储于可读存储介质中，如只读存储器、磁盘或光盘等。上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地，上述实施例中的各模块可以采用硬件的形式实现，例如通过集成电路来实现其相应功能，也可以采用软件功能模块的形式实现，例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本发明实施例不限制于任何特定形式的硬件和软件的结合。

该发明提出的基于多几何模型融合的结构一致性运动分割方法，通过构造一个共识相似度矩阵来实现所有几何模型之间的相似度级别的分割一致性。同时，提出一种交替更新变量的方法，且具有良好的全局收敛性。

以上实施方式仅用于说明本发明，而并非对本发明的限制，有关技术领域的普通技术人员，在不脱离本发明的精神和范围的情况下，还可以做出各种变化和变形，因此所有等同的技术方案也属于本发明的范畴，本发明的专利保护范围应由权利要求限定。

Claims

1.一种基于多几何模型融合的结构一致性运动分割方法，其特征在于，包括：

获取目标视频的F个连续帧中的N个几何模型的跟踪点的轨迹

对于该目标视频的V个几何模型中的任一个，在每两个连续帧中随机采样M个最小数据点子集对该几何模型进行估计，以生成M个模型假设，并在F个连续帧中共采样得到M×(F-1)个模型假设；根据每个

基于

为跟踪点的坐标，

更新该基础相似度矩阵

直至收敛；更新

前对

进行初始化及矩阵元素分解，具体包括：

对于该目标视频的k个拟分割的运动数，

其中，

初始化各变量G^(v)←0，

U←I_N，T为转置符号；

对该基础相似度矩阵

进行聚合得到共识相似度矩阵；

对该共识相似度矩阵进行谱聚类得到运动分割标签；通过该运动分割标签对该几何模型进行运动分割。

2.如权利要求1所述的结构一致性运动分割方法，其特征在于，更新

的步骤具体包括：

固定S和U，更新

其中，

表示矩阵逐元素除法，ɑ₁为第一更新参数；

固定G^(v)和U，更新S使得S中的元素

其中，

ɑ₂为第二更新参数；

固定S和G^(v)，更新

3.如权利要求2所述的结构一致性运动分割方法，其特征在于，通过聚合得到共识相似度矩阵A的步骤具体包括：

4.一种基于多几何模型融合的结构一致性运动分割系统，其特征在于，包括：

基础相似度矩阵构建模块，用于根据目标视频中多个几何模型的跟踪点的已知轨迹信息，获取各跟踪点之间的相似度，构建为基础相似度矩阵；并更新该基础相似度矩阵直至收敛；其中，获取目标视频的F个连续帧中的N个几何模型的跟踪点的轨迹

基于

其中，

为跟踪点的坐标，

更新该基础相似度矩阵

直至收敛；更新

前对

进行初始化及矩阵元素分解，具体包括：对于该目标视频的k个拟分割的运动数，

非单位矩阵，n_i表示第i类运动中跟踪点的个数，且满足∑_in_i＝N；设置A^(v)的对角线元素为零，使用共享块对角掩码矩阵S和幅值矩阵G^(v)的逐元素乘积对每个几何模型的A^(v)进行分解，得到A^(v)＝S⊙G^(v)；其中，S中每个矩阵元素的上界值为S_max，G^(v)中每个矩阵元素的下界值为G_min，G_min≥0；对于S施加k-块对角结构约束，最小化S对应的图拉普拉斯矩阵L_S的最小k个特征根，该约束等价于最小化S为最小化图拉普拉斯矩阵L_S与一新增变量U的内积，其中，U的迹为k，其特征根非负且均小于等于1；初始化各变量G^(v)←0，