CN107808391B

CN107808391B - 一种基于特征选择与光滑表示聚类的视频动态目标提取方法

Info

Publication number: CN107808391B
Application number: CN201711030113.6A
Authority: CN
Inventors: 郑建炜; 路程; 杨平; 秦梦洁; 杨弘; 陈婉君
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2017-10-30
Filing date: 2017-10-30
Publication date: 2020-10-02
Anticipated expiration: 2037-10-30
Also published as: CN107808391A

Abstract

一种基于特征选择与光滑表示聚类的视频动态目标提取方法，包括如下步骤：(1)对视频数据进行预处理，编码成视频序列矩阵Y；(2)以视频序列矩阵Y为输入，建立FSSR聚类模型；(3)使用增广拉格朗日函数和交替方向乘子法对聚类模型进行优化，获得最优系数矩阵Z^*；(4)使用公式(|Z^*|+|Z^*T|)/2，计算关联矩阵S；(5)使用规范化分割算法对关联矩阵S进行分割，根据聚类结果获取动态目标图像。本发明具有运行效率高、数据适应性强、准确度高、运动一致性强等的优点，非常适合高维特征视频数据的目标提取。

Description

一种基于特征选择与光滑表示聚类的视频动态目标提取方法

技术领域

本发明涉及一种基于特征选择与光滑表示聚类的视频动态目标提取方法，可用于目标跟踪和目标检测。

背景技术

计算机视觉中对视频序列场景的分析和理解是其中一项重要的研究内容，其应用包括：视频编码、治安监控、智能交通、自动导航、机器视觉、医学图像、气象图像等等。视频序列场景的分析和理解包括运动目标的跟踪、检测、分割、估计和识别，其中对动态目标的提取是视频序列场景分析和理解的前提。

视频动态目标提取的关键问题是根据场景中提取的视觉特征，对视频序列中不同的运动物体进行聚类划分。常用的视频动态目标提取算法分为三个大类：基于透视几何约束的算法，例如对极几何和Planar-Parallax分解；基于仿射相机模型的算法，例如子空间聚类；基于轨迹相似性的聚类算法，例如光流法。

近几年国内外很多学者采用仿射相机模型，利用高维数据中存在的低维子结构，将视频动态目标提取问题转化为子空间划分问题，借助相关的子空间聚类算法很好的解决了视频动态目标提取中鲁棒性、相机运动、大规模高维数据等问题。基于子空间聚类的视频动态目标提取方法构造衡量数据点两两之间相似程度的关联矩阵，利用相关的谱聚类方法划分关联矩阵，最终完成视频动态目标提取。相关的子空间聚类算法众多，当中最为典型的是低秩子空间聚类和稀疏子空间聚类。稀疏子空间聚类利用数据本身作为字典，寻找每个数据点关于其他数据点的最优稀疏表示；低秩子空间聚类利用整个数据作为字典，寻找每个数据点关于其他数据点的最优低秩表示。低秩表示带有全局约束，稀疏表示对表示系数不带有显式的全局约束，抗噪声干扰方面表现较好，而这两种方法在数据信噪比小、子空间不相互独立时，其构造的关联矩阵块对角结构较差，从而不利于正确聚类。

特征选择(Feature Selection)是指从原始特征集合中选择相关特征子集的操作，实际应用中，越来越多的高维数据降低了学习性能，特征选择是解决这一问题的有效方法。

规范化分割(Normalized cut)算法是基于Shi和Malik在2000年建立的2-way划分的规范割目标函数的谱聚类分割方法。该方法不仅能够衡量类内样本间的相似程度,也能衡量类间样本间的相异程度。

发明内容

本发明要解决传统视频动态目标提取技术中存在高维数据计算复杂、实时性差、抗噪声能力差等缺点，提供一种基于特征选择与光滑表示聚类的视频动态目标提取方法，可用于目标跟踪和目标检测。

针对实际视频数据存在的高维特征，使用特征选择操作进行维数约简，进一步使用权值因子来衡量特征相关贡献度；鉴于传统稀疏与低秩表示存在的块对角化的苛刻条件，使用具有组效应的迹范数约束表示系数矩阵，增强其块对角化，通过提高子空间聚类的准确率最终提高视频动态目标提取的准确度。本发明提出的基于特征选择与光滑表示聚类(Feature Selection and Smooth Representation,FSSR)的视频动态目标提取方法，包括如下步骤：

步骤1，对视频数据进行预处理，编码生成视频序列矩阵Y；

步骤2，以视频序列矩阵Y为输入，建立FSSR聚类模型；

步骤3，使用增广拉格朗日函数和交替方向乘子法对聚类模型进行优化，获得最优系数矩阵Z^*；

步骤4，使用公式(|Z^*|+|Z^*T|)/2，计算关联矩阵S；

步骤5，使用规范化分割算法对关联矩阵进行分割，根据聚类结果获取动态目标图像。

本发明的优点是：具有运行效率高、数据适应性强、准确度高、运动一致性强等的优点，非常适合高维特征视频数据的目标提取。

附图说明

图1是本发明的视频序列矩阵结构图。

图2是本发明的流程图。

图3是本发明的输入视频与各类目标输出图像。

图4是本发明的实施结构图。

具体实施方式

下面结合附图，进一步说明本发明的技术方案。

一种基于特征选择与光滑表示聚类的视频动态目标提取方法，包括如下步骤：

步骤1，视频序列数据预处理。假设视频序列为f＝[1,2,…,F]，共F帧，我们选取N个像素点，对每一帧的N个像素点

进行提取和跟踪。这样就得到N条链，又称为像素轨迹，每条链表示为一个长度为2F的向量

N条像素轨迹组合成一个2F×N的矩阵Y＝[y₁,y₂,…,y_N]∈R^2F×N。如图1所示。

步骤2，以视频序列矩阵Y为输入，建立FSSR聚类模型

s.t.p^T1＝1 p_i≥0

其中Z是表示系数矩阵，p是特征选择向量，L是拉普拉斯矩阵，L＝D–W，D是对角度矩阵，

W＝(w_ij)为相似图，w_ij＝||y_i-y_j||₂代表两个数据点之间的距离相似度，本发明采用0-1权重来构造k近邻(k-nearest neighbor,knn)图W，λ为正则项系数，tr(·)是矩阵的迹。

步骤3，使用增广拉格朗日函数和交替方向乘子法(Alternating DirectionMethod ofMultipliers,ADMM)对函数模型优化。引入虚变量J＝Z，根据增广拉格朗日函数可以使目标模型转化为如下形式

s.t.p^T1＝1 p_i≥0

最优表示系数矩阵Z^*的求解过程如下：

输入：视频序列矩阵Y，参数值λ，ρ和κ，最大迭代数t_max

初始化：Z，J，p，Θ，t＝0

迭代31–34

31.根据式(1)计算辅助变量J；

J＝(Y^Tdiag²(p)Y+ρI)^-1(Y^Tdiag²(p)Y+ρZ-Θ) (1)

32.根据式(2)计算表示系数矩阵Z；

Z＝(ρJ+Θ)(2λL+ρI)^-1 (2)

33.根据式(3)计算特征权值p；

p＝P_M(p) (3)

设

则p的初始解为

当设定特征选择参数M后，根据p的初始值对p_i进行降序排序p₁≥p₂≥,...,≥p_M≥p_M+1≥,...,≥p_d≥0，当i≤M时，p_i保持初始值

不变；当i>M时，p_i置为0，P_M是表示这一关系的算子。

34.根据式(4)迭代Θ和ρ；

其中κ>1控制收敛速度，

用于防止ρ变得过大，本发明设置为10⁸。

t＝t+1

直至t≥t_max或函数收敛，输出Z^*

步骤4，由步骤3求得表示系数矩阵Z^*之后，利用公式

求关联矩阵S。

步骤5，利用规范化分割算法对关联矩阵S进行分割，根据聚类结果最终提取出动态目标。

如上所示，根据本发明，可以提供一种基于特征选择与光滑表示聚类的视频动态目标提取方法。

Claims

1.一种基于特征选择与光滑表示聚类的视频动态目标提取方法，包括如下步骤：

步骤1，视频序列数据预处理；假设视频序列为f＝[1,2,…,F]，共F帧，选取N个像素点，对每一帧的N个像素点

进行提取和跟踪；这样就得到N条链，又称为像素轨迹，每条链表示为一个长度为2F的向量

N条像素轨迹组合成一个2F×N的矩阵Y＝[y₁,y₂,…,y_N]∈R^2F×N；

步骤2，以视频序列矩阵Y为输入，建立FSSR聚类模型

s.t.p^T1＝1 p_i≥0

W＝(w_ij)为相似图，w_ij＝||y_i-y_j||₂代表两个数据点之间的距离相似度，采用0-1权重来构造k近邻图W，λ为正则项系数，tr(·)是矩阵的迹；

步骤3，使用增广拉格朗日函数和交替方向乘子法对函数模型优化；引入虚变量J＝Z，根据增广拉格朗日函数可以使目标模型转化为如下形式

s.t.p^T1＝1 p_i≥0

最优表示系数矩阵Z^*的求解过程如下：

输入：视频序列矩阵Y，参数值λ，ρ和κ，最大迭代数t_max

初始化：Z，J，p，Θ，t＝0；

迭代31–34：

31.根据式(1)计算辅助变量J；

J＝(Y^Tdiag²(p)Y+ρI)^-1(Y^Tdiag²(p)Y+ρZ-Θ) (1)

32.根据式(2)计算表示系数矩阵Z；

Z＝(ρJ+Θ)(2λL+ρI)^-1 (2)

33.根据式(3)计算特征权值p；

p＝P_M(p) (3)

设

则p的初始解为

不变；当i>M时，p_i置为0，P_M是表示这一关系的算子；

34.根据式(4)迭代Θ和ρ；

其中κ>1控制收敛速度，

用于防止ρ变得过大，设置为10⁸；

t＝t+1

直至t≥t_max或函数收敛，输出Z^*；

步骤4，由步骤3求得表示系数矩阵Z^*之后，利用公式

求关联矩阵S；