CN106372636A

CN106372636A - 基于hop_top的视频显著性检测方法

Info

Publication number: CN106372636A
Application number: CN201610729077.1A
Authority: CN
Inventors: 阳兵; 高志勇; 张小云; 陈立
Original assignee: Shanghai Jiao Tong University
Current assignee: Shanghai Jiao Tong University
Priority date: 2016-08-25
Filing date: 2016-08-25
Publication date: 2017-02-01

Abstract

本发明公开了一种基于HOG_TOP的视频显著性检测方法，其包括以下步骤：步骤一：将原始视频在三个正交的平面XY、XT、YT计算得到HOG_TOP特征；步骤二：在XY平面通过计算中央‑周围原则得到空域显著性图SS；步骤三：分别在XT，YT平面通过中央‑周围原则计算得到时域显著性图SXT和SYT；步骤四：自适应的融合XT和YT方向的显著性图得到最终的时域显著性图ST；步骤五：自适应的融合SS和ST得到最终的显著性值SF。本发明提供的方法通过利用HOG_TOP特征，在XY，XT，YT三个平面分别利用中心—周围原则去计算得到显著性图，能够更好地取得时间轴的预测信息，从而能够得到高质量的显著性图。

Description

基于HOP_TOP的视频显著性检测方法

技术领域

本发明涉及一种计算机视觉技术，特别是涉及一种基于HOP_TOP的视频显著性检测方法。

背景技术

视频当中往往包含复杂的场景，然而，人眼在面对复杂场景的时候，注意力只会集中在有限的区域，这些突出的区域被称为视觉显著性区域。目前国内外提出了一些视频视觉显著性算法，例如，Seo(H.J.Seo and P.Milanfar，“Static and space-time visualsaliency detection by self-resemblance，”J.Vis.，vol.9，no.12，p.15，Nov.2009.)提出了一种利用自相似去计算显著性的方法。该方法首先提出一种包含了当前像素与周围像素关系的局部特征，然后基于这个特征去计算自相似度，取得了一定的效果。Guo(C.Guoand L.Zhang，“A novel multiresolution spatiotemporal saliency detection modeland its applications in image and video compression，”IEEE Trans.ImageProcess.，vol.19，no.1，pp.185–198，Jan.2010.)提出了一种利用四元数傅里叶频谱变换去计算显著性的方法，四维特征空间由亮度，两个色度以及帧之间差异构成。

目前国内专利有：基于视频帧图像中颜色和运动全局对比度的视觉显著性算法(专利申请号201310080831)。该方法主要利用颜色和运动计算对比度的方法来得到显著性图，在对比度明显的情况下能够取得较好的效果，但是在复杂场景的时候性能会有一定程度的下降。

本发明公开的方法不同于上述所有方法，因为本发明目的在于针对复杂场景去得到高质量的显著性图，利用三个正交平面的中央-周围机制去得到不同的显著性图，然后自适应的融合这三幅显著性图去得到最终的显著性图。

发明内容

本发明所要解决的技术问题是提供一种基于HOG_TOP的视频显著性检测方法，使得在复杂场景下面能够得到高质量的显著性图。

本发明是通过下述技术方案来解决上述技术问题的：一种基于HOG_TOP的视频显著性检测方法，其特征在于，其包括以下步骤：

步骤一：将原始视频在三个正交的平面XY、XT、YT计算得到HOG_TOP特征；

其具体过程如下，把原始输入视频看成一个立方体，三个正交的轴分别为X轴，Y轴以及T轴，然后在每个平面计算HOG特征.HOG特征的主要计算步骤如下：一、灰度化(将图像看做一个x，y，z(灰度)的三维图像)；二、计算图像每个像素的梯度(包括方向和大小)；三、将图像划分成小的cells；四、统计每个cell(单元，用来表示每个单元当中包含的像素的个数)的梯度直方图，即可形成每个cell的描述子；五、将每几个cell组成一个block(块，用来表示每个块当中包含多少个cell)，一个block内所有的cell的描述子串联起来便得到该block的HOG特征；

步骤二：在XY平面通过计算中央-周围原则得到空域显著性图SS；

其具体过程如下，对于每一个像素l＝(x_c,y_c)，我们提取出来一个中央区域r_C和一个周围区域r_S，其中r_C和r_S具有共同的中心。接着我们计算r_C和r_S在XY平面对应的特征分布h_c和h_s，并且定义h_c和h_s的差异为像素l的显著性值；

步骤三：分别在XT，YT平面通过中央-周围原则计算得到时域显著性图SXT和SYT；

步骤四：自适应的融合XT和YT方向的显著性图得到最终的时域显著性图ST；

其具体过程如下，分别计算SXT和SYT的平均值，然后自适应的融合SXT和SYT去得到ST；

步骤五：自适应的融合SS和ST得到最终的显著性值SF；

其具体过程如下，分别计算SS和ST的平均值，然后自适应的融合SS和ST去得到SF。

优选地，所述步骤二和步骤三中，在每个平面通过中心—周围原则去得到显著性值。

优选地，所述步骤四和步骤五中，自适应的融合各个平面的显著性图去得到最终的显著性值。

优选地，所述步骤一把原始输入视频看成一个立方体，三个正交的轴分别为X轴，Y轴以及T轴，然后在每个平面计算HOG特征。

所述HOG特征采用如下步骤计算：一、灰度化；二、计算图像每个像素的优选地，梯度；三、将图像划分成小的单元；四、统计每个单元的梯度直方图；五、将每几个单元组成一个块，一个块内所有的单元的描述子串联起来便得到该块的HOG特征。

本发明的积极进步效果在于：本发明提供的方法通过利用HOG_TOP特征，在XY，XT，YT三个平面分别利用中心—周围原则去计算得到显著性图，能够更好地取得时间轴的预测信息，从而能够得到高质量的显著性图。

附图说明

图1为本发明所提出的基于HOG_TOP的视频显著性检测方法的流程图。

具体实施方式

下面结合附图给出本发明较佳实施例，以详细说明本发明的技术方案。

如图1所示，为本发明基于HOG_TOP的视频显著性检测方法的一个实例的处理流程图，包括以下步骤：

其具体过程如下，把原始输入视频看成一个立方体，三个正交的轴分别为X轴，Y轴以及T轴，然后在每个平面计算HOG特征。HOG特征的主要计算步骤如下：一、灰度化(将图像看做一个x，y，z(灰度)的三维图像)；二、计算图像每个像素的梯度(包括方向和大小)；三、将图像划分成小的cells；四、统计每个cell(单元，用来表示每个单元当中包含的像素的个数)的梯度直方图，即可形成每个cell的描述子；五、将每几个cell组成一个block(块，用来表示每个块当中包含多少个cell)，一个block内所有的cell的描述子串联起来便得到该block(块)的HOG特征。

在计算每个平面的HOG特征的时候，每个block中包含2x2个cell，XY平面的每个cell包含8x8个像素，XT和YT平面的每个cell包含3x3个像素。

步骤二：对于每一个像素l＝(x_c,y_c)，我们提取出来一个中央区域r_C和一个周围区域r_S，其中r_C和r_S具有共同的中心。接着我们计算r_C和r_S在XY平面对应的特征分布h_c和h_s，并且定义h_c和h_s的差异为像素l的显著性值。计算公式如下：

S S (l) = χ^{2} (h_{c}, h_{s}) = Σ_{i = 1}^{N} \frac{{(h_{c} (i) - h_{s} (i))}^{2}}{(h_{c} (i) + h_{s} (i)) / 2} - - - (1)

上式中h_c和h_s是对应着r_C和r_S的直方图分布，N代表量化的bin的数目，χ(·,·)代表两个矢量的卡方距离。

在XY平面按照(1)式计算得到空域显著性图SS，其中N的值为9，r_S的大小是r_C的4倍大。

步骤三：如XY平面类似的操作，分别在XT，YT平面按照(1)式计算得到时域显著性图SXT和SYT；

步骤四：分别计算SXT和SYT的平均值，然后自适应的融合SXT和SYT去得到ST。计算公式如下：

S T = \frac{m e a n (S Y T)}{m e a n (S X T) + m e a n (S Y T)} S Y T + \frac{m e a n (S X T)}{m e a n (S X T) + m e a n (S Y T)} S X T - - - (2)

按照(2)式去融合XT和YT对应的显著性图得到最终的时域显著性图ST。

步骤五：分别计算SS和ST的平均值，然后自适应的融合SS和ST去得到SF。计算公式如下：

S F = \frac{m e a n (S S)}{m e a n (S S) + m e a n (S S)} S S + \frac{m e a n (S T)}{m e a n (S S) + m e a n (S T)} S T - - - (3)

按照(3)式去融合空域和时域显著性图去得到最终的显著性图SF。

综上所述，本发明提供的方法通过利用HOG_TOP特征，在XY，XT，YT三个平面分别利用中心—周围原则去计算得到显著性图，能够更好地取得时间轴的预测信息，从而能够得到高质量的显著性图。

以上所述的具体实施例，对本发明的解决的技术问题、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于HOG_TOP的视频显著性检测方法，其特征在于，其包括以下步骤：

步骤五：自适应的融合SS和ST得到最终的显著性值SF。

2.根据权利要求1所述的基于HOG_TOP的视频显著性检测方法，其特征在于，所述步骤二和步骤三中，在每个平面通过中心—周围原则去得到显著性值。

3.根据权利要求1所述的基于HOG_TOP的视频显著性检测方法，其特征在于，所述步骤四和步骤五中，自适应的融合各个平面的显著性图去得到最终的显著性值。

4.根据权利要求1所述的基于HOG_TOP的视频显著性检测方法，其特征在于，所述步骤一把原始输入视频看成一个立方体，三个正交的轴分别为X轴，Y轴以及T轴，然后在每个平面计算HOG特征。

5.根据权利要求4所述的基于HOG_TOP的视频显著性检测方法，其特征在于，所述HOG特征采用如下步骤计算：一、灰度化；二、计算图像每个像素的梯度；三、将图像划分成小的单元；四、统计每个单元的梯度直方图；五、将每几个单元组成一个块，一个块内所有的单元的描述子串联起来便得到该块的HOG特征。