CN104504121A

CN104504121A - 一种视频检索方法及装置

Info

Publication number: CN104504121A
Application number: CN201410848965.6A
Authority: CN
Inventors: 张彦刚; 王涛
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2014-12-29
Filing date: 2014-12-29
Publication date: 2015-04-08

Abstract

本发明实施例公开了一种视频检索方法及装置，涉及视频处理技术领域，其中，所述方法包括：接收针对目标视频的视频检索请求；根据所述目标视频的视频数据，提取所述目标视频的特征信息；将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配，获得与所述目标视频相匹配的视频；其中，所述根据所述目标视频的视频数据，提取所述目标视频的特征信息，包括：从目标视频中提取若干个视频帧；将所提取的每一个视频帧划分为相同数量个图像块；分别获得划分得到的各个图像块的M维颜色直方图对应的统计值；根据所获得的统计值，生成所述目标视频的特征信息。应用本发明实施例提供的方案进行视频检索，能够为视频检索提供有效的颜色特征信息。

Description

一种视频检索方法及装置

技术领域

本发明涉及视频处理技术领域，特别涉及一种视频检索方法及装置。

背景技术

视频因具有信息量大、内容丰富等特点，而深受广大用户喜欢。然而，正是由于视频具有上述的这些特点，如何有效的分析视频，进而高效的进行视频检索等操作成为实际应用中的一个突出问题。

现有技术中，一般先提取目标视频的视频特征，再通过对所提取的视频特征的分析实现对目标视频的检索。其中，视频特征一般是能够表现视频主要特性或者重要特性的信息。

常见的，以视频帧之间相应位置上像素点的像素值之差作为目标视频的特征值，上述的像素值之差能够反映视频帧之间的运动信息，例如，运动速度信息、运动方向信息等等，通过分析这些数值可以得到目标视频的各视频帧之间的运动关系。然而，视频帧间像素值之差仅仅能反映出两视频帧之间像素值的变化幅度，而无法提供视频帧的颜色特征信息，影响对目标视频的准确检索。

发明内容

本发明实施例公开了一种视频检索方法及装置，以能够为视频检索提供有效的颜色特征信息。

为达到上述目的，本发明实施例公开了一种视频检索方法，所述方法包括：

接收针对目标视频的视频检索请求；

根据所述目标视频的视频数据，提取所述目标视频的特征信息；

将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配，获得与所述目标视频相匹配的视频；

其中，所述根据所述目标视频的视频数据，提取所述目标视频的特征信息，包括：

从目标视频中提取若干个视频帧；

将所提取的每一个视频帧划分为相同数量个图像块；

分别获得划分得到的各个图像块的M维颜色直方图对应的统计值；

根据所获得的统计值，生成所述目标视频的特征信息。

具体的，所述根据所获得的统计值，生成所述目标视频的特征信息，包括：

根据划分所提取的每一视频帧得到的各个图像块的M维颜色直方图对应的统计值，获得该视频帧的M维颜色直方图对应的统计值；

根据所获得的各个视频帧的M维颜色直方图对应的统计值，生成所述目标视频的特征信息。

具体的，所述根据划分所提取的每一视频帧得到的各个图像块的M维颜色直方图对应的统计值，获得该视频帧的M维颜色直方图对应的统计值，包括：

通过以下步骤获得所提取的任一视频帧i的M维颜色直方图对应的统计值：

根据第一预设加权系数，将视频帧i中位于同一行的各个图像块的M维颜色直方图对应的统计值，合并为一个M维颜色直方图对应的统计值；

根据第二预设加权系数，将经上述合并操作得到的各个M维颜色直方图对应的统计值合并为一个M维颜色直方图对应的统计值。

具体的，所述根据所获得的各个视频帧的M维颜色直方图对应的统计值，生成所述目标视频的特征信息，包括：

通过机器学习算法分别将所获得的各个视频帧的M维颜色直方图对应的统计值量化为一个数值；

根据量化得到的各个数值，生成所述目标视频的特征信息。

根据预设的K组加权系数，按照如下表达式，对所获得的各个视频帧的M维颜色直方图对应的统计值进行加权计算：

H_{pk}^{,} = w_{k 1} * H_{p 1} + w_{k 2} * H_{p 2} + . . . . . . + w_{kN} * H_{pN},

其中，N为所提取的视频帧的数量，k＝1、2……K，H_p1、H_p2……H_pN为所获得的N个视频帧的M维颜色直方图对应的统计值，w_k1、w_k2……w_kN为第k组加权系数，为根据第k组加权系数进行加权处理得到的M维颜色直方图对应的统计值；

根据上述加权计算的结果，生成所述目标视频的特征信息。

为达到上述目的，本发明实施例公开了一种视频检索装置，所述装置包括：

请求接收模块，用于接收针对目标视频的视频检索请求；

特征信息提取模块，用于根据所述目标视频的视频数据，提取所述目标视频的特征信息；

特征信息匹配模块，用于将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配，获得与所述目标视频相匹配的视频；

其中，所述特征信息提取模块，包括：

视频帧提取子模块，用于从目标视频中提取若干个视频帧；

视频帧划分子模块，用于将所提取的每一个视频帧划分为相同数量个图像块；

统计值获得子模块，用于分别获得划分得到的各个图像块的M维颜色直方图对应的统计值；

特征信息生成子模块，用于根据所获得的统计值，生成所述目标视频的特征信息。

具体的，所述特征信息生成子模块，包括：

统计值获得单元，用于根据划分所提取的每一视频帧得到的各个图像块的M维颜色直方图对应的统计值，获得该视频帧的M维颜色直方图对应的统计值；

特征信息生成单元，用于根据所获得的各个视频帧的M维颜色直方图对应的统计值，生成所述目标视频的特征信息。

具体的，所述统计值获得单元，具体用于获得所提取的任一视频帧i的M维颜色直方图对应的统计值；

所述统计值获得单元，包括：

第一统计值合并子单元，用于根据第一预设加权系数，将视频帧i中位于同一行的各个图像块的M维颜色直方图对应的统计值，合并为一个M维颜色直方图对应的统计值；

第二统计值合并子单元，用于根据第二预设加权系数，将经上述合并操作得到的各个M维颜色直方图对应的统计值合并为一个M维颜色直方图对应的统计值。

具体的，所述特征信息生成单元，包括：

统计值量化子单元，用于通过机器学习算法分别将所获得的各个视频帧的M维颜色直方图对应的统计值量化为一个数值；

第一特征信息生成子单元，用于根据量化得到的各个数值，生成所述目标视频的特征信息。

具体的，所述特征信息生成单元，包括：

加权计算子单元，用于根据预设的K组加权系数，按照如下表达式，对所获得的各个视频帧的M维颜色直方图对应的统计值进行加权计算：

H_{pk}^{,} = w_{k 1} * H_{p 1} + w_{k 2} * H_{p 2} + . . . . . . + w_{kN} * H_{pN},

第二特征信息生成子单元，用于根据所述加权计算子单元的加权计算结果，生成所述目标视频的特征信息。

由以上可见，本发明实施例提供的方案中，通过将所提取的视频帧划分为相同数量的图像块，并获得各个图像块的M维颜色直方图对应的统计值的方式，获得目标视频的特征信息，将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配，实现针对目标视频的视频检索。由于视频帧的颜色直方图反映的是视频帧的各个颜色分量中各灰度级所占的比例，因此，根据视频帧的颜色直方图对应的统计值能够分析出视频帧的颜色信息，进而可以得到目标视频的颜色特征信息，能够为视频检索提供有效的颜色特征信息。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种视频检索方法的流程示意图；

图2为本发明实施例提供的一种视频特征提取方法的流程示意图；

图3为本发明实施例提供的另一种视频特征提取方法的流程示意图；

图4为第一种将视频帧划分为图像块的图示；

图5为第二种将视频帧划分为图像块的图示；

图6为本发明实施例提供的一种视频检索装置的结构示意图；

图7为本发明实施例提供的一种视频特征提取装置的结构示意图；

图8为本发明实施例提供的另一种视频特征提取装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例提供的一种视频检索方法的流程示意图，该方法包括：

S101：接收针对目标视频的视频检索请求。

其中，针对目标视频的检索请求中至少应携带目标视频的标识，当然也可以携带其他信息，例如，检索精度等等，本申请并不对此进行限定。

S102：根据目标视频的视频数据，提取目标视频的特征信息。

目标视频的特征信息是指能够表现目标视频主要特性或者重要特性的信息。

具体的，根据目标视频的视频数据，提取的目标视频的特征信息可以是用于表示各视频帧帧间运动状态的信息、用于表示各视频帧纹理状态的信息和用于表示各视频帧中颜色分布状态的信息等等。

本申请中，具体如何根据目标视频的视频数据提取目标视频的特征信息可参见下述图2和图3所示的实施例。

S103：将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配，获得与目标视频相匹配的视频。

在将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配时，可以采用常用的曲线匹配方法进行匹配，例如：基于均值的匹配方法、基于均方差的匹配方法等等，现有技术中曲线匹配方法较多，这里不再详述。

另外，在进行匹配时还可以考虑用户要求的匹配精度等信息，例如，精确匹配、模糊匹配等等。

实际应用中，可根据目标视频的视频数据，提取目标视频的特征信息，一种具体实现方式中，参见图2，提供了一种提取视频特征信息的方法的流程示意图，该方法包括：

S1021：从目标视频中提取若干个视频帧。

众所周知，目标视频是由一系列视频帧组成的，而其中每一视频帧的数据量一般较大。在提取目标视频的特征信息时，若以目标视频的所有视频帧为对象进行特征提取，计算量大；另外，目标视频中相邻的各视频帧之间存在时间相关性，即连续若干帧之间的画面内容相似度较高，鉴于上述两方面原因，在提取目标视频的特征信息时，可仅从目标视频中提取若干个视频帧进行。

其中，从目标视频中提取视频帧时，可以按照固定的时间间隔提取视频帧，还可以按照固定的帧数间隔提取视频帧等等。

S1022：将所提取的每一个视频帧划分为相同数量个图像块。

为保证根据所提取的视频帧确定目标视频的特征信息时，所使用的各个视频帧的信息一致，需将所提取的每一个视频帧划分为相同数量个图像块。

每一个视频帧可以被划分为(图像块行数x图像块列数)个图像块，例如，2x2＝4个图像块、3x3＝9个图像块、3x4＝12个图像块等等。

S1023：分别获得划分得到的各个图像块的M维颜色直方图对应的统计值。

直方图是灰度值的函数，描述的是数字图像中的每一灰度值与其出现的频率间的统计关系，上述的每一灰度值出现的频率，可以理解为该灰度值的像素数量，也可以理解为该灰度值出现的概率；颜色直方图反映的是不同色彩在整幅图像中所占的比例，例如：RGB颜色直方图、HSV颜色直方图、LUV颜色直方图和LAB颜色直方图等等。

一般情况下，灰度值的取值范围为：0～255，得到的颜色直方图为256维颜色直方图。在应用256维颜色直方图对应的统计值进行计算时，由于其维数较多，计算量大，为便于计算，一般对上述256维颜色直方图对应的统计值进行变换得到小维数的颜色直方图对应的统计值，或者直接获得小维数的颜色直方图对应的统计值，而无需先获得256颜色直方图对应的统计值。

例如，小维数的颜色直方图可以是16维颜色直方图，具体的，可以通过以下步骤获得一幅图像的16维颜色直方图对应的统计值：

将0～255中的256个灰度值划分为16个灰度段，例如，灰度值0～15为一个灰度段，灰度值16～31为一个灰度段等等；

统计划分得到的每个灰度段内各灰度值在图像中出现的概率或者对应像素点的数量，进而得到该图像的16维颜色直方图对应的统计值，例如，灰度值0～15的灰度段对应的统计值可以为灰度值0、1……14、15这16个灰度值在图像中出现的概率之和或者对应像素点的数量之和。

综合以上可知，上述的M可以是256，也可以是小于256的数值。

S1024：根据所获得的统计值，生成目标视频的特征信息。

实际应中，可以直接将所获得的统计值作为目标视频的特征信息，也可以先对所获得的统计值进行某些变换，再将变换后的数值作为目标视频的特征信息。

具体的，参见图3，提供了另一种提取视频特征信息的方法的流程示意图，与前述实施例相比，本实施例中，对所获得的统计值进行了适当变换，并根据变换后的数据生成目标视频的特征信息，包括：

S1024A：根据划分所提取的每一视频帧得到的各个图像块的M维颜色直方图对应的统计值，获得该视频帧的M维颜色直方图对应的统计值。

可以通过以下步骤获得所提取的任一视频帧i的M维颜色直方图对应的统计值：

上述的第一预设加权系数与第二预设加权系数可以相同，也可以不相同。

下面通过两个具体实例对本步骤进行详细说明。

实例一：图4为第一种将视频帧划分为图像块的图示，由该图示可见，视频帧被划分为图像块1、图像块2、图像块3和图像块4四个图像块，假设，第一预设加权系数为(1，-1)，第二预设加权系数为(1，-1)，M＝16，则

A、根据第一预设加权系数，分别按照如下关系式，将图像块1和图像块2的16维颜色直方图对应的统计值，合并为一个16维颜色直方图H₁对应的统计值，将图像块3和图像块4的16维颜色直方图对应的统计值，合并为一个16维颜色直方图H₂对应的统计值，

H₁(j)＝|H_pic1(j)-H_pic2(j)|，

H₂(j)＝|H_pic3(j)-H_pic4(j)|，

其中，j＝1、2……16，H_pic1(j)、H_pic2(j)、H_pic3(j)、H_pic4(j)分别为图像块1、图像块2、图像块3、图像块4的16颜色直方图的第j维对应的统计值。

需要说明的是，考虑到颜色直方图的统计值都为正数，所以，根据第一预设加权系数进行加权计算后，进行了取绝对值计算。

B、根据第二预设加权系数，按照如下关系式，将步骤A计算得到的16维颜色直方图H₁对应的统计值和16维颜色直方图H₂对应的统计值，合并为一个16维颜色直方图H₃对应的统计值，

H₃(j)＝|H₁(j)-H₂(j)|，其中，j＝1、2……16。

实例二：图5为第二种将视频帧划分为图像块的图示，由该图示可见，视频帧被划分为图像块5、图像块6……图像块15、图像块16共计12个图像块，假设第一预设加权系数为(1，-1，-1，1)，第二预设加权系数为(1，-2，1)，M＝16，则

C、根据第一预设加权系数，分别按照如下关系式，

将图像块5至图像块8的16维颜色直方图对应的统计值，合并为一个16维颜色直方图H₄对应的统计值；

将图像块9至图像块12的16维颜色直方图对应的统计值，合并为一个16维颜色直方图H₅对应的统计值；

将图像块13至图像块16的16维颜色直方图对应的统计值，合并为一个16维颜色直方图H₆对应的统计值；

H₄(j)＝|H_pic5(j)-H_pic6(j)-H_pic7(j)+H_pic8(j)|，

H₅(j)＝|H_pic9(j)-H_pic10(j)-H_pic11(j)+H_pic12(j)|，

H₆(j)＝|H_pic13(j)-H_pic14(j)-H_pic15(j)+H_pic16(j)|，

其中，j＝1、2……16，H_pic5(j)、H_pic6(j)……H_pic15(j)、H_pic16(j)分别为图像块5、图像块6……图像块15、图像块16的16颜色直方图的第j维对应的统计值。

D、根据第二预设加权系数，按照如下关系式，将步骤C计算得到的16维颜色直方图H₄、H₅、H₆对应的统计值，合并为一个16维颜色直方图H₇对应的统计值，

H₇(j)＝|H₄(j)-2*H₅(j)+H₆(j)|，其中，j＝1、2……16。

S1024B：根据所获得的各个视频帧的M维颜色直方图对应的统计值，生成目标视频的特征信息。

在本发明的一种具体实现方式中，可以先通过机器学习算法分别将所获得的各个视频帧的M维颜色直方图对应的统计值量化为一个数值，再根据量化得到的各个数值，生成目标视频的特征信息。

现有技术中，存在多种常用的机器学习算法，属于比较成熟的算法，这里不再赘述。

在本发明的另一种具体实现方式中，可以先根据K组加权系数，对所获得的各个视频帧的M维颜色直方图对应的统计值进行加权计算，再根据计算的结果，生成目标视频的特征信息。

其中，K可以等于1，也可以是大于1的整数，本申请并不对此进行限定。

按照如下表达式，根据预设的K组加权系数，对所获得的各个视频帧的M维颜色直方图对应的统计值进行加权计算：

H_{pk}^{,} = w_{k 1} * H_{p 1} + w_{k 2} * H_{p 2} + . . . . . . + w_{kN} * H_{pN},

其中，N为所提取的视频帧的数量，k＝1、2……K，H_p1、H_p2……H_pN为所获得的N个视频帧的M维颜色直方图对应的统计值，w_k1、w_k2……w_kN为第k组加权系数，为根据第k组加权系数进行加权处理得到的M维颜色直方图对应的统计值。

w_k1、w_k2……w_kN中各值之和应为一个预先设定的值，这N个值可以相等，也可以不相等。

例如，w_k1、w_k2……w_kN可以均等于1/N，即采用均值法进行加权计算。

与上述的视频检索方法相对应，本发明实施例还提供了一种视频检索装置。

图6为本发明实施例提供的一种视频检索装置，该装置包括：请求接收模块601、特征信息提取模块602和特征信息匹配模块603。

其中，请求接收模块601，用于接收针对目标视频的视频检索请求；

特征信息提取模块602，用于根据所述目标视频的视频数据，提取所述目标视频的特征信息；

特征信息匹配模块603，用于将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配，获得与所述目标视频相匹配的视频。

具体的，参见图7，提供了一种视频特征提取装置的结构示意图，该装置对应于上述的特征信息提取模块602，包括：视频帧提取子模块6021、视频帧划分子模块6022、统计值获得子模块6023和特征信息生成子模块6024。

其中，视频帧提取子模块6021，用于从目标视频中提取若干个视频帧；

视频帧划分子模块6022，用于将所提取的每一个视频帧划分为相同数量个图像块；

统计值获得子模块6023，用于分别获得划分得到的各个图像块的M维颜色直方图对应的统计值；

特征信息生成子模块6024，用于根据所获得的统计值，生成所述目标视频的特征信息。

在本发明的一种具体实现方式中，参见图8，提供了另一种视频特征提取装置的结构示意图，与图7所述实施例相比，本实施例中，特征信息生成子模块6024，包括：统计值获得单元60241和特征信息生成单元60242。

其中，统计值获得单元60241，用于根据划分所提取的每一视频帧得到的各个图像块的M维颜色直方图对应的统计值，获得该视频帧的M维颜色直方图对应的统计值；

特征信息生成单元60242，用于根据所获得的各个视频帧的M维颜色直方图对应的统计值，生成所述目标视频的特征信息。

可选的，上述的统计值获得单元60241，具体用于获得所提取的任一视频帧i的M维颜色直方图对应的统计值；

上述的统计值获得单元60241，可以包括：第一统计值合并子单元和第二统计值合并子单元(图中未示出)。

其中，第一统计值合并子单元，用于根据第一预设加权系数，将视频帧i中位于同一行的各个图像块的M维颜色直方图对应的统计值，合并为一个M维颜色直方图对应的统计值；

可选的，上述的特征信息生成单元60242，可以包括：统计值量化子单元和第一特征信息生成子单元(图中未示出)。

其中，统计值量化子单元，用于通过机器学习算法分别将所获得的各个视频帧的M维颜色直方图对应的统计值量化为一个数值；

一种具体实现方式中，上述的特征信息生成单元60242，包括：加权计算子单元和第二特征信息生成子单元(图中未示出)。

其中，加权计算子单元，用于根据预设的K组加权系数，按照如下表达式，对所获得的各个视频帧的M维颜色直方图对应的统计值进行加权计算：

H_{pk}^{,} = w_{k 1} * H_{p 1} + w_{k 2} * H_{p 2} + . . . . . . + w_{kN} * H_{pN},

其中，N为所提取的视频帧的数量，k＝1、2……K，H_p1、H_p2……H_pN为所获得的N个视频帧的M维颜色直方图对应的统计值，w_k1、w_k2……w_kN为第k组加权系数，H'_pk为根据第k组加权系数进行加权处理得到的M维颜色直方图对应的统计值；

对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，所述的程序可以存储于计算机可读取存储介质中，这里所称得的存储介质，如：ROM/RAM、磁碟、光盘等。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种视频检索方法，其特征在于，所述方法包括：

接收针对目标视频的视频检索请求；

从目标视频中提取若干个视频帧；

将所提取的每一个视频帧划分为相同数量个图像块；

根据所获得的统计值，生成所述目标视频的特征信息。

2.根据权利要求1所述的方法，其特征在于，所述根据所获得的统计值，生成所述目标视频的特征信息，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据划分所提取的每一视频帧得到的各个图像块的M维颜色直方图对应的统计值，获得该视频帧的M维颜色直方图对应的统计值，包括：

4.根据权利要求2或3所述的方法，其特征在于，所述根据所获得的各个视频帧的M维颜色直方图对应的统计值，生成所述目标视频的特征信息，包括：

根据量化得到的各个数值，生成所述目标视频的特征信息。

5.根据权利要求2或3所述的方法，其特征在于，所述根据所获得的各个视频帧的M维颜色直方图对应的统计值，生成所述目标视频的特征信息，包括：

H'_pk＝w_k1*H_p1+w_k2*H_p2+……+w_kN*H_pN，

根据上述加权计算的结果，生成所述目标视频的特征信息。

6.一种视频检索装置，其特征在于，所述装置包括：

请求接收模块，用于接收针对目标视频的视频检索请求；

其中，所述特征信息提取模块，包括：

视频帧提取子模块，用于从目标视频中提取若干个视频帧；

7.根据权利要求6所述的装置，其特征在于，所述特征信息生成子模块，包括：

8.根据权利要求7所述的装置，其特征在于，所述统计值获得单元，具体用于获得所提取的任一视频帧i的M维颜色直方图对应的统计值；

所述统计值获得单元，包括：

9.根据权利要求7或8所述的装置，其特征在于，所述特征信息生成单元，包括：

10.根据权利要求7或8所述的装置，其特征在于，所述特征信息生成单元，包括：

H'_pk＝w_k1*H_p1+w_k2*H_p2+……+w_kN*H_pN，