CN104504121A - 一种视频检索方法及装置 - Google Patents

一种视频检索方法及装置 Download PDF

Info

Publication number
CN104504121A
CN104504121A CN201410848965.6A CN201410848965A CN104504121A CN 104504121 A CN104504121 A CN 104504121A CN 201410848965 A CN201410848965 A CN 201410848965A CN 104504121 A CN104504121 A CN 104504121A
Authority
CN
China
Prior art keywords
video
statistical value
characteristic information
frame
color histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410848965.6A
Other languages
English (en)
Inventor
张彦刚
王涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201410848965.6A priority Critical patent/CN104504121A/zh
Publication of CN104504121A publication Critical patent/CN104504121A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/785Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using colour or luminescence

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种视频检索方法及装置,涉及视频处理技术领域,其中,所述方法包括:接收针对目标视频的视频检索请求;根据所述目标视频的视频数据,提取所述目标视频的特征信息;将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配,获得与所述目标视频相匹配的视频;其中,所述根据所述目标视频的视频数据,提取所述目标视频的特征信息,包括:从目标视频中提取若干个视频帧;将所提取的每一个视频帧划分为相同数量个图像块;分别获得划分得到的各个图像块的M维颜色直方图对应的统计值;根据所获得的统计值,生成所述目标视频的特征信息。应用本发明实施例提供的方案进行视频检索,能够为视频检索提供有效的颜色特征信息。

Description

一种视频检索方法及装置
技术领域
本发明涉及视频处理技术领域,特别涉及一种视频检索方法及装置。
背景技术
视频因具有信息量大、内容丰富等特点,而深受广大用户喜欢。然而,正是由于视频具有上述的这些特点,如何有效的分析视频,进而高效的进行视频检索等操作成为实际应用中的一个突出问题。
现有技术中,一般先提取目标视频的视频特征,再通过对所提取的视频特征的分析实现对目标视频的检索。其中,视频特征一般是能够表现视频主要特性或者重要特性的信息。
常见的,以视频帧之间相应位置上像素点的像素值之差作为目标视频的特征值,上述的像素值之差能够反映视频帧之间的运动信息,例如,运动速度信息、运动方向信息等等,通过分析这些数值可以得到目标视频的各视频帧之间的运动关系。然而,视频帧间像素值之差仅仅能反映出两视频帧之间像素值的变化幅度,而无法提供视频帧的颜色特征信息,影响对目标视频的准确检索。
发明内容
本发明实施例公开了一种视频检索方法及装置,以能够为视频检索提供有效的颜色特征信息。
为达到上述目的,本发明实施例公开了一种视频检索方法,所述方法包括:
接收针对目标视频的视频检索请求;
根据所述目标视频的视频数据,提取所述目标视频的特征信息;
将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配,获得与所述目标视频相匹配的视频;
其中,所述根据所述目标视频的视频数据,提取所述目标视频的特征信息,包括:
从目标视频中提取若干个视频帧;
将所提取的每一个视频帧划分为相同数量个图像块;
分别获得划分得到的各个图像块的M维颜色直方图对应的统计值;
根据所获得的统计值,生成所述目标视频的特征信息。
具体的,所述根据所获得的统计值,生成所述目标视频的特征信息,包括:
根据划分所提取的每一视频帧得到的各个图像块的M维颜色直方图对应的统计值,获得该视频帧的M维颜色直方图对应的统计值;
根据所获得的各个视频帧的M维颜色直方图对应的统计值,生成所述目标视频的特征信息。
具体的,所述根据划分所提取的每一视频帧得到的各个图像块的M维颜色直方图对应的统计值,获得该视频帧的M维颜色直方图对应的统计值,包括:
通过以下步骤获得所提取的任一视频帧i的M维颜色直方图对应的统计值:
根据第一预设加权系数,将视频帧i中位于同一行的各个图像块的M维颜色直方图对应的统计值,合并为一个M维颜色直方图对应的统计值;
根据第二预设加权系数,将经上述合并操作得到的各个M维颜色直方图对应的统计值合并为一个M维颜色直方图对应的统计值。
具体的,所述根据所获得的各个视频帧的M维颜色直方图对应的统计值,生成所述目标视频的特征信息,包括:
通过机器学习算法分别将所获得的各个视频帧的M维颜色直方图对应的统计值量化为一个数值;
根据量化得到的各个数值,生成所述目标视频的特征信息。
具体的,所述根据所获得的各个视频帧的M维颜色直方图对应的统计值,生成所述目标视频的特征信息,包括:
根据预设的K组加权系数,按照如下表达式,对所获得的各个视频帧的M维颜色直方图对应的统计值进行加权计算:
H pk , = w k 1 * H p 1 + w k 2 * H p 2 + . . . . . . + w kN * H pN ,
其中,N为所提取的视频帧的数量,k=1、2……K,Hp1、Hp2……HpN为所获得的N个视频帧的M维颜色直方图对应的统计值,wk1、wk2……wkN为第k组加权系数,为根据第k组加权系数进行加权处理得到的M维颜色直方图对应的统计值;
根据上述加权计算的结果,生成所述目标视频的特征信息。
为达到上述目的,本发明实施例公开了一种视频检索装置,所述装置包括:
请求接收模块,用于接收针对目标视频的视频检索请求;
特征信息提取模块,用于根据所述目标视频的视频数据,提取所述目标视频的特征信息;
特征信息匹配模块,用于将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配,获得与所述目标视频相匹配的视频;
其中,所述特征信息提取模块,包括:
视频帧提取子模块,用于从目标视频中提取若干个视频帧;
视频帧划分子模块,用于将所提取的每一个视频帧划分为相同数量个图像块;
统计值获得子模块,用于分别获得划分得到的各个图像块的M维颜色直方图对应的统计值;
特征信息生成子模块,用于根据所获得的统计值,生成所述目标视频的特征信息。
具体的,所述特征信息生成子模块,包括:
统计值获得单元,用于根据划分所提取的每一视频帧得到的各个图像块的M维颜色直方图对应的统计值,获得该视频帧的M维颜色直方图对应的统计值;
特征信息生成单元,用于根据所获得的各个视频帧的M维颜色直方图对应的统计值,生成所述目标视频的特征信息。
具体的,所述统计值获得单元,具体用于获得所提取的任一视频帧i的M维颜色直方图对应的统计值;
所述统计值获得单元,包括:
第一统计值合并子单元,用于根据第一预设加权系数,将视频帧i中位于同一行的各个图像块的M维颜色直方图对应的统计值,合并为一个M维颜色直方图对应的统计值;
第二统计值合并子单元,用于根据第二预设加权系数,将经上述合并操作得到的各个M维颜色直方图对应的统计值合并为一个M维颜色直方图对应的统计值。
具体的,所述特征信息生成单元,包括:
统计值量化子单元,用于通过机器学习算法分别将所获得的各个视频帧的M维颜色直方图对应的统计值量化为一个数值;
第一特征信息生成子单元,用于根据量化得到的各个数值,生成所述目标视频的特征信息。
具体的,所述特征信息生成单元,包括:
加权计算子单元,用于根据预设的K组加权系数,按照如下表达式,对所获得的各个视频帧的M维颜色直方图对应的统计值进行加权计算:
H pk , = w k 1 * H p 1 + w k 2 * H p 2 + . . . . . . + w kN * H pN ,
其中,N为所提取的视频帧的数量,k=1、2……K,Hp1、Hp2……HpN为所获得的N个视频帧的M维颜色直方图对应的统计值,wk1、wk2……wkN为第k组加权系数,为根据第k组加权系数进行加权处理得到的M维颜色直方图对应的统计值;
第二特征信息生成子单元,用于根据所述加权计算子单元的加权计算结果,生成所述目标视频的特征信息。
由以上可见,本发明实施例提供的方案中,通过将所提取的视频帧划分为相同数量的图像块,并获得各个图像块的M维颜色直方图对应的统计值的方式,获得目标视频的特征信息,将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配,实现针对目标视频的视频检索。由于视频帧的颜色直方图反映的是视频帧的各个颜色分量中各灰度级所占的比例,因此,根据视频帧的颜色直方图对应的统计值能够分析出视频帧的颜色信息,进而可以得到目标视频的颜色特征信息,能够为视频检索提供有效的颜色特征信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种视频检索方法的流程示意图;
图2为本发明实施例提供的一种视频特征提取方法的流程示意图;
图3为本发明实施例提供的另一种视频特征提取方法的流程示意图;
图4为第一种将视频帧划分为图像块的图示;
图5为第二种将视频帧划分为图像块的图示;
图6为本发明实施例提供的一种视频检索装置的结构示意图;
图7为本发明实施例提供的一种视频特征提取装置的结构示意图;
图8为本发明实施例提供的另一种视频特征提取装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种视频检索方法的流程示意图,该方法包括:
S101:接收针对目标视频的视频检索请求。
其中,针对目标视频的检索请求中至少应携带目标视频的标识,当然也可以携带其他信息,例如,检索精度等等,本申请并不对此进行限定。
S102:根据目标视频的视频数据,提取目标视频的特征信息。
目标视频的特征信息是指能够表现目标视频主要特性或者重要特性的信息。
具体的,根据目标视频的视频数据,提取的目标视频的特征信息可以是用于表示各视频帧帧间运动状态的信息、用于表示各视频帧纹理状态的信息和用于表示各视频帧中颜色分布状态的信息等等。
本申请中,具体如何根据目标视频的视频数据提取目标视频的特征信息可参见下述图2和图3所示的实施例。
S103:将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配,获得与目标视频相匹配的视频。
在将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配时,可以采用常用的曲线匹配方法进行匹配,例如:基于均值的匹配方法、基于均方差的匹配方法等等,现有技术中曲线匹配方法较多,这里不再详述。
另外,在进行匹配时还可以考虑用户要求的匹配精度等信息,例如,精确匹配、模糊匹配等等。
实际应用中,可根据目标视频的视频数据,提取目标视频的特征信息,一种具体实现方式中,参见图2,提供了一种提取视频特征信息的方法的流程示意图,该方法包括:
S1021:从目标视频中提取若干个视频帧。
众所周知,目标视频是由一系列视频帧组成的,而其中每一视频帧的数据量一般较大。在提取目标视频的特征信息时,若以目标视频的所有视频帧为对象进行特征提取,计算量大;另外,目标视频中相邻的各视频帧之间存在时间相关性,即连续若干帧之间的画面内容相似度较高,鉴于上述两方面原因,在提取目标视频的特征信息时,可仅从目标视频中提取若干个视频帧进行。
其中,从目标视频中提取视频帧时,可以按照固定的时间间隔提取视频帧,还可以按照固定的帧数间隔提取视频帧等等。
S1022:将所提取的每一个视频帧划分为相同数量个图像块。
为保证根据所提取的视频帧确定目标视频的特征信息时,所使用的各个视频帧的信息一致,需将所提取的每一个视频帧划分为相同数量个图像块。
每一个视频帧可以被划分为(图像块行数x图像块列数)个图像块,例如,2x2=4个图像块、3x3=9个图像块、3x4=12个图像块等等。
S1023:分别获得划分得到的各个图像块的M维颜色直方图对应的统计值。
直方图是灰度值的函数,描述的是数字图像中的每一灰度值与其出现的频率间的统计关系,上述的每一灰度值出现的频率,可以理解为该灰度值的像素数量,也可以理解为该灰度值出现的概率;颜色直方图反映的是不同色彩在整幅图像中所占的比例,例如:RGB颜色直方图、HSV颜色直方图、LUV颜色直方图和LAB颜色直方图等等。
一般情况下,灰度值的取值范围为:0~255,得到的颜色直方图为256维颜色直方图。在应用256维颜色直方图对应的统计值进行计算时,由于其维数较多,计算量大,为便于计算,一般对上述256维颜色直方图对应的统计值进行变换得到小维数的颜色直方图对应的统计值,或者直接获得小维数的颜色直方图对应的统计值,而无需先获得256颜色直方图对应的统计值。
例如,小维数的颜色直方图可以是16维颜色直方图,具体的,可以通过以下步骤获得一幅图像的16维颜色直方图对应的统计值:
将0~255中的256个灰度值划分为16个灰度段,例如,灰度值0~15为一个灰度段,灰度值16~31为一个灰度段等等;
统计划分得到的每个灰度段内各灰度值在图像中出现的概率或者对应像素点的数量,进而得到该图像的16维颜色直方图对应的统计值,例如,灰度值0~15的灰度段对应的统计值可以为灰度值0、1……14、15这16个灰度值在图像中出现的概率之和或者对应像素点的数量之和。
综合以上可知,上述的M可以是256,也可以是小于256的数值。
S1024:根据所获得的统计值,生成目标视频的特征信息。
实际应中,可以直接将所获得的统计值作为目标视频的特征信息,也可以先对所获得的统计值进行某些变换,再将变换后的数值作为目标视频的特征信息。
具体的,参见图3,提供了另一种提取视频特征信息的方法的流程示意图,与前述实施例相比,本实施例中,对所获得的统计值进行了适当变换,并根据变换后的数据生成目标视频的特征信息,包括:
S1024A:根据划分所提取的每一视频帧得到的各个图像块的M维颜色直方图对应的统计值,获得该视频帧的M维颜色直方图对应的统计值。
可以通过以下步骤获得所提取的任一视频帧i的M维颜色直方图对应的统计值:
根据第一预设加权系数,将视频帧i中位于同一行的各个图像块的M维颜色直方图对应的统计值,合并为一个M维颜色直方图对应的统计值;
根据第二预设加权系数,将经上述合并操作得到的各个M维颜色直方图对应的统计值合并为一个M维颜色直方图对应的统计值。
上述的第一预设加权系数与第二预设加权系数可以相同,也可以不相同。
下面通过两个具体实例对本步骤进行详细说明。
实例一:图4为第一种将视频帧划分为图像块的图示,由该图示可见,视频帧被划分为图像块1、图像块2、图像块3和图像块4四个图像块,假设,第一预设加权系数为(1,-1),第二预设加权系数为(1,-1),M=16,则
A、根据第一预设加权系数,分别按照如下关系式,将图像块1和图像块2的16维颜色直方图对应的统计值,合并为一个16维颜色直方图H1对应的统计值,将图像块3和图像块4的16维颜色直方图对应的统计值,合并为一个16维颜色直方图H2对应的统计值,
H1(j)=|Hpic1(j)-Hpic2(j)|,
H2(j)=|Hpic3(j)-Hpic4(j)|,
其中,j=1、2……16,Hpic1(j)、Hpic2(j)、Hpic3(j)、Hpic4(j)分别为图像块1、图像块2、图像块3、图像块4的16颜色直方图的第j维对应的统计值。
需要说明的是,考虑到颜色直方图的统计值都为正数,所以,根据第一预设加权系数进行加权计算后,进行了取绝对值计算。
B、根据第二预设加权系数,按照如下关系式,将步骤A计算得到的16维颜色直方图H1对应的统计值和16维颜色直方图H2对应的统计值,合并为一个16维颜色直方图H3对应的统计值,
H3(j)=|H1(j)-H2(j)|,其中,j=1、2……16。
实例二:图5为第二种将视频帧划分为图像块的图示,由该图示可见,视频帧被划分为图像块5、图像块6……图像块15、图像块16共计12个图像块,假设第一预设加权系数为(1,-1,-1,1),第二预设加权系数为(1,-2,1),M=16,则
C、根据第一预设加权系数,分别按照如下关系式,
将图像块5至图像块8的16维颜色直方图对应的统计值,合并为一个16维颜色直方图H4对应的统计值;
将图像块9至图像块12的16维颜色直方图对应的统计值,合并为一个16维颜色直方图H5对应的统计值;
将图像块13至图像块16的16维颜色直方图对应的统计值,合并为一个16维颜色直方图H6对应的统计值;
H4(j)=|Hpic5(j)-Hpic6(j)-Hpic7(j)+Hpic8(j)|,
H5(j)=|Hpic9(j)-Hpic10(j)-Hpic11(j)+Hpic12(j)|,
H6(j)=|Hpic13(j)-Hpic14(j)-Hpic15(j)+Hpic16(j)|,
其中,j=1、2……16,Hpic5(j)、Hpic6(j)……Hpic15(j)、Hpic16(j)分别为图像块5、图像块6……图像块15、图像块16的16颜色直方图的第j维对应的统计值。
D、根据第二预设加权系数,按照如下关系式,将步骤C计算得到的16维颜色直方图H4、H5、H6对应的统计值,合并为一个16维颜色直方图H7对应的统计值,
H7(j)=|H4(j)-2*H5(j)+H6(j)|,其中,j=1、2……16。
S1024B:根据所获得的各个视频帧的M维颜色直方图对应的统计值,生成目标视频的特征信息。
在本发明的一种具体实现方式中,可以先通过机器学习算法分别将所获得的各个视频帧的M维颜色直方图对应的统计值量化为一个数值,再根据量化得到的各个数值,生成目标视频的特征信息。
现有技术中,存在多种常用的机器学习算法,属于比较成熟的算法,这里不再赘述。
在本发明的另一种具体实现方式中,可以先根据K组加权系数,对所获得的各个视频帧的M维颜色直方图对应的统计值进行加权计算,再根据计算的结果,生成目标视频的特征信息。
其中,K可以等于1,也可以是大于1的整数,本申请并不对此进行限定。
按照如下表达式,根据预设的K组加权系数,对所获得的各个视频帧的M维颜色直方图对应的统计值进行加权计算:
H pk , = w k 1 * H p 1 + w k 2 * H p 2 + . . . . . . + w kN * H pN ,
其中,N为所提取的视频帧的数量,k=1、2……K,Hp1、Hp2……HpN为所获得的N个视频帧的M维颜色直方图对应的统计值,wk1、wk2……wkN为第k组加权系数,为根据第k组加权系数进行加权处理得到的M维颜色直方图对应的统计值。
wk1、wk2……wkN中各值之和应为一个预先设定的值,这N个值可以相等,也可以不相等。
例如,wk1、wk2……wkN可以均等于1/N,即采用均值法进行加权计算。
由以上可见,本发明实施例提供的方案中,通过将所提取的视频帧划分为相同数量的图像块,并获得各个图像块的M维颜色直方图对应的统计值的方式,获得目标视频的特征信息,将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配,实现针对目标视频的视频检索。由于视频帧的颜色直方图反映的是视频帧的各个颜色分量中各灰度级所占的比例,因此,根据视频帧的颜色直方图对应的统计值能够分析出视频帧的颜色信息,进而可以得到目标视频的颜色特征信息,能够为视频检索提供有效的颜色特征信息。
与上述的视频检索方法相对应,本发明实施例还提供了一种视频检索装置。
图6为本发明实施例提供的一种视频检索装置,该装置包括:请求接收模块601、特征信息提取模块602和特征信息匹配模块603。
其中,请求接收模块601,用于接收针对目标视频的视频检索请求;
特征信息提取模块602,用于根据所述目标视频的视频数据,提取所述目标视频的特征信息;
特征信息匹配模块603,用于将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配,获得与所述目标视频相匹配的视频。
具体的,参见图7,提供了一种视频特征提取装置的结构示意图,该装置对应于上述的特征信息提取模块602,包括:视频帧提取子模块6021、视频帧划分子模块6022、统计值获得子模块6023和特征信息生成子模块6024。
其中,视频帧提取子模块6021,用于从目标视频中提取若干个视频帧;
视频帧划分子模块6022,用于将所提取的每一个视频帧划分为相同数量个图像块;
统计值获得子模块6023,用于分别获得划分得到的各个图像块的M维颜色直方图对应的统计值;
特征信息生成子模块6024,用于根据所获得的统计值,生成所述目标视频的特征信息。
在本发明的一种具体实现方式中,参见图8,提供了另一种视频特征提取装置的结构示意图,与图7所述实施例相比,本实施例中,特征信息生成子模块6024,包括:统计值获得单元60241和特征信息生成单元60242。
其中,统计值获得单元60241,用于根据划分所提取的每一视频帧得到的各个图像块的M维颜色直方图对应的统计值,获得该视频帧的M维颜色直方图对应的统计值;
特征信息生成单元60242,用于根据所获得的各个视频帧的M维颜色直方图对应的统计值,生成所述目标视频的特征信息。
可选的,上述的统计值获得单元60241,具体用于获得所提取的任一视频帧i的M维颜色直方图对应的统计值;
上述的统计值获得单元60241,可以包括:第一统计值合并子单元和第二统计值合并子单元(图中未示出)。
其中,第一统计值合并子单元,用于根据第一预设加权系数,将视频帧i中位于同一行的各个图像块的M维颜色直方图对应的统计值,合并为一个M维颜色直方图对应的统计值;
第二统计值合并子单元,用于根据第二预设加权系数,将经上述合并操作得到的各个M维颜色直方图对应的统计值合并为一个M维颜色直方图对应的统计值。
可选的,上述的特征信息生成单元60242,可以包括:统计值量化子单元和第一特征信息生成子单元(图中未示出)。
其中,统计值量化子单元,用于通过机器学习算法分别将所获得的各个视频帧的M维颜色直方图对应的统计值量化为一个数值;
第一特征信息生成子单元,用于根据量化得到的各个数值,生成所述目标视频的特征信息。
一种具体实现方式中,上述的特征信息生成单元60242,包括:加权计算子单元和第二特征信息生成子单元(图中未示出)。
其中,加权计算子单元,用于根据预设的K组加权系数,按照如下表达式,对所获得的各个视频帧的M维颜色直方图对应的统计值进行加权计算:
H pk , = w k 1 * H p 1 + w k 2 * H p 2 + . . . . . . + w kN * H pN ,
其中,N为所提取的视频帧的数量,k=1、2……K,Hp1、Hp2……HpN为所获得的N个视频帧的M维颜色直方图对应的统计值,wk1、wk2……wkN为第k组加权系数,H'pk为根据第k组加权系数进行加权处理得到的M维颜色直方图对应的统计值;
第二特征信息生成子单元,用于根据所述加权计算子单元的加权计算结果,生成所述目标视频的特征信息。
由以上可见,本发明实施例提供的方案中,通过将所提取的视频帧划分为相同数量的图像块,并获得各个图像块的M维颜色直方图对应的统计值的方式,获得目标视频的特征信息,将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配,实现针对目标视频的视频检索。由于视频帧的颜色直方图反映的是视频帧的各个颜色分量中各灰度级所占的比例,因此,根据视频帧的颜色直方图对应的统计值能够分析出视频帧的颜色信息,进而可以得到目标视频的颜色特征信息,能够为视频检索提供有效的颜色特征信息。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种视频检索方法,其特征在于,所述方法包括:
接收针对目标视频的视频检索请求;
根据所述目标视频的视频数据,提取所述目标视频的特征信息;
将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配,获得与所述目标视频相匹配的视频;
其中,所述根据所述目标视频的视频数据,提取所述目标视频的特征信息,包括:
从目标视频中提取若干个视频帧;
将所提取的每一个视频帧划分为相同数量个图像块;
分别获得划分得到的各个图像块的M维颜色直方图对应的统计值;
根据所获得的统计值,生成所述目标视频的特征信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所获得的统计值,生成所述目标视频的特征信息,包括:
根据划分所提取的每一视频帧得到的各个图像块的M维颜色直方图对应的统计值,获得该视频帧的M维颜色直方图对应的统计值;
根据所获得的各个视频帧的M维颜色直方图对应的统计值,生成所述目标视频的特征信息。
3.根据权利要求2所述的方法,其特征在于,所述根据划分所提取的每一视频帧得到的各个图像块的M维颜色直方图对应的统计值,获得该视频帧的M维颜色直方图对应的统计值,包括:
通过以下步骤获得所提取的任一视频帧i的M维颜色直方图对应的统计值:
根据第一预设加权系数,将视频帧i中位于同一行的各个图像块的M维颜色直方图对应的统计值,合并为一个M维颜色直方图对应的统计值;
根据第二预设加权系数,将经上述合并操作得到的各个M维颜色直方图对应的统计值合并为一个M维颜色直方图对应的统计值。
4.根据权利要求2或3所述的方法,其特征在于,所述根据所获得的各个视频帧的M维颜色直方图对应的统计值,生成所述目标视频的特征信息,包括:
通过机器学习算法分别将所获得的各个视频帧的M维颜色直方图对应的统计值量化为一个数值;
根据量化得到的各个数值,生成所述目标视频的特征信息。
5.根据权利要求2或3所述的方法,其特征在于,所述根据所获得的各个视频帧的M维颜色直方图对应的统计值,生成所述目标视频的特征信息,包括:
根据预设的K组加权系数,按照如下表达式,对所获得的各个视频帧的M维颜色直方图对应的统计值进行加权计算:
H'pk=wk1*Hp1+wk2*Hp2+……+wkN*HpN
其中,N为所提取的视频帧的数量,k=1、2……K,Hp1、Hp2……HpN为所获得的N个视频帧的M维颜色直方图对应的统计值,wk1、wk2……wkN为第k组加权系数,H'pk为根据第k组加权系数进行加权处理得到的M维颜色直方图对应的统计值;
根据上述加权计算的结果,生成所述目标视频的特征信息。
6.一种视频检索装置,其特征在于,所述装置包括:
请求接收模块,用于接收针对目标视频的视频检索请求;
特征信息提取模块,用于根据所述目标视频的视频数据,提取所述目标视频的特征信息;
特征信息匹配模块,用于将所提取的特征信息与预设的视频库中所包含视频的特征信息进行匹配,获得与所述目标视频相匹配的视频;
其中,所述特征信息提取模块,包括:
视频帧提取子模块,用于从目标视频中提取若干个视频帧;
视频帧划分子模块,用于将所提取的每一个视频帧划分为相同数量个图像块;
统计值获得子模块,用于分别获得划分得到的各个图像块的M维颜色直方图对应的统计值;
特征信息生成子模块,用于根据所获得的统计值,生成所述目标视频的特征信息。
7.根据权利要求6所述的装置,其特征在于,所述特征信息生成子模块,包括:
统计值获得单元,用于根据划分所提取的每一视频帧得到的各个图像块的M维颜色直方图对应的统计值,获得该视频帧的M维颜色直方图对应的统计值;
特征信息生成单元,用于根据所获得的各个视频帧的M维颜色直方图对应的统计值,生成所述目标视频的特征信息。
8.根据权利要求7所述的装置,其特征在于,所述统计值获得单元,具体用于获得所提取的任一视频帧i的M维颜色直方图对应的统计值;
所述统计值获得单元,包括:
第一统计值合并子单元,用于根据第一预设加权系数,将视频帧i中位于同一行的各个图像块的M维颜色直方图对应的统计值,合并为一个M维颜色直方图对应的统计值;
第二统计值合并子单元,用于根据第二预设加权系数,将经上述合并操作得到的各个M维颜色直方图对应的统计值合并为一个M维颜色直方图对应的统计值。
9.根据权利要求7或8所述的装置,其特征在于,所述特征信息生成单元,包括:
统计值量化子单元,用于通过机器学习算法分别将所获得的各个视频帧的M维颜色直方图对应的统计值量化为一个数值;
第一特征信息生成子单元,用于根据量化得到的各个数值,生成所述目标视频的特征信息。
10.根据权利要求7或8所述的装置,其特征在于,所述特征信息生成单元,包括:
加权计算子单元,用于根据预设的K组加权系数,按照如下表达式,对所获得的各个视频帧的M维颜色直方图对应的统计值进行加权计算:
H'pk=wk1*Hp1+wk2*Hp2+……+wkN*HpN
其中,N为所提取的视频帧的数量,k=1、2……K,Hp1、Hp2……HpN为所获得的N个视频帧的M维颜色直方图对应的统计值,wk1、wk2……wkN为第k组加权系数,H'pk为根据第k组加权系数进行加权处理得到的M维颜色直方图对应的统计值;
第二特征信息生成子单元,用于根据所述加权计算子单元的加权计算结果,生成所述目标视频的特征信息。
CN201410848965.6A 2014-12-29 2014-12-29 一种视频检索方法及装置 Pending CN104504121A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410848965.6A CN104504121A (zh) 2014-12-29 2014-12-29 一种视频检索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410848965.6A CN104504121A (zh) 2014-12-29 2014-12-29 一种视频检索方法及装置

Publications (1)

Publication Number Publication Date
CN104504121A true CN104504121A (zh) 2015-04-08

Family

ID=52945518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410848965.6A Pending CN104504121A (zh) 2014-12-29 2014-12-29 一种视频检索方法及装置

Country Status (1)

Country Link
CN (1) CN104504121A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105022604A (zh) * 2015-07-17 2015-11-04 广东威创视讯科技股份有限公司 一种智能信号处理方法及装置
CN106231356A (zh) * 2016-08-17 2016-12-14 腾讯科技(深圳)有限公司 视频的处理方法和装置
CN106610987A (zh) * 2015-10-22 2017-05-03 杭州海康威视数字技术股份有限公司 视频图像检索方法、装置及系统
CN107221346A (zh) * 2017-05-25 2017-09-29 亮风台(上海)信息科技有限公司 一种用于确定ar视频的识别图片的方法与设备
CN107529071A (zh) * 2016-06-22 2017-12-29 腾讯科技(深圳)有限公司 一种视频数据处理方法以及装置
CN108205581A (zh) * 2016-12-20 2018-06-26 奥多比公司 生成数字媒介环境中的紧凑视频特征表示
WO2019129075A1 (zh) * 2017-12-27 2019-07-04 中兴通讯股份有限公司 视频检索的方法和装置以及计算机可读存储介质
CN111767923A (zh) * 2020-07-28 2020-10-13 腾讯科技(深圳)有限公司 一种图像数据检测方法、装置以及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100318515A1 (en) * 2009-06-10 2010-12-16 Zeitera, Llc Media Fingerprinting and Identification System
CN102419816A (zh) * 2011-11-18 2012-04-18 山东大学 用于相同内容视频检索的视频指纹方法
CN103475935A (zh) * 2013-09-06 2013-12-25 北京锐安科技有限公司 一种视频片段的检索方法及装置
CN103593464A (zh) * 2013-11-25 2014-02-19 华中科技大学 基于视觉特征的视频指纹检测及视频序列匹配方法及系统
CN104050247A (zh) * 2014-06-04 2014-09-17 上海美琦浦悦通讯科技有限公司 实现海量视频快速检索的方法
CN104219423A (zh) * 2014-09-25 2014-12-17 联想(北京)有限公司 一种信息处理方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100318515A1 (en) * 2009-06-10 2010-12-16 Zeitera, Llc Media Fingerprinting and Identification System
CN102419816A (zh) * 2011-11-18 2012-04-18 山东大学 用于相同内容视频检索的视频指纹方法
CN103475935A (zh) * 2013-09-06 2013-12-25 北京锐安科技有限公司 一种视频片段的检索方法及装置
CN103593464A (zh) * 2013-11-25 2014-02-19 华中科技大学 基于视觉特征的视频指纹检测及视频序列匹配方法及系统
CN104050247A (zh) * 2014-06-04 2014-09-17 上海美琦浦悦通讯科技有限公司 实现海量视频快速检索的方法
CN104219423A (zh) * 2014-09-25 2014-12-17 联想(北京)有限公司 一种信息处理方法和装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105022604A (zh) * 2015-07-17 2015-11-04 广东威创视讯科技股份有限公司 一种智能信号处理方法及装置
CN106610987B (zh) * 2015-10-22 2020-02-21 杭州海康威视数字技术股份有限公司 视频图像检索方法、装置及系统
CN106610987A (zh) * 2015-10-22 2017-05-03 杭州海康威视数字技术股份有限公司 视频图像检索方法、装置及系统
CN107529071B (zh) * 2016-06-22 2019-03-01 腾讯科技(深圳)有限公司 一种视频数据处理方法以及装置
CN107529071A (zh) * 2016-06-22 2017-12-29 腾讯科技(深圳)有限公司 一种视频数据处理方法以及装置
CN106231356B (zh) * 2016-08-17 2019-01-08 腾讯科技(深圳)有限公司 视频的处理方法和装置
CN106231356A (zh) * 2016-08-17 2016-12-14 腾讯科技(深圳)有限公司 视频的处理方法和装置
CN108205581A (zh) * 2016-12-20 2018-06-26 奥多比公司 生成数字媒介环境中的紧凑视频特征表示
CN108205581B (zh) * 2016-12-20 2023-04-28 奥多比公司 生成数字媒介环境中的紧凑视频特征表示
CN107221346A (zh) * 2017-05-25 2017-09-29 亮风台(上海)信息科技有限公司 一种用于确定ar视频的识别图片的方法与设备
WO2019129075A1 (zh) * 2017-12-27 2019-07-04 中兴通讯股份有限公司 视频检索的方法和装置以及计算机可读存储介质
CN111767923A (zh) * 2020-07-28 2020-10-13 腾讯科技(深圳)有限公司 一种图像数据检测方法、装置以及计算机可读存储介质
CN111767923B (zh) * 2020-07-28 2024-02-20 腾讯科技(深圳)有限公司 一种图像数据检测方法、装置以及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN104504121A (zh) 一种视频检索方法及装置
CN103283247B (zh) 用于编索引、相似度搜索和分类的矢量变换
CN101300575B (zh) 图像处理
JP4486780B2 (ja) 画像情報検索のための非線形量子化及び類似度マッチング方法
Liang et al. Image fusion using higher order singular value decomposition
Lee et al. Efficient local statistical analysis via integral histograms with discrete wavelet transform
KR20190055447A (ko) 연산 가속화가 적용된 신경망 모델의 생성 및 활용을 위한 장치 및 방법
Jung et al. Rigid motion segmentation using randomized voting
CN101300576A (zh) 图像处理
CN104504101A (zh) 一种相似视频的确定方法及装置
Xie et al. Bag-of-words feature representation for blind image quality assessment with local quantized pattern
Gazagnes et al. Distributed connected component filtering and analysis in 2D and 3D tera-scale data sets
US20110268315A1 (en) Scalable Media Fingerprint Extraction
CN103699691A (zh) 生成图像指纹及基于此进行相似图像检索的方法
JP2009133843A (ja) 表面欠陥の分布形態解析装置、方法、及びプログラム
Morovic et al. A fast, non-iterative and exact histogram matching algorithm
US20150269456A1 (en) Methods and systems for determining a perceptual similarity between images
Thepade et al. Image classification using advanced block truncation coding with ternary image maps
Chye et al. Selection criteria of the compression algorithm in information-measuring system
Kekre et al. Comparative study of color histogram based bins approach in RGB, XYZ, Kekre's LXY and L′ X′ Y′ color spaces
Burdescu et al. Computational complexity analysis of the graph extraction algorithm for 3D segmentation
Aghav-Palwe et al. Color image retrieval using compacted feature vector with mean-count tree
Varish et al. A content based image retrieval using color and texture features
Liang et al. Using particle swarm large-scale optimization to improve sampling-based image matting
Wen et al. Sparse subspace clustering for incomplete images

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150408