CN103984778B

CN103984778B - 一种视频检索方法及系统

Info

Publication number: CN103984778B
Application number: CN201410250095.2A
Authority: CN
Inventors: 张宝良; 张元庆; 李丁盼
Original assignee: Beijing Liebao Network Technology Co Ltd
Current assignee: Beijing Liebao Network Technology Co Ltd
Priority date: 2014-06-06
Filing date: 2014-06-06
Publication date: 2017-12-01
Anticipated expiration: 2034-06-06
Also published as: CN103984778A

Abstract

本发明实施例提供的一种视频检索方法及系统，可以根据视频帧的相似度将用于检索的源视频拆分为多个子视频，并对每个子视频分析得到子视频的特征图像，使用子视频的特征图像来进行视频检索。在检索时，本发明可以根据图像相似度及播放顺序是否一致确定所要检索的视频。由于进行视频检索时，需要同时满足图像相似度高和播放顺序一致这两个条件，因此所确定的检索结果的准确性更高。同时，本发明可以使用户在不了解视频名称等文字信息时通过视频来检索视频，扩展了视频检索方式，降低了视频检索的难度。

Description

一种视频检索方法及系统

技术领域

本发明涉及信息检索技术领域，特别是涉及一种视频检索方法及系统。

背景技术

随着科技的发展，用户通过各种电子设备观看视频也越来越普遍。

用户经常需要检索自己所需要观看的视频，现有的视频检索技术一般可以通过视频名称、演职人员等文字信息来检索视频。例如：输入某导演的名字，则与该导演相关的电影、电视剧就会在检索结果中显示。但这需要用户知悉所要检索的视频的上述文字信息才能进行检索。当用户并不了解上述文字信息时，则无法进行检索。

发明内容

本发明实施例的目的在于提供一种视频检索方法及系统，以通过视频进行检索。

为达到上述目的，本发明实施例公开了一种视频检索方法，包括：

获得用于检索的源视频；

根据所述源视频的视频帧的相似度，将所述源视频至少拆分为第一子视频和第二子视频，并将拆分得到的子视频按照播放顺序进行排序；

对所述第一子视频和第二子视频进行分析，获得所述第一子视频的特征图像以及所述第二子视频的特征图像；

利用所述第一子视频的特征图像和所述第二子视频的特征图像在预设的检索库中进行检索，命中第一索引图像和第二索引图像，其中，所述第一子视频的特征图像与所述第一索引图像的相似度高于第二阈值，所述第二子视频的特征图像与所述第二索引图像的相似度高于所述第二阈值；

若所述第一索引图像和第二索引图像对应同一索引视频，且所述第一索引图像和所述第二索引图像的排序与所述第一子视频和所述第二子视频的排序相同，确定所述第一索引图像和第二索引图像对应的索引视频为检索结果。

优选的，所述第一子视频的特征图像为所述第一子视频中视频帧的相同部分，所述第二子视频的特征图像为所述第二子视频中视频帧的相同部分；

或者，所述第一子视频的特征图像为所述第一子视频中视频帧的相同部分和不同部分，所述第二子视频的特征图像为所述第二子视频中视频帧的相同部分和不同部分；

或者，所述第一子视频的特征图像为所述第一子视频中的第一帧、最后一帧及处于中间位置的视频帧，所述第二子视频的特征图像为所述第二子视频中的第一帧、最后一帧及处于中间位置的视频帧；

或者，所述第一子视频的特征图像为从所述第一子视频中提取出来的具有相同时间间隔的至少两个视频帧，所述第二子视频的特征图像为从所述第二子视频中提取出来的具有相同时间间隔的至少两个视频帧；

或者，所述第一子视频的特征图像为对所述第一子视频的视频帧进行均化处理后得到的图像，所述第二子视频的特征图像为对所述第二子视频的视频帧进行均化处理后得到的图像。

优选的，所述获得用于检索的源视频，包括：根据用户输入的本地视频地址，从本地获得用于检索的源视频；

或者，所述获得用于检索的源视频，包括：根据用户输入的网络视频地址，从网络中获得用于检索的源视频。

优选的，还包括：输出确定为检索结果的索引视频的标识信息。

优选的，还包括：

确定所述源视频与确定为检索结果的索引视频的相对位置信息；

输出所述相对位置信息。

一种视频检索系统，包括：源视频获得模块、源视频拆分模块、子视频分析模块、视频检索模块和结果确定模块，

所述源视频获得模块，用于获得用于检索的源视频；

所述源视频拆分模块，用于根据所述源视频的视频帧的相似度，将所述源视频至少拆分为第一子视频和第二子视频，并将拆分得到的子视频按照播放顺序进行排序；

所述子视频分析模块，用于对所述第一子视频和第二子视频进行分析，获得所述第一子视频的特征图像以及所述第二子视频的特征图像；

所述视频检索模块，用于利用所述第一子视频的特征图像和所述第二子视频的特征图像在预设的检索库中进行检索，命中第一索引图像和第二索引图像，其中，所述第一子视频的特征图像与所述第一索引图像的相似度高于第二阈值，所述第二子视频的特征图像与所述第二索引图像的相似度高于所述第二阈值；

所述结果确定模块，用于在所述第一索引图像和第二索引图像对应同一索引视频，且所述第一索引图像和所述第二索引图像的排序与所述第一子视频和所述第二子视频的排序相同时，确定所述第一索引图像和第二索引图像对应的索引视频为检索结果。

优选的，所述源视频获得模块，包括：本地视频获得子模块和/或网络视频获得子模块，

所述本地视频获得子模块，用于根据用户输入的本地视频地址，从本地获得用于检索的源视频；

所述网络视频获得子模块，用于根据用户输入的网络视频地址，从网络中获得用于检索的源视频。

优选的，还包括：结果输出模块，用于输出确定为检索结果的索引视频的标识信息。

优选的，还包括：相对位置确定模块和相对位置输出模块，

所述相对位置确定模块，用于确定所述源视频与确定为检索结果的索引视频的相对位置信息；

所述相对位置输出模块，用于输出所述相对位置信息。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种视频检索方法的流程图；

图2为本发明实施例提供的另一种视频检索方法的流程图；

图3为本发明实施例提供的一种视频检索系统的结构示意图；

图4为本发明实施例提供的另一种视频检索系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，本发明实施例提供的一种视频检索方法，可以包括：

S100、获得用于检索的源视频；

在本发明的实施例中，用于检索的源视频可以为一个视频的片段，如用户使用手机对电视中正在播放的节目进行拍摄得到的视频；或者，用于检索的源视频也可以为图像互换格式GIF动画。可以理解，GIF动画与视频一样，是由具有播放先后顺序的多张图像构成。

如果用于检索的源视频是本地视频，则可以根据用户输入的本地视频地址，从本地获得用于检索的源视频。如果用于检索的源视频是网络视频，则可以根据用户输入的网络视频地址，从网络中获得用于检索的源视频。

S200、根据所述源视频的视频帧的相似度，将所述源视频至少拆分为第一子视频和第二子视频，并将拆分得到的子视频按照播放顺序进行排序；

可以理解的是，在拍摄视频的过程中，随着拍摄对象、拍摄方式的变化，一个视频中可以有多个场景，例如汽车中、客厅中、楼梯间中、办公室中等多个场景。在对某场景进行拍摄时，由于拍摄背景、人物变化相对较小，因此，可以根据视频帧的相似度就可以将视频拆分为对应于场景的多个子视频。

在本发明的一种可选实施方式中，场景可以为视频拍摄的一个或多个镜头，一个镜头可以是指从前一个光学转换到后一个光学转换之间的完整片段。在视频中，一个或多个镜头可以组成一个场景，若干个场景构成一部影片。因此，镜头也是构成视觉语言的基本单位。

由于视频具有播放顺序，因此可以将拆分得到的多个子视频按照播放顺序进行排列，得到子视频序列。例如：某视频播放时，首先出现场景A，然后出现场景B，那么拆分得到的与场景A对应的子视频排列在场景B对应的子视频的前方。

S300、对所述第一子视频和第二子视频进行分析，获得第一子视频的特征图像以及第二子视频的特征图像；

特征图像可以是体现子视频的各视频帧的图像特征，在进行视频检索时，使用子视频的特征图像进行检索，可以有效减少检索过程中的计算量。

可选的，在本发明的具体示例中，上述S300的实现方式有多种，下面进行详细的介绍。当然，上述S300的实现并不局限于下列方式。

方式一、对所述第一子视频和第二子视频进行分析，获得第一子视频的特征图像以及第二子视频的特征图像，其中，所述第一子视频的特征图像为所述第一子视频中视频帧的相同部分，所述第二子视频的特征图像为所述第二子视频中视频帧的相同部分。

方式二、对所述第一子视频和第二子视频进行分析，获得第一子视频的特征图像以及第二子视频的特征图像，其中，所述第一子视频的特征图像为第一子视频中视频帧的相同部分和不同部分，所述第二子视频的特征图像为第二子视频中视频帧的相同部分和不同部分。

在进行视频拍摄时，如果视频拍摄设备静止拍摄，则所拍摄的场景中的背景变化较小或不变，而前景部分则发生变化。例如：人物访谈视频中背景图像没有变化，由于人的动作、表情在一直变化，因此作为前景部分的人物图像则发生变化。如果视频拍摄设备根据拍摄主体的移动而移动拍摄，如人骑马移动，视频拍摄设备跟随移动拍摄，则所拍摄的场景中的背景变化，而拍摄主体变化较小或不变。因此，可以将视频帧的相同部分作为子视频的特征图像，也可以将相同部分和不同部分均作为子视频的特征图像。

优选的，上述方式一和方式二中，可以采用MPEG视频压缩技术中的视频帧差异确定方式来获得各视频帧的相同部分和/或不同部分。

MPEG视频压缩技术是基于变换的有损压缩。MPEG视频压缩技术将图像分区成小块，然后进行变换编码，然后进行量化，最后进行熵编码。MPEG视频压缩技术采用了的动量估计和动量补偿技术。在利用了动量补偿的图像中，被编码的是经过动量补偿的参考帧与目前图像的差。MPEG以一秒时段作为单位，将时段内的每一格图像做比较。由于一般视频内容都是背景部分变化小、前景部分变化大，MPEG技术就应用这个特点，以一幅图像为主图，其余图像格只记录参考资料及变化数据，更有效记录动态图像。

方式三、对所述第一子视频和第二子视频进行分析，获得第一子视频的特征图像以及第二子视频的特征图像，其中，所述第一子视频的特征图像为第一子视频中的第一帧、最后一帧及处于中间位置的视频帧，所述第二子视频的特征图像为第二子视频中的第一帧、最后一帧及处于中间位置的视频帧。

方式四、对所述第一子视频和第二子视频进行分析，获得第一子视频的特征图像以及第二子视频的特征图像，其中，所述第一子视频的特征图像为从第一子视频中提取出来的具有相同时间间隔的至少两个视频帧，所述第二子视频的特征图像为从第二子视频中提取出来的具有相同时间间隔的至少两个视频帧。

方式三和方式四，直接采用子视频中的某个或某些视频帧作为该子视频的特征图像，更加简单直接。为了提高检索的准确性，方式三是选取了位于子视频的首、尾和中间位置的视频帧，可以很好的体现子视频的图像特征。方式四则是按照播放时刻每隔一段时间就选取一个视频帧，这样选取的视频帧均匀分布在子视频中，也可以很好的体现子视频的图像特征。

方式五、对所述第一子视频和第二子视频进行分析，获得第一子视频的特征图像以及第二子视频的特征图像，其中，所述第一子视频的特征图像为对第一子视频的视频帧进行均化处理后得到的图像，所述第二子视频的特征图像为对第二子视频的视频帧进行均化处理后得到的图像。

具体的，可以对视频帧中相同位置像素的颜色值计算平均值，得到视频帧各像素的平均颜色值，由具有平均颜色值的像素组成的图像即为均化图像。

可以理解的是，由于S300对按照播放顺序进行排序的第一子视频和第二子视频进行分析，获得第一子视频的特征图像以及第二子视频的特征图像，因此所获得的特征图像也可以构成具有相同排列顺序的特征图像序列。

S400、利用所述第一子视频的特征图像和所述第二子视频的特征图像在预设的检索库中进行检索，命中第一索引图像和第二索引图像，其中，所述第一子视频的特征图像与所述第一索引图像的相似度高于第二阈值，所述第二子视频的特征图像与所述第二索引图像的相似度高于所述第二阈值；

其中，预设的检索库中可以保存有索引视频，如电影等。或者，预设的检索库中可以保存有所述索引视频的索引子视频，所述索引子视频可以是根据视频帧的相似度对索引视频进行拆分得到。同属一个索引视频的多个索引子视频按照播放顺序排列。或者，预设的检索库中可以保存有索引图像，所述索引图像从索引子视频中分析获得，与索引子视频对应。由于属一个索引视频的多个索引子视频按照播放顺序排列，因此索引图像也可以构成具有相同排列顺序的索引图像序列。

可选的，在本发明的实施例中，上述S400在具体实现时，可以从特征图像和索引图像中提取特征信息，如特征码等，然后通过对比特征信息确定二者的相似度。例如，通过感知哈希算法确定两个图像间的相似度。通过感知哈希算法可以得到特征图像、索引图像的哈希值，并将该哈希值作为相应图像的特征信息以进行相似度计算。

S500、若所述第一索引图像和第二索引图像对应同一索引视频，且所述第一索引图像和所述第二索引图像的排序与所述第一子视频和所述第二子视频的排序相同，确定所述第一索引图像和第二索引图像对应的索引视频为检索结果。

否则，可以认为没有检索到相应的结果。可选的，还可以输出检索结果以告知用户未检索到相关视频。

本发明在进行视频检索时，当检索库中有多个索引图像与特征图像相似度高于阈值，且索引图像的排列顺序与子视频的排列顺序一致时，就可以确定上述多个索引图像对应的索引视频为所要检索的视频。

例如：用于检索的源视频是网络上的一段视频，本发明实施例提供的技术方案中，获得该源视频，划分后得到第一子视频和第二子视频，其中，第一子视频顺序在第二子视频之前。从第一子视频中得到第一特征图像，从第二子视频中得到第二特征图像。利用第一特征图像在检索库中检索，得到与第一特征图像相似度高于第二阈值的第一索引图像；利用第二特征图像在检索库中检索，得到与第二特征图像相似度高于第二阈值的第二索引图像。若第一索引图像和第二索引图像对应同一索引视频，且第一索引图像的顺序在第二索引图像之前，因此可以确定源视频与索引视频具有较高的相似度，可以将该索引视频作为检索结果。

优选的，在本发明的一个实施例中，还可以输出该索引视频的标识信息给用户；示例性的，索引视频的标识信息可以包括：索引视频的名称、索引视频的海报和/或索引视频的播放地址。当然，索引视频的标识信息还可以包括：索引视频的作者、索引视频的简介、索引视频的剧照和/或索引视频的演职人员信息等。

本发明实施例提供的一种视频检索方法，可以根据视频帧的相似度将用于检索的源视频拆分为多个子视频，并对每个子视频分析得到子视频的特征图像，使用子视频的特征图像来进行视频检索。在检索时，本发明可以根据图像相似度及播放顺序是否一致确定所要检索的视频。由于进行视频检索时，需要同时满足图像相似度高和播放顺序一致这两个条件，因此所确定的检索结果的准确性更高。同时，本发明可以使用户在不了解视频名称等文字信息时通过视频来检索视频，扩展了视频检索方式，降低了视频检索的难度。

可选的，如图2所示，在上述S500之后，本发明实施例提供的另一种视频检索方法中，还可以包括：

S600、确定所述源视频与作为检索结果的索引视频的相对位置信息；

S700、输出所述相对位置信息。在本发明的实施例中，根据第一索引图像和第二索引图像在索引视频的所有索引图像中的排列顺序，就可以得到上述源视频出自索引视频哪一段，也就得到了源视频与索引视频的相对位置信息。

具体的，S700中相对位置信息的输出方式有多种，可选的，可以将上述相对位置信息显示在视频播放界面中，如：在视频播放进度条中设置相对位置标识。

得到并输出源视频与索引视频的相对位置信息可以帮助用户快速在索引视频中进行定位，方便用户观看。

与上述方法实施例相对应，本发明还提供了一种视频检索系统。

如图3所示，本发明实施例提供的一种视频检索系统，可以包括：源视频获得模块100、源视频拆分模块200、子视频分析模块300、视频检索模块400和结果确定模块500，

源视频获得模块100，用于获得用于检索的源视频；

可选的，源视频获得模块100，可以包括：本地视频获得子模块和/或网络视频获得子模块，

源视频拆分模块200，用于根据所述源视频的视频帧的相似度，将所述源视频至少拆分为第一子视频和第二子视频，并将拆分得到的子视频按照播放顺序进行排序；

子视频分析模块300，用于对所述第一子视频和第二子视频进行分析，获得所述第一子视频的特征图像以及所述第二子视频的特征图像；

可选的，在本发明的具体示例中，上述子视频分析模块300获得的特征图像可以有多种情况，下面进行详细的介绍。当然，视频分析模块300获得的特征图像并不局限于下列情况。

情况一、所述第一子视频的特征图像为所述第一子视频中视频帧的相同部分，所述第二子视频的特征图像为所述第二子视频中视频帧的相同部分；

情况二、所述第一子视频的特征图像为所述第一子视频中视频帧的相同部分和不同部分，所述第二子视频的特征图像为所述第二子视频中视频帧的相同部分和不同部分；

情况三、所述第一子视频的特征图像为所述第一子视频中的第一帧、最后一帧及处于中间位置的视频帧，所述第二子视频的特征图像为所述第二子视频中的第一帧、最后一帧及处于中间位置的视频帧；

情况四、所述第一子视频的特征图像为从所述第一子视频中提取出来的具有相同时间间隔的至少两个视频帧，所述第二子视频的特征图像为从所述第二子视频中提取出来的具有相同时间间隔的至少两个视频帧；

情况五、所述第一子视频的特征图像为对所述第一子视频的视频帧进行均化处理后得到的图像，所述第二子视频的特征图像为对所述第二子视频的视频帧进行均化处理后得到的图像。

视频检索模块400，用于利用所述第一子视频的特征图像和所述第二子视频的特征图像在预设的检索库中进行检索，命中第一索引图像和第二索引图像，其中，所述第一子视频的特征图像与所述第一索引图像的相似度高于第二阈值，所述第二子视频的特征图像与所述第二索引图像的相似度高于所述第二阈值；

结果确定模块500，用于在所述第一索引图像和第二索引图像对应同一索引视频，且所述第一索引图像和所述第二索引图像的排序与所述第一子视频和所述第二子视频的排序相同时，确定所述第一索引图像和第二索引图像对应的索引视频为检索结果。

优选的，在本发明的一个实施例中，还可以包括：结果输出模块，用于输出确定为检索结果的索引视频的标识信息。示例性的，索引视频的标识信息可以包括：索引视频的名称、索引视频的海报和/或索引视频的播放地址。当然，索引视频的标识信息还可以包括：索引视频的作者、索引视频的简介、索引视频的剧照和/或索引视频的演职人员信息等。

本发明实施例提供的一种视频检索系统，可以根据视频帧的相似度将用于检索的源视频拆分为多个子视频，并对每个子视频分析得到子视频的特征图像，使用子视频的特征图像来进行视频检索。在检索时，本发明可以根据图像相似度及播放顺序是否一致确定所要检索的视频。由于进行视频检索时，需要同时满足图像相似度高和播放顺序一致这两个条件，因此所确定的检索结果的准确性更高。同时，本发明可以使用户在不了解视频名称等文字信息时通过视频来检索视频，扩展了视频检索方式，降低了视频检索的难度。

可选的，如图4所示，本发明实施例提供的另一种视频检索系统中，还可以包括：相对位置确定模块600和相对位置输出模块700，

相对位置确定模块600，用于确定所述源视频与确定为检索结果的索引视频的相对位置信息；

相对位置输出模块700，用于输出所述相对位置信息。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种视频检索方法，其特征在于，包括：

获得用于检索的源视频；

若所述第一索引图像和第二索引图像对应同一索引视频，且所述第一索引图像和所述第二索引图像的排序与所述第一子视频和所述第二子视频的排序相同，确定所述第一索引图像和第二索引图像对应的索引视频为检索结果；

其中，所述第一子视频的特征图像为所述第一子视频中视频帧的相同部分和不同部分，所述第二子视频的特征图像为所述第二子视频中视频帧的相同部分和不同部分；

或者，所述第一子视频的特征图像为对所述第一子视频的视频帧进行均化处理后得到的图像，所述第二子视频的特征图像为对所述第二子视频的视频帧进行均化处理后得到的图像；

所述方法还包括：

输出所述相对位置信息。

2.根据权利要求1所述的方法，其特征在于，所述获得用于检索的源视频，包括：根据用户输入的本地视频地址，从本地获得用于检索的源视频；

3.根据权利要求1-2中任一项所述的方法，其特征在于，还包括：输出确定为检索结果的索引视频的标识信息。

4.一种视频检索系统，其特征在于，包括：源视频获得模块、源视频拆分模块、子视频分析模块、视频检索模块和结果确定模块，

所述源视频获得模块，用于获得用于检索的源视频；

所述结果确定模块，用于在所述第一索引图像和第二索引图像对应同一索引视频，且所述第一索引图像和所述第二索引图像的排序与所述第一子视频和所述第二子视频的排序相同时，确定所述第一索引图像和第二索引图像对应的索引视频为检索结果；

所述系统还包括：相对位置确定模块和相对位置输出模块，

所述相对位置输出模块，用于输出所述相对位置信息。

5.根据权利要求4所述的系统，其特征在于，所述源视频获得模块，包括：本地视频获得子模块和/或网络视频获得子模块，

6.根据权利要求4-5中任一项所述的系统，其特征在于，还包括：结果输出模块，用于输出确定为检索结果的索引视频的标识信息。