WO2019184522A1

WO2019184522A1 - 一种重复视频的判断方法及装置

Info

Publication number: WO2019184522A1
Application number: PCT/CN2018/125500
Authority: WO
Inventors: 何轶; 李磊; 杨成; 李�根; 李亦锬
Original assignee: 北京字节跳动网络技术有限公司
Priority date: 2018-03-29
Filing date: 2018-12-29
Publication date: 2019-10-03
Also published as: US20210058667A1; US11265598B2; JP7000468B2; SG11201914063RA; CN110324660A; JP2020525935A; CN110324660B

Abstract

本公开涉及一种重复视频的判断方法及装置，该方法包括：获取待查重视频的多种视频特征；根据所述待查重视频的多种视频特征，对多个已有视频分别进行序列比对，得到序列比对结果；根据所述序列比对结果，对所述多个已有视频进行第一排名，根据所述第一排名的结果，取出前n个所述已有视频作为第一候选视频；根据所述第一候选视频的所述序列比对结果，确定所述待查重视频的重复情况。

Description

一种重复视频的判断方法及装置

相关申请的交叉引用

本申请要求申请号为201810273706.3、申请日为2018年3月29日的中国专利申请的优先权，该文献的全部内容以引用方式并入本文。

技术领域

本公开涉及视频处理技术领域，特别是涉及一种重复视频的判断方法及装置。

背景技术

在如今的多媒体信息社会中，用户每天向视频平台上传海量的视频，这些视频中大部分是正常的有价值视频，然而也有一些问题视频，问题视频主要包括：和平台视频数据库中的已有视频重复的视频、与版权数据库中的视频重复的视频(例如，需要支付版权费的视频)以及某些不适宜或禁止展示的视频。因此需要对用户上传的海量视频进行快速的比对和消重。

现有的对视频进行比对和消重的方法存在速度慢，准确性差，对运算资源和存储资源消耗大等问题。

发明内容

本公开的目的在于，提供一种新的重复视频的判断方法及装置。

本公开的目的是采用以下的技术方案来实现的。依据本公开提出的重复视频的判断方法，包括以下步骤：获取待查重视频的多种视频特征；根据所述待查重视频的多种视频特征，对多个已有视频分别进行序列比对，得到序列比对结果；根据所述序列比对结果，对所述多个已有视频进行第一排名，根据所述第一排名的结果，取出前n个所述已有视频作为第一候选视频，其中n为正整数；根据所述第一候选视频的所述序列比对结果，确定所述待查重视频的重复情况。

本公开的可以采用以下的技术措施来进一步实现。

前述的重复视频的判断方法，其中，所述获取所述待查重视频的多种视频特征包括：对所述待查重视频进行抽帧，得到所述待查重视频的多个帧图像；提取所述帧图像的多种图像特征作为第一图像特征；根据所述待查重视频的多个帧图像的同种的所述第一图像特征，确定所述待查重视频的视频特征作为第一视频特征，以得到多种所述第一视频特征。

前述的重复视频的判断方法，其中，所述的提取所述帧图像的多种图像特征包括：对于每个所述帧图像，获取一个或多个检测向量，利用每个所述检测向量，以所述帧图像中的任意像素作为起点，确定所述起点的经所述检测向量指向的终点，根据各个所述起点与对应的所述终点之间的差异情况的总体情况来确定所述帧图像的图像特征，作为栅栏特征。

前述的重复视频的判断方法，其中，所述的提取所述帧图像的多种图像特征包括：对于每个所述帧图像，逐级地进行多种类型的池化，以得到所述帧图像的图像特征，作为池化特征；其中，所述多种类型的池化包括最大池化、最小池化和平均池化。

前述的重复视频的判断方法，其中，所述的根据所述待查重视频的多种视频特征，对多个已有视频分别进行序列比对，得到序列比对结果包括：获取一个所述已有视频的多种视频特征作为第二视频特征，每种所述第二视频特征包含多个第二图像特征；分别确定同种的每个所述第二图像特征和每个所述第一图像特征之间的单体相似度，以得到多种所述单体相似度；确定所述多种单体相似度的平均值或最小值，根据所述多种单体相似度的平均值或最小值确定所述已有视频的相似度矩阵；根据所述相似度矩阵确定序列比对评分，所述序列比对评分用于表示所述已有视频与所述待查重视频的相似程度。

前述的重复视频的判断方法，其中，所述的根据所述相似度矩阵确定序列比对评分包括：根据所述相似度矩阵中的直线确定序列比对评分。

前述的重复视频的判断方法，其中，所述的根据所述待查重视频的多种视频特征，对多个已有视频分别进行序列比对，得到序列比对结果还包括：根据所述相似度矩阵确定所述已有视频和所述待查重视频的重复视频片段。

前述的重复视频的判断方法，其中，所述的根据所述待查重视频的多种视频特征，对多个已有视频分别进行序列比对，得到序列比对结果包括：根据至少一种所述第一视频特征中的每个单独的第一图像特征，对多个已有视频进行第二排名，根据所述第二排名的结果，取出前k个所述已有视频作为第二候选视频，其中k为正整数，分别对每个所述第二候选视频进行序列比对，得到序列比对结果。

前述的重复视频的判断方法，其中，所述的根据至少一种所述第一视频特征中的每个单独的第一图像特征，对多个已有视频进行第二排名包括：将至少一种所述第一视频特征中的每个单独的第一图像特征作为索引请求，对多个已有视频进行词频-逆向文件频率排名。

前述的重复视频的判断方法，其中，所述根据所述待查重视频的多个帧图像的每种所述第一图像特征，确定所述待查重视频的所述多种视频特征作为第一视频特征包括：对所述第一图像特征进行二值化处理；根据所述多个帧图像的二值化的所述第一图像特征，确定所述第一视频特征。

本公开的目的还采用以下技术方案来实现。依据本公开提出的重复视频的判断装置，包括：视频特征获取模块，用于获取待查重视频的多种类型的视频特征；序列比对模块，用于根据所述待查重视频的多种视频特征，对多个已有视频分别进行序列比对，得到序列比对结果；第一排名模块，用于根据所述序列比对结果，对所述多个已有视频进行第一排名，根据所述第一排名的结果，取出前n个所述已有视频作为第一候选视频，其中n为正整数；查重模块，用于根据所述第一候选视频的所述序列比对结果，确定所述待查重视频的重复情况。

本公开的目的还可以采用以下的技术措施来进一步实现。

前述的重复视频的判断装置，其还包括执行前述任一重复视频的判断方法步骤的模块。

本公开的目的还采用以下技术方案来实现。依据本公开提出的一种重复视频的判断硬件装置，包括：存储器，用于存储非暂时性计算机可读指令；以及处理器，用于运行所述计算机可读指令，使得所述处理器执行时实现前述任意一种重复视频的判断方法。

本公开的目的还采用以下技术方案来实现。依据本公开提出的一种计算机可读存储介质，用于存储非暂时性计算机可读指令，当所述非暂时性计算机可读指令由计算机执行时，使得所述计算机执行前述任意一种重复视频的判断方法。

本公开的目的还采用以下技术方案来实现。依据本公开提出的一种终端设备，包括前述任意一种重复视频的判断装置。

上述说明仅是本公开技术方案的概述，为了能更清楚了解本公开的技术手段，而可依照说明书的内容予以实施，并且为让本公开的上述和其他目的、特征和优点能够更明显易懂，以下特举较佳实施例,并配合附图，详细说明如下。

附图说明

图1是本公开一个实施例的重复视频的判断方法的流程框图。

图2是本公开一个实施例提供的获取待查重视频的视频特征的流程框图。

图3是本公开一个实施例提供的提取栅栏特征流程框图。

图4是本公开一个实施例提供的提取池化特征流程框图。

图5是本公开一个实施例提供的利用随机投影法对图像特征进行二值化处理的流程框图。

图6是本公开一个实施例提供的序列比对的流程框图。

图7是本公开一个实施例提供的利用动态规划法进行序列比对的流程框图。

图8是本公开一个实施例提供的利用匀速视频法进行序列比对的流程框图。

图9是本公开一个实施例提供的第二排名的流程框图。

图10是本公开一个实施例的重复视频的判断装置的结构框图。

图11是本公开一个实施例提供的视频特征获取模块的结构框图。

图12是本公开一个实施例提供的序列比对模块的结构框图。

图13是本公开一个实施例的重复视频的判断硬件装置的硬件框图。

图14是本公开一个实施例的计算机可读存储介质的示意图。

图15是本公开一个实施例的终端设备的结构框图。

具体实施方式

为更进一步阐述本公开为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本公开提出的重复视频的判断方法及装置的具体实施方式、结构、特征及其功效，详细说明如后。

图1为本公开的重复视频的判断方法一个实施例的示意性流程框图。请参阅图1，本公开示例的重复视频的判断方法，主要包括以下步骤：

步骤S11，获取待查重视频(Query Video)的多种视频特征。这里所说的视频可以是一段视频信号，也可以是一个视频文件。不妨将待查重视频的视频特征定义为第一视频特征。此后，处理进到步骤S12。

步骤S12，根据待查重视频的多种该第一视频特征，对多个已有视频中的每个已有视频分别进行序列比对，得到每个已有视频的序列比对结果。在一些示例中，该序列比对结果包括用于表现该已有视频与待查重视频的相似程度的序列比对评分和/或该已有视频与待查重视频的相重复的视频片段。在一些实施例中，该已有视频为一个视频数据库中的视频。此后，处理进到步骤S13。

步骤S13，根据该序列比对结果，对该多个已有视频进行第一排名，根据该第一排名的结果，取出第一排名结果中的前n个已有视频作为第一候选视频，其中n为正整数。此后，处理进到步骤S14。

步骤S14，根据该第一候选视频的序列比对结果，确定该待查重视频的重复情况。例如确定该待查重视频是否为重复视频(可以通过人工比对来确定，也可以通过预设一个序列比对评分的阈值，并根据第一候选视频的序列比对评分是否高于该阈值来确定)、确定与哪个或哪些已有视频相重复、还可以确定具体的重复视频片段，进而过滤重复视频。

利用本公开提出的重复视频判断方法进行视频查重，通过利用多种视频特征进行查重，能够大大提高判断重复视频的准确性和效率。

下面对上述的步骤分别进行详细的陈述和说明。

一、关于步骤S11。

图2为本公开一个实施例提供的获取待查重视频的视频特征的示意性框图。请参阅图2，在本公开的一种实施例中，本公开示例中的步骤S11包括以下步骤：

步骤S21，对待查重视频进行采样抽帧，得到该待查重视频的多个帧图像。事实上该多个帧图像构成的一个图像序列。具体地，所抽取的帧图像的具体数量是可以设置的，例如可以从每秒视频中抽取两个帧图像，也可以从每秒视频中抽取一个帧图像。需注意，可以均匀地进行抽帧，即相邻的两个帧图像之间的时间间隔是一致的。。

步骤S22，提取每个帧图像的多种的图像特征，不妨将待查重视频的图像特征定义为第一图像特征。

步骤S23，根据待查重视频的该多个帧图像的同种的每个第一图像特征确定该待查重视频的第一视频特征，从而得到多种第一视频特征。具体地，可以将该多个第一图像特征按照所对应的多个帧图像在视频中的顺序(也就是在图像序列中的顺序)进行排列，得到该第一视频特征。

其中，对步骤S22中的提取图像特征的方法以及所得到的第一图像特征的类型不做限制，可以利用多种方式进行的第一图像特征的提取。例如提取得到的第一图像特征可以是浮点数特征也可以是二值化特征。需要说明的是，视频数据库中记录有已有视频的视频特征(不妨将已有视频的视频特征定义为第二视频特征，且该第二视频特征由多个第二图像特征构成)，并且，视频数据库中包含与第一视频特征为利用相同方法提取到的相同类型的第二视频特征，以使得在视频特征比对过程中能够进行相同类型的第一视频特征与第二视频特征的比较。

值得注意的是，可以按照上述方法获取已有视频的视频特征。为了便于区分，不妨将已有视频的视频特征定义为第二视频特征，第二视频特征中的图像特征定义为第二图像特征。

在本公开的一些实施例中，在步骤S22中提取得到的多种图像特征之中包括栅栏特征(也可以称为Fence特征或Recall特征)。提取帧图像的栅栏特征的方法为：对于每个帧图像，获取一个或多个检测向量，利用每个检测向量，以一个帧图像中的任意像素作为起点确定该检测向量指向的终点，确定每对起点与终点之间的差异情况，根据各对起点终点的差异情况的总体情况来确定帧图像的图像特征，将这种图像特征定义为栅栏特征。需要注意的是，所谓的以任意像素作为起点为：一般可以将帧图像中的所有像素定义为起点；或者也可以将帧图像中的一个或多个预设位置的像素定义为起点，而具体的位置是任意的，例如，可以取一个帧图像中所有的未处于边缘上的点作为起点。

具体地，图3为本公开一个实施例提供的提取栅栏特征的示意性框图。由于对任何视频均可以按照图3所示的方法获取图像特征，在本实施例的说明中不区分是否为待查重视频。请参阅图3，在本公开的一种实施例中，本公开示例中的步骤S22可以包括以下步骤：

步骤S31，获取一个或多个检测向量(shift vectors)。不妨假设所获取的检测向量的数量为N个，其中的N为正整数。具体地，该多个检测向量可以是预设的，也可以是随机生成的。进一步地，每个检测向量的长度和方向都是任意的。另外，各个检测向量之间是独立的，不需要有任何关联。值得注意的是，对于抽帧得到的多个帧图像，一般可以利用同一组检测向量来确定各个帧图像的图像特征，但是也可以利用不同的多组检测向量来分别确定各个帧图像的图像特征。此后，处理进到步骤S32。

步骤S32，根据一个检测向量，以帧图像中的每个像素作为起点，确定该起点的经该检测向量指向的终点的像素，根据各个起点像素与对应的终点像素之间的差异情况的总体情况，确定该帧图像的基于每个检测向量的特征比特(bit)。此后，处理进到步骤S33。

步骤S33，分别确定每个检测向量对应的特征比特，根据所得的N个该特征比特，确定与该帧图像对应的一个栅栏特征。

在一些示例中，起点像素与终点像素之间的差异情况包括起点像素的亮度信息与终点像素的亮度信息之间的差异情况。具体地，在一个示例中，步骤S32包括：为一个检测向量分配一个计数器；统计每对起点和终点的亮度差异，对计数器的取值进行增减，如果起点的亮度值大于终点的亮度值，则计数器的值+1，反之，如果起点的亮度值小于终点的亮度值则计数器的值-1；判断该计数器的值是否大于预设的设定值(例如可将该设定值预设为0)，如果该计数器的值大于该设定值，则生成一个取值为1的特征比特，反之则生成一个取值为0的特征比特。

需要说明的是，如果检测向量的终点超出了帧图像的范围，可以不改变计数器的值，或者也可以对该帧图像进行周期性的延拓，在该帧图像的四面八方设置与该帧图像同样的帧图像，以使得检测向量的终点一定存在一个对应的像素。

根据长度、方向任意的检测向量确定帧图像中的起点像素和终点像素，并比较起点像素与终点像素之间的差异情况来生成帧图像的特征，能够提高视频特征提取的准确性和提取的效率，并能提高得到的视频特征的优良程度，进而使得基于栅栏特征进行的视频查重具有更高的准确率和效率。

在本公开的一些实施例中，在步骤S22中提取得到的多种图像特征之中包括池化特征(也可以称为Pooling特征或Reranking特征)。提取帧图像的池化特征的方法为：对于每个帧图像，逐级地进行多种类型的池化(Pooling)处理，以得到该帧图像的图像特征，将这种图像特征定义为池化特征。其中，池化(Pooling)是一种在卷积神经网络领域的降维方法，而所谓的多种类型的池化包括最大池化、最小池化和平均池化。具体地，可以基于帧图像的多种颜色通道逐级地进行多种类型的池化，以根据帧图像的多种颜色通道得到图像特征。

具体地，对帧图像逐级地进行多种类型的池化的包括：根据帧图像确定一个矩阵，利用多种类型的池化，逐级地生成更小的矩阵，直到缩小为一个仅包括一个点的矩阵(或者，也可以将矩阵中的“点”称为矩阵中的“元素”)，根据该仅包含一个点的矩阵确定该帧图像的池化特征。图4为本公开一个实施例提供的提取池化特征的示意性框图。由于对任何视频均可以按照图4所示的方法获取图像特征，在本实施例的说明中不区分是否为待查重视频。请参阅图4，在本公开的一种实施例中，本公开示例中的步骤S22可以包括以下步骤：

步骤S41，根据一个帧图像，确定一个具有第一矩阵维度和第二矩阵维度(或者说，具有长度方向和宽度方向)的第一矩阵。不妨假设该帧图像的长度为x像素、宽度为y像素，其中的x和y为正整数。该第一矩阵中的一个点(也可以将矩阵中的点称为矩阵中的元素，但为了与向量中的元素相区分，以下均将矩阵中的元素称为“点”)对应该帧图像中的一个像素，从而该第一矩阵为一个第一矩阵维度的长度为x、第二矩阵维度的长度为y的矩阵(即x*y矩阵)；这里所说的矩阵的第一矩阵维度/第二矩阵维度的长度用于表示该矩阵在第一矩阵维度/第二矩阵维度上所包含的点的数量。该第一矩阵中的每个点的取值为一个3维的向量，将该3维的向量定义为第一向量，该第一向量用于表示该帧图像中的对应像素的三个颜色通道的亮度。需要注意的是，当视频对象的颜色模式为红绿蓝模式(RGB模式)时，可以取红、绿、蓝三个颜色通道；但并非一定取红、绿、蓝三个颜色通道，例如，可以根据视频对象所使用的颜色模式进行选取；甚至所选取的颜色通道的数量也并非必须是三个，例如，可以选取红绿蓝三个颜色通道中的两个。此后，处理进到步骤S42。

步骤S42，在第一矩阵上设置多个第一区块(事实上每个区块相当于一个池化窗，因此也可将第一区块称为第一池化窗)，不妨设置x ₁*y ₁个第一区块，其中的x ₁和y ₁为正整数，每个第一区块包含多个该第一矩阵的点(或者说，包含多个第一向量)；该多个第一区块在第一矩阵维度上的数量少于该第一矩阵的第一矩阵维度的长度(或者说，少于该第一矩阵在第一矩阵维度上所包含的点的数量)，且该多个第一区块在第二矩阵维度上的数量少于该第一矩阵的第二矩阵维度的长度(或者说，少于该第一矩阵在第二矩阵维度上所包含的点的数量)，即有x ₁的值小于x，且y ₁的值小于y。对于每个第一区块，分别计算第一区块所包含的多个第一向量的各个维的最大值、最小值和平均值，得到该第一区块对应的一个9维的向量，将该9维的向量定义为第二向量。需要说明的是，各个第一区块之间可以部分相互重叠，即可以包含相同的点，也可以不相互重叠。此后，处理进到步骤S43。

具体地，在设置第一区块时，可以均匀地将第一矩阵的第一矩阵维分成x ₁段，每段具有相同的长度，且相邻两段之间包含相同的点(部分重叠)，按照同样的方式，将第一矩阵的第二矩阵维分成y ₁段，再将该x ₁段与该y ₁段进行组合，得到第一矩阵的x ₁*y ₁个第一区块。

需要说明的是，当设置的每个第一区块具有相同的大小和相同的间距时(相邻的两个第一区块可以重叠)，前述的在第一矩阵上设置多个第一区块并计算各个第一区块的第二向量的过程，事实上等同于用一个池化窗按照一定间距扫描(或者说划过)整个第一矩阵，并在每次扫描中，计算该池化窗覆盖的区域的第二向量。

步骤S43，根据该多个x ₁*y ₁个第一区块以及每个第一区块对应的第二向量，确定第二矩阵；该第二矩阵中的一个点对应一个第一区块，当设置了x ₁*y ₁个第一区块时，该第二矩阵就是一个第一矩阵维的长度为x ₁、第二矩阵维的长度为y ₁的矩阵(即x ₁*y ₁矩阵)；该第二矩阵中的各个点的取值为对应的第一区块的该第二向量。此后，处理进到步骤S44。

需要说明的是，在确定第二矩阵时，需要按照一定顺序进行第一区块与第二矩阵中的点的对应。作为一种具体示例，可以按照各个第一区块在第一矩阵中的位置顺序，对第二矩阵中的各个点进行排列。

步骤S44，重复步骤S42和步骤S43：根据包含x ₁*y ₁个点且每个点的取值为9维向量的第二矩阵，得到包含x ₂*y ₂个点且每个点的取值为27维向量的第三矩阵(其中的x ₂为小于x ₁的正整数，y ₂为小于y ₁的正整数)；再根据包含x ₂*y ₂个点且每个点的取值为27维向量的第三矩阵，得到包含x ₃*y ₃个点且每个点的取值为81维向量的第三矩阵(其中的x ₃为小于x ₂的正整数，y ₃为小于y ₂的正整数)；...；直到将该第一矩阵(或者说，该帧图像)缩小成一个1*1的第N矩阵(事实上，就是将矩阵降维成了一个点)，其中的N为正整数，该第N矩阵仅包括一个点，该点的取值为一个3 ^N维的向量；将该3 ^N维向量确定为该帧图像的池化特征。

需要注意的是，在步骤S44中，在各次的设置区块的过程中，应根据矩阵的大小采用相应的方式来设置区块，以适应矩阵的第一矩阵维、第二矩阵维的逐级减小。

通过逐级地对帧图像进行多种类型的池化以生成帧图像的特征，能够提高视频特征提取的准确性和提取的效率，并能提高得到的视频特征的优良程度和鲁棒性，进而使得基于池化特征进行的视频查重具有更高的准确率和效率。

进一步地，在本公开的实施例中，如果在步骤S22中所确定的图像特征不是二进制数构成的比特串(例如前述的池化特征就是一种浮点数特征)，则本公开还可以包括以下步骤：对在步骤S22中所确定的图像特征进行二值化处理，得到二值化的图像特征，该二值化的图像特征为由0/1构成的比特串。然后，再根据所得到的二值化的图像特征，确定视频对象的视频特征。

将图像特征进行二值化处理，能够压缩视频特征的存储，并加速视频比对的相似度计算过程。

具体地，可以利用随机投影(random projection)法将图像特征转化为二值化形式的图像特征。由于待查重视频的第一图像特征与已有视频的第二图像特征可以利用同样的方法进行二值化，在本示例中，不区分第一图像特征与第二图像特征。图5为本公开一个实施例提供的利用随机投影法对图像特征进行二值化的示意性框图。请参阅图5，本公开示例的重复视频的判断方法，还可以包括以下的利用随机投影法对图像特征进行二值化处理的步骤：

步骤S51，为了生成长度为h的二值化图像特征，根据一个图像特征，生成2h个小组(group)，每个小组包含该图像特征中的多个元素(也就是，每个小组包含图像特征的多个维度的数值)。其中的h为正整数。此后，处理进到步骤S52。

需要说明的是，一个小组具体包含哪些元素是任意的，并且两个不同小组可以包括一些相同的元素。不过，为了便于视频比对，每个小组包含具体包含哪些元素可以是预设的，或者对多个视频可以采用同样的方式来生成该小组。

在本示例中，每个小组所包含的元素的数量是相同的。但需要说明的是，事实上各个小组所包含的元素的数量也可以是不同的。

步骤S52，分别对每个小组所包括的多个元素进行求和，以得到每个小组的加和值。此后，处理进到步骤S53。

步骤S53，将该2h个小组两两配对，得到h个小组对。此后，处理进到步骤S54。

具体地，可以预先将2h个小组编号(或者将小组排序)，并将相邻的两个小组配成一对。

步骤S54，分别对每个小组对进行比较，比较每一个小组对中的两个小组的加和值的大小，根据比较的结果生成一个二值化的图像特征比特。此后，处理进到步骤S55。

具体地，在预先已将小组编号的示例中，在一对小组中，如果编号小的小组的加和值大于编号大的小组的加和值，则生成一个取值为1的二值化图像特征比特，反之则生成一个取值为0的二值化图像特征比特。需要说明的是，不限制生成二值化图像特征比特的方式，比如，也可以当编号小的小组的加和值小于编号大的小组的加和值时生成取值为1的二值化图像特征比特。

步骤S55，根据该h个小组对的该h个二值化图像特征比特，组成长度为h的二值化图像特征。

二、关于步骤S12和步骤S13。

图6为本公开一个实施例提供的序列比对的示意性流程框图。请参阅图6，本公开示例中的步骤S12，可以包括以下步骤：

步骤S61，获取一个已有视频的多种视频特征。不妨将已有视频的视频特征定义为第二视频特征，每种第二视频特征包含多个第二图像特征。此后，处理进到步骤S62。

例如，可以同时获取待查重视频和已有视频的前述的栅栏特征和池化特征，和/或同时获取前述的浮点数特征和二值化特征。

步骤S62，针对多种第二视频特征和多种第一视频特征，分别确定每种第二视频特征中的每个第二图像特征与同种的第一视频特征中的每个第一图像特征之间的单体相似度，以得到多种单体相似度。每个单体相似度用于表示一个第一图像特征与一个第二图像特征之间的相似程度，具体可以是，单体相似度越大表示越相似。此后，处理进到步骤S63。

不妨假设待查重视频的第一视频特征的长度、已有视频的第二视频特征的长度分别为M ₁和M ₂，其中的M ₁和M ₂为正整数，也就是说，第一视频特征包含M ₁个第一图像特征，第二视频特征包含M ₂个第二图像特征。从而同种的第一视频特征和第二视频特征之间可以得到M ₁*M ₂个单体相似度。

在本公开的实施例中，可以根据图像特征的类型，选择能够判断第一、第二图像特征的相似程度的距离或度量作为该单体相似度。

具体地，当第一、第二图像特征同为浮点数特征时，可根据第一图像特征与第二图像之间的余弦距离(或者，称为余弦相似度)确定该单体相似度；一般可直接将该余弦距离确定为单体相似度。而当第一、第二图像特征同为二值化特征时，可根据第一图像特征与第二图像特征之间的汉明距离(Hamming距离)确定该单体相似度。具体地，先计算第一、第二图像特征之间的汉明距离，再计算图像特征的长度与该汉明距离的差值，并将该差值与该图像特征长度的比值确定为单体相似度，用以表示二值化的第一、第二图像特征中的相同比特所占的比例。其中的汉明距离是一种信息论领域中常用的度量，两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。需要说明的是，利用同种方法提取得到的图像特征一般具有相同的长度。

值得注意的是，不限于利用余弦距离或汉明距离表示该单体相似度，而是可以利用任何可以判断两个图像特征的相似程度的距离或度量。

步骤S63，在一个示例中，确定多种单体相似度的最小值，根据该多种单体相似度的平均值确定该已有视频的相似度矩阵(Similarity Matrix)；或者在另一个示例中，确定多种单体相似度的最小值，根据该多种单体相似度的最小值确定该已有视频的相似度矩阵。

具体地，该相似度矩阵中的每个点对应一个单体相似度，使得该相似度矩阵记录有一个已有视频的各个第二图像特征与各个第一图像特征之间的单体相似度。并且，该相似度矩阵的各个点：在横向上按照待查重视频的各个第一图像特征在第一视频特征中的先后顺序排列，且在纵向上按照已有视频的各个第二图像特征在第二视频特征中的先后顺序排列。从而位于第i行第j列的点表示待查重视频第i帧和已有视频第j帧之间的单体相似度，进而该相似度矩阵为一个M ₁×M ₂矩阵。此后，处理进到步骤S64。

需要说明的是，在取多种单体相似度的平均值或最小值之前，需要确保各种单体相似度具有一致的取值范围，例如可以预先将所有类型的单体相似度的取值范围均设置为0到1。事实上，前述的根据余弦距离确定的单体相似度的示例以及根据汉明距离确定的单体相似度的示例，均已将单体相似度的取值范围设置为0到1。

需要说明的是，在实际操作中，并非一定先进行步骤S62的计算各个单体相似度，再进行步骤S63的确定相似度矩阵，而是可以直接确定相似度矩阵，在确定该相似度矩阵的各个点的过程中计算对应的单体相似度。

步骤S64，根据该相似度矩阵，确定该已有视频与待查重视频的相似情况。具体地，所谓的确定相似情况包括，根据该相似度矩阵来确定该已有视频与待查重视频之间的相似程度，并可以利用序列比对评分来表现该相似程度。在本公开的实施例中，该序列比对评分可以是一个0到1之间的分数，数字越大表示两段视频越相似。进一步地，前述的确定相似情况还包括根据相似度矩阵来确定该已有视频和该待查重视频中的相重复的视频片段的起止时间。

在本公开的一些实施例中，步骤S64包括：根据相似度矩阵中的直线来确定待查重视频与已有视频的相似情况。

需注意，由于视频特征一般包含有穷的多个图像特征，从而相似度矩阵为有穷矩阵，因此实际上所谓的“直线”是相似度矩阵中的多个点组成的有穷长的线段。该直线具有斜率，该斜率为直线所包括的多个点的连线的斜率。另外，该直线的起点和终点可以是相似度矩阵中的任意的点，不必是位于边缘的点。

本公开所说的直线包括相似度矩阵中的对角线、与该对角线相平行的各条线段这些在相似度矩阵中从左上到右下的斜率为1的直线，还包括斜率不为1的直线。例如，可以是的斜率近似于1的直线，以提高查重的鲁棒性；可以是斜率为2、3、...或1/2、1/3、...等的直线，以应对经过调速的视频的查重；甚至可以是斜率为负数的直线(在相似度矩阵中从左下到右上的直线)，以应对经过反向播放处理的视频。其中的对角线为由位于(1,1)、(2,2)、(3,3)...的点组成的线段(事实上就是以左上角的点为起点且斜率为1的一条直线)。

事实上，相似度矩阵中的每条直线均由顺序排列的多个单体相似度构成，因此由于每条直线表现了多个顺序排列的图像特征对的相似情况，从而能够表现一段待查重视频片段与一段已有视频片段的相似程度。其中每个图像特征对包括一个第一图像特征和一个第二图像特征。也就是说，每条直线表现了多个顺序排列的第一图像特征与多个顺序排列的第二图像特征之间的相似程度。而直线的斜率、起点终点表现了两段视频片段的长度、位置。例如，由(1,1)、(2,3)、(3,5)、(4,7)构成的直线，由于表现了序数为1的第一图像特征与序数为1第二图像特征之间的相似情况、序数为2的第一图像特征与序数为3第二图像特征之间的相似情况、...，从而该直线能够反应序数为1、2、3、4的第一图像特征所对应的一段待查重视频的片段与序数为1、3、5、7的第二图像特征所对应的一段已有视频的片段之间的相似情况。

因此，可以根据相似度矩阵中的直线来确定两个视频的相似情况：不妨将一个直线所包含的各个单体相似度的平均情况(或总体情况)定义为该直线的直线相似度，该直线相似度能够体现对应的多个第一图像特征与多个第二图像特征之间的相似情况；在相似度矩阵中确定一条直线相似度最高的直线，不妨称为匹配直线；将匹配直线的直线相似度确定为待查重视频与已有视频的相似程度，和/或根据匹配直线所对应的多个第一图像特征和多个第二图像特征来确定待查重视频与已有视频的重复视频片段。

其中的根据相似度矩阵中的直线(例如匹配直线)来确定重复视频片段的具体方法可以是：根据直线的起点所对应的第一图像特征的序数(或者说，相似度矩阵中的横坐标)确定待查重视频中的重复视频片段的开始时间，而根据该起点所对应的第二图像特征的序数(或者说，相似度矩阵中的纵坐标)确定已有视频中的重复视频片段的开始时间；类似地，根据直线的终点的横坐标确定待查重视频中的重复视频片段的结束时间，而根据该终点的纵坐标确定已有视频中的重复视频片段的结束时间。

需要注意的是，在确定匹配直线的过程中，可以是从预设的多条直线中确定一条直线相似度最高的直线，例如该预设的多条直线为所有的斜率为预设的斜率设定值(比如斜率为1)的直线，或者，也可以是先从相似度矩阵中选取使得单体相似度的大小排名靠前的多个点，再根据这些点拟合出一条直线，以生成一条使得直线相似度相对最高的直线。

在本公开的一个具体实施例中，可以利用动态规划法来根据相似度矩阵确定两个视频的相似情况。图7为本公开一个实施例提供的利用动态规划法进行视频查重的示意性流程框图。请参阅图7，在一种实施例中，本公开的步骤S64包括以下具体步骤：

步骤S64-1a，将相似度矩阵中的斜率为预设的斜率设定值的多条直线定义为备选直线，根据每条备选直线所包含的各个单体相似度确定该备选直线的直线相似度。具体地，一条直线的直线相似度可以设置为该直线所包含的各个单体相似度的平均值，或者可以设置为该直线所包含的各个单体相似度的总和值。在一种具体示例中，可以将斜率设定值取为1，即前述的备选直线为：相似度矩阵中的对角线以及与该对角线平行的直线。此后，处理进到步骤S64-1b。

需要注意的是，在本公开的一种实施例中，步骤S64-1a还包括：先从备选直线中排除那些包含的单体相似度的数量少于预设的直线长度设定值的直线，然后再进到步骤S64-1b。或者说，在本实施例中，备选直线还须满足：包含的单体相似度的数量达到预设的直线长度设定值。通过排除单体相似度过少的直线，可以排除当直线包含的单体相似度过少而影响最终得到的序列比对结果的准确性的问题。

步骤S64-1b，从该多条备选直线中，确定一条使得该直线相似度最大的备选直线，并定义为第一匹配直线。此后，处理进到步骤S64-1c。

步骤S64-1c，将该第一匹配直线的直线相似度确定为序列比对评分，用以表现待查重视频与已有视频的相似程度；根据该第一匹配直线的起点和终点确定两个视频中的重复片段的起止时间。

需要注意的是，在本公开的一些实施例中，步骤S64-1a中的预设的斜率设定值可以为多个，即备选直线为斜率与多个斜率设定值中任意一个相等的直线，例如备选直线可以为斜率为1、-1、2、1/2等的直线，并且在步骤S64-1b中，从斜率为多个斜率设定值中任意一个的多条备选直线中确定一条第一匹配直线。

本公开提出的重复视频的判断方法，通过利用动态规划法来确定序列比对评分和/或确定相重复的视频片段，能够提高查重的准确性和查重的速度。

在本公开的另一个具体实施例中，也可以利用匀速视频法来根据相似度矩阵确定两个视频的相似情况。图8为本公开一个实施例提供的利用匀速视频法进行视频查重的示意性流程框图。请参阅图8，在一种实施例中，本公开的步骤S64包括以下具体步骤：

步骤S64-2a，在相似度矩阵中选取单体相似度最大的多个点，并定义为相似度极值点。所取的相似度极值点的具体数量可以是预设的。此后，处理进到步骤S64-2b。

步骤S64-2b，基于该多个相似度极值点，在该相似度矩阵中拟合出一条直线作为第二匹配直线。在一些具体示例中，基于该多个相似度极值点拟合出一条具有预设的斜率设定值或接近预设的斜率设定值的直线作为第二匹配直线，例如，拟合出一条斜率接近1的直线。具体地，可以利用随机抽样一致法(Random Sample Consensus法，简称为RANSAC法)在该相似度矩阵中拟合出一条斜率接近斜率设定值的直线。其中的RANSAC法是一种常用的根据一组包含异常数据的样本数据集，计算出数据的数学模型参数，以得到有效样本数据的方法。此后，处理进到步骤S64-2c。

步骤S64-2c，根据该第二匹配直线所包含的多个单体相似度来确定序列比对评分，用以表现待查重视频与已有视频的相似程度。具体地，可以将该第二匹配直线上的各个单体相似度的平均值确定为该序列比对评分。另外，可以根据该第二匹配直线的起点和终点确定两个视频中的重复片段的起止时间。

本公开提出的重复视频的判断方法，通过利用匀速视频法来确定序列比对评分和/或确定相重复的视频片段，能够提高查重的准确性和查重的速度。

在本公开的一些实施例中(例如前述的图7和图8所示的实施例)，步骤S64还包括：检测所得到的第一匹配直线或第二匹配直线的开头部分和结尾部分，判断该第一匹配直线/第二匹配直线的开头部分和结尾部分的点(单体相似度)是否达到预设的单体相似度设定值，去掉第一匹配直线/第二匹配直线的开头和结尾的未达到该单体相似度设定值(即单体相似度不高)的部分，保留中间一段直线并定义为第三匹配直线；根据该第三匹配直线的直线相似度来确定待查重视频与已有视频的相似程度，和/或根据该第三匹配直线的起点和终点确定待查重视频与已有视频的重复视频片段的起止时间。通过去掉匹配直线开头结尾的相似度不高的部分、保留中间一段相似度较高的直线之后，再确定待查重视频与已有视频的相似情况，能够提高查重的准确性，能够更准确地得到重复视频片段的起止时间。

其中的去掉匹配直线开头/结尾的未达到该单体相似度设定值的部分的具体方法可以是：从匹配直线的起点/终点向中间依次检查，判断是否达到该单体相似度设定值，在找到第一个达到该单体相似度设定值的点后，去掉该点到起点/终点之间的多个点。

本公开的重复视频的判断方法，通过取多种视频特征的相似度的平均值或最小值进行视频查重，能够减少或排除利用单种视频特征得到相似度(例如前述的相似度矩阵、直线相似度等)进行比对存在误匹配的情况，进而提高查重的准确性。

进一步地，如果对视频数据库中的所有视频都进行序列比对和第一排名，可能会影响查重效率。因此在序列比对之前，可以先根据至少一种第一视频特征中的每个单独的第一图像特征，对多个已有视频进行第二排名，以从视频数据库中选出第二候选视频，进而再对第二候选视频进行序列比对。具体地，可以将至少一种第一视频特征中的每个单独的第一图像特征作为索引请求，对多个已有视频进行词频-逆向文件频率方式的排名(term frequency–inverse document frequency ranking，简称为TF-IDF排名)。

在本公开的一些实施例中，可以对第二视频特征进行索引，以预先得到多个已有视频的特征索引，然后将该特征索引与第一图像特征进行匹配，以对多个已有视频进行TF-IDF排名。

具体地，前述的预先得到已有视频的特征索引进一步包括，预先得到已有视频的视频特征的正排特征索引(forward index)和倒排特征索引(inverted index)，以便于对视频查重。该正排特征索引和倒排特征索引可以预先存储在视频数据库中。其中，正排特征索引用于记录各个已有视频的视频特征，即记录了各个已有视频的视频特征具体包含了哪些图像特征以及这些图像特征的顺序；倒排特征索引用于记录各个图像特征在哪个或哪些已有视频的视频特征中出现。具体地，可以利用键值对(key-value对)的形式来存储该正排特征索引和倒排特征索引：在正排特征索引中，用一个键(key)表示一个视频的编号(或者，称为视频ID)，而与该键对应的值(value)记录该视频包含了哪些图像特征以及这些图像特征的顺序，不妨将正排特征索引中的键、值分别称为正排键、正排值；在倒排特征索引中，用一个键(key)表示一个图像特征，而与该键对应的值(value)记录包含有该图像特征的视频的编号，不妨将倒排特征索引中的键、值分别称为倒排键、倒排值。

其中的TF-IDF排名是一类通过对信息进行词频和逆向文件频率加权，来判断信息的重要程度，以进行排名的技术。其中的词频是指一个词(或者说，一个信息)在某个文章(或者说，某个文件)中出现的频率，词频越高说明该词对于该文章越重要；其中的文件频率是指一个词出现在了文章库中的多少个文章中，而逆向文件频率是文件频率的倒数(实际计算时，还可对逆向文件频率取对数，或者定义逆向文件频率是文件频率的倒数的对数)，逆向文件频率越高，说明该词的区分度越好。因此，TF-IDF排名利用词频与逆向文件频率的乘积的大小进行排名。事实上，可以将一个视频的视频特征作为一个文章，而每个图像特征作为一个词，从而能够利用TF-IDF方式对已有视频进行排名。

另外，如果对视频数据库中的所有已有视频都进行第二排名，可能会影响第二排名的效率，因此在第二排名之前，可以先对视频数据库中的已有视频进行绝对匹配(exact match)。其中的绝对匹配，用于选出所包含的第一图像特征的数量在预设数量或预设比例以上的已有视频进行第二排名。

图9为本公开一个实施例提供的包含绝对匹配步骤的第二排名的示意性流程框图。请参阅图9，在本公开的一个实施例中，在进行步骤S12之前，先进行以下步骤：

步骤S71，根据倒排特征索引，统计各个第一图像特征在哪些已有视频的第二视频特征中出现，以从视频数据库中匹配出包含预设数量以上第一图像特征的已有视频作为第三候选视频集合。此后，处理进到步骤S72。

步骤S72，基于正排特征索引，确定一个第一图像特征在一个第三候选视频的第二视频特征中的词频。该词频为：一个第一图像特征在一个第二视频特征所包含的全部图像特征之中所占的比例。此后，处理进到步骤S73。

步骤S73，基于倒排特征索引，确定一个第一图像特征的文件频率。该文件频率为：在多个已有视频之中(例如，可以是视频数据库中所有的已有视频)，第二视频特征中包含有该第一图像特征的已有视频的数量占已有视频总数的比例。此后，处理进到步骤S74。

步骤S74，根据各个第一图像特征在一个第三候选视频的第二视频特征中的词频以及各个第一图像特征的文件频率，确定该第三候选视频的词频-逆向文件频率评分。此后，处理进到步骤S75。

步骤S75，根据得到的各个第三候选视频的词频-逆向文件频率评分对第三候选视频集合进行排名，得到第二排名的结果，从该第二排名结果中取出前k个第三候选视频作为第二候选视频集合。同时，还可以返回各个第二候选视频的第二视频特征(正排特征索引)，以备在后续的步骤S12中基于该第二视频特征对第二候选视频集合进行进一步处理。

在本实施例中，可以利用索引服务器，将待查重视频的第一图像特征的集合作为索引请求，根据前述的正排特征索引和倒排特征索引，进行绝对匹配和TF-IDF排名，以召回第二候选视频集合并同时返回得到的各个第二候选视频的正排特征索引。具体地，可以利用开源的Elasticsearch搜索引擎进行上述的各个步骤，以达到快速检索的效果。

值得注意的是，绝对匹配和第二排名着重关注各个单独的第一图像特征出现在哪些已有视频中，并未考虑各个第一图像特征在第一视频特征中的顺序对查重的影响，或者说并未考虑视频特征的整体或顺序排列的多个图像特征的匹配情况。

对应地，前述示例中的步骤S12、步骤S13变为：分别对该多个第二候选视频进行前述的序列比对，得到序列比对结果，并对该多个第二候选视频进行前述的第一排名，以根据该第一排名从多个第二候选视频中选出第一候选视频。

本公开提出的重复视频的判断方法，通过进行第二排名，能够大大提高判断重复视频的准确性和效率。

需要说明的是，在进行步骤S71之前，可以进行前述实施例中的将图像特征二值化的处理，以便于进行第二排名。

图10为本公开的重复视频的判断装置一个实施例的示意性结构框图。请参阅图10，本公开示例的重复视频的判断装置100主要包括：

视频特征获取模块110，用于获取待查重视频的多种类型的视频特征。

序列比对模块120，用于根据待查重视频的多种视频特征，对多个已有视频分别进行序列比对，得到序列比对结果。

第一排名模块130，用于根据该序列比对结果，对该多个已有视频进行第一排名，根据该第一排名的结果，取出第一排名结果中的前n个已有视频作为第一候选视频，其中n为正整数。

查重模块140，用于根据该第一候选视频的序列比对结果，确定该待查重视频的重复情况。

图11为本公开的一个实施例提供的视频特征获取模块110的示意性框图。请参阅图11，本公开示例的视频特征获取模块110主要包括：

采样单元111，用于对待查重视频进行采样抽帧，得到该待查重视频的多个帧图像。

第一图像特征提取单元112，用于提取每个帧图像的多种的图像特征，不妨将待查重视频的图像特征定义为第一图像特征。

第一视频特征确定单元113，用于待查重视频的该多个帧图像的同种的每个第一图像特征确定该待查重视频的第一视频特征，从而得到多种第一视频特征。

具体地，该第一图像特征提取单元112可以包括按照前述方法实施例中的步骤提取栅栏特征的多个子单元(图中未示出)，和/或包括按照前述方法实施例中的步骤提取池化特征的多个子单元(图中未示出)。

进一步地，本公开示例的重复视频的判断装置，还可以包括二值化模块(图中未示出)，该二值化模块用于利用随机投影法对图像特征进行二值化处理。

图12为本公开的一个实施例提供的序列比对模块120的示意性框图。请参阅图12，本公开示例的序列比对模块120主要包括：

第二视频特征获取单元121，用于获取一个已有视频的多种视频特征。不妨将已有视频的视频特征定义为第二视频特征，每种第二视频特征包含多个第二图像特征。

单体相似度确定单元122，用于分别确定每种第二视频特征中的每个第二图像特征与同种的第一视频特征中的每个第一图像特征之间的单体相似度，以得到多种单体相似度。

相似度矩阵确定单元123，该相似度矩阵第一确定单元123用于根据多种单体相似度的平均值确定该已有视频的相似度矩阵；或者该相似度矩阵第一确定单元123用于根据多种单体相似度的最小值确定该已有视频的相似度矩阵，。

序列比对单元124，用于根据该相似度矩阵，确定该已有视频与待查重视频的相似情况。具体地，该序列比对单元124用于根据相似度矩阵中的直线来确定待查重视频与已有视频的相似情况。

具体地，该序列比对单元124可以包括按照前述方法实施例中的利用匀速视频法确定该序列比对评分并确定视频重复片段的多个子单元(图中未示出)，或者，该序列比对单元124可以包括利用动态规划法确定该序列比对评分并确定视频重复片段的多个子单元(图中未示出)。

进一步地，如果对视频数据库中的所有视频都进行序列比对和第一排名，可能会影响查重效率。因此在序列比对模块120之前，可以设有第二排名模块(图中未示出)，用于根据至少一种第一视频特征中的每个单独的第一图像特征，对多个已有视频进行第二排名，以从视频数据库中选出第二候选视频。进而，序列比对模块120用于对该第二候选视频进行序列比对。具体地，该第二排名模块用于：将至少一种第一视频特征中的每个单独的第一图像特征作为索引请求，对多个已有视频进行词频-逆向文件频率TF-IDF方式的排名。

需要说明的是，可以在该第二排名模块之前设置前述的二值化模块，以便于该第二排名模块进行第二排名。

图13是图示根据本公开的实施例的重复视频的判断硬件装置的硬件框图。如图13所示，根据本公开实施例的重复视频的判断硬件装置300包括存储器301和处理器302。重复视频的判断硬件装置300中的各组件通过总线系统和/或其它形式的连接机构(未示出)互连。

该存储器301用于存储非暂时性计算机可读指令。具体地，存储器301可以包括一个或多个计算机程序产品，该计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。该易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器 (cache)等。该非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。

该处理器302可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制重复视频的判断硬件装置300中的其它组件以执行期望的功能。在本公开的一个实施例中，该处理器302用于运行该存储器301中存储的该计算机可读指令，使得该重复视频的判断硬件装置300执行前述的本公开各实施例的重复视频的判断方法的全部或部分步骤。

图14是图示根据本公开的实施例的计算机可读存储介质的示意图。如图14所示，根据本公开实施例的计算机可读存储介质400，其上存储有非暂时性计算机可读指令401。当该非暂时性计算机可读指令401由处理器运行时，执行前述本公开各实施例的重复视频的判断方法的全部或部分步骤。

图15是图示根据本公开实施例的终端设备的硬件结构示意图。终端设备可以以各种形式来实施，本公开中的终端设备可以包括但不限于诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置、车载终端设备、车载显示终端、车载电子后视镜等等的移动终端设备以及诸如数字TV、台式计算机等等的固定终端设备。

如图15所示，终端设备1100可以包括无线通信单元1110、A/V(音频/视频)输入单元1120、用户输入单元1130、感测单元1140、输出单元1150、存储器1160、接口单元1170、控制器1180和电源单元1190等等。图15示出了具有各种组件的终端设备，但是应理解的是，并不要求实施所有示出的组件。可以替代地实施更多或更少的组件。

其中，无线通信单元1110允许终端设备1100与无线通信系统或网络之间的无线电通信。A/V输入单元1120用于接收音频或视频信号。用户输入单元1130可以根据用户输入的命令生成键输入数据以控制终端设备的各种操作。感测单元1140检测终端设备1100的当前状态、终端设备1100的位置、用户对于终端设备1100的触摸输入的有无、终端设备1100的取向、终端设备1100的加速或减速移动和方向等等，并且生成用于控制终端设备1100的操作的命令或信号。接口单元1170用作至少一个外部装置与终端设备1100连接可以通过的接口。输出单元1150被构造为以视觉、音频和/或触觉方式提供输出信号。存储器1160可以存储由控制器1180执行的处理和控制操作的软件程序等等，或者可以暂时地存储己经输出或将要输出的数据。存储器1160可以包括至少一种类型的存储介质。而且，终端设备1100可以与通过网络连接执行存储器1160的存储功能的网络存储装置协作。控制器1180通常控制终端设备的总体操作。另外，控制器1180可以包括用于再现或回放多媒体数据的多媒体模块。控制器1180可以执行模式识别处理，以将在触摸屏上执行的手写输入或者图片绘制输入识别为字符或图像。电源单元1190在控制器1180的控制下接收外部电力或内部电力并且提供操作各元件和组件所需的适当的电力。

本公开提出的重复视频的判断方法的各种实施方式可以以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。对于硬件实施，本公开提出的重复视频的判断方法的各种实施方式可通过使用特定用途集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理装置(DSPD)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计为执行这里描述的功能的电子单元中的至少一种来实施，在一些情况下本公开提出的重复视频的判断方法的各种实施方式可以在控制器1180中实施。对于软件实施，本公开提出的重复视频的判断方法的各种实施方式可与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可由以任何适当的编程语言编写的软件应用程序(或程序)来实施，软件代码可以存储在存储器1160中并且由控制器1180执行。

以上，根据本公开实施例的重复视频的判断方法、装置、硬件装置、计算机可读存储介质以及终端设备，通过利用多种视频特征进行视频查重，能够大大提高判断重复视频的效率、准确性和鲁棒性。

以上结合具体实施例描述了本公开的基本原理，但是，需要指出的是，在本公开中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本公开为必须采用上述具体的细节来实现。

本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

另外，如在此使用的，在以“至少一个”开始的项的列举中使用的“或”指示分离的列举，以便例如“A、B或C的至少一个”的列举意味着A或B或C，或AB或AC或BC，或ABC(即A和B和C)。此外，措辞“示例的”不意味着描述的例子是优选的或者比其他例子更好。

还需要指出的是，在本公开的系统和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

可以不脱离由所附权利要求定义的教导的技术而进行对在此所述的技术的各种改变、替换和更改。此外，本公开的权利要求的范围不限于以上所述的处理、机器、制造、事件的组成、手段、方法和动作的具体方面。可以利用与在此所述的相应方面进行基本相同的功能或者实现基本相同的结果的当前存在的或者稍后要开发的处理、机器、制造、事件的组成、手段、方法或动作。因而，所附权利要求包括在其范围内的这样的处理、机器、制造、事件的组成、手段、方法或动作。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此，本公开不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

一种重复视频的判断方法，所述方法包括：

获取待查重视频的多种视频特征；

根据所述待查重视频的多种视频特征，对多个已有视频分别进行序列比对，得到序列比对结果；

根据所述序列比对结果，对所述多个已有视频进行第一排名，根据所述第一排名的结果，取出前n个所述已有视频作为第一候选视频，其中n为正整数；

根据所述第一候选视频的所述序列比对结果，确定所述待查重视频的重复情况。
根据权利要求1所述的重复视频的判断方法，其中，所述的获取所述待查重视频的多种视频特征包括：

对所述待查重视频进行抽帧，得到所述待查重视频的多个帧图像；

提取所述帧图像的多种图像特征作为第一图像特征；

根据所述待查重视频的多个帧图像的同种的所述第一图像特征，确定所述待查重视频的视频特征作为第一视频特征，以得到多种所述第一视频特征。
根据权利要求2所述的重复视频的判断方法，其中，所述的提取所述帧图像的多种图像特征包括：

对于每个所述帧图像，获取一个或多个检测向量，利用每个所述检测向量，以所述帧图像中的任意像素作为起点，确定所述起点的经所述检测向量指向的终点，根据各个所述起点与对应的所述终点之间的差异情况的总体情况来确定所述帧图像的图像特征，作为栅栏特征。
根据权利要求2所述的重复视频的判断方法，其中，所述的提取所述帧图像的多种图像特征包括：

对于每个所述帧图像，逐级地进行多种类型的池化，以得到所述帧图像的图像特征，作为池化特征；其中，所述多种类型的池化包括最大池化、最小池化和平均池化。
根据权利要求2所述的重复视频的判断方法，其中，所述的根据所述待查重视频的多种视频特征，对多个已有视频分别进行序列比对，得到序列比对结果包括：

获取一个所述已有视频的多种视频特征作为第二视频特征，每种所述第二视频特征包含多个第二图像特征；

分别确定同种的每个所述第二图像特征和每个所述第一图像特征之间的单体相似度，以得到多种所述单体相似度；

确定所述多种单体相似度的平均值或最小值，根据所述多种单体相似度的平均值或最小值确定所述已有视频的相似度矩阵；

根据所述相似度矩阵确定序列比对评分，所述序列比对评分用于表示所述已有视频与所述待查重视频的相似程度。
根据权利要求5所述的重复视频的判断方法，其中，所述的根据所述相似度矩阵确定序列比对评分包括：根据所述相似度矩阵中的直线确定序列比对评分。
根据权利要求5所述的重复视频的判断方法，其中，所述的根据所述待查重视频的多种视频特征，对多个已有视频分别进行序列比对，得到序列比对结果还包括：

根据所述相似度矩阵确定所述已有视频和所述待查重视频的重复视频片段。
根据权利要求2所述的重复视频的判断方法，其中，所述的根据所述待查重视频的多种视频特征，对多个已有视频分别进行序列比对，得到序列比对结果包括：

根据至少一种所述第一视频特征中的每个单独的第一图像特征，对多个已有视频进行第二排名，根据所述第二排名的结果，取出前k个所述已有视频作为第二候选视频，其中k为正整数；

分别对每个所述第二候选视频进行序列比对，得到序列比对结果。
根据权利要求8所述的重复视频的判断方法，其中，所述的根据至少一种所述第一视频特征中的每个单独的第一图像特征，对多个已有视频进行第二排名包括，

将至少一种所述第一视频特征中的每个单独的第一图像特征作为索引请求，对多个已有视频进行词频-逆向文件频率排名。
根据权利要求8所述的重复视频的判断方法，其中，所述根据所述待查重视频的多个帧图像的每种所述第一图像特征，确定所述待查重视频的所述多种视频特征作为第一视频特征包括：

对所述第一图像特征进行二值化处理；

根据所述多个帧图像的二值化的所述第一图像特征，确定所述第一视频特征。
一种重复视频的判断装置，所述装置包括：

视频特征获取模块，用于获取待查重视频的多种类型的视频特征；

序列比对模块，用于根据所述待查重视频的多种视频特征，对多个已有视频分别进行序列比对，得到序列比对结果；

第一排名模块，用于根据所述序列比对结果，对所述多个已有视频进行第一排名，根据所述第一排名的结果，取出前n个所述已有视频作为第一候选视频，其中n为正整数；

查重模块，用于根据所述第一候选视频的所述序列比对结果，确定所述待查重视频的重复情况。
根据权利要求11所述的重复视频的判断装置，还包括执行权利要求2到10中任一权利要求所述步骤的模块。
一种重复视频的判断硬件装置，包括：

存储器，用于存储非暂时性计算机可读指令；以及

处理器，用于运行所述计算机可读指令，使得所述处理器执行时实现根据权利要求1到10中任意一项所述的重复视频的判断方法。
一种计算机可读存储介质，用于存储非暂时性计算机可读指令，当所述非暂时性计算机可读指令由计算机执行时，使得所述计算机执行权利要求1到10中任意一项所述的重复视频的判断方法。
一种终端设备，包括权利要求11或12所述的一种重复视频的判断装置。