CN112468843A

CN112468843A - 视频去重方法及装置

Info

Publication number: CN112468843A
Application number: CN202011157663.6A
Authority: CN
Inventors: 余英; 常江; 宫良; 夏泳; 党海飞; 易鹏; 刘骏; 曹志; 韦安明; 李忠炤; 韩凯; 肖辉; 刘文翰; 丁正华; 高杨; 薛静宜
Original assignee: Beijing Zhongguang Hengtong Technology Co ltd; Planning Institute Of Radio And Television Of State Administration Of Radio And Television
Current assignee: Beijing Zhongguang Hengtong Technology Co ltd; Planning Institute Of Radio And Television Of State Administration Of Radio And Television
Priority date: 2020-10-26
Filing date: 2020-10-26
Publication date: 2021-03-09

Abstract

本申请实施例公开了一种视频去重方案，包括：获取一第一视频；根据设定的采样规则从所述第一视频中提取多个图像；其中，所述第一视频中场景变换剧烈程度较高的场景变换片段对应于较高的采样频率；对于所述多个图像中的每个图像，提取所述图像的图像特征信息；将所述多个图像对应的多个图像特征数据按照所述多个图像在所述第一视频中出现的顺序进行排序，得到所述第一视频的第一视频特征数据；将所述第一视频对应的第一视频特征数据与至少一第二视频根据相同的方法获得的至少一第二视频特征数据进行比对，确定所述第一视频与至少一所述第二视频中任一第二视频的相似度。本实施例的方案可以在保证去重准确度的前提下，更合理的安排算力。

Description

视频去重方法及装置

技术领域

本申请涉及视频处理领域，特别涉及一种视频去重方法及装置。

背景技术

随着互联网技术和产业的发展，除了传统的电视台之外，视频网站、短视频平台成为了新的海量媒资存储平台，并涌现出了数百万参与到内容创作中的视频博主。其中，经常会出现用户上传的内容已经在视频库内存在的情况，如果视频平台不能发现，不但浪费了存储空间，而且为以后的版权争议埋下了很大隐患。

因此需要将新上传的视频与平台视频库内已有的视频进行比较，避免重复上传，实现方式主要有以下几种方法：

1)对视频库中的视频抽取视频关键帧，将关键帧进行抽样和压缩，形成缩略图数据，组成视频特征库。新的视频内容上传时同样抽取关键帧，形成缩略图数据，与视频特征库中的数据进行对比，如果相似度较高，则进行人工审核来确定是否为同一视频片段；

2)对视频库中的视频抽取视频关键帧，定位字幕信息，通过OCR技术提取字幕，形成视频的字幕库。新的视频内容上传时做类似处理，提取字幕内容与字幕库中的数据进行对比，如果相似对较高，则进入人工审核来确定是否为同一视频片段；

3)对视频库中的视频提取视频的语音信息，形成台词旋律库。新的视频内容上传时做类似处理，提取语音信息与台词旋律库中的数据进行对比，如果相似对较高，则进入人工审核来确定是否为同一视频片段；

4)对视频库中的视频抽取视频关键帧，通过人脸识别来形成视频特征库。新的视频内容上传时同样进行人脸识别，可以粗略判断是否为同一演员。此外，还可以结合演员数量及对应的出场次序，形成视频的人脸和剧情特征库。

可以看出，第一、二、四种方法都需要对视频进行图像帧提取，并且从提取的图像帧中提取特定的图像特征信息来进行处理。但是在进行图像帧提取时，通常是以固定的采样频率进行提取的。

发明内容

本申请实施例可能的目的是：提供一种视频去重方案。

第一方面，本申请的一可能的实施方案提供了一种视频去重方法，包括：

获取一第一视频；

根据设定的采样规则从所述第一视频中提取多个图像；其中，所述采样规则包括：响应于所述第一视频中存在至少一场景变换片段，所述至少一场景变换片段对应于至少一第一采样频率，所述第一视频中其他片段对应于第二采样频率；其中，所述至少一第一采样频率高于所述第二采样频率；

对于所述多个图像中的每个图像，提取所述图像的图像特征信息；

将所述多个图像对应的多个图像特征数据按照所述多个图像在所述第一视频中出现的顺序进行排序，得到所述第一视频对应的第一视频特征数据；

将所述第一视频对应的第一视频特征数据与至少一第二视频根据相同的方法获得的至少一第二视频特征数据进行比对，确定所述第一视频与至少一所述第二视频中任一第二视频的相似度。

第二方面，本申请的一可能的实施方案提供了一种视频去重装置，包括：

视频获取模块，用于获取一第一视频；

图像提取模块，用于根据设定的采样规则从所述第一视频中提取多个图像；其中，所述采样规则包括：响应于所述第一视频中存在至少一场景变换片段，所述至少一场景变换片段对应于至少一第一采样频率，所述第一视频中其他片段对应于第二采样频率；其中，所述至少一第一采样频率高于所述第二采样频率；

图像特征获取模块，用于对于所述多个图像中的每个图像，提取所述图像的图像特征信息；

视频特征获取模块，用于将所述多个图像对应的多个图像特征数据按照所述多个图像在所述第一视频中出现的顺序进行排序，得到所述第一视频对应的第一视频特征数据；

比对模块，用于将所述第一视频对应的第一视频特征数据与至少一第二视频根据相同的方法获得的至少一第二视频特征数据进行比对，确定所述第一视频与至少一所述第二视频中任一第二视频的相似度。

本申请实施例的至少一个视频去重方案通过在对视频提取多帧图像用于相似性比对时，考虑到场景变换剧烈程度来调整采样的频率，对于包含场景变换片段的视频的去重处理，能在保证查重准确度的前提下，合理的减少算力。

附图说明

图1为本申请实施例一种视频去重方法的流程图；

图2为本申请实施例一种视频去重方法提取的图像中识别出的多种对象的示意图；

图3为本申请实施例的一种视频去重装置的结构示意框图；

图4为本申请实施例的一种平台设备的结构示意框图。

具体实施方式

下面结合附图(若干附图中相同的标号表示相同的元素)和实施例，对本申请的具体实施方式作进一步详细说明。以下实施例用于说明本申请，但不用来限制本申请的范围。

本领域技术人员可以理解，本申请中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等，既不代表任何特定技术含义，也不表示它们之间的必然逻辑顺序。

本申请的发明人发现，在从视频提取多个图像帧，并且从所述多个图像帧中提取特定的图像特征信息来进行查重处理时，通常采用固定的频率进行的图像帧的提取，例如，每隔1秒提取一图像帧。对于图像变换比较剧烈的场景，这样的提取频率可能太低了，会错过一些关键的图像特征信息；但是对于图像变换比较平缓的场景——例如几十秒之内几乎没有变化的场景来说，这样的提取频率太高了，造成不必要的冗余图像特征信息提取及处理，进而浪费算力。因此本申请的发明人提出了下面的更为灵活的基于图像帧提取的去重处理方案。

如图1所示，本申请实施例提供了一种视频去重方法，包括：

S110：获取一第一视频；

S120：根据设定的采样规则从所述第一视频中提取多个图像；其中，所述采样规则包括：响应于所述第一视频中存在至少一场景变换片段，所述至少一场景变换片段对应于至少一第一采样频率，所述第一视频中其他片段对应于第二采样频率；其中，所述至少一第一采样频率高于所述第二采样频率；

S130：对于所述多个图像中的每个图像，提取所述图像的图像特征信息；

S140：将所述多个图像对应的多个图像特征数据按照所述多个图像在所述第一视频中出现的顺序进行排序，得到所述第一视频对应的第一视频特征数据；

S150：将所述第一视频对应的第一视频特征数据与至少一第二视频根据相同的方法获得的至少一第二视频特征数据进行比对，确定所述第一视频与所述至少一所述第二视频中任一第二视频的相似度。

举例来说，本申请提供的去重装置作为本实施例的执行主体，执行S110～S150。具体地，所述去重装置可以以软件、硬件或软硬件结合的方式设置在一视频平台设备中，或者，所述去重装置本身就是所述视频平台设备。

通过本申请实施例的方法，对于包含场景切换等场景变换片段的视频的去重处理，可以在保证去重准确度的前提下，更合理的安排算力。

通过下面的实施方式进一步说明本申请实施例的方法。

S110：获取一第一视频。

在一种可能的实施方式中，所述第一视频为待比对视频。

在一种可能的实施方式中，所述获取一第一视频可以包括获取用户实时上传的一待比对视频。

在本申请另一种可能的实施方式中，所述获取一第一视频还可以是从视频平台设备的一存储器中获取存储在其中的一待比对视频。

S120：根据设定的采样规则从所述第一视频中提取多个图像。

在本申请一种可能的实施例中，在步骤S120之前，所述方法还包括：对所述第一视频进行场景变换检测，确定所述第一视频中是否存在所述场景变换片段。其中，在一种可能的实施方式中，响应于所述第一视频中一视频片段的场景变换剧烈程度高于预定程度，确定所述视频片段为一场景变换片段。

这里所述场景变换片段，可以为在两个不同的场景间进行切换的转场片段，例如转场帧与前一关键帧之间的视频片段；也可以为同一场景，但是变化较剧烈的视频片段，例如爆炸场景对应的片段。

在一种可能的实施方式中，可以采用任一种场景变换检测方法进行场景变换片段的检测。例如，通过比较相邻帧之间的颜色、灰度等特征信息的相关的差异值是否超过一差异阈值等，确定一图像帧是否为转场帧。上面所述的场景变换剧烈程度可以对应于这里的差异值。

在本申请实施例中，所述采样规则包括：响应于所述第一视频中存在至少一场景变换片段，所述至少一场景变换片段对应于至少一第一采样频率，所述第一视频中其他片段对应于第二采样频率；这里，所述至少一第一采样频率高于所述第二采样频率。即，对于场景变换剧烈的场景变换片段，采用较高的采样频率进行采样，以减少场景变换过程中关键图像特征信息的漏采；对于场景变换平缓的片段，采用较低的采用频率进行采样，减少相同的冗余图像特征信息的采集。这样，在保持后续比对准确率的同时，可以减少视频整体的采样密度，减少视频特征数据。

在一种可能的实施方式中，对于一视频图像提取的采样频率可以只分为两种，即场景变换片段一种，其他片段一种。例如，对于视频中的场景变换片段，采用0.5秒一次的采样频率进行图像提取；对于视频中的其他片段采用2秒一次的采用频率进行图像提取。

在本申请另一种可能的实施例中，不同的场景变换剧烈程度还可以对应不同的第一采样频率。所述至少一场景变换片段包括场景变换剧烈程度不同的多个场景变换片段，所述多个场景变换片段对应于不同的多个第一采样频率，其中，场景变换剧烈程度越高的场景变换片段对应的第一采样频率越高。这样可以进一步提高图像提取的灵活性。

例如，可以将场景变换片段根据场景变换剧烈程度分为三种，分别对应于0.1秒、0.2秒和0.5秒一次的采样频率。

S130：对于所述多个图像中的每个图像，提取所述图像的图像特征信息。

这里，所述图像特征信息可以为任何可以应用于去重处理的图像特征信息，例如前面所述的缩略图数据、字幕信息、人脸信息等。

在本申请的一种实施例中，进一步提出了下面的图像特征信息提取方案，可以在花费较小算力的前提下达成较高的视频查重准确率。所述方案包括：对于所述多个图像中的每个图像进行下面的操作，以得到每个图像对应的图像特征数据：

S131通过对象识别，得到所述图像中最大的多种对象；

S132至少根据所述多种对象的大小对所述多种对象分别对应的多个代码进行排序，得到所述图像对应的图像特征数据。

特别的，本申请实施例的方法与现在已有的查重方法是相互平行的，因此可以与已有的方法协同工作，进一步提高视频查重的命中率，例如，可以将准确率提至90％左右。

下面进一步的对上述图像特征数据提取方法进行描述：

1)通过对象识别，得到所述图像中最大的多种对象。

这里的对象识别可以采用常用的对象识别方法对所述对象进行识别。例如通过训练好的卷积神经网络对所述图像中的对象进行识别。

在一种可能的实施方式中，所述多种对象的个数不超过预设的阈值。这里，所述多种对象的个数阈值可以根据需要设定。在一种可能的实施方式中，可以使用已有的对象识别方法，从所述图像中识别出最大的5种对象，可以在确保去重准确率的前提下，对应的图像特征数据字节占用较小，后续比对也会使用较少的算力。例如，与现有一些方法相比，该实施例的方案可以节省算力开销超过50％。

这里最大的多种对象例如可以是所述多种对象在所述图像中占的面积最大或包含的像素最多。其中，在图像中包含相同种类的多个对象时，按照所述多个对象所占面积的总和来确定该种对象在图像中的大小，例如图2中对象“人”的大小是由图像中两个人所占的画幅大小决定的。在一种可能的实施方式中，可以对所述图像中的所有对象进行识别，然后再找出其中最大的几种。

例如，如图2所示为一视频片段中提取的一帧图像，通过图像识别确定该图像中最大的5种对象按照大小排列分别为：人、树、草坪、箱子、书。

2)根据所述多种对象的大小对所述多种对象分别对应的多个代码进行排序，得到所述图像对应的图像特征数据。

例如，在一种可能的实施方式中，对上面所述图2中5种对象的大小进行排列后，其中每种对象对应于一个唯一的16位编码，则5种对象对应于5x16的一串数字编码，占用10个字节。该串数字编码即为该图像对应的图像特征数据。

在一种可能的实施方式中，在进行步骤S110之前，所述方法还包括一物体库的建立：包括为视频中常见的所有对象中的每个对象配置唯一对应的代码，并将所述对象与代码的对应关系存储在所述物体库中。

例如，在一种可能的实施方式中，可以选取了1万种视频中常见的对象建立所述物体库。其中，对所述物体库中的不同对象进行不同的16位编码，两个字节即可表示一种对象。当然，在其他可能的实施方式中，所述物体库中的对象的数量根据需要可以灵活设定。所述物体库中对象的编码也可以是其他方式的，只要每个编码能唯一确定物体库中的一个对象，并且所占字节较小，方便后面的比对即可。

在一种可能的实施方式中，在所述多种对象中可能包含大小相同的至少两个对象(虽然几率很小)，此时，可以按照设定的顺序排列所述大小相同的对象对应的代码。例如，在一种可能的实施方式中，可以根据所述至少两个对象在物体库中代码的先后顺序对所述至少两个对象的顺序进行排列。例如上面提到的每个对象对应一个16位编码，编码靠前的排在前面。

在一种可能的实施方式中，在所述图像中识别出的所有对象的个数有可能少于所述阈值，此时，可以通过设定的代码补齐。例如，以上面所述的16位编码为例，可以通过以设定的编码表示空的对象。例如在所述阈值为5个对象，但是图像中只识别出4个对象时，其余的16位编码均用0表示。

S140：将所述多个图像对应的多个图像特征数据按照所述多个图像在所述第一视频中出现的顺序进行排序，得到所述第一视频对应的第一视频特征数据。

通过步骤S140将所述多个图像在所述第一视频中出现的顺序这一时间特征考虑到特征数据中，可以进一步提高后续比对的准确率。

在一种可能的实施方式中，所述至少一第二视频为一视频库中的已有视频。

在一种可能的实施方式中，所述至少一第二视频之间已经进行过与下面第一视频特征数据的提取方式相同的第二视频特征数据的提取，并且进行了相互比对，根据比对结果排除掉重复视频。其中，在一种可能的实施方式中，所述视频库中的每个第二视频对应的第二视频特征数据均存储在一视频特征库中，方便后面比对使用。

在一种可能的实施方式中，所述方法还包括：根据所述相似度，确定所述第一视频与所述视频库中已有的一第二视频的重复可能性。

在一种可能的实施方式中，设置一相似度阈值，在所述相似度达到所述相似度阈值时：认为存在重复的情况，或者，进入人工审核来确定所述第一视频与对应的第二视频是否为同一视频片段。

不同的视频库，对相似度的要求可能不同。

在一种可能的实施方式的视频库中，认为第一视频和一第二视频整体相似才是重复，此时，可以进行第一视频特征数据整体与所述至少一第二视频特征数据的整体进行比对，在相似度达到一设定的相似度阈值，例如80％以上时，才认为所述两个视频是重复的，或者转为人工确认。

在另一种可能的实施方式的视频库中，认为所述第一视频和第二视频这两个视频中设定长度的片段之间相似就有重复可能，即对应的第一视频特征和第二视频特征中有设定长度的一段相似就认为这两个视频有重复可能。例如，在一个视频比另一个视频短时，所述设定长度可以为相对较短的那个视频的长度，此时相对较短的视频可能是另一个视频中的片段。或者，在另一种可能的实施方式中，所述设定长度也可以为比所述两个视频都要短的长度。

本领域技术人员可以理解，在本申请具体实施方式的上述方法中，各步骤的序号大小并不意味着执行顺序的先后，各步骤的执行顺序应以其功能和内在逻辑确定，而不应对本申请具体实施方式的实施过程构成任何限定。

如图3所示，本申请另一种可能的实施方式包括一种视频去重装置300，包括：

视频获取模块310，用于获取一第一视频；

图像提取模块320，用于根据设定的采样规则从所述第一视频中提取多个图像；其中，所述采样规则包括：响应于所述第一视频中存在至少一场景变换片段，所述至少一场景变换片段对应于至少一第一采样频率，所述第一视频中其他片段对应于第二采样频率；其中，所述至少一第一采样频率高于所述第二采样频率；

图像特征获取模块330，用于对于所述多个图像中的每个图像，提取所述图像的图像特征信息；

视频特征获取模块340，用于将所述多个图像对应的多个图像特征数据按照所述多个图像在所述第一视频中出现的顺序进行排序，得到所述第一视频对应的第一视频特征数据；

比对模块350，用于所述第一视频对应的第一视频特征数据与至少一第二视频根据相同的方法获得的至少一第二视频特征数据进行比对，确定所述第一视频与所述至少一所述第二视频中任一第二视频的相似度。

本申请实施例各模块功能的进一步实现参见图1所示实施例中对应的描述。

图4为本申请实施例提供的又一种平台设备400的结构示意图，本申请具体实施例并不对平台设备400的具体实现做限定。如图4所示，该平台设备400可以包括：

处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430、以及通信总线440。其中：

处理器410、通信接口420、以及存储器430通过通信总线440完成相互间的通信。

通信接口420，用于与比如客户端等的网元通信。

处理器410，用于执行程序432，具体可以执行上述方法实施例中的相关步骤。

具体地，程序432可以包括程序代码，所述程序代码包括计算机操作指令。

处理器410可能是一个中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本申请实施例的一个或多个集成电路。

存储器430，用于存放程序432。存储器430可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。程序432具体可以用于使得所述平台设备400执行以下操作：

获取一第一视频；

程序432中各步骤的具体实现可以参见上述实施例中的相应步骤和单元中对应的描述，在此不赘述。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的设备和模块的具体工作过程，可以参考前述方法实施例中的对应过程描述，在此不再赘述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及方法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上实施方式仅用于说明本申请，而并非对本申请的限制，有关技术领域的普通技术人员，在不脱离本申请的精神和范围的情况下，还可以做出各种变化和变型，因此所有等同的技术方案也属于本申请的范畴，本申请的专利保护范围应由权利要求限定。

Claims

1.一种视频去重方法，其特征在于，包括：

获取一第一视频；

2.根据权利要求1所述的方法，其特征在于：

所述至少一场景变换片段包括场景变换剧烈程度不同的多个场景变换片段，所述多个场景变换片段对应于不同的多个第一采样频率，其中，场景变换剧烈程度越高的场景变换片段对应的第一采样频率越高。

3.根据权利要求1或2所述的方法，其特征在于：

在提取所述多个图像之前，所述方法还包括：对所述第一视频进行场景变换检测，确定所述第一视频中是否存在所述场景变换片段。

4.根据权利要求3所述的方法，其特征在于：响应于所述第一视频中一视频片段的场景变换剧烈程度高于预定程度，确定所述视频片段为一场景变换片段。

5.根据权利要求1所述的方法，其特征在于：

所述第一视频为待比对视频；

所述至少一第二视频为一视频库中的已有视频；

所述方法还包括：根据所述相似度，确定所述第一视频与所述视频库中已有视频的重复可能性。

6.根据权利要求1所述的方法，其特征在于：

所述提取所述图像的图像特征信息包括：

通过对象识别，得到所述图像中最大的多种对象；

至少根据所述多种对象的大小对所述多种对象分别对应的多个代码进行排序，得到所述图像对应的图像特征数据。

7.根据权利要求6所述的方法，其特征在于，其中：所述多种对象的个数不超过预设的阈值。

8.根据权利要求7所述的方法，其特征在于，在所述图像中识别出的所有对象的个数少于所述阈值时，通过设定的代码补齐。

9.根据权利要求6所述的方法，其特征在于，在所述多种对象中包含大小相同的至少两种对象时，按照设定的顺序排列所述至少两种对象对应的代码。

10.一种视频去重装置，其特征在于，包括：

视频获取模块，用于获取一第一视频；