CN111949827B

CN111949827B - 视频抄袭检测方法、装置、设备和介质

Info

Publication number: CN111949827B
Application number: CN202010746067.5A
Authority: CN
Inventors: 郭宏伟; 刘汝帅; 谭卫军
Original assignee: Shenzhen Shenmu Information Technology Co ltd
Current assignee: Shenzhen Shenmu Information Technology Co ltd
Priority date: 2020-07-29
Filing date: 2020-07-29
Publication date: 2023-10-24
Anticipated expiration: 2040-07-29
Also published as: CN111949827A

Abstract

本发明公开了一种视频抄袭检测方法，该方法包括：获取至少一个底库视频和查询视频，进行间隔抽帧，得到多个底库图像和多个查询图像。将多个底库图像和多个查询图像输入卷积神经网络进行特征提取，获取到底库视频帧特征和查询视频帧特征。获取每个查询视频帧特征和每个底库视频帧特征的相似度，将相似度高于第一预设阈值的底库视频帧作为近邻匹配帧。将近邻匹配帧依据编码标识进行归类，生成至少一个底库视频帧集合。选择至少一个底库视频帧集合对应的底库视频作为候选视频。将查询视频与每个候选视频组成视频对，通过网络流量算法寻找每个匹配视频对中的疑似抄袭片段。此外，还提出了视频抄袭检测装置、设备和介质。

Description

视频抄袭检测方法、装置、设备和介质

技术领域

本发明涉及视频检测技术领域，尤其是涉及视频抄袭检测方法、装置、设备和介质。

背景技术

随着网上海量视频的出现，视频抄袭成为一个重要的问题。视频制作者通过各类视频编辑软件可以实现视频的快速制作，但往往由于引用素材为占比过大或仅作形式上的稍微修改(例如缩放、剪切、镜像等)，造成抄袭视频的泛滥，随之而来的是侵权纠纷和商业纠纷等问题。但由于网络上的视频数量过于庞大，完全由人工进行抄袭判定的方式是不现实的，因此将视频抄袭交由计算机设备进行自动判断就显得尤为重要。

但就现有的视频抄袭检测算法而言，其在检测的准确性及检测速度方面都谈不上理想，因此急需一种视频抄袭检测算法在检测准确性及检测速度上做出改进。

发明内容

基于此，有必要针对上述问题，提供检测足够准确及迅速的视频抄袭检测方法、装置、设备和介质。

一种视频抄袭检测的方法，所述方法包括：

获取至少一个底库视频和查询视频，对每个所述底库视频和所述查询视频进行间隔抽帧，获取每个所述底库视频的多个底库图像和所述查询视频的多个查询图像；

分别将每个所述底库视频的多个底库图像和所述查询视频的多个查询图像输入卷积神经网络进行特征提取，进行高斯滤波处理与最大值池化处理，获取每个所述底库视频的底库视频帧特征和所述查询视频的查询视频帧特征；

获取每个所述查询视频帧特征和每个所述底库视频帧特征的相似度，将所述相似度高于第一预设阈值的底库视频帧作为近邻匹配帧；

获取每个所述近邻匹配帧对应的底库视频编码标识，将所述近邻匹配帧按照所述底库视频编码标识归类，生成至少一个底库视频帧集合；

选择至少一个所述底库视频帧集合对应的底库视频作为候选视频；

将所述查询视频与每个所述候选视频组成视频对，通过网络流量算法寻找每个所述匹配视频对中的疑似抄袭片段。

在其中一个实施例中，在所述获取每个所述底库视频的底库视频帧特征和所述查询视频的查询视频帧特征之后，还包括：

分别对所述卷积神经网络最后一层卷积输出的查询视频帧特征及底库视频帧特征进行高斯滤波；

将高斯滤波处理后的所述查询视频帧特征及所述底库视频帧特征进行最大值池化；

根据每个通道的最大值生成查询视频帧特征向量及底库视频帧特征向量。

建立快速搜索数据库；其中，所述快速搜索数据库内对应记录了每个底库视频帧特征及其底库视频编码、帧特征时间戳；

通过数据分类聚类方法对所述快速搜索数据库内的所述底库视频帧特征进行分类或编码，以高效筛选出与查询视频帧特征所属的类别相对应的底库视频帧特征。

在其中一个实施例中，在所述将所述查询视频与每个所述候选视频组成视频对，通过网络流量算法寻找每个所述匹配视频对中的疑似抄袭片段之后，还包括：

获取所述疑似抄袭片段的片段时长与平均相似分数，将所述片段时长与所述平均相似分数输入分类器，以判断所述片段时长与所述平均相似分数代表的候选点在分布图内与分类边界的距离是否大于预设距离；

当所述片段时长与所述平均相似分数代表的候选点在所述分布图内与所述分类边界的距离大于或等于预设距离时，根据所述候选点在所述分布图内的位置判断所述疑似抄袭片段的分类结果；其中，所述分类结果包括真实的候选片段及误报的候选片段；

当所述片段时长与所述平均相似分数代表的候选点在所述分布图内与所述分类边界的距离小于预设距离时，通过时间匹配核算法判断所述疑似抄袭片段的分类结果。

在其中一个实施例中，对应同一所述底库视频的所述底库视频帧特征组成所述底库视频特征，所述查询视频帧特征组成查询视频特征；

所述获取每个所述查询视频帧特征和每个所述底库视频帧特征的相似度，将所述相似度高于第一预设阈值的底库视频帧作为近邻匹配帧，包括：

分别构建所述查询视频特征和所述底库视频特征的特征矩阵，将所述查询视频特征和所述底库视频特征的特征矩阵进行內积，得到相似度矩阵；

以相似度值的大小为序获取所述相似度矩阵中预设数量个相似度值，根据所述相似度值将所述底库视频中对应的底库视频帧作为所述近邻匹配帧；其中，所述相似度值为所述底库视频帧特征与所述查询视频帧特征之间内积值；

将所述相似度矩阵中低于所述第一预设阈值的相似度值过滤。

在其中一个实施例中，所述选择至少一个所述底库视频帧集合对应的底库视频作为候选视频，包括：

计算每个所述底库视频帧集合内所述近邻匹配帧的相似度总和；

选择所述相似度总和满足预设条件的所述底库视频帧集合对应的底库视频作为候选视频。

在其中一个实施例中，所述通过网络流量算法寻找每个所述匹配视频对中的疑似抄袭片段，包括：

建立每个所述匹配视频对的有向无环图，遍历所有所述有向无环图的结点，确定每个所述有向无环图中相似度累计和最大的结点路径；

将所述相似度累计和最大的结点路径所截取的视频片段作为对应所述匹配视频对中的疑似抄袭片段。

一种视频抄袭检测装置，所述装置包括：

视频获取模块，用于获取至少一个底库视频和查询视频，对每个所述底库视频和所述查询视频进行间隔抽帧，获取每个所述底库视频的多个底库图像和所述查询视频的多个查询图像；

特征提取模块，用于分别将每个所述底库视频的多个底库图像和所述查询视频的多个查询图像输入卷积神经网络进行特征提取，进行高斯滤波处理与最大值池化处理，获取每个所述底库视频的底库视频帧特征和所述查询视频的查询视频帧特征；

近邻匹配帧搜索模块，用于获取每个所述查询视频帧特征和每个所述底库视频帧特征的相似度，将所述相似度高于第一预设阈值的底库视频帧作为近邻匹配帧；

归类模块，用于获取每个所述近邻匹配帧对应的底库视频编码标识，将所述近邻匹配帧按照所述底库视频编码标识归类，生成至少一个底库视频帧集合；

候选视频选择模块，用于选择至少一个所述底库视频帧集合对应的底库视频作为候选视频；

疑似抄袭片段搜索模块，用于将所述查询视频与每个所述候选视频组成视频对，通过网络流量算法寻找每个所述匹配视频对中的疑似抄袭片段。

一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如下步骤：

一种视频抄袭检测设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如下步骤：

本发明提供了视频抄袭检测方法、装置、设备和介质，结合了卷积神经网络自动提取图片特征，通过匹配相似度的方式寻找底库视频帧中的近邻匹配帧，从而选择部分底库视频作为候选视频，将候选视频与底库视频组成视频对，最后通过网络流量算法实现疑似抄袭片段的查找。本实施例可提高视频抄袭检测的速度以及准确性，极大的改善视频抄袭检测系统的性能。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

其中：

图1为第一实施例中视频抄袭检测方法的流程示意图；

图2为一个实施例中有向无环图的示意图；

图3为第二实施例中视频抄袭检测方法的流程示意图；

图4为分类图的第一实施例示意图；

图5为分类图的第二实施例示意图；

图6为一个实施例中视频抄袭检测装置的结构示意图；

图7为一个实施例中视频抄袭检测设备的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，图1为第一实施例中视频抄袭检测方法的流程示意图，第一实施例中视频抄袭检测方法提供的步骤包括：

步骤102，获取至少一个底库视频和查询视频，对每个底库视频和查询视频进行间隔抽帧，获取每个底库视频的多个底库图像和查询视频的多个查询图像。

在一个实施例中，分别对获取到的底库视频和查询视频进行间隔抽帧，抽帧的频率为每隔1秒抽一帧。可以理解的是，为提高视频抄袭检测的判断精确度，可以适当提高抽帧频率，例如采用每隔0.5秒抽一帧的频率进行抽帧。由于图像帧的数量是由视频的时长决定的，而更多的查询图像会保证视频抄袭的判断结果更为精确，因此在获取查询视频时，需尽量保证查询视频的时长符合要求。

步骤104，分别将每个底库视频的多个底库图像和查询视频的多个查询图像输入卷积神经网络进行特征提取，进行高斯滤波处理与最大值池化处理，获取每个底库视频的底库视频帧特征和查询视频的查询视频帧特征。

本实施例中，可选用较为常见的图像分类卷积神经网络进行特征提取，示例性的，选用VGG-16卷积神经网络或Resnet-18卷积神经网络来实现特征提取。更具体的，以VGG-16卷积神经网络为例，在特征提取前选用ImageNet数据集(包含有超过1400万张注释图像的数据集)的部分数据对VGG-16卷积神经网络进行预训练，使该卷积神经网络具备图像分类能力，然后将每个底库视频抽帧后得到的底库图像输入训练好的VGG-16卷积神经网络，提取最后的卷积层输出作为特征，进行高斯滤波处理与最大值池化处理，得到每个底库视频的多个底库视频帧特征。同理，通过上述特征提取方法可得到查询视频的多个查询视频帧特征。

步骤106，获取每个查询视频帧特征和每个底库视频帧特征的相似度，将相似度高于第一预设阈值的底库视频帧作为近邻匹配帧。

在一个实施例中，通过构建相似度矩阵的方法来寻找近邻匹配帧。具体的，由属于同一视频的底库视频帧特征组成底库视频特征，由查询视频帧特征组成查询视频特征。再分别构建查询视频特征的一个特征矩阵和底库视频特征的一个特征矩阵，再将这两个特征矩阵进行內积计算，可得到一个带有相似度值的相似度矩阵。其中，相似度值为底库视频帧特征与查询视频帧特征之间的内积值。对相似度值进行排序并选择数值最大的K个相似度，由实验可得，K的取值为200-500之间为最佳。进一步的，为提高抄袭检测的判断效率，将近邻匹配帧用第一预设阈值(例如0.65)进行过滤。最后，通过逆推导查找，找到內积值是由哪些底库视频特征包含的底库视频帧特征计算得到的，将这些底库视频帧作为近邻匹配帧。

步骤108，获取每个近邻匹配帧对应的底库视频编码标识，将近邻匹配帧按照底库视频编码标识归类，生成至少一个底库视频帧集合。

其中，编码标识是指ID(IDentity)标识或其他可表征近邻匹配帧属性的标识，依据编码标识归类，从而便于后续获取每个底库视频与查询视频的相似度情况。

步骤110，选择至少一个底库视频帧集合对应的底库视频作为候选视频。

其中，候选视频是指底库视频中最有抄袭嫌疑的一批视频。

在一个实施例中，选择方式为：首先对属于一个底库视频帧集合内的所有近邻匹配帧进行相似度求和，得到相似度总和。再对所有底库视频帧集合的相似度总和进行排序，取相似度总和数值最大的N个作为保留的底库视频帧集合。其中N较优地选择为5个，当然也可以根据检索速度的要求以及检索精确度的要求，将N适应性地增大或减小。进一步的，每个底库视频帧集合有一个统一的编码标识，根据该编码标识找到对应的底库视频作为候选视频。

在另一个实施例中，选择的方式为：首先对属于一个底库视频帧集合内的所有近邻匹配帧进行相似度求和，得到相似度总和。再筛选出相似度总和大于预设总和阈值的底库视频帧集合，最后根据底库视频帧集合的编码标识找出对应的底库视频作为候选视频。

步骤112，将查询视频与每个候选视频组成视频对，通过网络流量算法寻找每个匹配视频对中的疑似抄袭片段。

其中，网络流量算法的实现方法具体为：第一步，建立每个匹配视频对的有向无环图。如图2所示，在该图中，每个带字母的圆为一个结点，其中包含有查询视频帧与底库视频帧的时间戳；而该图中的箭头则代表下一结点所对应的查询视频帧与底库视频帧的相似度。示例性的，以建立一个匹配视频对的有向无环图为例，遍历该视频对中底库视频内的近邻匹配帧，获取到每个近邻匹配帧在底库视频的时间戳以及在查询视频的时间戳。其中，当近邻匹配帧的相似度大于预设阈值时，该时间戳对应的结点才会保留。然后依据时间戳顺序依次连接所有的结点，同时应保证前后结点的时间戳的差不能过大。第二步，遍历这些结点，计算所有路径的相似度的累计和，确定相似度累计和最大的节点路径所截取的视频片段为该匹配视频对中的一个疑似抄袭片段。如图2所示，得到的相似度累计和最大的节点路径为“A-D-C-F-H-I-J-K-L-M-O-P”。

进一步的，当该匹配视频对中存在两个或更多个疑似抄袭片段时，可以在有向无环图标记出已确定的疑似抄袭片段，通过迭代的方式，可再次重复上述网络流量算法的运算，并只在未标记了的有向无环图部分进行查找。

上述视频抄袭检测方法，结合了卷积神经网络自动提取图片特征，通过匹配相似度的方式寻找底库视频帧中的近邻匹配帧，从而选择部分底库视频作为候选视频，将候选视频与底库视频组成视频对，最后通过网络流量算法实现疑似抄袭片段的查找。本实施例可提高视频抄袭检测的速度以及准确性，极大的改善视频抄袭检测系统的性能。

如图3所示，图3为第二实施例中视频抄袭检测方法的流程示意图，该第二实施例中视频抄袭检测方法的流程示意图提供的步骤包括：

步骤302，获取至少一个底库视频和查询视频，对每个底库视频和查询视频进行间隔抽帧，获取每个底库视频的多个底库图像和查询视频的多个查询图像。

步骤304，分别将每个底库视频的多个底库图像和查询视频的多个查询图像输入卷积神经网络进行特征提取，进行高斯滤波处理与最大值池化处理，获取每个底库视频的底库视频帧特征和查询视频的查询视频帧特征。

在一个具体的实施场景中，步骤302-304与第一实施例中视频抄袭检测方法的步骤102-104基本一致，此处不再进行赘述。

步骤306，分别对卷积神经网络最后一层卷积输出的查询视频帧特征及底库视频帧特征进行高斯滤波；将高斯滤波处理后的查询视频帧特征及底库视频帧特征进行最大值池化，根据每个通道的最大值生成查询视频帧特征向量及底库视频帧特征向量。

本步骤为对最后一层卷积输出的查询视频帧特征及底库视频帧特征进行聚合处理，通过聚合处理可减少特征维度，仅保留查询视频帧特征及底库视频帧特征中最大的值，而抛弃其他相对较小的值(最大值具有特征代表性)。具体的，先进行高斯滤波以消除特征中带有的高斯噪声，选用的高斯核大小与每个查询视频帧特征及底库视频帧特征所对应的矩阵一致。进一步的，分别将查询视频帧特征及底库视频帧特征中每个通道的最大值作为池化层的保留值，其它特征值则全部抛弃。其中最大值池化的作用在于精简数据，保留主要特征。

步骤308，根据每个通道的最大值生成查询视频帧特征向量及底库视频帧特征向量。

在上一步骤的聚合处理过程中应保留各最大值的原始顺序，将带有顺序的最大值进行组合，即可得到一个查询视频的查询视频帧特征向量或一个底库视频的底库视频帧特征向量，向量的长度也即通道数。

进一步的，如果输出向量的长度过长，也可采用PCA(Principal ComponentsAnalysis，主成分分析)方法进行降维，本实施例中限定输出的查询视频帧特征向量及底库视频帧特征向量的维度为512。

步骤310，建立快速搜索数据库；通过数据分类聚类方法对快速搜索数据库内的底库视频帧特征进行分类或编码，以筛选出与查询视频帧特征所属的类别相对应的底库视频帧特征。

其中，该快速搜索数据库内部通过k均值聚类算法(K-mean)来进行优化，具体的，预先将数据分为K组，随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。此外，还可对聚类中心进行编码以作区分。而在后续查找近邻匹配帧时，可选择性地查找属性相关联的聚类中心内的底库视频帧特征，从而实现高效筛选的目标。

本步骤相较于传统的针对每个底库视频单独创建数据库的做法的优点在于：第一，降低了误检率。快速搜索数据库内疑似抄袭视频被归类，且相似度都较高，因而被选中概率大；而非疑似抄袭视频也被归类，且相似度都较低，因而被选中的概率大大减小。第二，抄袭判定速度较快。由于进行了预先归类，本实施中抄袭判定速度和底库中视频的数量基本无关。

步骤312，获取每个查询视频帧特征和每个底库视频帧特征的相似度，将相似度高于第一预设阈值的底库视频帧作为近邻匹配帧。

步骤314，获取每个近邻匹配帧对应的底库视频编码标识，将近邻匹配帧按照底库视频编码标识归类，生成至少一个底库视频帧集合。

步骤316，选择至少一个底库视频帧集合对应的底库视频作为候选视频。

步骤318，将查询视频与每个候选视频组成视频对，通过网络流量算法寻找每个匹配视频对中的疑似抄袭片段。

在一个具体的实施场景中，步骤312-318与第一实施例中视频抄袭检测方法的步骤106-112基本一致，此处不再进行赘述。

步骤320，获取疑似抄袭片段的片段时长与平均相似分数，将片段时长与平均相似分数输入分类器，以判断片段时长与平均相似分数代表的候选点在分布图内与分类边界的距离是否大于预设距离。

其中，平均相似分数是指疑似抄袭片段内相似度分数总和除以片段时长得到的值。可以理解的是，片段时长越长则疑似抄袭片段确定为抄袭的可能性就越大，而平均相似分数越大则抄袭片段确定为抄袭的可能性也越大。

具体的，将片段时长与平均相似分数输入预先训练过的SVM(Support VectorMachine，支持向量机)分类器进行分类。示例性的，如图4所示，实线为分类边界，而虚线与实线的距离为预设距离，本实施例中预设距离设为1。当候选点在虚线外时，可认定分类结果较为可靠；当候选点在虚线内时，需进一步分类。

步骤322，当片段时长与平均相似分数代表的候选点在分布图内与分类边界的距离大于或等于预设距离时，根据候选点在分布图内的位置判断疑似抄袭片段的分类结果。

其中，分类结果包括真实的候选片段(TP)及误报的候选片段(FP)。本实施例中真实的候选片段是指确定疑似抄袭片段为抄袭片段。误报的候选片段是指确定疑似抄袭片段为非抄袭片段。

示例性的，分布图如图5所示，在该分部图中横轴为片段时长，纵轴为平均相似分数，斜实线为分类边界。当候选点在分布图内与分类边界的距离满足大于或等于预设距离，且在分类边界的右侧时，确定疑似抄袭片段为真实的候选片段。当候选点在分布图内与分类边界的距离满足大于或等于预设距离，且在分类边界的左侧时，确定疑似抄袭片段为误报的候选片段。

步骤324，当片段时长与平均相似分数代表的候选点在分布图内与分类边界的距离小于预设距离时，通过时间匹配核算法判断疑似抄袭片段的分类结果。

具体的，时间匹配核算法的实现方法为：对查询视频和底库视频的片段进行比较密地抽帧，通常与步骤102中的抽帧频率一致。对每一帧计算PDQ(P：感知哈希、D：离散余弦变换、Q：质量度量)特征。然后在整个X和X’片段的PDQ特征上计算TMK(temporal matchingkernel，时间匹配核)，其中X对应查询视频，X’对应底库视频。求导公式如下：

该公式的第一步部分是它的直流部分，第二部分是余弦部分，第三部分是正弦部分。首先计算X和X’的直流部分的余弦距离，作为level-1分数。如果这个分数低于一个阈值(这个阈值通常设置为0.7)，可以直接判断候选视频为误报的候选片段。否则，计算Level-2距离，即包括余弦部分和正弦部分。如果Level-2分值高于第二个阈值，(阈值通常设置为0.7)，则判断候选视频为真实的候选片段，否则为误报的候选片段。

在一个实施例中，如图6所示，提出了一种视频抄袭检测装置，该装置包括：

视频获取模块602，用于获取至少一个底库视频和查询视频，对每个底库视频和查询视频进行间隔抽帧，获取每个底库视频的多个底库图像和查询视频的多个查询图像；

特征提取模块604，用于分别将每个底库视频的多个底库图像和查询视频的多个查询图像输入卷积神经网络进行特征提取，进行高斯滤波处理与最大值池化处理，获取每个底库视频的底库视频帧特征和查询视频的查询视频帧特征；

近邻匹配帧搜索模块606，用于获取每个查询视频帧特征和每个底库视频帧特征的相似度，将相似度高于第一预设阈值的底库视频帧作为近邻匹配帧；

归类模块608，用于获取每个近邻匹配帧对应的底库视频编码标识，将近邻匹配帧按照底库视频编码标识归类，生成至少一个底库视频帧集合；

候选视频选择模块610，用于选择至少一个底库视频帧集合对应的底库视频作为候选视频；

疑似抄袭片段搜索模块612，用于将查询视频与每个候选视频组成视频对，通过网络流量算法寻找每个匹配视频对中的疑似抄袭片段。

上述视频抄袭检测装置，结合了神经网络自动提取图片特征，通过匹配相似度的方式寻找底库视频帧中的近邻匹配帧，从而选择部分底库视频作为候选视频，将候选视频与底库视频组成视频对，最后通过网络流量算法实现疑似抄袭片段的查找。本实施例可提高视频抄袭检测的速度以及准确性，极大的改善视频抄袭检测系统的性能。

在一个实施例中，视频抄袭检测装置还包括：聚合模块，用于分别对卷积神经网络最后一层卷积输出的查询视频帧特征及底库视频帧特征进行高斯滤波；将高斯滤波处理后的查询视频帧特征及底库视频帧特征进行最大值池化；根据每个通道的最大值生成查询视频帧特征向量及底库视频帧特征向量。

在一个实施例中，视频抄袭检测装置还包括：分类聚类模块，建立快速搜索数据库；其中，快速搜索数据库内对应记录了每个底库视频帧特征及其底库视频编码、帧特征时间戳；通过数据分类聚类方法对快速搜索数据库内的底库视频帧特征进行分类或编码，以筛选出与查询视频帧特征所属的类别相对应的底库视频帧特征。

在一个实施例中，视频抄袭检测装置还包括：第一判断模块，用于获取疑似抄袭片段的片段时长与平均相似分数，将片段时长与平均相似分数输入分类器，以判断片段时长与平均相似分数代表的候选点在分布图内与分类边界的距离是否大于预设距离；当片段时长与平均相似分数代表的候选点在分布图内与分类边界的距离大于或等于预设距离时，根据候选点在分布图内的位置判断疑似抄袭片段的分类结果；其中，分类结果包括真实的候选片段及误报的候选片段；当片段时长与平均相似分数代表的候选点在分布图内与分类边界的距离小于预设距离时，通过时间匹配核算法判断疑似抄袭片段的分类结果。

在一个实施例中，对应同一底库视频的底库视频帧特征组成底库视频特征，查询视频帧特征组成查询视频特征；近邻匹配帧搜索模块606，还具体用于：分别构建查询视频特征和底库视频特征的特征矩阵，将查询视频特征和底库视频特征的特征矩阵进行內积，得到相似度矩阵；以相似度值的大小为序获取相似度矩阵中预设数量个相似度值，根据相似度值将底库视频中对应的底库视频帧作为近邻匹配帧；其中，相似度值为底库视频帧特征与查询视频帧特征之间内积值；将相似度矩阵中低于第一预设阈值的相似度值过滤。

在一个实施例中，候选视频选择模块610，还具体用于：计算每个底库视频帧集合内近邻匹配帧的相似度总和；选择相似度总和满足预设条件的底库视频帧集合对应的底库视频作为候选视频。

在一个实施例中，疑似抄袭片段搜索模块612，还具体用于建立每个匹配视频对的有向无环图，遍历所有有向无环图的结点，确定每个有向无环图中相似度累计和最大的结点路径；将相似度累计和最大的结点路径所截取的视频片段作为对应匹配视频对中的疑似抄袭片段。

图7示出了一个实施例中视频抄袭检测设备的内部结构图。如图7所示，该视频抄袭检测设备包括通过系统总线连接的处理器、存储器和网络接口。其中，存储器包括非易失性存储介质和内存储器。该视频抄袭检测设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现视频抄袭检测方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行视频抄袭检测方法。本领域技术人员可以理解，图7中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的视频抄袭检测设备的限定，具体的视频抄袭检测设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

一种视频抄袭检测设备，包括存储器、处理器以及存储在该存储器中并可在该处理器上执行的计算机程序，该处理器执行该计算机程序时实现如下步骤：获取至少一个底库视频和查询视频，对每个底库视频和查询视频进行间隔抽帧，获取每个底库视频的多个底库图像和查询视频的多个查询图像；分别将每个底库视频的多个底库图像和查询视频的多个查询图像输入卷积神经网络进行特征提取，进行高斯滤波处理与最大值池化处理，获取每个底库视频的底库视频帧特征和查询视频的查询视频帧特征；获取每个查询视频帧特征和每个底库视频帧特征的相似度，将相似度高于第一预设阈值的底库视频帧作为近邻匹配帧；获取每个近邻匹配帧对应的底库视频编码标识，将近邻匹配帧按照底库视频编码标识归类，生成至少一个底库视频帧集合；选择至少一个底库视频帧集合对应的底库视频作为候选视频；将查询视频与每个候选视频组成视频对，通过网络流量算法寻找每个匹配视频对中的疑似抄袭片段。

在一个实施例中，在获取每个底库视频的底库视频帧特征和查询视频的查询视频帧特征之后，还包括：分别对卷积神经网络最后一层卷积输出的查询视频帧特征及底库视频帧特征进行高斯滤波；将高斯滤波处理后的查询视频帧特征及底库视频帧特征进行最大值池化；根据每个通道的最大值生成查询视频帧特征向量及底库视频帧特征向量。

在一个实施例中，在获取每个底库视频的底库视频帧特征和查询视频的查询视频帧特征之后，还包括：建立快速搜索数据库；其中，快速搜索数据库内对应记录了每个底库视频帧特征及其底库视频编码、帧特征时间戳；通过数据分类聚类方法对快速搜索数据库内的底库视频帧特征进行分类或编码，以筛选出与查询视频帧特征所属的类别相对应的底库视频帧特征。

在一个实施例中，在将查询视频与每个候选视频组成视频对，通过网络流量算法寻找每个匹配视频对中的疑似抄袭片段之后，还包括：

获取疑似抄袭片段的片段时长与平均相似分数，将片段时长与平均相似分数输入分类器，以判断片段时长与平均相似分数代表的候选点在分布图内与分类边界的距离是否大于预设距离；当片段时长与平均相似分数代表的候选点在分布图内与分类边界的距离大于或等于预设距离时，根据候选点在分布图内的位置判断疑似抄袭片段的分类结果；其中，分类结果包括真实的候选片段及误报的候选片段；当片段时长与平均相似分数代表的候选点在分布图内与分类边界的距离小于预设距离时，通过时间匹配核算法判断疑似抄袭片段的分类结果。

在一个实施例中，对应同一底库视频的底库视频帧特征组成底库视频特征，查询视频帧特征组成查询视频特征；获取每个查询视频帧特征和每个底库视频帧特征的相似度，将相似度高于第一预设阈值的底库视频帧作为近邻匹配帧，包括：分别构建查询视频特征和底库视频特征的特征矩阵，将查询视频特征和底库视频特征的特征矩阵进行內积，得到相似度矩阵；以相似度值的大小为序获取相似度矩阵中预设数量个相似度值，根据相似度值将底库视频中对应的底库视频帧作为近邻匹配帧；其中，相似度值为底库视频帧特征与查询视频帧特征之间内积值；将相似度矩阵中低于第一预设阈值的相似度值过滤。

在一个实施例中，选择至少一个底库视频帧集合对应的底库视频作为候选视频，包括：计算每个底库视频帧集合内近邻匹配帧的相似度总和；选择相似度总和满足预设条件的底库视频帧集合对应的底库视频作为候选视频。

在一个实施例中，通过网络流量算法寻找每个匹配视频对中的疑似抄袭片段，包括：建立每个匹配视频对的有向无环图，遍历所有有向无环图的结点，确定每个有向无环图中相似度累计和最大的结点路径；将相似度累计和最大的结点路径所截取的视频片段作为对应匹配视频对中的疑似抄袭片段。

一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现如下步骤：获取至少一个底库视频和查询视频，对每个底库视频和查询视频进行间隔抽帧，获取每个底库视频的多个底库图像和查询视频的多个查询图像；分别将每个底库视频的多个底库图像和查询视频的多个查询图像输入卷积神经网络进行特征提取，进行高斯滤波处理与最大值池化处理，获取每个底库视频的底库视频帧特征和查询视频的查询视频帧特征；获取每个查询视频帧特征和每个底库视频帧特征的相似度，将相似度高于第一预设阈值的底库视频帧作为近邻匹配帧；获取每个近邻匹配帧对应的底库视频编码标识，将近邻匹配帧按照底库视频编码标识归类，生成至少一个底库视频帧集合；选择至少一个底库视频帧集合对应的底库视频作为候选视频；将查询视频与每个候选视频组成视频对，通过网络流量算法寻找每个匹配视频对中的疑似抄袭片段。

在一个实施例中，通过网络流量算法寻找每个匹配视频对中的疑似抄袭片段，包括：建立每个匹配视频对的有向无环图，遍历所有有向无环图的结点，确定每个有向无环图中相似度累计和最大的结点路径；将相似度累计和最大的结点路径所截取的视频片段作为对应匹配视频对中的疑似抄袭片段。需要说明的是，上述视频抄袭检测方法、装置、设备及计算机可读存储介质属于一个总的发明构思，视频抄袭检测方法、装置、设备及计算机可读存储介质实施例中的内容可相互适用。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种视频抄袭检测的方法，其特征在于，所述方法包括：

将所述查询视频与每个所述候选视频组成视频对，通过网络流量算法寻找每个所述视频对中的疑似抄袭片段；

所述通过网络流量算法寻找每个所述视频对中的疑似抄袭片段，包括：

遍历所述视频对中底库视频内的近邻匹配帧；其中，相似度大于预设阈值的近邻匹配帧被保留；

获取每个近邻匹配帧在底库视频的时间戳及在查询视频的时间戳，依据时间戳顺序依次连接所有的节点，以建立每个所述视频对的有向无环图；其中，所述有向无环图包含多个节点和多个箭头，每个节点包含有查询视频或底库视频的时间戳，箭头指示下一节点所对应的查询视频或底库视频的相似度，在所述有向无环图中，前后节点的时间戳之间的差值小于预设的时间阈值；

遍历所有所述有向无环图，确定每个所述有向无环图中相似度累计和最大的路径，将所述相似度累计和最大的路径作为对应所述视频对中的疑似抄袭片段。

2.根据权利要求1所述的方法，其特征在于，在所述获取每个所述底库视频的底库视频帧特征和所述查询视频的查询视频帧特征之后，还包括：

3.根据权利要求1所述的方法，其特征在于，在所述获取每个所述底库视频的底库视频帧特征和所述查询视频的查询视频帧特征之后，还包括：

通过数据分类聚类方法对所述快速搜索数据库内的所述底库视频帧特征进行分类或编码，以筛选出与查询视频帧特征所属的类别相对应的底库视频帧特征。

4.根据权利要求1所述的方法，其特征在于，在所述将所述查询视频与每个所述候选视频组成视频对，通过网络流量算法寻找每个所述视频对中的疑似抄袭片段之后，还包括：

5.根据权利要求1所述的方法，其特征在于，对应同一所述底库视频的所述底库视频帧特征组成底库视频特征，所述查询视频帧特征组成查询视频特征；

6.根据权利要求1所述的方法，其特征在于，所述选择至少一个所述底库视频帧集合对应的底库视频作为候选视频，包括：

7.一种视频抄袭检测装置，其特征在于，所述装置包括：

疑似抄袭片段搜索模块，用于将所述查询视频与每个所述候选视频组成视频对，通过网络流量算法寻找每个所述视频对中的疑似抄袭片段；

所述疑似抄袭片段搜索模块，具体用于：

8.一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1至6中任一项所述方法的步骤。

9.一种视频抄袭检测设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1至6中任一项所述方法的步骤。