CN112381151A

CN112381151A - 相似视频的确定方法及装置

Info

Publication number: CN112381151A
Application number: CN202011284918.5A
Authority: CN
Inventors: 陈畅新; 钟艺豪; 李百川
Original assignee: Youmi Technology Co ltd
Current assignee: Youmi Technology Co ltd
Priority date: 2020-11-17
Filing date: 2020-11-17
Publication date: 2021-02-19
Anticipated expiration: 2040-11-17
Also published as: CN112381151B

Abstract

本发明公开了相似视频的确定方法及装置，包括：确定第一视频及第二视频各自对应的拼接哈希值，拼接哈希值是对相应视频对应的视频帧集合中每个视频帧的哈希值执行拼接操作得到的，视频对应的视频帧集合包括至少两个视频帧且不同视频对应的视频帧集合包括相同数量的视频帧；根据第一视频及第二视频各自对应的拼接哈希值，计算第一视频与第二视频的汉明距离；当该汉明距离小于等于汉明距离阈值时，确定第一视频与第二视频为相似视频。可见，本发明能够根据拼接哈希值计算视频间的汉明距离，进而根据汉明距离判断视频是否相似，相较于根据训练好的预测模型并结合每个视频对应的标注信息判断视频是否相似的方式提高了确定相似视频的准确率及效率。

Description

相似视频的确定方法及装置

技术领域

本发明涉及视频处理技术领域，尤其涉及一种相似视频的确定方法及装置。

背景技术

随着电子信息的快速发展，短视频日渐火爆且相应的用户规模也日益扩大，用户不仅可以直接拍摄视频并进行剪辑发布，而且还能够基于已有视频的设计添加不同的创作元素(也称艺术效果)对已有视频进行再创作，例如用户可以对已有视频的画面、光度及编码等进行修改，这不仅能够丰富用户的日常生活，在一些情况下，还能够为用户带来一定的收益。

由于越来越多的用户参与发布视频或对已有视频进行再创作，这导致在海量的视频数据库中存在大量重复或相似的视频。在实际应用中，需要确定海量的视频数据库中视频间是否相似，以便于对海量的视频数据库中的视频进行分类，这样能够提高用户搜索并获取符合自身需求的视频的效率与准确性，还能够提高为用户推荐的视频之间的关联性。

实践发现，当前主要依赖于训练好的预测模型并结合每个视频对应的标注信息预测视频间的相似度进而判断视频间是否相似，也即：相似视频的确定依赖于训练好的预测模型及视频的标注信息，存在准确性低的问题，且当某一视频无标注信息或者某一视频的标注信息为新出现的标注信息时，这会导致预测模型无法预测该视频与其它视频的相似度，或者，需要更新预测模型才能预测该视频与其它视频的相似度，存在效率低的问题。可见，如何提高确定相似视频的准确率及效率显得尤为重要。

发明内容

本发明所要解决的技术问题在于，提供一种相似视频的确定方法及装置，能够提高确定相似视频的准确率及效率。

为了解决上述技术问题，本发明第一方面公开了一种相似视频的确定方法，所述方法包括：

确定第一视频对应的拼接哈希值以及第二视频对应的拼接哈希值，所述拼接哈希值是对相应视频对应的视频帧集合中每个视频帧的哈希值执行拼接操作得到的，所述视频帧集合包括至少两个视频帧且不同视频对应的视频帧集合包括相同数量的视频帧；

根据所述第一视频对应的拼接哈希值以及所述第二视频对应的拼接哈希值，计算所述第一视频与所述第二视频的汉明距离；

判断所述汉明距离是否小于等于预先确定出的汉明距离阈值，当判断出所述汉明距离小于等于所述汉明距离阈值时，确定所述第一视频与所述第二视频为相似视频。

作为一种可选的实施方式，在本发明第一方面中，所述确定第一视频对应的拼接哈希值以及第二视频对应的拼接哈希值，包括：

对于所述第一视频及所述第二视频，根据确定出的抽帧参数抽取每个视频的至少两个视频帧，得到每个视频对应的视频帧集合；

计算每个视频对应的视频帧集合中每个视频帧的哈希值，并按照预先确定出的拼接顺序拼接每个视频对应的视频帧集合中每个视频帧的哈希值，得到每个视频对应的拼接哈希值；

其中，每个视频对应相同的抽帧参数，所述抽帧参数包括抽帧数量，和/或，需要抽取的起始帧的帧标识或起始时刻。

作为一种可选的实施方式，在本发明第一方面中，所述对于所述第一视频及所述第二视频，根据确定出的抽帧参数抽取每个视频的至少两个视频帧，得到每个视频对应的视频帧集合之后，所述方法还包括：

分别对所述第一视频对应的视频帧集合及所述第二视频对应的视频帧集合执行主画面检测与提取操作，以提取每个视频对应的视频帧集合中每个视频帧对应的主画面；以及，将每个视频对应的视频帧集合中的每个视频帧替换为该视频帧对应的主画面，以更新每个视频对应的视频帧集合中的每个视频帧。

作为一种可选的实施方式，在本发明第一方面中，所述确定第一视频对应的拼接哈希值以及第二视频对应的拼接哈希值之前，所述方法还包括：

从确定出的待分类视频集合中选择任意一个待分类视频作为第一视频，以及，从预先确定出的目标已分类视频集合中选择一个针对所述第一视频还未被选择过的已分类视频作为第二视频，其中，所述目标已分类视频集合为预先针对所述待分类视频集合构建的两个已分类视频集合中的其中一个；

在确定出所述第一视频及所述第二视频之后，触发执行所述的确定第一视频对应的拼接哈希值以及第二视频对应的拼接哈希值的步骤；

以及，所述方法还包括：

当判断出所述汉明距离小于等于所述汉明距离阈值时，为所述第一视频和所述第二视频设置关联标识，并将所述第一视频及所述第二视频中的其中一个视频作为目标视频添加至相似视频集合；

当判断出所述汉明距离大于所述汉明距离阈值时，重新触发执行所述的从预先确定出的目标已分类视频集合中选择一个针对所述第一视频还未被选择过的已分类视频作为第二视频的步骤，直至所述目标已分类视频集合中不存在未被选择的已分类视频或者判断出所述汉明距离小于等于所述汉明距离阈值；

其中，两个所述已分类视频集合包括所述相似视频集合，且每个所述已分类视频集合所包括的视频均为已分类视频。

作为一种可选的实施方式，在本发明第一方面中，两个所述已分类视频集合还包括保留视频集合；

所述保留视频集合包括的任意两个已分类视频之间的汉明距离均大于所述汉明距离阈值；且对于所述相似视频集合中的任意一个已分类视频，所述保留视频集合中均存在该已分类视频的相似视频。

作为一种可选的实施方式，在本发明第一方面中，所述从预先确定出的目标已分类视频集合中选择一个针对所述第一视频还未被选择过的已分类视频作为第二视频之前，所述方法还包括：

判断预先构建的两个已分类视频集合当前是否均为空集合；

当判断出两个所述已分类视频集合当前均为空集合时，从所述待分类视频集合包括的除所述第一视频之外的剩余视频中选择其中一个视频作为第二视频，其中，所述目标视频为所述第一视频或所述第二视频；

当判断出两个所述已分类视频集合当前不均为空集合时，触发执行所述的从预先确定出的目标已分类视频集合中选择一个针对所述第一视频还未被选择过的已分类视频作为第二视频的步骤，其中，所述目标视频为所述第一视频。

作为一种可选的实施方式，在本发明第一方面中，所述方法还包括：

当所述待分类视频集合包括的所有视频均添加至相应的已分类视频集合时，判断所述保留视频集合当前所包括的视频数量是否满足预先设定的数量条件；

当判断出所述视频数量不满足所述数量条件时，调整所述汉明距离阈值以缩小所述汉明距离阈值，将所述保留视频集合作为新确定出的待分类视频集合，为其构建对应的两个已分类视频集合，并触发执行所述的从确定出的待分类视频集合中选择任意一个待分类视频作为第一视频的步骤以及触发执行所述的判断预先构建的两个已分类视频集合当前是否均为空集合的步骤。

当所述保留视频集合作为新确定出的待分类视频集合且其包括的所有视频均添加至为所述保留视频集合构建的已分类视频集合时，将所述保留视频集合对应的两个已分类视频集合中的其中一个已分类视频集合确定为初始确定出的待分类视频集合的相似视频合并结果；

其中，所述其中一个已分类视频集合包括的任意两个已分类视频之间的汉明距离均大于调整后的所述汉明距离阈值。

本发明第二方面公开了一种相似视频的确定装置，所述装置还包括：

第一确定模块，用于确定第一视频对应的拼接哈希值以及第二视频对应的拼接哈希值，所述拼接哈希值是对相应视频对应的视频帧集合中每个视频帧的哈希值执行拼接操作得到的，所述视频帧集合包括至少两个视频帧且不同视频对应的视频帧集合包括相同数量的视频帧；

计算模块，用于根据所述第一视频对应的拼接哈希值以及所述第二视频对应的拼接哈希值，计算所述第一视频与所述第二视频的汉明距离；

判断模块，用于判断所述汉明距离是否小于等于预先确定出的汉明距离阈值；

第二确定模块，用于当所述判断模块判断出所述汉明距离小于等于所述汉明距离阈值时，确定所述第一视频与所述第二视频为相似视频。

作为一种可选的实施方式，在本发明第二方面中，所述第一确定模块包括：

抽帧子模块，用于对于所述第一视频及所述第二视频，根据确定出的抽帧参数抽取每个视频的至少两个视频帧，得到每个视频对应的视频帧集合；

计算子模块，用于计算每个视频对应的视频帧集合中每个视频帧的哈希值；

拼接子模块，用于按照预先确定出的拼接顺序拼接每个视频对应的视频帧集合中每个视频帧的哈希值，得到每个视频对应的拼接哈希值；

作为一种可选的实施方式，在本发明第二方面中，所述第一确定模块还包括：

更新子模块，用于在所述抽帧子模块根据确定出的抽帧参数抽取每个视频的至少两个视频帧，得到每个视频对应的视频帧集合之后，分别对所述第一视频对应的视频帧集合及所述第二视频对应的视频帧集合执行主画面检测与提取操作，以提取每个视频对应的视频帧集合中每个视频帧对应的主画面；以及，将每个视频对应的视频帧集合中的每个视频帧替换为该视频帧对应的主画面，以更新每个视频对应的视频帧集合中的每个视频帧。

作为一种可选的实施方式，在本发明第二方面中，所述装置还包括：

选择模块，用于从确定出的待分类视频集合中选择任意一个待分类视频作为第一视频，以及，从预先确定出的目标已分类视频集合中选择一个针对所述第一视频还未被选择过的已分类视频作为第二视频，其中，所述目标已分类视频集合为预先针对所述待分类视频集合构建的两个已分类视频集合中的其中一个；以及，在确定出所述第一视频及所述第二视频之后，触发所述第一确定模块执行所述的确定第一视频对应的拼接哈希值以及第二视频对应的拼接哈希值的操作；

视频处理模块，用于当所述判断模块判断出所述汉明距离小于等于所述汉明距离阈值时，为所述第一视频和所述第二视频设置关联标识，并将所述第一视频及所述第二视频中的其中一个视频作为目标视频添加至相似视频集合；

所述选择模块，还用于当所述判断模块判断出所述汉明距离大于所述汉明距离阈值时，从预先确定出的目标已分类视频集合中选择一个针对所述第一视频还未被选择过的已分类视频作为第二视频，直至所述目标已分类视频集合中不存在未被选择的已分类视频或者判断出所述汉明距离小于等于所述汉明距离阈值；

作为一种可选的实施方式，在本发明第二方面中，两个所述已分类视频集合还包括保留视频集合；

作为一种可选的实施方式，在本发明第二方面中，所述判断模块，还用于在所述选择模块从预先确定出的目标已分类视频集合中选择一个针对所述第一视频还未被选择过的已分类视频作为第二视频之前，判断预先构建的两个已分类视频集合当前是否均为空集合；当判断出两个所述已分类视频集合当前不均为空集合时，触发所述选择模块执行所述的从预先确定出的目标已分类视频集合中选择一个针对所述第一视频还未被选择过的已分类视频作为第二视频的操作，其中，所述目标视频为所述第一视频；

所述选择模块，还用于当所述判断模块判断出两个所述已分类视频集合当前均为空集合时，从所述待分类视频集合包括的除所述第一视频之外的剩余视频中选择其中一个视频作为第二视频，其中，所述目标视频为所述第一视频或所述第二视频。

作为一种可选的实施方式，在本发明第二方面中，所述判断模块，还用于当所述待分类视频集合包括的所有视频均添加至相应的已分类视频集合时，判断所述保留视频集合当前所包括的视频数量是否满足预先设定的数量条件；

所述装置还包括：

调整模块，用于当所述判断模块判断出所述视频数量不满足所述数量条件时，调整所述汉明距离阈值以缩小所述汉明距离阈值；

集合处理模块，用于当所述判断模块判断出所述视频数量不满足所述数量条件时，将所述保留视频集合作为新确定出的待分类视频集合，为其构建对应的两个已分类视频集合，并触发所述选择模块执行所述的从确定出的待分类视频集合中选择任意一个待分类视频作为第一视频的操作，以及，触发所述判断模块执行所述的判断预先构建的两个已分类视频集合当前是否均为空集合的操作。

作为一种可选的实施方式，在本发明第二方面中，所述第二确定模块，还用于当所述保留视频集合作为新确定出的待分类视频集合且其包括的所有视频均添加至为所述保留视频集合构建的已分类视频集合时，将所述保留视频集合对应的两个已分类视频集合中的其中一个已分类视频集合确定为初始确定出的待分类视频集合的相似视频合并结果；

本发明第三方面公开了另一种相似视频的确定装置，所述装置包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行本发明第一方面公开的相似视频的确定方法中的部分或全部步骤。

本发明第四方面公开了一种计算机存储介质，所述计算机存储介质存储有计算机指令，所述计算机指令被调用时，用于执行本发明第一方面公开的相似视频的确定方法中的部分或全部步骤。

与现有技术相比，本发明实施例具有以下有益效果：

本发明实施例中，确定第一视频及第二视频各自对应的拼接哈希值，拼接哈希值是对相应视频对应的视频帧集合中每个视频帧的哈希值执行拼接操作得到的，视频对应的视频帧集合包括至少两个视频帧且不同视频对应的视频帧集合包括相同数量的视频帧；根据第一视频及第二视频各自对应的拼接哈希值，计算第一视频与第二视频的汉明距离；当该汉明距离小于等于汉明距离阈值时，确定第一视频与第二视频为相似视频。可见，实施本发明能够基于由待处理视频(第一视频及第二视频)包括的至少两个视频帧的哈希值拼接而成的拼接哈希值判断视频之间是否相似，相较于根据训练好的预测模型并结合每个视频对应的标注信息判断视频是否相似的方式提高了确定相似视频的准确率及效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种相似视频的确定方法的流程示意图。

图2是本发明实施例公开的另一种相似视频的确定方法的流程示意图；

图3是本发明实施例公开的一种相似视频的确定装置的结构示意图；

图4是本发明实施例公开的另一种相似视频的确定装置的结构示意图；

图5是本发明实施例公开的又一种相似视频的确定装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

本发明公开了一种相似视频的确定方法及装置，能够基于由待处理视频包括的至少两个视频帧的哈希值拼接而成的拼接哈希值判断视频之间是否相似，相较于根据训练好的预测模型并结合每个视频对应的标注信息判断视频是否相似的方式提高了确定相似视频的准确率及效率。以下分别进行详细说明。

实施例一(方法侧实施例)

请参阅图1，图1是本发明实施例公开的一种相似视频的确定方法的流程示意图。其中，图1所描述的方法可以应用于确定装置中，该确定装置可以应用于相应的移动终端、固定终端或服务终端中，本发明实施例对此不作限定。如图1所示，该相似视频的确定方法可以包括以下操作：

101、确定装置确定第一视频对应的拼接哈希值以及第二视频对应的拼接哈希值。

本发明实施例中，视频对应的拼接哈希值是按照确定出的拼接顺序(如视频帧的时间先后顺序)对该视频对应的视频帧集合中每个视频帧的哈希值执行拼接操作得到的，每个视频帧集合包括至少两个视频帧且不同视频对应的视频帧集合包括相同数量的视频帧，这样能够保证两个视频对应的拼接哈希值是等长的字符串，进而有利于根据拼接哈希值计算出正确的汉明距离。其中，第一视频、第二视频为需要进行相似性判断的任意两个视频，该两个视频可以是独立的，也可以是某一待分类视频集合所包括的任意两个视频，本发明实施例不作限定。其中，当第一视频、第二视频是待分类视频集合所包括的任意两个视频时，通过本发明实施例所描述的方法能够实现待分类视频集合的相似视频合并以及相似视频归类，有利于提高待分类视频集合的相似视频合并、相似视频归类效率及准确率。

102、确定装置根据第一视频对应的拼接哈希值以及第二视频对应的拼接哈希值，计算第一视频与第二视频的汉明距离。

本发明实施例中，汉明距离作为视频帧相似度的衡量指标，用来确定两个视频是否为相似视频。其中，两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数，汉明距离越小，说明视频之间的相似度就越高，汉明距离越大，说明视频之间的相似度就越低。

103、确定装置判断计算出的汉明距离是否小于等于预先确定出的汉明距离阈值，当步骤103的判断结果为是时，触发执行步骤104；当步骤103的判断结果为否时，可以结束本次流程。

需要特别说明的是，若第一视频和第二视频是独立的视频，当步骤103的判断结果为否时，可以直接结束本次流程；当第一视频和第二视频为待分类视频集合中的两个视频时，当步骤103的判断结果为否时，还可以进一步判断第一视频和/或第二视频与该待分类视频集合中的其它视频是否为相似视频。

104、当判断出汉明距离小于等于汉明距离阈值时，确定装置确定第一视频与第二视频为相似视频。

可见，实施本发明实施例所描述的方法能够基于由待处理视频包括的至少两个视频帧的哈希值拼接而成的拼接哈希值判断视频之间是否相似，相较于根据训练好的预测模型并结合每个视频对应的标注信息判断视频是否相似的方式提高了确定相似视频的准确率及效率。此外，还能够保证两个视频对应的拼接哈希值是等长的字符串，进而有利于根据拼接哈希值计算出正确的汉明距离，提高了汉明距离的计算准确性，进而提高了确定相似视频的准确性。

在一个可选的实施例中，在执行完毕步骤104之后，该方法还可以包括以下操作：

确定装置根据计算出的汉明距离确定第一视频与第二视频之间的相似度，并根据第一视频与第二视频之间的相似度所属的相似度范围，确定第一视频与第二视频的相似等级，可选的，相似等级的值越小表示视频间的相似度就越高。

进一步可选的，确定装置根据计算出的汉明距离确定第一视频与第二视频之间的相似度，可以包括：

确定装置根据获取到的汉明-相似转换关系，将计算出的汉明距离转换为第一视频与第二视频之间的相似度。

可见，该可选的实施例能够在确定出两个视频为相似视频之后根据视频间的汉明距离确定视频之间的相似度，进而确定视频之间的相似等级，有利于在相关人员存在相似视频推荐请求时根据视频之间的相似等级快速、准确地向相关人员推荐相似度较高的视频。

在另一个可选的实施例中，确定装置确定第一视频对应的拼接哈希值以及第二视频对应的拼接哈希值，可以包括：

对于第一视频及第二视频，确定装置根据确定出的抽帧参数抽取每个视频的至少两个视频帧，得到每个视频对应的视频帧集合；

确定装置计算每个视频对应的视频帧集合中每个视频帧的哈希值，并按照预先确定出的拼接顺序拼接每个视频对应的视频帧集合中每个视频帧的哈希值，得到每个视频对应的拼接哈希值。

其中，每个视频对应相同的抽帧参数，且抽帧参数可以包括抽帧数量(大于等于2)，和/或，需要抽取的起始帧的帧标识或起始时刻。且确定装置可以使用OpenCV、ImageIO、Scikit-Image、FFmpeg等图像处理库对每个视频进行抽帧，以及，确定装置可以预先通过设定好的算法计算每个视频帧的哈希值，设定好的算法可以是均值哈希算法，也可以是差异哈希算法，还可以是感知哈希值算法等，本发明实施例不作限定。

在该可选的实施例中，对于每个视频，确定装置均需要按照相同的抽帧参数对视频进行抽帧，以抽取每个视频的至少两个视频帧且对不同的视频抽取相同数量的视频帧。优选的，对于每个视频，确定装置抽取该视频的第2-4秒的第一帧，得到该视频对应的视频帧集合。由于部分相似视频新增了视频标题画面或特效，只抽取前两秒的视频帧会存在较大的误差，单独抽取一帧进行后续计算得到的相似视频的准确性较低，抽取过多的视频帧会导致计算量的增加，此外，由于部分相似视频的播放速度不同，通常为源视频的1.2-1.5倍，若抽取播放时间相对靠后的视频帧，会导致相似视频的播放画面区别较大，进而导致判断出的相似视频存在较大误差，准确性较低，因此，本发明实施例优选第2-4秒的第一帧能够在增加少量计算量的同时提高确定出相似视频的准确性。

在该可选的实施例中，进一步可选的，对于第一视频及第二视频，确定装置根据确定出的抽帧参数抽取每个视频的至少两个视频帧，得到每个视频对应的视频帧集合之后，确定装置还可以执行以下操作：

确定装置分别对第一视频对应的视频帧集合及第二视频对应的视频帧集合执行主画面检测与提取操作，以提取每个视频对应的视频帧集合中每个视频帧对应的主画面；以及，将每个视频对应的视频帧集合中的每个视频帧替换为该视频帧对应的主画面，以更新每个视频对应的视频帧集合中的每个视频帧。

具体的，对于上述第一视频及上述第二视频中的每个视频，确定装置对该视频对应的视频帧集合中所有视频帧执行主画面检测操作，得到该视频对应的视频帧集合中每个视频帧对应的多个矩形区域，对该视频对应的视频帧集合中每个视频帧对应的矩形区域执行主画面提取操作，得到该视频对应的视频帧集合中每个视频帧对应的主画面，以及，将该视频对应的视频帧集合中的视频帧替换为该视频帧对应的主画面以更新该视频帧。

进一步的，该可选的实施例可以通过视频帧的画面布局、图像复杂度以及同一个视频帧集合的不同视频帧之间的差异度进行主画面的判断和提取。具体的：

对于任一视频对应的视频帧集合所包括的视频帧，确定装置利用直线检测或外接矩形检测视频帧的画面布局，从而提取出视频帧存在的多个矩形画面，然后比较不同视频帧相同矩形画面的图像差异度，差异度最大的矩形区域予以保留，认为是主画面区域；若比较的两个视频帧提取的矩形区域不一致，则分别计算视频帧各矩形区域的图像复杂度，复杂度最高的矩形区域认为是该视频帧的主画面区域。

进一步可选的，对于任一视频对应的视频帧集合中的每个视频帧，在得到该视频帧对应的矩形区域之后，确定装置可以先判断该视频帧对应的矩形区域的个数是否小于等于确定出的个数阈值，如果是，则不对该视频帧进行后续的处理，如果否，则进行后续的主画面提取操作以及视频帧替换操作。

在该可选的实施例中，部分相似视频的画面布局变化较大，包括在横向或纵向将画面布局分成的三部分，中间部分嵌入源视频，其余两部分添加字幕、水印、标签等，或是对源视频模糊处理后的播放画面，这些剪辑后的画面布局若不加以处理，会导致计算出来的哈希值与源视频画面计算出来的哈希值存在较大差别，因此，该可选的实施例能够先采用主画面检测算法将视频画面提取出来，替换掉相应的视频帧，这样能够提高计算出来的哈希值的准确性。

可见，实施本发明实施例所描述的方法能够基于由待处理视频包括的至少两个视频帧的哈希值拼接而成的拼接哈希值判断视频之间是否相似，相较于根据训练好的预测模型并结合每个视频对应的标注信息判断视频是否相似的方式提高了确定相似视频的准确率及效率。此外，还能够保证两个视频对应的拼接哈希值是等长的字符串，进而有利于根据拼接哈希值计算出正确的汉明距离，提高了汉明距离的计算准确性，进而提高了确定相似视频的准确性。此外，还能够先采用主画面检测算法将视频画面提取出来，替换掉相应的视频帧，这样能够提高计算出来的哈希值的准确性。此外，还能够在确定出两个视频为相似视频之后根据视频间的汉明距离确定视频之间的相似度，进而确定视频之间的相似等级，有利于在相关人员存在相似视频推荐请求时根据视频之间的相似等级快速、准确地向相关人员推荐相似度较高的视频。

实施例二(方法侧实施例)

请参阅图2，图2是本发明实施例公开的另一种相似视频的确定方法的流程示意图。其中，图2所描述的方法可以应用于确定装置中，该确定装置可以应用于相应的移动终端、固定终端或服务终端中，本发明实施例对此不作限定。如图2所示，该相似视频的确定方法可以包括以下操作：

201、确定装置从确定出的待分类视频集合中选择任意一个待分类视频作为第一视频。

其中，该待分类视频集合为需要进行相似视频合并和/或相似视频归类的视频集合，且对于初始的待分类视频集合，其所包括的视频均可以理解为待分类视频，在确定出初始的待分类视频集合之后，确定装置还需要为其构建两个已分类视频集合，该两个已分类视频集合可以包括保留视频集合以及相似视频集合，且在初始构建出两个已分类视频集合时，该两个已分类视频集合均为空集合，且随着后续步骤的执行，逐步的将待分类视频集合包括的视频添加至相应的已分类视频集合中，实现视频的分类，进而得到待分类视频集合的相似视频合并结果。

202、确定装置判断预先构建的两个已分类视频集合当前是否均为空集合，当步骤202的判断结果为是时，触发执行步骤203；当步骤202的判断结果为否时，触发执行步骤204。

203、确定装置从上述待分类视频集合包括的除第一视频之外的剩余视频中选择其中一个视频作为第二视频。

204、确定装置从预先确定出的目标已分类视频集合中选择一个针对第一视频还未被选择过的已分类视频作为第二视频。

其中，目标已分类视频集合为上述两个已分类视频集合中的其中一个，且目标已分类视频集合不为空集合。优选的，当上述两个已分类视频集合均不为空集合时，目标已分类视频集合为上述两个已分类视频集合中当前所包括的视频数量较少的集合。也即，在一个可选的实施例中，当步骤202的判断结果为否以及在执行步骤204之前，该方法还可以包括以下操作：

当上述两个已分类视频集合均不为空集合时，从上述两个已分类视频集合中当前所包括的视频数量少的已分类视频集合作为目标已分类视频集合，并触发执行步骤204。

可见，在该可选的实施例能够先选择视频数量较少的已分类视频集合，这样有利于减少数据处理量，提高确定出所属的分类集合的效率。

205、在确定出第一视频及第二视频之后，确定装置确定第一视频对应的拼接哈希值以及第二视频对应的拼接哈希值。

206、确定装置根据第一视频对应的拼接哈希值以及第二视频对应的拼接哈希值，计算第一视频与第二视频的汉明距离。

207、确定装置判断计算出的汉明距离是否小于等于预先确定出的汉明距离阈值，当步骤207的判断结果为否时，继续触发执行步骤204，直至目标已分类视频集合中不存在未被选择的已分类视频或者判断出汉明距离小于等于汉明距离阈值；当步骤207的判断结果为是时，触发执行步骤208。

需要说明的是，在“当步骤207的判断结果为否时，继续触发执行步骤204”的循环过程中，若最终判断出目标已分类视频集合中不存在上述第一视频的相似视频且另一个已分类视频集合不为空时，可以将另一个已分类视频集合作为新的目标已分类视频集合，并触发执行步骤204；若判断出两个已分类视频集合中均不存在上述第一视频的相似视频，则确定装置可以直接将上述第一视频添加至保留视频集合中，有利于实现相似视频的合并。

208、确定装置确定第一视频和第二视频为相似视频，为第一视频和第二视频设置关联标识，并将第一视频及第二视频中的其中一个视频作为目标视频添加至相似视频集合。

需要说明的是，在将上述待分类视频集合中的视频分类完毕时，保留视频集合包括的任意两个已分类视频之间的汉明距离均大于汉明距离阈值；且对于相似视频集合中的任意一个已分类视频，保留视频集合中均存在该已分类视频的相似视频。

可见，本发明实施例能够在确定第一视频和第二视频为相似视频之后，为相似视频设置用于表示两个视频为相似视频的关联标识，有利于根据关联标识快速地实现相似视频的分组，且还能够将相应视频添加至相似视频集合及保留视频集合，有利于实现待分类视频集合的分类，进而能够快速、准确地对上述待分类视频集合中的视频进行相似视频的合并及相似视频的分组。

需要说明的是，若第二视频是通过步骤203确定出的，在确定第一视频和第二视频为相似视频之后，可以随机选择其中一个视频添加至相似视频集合，也可以根据预先确定出的视频筛选条件从第一视频和第二视频中筛选出符合要求的视频，并将筛选出的符合要求的视频添加至相似视频集合；若第二视频是通过步骤204确定出的，则在确定第一视频和第二视频为相似视频之后，直接将第一视频添加至相似视频集合，进一步的，在将第一视频添加至相似视频集合之前，确定装置还可以先判断目标已分类视频集合当前包括的视频数量是否大于1，若大于1，则直接将第一视频添加至相似视频集合，若等于1，则可以随机选择其中一个视频添加至相似视频集合，也可以根据预先确定出的视频筛选条件从第一视频和第二视频中筛选出符合要求的视频，并将筛选出的符合要求的视频添加至相似视频集合。可选的，视频筛选条件可以为播放时长更长、分辨率更高、视频文件更大等一种或多种的组合。

在一个可选的实施例中，该方法还可以包括以下操作：

当上述待分类视频集合包括的所有视频均添加至相应的已分类视频集合时，确定装置判断保留视频集合当前所包括的视频数量是否满足预先设定的数量条件；

当判断出视频数量不满足数量条件时，确定装置调整汉明距离阈值以缩小汉明距离阈值，将上述保留视频集合作为新确定出的待分类视频集合，为其构建对应的两个已分类视频集合，并触发执行上述的从确定出的待分类视频集合中选择任意一个待分类视频作为第一视频的步骤以及触发执行上述的判断预先构建的两个已分类视频集合当前是否均为空集合的步骤。

其中，当判断出视频数量满足数量条件时，确定装置将上述保留视频集合确定为上述待分类视频集合的相似视频合并结果。

可选的，确定装置判断保留视频集合当前所包括的视频数量是否满足预先设定的数量条件，可以包括：

确定装置判断保留视频集合当前所包括的视频数量是否小于等于预先确定出的数量阈值，若是，则确定满足数量条件，若否，则确定不满足数量条件；或者，

确定装置判断保留视频集合当前所包括的视频数量占上述待分类视频集合所包括的视频总数量的比例是否小于等于确定出的比例阈值，若是，则确定满足数量条件，若否，则确定不满足数量条件。

在另一个可选的实施例中，该方法还可以包括以下操作：

当上述保留视频集合作为新确定出的待分类视频集合且其包括的所有视频均添加至为保留视频集合构建的已分类视频集合时，确定装置将保留视频集合对应的两个已分类视频集合中的其中一个已分类视频集合确定为初始确定出的待分类视频集合的相似视频合并结果。

进一步的，当上述保留视频集合作为新确定出的待分类视频集合且其包括的所有视频均添加至为保留视频集合构建的已分类视频集合且为保留视频集合构建的保留视频集合包括的视频数量满足数量条件时，确定装置将保留视频集合对应的两个已分类视频集合中的其中一个已分类视频集合确定为初始确定出的待分类视频集合的相似视频合并结果。

需要说明的是，当上述保留视频集合作为新确定出的待分类视频集合且其包括的所有视频均添加至为保留视频集合构建的已分类视频集合且为保留视频集合构建的保留视频集合包括的视频数量不满足数量条件时，确定装置可以继续触发执行上述的调整汉明距离阈值以缩小汉明距离阈值，将上述保留视频集合作为新确定出的待分类视频集合，为其构建对应的两个已分类视频集合的步骤。进一步的，当上述保留视频集合作为新确定出的待分类视频集合且其包括的所有视频均添加至为保留视频集合构建的已分类视频集合且为保留视频集合构建的保留视频集合包括的视频数量不满足数量条件时，确定装置可以根据预先设定的控制条件确定是否需要进一步继续执行上述的调整汉明距离阈值以缩小汉明距离阈值，将上述保留视频集合作为新确定出的待分类视频集合，为其构建对应的两个已分类视频集合的步骤。

其中，该其中一个已分类视频集合包括的任意两个已分类视频之间的汉明距离均大于调整后的汉明距离阈值。

可见，该可选的实施例还能够在分类出的保留视频集合中视频的数量较多或者视频的数量占比较大时，能够自适应调整汉明距离阈值进一步对保留视频集合进行相似视频的合并，有利于提高最终确定出的相似视频集合以及保留视频集合的精准性。

实施例三

请参阅图3，图3是本发明实施例公开的一种相似视频的确定装置的结构示意图。其中，图3所描述装置可以应用于相应的移动终端、固定终端或服务终端中，本发明实施例对此不作限定。如图3所示，该相似视频的确定装置可以包括：

第一确定模块301，用于确定第一视频对应的拼接哈希值以及第二视频对应的拼接哈希值，拼接哈希值是对相应视频对应的视频帧集合中每个视频帧的哈希值执行拼接操作得到的，视频帧集合包括至少两个视频帧且不同视频对应的视频帧集合包括相同数量的视频帧。

计算模块302，用于根据第一视频对应的拼接哈希值以及第二视频对应的拼接哈希值，计算第一视频与第二视频的汉明距离。

判断模块303，用于判断汉明距离是否小于等于预先确定出的汉明距离阈值。

第二确定模块304，用于当判断模块303判断出汉明距离小于等于汉明距离阈值时，确定第一视频与第二视频为相似视频。

可见，实施图3所描述的装置能够基于由待处理视频(第一视频及第二视频)包括的至少两个视频帧的哈希值拼接而成的拼接哈希值判断视频之间是否相似，相较于根据训练好的预测模型并结合每个视频对应的标注信息判断视频是否相似的方式提高了确定相似视频的准确率及效率。

在一个可选的实施例中，如图4所示，第一确定模块301，可以包括：

抽帧子模块3011，用于对于第一视频及第二视频，根据确定出的抽帧参数抽取每个视频的至少两个视频帧，得到每个视频对应的视频帧集合；

计算子模块3012，用于计算每个视频对应的视频帧集合中每个视频帧的哈希值；

拼接子模块3013，用于按照预先确定出的拼接顺序拼接每个视频对应的视频帧集合中每个视频帧的哈希值，得到每个视频对应的拼接哈希值。

其中，每个视频对应相同的抽帧参数，抽帧参数包括抽帧数量，和/或，需要抽取的起始帧的帧标识或起始时刻。

进一步可选的，如图4所示，第一确定模块301还可以包括：

更新子模块3014，用于在抽帧子模块3011根据确定出的抽帧参数抽取每个视频的至少两个视频帧，得到每个视频对应的视频帧集合之后，分别对第一视频对应的视频帧集合及第二视频对应的视频帧集合执行主画面检测与提取操作，以提取每个视频对应的视频帧集合中每个视频帧对应的主画面；以及，将每个视频对应的视频帧集合中的每个视频帧替换为该视频帧对应的主画面，以更新每个视频对应的视频帧集合中的每个视频帧。

可见，实施图4所描述的装置还能够先采用主画面检测算法将视频画面提取出来，替换掉相应的视频帧，这样能够提高计算出来的哈希值的准确性。

在另一个可选的实施例中，如图4所示，该装置还可以包括：

选择模块305，用于从确定出的待分类视频集合中选择任意一个待分类视频作为第一视频，以及，从预先确定出的目标已分类视频集合中选择一个针对第一视频还未被选择过的已分类视频作为第二视频，其中，目标已分类视频集合为预先针对待分类视频集合构建的两个已分类视频集合中的其中一个；以及，在确定出第一视频及第二视频之后，触发第一确定模块301执行上述的确定第一视频对应的拼接哈希值以及第二视频对应的拼接哈希值的操作。

视频处理模块306，用于当判断模块303判断出汉明距离小于等于汉明距离阈值时，为第一视频和第二视频设置关联标识，并将第一视频及第二视频中的其中一个视频作为目标视频添加至相似视频集合。

选择模块305，还用于当判断模块303判断出汉明距离大于汉明距离阈值时，在视频处理模块306将第一视频添加至保留视频集合之后，从预先确定出的目标已分类视频集合中选择一个针对第一视频还未被选择过的已分类视频作为第二视频，直至目标已分类视频集合中不存在未被选择的已分类视频或者判断出汉明距离小于等于汉明距离阈值。

其中，两个已分类视频集合包括相似视频集合，且每个已分类视频集合所包括的视频均为已分类视频。进一步的，两个已分类视频集合还包括保留视频集合，且保留视频集合包括的任意两个已分类视频之间的汉明距离均大于汉明距离阈值；且对于相似视频集合中的任意一个已分类视频，保留视频集合中均存在该已分类视频的相似视频。

在又一个可选的实施例中，判断模块303，还用于在选择模块305从预先确定出的目标已分类视频集合中选择一个针对第一视频还未被选择过的已分类视频作为第二视频之前，判断预先构建的两个已分类视频集合当前是否均为空集合；当判断出两个已分类视频集合当前不均为空集合时，触发选择模块305执行上述的从预先确定出的目标已分类视频集合中选择一个针对第一视频还未被选择过的已分类视频作为第二视频的操作，其中，目标视频为第一视频。

选择模块305，还用于当判断模块303判断出两个已分类视频集合当前均为空集合时，从待分类视频集合包括的除第一视频之外的剩余视频中选择其中一个视频作为第二视频，其中，目标视频为第一视频或第二视频。

在又一个可选的实施例中，判断模块303，还用于当待分类视频集合包括的所有视频均添加至相应的已分类视频集合时，判断保留视频集合当前所包括的视频数量是否满足预先设定的数量条件。如图4所示，该装置还包括：

调整模块307，用于当判断模块303判断出视频数量不满足数量条件时，调整汉明距离阈值以缩小汉明距离阈值。

集合处理模块308，用于当判断模块303判断出视频数量不满足数量条件时，将保留视频集合作为新确定出的待分类视频集合，为其构建对应的两个已分类视频集合，并触发选择模块305执行上述的从确定出的待分类视频集合中选择任意一个待分类视频作为第一视频的操作，以及，触发判断模块303执行上述的判断预先构建的两个已分类视频集合当前是否均为空集合的操作。

在又一个可选的实施例中，第二确定模块304，还可以用于当保留视频集合作为新确定出的待分类视频集合且其包括的所有视频均添加至为保留视频集合构建的已分类视频集合时，将保留视频集合对应的两个已分类视频集合中的其中一个已分类视频集合确定为初始确定出的待分类视频集合的相似视频合并结果。

其中，其中一个已分类视频集合包括的任意两个已分类视频之间的汉明距离均大于调整后的汉明距离阈值。

可见，该可选的实施例还能够在确定第一视频和第二视频为相似视频之后，为相似视频设置用于表示两个视频为相似视频的关联标识，有利于根据关联标识快速地实现相似视频的分组，且还能够将相应视频添加至相似视频集合及保留视频集合，有利于实现待分类视频集合的分类，进而能够快速、准确地对上述待分类视频集合中的视频进行相似视频的合并及相似视频的分组。此外，还能够在分类出的保留视频集合中视频的数量较多或者视频的数量占比较大时，能够自适应调整汉明距离阈值进一步对保留视频集合进行相似视频的合并，有利于提高最终确定出的相似视频集合以及保留视频集合的精准性。

实施例四

请参阅图5，图5是本发明实施例公开的又一种相似视频的确定装置的结构示意图。如图5所示，该装置可以包括：

存储有可执行程序代码的存储器401；

与存储器401耦合的处理器402。

其中，处理器402调用存储器401中存储的可执行程序代码，用于执行实施例一或实施例二中公开的相似视频的确定方法的部分或全部步骤。

实施例五

本发明实施例公开了一种计算机读存储介质，其存储用于电子数据交换的计算机程序，其中，该计算机程序使得计算机执行实施例一或实施例二中公开的相似视频的确定方法的部分或全部步骤。

实施例六

本发明实施例公开了一种计算机程序产品，该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，且该计算机程序可操作来使计算机执行实施例一或实施例二中公开的相似视频的确定方法的部分或全部步骤。

以上所描述的装置实施例仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施例的具体描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory，ROM)、随机存储器(Random Access Memory，RAM)、可编程只读存储器(Programmable Read-only Memory，PROM)、可擦除可编程只读存储器(ErasableProgrammable Read Only Memory，EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

最后应说明的是：本发明实施例公开的一种相似视频的确定方法及装置所揭露的仅为本发明较佳实施例而已，仅用于说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解；其依然可以对前述各项实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或替换，并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

Claims

1.一种相似视频的确定方法，其特征在于，所述方法包括：

2.根据权利要求1所述的相似视频的确定方法，其特征在于，所述确定第一视频对应的拼接哈希值以及第二视频对应的拼接哈希值，包括：

3.根据权利要求2所述的相似视频的确定方法，其特征在于，所述对于所述第一视频及所述第二视频，根据确定出的抽帧参数抽取每个视频的至少两个视频帧，得到每个视频对应的视频帧集合之后，所述方法还包括：

4.根据权利要求1-3任一项所述的相似视频的确定方法，其特征在于，所述确定第一视频对应的拼接哈希值以及第二视频对应的拼接哈希值之前，所述方法还包括：

以及，所述方法还包括：

5.根据权利要求4所述的相似视频的确定方法，其特征在于，两个所述已分类视频集合还包括保留视频集合；

6.根据权利要求5所述的相似视频的确定方法，其特征在于，所述从预先确定出的目标已分类视频集合中选择一个针对所述第一视频还未被选择过的已分类视频作为第二视频之前，所述方法还包括：

判断预先构建的两个已分类视频集合当前是否均为空集合；

7.根据权利要求6所述的相似视频的确定方法，其特征在于，所述方法还包括：

8.根据权利权利要求7所述的相似视频的确定方法，其特征在于，所述方法还包括：

9.一种相似视频的确定装置，其特征在于，所述装置包括：

10.一种相似视频的确定装置，其特征在于，所述装置包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行如权利要求1-8任一项所述的相似视频的确定方法。

11.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机指令，所述计算机指令被调用时，用于执行如权利要求1-8任一项所述的相似视频的确定方法。