WO2021027325A1

WO2021027325A1 - 视频相似度获取方法、装置、计算机设备及存储介质

Info

Publication number: WO2021027325A1
Application number: PCT/CN2020/087033
Authority: WO
Inventors: 夏新
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2019-08-15
Filing date: 2020-04-26
Publication date: 2021-02-18
Also published as: CN110674837A

Abstract

本申请涉及人工智能领域，具体公开了视频相似度获取方法、装置、计算机设备及存储介质。该方法包括：通过光流法分别对待比对视频和原始视频进行预处理，得到与待比对视频对应的第一目标图片集合，及与原始视频对应的第二目标图片集合；通过卷积神经网络获取分别第一目标图片集合对应的第一图片特征向量集合，及第二目标图片集合对应的第二图片特征向量集合；获取第一图片特征向量集合中各图片特征向量与第二图片特征向量集合中对应图片特征向量的相似度，以得到待比对视频与原始视频的平均相似度；以及将待比对视频与原始视频的平均相似度发送至上传端。该方法实现了结合微表情识别技术和视频图像比对来判断视频之间的相似度，提高了视频之间的相似度的识别准确率。

Description

视频相似度获取方法、装置、计算机设备及存储介质

本申请要求于2019年8月15日提交中国专利局、申请号为201910752907.6，发明名称为“视频相似度获取方法、装置、计算机设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种视频相似度获取方法、装置、计算机设备及存储介质。

背景技术

目前，在评判两段视频的相似度时，无具体算法来进行计算，只是用户通过肉眼来比对两者的相似程度(例如一些视频模仿秀APP，用户上传一个模仿视频以还原原始视频中表演者的肢体动作和表情等)。发明人意识到，通过肉眼评判时，难以准确的获取表演者的微表情以进行精准的视频相似度判断。

发明内容

本申请实施例提供了一种视频相似度获取方法、装置、计算机设备及存储介质，旨在解决现有技术中在评判两段视频的相似度时是用户通过肉眼来比对两者的相似程度，难以准确的获取表演者的微表情以进行精准的视频相似度判断的问题。

第一方面，本申请实施例提供了一种视频相似度获取方法，其包括：

接收上传端所上传的待比对视频，获取与所述待比对视频对应的原始视频；

将所述待对比视频及所述原始视频均进行视频拆分，得到与所述待对比视频对应的待对比图片集合，及与所述原始视频对应的原始图片集合；

通过光流法对所述待比对视频进行预处理，得到与所述待比对视频对应的第一目标图片集合；

通过光流法对所述原始视频进行预处理，得到与所述原始视频对应的第二目标图片集合；

通过卷积神经网络获取所述第一目标图片集合中每一目标图片对应的目标图片特征向量，以组成第一图片特征向量集合；

通过卷积神经网络获取所述第二目标图片集合中每一目标图片对应的目标图片特征向量，以组成第二图片特征向量集合；

获取所述第一图片特征向量集合中各图片特征向量与所述第二图片特征向量集合中对应图片特征向量的相似度，以得到所述待比对视频与所述原始视频的平均相似度；以及

将所述待比对视频与所述原始视频的平均相似度发送至上传端。

第二方面，本申请实施例提供了一种视频相似度获取装置，其包括：

视频接收单元，用于接收上传端所上传的待比对视频，获取与所述待比对视频对应的原始视频；

视频拆分单元，用于将所述待对比视频及所述原始视频均进行视频拆分，得到与所述待对比视频对应的待对比图片集合，及与所述原始视频对应的原始图片集合；

第一图片集合获取单元，用于通过光流法对所述待比对视频进行预处理，得到与所述待比对视频对应的第一目标图片集合；

第二图片集合获取单元，用于通过光流法对所述原始视频进行预处理，得到与所述原始视频对应的第二目标图片集合；

第一提取单元，用于通过卷积神经网络获取所述第一目标图片集合中每一目标图片对应的目标图片特征向量，以组成第一图片特征向量集合；

第二提取单元，用于通过卷积神经网络获取所述第二目标图片集合中每一目标图片对应的目标图片特征向量，以组成第二图片特征向量集合；

平均相似度获取单元，用于获取所述第一图片特征向量集合中各图片特征向量与所述第二图片特征向量集合中对应图片特征向量的相似度，以得到所述待比对视频与所述原始视频的平均相似度；以及

平均相似度发送单元，用于将所述待比对视频与所述原始视频的平均相似度发送至上传端。

第三方面，本申请实施例又提供了一种计算机设备，其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述第一方面所述的视频相似度获取方法。

第四方面，本申请实施例还提供了一种计算机可读存储介质，其中所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的视频相似度获取方法。

本申请实施例提供了一种视频相似度获取方法、装置、计算机设备及存储介质。该方法实现了结合微表情识别技术和视频图像比对来判断视频之间的相似度，提高了视频之间的相似度的识别准确率。

附图说明

图1为本申请实施例提供的视频相似度获取方法的应用场景示意图；

图2为本申请实施例提供的视频相似度获取方法的流程示意图；

图3为本申请实施例提供的视频相似度获取方法的子流程示意图；

图4为本申请实施例提供的视频相似度获取方法的另一子流程示意图；

图5为本申请实施例提供的视频相似度获取装置的示意性框图；

图6为本申请实施例提供的视频相似度获取装置的子单元示意性框图；

图7为本申请实施例提供的视频相似度获取装置的另一子单元示意性框图；

图8为本申请实施例提供的计算机设备的示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参阅图1和图2，图1为本申请实施例提供的视频相似度获取方法的应用场景示意图；图2为本申请实施例提供的视频相似度获取方法的流程示意图，该视频相似度获取方法应用于服务器中，该方法通过安装于服务器中的应用软件进行执行。

如图2所示，该方法包括步骤S110～S180。

S110、接收上传端所上传的待比对视频，获取与所述待比对视频对应的原始视频。

在本实施例中，为了判断用户通过上传端(上传端为用户使用的智能终端，如智能手机、平板电脑等)上传至服务器的待比对视频，与服务器中存储的所述待比对视频对应的原始视频的相似度时，可以是用户先选定了服务器中的某一原始视频后，获取该原始视频在服务器中对应的存储路径，当用户通过上传端拍摄视频获取了待比对视频后上传至服务器中的缓存区域，根据该原始视频的存储路径获取该原始视频，之后进行一系列视频数据处理，分析两个视频之间的相似度。

在一实施例中，步骤S110中获取与所述待比对视频对应的原始视频，包括：

根据所述待对比视频对应的存储路径在服务器中获取对应的原始视频。

在本实施例中，当上传端上传所述待对比视频至服务器时，用户在上传端的用户交互界面(该用户交互界面为服务器与上传端进行通讯的媒介)上先选定原始视频，再选定原始视频之后，服务器即可判断该原始视频的存储路径，服务器将存储路径发送至上传端，上传端所获取的待比对视频在服务器中的默认存储路径即为原始视频的存储路径。一旦上传端上传所述待对比视频至服务器后，服务器即可根据待比对视频在服务器中的默认存储路径获取对应的原始视频。通过这一方式，用户在上传待对比视频之前就选定了与之比对的原始视频，将待对比视频与原始视频存储在服务器中的同一存储路径，便于同一数据分区的数据进行快速比对，无需跨区迁移数据。

S120、将所述待对比视频及所述原始视频均进行视频拆分，得到与所述待对比视频对应的待对比图片集合，及与所述原始视频对应的原始图片集合。

在本实施例中，在比对所述待对比视频及所述原始视频时，需要将所述待对比视频及所述原始视频均进行视频拆分。由于视频的本质是在单位时间内播放一定数量的图片，例如在1秒内播放24-30张连续的图片，此时为了对比所述待对比视频及所述原始视频的相似程度，可以先将两者分别进行拆分，得到与所述待对比视频对应的待对比图片集合，及与所述原始视频对应的原始图片集合。在将所述待对比视频及所述原始视频均进行拆分时，采用常用的一些视频拆分工具即可，且将每一秒的视频拆分为24帧图片。

S130、通过光流法对所述待比对视频进行预处理，得到与所述待比对视频对应的第一目标图片集合。

在本实施例中，当服务器获取了上传端所上传的待比对视频后，需对其进行微表情分析。具体实施时，可以通过光流法进行微表情分析以得到所述待比对视频对应的第一目标图片集合。

在一实施例中，如图3所示，步骤S130包括：

S131、获取所述待比对视频中各帧图片的各像素点对应的速度矢量特征；

S132、若所述待比对视频中存在至少一帧图片的所述速度矢量特征未保持连续变化，将对应图片组成所述待比对视频中的第一目标图片集合。

在本实施例中，当人的眼睛观察运动物体时，物体的景象在人眼的视网膜上形成一系列连续变化的图像，这一系列连续变化的信息不断“流过”视网膜(即图像平面)，好像是一种光的“流”，故称之为光流。光流表达图像的变化，包含目标运动的信息，可用来确定目标的运动。光流三个要素：一是运动速度场,这是形成光流的必要条件；二是带光学特征的部分例如有灰度的象素点，它可以携带运动信息；三是成像投影从场景到图像平面，因而能被观察到。

定义光流以点为基础，具体来说，设(u,v)为图像点(x,y)的光流，则把(x,y,u,v)称为光流点。所有光流点的集合称为光流场。当带光学特性的物体在三维空间运动时，在图像平面上就形成了相应的图像运动场，或称为图像速度场。在理想情况下，光流场对应于运动场。

给图像中的每个像素点赋予一个速度矢量，这样就形成了一个运动矢量场。根据各个像素点的速度矢量特征，可以对图像进行动态分析。如果图像中没有运动目标，则光流矢量在整个图像区域是连续变化的。当图像中有运动物体时(当用户有微表情时，脸部会有运动，相当于运动物体)，目标和背景存在着相对运动。运动物体所形成的速度矢量必然和背景的速度矢量有所不同，如此便可以计算出运动物体的位置。通过光流法进行预处理，即可得到与所述待比对视频对应的第一目标图片集合。

S140、通过光流法对所述原始视频进行预处理，得到与所述原始视频对应的第二目标图片集合。

在本实施例中，在通过光流法对所述原始视频进行预处理时，其过程与通过光流法对所述待比对视频进行预处理相同，通过光流法进行预处理，即可得到与所述原始视频对应的第二目标图片集合。其中，所述第一目标图片集合中所包括图片的第一总张数不超过所述二目标图片集合中所包括图片的第二总张数，一般是所述第一目标图片集合中所包括图片的第一总张数等于所述二目标图片集合中所包括图片的第二总张数。

S150、通过卷积神经网络获取所述第一目标图片集合中每一目标图片对应的目标图片特征向量，以组成第一图片特征向量集合。

在本实施例中，当分别获取了第一目标图片集合和第二目标图片集合后，此时需对比第一目标图片集合中每张图片与第二目标图片集合中对应图片的相似度。此时，可通过卷积神经网络获取所述第一目标图片集合中每一目标图片对应的目标图片特征向量，以所述第一目标图片集合中每一目标图片对应的目标图片特征向量作为向量数据量分析与与第二目标图片集合中对应图片的相似度。

在一实施例中，如图4所示，步骤S150包括：

S151、将所述第一目标图片集合中每一目标图片进行预处理，得到与各目标图片对应的预处理后图片，及与每一预处理后图片对应的图片像素矩阵；其中，将目标图片进行预处理为依序对所述目标图片进行灰度化、边缘检测和二值化处理；

S152、将与各预处理后图片对应的图片像素矩阵输入至卷积神经网络模型中输入层，得到与各预处理后图片对应的特征图；

S153、将各特征图输入至卷积神经网络模型中池化层，得到与各特征图对应的一维向量；

S154、将与各特征图对应的一维向量输入至卷积神经网络模型中全连接层，得到与各特征图对应的目标图片特征向量，以组成第一图片特征向量集合。

在本实施例中，对所述第一目标图片集合中每一目标图片依次进行灰度化、边缘检测和二值化处理，即可得到与各目标图片对应的预处理后图片，及与每一预处理后图片对应的图片像素矩阵。

由于彩色图像包含更多的信息，但是直接对彩色图像进行处理，服务器中的执行速度将会降低，储存空间也会变大。彩色图像的灰度化是图像处理的一种基本的方法，在模式识别领域得到广泛的运用，合理的灰度化将对图像信息的提取和后续处理有很大的帮助，能够节省储存空间，加快处理速度。

边缘检测的方法是考察图像的像素在某个领域内灰度的变化情况，标识数字图像中亮度变化明显的点。图像的边缘检测能够大幅度地减少数据量，并且剔除不相关的信息，保存图像重要的结构属性。用于边缘检测的算子很多，常用的除了有Sobel算子(即索贝尔算子)，还有Laplacian边缘检测算子(即拉普拉斯边缘检测算子)、Canny边缘检测算子(即坎尼算子)等。

为了减少噪声的影响，需要对进行边缘检测后的图像进行二值化处理，二值化是对图像进行阈值化的一种类型。根据阈值的选取情况，二值化的方法可分为全局阈值法、动态阈值法和局部阈值法，常用最大类间方差法(也称Otsu算法)进行阈值化，来剔除一些梯度值较小的像素，二值化处理后图像的像素值为0或者255。此时，即可得到与各目标图片对应的预处理后图片，及与每一预处理后图片对应的图片像素矩阵。

在获取目标图片的目标图片特征向量时，先获取与预处理后图片对应的图片像素矩阵，然后将预处理后图片对应的图片像素矩阵作为卷积神经网络模型中输入层的输入，得到特征图，之后将特征图输入池化层，得到特征图对应的最大值所对应的一维向量，最后将特征图对应的最大值所对应的一维向量输入至全连接层，得到与预处理后图片对应的目标图片特征向量。由于所述第一目标图片集合中每一目标图片均获取了对应的目标图片特征向量，即可组成第一图片特征向量集合。

S160、通过卷积神经网络获取所述第二目标图片集合中每一目标图片对应的目标图片特征向量，以组成第二图片特征向量集合。

在本实施例中，在通过卷积神经网络获取与所述第二目标图片集合中每一目标图片对应的目标图片特征向量时，其过程与通过卷积神经网络获取与所述第一目标图片集合中每一目标图片对应的目标图片特征向量相同。由于所述第二目标图片集合中每一目标图片均获取了对应的目标图片特征向量，即可组成第二图片特征向量集合。

S170、获取所述第一图片特征向量集合中各图片特征向量与所述第二图片特征向量集合中对应图片特征向量的相似度，以得到所述待比对视频与所述原始视频的平均相似度。

在本实施例中，一般由于待对比视频为原始视频的模仿视频，一般大的肢体动作是较为类似的，为了更精细的通过微表情来判断待对比视频与原始视频的相似度，可分别获取第一图片特征向量集合和第二图片特征向量集合，然后获取所述第一图片特征向量集合中各图片特征向量与所述第二图片特征向量集合中对应图片特征向量的相似度，以得到所述待比对视频与所述原始视频的平均相似度。

在一实施例中，步骤S170包括：

获取所述第一图片特征向量集合中各图片特征向量与所述第二图片特征向量集合中对应图片特征向量的欧氏距离后求平均欧氏距离值，以所述平均欧氏距离值作为所述第一图片特征向量集合与所述第二图片特征向量集合之间的相似度。

例如，第一图片特征向量集合中包括10个图片特征向量，分别记为a1-a10；第二图片特征向量集合中同样也包括10个图片特征向量，分别记为b1-b10；此时计算a1与b1之间的欧氏距离以作为a1与b1之间的第一相似度，计算a2与b2之间的欧氏距离以作为a2与b2之间的第二相似度，……，计算a10与b10之间的欧氏距离以作为a10与b10之间的第十相似度，此时获取第一相似度至第十相似度的平均值作为所述待比对视频与所述原始视频的平均相似度，通过这一运算方式能获取两相似视频之间根据微表情相似度而评判的具体相似度，这比通过肉眼评判能更精准判断的视频相似度。

S180、将所述待比对视频与所述原始视频的平均相似度发送至上传端。

在本实施例中，当在服务器中完成了所述待比对视频与所述原始视频的平均相似度的计算后，以所述待比对视频与所述原始视频的平均相似度作为视频相似度的评分发送至上传端，从而实现对上传端的评分通知。

在一实施例中，步骤S180之后还包括：

S190、若所述待比对视频对应的原创者引用信息与所述原始视频的原创者信息不相同，发送更正所述待比对视频对应的原创者引用信息的通知信息至上传端。

在本实施例中，当用户上传了待对比视频至服务器时，一般还需对待对比视频的原创者引用信息进行编辑，以表示用户所拍摄的待对比视频是模仿原始视频的，从而明确引用关系。一旦服务器检测到所述待比对视频对应的原创者引用信息与所述原始视频的原创者信息不相同，则表示用户并未正确编辑原创者引用信息可能会导致后期的法律风险，此时发送更正所述待比对视频对应的原创者引用信息的通知信息至上传端以告知用户及时修改原创者引用信息，从而有效规避后期的法律风险。

该方法实现了结合微表情识别技术和视频图像比对来判断视频之间的相似度，提高了视频之间的相似度的识别准确率。

本申请实施例还提供一种视频相似度获取装置，该视频相似度获取装置用于执行前述视频相似度获取方法的任一实施例。具体地，请参阅图5，图5是本申请实施例提供的视频相似度获取装置的示意性框图。该视频相似度获取装置100可以配置于服务器中。

如图5所示，视频相似度获取装置100包括视频接收单元110、视频拆分单元120、第一图片集合获取单元130、第二图片集合获取单元140、第一提取单元150、第二提取单元160、平均相似度获取单元170、平均相似度发送单元180。

视频接收单元110，用于接收上传端所上传的待比对视频，获取与所述待比对视频对应的原始视频。

在一实施例中，视频接收单元110还用于：

视频拆分单元120，用于将所述待对比视频及所述原始视频均进行视频拆分，得到与所述待对比视频对应的待对比图片集合，及与所述原始视频对应的原始图片集合。

第一图片集合获取单元130，用于通过光流法对所述待比对视频进行预处理，得到与所述待比对视频对应的第一目标图片集合。

在一实施例中，如图6所示，第一图片集合获取单元130包括：

矢量特征获取单元131，用于获取所述待比对视频中各帧图片的各像素点对应的速度矢量特征；

第一目标图片集合获取单元132，用于若所述待比对视频中存在至少一帧图片的所述速度矢量特征未保持连续变化，将对应图片组成所述待比对视频中的第一目标图片集合。

第二图片集合获取单元140，用于通过光流法对所述原始视频进行预处理，得到与所述原始视频对应的第二目标图片集合。

第一提取单元150，用于通过卷积神经网络获取所述第一目标图片集合中每一目标图片对应的目标图片特征向量，以组成第一图片特征向量集合。

在一实施例中，如图7所示，第一提取单元150包括：

预处理单元151，用于将所述第一目标图片集合中每一目标图片进行预处理，得到与各目标图片对应的预处理后图片，及与每一预处理后图片对应的图片像素矩阵；其中，将目标图片进行预处理为依序对所述目标图片进行灰度化、边缘检测和二值化处理；

卷积单元152，用于将与各预处理后图片对应的图片像素矩阵输入至卷积神经网络模型中输入层，得到与各预处理后图片对应的特征图；

池化单元153，用于将各特征图输入至卷积神经网络模型中池化层，得到与各特征图对应的一维向量；

全连接单元154，用于将与各特征图对应的一维向量输入至卷积神经网络模型中全连接层，得到与各特征图对应的目标图片特征向量，以组成第一图片特征向量集合。

第二提取单元160，用于通过卷积神经网络获取所述第二目标图片集合中每一目标图片对应的目标图片特征向量，以组成第二图片特征向量集合。

平均相似度获取单元170，用于获取所述第一图片特征向量集合中各图片特征向量与所述第二图片特征向量集合中对应图片特征向量的相似度，以得到所述待比对视频与所述原始视频的平均相似度。

在一实施例中，平均相似度获取单元170还用于：

平均相似度发送单元180，用于将所述待比对视频与所述原始视频的平均相似度发送至上传端。

在一实施例中，视频相似度获取装置100还包括：

原创信息比对单元190，用于若所述待比对视频对应的原创者引用信息与所述原始视频的原创者信息不相同，发送更正所述待比对视频对应的原创者引用信息的通知信息至上传端。

该装置实现了结合微表情识别技术和视频图像比对来判断视频之间的相似度，提高了视频之间的相似度的识别准确率。

上述视频相似度获取装置可以实现为计算机程序的形式，该计算机程序可以在如图8所示的计算机设备上运行。

请参阅图8，图8是本申请实施例提供的计算机设备的示意性框图。该计算机设备500 是服务器，服务器可以是独立的服务器，也可以是多个服务器组成的服务器集群。

参阅图8，该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505，其中，存储器可以包括非易失性存储介质503和内存储器504。

该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时，可使得处理器502执行视频相似度获取方法。

该处理器502用于提供计算和控制能力，支撑整个计算机设备500的运行。

该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境，该计算机程序5032被处理器502执行时，可使得处理器502执行视频相似度获取方法。

该网络接口505用于进行网络通信，如提供数据信息的传输等。本领域技术人员可以理解，图8中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备500的限定，具体的计算机设备500可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器502用于运行存储在存储器中的计算机程序5032，以实现本申请实施例公开的视频相似度获取装置。

本领域技术人员可以理解，图8中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定，在其他实施例中，计算机设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。例如，在一些实施例中，计算机设备可以仅包括存储器及处理器，在这样的实施例中，存储器及处理器的结构及功能与图8所示实施例一致，在此不再赘述。

应当理解，在本申请实施例中，处理器502可以是中央处理单元(Central Processing Unit，CPU)，该处理器502还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

在本申请的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质，也可以为易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序，其中计算机程序被处理器执行时实现本申请实施例公开的视频相似度获取方法。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的设备、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为逻辑功能划分，实际实现时可以有另外的划分方式，也可以将具有相同功能的单元集合成一个单元，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

一种视频相似度获取方法，其中，包括：

接收上传端所上传的待比对视频，获取与所述待比对视频对应的原始视频；

将所述待对比视频及所述原始视频均进行视频拆分，得到与所述待对比视频对应的待对比图片集合，及与所述原始视频对应的原始图片集合；

通过光流法对所述待比对视频进行预处理，得到与所述待比对视频对应的第一目标图片集合；

通过光流法对所述原始视频进行预处理，得到与所述原始视频对应的第二目标图片集合；

通过卷积神经网络获取所述第一目标图片集合中每一目标图片对应的目标图片特征向量，以组成第一图片特征向量集合；

通过卷积神经网络获取所述第二目标图片集合中每一目标图片对应的目标图片特征向量，以组成第二图片特征向量集合；

获取所述第一图片特征向量集合中各图片特征向量与所述第二图片特征向量集合中对应图片特征向量的相似度，以得到所述待比对视频与所述原始视频的平均相似度；以及

将所述待比对视频与所述原始视频的平均相似度发送至上传端。
根据权利要求1所述的视频相似度获取方法，其中，所述获取与所述待比对视频对应的原始视频，包括：

根据所述待对比视频对应的存储路径在服务器中获取对应的原始视频。
根据权利要求1所述的视频相似度获取方法，其中，所述通过光流法对所述待比对视频进行预处理，得到与所述待比对视频对应的第一目标图片集合，包括：

获取所述待比对视频中各帧图片的各像素点对应的速度矢量特征；

若所述待比对视频中存在至少一帧图片的所述速度矢量特征未保持连续变化，将对应图片组成所述待比对视频中的第一目标图片集合。
根据权利要求1所述的视频相似度获取方法，其中，所述通过卷积神经网络获取所述第一目标图片集合中每一目标图片对应的目标图片特征向量，以组成第一图片特征向量集合，包括：

将所述第一目标图片集合中每一目标图片进行预处理，得到与各目标图片对应的预处理后图片，及与每一预处理后图片对应的图片像素矩阵；其中，将目标图片进行预处理为依序对所述目标图片进行灰度化、边缘检测和二值化处理；

将与各预处理后图片对应的图片像素矩阵输入至卷积神经网络模型中输入层，得到与各预处理后图片对应的特征图；

将各特征图输入至卷积神经网络模型中池化层，得到与各特征图对应的一维向量；

将与各特征图对应的一维向量输入至卷积神经网络模型中全连接层，得到与各特征图对应的目标图片特征向量，以组成第一图片特征向量集合。
根据权利要求1所述的视频相似度获取方法，其中，所述获取所述第一图片特征向量集合中各图片特征向量与所述第二图片特征向量集合中对应图片特征向量的相似度，包括：

获取所述第一图片特征向量集合中各图片特征向量与所述第二图片特征向量集合中对应图片特征向量的欧氏距离后求平均欧氏距离值，以所述平均欧氏距离值作为所述第一图片特征向量集合与所述第二图片特征向量集合之间的相似度。
根据权利要求1所述的视频相似度获取方法，其中，所述将所述待比对视频与所述原始视频的平均相似度发送至上传端之后，还包括：

若所述待比对视频对应的原创者引用信息与所述原始视频的原创者信息不相同，发送更正所述待比对视频对应的原创者引用信息的通知信息至上传端。
一种视频相似度获取装置，其中，包括：

视频接收单元，用于接收上传端所上传的待比对视频，获取与所述待比对视频对应的原始视频；

视频拆分单元，用于将所述待对比视频及所述原始视频均进行视频拆分，得到与所述待对比视频对应的待对比图片集合，及与所述原始视频对应的原始图片集合；

第一图片集合获取单元，用于通过光流法对所述待比对视频进行预处理，得到与所述待比对视频对应的第一目标图片集合；

第二图片集合获取单元，用于通过光流法对所述原始视频进行预处理，得到与所述原始视频对应的第二目标图片集合；

第一提取单元，用于通过卷积神经网络获取所述第一目标图片集合中每一目标图片对应的目标图片特征向量，以组成第一图片特征向量集合；

第二提取单元，用于通过卷积神经网络获取所述第二目标图片集合中每一目标图片对应的目标图片特征向量，以组成第二图片特征向量集合；

平均相似度获取单元，用于获取所述第一图片特征向量集合中各图片特征向量与所述第二图片特征向量集合中对应图片特征向量的相似度，以得到所述待比对视频与所述原始视频的平均相似度；以及

平均相似度发送单元，用于将所述待比对视频与所述原始视频的平均相似度发送至上传端。
根据权利要求7所述的视频相似度获取装置，其中，所述第一图片集合获取单元，包括：

矢量特征获取单元，用于获取所述待比对视频中各帧图片的各像素点对应的速度矢量特征；

第一目标图片集合获取单元，用于若所述待比对视频中存在至少一帧图片的所述速度矢量特征未保持连续变化，将对应图片组成所述待比对视频中的第一目标图片集合。
一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其中，所述处理器执行所述计算机程序时实现如下步骤：

接收上传端所上传的待比对视频，获取与所述待比对视频对应的原始视频；

将所述待对比视频及所述原始视频均进行视频拆分，得到与所述待对比视频对应的待对比图片集合，及与所述原始视频对应的原始图片集合；

通过光流法对所述待比对视频进行预处理，得到与所述待比对视频对应的第一目标图片集合；

通过光流法对所述原始视频进行预处理，得到与所述原始视频对应的第二目标图片集合；

通过卷积神经网络获取所述第一目标图片集合中每一目标图片对应的目标图片特征向量，以组成第一图片特征向量集合；

通过卷积神经网络获取所述第二目标图片集合中每一目标图片对应的目标图片特征向量，以组成第二图片特征向量集合；

获取所述第一图片特征向量集合中各图片特征向量与所述第二图片特征向量集合中对应图片特征向量的相似度，以得到所述待比对视频与所述原始视频的平均相似度；以及

将所述待比对视频与所述原始视频的平均相似度发送至上传端。
如权利要求9所述的计算机设备，其中，所述处理器执行所述计算机程序时实现所述获取与所述待比对视频对应的原始视频的步骤，包括：

根据所述待对比视频对应的存储路径在服务器中获取对应的原始视频。
如权利要求9所述的计算机设备，其中，所述处理器执行所述计算机程序时实现所述通过光流法对所述待比对视频进行预处理，得到与所述待比对视频对应的第一目标图片集合的步骤，包括：

获取所述待比对视频中各帧图片的各像素点对应的速度矢量特征；

若所述待比对视频中存在至少一帧图片的所述速度矢量特征未保持连续变化，将对应图片组成所述待比对视频中的第一目标图片集合。
如权利要求9所述的计算机设备，其中，所述处理器执行所述计算机程序时实现所述通过卷积神经网络获取所述第一目标图片集合中每一目标图片对应的目标图片特征向量，以组成第一图片特征向量集合的步骤，包括：

将所述第一目标图片集合中每一目标图片进行预处理，得到与各目标图片对应的预处理后图片，及与每一预处理后图片对应的图片像素矩阵；其中，将目标图片进行预处理为依序对所述目标图片进行灰度化、边缘检测和二值化处理；

将与各预处理后图片对应的图片像素矩阵输入至卷积神经网络模型中输入层，得到与各预处理后图片对应的特征图；

将各特征图输入至卷积神经网络模型中池化层，得到与各特征图对应的一维向量；

将与各特征图对应的一维向量输入至卷积神经网络模型中全连接层，得到与各特征图对应的目标图片特征向量，以组成第一图片特征向量集合。
如权利要求9所述的计算机设备，其中，所述处理器执行所述计算机程序时实现所述获取所述第一图片特征向量集合中各图片特征向量与所述第二图片特征向量集合中对应图片特征向量的相似度的步骤，包括：

获取所述第一图片特征向量集合中各图片特征向量与所述第二图片特征向量集合中对应图片特征向量的欧氏距离后求平均欧氏距离值，以所述平均欧氏距离值作为所述第一图片特征向量集合与所述第二图片特征向量集合之间的相似度。
如权利要求9所述的计算机设备，其中，所述处理器执行所述计算机程序时实现所述将所述待比对视频与所述原始视频的平均相似度发送至上传端的步骤之后，还用于实现如下步骤：

若所述待比对视频对应的原创者引用信息与所述原始视频的原创者信息不相同，发送更正所述待比对视频对应的原创者引用信息的通知信息至上传端。
一种计算机可读存储介质，其中，所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行如下步骤：

接收上传端所上传的待比对视频，获取与所述待比对视频对应的原始视频；

将所述待对比视频及所述原始视频均进行视频拆分，得到与所述待对比视频对应的待对比图片集合，及与所述原始视频对应的原始图片集合；

通过光流法对所述待比对视频进行预处理，得到与所述待比对视频对应的第一目标图片集合；

通过光流法对所述原始视频进行预处理，得到与所述原始视频对应的第二目标图片集合；

通过卷积神经网络获取所述第一目标图片集合中每一目标图片对应的目标图片特征向量，以组成第一图片特征向量集合；

通过卷积神经网络获取所述第二目标图片集合中每一目标图片对应的目标图片特征向量，以组成第二图片特征向量集合；

获取所述第一图片特征向量集合中各图片特征向量与所述第二图片特征向量集合中对应图片特征向量的相似度，以得到所述待比对视频与所述原始视频的平均相似度；以及

将所述待比对视频与所述原始视频的平均相似度发送至上传端。
如权利要求15所述的存储介质，其中，所述计算机程序当被处理器执行时使所述处理器执行所述获取与所述待比对视频对应的原始视频的步骤，包括：

根据所述待对比视频对应的存储路径在服务器中获取对应的原始视频。
如权利要求15所述的存储介质，其中，所述计算机程序当被处理器执行时使所述处理器执行所述通过光流法对所述待比对视频进行预处理，得到与所述待比对视频对应的第一目标图片集合的步骤，包括：

获取所述待比对视频中各帧图片的各像素点对应的速度矢量特征；

若所述待比对视频中存在至少一帧图片的所述速度矢量特征未保持连续变化，将对应图片组成所述待比对视频中的第一目标图片集合。
如权利要求15所述的存储介质，其中，所述通过卷积神经网络获取所述第一目标图片集合中每一目标图片对应的目标图片特征向量，以组成第一图片特征向量集合的步骤，包括：

将所述第一目标图片集合中每一目标图片进行预处理，得到与各目标图片对应的预处理后图片，及与每一预处理后图片对应的图片像素矩阵；其中，将目标图片进行预处理为依序对所述目标图片进行灰度化、边缘检测和二值化处理；

将与各预处理后图片对应的图片像素矩阵输入至卷积神经网络模型中输入层，得到与各预处理后图片对应的特征图；

将各特征图输入至卷积神经网络模型中池化层，得到与各特征图对应的一维向量；

将与各特征图对应的一维向量输入至卷积神经网络模型中全连接层，得到与各特征图对应的目标图片特征向量，以组成第一图片特征向量集合。
如权利要求15所述的存储介质，其中，所述计算机程序当被处理器执行时使所述处理器执行所述获取所述第一图片特征向量集合中各图片特征向量与所述第二图片特征向量集合中对应图片特征向量的相似度的步骤，包括：

获取所述第一图片特征向量集合中各图片特征向量与所述第二图片特征向量集合中对应图片特征向量的欧氏距离后求平均欧氏距离值，以所述平均欧氏距离值作为所述第一图片特征向量集合与所述第二图片特征向量集合之间的相似度。
如权利要求15所述的存储介质，其中，所述计算机程序当被处理器执行时使所述处理器执行所述将所述待比对视频与所述原始视频的平均相似度发送至上传端的步骤之后，还用于执行如下步骤：

若所述待比对视频对应的原创者引用信息与所述原始视频的原创者信息不相同，发送更正所述待比对视频对应的原创者引用信息的通知信息至上传端。