CN103177099A

CN103177099A - 视频比对方法及系统

Info

Publication number: CN103177099A
Application number: CN2013100902608A
Authority: CN
Inventors: 朱定局
Original assignee: Shenzhen Institute of Advanced Technology of CAS
Current assignee: Shenzhen Hongzhituoxin Venture Capital Enterprise LP
Priority date: 2013-03-20
Filing date: 2013-03-20
Publication date: 2013-06-26
Anticipated expiration: 2033-03-20
Also published as: CN103177099B

Abstract

本发明公开了一种视频比对方法，包括：获取需要判别相似度的第一和第二视频；以第一划分粒度将第一和第二视频分别分割成若干视频片段，计算第一划分粒度下第一与第二视频中相同的视频片段数量占第一视频的视频片段总数的比例；自第一和第二视频中删除相同的视频片段，分别得到第一剩余视频和第二剩余视频；以第二划分粒度将第一和第二剩余视频分别分割成若干视频片段，计算第二划分粒度下第一与第二剩余视频中相同的视频片段数量占第一剩余视频的视频片段总数的比例；计算第一视频与第二视频的综合相似度。本发明能够较为准确反映被人为打乱了帧序、镜头序、场景序的视频之间的相似程度，将这些被故意打乱了顺序的相似视频检测出来。

Description

视频比对方法及系统

技术领域

本发明涉及电数字数据处理，特别是涉及一种视频比对方法，还涉及一种视频比对系统。

背景技术

现有技术中判断两个视频的相似度，一般是通过将两个视频进行分帧，然后按照顺序判断两个视频中重复的帧镜头串。

但如果视频中帧镜头的顺序被故意打乱了，那么即使实质上是相似的（例如抄袭的）视频之间，按照现有的相似度统计方式得到的相似度较低，无法反映其本身的相似程度。

发明内容

基于此，为了解决传统的视频相似度统计方法难以准确反映被人为打乱了帧序、镜头序、场景序的视频之间的相似程度的问题，有必要提供一种能够较为准确反映被人为打乱了帧序、镜头序、场景序的视频之间的相似程度的视频比对方法。

一种视频比对方法，包括：获取需要判别相似度的第一视频和第二视频；以第一划分粒度将所述第一视频和第二视频分别分割成若干视频片段，将第一划分粒度下第一视频中全部的视频片段与第二视频中全部的视频片段进行比较，计算第一划分粒度下第一视频与第二视频中相同的视频片段数量占第一视频的视频片段总数的比例x1；自第一视频和第二视频中删除相同的视频片段，分别得到第一剩余视频和第二剩余视频；以第二划分粒度将第一剩余视频和第二剩余视频分别分割成若干视频片段，将第二划分粒度下第一剩余视频中全部的视频片段与第二视频中全部的视频片段进行比较，计算第二划分粒度下第一剩余视频与第二剩余视频中相同的视频片段数量占第一剩余视频的视频片段总数的比例y1；所述第二划分粒度比第一划分粒度小；将x1乘以第一划分粒度在综合相似度中的权重，得到第一划分粒度的相似度，用一减去第一划分粒度的相似度后再乘以y1、接着加上第一划分粒度的相似度，以计算第一视频与第二视频的综合相似度。

在其中一个实施例中，所述以第一划分粒度将所述第一视频和第二视频分别分割成若干视频片段的步骤，是将所述第一视频和第二视频分别分割成若干场景；所述以第二划分粒度将第一剩余视频和第二剩余视频分别分割成若干视频片段的步骤，是将所述第一剩余视频和第二剩余视频分别分割成若干帧。

在其中一个实施例中，所述以第一划分粒度将所述第一视频和第二视频分别分割成若干视频片段的步骤，是将所述第一视频和第二视频分别分割成若干镜头；所述以第二划分粒度将第一剩余视频和第二剩余视频分别分割成若干视频片段的步骤，是将所述第一剩余视频和第二剩余视频分别分割成若干帧。

在其中一个实施例中，所述以第一划分粒度将所述第一视频和第二视频分别分割成若干视频片段的步骤，是将所述第一视频和第二视频分别分割成若干场景；所述以第二划分粒度将第一剩余视频和第二剩余视频分别分割成若干视频片段的步骤，是将所述第一剩余视频和第二剩余视频分别分割成若干镜头；

所述视频比对方法还包括自第一剩余视频和第二剩余视频中删除相同的镜头，分别得到视频T5和视频T6，将视频T5和视频T6分别分割成若干帧，将视频T5中全部的帧和视频T6中全部的帧进行比较，计算视频T5和视频T6中相同的帧占视频T5中帧总数的比例z1的步骤；所述计算第一视频与第二视频的综合相似度的步骤，是通过如下公式进行计算：综合相似度M1=x1*c1+(1-x1*c1)[y1*c2+(1-y1*c2)z1]；其中c1为场景粒度在综合相似度中的权重，c2为镜头粒度在综合相似度中的权重。

在其中一个实施例中，还包括判断所述第一视频与第二视频的综合相似度是否大于相似度阈值，若是，则判定所述第一视频与第二视频相似的步骤。

在其中一个实施例中，还包括下列步骤：计算第一划分粒度下第一视频与第二视频中相同的视频片段数量占第二视频的视频片段总数的比例x2；计算第二划分粒度下第一剩余视频与第二剩余视频中相同的视频片段数量占第二剩余视频的视频片段总数的比例y2；将x2乘以第一划分粒度在综合相似度中的权重，得到第一划分粒度的相似度，用一减去第一划分粒度的相似度后再乘以y2、接着加上第一划分粒度的相似度，计算第二视频与第一视频的综合相似度；判断所述第一视频与第二视频的综合相似度是否大于相似度阈值，所述第二视频与第一视频的综合相似度是否大于所述相似度阈值，若二者有任意一个大于所述相似度阈值，则判定所述第一视频与第二视频相似。

同时提供一种视频比对系统，包括：读取模块，用于获取需要判别相似度的第一视频和第二视频；第一分割比较模块，用于以第一划分粒度将所述第一视频和第二视频分别分割成若干视频片段，将第一划分粒度下第一视频中全部的视频片段与第二视频中全部的视频片段进行比较，计算第一划分粒度下第一视频与第二视频中相同的视频片段数量占第一视频的视频片段总数的比例x1；第一删除模块，用于自第一视频和第二视频中删除相同的视频片段，分别得到第一剩余视频和第二剩余视频；分割比较模块，用于以第二划分粒度将第一剩余视频和第二剩余视频分别分割成若干视频片段，将第二划分粒度下第一剩余视频中全部的视频片段与第二视频中全部的视频片段进行比较，计算第二划分粒度下第一剩余视频与第二剩余视频中相同的视频片段数量占第一剩余视频的视频片段总数的比例y1；所述第二划分粒度比第一划分粒度小；综合相似度计算模块，用于将x1乘以第一划分粒度在综合相似度中的权重，得到第一划分粒度的相似度，用一减去第一划分粒度的相似度后再乘以y1、接着加上第一划分粒度的相似度，计算第一视频与第二视频的综合相似度。

在其中一个实施例中，还包括判断模块，用于判断所述第一视频与第二视频的综合相似度是否大于相似度阈值，若是，则判定所述第一视频与第二视频相似。

上述视频比对方法，采用多粒度的比对方法，先后以视频的场景、镜头、帧为粒度，对视频进行分割-比较-删除后来计算视频之间的综合相似度，使得被故意打乱了帧序、镜头序、场景序的相似视频也可以被检测出来，能够较为准确反映被人为打乱了帧序、镜头序、场景序的视频之间的相似程度。

附图说明

图1是实施例一中视频比对方法的流程图；

图2是实施例二中视频比对方法的流程图；

图3是实施例三中视频比对方法的流程图。

具体实施方式

为使本发明的目的、特征和优点能够更为明显易懂，下面结合附图对本发明的具体实施方式做详细的说明。

实施例一：

图1是一实施例中视频比对方法的流程图，包括下列步骤：

S110，获取需要判别相似度的视频T1和视频T2。

S120，将视频T1和视频T2分别分割成若干场景（scene），将视频T1中全部的场景与视频T2中全部的场景进行比较，将相同场景的数量记为k3。

其中，将视频分割成场景的算法可以采用现有技术。在本实施例中，将视频T1的场景数量记为k1，视频T2的场景数量记为k2。i从1到k1，j从1到k2，比较视频T1的第i个场景与视频T2的第j个场景是否相同，并将相同的场景的数量记为k3。

S130，自视频T1和视频T2中删除相同的场景，视频T1在删除后得到视频T3，视频T2在删除后得到视频T4。

将步骤S120比较后得出的相同的各场景从视频T1和视频T2中删除，分别得到视频T3和视频T4。删除后得到的视频T3与视频T4之间不存在相同的场景。

S140，将视频T3和视频T4分别分割成若干镜头（shot），将视频T3中全部的镜头与视频T4中全部的镜头进行比较，将相同镜头的数量记为k6。

其中，将视频分割成镜头的算法可以采用现有技术。在本实施例中，将视频T3的镜头数量记为k4，视频T4的镜头数量记为k5。i从1到k4，j从1到k5，比较视频T3的第i个镜头与视频T4的第j个镜头是否相同，并将相同的镜头的数量记为k6。

S150，自视频T3和视频T4中删除相同的镜头，视频T3在删除后得到视频T5，视频T4在删除后得到视频T6。

将步骤S140比较后得出的相同的各镜头从视频T3和视频T4中删除，分别得到视频T5和视频T6。删除后得到的视频T5和视频T6之间不存在相同的镜头。

S160，将视频T5和视频T6分别分割成若干帧（frame），将视频T5中全部的帧与视频T6中全部的帧进行比较，将相同帧的数量记为k9。

其中，将视频分割成帧的算法可以采用现有技术。在本实施例中，将视频T5的帧数量记为k7，视频T6的帧数量记为k8。i从1到k7，j从1到k8，比较视频T5的第i帧与视频T6的第j帧是否相同，并将相同的帧的数量记为k9。

S170，计算视频T1与视频T2的综合相似度，计算视频T2与视频T1的综合相似度。

视频T1与视频T2的综合相似度M1通过如下公式进行计算：

M1=k3/k1*c1+(1-k3/k1*c1)*[k6/k4*c2+(1-k6/k4*c2)*k9/k7]

视频T2与视频T1的综合相似度M2通过如下公式进行计算：

M2=k3/k2*c1+(1-k3/k2*c1)*[k6/k5*c2+(1-k6/k5*c2)*k9/k8]

其中c1为场景粒度在综合相似度中的权重，c2为镜头粒度在综合相似度中的权重。可以取合适的经验值（但需保证c1>0，1-k3/k1*c1>0，1-k3/k2*c1>0，c2>0，1-k6/k4*c2>0，1-k6/k5*c2>0），来调整不同划分粒度在综合相似度中所占的比重。

在其中一个实施例中，c1=c2=1，则视频T1与视频T2的综合相似度为：

M1=k3/k1+(1-k3/k1)*[k6/k4+(1-k6/k4)*k9/k7]

视频T2与视频T1的综合相似度为：

M2=k3/k2+(1-k3/k2)*[k6/k5+(1-k6/k5)*k9/k8]

其中，视频T1与视频T2的综合相似度不一定等于视频T2与视频T1的综合相似度。例如，视频T1是视频T2的一半，则视频T1可以完全从视频T2中找到，而视频T2只有一半能从视频T1的找到，这种情况下，显然视频T1与视频T2的综合相似度大于视频T2与视频T1的综合相似度。

在另一个实施例中，计算M1、M2可以采用不同的权重，即：

M1=k3/k1*c1+(1-k3/k1*c1)*[k6/k4*c2+(1-k6/k4*c2)*k9/k7]

M2=k3/k2*c3+(1-k3/k2*c3)*[k6/k5*c4+(1-k6/k5*c4)*k9/k8]

其中c1、c2、c3、c4是权重，可以取合适的经验值，且c1>0，c2>0，1-k3/k1*c1>0，1-k6/k4*c2>0，c3>0，c4>0，1-k3/k2*c3>0，1-k6/k5*c4>0。

在本实施例中，步骤S170后还包括步骤：

判断视频T1与视频T2的综合相似度是否大于相似度阈值θ，及视频T2与视频T1的综合相似度是否大于相似度阈值θ，若二者有任意一个大于相似度阈值θ，则判定视频T1与视频T2相似。相似度阈值θ可以是一个经验值，其取值与c1、c2有关。

在其它实施例中，也可以只计算一个综合相似度（例如视频T1与视频T2的综合相似度），并只判断该综合相似度是否大于相似度阈值θ。比如在两个视频中认定视频T1是有抄袭嫌疑的情况。

在其它实施例中，将需要判别相似度的两个视频分割成若干视频片段时采用的划分粒度，也可以不同于实施例一，例如是直接从场景到帧，或者是直接从镜头到帧，又或者采用除了场景、镜头、帧外其它的划分粒度。以下再分别给出两个对应的实施例：

实施例二：

S210，获取需要判别相似度的视频T1和视频T2。

S220，将视频T1和视频T2分别分割成若干场景，将视频T1中全部的场景与视频T2中全部的场景进行比较，将相同场景的数量记为k3。

在本实施例中，将视频T1的场景数量记为k1，视频T2的场景数量记为k2。i从1到k1，j从1到k2，比较视频T1的第i个场景与视频T2的第j个场景是否相同，并将相同的场景数量记为k3。

S230，自视频T1和视频T2中删除相同的场景，视频T1在删除后得到视频T3，视频T2在删除后得到视频T4。

S240，将视频T3和视频T4分别分割成若干帧，将视频T3中全部的帧与视频T4中全部的帧进行比较，将相同帧的数量记为k6。

在本实施例中，将视频T3的帧数量记为k4，视频T4的帧数量记为k5。i从1到k4，j从1到k5，比较视频T3的第i帧与视频T4的第j帧是否相同，并将相同的帧数量记为k6。

S250，计算视频T1与视频T2的综合相似度，计算视频T2与视频T1的综合相似度。

在本实施例中，视频T1与视频T2的综合相似度M1通过如下公式进行计算：

M1=k3/k1*c1+(1-k3/k1*c1)*k6/k4

视频T2与视频T1的综合相似度M2通过如下公式进行计算：

M2=k3/k2*c1+(1-k3/k2*c1)*k6/k5

其中c1为场景粒度在综合相似度中的权重，可以取合适的经验值，但需保证c1>0，1-k3/k1*c1>0，1-k3/k2*c1>0。

在本实施例中，步骤S250后还包括步骤：

判断视频T1与视频T2的综合相似度是否大于相似度阈值θ，及视频T2与视频T1的综合相似度是否大于相似度阈值θ，若二者有任意一个大于相似度阈值θ，则判定视频T1与视频T2相似。相似度阈值θ可以是一个经验值，其取值与c1有关。

在其它实施例中，也可以只计算一个综合相似度（例如视频T1与视频T2的综合相似度），并只判断该综合相似度是否大于相似度阈值θ。

实施例三：

S310，获取需要判别相似度的视频T1和视频T2。

S320，将视频T1和视频T2分别分割成若干镜头，将视频T1中全部的镜头与视频T2中全部的镜头进行比较，将相同镜头的数量记为k3。

在本实施例中，将视频T1的镜头数量记为k1，视频T2的镜头数量记为k2。i从1到k1，j从1到k2，比较视频T1的第i个镜头与视频T2的第j个镜头是否相同，并将相同的镜头数量记为k3。

S330，自视频T1和视频T2中删除相同的镜头，视频T1在删除后得到视频T3，视频T2在删除后得到视频T4。

S340，将视频T3和视频T4分别分割成若干帧，将视频T3中全部的帧与视频T4中全部的帧进行比较，将相同帧的数量记为k6。

S350，计算视频T1与视频T2的综合相似度，计算视频T2与视频T1的综合相似度。

M1=k3/k1*c1+(1-k3/k1*c1)*k6/k4

视频T2与视频T1的综合相似度M2通过如下公式进行计算：

M2=k3/k2*c1+(1-k3/k2*c1)*k6/k5

其中c1为镜头粒度在综合相似度中的权重，可以取合适的经验值，但需保证c1>0，1-k3/k1*c1>0，1-k3/k2*c1>0。

在本实施例中，步骤S350后还包括步骤：

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种视频比对方法，包括：

获取需要判别相似度的第一视频和第二视频；

以第一划分粒度将所述第一视频和第二视频分别分割成若干视频片段，将第一划分粒度下第一视频中全部的视频片段与第二视频中全部的视频片段进行比较，计算第一划分粒度下第一视频与第二视频中相同的视频片段数量占第一视频的视频片段总数的比例x1；

自第一视频和第二视频中删除相同的视频片段，分别得到第一剩余视频和第二剩余视频；

以第二划分粒度将第一剩余视频和第二剩余视频分别分割成若干视频片段，将第二划分粒度下第一剩余视频中全部的视频片段与第二视频中全部的视频片段进行比较，计算第二划分粒度下第一剩余视频与第二剩余视频中相同的视频片段数量占第一剩余视频的视频片段总数的比例y1；所述第二划分粒度比第一划分粒度小；

将x1乘以第一划分粒度在综合相似度中的权重，得到第一划分粒度的相似度，用一减去第一划分粒度的相似度后再乘以y1、接着加上第一划分粒度的相似度，以计算第一视频与第二视频的综合相似度。

2.根据权利要求1所述的视频比对方法，其特征在于，所述以第一划分粒度将所述第一视频和第二视频分别分割成若干视频片段的步骤，是将所述第一视频和第二视频分别分割成若干场景；所述以第二划分粒度将第一剩余视频和第二剩余视频分别分割成若干视频片段的步骤，是将所述第一剩余视频和第二剩余视频分别分割成若干帧。

3.根据权利要求1所述的视频比对方法，其特征在于，所述以第一划分粒度将所述第一视频和第二视频分别分割成若干视频片段的步骤，是将所述第一视频和第二视频分别分割成若干镜头；所述以第二划分粒度将第一剩余视频和第二剩余视频分别分割成若干视频片段的步骤，是将所述第一剩余视频和第二剩余视频分别分割成若干帧。

4.根据权利要求1所述的视频比对方法，其特征在于，所述以第一划分粒度将所述第一视频和第二视频分别分割成若干视频片段的步骤，是将所述第一视频和第二视频分别分割成若干场景；所述以第二划分粒度将第一剩余视频和第二剩余视频分别分割成若干视频片段的步骤，是将所述第一剩余视频和第二剩余视频分别分割成若干镜头；

所述视频比对方法还包括自第一剩余视频和第二剩余视频中删除相同的镜头，分别得到视频T5和视频T6，将视频T5和视频T6分别分割成若干帧，将视频T5中全部的帧和视频T6中全部的帧进行比较，计算视频T5和视频T6中相同的帧占视频T5中帧总数的比例z1的步骤；

所述计算第一视频与第二视频的综合相似度的步骤，是通过如下公式进行计算：综合相似度M1=x1*c1+(1-x1*c1)[y1*c2+(1-y1*c2)z1]；其中c1为场景粒度在综合相似度中的权重，c2为镜头粒度在综合相似度中的权重。

5.根据权利要求1-4中任意一项所述的视频比对方法，其特征在于，还包括判断所述第一视频与第二视频的综合相似度是否大于相似度阈值，若是，则判定所述第一视频与第二视频相似的步骤。

6.根据权利要求1-3中任意一项所述的视频比对方法，其特征在于，还包括下列步骤：

计算第一划分粒度下第一视频与第二视频中相同的视频片段数量占第二视频的视频片段总数的比例x2；

计算第二划分粒度下第一剩余视频与第二剩余视频中相同的视频片段数量占第二剩余视频的视频片段总数的比例y2；

将x2乘以第一划分粒度在综合相似度中的权重，得到第一划分粒度的相似度，用一减去第一划分粒度的相似度后再乘以y2、接着加上第一划分粒度的相似度，计算第二视频与第一视频的综合相似度；

判断所述第一视频与第二视频的综合相似度是否大于相似度阈值，所述第二视频与第一视频的综合相似度是否大于所述相似度阈值，若二者有任意一个大于所述相似度阈值，则判定所述第一视频与第二视频相似。

7.一种视频比对系统，其特征在于，包括：

读取模块，用于获取需要判别相似度的第一视频和第二视频；

第一分割比较模块，用于以第一划分粒度将所述第一视频和第二视频分别分割成若干视频片段，将第一划分粒度下第一视频中全部的视频片段与第二视频中全部的视频片段进行比较，计算第一划分粒度下第一视频与第二视频中相同的视频片段数量占第一视频的视频片段总数的比例x1；

第一删除模块，用于自第一视频和第二视频中删除相同的视频片段，分别得到第一剩余视频和第二剩余视频；

分割比较模块，用于以第二划分粒度将第一剩余视频和第二剩余视频分别分割成若干视频片段，将第二划分粒度下第一剩余视频中全部的视频片段与第二视频中全部的视频片段进行比较，计算第二划分粒度下第一剩余视频与第二剩余视频中相同的视频片段数量占第一剩余视频的视频片段总数的比例y1；所述第二划分粒度比第一划分粒度小；

综合相似度计算模块，用于将x1乘以第一划分粒度在综合相似度中的权重，得到第一划分粒度的相似度，用一减去第一划分粒度的相似度后再乘以y1、接着加上第一划分粒度的相似度，计算第一视频与第二视频的综合相似度。

8.根据权利要求7中所述的视频比对系统，其特征在于，还包括判断模块，用于判断所述第一视频与第二视频的综合相似度是否大于相似度阈值，若是，则判定所述第一视频与第二视频相似。