CN111507260B - 一种视频相似度快速检测方法及检测装置 - Google Patents
一种视频相似度快速检测方法及检测装置 Download PDFInfo
- Publication number
- CN111507260B CN111507260B CN202010304043.4A CN202010304043A CN111507260B CN 111507260 B CN111507260 B CN 111507260B CN 202010304043 A CN202010304043 A CN 202010304043A CN 111507260 B CN111507260 B CN 111507260B
- Authority
- CN
- China
- Prior art keywords
- fingerprint
- video
- frame
- key frame
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明公开了在大量视频中鉴别相似视频的快速检测方及检测装置,包括输入视频库中的所有视频文件,提取视频的关键帧;通过计算DCT值得到每一关键帧的指纹;将每一指纹平均分为d块且组合为g个组,建立倒排索引;输入需要检测的视频文件并计算其关键帧的指纹,同样分为n块g个组,查找包含与某组值完全相同的完整指纹;通过计算图像帧相似度,判定视频是否相似;若不相似,则视频数据库中不存在与输入视频相似的视频。本方法利用一种基于分块的快速比较算法,通过视频最基础的关键帧图像的相似度比较进而判断两个视频的相似度,能够实现大多数情况下的大量视频相似度快速检测。
Description
技术领域
本发明涉及视频相似识别技术领域,具体为一种视频相似度快速检测方法及检测装置。
背景技术
视频相似度的检测是视频侵权鉴别的重要手段。在知识产权相关法规中,未经原创作者允许直接传播或者复制修改视频后嵌在自己的视频中进行网络传播属于侵权行为,但是在互联网高度发达的今天,这种侵权行为却层出不穷,且一直没有合适、高效的检测方法。鉴别视频侵权问题的关键是检测两个视频的相似度。只要能够准确检测两段视频的相似度,则能有效支持侵权的鉴别。
现有的相似视频检测方法存在准确性不够、效率低的问题。例如,MD5计算法,能检测出直接转发的视频,但无法检测出篡改后的视频。最长公共子序列(LCS)算法能比较两个视频内嵌字幕的重复度,但仅限于有字幕的视频对比;基于标题、标签和描述内容的检测方式,需要大量的人工辅助才能完成;但由于每个人对视频的理解不同,产生的标签和描述也有所不同,导致最终的鉴别效果做不到客观一致。基于光流的视频复制移动伪造检测算法,虽然能够判断是否存在复制修改行为,但计算复杂度太大,效率太低。
发明内容
本发明所要实现的目的是:寻求一种计算复杂度低、效率高的检测方法,从而得到适应大规模视频量的快速检测方法。
本发明通过下述技术方案实现:
一种视频相似度快速检测方法,包括:
指纹集处理:
处理参考视频B得到对应于参考视频B的指纹集FB={fb1,...,fbj,…,fbn};处理检测视频A得到对应于检测视频A的指纹集FA={fa1,...,fai,…,fam};
指纹切块分组处理:
对指纹集FB和指纹集FA中的所有指纹做指纹切块分组处理,分别得到大小为n×g的分组指纹集合GB和大小为m×g的分组指纹集合GA;
建立倒排索引处理:
为分组指纹集合GB创建g个表,相同组合方式的元素存储在同一张表内,然后对该表内的每个元素建立倒排索引,指向包含它的完整指纹;
指纹比对处理:
从分组指纹集合GA中取一个元素C,并逐一在分组指纹集合GB的倒排索引中寻找与C值相等元素:若只存在一个相等的元素E,则直接计算对应指纹的汉明距离,若结果小于或等于H,则两指纹为相似指纹;若存在多个元素E,则选取汉明距离最小的作为相似指纹;若不存在,则跳到下一元素,继续比对;重复上述指纹比对处理,直至找到指纹集FA与指纹集FB中所有相似的指纹,定义相似的指纹对应的关键帧为相似关键帧,以此获得相似关键帧的个数;
相似判定处理:
根据相似关键帧个数计算相似度,设定相似度阈值T2,如果检测视频A和参考视频B的相似度SA,B大于等于阈值T2,则认为检测视频A与参考视频B相似;否则,则认为两视频不相似。
基于上述方案可以看出,本发明的构思是:基于对比视频最基础的图像特征,设计出一种基于分块的视频相似度快速检测方法,能大大提高对侵权视频的检测效率。
基于分块的构思,定义两个汉明距离在设定阈值H内的指纹为相似指纹,将一个视频指纹平均切为d个等长的块。根据抽屉原理(例如,把9个苹果放进10个抽屉里,至少有一个空抽屉),两个相似的指纹至少有(d-H)块是完全相等的,可以得出:有(d-H)块完全相等的两指纹有可能相似,但(d-H)块不完全相等的一定不可能相似,从而排除一些不可能相似的指纹。
对切分的d个指纹块随机取出(d-H)块,对这些指纹块形成的值构建倒排索引(从值即能找到包含该值的所有的完整指纹)。把被测视频的指纹同样切分、随机取出(d-H)块,去倒排索引里查找这些指纹块形成的值是否存在:存在即说明该完整指纹可能与包含其的完整指纹相似,就把两完整指纹进行对比,汉明距离小于H的即为相似指纹(关键帧);不存在则说明这两组完整指纹一定不相似,比较下一指纹块形成的值。
可以看出,基于上述指纹切块分组处理、建立倒排索引处理、指纹比对处理可以极大的减少计算量。其中,将相同组合方式的元素存储在同一张表内建立倒排索引,这样采用抽屉原理,可以确定一定不相似的数据,使得省略重复处理的过程,从而快速提升计算速度。总的使得本发明的处理速度可以很快。我们经过测试,可以得到以下参数,可以验证上述构思能达到预期提升检测速度的目的。
表1测试数据:
指纹切块分组处理中,单个指纹做指纹切块分组处理具体为:将指纹集FB中任一指纹fbj平均切分为d个等长的块,,其中d>H,即fbj1,fbj2,…,fbjd,再随机取出其中(d-H)份构成一个新元素,共有种可能的组合方式;将指纹集FA中任一指纹fai平均切分为d个等长的块,即fai1,fai2,…,faid,再随机取出其中(d-H)份构成一个新元素,共有种可能的组合方式;其中定义两个汉明距离在设定阈值H内的指纹为相似指纹;
优选的,相似度按下式计算如下:
式中,snum表示检测视频A和参考视频B中相似关键帧个数,n和m分别表示参考视频B的关键帧的个数和检测视频A的关键帧的个数。
优选的,所述指纹集处理的具体过程为:分别对参考视频B、检测视频A进行以下操作得到指纹集FB、指纹集FA,
S1、获取关键帧集合:分别获得参考视频B、检测视频A对应的关键帧集合,参考视频B为对应的关键帧集合KB={kb1,kb2,…,kbj,…,kbn},检测视频A为对应的关键帧集合KA={ka1,ka2,…,kai,…,kam};
S2、预处理:将每个关键帧图像缩小为预设M×M的尺寸,并将其转换为灰度图;
S3、离散余弦变换处理:对灰度图进行离散余弦变换DCT,只保留结果中左上角的N×N子矩阵ZN×N,N=M/4;
S4、二值化处理:计算ZN×N所有元素的算数平均值;然后将大于或等于平均值的元素设为1,小于平均值的元素设为0;
S5、计算指纹处理:将二值化处理后的ZN×N按照先行后列的顺序得到一个二进制序列,作为该关键帧的指纹fbj、指纹faj;
S6、重复S2至S5,分别得到指纹集FB={fb1,...,fbj…,fbn}、指纹集FA={fa1,...,fai…,fam}。
优选的,所述S1、获取关键帧集合的具体过程为:
步骤S11:将参考视频B、检测视频A进行切帧处理,得到该视频的图像帧集;
步骤S12:遍历图像帧集中的所有图像帧,计算前后两帧差分得到帧间差分强度;
步骤S13:将帧间差分强度为局部最大值的候选关键帧作为关键帧,即得到该视频的关键帧集合为KB={kb1,kb2,…,kbj,…,kbn},KA={ka1,ka2,…,kai,…,kam}。
优选的,所述帧间差分强度,如下所示:
对于参考视频B有:Pj=|bj+1-bj|;对于检测视频A有:Pj=|ai+1-ai|;
其中Pj表示该视频的第j帧的帧间差分强度,bj表示参考视频B的图像帧集B={b1,b2,…,bj,…,bn}中的某一帧图像,bj+1表示图像帧集B中bj的后一帧图像,ai表示检测视频A的图像帧集A={a1,a2,…,ai,…,am}中的某一帧图像,ai+1表示图像帧集A中ai的后一帧图像;然后,将帧间差分强度大于阈值T1的帧作为一个候选关键帧。
优选的,所述离散余弦变换DCT计算如下所示:
在大量视频中鉴别相似视频的检测装置,包括:
指纹集获取单元:用于处理参考视频B得到对应于参考视频B的指纹集FB={fb1,...,fbj…,fbn};处理检测视频A得到对应于检测视频A的指纹集FA={fa1,...,fai…,fam};
指纹切块分组单元:用于对指纹集FB和指纹集FA中的所有指纹做指纹切块分组处理,分别得到大小为n×g的分组指纹集合GB和大小为m×g的分组指纹集合GA;
倒排索引建立单元:用于为分组指纹集合GB创建g个表,相同组合方式的元素存储在同一张表内,然后对该表内的每个元素建立倒排索引,指向包含它的完整指纹;
指纹比对单元:用于从分组指纹集合GA中取一个元素C,并逐一在分组指纹集合GB的倒排索引中寻找与C值相等元素:若只存在一个相等的元素E,则直接计算对应指纹的汉明距离,若结果小于或等于H,则两指纹为相似指纹;若存在多个元素E,则选取汉明距离最小的作为相似指纹;若不存在,则跳到下一元素,继续比对;重复上述指纹比对处理,直至找到指纹集FA与指纹集FB中所有相似的指纹,定义相似的指纹对应的关键帧为相似关键帧,以此获得相似关键帧的个数;
相似判定单元:用于根据相似关键帧个数计算相似度,设定相似度阈值T2,如果检测视频A和参考视频B的相似度SA,B大于等于阈值T2,则认为检测视频A与参考视频B相似;否则,则认为两视频不相似。
优选的,所述指纹集获取单元包括:
关键帧集合获取单元:用于分别获得参考视频B、检测视频A对应的关键帧集合,参考视频B为对应的关键帧集合KB={kb1,kb2,…,kbj,…,kbn},检测视频A为对应的关键帧集合KA={ka1,ka2,…,kai,…,kam};
指纹计算执行单元:用于对关键帧集合KB、关键帧集合KA执行程序X得到关键帧的指纹fbj、指纹faj,
程序X为:
将每个关键帧图像缩小为预设M×M的尺寸,并将其转换为灰度图;
对灰度图进行离散余弦变换DCT,只保留结果中左上角的N×N子矩阵ZN×N,N=M/4;
计算ZN×N所有元素的算数平均值;然后将大于或等于平均值的元素设为1,小于平均值的元素设为0;
将二值化处理后的ZN×N按照先行后列的顺序得到一个二进制序列,作为该关键帧的指纹fbj、指纹faj。
优选的,关键帧集合获取单元包括:
切帧模块:用于将参考视频B、检测视频A进行切帧处理,得到该视频的图像帧集;
帧间差分强度执行模块:遍历图像帧集中的所有图像帧,计算前后两帧差分得到帧间差分强度;
关键帧识别获取模块:用于将帧间差分强度为局部最大值的候选关键帧作为关键帧,即得到该视频的关键帧集合为KB={kb1,kb2,…,kbj,…,kbn},KA={ka1,ka2,…,kai,…,kam}。
本发明可以达到以下效果:
本发明包括以下步骤:输入视频库中的所有视频文件,提取视频的关键帧;通过计算DCT值得到每一关键帧的指纹;将每一指纹平均分为d块且组合为g个组,建立倒排索引;输入需要检测的视频文件并计算其关键帧的指纹,同样分为n块g个组,查找包含与某组值完全相同的完整指纹;通过计算图像帧相似度,判定视频是否相似;若不相似,则视频数据库中不存在与输入视频相似的视频。本方法利用一种基于分块的快速比较算法,通过视频最基础的关键帧图像的相似度比较进而判断两个视频的相似度,能够实现大多数情况下的大量视频相似度快速检测。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为提取关键帧流程示意图。
图2为计算关键帧指纹流程示意图。
图3为指纹比较流程示意图。
图4为视频1未采用分块思想计算法和分块思想计算法的用时输出结果图。
图5为视频2未采用分块思想计算法和分块思想计算法的用时输出结果图。
具体实施方式
在对本发明的任意实施例进行详细的描述之前,应该理解本发明的应用不局限于下面的说明或附图中所示的结构的细节。本发明可采用其它的实施例,并且可以以各种方式被实施或被执行。基于本发明中的实施例,本领域普通技术人员在没有做出创造性改进前提下所获得的所有其它实施例,均属于本发明保护的范围。
实施例1
如图3所示:
一种视频相似度快速检测方法,包括:
指纹集处理:
理参考视频B得到对应于参考视频B的指纹集FB={fb1,...,fbj,…,fbn};处理检测视频A得到对应于检测视频A的指纹集FA={fa1,...,fai,…,fam};
指纹切块分组处理:
对指纹集FB和指纹集FA中的所有指纹做指纹切块分组处理,分别得到大小为n×g的分组指纹集合GB和大小为m×g的分组指纹集合GA;
建立倒排索引处理:
为分组指纹集合GB创建g个表,相同组合方式的元素存储在同一张表内,然后对该表内的每个元素建立倒排索引,指向包含它的完整指纹;
指纹比对处理:
从分组指纹集合GA中取一个元素C,并逐一在分组指纹集合GB的倒排索引中寻找与C值相等元素:若只存在一个相等的元素E,则直接计算对应指纹的汉明距离,若结果小于或等于H,则两指纹为相似指纹;若存在多个元素E,则选取汉明距离最小的作为相似指纹;若不存在,则跳到下一元素,继续比对;重复上述指纹比对处理,直至找到指纹集FA与指纹集FB中所有相似的指纹,定义相似的指纹对应的关键帧为相似关键帧,以此获得相似关键帧的个数;
相似判定处理:
根据相似关键帧个数计算相似度,设定相似度阈值T2,如果检测视频A和参考视频B的相似度SA,B大于等于阈值T2,则认为检测视频A与参考视频B相似;否则,则认为两视频不相似。
基于上述方案可以看出,本发明的构思是:基于对比视频最基础的图像特征,设计出一种基于分块的视频相似度快速检测方法,能大大提高对侵权视频的检测效率。
基于分块的构思,定义两个汉明距离在设定阈值H内的指纹为相似指纹,将一个视频指纹平均切为d个等长的块。根据抽屉原理(例如,把9个苹果放进10个抽屉里,至少有一个空抽屉),两个相似的指纹至少有(d-H)块是完全相等的,可以得出:有(d-H)块完全相等的两指纹有可能相似,但(d-H)块不完全相等的一定不可能相似,从而排除一些不可能相似的指纹。
对切分的d个指纹块随机取出(d-H)块,对这些指纹块形成的值构建倒排索引(从值即能找到包含该值的所有的完整指纹)。把被测视频的指纹同样切分、随机取出(d-H)块,去倒排索引里查找这些指纹块形成的值是否存在:存在即说明该完整指纹可能与包含其的完整指纹相似,就把两完整指纹进行对比,汉明距离小于H的即为相似指纹(关键帧);不存在则说明这两组完整指纹一定不相似,比较下一指纹块形成的值。
可以看出,基于上述指纹切块分组处理、建立倒排索引处理、指纹比对处理可以极大的减少计算量。其中,将相同组合方式的元素存储在同一张表内建立倒排索引,这样采用抽屉原理,可以确定一定不相似的数据,使得省略重复处理的过程,从而快速提升计算速度。总的使得本发明的处理速度可以很快。我们经过测试,H=5,d=8,M=32可以得到以下参数,可以验证上述构思能达到预期提升检测速度的目的。
表1测试数据:
指纹切块分组处理中,单个指纹做指纹切块分组处理具体为:将指纹集FB中任一指纹fbj平均切分为d个等长的块,其中d>H,即fbj1,fbj2,…,fbjd,再随机取出其中(d-H)份构成一个新元素,共有种可能的组合方式;将指纹集FA中任一指纹fai平均切分为d个等长的块,即fai1,fai2,…,faid,再随机取出其中(d-H)份构成一个新元素,共有种可能的组合方式;其中定义两个汉明距离在设定阈值H内的指纹为相似指纹。
优选的,相似度按下式计算如下:
式中,snum表示检测视频A和参考视频B中相似关键帧个数,n和m分别表示参考视频B的关键帧的个数和检测视频A的关键帧的个数。
实施例2
在上述实施例的基础上,如图2所示,其所述指纹集处理的具体过程可以是:
分别对参考视频B、检测视频A进行以下操作得到指纹集FB、指纹集FA,
S1、获取关键帧集合:分别获得参考视频B、检测视频A对应的关键帧集合,参考视频B为对应的关键帧集合KB={kb1,kb2,…,kbj,…,kbn},检测视频A为对应的关键帧集合KA={ka1,ka2,…,kai,…,kam};
S2、预处理:将每个关键帧图像缩小为预设M×M的尺寸,并将其转换为灰度图;
S3、离散余弦变换处理:对灰度图进行离散余弦变换DCT,只保留结果中左上角的N×N子矩阵ZN×N,N=M/4;
S4、二值化处理:计算ZN×N所有元素的算数平均值;然后将大于或等于平均值的元素设为1,小于平均值的元素设为0;
S5、计算指纹处理:将二值化处理后的ZN×N按照先行后列的顺序得到一个二进制序列,作为该关键帧的指纹fbj、指纹fai;
S6、重复S2至S5,分别得到指纹集FB={fb1,...,fbj…,fbn}、指纹集FA={fa1,...,fai…,fam}。
优选的,所述离散余弦变换DCT计算如下所示:
实施例3
在上述实施例的基础上,如图1所示,关键帧集合可以采用以下具体过程:
步骤S11:将参考视频B、检测视频A进行切帧处理,得到该视频的图像帧集;
步骤S12:遍历图像帧集中的所有图像帧,计算前后两帧差分得到帧间差分强度;
步骤S13:将帧间差分强度为局部最大值的候选关键帧作为关键帧,即得到该视频的关键帧集合为KB={kb1,kb2,…,kbj,…,kbn},KA={ka1,ka2,…,kai,…,kam}。
优选的,所述帧间差分强度,如下所示:
对于参考视频B有:Pj=|bj+1-bj|;对于检测视频A有:Pj=|ai+1-ai|;
其中Pj表示该视频的第j帧的帧间差分强度,bj表示参考视频B的图像帧集B={b1,b2,…,bj,…,bn}中的某一帧图像,bj+1表示图像帧集B中bj的后一帧图像,ai表示检测视频A的图像帧集A={a1,a2,…,ai,…,am}中的某一帧图像,ai+1表示图像帧集A中ai的后一帧图像;然后,将帧间差分强度大于阈值T1的帧作为一个候选关键帧。
实施例4
在大量视频中鉴别相似视频的检测装置,包括:
指纹集获取单元:用于处理参考视频B得到对应于参考视频B的指纹集FB={fb1,...,fbj…,fbn};处理检测视频A得到对应于检测视频A的指纹集FA={fa1,...,fai…,fam};
指纹切块分组单元:用于对指纹集FB和指纹集FA中的所有指纹做指纹切块分组处理,分别得到大小为n×g的分组指纹集合GB和大小为m×g的分组指纹集合GA;
倒排索引建立单元:用于为分组指纹集合GB创建g个表,相同组合方式的元素存储在同一张表内,然后对该表内的每个元素建立倒排索引,指向包含它的完整指纹;
指纹比对单元:用于从分组指纹集合GA中取一个元素C,并逐一在分组指纹集合GB的倒排索引中寻找与C值相等元素:若只存在一个相等的元素E,则直接计算对应指纹的汉明距离,若结果小于或等于H,则两指纹为相似指纹;若存在多个元素E,则选取汉明距离最小的作为相似指纹;若不存在,则跳到下一元素,继续比对;重复上述指纹比对处理,直至找到指纹集FA与指纹集FB中所有相似的指纹,定义相似的指纹对应的关键帧为相似关键帧,以此获得相似关键帧的个数;
相似判定单元:用于根据相似关键帧个数计算相似度,设定相似度阈值T2,如果检测视频A和参考视频B的相似度SA,B大于等于阈值T2,则认为检测视频A与参考视频B相似;否则,则认为两视频不相似。
优选的,所述指纹集获取单元包括:
关键帧集合获取单元:用于分别获得参考视频B、检测视频A对应的关键帧集合,参考视频B为对应的关键帧集合KB={kb1,kb2,…,kbj,…,kbn},检测视频A为对应的关键帧集合KA={ka1,ka2,…,kai,…,kam};
指纹计算执行单元:用于对关键帧集合KB、关键帧集合KA执行程序X得到关键帧的指纹fbj、指纹fai,
程序X为:
将每个关键帧图像缩小为预设M×M的尺寸,并将其转换为灰度图;
对灰度图进行离散余弦变换DCT,只保留结果中左上角的N×N子矩阵ZN×N,N=M/4;
计算ZN×N所有元素的算数平均值;然后将大于或等于平均值的元素设为1,小于平均值的元素设为0;
将二值化处理后的ZN×N按照先行后列的顺序得到一个二进制序列,作为该关键帧的指纹fbj、指纹faj。
优选的,关键帧集合获取单元包括:
切帧模块:用于将参考视频B、检测视频A进行切帧处理,得到该视频的图像帧集;
帧间差分强度执行模块:遍历图像帧集中的所有图像帧,计算前后两帧差分得到帧间差分强度;
关键帧识别获取模块:用于将帧间差分强度为局部最大值的候选关键帧作为关键帧,即得到该视频的关键帧集合为KB={kb1,kb2,…,kbj,…,kbn},KA={ka1,ka2,…,kai,…,kam}。
实施例5
如图1、图2、图3结合所示:
基于图像分块的相似视频快速检测方法,包括如下步骤:
步骤1:将参考视频B进行切帧处理,得到该视频的图像帧集。
步骤2:遍历图像帧集中的所有图像帧,计算前后两帧差分得到帧间差分强度,
步骤3:将帧间差分强度为局部最大值的候选关键帧作为关键帧,即得到该视频的关键帧集合为KB={kb1,kb2,…,kbj,…,kbn}。
步骤4:将每个关键帧图像缩小为M×M的尺寸,并将其转换为灰度图。
步骤5:对步骤S4中灰度图进行离散余弦变换(DCT),只保留结果中左上角的N×N子矩阵ZN×N,N=M/4。DCT计算如下所示:
步骤6:二值化:计算ZN×N所有元素的算数平均值;然后将大于或等于平均值的元素设为1,小于平均值的元素设为0。
步骤7:计算指纹:将二值化后的ZN×N按照先行后列的顺序得到一个二进制序列,作为该关键帧的指纹fbj。
步骤8:重复步骤4至7得到参考视频B的指纹集FB={fb1,...,fbj…,fbn};
步骤9:将检测视频A根据步骤S1至S8处理得到检测视频A的指纹集FA={fa1,...,fai…,fam}。
步骤10:指纹切块分组。定义两个汉明距离在设定阈值H内的指纹为相似指纹。将FB中任一指纹fbj平均切分为d(d>H)个等长的块,即fbj1,fbj2,…,fbjd。随机取出其中(d-H)份构成一个新元素,共有种可能的组合方式。对FB集合和FA集合中的所有指纹做此操作,分别得到大小为n×g的分组指纹集合GB和大小为m×g的分组指纹集合GA。
步骤11:建立倒排索引(inverted index):为GB创建g个表,相同组合方式的元素存储在同一张表内,然后对该表内的每个元素建立倒排索引,指向包含它的完整指纹。
步骤12:指纹比对:定义相似指纹对应的关键帧为相似关键帧。从GA中取一个元素C,并逐一在GB的倒排索引中寻找与C值相等元素:若只存在一个相等的元素E,则直接计算对应指纹的汉明距离,若结果小于或等于H,则两指纹为相似指纹;若存在多个元素E,则选取汉明距离最小的作为相似指纹;若不存在,则跳到下一元素,继续比对。
步骤13:重复步骤12,直至找到FA与FB中所有相似的指纹。
步骤:14:计算相似度。
步骤15:设定相似度阈值T2。如果视频A和B的相似度SA,B大于等于阈值T2,则认为检测视频A与参考视频B相似;否则,则认为两视频不相似。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种视频相似度快速检测方法,其特征在于,包括:
指纹集处理:
处理参考视频B得到对应于参考视频B的指纹集FB={fb1,...,fbj,…,fbn};处理检测视频A得到对应于检测视频A的指纹集FA={fa1,...,fai,…,fam};
指纹切块分组处理:
对指纹集FB和指纹集FA中的所有指纹做指纹切块分组处理,分别得到大小为n×g的分组指纹集合GB和大小为m×g的分组指纹集合GA;
指纹切块分组处理中,单个指纹做指纹切块分组处理具体为:将指纹集FB中任一指纹fbj平均切分为d个等长的块,其中d>H,即fbj1,fbj2,…,fbjd,再随机取出其中(d-H)份构成一个新元素,共有种可能的组合方式;将指纹集FA中任一指纹fai平均切分为d个等长的块,即fai1,fai2,…,faid,再随机取出其中(d-H)份构成一个新元素,共有种可能的组合方式;其中定义两个汉明距离在设定阈值H内的指纹为相似指纹;
建立倒排索引处理:
为分组指纹集合GB创建g个表,相同组合方式的元素存储在同一张表内,然后对该表内的每个元素建立倒排索引,指向包含它的完整指纹;
指纹比对处理:
从分组指纹集合GA中取一个元素C,并逐一在分组指纹集合GB的倒排索引中寻找与C值相等元素:若只存在一个相等的元素E,则直接计算对应指纹的汉明距离,若结果小于或等于H,则两指纹为相似指纹;若存在多个元素E,则选取汉明距离最小的作为相似指纹;若不存在,则跳到下一元素,继续比对;重复上述指纹比对处理,直至找到指纹集FA与指纹集FB中所有相似的指纹,定义相似的指纹对应的关键帧为相似关键帧,以此获得相似关键帧的个数;
相似判定处理:
根据相似关键帧个数计算相似度,设定相似度阈值T2,如果检测视频A和参考视频B的相似度SA,B大于等于阈值T2,则认为检测视频A与参考视频B相似;否则,则认为两视频不相似。
3.根据权利要求2中所述的一种视频相似度快速检测方法,其特征在于,
所述指纹集处理的具体过程为:分别对参考视频B、检测视频A进行以下操作得到指纹集FB、指纹集FA,
S1、获取关键帧集合:分别获得参考视频B、检测视频A对应的关键帧集合,参考视频B为对应的关键帧集合KB={kb1,kb2,…,kbj,…,kbn},检测视频A为对应的关键帧集合KA={ka1,ka2,…,kai,…,kam};
S2、预处理:将每个关键帧图像缩小为预设M×M的尺寸,并将其转换为灰度图;
S3、离散余弦变换处理:对灰度图进行离散余弦变换DCT,只保留结果中左上角的N×N子矩阵ZN×N,N=M/4;
S4、二值化处理:计算ZN×N所有元素的算数平均值;然后将大于或等于平均值的元素设为1,小于平均值的元素设为0;
S5、计算指纹处理:将二值化处理后的ZN×N按照先行后列的顺序得到一个二进制序列,作为该关键帧的指纹fbj、指纹fai;
S6、重复S2至S5,分别得到指纹集FB={fb1,...,fbj…,fbn}、指纹集FA={fa1,...,fai…,fam}。
4.根据权利要求3所述的一种视频相似度快速检测方法,其特征在于,
所述S1、获取关键帧集合的具体过程为:
步骤S11:将参考视频B、检测视频A进行切帧处理,得到该视频的图像帧集;
步骤S12:遍历图像帧集中的所有图像帧,计算前后两帧差分得到帧间差分强度;
步骤S13:将帧间差分强度为局部最大值的候选关键帧作为关键帧,即得到该视频的关键帧集合为KB={kb1,kb2,…,kbj,…,kbn},KA={ka1,ka2,…,kai,…,kam}。
5.根据权利要求4所述的一种视频相似度快速检测方法,其特征在于,
所述帧间差分强度,如下所示:
对于参考视频B有:Pj=|bj+1-bj|;对于检测视频A有:Pi =|ai+1-ai|;
其中Pj表示该视频的第j帧的帧间差分强度,bj表示参考视频B的图像帧集B={b1,b2,…,bj,…,bn}中的某一帧图像,bj+1表示图像帧集B中bj的后一帧图像,ai表示检测视频A的图像帧集A={a1,a2,…,ai,…,am}中的某一帧图像,ai+1表示图像帧集A中ai的后一帧图像;然后,将帧间差分强度大于阈值T1的帧作为一个候选关键帧。
7.视频相似度快速检测装置,其特征在于,包括:
指纹集获取单元:用于处理参考视频B得到对应于参考视频B的指纹集FB={fb1,...,fbj…,fbn};处理检测视频A得到对应于检测视频A的指纹集FA={fa1,...,fai…,fam};
指纹切块分组单元:用于对指纹集FB和指纹集FA中的所有指纹做指纹切块分组处理,分别得到大小为n×g的分组指纹集合GB和大小为m×g的分组指纹集合GA,用于指纹切块分组处理中,单个指纹做指纹切块分组处理具体为:将指纹集FB中任一指纹fbj平均切分为d个等长的块,其中d>H,即fbj1,fbj2,…,fbjd,再随机取出其中(d-H)份构成一个新元素,共有种可能的组合方式;将指纹集FA中任一指纹fai平均切分为d个等长的块,即fai1,fai2,…,faid,再随机取出其中(d-H)份构成一个新元素,共有种可能的组合方式;其中定义两个汉明距离在设定阈值H内的指纹为相似指纹;
倒排索引建立单元:用于为分组指纹集合GB创建g个表,相同组合方式的元素存储在同一张表内,然后对该表内的每个元素建立倒排索引,指向包含它的完整指纹;
指纹比对单元:用于从分组指纹集合GA中取一个元素C,并逐一在分组指纹集合GB的倒排索引中寻找与C值相等元素:若只存在一个相等的元素E,则直接计算对应指纹的汉明距离,若结果小于或等于H,则两指纹为相似指纹;若存在多个元素E,则选取汉明距离最小的作为相似指纹;若不存在,则跳到下一元素,继续比对;重复上述指纹比对处理,直至找到指纹集FA与指纹集FB中所有相似的指纹,定义相似的指纹对应的关键帧为相似关键帧,以此获得相似关键帧的个数;
相似判定单元:用于根据相似关键帧个数计算相似度,设定相似度阈值T2,如果检测视频A和参考视频B的相似度SA,B大于等于阈值T2,则认为检测视频A与参考视频B相似;否则,则认为两视频不相似。
8.根据权利要求7所述的视频相似度快速检测装置,其特征在于,
所述指纹集获取单元包括:
关键帧集合获取单元:用于分别获得参考视频B、检测视频A对应的关键帧集合,参考视频B为对应的关键帧集合KB={kb1,kb2,…,kbj,…,kbn},检测视频A为对应的关键帧集合KA={ka1,ka2,…,kai,…,kam};
指纹计算执行单元:用于对关键帧集合KB、关键帧集合KA执行程序X得到关键帧的指纹fbj、指纹fai,
程序X为:
将每个关键帧图像缩小为预设M×M的尺寸,并将其转换为灰度图;
对灰度图进行离散余弦变换DCT,只保留结果中左上角的N×N子矩阵ZN×N,N=M/4;
计算ZN×N所有元素的算数平均值;然后将大于或等于平均值的元素设为1,小于平均值的元素设为0;
将二值化处理后的ZN×N按照先行后列的顺序得到一个二进制序列,作为该关键帧的指纹fbj、指纹faj。
9.根据权利要求8所述的视频相似度快速检测装置,其特征在于,关键帧集合获取单元包括:
切帧模块:用于将参考视频B、检测视频A进行切帧处理,得到该视频的图像帧集;
帧间差分强度执行模块:遍历图像帧集中的所有图像帧,计算前后两帧差分得到帧间差分强度;
关键帧识别获取模块:用于将帧间差分强度为局部最大值的候选关键帧作为关键帧,即得到该视频的关键帧集合为KB={kb1,kb2,…,kbj,…,kbn},KA={ka1,ka2,…,kai,…,kam}。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010304043.4A CN111507260B (zh) | 2020-04-17 | 2020-04-17 | 一种视频相似度快速检测方法及检测装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010304043.4A CN111507260B (zh) | 2020-04-17 | 2020-04-17 | 一种视频相似度快速检测方法及检测装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111507260A CN111507260A (zh) | 2020-08-07 |
CN111507260B true CN111507260B (zh) | 2022-08-05 |
Family
ID=71871012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010304043.4A Active CN111507260B (zh) | 2020-04-17 | 2020-04-17 | 一种视频相似度快速检测方法及检测装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111507260B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112381151B (zh) * | 2020-11-17 | 2024-03-22 | 有米科技股份有限公司 | 相似视频的确定方法及装置 |
CN113569719B (zh) * | 2021-07-26 | 2023-12-29 | 上海艾策通讯科技股份有限公司 | 视频侵权判定方法、装置、存储介质及电子设备 |
CN113722543A (zh) * | 2021-09-14 | 2021-11-30 | 图灵创智(北京)科技有限公司 | 一种视频相似性比对方法、系统及设备 |
CN116939267B (zh) * | 2023-09-14 | 2023-12-05 | 腾讯科技(深圳)有限公司 | 帧对齐方法、装置、计算机设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853486A (zh) * | 2010-06-08 | 2010-10-06 | 华中科技大学 | 一种基于局部数字指纹的图像拷贝检测方法 |
CN103257992A (zh) * | 2013-01-29 | 2013-08-21 | 中国科学技术大学 | 一种相似视频检索的方法及系统 |
CN103699691A (zh) * | 2014-01-10 | 2014-04-02 | 五八同城信息技术有限公司 | 生成图像指纹及基于此进行相似图像检索的方法 |
CN104050247A (zh) * | 2014-06-04 | 2014-09-17 | 上海美琦浦悦通讯科技有限公司 | 实现海量视频快速检索的方法 |
CN109445834A (zh) * | 2018-10-30 | 2019-03-08 | 北京计算机技术及应用研究所 | 基于抽象语法树的程序代码相似性快速比较方法 |
CN110083740A (zh) * | 2019-05-07 | 2019-08-02 | 深圳市网心科技有限公司 | 视频指纹提取及视频检索方法、装置、终端及存储介质 |
CN110309446A (zh) * | 2019-04-26 | 2019-10-08 | 深圳市赛为智能股份有限公司 | 文本内容快速去重方法、装置、计算机设备及存储介质 |
CN110427895A (zh) * | 2019-08-06 | 2019-11-08 | 李震 | 一种基于计算机视觉的视频内容相似度判别方法及系统 |
CN110599486A (zh) * | 2019-09-20 | 2019-12-20 | 福州大学 | 一种视频抄袭的检测方法及系统 |
CN110889011A (zh) * | 2019-11-29 | 2020-03-17 | 杭州当虹科技股份有限公司 | 一种视频指纹方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10521441B2 (en) * | 2014-01-02 | 2019-12-31 | The George Washington University | System and method for approximate searching very large data |
CN106933824B (zh) * | 2015-12-29 | 2021-01-01 | 伊姆西Ip控股有限责任公司 | 在多个文档中确定与目标文档相似的文档集合的方法和装置 |
US11276015B2 (en) * | 2017-04-20 | 2022-03-15 | Capital One Services, Llc | Machine learning artificial intelligence system for predicting hours of operation |
-
2020
- 2020-04-17 CN CN202010304043.4A patent/CN111507260B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853486A (zh) * | 2010-06-08 | 2010-10-06 | 华中科技大学 | 一种基于局部数字指纹的图像拷贝检测方法 |
CN103257992A (zh) * | 2013-01-29 | 2013-08-21 | 中国科学技术大学 | 一种相似视频检索的方法及系统 |
CN103699691A (zh) * | 2014-01-10 | 2014-04-02 | 五八同城信息技术有限公司 | 生成图像指纹及基于此进行相似图像检索的方法 |
CN104050247A (zh) * | 2014-06-04 | 2014-09-17 | 上海美琦浦悦通讯科技有限公司 | 实现海量视频快速检索的方法 |
CN109445834A (zh) * | 2018-10-30 | 2019-03-08 | 北京计算机技术及应用研究所 | 基于抽象语法树的程序代码相似性快速比较方法 |
CN110309446A (zh) * | 2019-04-26 | 2019-10-08 | 深圳市赛为智能股份有限公司 | 文本内容快速去重方法、装置、计算机设备及存储介质 |
CN110083740A (zh) * | 2019-05-07 | 2019-08-02 | 深圳市网心科技有限公司 | 视频指纹提取及视频检索方法、装置、终端及存储介质 |
CN110427895A (zh) * | 2019-08-06 | 2019-11-08 | 李震 | 一种基于计算机视觉的视频内容相似度判别方法及系统 |
CN110599486A (zh) * | 2019-09-20 | 2019-12-20 | 福州大学 | 一种视频抄袭的检测方法及系统 |
CN110889011A (zh) * | 2019-11-29 | 2020-03-17 | 杭州当虹科技股份有限公司 | 一种视频指纹方法 |
Non-Patent Citations (4)
Title |
---|
Ultrahigh-Speed TV Commercial Detection, Extraction, and Matching;Xiaomeng Wu 等;《IEEE Trans. Circuits Syst. Video Techn》;20130101;第23卷(第6期);1054-1069 * |
关于鸽巢原理和Ramsey定理的几个结论;蒋洪;《科教文汇(中旬刊)》;20081120(第11期);281 * |
基于Simhash算法的海量文档反作弊技术研究;徐济惠;《计算机技术与发展》;20140910;第24卷(第09期);103-107 * |
基于Simhash算法的重复数据删除技术的研究与改进;陈春玲 等;《南京邮电大学学报(自然科学版)》;20160629;第36卷(第03期);85-91 * |
Also Published As
Publication number | Publication date |
---|---|
CN111507260A (zh) | 2020-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111507260B (zh) | 一种视频相似度快速检测方法及检测装置 | |
CN102496001B (zh) | 一种视频监控目标自动检测的方法和系统 | |
Ayed et al. | MapReduce based text detection in big data natural scene videos | |
CN113111154B (zh) | 相似度评估方法、答案搜索方法、装置、设备及介质 | |
CN109241741B (zh) | 一种基于图像纹理指纹的恶意代码分类方法 | |
CN110134777B (zh) | 问题去重方法、装置、电子设备和计算机可读存储介质 | |
CN110826056B (zh) | 一种基于注意力卷积自编码器的推荐系统攻击检测方法 | |
KR20140033509A (ko) | 비디오들을 비교하기 위한 방법들 및 장치 | |
Chhatkuli et al. | Separating compound figures in journal articles to allow for subfigure classification | |
CN110879967B (zh) | 视频内容重复判断方法及装置 | |
CN108763295A (zh) | 一种基于深度学习的视频近似拷贝检索算法 | |
CN111368867A (zh) | 档案归类方法及系统、计算机可读存储介质 | |
CN109697240B (zh) | 一种基于特征的图像检索方法及装置 | |
CN112235305A (zh) | 一种基于卷积神经网络的恶意流量检测方法 | |
US11281714B2 (en) | Image retrieval | |
Cui et al. | Edge detection algorithm optimization and simulation based on machine learning method and image depth information | |
Ren et al. | Barcode detection and decoding method based on deep learning | |
CN104484869A (zh) | 面向排序测度特征的图像匹配方法及系统 | |
CN115641395A (zh) | 一种基于互信息的图文对齐方法 | |
Shang et al. | An improved OTSU method based on Genetic Algorithm | |
Khan et al. | Deepfake Detection: A Comparative Analysis | |
CN108021918B (zh) | 文字识别方法及装置 | |
CN111581640A (zh) | 一种恶意软件检测方法、装置及设备、存储介质 | |
Liu et al. | A computationally efficient algorithm for large scale near-duplicate video detection | |
Singh et al. | Text Region Extraction: A Morphological Based Image Analysis Using Genetic Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |