CN109246446A - 比较视频内容相似性的方法、装置和设备 - Google Patents
比较视频内容相似性的方法、装置和设备 Download PDFInfo
- Publication number
- CN109246446A CN109246446A CN201811334406.8A CN201811334406A CN109246446A CN 109246446 A CN109246446 A CN 109246446A CN 201811334406 A CN201811334406 A CN 201811334406A CN 109246446 A CN109246446 A CN 109246446A
- Authority
- CN
- China
- Prior art keywords
- picture
- pictures
- sequence
- video
- compared
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000011218 segmentation Effects 0.000 claims abstract description 49
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 238000010008 shearing Methods 0.000 claims abstract description 9
- 239000011159 matrix material Substances 0.000 claims description 20
- 238000004891 communication Methods 0.000 claims description 19
- 241001270131 Agaricus moelleri Species 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 238000012550 audit Methods 0.000 abstract description 26
- 238000012795 verification Methods 0.000 abstract description 7
- 238000012552 review Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 239000000463 material Substances 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/254—Management at additional data server, e.g. shopping server, rights management server
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8456—Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/278—Subtitling
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明提供了一种比较视频内容相似性的方法、装置和设备,包括以下步骤:获取两个以上待比较视频;将要比较的视频抽取成图片序列;对每一张图片生成描述其特征的指纹;分段,运用最长公共子序列法对图片序列进行比较;合并各个分段的比较结果,得到视频的相似性结果。本发明所述比较视频内容相似性的方法通过对两个视频的智能比较,得到视频的剪切情况,从而辅助视频的人工审核,审核时可据此仅需观看视频的不同部分,从而减轻审核人员的工作量,加速视频审核的过程。
Description
技术领域
本发明涉及视频审核系统中的计算机辅助审核领域。
背景技术
随着互联网、智能设备的飞速发展,互联网上的数据特别是图片、视频等内容呈现爆炸式增长,这些内容中也充斥着各种不可控的风险因素,比如色情视频和图片、涉政暴恐内容等。随着国家对网络视听节目的监管力度逐步升级,《网络视听节目内容审核通则》发布,要求从事互联网视听节目服务相关单位在播出网络视听节目前,对拟播出的视听节目作品和用于宣传、介绍作品等目的而制作的图文及视频内容进行审核,提出两个审核原则即先审后播原则、审核到位原则,规定了节目内容的审核标准。
根据审核到位原则,审核节目时不得快进和遗漏,非专业类网络视听节目应由不少于三人的审核员审核。审核严格的视频平台会对审核后的视频进行最终复核,复核的方法之一是与其他来源的相同内容的视频进行比较,比如同一部电影其它视频平台已经审核并发布,通过比较异同并根据本企业的审核标准,可以发现审核后的视频是否仍然存在需要剪掉的内容或有没必要剪掉的内容,这些工作目前一般由复核人员全人工完成。
图1描述了现有视频复核处理流程,对审核后视频和其它来源视频进行比较,步骤10完整播放两个要比较的视频,复核人员进行观看,人工寻找两个视频的不同之处,步骤11复核人员给出复核意见,即审核后视频是否符合审核要求。
现有视频复核处理流程中人工复核时要完整播放两个视频进行比较,复核工作量大且效率低,因此如何通过计算机算法自动找出视频的不同之处以辅助复核工作提高工作效率成为急需解决的问题。
发明内容
本发明所要解决的技术问题是提供一种比较视频内容相似性的方法,通过对两个视频的智能比较,得到视频的剪切情况,从而辅助视频的人工审核,提高视频审核效率。
为了解决以上技术问题,本发明提供了一种比较视频内容相似性的方法,包括以下步骤:获取两个以上待比较视频;将要比较的视频抽取成图片序列;对每一张图片生成描述其特征的指纹;分段,运用最长公共子序列法对图片序列进行比较;合并各个分段的比较结果,得到视频的相似性结果。
本发明所述比较视频内容相似性的方法的有益效果在于:通过对视频的智能比较,从而辅助视频的人工审核,审核时可据此仅需观看视频的不同部分,从而减轻审核人员的工作量,加速视频审核的过程。
优选的,所述待比较视频为两个视频;所述将要比较的视频抽取成图片序列的步骤包括:将视频缩放到相同大小,剪切视频的公共区域生成图片,得到对应的两个图片序列,序列中每一张图片对应视频中的每一帧。
优选的,所述对每一张图片生成描述其特征的指纹的步骤包括:将每张图片像素统一为MxN、若干级灰度;对每张图片,计算MxN个像素值的平均值;将MxN个像素值与所述的平均值进行比较,如像素值大于等于平均值取1,如像素值小于平均值取0;将上述的MxN个比较结果,按在图片中的位置组成无符号整数,得到图片的指纹;所述M和N为正整数。
优选的,所述图片序列进行比对的步骤包括:取一段要比较的图片序列,从两个图片序列的第1张图片开始比较,依次比较两个序列的每一张图片;使用图片指纹之间的汉明距离来表征两张图片的差异;使用最长公共子序列法寻找两个图片序列的相同部分。
优选的,所述使用图片指纹之间的汉明距离来表征两张图片的差异的步骤包括:计算两个图片指纹序列中,所有对应比特位两个无符号整数的不相同的个数,如果汉明距离不超过第一阈值,说明两张图片相似;如果汉明距离大于第二阈值,则说明这是两张不同的图片;使用最长公共子序列法寻找两个图片序列的相同部分的步骤包括:计算最长公共子序列长度矩阵和对应的方向矩阵;由方向矩阵通过回溯方法构造两个序列的最长公共子序列。
优选的,若还有图片没有比较过,则取下一个要比较的分段进行比较,直到所有图片均比较过;合并所有分段比较结果,对每一个分段的图片序列比较结果进行处理,将最大公共子序列中每个项的图片编号加上该分段的起始图片编号,得到每个公共项在整个图片序列中的图片编号;合并所有分段的最大公共子序列,最终得到两个完整图片序列的最大公共子序列,即两个视频的相同部分。
本发明还提供了一种比较多个视频内容相似性的装置,包括:获取待比较视频模块,用于获取两个待比较视频;抽取图片序列模块,用于将要比较的视频抽取成两个图片序列;图片序列比较模块,用于对每一张图片生成描述其特征的指纹,分段,运用最长公共子序列法对图片序列进行比较;合并分段模块,用于合并各个分段的比较结果,得到视频的相似性结果。
本发明所述比较视频内容相似性的装置的有益效果在于:通过对两个视频的智能比较,得到视频的剪切情况,从而辅助视频的人工审核,审核时可据此仅需观看视频的不同部分,从而减轻审核人员的工作量,加速视频审核的过程。
优选的,所述待比较视频为两个视频;所述抽取图片序列模块,用于将视频缩放到相同大小,剪切视频的公共区域生成图片,得到对应的两个图片序列,序列中每一张图片对应视频中的每一帧;所述图片序列比较模块包括指纹生成模块和图片指纹比较模块;所述指纹生成模块,用于将每张图片像素统一为MxN、若干级灰度;对每张图片,计算MxN个像素值的平均值;将MxN个像素值与所述的平均值进行比较,如像素值大于等于平均值取1,如像素值小于平均值取0;将上述的MxN个比较结果,按在图片中的位置组成无符号整数,得到图片的指纹;所述M和N为正整数;所述图片指纹比较模块,用于取一段要比较的图片序列,从两个图片序列的第1张图片开始比较,依次比较两个序列的每一张图片;计算两个图片指纹序列中,所有对应比特位两个无符号整数的不相同的个数,如果汉明距离不超过第一阈值,说明两张图片相似;如果汉明距离大于第二阈值,则说明这是两张不同的图片。
优选的,所述图片序列比较模块,用于使用最长公共子序列法计算最长公共子序列长度矩阵和对应的方向矩阵;由方向矩阵通过回溯方法构造两个序列的最长公共子序列;所述合并分段模块,用于合并所有分段比较结果,对每一个分段的图片序列比较结果进行处理,将最大公共子序列中每个项的图片编号加上该分段的起始图片编号,得到每个公共项在整个图片序列中的图片编号;合并所有分段的最大公共子序列,最终得到两个完整图片序列的最大公共子序列,即两个视频的相同部分。
本发明还提供了一种比较视频内容相似性的设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述的方法步骤。
本发明所述比较视频内容相似性的设备的有益效果在于:通过对两个视频的智能比较,得到视频的剪切情况,从而辅助视频的人工审核,审核时可据此仅需观看视频的不同部分,从而减轻审核人员的工作量,加速视频审核的过程。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细说明。
图1为现有视频复核处理的流程图;
图2为本发明所述应用视频比较方法的复核处理的流程图;
图3为本发明所述视频比较方法的流程图;
图4为本发明所述由图片生成指纹的流程图;
图5为本发明所述比较图片序列的流程图;
图6为本发明所述最大公共子序列(LCS)算法的示意图。
具体实施方式
实施例一、
本发明所述比较视频内容相似性的方法、装置和设备优选的应用于两个视频的比较,以下基于两个视频的比较进行举例说明,基于本发明的构思当然也可以应用于其他任意数量的视频的比较。
本发明要解决在视频审核系统中,要对两个视频进行比较只能人工观看整个视频,工作量大且效率低的问题。本发明的特点是首先将要比较的视频抽取成图片序列,对每一张图片生成描述其特征的指纹用于图片的比较,然后使用分段方式对图片序列运用最长公共子序列算法进行比较,最后合并各个分段的比较结果得到两个视频的异同,审核时可据此仅需观看视频的不同部分,从而减轻审核人员的工作量,加速视频审核的过程。
其步骤如图2:
步骤20,对审核后视频和其它来源视频进行比较得到视频的异同点
步骤21,在复核人员进行人工复核时,根据步骤20得到的视频异同点,只需播放两个视频的不同部分即可完成审核工作,大大节约工作量
步骤22,复核人员最终给出复核意见。
图3为本发明的一个实施案例。该实施案例包括:
步骤30,对要进行比较的两个视频文件进行抽取图片的操作,由于两个视频来源不同,分辨率可能不同且会有不同的台标、字幕等后期叠加的内容,要先将视频缩放到相同大小,然后避开台标、字幕等不同的部分剪切出视频的公共区域生成图片,最终生成对应的两个图片序列,序列中每一张图片对应视频中的每一帧。
步骤31,对两个图片序列中的每一张图片生成一个指纹(fingerprint),为64bit的无符号整数,在后面的步骤中将使用指纹比较来代替图片比较,这样可以大大提高图片比较的速度。生成图片指纹的过程如图4所示,
1)步骤40,对图片大小、颜色进行规整便于特征值计算,将图片大小缩小到8x8,像素值转换为64级灰度。本实施例优选的将图片缩小到8x8的像素,当然也可以设定为其他设定的大小,例如MxN,M和N为正整数。该图片大小可以根据实际需要进行调整。本实施例以8x8为例进行说明。
2)步骤41,对规整后图片,计算8x8个像素值的平均值。
3)步骤42,将8x8个像素值与步骤41得到的平均值进行比较,像素值大于等于平均值取1,像素值小于平均值取0。
4)步骤43,将步骤42的64个比较结果(1或0),按在8x8图片中的位置组成64bit的无符号整数,得到图片的指纹。
步骤32,取一段要比较的图片序列,由于图片序列中的图片数目很大,考虑到所需的内存和算法性能必须分段进行图片序列比较。设两个图片序列的图片总数目为Lx和Ly,每个分段的图片数目最大为Lmax,取出要进行比较的图片编号范围分别为[first_x,last_x]和[first_y,last_y],初始化时first_x=1,first_y=1,即从两个图片序列的第1张图片开始比较,分段的最后一张图片的编号取为
和
步骤33,对步骤32中取出的图片序列进行比较,两张图片的差异使用图片指纹之间的汉明距离来表征,寻找两个图片序列的相同部分使用最长公共子序列(LongestCommonSubsequence,LCS)算法。本发明所述最长公共子序列其定义是,一个序列S,如果分别是两个或多个已知序列的子序列,且是所有符合此条件序列中最长的,则S称为已知序列的最长公共子序列。设两个图片序列长度分别为m和n,由每张图片的指纹组成的序列分别记为X=<x1,x2,…,xm>和Y=<y1,y2,…,yn>,使用最长公共子序列算法找出序列X和Y的最长公共子序列,就得到了两个图片序列的相同部分,具体的过程如图5所示。
1)步骤50,计算两个图片指纹序列中所有xi和yj的汉明距离,即两个无符号整数的对应比特位不相同的个数,记为hamming(xi,yj),如果汉明距离不超过第一阈值,例如3,说明两张图片很相似;如果汉明距离大于第二阈值,例如10,则说明这是两张不同的图片。上述的第一阈值和第二阈值可以根据需要进行设定。本发明所述汉明距离是表明一个信号变成另一个信号需要的最小操作(替换位),实际中就是比较两个比特串有多少个位不一样,简洁的操作时就是两个比特串进行异或之后包含1的个数。
2)步骤51,计算最长公共子序列长度矩阵和对应的方向矩阵。定义序列X和Y的前缀子序列为Xi=<x1,x2,…,xi>和Yj=<y1,y2,…,yj>,最长公共子序列长度矩阵的项c[i,j]记录序列为Xi和Yj的最长公共子序列的长度,对应方向矩阵的项b[i,j]记录指示c[i,j]的值是由哪一个项计算得到的,递归关系如下式,示例如图6所示,方格中的数字为最长公共子序列长度c[i,j],方格中的箭头代表b[i,j],
3)步骤52,由方向矩阵b可以通过回溯方法快速构造序列X和Y的最长公共子序列,从b[m,n]开始,沿着箭头所指的方向在数组b中搜索,当b[i,j]遇时,表示xi=yj是最长公共子序列的一个项。示例如图6所示,灰色的方格为回溯时经过的路径,路径中箭头为的灰色的方格对应的项是最长公共子序列的一个项,最长公共子序列有4项,分别为(x2=y1)、(x3=y3)、(x4=y5)和(x6=y6)。
步骤34,若所有图片已经比较过,则转步骤35,否则根据步骤33的分段比较结果设置下一分段的起始图片编号first_x和first_y,然后转步骤32取下一个要比较的分段。若步骤33找到最大公共子序列,且最大公共子序列的最后一项为(xi=yj),则设置起始图片编号为
first_x=first_x+i first_y=first_y+j
若步骤33没有找到最大公共子序列,则将起始图片编号设为
步骤35,合并所有分段比较结果,对每一个分段的图片序列比较结果进行处理,将最大公共子序列中每个项的图片编号加上该分段的起始图片编号,得到每个公共项在整个图片序列中的图片编号,然后合并所有分段的最大公共子序列,最终得到两个完整图片序列的最大公共子序列,即两个视频的相同部分,完成整个视频比较过程。
本发明还提供了一种比较多个视频内容相似性的装置,包括:获取待比较视频模块,用于获取两个待比较视频;抽取图片序列模块,用于将要比较的视频抽取成两个图片序列;图片比较模块,用于对每一张图片生成描述其特征的指纹,进行两张对应图片的比较;图片序列比较模块,用于使用分段方式对两个图片序列、运用最长公共子序列算法进行比较;合并分段模块,用于合并各个分段的比较结果得到两个视频的异同;审核模块,用于审核两个视频的不同部分,省略相同部分。
所述抽取图片序列模块,用于将视频缩放到相同分辨率,剪切出视频的公共区域生成图片,生成对应的两个图片序列,序列中每一张图片对应视频中的每一帧;图片比较模块包括指纹生成模块、图片指纹比较模块;所述指纹生成模块,用于将每张图片像素统一为MxN、若干级灰度;对每张图片,计算MxN个像素值的平均值;将MxN个像素值与所述的平均值进行比较,如像素值大于等于平均值取1,如像素值小于平均值取0;将上述的MxN个比较结果,按在图片中的位置组成无符号整数,得到图片的指纹;所述M和N为正整数;所述图片指纹比较模块,用于取一段要比较的图片序列,从两个图片序列的第1张图片开始比较,依次比较两个序列的每一张图片;计算两个图片指纹序列中,所有对应比特位两个无符号整数的不相同的个数,如果汉明距离不超过第一阈值,说明两张图片相似;如果汉明距离大于第二阈值,则说明这是两张不同的图片。
所述图片序列比较模块,用于使用最长公共子序列LCS算法寻找两个图片序列的相同部分:计算最长公共子序列长度矩阵和对应的方向矩阵;由方向矩阵通过回溯方法构造两个序列的最长公共子序列;所述合并分段模块,用于合并所有分段比较结果,对每一个分段的图片序列比较结果进行处理,将最大公共子序列中每个项的图片编号加上该分段的起始图片编号,得到每个公共项在整个图片序列中的图片编号;合并所有分段的最大公共子序列,最终得到两个完整图片序列的最大公共子序列,即两个视频的相同部分。本发明所述比较视频内容相似性的装置通过对两个视频的智能比较,得到视频的剪切情况,从而辅助视频的人工审核,审核时可据此仅需观看视频的不同部分,从而减轻审核人员的工作量,加速视频审核的过程。
本发明还提供了一种比较视频内容相似性的设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述的方法步骤。本发明所述比较视频内容相似性的设备通过对两个视频的智能比较,得到视频的剪切情况,从而辅助视频的人工审核,审核时可据此仅需观看视频的不同部分,从而减轻审核人员的工作量,加速视频审核的过程。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。通信接口用于上述电子设备与其他设备之间的通信。存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processing,简称DSP)、专用集成电路(Application SpecificIntegratedCircuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。本发明并不限于上文讨论的实施方式。以上对具体实施方式的描述旨在于为了描述和说明本发明涉及的技术方案。基于本发明启示的显而易见的变换或替代也应当被认为落入本发明的保护范围。以上的具体实施方式用来揭示本发明的最佳实施方法,以使得本领域的普通技术人员能够应用本发明的多种实施方式以及多种替代方式来达到本发明的目的。
Claims (10)
1.一种比较视频内容相似性的方法,其特征在于,包括以下步骤:
获取两个以上待比较视频;
将要比较的视频抽取成图片序列;
对每一张图片生成描述其特征的指纹;
分段,运用最长公共子序列法对图片序列进行比较;
合并各个分段的比较结果,得到视频的相似性结果。
2.如权利要求1所述的比较视频内容相似性的方法,其特征在于,
所述待比较视频为两个视频;
所述将要比较的视频抽取成图片序列的步骤包括:
将视频缩放到相同大小,剪切视频的公共区域生成图片,得到对应的两个图片序列,序列中每一张图片对应视频中的每一帧。
3.如权利要求1所述的比较视频内容相似性的方法,其特征在于,所述对每一张图片生成描述其特征的指纹的步骤包括:
将每张图片像素统一为MxN、若干级灰度;
对每张图片,计算MxN个像素值的平均值;
将MxN个像素值与所述的平均值进行比较,如像素值大于等于平均值取1,如像素值小于平均值取0;
将上述的MxN个比较结果,按在图片中的位置组成无符号整数,得到图片的指纹;
所述M和N为正整数。
4.如权利要求1所述的比较视频内容相似性的方法,其特征在于,所述图片序列进行比对的步骤包括:
取一段要比较的图片序列,从两个图片序列的第1张图片开始比较,依次比较两个序列的每一张图片;
使用图片指纹之间的汉明距离来表征两张图片的差异;
使用最长公共子序列法寻找两个图片序列的相同部分。
5.如权利要求4所述的比较视频内容相似性的方法,其特征在于,所述使用图片指纹之间的汉明距离来表征两张图片的差异的步骤包括:
计算两个图片指纹序列中,所有对应比特位两个无符号整数的不相同的个数,如果汉明距离不超过第一阈值,说明两张图片相似;如果汉明距离大于第二阈值,则说明这是两张不同的图片;
使用最长公共子序列法寻找两个图片序列的相同部分的步骤包括:
计算最长公共子序列长度矩阵和对应的方向矩阵;
由方向矩阵通过回溯方法构造两个序列的最长公共子序列。
6.如权利要求1所述的比较视频内容相似性的方法,其特征在于,
若还有图片没有比较过,则取下一个要比较的分段进行比较,直到所有图片均比较过;
合并所有分段比较结果,对每一个分段的图片序列比较结果进行处理,将最大公共子序列中每个项的图片编号加上该分段的起始图片编号,得到每个公共项在整个图片序列中的图片编号;
合并所有分段的最大公共子序列,最终得到两个完整图片序列的最大公共子序列,即两个视频的相同部分。
7.一种比较视频内容相似性的装置,其特征在于,包括:
获取待比较视频模块,用于获取两个待比较视频;
抽取图片序列模块,用于将要比较的视频抽取成两个图片序列;
图片序列比较模块,用于对每一张图片生成描述其特征的指纹,分段,运用最长公共子序列法对图片序列进行比较;
合并分段模块,用于合并各个分段的比较结果,得到视频的相似性结果。
8.如权利要求7所述的比较视频内容相似性的装置,其特征在于,
所述待比较视频为两个视频;
所述抽取图片序列模块,用于将视频缩放到相同大小,剪切视频的公共区域生成图片,得到对应的两个图片序列,序列中每一张图片对应视频中的每一帧;
所述图片序列比较模块包括指纹生成模块和图片指纹比较模块;所述指纹生成模块,用于将每张图片像素统一为MxN、若干级灰度;对每张图片,计算MxN个像素值的平均值;将MxN个像素值与所述的平均值进行比较,如像素值大于等于平均值取1,如像素值小于平均值取0;将上述的MxN个比较结果,按在图片中的位置组成无符号整数,得到图片的指纹;所述M和N为正整数;
所述图片指纹比较模块,用于取一段要比较的图片序列,从两个图片序列的第1张图片开始比较,依次比较两个序列的每一张图片;计算两个图片指纹序列中,所有对应比特位两个无符号整数的不相同的个数,如果汉明距离不超过第一阈值,说明两张图片相似;如果汉明距离大于第二阈值,则说明这是两张不同的图片。
9.如权利要求8所述的比较视频内容相似性的装置,其特征在于,
所述图片序列比较模块,用于使用最长公共子序列法计算最长公共子序列长度矩阵和对应的方向矩阵;由方向矩阵通过回溯方法构造两个序列的最长公共子序列;
所述合并分段模块,用于合并所有分段比较结果,对每一个分段的图片序列比较结果进行处理,将最大公共子序列中每个项的图片编号加上该分段的起始图片编号,得到每个公共项在整个图片序列中的图片编号;合并所有分段的最大公共子序列,最终得到两个完整图片序列的最大公共子序列,即两个视频的相同部分。
10.一种比较视频内容相似性的设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811334406.8A CN109246446A (zh) | 2018-11-09 | 2018-11-09 | 比较视频内容相似性的方法、装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811334406.8A CN109246446A (zh) | 2018-11-09 | 2018-11-09 | 比较视频内容相似性的方法、装置和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109246446A true CN109246446A (zh) | 2019-01-18 |
Family
ID=65077984
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811334406.8A Pending CN109246446A (zh) | 2018-11-09 | 2018-11-09 | 比较视频内容相似性的方法、装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109246446A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109674494A (zh) * | 2019-01-29 | 2019-04-26 | 深圳瀚维智能医疗科技有限公司 | 超声扫查实时控制方法、装置、存储介质及计算机设备 |
CN112653885A (zh) * | 2020-12-10 | 2021-04-13 | 上海连尚网络科技有限公司 | 视频重复度获取方法、电子设备及存储介质 |
CN113379296A (zh) * | 2021-06-28 | 2021-09-10 | 平安信托有限责任公司 | 报表指标归一化方法、装置、电子设备及可读存储介质 |
WO2022020235A1 (en) * | 2020-07-20 | 2022-01-27 | Netflix, Inc. | Automated workflows from media asset differentials |
CN115442656A (zh) * | 2021-06-04 | 2022-12-06 | 中国移动通信集团浙江有限公司 | 视频片头片尾自动检测方法、装置、设备及存储介质 |
US11586724B1 (en) | 2019-10-10 | 2023-02-21 | Authidote LLC | System and methods for authenticating content |
CN115942042A (zh) * | 2022-12-26 | 2023-04-07 | 中国电子产业工程有限公司 | 一种基于改进lcs的网络视频识别匹配方法、装置和设备 |
CN117278802A (zh) * | 2023-11-23 | 2023-12-22 | 湖南快乐阳光互动娱乐传媒有限公司 | 一种视频剪辑痕迹的比对方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1461142A (zh) * | 2003-06-30 | 2003-12-10 | 北京大学计算机科学技术研究所 | 一种基于内容的视频片段检索方法 |
CN104636505A (zh) * | 2015-03-13 | 2015-05-20 | 北京世纪互联宽带数据中心有限公司 | 一种视频检索方法及装置 |
CN105139011A (zh) * | 2015-09-07 | 2015-12-09 | 浙江宇视科技有限公司 | 一种基于标识物图像的车辆识别方法及装置 |
US20160267179A1 (en) * | 2013-10-21 | 2016-09-15 | Tao Mei | Mobile Video Search |
CN107423621A (zh) * | 2017-03-21 | 2017-12-01 | 湘潭大学 | 一种针对恶意软件变种的高效识别算法 |
-
2018
- 2018-11-09 CN CN201811334406.8A patent/CN109246446A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1461142A (zh) * | 2003-06-30 | 2003-12-10 | 北京大学计算机科学技术研究所 | 一种基于内容的视频片段检索方法 |
US20160267179A1 (en) * | 2013-10-21 | 2016-09-15 | Tao Mei | Mobile Video Search |
CN104636505A (zh) * | 2015-03-13 | 2015-05-20 | 北京世纪互联宽带数据中心有限公司 | 一种视频检索方法及装置 |
CN105139011A (zh) * | 2015-09-07 | 2015-12-09 | 浙江宇视科技有限公司 | 一种基于标识物图像的车辆识别方法及装置 |
CN107423621A (zh) * | 2017-03-21 | 2017-12-01 | 湘潭大学 | 一种针对恶意软件变种的高效识别算法 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109674494B (zh) * | 2019-01-29 | 2021-09-14 | 深圳瀚维智能医疗科技有限公司 | 超声扫查实时控制方法、装置、存储介质及计算机设备 |
CN109674494A (zh) * | 2019-01-29 | 2019-04-26 | 深圳瀚维智能医疗科技有限公司 | 超声扫查实时控制方法、装置、存储介质及计算机设备 |
US11586724B1 (en) | 2019-10-10 | 2023-02-21 | Authidote LLC | System and methods for authenticating content |
WO2022020235A1 (en) * | 2020-07-20 | 2022-01-27 | Netflix, Inc. | Automated workflows from media asset differentials |
US11659214B2 (en) | 2020-07-20 | 2023-05-23 | Netflix, Inc. | Automated workflows from media asset differentials |
CN112653885A (zh) * | 2020-12-10 | 2021-04-13 | 上海连尚网络科技有限公司 | 视频重复度获取方法、电子设备及存储介质 |
CN112653885B (zh) * | 2020-12-10 | 2023-10-03 | 上海连尚网络科技有限公司 | 视频重复度获取方法、电子设备及存储介质 |
CN115442656A (zh) * | 2021-06-04 | 2022-12-06 | 中国移动通信集团浙江有限公司 | 视频片头片尾自动检测方法、装置、设备及存储介质 |
CN115442656B (zh) * | 2021-06-04 | 2023-08-15 | 中国移动通信集团浙江有限公司 | 视频片头片尾自动检测方法、装置、设备及存储介质 |
CN113379296A (zh) * | 2021-06-28 | 2021-09-10 | 平安信托有限责任公司 | 报表指标归一化方法、装置、电子设备及可读存储介质 |
CN115942042A (zh) * | 2022-12-26 | 2023-04-07 | 中国电子产业工程有限公司 | 一种基于改进lcs的网络视频识别匹配方法、装置和设备 |
CN117278802A (zh) * | 2023-11-23 | 2023-12-22 | 湖南快乐阳光互动娱乐传媒有限公司 | 一种视频剪辑痕迹的比对方法及装置 |
CN117278802B (zh) * | 2023-11-23 | 2024-02-13 | 湖南快乐阳光互动娱乐传媒有限公司 | 一种视频剪辑痕迹的比对方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109246446A (zh) | 比较视频内容相似性的方法、装置和设备 | |
US20210064654A1 (en) | Identifying Video Content via Fingerprint Matching | |
CN110163079B (zh) | 视频检测方法及装置、计算机可读介质和电子设备 | |
CN110688524B (zh) | 视频检索方法、装置、电子设备及存储介质 | |
EP3271865B1 (en) | Detecting segments of a video program | |
US9323840B2 (en) | Video fingerprinting | |
CN108073902B (zh) | 基于深度学习的视频总结方法、装置及终端设备 | |
US9269025B1 (en) | Object detection in images | |
WO2023040506A1 (zh) | 一种基于模型的数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品 | |
CN113434716B (zh) | 一种跨模态信息检索方法和装置 | |
WO2015167901A1 (en) | Video fingerprinting | |
CN108881947A (zh) | 一种直播流的侵权检测方法及装置 | |
CN111836118B (zh) | 视频处理方法、装置、服务器及存储介质 | |
TWI803243B (zh) | 圖像擴增方法、電腦設備及儲存介質 | |
WO2017070841A1 (zh) | 图像处理方法和装置 | |
CN111708909B (zh) | 视频标签的添加方法及装置、电子设备、计算机可读存储介质 | |
CN106503112B (zh) | 视频检索方法和装置 | |
CN108345700B (zh) | 文章代表图片的选取方法、装置和计算机设备 | |
US12081827B2 (en) | Determining video provenance utilizing deep learning | |
CN108921023A (zh) | 一种确定低质量人像数据的方法及装置 | |
WO2019127940A1 (zh) | 视频分类模型训练方法、装置、存储介质及电子设备 | |
CN111783812A (zh) | 违禁图像识别方法、装置和计算机可读存储介质 | |
CN113033677A (zh) | 视频分类方法、装置、电子设备和存储介质 | |
US9928408B2 (en) | Signal processing | |
WO2020233324A1 (zh) | 终端设备性能测试的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190118 |
|
RJ01 | Rejection of invention patent application after publication |