CN110826365B - 一种视频指纹生成方法和装置 - Google Patents

一种视频指纹生成方法和装置 Download PDF

Info

Publication number
CN110826365B
CN110826365B CN201810905169.XA CN201810905169A CN110826365B CN 110826365 B CN110826365 B CN 110826365B CN 201810905169 A CN201810905169 A CN 201810905169A CN 110826365 B CN110826365 B CN 110826365B
Authority
CN
China
Prior art keywords
shot
time slice
sequence
current
lens
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810905169.XA
Other languages
English (en)
Other versions
CN110826365A (zh
Inventor
陈长国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201810905169.XA priority Critical patent/CN110826365B/zh
Priority to EP19846876.1A priority patent/EP3835974B1/en
Priority to PCT/CN2019/099051 priority patent/WO2020029883A1/zh
Publication of CN110826365A publication Critical patent/CN110826365A/zh
Priority to US17/170,447 priority patent/US11961299B2/en
Application granted granted Critical
Publication of CN110826365B publication Critical patent/CN110826365B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/48Matching video sequences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes

Abstract

本申请提出一种视频指纹生成方法和装置,所述方法包括:对视频内容进行镜头边界检测;根据镜头边界的位置点,确定每一个镜头的持续时间,将所述每一个镜头的持续时间组成镜头边界时间片序列;根据获得所述时间片序列获得视频指纹信息。

Description

一种视频指纹生成方法和装置
技术领域
本发明涉及视频处理技术领域,尤其涉及一种视频指纹生成方法和装置。
背景技术
在网站中,不同用户可能会上传具有相同内容的视频文件,即使是同一用户,也可能多次上传具有相同内容的视频文件,所以网站中的视频文件存在较为严重的重复问题。实际应用中,视频网站需要对用户上传的视频文件进行去重,以便在向用户展示搜索结果时,能够对具有相同内容的视频文件进行去重处理。
现有的一种重复视频文件确定方法是:图片哈希技术,对于训练图像和查询图像都需要进行特征的提取,之后通过哈希函数的转化,压缩为一定数目的编码序列,该过程称为哈希编码。然后将得到的哈希编码,进行汉明距离的计算,在设置的汉明距离阈值范围内再对候选样本做欧式距离排序,也就是重排,最后返回检索到的图像,但是这种方法存在一定的缺点,对于视频内容的篡改,生成的哈希码有很大的不同,导致检索不到相似的内容,也就是说,在视频文件去重处理中,不会将这些具有相同内容的图片作为重复视频文件予以考虑。这样,对于长视频图片内容被裁剪,被旋转等存在大量的漏检的问题。
发明内容
本申请提供一种视频指纹生成方法和装置,快速有效的解决影像内容的重复性检测问题。
采取的技术方案如下:
第一方面,本发明提供一种视频指纹生成方法,包括:
对视频内容进行镜头边界检测;
根据镜头边界的位置点,确定每一个镜头的持续时间,将所述每一个镜头的持续时间组成镜头边界时间片序列;
根据获得所述时间片序列获得视频指纹信息。
优选地,根据获得所述时间片序列获得视频指纹信息包括:
根据获得所述时间片序列中当前镜头的时间片元素与相邻镜头的时间片元素的差值,获得当前镜头的视频指纹信息。
优选地,根据获得所述时间片序列中当前镜头的时间片元素与相邻镜头的时间片元素的差值,获得当前镜头的视频指纹信息包括:
分别计算所述时间片序列中当前镜头的时间片元素与其前一个镜头的时间片元素和后一个镜头的时间片元素的量化差值;
将当前镜头的时间片元素对应的两个量化差值作为所述元素的索引项,
将当前镜头的时间片元素的索引项与所述视频的视频序号和所述镜头的时间片的镜头序号作为当前镜头的指纹信息。
优选地,对视频内容进行镜头边界检测包括:
对所述视频内容的每一帧图像进行处理获得预设尺寸的灰度图像;
计算每一帧图像的归一化直方图;
计算每一帧图像的归一化累积直方图;
计算每相邻两帧图像的累积直方图的差值,形成差值序列;
对所述差值序列采用预设大小的窗口进行平滑处理;
在时间长度为预设长度的时间窗口之内,计算所述差值序列的标准差;
如果当前窗口的值与标准差的差距满足预设条件,则确定当前窗口对应的图像是镜头边界的位置。
优选地,分别计算所述时间片序列中当前镜头的时间片元素与其前一个镜头的时间片元素和后一个镜头的时间片元素的量化差值包括:
利用如下公式计算所述时间片序列中的当前镜头的时间片元素Ti与其前一个镜头的时间片元素Ti-1的量化差值f(Ti,Ti-1):
Figure BDA0001760435000000031
其中,floor(*)表示向下取整,n为正整数,4≤n≤9。
优选地,获取所述镜头的时间片的镜头序号的方式包括:
根据当前镜头的持续时间在镜头边界时间片序列中的排序确定当前镜头的时间片的镜头序号。
第二方面,本发明提供一种视频指纹生成方法装置,包括:
边界检测模块,设置为对视频内容进行镜头边界检测;
时间计算模块,设置为根据镜头边界的位置点,确定每一个镜头的持续时间,将所述每一个镜头的持续时间组成镜头边界时间片序列;
指纹信息模块,设置为根据获得所述时间片序列获得视频指纹信息。
优选地,所述指纹信息模块根据获得所述时间片序列获得视频指纹信息包括:
根据获得所述时间片序列中当前镜头的时间片元素与相邻镜头的时间片元素的差值,获得当前镜头的视频指纹信息。
优选地,所述指纹信息模块包括:
量化差值单元,设置为分别计算所述时间片序列中当前镜头的时间片元素与其前一个镜头的时间片元素和后一个镜头的时间片元素的量化差值;
一级索引单元,设置为将当前镜头的时间片元素对应的两个量化差值作为所述元素的索引项,
二级索引单元,设置为将所述镜头的时间片元素的索引项与所述视频的视频序号和所述镜头的时间片的镜头序号作为当前镜头的指纹信息。
优选地,所述边界检测模块对视频内容进行镜头边界检测包括:
对所述视频内容的每一帧图像进行处理获得预设尺寸的灰度图像;
计算每一帧图像的归一化直方图;
计算每一帧图像的归一化累积直方图;
计算每相邻两帧图像的累积直方图的差值,形成差值序列;
对所述差值序列采用预设大小的窗口进行平滑处理;
在时间长度为预设长度的时间窗口之内,计算所述差值序列的标准差;
如果当前窗口的值与标准差的差距满足预设条件,则确定当前窗口对应的图像是镜头边界的位置。
优选地,所述量化差值单元分别计算所述时间片序列中当前镜头的时间片元素与其前一个镜头的时间片元素和后一个镜头的时间片元素的量化差值包括:
利用如下公式计算所述时间片序列中的当前镜头的时间片元素Ti与其前一个镜头的时间片元素Ti-1的量化差值f(Ti,Ti-1):
Figure BDA0001760435000000041
其中,floor(*)表示向下取整,n为正整数,4≤n≤9。
优选地,所述二级索引单元获取所述镜头的时间片的镜头序号的方式包括:
根据当前镜头的持续时间在镜头边界时间片序列中的排序确定当前镜头的时间片的镜头序号。
本申请和现有技术相比,具有如下有益效果:
本申请采用镜头的持续时间作为依据,利用归一化差值量化公式,得到的量化差值序列是整数。再采用二级倒排索引结构。生成的视频指纹信息码字短,并且具有高度的抗裁剪和抗旋转特性。对于其它常见的视频编辑类型的攻击,同样具有很好的鲁棒性。本方案采用的镜头检测技术将会对最终的结果产生直接的影响,但对镜头检测出错的情况仍然具有相当程度的容忍性能。
附图说明
图1为本发明实施例的一种视频指纹生成方法的流程图;
图2为本发明实施例的视频指纹生成过程的示意图;
图3为本发明实施例的镜头边界时间片序列示意图;
图4为本发明实施例的归一化差值量化过程的示意图;
图5为本发明实施例的一种视频指纹检索方法的流程图;
图6为本发明实施例的一种视频指纹生成装置的结构示意图;
图7为本发明实施例的指纹信息模块的结构示意图;
图8为本发明实施例的一种视频指纹检索装置的结构示意图。
具体实施方式
下面将结合附图及实施例对本申请的技术方案进行更详细的说明。
需要说明的是,如果不冲突,本申请实施例以及实施例中的各个特征可以相互结合,均在本申请的保护范围之内。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在一种配置中,进行视频指纹生成和检索的设备可包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存(memory)。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。内存可能包括一个或多个模块。
计算机可读介质包括永久性和非永久性、可移动和非可移动存储介质,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM),快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
实施例一
如图1和图2所示,本发明实施例提供一种视频指纹生成方法,包括:
S101、对视频内容进行镜头边界检测;
S102、根据镜头边界的位置点,确定每一个镜头的持续时间,将所述每一个镜头的持续时间组成镜头边界时间片序列;
S103、根据获得所述时间片序列获得视频指纹信息。
对于一段视频内容,由于经过了后期的人工编辑,会存在较多的场景切换。这种场景切换的表现形式很多样,例如包括镜头的突变,还包括一些特效的转场形式的场景切换。比较常见的类型包括淡入淡出型,马赛克特效转场,百叶窗特效转场等。不同的视频内容,其场景切换的位置和频率是不一样的。如果把一段视频内容所有场景切换的时间位置都准确的找出来,就得到了一个时间序列。对应的,任意一个时间序列,唯一对应一段视频内容。
本发明实施例对场景切换的位置检测做镜头边界检测。上述假设有一个前提是必须准确找到一部电影场景切换的位。置且镜头边界检测一般不会因为图像内容的裁剪,旋转而产生较大的影响,这意味本发明实施例的方法对于裁剪、旋转具有高度鲁棒性。
本实施例中,步骤S103中,根据获得所述时间片序列获得视频指纹信息包括:
根据获得所述时间片序列中当前镜头的时间片元素与相邻镜头的时间片元素的差值,获得当前镜头的视频指纹信息。
本实施例中,步骤S101中,对视频内容进行镜头边界检测包括:
采用基于累积直方图的方式对所述视频内容进行镜头边界检测。
具体地,采用基于累积直方图的方式对所述视频内容进行镜头边界检测包括:
S1、对所述视频内容的每一帧图像进行处理获得预设尺寸的灰度图像;
S2、计算每一帧图像的归一化直方图;
S3、计算每一帧图像的归一化累积直方图;
S4、计算每相邻两帧图像的累积直方图的差值,形成差值序列;
S5、对所述差值序列采用预设大小的窗口进行平滑处理;
S6、在时间长度为预设长度的时间窗口之内,计算所述差值序列的标准差;
S7、如果当前窗口的值与标准差的差距满足预设条件,则确定当前窗口对应的图像是镜头边界的位置。
如图3所示,以输入的视频内容为例,检测所述视频内容,获得的镜头边界位置如图3坐标轴上的脉冲箭头所示,每一个镜头的持续时间如图3坐标轴下的双向箭头所示。镜头检测的目的是对于输入的视频内容,确定镜头变化的时间点。
如图4所示,本实施例中,步骤S103根据获得所述时间片序列中当前镜头的时间片元素与相邻镜头的时间片元素的差值,获得当前镜头的视频指纹信息包括:
S1031、分别计算所述时间片序列中当前镜头的时间片元素与其前一个镜头的时间片元素和后一个镜头的时间片元素的量化差值;
S1032、将当前镜头的时间片元素对应的两个量化差值作为所述元素的索引项,
S1033、将所述镜头的时间片元素的索引项与所述视频的视频序号和所述镜头的时间片的镜头序号作为当前镜头的指纹信息。
本实施例中步骤S1031中,分别计算所述时间片序列中当前镜头的时间片元素与其前一个镜头的时间片元素和后一个镜头的时间片元素的量化差值包括:
利用如下公式计算所述时间片序列中的当前镜头的时间片元素Ti与其前一个镜头的时间片元素Ti-1的量化差值f(Ti,Ti-1):
Figure BDA0001760435000000071
其中,floor(*)表示向下取整,n为正整数,4≤n≤9。
本实施例中,
Figure BDA0001760435000000081
的取值范围为(-1,1),作加1运算后,取值范围为(0,2),作除2运算后,取值范围为(0,1),作乘以2n运算后,取值范围为(0,2n),可以转换为n为二进制数。优选地,n=6。
其中,获取所述镜头的时间片的镜头序号的方式包括:
根据当前镜头的持续时间在镜头边界时间片序列中的排序确定当前镜头的时间片的镜头序号。
实施例二
本实施例说明图片镜头边界检测处理的过程:
本实施例中采用基于累积直方图的镜头边界检测方法,具体流程如下:
1.1视频内容的帧图像归一化为256x256的灰度图片;
1.2.计算归一化直方图,计算直方图过程中每一个像素量化为6个比特;
1.3.计算归一化累积直方图;
1.4.计算相邻两帧累积直方图的差值;
1.5.对差值序列进行高斯平滑,平滑窗口大小为3;
1.6.在时间长度为1秒的时间窗口之内,计算差值序列的标准差,如果某个序列的值大于标准差的8倍以上,则认为是镜头边界的位置;
1.7.将滑动窗的位置向后移动一帧的位置,返回执行1.6,直到窗口达到最后的位置。
实施例三
本实施例说明利用时间片序列进行归一化差值量化计算的过程:
由于镜头检测存在误检和漏检,因此不能直接对比两个视频经过镜头检测得到的两个时间序列。而且,在实际场景中,两个相同的视频,也可能一个在时间轴上被裁剪只剩下一半,即在时间轴上不是对齐的。因此,本实施例采用连续的3个时间片序列生成特征。这3个时间片序列视为一个时间窗口。然后,时间窗口向下滑动。相邻的两个时间窗口是有重叠的。本实施例采用的方式可以应对漏检和误检的镜头。
本实施例采用归一化差值量化特征,具体计算公式如下:
对于任意相邻的两个镜头的时间片元素,
Figure BDA0001760435000000091
其中,floor(*)表示向下取整。
本实施例中,输出为一个6bit的无符号整数。
连续的3个相邻的镜头的时间片元素,按照上述公式计算获得12bit的整数,作为特征值,12bit的无符号整数是构建的索引项。
实施例四
如图4所示,本发明提供一种图片指纹检索方法,包括:
S201、获得输入视频内容的视频指纹信息;
S202、将所述输入视频内容的视频指纹信息与数据库中每个视频的视频指纹信息进行对比,当所述输入视频内容的视频指纹信息与数据库中的视频的视频指纹信息相同时,将所述输入视频内容确定为重复视频。
本实施例,所述的方法还包括:
将所述输入视频内容和所述数据库中的重复视频以相同标记符进行标记,以在向用户展示视频时,根据预设的选择要求,选择具有相同标记符的视频中的一个视频进行展示。
对于输入的视频内容,按照上述过程会生成多个的12bit无符号整数作为特征序列。在检索的结构里面,每一个镜头的指纹信息除了包括特征序列外,还附带所述镜头的镜头序号,以及对应的视频编号。12bit整数可以作为一个哈希表的索引,对应4096个哈希值。每一个特征都将被分散到这个哈希表里面。具体的内存结构如下:
Figure BDA0001760435000000101
有了上面的哈希倒排结构,就可以快速的完成检索的任务。即先通过12bit的整数获得当前特征对应的所有的视频序号以及对应的镜头序号。如果多个特征是同一个视频产生的,并且库里面已经保存了数据库的特征值,则他们对应的视频序号是相同,镜头序号是递增的。按照这个规则,可以快速过滤出最终想要的结果。
实施例五
如图6所示,本实施例提供一种视频指纹生成方法装置,包括:
边界检测模块100,设置为对视频内容进行镜头边界检测;
时间计算模块200,设置为根据镜头边界的位置点,确定每一个镜头的持续时间,将所述每一个镜头的持续时间组成镜头边界时间片序列;
指纹信息模块300,设置为根据获得所述时间片序列获得视频指纹信息。
本实施例中,所述指纹信息模块300根据获得所述时间片序列获得视频指纹信息包括:
根据获得所述时间片序列中当前镜头的时间片元素与相邻镜头的时间片元素的差值,获得当前镜头的视频指纹信息。
本实施例中,所述边界检测模块100对视频内容进行镜头边界检测包括:
采用基于累积直方图的方式对所述视频内容进行镜头边界检测。
所述边界检测模块100采用基于累积直方图的方式对所述视频内容进行镜头边界检测包括:
对所述视频内容的每一帧图像进行处理获得预设尺寸的灰度图像;
计算每一帧图像的归一化直方图;
计算每一帧图像的归一化累积直方图;
计算每相邻两帧图像的累积直方图的差值,形成差值序列;
对所述差值序列采用预设大小的窗口进行平滑处理;
在时间长度为预设长度的时间窗口之内,计算所述差值序列的标准差;
如果当前窗口的值与标准差的差距满足预设条件,则确定当前窗口对应的图像是镜头边界的位置。
如图7所示,所述指纹信息模块300包括:
量化差值单元,设置为分别计算所述时间片序列中当前镜头的时间片元素与其前一个镜头的时间片元素和后一个镜头的时间片元素的量化差值;
一级索引单元,设置为将当前镜头的时间片元素对应的两个量化差值作为所述元素的索引项,
二级索引单元,设置为将所述镜头的时间片元素的索引项与所述视频的视频序号和所述镜头的时间片的镜头序号作为当前镜头的指纹信息。
实施例六
如图8所示,本实施例提供一种图片指纹检索装置,包括:
获取模块400,设置为获得输入视频内容的视频指纹信息;
去重模块500,设置为将所述输入视频内容的视频指纹信息与数据库中每个视频的视频指纹信息进行对比,当所述输入视频内容的视频指纹信息与数据库中的视频的视频指纹信息相同时,将所述输入视频内容确定为重复视频。
本实施例中,所述的装置还包括标记模块600,设置为:
将所述输入视频内容和所述数据库中的重复视频以相同标记符进行标记,以在向用户展示视频时,根据预设的选择要求,选择具有相同标记符的视频中的一个视频进行展示。
虽然本发明所揭示的实施方式如上,但其内容只是为了便于理解本发明的技术方案而采用的实施方式,并非用于限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭示的核心技术方案的前提下,可以在实施的形式和细节上做任何修改与变化,但本发明所限定的保护范围,仍须以所附的权利要求书限定的范围为准。

Claims (8)

1.一种视频指纹生成方法,其特征在于,包括:
对视频内容进行镜头边界检测;
根据镜头边界的位置点,确定每一个镜头的持续时间,将所述每一个镜头的持续时间组成镜头边界时间片序列;
分别计算所述时间片序列中当前镜头的时间片元素与其前一个镜头的时间片元素和后一个镜头的时间片元素的量化差值;
将当前镜头的时间片元素对应的两个量化差值作为所述元素的索引项,
将当前镜头的时间片元素的索引项与所述视频的视频序号和所述镜头的时间片的镜头序号作为当前镜头的指纹信息。
2.如权利要求1所述的方法,其特征在于:所述对视频内容进行镜头边界检测包括:
对所述视频内容的每一帧图像进行处理获得预设尺寸的灰度图像;
计算每一帧图像的归一化直方图;
计算每一帧图像的归一化累积直方图;
计算每相邻两帧图像的累积直方图的差值,形成差值序列;
对所述差值序列采用预设大小的窗口进行平滑处理;
在时间长度为预设长度的时间窗口之内,计算所述差值序列的标准差;
如果当前窗口的值与标准差的差距满足预设条件,则确定当前窗口对应的图像是镜头边界的位置。
3.如权利要求1所述的方法,其特征在于:所述分别计算所述时间片序列中当前镜头的时间片元素与其前一个镜头的时间片元素和后一个镜头的时间片元素的量化差值包括:
利用如下公式计算所述时间片序列中的当前镜头的时间片元素Ti与其前一个镜头的时间片元素Ti-1的量化差值f(Ti,Ti-1):
Figure FDA0004094941480000021
其中,floor(*)表示向下取整,n为正整数,4≤n≤9。
4.如权利要求1所述的方法,其特征在于:获取所述镜头的时间片的镜头序号的方式包括:
根据当前镜头的持续时间在镜头边界时间片序列中的排序确定当前镜头的时间片的镜头序号。
5.一种视频指纹生成方法装置,其特征在于,包括:
边界检测模块,设置为对视频内容进行镜头边界检测;
时间计算模块,设置为根据镜头边界的位置点,确定每一个镜头的持续时间,将所述每一个镜头的持续时间组成镜头边界时间片序列;
指纹信息模块,所述指纹信息模块包括量化差值单元、一级索引单元和二级索引单元;
所述量化差值单元,设置为分别计算所述时间片序列中当前镜头的时间片元素与其前一个镜头的时间片元素和后一个镜头的时间片元素的量化差值;
所述一级索引单元,设置为将当前镜头的时间片元素对应的两个量化差值作为所述元素的索引项,
所述二级索引单元,设置为将所述镜头的时间片元素的索引项与所述视频的视频序号和所述镜头的时间片的镜头序号作为当前镜头的指纹信息。
6.如权利要求5所述的装置,其特征在于:所述边界检测模块对视频内容进行镜头边界检测包括:
对所述视频内容的每一帧图像进行处理获得预设尺寸的灰度图像;
计算每一帧图像的归一化直方图;
计算每一帧图像的归一化累积直方图;
计算每相邻两帧图像的累积直方图的差值,形成差值序列;
对所述差值序列采用预设大小的窗口进行平滑处理;
在时间长度为预设长度的时间窗口之内,计算所述差值序列的标准差;
如果当前窗口的值与标准差的差距满足预设条件,则确定当前窗口对应的图像是镜头边界的位置。
7.如权利要求5所述的装置,其特征在于:所述量化差值单元分别计算所述时间片序列中当前镜头的时间片元素与其前一个镜头的时间片元素和后一个镜头的时间片元素的量化差值包括:
利用如下公式计算所述时间片序列中的当前镜头的时间片元素Ti与其前一个镜头的时间片元素Ti-1的量化差值f(Ti,Ti-1):
Figure FDA0004094941480000031
其中,floor(*)表示向下取整,n为正整数,4≤n≤9。
8.如权利要求5所述的装置,其特征在于:所述二级索引单元获取所述镜头的时间片的镜头序号的方式包括:
根据当前镜头的持续时间在镜头边界时间片序列中的排序确定当前镜头的时间片的镜头序号。
CN201810905169.XA 2018-08-09 2018-08-09 一种视频指纹生成方法和装置 Active CN110826365B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201810905169.XA CN110826365B (zh) 2018-08-09 2018-08-09 一种视频指纹生成方法和装置
EP19846876.1A EP3835974B1 (en) 2018-08-09 2019-08-02 Method and device for generating video fingerprint
PCT/CN2019/099051 WO2020029883A1 (zh) 2018-08-09 2019-08-02 一种视频指纹生成方法和装置
US17/170,447 US11961299B2 (en) 2018-08-09 2021-02-08 Method and apparatus for generating video fingerprint

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810905169.XA CN110826365B (zh) 2018-08-09 2018-08-09 一种视频指纹生成方法和装置

Publications (2)

Publication Number Publication Date
CN110826365A CN110826365A (zh) 2020-02-21
CN110826365B true CN110826365B (zh) 2023-06-23

Family

ID=69413380

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810905169.XA Active CN110826365B (zh) 2018-08-09 2018-08-09 一种视频指纹生成方法和装置

Country Status (4)

Country Link
US (1) US11961299B2 (zh)
EP (1) EP3835974B1 (zh)
CN (1) CN110826365B (zh)
WO (1) WO2020029883A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113190713A (zh) * 2021-05-06 2021-07-30 百度在线网络技术(北京)有限公司 视频搜索方法及装置、电子设备和介质
CN113139094B (zh) * 2021-05-06 2023-11-07 北京百度网讯科技有限公司 视频搜索方法及装置、电子设备和介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007080133A2 (en) * 2006-01-16 2007-07-19 Thomson Licensing Method for determining and fingerprinting a key frame of a video sequence
WO2008113596A2 (de) * 2007-03-22 2008-09-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur zeitlichen segmentierung eines videos in videobildfolgen und zur auswahl von keyframes für das auffinden von bildinhalten unter einbeziehung einer subshot-detektion
CN101620629A (zh) * 2009-06-09 2010-01-06 中兴通讯股份有限公司 一种提取视频索引的方法、装置及视频下载系统
CN102685398A (zh) * 2011-09-06 2012-09-19 天脉聚源(北京)传媒科技有限公司 一种新闻视频场景生成方法
CN104867161A (zh) * 2015-05-14 2015-08-26 国家电网公司 一种视频处理方法及装置
CN108010044A (zh) * 2016-10-28 2018-05-08 央视国际网络无锡有限公司 一种视频边界检测的方法
WO2018102014A1 (en) * 2016-11-30 2018-06-07 Google Inc. Determination of similarity between videos using shot duration correlation

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8600113B2 (en) 2004-11-12 2013-12-03 The University Court Of The University Of St. Andrews System, method and computer program product for video fingerprinting
US8009861B2 (en) 2006-04-28 2011-08-30 Vobile, Inc. Method and system for fingerprinting digital video object based on multiresolution, multirate spatial and temporal signatures
WO2007148264A1 (en) 2006-06-20 2007-12-27 Koninklijke Philips Electronics N.V. Generating fingerprints of video signals
US8094872B1 (en) 2007-05-09 2012-01-10 Google Inc. Three-dimensional wavelet based video fingerprinting
US8265333B2 (en) 2007-07-27 2012-09-11 Synergy Sports Technology, Llc Systems and methods for generating bookmark video fingerprints
US8611422B1 (en) * 2007-06-19 2013-12-17 Google Inc. Endpoint based video fingerprinting
US9177209B2 (en) 2007-12-17 2015-11-03 Sinoeast Concept Limited Temporal segment based extraction and robust matching of video fingerprints
US8259177B2 (en) 2008-06-30 2012-09-04 Cisco Technology, Inc. Video fingerprint systems and methods
US8498487B2 (en) 2008-08-20 2013-07-30 Sri International Content-based matching of videos using local spatio-temporal fingerprints
US8422731B2 (en) * 2008-09-10 2013-04-16 Yahoo! Inc. System, method, and apparatus for video fingerprinting
US8345990B2 (en) * 2009-08-03 2013-01-01 Indian Institute Of Technology Bombay System for creating a capsule representation of an instructional video
US8229219B1 (en) 2009-08-06 2012-07-24 Google Inc. Full-length video fingerprinting
EP2437498A1 (en) 2010-09-30 2012-04-04 British Telecommunications Public Limited Company Digital video fingerprinting
CN102073864B (zh) * 2010-12-01 2015-04-22 北京邮电大学 四层结构的体育视频中足球项目检测系统及实现
US8538239B2 (en) * 2011-12-22 2013-09-17 Broadcom Corporation System and method for fingerprinting video
US8989376B2 (en) 2012-03-29 2015-03-24 Alcatel Lucent Method and apparatus for authenticating video content
CN102750339B (zh) * 2012-06-05 2014-04-16 北京交通大学 一种基于视频重构的重复片段定位方法
US8818037B2 (en) * 2012-10-01 2014-08-26 Microsoft Corporation Video scene detection
US9514502B2 (en) * 2015-01-21 2016-12-06 Interra Systems Inc. Methods and systems for detecting shot boundaries for fingerprint generation of a video
US10313710B1 (en) * 2017-07-31 2019-06-04 Amazon Technologies, Inc. Synchronizing encoding between encoders

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007080133A2 (en) * 2006-01-16 2007-07-19 Thomson Licensing Method for determining and fingerprinting a key frame of a video sequence
WO2008113596A2 (de) * 2007-03-22 2008-09-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur zeitlichen segmentierung eines videos in videobildfolgen und zur auswahl von keyframes für das auffinden von bildinhalten unter einbeziehung einer subshot-detektion
CN101620629A (zh) * 2009-06-09 2010-01-06 中兴通讯股份有限公司 一种提取视频索引的方法、装置及视频下载系统
CN102685398A (zh) * 2011-09-06 2012-09-19 天脉聚源(北京)传媒科技有限公司 一种新闻视频场景生成方法
CN104867161A (zh) * 2015-05-14 2015-08-26 国家电网公司 一种视频处理方法及装置
CN108010044A (zh) * 2016-10-28 2018-05-08 央视国际网络无锡有限公司 一种视频边界检测的方法
WO2018102014A1 (en) * 2016-11-30 2018-06-07 Google Inc. Determination of similarity between videos using shot duration correlation

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Rui L 等.A Video Shot Boundary Detection Approach Based on CNN Feature.IEEE International Symposium on Multimedia. IEEE Computer Society.2017,全文. *
丁洪丽 ; 陈怀新 ; .基于累积直方图的视频镜头边界检测方法.电讯技术.2008,(03),全文. *

Also Published As

Publication number Publication date
WO2020029883A1 (zh) 2020-02-13
EP3835974B1 (en) 2024-01-24
EP3835974A1 (en) 2021-06-16
US20210166036A1 (en) 2021-06-03
US11961299B2 (en) 2024-04-16
CN110826365A (zh) 2020-02-21
EP3835974A4 (en) 2022-05-04

Similar Documents

Publication Publication Date Title
RU2628192C2 (ru) Устройство для семантической классификации и поиска в архивах оцифрованных киноматериалов
US8363960B2 (en) Method and device for selection of key-frames for retrieving picture contents, and method and device for temporal segmentation of a sequence of successive video pictures or a shot
JP5980311B2 (ja) ビデオ・シグネチャ
JP5711387B2 (ja) 映像を比較する方法および装置
CN105095435A (zh) 一种图像高维特征的相似比较方法及装置
EP2657884B1 (en) Identifying multimedia objects based on multimedia fingerprint
CN107633023B (zh) 一种图像去重方法和装置
CN106557545B (zh) 视频检索方法和装置
CN109964221B (zh) 使用镜头持续时间相关来确定视频之间的相似性
CN110162665B (zh) 视频搜索方法、计算机设备及存储介质
Valsesia et al. Large-scale image retrieval based on compressed camera identification
CN110826365B (zh) 一种视频指纹生成方法和装置
US10924637B2 (en) Playback method, playback device and computer-readable storage medium
CN114117120A (zh) 基于内容分析的视频文件智能索引生成系统及方法
CN114708287A (zh) 一种镜头边界检测方法、设备及存储介质
JP2020525949A (ja) メディア検索方法及び装置
CN116340551A (zh) 一种相似内容确定方法和装置
CN104850600A (zh) 一种用于搜索包含人脸的图片的方法和装置
CN116188815A (zh) 一种视频相似度检测方法、系统、存储介质和电子设备
Bhaumik et al. Towards redundancy reduction in storyboard representation for static video summarization
CN114372169A (zh) 一种同源视频检索的方法、装置以及存储介质
CN111143619B (zh) 视频指纹生成方法、检索方法、电子设备及介质
CN112446361A (zh) 一种训练数据的清洗方法及设备
Bhaumik et al. Real-time storyboard generation in videos using a probability distribution based threshold
CN111008301B (zh) 一种以图搜视频的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40024336

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant