CN103744973A - 基于多特征哈希的视频拷贝检测方法 - Google Patents

基于多特征哈希的视频拷贝检测方法 Download PDF

Info

Publication number
CN103744973A
CN103744973A CN201410012758.7A CN201410012758A CN103744973A CN 103744973 A CN103744973 A CN 103744973A CN 201410012758 A CN201410012758 A CN 201410012758A CN 103744973 A CN103744973 A CN 103744973A
Authority
CN
China
Prior art keywords
video
key frame
hash
feature
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410012758.7A
Other languages
English (en)
Inventor
邓成
彭海燕
杨延华
李洁
王颖
高新波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201410012758.7A priority Critical patent/CN103744973A/zh
Publication of CN103744973A publication Critical patent/CN103744973A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于多特征哈希的视频拷贝检测方法,主要解决现有视频拷贝检测算法不能有效平衡检测效率和检测精度的问题。其实现步骤是:(1)提取关键帧的塔型梯度方向直方图PHOG为关键帧的全局特征;(2)提取关键帧的基于尺度不变特征变换SIFT的加权对比度直方图为关键帧的局部特征;(3)利用相似度保持的多特征哈希学习SPM2H算法建立目标函数,通过优化求解得到L个哈希函数;(4)利用L个哈希函数,将数据库视频关键帧和查询视频关键帧映射为L维的哈希码;(5)通过特征匹配判断查询视频是否为拷贝视频。本发明对多种攻击具有良好的鲁棒性,可用于互联网上数字视频的版权保护、拷贝控制及数据挖掘。

Description

基于多特征哈希的视频拷贝检测方法
技术领域
本发明属于信息安全技术领域,具体的说是一种视频特征提取和拷贝检测的方法,该方法能有效抵抗常规视频攻击、几何攻击及组合攻击,可用于互联网上数字视频的版权保护、视频内容分析及拷贝控制领域。
背景技术
随着数字技术的不断进步和计算机网络的日益普及,多媒体数据正逐渐成为人们获取信息的重要来源,特别是互联网视频网站越来越多。数字化的多媒体数据获取容易、复制简单并且传播迅速,不仅给多媒体信息的存取提供了极大的便利,而且极大提高了信息表达的效率和准确性,但由此引发的盗版问题、版权纷争和数据管理也成为日益严重的社会问题。例如,拷贝视频侵犯了数字视频版权所有者的权利和经济效益,造成了严重的盗版和侵权问题;而一些具有特殊意义的视频信息,如涉及司法诉讼、政府机要等信息如果遭到恶意攻击和篡改伪造,则会给司法公正和国家安全带来极大的危害;同时人们可以随意地对网络上的视频进行复制、编辑和传播,导致搜索引擎的搜索结果重复,大大的降低了搜索的效率;而且,随着视频网站的增多以及视频检索的广泛应用,这些拷贝视频正成为“垃圾视频”,危害着视频网络。因此如何在利用多媒体信息和计算机网络的同时,又可以有效的保护知识产权、保障信息安全和保证搜索精度已成为一个亟需解决的现实问题。视频拷贝检测技术是实现数字视频版权保护及数据库管理的有效方法,已成为多媒体信息安全领域的一个研究热点。
视频拷贝检测技术不需要向原始视频中嵌入任何信息,其提取的特征序列包含了视频内容的足够信息,在实际应用中可以通过测量查询视频与参考视频之间的距离来判断查询视频是否是参考视频的拷贝。一个典型的视频拷贝检测技术的步骤如下:(1)从原始参考视频和查询视频中提取视频特征序列;(2)数据库搜索;(3)对参考视频特征序列和查询视频特征序列按照某种度量方式进行比较,若两者之间的距离小于既定阈值,则认为查询视频是拷贝视频。在以上步骤中,最重要的是提取能够代表视频内容且对视频的各种攻击具有鲁棒性的视频特征,这也是研究者首要考虑的问题。
近年来,许多专家学者从不同的角度研究视频拷贝检测,但依然有两个问题没有解决。首先是已存在的大部分方法用单一特征描述视频内容,然而不同的视觉特征有截然不同的描述功能,比如全局特征可以有效地描述视频的全局信息,但对全局攻击的鲁棒性较弱,局部特征可以有效地描述视频的局部信息,但对视频的局部攻击比较敏感,因此单一特征构造的视频信息无法全面的描述视频内容,缺乏广泛的鲁棒性,然而直接级联多种视觉特征会造成维数灾难,降低检测效率;其次已存在的大部分索引方法旨在提高检测效率而忽略了检测精度。
发明内容
本发明的目的在于针对上述已有技术的不足,提出一种基于多特征哈希的视频拷贝检测方法,以挖掘不同视觉特征之间的互补性,在保证视频拷贝检测精度的同时,提高检测效率。
实现本发明目的的技术方案是:将视频看作一系列关键帧的组合,提取关键帧的多种特征,设计有效的目标函数,学习能够保持原始空间中相似结构的哈希函数--即利用多种视觉特征中蕴含的互补信息构建多特征哈希,最后利用产生的哈希函数将数据库及查询视频的高维特征进行哈希化处理,得到有区分力的哈希码。哈希码保留了原始数据的相似性,提高视频拷贝检测在不同攻击下的检索精度和检索效率。其具体步骤包括如下:
(1)多特征提取步骤:
(1a)给定视频V,将视频V分割成一系列连续的相等长度的视频镜头V={C1,C2,…,Ci,...,CI},Ci是视频V的第i个镜头,i=1,2,...,I,I是视频镜头的个数;
(1b)将每一个视频镜头的帧率统一为每秒30帧,将所有的视频帧转换为宽度为320,高度为240的灰度图像;
(1c)对每一个视频镜头进行降6采样处理,即每6个视频帧提取一个关键帧;
(1d)提取关键帧的塔型梯度方向直方图PHOG为关键帧的全局特征;
(1e)利用尺度不变特征变换SIFT检测算子,提取关键帧的特征点,获得关键帧的特征点集,在关键帧大小为120×40的中心区域内,选择特征强度最大的特征点作为圆心,构造半径为R的稳定的圆形特征区域,若该区域不存在特征点,则选择关键帧的中心为圆心,提取基于尺度不变特征变换SIFT的加权对比度直方图为关键帧的局部特征;
(2)特征映射步骤:
(2a)利用相似度保持的多特征哈希学习SPM2H算法建立目标函数,通过优化求解得到L个哈希函数{h1,h2,…,hl,...,hL},hl是第l个哈希函数,l=1,2,...,L;
(2b)对于每个关键帧,结合提取的全局特征和局部特征,由每一个哈希函数产生一位哈希码,利用L个哈希函数,使数据库视频的关键帧和查询视频的关键帧映射为L维的哈希码;
(3)特征匹配步骤:
(3a)测量查询视频镜头Q与数据库中的参考视频镜头P的相似度,表示为:
sim ( Q , P ) = Σ Y i ∈ G Q ( min Y j ∈ G P ( sim ( Y i , Y j ) ) ) ,
式中,Yi是查询视频镜头Q的第i个关键帧的哈希码,Yj是数据库中参考视频镜头P的第j个关键帧的哈希码,GQ是查询视频镜头Q的关键帧集合,GP是数据库中参考视频镜头P的关键帧集合,式中sim(Yi,Yj)是视频关键帧Yi与Yj的相似度,表示为:
sim ( Y i , Y j ) = 1 L Σ L Y i ⊗ Y j ,
式中,L是哈希码的维数,
Figure BDA0000455833190000033
是异或操作;
(3b)定义匹配检测阈值ε:设数据库中的视频镜头为A个,分别为{P1,P2,...,Pb,...,PA},b=1,2,...,A,Pb为数据库中第b个视频镜头,计算查询视频镜头Q与数据库中每个视频镜头Pb的相似度,得到A个相似度值为{sim(Q,P1),sim(Q,P2),...,sim(Q,Pb),...,sim(Q,PA)},对其从小到大排列,在最大值与最小值之间均匀取值作为匹配检测阈值ε;
(3c)将查询视频镜头Q与数据库中的参考视频镜头P的相似度sim(Q,P)与匹配检测阈值ε进行比较,如果sim(Q,P)≤ε,则认为查询视频镜头Q是数据库中参考视频镜头P的拷贝,如果sim(Q,P)>ε,则认为查询视频镜头Q不是数据库中参考视频镜头P的拷贝。
本发明具有以下优点:
(1)本发明利用全局特征塔型梯度方向直方图PHOG与局部特征基于尺度不变特征变换SIFT的加权对比度直方图来描述视频关键帧,增强了视频拷贝检测对多种攻击的鲁棒性,提高了视频拷贝检测的精度;
(2)本发明利用哈希方法将原始特征空间中的高维特征映射为低维特征,降低了数据的存储空间,提高了视频拷贝检测的效率;
(3)本发明利用相似度保持的多特征哈希学习SPM2H算法挖掘不同特征的互补性,得到了训练视频的最优哈希码及有区分力的哈希函数,同时将查询视频利用得到的哈希函数映射为其对应的哈希码,使得哈希码保留了视频在原始特征空间下的相似性,提高了视频拷贝检测在不同攻击下的性能。
附图说明
图1是本发明的实施总流程图;
图2是本发明提取出的全局特征示意图;
图3是本发明中提取局部特征的子流程图;
图4是本发明的仿真结果图。
具体实施方案
参照图1,本发明的实施包括多特征提取、特征映射和特征匹配三个方面。
一.多特征提取
步骤1:给定视频V,将视频V分割成一系列连续的相等长度的视频镜头V={C1,C2,…,Ci,...,CI},Ci是视频V的第i个镜头,i=1,2,...,I,I是视频镜头的个数。
步骤2:将每一个视频镜头的帧率统一为每秒30帧,将所有的视频帧转换为宽度为320,高度为240的灰度图像。
步骤3:对每一个视频镜头进行降6采样处理,即每6个视频帧提取一个关键帧I′。
步骤4:提取关键帧I′的塔型梯度方向直方图PHOG作为关键帧I′的全局特征。
4.1)采用典型的Canny边缘检测算子提取关键帧I′的边缘信息,得到关键帧I′的边缘图像像I0,同时得到边缘图像像I0的梯度幅值矩阵G={g1,1,...,g1,240;...;...,ge,f,...;...}及梯度方向矩阵R={α1,1,...,α1,240;...;...,αe,f,...;...},ge,f是边缘图像像I0的第e行第f列像素的梯度幅值,αe,f是边缘图像像I0的第e行第f列像素的梯度方向;
4.2)将梯度方向区间0~360°划分为8个方向子区间{o0,...,oj,...,o8},j=1,2,...,8,oj是第j个方向子区间;
4.3)统计边缘图像I0中像素的梯度方向落在方向子区间oj内的像素集合Pj,并将像素集合Pj中所有像素的梯度幅值相加,得到一个方向子区间oj的梯度值,对每一个方向子区间依次计算其梯度值,得到8个方向子区间的8个梯度值,这8个方向子区间的梯度值构成边缘图像I0的8维梯度方向直方图;
4.4)对边缘图像I0进行1级金字塔型分割,即将边缘图像I0平均分成四个大小相同的区域,得到1级金字塔边缘图像I1
4.5)按照步骤4.3)计算边缘图像I0的8维梯度方向直方图的方法,对1级金字塔边缘图像I1的每个区域依次计算其8维梯度方向直方图,依照从上到下,从左到右的顺序将4个区域的8维梯度方向直方图进行级联,得到1级金字塔边缘图像I1的32维梯度方向直方图;
4.6)将边缘图像I0的8维梯度方向直方图与1级金字塔边缘图像I1的32维梯度方向直方图进行级联并采用L2范数进行归一化,得到关键帧I′的40维梯度方向直方图PHOG,作为关键帧I′的全局特征。
本步骤4提取的全局特征如图2所示,其中关键帧I′如图2(a)所示,其边缘图像I0如图2(b)所示,1级金字塔边缘图像I1如图2(c)所示。
步骤5:提取基于尺度不变特征变换SIFT的加权对比度直方图作为关键帧I′的局部特征。
参照图3,本步骤的具体实现如下:
5.1)利用典型的尺度不变特征变换SIFT特征点检测算子,提取关键帧I′的尺度不变特征变换SIFT特征点,获得关键帧I′的尺度不变特征变换SIFT特征点集;
5.2)在关键帧I′大小为120×40的中心区域内,选择特征强度最大的尺度不变特征变换SIFT特征点作为圆心,构造半径为R=100的稳定的圆形特征区域,若该区域不存在尺度不变特征变换SIFT特征点,则选择关键帧I′的中心为圆心,构造半径为R=100的稳定的圆形特征区域;
5.3)将圆形特征区域进行极坐标划分:
5.3a)将圆形特征区域先分成4个角度区间:
Figure BDA0000455833190000051
5.3b)将圆形特征区域分为3级半径区间:40,70,100;
5.3c)按照半径递增的顺序,在每一级半径区域内,按照角度从小到大遍历,组成12个相邻且不重叠的区域{R1,R2,...,Rk,...,R12},k=1,2,...,12;
5.4)计算区域Rk中的像素点p的灰度值I(p)与圆心点pc的灰度值I(pc)的差值C(p):
C(p)=I(p)-I(pc);
5.5)计算区域Rk中的所有像素点的差值为正的对比度
Figure BDA0000455833190000061
和差值为负的对比度
Figure BDA0000455833190000062
分别为:
H R k + ( p c ) = | Σ { C ( p ) | p ∈ R k ^ C ( p ) ≥ 0 } # R k + | ,
H R k - ( p c ) = | &Sigma; { C ( p ) | p &Element; R k ^ C ( p ) < 0 } # R k - | ,
Figure BDA0000455833190000065
为C(p)≥0的像素点个数,
Figure BDA0000455833190000066
为C(p)<0的像素点个数,^是求与操作,{C(p)|p∈Rk^C(p)≥0}是满足p∈Rk且C(p)≥0的C(p)值,{C(p∈)pk|^R是满足p∈Rk且C(p)<0的C(p)值;
5.6)依次计算区域Rk中的所有像素点差值为正的对比度
Figure BDA0000455833190000067
和差值负的对比度
Figure BDA0000455833190000068
得到24维的对比度直方图
Figure BDA0000455833190000069
对三级半径区域的对比度乘以权值,得到加权对比度直方图,该权值按照半径递增的顺序依次为(0.4,0.35,0.25)。
二.特征映射
步骤6:利用相似度保持的多特征哈希学习SPM2H算法建立目标函数。
6.1)构建每种视觉特征下的局部结构信息,即关联矩阵:
Figure BDA00004558331900000610
式中,
Figure BDA00004558331900000611
是在第m种视觉特征下第p个关键帧和第q个关键帧的关联度,NK(·)表示K近邻,^是求与操作,表示在第m种视觉特征下第p个关键帧属于第q个关键帧的K近邻且第q个关键帧属于第p个关键帧的K近邻,
Figure BDA00004558331900000613
是第p个关键帧的第m种特征向量,
Figure BDA00004558331900000614
是第q个关键帧的第m种特征向量;
6.2)建立相似度保持的多特征哈希学习SPM2H算法的目标函数:
O = min Y &Sigma; m = 1 M &Sigma; p , q N S p , q ( m ) ( d ( x p ( m ) , x q ( m ) ) - d ~ ( x p ( m ) , x q ( m ) ) ) 2
s.t.Y∈{-1,1}N×L,Y1=0,YYT=I,
式中,
Figure BDA00004558331900000616
是对Y求最小操作,L是哈希码的维数,M是视觉特征的数目,N是训练关键帧的数目,s.t.·是约束条件,Y=[Y1,...,YN]∈RN×L是所有训练关键帧在多种特征下的哈希码,
Figure BDA0000455833190000071
是第p个关键帧的第m种特征向量
Figure BDA0000455833190000072
与第q个关键帧的第m种特征向量
Figure BDA0000455833190000073
之间的归一化距离,
Figure BDA0000455833190000074
是第p个关键帧的哈希码Yp与第q个关键帧的哈希码Yq之间的归一化距离,表示为:
d ~ ( x p ( m ) , x q ( m ) ) = 1 L &Sigma; L Y p &CircleTimes; Y q .
步骤7:通过优化求解得到L个哈希函数{h1,h2,…,hl,...,hL},hl是第l个哈希函数,l=1,2,...,L。
7.1)随机初始化哈希码Y=[y11,...,y1L;...;...,yuv,...;...;...,ygv,...;...;yN1,...,yNL],定义阈值向量m=[m1,m2,...,mv,...,mL],mv为m的第v列元素,其取值为哈希码Y的第v列元素的中间值,v=1,2,...,L,L是哈希码的维数,yuv为哈希码Y的第u行第v列元素,u=1,2,...,N,N是训练关键帧的数目,如果yuv≥mv,则yuv置为1,如果yuv<mv,则yuv置为-1,依次进行,此时哈希码Y为二值矩阵;
7.2)计算目标函数O的初始值为Dm,定义门限阈值T=10-6,定义最优哈希码为Y0,将初始值Dm与门限阈值T进行比较,如果Dm≤T,则最优哈希码Y0=Y,执行步骤7.6),如果Dm>T,则执行步骤7.3);
7.3)比较哈希码Y的第u行第v列元素yuv与第g行第v列元素ygv是否相同,1≤u≤N,1≤g≤N:
如果yuv与ygv相同,则给g加1,返回步骤7.3);
如果yuv与ygv不相同,则(yuv,ygv)有两种取值情况,即(1,-1)与(-1,1),对于这两种取值情况分别计算目标函数O的值,并比较两次得到的目标函数O的值大小,选择其较小值对应的取值情况来更新(yuv,ygv),根据更新后的(yuv,ygv)再更新哈希码Y;
7.4)对于哈希码Y的第u行依次执行步骤7.3),1≤u≤N;
7.5)对于哈希码Y的第v列迭代执行步骤7.3)与步骤7.4),直到每次迭代执行前目标函数O的值与迭代执行后目标函数O的值之差小于门限阈值T时,再执行哈希码Y的第v+1列的迭代,直到v=L时,得到最优哈希码Y0=Y;
7.6)采用线性变换表示哈希函数hl(xt):
h l ( x t ) = w l T x t + b l ,
式中,wl∈Rd×1是转换向量,
Figure BDA0000455833190000087
是wl的转置向量,l=1,2,...,L,bl是偏移量,
Figure BDA0000455833190000081
是第t个关键帧在所有视觉特征下的直接级联特征,d是级联特征的维数,表示为:
Figure BDA0000455833190000082
dm是第m种视觉特征的维数;
7.7)整合通过目标函数O得到的最优哈希码Y0及哈希函数hl(xt),建立一致性表达式:
min W , b &Sigma; l = 1 L ( &Sigma; t = 1 N | | h l ( x t ) - y tl | | F 2 + &lambda;&Omega; ( h l ) ) ,
由一致性表达式及哈希函数hl(xt)的表达式,得到新的一致性表达式:
min W , b | | X T W + 1 b - Y 0 | | F 2 + &lambda; | | W | | F 2 ;
式中,Ω(hl)是关于hl的正则化函数,λ是学习参数,ytl是最优哈希码Y0的第t行第l列元素,
Figure BDA0000455833190000088
是F范数,X=[x1,...,xN]∈Rd×N是所有训练的关键帧在所有视觉特征下的直接级联特征,W=[w1,...,wl,...,wL]∈Rd×L是转换矩阵,b=[b1,...,bl,...,bL]∈R1×L是L位哈希码的偏移向量;
7.8)用新的一致性表达式对偏移向量b求偏导并置0,得到偏移向量b的表达式:
b = 1 n ( 1 T Y 0 - 1 T X T W ) ,
用新的一致性表达式对转换矩阵W求偏导并置0,得到转换矩阵W的表达式:
W=(XLcXT+λI)-1XLcY0
式中,
Figure BDA0000455833190000086
I是单位矩阵,1是N维的全1列向量,1T是1的转置;
7.9)用转换矩阵W的第l列wl及偏移向量b的第l列bl组成第l个哈希函数hl,得到L个哈希函数{h1,h2,…,hl,...,hL},l=1,2,...,L。
步骤8:对于每个关键帧,根据提取的全局特征塔型梯度方向直方图PHOG与局部特征基于尺度不变特征变换SIFT的加权对比度直方图,由每一个哈希函数产生一位哈希码,利用L个哈希函数,使数据库视频的关键帧和查询视频的关键帧映射为L维的哈希码。
三.特征匹配
步骤9:测量查询视频镜头Q与数据库中的参考视频镜头P的相似度,表示为:
sim ( Q , P ) = &Sigma; Y i &Element; G Q ( min Y j &Element; G P ( sim ( Y i , Y j ) ) ) ,
式中,Yi是查询视频镜头Q的第i个关键帧的哈希码,Yj是数据库中参考视频镜头P的第j个关键帧的哈希码,GQ是查询视频镜头Q的关键帧集合,GP是数据库中参考视频镜头P的关键帧集合,式中sim(Yi,Yj)是视频关键帧Yi与Yj的相似度,表示为:
sim ( Y i , Y j ) = 1 L &Sigma; L Y i &CircleTimes; Y j ,
式中,L是哈希码的维数,
Figure BDA0000455833190000093
是异或操作。
步骤10:定义匹配检测阈值ε:设数据库中的视频镜头为A个,分别为{P1,P2,...,Pb,...,PA},b=1,2,...,A,Pb为数据库中第b个视频镜头,计算查询视频镜头Q与数据库中每个视频镜头Pb的相似度,得到A个相似度值为{sim(Q,P1),sim(Q,P2),...,sim(Q,Pb),...,sim(Q,PA)},对其从小到大排列,在最大值与最小值之间均匀取值作为匹配检测阈值ε。
步骤11:将查询视频镜头Q与数据库中的参考视频镜头P的相似度sim(Q,P)与匹配检测阈值ε进行比较,如果sim(Q,P)≤ε,则认为查询视频镜头Q是数据库中参考视频镜头P的拷贝,如果sim(Q,P)>ε,则认为查询视频镜头Q不是数据库中参考视频镜头P的拷贝。
本发明的优点可通过以下仿真实验说明:
1.仿真条件:
本发明在大量视频数据库上进行实验,测量视频拷贝检测在不同攻击下的查全率和查准率曲线,其中查准率是检测出与查询视频内容相关的视频数目与所有检测出视频数目的比值,查全率是检测出与查询视频内容相关的视频数目与数据库中全部与查询视频内容相关视频数目的比值;查全率和查准率曲线的弯曲程度越大,表示视频拷贝检测的性能越好。
设定两种对比方法:(1)用全局特征塔型梯度方向直方图PHOG表示视频关键帧,进行视频拷贝检测;(2)用局部特征基于尺度不变特征变换SIFT的加权对比度直方图表示视频关键帧,进行视频拷贝检测。
2.仿真内容:
将数据库中的视频进行6种攻击,6种攻击参数信息如表1,将攻击后的视频作为查询视频,测量本发明及两种对比方法在6种攻击下的查全率和查准率曲线,仿真结果如图4所示,其中:图4(a)是高斯噪声攻击下的查全率和查准率曲线,图4(b)是亮度变化攻击下的查全率和查准率曲线,图4(c)是剪切攻击下的查全率和查准率曲线,图4(d)是旋转攻击下的查全率和查准率曲线,图4(e)是帧率变换攻击下的查全率和查准率曲线,图4(f)是掉帧攻击下的查全率和查准率曲线。
图4中的“多特征哈希”表示本发明的方法,“全局特征”表示对比方法(1),“局部特征”表示对比方法(2)。
从图4可以看出,在几何攻击、时序攻击及多种空域攻击下,本发明的方法均优于对比方法,说明本发明的方法在多种攻击下具有更好的视频拷贝检测性能。
表1
将上述6种攻击中的任意一种攻击后的视频作为查询视频,计算本发明及两种对比方法在数据库中检测到查询视频的时间复杂度,时间复杂度越小,表示视频拷贝检测的效率越好,计算结果显示,对比方法的时间复杂度是本发明的时间复杂度的5倍多,从仿真结果可以看出,本发明的方法具有更好的视频拷贝检测效率。
综上,本发明有效提高了视频拷贝检测的精度和效率,对几何攻击、时序攻击及多种空域攻击均具有较好的鲁棒性,这是因为:(1)本发明用多种特征描述视频内容,提高了视频拷贝检测的精度;(2)本发明的多特征哈希学习算法挖掘了不同视觉特征之间的互补信息,使得哈希码保留了视频在原始特征空间下的相似性,有效提高了视频拷贝检测的性能。

Claims (4)

1.一种基于多特征哈希的视频拷贝检测方法,包括:
(1)多特征提取步骤:
(1a)给定视频V,将视频V分割成一系列连续的相等长度的视频镜头V={C1,C2,…,Ci,...,CI},Ci是视频V的第i个镜头,i=1,2,...,I,I是视频镜头的个数;
(1b)将每一个视频镜头的帧率统一为每秒30帧,将所有的视频帧转换为宽度为320,高度为240的灰度图像;
(1c)对每一个视频镜头进行降6采样处理,即每6个视频帧提取一个关键帧;
(1d)提取关键帧的塔型梯度方向直方图PHOG为关键帧的全局特征;
(1e)利用尺度不变特征变换SIFT检测算子,提取关键帧的特征点,获得关键帧的特征点集,在关键帧大小为120×40的中心区域内,选择特征强度最大的特征点作为圆心,构造半径为R的稳定的圆形特征区域,若该区域不存在特征点,则选择关键帧的中心为圆心,提取基于尺度不变特征变换SIFT的加权对比度直方图为关键帧的局部特征;
(2)特征映射步骤:
(2a)利用相似度保持的多特征哈希学习SPM2H算法建立目标函数,通过优化求解得到L个哈希函数{h1,h2,…,hl,...,hL},hl是第l个哈希函数,l=1,2,...,L;
(2b)对于每个关键帧,结合提取的全局特征和局部特征,由每一个哈希函数产生一位哈希码,利用L个哈希函数,使数据库视频的关键帧和查询视频的关键帧映射为L维的哈希码;
(3)特征匹配步骤:
(3a)测量查询视频镜头Q与数据库中的参考视频镜头P的相似度,表示为:
sim ( Q , P ) = &Sigma; Y i &Element; G Q ( min Y j &Element; G P ( sim ( Y i , Y j ) ) ) ,
式中,Yi是查询视频镜头Q的第i个关键帧的哈希码,Yj是数据库中参考视频镜头P的第j个关键帧的哈希码,GQ是查询视频镜头Q的关键帧集合,GP是数据库中参考视频镜头P的关键帧集合,式中sim(Yi,Yj)是视频关键帧Yi与Yj的相似度,表示为:
sim ( Y i , Y j ) = 1 L &Sigma; L Y i &CircleTimes; Y j ,
式中,L是哈希码的维数,
Figure FDA0000455833180000013
是异或操作;
(3b)定义匹配检测阈值ε:设数据库中的视频镜头为A个,分别为{P1,P2,...,Pb,...,PA},b=1,2,...,A,Pb为数据库中第b个视频镜头,计算查询视频镜头Q与数据库中每个视频镜头Pb的相似度,得到A个相似度值为{sim(Q,P1),sim(Q,P2),...,sim(Q,Pb),...,sim(Q,PA)},对其从小到大排列,在最大值与最小值之间均匀取值作为匹配检测阈值ε;
(3c)将查询视频镜头Q与数据库中的参考视频镜头P的相似度sim(Q,P)与匹配检测阈值ε进行比较,如果sim(Q,P)≤ε,则认为查询视频镜头Q是数据库中参考视频镜头P的拷贝,如果sim(Q,P)>ε,则认为查询视频镜头Q不是数据库中参考视频镜头P的拷贝。
2.根据权利要求1所述的基于多特征哈希的视频拷贝检测方法,其中步骤(1e)所述的提取基于尺度不变特征变换SIFT的加权对比度直方图为关键帧的局部特征,按如下步骤进行:
(1e1)将圆形特征区域进行极坐标划分:
首先,将圆形特征区域先分成4个角度区间:
Figure FDA0000455833180000021
其次,将圆形特征区域分为3级半径区间:40,70,100;
然后,按照半径递增的顺序,在每一级半径区域内,按照角度从小到大遍历,组成12个相邻并不重叠的区域{R1,R2,...,Rk,...,R12},k=1,2,...,12;
(1e2)计算区域Rk中的像素点p的灰度值I(p)与圆心点pc的灰度值I(pc)的差值C(p):
C(p)=I(p)-I(pc);
(1e3)计算区域Rk中的所有像素点的差值为正的对比度
Figure FDA0000455833180000022
和差值为负的对比度
Figure FDA0000455833180000023
分别为:
H R k + ( p c ) = | &Sigma; { C ( p ) | p &Element; R k ^ C ( p ) &GreaterEqual; 0 } # R k + | ,
H R k - ( p c ) = | &Sigma; { C ( p ) | p &Element; R k ^ C ( p ) < 0 } # R k - | ,
Figure FDA0000455833180000031
为C(p)≥0的像素点个数,
Figure FDA0000455833180000032
为C(p)<0的像素点个数,^是求与操作,{C(p)|p∈Rk^C(p)≥0}是满足p∈Rk且C(p)≥0的C(p)值,{C(p)|p∈Rk^C(p)<0}是满足p∈Rk且C(p)<0的C(p)值;
(1e4)依次计算区域Rk中的所有像素点差值为正的对比度
Figure FDA0000455833180000033
和差值负的对比度
Figure FDA0000455833180000034
得到24维的对比度直方图,对三级半径区域的对比度乘以权值,得到加权对比度直方图,该权值按照半径递增的顺序依次为(0.4,0.35,0.25)。
3.根据权利要求1所述的基于多特征哈希的视频拷贝检测方法,其中步骤(2a)所述的利用相似度保持的多特征哈希学习SPM2H算法建立目标函数,按如下步骤进行:
(2a1)构建每种视觉特征下的局部结构信息,即关联矩阵:
Figure FDA0000455833180000036
式中,是在第m种视觉特征下第p个关键帧和第q个关键帧的关联度,NK(·)是K近邻,^是求与操作,
Figure FDA0000455833180000038
表示在第m种视觉特征下第p个关键帧属于第q个关键帧的K近邻且第q个关键帧属于第p个关键帧的K近邻,
Figure FDA0000455833180000039
是第p个关键帧的第m种特征向量,
Figure FDA00004558331800000310
是第q个关键帧的第m种特征向量;
(2a2)建立相似度保持的多特征哈希学习SPM2H算法的目标函数:
O = min Y &Sigma; m = 1 M &Sigma; p , q N S p , q ( m ) ( d ( x p ( m ) , x q ( m ) ) - d ~ ( x p ( m ) , x q ( m ) ) ) 2
s.t.Y∈{-1,1}N×L,Y1=0,YYT=I,
式中,
Figure FDA00004558331800000312
是对Y求最小操作,L是哈希码的维数,M是视觉特征的数目,N是训练关键帧的数目,s.t.·是约束条件,Y=[Y1,...,YN]∈RN×L是所有训练关键帧在多种特征下的哈希码,
Figure FDA00004558331800000313
是第p个关键帧的第m种特征向量
Figure FDA00004558331800000314
与第q个关键帧的第m种特征向量
Figure FDA00004558331800000315
之间的归一化距离,
Figure FDA00004558331800000316
是第p个关键帧的哈希码Yp与第q个关键帧的哈希码Yq之间的归一化距离,表示为:
d ~ ( x p ( m ) , x q ( m ) ) = 1 L &Sigma; L Y p &CircleTimes; Y q .
4.根据权利要求1所述的基于多特征哈希的视频拷贝检测方法,其中步骤(2a)所述的通过优化求解得到L个哈希函数{h1,h2,…,hl,...,hL},hl是第l个哈希函数,l=1,2,...L,,按如下步骤进行:
(2aa)随机初始化哈希码Y=[y11,...,y1L;...;...,yuv,...;...;...,ygv,...;...;yN1,...,yNL],定义阈值向量m=[m1,m2,...,mv,...,mL],mv为m的第v列元素,其取值为哈希码Y的第v列元素的中间值,v=1,2,...,L,L是哈希码的维数,yuv为哈希码Y的第u行第v列元素,u=1,2,...,N,N是训练关键帧的数目,如果yuv≥mv,则yuv置为1,如果yuv<mv,则yuv置为-1,依次进行,此时哈希码Y为二值矩阵;
(2ab)计算目标函数O的初始值为Dm,定义门限阈值T=10-6,定义最优哈希码为Y0,将初始值Dm与门限阈值T进行比较,如果Dm≤T,则最优哈希码Y0=Y,执行步骤(2af),如果Dm>T,则执行步骤(2ac);
(2ac)比较哈希码Y的第u行第v列元素yuv与第g行第v列元素ygv是否相同,1≤u≤N,1≤g≤N:
如果yuv与ygv相同,则给g加1,返回步骤(2ac);
如果yuv与ygv不相同,则(yuv,ygv)有两种取值情况,即(1,-1)与(-1,1),对于这两种取值情况分别计算目标函数O的值,并比较两次得到的目标函数O的值大小,选择其较小值对应的取值情况来更新(yuv,ygv),根据更新后的(yuv,ygv)再更新哈希码Y;
(2ad)对于哈希码Y的第u行依次执行步骤(2ac),1≤u≤N;
(2ae)对于哈希码Y的第v列迭代执行步骤(2ac)与步骤(2ad),直到每次迭代执行前目标函数O的值与迭代执行后目标函数O的值之差小于门限阈值T时,再执行哈希码Y的第v+1列的迭代,直到v=L时,得到最优哈希码Y0=Y;
(2af)采用线性变换表示哈希函数hl(xt):
h l ( x t ) = w l T x t + b l ,
式中,wl∈Rd×1是转换向量,
Figure FDA0000455833180000042
是wl的转置向量,l=1,2,...,L,bl是偏移量,
Figure FDA0000455833180000043
是第t个关键帧在所有视觉特征下的直接级联特征,d是级联特征的维数,表示为:
Figure FDA0000455833180000044
dm是第m种视觉特征的维数;
(2ag)整合通过目标函数O得到的最优哈希码Y0及哈希函数hl(xt),建立一致性表达式:
min W , b &Sigma; l = 1 L ( &Sigma; t = 1 N | | h l ( x t ) - y tl | | F 2 + &lambda;&Omega; ( h l ) ) ,
由一致性表达式及哈希函数hl(xt)的表达式可得新的一致性表达式:
min W , b | | X T W + 1 b - Y 0 | | F 2 + &lambda; | | W | | F 2 ;
式中,Ω(hl)是关于hl的正则化函数,λ是学习参数,ytl是最优哈希码Y0的第t行第l列元素,
Figure FDA0000455833180000053
是F范数,X=[x1,...,xN]∈Rd×N是所有训练的关键帧所有视觉特征下的直接级联特征,W=[w1,...,wl,...,wL]∈Rd×L是转换矩阵,b=[b1,...,bl,...,bL]∈R1×L是L位哈希码的偏移向量;
(2ah)用新的一致性表达式对偏移向量b求偏导并置0,得到偏移向量b的表达式:
b = 1 n ( 1 T Y 0 - 1 T X T W ) ,
用新的一致性表达式对转换矩阵W求偏导并置0,得到转换矩阵W的表达式:
W=(XLcXT+λI)-1XLcY0
式中,
Figure FDA0000455833180000055
I是单位矩阵,1是N维的全1列向量,1T是1的转置;
(2ai)用转换矩阵W的第l列wl及偏移向量b的第l列bl组成第l个哈希函数hl,得到L个哈希函数{h1,h2,…,hl,...,hL},l=1,2,...,L。
CN201410012758.7A 2014-01-11 2014-01-11 基于多特征哈希的视频拷贝检测方法 Pending CN103744973A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410012758.7A CN103744973A (zh) 2014-01-11 2014-01-11 基于多特征哈希的视频拷贝检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410012758.7A CN103744973A (zh) 2014-01-11 2014-01-11 基于多特征哈希的视频拷贝检测方法

Publications (1)

Publication Number Publication Date
CN103744973A true CN103744973A (zh) 2014-04-23

Family

ID=50501991

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410012758.7A Pending CN103744973A (zh) 2014-01-11 2014-01-11 基于多特征哈希的视频拷贝检测方法

Country Status (1)

Country Link
CN (1) CN103744973A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239420A (zh) * 2014-10-20 2014-12-24 北京畅景立达软件技术有限公司 一种基于视频指纹的视频相似度匹配方法
CN104331450A (zh) * 2014-10-29 2015-02-04 聂秀山 基于多模式特征和张量分解的视频拷贝检测方法
CN104504307A (zh) * 2015-01-08 2015-04-08 北京大学 基于拷贝单元的音视频拷贝检测方法和装置
CN104581431A (zh) * 2014-11-28 2015-04-29 安科智慧城市技术(中国)有限公司 一种视频认证方法及装置
CN105956550A (zh) * 2016-04-29 2016-09-21 浪潮电子信息产业股份有限公司 一种视频鉴别的方法和装置
CN107464268A (zh) * 2016-06-02 2017-12-12 国家计算机网络与信息安全管理中心 一种利用全局和局部特征的联合编码方法
CN108121806A (zh) * 2017-12-26 2018-06-05 湖北工业大学 一种基于局部特征匹配的图像搜索方法及系统
CN108182421A (zh) * 2018-01-24 2018-06-19 北京影谱科技股份有限公司 视频分割方法和装置
CN108253977A (zh) * 2016-12-28 2018-07-06 沈阳美行科技有限公司 用于更新导航数据的增量数据的生成方法及生成装置
CN108566562A (zh) * 2018-05-02 2018-09-21 中广热点云科技有限公司 版权视频信息结构化整理完成样本封样的方法
CN108696713A (zh) * 2018-04-27 2018-10-23 苏州科达科技股份有限公司 码流的安全测试方法、装置及测试设备
CN108734106A (zh) * 2018-04-23 2018-11-02 中国科学院自动化研究所 基于对比的快速暴恐视频识别方法
CN109726765A (zh) * 2019-01-02 2019-05-07 京东方科技集团股份有限公司 一种视频分类问题的样本提取方法及装置
CN110069666A (zh) * 2019-04-03 2019-07-30 清华大学 基于近邻结构保持的哈希学习方法和装置
CN110276379A (zh) * 2019-05-21 2019-09-24 方佳欣 一种基于视频图像分析的灾情信息快速提取方法
CN113438507A (zh) * 2021-06-11 2021-09-24 上海连尚网络科技有限公司 一种用于确定视频侵权的方法、设备、介质及程序产品
WO2022012178A1 (zh) * 2020-07-16 2022-01-20 北京字节跳动网络技术有限公司 用于生成目标函数的方法、装置、电子设备和计算机可读介质
CN115965581A (zh) * 2022-11-22 2023-04-14 澳门科技大学 一种复制-粘贴篡改图像检测方法、系统及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070294247A1 (en) * 2006-06-20 2007-12-20 International Business Machines Corporation Identifying optimal multi-scale patterns in time-series streams
CN101807208A (zh) * 2010-03-26 2010-08-18 上海全土豆网络科技有限公司 视频指纹快速检索方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070294247A1 (en) * 2006-06-20 2007-12-20 International Business Machines Corporation Identifying optimal multi-scale patterns in time-series streams
CN101807208A (zh) * 2010-03-26 2010-08-18 上海全土豆网络科技有限公司 视频指纹快速检索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
H PENG: "Learning to multimodal hash for robust video copy detection", 《IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING》 *
赵玉鑫: "基于局部排序的视频拷贝检测", 《计算机辅助设计与图形学学报》 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239420B (zh) * 2014-10-20 2017-06-06 北京畅景立达软件技术有限公司 一种基于视频指纹的视频相似度匹配方法
CN104239420A (zh) * 2014-10-20 2014-12-24 北京畅景立达软件技术有限公司 一种基于视频指纹的视频相似度匹配方法
CN104331450A (zh) * 2014-10-29 2015-02-04 聂秀山 基于多模式特征和张量分解的视频拷贝检测方法
CN104581431A (zh) * 2014-11-28 2015-04-29 安科智慧城市技术(中国)有限公司 一种视频认证方法及装置
CN104581431B (zh) * 2014-11-28 2018-01-30 精宸智云(武汉)科技有限公司 一种视频认证方法及装置
CN104504307B (zh) * 2015-01-08 2017-09-29 北京大学 基于拷贝单元的音视频拷贝检测方法和装置
CN104504307A (zh) * 2015-01-08 2015-04-08 北京大学 基于拷贝单元的音视频拷贝检测方法和装置
CN105956550B (zh) * 2016-04-29 2019-06-04 浪潮电子信息产业股份有限公司 一种视频鉴别的方法和装置
CN105956550A (zh) * 2016-04-29 2016-09-21 浪潮电子信息产业股份有限公司 一种视频鉴别的方法和装置
CN107464268A (zh) * 2016-06-02 2017-12-12 国家计算机网络与信息安全管理中心 一种利用全局和局部特征的联合编码方法
CN108253977A (zh) * 2016-12-28 2018-07-06 沈阳美行科技有限公司 用于更新导航数据的增量数据的生成方法及生成装置
CN108253977B (zh) * 2016-12-28 2020-11-24 沈阳美行科技有限公司 用于更新导航数据的增量数据的生成方法及生成装置
CN108121806A (zh) * 2017-12-26 2018-06-05 湖北工业大学 一种基于局部特征匹配的图像搜索方法及系统
CN108182421A (zh) * 2018-01-24 2018-06-19 北京影谱科技股份有限公司 视频分割方法和装置
CN108182421B (zh) * 2018-01-24 2020-07-14 北京影谱科技股份有限公司 视频分割方法和装置
CN108734106A (zh) * 2018-04-23 2018-11-02 中国科学院自动化研究所 基于对比的快速暴恐视频识别方法
CN108734106B (zh) * 2018-04-23 2021-01-05 中国科学院自动化研究所 基于对比的快速暴恐视频识别方法
CN108696713A (zh) * 2018-04-27 2018-10-23 苏州科达科技股份有限公司 码流的安全测试方法、装置及测试设备
CN108566562B (zh) * 2018-05-02 2020-09-08 中广热点云科技有限公司 版权视频信息结构化整理完成样本封样的方法
CN108566562A (zh) * 2018-05-02 2018-09-21 中广热点云科技有限公司 版权视频信息结构化整理完成样本封样的方法
CN109726765A (zh) * 2019-01-02 2019-05-07 京东方科技集团股份有限公司 一种视频分类问题的样本提取方法及装置
CN110069666A (zh) * 2019-04-03 2019-07-30 清华大学 基于近邻结构保持的哈希学习方法和装置
CN110069666B (zh) * 2019-04-03 2021-04-06 清华大学 基于近邻结构保持的哈希学习方法和装置
CN110276379B (zh) * 2019-05-21 2020-06-23 方佳欣 一种基于视频图像分析的灾情信息快速提取方法
CN110276379A (zh) * 2019-05-21 2019-09-24 方佳欣 一种基于视频图像分析的灾情信息快速提取方法
WO2022012178A1 (zh) * 2020-07-16 2022-01-20 北京字节跳动网络技术有限公司 用于生成目标函数的方法、装置、电子设备和计算机可读介质
CN113438507A (zh) * 2021-06-11 2021-09-24 上海连尚网络科技有限公司 一种用于确定视频侵权的方法、设备、介质及程序产品
CN113438507B (zh) * 2021-06-11 2023-09-15 上海连尚网络科技有限公司 一种用于确定视频侵权的方法、设备及介质
CN115965581A (zh) * 2022-11-22 2023-04-14 澳门科技大学 一种复制-粘贴篡改图像检测方法、系统及设备
CN115965581B (zh) * 2022-11-22 2023-09-12 澳门科技大学 一种复制-粘贴篡改图像检测方法、系统及设备

Similar Documents

Publication Publication Date Title
CN103744973A (zh) 基于多特征哈希的视频拷贝检测方法
Amoon et al. Automatic target recognition of synthetic aperture radar (SAR) images based on optimal selection of Zernike moments features
Qin et al. Coverless image steganography: a survey
Malof et al. Automatic detection of solar photovoltaic arrays in high resolution aerial imagery
Davarzani et al. Perceptual image hashing using center-symmetric local binary patterns
Li et al. An Efficient Scheme for Detecting Copy-move Forged Images by Local Binary Patterns.
Li et al. Detecting copy-move forgery under affine transforms for image forensics
Sun et al. Nonoverlapping blocks based copy‐move forgery detection
CN103020605B (zh) 基于决策层融合的桥梁识别方法
Deb et al. An efficient method of vehicle license plate recognition based on sliding concentric windows and artificial neural network
Wang et al. Reversible fragile watermarking for locating tampered blocks in 2D vector maps
Vaishnavi et al. Application of local invariant symmetry features to detect and localize image copy move forgeries
CN115242559B (zh) 基于区块链和联邦学习的网络流量入侵检测方法
Diwan et al. Keypoint based comprehensive copy‐move forgery detection
Liu et al. Improved SIFT-based copy-move detection using BFSN clustering and CFA features
Gupta et al. Change detection in Landsat images based on local neighbourhood information
Selvaraj et al. Enhanced copy–paste forgery detection in digital images using scale‐invariant feature transform
Dixit et al. Composite attacks‐based copy‐move image forgery detection using AKAZE and FAST with automatic contrast thresholding
Yang et al. An efficient and robust zero watermarking algorithm
Diwan et al. Unveiling copy-move forgeries: Enhancing detection with SuperPoint keypoint architecture
Choi et al. PIHA: Detection method using perceptual image hashing against query-based adversarial attacks
Hu et al. An improved heuristic optimization algorithm for feature learning based on morphological filtering and its application
Chou et al. Copy-move forgery detection based on local gabor wavelets patterns
CN103927709B (zh) 一种基于特征区域几何优化的鲁棒可逆水印嵌入和提取方法
Yu et al. FI-SIFT Algorithm for Exposing Image Copy-Move Forgery with Reflection Attacks.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140423