CN110889011B - 一种视频指纹方法 - Google Patents

一种视频指纹方法 Download PDF

Info

Publication number
CN110889011B
CN110889011B CN201911203905.8A CN201911203905A CN110889011B CN 110889011 B CN110889011 B CN 110889011B CN 201911203905 A CN201911203905 A CN 201911203905A CN 110889011 B CN110889011 B CN 110889011B
Authority
CN
China
Prior art keywords
video
fingerprint
image
frame
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911203905.8A
Other languages
English (en)
Other versions
CN110889011A (zh
Inventor
李宏元
吴奕刚
孙彦龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Arcvideo Technology Co ltd
Original Assignee
Hangzhou Arcvideo Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Arcvideo Technology Co ltd filed Critical Hangzhou Arcvideo Technology Co ltd
Priority to CN201911203905.8A priority Critical patent/CN110889011B/zh
Publication of CN110889011A publication Critical patent/CN110889011A/zh
Application granted granted Critical
Publication of CN110889011B publication Critical patent/CN110889011B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种视频指纹方法。它具体包括如下步骤:对视频在时间轴上重取样;将视频的每帧图像转换为灰度图,再进行去黑边处理,之后缩放至规定的大小;统计各帧图像的特征数据;考察每幅图的亮度变化,对每帧图片都提取此类特征数据;再考察相邻图像帧特征数据之变化,获得64位布尔值组成的整数就可作为当前图像帧的指纹编码;按上述方式连续取帧,沿着时间轴滑动取样,形成的一串指纹序列作为整个视频的特征指纹;指纹之距离计算采用汉明距;若某视频A的特征指纹全部或部分片段与另一视频B的部分指纹高度相似,即可断定视频A或A的片段在视频B中出现。本发明的有益效果是:运算量小,稳定性较高。

Description

一种视频指纹方法
技术领域
本发明涉及视频处理相关技术领域,尤其是指一种视频指纹方法。
背景技术
随着计算机技术与网络技术的飞速发展,多媒体尤其是视频数据量急剧增长。海量视频的呈现,视频的检索与保护的重要性日益突出。由于视频的数据与信息量巨大,许多公司和厂家采用视频指纹技术。目前,有各种不同的视频指纹方案出现,以应对不同的应用场景。但这些指纹方案往往由于其复杂性和大运算量,或者因为对抗噪声、尺度变换等攻击的鲁棒性不够而使应用受到限制。
发明内容
本发明是为了克服现有技术中存在上述的不足,提供了一种运算量小且稳定性高的视频指纹方法。
为了实现上述目的,本发明采用以下技术方案:
一种视频指纹方法,具体包括如下步骤:
(1)对视频在时间轴上重取样,即采用固定的帧率;
(2)将视频的每帧图像转换为灰度图,再进行去黑边处理,之后缩放至规定的大小;
(3)统计各帧图像的特征数据,采用分块亮度,具体操作是将整幅图像划分为8x8的分块,顺序排列,共64块,统计累加各个块内各点的灰度值;
(4)考察每幅图内64个分块之间的亮度变化,这样能获得一个元素个数为64的一维数组,此数组可作为视频图像在空间上的特征,对每帧图片都提取此类特征数据;
(5)再考察相邻图像帧特征数据之变化,即视频在时间域的变化,以RASTA滤波器处理,获得64位布尔值组成的整数就可作为当前图像帧的指纹编码;
(6)按上述方式连续取帧,沿着时间轴滑动取样,每次滑动一帧就可获得一个指纹编码,这样形成的一串指纹序列,可作为整个视频的特征指纹;
(7)指纹之距离计算采用汉明距;
(8)对于两个指纹长度相同的视频,其差异可以使用所有对应指纹距离的平均值来度量;
(9)若某视频A的特征指纹全部或部分片段与另一视频B的部分指纹高度相似,即可断定视频A或A的片段在视频B中出现。
本申请提供了一种视频文件的指纹方案,可用于建立视频文件的索引,可用于视频文件的搜索和盗版检测等。本申请的指纹方案不仅体现了视频图像在二维空间上的特征,也兼顾了视频在时间域的变化,而且运算量小,稳定性较高,对于二维拉伸、缩放、亮度改变或饱和度及马赛克等攻击有很强的抵抗能力,也能抵抗小幅度的旋转,特别适于盗版检测的视频搜索与比对。
作为优选,在步骤(3)中,特征数据可以是图像经过傅里叶变换后的各个频组能量,也可以是亮度直方图数据。
作为优选,在步骤(4)中,相邻块之间的亮度差值反应较高频率的变化,而人眼感知的变化往往集中于低频段,故可统计距离较远的分块之间的差值。
作为优选,在步骤(5)中,采用四阶RASTA滤波,即取连续的四帧,相当于160毫秒的跨度,共64组个数为4的特征数据序列,具体操作方式如下:
把图像帧k划分为平均大小的8x8共64个分块,顺序编号为0~63.各个分块的亮度记为B[0],B[1],B[2],...,B[61],B[62],B[63],检查如下两行对应分块的亮度差:
B[0],B[1],B[2],...,B[34],B[35],B[36],B[37],B[38],B[39],...,B[61],B[62],B[63]
B[27],B[28],B[29],...,B[61],B[62],B[63],B[0],B[1],B[2],...,B[24],B[25],B[26]
分别计算B[0]与B[27]、B[1]与B[28],直至B[63]与B[26]的差值,这样就有64个差值,组成一个元素个数为64的一维数组:
{x[k,0],x[k,1],x[k,2],...,x[k,61],x[k,62],x[k,63]}
考察某视频连续的帧序列,从第一帧开始直到第n+1帧,一共可以获得n+1组类似上述的一维数组;为表示分别,第一个下标为帧序号,第二个下标为分块序号,列式如下:
{x[0,0],x[0,1],x[0,2],...,x[0,61],x[0,62],x[0,63]}
{x[1,0],x[1,1],x[1,2],...,x[1,61],x[1,62],x[1,63]}
{x[2,0],x[2,1],x[2,2],...,x[2,61],x[2,62],x[2,63]}
{x[n,0],x[n,1],x[n,2],...,x[n,61],x[n,62],x[n,63]}
上述数组共64列,作为对应的64个RASTA滤波器的输入,则可获得64个输出,迭代公式为:
y[k,i]=0.94*y[k-1,i]+2.0*x[k,i]+x[k-4,i]-x[k-2,i]-2.0*x[k-1,i]
其中,i=0~63,每次迭代的输出都只与上一次的输出和当前及前四次的输入有关;对于第一帧,没有前四帧的输入与输出,可设置初始条件为0:
x[-4,i]=0,x[-3,i]=0,x[-2,i]=0,x[-1,i]=0,y[-1,i]=0
其中,i=0~63,这样每一帧都有64个输出,这64个输出的符号以布尔值标记:若大于0,标记为1;若小于或等于0,标记为0;这样就形成了由0或1标志位组成的64位编码,这就是此图像帧的指纹编码。
本发明的有益效果是:不仅体现了视频图像在二维空间上的特征,也兼顾了视频在时间域的变化,而且运算量小,稳定性较高,特别适于盗版检测的视频搜索与比对。
具体实施方式
下面结合具体实施方式对本发明做进一步的描述。
一种视频指纹方法,具体包括如下步骤:
(1)对视频在时间轴上重取样,即采用固定的帧率;本发明使用的帧率为25帧/秒;
(2)将视频的每帧图像转换为灰度图,再进行去黑边处理,之后缩放至规定的大小,比如320X240;
(3)统计各帧图像的特征数据,这个特征数据可以是图像经过傅里叶变换后的各个频组能量,也可以是亮度直方图等数据;采用分块亮度(灰度),具体操作是将整幅图像划分为8x8的分块,顺序排列,共64块,统计累加各个块内各点的灰度值;
其中:分块亮度、亮度直方图数据及图像经过傅里叶变换后的各个频组能量这几类数据,彼此之间没有对应的、直接的关联,他们都是从不同的参数来描述图像的特征,都可作为图像的特征数据。示例中采用分块亮度作为考量的特征数据来提取指纹,最容易理解;采用其他特征也同样可以获得指纹。一个指纹系统可以选取上述任一特征来提取指纹;使用不同的特征方案获得的指纹各不相同,也各不相干。
(4)考察每幅图内64个分块之间的亮度变化,相邻块之间的亮度差值反应较高频率的变化,而人眼感知的变化往往集中于低频段,故可统计距离较远的分块之间的差值,比如第1块和第28块的亮度差,第2块和第29块之差值。。。。,这样能获得一个元素个数为64的一维数组,此数组可作为视频图像在空间上的特征,对每帧图片都提取此类特征数据;图像的两个分块之间的亮度差值反映了这两个分块的亮度变化,就是分块A比分块B亮多少,或者暗多少。
(5)再考察相邻图像帧特征数据之变化,即视频在时间域的变化,以RASTA滤波器处理,这样能提高对数据变化的敏感程度。这里采用四阶RASTA滤波,即取连续的四帧,相当于160毫秒的跨度,共64组个数为4的特征数据序列,具体操作方式如下:
把图像帧k划分为平均大小的8x8共64个分块,顺序编号为0~63.各个分块的亮度记为B[0],B[1],B[2],...,B[61],B[62],B[63],检查如下两行对应分块的亮度差:
B[0],B[1],B[2],...,B[34],B[35],B[36],B[37],B[38],B[39],...,B[61],B[62],B[63]
B[27],B[28],B[29],...,B[61],B[62],B[63],B[0],B[1],B[2],...,B[24],B[25],B[26]
分别计算B[0]与B[27]、B[1]与B[28],直至B[63]与B[26]的差值,这样就有64个差值,组成一个元素个数为64的一维数组:
{x[k,0],x[k,1],x[k,2],...,x[k,61],x[k,62],x[k,63]}
考察某视频连续的帧序列,从第一帧开始直到第n+1帧,一共可以获得n+1组类似上述的一维数组;为表示分别,第一个下标为帧序号,第二个下标为分块序号,列式如下:
{x[0,0],x[0,1],x[0,2],...,x[0,61],x[0,62],x[0,63]}
{x[1,0],x[1,1],x[1,2],...,x[1,61],x[1,62],x[1,63]}
{x[2,0],x[2,1],x[2,2],...,x[2,61],x[2,62],x[2,63]}
{x[n,0],x[n,1],x[n,2],...,x[n,61],x[n,62],x[n,63]}
上述数组共64列,作为对应的64个RASTA滤波器的输入,则可获得64个输出,迭代公式为:
y[k,i]=0.94*y[k-1,i]+2.0*x[k,i]+x[k-4,i]-x[k-2,i]-2.0*x[k-1,i]
其中,i=0~63,每次迭代的输出都只与上一次的输出和当前及前四次的输入有关;对于第一帧,没有前四帧的输入与输出,可设置初始条件为0:
x[-4,i]=0,x[-3,i]=0,x[-2,i]=0,x[-1,i]=0,y[-1,i]=0
其中,i=0~63,这样每一帧都有64个输出,这64个输出的符号以布尔值标记:若大于0,标记为1;若小于或等于0,标记为0;这样就形成了由0或1标志位组成的64位编码,这就是此图像帧的指纹编码;
(6)按上述方式连续取帧,相当于采用大小为4的帧窗口,沿着时间轴滑动取样,每次滑动一帧就可获得一个指纹编码,这样形成的一串指纹序列,可作为整个视频的特征指纹;
(7)指纹之距离计算采用汉明距(Hamming distance);
(8)对于两个指纹长度(个数)相同的视频,其差异可以使用所有对应指纹距离的平均值来度量;
(9)若某视频A的特征指纹全部(或部分片段)与另一视频B的部分指纹高度相似,即可断定视频A(或A的片段)在视频B中出现。
本指纹方案不仅体现了视频图像在二维空间上的特征,也兼顾了视频在时间域的变化,而且运算量小,稳定性较高,对于二维拉伸、缩放、亮度改变或饱和度及马赛克等攻击有很强的抵抗能力,也能抵抗小幅度的旋转,但对于较大幅度的旋转操作和时间轴上的缩放等攻击的抵抗能力较弱,特别适于盗版检测的视频搜索与比对。

Claims (3)

1.一种视频指纹方法,其特征是,具体包括如下步骤:
(1)对视频在时间轴上重取样,即采用固定的帧率;
(2)将视频的每帧图像转换为灰度图,再进行去黑边处理,之后缩放至规定的大小;
(3)统计各帧图像的特征数据,采用分块亮度,具体操作是将整幅图像划分为8x8的分块,顺序排列,共64块,统计累加各个块内各点的灰度值;
(4)考察每幅图内64个分块之间的亮度变化,这样能获得一个元素个数为64的一维数组,此数组作为视频图像在空间上的特征,对每帧图片都提取此类特征数据;
(5)再考察相邻图像帧特征数据之变化,即视频在时间域的变化,以RASTA滤波器处理,获得64位布尔值组成的整数就可作为当前图像帧的指纹编码;采用四阶RASTA滤波,即取连续的四帧,共64组个数为4的特征数据序列,具体操作方式如下:
把图像帧k划分为平均大小的8x8共64个分块,顺序编号为0~63.各个分块的亮度记为B[0], B[1], B[2],..., B[61], B[62], B[63],检查如下两行对应分块的亮度差:
B[0], B[1], B[2], ...,B[34],B[35],B[36],B[37],B[38],B[39],..., B[61],B[62],B[63]
B[27],B[28],B[29],...,B[61],B[62],B[63],B[0], B[1], B[2], ..., B[24],B[25],B[26]
分别计算B[0]与B[27]、B[1]与B[28],直至B[63]与 B[26]的差值,这样就有64个差值,组成一个元素个数为64的一维数组:
{x[k, 0], x[k, 1], x[k, 2], ..., x[k, 61], x[k, 62], x[k, 63]}
考察某视频连续的帧序列,从第一帧开始直到第n+1帧,一共可以获得n+1组类似上述的一维数组;为表示分别,第一个下标为帧序号,第二个下标为分块序号,列式如下:
{x[0,0], x[0,1], x[0,2], ..., x[0,61], x[0,62], x[0,63]}
{x[1,0], x[1,1], x[1,2], ..., x[1,61], x[1,62], x[1,63]}
{x[2,0], x[2,1], x[2,2], ..., x[2,61], x[2,62], x[2,63]}
……
{x[n,0], x[n,1], x[n,2], ..., x[n,61], x[n,62], x[n,63]}
上述数组共64列,作为对应的64个RASTA滤波器的输入,则可获得64个输出,每次迭代的输出都只与上一次的输出和当前及前四次的输入有关;对于第一帧,没有前四帧的输入与输出,设置初始条件为0,这样每一帧都有64个输出,这64个输出的符号以布尔值标记:若大于0,标记为1;若小于或等于0,标记为0;这样就形成了由0或1标志位组成的64位编码,这就是此图像帧的指纹编码;
(6)按步骤(5)的方式连续取帧,沿着时间轴滑动取样,每次滑动一帧就获得一个指纹编码,这样形成的一串指纹序列,作为整个视频的特征指纹;
(7)指纹之距离计算采用汉明距;
(8)对于两个指纹长度相同的视频,其差异使用所有对应指纹距离的平均值来度量;
(9)若某视频A的特征指纹全部或部分片段与另一视频B的部分指纹高度相似,即断定视频A或A的片段在视频B中出现。
2.根据权利要求1所述的一种视频指纹方法,其特征是,在步骤(3)中,特征数据是图像经过傅里叶变换后的各个频组能量,或者是亮度直方图数据。
3.根据权利要求1所述的一种视频指纹方法,其特征是,在步骤(4)中,相邻块之间的亮度差值反应较高频率的变化,而人眼感知的变化往往集中于低频段,故统计距离较远的分块之间的差值。
CN201911203905.8A 2019-11-29 2019-11-29 一种视频指纹方法 Active CN110889011B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911203905.8A CN110889011B (zh) 2019-11-29 2019-11-29 一种视频指纹方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911203905.8A CN110889011B (zh) 2019-11-29 2019-11-29 一种视频指纹方法

Publications (2)

Publication Number Publication Date
CN110889011A CN110889011A (zh) 2020-03-17
CN110889011B true CN110889011B (zh) 2022-07-26

Family

ID=69749637

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911203905.8A Active CN110889011B (zh) 2019-11-29 2019-11-29 一种视频指纹方法

Country Status (1)

Country Link
CN (1) CN110889011B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111507260B (zh) * 2020-04-17 2022-08-05 重庆邮电大学 一种视频相似度快速检测方法及检测装置
CN112183328A (zh) * 2020-09-27 2021-01-05 北京永新视博数字电视技术有限公司 视频识别方法、装置、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101635843A (zh) * 2008-07-23 2010-01-27 北京大学 一种基于帧间变化特征的视纹提取、查找比对方法及系统
CN102156751A (zh) * 2011-04-26 2011-08-17 深圳市迅雷网络技术有限公司 一种提取视频指纹的方法及装置
CN104239420A (zh) * 2014-10-20 2014-12-24 北京畅景立达软件技术有限公司 一种基于视频指纹的视频相似度匹配方法
CN110083740A (zh) * 2019-05-07 2019-08-02 深圳市网心科技有限公司 视频指纹提取及视频检索方法、装置、终端及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6481762B2 (ja) * 2016-02-18 2019-03-13 パナソニック株式会社 撮像装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101635843A (zh) * 2008-07-23 2010-01-27 北京大学 一种基于帧间变化特征的视纹提取、查找比对方法及系统
CN102156751A (zh) * 2011-04-26 2011-08-17 深圳市迅雷网络技术有限公司 一种提取视频指纹的方法及装置
CN104239420A (zh) * 2014-10-20 2014-12-24 北京畅景立达软件技术有限公司 一种基于视频指纹的视频相似度匹配方法
CN110083740A (zh) * 2019-05-07 2019-08-02 深圳市网心科技有限公司 视频指纹提取及视频检索方法、装置、终端及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A Digital Fingerprint Scheme Based on MPEG-2;Yigang Zhou等;《2010 Sixth International Conference on Intelligent Information Hiding and Multimedia Signal Processing》;20101115;全文 *
基于内容的视频检索关键技术研究;孙军亮;《中国优秀硕士学位论文全文数据库(电子期刊)》;20120415;第I138-1940页 *

Also Published As

Publication number Publication date
CN110889011A (zh) 2020-03-17

Similar Documents

Publication Publication Date Title
CN110598558B (zh) 人群密度估计方法、装置、电子设备及介质
Cao et al. Forensic estimation of gamma correction in digital images
CN108921130A (zh) 基于显著性区域的视频关键帧提取方法
JP2012523641A (ja) ビデオコンテンツ解析のためのキーフレーム抽出
CN110889011B (zh) 一种视频指纹方法
Pei et al. The improved wavelet transform based image fusion algorithm and the quality assessment
EP2383990B1 (en) Time segment representative feature vector generation device
KR101968921B1 (ko) 강건한 낮은 복잡도 비디오 핑거프린팅을 위한 장치 및 방법
Pal et al. Video segmentation using minimum ratio similarity measurement
Asim et al. A key frame based video summarization using color features
Xie et al. Bag-of-words feature representation for blind image quality assessment with local quantized pattern
Su et al. Robust video fingerprinting based on visual attention regions
EP2531956B1 (en) Image recognition system based on cascaded over-complete dictionaries
WO2010080857A2 (en) Scalable media fingerprint extraction
Wang et al. Fast detection and segmentation of partial image blur based on discrete Walsh–Hadamard transform
Cirne et al. A video summarization method based on spectral clustering
US10394888B2 (en) Video search system and method
US11048946B2 (en) System and method for identifying cognate image sequences
Chen et al. Modelling of content-aware indicators for effective determination of shot boundaries in compressed MPEG videos
Harvey et al. Spatio-temporal video copy detection
WO2010084738A1 (ja) 照合加重情報抽出装置
KR101068288B1 (ko) 세그먼트 특징을 이용한 내용 기반 동영상 검출 방법
Baar et al. Camera identification by grouping images from database, based on shared noise patterns
Zhang et al. No-reference image sharpness assessment based on rank learning
CN113850284B (zh) 一种基于多尺度特征融合和多分支预测的多操作检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant