CN103593464A - 基于视觉特征的视频指纹检测及视频序列匹配方法及系统 - Google Patents

基于视觉特征的视频指纹检测及视频序列匹配方法及系统 Download PDF

Info

Publication number
CN103593464A
CN103593464A CN201310608893.3A CN201310608893A CN103593464A CN 103593464 A CN103593464 A CN 103593464A CN 201310608893 A CN201310608893 A CN 201310608893A CN 103593464 A CN103593464 A CN 103593464A
Authority
CN
China
Prior art keywords
video
key frame
finger print
frame
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310608893.3A
Other languages
English (en)
Other versions
CN103593464B (zh
Inventor
刘琼
杨铀
喻莉
吴伟民
高跃
于国星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201310608893.3A priority Critical patent/CN103593464B/zh
Publication of CN103593464A publication Critical patent/CN103593464A/zh
Application granted granted Critical
Publication of CN103593464B publication Critical patent/CN103593464B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/48Matching video sequences

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Collating Specific Patterns (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出一种基于视觉特征的视频指纹检测方法,具体为:按照帧间相关性对视频序列分段,在分段中提取关键帧;在各关键帧中提取视频特征;利用像素点特征字典对像素点分类;对各关键帧分别进行多次不同数量的分块,在各子块中依据像素点的分类结果统计像素点特征字典各元素的出现次数,得到该子块的特征向量;将所有子块的特征向量拼接得到关键帧的高维视频指纹;对各高维视频指纹进行降维;将各视频片段关键帧的低维视频指纹按照时间先后顺序连成关键帧视频指纹串。本发明还提供了基于上述指纹检测方法的视频匹配方法。本发明通过对视频内容的关键信息进行有效描述,在不影响匹配率的情况下,大大降低了算法的复杂度,有效提高了检测效率。

Description

基于视觉特征的视频指纹检测及视频序列匹配方法及系统
技术领域
本发明属于视频分析领域,尤其是涉及一种基于视觉特征的视频指纹检测及视频序列匹配方法。
背景技术
随着计算机技术及网络的快速发展,网络视频数量正在急剧增长。与此同时,随着视频处理技术的发展,视频编辑变得越发容易,针对视频内容进行内容的删减、分辨率改变、内容遮挡、内容替换、增加噪声等等都增加对相关视频内容检测的困难。如何有效地建立视频指纹从而能够在存在一定视频编辑的前提下仍然能够检测到相关视频内容成为一项日益迫切的需求。
目前主要的视频序列匹配方法主要可以分成两类。第一种方法是全局的亮度分析方法。该方法通过对视频帧的亮度分布进行分析,从而形成一种简单的特征用于视频比对。这种技术的优点是简单,而且计算迅速,可以快速生成用以匹配的视频指纹。缺点是该方法对视频内容的一致性要求较高,当视频内容经过编辑发生一定程度的变化时,该方法就无法检测到相关的视频。第二种方法基于运动轨迹的分析。这种方法首先获得视频序列的一些关键对象,并分析关键对象在整段视频序列中的变化情况,并依此作为视频指纹来进行相关视频检测。这类基于运动轨迹分析的方法能够对关键对象进行跟踪,从而相对基于全局亮度的方法鲁棒性较好,但是其计算复杂度很高,需要对关键对象进行检测并跟踪,从而在效率上具有一定的局限性。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于视觉特征的视频指纹检测及视频序列匹配方法及系统,其目的在于通过对视频内容的关键信息进行有效描述,在不影响匹配率的情况下,大大降低了算法的复杂度,有效提高了检测效率。
一种基于视觉特征的视频指纹检测方法,包括以下步骤:
(1)按照帧间相关性对视频序列分段,在得到的每个视频分段中提取最具有代表性的关键帧;
(2)分别在各关键帧中采样,对采样得到的像素点提取视频特征;
(3)依据视频特征,利用离线样本聚类得到的像素点特征字典对采样像素点分类;
(4)对各关键帧分别进行多次不同数量的分块;在每次分块得到的子块中,依据采样像素点的分类结果统计像素点特征字典各元素的出现次数,从而得到该子块对应的特征向量;将统计得到的所有子块特征向量拼接得到关键帧的高维视频指纹;
(5)对各高维视频指纹进行降维得到低维视频指纹;
(6)将各视频片段关键帧的低维视频指纹按照时间先后顺序连成关键帧视频指纹串。
进一步地,所述步骤(1)按照帧间相关性对视频序列分段,在得到的每个视频分段中提取最具有代表性的关键帧的具体过程为:
计算视频序列中相邻两帧间的色彩直方图距离,将色彩直方图距离归一化处理后作为相邻帧间的相关性度量;若相关性度量低于分段阈值,则将该相关性度量对应的相邻帧间设为分割点;相邻分割点之间的视频划分为一个视频片断。
进一步地,所述视频特征为SIFT视频特征、颜色直方图、颜色矩、灰度统计特征、边缘特征或角点特征。
进一步地,所述像素点特征字典是采用K均值聚类算法、凝聚层次聚类算法或DBSCAN聚类算法聚类得到。
进一步地,所述步骤(5)采用主成份分析法、独立成分分析法、线性决策分析法或局部特性分析法对各高维视频指纹进行降维得到低维视频指纹。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,本发明方法通过视频帧的视觉相似性的变化,首先获得多个连续的视频片段,并为每一个视频片段提取一个视频关键帧。接下来对每个视频关键帧进行具有空间位置信息描述的视频指纹提取,这种空间位置信息以例如SIFT特征的形式被提取出来。与每一帧都提取视频指纹相比,这种基于关键帧的视频指纹提取,在基本不影响匹配率的情况下,大大降低了算法的复杂度,有效提高了运算效率。
进一步地,由于色彩直方图距离描述了不同颜色在图像中所占的比例,反映了图像颜色的统计分布和基本色调。因此,本发明采用色彩直方图距离来表征两帧间的相关性,在低算法复杂度的条件下可以准确的对视频进行分段。
本发明还提供了一种视频序列匹配方法,具体为:针对待分析视频序列和基准视频序列,分别按照所述的视频指纹检测方法进行检测,得到各自的关键帧视频指纹串;采用串匹配方法对两关键帧视频指纹串进行匹配。
进一步地,所述采用串匹配方法对两关键帧视频指纹串进行匹配的具体实现过程为:
令待检索视频Q的关键帧集合表示为nq为待检索视频Q的关键帧数目;基准视频片段
Figure BDA0000423053100000033
的关键帧集合表示为
Figure BDA0000423053100000032
ni为基准视频片段Clipi的关键帧数目;
计算待检索视频Q中第s个关键帧kfq,s与基准视频片段Clipi中第t个关键帧kfi,t之间的欧式距离:
d(kfq,s,kfi,t)=norm(feaq,s,feai,t),
式中,s=1,…,nq,t=1,…,ni,feaq,s和feai,t分别是关键帧kfq,s与kfi,t的视觉特征向量,norm()表示求向量feaq,s和feai,t之差的2-范数;
若欧式距离d(kfq,s,kfi,t)<阈值T1,则判定kfq,s与kfi,t匹配;
一旦待检索视频存在一帧与基准视频片段Clipi中关键帧kfi,t匹配,则认为关键帧kfi,t匹配成功,计算基准视频中匹配成功的关键帧数与基准视频的关键帧总数的比值即为匹配率。
进一步地,所述匹配的具体实现过程还包括下述步骤:
若待检索视频的某个关键帧与基准视频中的第t个关键帧kfi,t匹配,则匹配标志flagt=1,否则为flagt=0,该关键帧kfi,t所代表视频片段与待检索视频某片段的相似度为flagt×wkf(kfi,t);
计算基准视频与待检索视频总相似度为
Figure BDA0000423053100000041
计算总的匹配时长为 t = length ( Video i ) · Σ t = 1 n i flag t × w kf ( kf i , t ) ;
综合考虑匹配时长与匹配率确定待检索视频与基准视频是否匹配。
一种基于视觉特征的视频指纹检测系统,其特征在于,包括
第一模块,用于按照帧间相关性对视频序列分段,在得到的每个视频分段中提取最具有代表性的关键帧;
第二模块,用于分别在各关键帧中采样,对采样得到的像素点提取视频特征;
第三模块,用于依据视频特征,利用离线样本聚类得到的像素点特征字典对采样像素点分类;
第四模块,用于对各关键帧分别进行多次不同数量的分块;在每次分块得到的子块中,依据采样像素点的分类结果统计像素点特征字典各元素的出现次数,从而得到该子块对应的特征向量;将统计得到的所有子块特征向量拼接得到关键帧的高维视频指纹;
第五模块,用于对各高维视频指纹进行降维得到低维视频指纹;
第六模块,用于将各视频片段关键帧的低维视频指纹按照时间先后顺序连成关键帧视频指纹串。
本发明匹配方法的技术效果体现在:
本发明基于该视频指纹,采用串匹配方法对关键视频进行有效检测,通过计算两个视频之间的任意两个关键帧的欧式距离,可以准确判断两个视频是否匹配。作为优化,在匹配率的基础上,还考虑到每个关键帧相似度对整个视频序列相似性的贡献不同,关键帧所在视频片段时长越长,其对视频序列的相似性贡献越大,反之贡献越小。因此,将匹配的关键帧视频指纹串的相似度进行加权,权值由关键帧所在视频片段的时长获得。最后由匹配时长与匹配率共同决定待检索视频与基准视频是否匹配。本方法不仅考虑关键帧像素点的特征,同时考虑整体空间的分布,因此能对视频内容的关键信息进行描述,从而获得更好的视频序列检测结果。本发明方法设计简单,易于实现。
附图说明
图1为本发明的基于视觉特征的视频指纹检测及视频序列匹配方法流程图;
图2为本发明的应用实例的数据图;
图3为本发明的应用实例结果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明的基于视觉特征的视频指纹检测及视频序列匹配方法如图1所示,具体实现步骤如下:
1、基准视频指纹的提取。
(1)按照帧间相关性对视频序列分段,在得到的每个视频分段中提取最具有代表性的关键帧。
对于视频序列的关键帧选取,关键在于寻找最优分割点,从而能够得到足够精确的视频关键帧序列。具体可采用基于视频分割的关键帧提取、基于聚类的关键帧提取、基于公差带的关键帧提取以及基于运动分析的关键帧提取等方法。本发明对基于视频分割的关键帧提取方法进行了改进为例详细说明:
(1.1)对视频进行解码,获得所有视频帧的信息;
(1.2)基于时间顺序对视频序列进行分段。
对视频序列中的各帧进行色彩直方图统计,计算相邻两帧间的色彩直方图距离。由于色彩直方图距离描述了不同颜色在图像中所占的比例,反映了图像颜色的统计分布和基本色调。因此,本发明采用色彩直方图距离来表征两帧间的相关性,在低算法复杂度的条件下可以准确的对视频进行分段。接下来,对色彩直方图距离进行归一化处理得到相邻帧间的分割度量。
以第一帧为初始帧开始,将初始帧与第二帧间的相关性度量与分段阈值比较,若相关性度量低于分段阈值,则初始帧与第二帧间设为分割点,否则将第二帧与第三帧间、第三帧与第四帧间……进行相同方式的比较和处理,一直到找到分割点为止,那么初始帧与分割点间的视频图像为一视频分段。将分割点的下一帧作为初始帧,按照相同的方式确定下一视频分段。
分段阈值为经验值,与连续两帧的相似度有关,具体可根据试验结果调整,例如将该分割度量值小于-20的位置设置为一个视频分割点。
(1.3)在每一个视频片段选取最具有代表性的帧作为关键帧。最具代表性的帧选取原则是:与该视频片段中与该段内所有帧的色彩直方图距离平均值最近的帧为最具代表性的帧,即关键帧。
(1.4)在提取关键帧后,设置该关键帧的权重。由于每段视频反映的内容重要程度不同,因此对不同的关键帧赋予不同的权重。权重通过每个关键帧对代表的视频片段长度来决定的,视频片段越长则其权重相对越大,反之则越小。这样既获得了每个视频分段的时间,同时又将视频段内容的重要程度加以区分。
(2)分别在各关键帧中采样,对采样得到的像素点提取视频特征。
对基准视频序列的各关键帧进行采样,并对选取的像素点提取视频特征。视频图像的特征有很多,概括起来包括纹理特征、颜色特征、几何形状特征等,针对以上特征又包含一些具体的特征,如颜色直方图、颜色矩、灰度统计特征、边缘特征、角点特征等。本发明选用SIFT视频特征,该特征对发生平移、旋转、尺度缩放、亮度变化、视角变化、仿射变换、噪声干扰等图像都有较好的匹配效果。
(3)依据视频特征,利用离线样本聚类得到的像素点特征字典对采样像素点分类;
在指纹提取前,首先利用历史样本视频训练得到像素点特征字典,具体为:
对样本视频的关键帧首先进行采样,并对选取的像素点提取视频特征。
对提取的像素点特征聚类得到像素点特征字典。聚类可采用K均值聚类算法、凝聚层次聚类算法、基于密度的聚类算法(DBSCAN)等,本发明优选K均值聚类算法,它被广泛的用于连续空间中的数据对象聚类。
视频指纹生成决定了视频内容描述能力的性能,旨在获得对视频关键内容及全局部分具有较好代表能力的视频特征。视频指纹的提取可采用基于图像特征的视频指纹提取、基于运动特征的视频指纹提取、以及结合图像特征与运动特征的视频指纹提取等方法。
由于本发明已经进行了关键帧的提取,所以在提取视频指纹时,只需要采用基于关键帧内容的方法。该方法提取的视频指纹具有较强的描述能力和较好的鲁棒性。按照下述方法对对基准视频序列的每一关键帧提取视频指纹:
(3.1)利用像素点特征字典对步骤(2)的采样像素点进行分类,每个采样点获得一个标签;
(3.2)对各关键帧先后多次分块,每次分块数量不同,对每次得到的分块统计字典元素出现的数量,例如字典的维数n为1024维,对每个元素都进行统计,那么每一块得到的统计特征就有1024维。将图像分成不同层次的块,这样可以提高匹配的准确度,基于块的特征可以防止一定的图像篡改带来的干扰,每次分块数量优选2m,m大于1,分块次数和每次分块个数越多,准确度越大,但会带来计算量的增加,具体选择根据精度要求和试验结果适当调整。
例如,将图像分成1*1块。统计字典元素得到1024*1维特征;将图像分成2*2块,在每一个块内分别进行统计字典元素出现的数量得到1024*4维特征;将图像分成4*4块,统计字典元素得到1024*16维特征。这样每一帧会得到1024*21维特征,并将全部的统计结果拼接作为该帧的视频指纹。
(4)对获得视频指纹进行降维,从而生成低维度的视频指纹;
低维度视频指纹生成方法旨在降低原始高维视频指纹特征,从而能够更加精确的进行视频指纹的存储和查询。对获得高维视频指纹进行降维,具体可采用主成份分析法、独立成分分析法、线性决策分析法、局部特性分析法等,本发明优选主成份分析法,将众多具有相关性的属性合并组成新的互相无关的综合指标,来实现视频指纹的降维。
(5)将各视频片段的关键帧的视频指纹按照时间先后顺序连成关键帧视频指纹串,以备后续匹配过程中应用串匹配方法进行两个视频片段的相关性分析,实际上,每个关键帧视频指纹串就是一个特征向量组,每个元素就是一帧图像的特征向量。
2、待分析视频序列的匹配。
将待分析的视频序列与基准视频序列按照如下步骤进行匹配:
(1)待分析视频序列和基准视频序列分别进行以上视频指纹提取后,分别得到的是两个关键帧视频指纹串。
(2)应用串匹配方法进行视频关键帧视频指纹串的匹配。视频的关键帧视频指纹串是以每一关键帧的特征向量为单位元素的串,它们匹配,可以抽象为串匹配的问题。所以本发明用串匹配的方法解决视频关键帧串的匹配问题,对于待分析视频序列和基准视频序列的关键帧视频指纹串中的任意两个关键帧,计算该两关键帧低维度视频指纹的欧式距离,具体如下:
令待检索视频Q的关键帧集合表示为
Figure BDA0000423053100000091
nq为待检索视频Q的关键帧数目;基准视频片段
Figure BDA0000423053100000093
的关键帧集合表示为
Figure BDA0000423053100000092
ni为基准视频片段Clipi的关键帧数目;
计算待检索视频Q中第s个关键帧kfq,s与基准视频片段Clipi中第t个关键帧kfi,t之间的欧式距离:
d(kfq,s,kfi,t)=norm(feaq,s,feai,t),
式中,s=1,…,nq,t=1,…,ni,feaq,s和feai,t分别是关键帧kfq,s与kfi,t的视觉特征向量,norm()表示求向量feaq,s和feai,t之差的2-范数;
欧式距离d(kfq,s,kfi,t)越小,则表明待检索视频Q中第s个关键帧kfq,s与基准视频片段Clipi中第t个关键帧kfi,t间的相似性越大。实际应用中,可定义阈值T1,当d(kfq,s,kfi,t)<T1时,认为该两帧完全匹配。需要指出的是,较小的T1将会使得两个视频帧之间匹配的条件更加严格,使得只有极为相似的视频帧才会匹配。较大的T1将会使得两个视频帧之间匹配的条件更加宽松,使得匹配的视频帧更多。
只要待检索视频存在一帧与基准视频片段Clipi中关键帧kfi,t匹配,则认为关键帧kfi,t匹配成功,通过将基准视频中匹配成功的关键帧数比上基准视频的关键帧总数获得基准视频的匹配率。
进一步地,还可将匹配的关键帧视频指纹串的相似度进行加权,从而获得两个视频序列的综合匹配结果。将匹配的关键帧视频指纹串的相似度进行加权,权值由关键帧所在视频片段的时长获得,加权的目的是为了突出每个关键帧相似度对整个视频序列相似性的贡献不同,关键帧所在视频片段时长越长,其对视频序列的相似性贡献越大,反之贡献越小。由此得到视频序列的相似性,从而获得两个视频序列的匹配结果。具体过程如下:
权值由以下公式得到:
w kf ( kf i , t ) = length ( Clip t ) length ( Video i )
kfi,t为基准视频中的第t个关键帧,length(Clips)为该关键帧代表的视频分段的时长,length(Videoi)代表基准视频的总时长。
若待检索视频的某个关键帧与kfi,t匹配,则匹配标志flagt=1,否则为flagt=0,该关键帧所代表视频片段与待检索视频某片段的相似度为flagt×wkf(kfi,t),那么基准视频与待检索视频总相似度为:
Figure BDA0000423053100000102
那么总的匹配时长为:匹配时长与匹配率共同决定待检索视频与基准视频是否匹配。
实施例:
本实施例选取了1000段视频序列。每段视频序列从几秒钟到1分钟不等,分别包括单个或多个视频镜头。为了描述方便,在以下介绍中每个视频序列均使用一个视频关键帧进行代表。另外选取一个待分析视频,并通过分辨率变化、局部遮挡、字幕变化、台标变化等方式获得20种处理后视频序列。本实施例旨在从1000+20个视频序列中检测到20个相关的视频序列。
本实施例的基于视觉特征的视频指纹检测及视频序列匹配方法包括以下步骤:
1)对原始视频序列进行解码,获得各视频帧的信息,对每一段视频进行基于时间顺序的关键帧提取,并为每个关键帧赋予一定权重;
2)对每一个关键帧提取视觉特征,并通过空间位置分布建立具有空间分布描述能力的视频指纹;
3)对获得视频指纹进行降维,从而生成低维度的视频指纹;
4)将一个视频片段的关键帧连成一个具有时间顺序的关键帧串,应用串匹配方法进行两个视频片段的相关性分析。
上述步骤1)中,对于视频序列的关键帧选取,关键在于寻找最优分割点,从而能够得到足够精确的视频关键帧序列。具体包括以下步骤:
(1)对视频进行解码,获得所有视频帧的信息;
(2)计算任意两个视频帧之间的距离,这里采用每个视频帧的色彩直方图距离,并基于时间顺序对视频进行分段。每次选取一个初始帧,当后续帧与初始帧距离超出一个阈值时,设置为一个视频断点,从而获得一个视频片段,并重新初始化初始帧,其中阈值设置为0.5;
(3)对每一个视频片段选取最具有代表性的帧作为关键帧,并基于该视频片段的帧的数量设置该关键帧的权重。
上述步骤2)中视频指纹生成决定了视频内容描述能力的性能,旨在获得对视频关键内容及全局部分具有较好代表能力的视频特征。具体包括以下几个步骤:
(1)对待处理的关键帧首先进行密集采样,并对选取的像素点提取SIFT视频特征,其中两个方向的步进步长均为10个像素;
(2)选取大量像素点特征,应用K均值聚类获得一个大小为1024的像素点特征字典,这里选取20万个像素点的SIFT特征进行K均值聚类生成像素点特征字典;
(3)基于像素点特征字典对(1)中像素点特征进行分类,每个采样点获得一个标签;
(4)将图像分成不从层次的块,比如1*1、2*2和4*4,在每一个块内进行分别统计字典元素出现的数量,并将全部的统计结果拼接作为该帧的视频指纹。
上述步骤3)中低维度视频指纹生成方法旨在降低原始高维视频指纹特征,从而能够更加精确的进行视频指纹的存储和查询。对获得高维视频指纹进行降维,使用主成分分析将高维指纹降维到200维,从而获得低维视频指纹。
上述步骤4)中应用串匹配方法进行视频关键帧视频指纹串的匹配:
计算待检索视频Q中第s个关键帧kfq,s与基准视频片段Clipi中第t个关键帧kfi,t之间的欧式距离:
d(kfq,s,kfi,t)=norm(feaq,s,feai,t),
当d(kfi,t,Q)<T1时,认为该关键帧与Q产生了完全匹配。在本实例中,T1被设置为0.4。
基于串匹配结果获得两个视频序列的相关性,将匹配的关键帧串的相似度进行加权,从而获得两个视频序列的匹配结果。这里我们设置匹配时长阈值为15秒,匹配率阈值为70%,用户可以根据需要设置阈值。
本实施例的待分析视频序列及20种编辑后的视频序列的单关键帧描述如图2所示。图3中给出了检测结果及顺序。从实验结果中可以看出,本方法能够有效的将相关的视频序列检测出来。
虽然在本方法说明及实施例中应用该视频指纹进行视频片段匹配,但是本发明并不限于这种形式的应用。本领域普通技术人员可在本发明的精神及观点内对本发明进行多种不同的修改,但凡依本发明权利要求书范围所做的同等的变化及修饰,皆为本发明所保护的范围。

Claims (9)

1.一种基于视觉特征的视频指纹检测方法,其特征在于,包括以下步骤:
(1)按照帧间相关性对视频序列分段,在得到的每个视频分段中提取最具有代表性的关键帧;
(2)分别在各关键帧中采样,对采样得到的像素点提取视频特征;
(3)依据视频特征,利用离线样本聚类得到的像素点特征字典对采样像素点分类;
(4)对各关键帧分别进行多次不同数量的分块;在每次分块得到的子块中,依据采样像素点的分类结果统计像素点特征字典各元素的出现次数,从而得到该子块对应的特征向量;将统计得到的所有子块特征向量拼接得到关键帧的高维视频指纹;
(5)对各高维视频指纹进行降维得到低维视频指纹;
(6)将各视频片段关键帧的低维视频指纹按照时间先后顺序连成关键帧视频指纹串。
2.根据权利要求1所述的基于视觉特征的视频指纹检测方法,其特征在于,所述步骤(1)按照帧间相关性对视频序列分段,在得到的每个视频分段中提取最具有代表性的关键帧的具体过程为:
计算视频序列中相邻两帧间的色彩直方图距离,将色彩直方图距离归一化处理后作为相邻帧间的相关性度量;若相关性度量低于分段阈值,则将该相关性度量对应的相邻帧间设为分割点;相邻分割点之间的视频划分为一个视频片断。
3.根据权利要求1或2所述的基于视觉特征的视频指纹检测方法,其特征在于,所述视频特征为SIFT视频特征、颜色直方图、颜色矩、灰度统计特征、边缘特征或角点特征。
4.根据权利要求1或2所述的基于视觉特征的视频指纹检测方法,其特征在于,所述像素点特征字典是采用K均值聚类算法、凝聚层次聚类算法或DBSCAN聚类算法聚类得到。
5.根据权利要求1或2所述的基于视觉特征的视频指纹检测方法,其特征在于,所述步骤(5)采用主成份分析法、独立成分分析法、线性决策分析法或局部特性分析法对各高维视频指纹进行降维得到低维视频指纹。
6.一种视频序列匹配方法,其特征在于,具体为:针对待分析视频序列和基准视频序列,分别按照权利要求1~5任意一项所述的视频指纹检测方法进行检测,得到各自的关键帧视频指纹串;采用串匹配方法对两关键帧视频指纹串进行匹配。
7.根据权利要求6所述的一种视频序列匹配方法,其特征在于,所述采用串匹配方法对两关键帧视频指纹串进行匹配的具体实现过程为:
令待检索视频Q的关键帧集合表示为
Figure FDA0000423053090000021
nq为待检索视频Q的关键帧数目;基准视频片段
Figure FDA0000423053090000023
的关键帧集合表示为
Figure FDA0000423053090000022
ni为基准视频片段Clipi的关键帧数目;
计算待检索视频Q中第s个关键帧kfq,s与基准视频片段Clipi中第t个关键帧kfi,t之间的欧式距离:
d(kfq,s,kfi,t)=norm(feaq,s,feai,t),
式中,s=1,…,nq,t=1,…,ni,feaq,s和feai,t分别是关键帧kfq,s与kfi,t的视觉特征向量,norm()表示求向量feaq,s和feai,t之差的2-范数;
若欧式距离d(kfq,s,kfi,t)<阈值T1,则判定kfq,s与kfi,t匹配;
一旦待检索视频存在一帧与基准视频片段Clipi中关键帧kfi,t匹配,则认为关键帧kfi,t匹配成功,计算基准视频中匹配成功的关键帧数与基准视频的关键帧总数的比值即为匹配率。
8.根据权利要求7所述的一种视频序列匹配方法,其特征在于,所述匹配的具体实现过程还包括下述步骤:
若待检索视频的某个关键帧与基准视频中的第t个关键帧kfi,t匹配,则匹配标志flagt=1,否则为flagt=0,该关键帧kfi,t所代表视频片段与待检索视频某片段的相似度为flagt×wkf(kfi,t);
计算基准视频与待检索视频总相似度为
Figure FDA0000423053090000031
计算总的匹配时长为 t = length ( Video i ) · Σ t = 1 n i flag t × w kf ( kf i , t ) ;
综合考虑匹配时长与匹配率确定待检索视频与基准视频是否匹配。
9.一种基于视觉特征的视频指纹检测系统,其特征在于,包括
第一模块,用于按照帧间相关性对视频序列分段,在得到的每个视频分段中提取最具有代表性的关键帧;
第二模块,用于分别在各关键帧中采样,对采样得到的像素点提取视频特征;
第三模块,用于依据视频特征,利用离线样本聚类得到的像素点特征字典对采样像素点分类;
第四模块,用于对各关键帧分别进行多次不同数量的分块;在每次分块得到的子块中,依据采样像素点的分类结果统计像素点特征字典各元素的出现次数,从而得到该子块对应的特征向量;将统计得到的所有子块特征向量拼接得到关键帧的高维视频指纹;
第五模块,用于对各高维视频指纹进行降维得到低维视频指纹;
第六模块,用于将各视频片段关键帧的低维视频指纹按照时间先后顺序连成关键帧视频指纹串。
CN201310608893.3A 2013-11-25 2013-11-25 基于视觉特征的视频指纹检测及视频序列匹配方法及系统 Active CN103593464B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310608893.3A CN103593464B (zh) 2013-11-25 2013-11-25 基于视觉特征的视频指纹检测及视频序列匹配方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310608893.3A CN103593464B (zh) 2013-11-25 2013-11-25 基于视觉特征的视频指纹检测及视频序列匹配方法及系统

Publications (2)

Publication Number Publication Date
CN103593464A true CN103593464A (zh) 2014-02-19
CN103593464B CN103593464B (zh) 2017-02-15

Family

ID=50083605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310608893.3A Active CN103593464B (zh) 2013-11-25 2013-11-25 基于视觉特征的视频指纹检测及视频序列匹配方法及系统

Country Status (1)

Country Link
CN (1) CN103593464B (zh)

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077590A (zh) * 2014-06-30 2014-10-01 安科智慧城市技术(中国)有限公司 一种视频指纹提取方法及系统
CN104219423A (zh) * 2014-09-25 2014-12-17 联想(北京)有限公司 一种信息处理方法和装置
CN104239566A (zh) * 2014-09-28 2014-12-24 小米科技有限责任公司 视频搜索的方法及装置
CN104504121A (zh) * 2014-12-29 2015-04-08 北京奇艺世纪科技有限公司 一种视频检索方法及装置
CN105677758A (zh) * 2015-12-30 2016-06-15 合一网络技术(北京)有限公司 一种建立样本视频与副本视频归属关系的方法及系统
CN105740773A (zh) * 2016-01-25 2016-07-06 重庆理工大学 基于深度学习和多尺度信息的行为识别方法
CN106021320A (zh) * 2016-05-06 2016-10-12 成都索贝数码科技股份有限公司 基于视频的在线实时视频的检索方法
CN106203494A (zh) * 2016-06-30 2016-12-07 电子科技大学 一种基于内存计算的并行化聚类方法
CN106228121A (zh) * 2016-07-15 2016-12-14 华中科技大学 手势特征识别方法和装置
CN106375781A (zh) * 2015-07-23 2017-02-01 无锡天脉聚源传媒科技有限公司 一种重复视频的判断方法及装置
CN106375850A (zh) * 2015-07-23 2017-02-01 无锡天脉聚源传媒科技有限公司 一种匹配视频的判断方法及装置
CN106708876A (zh) * 2015-11-16 2017-05-24 任子行网络技术股份有限公司 一种基于Lucene的相似视频检索方法及系统
CN107103002A (zh) * 2016-02-22 2017-08-29 南京中兴新软件有限责任公司 图像的检索方法及装置
CN107180056A (zh) * 2016-03-11 2017-09-19 阿里巴巴集团控股有限公司 视频中片段的匹配方法和装置
CN107622270A (zh) * 2016-07-13 2018-01-23 中国电信股份有限公司 图像相似度计算方法和装置、相似图像检索方法和系统
CN107704570A (zh) * 2017-09-30 2018-02-16 韦彩霞 一种高效的多媒体教学管理系统
CN107704525A (zh) * 2017-09-04 2018-02-16 优酷网络技术(北京)有限公司 视频搜索方法和装置
CN108021852A (zh) * 2016-11-04 2018-05-11 株式会社理光 一种人数统计方法、人数统计系统及电子设备
CN108615043A (zh) * 2016-12-12 2018-10-02 中移(杭州)信息技术有限公司 一种视频分类方法及系统
CN108734491A (zh) * 2017-04-20 2018-11-02 合信息技术(北京)有限公司 评估多媒体数据的版权价值的方法及装置
CN108769731A (zh) * 2018-05-25 2018-11-06 北京奇艺世纪科技有限公司 一种检测视频中目标视频片段的方法、装置及电子设备
CN108810622A (zh) * 2018-07-09 2018-11-13 腾讯科技(深圳)有限公司 视频帧的提取方法、装置、计算机可读介质及电子设备
CN109241342A (zh) * 2018-07-23 2019-01-18 中国科学院计算技术研究所 基于深度线索的视频场景检索方法和系统
CN109543511A (zh) * 2018-10-09 2019-03-29 广州市诚毅科技软件开发有限公司 基于图纹突变帧和特征计算的视频识别方法、系统及装置
CN109857907A (zh) * 2019-02-25 2019-06-07 百度在线网络技术(北京)有限公司 视频定位方法和装置
CN109960960A (zh) * 2017-12-14 2019-07-02 中国移动通信集团安徽有限公司 视频指纹生成和匹配方法及装置、计算机设备和存储介质
CN109992678A (zh) * 2019-03-14 2019-07-09 深圳市腾讯计算机系统有限公司 目标多媒体文件的确定方法及装置
CN110489596A (zh) * 2019-07-04 2019-11-22 天脉聚源(杭州)传媒科技有限公司 一种视频检测方法、系统、装置及存储介质
CN110598014A (zh) * 2019-09-27 2019-12-20 腾讯科技(深圳)有限公司 一种多媒体数据处理方法、装置及存储介质
CN111143619A (zh) * 2019-12-27 2020-05-12 咪咕文化科技有限公司 视频指纹生成方法、检索方法、电子设备及介质
CN111753673A (zh) * 2020-06-04 2020-10-09 五八有限公司 一种视频数据的检测方法和装置
US20200349385A1 (en) * 2018-04-13 2020-11-05 Tencent Technology (Shenzhen) Company Limited Multimedia resource matching method and apparatus, storage medium, and electronic apparatus
TWI719780B (zh) * 2019-12-26 2021-02-21 國立高雄大學 指紋對位方法及其裝置
CN112434553A (zh) * 2020-10-15 2021-03-02 北京工业大学 一种基于深度字典学习的视频鉴别方法及系统
CN112565825A (zh) * 2020-12-02 2021-03-26 腾讯科技(深圳)有限公司 一种视频数据处理方法、装置、设备以及介质
CN112800985A (zh) * 2021-02-02 2021-05-14 杭州刀豆网络科技有限公司 一种基于深度学习的视频对比方法
CN113254712A (zh) * 2021-05-12 2021-08-13 北京百度网讯科技有限公司 视频匹配方法、视频处理方法、装置、电子设备及介质
CN113596575A (zh) * 2021-08-02 2021-11-02 北京市博汇科技股份有限公司 一种视频指纹数据的生成方法、比对方法及设备
CN113987267A (zh) * 2021-10-28 2022-01-28 上海数禾信息科技有限公司 视频文件的标签生成方法、装置、计算机设备和存储介质
CN116437127A (zh) * 2023-06-13 2023-07-14 典基网络科技(上海)有限公司 一种基于用户数据共享的视频卡顿优化方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254006A (zh) * 2011-07-15 2011-11-23 上海交通大学 基于内容的互联网视频检索方法
CN103390040A (zh) * 2013-07-17 2013-11-13 南京邮电大学 一种视频拷贝检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254006A (zh) * 2011-07-15 2011-11-23 上海交通大学 基于内容的互联网视频检索方法
CN103390040A (zh) * 2013-07-17 2013-11-13 南京邮电大学 一种视频拷贝检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
刘巍: "基于内容的同源音频和视频检索", 《中国优秀硕士学位论文全文数据库》 *
周志立: "基于内容的视频拷贝检测算法研究", 《中国优秀硕士学位论文全文数据库》 *
惠雯,赵海英,林闯,杨扬: "基于内容的视频取证研究", 《计算机科学》 *
梅玫: "基于内容的同源视频检索技术研究", 《中国优秀硕士学位论文全文数据库》 *

Cited By (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077590A (zh) * 2014-06-30 2014-10-01 安科智慧城市技术(中国)有限公司 一种视频指纹提取方法及系统
CN104219423A (zh) * 2014-09-25 2014-12-17 联想(北京)有限公司 一种信息处理方法和装置
CN104239566B (zh) * 2014-09-28 2019-02-12 小米科技有限责任公司 视频搜索的方法及装置
CN104239566A (zh) * 2014-09-28 2014-12-24 小米科技有限责任公司 视频搜索的方法及装置
CN104504121A (zh) * 2014-12-29 2015-04-08 北京奇艺世纪科技有限公司 一种视频检索方法及装置
CN106375850A (zh) * 2015-07-23 2017-02-01 无锡天脉聚源传媒科技有限公司 一种匹配视频的判断方法及装置
CN106375850B (zh) * 2015-07-23 2019-09-13 无锡天脉聚源传媒科技有限公司 一种匹配视频的判断方法及装置
CN106375781B (zh) * 2015-07-23 2019-09-13 无锡天脉聚源传媒科技有限公司 一种重复视频的判断方法及装置
CN106375781A (zh) * 2015-07-23 2017-02-01 无锡天脉聚源传媒科技有限公司 一种重复视频的判断方法及装置
CN106708876B (zh) * 2015-11-16 2020-04-21 任子行网络技术股份有限公司 一种基于Lucene的相似视频检索方法及系统
CN106708876A (zh) * 2015-11-16 2017-05-24 任子行网络技术股份有限公司 一种基于Lucene的相似视频检索方法及系统
CN105677758A (zh) * 2015-12-30 2016-06-15 合一网络技术(北京)有限公司 一种建立样本视频与副本视频归属关系的方法及系统
CN105740773A (zh) * 2016-01-25 2016-07-06 重庆理工大学 基于深度学习和多尺度信息的行为识别方法
CN105740773B (zh) * 2016-01-25 2019-02-01 重庆理工大学 基于深度学习和多尺度信息的行为识别方法
CN107103002A (zh) * 2016-02-22 2017-08-29 南京中兴新软件有限责任公司 图像的检索方法及装置
CN107180056A (zh) * 2016-03-11 2017-09-19 阿里巴巴集团控股有限公司 视频中片段的匹配方法和装置
CN106021320A (zh) * 2016-05-06 2016-10-12 成都索贝数码科技股份有限公司 基于视频的在线实时视频的检索方法
CN106021320B (zh) * 2016-05-06 2018-06-29 成都索贝数码科技股份有限公司 基于视频的在线实时视频的检索方法
CN106203494A (zh) * 2016-06-30 2016-12-07 电子科技大学 一种基于内存计算的并行化聚类方法
CN106203494B (zh) * 2016-06-30 2019-12-13 电子科技大学 一种基于内存计算的并行化聚类方法
CN107622270A (zh) * 2016-07-13 2018-01-23 中国电信股份有限公司 图像相似度计算方法和装置、相似图像检索方法和系统
CN106228121B (zh) * 2016-07-15 2019-12-06 华中科技大学 手势特征识别方法和装置
CN106228121A (zh) * 2016-07-15 2016-12-14 华中科技大学 手势特征识别方法和装置
CN108021852A (zh) * 2016-11-04 2018-05-11 株式会社理光 一种人数统计方法、人数统计系统及电子设备
CN108615043B (zh) * 2016-12-12 2021-05-25 中移(杭州)信息技术有限公司 一种视频分类方法及系统
CN108615043A (zh) * 2016-12-12 2018-10-02 中移(杭州)信息技术有限公司 一种视频分类方法及系统
CN108734491A (zh) * 2017-04-20 2018-11-02 合信息技术(北京)有限公司 评估多媒体数据的版权价值的方法及装置
CN108734491B (zh) * 2017-04-20 2023-04-07 阿里巴巴(中国)有限公司 评估多媒体数据的版权价值的方法及装置
CN107704525A (zh) * 2017-09-04 2018-02-16 优酷网络技术(北京)有限公司 视频搜索方法和装置
CN107704570A (zh) * 2017-09-30 2018-02-16 韦彩霞 一种高效的多媒体教学管理系统
CN109960960A (zh) * 2017-12-14 2019-07-02 中国移动通信集团安徽有限公司 视频指纹生成和匹配方法及装置、计算机设备和存储介质
US20200349385A1 (en) * 2018-04-13 2020-11-05 Tencent Technology (Shenzhen) Company Limited Multimedia resource matching method and apparatus, storage medium, and electronic apparatus
US11914639B2 (en) * 2018-04-13 2024-02-27 Tencent Technology (Shenzhen) Company Limited Multimedia resource matching method and apparatus, storage medium, and electronic apparatus
CN108769731A (zh) * 2018-05-25 2018-11-06 北京奇艺世纪科技有限公司 一种检测视频中目标视频片段的方法、装置及电子设备
CN108769731B (zh) * 2018-05-25 2021-09-24 北京奇艺世纪科技有限公司 一种检测视频中目标视频片段的方法、装置及电子设备
CN108810622A (zh) * 2018-07-09 2018-11-13 腾讯科技(深圳)有限公司 视频帧的提取方法、装置、计算机可读介质及电子设备
CN109241342A (zh) * 2018-07-23 2019-01-18 中国科学院计算技术研究所 基于深度线索的视频场景检索方法和系统
CN109543511A (zh) * 2018-10-09 2019-03-29 广州市诚毅科技软件开发有限公司 基于图纹突变帧和特征计算的视频识别方法、系统及装置
CN109857907B (zh) * 2019-02-25 2021-11-30 百度在线网络技术(北京)有限公司 视频定位方法和装置
CN109857907A (zh) * 2019-02-25 2019-06-07 百度在线网络技术(北京)有限公司 视频定位方法和装置
CN109992678A (zh) * 2019-03-14 2019-07-09 深圳市腾讯计算机系统有限公司 目标多媒体文件的确定方法及装置
CN109992678B (zh) * 2019-03-14 2021-05-11 深圳市腾讯计算机系统有限公司 目标多媒体文件的确定方法及装置
CN110489596A (zh) * 2019-07-04 2019-11-22 天脉聚源(杭州)传媒科技有限公司 一种视频检测方法、系统、装置及存储介质
CN110598014A (zh) * 2019-09-27 2019-12-20 腾讯科技(深圳)有限公司 一种多媒体数据处理方法、装置及存储介质
CN110598014B (zh) * 2019-09-27 2021-12-10 腾讯科技(深圳)有限公司 一种多媒体数据处理方法、装置及存储介质
TWI719780B (zh) * 2019-12-26 2021-02-21 國立高雄大學 指紋對位方法及其裝置
CN111143619B (zh) * 2019-12-27 2023-08-15 咪咕文化科技有限公司 视频指纹生成方法、检索方法、电子设备及介质
CN111143619A (zh) * 2019-12-27 2020-05-12 咪咕文化科技有限公司 视频指纹生成方法、检索方法、电子设备及介质
CN111753673A (zh) * 2020-06-04 2020-10-09 五八有限公司 一种视频数据的检测方法和装置
CN112434553B (zh) * 2020-10-15 2024-04-19 北京工业大学 一种基于深度字典学习的视频鉴别方法及系统
CN112434553A (zh) * 2020-10-15 2021-03-02 北京工业大学 一种基于深度字典学习的视频鉴别方法及系统
WO2022116888A1 (zh) * 2020-12-02 2022-06-09 腾讯科技(深圳)有限公司 一种视频数据处理方法、装置、设备以及介质
CN112565825A (zh) * 2020-12-02 2021-03-26 腾讯科技(深圳)有限公司 一种视频数据处理方法、装置、设备以及介质
CN112800985A (zh) * 2021-02-02 2021-05-14 杭州刀豆网络科技有限公司 一种基于深度学习的视频对比方法
CN113254712A (zh) * 2021-05-12 2021-08-13 北京百度网讯科技有限公司 视频匹配方法、视频处理方法、装置、电子设备及介质
CN113254712B (zh) * 2021-05-12 2024-04-26 北京百度网讯科技有限公司 视频匹配方法、视频处理方法、装置、电子设备及介质
CN113596575A (zh) * 2021-08-02 2021-11-02 北京市博汇科技股份有限公司 一种视频指纹数据的生成方法、比对方法及设备
CN113596575B (zh) * 2021-08-02 2023-09-22 北京市博汇科技股份有限公司 一种视频指纹数据的生成方法、比对方法及设备
CN113987267A (zh) * 2021-10-28 2022-01-28 上海数禾信息科技有限公司 视频文件的标签生成方法、装置、计算机设备和存储介质
CN116437127A (zh) * 2023-06-13 2023-07-14 典基网络科技(上海)有限公司 一种基于用户数据共享的视频卡顿优化方法
CN116437127B (zh) * 2023-06-13 2023-08-11 典基网络科技(上海)有限公司 一种基于用户数据共享的视频卡顿优化方法

Also Published As

Publication number Publication date
CN103593464B (zh) 2017-02-15

Similar Documents

Publication Publication Date Title
CN103593464B (zh) 基于视觉特征的视频指纹检测及视频序列匹配方法及系统
Yin et al. Text detection, tracking and recognition in video: a comprehensive survey
TWI235343B (en) Estimating text color and segmentation of images
US8358837B2 (en) Apparatus and methods for detecting adult videos
CN104376003B (zh) 一种视频检索方法及装置
US20210019872A1 (en) Detecting near-duplicate image
CN110717411A (zh) 一种基于深层特征融合的行人重识别方法
CN104166685A (zh) 一种检测视频片段的方法和装置
CN106599133B (zh) 一种基于草图交互的监控视频可视分析方法
Zhang et al. License plate localization in unconstrained scenes using a two-stage CNN-RNN
Yang et al. Spatiotemporal trident networks: detection and localization of object removal tampering in video passive forensics
CN102176208A (zh) 基于三维空时特征的鲁棒视频指纹方法
Rong et al. Scene text recognition in multiple frames based on text tracking
CN111507215A (zh) 基于时空卷积循环神经网络与空洞卷积的视频目标分割方法
Ren et al. Image set classification using candidate sets selection and improved reverse training
Zhang [Retracted] Sports Action Recognition Based on Particle Swarm Optimization Neural Networks
Guangjing et al. Research on static image recognition of sports based on machine learning
Elmezain et al. A novel system for automatic hand gesture spotting and recognition in stereo color image sequences
Ozay et al. Sequential sparsification for change detection
CN104318207B (zh) 一种利用快速鲁棒特征和支持向量机来判断切变镜头和渐变镜头的方法
Zhang et al. Shot boundary detection based on block-wise principal component analysis
Zhu et al. [Retracted] Basketball Object Extraction Method Based on Image Segmentation Algorithm
Prabakaran et al. Key frame extraction analysis based on optimized convolution neural network (ocnn) using intensity feature selection (ifs)
Aiswarya et al. Keyframe Extraction Algorithm for Continuous Sign‐Language Videos Using Angular Displacement and Sequence Check Metrics
Dahake Face Recognition from Video using Threshold based Clustering

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant