CN111460961A - 一种基于cdvs的相似图聚类的静态视频摘要方法 - Google Patents

一种基于cdvs的相似图聚类的静态视频摘要方法 Download PDF

Info

Publication number
CN111460961A
CN111460961A CN202010227616.8A CN202010227616A CN111460961A CN 111460961 A CN111460961 A CN 111460961A CN 202010227616 A CN202010227616 A CN 202010227616A CN 111460961 A CN111460961 A CN 111460961A
Authority
CN
China
Prior art keywords
frames
frame
cdvs
video
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010227616.8A
Other languages
English (en)
Other versions
CN111460961B (zh
Inventor
滕国伟
朱林林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN202010227616.8A priority Critical patent/CN111460961B/zh
Publication of CN111460961A publication Critical patent/CN111460961A/zh
Application granted granted Critical
Publication of CN111460961B publication Critical patent/CN111460961B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8549Creating video summaries, e.g. movie trailer

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于CDVS的相似图聚类的静态视频摘要方法,旨在生成一个紧凑而且能够代表视频的静态图像集合。包括如下步骤:1)提取视频帧特征,为了降低运算复杂度,首先对输入视频帧进行预采样得到一组候选帧;然后对每个候选帧提取CDVS描述子,获得视频帧的特征。2)相似帧聚类,选择候选帧中的第一帧作为参考帧,利用汉明距离计算其余候选帧与参考帧之间的相似性,将高度相关的帧自动聚为一类,无需预设聚类的数量。3)关键帧的生成,通过视频帧色彩熵函数从每个聚类中选择选出一帧图像视觉质量最好的作为关键帧。4)冗余帧消除,对得到的关键帧利用汉明距离进行相似性计算,对相似的冗余帧消除,选择出的关键帧具有较好的图像视觉质量。

Description

一种基于CDVS的相似图聚类的静态视频摘要方法
技术领域
本发明涉及一种基于紧凑型视觉描述子(CDVS)的相似图聚类的静态视频摘要方法,属于视频摘要领域。
背景技术
随着科技的进步和多媒体技术的发展,视频信息的直观性、准确性和高效性使得数字视频的应用越来越广泛。但是不断增长的视频数据给其存储与检索也带来了巨大挑战。用户必须浏览大量的视频数据,每个视频数据跨越数小时才能获得相关视频。挖掘这些巨大的视频存储库以选择感兴趣的特定视频是昂贵、耗时且繁琐的任务。近年来,为提高视频检索性能和高效存储视频数据进行了大量的研究工作并取得了很好的效果。视频摘要是一种有效的解决方案,使得用户处理互联网上视频数量大幅增加。
现有的大多数方法在检测到视频镜头之后提取关键帧,通常基于镜头的方法得到的关键帧仍然可能是冗余的,因为类似的镜头可能在视频中出现多次。此外,预先设置簇的数量可能影响最佳视频摘要结果的生成。因此如果采用一种从整个视频中提取关键帧而不是分别从每个镜头中提取关键帧,那么就可以在准确性和冗余方面改善提取的关键帧质量。
发明内容
针对现有技术存在的缺陷,本发明的目的在于提供一种基于CDVS的相似图聚类的静态视频摘要方法,对每个候选帧提取紧凑型视觉描述子(CDVS),之后计算候选帧中每两帧之间的汉明距离,使用相似性图聚类来执行关键帧的选择,可以在准确性和冗余方面改善提取的关键帧质量。
为达到以上目的,本发明构思如下:
对输入视频帧进行预采样得到一组候选帧,然后对每个候选帧提取CDVS描述子。在候选帧中选一帧作为参考帧,利用汉明距离计算其余候选帧与参考帧之间的相似性,相似的视频帧聚为一类,每一类通过视频帧色彩熵函数选出一帧图像视觉最好的作为关键帧。最后对得到的关键帧进一步利用汉明距离进行相似性计算,如果关键帧之间存在相似的帧,那么这些相似的帧通过视频色彩熵函数选出一帧图像视觉最好的,作为最终的关键帧。
根据上述构思,本发明采用如下技术方案:
一种基于CDVS的相似图聚类的静态视频摘要方法,具体操作步骤如下:
1)预采样:对输入视频帧进行预采样,得到一组候选帧F=[F1,F2,F3,…,FM],其中M为候选帧的总数;
2)提取视频帧特征:选择若干候选帧F=[F1,F2,F3,…,FM],为每个候选帧计算CDVS描述子,获得视频帧特征;提取CDVS描述子包括三个步骤:兴趣点检测,局部特征选择和局部特征描述符聚合;
3)相似帧聚类:选择候选帧中的第一帧作为参考帧,利用汉明距离计算其余候选帧与参考帧之间的相似性,相似的视频帧聚为一类,这个过程能够检测高度相关的帧并自动聚为一类,并且避免了预设聚类的数量,避免影响视频摘要的最优结果生成;
4)关键帧的生成:通过视频帧色彩熵函数从每个簇中选择出一帧图像视觉质量最好的作为代表帧,不需要任何的迭代;
5)冗余帧的消除:由于步骤4)得到的代表帧之间可能还存在冗余,所以对得到的关键帧进一步利用汉明距离进行相似性计算,将每个代表与其余代表帧进行比较,从而消除冗余的关键帧,得到最终的视频摘要结果。
所述步骤2)中的CDVS描述子特征提取,具体步骤如下:
2-1)兴趣点检测:CDVS提出了一种新颖的逐块比例空间表示,并应用了高斯LoG滤波的拉普拉斯算子,以实现基于块的频域LoG,BFLoG检测器;为了识别兴趣点,CDVS提出了一种低次多项式ALP方法来通过多项式近似LoG滤波结果,用于在尺度空间中找到极值并完善检测点的空间位置;
2-2)特征选择:由兴趣点检测生成的局部特征的数量可能大于在给定CDVS图像描述符长度下存储的局部特征的数量,因此,CDVS标准根据局部特征的属性评估特征匹配的可能性,并选择数量有限的兴趣点,以识别那些最大化预期质量度量以进行后续匹配的特征点;特征属性包括尺度空间中的尺度σ,方向θ,尺度标准化的LoG响应值D,Hessian矩阵比p,尺度空间的二阶导数pσσ以及兴趣点到图像中心的距离d;
2-3)局部特征描述子聚合:CDVS标准中采用SCFV聚合描述子生成CDVS描述子,SCFV基本思想是对图像的局部特征降维压缩后生成的Fisher向量,Fisher Vector中包含了原特征向量每一维的值,并且包含了生成式建模过程的结构性信息,对图片的表达更加细致。
所述步骤3)中的相似帧聚类,具体步骤如下:
对所有候选帧进行特征提取之后,将所有的候选帧分割成簇;利用基于CDVS全局描述子匹配的相似帧聚类方法,这种方法不需要指定集群的数目;CDVS全局描述子匹配过程如下:给定两个图像Q和R,使用CDVS全局描述子计算基于汉明距离的相似度得分,如下所示:
Figure BDA0002427734050000031
其中:
Figure BDA0002427734050000032
表示GMM中第i个高斯函数的二值化fisher子矢量
Figure BDA0002427734050000033
如果选择第i个高斯函数
Figure BDA0002427734050000034
反之
Figure BDA0002427734050000035
表示来自Q和R的第i个高斯函数的Fisher子矢量的汉明距离,范围从0到D;
Figure BDA0002427734050000036
表示从INRIA Holidays,Oxford Buildings和Pasadena Buildings的一组匹配/不匹配图像对中学习的权重,
Figure BDA0002427734050000037
表示与二值化Fisher子矢量
Figure BDA0002427734050000038
相关联的权重;单个阈值τ用于声明两图像R与Q是否匹配,如果sQ,R大于阈值τ=0.5,说明两帧之间是匹配的,看作是同一类;
将候选帧的第一帧与其余所有候选帧进行汉明距离相似性计算,与第一帧相似度大于阈值τ的就被归为第一类;以此类推,将所有候选帧归为N个类,这N个类内的视频帧是相似的,类与类之间的视频帧是不相似的。
所述4)中关键帧的生成,关于视频帧色彩熵函数H(x):该值越高图像的对比度越高,则认为该帧具有较好的图像视觉质量,其定义如下:
Figure BDA0002427734050000039
其中:N表视色彩的种数,RGB色彩空间精度分别为8*8*8,则N为512;pi表示第i种色彩Ci在图像中出现概率,该值直接由图像色彩直方图得到。
与现有技术相比,本发明具有如下的优点:
本发明方法是从整个视频中提取关键帧而不是分别从每个镜头中提取关键帧,减少了冗余;与传统的聚类相比,本发明不用预先设置簇的数量,避免了设置参数对视频摘要结果的影响,提高了视频摘要结果的准确性;采用紧凑型视觉描述子来提取视频帧特征,与SIFT相比,其计算复杂度低,匹配精度高,速度快,并且需要非常低的内存;利用视频帧色彩熵函数,选择出的关键帧具有较好的图像视觉质量。
附图说明
图1为本发明基于CDVS的相似图聚类的静态视频摘要方法的流程图。
图2为本发明相似帧聚类方法的流程图。
具体实施方式
本发明优选实施例结合附图详述如下:
如图1所示,一种基于CDVS的相似图聚类的静态视频摘要方法,具体操作步骤如下:
1)预采样,视频是一种具有大量冗余的媒体,通常几十帧代表相同的视觉信息,为了降低运算复杂度,首先对输入视频帧进行预采样,得到一组候选帧F=[F1,F2,F3,...,FM],其中M为候选帧的总数。
2)提取视频帧特征,紧凑型视觉描述子可以有效地用于特征提取,并且计算复杂度比SIFT小得多。选择若干候选帧F=[F1,F2,F3,...,FM],为每个候选帧计算CDVS描述子,获得视频帧特征。提取CDVS描述子包括三个步骤:兴趣点检测,局部特征选择和局部特征描述符聚合,具体步骤如下:
2-1)兴趣点检测:CDVS提出了一种新颖的逐块比例空间表示,并应用了高斯LoG滤波的拉普拉斯算子,以实现基于块的频域LoG,BFLoG检测器;为了识别兴趣点,CDVS提出了一种低次多项式ALP方法来通过多项式近似LoG滤波结果,用于在尺度空间中找到极值并完善检测点的空间位置;
2-2)特征选择:由兴趣点检测生成的局部特征的数量可能大于在给定CDVS图像描述符长度下存储的局部特征的数量,因此,CDVS标准根据局部特征的属性评估特征匹配的可能性,并选择数量有限的兴趣点,以识别那些最大化预期质量度量以进行后续匹配的特征点;特征属性包括尺度空间中的尺度σ,方向θ,尺度标准化的LoG响应值D,Hessian矩阵比p,尺度空间的二阶导数pσσ以及兴趣点到图像中心的距离d;
2-3)局部特征描述子聚合:CDVS标准中采用SCFV聚合描述子生成CDVS描述子,SCFV基本思想是对图像的局部特征降维压缩后生成的Fisher向量,FisherVector中包含了原特征向量每一维的值,并且包含了生成式建模过程的结构性信息,对图片的表达更加细致。
3)相似帧聚类,选择候选帧中的第一帧作为参考帧,利用汉明距离计算其余候选帧与参考帧之间的相似性,相似的视频帧聚为一类,这个过程可以检测高度相关的帧并自动聚为一类,并且避免了预设聚类的数量,因为提前设置簇数可能会影响视频摘要的最优结果生成。
本实施例中,如图2所示,相似帧聚类方法主要包括以下几个步骤:首先在未分类的候选帧中选取第一帧作为查询图像Q,其余帧作为数据库图像(DB)R,根据步骤3)计算出所有数据库图像R相对于查询图像Q的距离di(i的值从1到n,n为数据库图像中帧的个数,相似度得分从高到低依次排列),设置一个最小得分阈值η,认为di<η的查询图像Q与数据库中的图像Ri内容相似,记di<η的视频帧的个数为N1,为了使N1个视频帧代表足够多的视频信息,设定阈值T1,如果N1小于T1,认为N1个视频帧过短且没有代表足够多的视频内容,将重新选取下一帧作为查询图像重新进行选择。此时将N1个视频帧作为Cluster 1,然后记未分类视频帧个数为Nu,在剩余未分类的视频帧中重复上述过程。最终可得到视频帧的n个分类Cluster l到Cluster n。
所述汉明距离计算公式如下:
所有候选帧都由CDVS全局描述子表示,给定两个图像Q和R,使用CDVS全局描述子计算基于汉明距离的相似度得分:
Figure BDA0002427734050000051
其中:
Figure BDA0002427734050000052
表示GMM中第i个高斯函数的二值化fisher子矢量
Figure BDA0002427734050000053
如果选择第i个高斯函数
Figure BDA0002427734050000054
反之
Figure BDA0002427734050000055
表示来自Q和R的第i个高斯函数的Fisher子矢量的汉明距离,范围从0到D(对于操作点512B,D=24,对于其他操作点,D=32)。
Figure BDA0002427734050000056
表示从INRIA Holidays,Oxford Buildings和Pasadena Buildings的一组匹配/不匹配图像对中学习的权重,
Figure BDA0002427734050000057
表示与二值化Fisher子矢量
Figure BDA0002427734050000058
相关联的权重。单个阈值τ用于声明两图像R与Q是否匹配,如果sQ,R大于阈值τ=0.5,说明两帧之间是匹配的,可以看作是同一类。
4)关键帧的生成,通过视频帧色彩熵函数从每个簇中选择出一帧图像视觉质量最好的作为代表帧,不需要任何的迭代。
关于视频帧色彩熵函数H(x):该值越高图像的对比度越高,则认为该帧具有较好的图像视觉质量,其定义如下:
Figure BDA0002427734050000059
其中:N表视色彩的种数,RGB色彩空间精度分别为8*8*8,则N为512。pi表示第i种色彩Ci在图像中出现概率,该值可以直接由图像色彩直方图得到。
5)冗余帧的消除,由于步骤4)得到的代表帧之间可能还存在冗余,所以对得到的关键帧进一步利用汉明距离进行相似性计算,将每个代表与其余代表帧进行比较,从而消除相似的关键帧,得到最终的视频摘要结果。

Claims (4)

1.一种基于CDVS的相似图聚类的静态视频摘要方法,其特征在于,具体操作步骤如下:
1)预采样:对输入视频帧进行预采样,得到一组候选帧F=[F1,F2,F3,…,FM],其中M为候选帧的总数;
2)提取视频帧特征:选择若干候选帧F=[F1,F2,F3,…,FM],为每个候选帧计算CDVS描述子,获得视频帧特征;提取CDVS描述子包括三个步骤:兴趣点检测,局部特征选择和局部特征描述符聚合;
3)相似帧聚类:选择候选帧中的第一帧作为参考帧,利用汉明距离计算其余候选帧与参考帧之间的相似性,相似的视频帧聚为一类,这个过程能够检测高度相关的帧并自动聚为一类,并且避免了预设聚类的数量,避免影响视频摘要的最优结果生成;
4)关键帧的生成:通过视频帧色彩熵函数从每个簇中选择出一帧图像视觉质量最好的作为代表帧,不需要任何的迭代;
5)冗余帧的消除:由于步骤4)得到的代表帧之间可能还存在冗余,所以对得到的关键帧进一步利用汉明距离进行相似性计算,将每个代表与其余代表帧进行比较,从而消除冗余的关键帧,得到最终的视频摘要结果。
2.根据权利要求1所述的基于CDVS的相似图聚类的静态视频摘要方法,其特征在于,所述步骤2)中的CDVS描述子特征提取,具体步骤如下:
2-1)兴趣点检测:CDVS提出了一种新颖的逐块比例空间表示,并应用了高斯LoG滤波的拉普拉斯算子,以实现基于块的频域LoG,BFLoG检测器;为了识别兴趣点,CDVS提出了一种低次多项式ALP方法来通过多项式近似LoG滤波结果,用于在尺度空间中找到极值并完善检测点的空间位置;
2-2)特征选择:由兴趣点检测生成的局部特征的数量可能大于在给定CDVS图像描述符长度下存储的局部特征的数量,因此,CDVS标准根据局部特征的属性评估特征匹配的可能性,并选择数量有限的兴趣点,以识别那些最大化预期质量度量以进行后续匹配的特征点;特征属性包括尺度空间中的尺度σ,方向θ,尺度标准化的LoG响应值D,Hessian矩阵比p,尺度空间的二阶导数pσσ以及兴趣点到图像中心的距离d;
2-3)局部特征描述子聚合:CDVS标准中采用SCFV聚合描述子生成CDVS描述子,SCFV基本思想是对图像的局部特征降维压缩后生成的Fisher向量,Fisher Vector中包含了原特征向量每一维的值,并且包含了生成式建模过程的结构性信息,对图片的表达更加细致。
3.根据权利要求1所述的基于CDVS的相似图聚类的静态视频摘要方法,其特征在于,所述步骤3)中的相似帧聚类,具体步骤如下:
对所有候选帧进行特征提取之后,将所有的候选帧分割成簇;利用基于CDVS全局描述子匹配的相似帧聚类方法,这种方法不需要指定集群的数目;CDVS全局描述子匹配过程如下:给定两个图像Q和R,使用CDVS全局描述子计算基于汉明距离的相似度得分,如下所示:
Figure FDA0002427734040000021
其中:
Figure FDA0002427734040000022
表示GMM中第i个高斯函数的二值化fisher子矢量
Figure FDA0002427734040000023
(或
Figure FDA0002427734040000024
),如果选择第i个高斯函数
Figure FDA0002427734040000025
反之
Figure FDA0002427734040000026
Figure FDA0002427734040000027
表示来自Q和R的第i个高斯函数的Fisher子矢量的汉明距离,范围从0到D;
Figure FDA0002427734040000028
表示从INRIA Holidays,Oxford Buildings和Pasadena Buildings的一组匹配/不匹配图像对中学习的权重,
Figure FDA0002427734040000029
表示与二值化Fisher子矢量
Figure FDA00024277340400000210
相关联的权重;单个阈值τ用于声明两图像R与Q是否匹配,如果sQ,R大于阈值τ=0.5,说明两帧之间是匹配的,看作是同一类;
将候选帧的第一帧与其余所有候选帧进行汉明距离相似性计算,与第一帧相似度大于阈值τ的就被归为第一类;以此类推,将所有候选帧归为N个类,这N个类内的视频帧是相似的,类与类之间的视频帧是不相似的。
4.根据权利要求1所述的基于CDVS的相似图聚类的静态视频摘要方法,其特征在于,所述4)中关键帧的生成,关于视频帧色彩熵函数H(x):该值越高图像的对比度越高,则认为该帧具有较好的图像视觉质量,其定义如下:
Figure FDA00024277340400000211
其中:N表视色彩的种数,RGB色彩空间精度分别为8*8*8,则N为512;pi表示第i种色彩Ci在图像中出现概率,该值直接由图像色彩直方图得到。
CN202010227616.8A 2020-03-27 2020-03-27 一种基于cdvs的相似图聚类的静态视频摘要方法 Active CN111460961B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010227616.8A CN111460961B (zh) 2020-03-27 2020-03-27 一种基于cdvs的相似图聚类的静态视频摘要方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010227616.8A CN111460961B (zh) 2020-03-27 2020-03-27 一种基于cdvs的相似图聚类的静态视频摘要方法

Publications (2)

Publication Number Publication Date
CN111460961A true CN111460961A (zh) 2020-07-28
CN111460961B CN111460961B (zh) 2023-07-18

Family

ID=71684990

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010227616.8A Active CN111460961B (zh) 2020-03-27 2020-03-27 一种基于cdvs的相似图聚类的静态视频摘要方法

Country Status (1)

Country Link
CN (1) CN111460961B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112381151A (zh) * 2020-11-17 2021-02-19 有米科技股份有限公司 相似视频的确定方法及装置
CN112733823A (zh) * 2021-03-31 2021-04-30 南昌虚拟现实研究院股份有限公司 手势姿态识别关键帧提取方法、装置及可读存储介质
CN113139507A (zh) * 2021-05-12 2021-07-20 保定金迪地下管线探测工程有限公司 一种排水管道缺陷照片自动截取方法及其系统
CN113542771A (zh) * 2021-07-15 2021-10-22 广东电网有限责任公司中山供电局 一种基于内容权重的视频高效压缩处理方法
CN113536035A (zh) * 2021-04-27 2021-10-22 北京工业大学 基于代表性和特异性得分的非监督监控视频摘要生成方法及生成器
CN113676752A (zh) * 2021-09-01 2021-11-19 上海漫酷网络技术有限公司 一种互联网视频广告关键帧提取方法
CN117541969A (zh) * 2024-01-09 2024-02-09 四川大学 一种基于语义和图像增强的色情视频检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105025392A (zh) * 2015-06-25 2015-11-04 西北工业大学 基于摘要空间特征学习的视频摘要关键帧提取方法
US20160179893A1 (en) * 2014-12-22 2016-06-23 Blackberry Limited Method and system for efficient feature matching
CN106095588A (zh) * 2016-06-28 2016-11-09 北京大学深圳研究生院 基于gpgpu平台的cdvs提取过程加速方法
CN106611030A (zh) * 2015-10-27 2017-05-03 杭州海康威视数字技术股份有限公司 基于视频的对象相似度比较方法和检索方法及其系统
CN110659333A (zh) * 2019-08-23 2020-01-07 浙江省北大信息技术高等研究院 一种多层次视觉特征描述方法和视觉检索系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160179893A1 (en) * 2014-12-22 2016-06-23 Blackberry Limited Method and system for efficient feature matching
CN105025392A (zh) * 2015-06-25 2015-11-04 西北工业大学 基于摘要空间特征学习的视频摘要关键帧提取方法
CN106611030A (zh) * 2015-10-27 2017-05-03 杭州海康威视数字技术股份有限公司 基于视频的对象相似度比较方法和检索方法及其系统
CN106095588A (zh) * 2016-06-28 2016-11-09 北京大学深圳研究生院 基于gpgpu平台的cdvs提取过程加速方法
CN110659333A (zh) * 2019-08-23 2020-01-07 浙江省北大信息技术高等研究院 一种多层次视觉特征描述方法和视觉检索系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112381151A (zh) * 2020-11-17 2021-02-19 有米科技股份有限公司 相似视频的确定方法及装置
CN112381151B (zh) * 2020-11-17 2024-03-22 有米科技股份有限公司 相似视频的确定方法及装置
CN112733823A (zh) * 2021-03-31 2021-04-30 南昌虚拟现实研究院股份有限公司 手势姿态识别关键帧提取方法、装置及可读存储介质
CN112733823B (zh) * 2021-03-31 2021-06-22 南昌虚拟现实研究院股份有限公司 手势姿态识别关键帧提取方法、装置及可读存储介质
CN113536035A (zh) * 2021-04-27 2021-10-22 北京工业大学 基于代表性和特异性得分的非监督监控视频摘要生成方法及生成器
CN113139507A (zh) * 2021-05-12 2021-07-20 保定金迪地下管线探测工程有限公司 一种排水管道缺陷照片自动截取方法及其系统
CN113139507B (zh) * 2021-05-12 2022-06-17 保定金迪地下管线探测工程有限公司 一种排水管道缺陷照片自动截取方法及其系统
CN113542771A (zh) * 2021-07-15 2021-10-22 广东电网有限责任公司中山供电局 一种基于内容权重的视频高效压缩处理方法
CN113676752A (zh) * 2021-09-01 2021-11-19 上海漫酷网络技术有限公司 一种互联网视频广告关键帧提取方法
CN117541969A (zh) * 2024-01-09 2024-02-09 四川大学 一种基于语义和图像增强的色情视频检测方法
CN117541969B (zh) * 2024-01-09 2024-04-16 四川大学 一种基于语义和图像增强的色情视频检测方法

Also Published As

Publication number Publication date
CN111460961B (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
CN111460961B (zh) 一种基于cdvs的相似图聚类的静态视频摘要方法
US11126654B1 (en) Method and apparatus for multi-dimensional content search and video identification
US8467610B2 (en) Video summarization using sparse basis function combination
US8467611B2 (en) Video key-frame extraction using bi-level sparsity
US20120148149A1 (en) Video key frame extraction using sparse representation
CN110222218B (zh) 基于多尺度NetVLAD和深度哈希的图像检索方法
EP2289021A2 (en) Semantic event detection for digital content records
CN107292642B (zh) 一种基于图像的商品推荐方法及系统
CN115443490A (zh) 影像审核方法及装置、设备、存储介质
CN111104555A (zh) 基于注意力机制的视频哈希检索方法
Cirne et al. A video summarization method based on spectral clustering
CN110769259A (zh) 一种视频目标跟踪轨迹内容的图像数据压缩方法
Hao et al. Improvement of word bag model based on image classification
CN105975643B (zh) 一种基于文本索引的实时图像检索方法
Bhaumik et al. Real-time storyboard generation in videos using a probability distribution based threshold
Valveny et al. Performance characterization of shape descriptors for symbol representation
Younessian et al. Telefonica Research at TRECVID 2010 Content-Based Copy Detection.
Cao et al. A key frame selection algorithm based on sliding window and image features
Ren et al. Visual words based spatiotemporal sequence matching in video copy detection
Diou et al. Vitalas at trecvid-2008
Souvannavong et al. Latent semantic indexing for semantic content detection of video shots
CN108830313B (zh) 一种共生模式图像挖掘方法
CN109034040B (zh) 一种基于演员表的人物识别方法、装置、设备和介质
Zarif et al. Video Summarization Approach Based on Binary Robust Invariant Scalable Keypoints and Bisecting K-Means.
Rodrıguez Codebook-Based Near-Duplicate Video Detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant