CN107748761A - 一种视频摘要的关键帧提取方法 - Google Patents

一种视频摘要的关键帧提取方法 Download PDF

Info

Publication number
CN107748761A
CN107748761A CN201710878227.XA CN201710878227A CN107748761A CN 107748761 A CN107748761 A CN 107748761A CN 201710878227 A CN201710878227 A CN 201710878227A CN 107748761 A CN107748761 A CN 107748761A
Authority
CN
China
Prior art keywords
video
key frame
dis
key
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710878227.XA
Other languages
English (en)
Other versions
CN107748761B (zh
Inventor
武继刚
贺子楠
姜文超
王勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201710878227.XA priority Critical patent/CN107748761B/zh
Publication of CN107748761A publication Critical patent/CN107748761A/zh
Application granted granted Critical
Publication of CN107748761B publication Critical patent/CN107748761B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种视频摘要的关键帧提取方法,所述方法包括:对视频摘要中满足代表性和多样性条件的帧进行提取以作为所述关键帧,如下式所示:

Description

一种视频摘要的关键帧提取方法
技术领域
本申请涉及机器学习与数据分析领域,其尤其指一种视频摘要的关键帧提取方法。
背景技术
视屏摘要:视频摘要又称视频浓缩,是对视频内容的一个简单概括,以自动或半自动的方式,先通过运动目标分析,提取运动目标,然后对各个目标的运动轨迹进行分析,将不同的目标拼接到一个共同的背景场景中,并将它们以某种方式进行组合。视频摘要在视频分析和基于内容的视频检索中扮演着重要角色。在社会公共安全领域,视频监控系统成为维护社会治安,加强社会管理的一个重要组成部分。然而视频录像存在存储数据量大,存储时间长等特点,通过录像寻找线索,获取证据传统的做法是要耗费大量人力、物力以及时间,效率极其低下,以至于错过最佳破案时机。因此在视频监控系统中,对原始视频进行浓缩,可以快速浏览,锁定检索对象,能够满足公安,网监,刑侦的各种需求及应用。
静态的视频摘要:也称之为视频概要(video summary),是以一系列从原始视频流中抽取出来的静态语义单元来表现视频的内容。静态语义单元是诸如关键帧、标题、幻灯片等可以概括表示视频镜头内容的静态特征信息。目前的静态视频摘要的研究主要是基于关键帧选取方法来展开的。通过将多个关键帧组合成视频摘要,允许用于通过少量的关键帧快速浏览原始视频的内容,并提供快速检索。关键帧的选取主要利用颜色、运动矢量等视觉特征去区分帧间的差异性。但差异性的区分计算依赖阈值的选择,选择过程中计算了较大、实时性较差。基于关键帧的视频摘要结果简单,观看方便。但由于其以静态图像为结果的表达形式,很难准确地表达视频的内在语义,且对“对象”动态特征的描述不够全面,所以仅仅适用于视频的精彩瞬间生成,无法适应需要进行“对象”特征分析的场合。
动态视频摘要:又称之为视频浓缩(video synthesis),是一段比原始视频短的多的浓缩结果。动态视频摘要可以分为精彩剪辑视频、专题浓缩视频、一般浓缩视频三种。精彩剪辑视频主要用于电影电视行业,是由原始视频中的精彩瞬间组成,专题浓缩视频主要应用于医学、金融等特定领域,利用特定专业知识对原始视频进行分析后浓缩得到的表现该领域特定内容的浓缩视频。
相对而言,一般视频浓缩采用通用浓缩方法面向较为普通视频,用户可以通过播放这些相对精炼的摘要视频来了解整个视频的内容。
发明内容
本发明认为组成视频摘要的关键帧需要满足代表性和多样性,其提出了新的代表性和多样性的定义方法,它们分别基于拓扑势与范数,并且提出了关键帧提取的数学模型。并且利用拓扑势来确定每一帧代表性,在我们得到每一帧的拓扑势后,将视频帧按照拓扑势进行代表性排序。同时考虑视频帧的外观不相似度和行为不相似度对其进行分别定义,最终得到确定关键帧的式子。
本发明的目的通过下述技术方案实现:
组成视频摘要的关键帧需要满足代表性和多元性,如下式所示:
其中,R(S)代表关键帧的代表性,而D(S)代表关键帧的多样性。
(1)代表性
对video frames建立网络G=(V,E),其中V为视频帧集合,E的权重为dij=d(vi,vj)。根据数据场势函数的定义,任一结点的拓扑势可以表示为,
其中,mj表示网络节点vj的质量,用来描述vj的固有属性,n为网络节点的个数,σ为影响因子,用于控制每个结点的影响范围。我们利用拓扑势来确定每一帧的代表性,则:
1)我们定义vj局部密度来代表vj的固有属性。其中
dc为截断误差,其通常为实际值与计算值之间的差值。
2)影响因子σ的选取应该使势场分布尽可能体现数据的内在分布规律,我们引入势熵的概念来衡量势场数据分布的合理性。势熵定义如下:其中为标准化因子,我们通过下式来求解影响因子σ:
由此,我们得到每一帧的拓扑势,并将视频帧按照拓扑势进行代表性排序。
(2)多样性
我们同时考虑视频帧的外观不相似度和行为不相似度,定义如下:
disa(vi,vj)=||ci-cj||,dism(vi,vj)=||oi-oj||,其中,c和o分别是colorhistogram和optical flow,dis(vi,vj)=disa(vi,vj)+dism(vi,vj)。那么,关键帧的多样性由下式进行确定:
*外观和行为的两个距离要调和才能进行运算。
综上所述,我们利用下式进行关键帧提取:
本发明相对于现有技术的优点及效果:
本文提出的方法基于视频摘要的两个因素代表性和多样性,我们对其进行了新的定义,在此基础上得到获取视频摘要的数学模型,此后进一步提出关键帧提取的具体方式方法,首先设置关键帧的代表能力的阈值,而后按照帧代表性从大到小的顺序对关键帧进行挑选。相比于现有的技术,本文所提出的方法具有一定的参考价值,并且对于一些特殊情况下的视频分析提取具有比一般方法更加突出的优势和作用。
具体实施方式
考虑到我们希望挑选的关键帧在不存在信息冗余的情况下尽可能地展现视频的主要内容,所以我们以差异性为约束,对关键帧集合的代表性进行优化。
(1)首先我们设置关键帧的代表能力的阈值δ1,我们只对代表能力的视频帧进行研究。接下来,我们对视频帧按照代表性的大小排序:
其中k是排序之后视频帧的标号,N为代表能力的视频帧的数目。
(2)我们按照帧代表性从大到小的顺序对关键帧进行挑选。第1帧最具有代表性,显然可以作为关键帧。如果第k帧被选入关键帧集合,那么我们定义下一个关键帧的备选集合为{k+1,k+2,...,N}。第k+i帧被选入关键帧集合,如果满足:
dis(k,k+i)>δ2,and dis(k,k+j)≤δ,
其中δ2是两帧相似程度的阈值。

Claims (3)

1.一种视频摘要的关键帧提取方法,其特征在于,所述方法包括:对视频摘要中满足代表性和多样性条件的帧进行提取以作为所述关键帧,如下式所示:
<mrow> <mi>S</mi> <mo>=</mo> <mi>arg</mi> <munder> <mi>max</mi> <mrow> <mi>S</mi> <mo>&amp;Subset;</mo> <mi>V</mi> </mrow> </munder> <mi>R</mi> <mrow> <mo>(</mo> <mi>S</mi> <mo>)</mo> </mrow> <mo>&amp;CenterDot;</mo> <mi>D</mi> <mrow> <mo>(</mo> <mi>S</mi> <mo>)</mo> </mrow> <mo>,</mo> </mrow>
其中,R(S)代表关键帧的代表性,而D(S)代表关键帧的多样性,S表示关键帧。
2.如权利要求1所述的提取方法,其特征在于,所述代表性条件具体包括:
对所述视频摘要建立网络G=(V,E),其中V为视频帧集合,E的权重为dij=d(vi,vj),其表示网络中每条边的权值,可取欧氏距离等度量方法进行计算;根据数据场势函数的定义,任一结点的拓扑势表示为,
其中,mj表示网络节点vj的质量,用来描述vj的固有属性,n为节点的数量;σ为影响因子,用于控制每个结点的影响范围;
然后利用所述拓扑势来确定每一帧的代表性,即:
其中有:
dc为截断误差,其为实际值与计算值之间的差值;
影响因子σ为其中
3.如权利要求2述的提取方法,其特征在于,所述多样性条件具体包括:
首先计算外观不相似度:disa(vi,vj)=||ci-cj||和行为不相似度:dism(vi,vj)=||oi-oj||,
其中,c和o分别是彩色直方图和光流,所述关键帧的多样性条件由下式进行确定:
其中dis(vi,vj)=disa(vi,vj)+dism(vi,vj)。
CN201710878227.XA 2017-09-26 2017-09-26 一种视频摘要的关键帧提取方法 Active CN107748761B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710878227.XA CN107748761B (zh) 2017-09-26 2017-09-26 一种视频摘要的关键帧提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710878227.XA CN107748761B (zh) 2017-09-26 2017-09-26 一种视频摘要的关键帧提取方法

Publications (2)

Publication Number Publication Date
CN107748761A true CN107748761A (zh) 2018-03-02
CN107748761B CN107748761B (zh) 2021-10-19

Family

ID=61254611

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710878227.XA Active CN107748761B (zh) 2017-09-26 2017-09-26 一种视频摘要的关键帧提取方法

Country Status (1)

Country Link
CN (1) CN107748761B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109243594A (zh) * 2018-08-28 2019-01-18 青岛大学附属医院 一种小儿外科刀口清洁护理装置及控制方法
CN113642422A (zh) * 2021-07-27 2021-11-12 东北电力大学 一种连续中文手语识别方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7027513B2 (en) * 2003-01-15 2006-04-11 Microsoft Corporation Method and system for extracting key frames from video using a triangle model of motion based on perceived motion energy
EP2038774A2 (en) * 2006-06-29 2009-03-25 Koninklijke Philips Electronics N.V. Method and system of key frame extraction
CN101577824A (zh) * 2009-06-12 2009-11-11 西安理工大学 基于邻近i帧dc图像相似度的压缩域关键帧提取方法
CN103942751A (zh) * 2014-04-28 2014-07-23 中央民族大学 一种视频关键帧提取方法
CN104394488A (zh) * 2014-11-28 2015-03-04 苏州科达科技股份有限公司 一种视频摘要的生成方法及系统
US20170024930A1 (en) * 2015-07-20 2017-01-26 Ming Chuang Consistent tessellation via topology-aware surface tracking

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7027513B2 (en) * 2003-01-15 2006-04-11 Microsoft Corporation Method and system for extracting key frames from video using a triangle model of motion based on perceived motion energy
US7983340B2 (en) * 2003-01-15 2011-07-19 Microsoft Corporation Extracting key frames from video using a triangle model of motion based on perceived motion energy
EP2038774A2 (en) * 2006-06-29 2009-03-25 Koninklijke Philips Electronics N.V. Method and system of key frame extraction
CN101577824A (zh) * 2009-06-12 2009-11-11 西安理工大学 基于邻近i帧dc图像相似度的压缩域关键帧提取方法
CN103942751A (zh) * 2014-04-28 2014-07-23 中央民族大学 一种视频关键帧提取方法
CN104394488A (zh) * 2014-11-28 2015-03-04 苏州科达科技股份有限公司 一种视频摘要的生成方法及系统
US20170024930A1 (en) * 2015-07-20 2017-01-26 Ming Chuang Consistent tessellation via topology-aware surface tracking

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHAKRABORTY S,TICKOO O,IYER R: ""Adaptive keyframe selection for video summarization"", 《IEEE WINTER CONFERENCE ON APPLICATIONS OF COMPUTER VISION》 *
王宇、汪荣贵、杨娟: ""一种新的自适应的视频关键帧提取方法"", 《合肥工业大学学报(自然科学版)》 *
肖俐平、孟晖、李德毅: ""基于拓扑势的网络节点重要性排序及评价方法"", 《武汉大学学报-信息科学版》 *
解晓萌、黎绍发: ""一种新的冗余关键帧去除算法"", 《电视技术》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109243594A (zh) * 2018-08-28 2019-01-18 青岛大学附属医院 一种小儿外科刀口清洁护理装置及控制方法
CN113642422A (zh) * 2021-07-27 2021-11-12 东北电力大学 一种连续中文手语识别方法
CN113642422B (zh) * 2021-07-27 2024-05-24 东北电力大学 一种连续中文手语识别方法

Also Published As

Publication number Publication date
CN107748761B (zh) 2021-10-19

Similar Documents

Publication Publication Date Title
Rui et al. Constructing table-of-content for videos
Zhou et al. Movie genre classification via scene categorization
JP3568117B2 (ja) ビデオ画像の分割、分類、および要約のための方法およびシステム
Cong et al. Towards scalable summarization of consumer videos via sparse dictionary selection
US9176987B1 (en) Automatic face annotation method and system
CN106649713B (zh) 一种基于内容的电影可视化处理方法及其系统
CN103210651B (zh) 用于视频概要的方法和系统
US20080162561A1 (en) Method and apparatus for semantic super-resolution of audio-visual data
Qu et al. An improved keyframe extraction method based on HSV colour space.
EP1067786A1 (en) Data describing method and data processor
Papadopoulos et al. Automatic summarization and annotation of videos with lack of metadata information
Mahum et al. A generic framework for generation of summarized video clips using transfer learning (SumVClip)
CN107748761B (zh) 一种视频摘要的关键帧提取方法
Zhao et al. Key-frame extraction based on HSV histogram and adaptive clustering
Jin et al. Network video summarization based on key frame extraction via superpixel segmentation
CN107516084B (zh) 一种基于多特征融合的互联网视频作者身份识别方法
JP2009060413A (ja) 動画特徴抽出方法およびシステムならびに動画検索方法およびシステム
Lu et al. A novel video summarization framework for document preparation and archival applications
Widiarto et al. Video summarization using a key frame selection based on shot segmentation
CN111090775A (zh) 一种视频摘要的关键帧提取方法
Dao et al. Discovering inherent event taxonomies from social media collections
Weber et al. Video object mining: Issues and perspectives
Dong et al. Advanced news video parsing via visual characteristics of anchorperson scenes
Jiang et al. A scene change detection framework based on deep learning and image matching
Naveen Kumar et al. An efficient approach for video retrieval by spatio-temporal features

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant