CN102395984A - 用于视频内容分析的关键帧提取 - Google Patents
用于视频内容分析的关键帧提取 Download PDFInfo
- Publication number
- CN102395984A CN102395984A CN2010800167531A CN201080016753A CN102395984A CN 102395984 A CN102395984 A CN 102395984A CN 2010800167531 A CN2010800167531 A CN 2010800167531A CN 201080016753 A CN201080016753 A CN 201080016753A CN 102395984 A CN102395984 A CN 102395984A
- Authority
- CN
- China
- Prior art keywords
- frame
- motion
- bin
- tolerance
- histogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/144—Movement detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
Abstract
一种从构成镜头的帧序列中提取关键帧的方法,每帧由像素矩阵构成,该方法包括:对于帧序列的每帧:将该帧与后续帧相比的光流计算(3)为从该帧到后续帧的每个像素的位移的矩阵;基于该帧的光流计算(5)运动熵度量;将帧序列的具有最大运动熵度量的帧选择(7)为关键帧。
Description
技术领域
本发明涉及构成镜头(shot)的帧序列中的关键帧的提取领域,所述关键帧用于在视频摘要、浏览、搜索和理解中代表镜头。
背景技术
随着在因特网、移动设备和大范围的视频应用中存储和观看数字视频的流行性的快速增长,对视频数据的有效管理变得比以前重要得多。
对于自动视频检索而言,几乎不可能使用关键字描述视频序列。原因在于,人工注释需要巨大的人力,并且使用的关键字倾向于不精确且是主观的。因此,可以提供对视频序列的有效索引、检索和浏览的基于内容的技术将是一种解决方案。
用于管理视频数据的一般方法是借助于镜头切分检测或者场景分解检测将视频分割成称为“镜头”的若干组相关帧。在标识镜头边界之后,可以从每组帧(GoF)或者视频镜头中提取一个或多个关键帧或代表帧。然后,这些关键帧上的视觉内容被用来代表视频镜头以用于索引和检索。
关键帧提取是视频分析和管理中的基本部分,其提供用于视频索引、浏览和检索的适当视频摘要。关键帧的使用减少了视频索引中所需的数据量并且提供了用于处理视频内容的框架。
关键帧提取可以在场景或镜头水平下进行。通常,镜头水平下的分析是优选的,因为它保留了选择的关键帧在视频帧集中的时间顺序。
当前的关键帧提取技术可以分类成以下六类:
基于镜头边界的方法,基于视觉内容的方法,基于运动分析的方法,基于镜头活动的方法,基于无监督聚类的方法,以及基于宏块的方法。这些方法分别具有其优点。
例如,文献US2005/0002452公开了一种关键帧提取,该关键帧提取基于由亮度分布定义的熵度量以及与相邻帧的比较,使得具有最少运动活性的帧被选择。
看起来已知的提取方法在选择包含可以用于动作识别的复杂且快速变化的运动的帧方面表现得并不良好。
发明内容
有利的是实现一种提取代表镜头捕获的(多个)运动的关键帧的方法。
为了更好地解决一个或多个关切,在本发明的第一方面中,一种从构成镜头的每帧由像素矩阵构成的帧序列中提取关键帧的方法包括:
· 对于帧序列的每帧:
· 将该帧与后续帧相比的光流计算为从该帧到后续帧的每个像素的位移的矩阵;
· 基于该帧的光流计算运动熵度量;
· 将帧序列的具有最大运动熵度量的帧选择为关键帧。
所述方法特别有益于选择具有复杂且快速变化的运动的(多个)帧。
在一个特定的实施例中,
· 每个像素的位移被定义为具有模和位移角的矢量,运动直方图由代表模和位移角的组合的预定数量的面元(bin)定义。
· 丢弃具有最高频率的面元。
· 运动熵度量为每个面元的运动熵度量的总和,一个面元的运动熵度量与该面元在运动直方图中的出现频率成比例。
· 面元熵度量由该面元出现的对数频率的绝对值加权。
· 将每帧的运动直方图与另一帧的运动直方图进行比较以便将该帧的运动熵度量定义为相似性度量。
· 通过在具有预定长度的帧的滑动窗中选择所述帧序列的具有最大运动熵度量的帧而提取多个关键帧。
· 每个像素的位移定义为具有模和位移角的矢量,并且运动直方图由代表模和位移角的组合的预定数量的面元定义,运动熵度量为每个面元的运动熵度量的总和,一个面元的运动熵度量与该面元在运动直方图中出现的频率成比例,并且
· 所述方法进一步包括对于每个被选择的帧,与其相邻帧的运动直方图进行比较,并且用比较的结果对每个被选择的帧的运动熵度量进行加权。
在本发明的第二方面中,一种计算机软件产品存储在记录介质上并且包括一组指令,当计算机执行该组指令时,其使得计算机能够实施上面公开的方法。
在本发明的第三方面中,一种用于从构成镜头的帧序列中提取关键帧的装置,每帧由像素矩阵构成,该装置包括:
帧光流计算器,其用于将所述帧序列的每帧与后续帧相比的光流计算为从该帧到后续帧的每个像素的位移的矩阵;
运动熵度量计算器,其基于帧光流计算器的输出;
关键帧选择器,其用于选择帧序列的具有最大运动熵度量的帧。
取决于图像的类型,特定的实施例由于更易于适应或者由于给出更好的结果而可能是优选的。然而,可以适当地或者根据需要组合或修改这些特定实施例的各方面。
附图说明
本发明的这些和其他方面根据以下描述的实施例将是清楚明白的,并且将参照所述实施例进行阐述,其中:
- 图1为依照本发明一个实施例的方法的流程图;
- 图2为帧的运动直方图;
- 图3为图2的另一个帧运动直方图,其没有具有最高计数的面元;
- 图4为依照本发明另一个实施例的方法的流程图;以及
- 图5为依照本发明一个实施例的装置的示意图。
具体实施方式
参照图1,一种从构成镜头的帧序列中提取关键帧的方法,每帧由像素矩阵构成,该方法包括:
· 对于所述帧序列的每帧(步骤1):
· 将与后续帧相比的帧光流计算为从该帧到后续帧的每个像素的位移的矩阵(步骤3);
· 基于该帧光流计算运动熵度量(步骤5);
· 将帧序列的具有最大运动熵度量的帧选择为关键帧(步骤7)。
现在参照特定实施例详细地讨论每个步骤。
考虑光流的计算,应当指出的是,每个人类活动引起可以被观察者容易地识别的特有的运动模式。光流是一种适合于识别人类动作的运动描述符。
在第一步骤中,帧的每个像素的位移通过与后续帧比较作为光流场而计算。例如,使用诸如Lucas-Kanade算法之类的标准方法计算光流场序列。
因此,对于帧k,帧i与帧i+1之间的光流Fk为每个速度矢量具有模Mi(x, y)和角度Θi(x, y)的速度矢量Fi(x, y)矩阵。速度矢量Fi(x, y)度量像素(x, y)从帧i到帧i+1的位移。
熵是表示数据集的不纯度或不可预测性的良好方式,因为它取决于其中进行测量的环境。
基于上面定义的光流,计算运动熵度量。
每个基于光流输出的速度矢量通过其幅度Mi(x, y)和取向Θi(x, y)量化。运动直方图被定义为预定数量的面元,每个面元为幅度和取向的组合,从而覆盖幅度和取向值的整个谱。例如,使用表示5个幅度水平和8个取向角度的40个直方图面元。
帧中第k个面元出现的概率给定为:
其中M、N为帧的大小并且h表示第k个面元的计数。Pf(k)因而为面元k中包含的像素计数与总像素数之比。
其中Kmax为直方图中的总面元数,在该实例中Kmax=40,并且所有面元的熵ef(k)的总和为该帧中的运动的全局熵。面元熵度量ef(k)因而为由面元出现的对数概率的绝对值加权的面元出现的概率。由于对数概率总是为负的,因而取绝对值以获得正值作为熵。
直观上,有峰运动直方图包含较少的运动信息,从而产生低的熵值;平坦且分布式的直方图包括更多的运动信息,并且因而得到高的熵值。
上面公开的熵最大值方法提供了关于哪些帧包含最复杂的运动的信息。在一些情形中,其中运动直方图相对于周围帧相对较快地变化的帧也包含重要的信息。因此,公开了第二实施例,其称为帧间方法或直方图交会法,并且其测量连续帧的运动之间的差异。
所述度量计算两个直方图之间的相似性。
帧i及其邻近帧(超前或滞后x帧)的运动直方图分别为Hf(i)和Hf(i±x),并且每个分别包含Kmax个面元Hf(i, k)和Hf(i±x, k)。两个直方图的交点HI被定义为
分母对直方图交点归一化,并且使得直方图交点的值介于0与1之间。该值实际上与来自具有邻近帧中的相同运动矢量的相应像素的当前帧的像素数成比例。较高的HI值指示两帧之间的较高的相似性。
在该方法中,HI用作运动熵度量并且将关键帧选择为具有最高HI的帧。
该方法可以用作第一种公开的方法的补充方法,因为它提供了关于两帧之间的运动矢量分布的额外信息。
在这两种方法的一种变型中,应当指出的是,视频帧通常具有前景(对象)和背景(照相机)运动,并且背景运动通常在运动直方图中是一致的且占主导的。
如图2中所示,最高的面元表示背景运动。该背景运动可以通过从直方图中简单地移除最高的面元而消除。通过这样做,包含视频序列的突出对象的区域被聚焦。图3示出了背景运动消除之后的图2的运动直方图,其中只留下了39个面元。在背景运动消除之后,直方图变成前景对象的运动分布的更好的表示。背景运动消除提高了关键帧提取的性能。
对于诸如动作识别之类的特定应用而言,一个关键帧可能并不够并且需要多个关键帧以概括镜头。因此,代替找到整个镜头的熵函数的全局最大值的是,搜索局部最大值。例如,考虑长度为n帧的滑动窗中的局部最大值。当然,也可以采用用于寻找本地最大值的更高级的技术。
通过使用局部最大值方法选择的关键帧可以用于诸如视频摘要之类的应用。对于低活性镜头,一个单个的关键帧可能就足够了,但是大多数时候,需要多个关键帧以表示镜头的内容。通过观察一组关键帧而不是单个关键帧,可以获得对于镜头的布局,例如运动的方向、背景的变化等等的更好的理解。
可以通过组合熵最大值和帧间算法获得关键帧。该组合的算法提取的帧不仅包含最复杂的运动,而且具有相对于其邻域的突出运动变化。
· 通过利用熵最大值方法挑选局部最大值而选择初始帧(步骤10,图4);
· 对选择的初始帧应用直方图交会法(步骤12);
· 通过选择的初始帧的相应直方图交点值对这些初始帧的熵值进行加权(步骤14);以及
· 通过找到加权的熵曲线中的峰而提取最终的关键帧(步骤16)。
所公开的方法可以由用于从构成镜头的帧序列中提取关键帧的装置(图5)实现,该装置包括:
· 帧光流计算器20,其用于将所述镜头的每帧与后续帧相比的光流计算为从该帧到后续帧的每个像素的位移的矩阵;
· 运动熵度量计算器22,其基于帧光流计算器的输出;
· 关键帧选择器24,其用于选择镜头的具有最大运动熵度量的帧。
该装置可以包括用于接收要分析的镜头的输入构件以及例如将关键帧发送给视频数据库索引的输出构件。
尽管在所述附图和前面的描述中已经详细地图示和描述了本发明,但是这样的图示和描述应当被认为是说明性或示例性的,而不是限制性的;本发明并不限于所公开的实施例。
所述装置可以通过使用可编程计算机和计算机软件产品来实现,所述计算机软件产品存储在记录介质上并且包含一组指令,当计算机执行该组指令时,该组指令使得计算机能够实施所公开的方法。然而,由于每个操作的高度并行性以及视频处理特别地要求的高通量,本领域技术人员可以有利地将系统实现到诸如FPGA(现场可编程门阵列)之类的特定硬件部件中或者通过使用某个特定的数字信号处理器实现。
本领域技术人员在实施要求保护的本发明时,根据对于所述附图、本公开内容以及所附权利要求书的研究,应当能够理解并实施所公开实施例的其他变型。在权利要求书中,措词“包括/包含”并没有排除其他的元件,并且不定冠词“一”并没有排除复数。
Claims (10)
1. 一种从构成镜头的帧序列中提取关键帧的方法,每帧由像素矩阵构成,所述方法包括:
· 对于所述帧序列的每帧:
· 将所述帧与后续帧相比的光流计算(3)为从所述帧到后续帧的每个像素的位移的矩阵;
· 基于所述帧的光流计算(5)运动熵度量;
· 将所述帧序列的具有最大运动熵度量的帧选择(7)为关键帧。
2. 依照权利要求1的方法,其中每个像素的位移被定义为具有模和位移角的矢量,运动直方图由代表模和位移角的组合的预定数量的面元定义。
3. 依照权利要求2的方法,其中丢弃具有最高频率的面元。
4. 依照权利要求2或3的方法,其中运动熵度量为每个面元的运动熵度量的总和,一个面元的运动熵度量与所述面元在运动直方图中的出现频率成比例。
5. 依照权利要求4的方法,其中面元熵度量由所述面元出现的对数频率的绝对值加权。
6. 依照权利要求2或3的方法,其中将每帧的运动直方图与另一帧的运动直方图进行比较以便将所述帧的所述运动熵度量定义为相似性度量。
7. 依照权利要求1的方法,其中通过在具有预定长度的帧的滑动窗中选择所述帧序列的具有最大运动熵度量的帧而提取多个关键帧。
8. 依照权利要求7的方法,其中每个像素的位移定义为具有模和位移角的矢量,并且运动直方图由代表模和位移角的组合的预定数量的面元定义,运动熵度量为每个面元的运动熵度量的总和,一个面元的运动熵度量与所述面元在运动直方图中出现的频率成比例,并且
所述方法进一步包括对于每个选择的帧,与其相邻帧的运动直方图进行比较,并且由比较的结果对每个选择的帧的运动熵度量进行加权。
9. 计算机软件产品,存储在记录介质上并且包括一组指令,当计算机执行该组指令时,其使得计算机能够实施依照权利要求1的方法。
10. 用于从构成镜头的帧序列中提取关键帧的装置,每帧由像素矩阵构成,所述装置包括:
· 帧光流计算器(20),其用于将所述帧序列的每帧与后续帧相比的光流计算为从所述帧到后续帧的每个像素的位移的矩阵;
· 运动熵度量计算器(22),其基于帧光流计算器的输出;
· 关键帧选择器(24),其用于选择所述帧序列的具有最大运动熵度量的帧。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP09305316.3 | 2009-04-14 | ||
EP09305316 | 2009-04-14 | ||
PCT/IB2010/051620 WO2010119410A1 (en) | 2009-04-14 | 2010-04-14 | Key frames extraction for video content analysis |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102395984A true CN102395984A (zh) | 2012-03-28 |
Family
ID=42634832
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010800167531A Pending CN102395984A (zh) | 2009-04-14 | 2010-04-14 | 用于视频内容分析的关键帧提取 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20120027295A1 (zh) |
EP (1) | EP2419861A1 (zh) |
JP (1) | JP2012523641A (zh) |
CN (1) | CN102395984A (zh) |
RU (1) | RU2011146075A (zh) |
WO (1) | WO2010119410A1 (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106228111A (zh) * | 2016-07-08 | 2016-12-14 | 天津大学 | 一种基于骨骼序列提取关键帧的方法 |
CN106911943A (zh) * | 2017-02-21 | 2017-06-30 | 腾讯科技(深圳)有限公司 | 一种视频展示方法及其装置 |
CN108292362A (zh) * | 2016-01-05 | 2018-07-17 | 英特尔公司 | 用于光标控制的手势识别 |
CN108615241A (zh) * | 2018-04-28 | 2018-10-02 | 四川大学 | 一种基于光流的快速人体姿态估计方法 |
CN110008789A (zh) * | 2018-01-05 | 2019-07-12 | 中国移动通信有限公司研究院 | 多类物体检测与识别的方法、设备及计算机可读存储介质 |
CN110959160A (zh) * | 2017-08-01 | 2020-04-03 | 华为技术有限公司 | 一种手势识别方法、装置及设备 |
CN113361426A (zh) * | 2021-06-11 | 2021-09-07 | 爱保科技有限公司 | 车辆定损图像获取方法、介质、装置和电子设备 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101840435A (zh) * | 2010-05-14 | 2010-09-22 | 中兴通讯股份有限公司 | 一种实现视频预览和检索的方法及移动终端 |
GB2484133B (en) * | 2010-09-30 | 2013-08-14 | Toshiba Res Europ Ltd | A video analysis method and system |
CN102708571B (zh) * | 2011-06-24 | 2014-10-22 | 杭州海康威视数字技术股份有限公司 | 视频中剧烈运动的检测方法及其装置 |
JP5868053B2 (ja) * | 2011-07-23 | 2016-02-24 | キヤノン株式会社 | 画像処理方法、画像処理装置、およびプログラム |
US9355649B2 (en) | 2012-11-13 | 2016-05-31 | Adobe Systems Incorporated | Sound alignment using timing information |
US10638221B2 (en) | 2012-11-13 | 2020-04-28 | Adobe Inc. | Time interval sound alignment |
US10249321B2 (en) | 2012-11-20 | 2019-04-02 | Adobe Inc. | Sound rate modification |
US9165373B2 (en) * | 2013-03-11 | 2015-10-20 | Adobe Systems Incorporated | Statistics of nearest neighbor fields |
US9129399B2 (en) | 2013-03-11 | 2015-09-08 | Adobe Systems Incorporated | Optical flow with nearest neighbor field fusion |
US9031345B2 (en) | 2013-03-11 | 2015-05-12 | Adobe Systems Incorporated | Optical flow accounting for image haze |
US9025822B2 (en) | 2013-03-11 | 2015-05-05 | Adobe Systems Incorporated | Spatially coherent nearest neighbor fields |
CN103413322B (zh) * | 2013-07-16 | 2015-11-18 | 南京师范大学 | 序列视频关键帧提取方法 |
US9628837B2 (en) | 2013-08-07 | 2017-04-18 | AudioStreamTV Inc. | Systems and methods for providing synchronized content |
JP6160480B2 (ja) * | 2013-12-27 | 2017-07-12 | 富士ゼロックス株式会社 | 代表フレーム選定システム、代表フレーム選定プログラム |
US10832158B2 (en) * | 2014-03-31 | 2020-11-10 | Google Llc | Mutual information with absolute dependency for feature selection in machine learning models |
US9799376B2 (en) * | 2014-09-17 | 2017-10-24 | Xiaomi Inc. | Method and device for video browsing based on keyframe |
CN104331911A (zh) * | 2014-11-21 | 2015-02-04 | 大连大学 | 基于改进二阶振荡粒子群优化算法的关键帧提取方法 |
CN104463864B (zh) * | 2014-12-05 | 2018-08-14 | 华南师范大学 | 多级并行关键帧云提取方法及系统 |
CN106296631A (zh) * | 2015-05-20 | 2017-01-04 | 中国科学院沈阳自动化研究所 | 一种基于注意力先验的胃镜视频摘要方法 |
US10181195B2 (en) * | 2015-12-28 | 2019-01-15 | Facebook, Inc. | Systems and methods for determining optical flow |
CN106611157B (zh) * | 2016-11-17 | 2019-11-29 | 中国石油大学(华东) | 一种基于光流定位和滑动窗口检测的多人姿态识别方法 |
WO2020193784A2 (en) * | 2019-03-28 | 2020-10-01 | Piksel, Inc | A method and system for matching clips with videos via media analysis |
US11074457B2 (en) | 2019-04-17 | 2021-07-27 | International Business Machines Corporation | Identifying advertisements embedded in videos |
CN110381392B (zh) * | 2019-06-06 | 2021-08-10 | 五邑大学 | 一种视频摘要提取方法及其系统、装置、存储介质 |
CN111597911B (zh) * | 2020-04-22 | 2023-08-29 | 成都运达科技股份有限公司 | 一种基于图像特征快速提取关键帧的方法和系统 |
CN112949428B (zh) * | 2021-02-09 | 2021-09-07 | 中国科学院空间应用工程与技术中心 | 基于视频卫星对地观测数据的关键帧提取方法和系统 |
US11762939B2 (en) * | 2021-08-25 | 2023-09-19 | International Business Machines Corporation | Measure GUI response time |
US11417099B1 (en) * | 2021-11-08 | 2022-08-16 | 9219-1568 Quebec Inc. | System and method for digital fingerprinting of media content |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6782049B1 (en) * | 1999-01-29 | 2004-08-24 | Hewlett-Packard Development Company, L.P. | System for selecting a keyframe to represent a video |
CN101582063A (zh) * | 2008-05-13 | 2009-11-18 | 华为技术有限公司 | 视频服务系统、视频服务装置及其关键帧的提取方法 |
Family Cites Families (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5872599A (en) * | 1995-03-08 | 1999-02-16 | Lucent Technologies Inc. | Method and apparatus for selectively discarding data when required in order to achieve a desired Huffman coding rate |
US6389168B2 (en) * | 1998-10-13 | 2002-05-14 | Hewlett Packard Co | Object-based parsing and indexing of compressed video streams |
US6597738B1 (en) * | 1999-02-01 | 2003-07-22 | Hyundai Curitel, Inc. | Motion descriptor generating apparatus by using accumulated motion histogram and a method therefor |
JP2003503971A (ja) * | 1999-07-06 | 2003-01-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ビデオシーケンスの構造の自動抽出方法 |
US6697523B1 (en) * | 2000-08-09 | 2004-02-24 | Mitsubishi Electric Research Laboratories, Inc. | Method for summarizing a video using motion and color descriptors |
JP2002064825A (ja) * | 2000-08-23 | 2002-02-28 | Kddi Research & Development Laboratories Inc | 画像の領域分割装置 |
US6711587B1 (en) * | 2000-09-05 | 2004-03-23 | Hewlett-Packard Development Company, L.P. | Keyframe selection to represent a video |
KR100422710B1 (ko) * | 2000-11-25 | 2004-03-12 | 엘지전자 주식회사 | 다중 가중치 구조를 사용한 멀티미디어 검색 방법 |
US20020147834A1 (en) * | 2000-12-19 | 2002-10-10 | Shih-Ping Liou | Streaming videos over connections with narrow bandwidth |
US6965645B2 (en) * | 2001-09-25 | 2005-11-15 | Microsoft Corporation | Content-based characterization of video frame sequences |
US8238718B2 (en) * | 2002-06-19 | 2012-08-07 | Microsoft Corporaton | System and method for automatically generating video cliplets from digital video |
FR2843212B1 (fr) * | 2002-08-05 | 2005-07-22 | Ltu Technologies | Detection d'une image de reference robuste a de grandes transformations photometriques |
JP4036328B2 (ja) * | 2002-09-30 | 2008-01-23 | 株式会社Kddi研究所 | 動画像データのシーン分類装置 |
US20040088723A1 (en) * | 2002-11-01 | 2004-05-06 | Yu-Fei Ma | Systems and methods for generating a video summary |
US7116716B2 (en) * | 2002-11-01 | 2006-10-03 | Microsoft Corporation | Systems and methods for generating a motion attention model |
US7027513B2 (en) * | 2003-01-15 | 2006-04-11 | Microsoft Corporation | Method and system for extracting key frames from video using a triangle model of motion based on perceived motion energy |
US7327885B2 (en) * | 2003-06-30 | 2008-02-05 | Mitsubishi Electric Research Laboratories, Inc. | Method for detecting short term unusual events in videos |
US7587064B2 (en) * | 2004-02-03 | 2009-09-08 | Hrl Laboratories, Llc | Active learning system for object fingerprinting |
WO2005076594A1 (en) * | 2004-02-06 | 2005-08-18 | Agency For Science, Technology And Research | Automatic video event detection and indexing |
US7324711B2 (en) * | 2004-02-26 | 2008-01-29 | Xerox Corporation | Method for automated image indexing and retrieval |
US7843512B2 (en) * | 2004-03-31 | 2010-11-30 | Honeywell International Inc. | Identifying key video frames |
EP1615447B1 (en) * | 2004-07-09 | 2016-03-09 | STMicroelectronics Srl | Method and system for delivery of coded information streams, related network and computer program product therefor |
US8013229B2 (en) * | 2005-07-22 | 2011-09-06 | Agency For Science, Technology And Research | Automatic creation of thumbnails for music videos |
WO2007035317A2 (en) * | 2005-09-16 | 2007-03-29 | Snapse, Inc. | System and method for providing a media content exchange |
WO2007053112A1 (en) * | 2005-11-07 | 2007-05-10 | Agency For Science, Technology And Research | Repeat clip identification in video data |
EP1811457A1 (en) * | 2006-01-20 | 2007-07-25 | BRITISH TELECOMMUNICATIONS public limited company | Video signal analysis |
US8494052B2 (en) * | 2006-04-07 | 2013-07-23 | Microsoft Corporation | Dynamic selection of motion estimation search ranges and extended motion vector ranges |
US8379154B2 (en) * | 2006-05-12 | 2013-02-19 | Tong Zhang | Key-frame extraction from video |
US7853071B2 (en) * | 2006-11-16 | 2010-12-14 | Tandent Vision Science, Inc. | Method and system for learning object recognition in images |
US8671346B2 (en) * | 2007-02-09 | 2014-03-11 | Microsoft Corporation | Smart video thumbnail |
EP1988488A1 (en) * | 2007-05-03 | 2008-11-05 | Sony Deutschland Gmbh | Method for detecting moving objects in a blind spot region of a vehicle and blind spot detection device |
US8224087B2 (en) * | 2007-07-16 | 2012-07-17 | Michael Bronstein | Method and apparatus for video digest generation |
US8200063B2 (en) * | 2007-09-24 | 2012-06-12 | Fuji Xerox Co., Ltd. | System and method for video summarization |
US8514939B2 (en) * | 2007-10-31 | 2013-08-20 | Broadcom Corporation | Method and system for motion compensated picture rate up-conversion of digital video using picture boundary processing |
KR101540138B1 (ko) * | 2007-12-20 | 2015-07-28 | 퀄컴 인코포레이티드 | 적응적 조사영역을 갖는 모션추정 장치 및 방법 |
US8634638B2 (en) * | 2008-06-20 | 2014-01-21 | Sri International | Real-time action detection and classification |
US8170278B2 (en) * | 2008-08-06 | 2012-05-01 | Sri International | System and method for detecting and tracking an object of interest in spatio-temporal space |
EP2399386A4 (en) * | 2009-02-20 | 2014-12-10 | Indian Inst Technology Bombay | DEVICE AND METHOD FOR AUTOMATICALLY RECREATING EFFICIENTLY COMPRESSED MAGISTRAL COURSE VIDEO AND MITIGATING THE CONTENTS |
-
2010
- 2010-04-14 JP JP2012505283A patent/JP2012523641A/ja not_active Withdrawn
- 2010-04-14 EP EP10717279A patent/EP2419861A1/en not_active Withdrawn
- 2010-04-14 WO PCT/IB2010/051620 patent/WO2010119410A1/en active Application Filing
- 2010-04-14 US US13/263,628 patent/US20120027295A1/en not_active Abandoned
- 2010-04-14 CN CN2010800167531A patent/CN102395984A/zh active Pending
- 2010-04-14 RU RU2011146075/08A patent/RU2011146075A/ru not_active Application Discontinuation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6782049B1 (en) * | 1999-01-29 | 2004-08-24 | Hewlett-Packard Development Company, L.P. | System for selecting a keyframe to represent a video |
CN101582063A (zh) * | 2008-05-13 | 2009-11-18 | 华为技术有限公司 | 视频服务系统、视频服务装置及其关键帧的提取方法 |
Non-Patent Citations (4)
Title |
---|
《2007 INTERNATIONAL CONFERENCE ON MULTIMEDIA AND UBIQUITOUS ENGINEERING IEEE PISCATAWAY》 20071231 TING WANG等 "An approach to video key-frame extraction based on rough set" 第590-596页 1-6 , * |
LING SHAO等: ""Motion histogram analysis based key frame extraction for human action/activity representation"", 《2009 CANADIAN CONFERENCE ON COMPUTER AND ROBOT VISION CRV 2009)》 * |
MENTZELOPOULOS M.等: ""Key-frame extraction algorithm using entropy difference"", 《MIR"04 - PROCEEDINGS OF THE 6THMIR"04 - PROCEEDINGS OF THE 6TH ACM SIGMM INTERNATIONAL WORKSHOP ON MULTIMEDIA INFORMATION RETRIEVAL 2004 ASSOCIATION FOR COMPUTING MACHINERY 》 * |
TING WANG等: ""An approach to video key-frame extraction based on rough set"", 《2007 INTERNATIONAL CONFERENCE ON MULTIMEDIA AND UBIQUITOUS ENGINEERING IEEE PISCATAWAY》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108292362A (zh) * | 2016-01-05 | 2018-07-17 | 英特尔公司 | 用于光标控制的手势识别 |
CN108292362B (zh) * | 2016-01-05 | 2022-04-12 | 英特尔公司 | 用于光标控制的手势识别 |
CN106228111A (zh) * | 2016-07-08 | 2016-12-14 | 天津大学 | 一种基于骨骼序列提取关键帧的方法 |
CN106911943A (zh) * | 2017-02-21 | 2017-06-30 | 腾讯科技(深圳)有限公司 | 一种视频展示方法及其装置 |
CN106911943B (zh) * | 2017-02-21 | 2021-10-26 | 腾讯科技(深圳)有限公司 | 一种视频展示方法、装置及存储介质 |
CN110959160A (zh) * | 2017-08-01 | 2020-04-03 | 华为技术有限公司 | 一种手势识别方法、装置及设备 |
CN110008789A (zh) * | 2018-01-05 | 2019-07-12 | 中国移动通信有限公司研究院 | 多类物体检测与识别的方法、设备及计算机可读存储介质 |
CN108615241A (zh) * | 2018-04-28 | 2018-10-02 | 四川大学 | 一种基于光流的快速人体姿态估计方法 |
CN108615241B (zh) * | 2018-04-28 | 2020-10-27 | 四川大学 | 一种基于光流的快速人体姿态估计方法 |
CN113361426A (zh) * | 2021-06-11 | 2021-09-07 | 爱保科技有限公司 | 车辆定损图像获取方法、介质、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
EP2419861A1 (en) | 2012-02-22 |
US20120027295A1 (en) | 2012-02-02 |
RU2011146075A (ru) | 2013-05-20 |
JP2012523641A (ja) | 2012-10-04 |
WO2010119410A1 (en) | 2010-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102395984A (zh) | 用于视频内容分析的关键帧提取 | |
CN107844779B (zh) | 一种视频关键帧提取方法 | |
Hannane et al. | An efficient method for video shot boundary detection and keyframe extraction using SIFT-point distribution histogram | |
US20120148149A1 (en) | Video key frame extraction using sparse representation | |
US8467611B2 (en) | Video key-frame extraction using bi-level sparsity | |
CN113011329B (zh) | 一种基于多尺度特征金字塔网络及密集人群计数方法 | |
CN111401308B (zh) | 一种基于光流效应的鱼类行为视频识别方法 | |
CN102495887B (zh) | 一种基于关键区域色彩矩阵的视频镜头分割方法及其应用方法 | |
Gornale et al. | Analysis and detection of content based video retrieval | |
Tsai et al. | Swin-JDE: Joint detection and embedding multi-object tracking in crowded scenes based on swin-transformer | |
Idan et al. | Fast shot boundary detection based on separable moments and support vector machine | |
Mishra | Video shot boundary detection using hybrid dual tree complex wavelet transform with Walsh Hadamard transform | |
CN110188625B (zh) | 一种基于多特征融合的视频精细结构化方法 | |
Wang et al. | Video text detection by attentive spatiotemporal fusion of deep convolutional features | |
CN110933520B (zh) | 一种基于螺旋摘要的监控视频展示方法及存储介质 | |
CN104504162A (zh) | 一种基于机器人视觉平台的视频检索方法 | |
KR101068288B1 (ko) | 세그먼트 특징을 이용한 내용 기반 동영상 검출 방법 | |
Piramanayagam et al. | Shot boundary detection and label propagation for spatio-temporal video segmentation | |
Mizher et al. | Action key frames extraction using l1-norm and accumulative optical flow for compact video shot summarisation | |
JP3358692B2 (ja) | 映像ブロック分類方法及び装置 | |
Schwab et al. | A multi-cue spatio-temporal framework for automatic frontal face clustering in video sequences | |
Chae et al. | Siamevent: Event-based object tracking via edge-aware similarity learning with siamese networks | |
CN113032631A (zh) | 一种基于全局运动统计特征的团队体育视频关键帧提取方法 | |
CN108804981B (zh) | 基于长时间视频序列背景建模框架的运动目标检测方法 | |
Rashmi et al. | Shot-based keyframe extraction using bitwise-XOR dissimilarity approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120328 |