CN103942751B - 一种视频关键帧提取方法 - Google Patents
一种视频关键帧提取方法 Download PDFInfo
- Publication number
- CN103942751B CN103942751B CN201410174354.8A CN201410174354A CN103942751B CN 103942751 B CN103942751 B CN 103942751B CN 201410174354 A CN201410174354 A CN 201410174354A CN 103942751 B CN103942751 B CN 103942751B
- Authority
- CN
- China
- Prior art keywords
- frame
- video
- sequence
- vision
- similar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000000605 extraction Methods 0.000 claims abstract description 10
- 230000035807 sensation Effects 0.000 claims description 36
- 230000000007 visual effect Effects 0.000 claims description 8
- 239000012634 fragment Substances 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 210000004884 grey matter Anatomy 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005206 flow analysis Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
公开了一种视频关键帧的提取方法,属于视频数据处理领域。本发明中关键帧提取包含:计算视频帧灰度质心,并依据相邻帧间灰度质心距离,以及当前视频帧灰度质心与前序视觉相似帧序列平均灰度质心间距离,将视频帧序列分割为多个具有视觉相似连续性的帧序列,从视觉相似连续帧序列中选取关键帧。本方法解决了现有关键帧提取技术计算过程复杂,计算量大的问题。
Description
技术领域
本发明涉及一种视频关键帧的提取方法,属于视频数据处理技术领域。
背景技术
随着网络基础设施的不断完善,新的网络技术的应用及视频拍摄设备的普及,视频资源总量及人们对视频资源的需求量都急剧增加。对视频信息进行智能标注、自动分类,实现视频内容自动检测、过滤及视频内容检索等需求不断增加。视频关键帧提取作为视频信息处理的基础技术,其性能直接影响高级视频处理的结果。当前视频关键帧提取方法主要有:基于颜色(或直方图)帧差方法,基于运动分析方法及基于视频帧聚类方法。基于颜色或颜色直方图帧差法存在对光线变化敏感,不能体现全局特征或不能体现局部细节变化的缺点。基于运动分析的关键帧提取方法使用光流分析计算视频帧的运动量,存在算法复杂,计算量大的问题。基于聚类的关键帧提取方法可有效获取镜头显著变化的视觉内容,但聚类的方法不能保持视频帧所具有的时序关系及动态信息。
发明内容
为解决上述问题,本发明提出了一种新的视频关键帧提取方法,计算过程比较简单,计算量较小。
本发明的原理:本发明所述的视频关键帧提取方法包括计算视频帧灰度质心,将完整视频帧序列划分为多个具有视觉相似连续视频帧序列,筛选有效视觉相似视频帧序列,从各个视觉相似视频帧序列选取视频关键帧。
本发明的技术方案如下:
一种视频关键帧提取方法,其特征在于,包括如下步骤:
步骤一:逐帧读取视频帧,将各视频帧图像转为灰度图,依次计算各视频帧的灰度质心组成灰度质心序列,使用灰度质心序列代表视频帧序列,下面步骤对视频帧序列的操作即为对灰度质心序列的操作;
步骤二:将视频帧序列划分为多个视觉相似视频帧序列;
步骤三:依据设定的最小有效视觉相似视频帧序列长度,从视觉相似视频帧序列中筛选有效视觉相似视频帧序列;
步骤四:从有效视觉相似视频帧序列提取视频关键帧。
优选的技术方案:
步骤二中,根据当前帧灰度质心与前一帧灰度质心间距离和当前帧灰度质心与原点间距离的比值,以下称为相对变化率,确定两帧视觉相似关系,相对变化率小于预设的阈值认为两视频帧具有视觉相似性,否则不具有视觉相似性;
步骤二中,根据当前帧灰度质心与前序视觉相似视频帧序列(从前一帧开始向前连续的具有视觉相似性的视频帧序列)平均灰度质心间距离和当前帧灰度质心与原点间距离的比值,确定当前帧与前序视觉相似视频帧序列视觉相似关系,比值小于预设的阈值认为当前帧与前序视觉相似视频帧序列具有视觉相似性,否则不具有视觉相似性;
步骤三中,使用最小有效视觉相似视频帧序列长度,控制有效视觉相似视频帧序列个数(长度大于最小有效视觉相似视频帧序列长度的视觉相似视频帧序列被认为是有效地视觉相似视频帧序列),进而控制关键帧数量;
步骤四中,在每一个有效视觉相似视频帧序列中,选择灰度质心与该有效视觉相似视频帧序列平均灰度质心距离最小的视频帧作为该视觉相似视频帧序列的关键帧。
本发明的有益效果:本发明所述的视频关键帧提取方法,能够实现视频关键帧的高效提取,通过调整最小有效视觉相似视频帧序列长度,可以实现镜头渐变过程关键帧的提取,控制关键帧的总数,解决了现有关键帧提取技术计算过程复杂,计算量大的问题。
具体实施方式
本发明所述的视频关键帧提取方法的实施步骤包括:
(1)逐帧读取视频帧,将视频帧图像转换为灰度图像,计算视频灰度质心并存储灰度质心,使用灰度质心序列代表视频帧序列,详细步骤:
a、将视频帧图像像素RGB值转换为灰度图像对应像素值,转换公式为:
Gray=R*0.11+G*0.59+B*0.30,
b、计算灰度质心,公式如为:
其中,xij为XM×N(XM×N表示尺寸为M×N的灰度图像)第i行第j列位置的像素灰度值,视频帧对应图像尺寸为M×N;
c、保存灰度质心坐标(XC,YC),所有视频帧图像灰度质心组成一个灰度质心序列。
(2)将视频帧序列划分为多个视觉相似视频帧序列,即将步骤(1)中得到的灰度质心序列划分为视觉相似视频帧序列;
划分视觉相似视频帧将整个视频划分为视频帧片段,同属一个视频帧片段的帧在视觉上具有相似性。划分过程需要记录片段的起止位置,如下使用一个标记数组实现视频帧视觉相似标记,视觉相似视频帧分割过程如下:
a、定义标记数组flag[],大小为视频的总帧数,数组值0表示当前帧与前一帧不属于同一个视觉相似视频帧序列,数组值1表示当前帧与前一帧属于同一视觉相似视频帧序列,flag初始化为全0;
b、从第二帧开始,确定每一帧所属视觉相似视频帧序列;
X(k)表示视频第k帧,{X(k-m),…,X(k-1)}表示第k帧的前序视觉相似视频帧序列(由第k-1帧开始,向前且对应flag标记为1的视频帧构成,若k-1帧对应标记为0,则只包含第k-1帧),为第j帧的灰度质心,为视觉相似帧序列{X(k-m),…,X(k-1)}的平均灰度质心,满足如下约束:
s.t.1≤x≤N,1≤y≤M
其解为:若如下条件同时成立,则更新第k帧对应的flag标记为1,否则保持flag为0:
其中ε1,ε2为视觉相似阈值,取值范围为1%≤ε1,ε2≤3%。若上述条件不满足,则X(k)将作为下一视觉相似序列的首帧构成新的相似序列{X(k)}。
(3)依据设定的最小有效视觉相似视频帧序列长度,从视觉相似视频帧序列中筛选有效视觉相似视频帧序列;
选取长度大于最小有效视觉相似视频帧序列长度的视觉相似视频帧序列作为有效视觉相似视频帧序列,即记录标记数组中长度大于最小视觉相似视频帧序列长度的连续1值片段的起止位置信息,作为有效视觉相似视频帧序列。最小有效视觉相似视频帧序列长度可用于视频镜头切换过程视频关键帧提取的控制,其值越大则视频关键帧提取的镜头渐变过程变化越平缓。
(4)从有效视觉相似视频帧序列提取视频关键帧;
从每一个有效视觉相似视频帧序列中,选取灰度质心与该有效视觉相似视频帧序列平均灰度质心距离最小的帧作为本序列的关键帧,Keyj表示从第j个有效视觉相似视频帧序列中选取的视频关键帧的帧序号(视频帧为整个视频帧序列的第几帧),Vj为第j个有效视觉相似视频帧序列包含的所有视频帧帧序号集合,则:
对每一个有效视觉相似视频帧序列使用上面的计算方法,得到视频的全部关键帧的帧序号集合{Key1,...,Keym}(m为有效视觉相似视频帧序列的个数),完成视频关键帧的提取。
Claims (7)
1.一种视频关键帧提取方法,其特征是,包括如下步骤:
步骤一:逐帧读取视频帧,将各视频帧图像转为灰度图,依次计算各视频帧的灰度质心组成灰度质心序列,使用灰度质心序列代表视频帧序列,下面步骤对视频帧序列的操作即为对灰度质心序列的操作,具体包括:
1.1)将视频帧图像像素RGB值转换为灰度图像对应像素值,转换公式为:Gray=R*0.11+G*0.59+B*0.30;
1.2)计算灰度质心,公式如为:
其中,xij为XM×N第i行第j列位置的像素灰度值,XM×N表示视频帧对应的尺寸为M×N的灰度图像;
1.3)保存灰度质心坐标(XC,YC),所有视频帧图像灰度质心组成一个灰度质心序列;
步骤二:将视频帧序列划分为多个视觉相似视频帧序列;
步骤二中,根据当前帧灰度质心与前一帧灰度质心间距离和当前帧灰度质心与原点间距离的比值,确定两帧视觉相似关系,相对变化率小于预设的阈值认为两视频帧具有视觉相似性,否则不具有视觉相似性;
步骤三:依据设定的最小有效视觉相似视频帧序列长度,从视觉相似视频帧序列中筛选有效视觉相似视频帧序列;
步骤四:从有效视觉相似视频帧序列提取视频关键帧。
2.如权利要求1所述的视频关键帧提取方法,其特征是,步骤二中,根据当前帧灰度质心与前序视觉相似视频帧序列平均灰度质心间距离和当前帧灰度质心与原点间距离的比值,确定当前帧与前序视觉相似视频帧序列视觉相似关系,比值小于预设的阈值认为当前帧与前序视觉相似视频帧序列具有视觉相似性,否则不具有视觉相似性。
3.如权利要求1所述的视频关键帧提取方法,其特征是,步骤三中,使用最小有效视觉相似视频帧序列长度,控制有效视觉相似视频帧序列个数进而控制关键帧数量。
4.如权利要求1所述的视频关键帧提取方法,其特征是,步骤四中,在每一个有效视觉相似视频帧序列中,选择灰度质心与该有效视觉相似视频帧序列平均灰度质心距离最小的视频帧作为该视觉相似视频帧序列的关键帧。
5.如权利要求1所述的视频关键帧提取方法,其特征是,步骤二包括:
2.1)定义标记数组flag[],大小为视频的总帧数,数组值0表示当前帧与前一帧不属于同一个视觉相似视频帧序列,数组值1表示当前帧与前一帧属于同一视觉相似视频帧序列,flag初始化为全0;
2.2)从第二帧开始,确定每一帧所属视觉相似视频帧序列;
X(k)表示视频第k帧,{X(k-m),…,X(k-1)}表示第k帧的前序视觉相似视频帧序列,由第k-1帧开始,向前且对应flag标记为1的视频帧构成,若k-1帧对应标记为0,则只包含第k-1帧,为第j帧的灰度质心,为视觉相似帧序列{X(k-m),…,X(k-1)}的平均灰度质心,满足如下约束:
其解为:
若如下条件同时成立,则更新第k帧对应的flag标记为1,否则保持flag为0:
其中ε1,ε2为视觉相似阈值,取值范围为1%≤ε1,ε2≤3%;若上述条件不满足,则X(k)将作为下一视觉相似序列的首帧构成新的相似序列{X(k)}。
6.如权利要求5所述的视频关键帧提取方法,其特征是,步骤三中,选取长度大于最小有效视觉相似视频帧序列长度的视觉相似视频帧序列作为有效视觉相似视频帧序列,即记录标记数组中长度大于最小视觉相似视频帧序列长度的连续1值片段的起止位置信息,作为有效视觉相似视频帧序列。
7.如权利要求6所述的视频关键帧提取方法,其特征是,步骤四中,从每一个有效视觉相似视频帧序列中,选取灰度质心与该有效视觉相似视频帧序列平均灰度质心距离最小的帧作为本序列的关键帧,Keyj表示从第j个有效视觉相似视频帧序列中选取的视频关键帧的帧序号,Vj为第j个有效视觉相似视频帧序列包含的所有视频帧帧序号集合,则:对每一个有效视觉相似视频帧序列使用上面的计算方法,得到视频的全部关键帧的帧序号集合{Key1,...,Keym},完成视频关键帧的提取。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410174354.8A CN103942751B (zh) | 2014-04-28 | 2014-04-28 | 一种视频关键帧提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410174354.8A CN103942751B (zh) | 2014-04-28 | 2014-04-28 | 一种视频关键帧提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103942751A CN103942751A (zh) | 2014-07-23 |
CN103942751B true CN103942751B (zh) | 2017-06-06 |
Family
ID=51190403
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410174354.8A Expired - Fee Related CN103942751B (zh) | 2014-04-28 | 2014-04-28 | 一种视频关键帧提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103942751B (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105678732B (zh) * | 2014-11-18 | 2018-07-03 | 北京数码视讯科技股份有限公司 | 一种点球、角球和任意球关键帧的检测方法和装置 |
CN107358141B (zh) * | 2016-05-10 | 2020-10-23 | 阿里巴巴集团控股有限公司 | 数据识别的方法及装置 |
CN106934378B (zh) * | 2017-03-16 | 2020-04-24 | 山东建筑大学 | 一种基于视频深度学习的汽车远光灯识别系统及方法 |
CN107564056B (zh) * | 2017-07-26 | 2020-12-18 | 西南交通大学 | 一种接触网支撑装置三维点云数据最优数据帧选取方法 |
CN107748761B (zh) * | 2017-09-26 | 2021-10-19 | 广东工业大学 | 一种视频摘要的关键帧提取方法 |
CN107798304B (zh) * | 2017-10-20 | 2021-11-02 | 央视国际网络无锡有限公司 | 一种快速视频审核的方法 |
CN108022280B (zh) * | 2017-12-05 | 2021-08-20 | 大陆汽车车身电子系统(芜湖)有限公司 | 组合仪表动画显示方法与组合仪表动画数据处理方法 |
CN109151568B (zh) * | 2018-07-10 | 2021-04-06 | Oppo广东移动通信有限公司 | 视频处理方法及相关产品 |
CN109284784A (zh) * | 2018-09-29 | 2019-01-29 | 北京数美时代科技有限公司 | 一种针对直播场景视频的内容审核模型训练方法及装置 |
CN112118494B (zh) * | 2019-06-20 | 2022-09-20 | 腾讯科技(深圳)有限公司 | 一种视频数据处理方法、装置及存储介质 |
CN110472484B (zh) * | 2019-07-02 | 2021-11-09 | 山东师范大学 | 基于多视图特征的视频关键帧提取方法、系统及设备 |
CN111083537B (zh) * | 2019-12-30 | 2022-02-01 | 纯米科技(上海)股份有限公司 | 烹饪视频生成方法及装置 |
CN111726536B (zh) * | 2020-07-03 | 2024-01-05 | 腾讯科技(深圳)有限公司 | 视频生成方法、装置、存储介质及计算机设备 |
CN112954450B (zh) * | 2021-02-02 | 2022-06-17 | 北京字跳网络技术有限公司 | 视频处理方法、装置、电子设备和存储介质 |
CN116405745B (zh) * | 2023-06-09 | 2023-11-17 | 深圳市信润富联数字科技有限公司 | 视频信息的提取方法、装置、终端设备及计算机介质 |
CN117831136B (zh) * | 2024-03-04 | 2024-05-07 | 贵州省种畜禽种质测定中心 | 基于远程监控的牛异常行为检测方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1515276A2 (en) * | 2003-09-12 | 2005-03-16 | Hewlett-Packard Development Company, L.P. | Generating animated image file from video data file frames |
-
2014
- 2014-04-28 CN CN201410174354.8A patent/CN103942751B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1515276A2 (en) * | 2003-09-12 | 2005-03-16 | Hewlett-Packard Development Company, L.P. | Generating animated image file from video data file frames |
Non-Patent Citations (3)
Title |
---|
"基于运动序列分割的运动捕获数据关键帧提取";朱登明等;《计算机辅助设计与图形学学报》;20080630;第20卷(第6期);第789页第2节 * |
"基于镜头内容变化率的关键帧提取算法";丁洪丽等;《计算机工程》;20090731;第35卷(第13 期);第226页第2-3节 * |
"运动图像快速跟踪技术研究";曲巨宝等;《重庆师范大学学报( 自然科学版)》;20110131;第28卷(第1期);第44页第1节 * |
Also Published As
Publication number | Publication date |
---|---|
CN103942751A (zh) | 2014-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103942751B (zh) | 一种视频关键帧提取方法 | |
CN106997597B (zh) | 一种基于有监督显著性检测的目标跟踪方法 | |
WO2020173226A1 (zh) | 一种时空行为检测方法 | |
CN106157319B (zh) | 基于卷积神经网络的区域和像素级融合的显著性检测方法 | |
CN107943837B (zh) | 一种前景目标关键帧化的视频摘要生成方法 | |
CN106952269B (zh) | 近邻可逆的视频前景物体序列检测分割方法及系统 | |
CN109064484B (zh) | 基于子群组划分与动量特征融合的人群运动行为识别方法 | |
CN108830252A (zh) | 一种融合全局时空特征的卷积神经网络人体动作识别方法 | |
Zhang et al. | Semantic segmentation of urban scenes using dense depth maps | |
CN110059581A (zh) | 基于场景深度信息的人群计数方法 | |
CN106937120B (zh) | 基于对象的监控视频浓缩方法 | |
CN111723693B (zh) | 一种基于小样本学习的人群计数方法 | |
CN108491766B (zh) | 一种端到端的基于深度决策森林的人群计数方法 | |
CN103886619B (zh) | 一种融合多尺度超像素的目标跟踪方法 | |
CN107633226A (zh) | 一种人体动作跟踪识别方法及系统 | |
CN106845621A (zh) | 基于深度卷积神经网络的密集人群人数计数方法及系统 | |
CN111027377B (zh) | 一种双流神经网络时序动作定位方法 | |
CN106709453A (zh) | 一种基于深度学习的体育视频关键姿态提取方法 | |
CN105869178A (zh) | 一种基于多尺度组合特征凸优化的复杂目标动态场景无监督分割方法 | |
CN105512618B (zh) | 视频跟踪方法 | |
CN108182447A (zh) | 一种基于深度学习的自适应粒子滤波目标跟踪方法 | |
CN106934332A (zh) | 一种多目标跟踪的方法 | |
CN109063667A (zh) | 一种基于场景的视频识别方式优化及推送方法 | |
CN106373126B (zh) | 基于融合类测地线和边界对比的图像显著性检测方法 | |
CN114495170A (zh) | 一种基于局部抑制自注意力的行人重识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170606 |