CN107943837A - 一种前景目标关键帧化的视频摘要生成方法 - Google Patents
一种前景目标关键帧化的视频摘要生成方法 Download PDFInfo
- Publication number
- CN107943837A CN107943837A CN201711026911.1A CN201711026911A CN107943837A CN 107943837 A CN107943837 A CN 107943837A CN 201711026911 A CN201711026911 A CN 201711026911A CN 107943837 A CN107943837 A CN 107943837A
- Authority
- CN
- China
- Prior art keywords
- target
- image
- video
- frame
- foreground target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000001514 detection method Methods 0.000 claims abstract description 32
- 238000000605 extraction Methods 0.000 claims abstract description 21
- 238000005516 engineering process Methods 0.000 claims abstract description 8
- 230000004927 fusion Effects 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 230000006378 damage Effects 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 238000007599 discharging Methods 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 238000005286 illumination Methods 0.000 claims description 2
- 230000002452 interceptive effect Effects 0.000 claims description 2
- 238000003062 neural network model Methods 0.000 claims description 2
- 238000013527 convolutional neural network Methods 0.000 abstract description 2
- 230000000750 progressive effect Effects 0.000 abstract description 2
- 230000003068 static effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种前景目标关键帧化的视频摘要生成方法,属于图像处理领域。它包括对待处理视频流逐帧利用由卷积神经网络训练的目标分类器对图像进行检测得到前景目标;结合跟踪算法跟踪每一帧前景目标,逐步更新得到目标运动轨迹;在视频中剔除前景目标,得到无运动目标的视频背景;对提取的前景目标序列,去除相似元素,形成关键化后前景目标序列;将提取的目标用图像融合算法贴合到背景图像并显示相关信息,将整个视频流浓缩成少量视频帧,形成视频概述。利用深度学习技术进行目标检测并与跟踪算法配合,高效实现前景目标的检测跟踪,降低场景噪声对视频处理的干扰,由独立目标重新渲染视频,压缩时空数据,提高视频浏览速率,运用于各复杂场景。
Description
技术领域
本发明属于图像处理领域,尤其是一种前景目标关键帧化的视频摘要生成方法。
背景技术
监控视频一般采用固定摄像头24小时不间断拍摄的方式进行录制。据报道,海量视频信息,真正发挥作用的可能还不到1%。我国投入巨资建设监控系统所发挥的效益很小。面对这种海量的视频信息,最亟需解决的问题是如何提高浏览效率,以便充分利用视频信息。提高视频事件的获取处理速度,降低人工处理视频效率的疏漏。
视频数据具有表现力强、形象生动等特点,但是其数据量巨大、表现内容不透明、数据无结构等特点使得对视频数据的组织、管理、分析很不方便。在此背景下,视频摘要技术应运而生。该技术利用计算机视觉技术对视频文件的内容进行分析,提取有效信息,生成一个能概括原视频的活动内容,但同时又大大缩短视频长度,压缩了视频的大小。
传统的视频摘要技术,一种方法是从视频提取关键帧,再使用关键帧来生成摘要视频。关键帧是选择出来可以很好代表原始内容的视频帧。另一种方法是从原始视频中选择一些视频段来生成摘要视频。这种方法压缩率比较小,但表现能力更强。Alex Rav-Acha等人在CVPR2006上首次提出了以分析视频帧的元数据为核心的视频摘要技术,该技术将每帧视频的活动信息提取出来,在时空上进行重组。
发明内容
为解决现有技术存在用户不能有效快速浏览监控视频的缺陷,本发明提供一种前景目标关键帧化的视频摘要生成方法。
为实现上述目的,本发明采用下述技术方案:
一种前景目标关键帧化的视频摘要生成方法,它包括如下步骤:
步骤1,采集训练样本,构建数据集,训练神经网络模型;
步骤2,对输入视频逐帧进行目标检测,提取检测目标对应的图像区域;
步骤3,为获取到的检测目标分配跟踪器,进行检测目标的连续跟踪并存储运动轨迹;
步骤4,利用提取到的前景目标和给定背景进行视频背景建模;
步骤5,对各前景目标序列提取关键帧,对所有运动目标的轨迹进行时空压缩,生成较少帧数的摘要图像序列;
步骤6,通过图像融合技术将检测目标的运动轨迹贴合到背景图像上。
进一步地,步骤1中数据集包含常规目标类图像(不包括场景类图像与语义场景类图像,以交通道路为例,则采集以车辆、行人为主的图像数据集,准确地说,数据集应选择具有特征代表性的运动目标,而对于手套、茶杯灯大多静止的物体不作训练),常规目标类图像包括不同拍摄角度、不同光照变化和天气情况下的独立图像,该图像经分类后,选取训练样本,对目标网络进行离线训练(根据训练结果调整目标网络参数,直至达到一个可观的识别率)。
进一步地,步骤2中目标检测是先将视频逐帧输入基于深度神经网络的目标检测算法,根据步骤一离线训练所得特征,再由输入的视频图像进行在线检测;
在进行步骤2中目标检测之前还包括对图像尺寸的处理步骤(例如将所载入的视频帧放缩至较低分辨率);
对于新出现在视频场景中的目标,步骤2中目标检测将检测目标判定为新出现的目标,并经步骤3分配跟踪器实现对新目标的跟踪。
步骤2中目标检测的区域,避免在临界阈值下出现多分类的情况;步骤2中目标检测的区域,为每个目标分配新的ID,并将其图像区域作为步骤3中连续跟踪算法的初始化区域。
进一步地,步骤3中检测目标的连续跟踪是基于多个互不干扰的单目标跟踪器实现的;
单目标跟踪器包含在图像边缘自动放弃跟踪,销毁跟踪器的内容以及判定目标图像区域为背景的情况下自动销毁的内容,其判别方式如下:
对于目标图像区域坐标接近图像边缘时,销毁跟踪器;对于接近的阈值设定,根据原始图像的长宽通过百分比进行动态设定;
对于目标图像区域静止不动时,判定跟踪目标区域为背景图像,销毁跟踪图像区域,其判定方法为:计算目标图像区域质心两坐标方向的方差,当两方差值的较大者低于所设阈值时,标记图像区域为静止背景,同时销毁跟踪器;该标记用于下一次检测目标区域的过滤判别。
进一步地,步骤3中单目标跟踪器的连续跟踪算法是基于相关滤波实现的,具体步骤如下:
步骤11,计算步骤2所检测得到的目标图像区域的HOG特征;
步骤12,针对步骤11中的目标图像区域,对该区域像素值进行循环移位,构建分块循环矩阵及高斯回归标签,并通过岭回归训练回归模型对该区域进行多尺度采样,训练尺度滤波器;
步骤13,在新的图像输入时,将图像与步骤12的回归模型根据核函数进行运算,确定响应最大的图像位置,即为目标中心位置;
步骤14,以中心位置对目标进行多尺度采样,提取特征,经尺度滤波器卷积得到目标最优尺度;
步骤15,根据步骤14最终确定跟踪算法跟踪结果,即获取到输出图像区域。
步骤16,对比跟踪结果与当前帧检测结果,进行目标图像区域优化。
进一步地,步骤16中对比优化策略是通过计算目标跟踪图像区域与目标检测图像区域的重叠率,并设置阈值判断为同一目标实现连续跟踪。
对于目标检测图像区域与目标跟踪图像区域,具有两者的相互约束与更新策略,该策略通过计算两区域的重叠率;对于重叠率较大的,判定为跟踪图像区域与检测图像区域指代的为同一个目标,以检测图像区域重置跟踪器;对于重叠率较小的,局部情况下判定为不同目标,全局情况下判定为新进入场景的目标,对于此类目标,作为新目标分配ID,并为其配置跟踪器进行跟踪。
进一步地,步骤4中视频背景建模的具体步骤如下:
步骤21,对于在步骤2获取到的图像,经步骤3剔除前景目标后重新生成图像,作为每一帧的背景提取图像;
步骤22,对于背景提取图像,先取第1帧作为假定背景,再依图像序列顺序,根据权重对背景进行更新;
步骤23,最终得到的最后一帧更新后的背景图像,即为全局背景图像。
上述背景更新的算法是首先认定步骤2和步骤3得到的目标图像为全局前景图像,反向获得其余图像即为背景图像,对于背景图像,采用权重累积的方式更新动态平均值,获得全局背景,更新公式如下:
Dst(i,j)←alpha*Src(i,j)+(1-alpha)Dst(i,j)if mask(i,j)≠0。
对视频图像序列每一帧进行如上所述目标提取以及背景更新,待图像处理完成后,对目标提取结果进行轨迹存储;将各目标的轨迹保存,进入视频摘要的分析阶段进行轨迹分析,具体如下:
进一步地,步骤5中各前景目标序列关键帧提取是通过对比不同图像帧内的同一检测目标,采用颜色直方图比较其图像区域像素点的相似程度实现的。
进一步地,各前景目标序列关键帧提取的具体步骤如下:
步骤31,对前景目标的图像区域序列,进行通道分离,得到RGB三通道分量;
步骤32,将目标图像分割为5*5的25个小图像,对每一个图像设定权值,根据矩阵权值加权计算各通道计算颜色直方图;
步骤33,对每个图像序列,取第一帧作为模型帧,将之后的帧作为对比帧,与模型帧进行直方图对比,若两者差异小于先验阈值,则认为两帧相似,保留模型帧,剔除对比帧;否则,以对比帧截断图像序列,重新生成,再次执行该步骤直至图像序列遍历完毕。
计算公式如下:
对所示高斯拉普拉斯算子对每个目标,第i帧第j个区域相似度为Sij,权值因子Mj,第i帧图像Vij与V1j的相似度为Si,则有:
Sij=|Vij-V1j|
对经过压缩分割的前景目标图像,将其按时间顺序依次放入背景图像中的对应位置,最终形成视频摘要的形式,具体如下:
进一步地,步骤6中图像融合技术的具体步骤如下:
步骤41,取出步骤4所得的背景帧;
步骤42,将第一个时间段内取得的前景目标按时间顺序通过泊松编辑方法放置在背景中,并标记目标在原始视频中的出现时间;
步骤43,当一帧图像中放置的对象数目大于一定阈值时,则停止放置;
步骤44,取出下一个时间段内的前景目标进行放置,直至放完;
步骤45,将合成后的所有图像帧组合起来,形成最终的视频摘要。
有益效果:
本发明包括:对待处理的视频流逐帧利用由卷积神经网络训练的目标分类器对图像进行检测得到前景目标;结合跟踪算法对每一帧的前景目标进行跟踪,逐步更新得到目标运动轨迹;在视频中剔除前景目标,得到无运动目标的视频背景;对提取出的前景目标序列,去除相似的元素,形成关键化后的前景目标序列;将提取出的目标利用图像融合算法贴合到背景图像中并显示相关信息,将整个视频流浓缩成少量的视频帧,形成视频的概述。本发明利用深度学习技术进行目标检测并与跟踪算法相互配合,能够高效实现前景目标的检测跟踪,降低场景噪声对视频处理的干扰,并由独立目标重新渲染视频,压缩了时空数据,提高了视频浏览速率,能够运用于各种复杂场景。
附图说明
图1为本发明一实施例的流程图;
图2为本发明一实施例的关键帧提取模块流程图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
本实施例的一种前景目标关键帧化的视频摘要生成方法,如图1所示,其生成方法具体流程如下:
S101,构建含有目标视频待检测前景目标的训练数据集,并通过SSD网络进行训练,直至得到最优的SSD网络参数。
具体实现中,以交通道路为例,则采集以车辆、行人为主的图像,对采集图像进行分类,选取训练样本,构成SSD网络的训练数据集。
利用数据集对SSD网络进行训练,并根据中间训练结果对网络参数进行调整,直至网络训练收敛完成训练,并验证识别效果得到网络模型。
S102,载入待摘要的目标视频,并逐帧对图像序列缩放至同一分辨率,得到待监测的原始图像以进行前景目标的提取。
S103,对图像进行前景目标检测。
具体实现中,利用S101步骤训练好的SSD网络模型提取所载入视频帧的特征并作进一步匹配,保留置信度较高的匹配结果,作为前景目标检测的结果,并将检测结果还原至原始图像中,得到前景目标对应的图像区域,即为RectDetect。
S104,为得到的前景目标分配跟踪器,进行目标跟踪。
具体实现中,对从S103步骤获取到的目标图像区域,基于相关滤波构建目标跟踪器,具体步骤如下:
第一步,以S103步骤获取到的目标图像区域作为跟踪初始区域,首先计算该区域的HOG特征。
第二步,针对第一步中的前景目标图像区域,对该区域像素值进行循环移位,构建分块循环矩阵及高斯回归标签,并通过岭回归训练回归模型对该区域进行多尺度采样,训练尺度滤波器。
在新的图像输入时,将图像与回归模型根据核函数进行运算,确定目标中心位置,并以中心位置对目标进行多尺度采样,提取特征,经尺度滤波器卷积得到目标最优尺度;以尺度及中心位置还原在原始图像中还原跟踪结果,得到目标跟踪图像区域,即为RectTrack。
在新的图像中,同样执行S103步骤,得到该图像的目标检测图像区域。
对比目标跟踪图像区域与目标检测图像区域,以位置相似度作为优化策略对各独立目标区域进行区域优化。
该优化策略如下,计算检测区域与跟踪区域的覆盖率Overlop,
设定覆盖阈值T,当覆盖率超过覆盖阈值即认为检测区域与跟踪区域所确定目标为同一目标,并以检测图像区域更新覆盖掉跟踪图像区域。否则保持跟踪图像区域继续进行下一步跟踪。
并根据目标提取结果进行轨迹存储,对每个根据检测及跟踪所得目标,根据其图像区域位置存储不同视频帧中的图像。对于判定为新出现在视频帧的目标,为该目标新分配一个ID,对于已经出现在视频帧中的目标,根据匹配ID存储新的位置。
S105,根据提取到的前景目标更新背景模型。
具体实施如下,对于图像序列每帧的前景目标检测结果,根据图像位置绘制仅有前景目标检测的二值化图像作为mask图像,并基于权重更新背景,更新公式如下:
Dst(i,j)←alpha*Src(i,j)+(1-alpha)Dst(i,j)if mask(i,j)≠0
S106,在视频中的目标提取全部完毕后,对视频目标进行关键帧提取。
如图2所示,关键帧提取模块流程为:开始--加载参考帧--加载对比帧--计算各区域相似度--加权计算总体相似度--根据相似度进行归类--根据均值选取关键帧--结束。
关键帧提取的具体实施方式如下:
第一步,对前景目标的图像区域序列,进行通道分离,得到RGB三通道分量。
第二步,将目标图像分割为5*5的25个小图像,对每一个图像设定权值,根据矩阵权值加权计算各通道计算颜色直方图。
第三步,对每个图像序列,取第一帧作为模型帧,将之后的帧作为对比帧与模型帧进行直方图对比,若两者差异小于先验阈值,则认为两帧相似,保留模型帧,剔除对比帧。否则,则以对比帧截断图像序列,重新生成,再次执行该步骤直至图像序列遍历完毕。
对所示高斯拉普拉斯算子对每个目标,第i帧第j个区域相似度为Sij,权值因子Mj,第i帧图像Vij与V1j的相似度为Si,则有:
Sij=|Vij-V1j|
S107,待目标序列特征化完成之后,将运动目标按照轨迹融合到背景图像之中。
具体实施如下,首先,判断前景目标是否在整个视频中基本停止,对于此类目标,作出目标静止的额外标记,在视频摘要中,此类标记不作图像融合处理。
第一步,取出步骤4所得背景帧。
第二步,将第一个时间段内取得的前景目标按时间顺序通过泊松编辑方法放置在背景中,并标记目标在原始视频中的出现时间。
第三步,当一帧图像中放置的对象数目大于一定阈值时则停止放置。
第四步,取出下一个时间段内的前景目标进行放置直至放完。
第五步,将合成后的所有图像帧组合起来,形成最终的视频摘要。
对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (10)
1.一种前景目标关键帧化的视频摘要生成方法,其特征在于,它包括如下步骤:
步骤1,采集训练样本,构建数据集,训练神经网络模型;
步骤2,对输入视频逐帧进行目标检测,提取检测目标对应的图像区域;
步骤3,为获取到的检测目标分配跟踪器,进行检测目标的连续跟踪并存储运动轨迹;
步骤4,利用提取到的前景目标和给定背景进行视频背景建模;
步骤5,对各前景目标序列提取关键帧,对所有运动目标的轨迹进行时空压缩,生成较少帧数的摘要图像序列;
步骤6,通过图像融合技术将检测目标的运动轨迹贴合到背景图像上。
2.根据权利要求1所述的前景目标关键帧化的视频摘要生成方法,其特征在于,所述步骤1中数据集包含常规目标类图像,常规目标类图像包括不同拍摄角度、不同光照变化和天气情况下的独立图像,该图像经分类后,选取训练样本,对目标网络进行离线训练。
3.根据权利要求1所述的前景目标关键帧化的视频摘要生成方法,其特征在于,所述步骤2中目标检测是先将视频逐帧输入基于深度神经网络的目标检测算法,根据步骤一离线训练所得特征,再由输入的视频图像进行在线检测;
在进行所述步骤2中目标检测之前还包括对图像尺寸的处理步骤;
对于新出现在视频场景中的目标,所述步骤2中目标检测将检测目标判定为新出现的目标,并经步骤3分配跟踪器实现对新目标的跟踪。
4.根据权利要求1所述的前景目标关键帧化的视频摘要生成方法,其特征在于,所述步骤3中检测目标的连续跟踪是基于多个互不干扰的单目标跟踪器实现的;
所述单目标跟踪器包含在图像边缘自动放弃跟踪,销毁跟踪器的内容以及判定目标图像区域为背景的情况下自动销毁的内容。
5.根据权利要求4所述的前景目标关键帧化的视频摘要生成方法,其特征在于,所述步骤3中单目标跟踪器的连续跟踪算法是基于相关滤波实现的,具体步骤如下:
步骤11,计算步骤2所检测得到的目标图像区域的HOG特征;
步骤12,针对步骤11中的目标图像区域,对该区域像素值进行循环移位,构建分块循环矩阵及高斯回归标签,并通过岭回归训练回归模型对该区域进行多尺度采样,训练尺度滤波器;
步骤13,在新的图像输入时,将图像与步骤12的回归模型根据核函数进行运算,确定响应最大的图像位置,即为目标中心位置;
步骤14,以中心位置对目标进行多尺度采样,提取特征,经尺度滤波器卷积得到目标最优尺度;
步骤15,根据步骤14最终确定跟踪算法跟踪结果,即获取到输出图像区域。
步骤16,对比跟踪结果与当前帧检测结果,进行目标图像区域优化。
6.根据权利要求5所述的前景目标关键帧化的视频摘要生成方法,其特征在于,所述步骤16中对比优化策略是通过计算目标跟踪图像区域与目标检测图像区域的重叠率,并设置阈值判断为同一目标实现连续跟踪。
7.根据权利要求1所述的前景目标关键帧化的视频摘要生成方法,其特征在于,所述步骤4中视频背景建模的具体步骤如下:
步骤21,对于在步骤2获取到的图像,经步骤3剔除前景目标后重新生成图像,作为每一帧的背景提取图像;
步骤22,对于背景提取图像,先取第1帧作为假定背景,再依图像序列顺序,根据权重对背景进行更新;
步骤23,最终得到的最后一帧更新后的背景图像,即为全局背景图像。
8.根据权利要求1所述的前景目标关键帧化的视频摘要生成方法,其特征在于,所述步骤5中各前景目标序列关键帧提取是通过对比不同图像帧内的同一检测目标,采用颜色直方图比较其图像区域像素点的相似程度实现的。
9.根据权利要求8所述的前景目标关键帧化的视频摘要生成方法,其特征在于,所述各前景目标序列关键帧提取的具体步骤如下:
步骤31,对前景目标的图像区域序列,进行通道分离,得到RGB三通道分量;
步骤32,将目标图像分割为5*5的25个小图像,对每一个图像设定权值,根据矩阵权值加权计算各通道计算颜色直方图;
步骤33,对每个图像序列,取第一帧作为模型帧,将之后的帧作为对比帧,与模型帧进行直方图对比,若两者差异小于先验阈值,则认为两帧相似,保留模型帧,剔除对比帧;否则,以对比帧截断图像序列,重新生成,再次执行该步骤直至图像序列遍历完毕。
10.根据权利要求1所述的前景目标关键帧化的视频摘要生成方法,其特征在于,所述步骤6中图像融合技术的具体步骤如下:
步骤41,取出步骤4所得的背景帧;
步骤42,将第一个时间段内取得的前景目标按时间顺序通过泊松编辑方法放置在背景中,并标记目标在原始视频中的出现时间;
步骤43,当一帧图像中放置的对象数目大于一定阈值时,则停止放置;
步骤44,取出下一个时间段内的前景目标进行放置,直至放完;
步骤45,将合成后的所有图像帧组合起来,形成最终的视频摘要。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711026911.1A CN107943837B (zh) | 2017-10-27 | 2017-10-27 | 一种前景目标关键帧化的视频摘要生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711026911.1A CN107943837B (zh) | 2017-10-27 | 2017-10-27 | 一种前景目标关键帧化的视频摘要生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107943837A true CN107943837A (zh) | 2018-04-20 |
CN107943837B CN107943837B (zh) | 2022-09-30 |
Family
ID=61936504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711026911.1A Active CN107943837B (zh) | 2017-10-27 | 2017-10-27 | 一种前景目标关键帧化的视频摘要生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107943837B (zh) |
Cited By (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108600864A (zh) * | 2018-04-25 | 2018-09-28 | 中影数字巨幕(北京)有限公司 | 一种电影预告生成方法及装置 |
CN108875692A (zh) * | 2018-07-03 | 2018-11-23 | 中影数字巨幕(北京)有限公司 | 基于关键帧处理技术的缩略影片生成方法、介质和计算设备 |
CN109033178A (zh) * | 2018-06-26 | 2018-12-18 | 北京工业大学 | 一种挖掘能见度多维时空数据之间格兰杰因果关系的方法 |
CN109223178A (zh) * | 2018-08-29 | 2019-01-18 | 合肥工业大学 | 具有目标定位功能的腔镜智能边缘计算系统 |
CN109522449A (zh) * | 2018-09-28 | 2019-03-26 | 百度在线网络技术(北京)有限公司 | 搜索方法和装置 |
CN109961462A (zh) * | 2019-03-25 | 2019-07-02 | 华瑞新智科技(北京)有限公司 | 目标跟踪方法、装置和系统 |
CN109978045A (zh) * | 2019-03-20 | 2019-07-05 | 深圳市道通智能航空技术有限公司 | 一种目标跟踪方法、装置和无人机 |
CN110033463A (zh) * | 2019-04-12 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 一种前景数据生成及其应用方法、相关装置和系统 |
CN110110646A (zh) * | 2019-04-30 | 2019-08-09 | 浙江理工大学 | 一种基于深度学习的手势图像关键帧提取方法 |
CN110166851A (zh) * | 2018-08-21 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 一种视频摘要生成方法、装置和存储介质 |
CN110309795A (zh) * | 2019-07-04 | 2019-10-08 | 腾讯科技(深圳)有限公司 | 视频检测方法、装置、电子设备及存储介质 |
CN110536087A (zh) * | 2019-05-06 | 2019-12-03 | 珠海全志科技股份有限公司 | 电子设备及其运动轨迹照片合成方法、装置和嵌入式装置 |
CN110602504A (zh) * | 2019-10-09 | 2019-12-20 | 山东浪潮人工智能研究院有限公司 | 一种基于YOLOv2目标检测算法的视频解压缩方法及系统 |
CN110705462A (zh) * | 2019-09-29 | 2020-01-17 | 四川乐为科技有限公司 | 基于Hadoop 的分布式视频关键帧提取方法 |
CN110853124A (zh) * | 2019-09-17 | 2020-02-28 | Oppo广东移动通信有限公司 | 生成gif动态图的方法、装置、电子设备及介质 |
CN110879970A (zh) * | 2019-10-21 | 2020-03-13 | 武汉兴图新科电子股份有限公司 | 一种基于深度学习的视频兴趣区域人脸摘要方法、设备及其存储设备 |
CN110944197A (zh) * | 2018-09-25 | 2020-03-31 | 中国移动通信有限公司研究院 | 一种图像、音频编码的方法和装置 |
CN111311603A (zh) * | 2018-12-12 | 2020-06-19 | 北京京东尚科信息技术有限公司 | 用于输出目标物体数目信息的方法和装置 |
CN111881720A (zh) * | 2020-06-09 | 2020-11-03 | 山东大学 | 用于深度学习的数据自动增强扩充方法、识别方法及系统 |
CN112270247A (zh) * | 2020-10-23 | 2021-01-26 | 杭州卷积云科技有限公司 | 基于帧间差分和颜色直方图差值的关键帧提取方法 |
CN112333537A (zh) * | 2020-07-27 | 2021-02-05 | 深圳Tcl新技术有限公司 | 视频整合方法、装置及计算机可读存储介质 |
CN112883836A (zh) * | 2021-01-29 | 2021-06-01 | 中国矿业大学 | 一种煤矿井下巷道形变视频检测方法 |
CN112926522A (zh) * | 2021-03-30 | 2021-06-08 | 广东省科学院智能制造研究所 | 一种基于骨骼姿态与时空图卷积网络的行为识别方法 |
CN112991390A (zh) * | 2021-03-31 | 2021-06-18 | 江苏理工学院 | 一种基于背景感知的多跟踪器融合目标跟踪方法 |
CN113077490A (zh) * | 2021-03-29 | 2021-07-06 | 江苏理工学院 | 一种基于可靠性的多层深度特征目标跟踪方法 |
CN113139468A (zh) * | 2021-04-24 | 2021-07-20 | 西安交通大学 | 融合局部目标特征与全局特征的视频摘要生成方法 |
CN113269067A (zh) * | 2021-05-17 | 2021-08-17 | 中南大学 | 基于深度学习的周期性工业视频片段关键帧两阶段提取方法 |
CN113469200A (zh) * | 2020-03-30 | 2021-10-01 | 阿里巴巴集团控股有限公司 | 数据处理方法和系统、存储介质、计算设备 |
CN113496537A (zh) * | 2021-07-07 | 2021-10-12 | 网易(杭州)网络有限公司 | 动画播放方法、装置及服务器 |
CN113536860A (zh) * | 2020-04-20 | 2021-10-22 | 千寻位置网络有限公司 | 关键帧提取方法、道路交通设备和设施的矢量化方法 |
CN113642360A (zh) * | 2020-04-27 | 2021-11-12 | 杭州海康威视数字技术股份有限公司 | 一种行为计时方法、装置、电子设备及存储介质 |
WO2021238325A1 (zh) * | 2020-05-29 | 2021-12-02 | 华为技术有限公司 | 一种图像处理方法及装置 |
CN113947946A (zh) * | 2021-10-15 | 2022-01-18 | 华东交通大学 | 一种基于车联网v2x与视频融合的港区行车安全监测方法 |
WO2022206679A1 (zh) * | 2021-03-29 | 2022-10-06 | 影石创新科技股份有限公司 | 图像处理方法、装置、计算机设备和存储介质 |
CN118037549A (zh) * | 2024-04-11 | 2024-05-14 | 华南理工大学 | 一种基于视频内容理解的视频增强方法及系统 |
WO2024109308A1 (zh) * | 2023-07-18 | 2024-05-30 | 西北工业大学 | 一种基于多维语义信息的视频关键数据提取方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678299A (zh) * | 2012-08-30 | 2014-03-26 | 中兴通讯股份有限公司 | 一种监控视频摘要的方法及装置 |
CN104200237A (zh) * | 2014-08-22 | 2014-12-10 | 浙江生辉照明有限公司 | 一种基于核化相关滤波高速自动多目标跟踪方法 |
CN104244113A (zh) * | 2014-10-08 | 2014-12-24 | 中国科学院自动化研究所 | 一种基于深度学习技术的视频摘要生成方法 |
CN105357594A (zh) * | 2015-11-19 | 2016-02-24 | 南京云创大数据科技股份有限公司 | 基于集群及h264的视频浓缩算法的海量视频摘要生成方法 |
CN106935035A (zh) * | 2017-04-07 | 2017-07-07 | 西安电子科技大学 | 基于ssd神经网络的违章停车车辆实时检测方法 |
-
2017
- 2017-10-27 CN CN201711026911.1A patent/CN107943837B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678299A (zh) * | 2012-08-30 | 2014-03-26 | 中兴通讯股份有限公司 | 一种监控视频摘要的方法及装置 |
CN104200237A (zh) * | 2014-08-22 | 2014-12-10 | 浙江生辉照明有限公司 | 一种基于核化相关滤波高速自动多目标跟踪方法 |
CN104244113A (zh) * | 2014-10-08 | 2014-12-24 | 中国科学院自动化研究所 | 一种基于深度学习技术的视频摘要生成方法 |
CN105357594A (zh) * | 2015-11-19 | 2016-02-24 | 南京云创大数据科技股份有限公司 | 基于集群及h264的视频浓缩算法的海量视频摘要生成方法 |
CN106935035A (zh) * | 2017-04-07 | 2017-07-07 | 西安电子科技大学 | 基于ssd神经网络的违章停车车辆实时检测方法 |
Non-Patent Citations (4)
Title |
---|
ALEX RAV-ACHA等: "Making a Long Video Short: Dynamic Video Synopsis", 《2006 IEEE COMPUTER SOCIETY CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION 》 * |
WEI LIU等: "SSD: Single Shot MultiBox Detector", 《HTTPS://ARXIV.ORG/ABS/1512.02325》 * |
王璐: "一种基于关键帧技术的监控视频摘要提取方法", 《北京劳动保障职业学院学报》 * |
黄凯奇等: "智能视频监控技术综述", 《计算机学报》 * |
Cited By (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108600864B (zh) * | 2018-04-25 | 2020-08-28 | 中影数字巨幕(北京)有限公司 | 一种电影预告生成方法及装置 |
CN108600864A (zh) * | 2018-04-25 | 2018-09-28 | 中影数字巨幕(北京)有限公司 | 一种电影预告生成方法及装置 |
CN109033178A (zh) * | 2018-06-26 | 2018-12-18 | 北京工业大学 | 一种挖掘能见度多维时空数据之间格兰杰因果关系的方法 |
CN109033178B (zh) * | 2018-06-26 | 2021-07-30 | 北京工业大学 | 一种挖掘能见度多维时空数据之间格兰杰因果关系的方法 |
CN108875692A (zh) * | 2018-07-03 | 2018-11-23 | 中影数字巨幕(北京)有限公司 | 基于关键帧处理技术的缩略影片生成方法、介质和计算设备 |
CN108875692B (zh) * | 2018-07-03 | 2020-10-16 | 中影数字巨幕(北京)有限公司 | 基于关键帧处理技术的缩略影片生成方法、介质和计算设备 |
CN110166851A (zh) * | 2018-08-21 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 一种视频摘要生成方法、装置和存储介质 |
CN109223178A (zh) * | 2018-08-29 | 2019-01-18 | 合肥工业大学 | 具有目标定位功能的腔镜智能边缘计算系统 |
CN110944197A (zh) * | 2018-09-25 | 2020-03-31 | 中国移动通信有限公司研究院 | 一种图像、音频编码的方法和装置 |
CN110944197B (zh) * | 2018-09-25 | 2022-06-07 | 中国移动通信有限公司研究院 | 一种图像、音频编码的方法和装置 |
CN109522449A (zh) * | 2018-09-28 | 2019-03-26 | 百度在线网络技术(北京)有限公司 | 搜索方法和装置 |
CN111311603A (zh) * | 2018-12-12 | 2020-06-19 | 北京京东尚科信息技术有限公司 | 用于输出目标物体数目信息的方法和装置 |
CN109978045A (zh) * | 2019-03-20 | 2019-07-05 | 深圳市道通智能航空技术有限公司 | 一种目标跟踪方法、装置和无人机 |
CN109961462A (zh) * | 2019-03-25 | 2019-07-02 | 华瑞新智科技(北京)有限公司 | 目标跟踪方法、装置和系统 |
US11961237B2 (en) | 2019-04-12 | 2024-04-16 | Tencent Technology (Shenzhen) Company Limited | Foreground data generation method and method for applying same, related apparatus, and system |
CN110033463A (zh) * | 2019-04-12 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 一种前景数据生成及其应用方法、相关装置和系统 |
CN110110646B (zh) * | 2019-04-30 | 2021-05-04 | 浙江理工大学 | 一种基于深度学习的手势图像关键帧提取方法 |
CN110110646A (zh) * | 2019-04-30 | 2019-08-09 | 浙江理工大学 | 一种基于深度学习的手势图像关键帧提取方法 |
CN110536087A (zh) * | 2019-05-06 | 2019-12-03 | 珠海全志科技股份有限公司 | 电子设备及其运动轨迹照片合成方法、装置和嵌入式装置 |
CN110309795A (zh) * | 2019-07-04 | 2019-10-08 | 腾讯科技(深圳)有限公司 | 视频检测方法、装置、电子设备及存储介质 |
CN110309795B (zh) * | 2019-07-04 | 2024-03-12 | 腾讯科技(深圳)有限公司 | 视频检测方法、装置、电子设备及存储介质 |
CN110853124B (zh) * | 2019-09-17 | 2023-09-08 | Oppo广东移动通信有限公司 | 生成gif动态图的方法、装置、电子设备及介质 |
CN110853124A (zh) * | 2019-09-17 | 2020-02-28 | Oppo广东移动通信有限公司 | 生成gif动态图的方法、装置、电子设备及介质 |
CN110705462B (zh) * | 2019-09-29 | 2022-05-10 | 四川乐为科技有限公司 | 基于Hadoop的分布式视频关键帧提取方法 |
CN110705462A (zh) * | 2019-09-29 | 2020-01-17 | 四川乐为科技有限公司 | 基于Hadoop 的分布式视频关键帧提取方法 |
CN110602504A (zh) * | 2019-10-09 | 2019-12-20 | 山东浪潮人工智能研究院有限公司 | 一种基于YOLOv2目标检测算法的视频解压缩方法及系统 |
CN110879970A (zh) * | 2019-10-21 | 2020-03-13 | 武汉兴图新科电子股份有限公司 | 一种基于深度学习的视频兴趣区域人脸摘要方法、设备及其存储设备 |
CN113469200A (zh) * | 2020-03-30 | 2021-10-01 | 阿里巴巴集团控股有限公司 | 数据处理方法和系统、存储介质、计算设备 |
CN113536860A (zh) * | 2020-04-20 | 2021-10-22 | 千寻位置网络有限公司 | 关键帧提取方法、道路交通设备和设施的矢量化方法 |
CN113536860B (zh) * | 2020-04-20 | 2022-09-27 | 千寻位置网络有限公司 | 关键帧提取方法、道路交通设备和设施的矢量化方法 |
CN113642360A (zh) * | 2020-04-27 | 2021-11-12 | 杭州海康威视数字技术股份有限公司 | 一种行为计时方法、装置、电子设备及存储介质 |
CN113642360B (zh) * | 2020-04-27 | 2024-06-04 | 杭州海康威视数字技术股份有限公司 | 一种行为计时方法、装置、电子设备及存储介质 |
CN113810587B (zh) * | 2020-05-29 | 2023-04-18 | 华为技术有限公司 | 一种图像处理方法及装置 |
WO2021238325A1 (zh) * | 2020-05-29 | 2021-12-02 | 华为技术有限公司 | 一种图像处理方法及装置 |
CN113810587A (zh) * | 2020-05-29 | 2021-12-17 | 华为技术有限公司 | 一种图像处理方法及装置 |
CN111881720B (zh) * | 2020-06-09 | 2024-01-16 | 山东大学 | 用于深度学习的数据自动增强扩充方法、识别方法及系统 |
CN111881720A (zh) * | 2020-06-09 | 2020-11-03 | 山东大学 | 用于深度学习的数据自动增强扩充方法、识别方法及系统 |
CN112333537A (zh) * | 2020-07-27 | 2021-02-05 | 深圳Tcl新技术有限公司 | 视频整合方法、装置及计算机可读存储介质 |
CN112333537B (zh) * | 2020-07-27 | 2023-12-05 | 深圳Tcl新技术有限公司 | 视频整合方法、装置及计算机可读存储介质 |
CN112270247A (zh) * | 2020-10-23 | 2021-01-26 | 杭州卷积云科技有限公司 | 基于帧间差分和颜色直方图差值的关键帧提取方法 |
CN112883836B (zh) * | 2021-01-29 | 2024-04-16 | 中国矿业大学 | 一种煤矿井下巷道形变视频检测方法 |
CN112883836A (zh) * | 2021-01-29 | 2021-06-01 | 中国矿业大学 | 一种煤矿井下巷道形变视频检测方法 |
WO2022206679A1 (zh) * | 2021-03-29 | 2022-10-06 | 影石创新科技股份有限公司 | 图像处理方法、装置、计算机设备和存储介质 |
CN113077490A (zh) * | 2021-03-29 | 2021-07-06 | 江苏理工学院 | 一种基于可靠性的多层深度特征目标跟踪方法 |
CN112926522A (zh) * | 2021-03-30 | 2021-06-08 | 广东省科学院智能制造研究所 | 一种基于骨骼姿态与时空图卷积网络的行为识别方法 |
CN112926522B (zh) * | 2021-03-30 | 2023-11-24 | 广东省科学院智能制造研究所 | 一种基于骨骼姿态与时空图卷积网络的行为识别方法 |
CN112991390A (zh) * | 2021-03-31 | 2021-06-18 | 江苏理工学院 | 一种基于背景感知的多跟踪器融合目标跟踪方法 |
CN112991390B (zh) * | 2021-03-31 | 2023-08-18 | 江苏理工学院 | 一种基于背景感知的多跟踪器融合目标跟踪方法 |
CN113139468A (zh) * | 2021-04-24 | 2021-07-20 | 西安交通大学 | 融合局部目标特征与全局特征的视频摘要生成方法 |
CN113269067A (zh) * | 2021-05-17 | 2021-08-17 | 中南大学 | 基于深度学习的周期性工业视频片段关键帧两阶段提取方法 |
CN113496537A (zh) * | 2021-07-07 | 2021-10-12 | 网易(杭州)网络有限公司 | 动画播放方法、装置及服务器 |
CN113496537B (zh) * | 2021-07-07 | 2023-06-30 | 网易(杭州)网络有限公司 | 动画播放方法、装置及服务器 |
CN113947946A (zh) * | 2021-10-15 | 2022-01-18 | 华东交通大学 | 一种基于车联网v2x与视频融合的港区行车安全监测方法 |
WO2024109308A1 (zh) * | 2023-07-18 | 2024-05-30 | 西北工业大学 | 一种基于多维语义信息的视频关键数据提取方法 |
CN118037549A (zh) * | 2024-04-11 | 2024-05-14 | 华南理工大学 | 一种基于视频内容理解的视频增强方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107943837B (zh) | 2022-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107943837A (zh) | 一种前景目标关键帧化的视频摘要生成方法 | |
CN110363131B (zh) | 基于人体骨架的异常行为检测方法、系统及介质 | |
CN106096577B (zh) | 一种摄像头分布地图中的目标追踪方法 | |
CN113963445B (zh) | 一种基于姿态估计的行人摔倒动作识别方法及设备 | |
CN109684916B (zh) | 基于路径轨迹数据异常检测方法、系统、设备及存储介质 | |
CN102831439B (zh) | 手势跟踪方法及系统 | |
Chen et al. | Learning-based spatio-temporal vehicle tracking and indexing for transportation multimedia database systems | |
CN109816690A (zh) | 基于深度特征的多目标追踪方法及系统 | |
CN105760849B (zh) | 基于视频的目标对象行为数据获取方法及装置 | |
CN103440668B (zh) | 一种在线视频目标跟踪方法和装置 | |
CN104915655A (zh) | 一种多路监控视频的管理方法与设备 | |
Ullah et al. | Multi-feature-based crowd video modeling for visual event detection | |
CN107256386A (zh) | 基于深度学习的人类行为分析方法 | |
CN103345492A (zh) | 一种视频浓缩的方法和系统 | |
Ghadi et al. | Syntactic model-based human body 3D reconstruction and event classification via association based features mining and deep learning | |
CN103237201A (zh) | 一种基于社会化标注的案件视频研判方法 | |
JP7136500B2 (ja) | ノイズチャネルに基づくランダム遮蔽回復の歩行者再識別方法 | |
CN108875456A (zh) | 目标检测方法、目标检测装置和计算机可读存储介质 | |
CN108830170A (zh) | 一种基于分层特征表示的端到端目标跟踪方法 | |
CN103500456B (zh) | 一种基于动态贝叶斯模型网络的对象跟踪方法和设备 | |
Yang | RETRACTED ARTICLE: Analysis of sports image detection technology based on machine learning | |
Cancela et al. | Unsupervised trajectory modelling using temporal information via minimal paths | |
Zhou et al. | A study on attention-based LSTM for abnormal behavior recognition with variable pooling | |
Hao et al. | Recognition of basketball players’ action detection based on visual image and Harris corner extraction algorithm | |
CN109034100A (zh) | 人脸图样检测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |