CN102395029B - 一种支持视频可伸缩浏览的视频编解码方法和装置 - Google Patents
一种支持视频可伸缩浏览的视频编解码方法和装置 Download PDFInfo
- Publication number
- CN102395029B CN102395029B CN 201110346398 CN201110346398A CN102395029B CN 102395029 B CN102395029 B CN 102395029B CN 201110346398 CN201110346398 CN 201110346398 CN 201110346398 A CN201110346398 A CN 201110346398A CN 102395029 B CN102395029 B CN 102395029B
- Authority
- CN
- China
- Prior art keywords
- video
- flag bit
- decoding
- subelement
- moving objects
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种支持视频可伸缩浏览的视频编解码方法和装置。其中,所述支持视频可伸缩浏览的视频编码方法和装置,通过在编码原始视频的同时,编码通过视频分析和处理得到的与原始视频对应的运动对象标志位,使得解码端可以根据运动对象标志位进行支持视频可伸缩浏览的视频解码。所述支持视频可伸缩浏览的视频解码方法和装置,通过同时解码出重建的原始视频和运动对象标志位,从而在解码端根据运动对象标志位,对运动对象显示的起止时间进行重新排列,从而实现视频的可伸缩播放。本发明的优点是:在提高大纲视频和原始视频的存储效率的同时,也同时实现了对不同时间、不同位置出现的运动对象进行可伸缩浏览。
Description
技术领域
本发明涉及视频分析处理和视频编解码领域,特别是一种支持视频中运动对象密度可伸缩调整的视频快速浏览的编解码方法和装置。
背景技术
近年来,数字媒体的高速发展,公共安全情势受到社会和公众的广泛关注,多媒体和安防视频数据成爆炸式增长。传统耗时的简单原始的浏览方式已远远不能满足人们对视频信息访问和查询的需求。不断有新的视频浏览查阅方法出现。
目前的视频浏览方法,可以分为视频略览(Video Summary)、视频梗概(VideoSkimming)和视频摘要(Video Synopsis)三大类:
1.视频略览是从原始视频中提取一部分图像的集合来概括原始的视频内容,而这些代表原始视频的图像就称为关键帧(Keyframe)。对其浏览的方式包括故事板(Storyboard,参见S Uchihashi,J Foote and A Girgensohn,“Video manga:Generating semantically meaningful video summaries”,ACM Multimedia,1999.)和场景转移图(STG,参见B Yeo and B Liu,“Rapid scene analysis compressed video”,IEEE Trans.On Circuits and Systems for Video Technology,5(6):533-544,1995)等。基于关键帧提取的视频略览的优点在于简单易行,且计算复杂度低。不足之处在于关键帧表达机制丢失了视频的动态特性,因而表现力不生动。
2.视频梗概是从原始视频中提取能够表达原始视频的小片段或者镜头内容加以编辑合成,它本身就是一个视频片断,因此保持了原始视频的动态特性。视频梗概分为两类:视频概述(Summary Sequence,参看Naphade and Huang,“Semantic video indexing using a probabilistic framework”,ICPR,2000)和精彩片断(Highlight,参看Zhong and Chang,“Structure analysis of sports video usingdomain models”,ICME,2001)。与视频略览相似,视频梗概技术把帧作为组成视频的最小视觉单位,而对于背景相对稳定的监控视频,结果都不可避免的存在大量的冗余信息。
3.视频摘要是从完整的原始视频中提取所有运动物体序列,然后将这些序列重排到摘要视频空间,以达到压缩视频的效果。这种技术允许不同时间段出现的运动物体出现在摘要视频空间的同一帧(参看A.Rav-Acha,Y.Pritch,and S.Peleg,“Making a Long Video Short:Dynamic Video Synopsis”,CVPR,2006)。视频摘要的优点是能够以较大的比例压缩视频,如对于某些特定场景,视频摘要能将24小时的监控视频压缩到一分钟以内,但是该方法的算法复杂度非常高,需要很长时间用来分析和处理原始视频,因此难以实时使用。
为了适应对监控视频进行实时处理,事后快速查看的需要,Y.Pritch等人提出了视频浓缩的在线处理框架(参看Y.Pritch,A.Rav-Acha,A.Gutman,and S.Peleg,“Webcam synopsis:Peeking around the world”,ICCV,2007),通过实时的视频分析将运动对象序列提取到数据库与原始监控视频分开保存,需要观看时再根据用户需要生成相应长度的大纲视频。这种方法虽然在一定程度上提高了浓缩视频需要查看时的生成速度,但是这种通过数据库将原始监控视频、提取出的运动对象序列、生成后的大纲视频分别存储的方式存储效率较低,会加大存储负担,增加监控系统的运营成本。
在视频编码、存储方面,众多学者也在不断探索提高监控视频存储效率、增强监控视频码流解码浏览时的自适应性的视频编码技术和解决方案。可伸缩编码技术通过使用分层编码、层间预测等技术,达到了支持多种解码方式的可伸缩解码的效果(H.Schwarz,D.Marpe,and T.Wiegand,“Overview of thescalable video coding extension of H.264/AVC,”IEEE Trans.Circuits Syst.VideoTechnol.,vol.17,1103-1120,2007),为监控视频的时域可伸缩观看、空域可伸缩观看和质量可伸缩观看提供了技术支撑。但是以上可伸缩编码技术,都是只支撑基于帧的时域、空域、质量可伸缩浏览,无法支撑视频浓缩中的原始视频与大纲视频的高效存储以及对不同时间、不同位置出现的运动对象进行时空域的混合可伸缩浏览。
发明内容
针对传统视频大纲方法存储效率较低,以及传统监控视频编码方法缺少支撑视频浓缩实现时空域混合可伸缩浏览的编码存储方案的问题,本发明提出了一种支持视频可伸缩浏览的视频编解码方法和装置,支持可伸缩视频浓缩的监控视频编码、存储、浏览。
按照本发明提供的技术方案,所述支持视频可伸缩浏览的视频编解码方法,包括一种支持视频可伸缩浏览的视频编码方法和对应的一种支持视频可伸缩浏览的解码方法;
所述支持视频可伸缩浏览的视频编码方法为:在编码原始视频的同时,编码通过视频分析和处理得到的与原始视频对应的对象标志位,使得解码端能够根据对象标志位进行支持视频可伸缩浏览的视频解码;
所述支持视频可伸缩浏览的视频解码方法为:同时解码出重建的原始视频和对象标志位,从而在解码端根据对象标志位,对运动对象显示的起止时间进行重新排列,实现视频的可伸缩播放。
所述支持视频可伸缩浏览的视频编码方法在编码原始视频的同时进行视频分析和视频浓缩,在视频分析过程中提取了运动对象掩膜,在视频浓缩过程中计算了代价函数,然后生成了对象标志位。
所述支持视频可伸缩浏览的视频解码方法在解码获得原始视频的同时也解码获得了对象标志位,并且能够根据用户的浏览需要,实时输入伸缩级数p,最终根据解码重建的原始视频、对象标志位和伸缩级数p,在解码端生成伸缩级数p下的浓缩视频,并通过调整伸缩级数p生成并浏览不同级数下浓缩视频,从而实现视频的可伸缩浏览。
所述对象标志位包括:对象区域标志位和对象映射标志位;
所述对象区域标志位,表示了运动对象的区域信息,对象区域标志位是通过编码视频分析获得的运动对象掩膜获得的;
所述对象映射标志位,表示了运动对象的映射信息,即:从原始视频的某一帧映射到浓缩视频时的映射关系,对象映射标志位是通过编码视频浓缩时计算代价函数后的计算结果获得的。
解码出的所述对象标志位中的对象映射标志位,通过伸缩级数p进行调整,并将调整后的对象映射标志位实时生成新的浓缩视频。
一种支持视频可伸缩浏览的视频编解码装置,包括编码装置和解码装置;
所述编码装置在编码原始视频的同时,编码通过视频分析和处理得到的与原始视频对应的对象标志位,使得解码装置能够根据对象标志位进行支持视频可伸缩浏览的视频解码;
所述解码装置同时解码出重建的原始视频和对象标志位,从而根据对象标志位,对运动对象显示的起止时间进行重新排列,实现视频的可伸缩播放。
所述编码装置包括:
视频编码单元,用于编码原始视频;
视频分析与浓缩单元,用于生成运动对象的掩膜信息和原始视频到浓缩视频的映射信息;
对象标志位单元,用于生成和编码对象标志位;
码流复合单元,通过合并原始视频的码流和运动对象的标志位码流为一路码流,实现支持视频可伸缩浏览的视频编码。
所述解码装置包括:
码流分解单元,用于将复合码流分解为原始视频码流和对象标志位码流;
视频解码单元,用于解码并重建原始视频;
对象标志位解码单元,用于解码对象标志位;
前景、背景生成单元,用于生成前景运动对象序列和主背景视频;
映射关系调整单元,用于根据用户输入到解码装置的伸缩级数p,调整运动对象从原始视频映射到浓缩视频的映射关系;
浓缩视频重建单元,用于根据伸缩级数p下的映射关系、在重建视频基础上获得的前景运动对象序列和主背景视频,生成伸缩技术p下的浓缩视频。
所述编码装置中的视频分析与浓缩单元包括:视频分析子单元和视频浓缩子单元;所述视频分析子单元,用于对原始视频进行视频分析,并输出运动对象的掩膜信息;所述视频浓缩子单元,用于对原始视频通过视频分析得到的运动对象序列,进行代价函数计算,并输出运动对象的映射信息;
所述对象标志位单元包括:对象区域标志位生成子单元、对象映射标志位生成子单元,对象标志位合成与编码子单元;所述对象区域标志位生成子单元,用于根据视频分析子单元获得的运动对象掩膜,生成表示运动对象区域的标志位;所述对象映射标志位生成子单元,用于根据视频浓缩子单元获得的映射信息,即:从原始视频的某一帧映射到浓缩视频时的映射关系,生成表示运动对象映射信息的标志位;所述对象标志位合成与编码子单元,用于合成并编码运动对象的区域标志位和运动对象的映射标志位,最终生成对象标志位。
所述解码装置中的对象标志位解码单元包括:对象标志位分解子单元、对象区域标志位解码子单元、对象映射标志位解码子单元;所述对象标志位分解子单元,用于将对象标志位分解为对象区域标志位和运动对象的映射标志位;所述对象区域标志位解码子单元,用于将对象区域标志位解码为运动对象的区域信息,从而可以对重接的原始视频进行前景和背景分离;所述对象映射标志位解码子单元,用于将对象映射标志位解码为运动对象的映射信息,从而可以获得初始化的映射关系;
所述前景、背景生成单元包括:前景、背景分离子单元、前景缓存子单元和主背景选择子单元;所述前景、背景分离子单元,用于根据运动对象的区域信息,分别提取出视频中的前景运动对象区域和背景区域;所述前景缓存子单元,用于缓存根据运动对象区域信息获得的前景运动对象序列;所述主背景选择子单元,用于根据视频中的背景区域生成主背景视频,所述主背景视频用于浓缩视频重建。
本发明的优点是:本发明在保证相对于先前的大纲视频和原始视频分开存储的存储方式有明显的存储效率提升外,也进一步改善了传统浓缩视频的浏览方式,做到了可伸缩浏览,从而为固定背景的监控视频编码、存储与浏览提供了一个完整的解决方案。
附图说明
图1为本发明的支持视频可伸缩浓缩浏览的编码装置图;
图2为本发明的支持视频可伸缩浓缩浏览的解码装置图;
图3为本发明的支持视频可伸缩浏览的编码方法流程图;
图4为本发明的支持视频可伸缩浓缩浏览的解码方法流程图;
图5为本发明原始视频和浓缩视频的对比效果示意图;
图6为本发明的对象区域标志位生成过程中各步骤对应的效果图,其中:
图6(a)为从原始视频中截取的一帧图像;
图6(b)为视频分析子单元输出的运动对象掩膜和外接矩形框;
图6(c)为视频编码单元输出的块划分信息;
图6(d)为用外接矩形框修正后的块划分信息;
图6(e)为用修正后的块划分信息划分的原始图像;
图6(f)为根据对象区域标志位表示的运动对象区域效果图;
图7为本发明支持可伸缩的浓缩视频重建示意图。
具体实施方式
本发明针对传统视频大纲方法存储效率较低以及传统监控视频编码方法缺少支撑视频浓缩实现时空域混合可伸缩浏览的编码存储方案的问题,提出了一种支持可伸缩视频浓缩的监控视频编码、存储、浏览方法。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
参照图1所示的支持视频可伸缩浓缩浏览的系统装置图,本发明中的编码装置包括:视频编码单元,视频分析与浓缩单元,对象标志位单元,码流复合单元。
视频编码单元,用于编码原始视频,并输出码流中的块划分信息到对象标志位单元的区域标志位生成子单元。
视频分析与浓缩单元,包括视频分析子单元用于提取运动对象掩膜,以及视频浓缩子单元,用于计算视频分析子单元提取出的前景运动对象所需要映射到浓缩视频中的初始化帧号,并将初始化的映射关系输出到对象标志位单元的映射标志位子单元。
对象标志位单元包括:区域标志位生成子单元、映射标志位生成子单元和对象标志位合成与编码子单元。对象区域标志位生成子单元,用于根据视频分析单元输出的运动对象掩膜信息,生成基于块划分的对象区域标志位。对象映射标志位生成子单元,用于获取并缓存视频浓缩子单元传输过来的初始化映射关系,即运动对象映射到浓缩视频中的初始化帧号。对象标志位合成与编码子单元,用于将对象区域标志位子单元输出的对象区域标志位和对象映射标志位子单元输出的对象映射标志位,合并为对象标志位,并将其编码,输出到码流复合单元。
码流复合单元,用于将原始视频码流和标志位码流以帧为单位合并为一路码流。
参照图3,本发明中的支持视频可伸缩浓缩浏览的编码方法,包括以下步骤:步骤1,输入视频图像,对每帧图像分别进行视频分析和视频编码;步骤2,通过对输入视频进行视频分析,提取出每帧图像中的运动对象及其运动区域掩膜,该掩膜由一个初步标示运动对象位置的外接矩形框和矩形框内像素级的二值标记1和0表示,其中标记值1表示运动像素,0表示非运动像素;如图6(b)所示白色区域表示图6(a)中的非运动对象区域(背景区域),黑色人形区域是从图6(a)中提取出的运动对象掩膜,其外围邻接的矩形框是该运动对象的外接矩形框。与此同时,通过对该视频进行视频编码,为步骤5生成初始视频码流,并在编码过程中提取视频中每帧图像的块划分信息,块划分效果见图6(c)。步骤3,在步骤2中的视频分析和视频编码已经分别得到视频帧中所有运动对象的掩膜信息和视频的帧级块划分信息的基础上,根据运动对象掩膜求得标示整个运动对象区域的边界矩形框,随后根据块划分信息对该边界矩形框内的区域进行块划分,参见图6(d),并为区域内各个块进行二值标记,即将矩形框进行块划分之后得到的各个子块标记为前景块或者背景块,当落入子块中的运动掩膜区域的面积大于设定的阈值时,将该子块标记为1,表示前景块,否则将该子块标记为0,表示背景块,随后融合运动对象区域信息,块划分信息和标记好的各个子块的二值标志位,可将运动对象从经过信息融合后的图6(e)中提取出来,运动对象的提取结果参见图6(f)。当一帧中有多个运动对象时,即在有多套运动对象掩膜时,重复执行该步骤,直到结合视频帧的块划分信息标识完所有的运动对象分别所在的矩形区域。上述步骤完成之后,就可以生成每一帧的所有运动对象的对象区域标志位,从而最终生成视频的所有图像帧中的所有运动对象的对象区域标志位,该步骤生成的对象区域标志位用来表示视频中运动对象的区域信息。步骤4,在视频分析的基础上进行视频浓缩,即:累积从各帧前景图像中分别提取出的运动物体,形成运动物体序列,并引入三个代价函数:a.运动区域损失代价Ea,度量浓缩视频中运动区域的丢失程度;b.运动区域遮挡代价Ec,度量运动区域之间的遮挡程度;c.运动序列的时间一致性代价Et,度量运动序列的时间关系与原始视频中运动对象序列的时间关系的差异程度,随后为各个代价函数设置不同的权重系数w1,w2和w3,将三个代价函数线性组合成总的能量函数:E(M)=w1Ea(M)+w2Ec(M)+w3Et(M),其中M表示所有运动对象序列在浓缩视频的映射关系的集合,即各个运动对象在浓缩视频中的起始和结束位置,然后通过使用模拟退火算法(Simulated Annealing)根据能量函数E(M)的计算值对映射关系集M进行优化,待算法处理完后得到最终的映射关系集合Mbest(详细过程参看A.Rav-Acha,Y.Pritch,and S.Peleg,“Making a Long Video Short:Dynamic Video Synopsis”,CVPR,2006),并根据映射关系集Mbest中的各个运动对象在原始视频和浓缩视频中的对应关系,形成运动对象的映射标志位,映射标志位用来表示运动对象从原始视频映射到浓缩视频时在浓缩视频中的帧号;步骤5,将步骤3得到的对象区域标志位和步骤4得到的对象映射标志位合并为对象标志位,并将对象标志位按运动对象在原始视频中出现的帧号,将对象标志位编码存储到步骤2得到的对应帧的原始视频码流中,形成最终的支撑可伸缩浓缩浏览的复合视频码流。
如图2所示,本发明中的解码装置包括:码流分解单元,视频解码单元,对象标志位解码单元,前景、背景生成单元,映射关系调整单元,浓缩视频重建单元。
码流分解单元,将复合码流拆分为对象标志位码流和原始视频码流。
视频解码单元,用于解码原始视频码流,将码流重建为视频序列输出到前景、背景生成单元,并输出码流中的块划分信息到对象标志位解码单元的对象区域标志位解码子单元。
对象标志位解码单元包括:对象标志位分解子单元、对象区域标志位解码子单元和对象映射标志位解码子单元。其中对象标志位分解子单元,将对象标志位码流分解为对象区域标志位和对象映射标志位,并将两种标志位分别传输给对象区域标志位解码子单元和对象映射标志位解码子单元。对象区域标志位解码子单元,根据视频解码单元输出的块划分信息和对象标志位分解子单元输出的对象区域标志位,将对象区域标志位进行解码,从而获得块级的前景运动对象区域信息,并将区域信息传输给前景、背景生成单元。对象映射标志位解码子单元,将对象标志位分解子单元传入的对象映射标志位解码为对象映射关系信息,即运动对象所需映射到浓缩视频中的初始化帧号,并将初始化的映射关系输出到映射关系调整单元。
前景、背景生成单元包括:前景、背景分离子单元,前景缓存子单元和主背景选择子单元。其中,前景、背景分离子单元,用于根据运动对象的块级区域信息,将每帧图像分离为前景运动对象区域和背景区域,并将前景信息输出到前景缓存子单元,将背景信息输出到主背景选择子单元。前景缓存子单元,用于缓存各帧中的前景运动对象,组成运动对象序列,并输出到浓缩视频重建单元。主背景选择单元,利用前景、背景分离子单元输入的背景信息,如采用参考文献Shikun Feng,Shengcai Liao,Zhiyong Yuan and Stan Z.Li.″OnlinePrincipal Background Selection for Video Synopsis″,ICPR,17-20,2010所述的方法,生成主背景图像序列,并输出到浓缩视频重建单元;映射标志位更新单元,根据用户用伸缩级数输入装置输入的伸缩级数调整并更新对象映射标志位解码子单元输入的初始化映射关系,并将新的映射关系输出到浓缩视频重建单元。浓缩视频重建单元,根据前景缓存子单元输入的前景运动对象序列、主背景选择子单元输入的主背景序列和映射关系调整单元输入的当前伸缩级数下的映射关系,通过将前景对象按对象映射关系信息,即映射到浓缩视频中的帧号,映射到主背景序列中,从而生成当前伸缩级数下的浓缩视频。这里用户可以通过伸缩级数输入装置,实时调整伸缩级数,从而调整后面待播放视频的浓缩密度。当用户没有输入新的伸缩级数的时候,映射关系调整单元按用户最后一次输入的伸缩级数进行初始映射关系的调整与更新,并输出到浓缩视频重建单元。
参考图4,本发明中的支撑视频可伸缩浓缩浏览的解码方法,包括以下步骤:步骤1,输入用支持可伸缩浓缩浏览的视频编码方法得到的视频码流,从码流中提取对象标志位的码流信息,从而分别获得原始视频的编码码流和对象标志位的编码码流;步骤2,用原始视频的码流解码出原始视频,并输出视频各帧图像在码流中的块划分信息;步骤3,将对象标志位分解为对象区域标志位和对象映射标志位;步骤4,根据对象区域标志位和解码原始视频码流时获得的块划分信息,将对象区域标志位进行解码,从而获得各帧图像中的前景区域信息和背景区域信息。同时解码对象映射标志位,获得各前景运动对象的初始化映射关系;步骤5,根据步骤4获得的前景区域信息和背景区域信息,将步骤2解码获得的原始视频的前景和背景进行分离,其中前景指运动对象区域,背景指非运动对象区域;步骤6,缓存前景运动对象,形成前景运动对象序列,并根据参考文献Shikun Feng,Shengcai Liao,Zhiyong Yuan and Stan Z.Li.″Online Principal Background Selection for Video Synopsis″,ICPR,17-20,2010所述的方法,缓存背景区域,形成主背景视频;步骤7,根据解码端人为输入的伸缩级数p和步骤4得到的初始化对象映射关系f0,生成新的映射关系fp;步骤8,如图7所示,根据步骤7生成的映射关系,将前景运动对象分别映射到主背景视频中,从而重建出可伸缩浓缩视频。
在上述重建解码方法的步骤7中包括,根据原始的映射关系设原始映射关系f0,以及播放时用户输入的伸缩级数p,生成新的映射关系fp,并用新的映射关系,生成浓缩视频,实现视频的可伸缩浏览,其中生成新映射关系fp的步骤如下:步骤1,输入原始映射关系f0和用户指定的伸缩级数p;步骤2,根据公式fp(i,k)=f0(i,k)+(k-1)*p算出新伸缩级数下的映射关系fp。其中fp(i,k)为伸缩级数p时原始视频第i帧中的第k个运动对象映射到浓缩视频的帧号。
最终,原始视频和浓缩视频的对比效果示意图,如图5所示。由此可见,本发明在保证相对于先前的大纲视频和原始视频分开存储的存储方式有明显的存储效率提升外,也进一步改善了传统浓缩视频的浏览方式,做到了可伸缩浏览,从而为固定背景的监控视频编码、存储与浏览提供了一个完整的解决方案。
Claims (7)
1. 一种支持视频可伸缩浏览的视频编解码方法,其特征在于,包括一种支持视频可伸缩浏览的视频编码方法和对应的一种支持视频可伸缩浏览的解码方法;
所述支持视频可伸缩浏览的视频编码方法为:在编码原始视频的同时,编码通过视频分析和处理得到的与原始视频对应的对象标志位,使得解码端能够根据对象标志位进行支持视频可伸缩浏览的视频解码;
所述支持视频可伸缩浏览的视频解码方法为:同时解码出重建的原始视频和对象标志位,从而在解码端根据对象标志位,对运动对象显示的起止时间进行重新排列,实现视频的可伸缩播放:
所述对象标志位包括:对象区域标志位和对象映射标志位;
所述对象区域标志位,表示了运动对象的区域信息,对象区域标志位是通过编码视频分析获得的运动对象掩膜获得的;
所述对象映射标志位,表示了运动对象的映射信息,即:从原始视频的某一帧映射到浓缩视频时的映射关系,对象映射标志位是通过编码视频浓缩时计算代价函数后的计算结果获得的。
2.如权利要求1所述支持视频可伸缩浏览的视频编解码方法,其特征在于,所述支持视频可伸缩浏览的视频编码方法在编码原始视频的同时进行视频分析和视频浓缩,在视频分析过程中提取了运动对象掩膜,在视频浓缩过程中计算了代价函数,然后生成了对象标志位。
3.如权利要求1所述支持视频可伸缩浏览的视频编解码方法,其特征在于,所述支持视频可伸缩浏览的视频解码方法在解码获得原始视频的同时也解码获得了对象标志位,并且能够根据用户的浏览需要,实时输入伸缩级数p,最终根据解码重建的原始视频、对象标志位和伸缩级数p,在解码端生成伸缩级数p下的浓缩视频,并通过调整伸缩级数p生成并浏览不同级数下浓缩视频,从而实现视频的可伸缩浏览。
4.如权利要求1所述支持视频可伸缩浏览的视频编解码方法,其特征在于,解码出的所述对象标志位中的对象映射标志位,通过伸缩级数p进行调整,并将调整后的对象映射标志位实时生成新的浓缩视频。
5.一种支持视频可伸缩浏览的视频编解码装置,其特征在于,包括编码装置和解码装置;
所述编码装置在编码原始视频的同时,编码通过视频分析和处理得到的与原始视频对应的对象标志位,使得解码装置能够根据对象标志位进行支持视频可伸缩浏览的视频解码;
所述解码装置同时解码出重建的原始视频和对象标志位,从而根据对象标志位,对运动对象显示的起止时间进行重新排列,实现视频的可伸缩播放;
所述编码装置包括:
视频编码单元,用于编码原始视频;
视频分析与浓缩单元,用于生成运动对象的掩膜信息和原始视频到浓缩视频的映射信息;
对象标志位单元,用于生成和编码对象标志位;
码流复合单元,通过合并原始视频的码流和运动对象的标志位码流为一路码流,实现支持视频可伸缩浏览的视频编码;
所述编码装置中的视频分析与浓缩单元包括:视频分析子单元和视频浓缩子单元;所述视频分析子单元,用于对原始视频进行视频分析,并输出运动对象的掩膜信息;所述视频浓缩子单元,用于对原始视频通过视频分析得到的运动对象序列,进行代价函数计算,并输出运动对象的映射信息;
所述对象标志位单元包括:对象区域标志位生成子单元、对象映射标志位生成子单元,对象标志位合成与编码子单元;所述对象区域标志位生成子单元,用于根据视频分析子单元获得的运动对象掩膜,生成表示运动对象区域的标志位;所述对象映射标志位生成子单元,用于根据视频浓缩子单元获得的映射信息,即:从原始视频的某一帧映射到浓缩视频时的映射关系,生成表示运动对象映射信息的标志位;所述对象标志位合成与编码子单元,用于合成并编码运动对象的区域标志位和运动对象的映射标志位,最终生成对象标志位。
6.如权利要求5所述支持视频可伸缩浏览的视频编解码装置,其特征在于,所述解码装置包括:
码流分解单元,用于将复合码流分解为原始视频码流和对象标志位码流;
视频解码单元,用于解码并重建原始视频;
对象标志位解码单元,用于解码对象标志位;
前景、背景生成单元,用于生成前景运动对象序列和主背景视频;
映射关系调整单元,用于根据用户输入到解码装置的伸缩级数p,调整运动对象从原始视频映射到浓缩视频的映射关系;
浓缩视频重建单元,用于根据伸缩级数p下的映射关系、在重建视频基础上获得的前景运动对象序列和主背景视频,生成伸缩技术p下的浓缩视频。
7.如权利要求5所述支持视频可伸缩浏览的视频编解码装置,其特征在于,所述解码装置中的对象标志位解码单元包括:对象标志位分解子单元、对象区域标志位解码子单元、对象映射标志位解码子单元;所述对象标志位分解子单元,用于将对象标志位分解为对象区域标志位和运动对象的映射标志位;所述对象区域标志位解码子单元,用于将对象区域标志位解码为运动对象的区域信息,从而可以对重接的原始视频进行前景和背景分离;所述对象映射标志位解码子单元,用于将对象映射标志位解码为运动对象的映射信息,从而可以获得初始化的映射关系;
所述前景、背景生成单元包括:前景、背景分离子单元、前景缓存子单元和主背景选择子单元;所述前景、背景分离子单元,用于根据运动对象的区域信息,分别提取出视频中的前景运动对象区域和背景区域;所述前景缓存子单元,用于缓存根据运动对象区域信息获得的前景运动对象序列;所述主背景选择子单元,用于根据视频中的背景区域生成主背景视频,所述主背景视频用于浓缩视频重建。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110346398 CN102395029B (zh) | 2011-11-05 | 2011-11-05 | 一种支持视频可伸缩浏览的视频编解码方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110346398 CN102395029B (zh) | 2011-11-05 | 2011-11-05 | 一种支持视频可伸缩浏览的视频编解码方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102395029A CN102395029A (zh) | 2012-03-28 |
CN102395029B true CN102395029B (zh) | 2013-09-18 |
Family
ID=45862227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110346398 Active CN102395029B (zh) | 2011-11-05 | 2011-11-05 | 一种支持视频可伸缩浏览的视频编解码方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102395029B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678299B (zh) * | 2012-08-30 | 2018-03-23 | 中兴通讯股份有限公司 | 一种监控视频摘要的方法及装置 |
CN103152570B (zh) * | 2013-03-01 | 2016-02-24 | 北京大学 | 一种视频位流解码方法和装置 |
CN103605652B (zh) * | 2013-08-30 | 2017-11-07 | 北京桓润世嘉科技有限公司 | 基于对象标志位的视频检索和浏览的方法和装置 |
CN103826125B (zh) * | 2014-01-20 | 2017-10-27 | 北京创鑫汇智科技发展有限责任公司 | 用于已压缩监控视频的浓缩分析方法和装置 |
CN103763562B (zh) * | 2014-01-22 | 2016-11-16 | 复旦大学 | 一种基于线裁剪的视频浓缩方法 |
CN103813169B (zh) * | 2014-02-19 | 2017-07-21 | 北京大学 | 视频编解码器中可伸缩的对象表示方法和装置 |
CN103873864A (zh) * | 2014-03-31 | 2014-06-18 | 江南大学 | 一种应用于视频对象检索的对象标志位高效编码方法 |
CN104168482B (zh) * | 2014-06-27 | 2018-12-21 | 中安消技术有限公司 | 一种视频编解码方法及装置 |
CN105306945B (zh) * | 2014-07-10 | 2019-03-01 | 北京创鑫汇智科技发展有限责任公司 | 一种监控视频的可伸缩浓缩编码方法和装置 |
CN104394488B (zh) * | 2014-11-28 | 2018-08-17 | 苏州科达科技股份有限公司 | 一种视频摘要的生成方法及系统 |
CN105898313A (zh) * | 2014-12-15 | 2016-08-24 | 江南大学 | 一种新的基于视频大纲的监控视频可伸缩编码技术 |
CN104967855B (zh) * | 2015-06-25 | 2018-01-16 | 华侨大学 | 一种适用于监控视频的编码方法 |
CN105163093B (zh) * | 2015-10-08 | 2018-01-12 | 北京理工大学 | 一种面向avs监控档的压缩域视频摘要提取方法及装置 |
CN110545446B (zh) * | 2018-05-28 | 2022-01-18 | 深信服科技股份有限公司 | 一种桌面图像编码、解码方法、相关装置及存储介质 |
CN113473142B (zh) * | 2021-09-03 | 2022-10-04 | 浙江智慧视频安防创新中心有限公司 | 视频编码、视频解码方法及装置、电子设备、存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102081671A (zh) * | 2011-01-25 | 2011-06-01 | 北京中星微电子有限公司 | 一种视频可伸缩文件的生成方法及装置 |
-
2011
- 2011-11-05 CN CN 201110346398 patent/CN102395029B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102081671A (zh) * | 2011-01-25 | 2011-06-01 | 北京中星微电子有限公司 | 一种视频可伸缩文件的生成方法及装置 |
Non-Patent Citations (6)
Title |
---|
Alex Rav-Acha,et al..Making a Long Video Short:Dynamic Video Synopsis.《Proceedings of 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition(CVPR"06)》.2006,全文. |
Making a Long Video Short:Dynamic Video Synopsis;Alex Rav-Acha,et al.;《Proceedings of 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition(CVPR"06)》;20061231;全文 * |
Online Principal Background Selection for Video Synopsis;Shikun Feng,et al.;《2010 International Conference on Pattern Recognition》;20101231;全文 * |
Shikun Feng,et al..Online Principal Background Selection for Video Synopsis.《2010 International Conference on Pattern Recognition》.2010,全文. |
Webcam Synopsis:Peeking Around the World;Yael Pritch,et al.;《Computer Vision,2007.ICCV 2007》;20071231;全文 * |
Yael Pritch,et al..Webcam Synopsis:Peeking Around the World.《Computer Vision,2007.ICCV 2007》.2007,全文. |
Also Published As
Publication number | Publication date |
---|---|
CN102395029A (zh) | 2012-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102395029B (zh) | 一种支持视频可伸缩浏览的视频编解码方法和装置 | |
Duan et al. | Video coding for machines: A paradigm of collaborative compression and intelligent analytics | |
CN100514992C (zh) | 一种移动终端帧动画的处理方法 | |
KR100746006B1 (ko) | 계층적 구조에 적합하게 시간적 다이렉트 모드로인코딩하며, 디코딩하는 방법 및 장치 | |
CN105306945B (zh) | 一种监控视频的可伸缩浓缩编码方法和装置 | |
CN102055982A (zh) | 三维视频编解码方法及装置 | |
CN103402087A (zh) | 一种基于可分级位流的视频编解码方法 | |
CN107113422A (zh) | 用于视频编码和解码的灵活的参考图片管理 | |
CN103141092B (zh) | 针对视频压缩使用运动补偿的基于示例的超分辨率来编码视频信号的方法和设备 | |
CN103703779A (zh) | 使用次分辨率图像的图像压缩 | |
CN110290386B (zh) | 一种基于生成对抗网络的低码率人体运动视频编码系统及方法 | |
WO2016095696A1 (zh) | 一种基于视频大纲的监控视频可伸缩编码方法 | |
CN101924943B (zh) | 一种实时的基于h.264的低比特率视频转码方法 | |
US20130039594A1 (en) | Method and device for encoding data for rendering at least one image using computer graphics and corresponding method and device for decoding | |
CN107005710A (zh) | 多视点图像编码/解码方法和装置 | |
CN101883284A (zh) | 基于背景建模和可选差分模式的视频编/解码方法及系统 | |
Chen et al. | Transtic: Transferring transformer-based image compression from human perception to machine perception | |
CN104967855B (zh) | 一种适用于监控视频的编码方法 | |
CN107005705A (zh) | 使用层间预测对多层图像进行编码或解码的方法和装置 | |
Cui et al. | OctFormer: Efficient octree-based transformer for point cloud compression with local enhancement | |
Huang et al. | Flow-distilled IP two-stream networks for compressed video action recognition | |
CN107079159A (zh) | 基于多核系统的并行视频解码的方法和设备 | |
Du et al. | Optical Flow-based Spatiotemporal Sketch for Video Representation: A Novel Framework | |
CN113068041A (zh) | 一种智能仿射运动补偿编码方法 | |
CN115278226B (zh) | 一种基于3d点云的实时压缩与远程监控方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230718 Address after: 214135 Building C, Weina Sensor Network International Innovation Park, No. 200, Linghu Avenue, the Taihu Lake International Science Park, Wuxi New District, Jiangsu Province Patentee after: JIANGSU CAS INTERNET-OF-THINGS TECHNOLOGY VENTURE CAPITAL CO.,LTD. Address before: 4 / F, block C, China Sensor Network International Innovation Park, 200 Linghu Avenue, New District, Wuxi City, Jiangsu Province, 214135 Patentee before: JIANGSU R & D CENTER FOR INTERNET OF THINGS |
|
TR01 | Transfer of patent right |