CN102006475B - 一种视频编解码装置和方法 - Google Patents

一种视频编解码装置和方法 Download PDF

Info

Publication number
CN102006475B
CN102006475B CN 201010553038 CN201010553038A CN102006475B CN 102006475 B CN102006475 B CN 102006475B CN 201010553038 CN201010553038 CN 201010553038 CN 201010553038 A CN201010553038 A CN 201010553038A CN 102006475 B CN102006475 B CN 102006475B
Authority
CN
China
Prior art keywords
background
image
macro block
video
foreground
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 201010553038
Other languages
English (en)
Other versions
CN102006475A (zh
Inventor
邓亚峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vimicro Qingdao Corp
Original Assignee
Wuxi Vimicro Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Vimicro Corp filed Critical Wuxi Vimicro Corp
Priority to CN 201010553038 priority Critical patent/CN102006475B/zh
Publication of CN102006475A publication Critical patent/CN102006475A/zh
Application granted granted Critical
Publication of CN102006475B publication Critical patent/CN102006475B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提供一种视频编解码装置,其包括视频编码器和视频解码器,所述视频编码器将视频图像分割出前景图像,对所述前景图像进行编码,且在背景进行更新时,建立背景模型并进行编码以用于传输;所述视频解码器接收码流后解析出背景码流和前景码流,并将所述背景码流和前景码流分别进行解码已得到背景图像和前景图像,最后将解码后的背景图像和前景图像进行合成以得到原始视频图像。

Description

一种视频编解码装置和方法
【技术领域】
本发明涉及视频压缩领域,特别是涉及一种视频编解码装置和方法。
【背景技术】
随着多媒体的应用越来越广泛,视频技术也应用在越来越多的领域,如视频会议、视频监控等。由于视频的数据量非常大,在传输过程中会占用过多的宽带资源,且产生很大的时延。因此,提出了视频的编码压缩技术以克服视频数据量占用宽带资源以及时延的问题。
视频编码和传输技术发展到今天,已经存在很多的编码方式和标准。但是,还没有一种编码方式和标准是针对静止摄像头而设计的。在实际应用中,很多视频采集传输系统中,摄像头都是静止的。比如,视频会议和视频监控等。特别是视频监控,近年来,视频监控取得了长足发展,摄像头的布设量急剧增加。摄像头数目的增加,带来了一个重要的问题,那就是视频的传输和存储。采用传统的编码方式,为了达到很低的码率,图像质量往往被压缩的无法忍受,同时,码率并没有真正降低,造成资源的浪费。同时,在视频中,往往重要的目标是限定的,现有方法也没有能对图像区域进行区分,将更高的码率分配给更重要的目标。
因此有必要提出一种新的技术方案来解决上述问题。
【发明内容】
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
本发明的目的在于提供一种视频编解码装置和方法,其在编码端将视频图像的背景和前景分开,在背景不变的情况下,只传输一次背景,能大大降低视频传输时对宽带的占用率,而解码端对应的利用基于blending的方法对前景和背景进行融合叠加,很好的还原了原有的视频图像。
根据本发明的一方面,本发明提供一种视频编解码装置,其包括:视频编码器,其包括视频输入模块、背景更新模块、背景建模模块、背景编码模块、前景分割模块、前景编码模块和传输模块,其中所述视频输入模块用于输入视频图像;所述背景更新模块在所述视频图像中的背景变化时更新视频图像中的背景;所述背景建模模块根据更新的所述视频图像中的背景建立背景模型;所述背景编码模块对所述背景模型进行编码以获取背景码流;所述前景分割模块根据输入的视频图像以及所述背景模型分割出所述视频图像中的前景区域;所述前景编码模块对得到的前景区域进行编码以获取前景码流;所述传输模块,分别传输所述背景码流和前景码流;视频解码器, 其包括解析器模块、背景解码模块、前景解码模块和视频合成模块,其中所述解析器模块对接收到的码流进行解析,并将解析后的背景码流和前景码流分开;所述背景解码模块如果接收到解析后的背景码流则对其进行解码以更新背景图像,否则不做处理;所述前景解码模块从解析后的前景码流中得到前景区域数目,并获取各前景区域的外接矩形的坐标、宏块编码信息以及宏块有效标志信息;所述视频合成模块将获取的前景图像和背景图像合成以获取原始视频图像。
进一步的,所述时编解码器中的传输模块包括背景图像传输模块和前景图像传输模块,所背景述图像传输模块用于传输编码后的背景码流,所述前景图像传输模块用于传输编码后的前景码流。
进一步的,所述前景分割模块利用基于最大流分割方法的方法以分割出前景区域,其包括:获取系列背景图像中每个背景像素的颜色分量的高斯模型;对视频图像中的像素和背景图像进行像素差值,对所述差值大于阈值的像素则作为前景像素;获取所述前景像素的颜色分量的混合高斯模型;采用背景的所述高斯模型和前景的所述混合高斯模型计算视频图像中所有像素属于前景或背景的概率,归一化后得到该像素对应节点在图中分别与前景和背景节点的连接能量;对所述视频图像分别求其相邻像素间的水平边缘强度和垂直边缘强度;根据每个像素和相邻像素的水平边缘强度和垂直边缘强度得到在视频图像中所述像素与相邻像素间的连接能量;根据得到的所有节点间的连接能量,采用最大流分割方法进行最小分割,得到所述视频图像中的前景和背景像素。
进一步的,所述前景编码模块对前景区域内的有效宏块以及相同前景区域的二进制掩模进行编码以组成前景码流,其中所述二进制掩模用于标识视频图像中哪些位置属于前景区域,掩模上每个属于前景的像素被标记为1,否则标记为0;所述前景区域内的有效宏块获取方法为:根据前景区域的二进制掩模获取其最小外接矩形,将所述外接矩形内图像区域分为正方形的宏块,如果宏块中包含前景像素则判定该宏块为有效宏块,需要编码,否则判定为无效宏块,不进行编码。
进一步的,所述前景编码模块对前景区域内的有效宏块进行编码包括:对第一帧出现的有效前景宏块,按照宏块的顺序依次处理,对所述宏块进行离散余弦变换,并对离散余弦变换系数进行量化,采用差分编码方式对离散余弦变换系数进行预测,进而进行熵编码;对后续出现的各帧,判定前景区域内各宏块是否有效,对有效宏块按照顺序进行下述处理:对当前宏块,在前一帧图像的搜索范围内寻找与其最匹配的有效前景宏块,对前一帧图像中的所述最匹配的有效前景宏块与所述当前宏块做差,对得到的差值进行离散余弦变换,将其离散余弦变换系数量化后进行熵编码。
更进一步的,所述前景编码模块对前景区域的二进制掩模进行编码包括:记录图像中前景区域数目及各前景区域的外接矩形范围,还要记录外接矩形范围内的图像区域中各个宏块是否有效,如有有效则该位置标志为1,否则标志为0,将各个宏块的标志采用熵编码方式进行编码,并与宏块编码结果组成码流传输。
进一步的,所述视频合成模块获取当前图像的背景图像,根据各个前景区域的外接矩形坐标定位到前景区域的左上角,按照和编码相同的顺序,判断外接矩形中宏块对应的前景宏块是否为有效宏块,如果为无效宏块则跳到下一宏块进行处理,否则读取有效宏块的编码信息,解码后得到离散余弦变换系数,恢复残差图像,从前一帧图像中找到其匹配宏块,恢复当前宏块图像,就爱你过当前宏块图像覆盖到当前图像上的对应位置;或将有效宏块叠加到背景图像上。
根据本发明的另一方面,本发明还提供一种视频编解码方法,其包括:输入视频图像;在所述视频图像的背景变化时更新背景,对所述更新的背景建立背景模型并对所述背景模型进行编码以得到背景码流;根据所述视频图像以及所述背景模型分割出所述视频图像中的前景区域并对所述前景区域进行编码以得到前景码流;分别传输所述背景码流和前景码流;接收所述背景码流和前景码流并进行解析,且将解析后的背景码流和前景码流分开;如果接收到解析后的背景码流则对其进行解码以更新背景图像,否则不做处理;从解析后的前景码流中得到前景区域特征;根据所述前景区域特征获取前景区域当前宏块并将所述当前宏块覆盖到所述背景图像上以得到原始视频图像。
进一步的,所述前景区域特征包括:前景区域数目、各前景区域的外接矩形的坐标、宏块编码信息以及宏块有效标志信息。
更进一步的,根据所述前景区域特征获取前景区域当前宏块并将所述当前宏块覆盖到所述背景图像上以得到原始视频图像包括:获取当前图像的背景图像,根据各个前景区域的外接矩形坐标定位到前景区域的左上角,按照和编码相同的顺序,判断外接矩形中宏块对应的前景宏块是否为有效宏块,如果为无效宏块则跳到下一宏块进行处理,否则读取有效宏块的编码信息,解码后得到离散余弦变换系数,恢复残差图像,从前一帧图像中找到其匹配宏块,恢复当前宏块图像,就爱你过当前宏块图像覆盖到当前图像上的对应位置;或将有效宏块叠加到背景图像上。
与现有技术相比,本发明中视频编码器对于摄像头静止场景的视频编码,采用前景分割算法从背景中分离前景,对不发生变化的背景仅传送一次,而对包含重要内容的前景区域进行编码传输。为了将前景和背景更干净的分割,所述视频编码器采用了基于最大流分割的方法,能够更精细的得到分割边缘。此外,为了更好的得到合成图像的质量,视频解码器采用基于blending的方法对前景和背景融合叠加。由于背景不变时不需要传输背景图像,从而在视频传输时大大降低了宽带占用率。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明中一种视频编解码装置在一个实施例中的结构示意图;
图2为本发明中一种视频编码器在一个实施例中的结构示意图;
图3为本发明在一个实施例中基于最大流分割的前景分割算法的流程图;
图4为本发明中一种视频编码方法在一个实施例中的流程图;
图5为本发明中一种视频解码器在一个实施例中的结构示意图;和
图6为本发明中一种视频解码方法在一个实施例中的流程图。
【具体实施方式】
本发明的详细描述主要通过程序、步骤、逻辑块、过程或其他象征性的描述来直接或间接地模拟本发明技术方案的运作。为透彻的理解本发明,在接下来的描述中陈述了很多特定细节。而在没有这些特定细节时,本发明则可能仍可实现。所属领域内的技术人员使用此处的这些描述和陈述向所属领域内的其他技术人员有效的介绍他们的工作本质。换句话说,为避免混淆本发明的目的,由于熟知的方法和程序已经容易理解,因此它们并未被详细描述。
此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。此外,表示一个或多个实施例的方法、流程图或功能框图中的模块顺序并非固定的指代任何特定顺序,也不构成对本发明的限制。
本发明提供一种视频编解码装置,其在编码端将视频图像分成背景和前景并分别进行编码传输,在解码端将接收到的码流分别解析并解码出前景图像和背景图像,并将其合成以还原出原有图像。所述视频编解码装置的具体结构可参见图1所示。
图1为本发明中一种视频编解码装置在一个实施例中的结构示意图,请参阅图1所示,所述视频编解码装置10包括视频编码器200和视频解码器500。
图2为本发明中视频编码器在一个实施例中的结构示意图。请参阅图2所示,所述视频编码器200包括视频输入模块210、背景更新模块220、背景建模模块230、背景编码模块240、前景分割模块250、前景编码模块260以及传输模块270。所述视频编码器200对于摄像头静止场景的视频编码,采用前景分割算法从背景中分离前景,对不发生变化的背景仅传送一次或数次,而对包含重要内容的前景区域图像进行编码传输。
所述视频输入模块210用于输入需要编码传输的视频图像,所述视频图像可以为单张也可以为多张连续的视频图像。
所述背景更新模块220在所述视频图像的背景变化时则更新视频图像中的背景。在实际应用中,在第一次输入视频图像时则将其初始背景作为第一次背景更新来处理,接下来检测视频图像背景是否发生了变化,若发生变化则更新一次视频图像的背景。
所述背景建模模块230对所述视频图像更新后的背景进行背景建模以得到背景模型。所述背景为视频图像中长期相对不动的部分,如在视频监控中,监控摄像头视野内的数、房屋、街道等长期相对不动的部分。对应的,在具体应用中,所述背景建模模块130在视频图像第一次输入时则对初始背景图像进行建模,而在背景更新后则对更新后的背景进行建模。
所述背景编码模块240对所述背景模型进行编码。
在一个实施例中,对于需要传输的一系列背景图像,可以采用I帧P帧方式对背景图像进行编码。首先,获取的第一帧图像中的背景图像被当做I帧编码后进行传输,而后续得到的背景被当做P帧进行处理传输,在I帧中相应搜索范围内找到与之时间相邻的后续帧(即后续的P帧)中各宏块最匹配的宏块,然后将I帧中的各宏块与后续P帧中对应的各宏块的位置做差以得到一组差值向量,对所述差值向量均进行DCT(Discrete Cosine Transform,即离散余弦变换)变换,并对其量化后按照原来宏块的顺序组成一个向量组,所述向量组经过熵编码后进行传输。一般的,由于背景变化很小,所以上述P帧的码流很低,由于摄像机静止情况下,通常背景图像稳定不变,上述确定匹配宏块的方法可以直接在I帧中选用对应位置的宏块以作为P帧的宏块即可。
当然,上述仅仅讲述了一种背景编码的方法,所述背景编码模块240还可以通过其他的方法对背景图像进行编码,其具体实现可以通过软件、硬件或软硬件结合的方式实现对背景模型的编码,其中所述DCT变换以及熵编码的实现方法均属于所属领域的普通技术人员都能够实现的,且不作为本发明的重要技术方案,所以就不再一一详述了。
所述前景分割模块250根据输入的视频图像以及所述背景模型分割出所述视频图像中的前景区域。所述前景为图像中的活动目标,即图像中的运动目标,是视频中相对于背景更加重要的部分。
由于相对于前景的信息比较重要,所以可以采用质量更高的编码方式来对所述前景进行编码,而背景由于很长时间处于不变的状态,在不变的时候只需要传输一次背景即可,所以本发明选择将前景与背景分开编码和传输。
所述前景分割模块250为了更好地将前景从背景中分割出来,减少前景和背景边缘处的不平滑,前景分割模块250的方法有很多,现有的提取前景的方法比如背景差法、混合高斯模型方法以及核密度估计方法。但是,所述方法没有利用图像的区域信息,从而使得对前景与背景的交界区域的边缘分割的效果很差。这里可以采用一个更好的方法,即基于最大流分割(graph-cut)的方法。
在一个实施例中,利用最大流分割的方法对图像进行前景分割。其具体可参见图3所示,图3为本发明在一个实施例中基于最大流分割的前景分割算法的流程图。所述基于最大流分割的前景分割算法包括:
步骤300,输入视频图像;
步骤310,在所述视频图像中提取背景图像;
步骤320,获取所述背景图像中每个背景像素的颜色分量的高斯模型;
步骤330,对前景像素进行标识,具体为:对所述背景图像和视频图像中的前景图像进行像素差值(包括灰度差或颜色差),当所述差值大于阈值时则得到不同于背景的像素标识(如背景像素标识为0时,所述差值大于阈值的像素标识记为1),并认定这些像素绝大部分为前景像素;
步骤340,获取所述标识为前景的像素的颜色分量的混合高斯模型;
步骤350,对所述视频图像中的所有像素,采用所述背景高斯模型和前景混合高斯模型以得到其属于前景和背景的概率,经归一化后分别得到该像素对应节点在图中与前景和背景节点连接的能量,记为能量项1,由此可知,所述能量项1可以理解为每个像素属于前景还是属于背景的概率;
步骤360,获取所述视频图像中相邻像素间的垂直边缘强度;
步骤370,获取所述视频图像中相邻像素间的水平边缘强度;
步骤380,对所述视频图像中所有像素,根据其和相邻像素的所述水平边缘强度和垂直边缘强度得到视频图像中其与相邻像素间的连接能量,即为能量项2;
步骤390,根据得到的所有节点间的连接能量(包括所述能量项1和能量项2),采用最大流分割方法进行最小分割,得到输入图像中的前景和背景像素。
需要指出的是,当视频图像中的背景更新时需要对背景进行更新以保证步骤310获取的背景图像为最新图像。
该方法不仅仅利用了前景和背景之间的差来分割前景,而且,还利用了前景和背景区域的颜色模型,以及图像上前景和背景的边缘信息,因而能够得到更好的分割效果。且根据上述方法可以将前景图像中的所有像素标记为相同的数字,如1,而将背景图像中的所有像素标记为相同的数字,如0,这样便得到了一个可识别前景图像区域的二进制掩模。也就是说,所述二进制掩模和图像大小相同,每个像素位置的二进制值标识了该图像中像素是否属于前景,如果像素属于前景,则掩模上对应该像素的值则为1,否则为0。
所述前景编码模块260将所述前景分割出的前景进行编码以用于传输。为了将前景区域进行高质量的编码,本发明对前景区域内的有效宏块以及相同前景区域的二进制掩模进行编码以组成前景码流。
其所述前景区域的有效宏块获取方法具体为:将前景区域的二进制掩模获取其最小外接矩形,将所述最小外接矩形内图像区域分为大小固定的宏块,如果宏块中包含了前景像素,则认为该宏块有效,需要编码,否则认为该宏块中的像素为背景像素,无效,不进行编码;将上述需要编码的宏块按照顺序组成一个宏块向量,可以采用zig-zag扫描的方法确定顺序。
所述宏块可以为N×N的正方形,如可以设定为8×8或16×16的宏块,所述宏块大小的设定是为了后续DCT编码的方便。
在一个实施例中,所述前景编码模块对前景区域内的有效宏块进行编码的方法包括:对第一帧出现的有效前景宏块,按照宏块的顺序依次处理,对所述宏块进行DCT变换,并对DCT系数进行量化,采用差分编码方式对DCT系数进行预测,进而进行熵编码;对后续出现的各帧,判定前景区域内各宏块是否有效,对有效宏块按照顺序进行下述处理:对当前宏块,在前一帧图像的搜索范围内寻找与其最匹配的有效前景宏块,对前一帧图像中的所述最匹配的有效前景宏块与所述当前宏块做差,对得到的差值进行DCT变换,将其DCT系数量化后进行熵编码。
所述前景编码模块对前景区域的二进制掩模进行编码的方法包括:记录图像中前景区域数目及各前景区域的外接矩形范围,还要记录外接矩形范围内的图像区域中各个宏块是否有效,如有有效则该位置标志为1,否则标志为0,将各个宏块的标志采用熵编码方式进行编码。
所述前景编码模块260将所述前景区域内有效宏块的编码结果和对应的二进制掩模上标志的数据组成码流以用于传输。
这样,避免了在每次视频图像的前景发生变化而背景没发生变化时对背景区域的传输,同时,对于前景区域,也利用帧间信息将冗余信息排除,降低了码率。
所述传输模块270对所述背景编码模块240得到的编码后的背景图像和前景编码模块260得到的前景区域的图像进行传输。所述传输模块270包括背景图像传输模块2701和前景图像传输模块2702,其中所述背景图像传输模块2701对背景编码模块240得到的编码后的背景码流进行传输,所述前景图像传输模块2702对前景编码模块260得到的编码后的前景码流进行传输。
在实际应用中,所述背景图像传输模块2701和前景图像传输模块2702对背景码流和前景码流分别传输。由于背景图像在长期内不变的情况下,所述背景图像传输模块2701在此时间段内只传输一次背景码流。
综上所述,本发明中的视频编码器将背景和前景分开,且利用基于最大流分割方法提高了前景和背景交界区域的边缘分割效果,并对前景进行更高质量的编码,而对背景不变时近传输一次背景,从而提高了视频的压缩质量,且大大地降低了传输的视频对宽带的占用率。
图4为本发明中一种视频编码方法在一个实施例中的流程图,请参阅图4所示,所述视频编码方法包括:
步骤410,输入视频图像,所述视频图像可以为单张也可以为多张连续的视频图像。
步骤420,根据所述视频图像建立背景模型,当所述视频图像中的背景发生变化时,则更新背景模型。
步骤430,根据视频图像和背景模型分割前景图像。
为了更好地将前景从背景中分割出来,减少前景和背景边缘处的不平滑,对图像的前景分割的方法有很多,现有的提取前景的方法比如背景差法、混合高斯模型方法以及核密度估计方法。但是,所述方法没有利用图像的区域信息,从而使得对前景与背景的交界区域的边缘分割的效果很差。这里可以采用一个更好的方法,即基于最大流分割(graph-cut)的方法。所述最大流分割的方法具体可以参见图3所示,其内容已在上述部分进行了详细描述,所以这里就不再描述了。
步骤440,分别对背景模型和前景图像进行编码。
在一个实施例中,对背景模型进行编码时,对于需要传输的一系列背景图像,可以采用I帧P帧方式对背景图像进行编码。首先,获取的第一帧图像中的背景图像被当做I帧编码后进行传输,而后续得到的背景被当做P帧进行处理传输,在I帧中相应搜索范围内找到与之时间相邻的后续帧(即后续的P帧)中各宏块最匹配的宏块,然后将I帧中的各宏块与后续P帧中对应的各宏块的位置做差以得到一组差值向量,对所述差值向量均进行DCT(Discrete Cosine Transform,即离散余弦变换)变换,并对其量化后按照原来宏块的顺序组成一个向量组,所述向量组经过熵编码后进行传输。一般的,由于背景变化很小,所以上述P帧的码流很低,由于摄像机静止情况下,通常背景图像稳定不变,上述确定匹配宏块的方法可以直接在I帧中选用对应位置的宏块以作为P帧的宏块即可。
上述过程可以通过软件、硬件或软硬件结合的方式实现对背景模型的编码,其中所述DCT变换以及熵编码的实现方法均属于所属领域的普通技术人员都能够实现的,且不作为本发明的重要技术方案,所以就不再一一详述了。
在另一个实施例中,对前景区域进行编码时,为了将前景区域进行高质量的编码,本发明对前景区域内的有效宏块以及相同前景区域的二进制掩模进行编码以组成前景码流。
其所述前景区域的有效宏块获取方法具体为:将前景区域的二进制掩模获取其最小外接矩形,将所述最小外接矩形内图像区域分为大小固定的宏块,如果宏块中包含了前景像素,则认为该宏块有效,需要编码,否则认为该宏块中的像素为背景像素,无效,不进行编码;将上述需要编码的宏块按照顺序组成一个宏块向量,可以采用zig-zag扫描的方法确定顺序。
所述宏块可以为N×N的正方形,如可以设定为8×8或16×16的宏块,所述宏块大小的设定是为了后续DCT编码的方便。
在一个实施例中,所述前景编码模块对前景区域内的有效宏块进行编码的方法包括:对第一帧出现的有效前景宏块,按照宏块的顺序依次处理,对所述宏块进行DCT变换,并对DCT系数进行量化,采用差分编码方式对DCT系数进行预测,进而进行熵编码;对后续出现的各帧,判定前景区域内各宏块是否有效,对有效宏块按照顺序进行下述处理:对当前宏块,在前一帧图像的搜索范围内寻找与其最匹配的有效前景宏块,对前一帧图像中的所述最匹配的有效前景宏块与所述当前宏块做差,对得到的差值进行DCT变换,将其DCT系数量化后进行熵编码。
所述前景编码模块对前景区域的二进制掩模进行编码的方法包括:记录图像中前景区域数目及各前景区域的外接矩形范围,还要记录外接矩形范围内的图像区域中各个宏块是否有效,如有有效则该位置标志为1,否则标志为0,将各个宏块的标志采用熵编码方式进行编码。
最后将所述前景区域内有效宏块的编码结果和对应的二进制掩模上标志的数据组成码流以用于传输。
这样,避免了在每次视频图像的前景发生变化而背景没发生变化时对背景区域的传输,同时,对于前景区域,也利用帧间信息将冗余信息排除,降低了码率。
步骤450,分别传输编码后的背景码流和前景码流。
本发明还提供一种视频解码器,其将接搜到的码流解析成背景码流和前景码流,并分别将其进行解码并还原成原始图像。其具体可参见图5所示。
图5为本发明中一种视频解码器在一个实施例中的结构示意图。所述视频解码器500包括解析模块510、背景解码模块520、前景解码模块530以及视频合成模块540。
所述解析模块510对接收到的码流进行解析并将解析后的码流分成背景码流和前景码流。
所述背景解码模块520如果接收到解析后的背景码流则对其进行解码以更新背景图像,如果没有接收到解析后的背景码流则不做处理。
在一个实施例中,当接收到I帧数据时,所述背景解码模块520则采用I帧的解码器对其进行解码,并记录下来。如果接收到的是P帧数据,则恢复其DCT系数对应的残差图像,并从I帧中获取匹配宏块图像,还原原视频图像。
所述前景解码模块530对接收到的解析后的前景码流进行解码。
具体的,所述前景解码模块530从解析后的前景码流中得到前景区域数目,并获取各前景区域的外接矩形的坐标、宏块编码信息以及宏块有效标志信息。从宏块编码信息中分别恢复出各个宏块的信息。将上述前景区域数目、前景区域外接矩形坐标、前景区域宏块编码信息、前景区域宏块有效性标志以及背景图像传送给视频合成模块540。
所述视频合成模块540将解码后的背景图像和前景图像进行合成以得到原始的图像。
在实际应用中,其合成具体为:建立当前图像为背景图像;视频合成模块540对存在的前景区域分别进行处理:根据外接矩形坐标定位到前景区域左上角,按照和编码相同的顺序,对外接矩形中的宏块分别进行下述处理:获取当前宏块对应的前景宏块是否有效标志,如果宏块无效,则跳到处理下一个宏块,否则读取有效宏块的编码信息,解码得到DCT系数,恢复残差图像,从前帧图像中找到其匹配宏块,恢复当前宏块图像;将当前宏块图像覆盖到当前图像上的对应位置。
一种更佳的方法是采用blending的方法,将有效宏块叠加到背景图像上去。从而使得获得的图像更加真实自然,不会在前景和背景交界处留下痕迹。
在与视频编码器进行匹配时,采用视频解码器恢复图像以作为匹配宏块图像,而不是采用上帧图像,从而提高编码性能。
综上所述,本发明利用对应的合成算法将前景和背景图像进行合成或利用blending方法将前景叠加到图像上,从而避免了前景和背景交界处留下痕迹。
图6为本发明中一种视频解码的方法在一个实施例中的流程图,请参阅图5所示,所述视频解码包括:
步骤610,对接收到的码流进行解析以生成背景码流和前景码流。
步骤620,分别对背景码流和前景码流进行解码。
在具体应用中,如果接收到解析后的背景码流则对其进行解码以更新背景图像,如果没有接收到解析后的背景码流则不做处理。在一个实施例中,当接收到I帧数据时,则采用I帧的解码器对其进行解码,并记录下来。如果接收到的是P帧数据,则恢复其DCT系数对应的残差图像,并从I帧中获取匹配宏块图像,还原原图像。
在另一个实施例中,从解析后的前景码流中得到前景特征,所述前景特征包括前景区域数目、各前景区域的外接矩形的坐标、宏块编码信息以及宏块有效标志信息。从宏块编码信息中分别恢复出各个宏块的信息。将上述前景区域数目、前景区域外接矩形坐标、前景区域宏块编码信息、前景区域宏块有效性标志以及背景图像传送给视频合成模块。
步骤630,将解码后的背景图像和前景图像进行合成。
在实际应用中,其合成具体为:建立当前图像为背景图像;对存在的前景区域分别进行处理:根据外接矩形坐标定位到前景区域左上角,按照和编码相同的顺序,对外接矩形中的宏块分别进行下述处理:获取当前宏块对应的前景宏块是否有效标志,如果宏块无效,则跳到处理下一个宏块,否则读取有效宏块的编码信息,解码得到DCT系数,恢复残差图像,从前帧图像中找到其匹配宏块,恢复当前宏块图像;将当前宏块图像覆盖到当前图像上的对应位置。
一种更佳的方法是采用blending的方法,将有效宏块叠加到背景图像上去。从而使得获得的图像更加真实自然,不会在前景和背景交界处留下痕迹。
综上所述,本发明利用对应的合成算法将前景和背景图像进行合成或利用blending方法将前景叠加到图像上,从而避免了前景和背景交界处留下痕迹。
综上所述,本发明在视频编码端通过视频编码器将背景和前景分开,且利用基于最大流分割方法提高了前景和背景交界区域的边缘分割效果,并对前景进行更高质量的编码,而对背景不变时近传输一次背景,从而提高了视频的压缩质量,且大大地降低了传输的视频对宽带的占用率;在解码端利用对应的合成算法将前景和背景图像进行合成或利用blending方法将前景叠加到图像上,从而避免了前景和背景交界处留下痕迹。
上述说明已经充分揭露了本发明的具体实施方式。需要指出的是,熟悉该领域的技术人员对本发明的具体实施方式所做的任何改动均不脱离本发明的权利要求书的范围。相应地,本发明的权利要求的范围也并不仅仅局限于前述具体实施方式。

Claims (10)

1.一种视频编解码装置,其特征在于,其包括:
视频编码器,其包括视频输入模块、背景更新模块、背景建模模块、背景编码模块、前景分割模块、前景编码模块和传输模块,其中所述视频输入模块用于输入视频图像;所述背景更新模块在所述视频图像中的背景变化时更新视频图像中的背景;所述背景建模模块根据更新的所述视频图像中的背景建立背景模型;所述背景编码模块对所述背景模型进行编码以获取背景码流;所述前景分割模块根据输入的视频图像以及所述背景模型分割出所述视频图像中的前景区域;所述前景编码模块对得到的前景区域进行编码以获取前景码流;所述传输模块,分别传输所述背景码流和前景码流;和
视频解码器,其包括解析器模块、背景解码模块、前景解码模块和视频合成模块,其中所述解析器模块对接收到的码流进行解析,并将解析后的背景码流和前景码流分开;所述背景解码模块如果接收到解析后的背景码流则对其进行解码以更新背景图像,否则不做处理;所述前景解码模块从解析后的前景码流中得到前景区域数目,并获取各前景区域的外接矩形的坐标、宏块编码信息以及宏块有效标志信息;所述视频合成模块将获取的前景图像和背景图像合成以获取原始视频图像,
所述宏块有效标志信息是,如果宏块中包含了前景像素,则认为该宏块有效,需要编码,否则认为该宏块中的像素为背景像素,该宏块无效,不进行编码。
2.根据权利要求1所述的视频编解码装置,其特征在于:所述视频编码器中的传输模块包括背景图像传输模块和前景图像传输模块,所述背景图像传输模块用于传输编码后的背景码流,所述前景图像传输模块用于传输编码后的前景码流。
3.根据权利要求1所述的视频编解码装置,其特征在于:所述前景分割模块利用基于最大流分割方法的方法以分割出前景区域,其包括:
获取系列背景图像中每个背景像素的颜色分量的高斯模型;
对视频图像中的像素和背景图像进行像素差值,对所述差值大于阈值的像素则作为前景像素;
获取所述前景像素的颜色分量的混合高斯模型;
采用背景的所述高斯模型和前景的所述混合高斯模型计算视频图像中所有像素属于前景或背景的概率,归一化后得到该像素对应节点在图中分别与前景和背景节点的连接能量;
对所述视频图像分别求其相邻像素间的水平边缘强度和垂直边缘强度;
根据每个像素和相邻像素的水平边缘强度和垂直边缘强度得到在视频图像中所述像素与相邻像素间的连接能量;和
根据得到的所有节点间的连接能量,采用最大流分割方法进行最小分割,得到所述视频图像中的前景和背景像素。
4.根据权利要求1所述的视频编解码装置,其特征在于:所述前景编码模块对前景区域内的有效宏块以及相同前景区域的二进制掩模进行编码以组成前景码流,其中所述二进制掩模用于标识视频图像中哪些位置属于前景区域,掩模上每个属于前景的像素被标记为1,否则标记为0;所述前景区域内的有效宏块获取方法为:根据前景区域的二进制掩模获取其最小外接矩形,将所述外接矩形内图像区域分为正方形的宏块,如果宏块中包含前景像素则判定该宏块为有效宏块,需要编码,否则判定为无效宏块,不进行编码。
5.根据权利要求4所述的视频编解码装置,其特征在于:所述前景编码模块对前景区域内的有效宏块进行编码的方法包括:
对第一帧出现的有效前景宏块,按照宏块的顺序依次处理,对所述宏块进行离散余弦变换,并对离散余弦变换系数进行量化,采用差分编码方式对离散余弦变换系数进行预测,进而进行熵编码;
对后续出现的各帧,判定前景区域内各宏块是否有效,对有效宏块按照顺序进行下述处理:对当前宏块,在前一帧图像的搜索范围内寻找与其最匹配的有效前景宏块,对前一帧图像中的所述最匹配的有效前景宏块与所述当前宏块做差,对得到的差值进行离散余弦变换,将其离散余弦变换系数量化后进行熵编码。
6.根据权利要求5所述的视频编解码装置,其特征在于:所述前景编码模块对前景区域的二进制掩模进行编码的方法包括:
记录图像中前景区域数目及各前景区域的外接矩形范围,还要记录外接矩形范围内的图像区域中各个宏块是否有效,如有有效则该位置标志为1,否则标志为0,将各个宏块的标志采用熵编码方式进行编码,并与宏块编码结果组成码流传输。
7.根据权利要求1所述的视频编解码装置,其特征在于:所述视频合成模块获取当前图像的背景图像,根据各个前景区域的外接矩形坐标定位到前景区域的左上角,按照和编码相同的顺序,判断外接矩形中宏块对应的前景宏块是否为有效宏块,如果为无效宏块则跳到下一宏块进行处理,否则读取有效宏块的编码信息,解码后得到离散余弦变换系数,恢复残差图像,从前一帧图像中找到其匹配宏块,恢复当前宏块图像,就将当前宏块图像覆盖到当前图像上的对应位置;或将有效宏块叠加到背景图像上。
8.一种视频编解码方法,其特征在于,其包括:
输入视频图像;
在所述视频图像的背景变化时更新其背景;
对所述更新的背景建立背景模型并对所述背景模型进行编码以得到背景码流;
根据所述视频图像以及所述背景模型分割出所述视频图像中的前景区域并对所述前景区域进行编码以得到前景码流;
分别传输所述背景码流和前景码流;
接收所述背景码流和前景码流并进行解析,且将解析后的背景码流和前景码流分开;
如果接收到解析后的背景码流则对其进行解码以更新背景图像,否则不做处理;
从解析后的前景码流中得到前景区域特征;和
根据所述前景区域特征获取前景区域当前宏块并将所述当前宏块覆盖到所述背景图像上以得到原始视频图像。
9.根据权利要求8所述的视频编解码方法,其特征在于:所述前景区域特征包括:前景区域数目、各前景区域的外接矩形的坐标、宏块编码信息以及宏块有效标志信息,
所述宏块有效标志信息是,如果宏块中包含了前景像素,则认为该宏块有效,需要编码,否则认为该宏块中的像素为背景像素,该宏块无效,不进行编码。
10.根据权利要求9所述的视频编解码方法,其特征在于:根据所述前景区域特征获取前景区域当前宏块并将所述当前宏块覆盖到所述背景图像上以得到原始视频图像包括:
获取当前图像的背景图像,根据各个前景区域的外接矩形坐标定位到前景区域的左上角,按照和编码相同的顺序,判断外接矩形中宏块对应的前景宏块是否为有效宏块,如果为无效宏块则跳到下一宏块进行处理,否则读取有效宏块的编码信息,解码后得到离散余弦变换系数,恢复残差图像,从前一帧图像中找到其匹配宏块,恢复当前宏块图像,并将当前宏块图像覆盖到当前图像上的对应位置;或将有效宏块叠加到背景图像上。
CN 201010553038 2010-11-18 2010-11-18 一种视频编解码装置和方法 Active CN102006475B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010553038 CN102006475B (zh) 2010-11-18 2010-11-18 一种视频编解码装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010553038 CN102006475B (zh) 2010-11-18 2010-11-18 一种视频编解码装置和方法

Publications (2)

Publication Number Publication Date
CN102006475A CN102006475A (zh) 2011-04-06
CN102006475B true CN102006475B (zh) 2012-12-19

Family

ID=43813491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010553038 Active CN102006475B (zh) 2010-11-18 2010-11-18 一种视频编解码装置和方法

Country Status (1)

Country Link
CN (1) CN102006475B (zh)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102404574A (zh) * 2011-11-30 2012-04-04 江苏奇异点网络有限公司 面向低速宽带的网络教育视频压缩方法
CN102819846B (zh) * 2012-06-13 2015-01-21 广东威创视讯科技股份有限公司 高清视频播放方法和系统
CN102724492B (zh) * 2012-06-28 2015-06-03 广东威创视讯科技股份有限公司 视频图像传输、播放方法和系统
CN102868872B (zh) * 2012-09-29 2017-03-29 广东威创视讯科技股份有限公司 视频提取方法和装置
CN103037205B (zh) * 2012-12-14 2016-03-02 广东威创视讯科技股份有限公司 视频传输方法和系统
CN103179402A (zh) * 2013-03-19 2013-06-26 中国科学院半导体研究所 一种视频压缩编码与解码方法及其装置
CN103220530A (zh) * 2013-04-22 2013-07-24 郑永春 用于智能监控的高分辨率图像处理系统及方法
CN103347170A (zh) * 2013-06-27 2013-10-09 郑永春 用于智能监控的图像处理方法及其应用的高分辨率摄像头
CN103702123B (zh) * 2013-12-16 2017-12-15 浙江宇视科技有限公司 一种视频编码和处理的方法以及设备
CN104883572B (zh) * 2015-05-21 2018-04-27 浙江宇视科技有限公司 一种基于h.264或h.265的前背景分离编码设备和方法
CN105335125A (zh) * 2015-11-25 2016-02-17 武汉卡比特信息有限公司 一种手机屏幕映射到计算机类终端的优化方法
CN105357215A (zh) * 2015-12-01 2016-02-24 中国农业科学院农业信息研究所 一种低流量视频通讯传输系统及方法
CN105554040B (zh) * 2016-02-25 2018-10-12 北京京东尚科信息技术有限公司 远程视频监控方法和系统
CN105959633A (zh) * 2016-05-26 2016-09-21 北京志光伯元科技有限公司 一种视频传输方法及装置
CN106878268A (zh) * 2016-12-28 2017-06-20 杰创智能科技股份有限公司 低带宽高质量传输监控图像的方法及系统
CN107454428B (zh) * 2017-09-12 2019-08-27 中广热点云科技有限公司 一种视频数据的编解码预处理方法
CN107679190B (zh) * 2017-09-30 2019-03-15 冯贵良 一种大数据三维显示方法及显示系统
CN108462878B (zh) * 2018-04-09 2020-10-09 公安海警学院 基于关键帧和指示符运动模型的教学视频压缩算法
CN109587507A (zh) * 2018-10-26 2019-04-05 西安科锐盛创新科技有限公司 基于视频监控系统的视频数据处理方法及其设备
CN111145099B (zh) * 2018-11-02 2023-05-26 广州灵派科技有限公司 一种模式化图像处理技术
CN110784744A (zh) * 2019-10-31 2020-02-11 重庆唐码传媒有限公司 低延时图像采集方法
CN111479162B (zh) * 2020-04-07 2022-05-13 成都酷狗创业孵化器管理有限公司 直播数据传输方法、装置以及计算机可读存储介质
CN111526417B (zh) * 2020-04-20 2021-09-17 河北达实信息技术有限公司 一种视频图像传输方法及传输系统
CN111968031B (zh) * 2020-07-14 2024-07-16 浙江大华技术股份有限公司 一种图像拼接方法、装置、存储介质及电子装置
CN112153384B (zh) * 2020-07-23 2024-05-17 西安万像电子科技有限公司 图像编解码方法及装置
CN111800653B (zh) * 2020-07-29 2021-06-11 北京大学深圳研究生院 视频解码方法、系统、设备及计算机可读存储介质
CN112203095B (zh) * 2020-12-04 2021-03-09 腾讯科技(深圳)有限公司 视频运动估计方法、装置、设备及计算机可读存储介质
CN112653851A (zh) * 2020-12-22 2021-04-13 维沃移动通信有限公司 视频处理方法、装置和电子设备
CN112954393A (zh) * 2021-01-21 2021-06-11 北京博雅慧视智能技术研究院有限公司 一种基于视频编码的目标跟踪方法、系统、存储介质及终端
CN112995665A (zh) * 2021-03-10 2021-06-18 慧视云创(深圳)智能科技有限公司 一种用于摄像装置的视频编码方法及装置
CN114157873B (zh) * 2021-11-25 2024-08-23 中国通信建设第四工程局有限公司 一种视频压缩方法及视频压缩系统
CN117857816A (zh) * 2022-09-30 2024-04-09 中国电信股份有限公司 视频传输方法、装置、电子设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2486164A1 (en) * 2002-06-12 2003-12-24 British Telecommunications Public Limited Company Video pre-processing
CN100366091C (zh) * 2004-06-24 2008-01-30 华为技术有限公司 一种视频压缩方法
CN1980334A (zh) * 2005-12-09 2007-06-13 英业达股份有限公司 视频画面叠加编码传输的方法
CN101510304B (zh) * 2009-03-30 2014-05-21 北京中星微电子有限公司 一种分割获取前景图像的方法、装置和摄像头

Also Published As

Publication number Publication date
CN102006475A (zh) 2011-04-06

Similar Documents

Publication Publication Date Title
CN102006475B (zh) 一种视频编解码装置和方法
CN102006473B (zh) 视频编码器和编码方法以及视频解码器和解码方法
CN102067608B (zh) 用于视频译码的时间压缩中的片段化参考
CN101313588B (zh) 基于内容信息的可缩放性技术的编码方法和设备
CN111355956B (zh) 一种hevc帧内编码中基于深度学习的率失真优化快速决策系统及其方法
US10051271B2 (en) Coding structure
CN103069802A (zh) 重构图像的当前块的方法和对应的编码方法、对应的装置以及承载在比特流中编码的图像的存储介质
CN103636215A (zh) 对视频数据应用非正方形变换
CN111586420B (zh) 镜像模板匹配帧内预测方法、装置及视频解码方法、装置
CN102724498A (zh) 基于内容信息的可缩放性技术的编码方法和设备
CN101924943B (zh) 一种实时的基于h.264的低比特率视频转码方法
CN101098473A (zh) 一种图像编码方法及装置
CN101253775A (zh) 用于视频错误恢复的编解码方法及装置
CN103152578A (zh) 基于混合编解码的h.264视频水印嵌入及提取方法
CN102685500B (zh) 基于信息变长分组结构的h.264大容量信息隐藏方法
CN101291436B (zh) 视频编/解码方法和视频编/解码装置
CN104159117A (zh) 一种hevc视频的信息隐藏方法
CN104883572A (zh) 一种基于h.264或h.265的前背景分离编码设备和方法
CN102025997A (zh) 隐藏信息的方法和装置、提取隐藏信息的方法和装置
CN1926879A (zh) 视频信号编码器、视频信号处理器、视频信号分发系统及其操作方法
CN116156196A (zh) 一种用于视频数据的高效传输方法
CN103888770A (zh) 一种基于数据挖掘的高效自适应的视频转码系统
CN1774931A (zh) 对编码视频数据的内容分析
CN1643608A (zh) 已编码a/v序列的编辑
CN105681803A (zh) 一种大容量的hevc视频信息隐藏方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 214028 10-storey Building 530 Qingjia Road, Taihu International Science Park, Wuxi New District, Jiangsu Province

Patentee after: Zgmicro Corporation

Address before: 214028 10-storey Building 530 Qingjia Road, Taihu International Science Park, Wuxi New District, Jiangsu Province

Patentee before: WUXI VIMICRO Corp.

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20240808

Address after: Room 606, Building C, Entrepreneurship Building, No.1 Zhizhi Island Road, High tech Zone, Qingdao City, Shandong Province, China 266112

Patentee after: Vimicro Qingdao Corp.

Country or region after: China

Address before: 214028 10-storey Building 530 Qingjia Road, Taihu International Science Park, Wuxi New District, Jiangsu Province

Patentee before: Zgmicro Corporation

Country or region before: China

TR01 Transfer of patent right