CN103002289A - 面向监控应用的视频恒定质量编码装置及其编码方法 - Google Patents

面向监控应用的视频恒定质量编码装置及其编码方法 Download PDF

Info

Publication number
CN103002289A
CN103002289A CN2013100057414A CN201310005741A CN103002289A CN 103002289 A CN103002289 A CN 103002289A CN 2013100057414 A CN2013100057414 A CN 2013100057414A CN 201310005741 A CN201310005741 A CN 201310005741A CN 103002289 A CN103002289 A CN 103002289A
Authority
CN
China
Prior art keywords
image
pixel
mask
area
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100057414A
Other languages
English (en)
Other versions
CN103002289B (zh
Inventor
王啟军
甘彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ACADEMY OF PUBLIC SECURITY TECHNOLOGY HEFEI
CETC 38 Research Institute
Original Assignee
ACADEMY OF PUBLIC SECURITY TECHNOLOGY HEFEI
CETC 38 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ACADEMY OF PUBLIC SECURITY TECHNOLOGY HEFEI, CETC 38 Research Institute filed Critical ACADEMY OF PUBLIC SECURITY TECHNOLOGY HEFEI
Priority to CN201310005741.4A priority Critical patent/CN103002289B/zh
Publication of CN103002289A publication Critical patent/CN103002289A/zh
Application granted granted Critical
Publication of CN103002289B publication Critical patent/CN103002289B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种面向监控应用的视频恒定质量编码装置及其编码方法,该装置包括:背景检测模块,其用于提取出视频图像的前景区域和背景区域,将前景区域作为感兴趣区域,获得标识出前景区域和背景区域像素位置的图像掩膜;图像掩膜处理模块,其用于对提取出来的图像掩膜进行处理:剔除图像噪声影响,合并相邻但不相连的感兴趣区域,填补感兴趣区域中的“空洞”区域;宏块级掩膜生成模块,其用于在经过处理的图像掩膜的基础上生成宏块级掩膜,用于指导后续的视频编码;差异性编码模块,其用于在视频编码过程中,根据宏块级掩膜,分别对感兴趣区域和背景区域采用不同的量化参数,完成差异性编码。本发明还涉及该装置的编码方法。

Description

面向监控应用的视频恒定质量编码装置及其编码方法
技术领域
本发明涉及图像处理技术领域,具体地说是一种面向监控应用的视频恒定质量编码装置及其编码方法。
背景技术
近年来,我国整体经济实力显著增强,但社会治安状况也日趋复杂,公共安全问题不断凸现,巨大的需求促进了安防行业的迅猛发展,目前视频监控已广泛应用于公安、金融、交通等各个行业和领域中。当前视频监控所采用的视频格式基本上以CIF(352x288)、D1(720x576)等为主,遇到突发情况,视频图像质量难以保证,限制了视频作为证据或者办案线索的作用,在未来发展中,视频高清化逐步成为一个重要的趋势,高清视频包括720p(1280x720)、1080p(1920x1280)等格式,分辨率的提升带来了视频码率的大幅增加,如何传输和存储高清视频成为一个重要技术难题。
感兴趣区域(Region Of Interest,ROI)编码是视觉编码方面最早的尝试。在带宽受限的视频通信领域中,ROI编码将有限的比特数资源优先分配给用户感兴趣的目标区域,从而可以改善解码图像的主观视觉质量,如毋立芳等人结合整型小波变换(Integar Wavelet Transform, IWT)和嵌入式零树编码实现了无损ROI的图像近无损压缩(请参阅:毋立芳,沈兰荪,张晓玲. 基于感兴趣的图像近无损压缩[J]. 中国图形图像学报(A版), 2001, 6(6): 528-532),与此同时,又设计了一种小波变换域形状编码算法——树映射形状编码,实现对ROI形状的高效描述,该形状编码方法的编码效率取决于ROI的大小以及对非ROI区域的质量要求。相对于单帧的静止图像,视频序列由一系列图像帧构成,需要处理的数据量更大,所以需要算法具有更低的复杂度,以满足实时性要求,Mei-Juan Chen等提出通过提取视频帧中的颜色信息,将具有肤色的区域作为ROI,然后运用低通滤波处理图像背景区域,减少背景区域待编码数据量,在编码过程中,通过调节宏块层码率控制中的失真权重参数调整不同区域的图像质量,请参阅:Mei-Juan Chen, Ming-Chieh Chi, Ching-Ting Hsu and Jeng-Wei Chen. ROI videocoding based on H.263+ with robust Skin-color detection technique[J]. IEEE Transactions on Consumer Electronics, 2003, 49(3): 724-730. (《使用鲁棒肤色检测技术的基于H.263+的感兴趣视频编码》,IEEE消费电子汇刊)。考虑到视频图像内容的丰富多彩、变化多端,对感兴趣区域的实时准确分割在目前的技术条件下仍然是一项艰巨的任务,阻碍了该感兴趣区域编码的深入发展和广泛应用。
在监控应用中的视频存在一些特点:第一、视频背景不变,通过目前成熟的目标检测和分割方法可以准确提取出前景和背景;第二,监控应用的摄像机一般质量较差,再加上监控场景环境的变化,视频图像中噪声较大,这些噪声严重影响了编码效率。
目前已经广泛应用的运动目标检测与分割方法主要有:背景差分法,帧间差分法,基于统计模型的方法,光流法,请参阅:Brutzer, S., Hoferlin, B., Heidemann, G., 2011. Evaluation of background subtraction techniques for video surveillance. In: Proc. IEEE Conf. on Computer Vision and Pattern Recognition(《面向视频监控应用的背景减除技术评价》,IEEE计算机视觉与模式识别大会)。帧间差分法对场景光线的变化不敏感,当目标物表面大块区域灰度均匀时将会出现“孔洞”而使目标分割成多个区域;背景差分法是将当前视频帧与背景图像的差分来检测运动区域的算法,它能够提供最完整的运动目标信息,而且速度快,算法简单,检测准确。能满足系统实时性要求。但是对动态场景如光线、噪声等的变化却比较敏感,因此需要对背景做不断地更新。 基于统计模型的方法,虽然能够较好的提取出帧序列中的背景并分割出运动物体,但是这种方法需要人们事先假定背景特征密度场分布。光流法采用了运动目标随时间变化的光流场物理特性,从而有效地提取出运动目标。其优点是在摄像机运动的条件下也能有效地分割出独立的运动目标,其缺点是计算特别复杂,计算量大而难以满足实时性要求。
发明内容
本发明为避免上述现有技术所存在的不足之处,提供一种方便实用的视频恒定质量编码装置及其编码方法。
本发明是这样实现的,一种面向监控应用的视频恒定质量编码装置,其包括:
背景检测模块,其用于提取出视频图像的前景区域和背景区域,将前景区域作为感兴趣区域,获得标识出前景区域和背景区域像素位置的图像掩膜;
图像掩膜处理模块,其用于对提取出来的图像掩膜进行处理:剔除图像噪声影响,合并相邻但不相连的感兴趣区域,填补感兴趣区域中的“空洞”区域;
宏块级掩膜生成模块,其用于在经过处理的图像掩膜的基础上生成宏块级掩膜指导后续的视频编码;
差异性编码模块,其用于在视频编码过程中,根据宏块级掩膜,分别对感兴趣区域和背景区域采用不同的量化参数,完成差异性编码。
作为上述方案的进一步改进,该图像掩膜处理模块包括:
图像腐蚀子模块,其用于使用一个全为1的MxM矩阵,其中,M为大于1的奇数,扫描图像掩膜中的每一个像素,即矩阵的中心元素与当前图像像素位置对应,用该矩阵中的每一个像素与其覆盖的图像像素做逻辑“与”操作,如果运算结果都为1,则该像素为1,否则为0;以及
图像膨胀子模块,其用于使用一个全为1的M’xM’矩阵,M’为大于1的奇数,扫描图像掩膜中的每一个像素,即矩阵的中心元素与当前图像像素位置对应,用该矩阵中的每一个像素与其覆盖的图像像素做逻辑“与”操作,如果运算结果都为0,则该像素为0,否则为1;
其中,经图像腐蚀和图像膨胀操作后的图像掩膜结果为二进制掩膜output(x,y),其中 (x,y) 为像素坐标,如果output(x,y)为1,则表示像素坐标为(x,y)的像素为感兴趣区域,否则,则为背景区域即非感兴趣区域。
优选地,该宏块级掩膜生成模块包括:
提取子模块,其用于从二进制掩膜output(x,y)中提取上角坐标为(16*i,16*j),右下角坐标为(16*(i+1)-1,16*(j+1)-1)的图像区域Mb;
统计子模块,其用于统计Mb中像素值为1的像素个数Num;
计算子模块,其用于确定坐标位置为(i,j)的宏块级图像掩膜的值,如果Num大于M,则宏块级掩膜位置为(i,j)的元素值mask(i,j)为1,否则,为0,其中,mask标识宏块级的图像掩膜,而M则为大于0的整数。
再优选地,如果当前帧不是I帧,该差异性编码模块则进行感兴趣区域与背景区域差异性编码,假设当前帧的量化参数为QPpic,则坐标位置为(i,j)的宏块的量化参数QPmb为:
QP mb = QP pic + N if mask ( i , j ) = 0 QP pic if mask ( i , j ) = 1
其中N为大于0的整数。进而对QPmb的取值范围进行限定:QPmb=(QPmb>50)?50:QPmb
再优选地,如果当前帧为I帧,该差异性编码模块并不进行量化参数的调整。
本发明还提供一种面向监控应用的视频恒定质量编码方法,其包括以下步骤:
提取出视频图像的前景区域和背景区域,将前景区域作为感兴趣区域,获得标识出前景区域和背景区域像素位置的图像掩膜;
对提取出来的图像掩膜进行处理:剔除图像噪声影响,合并相邻但不相连的感兴趣区域,填补感兴趣区域中的“空洞”区域;
在经过处理的图像掩膜的基础上生成宏块级掩膜指导后续的视频编码;
在视频编码过程中,根据宏块级掩膜,分别对感兴趣区域和背景区域采用不同的量化参数,完成差异性编码。
作为上述方案的进一步改进,该图像掩膜处理步骤包括:
使用一个全为1的MxM矩阵,其中,M为大于1的奇数,扫描图像掩膜中的每一个像素,即矩阵的中心元素与当前图像像素位置对应,用该矩阵中的每一个像素与其覆盖的图像像素做逻辑“与”操作,如果运算结果都为1,则该像素为1,否则为0;以及
使用一个全为1的M’xM’矩阵,M’为大于1的奇数,扫描图像掩膜中的每一个像素,即矩阵的中心元素与当前图像像素位置对应,用该矩阵中的每一个像素与其覆盖的图像像素做逻辑“与”操作,如果运算结果都为0,则该像素为0,否则为1;
其中,经图像腐蚀和图像膨胀操作后的图像掩膜结果为二进制掩膜output(x,y),其中 (x,y) 为像素坐标,如果output(x,y)为1,则表示像素坐标为(x,y)的像素为感兴趣区域,否则,则为背景区域即非感兴趣区域。
优选地,该宏块级掩膜生成步骤包括:
从二进制掩膜output(x,y)中提取上角坐标为(16*i,16*j),右下角坐标为(16*(i+1)-1,16*(j+1)-1)的图像区域Mb;
统计Mb中像素值为1的像素个数Num;
确定坐标位置为(i,j)的宏块级图像掩膜的值,如果Num大于M,则宏块级掩膜位置为(i,j)的元素值mask(i,j)为1,否则,为0,其中,mask标识宏块级的图像掩膜,而M则为大于0的整数。
再优选地,如果当前帧不是I帧,则进行感兴趣区域与背景区域差异性编码,假设当前帧的量化参数为QPpic,则坐标位置为(i,j)的宏块的量化参数QPmb为:
QP mb = QP pic + N if mask ( i , j ) = 0 QP pic if mask ( i , j ) = 1
其中N为大于0的整数。进而对QPmb的取值范围进行限定:QPmb=(QPmb>50)?50:QPmb
再优选地,如果当前帧为I帧,并不进行量化参数的调整。
与现有技术相比,本发明的面向监控应用的视频恒定质量编码装置及其编码方法的优点如下:1、在保证感兴趣区域图像质量的前提下,大幅降低视频的编码码率,节省传输带宽和存储空间;2、不改变码流结构,与原有编码方式完全兼容。
附图说明
图1为本发明较佳实施方式提供的面向监控应用的视频恒定质量编码装置的模块示意图。
图2为图1中视频恒定质量编码装置的图像掩膜处理模块合并相邻但不相连的感兴趣区域的示意图。
图3为图1中视频恒定质量编码装置的图像掩膜处理模块填补感兴趣区域中的“空洞”区域的示意图。
图4为本发明较佳实施方式提供的面向监控应用的视频恒定质量编码方法的3x3矩阵与当前处理像素的对应关系示意图。
图5为应用传统H.264编码的处理过程状态图。
图6为应用本发明面向监控应用的视频恒定质量编码方法的处理过程状态图。
图7为应用传统H.264编码的编码结果示意图。
图8为应用本发明面向监控应用的视频恒定质量编码方法的编码结果示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,本发明较佳实施方式提供的面向监控应用的视频恒定质量编码装置包括背景检测模块1、图像掩膜处理模块2、宏块级掩膜生成模块3以及差异性编码模块4。
背景检测模块1用于提取出视频图像的前景区域和背景区域,将前景区域作为感兴趣区域,获得标识出前景区域和背景区域像素位置的图像掩膜。
图像掩膜处理模块2用于对提取出来的图像掩膜进行处理:剔除图像噪声影响,合并相邻但不相连的感兴趣区域,填补感兴趣区域中的“空洞”区域。“相邻但不相连”是指两个或两个以上感兴趣区域如果距离很近,那么处理后的结果会是将两个或两个以上感兴趣区域合并成一个感兴趣区域。如图2所示,图像5中的两个相邻但不相连的感兴趣区域6、7,合并成一个处理后的感兴趣区域8。填补前景区域中的“空洞”区域是指如果一块感兴趣区域包含非感兴趣区域(即“空洞”区域),则图像掩膜处理模块可以减小甚至消除这些空洞区域。如图3所示,处理前图像的感兴趣区域9存在“空洞”区域10,则经处理后图像就不存在“空洞”区域10了。
该图像掩膜处理模块2包括图像腐蚀子模块以及图像膨胀子模块
图像腐蚀子模块用于使用一个全为1的MxM矩阵,其中,M为大于1的奇数,扫描图像掩膜中的每一个像素,即矩阵的中心元素与当前图像像素位置对应,用该矩阵中的每一个像素与其覆盖的图像像素做逻辑“与”操作,如果运算结果都为1,则该像素为1,否则为0。
图像膨胀子模块用于使用一个全为1的M’xM’矩阵,M’为大于1的奇数,扫描图像掩膜中的每一个像素,即矩阵的中心元素与当前图像像素位置对应,用该矩阵中的每一个像素与其覆盖的图像像素做逻辑“与”操作,如果运算结果都为0,则该像素为0,否则为1。
其中,经图像腐蚀和图像膨胀操作后的图像掩膜结果为二进制掩膜output(x,y),其中 (x,y) 为像素坐标,如果output(x,y)为1,则表示像素坐标为(x,y)的像素为感兴趣区域,否则,则为背景区域(即非感兴趣区域)。
对图像掩膜先进行图像腐蚀处理,然后对处理的结果再进行图像膨胀处理。另外,图像腐蚀和图像膨胀所使用的矩阵大小可以不相同。
宏块级掩膜生成模块3用于在经过处理的图像掩膜的基础上生成宏块级掩膜指导后续的视频编码。该宏块级掩膜生成模块3包括提取子模块、统计子模块、计算子模块。
提取子模块用于从二进制掩膜output(x,y)中提取上角坐标为(16*i,16*j),右下角坐标为(16*(i+1)-1,16*(j+1)-1)的图像区域Mb;统计子模块用于统计Mb中像素值为1的像素个数Num;计算子模块用于确定坐标位置为(i,j)的宏块级图像掩膜的值,如果Num大于M,则宏块级掩膜位置为(i,j)的元素值mask(i,j)为1,否则,为0,其中,mask标识宏块级的图像掩膜,而M则为大于0的整数。
差异性编码模块4用于在视频编码过程中,根据宏块级掩膜,分别对感兴趣区域和背景区域采用不同的量化参数,完成差异性编码。具体地,如果当前帧不是I帧,该差异性编码模块4则进行感兴趣区域与背景区域差异性编码,假设当前帧的量化参数为QPpic,则坐标位置为(i,j)的宏块的量化参数QPmb为:
QP mb = QP pic + N if mask ( i , j ) = 0 QP pic if mask ( i , j ) = 1
其中N为大于0的整数。进而对QPmb的取值范围进行限定:QPmb=(QPmb>50)?50:QPmb。这个公式的含义是如果QPmb的值大于50,则QPmb的值为50,否则,QPmb的值为其本身。如果当前帧为I帧,该差异性编码模块并不进行量化参数的调整。
以下部分将对该编码装置及其编码方法的编码方式的具体实施方式进行详细描述。
一、背景检测模块1
在本实施方式中采用基于统计模型的方法进行背景检测。背景模型的思想是对图像中每个像素的颜色值(灰度或彩色)进行建模。如果当前图像坐标(x,y)上的像素颜色值与背景模型中(x,y)上的像素颜色值有较大差异时,当前像素被认为是前景,否则为背景。高斯混合模型(Gaussian Mixture Model)通过多个高斯概率密度函数的加权平均来平滑地近似任意形状的密度分布函数,用该模型对背景进行建模时,对图像中每一个像素位置分别建立高斯混合模型。以坐标为(x,y)的像素位置的混合高斯模型为例,令I(x,y,t)表示像素点(x,y)在t时刻的像素值,则该像素值的概率P(I(x,y,t))为:
P ( I ( x , y , t ) ) = Σ i = 1 K w i t * η i ( I ( x , y , t ) , u i t , σ i t )
其中,K为高斯混合背景模型中高斯分布的个数,
Figure BDA0000271430185
为t时刻第i个高斯分量的加权系数,也即权重。ηi为第i个高斯分量的高斯函数,
Figure BDA0000271430186
分别表示第i个高斯分量在t时刻的均值和方差。
η i ( I ( x , y , t ) , u i t , σ i t ) = 1 2 π σ i t * e - ( I ( x , y , t ) , u i t ) 2 2 ( σ i t ) 2
对于一个像素的K个高斯分量,根据
Figure BDA0000271430188
的值对它们从大到小进行排列,对于满足下式的前B个高斯分布被当作是背景模型:
B = arg min b { Σ k = 1 b w k > T }
其中,T是背景模型占有高斯分布的最小比例,通常为0.7,如果T太小退化为单高斯,T较大则可以描述复杂的动态背景。
对于当前像素(x,y,t),如果它的值I(x,y,t)与它的背景模型中第k(k<=B)个高斯分布匹配,即I(x,y,t)在
Figure BDA00002714301810
范围之内,λ设置为2.5,那么该像素被认为是背景,否则是前景。令输出图像为output,公式如下:
output ( x , y , t ) = 0 , I ( x , y , t ) &Element; N 1 , otherwise
在检测完前景之后,若该像素被认为是前景,即前B个高斯分布中没有一个与之匹配,则用一个新的高斯分布取代权重最小的那个高斯分布。新的分布的期望值即为当前的像素值,同时为它分配一个较大的初始偏差σinit和较小的初始权重值winit
若该像素被认为是背景,则对该像素的各个高斯分布的权重做如下调整:
w i t = ( 1 - &alpha; ) * w i t - 1 + &alpha; * D i , t
其中,α为学习率,值在0~1之间。如果第i个高斯分布与当前像素匹配,则Di,t=1,否则Di,t=0。对于与当前像素匹配的高斯分布,更新它们的期望值和偏差值:
u i t = ( 1 - &beta; ) * u i t - 1 + &beta; * I ( x , y , t )
( &sigma; i t ) 2 = ( 1 - &beta; ) * ( &sigma; i t - 1 ) 2 + &beta; * ( I ( x , y , t ) - u i t ) 2
&beta; = &alpha; * &eta; i ( I ( x , y , t ) , u i t - 1 , &sigma; i t - 1 )
二、图像掩膜处理模块2
图像掩膜处理模块2包括图像腐蚀子模块与图像膨胀子模块,即对背景检测模块所提取出来的图像掩膜处理操作包括图像腐蚀和图像膨胀两部分。图像腐蚀使用一个全为1的3x3矩阵扫描图像掩膜中的每一个像素,即矩阵的中心元素与当前图像像素位置对应(如图4所示),用该矩阵中的每一个像素与其覆盖的图像像素做逻辑“与”操作,如果运算结果都为1,则该像素为1,否则为0;图像膨胀使用一个全为1的3x3矩阵扫描图像掩膜中的每一个像素,即矩阵的中心元素与当前图像像素位置对应(如图4所示),用该矩阵中的每一个像素与其覆盖的图像像素做逻辑“与”操作,如果运算结果都为0,则该像素为0,否则为1。
三、感兴趣区域的宏块级掩膜生成模块3
宏块级掩膜生成模块3包括提取子模块、统计子模块以及计算子模块。假设经过图像腐蚀和图像膨胀操作后的图像掩膜结果为二进制掩膜output(x,y),其中 (x,y) 为像素坐标,如果output(x,y)为1,则表示像素坐标为(x,y)的像素为感兴趣区域,否则,则为背景区域(即非感兴趣区域)。考虑到视频编码均是以宏块(16x16)为基本单位,采用如下方式生成宏块级的图像掩膜:
对于坐标位置为(i,j)的宏块级图像掩膜的值通过以下步骤确定:
第一,从图像掩膜output中提取上角坐标为(16*i,16*j),右下角坐标为(16*(i+1)-1,16*(j+1)-1)的图像区域Mb;
第二,统计Mb中像素值为1的像素个数Num;
第三,确定坐标位置为(i,j)的宏块级图像掩膜的值。如果Num大于3,则宏块级掩膜位置为(i,j)的元素值mask(i,j)为1,否则,为0。其中,mask标识宏块级的图像掩膜。
四、差异性编码模块4
如果当前帧为I帧,则不进行感兴趣区域与背景区域的差异性编码;如果当前帧不是I帧,则进行感兴趣区域与背景区域差异性编码。假设当前帧为的量化参数为QPpic,则坐标位置为(i,j)的宏块的量化参数QPmb为:
QP mb = QP pic + 15 if mask ( i , j ) = 0 QP pic if mask ( i , j ) = 1
进而对QPmb的取值范围进行限定:
QPmb=(QPmb>50)?50:QPmb
对如图5(视频图像)所示的原始视频图像分别进行H.264编码和如图6所示(宏块级图像掩膜,白色为感兴趣区域)的使用本发明所描述的编码方法进行编码,视频的量化参数为30,编码帧数为300帧,没有B帧,使用H.264编码后的码流码率为419.99kbps,如图7所示,而是用本发明进行编码后的码流码率为197.66kbps,如图8所示。除此之外,本发明编码后的码流依然还是标准码流,不会造成码流结构的破坏。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种面向监控应用的视频恒定质量编码装置,其特征在于,其包括:
背景检测模块,其用于提取出视频图像的前景区域和背景区域,将前景区域作为感兴趣区域,获得标识出前景区域和背景区域像素位置的图像掩膜;
图像掩膜处理模块,其用于对提取出来的图像掩膜进行处理:剔除图像噪声影响,合并相邻但不相连的感兴趣区域,填补感兴趣区域中的“空洞”区域;
宏块级掩膜生成模块,其用于在经过处理的图像掩膜的基础上生成宏块级掩膜指导后续的视频编码;
差异性编码模块,其用于在视频编码过程中,根据宏块级掩膜,分别对感兴趣区域和背景区域采用不同的量化参数,完成差异性编码。
2.如权利要求1所述的面向监控应用的视频恒定质量编码装置,其特征在于,该图像掩膜处理模块包括:
图像腐蚀子模块,其用于使用一个全为1的MxM矩阵,其中,M为大于1的奇数,扫描图像掩膜中的每一个像素,即矩阵的中心元素与当前图像像素位置对应,用该矩阵中的每一个像素与其覆盖的图像像素做逻辑“与”操作,如果运算结果都为1,则该像素为1,否则为0;以及
图像膨胀子模块,其用于使用一个全为1的M’xM’矩阵,M’为大于1的奇数,扫描图像掩膜中的每一个像素,即矩阵的中心元素与当前图像像素位置对应,用该矩阵中的每一个像素与其覆盖的图像像素做逻辑“与”操作,如果运算结果都为0,则该像素为0,否则为1;
其中,经图像腐蚀和图像膨胀操作后的图像掩膜结果为二进制掩膜output(x,y),其中 (x,y) 为像素坐标,如果output(x,y)为1,则表示像素坐标为(x,y)的像素为感兴趣区域,否则,则为背景区域即非感兴趣区域。
3.如权利要求2所述的面向监控应用的视频恒定质量编码装置,其特征在于,该宏块级掩膜生成模块包括:
提取子模块,其用于从二进制掩膜output(x,y)中提取上角坐标为(16*i,16*j),右下角坐标为(16*(i+1)-1,16*(j+1)-1)的图像区域Mb;
统计子模块,其用于统计Mb中像素值为1的像素个数Num;
计算子模块,其用于确定坐标位置为(i,j)的宏块级图像掩膜的值,如果Num大于M,则宏块级掩膜位置为(i,j)的元素值mask(i,j)为1,否则,为0,其中,mask标识宏块级的图像掩膜,而M则为大于0的整数。
4.如权利要求3所述的面向监控应用的视频恒定质量编码装置,其特征在于,如果当前帧不是I帧,该差异性编码模块则进行感兴趣区域与背景区域差异性编码,假设当前帧的量化参数为QPpic,则坐标位置为(i,j)的宏块的量化参数QPmb为:
QP mb = QP pic + N if mask ( i , j ) = 0 QP pic if mask ( i , j ) = 1
其中N为大于0的整数。进而对QPmb的取值范围进行限定:QPmb=(QPmb>50)?50:QPmb
5.如权利要求3所述的面向监控应用的视频恒定质量编码装置,其特征在于,如果当前帧为I帧,该差异性编码模块并不进行量化参数的调整。
6.一种面向监控应用的视频恒定质量编码方法,其特征在于,其包括以下步骤:
提取出视频图像的前景区域和背景区域,将前景区域作为感兴趣区域,获得标识出前景区域和背景区域像素位置的图像掩膜;
对提取出来的图像掩膜进行处理:剔除图像噪声影响,合并相邻但不相连的感兴趣区域,填补感兴趣区域中的“空洞”区域;
在经过处理的图像掩膜的基础上生成宏块级掩膜指导后续的视频编码;
在视频编码过程中,根据宏块级掩膜,分别对感兴趣区域和背景区域采用不同的量化参数,完成差异性编码。
7.如权利要求6所述的面向监控应用的视频恒定质量编码方法,其特征在于,该图像掩膜处理步骤包括:
使用一个全为1的MxM矩阵,其中,M为大于1的奇数,扫描图像掩膜中的每一个像素,即矩阵的中心元素与当前图像像素位置对应,用该矩阵中的每一个像素与其覆盖的图像像素做逻辑“与”操作,如果运算结果都为1,则该像素为1,否则为0;以及
使用一个全为1的M’xM’矩阵,M’为大于1的奇数,扫描图像掩膜中的每一个像素,即矩阵的中心元素与当前图像像素位置对应,用该矩阵中的每一个像素与其覆盖的图像像素做逻辑“与”操作,如果运算结果都为0,则该像素为0,否则为1;
其中,经图像腐蚀和图像膨胀操作后的图像掩膜结果为二进制掩膜output(x,y),其中 (x,y) 为像素坐标,如果output(x,y)为1,则表示像素坐标为(x,y)的像素为感兴趣区域,否则,则为背景区域即非感兴趣区域。
8.如权利要求7所述的面向监控应用的视频恒定质量编码方法,其特征在于,该宏块级掩膜生成步骤包括:
从二进制掩膜output(x,y)中提取上角坐标为(16*i,16*j),右下角坐标为(16*(i+1)-1,16*(j+1)-1)的图像区域Mb;
统计Mb中像素值为1的像素个数Num;
确定坐标位置为(i,j)的宏块级图像掩膜的值,如果Num大于M,则宏块级掩膜位置为(i,j)的元素值mask(i,j)为1,否则,为0,其中,mask标识宏块级的图像掩膜,而M则为大于0的整数。
9.如权利要求8所述的面向监控应用的视频恒定质量编码方法,其特征在于,如果当前帧不是I帧,则进行感兴趣区域与背景区域差异性编码,假设当前帧的量化参数为QPpic,则坐标位置为(i,j)的宏块的量化参数QPmb为:
QP mb = QP pic + N if mask ( i , j ) = 0 QP pic if mask ( i , j ) = 1
其中N为大于0的整数。进而对QPmb的取值范围进行限定:QPmb=(QPmb>50)?50:QPmb
10.如权利要求8所述的面向监控应用的视频恒定质量编码方法,其特征在于,如果当前帧为I帧,并不进行量化参数的调整。
CN201310005741.4A 2013-01-08 2013-01-08 面向监控应用的视频恒定质量编码装置及其编码方法 Active CN103002289B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310005741.4A CN103002289B (zh) 2013-01-08 2013-01-08 面向监控应用的视频恒定质量编码装置及其编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310005741.4A CN103002289B (zh) 2013-01-08 2013-01-08 面向监控应用的视频恒定质量编码装置及其编码方法

Publications (2)

Publication Number Publication Date
CN103002289A true CN103002289A (zh) 2013-03-27
CN103002289B CN103002289B (zh) 2015-06-17

Family

ID=47930356

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310005741.4A Active CN103002289B (zh) 2013-01-08 2013-01-08 面向监控应用的视频恒定质量编码装置及其编码方法

Country Status (1)

Country Link
CN (1) CN103002289B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104967867A (zh) * 2015-06-19 2015-10-07 美国掌赢信息科技有限公司 一种即时视频的传输方法和电子设备
CN105163125A (zh) * 2015-06-19 2015-12-16 美国掌赢信息科技有限公司 一种即时视频的编码方法和电子设备
CN105825519A (zh) * 2016-02-05 2016-08-03 北京雅森科技发展有限公司 用于处理医学影像的方法和装置
CN106791856A (zh) * 2016-12-28 2017-05-31 天津天地伟业生产力促进有限公司 一种基于自适应感兴趣区域的视频编码方法
CN107005636A (zh) * 2014-09-30 2017-08-01 株式会社尼康 电子设备
CN107454395A (zh) * 2017-08-23 2017-12-08 上海安威士科技股份有限公司 一种高清网络摄像机及智能码流控制方法
CN108063946A (zh) * 2017-11-16 2018-05-22 腾讯科技(成都)有限公司 图像编码方法和装置、存储介质及电子装置
CN108337515A (zh) * 2018-01-19 2018-07-27 浙江大华技术股份有限公司 一种视频编码方法及装置
CN108830834A (zh) * 2018-05-23 2018-11-16 重庆交通大学 一种爬索机器人视频缺陷信息自动提取方法
CN110603809A (zh) * 2017-03-03 2019-12-20 Sk电信有限公司 用于视频编码或解码的设备和方法
CN111614930A (zh) * 2019-02-22 2020-09-01 浙江宇视科技有限公司 一种视频监控方法、系统、设备及计算机可读存储介质
CN111787398A (zh) * 2020-06-24 2020-10-16 浙江大华技术股份有限公司 视频压缩方法、装置、设备及存储装置
CN111901595A (zh) * 2020-06-29 2020-11-06 北京大学 一种基于深度神经网络的视频编码方法及装置、介质
CN112085016A (zh) * 2020-07-07 2020-12-15 南京信息工程大学 基于roi和iwt医学图像篡改认证及恢复的鲁棒水印方法
CN112954398A (zh) * 2021-02-07 2021-06-11 杭州朗和科技有限公司 编码方法、解码方法、装置、存储介质及电子设备
CN113473142A (zh) * 2021-09-03 2021-10-01 浙江智慧视频安防创新中心有限公司 视频编码、视频解码方法及装置、电子设备、存储介质
WO2021248349A1 (en) * 2020-06-10 2021-12-16 Plantronics, Inc. Combining high-quality foreground with enhanced low-quality background
WO2023082773A1 (zh) * 2021-11-12 2023-05-19 华为技术有限公司 视频编解码方法、装置、设备、存储介质及计算机程序
WO2024078512A1 (en) * 2022-10-10 2024-04-18 Alibaba Damo (Hangzhou) Technology Co., Ltd. Pre-analysis based image compression methods

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108650511B (zh) * 2018-05-15 2021-09-28 南京邮电大学 基于背景失真传播的监控视频率失真优化编码方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101198064A (zh) * 2007-12-10 2008-06-11 武汉大学 一种分辨率分层技术中的运动矢量预测方法
CN101383962A (zh) * 2007-09-07 2009-03-11 武汉大学 基于感兴趣区域的低码率空域增强层编解码方法
CN101715135A (zh) * 2009-09-30 2010-05-26 武汉大学 基于模板匹配的自适应帧内预测滤波编码方法
WO2010086544A1 (fr) * 2009-01-28 2010-08-05 France Telecom Procede et dispositif de codage d'une image utilisant un masque de prediction, procede et dispositif de decodage, signal et programmes d'ordinateur correspondants
US20120014608A1 (en) * 2010-07-15 2012-01-19 Sony Corporation Apparatus and method for image processing

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101383962A (zh) * 2007-09-07 2009-03-11 武汉大学 基于感兴趣区域的低码率空域增强层编解码方法
CN101198064A (zh) * 2007-12-10 2008-06-11 武汉大学 一种分辨率分层技术中的运动矢量预测方法
WO2010086544A1 (fr) * 2009-01-28 2010-08-05 France Telecom Procede et dispositif de codage d'une image utilisant un masque de prediction, procede et dispositif de decodage, signal et programmes d'ordinateur correspondants
CN101715135A (zh) * 2009-09-30 2010-05-26 武汉大学 基于模板匹配的自适应帧内预测滤波编码方法
US20120014608A1 (en) * 2010-07-15 2012-01-19 Sony Corporation Apparatus and method for image processing

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107005636A (zh) * 2014-09-30 2017-08-01 株式会社尼康 电子设备
CN105163125A (zh) * 2015-06-19 2015-12-16 美国掌赢信息科技有限公司 一种即时视频的编码方法和电子设备
CN104967867A (zh) * 2015-06-19 2015-10-07 美国掌赢信息科技有限公司 一种即时视频的传输方法和电子设备
CN105825519A (zh) * 2016-02-05 2016-08-03 北京雅森科技发展有限公司 用于处理医学影像的方法和装置
CN106791856A (zh) * 2016-12-28 2017-05-31 天津天地伟业生产力促进有限公司 一种基于自适应感兴趣区域的视频编码方法
CN110603809B (zh) * 2017-03-03 2023-06-27 Sk电信有限公司 用于视频编码或解码的设备和方法
CN110603809A (zh) * 2017-03-03 2019-12-20 Sk电信有限公司 用于视频编码或解码的设备和方法
CN107454395A (zh) * 2017-08-23 2017-12-08 上海安威士科技股份有限公司 一种高清网络摄像机及智能码流控制方法
CN108063946A (zh) * 2017-11-16 2018-05-22 腾讯科技(成都)有限公司 图像编码方法和装置、存储介质及电子装置
CN108337515A (zh) * 2018-01-19 2018-07-27 浙江大华技术股份有限公司 一种视频编码方法及装置
CN108830834A (zh) * 2018-05-23 2018-11-16 重庆交通大学 一种爬索机器人视频缺陷信息自动提取方法
CN111614930A (zh) * 2019-02-22 2020-09-01 浙江宇视科技有限公司 一种视频监控方法、系统、设备及计算机可读存储介质
WO2021248349A1 (en) * 2020-06-10 2021-12-16 Plantronics, Inc. Combining high-quality foreground with enhanced low-quality background
CN111787398A (zh) * 2020-06-24 2020-10-16 浙江大华技术股份有限公司 视频压缩方法、装置、设备及存储装置
CN111901595A (zh) * 2020-06-29 2020-11-06 北京大学 一种基于深度神经网络的视频编码方法及装置、介质
CN111901595B (zh) * 2020-06-29 2021-07-20 北京大学 一种基于深度神经网络的视频编码方法及装置、介质
CN112085016A (zh) * 2020-07-07 2020-12-15 南京信息工程大学 基于roi和iwt医学图像篡改认证及恢复的鲁棒水印方法
CN112954398A (zh) * 2021-02-07 2021-06-11 杭州朗和科技有限公司 编码方法、解码方法、装置、存储介质及电子设备
CN112954398B (zh) * 2021-02-07 2023-03-24 杭州网易智企科技有限公司 编码方法、解码方法、装置、存储介质及电子设备
CN113473142A (zh) * 2021-09-03 2021-10-01 浙江智慧视频安防创新中心有限公司 视频编码、视频解码方法及装置、电子设备、存储介质
WO2023082773A1 (zh) * 2021-11-12 2023-05-19 华为技术有限公司 视频编解码方法、装置、设备、存储介质及计算机程序
WO2024078512A1 (en) * 2022-10-10 2024-04-18 Alibaba Damo (Hangzhou) Technology Co., Ltd. Pre-analysis based image compression methods

Also Published As

Publication number Publication date
CN103002289B (zh) 2015-06-17

Similar Documents

Publication Publication Date Title
CN103002289B (zh) 面向监控应用的视频恒定质量编码装置及其编码方法
CN106162177B (zh) 视频编码方法和装置
EP3291558B1 (en) Video coding and decoding methods and apparatus
CN110324626B (zh) 一种面向物联网监控的双码流人脸分辨率保真的视频编解码方法
CN111355956B (zh) 一种hevc帧内编码中基于深度学习的率失真优化快速决策系统及其方法
WO2023016155A1 (zh) 图像处理方法、装置、介质及电子设备
CN110944200B (zh) 一种评估沉浸式视频转码方案的方法
CN111626178B (zh) 一种基于新时空特征流的压缩域视频动作识别方法和系统
TW201537517A (zh) 移動物體偵測方法及移動物體偵測裝置
CN103067705A (zh) 一种多视点深度视频预处理方法
CN110213584A (zh) 基于纹理复杂度的编码单元分类方法和编码单元分类设备
TWI512685B (zh) 移動物體偵測方法及其裝置
CN110677624B (zh) 基于深度学习的面向监控视频的前景和背景并行压缩方法
CN110246093B (zh) 一种解码图像增强方法
CN100366091C (zh) 一种视频压缩方法
WO2023203509A1 (en) Image data compression method and device using segmentation and classification
Dai et al. HEVC video steganalysis based on PU maps and multi-scale convolutional residual network
CN111723735B (zh) 一种基于卷积神经网络的伪高码率hevc视频检测方法
Xie et al. Just noticeable visual redundancy forecasting: a deep multimodal-driven approach
CN102685491A (zh) 一种实现视频编码的方法和系统
CN113573058B (zh) 一种基于时空显著性融合的帧间图像编码方法
CN108924542A (zh) 基于显著性和稀疏性的无参考立体视频质量评价方法
KR100575733B1 (ko) 압축 동영상의 움직임 객체 분할 방법
CN113810692B (zh) 对变化和移动进行分帧的方法、图像处理装置及程序产品
Talukdar et al. Movement epenthesis detection in continuous fingerspelling from a coarsely sampled motion vector field in H. 264/AVC video

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant