CN104427337B - 基于目标检测的感兴趣区域视频编码方法及其装置 - Google Patents

基于目标检测的感兴趣区域视频编码方法及其装置 Download PDF

Info

Publication number
CN104427337B
CN104427337B CN201310367169.6A CN201310367169A CN104427337B CN 104427337 B CN104427337 B CN 104427337B CN 201310367169 A CN201310367169 A CN 201310367169A CN 104427337 B CN104427337 B CN 104427337B
Authority
CN
China
Prior art keywords
interest
target
area
quantization parameter
target detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310367169.6A
Other languages
English (en)
Other versions
CN104427337A (zh
Inventor
沈林杰
师恩义
俞海
黄田
陈军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201310367169.6A priority Critical patent/CN104427337B/zh
Publication of CN104427337A publication Critical patent/CN104427337A/zh
Application granted granted Critical
Publication of CN104427337B publication Critical patent/CN104427337B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及视频编码技术领域,公开了一种基于目标检测的感兴趣区域视频编码方法及其装置。本发明中,该视频编码方法包括以下步骤:对原始图像进行目标检测,生成目标信息,获取目标区域和置信度;将目标区域转换成适合编码的感兴趣区域;根据编码质量等级和置信度计算编码量化参数;根据对应的编码量化参数对感兴趣区域和非感兴趣区域进行量化编码。通过目标检测获取感兴趣区域和非感兴趣区域以及对应置信度,选择相应量化参数对感兴趣区域和非感兴趣区域进行量化编码,可以有效保证感兴趣区域的编码质量及稳定性,同时在不降低感兴趣区域编码质量的前提下,可降低整幅图像的压缩码流,提高视频传输和存储效率。

Description

基于目标检测的感兴趣区域视频编码方法及其装置
技术领域
本发明涉及视频编码技术领域,特别涉及基于目标检测的感兴趣区域视频编码方法及其装置。
背景技术
视频监控是安全防范行业的一个重要组成部分。随着视频监控系统的不断扩大,监控点的增多,传输和存储数据都需要付出极大的成本。因此必须对视频信息进行高效的压缩,才能充分利用网络资源,降低存储空间,从而达到节约成本的目的。
在视频监控的实际应用中,人们一般只对监控场景的某一部分感兴趣,从而潜在的要求感兴趣的区域具备较高的编码质量,而对非感兴趣区域的编码质量没有很高的要求。在以往的监控系统中,都是对整幅图像进行统一的编码质量调整,若想提升编码质量就需要增加编码码率。所以,在其余的条件都不发生变化的前提下,仅对于编码系统存在一对无法解决的矛盾:更好的编码图像质量和更低的编码码率。
针对上述问题,目前普遍的解决方法就是对感兴趣区域与非感兴趣区域采用不同的编码质量进行编码。这里涉及到两个重要的步骤:感兴趣区域的选择;感兴趣区域和非感兴趣区域的编码。
对于感兴趣区域的选择,目前较多的解决方式是用户直接预先选定一块固定的区域,并设定该区域的编码质量等级,该类方法的缺点是只能选择固定的区域作为感兴趣区域;
另外的解决方案是在编码框架中加入运动检测模块,基于运动检测的结果确定感兴趣区域,此方法的缺点在于只能针对运动的物体选定感兴趣区域,而本发明的发明人发现,其实很多实际的应用中感兴趣的不仅仅是运动的部分,或者扰动来自并不关注的部分,或者感兴趣的区域正好处于静止状态。
选定感兴趣区域之后,视频编码时就是需要对感兴趣区域进行高质量编码,尽可能保留该区域的数据,对非感兴趣区域进行低质量编码,尽可能减少该区域所需的编码比特数。现有技术中有解决方案采用H.264的灵活宏块排序来处理感兴趣区域编码,对感兴趣区域尽量保留数据信息,对非感兴趣区域尽量减少编码比特,但是这种方法仅适用于H.264编码,且需要增加额外的比特开销,一般的解码器不能支持灵活宏块排序,对解码端的接入要求较高。
发明内容
本发明的目的在于提供一种基于目标检测的感兴趣区域视频编码方法及其装置,可以有效保证感兴趣区域的编码质量及其稳定性,同时在不降低感兴趣区域编码质量的前提下,可以降低整幅图像的压缩码流,提高视频传输和存储效率。
为解决上述技术问题,本发明的实施方式公开了一种基于目标检测的感兴趣区域视频编码方法,包括以下步骤:
对原始图像进行目标检测,生成目标信息,获取目标区域和对应目标检测的置信度;
将目标区域转换成适合编码的感兴趣区域;
根据编码质量等级和置信度计算感兴趣区域和非感兴趣区域的编码量化参数;
根据对应的编码量化参数对感兴趣区域和非感兴趣区域进行量化编码。
本发明的实施方式还公开了一种基于目标检测的感兴趣区域视频编码装置,包括:
目标检测模块,用于对原始图像进行目标检测,生成目标信息,获取目标区域和对应目标检测的置信度;
感兴趣区域生成模块,用于将目标检测模块生成的目标区域转换成适合编码的感兴趣区域;
量化参数确定模块,用于根据编码质量等级和置信度计算感兴趣区域和非感兴趣区域的编码量化参数;
编码模块,用于根据对应的编码量化参数对感兴趣区域和非感兴趣区域进行量化编码。
本发明实施方式与现有技术相比,主要区别及其效果在于:
通过目标检测获取感兴趣区域和非感兴趣区域,选择相对应的量化参数对感兴趣区域和非感兴趣区域进行量化编码,可以有效保证感兴趣区域的编码质量及其稳定性,同时在不降低感兴趣区域编码质量的前提下,可以降低整幅图像的压缩码流,提高视频传输和存储效率。
进一步地,并行处理目标检测和编码前预处理的步骤,可以大大节省视频编码所用的时间,编码效率更高。
进一步地,在对原始图像进行目标检测,生成目标信息,获取目标区域和对应目标检测的置信度的步骤和所述对原始图像进行编码前的预处理的步骤并行处理的情况下,两个步骤的处理延时可能不同,通过引入同步步骤,将对应同一图像的预处理结果和目标信息匹配起来,可以避免在目标检测出现异常时造成编码的中断。
附图说明
图1是本发明第一实施方式中一种基于目标检测的感兴趣区域视频编码方法的流程示意图;
图2是本发明第二实施方式中一种基于目标检测的感兴趣区域视频编码方法的流程示意图;
图3是本发明第二实施方式中一种基于目标检测的感兴趣区域视频编码方法的优选例的同步机制示意图;
图4是本发明第三实施方式中一种基于目标检测的感兴趣区域视频编码装置的结构示意图;
图5是本发明第四实施方式中一种基于目标检测的感兴趣区域视频编码装置的结构示意图。
具体实施方式
在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请各权利要求所要求保护的技术方案。
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的实施方式作进一步地详细描述。
本发明第一实施方式涉及一种基于目标检测的感兴趣区域视频编码方法。图1是该基于目标检测的感兴趣区域视频编码方法的流程示意图。
具体地说,如图1所示,该基于目标检测的感兴趣区域视频编码方法包括以下步骤:
在步骤101中,对原始图像进行目标检测,生成目标信息,获取目标区域和对应目标检测的置信度。
目标检测,也叫目标提取,是一种基于目标几何特征或统计特征的目标分割方法。这里的目标可以是人脸、车牌等,但不限于人脸和车牌等。
置信度,也称为可靠度,或置信水平,即对某个判断确信的程度。
一般而言,该步骤中包含目标检测和目标稳定两个子步骤,目标检测的作用是通过某些算法分析发现目标,并给出将其判断为目标的确信程度,目标稳定的作用是通过时域滤波等处理提取出稳定的目标及其位置。
此后进入步骤103,将目标区域转换成适合编码的感兴趣区域。该步骤主要是把步骤101中生成的目标区域转换成合适编码的感兴趣区域。感兴趣区域(Region OfInterest,简称“ROI”),是指图像中比较关注的部分。
具体地说,将目标区域转换成适合编码的感兴趣区域的步骤,包括以下两个子步骤:
目标信息映射,即将目标的位置和大小映射为以编码分辨率为基准的位置和大小。由于用于目标检测的图像分辨率和编码分辨率可能不同,需要将目标的位置和大小重新映射为以编码分辨率为基准的位置和大小。目标检测的结果是像素级别的,而编码的最小单元是宏块,所以只要宏块中存在检测到的目标像素即认为该宏块为感兴趣区域。宏块是图像编码的一个基本单元,由亮度数据和色度数据组成。如对于4:2:0格式来说,由一个16x16的亮度块和两个8x8的色度块组成。
目标大小调整,即根据目标的类型对目标大小进行以目标调整。算法检测出的目标大小与实际期望的感兴趣区域大小可能存在差距,比如目标类型为人脸时,实际期望的感兴趣区域要包含完整的头部,即比算法检测出的目标更大一点。这一步骤即是根据目标的类型对目标大小进行以目标中心点为固定点的重新调整。以目标区域矩形框为例,可选的操作是宽扩大TX(TX≥1)倍,高扩大TY(TY≥1)倍,但不以此为限,也可以采用其他方法。
此后进入步骤104,根据编码质量等级和置信度计算感兴趣区域和非感兴趣区域的编码量化参数。
量化参数(Quantisation Parameter,简称“QP”),量化是在图像质量和压缩比率之间折中的参数,量化参数越大质量越差,压缩码率越低。
通过外部输入的感兴趣区域及其编码质量等级和置信度,以及编码参数来确定当前帧的量化参数。感兴趣区域的编码等级决定了感兴趣区域的编码量化参数与非感兴趣区域的编码量化参数的差异值可取范围,而感兴趣区域的置信度具体决定了在此范围内感兴趣区域的编码量化参数与非感兴趣区域的编码量化参数的差异值。一般认为感兴趣区域的编码质量等级越高,则感兴趣区域的编码量化参数与非感兴趣区域的编码量化参数的差异值可取范围越大;感兴趣区域的置信度越高,则其编码量化参数与非感兴趣区域的差异值越大。
在步骤104中,编码量化参数的确定方式可以有多种,优选地,可以通过码率控制来确定。
码率控制:是指一种编码的优化算法,用于实现对视频码流的大小控制。
具体地说,当通过码率控制计算感兴趣区域和非感兴趣区域的编码量化参数时,步骤104还包括以下四个子步骤:
依据外部输入每个宏块的的编码质量等级及其置信度,将其转化为相对量化参数,即感兴趣区域与非感兴趣区域的编码量化参数的相对值QP_OFT(i,j),感兴趣区域的编码量化参数的相对值QP_OFT(i,j)为非零,非感兴趣区域的编码量化参数的相对值QP_OFT(i,j)为零;
统计转换后所有宏块的编码量化参数的相对值QP_OFT(i,j)总和;
依据上一帧的编码量化参数、上一帧统计完成的所有宏块的编码量化参数的相对值QP_OFT(i,j)总和以及当前帧统计得到的所有宏块的编码量化参数的相对值QP_OFT(i,j)总和来预测当前帧的编码量化参数QP;
计算感兴趣区域每一个宏块的编码量化参数,计算公式如下:
ROI_QP(i,j)=QP-QP_OFT(i,j),
式中,QP为当前帧的编码量化参数,QP_OFT(i,j)为当前帧每个宏块的编码量化参数的相对值,ROI_QP(i,j)为感兴趣区域每一个宏块的编码量化参数。
此外,可以理解,码率控制只是一种优选的确定编码量化参数的实施方式,在本发明的其它某些实施方式中,编码量化参数也可以通过其它的方式确定,比如预先设定好固定的编码量化参数,等等。
此后进入步骤105,根据对应的编码量化参数对感兴趣区域和非感兴趣区域进行量化编码,输出码流。
此后结束此流程。
通过目标检测获取感兴趣区域和非感兴趣区域,选择相对应的量化参数对感兴趣区域和非感兴趣区域进行量化编码,可以有效保证感兴趣区域的编码质量及其稳定性,同时在不降低感兴趣区域编码质量的前提下,可以降低整幅图像的压缩码流,提高视频传输和存储效率。
本发明第二实施方式涉及一种基于目标检测的感兴趣区域视频编码方法。图2是该基于目标检测的感兴趣区域视频编码方法的流程示意图。
第二实施方式在第一实施方式的基础上进行了改进,如图2所示,主要改进之处在于:
该基于目标检测的感兴趣区域视频视频编码方法还包括:
步骤102,对原始图像进行编码前的预处理。
比如缩放到编码所需要的大小,屏幕菜单式调节方式(On Screen Display,简称“OSD”)、LOGO、菜单等。
需要进一步说明的是,该步骤也是一个可选步骤,在没有该步骤的情况下,本技术方案仍然可以实施。
进一步地,优选地,在本实施方式中对原始图像进行目标检测,生成目标信息,获取目标区域和对应目标检测置信度的步骤101和对原始图像进行编码前的预处理的步骤102是并行处理的。
并行处理,可以大大节省视频编码所用的时间,编码效率更高。
此外,可以理解,对原始图像进行目标检测,生成目标信息,获取目标区域和对应目标检测的置信度的步骤101和对原始图像进行编码前的预处理的步骤102可以是并行处理的,也可以是串行处理的。
其次,在本实施方式中,对原始图像进行编码前的预处理的步骤102之后,还包括步骤106,将对应同一图像的预处理结果和目标信息匹配起来。
该步骤仅在对原始图像进行目标检测,生成目标信息,获取目标区域和对应目标检测的置信度的步骤101和对原始图像进行编码前的预处理的步骤102并行处理的情况下才需要。
在上述这种并行处理的情况下,上述两个步骤的处理延时可能不同,因此需要在该步骤中通过引入同步步骤,将对应同一图像的预处理结果和目标信息匹配起来,可以避免在目标检测出现异常时造成编码的中断。
在本发明的一个优选的实施例中,基于目标检测的感兴趣区域视频编码方法的流程示主要包括以下步骤:
步骤1目标生成:对输入的原始图像进行目标检测,生成目标信息。这里的目标可以是人脸,车牌等。一般而言,该步骤中包含目标检测和目标稳定两个子步骤,目标检测的作用是通过某些算法分析发现目标,并给出将其判断为目标的确信程度,目标稳定的作用是通过时域滤波等处理提取出稳定的目标及其位置。
步骤2编码前预处理:进行编码前的预处理,比如缩放到编码所需要的大小,叠加OSD、LOGO、菜单等。
需要说明的是,该步骤作为一个编码系统的常见部分,是一个可选的步骤,在没有该步骤的情况下,本技术方案仍然可以实施。
步骤3同步机制:该步骤是可选步骤,仅在步骤1和步骤2为并行处理的情况下才需要,在这种情况下,上述两个步骤的处理延时可能不同,因此需要在该步骤中将对应同一图像的预处理结果和目标信息匹配起来。该步骤的基本方法是根据时间戳判断,并引入一定的超时机制,以免在目标侦测模块出现异常时造成编码的中断。为支持该机制,需要在步骤1中为得到的目标信息建立缓冲池,在步骤2中为得到的编码图像建立缓冲池,缓冲池中的每个结果都包含一个对应原始图像的时间戳。步骤4ROI(Region Of Interest,简称“感兴趣区域”)生成:该步骤主要是把目标检测子步骤生成的目标区域转换成合适编码的感兴趣区域。该步骤可划分为以下子步骤:
子步骤4-1:目标信息映射。由于用于目标检测的图像分辨率和编码分辨率可能不同,需要将目标的位置和大小重新映射为以编码分辨率为基准的位置和大小。目标检测的结果是像素级别的,而编码的最小单元是宏块,所以只要宏块中存在检测到的目标像素即认为该宏块为感兴趣区域。
子步骤4-2:目标大小调整。算法检测出的目标大小与实际期望的感兴趣区域大小可能存在差距,比如目标类型为人脸时,实际期望的感兴趣区域要包含完整的头部,即比算法检测出的目标更大一点。这一步骤即是根据目标的类型对目标大小进行以目标中心点为固定点的重新调整。以目标区域矩形框为例,可选的操作是宽扩大TX(TX≥1)倍,高扩大TY(TY≥1)倍,也可以采用其他方法。
步骤5码率控制,确定编码量化参数:通过外部输入的感兴趣区域及其编码质量等级和置信度,以及编码参数来确定当前帧的量化参数。感兴趣区域的编码等级决定了感兴趣区域的编码量化参数与非感兴趣区域的编码量化参数的差异值可取范围,而感兴趣区域的置信度具体决定了在此范围内感兴趣区域的编码量化参数与非感兴趣区域的编码量化参数的差异值。一般认为感兴趣区域的编码质量等级越高,则感兴趣区域的编码量化参数与非感兴趣区域的编码量化参数的差异值可取范围越大;感兴趣区域的置信度越高,则其编码量化参数与非感兴趣区域的差异值越大。
码率控制,确定编码量化参数的具体步骤还包括以下子步骤:
子步骤5-1:依据外部输入每个宏块的的编码质量等级及其置信度,将其转化为相对量化参数,即感兴趣区域与非感兴趣区域的编码量化参数的相对值QP_OFT(i,j),感兴趣区域的QP_OFT(i,j)为非零,非感兴趣区域的QP_OFT(i,j)为零;
子步骤5-2:统计转换后的所有宏块的QP_OFT(i,j)总和;
子步骤5-3:依据上一帧的编码量化参数、上一帧统计完成的所有宏块的QP_OFT(i,j)总和以及当前帧统计得到的所有宏块的QP_OFT(i,j)总和来预测当前帧的编码量化参数QP;
子步骤5-4:计算感兴趣区域每一个宏块的编码量化参数
ROI_QP(i,j)=QP-QP_OFT(i,j);
式中,QP为当前帧的编码量化参数,QP_OFT(i,j)为当前帧每个宏块的编码量化参数的相对值,ROI_QP(i,j)为感兴趣区域每一个宏块的编码量化参数。
需要进一步说明的是,步骤5也是一个优选的步骤,在本发明的其它某些实施方式中,也可以采用其它的确定编码量化参数的方式,而不以此为限。
步骤6编码:依据计算得到的量化参数进行编码输出码流。
具体地说,将对应同一图像的预处理结果和目标信息匹配起来的基本方法是根据时间戳判断,并引入一定的超时机制,以免在目标侦测出现异常时造成编码的中断。为支持该机制,需要在步骤101中为得到的目标信息建立缓冲池,在步骤102中为得到的编码图像建立缓冲池,如图3所示。缓冲池中的每个结果都包含一个对应原始图像的时间戳。该机制的具体实现方法包括以下步骤:
1、从编码图像缓冲池中获取一帧编码图像I,如果获取失败,休眠一段时间后重新获取,直到获取成功;
2、比较I的时间戳Si和当前记录的目标信息T的时间戳St(当前记录的目标信息在初始化时清空,其St=0)。若Si-St>Ta,则认为T是过时目标信息,丢掉该目标信息,进入步骤3;若St-Si>Tb,则认为T是将来的目标信息,将待匹配的目标信息Tm清空,进入步骤6;其它情况,认为目标信息T和图像I匹配,执行Tm=T,进入步骤6;
3、从目标信息缓冲池中获取一帧目标信息,作为当前记录的目标信息T;如果获取失败(即目标信息缓冲池为空),则进入步骤4,否则返回步骤2;
4、比较当前时间戳Sc和图像时间戳Si,若Sc-Si>Tc,则认为获取目标信息超时,将Tm清空,进入步骤6;否则进入步骤5;
5、休眠一段时间,然后返回步骤3;
6、图像I与目标信息Tm匹配完成,进入ROI生成环节。
以上步骤中,Ta、Tb、Tc为预先设定阈值,均不小于0,可以根据实际情况(如编码帧率、系统负荷等)进行调整。如果Ta=Tb=0,则为严格匹配。
本发明的各方法实施方式均可以以软件、硬件、固件等方式实现。不管本发明是以软件、硬件、还是固件方式实现,指令代码都可以存储在任何类型的计算机可访问的存储器中(例如永久的或者可修改的,易失性的或者非易失性的,固态的或者非固态的,固定的或者可更换的介质等等)。同样,存储器可以例如是可编程阵列逻辑(Programmable ArrayLogic,简称“PAL”)、随机存取存储器(Random Access Memory,简称“RAM”)、可编程只读存储器(Programmable Read Only Memory,简称“PROM”)、只读存储器(Read-Only Memory,简称“ROM”)、电可擦除可编程只读存储器(Electrically Erasable Programmable ROM,简称“EEPROM”)、磁盘、光盘、数字通用光盘(Digital Versatile Disc,简称“DVD”)等等。
本发明第三实施方式涉及一种基于目标检测的感兴趣区域视频编码装置。图4是该基于目标检测的感兴趣区域视频编码装置的结构示意图。
具体地说,如图4所示,该基于目标检测的感兴趣区域视频编码装置包括:
目标检测模块,用于对原始图像进行目标检测,生成目标信息,获取目标区域和对应目标检测的置信度。目标检测模块的输入为原始图像(与用于编码的图像相比可能经过缩小或放大),以及与目标检测算法相关的一些参数,输出为目标的位置和判断的置信度。目标位置可以用一个矩形框的左上右下坐标表示,也可以采用其他表示方法,置信度在一般研究中心采用[0,1]区间的若干小数等级,0为确信非目标,1为确信目标,也可以用其他类似方法表达,例如分为10个等级。最简化的表达是2个等级,即0和1,0为非目标及对应非感兴趣区域,1为感兴趣区域。此模块主要是完成目标检测,目标可以是人脸或者车牌,但不仅限于这两者。
感兴趣区域生成模块,用于将目标检测模块生成的目标区域转换成适合编码的感兴趣区域。感兴趣区域生成模块的输入为目标的位置和大小,以及预处理后待编码的图像,输出为适合编码的感兴趣区域,此模块完成目标检测单元输出的目标位置和大小到编码的感兴趣区域的映射,以及大小的调整。
具体地说,感兴趣区域生成模块,包括以下两个子模块:
目标信息映射子模块,用于将目标的位置和大小映射为以编码分辨率为基准的位置和大小。
目标大小调整子模块,用于根据目标的类型对目标大小进行以目标中心点为固定点的调整。
量化参数确定模块,用于根据编码质量等级和置信度计算感兴趣区域和非感兴趣区域的编码量化参数。量化参数确定模块的输入为编码的感兴趣区域及其编码质量等级和置信度,以及对编码感兴趣区域的量化参数的统计值,输出为当前帧的非感兴趣区域的编码量化参数,此模块完成感兴趣区域的编码质量等级到编码量化参数的转换,以及非感兴趣区域的编码量化参数预测。
具体地说,优选地,量化参数确定模块包括以下四个子模块:
量化参数转换子模块,用于将编码质量等级和置信度转化为感兴趣区域与非感兴趣区域的编码量化参数的相对值。
量化参数统计子模块,用于统计转换后所有宏块的编码量化参数的相对值总和。
量化参数预测子模块,用于依据上一帧的编码量化参数、上一帧统计完成的所有宏块的编码量化参数的相对值总和以及当前帧统计得到的所有宏块的编码量化参数的相对值总和来预测当前帧的编码量化参数。
量化参数计算子模块,用于计算感兴趣区域每一个宏块的编码量化参数。
编码模块,用于根据对应的编码量化参数对感兴趣区域和非感兴趣区域进行量化编码。编码模块的输入为量化参数确定模块输出的编码量化参数以及编码图像,输出为编码码流。
在本发明的优选例中,还包括感兴趣区域稳定模块,其输入为连续多帧的编码感兴趣区域,输出为时间域滤波处理后的编码感兴趣区域,此模块的作用是消除偶尔出现的目标,以及填补偶尔消失的目标。
第一实施方式是与本实施方式相对应的方法实施方式,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
本发明第四实施方式涉及一种基于目标检测的感兴趣区域视频编码装置。图5是该基于目标检测的感兴趣区域视频编码装置的结构示意图。
第四实施方式在第三实施方式的基础上进行了改进,主要改进之处在于:
该基于目标检测的感兴趣区域视频编码装置还包括:
预处理模块,用于对原始图像进行编码前的预处理。
比如缩放到编码所需要的大小,屏幕菜单式调节方式(On Screen Display,简称“OSD”)、LOGO、菜单等。
在本发明的其它某些实施方式中,预处理模块也可以省略。在本实施方式中,优选地,目标检测模块对原始图像进行目标检测和预处理模块对原始图像进行编码前的预处理是并行处理的。
并行处理,可以大大节省视频编码所用的时间,编码效率更高。
此外,可以理解,目标检测模块对原始图像进行目标检测和预处理模块对原始图像进行编码前的预处理可以是并行处理的,也可以是串行处理的。
其次,该基于目标检测的感兴趣区域视频编码装置还包括:
图像同步模块,用于将对应同一图像的由目标检测模块和预处理模块处理得到的目标信息和预处理结果匹配起来。
图像同步模块的输入为目标检测图像和预处理图像时间戳信息,输出结果为两者是否匹配。
该模块仅在目标检测模块对原始图像进行目标检测和预处理模块对原始图像进行编码前的预处理是并行处理的的情况下才需要。
在上述这种并行处理的情况下,上述两个模块的处理延时可能不同,因此需要通过引入图像同步模块,将对应同一图像的预处理结果和目标信息匹配起来,可以避免在目标检测出现异常时造成编码的中断。
第二实施方式是与本实施方式相对应的方法实施方式,本实施方式可与第二实施方式互相配合实施。第二实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第二实施方式中。
综上所述,本发明的优选例中,一种基于目标检测的感兴趣区域视频编码装置,包含目标检测模块,图像同步模块,感兴趣区域生成模块,感兴趣区域稳定模块,量化参数确定模块,编码模块。
在基于目标检测的感兴趣区域视频编码方法中,主要包括:
1、通过“目标检测”获取感兴趣区域和非感兴趣区域,以及对应置信度;
2、选择相对应的量化参数对感兴趣区域和非感兴趣区域进行量化编码,其中检测所得区域的坐标和置信度会在编码感兴趣区域的坐标和编码量化系数之间形成映射;(具体为某一感兴趣区域量化系数相对非感兴趣区域量化系数差别的幅度,与对应目标检测的置信度呈递增关系)
本发明带来的有益效果主要体现在:
针对智能化视频监控的应用,提出一种加入目标检测单元的混合视频编码方法,该方法区别对待目标检测单元获取的感兴趣区域和非感兴趣区域,通过对目标检测单元获取的感兴趣区域的映射与调整,并在时间域上进行滤波处理,获得准确稳定的适合编码的感兴趣区域;通过保持感兴趣区域的编码量化参数与非感兴趣区域的编码量化参数的相对值,可以有效保证感兴趣区域的编码质量及其稳定性;同时在不降低感兴趣区域编码质量的前提下,可降低整幅图像的压缩码流,提高视频传输、存储效率。
本发明适合应用在视频监控系统,特别适合应用在具有人脸检测,车牌检测功能的视频监控系统,但并不局限于此。
需要说明的是,本发明各装置实施方式中提到的各模块都是逻辑模块,在物理上,一个逻辑模块可以是一个物理模块,也可以是一个物理模块的一部分,还可以以多个物理模块的组合实现,这些逻辑模块本身的物理实现方式并不是最重要的,这些逻辑模块所实现的功能的组合才是解决本发明所提出的技术问题的关键。此外,为了突出本发明的创新部分,本发明上述各装置实施方式并没有将与解决本发明所提出的技术问题关系不太密切的模块引入,这并不表明上述装置实施方式并不存在其它的模块。
需要说明的是,在本专利的权利要求和说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
虽然通过参照本发明的某些优选实施方式,已经对本发明进行了图示和描述,但本领域的普通技术人员应该明白,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (8)

1.一种基于目标检测的感兴趣区域视频编码方法,其特征在于,包括以下步骤:
对原始图像进行目标检测,生成目标信息,获取目标区域和对应目标检测的置信度;
将所述目标区域转换成适合编码的感兴趣区域;
根据编码质量等级和所述置信度计算所述感兴趣区域和非感兴趣区域的编码量化参数;
根据所述对应的编码量化参数对所述感兴趣区域和所述非感兴趣区域进行量化编码;其中
所述目标检测是一种基于目标几何特征或统计特征的目标分割方法,所述置信度是对判断确信的程度;并且,
所述根据编码质量等级和所述置信度计算所述感兴趣区域和非感兴趣区域的编码量化参数的步骤,包括以下子步骤:
将编码质量等级和所述置信度转化为感兴趣区域与非感兴趣区域的编码量化参数的相对值;
统计转换后所有宏块的编码量化参数的相对值总和;
依据上一帧的编码量化参数、上一帧统计完成的所有宏块的编码量化参数的相对值总和以及当前帧统计得到的所有宏块的编码量化参数的相对值总和来预测当前帧的编码量化参数;
计算感兴趣区域每一个宏块的编码量化参数。
2.根据权利要求1所述的基于目标检测的感兴趣区域视频编码方法,其特征在于,还包括以下步骤:
对原始图像进行编码前的预处理;
所述对原始图像进行目标检测,生成目标信息,获取目标区域和对应目标检测的置信度的步骤和所述对原始图像进行编码前的预处理的步骤是并行处理的。
3.根据权利要求2所述的基于目标检测的感兴趣区域视频编码方法,其特征在于,所述对原始图像进行编码前的预处理的步骤之后,还包括:
将对应同一图像的预处理结果和目标信息匹配起来。
4.根据权利要求1至3中任一项所述的基于目标检测的感兴趣区域视频编码方法,其特征在于,所述将所述目标区域转换成适合编码的感兴趣区域的步骤,包括以下子步骤:
将目标的位置和大小映射为以编码分辨率为基准的位置和大小;
根据目标的类型对目标大小进行以目标中心点为固定点的调整。
5.一种基于目标检测的感兴趣区域视频编码装置,其特征在于,包括:
目标检测模块,用于对原始图像进行目标检测,生成目标信息,获取目标区域和对应目标检测的置信度;
感兴趣区域生成模块,用于将所述目标检测模块生成的目标区域转换成适合编码的感兴趣区域;
量化参数确定模块,用于根据编码质量等级和所述置信度计算所述感兴趣区域和非感兴趣区域的编码量化参数;
编码模块,用于根据所述对应的编码量化参数对所述感兴趣区域和所述非感兴趣区域进行量化编码;其中
所述目标检测是一种基于目标几何特征或统计特征的目标分割方法,所述置信度是对判断确信的程度;并且
所述量化参数确定模块包括以下子模块:
量化参数转换子模块,用于将编码质量等级和所述置信度转化为感兴趣区域与非感兴趣区域的编码量化参数的相对值;
量化参数统计子模块,用于统计转换后所有宏块的编码量化参数的相对值总和;
量化参数预测子模块,用于依据上一帧的编码量化参数、上一帧统计完成的所有宏块的编码量化参数的相对值总和以及当前帧统计得到的所有宏块的编码量化参数的相对值总和来预测当前帧的编码量化参数;
量化参数计算子模块,用于计算感兴趣区域每一个宏块的编码量化参数。
6.根据权利要求5所述的基于目标检测的感兴趣区域视频编码装置,其特征在于,还包括:
预处理模块,用于对原始图像进行编码前的预处理;
所述目标检测模块对原始图像进行目标检测和所述预处理模块对原始图像进行编码前的预处理是并行处理的。
7.根据权利要求6所述的基于目标检测的感兴趣区域视频编码装置,其特征在于,还包括:
图像同步模块,用于将对应同一图像的由所述目标检测模块和所述预处理模块处理得到的目标信息和预处理结果匹配起来。
8.根据权利要求5至7中任一项所述的基于目标检测的感兴趣区域视频编码装置,其特征在于,所述感兴趣区域生成模块,包括以下子模块:
目标信息映射子模块,用于将所述目标的位置和大小映射为以编码分辨率为基准的位置和大小;
目标大小调整子模块,用于根据所述目标的类型对目标大小进行调整。
CN201310367169.6A 2013-08-21 2013-08-21 基于目标检测的感兴趣区域视频编码方法及其装置 Active CN104427337B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310367169.6A CN104427337B (zh) 2013-08-21 2013-08-21 基于目标检测的感兴趣区域视频编码方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310367169.6A CN104427337B (zh) 2013-08-21 2013-08-21 基于目标检测的感兴趣区域视频编码方法及其装置

Publications (2)

Publication Number Publication Date
CN104427337A CN104427337A (zh) 2015-03-18
CN104427337B true CN104427337B (zh) 2018-03-27

Family

ID=52975098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310367169.6A Active CN104427337B (zh) 2013-08-21 2013-08-21 基于目标检测的感兴趣区域视频编码方法及其装置

Country Status (1)

Country Link
CN (1) CN104427337B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106791862A (zh) * 2015-11-19 2017-05-31 掌赢信息科技(上海)有限公司 一种视频编码方法和设备

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106162191A (zh) * 2015-04-08 2016-11-23 杭州海康威视数字技术股份有限公司 一种基于目标的视频编码方法及系统
CN104754336B (zh) * 2015-04-13 2018-12-21 成都华迈通信技术有限公司 基于统计分析图像优先级的编码方法及编码码流控制装置
WO2016202285A1 (zh) * 2015-06-19 2016-12-22 美国掌赢信息科技有限公司 一种即时视频的传输方法和电子设备
CN105357524B (zh) * 2015-12-02 2020-04-28 广东中星微电子有限公司 一种视频编码方法及装置
CN105809136A (zh) 2016-03-14 2016-07-27 中磊电子(苏州)有限公司 影像数据处理方法及影像数据处理系统
CN106340024B (zh) * 2016-08-30 2019-07-02 厦门美图之家科技有限公司 一种图像分割方法、应用和计算设备
CN106488241A (zh) * 2016-10-13 2017-03-08 千目聚云数码科技(上海)有限公司 一种感兴趣区域设置方法
CN108156459A (zh) * 2016-12-02 2018-06-12 北京中科晶上科技股份有限公司 可伸缩视频传输方法及系统
CN106791856A (zh) * 2016-12-28 2017-05-31 天津天地伟业生产力促进有限公司 一种基于自适应感兴趣区域的视频编码方法
JP6945632B2 (ja) * 2016-12-29 2021-10-13 株式会社ソニー・インタラクティブエンタテインメント 視線追跡を用いたvr、低遅延、無線hmdビデオストリーミングのためのフォービエイテッドビデオリンク
CN106791696B (zh) * 2017-01-13 2019-11-08 中国科学院大学 无线视频监控系统及其图像传输方法和装置
CN108446694B (zh) * 2017-02-16 2020-11-27 杭州海康威视数字技术股份有限公司 一种目标检测方法及装置
CN106846813A (zh) * 2017-03-17 2017-06-13 西安电子科技大学 构建城市道路车辆图像数据库的方法
CN107257426B (zh) * 2017-06-19 2019-09-03 成都优孚达信息技术有限公司 一种减少资源消耗的数据压缩方法
CN109168032B (zh) * 2018-11-12 2021-08-27 广州酷狗计算机科技有限公司 视频数据的处理方法、终端、服务器及存储介质
CN111324793B (zh) * 2018-12-17 2024-02-23 地平线(上海)人工智能技术有限公司 对存储感兴趣区域的数据的操作进行控制的方法和装置
CN111447404B (zh) * 2019-01-16 2022-02-01 杭州海康威视数字技术股份有限公司 一种摄像机
CN109862356B (zh) * 2019-01-17 2020-11-10 中国科学院计算技术研究所 一种基于感兴趣区域的视频编码方法及系统
CN109949381B (zh) * 2019-03-15 2023-10-24 深圳市道通智能航空技术股份有限公司 图像处理方法、装置、图像处理芯片、摄像组件及飞行器
CN110049324B (zh) * 2019-04-12 2022-10-14 深圳壹账通智能科技有限公司 视频编码方法、系统、设备及计算机可读存储介质
CN110267041B (zh) 2019-06-28 2021-11-09 Oppo广东移动通信有限公司 图像编码方法、装置、电子设备和计算机可读存储介质
WO2020258241A1 (zh) * 2019-06-28 2020-12-30 深圳市大疆创新科技有限公司 可移动平台的图像处理方法、装置、可移动平台及介质
CN110728173A (zh) * 2019-08-26 2020-01-24 华北石油通信有限公司 基于感兴趣目标显著性检测的视频传输方法和装置
CN110557633B (zh) * 2019-08-28 2021-06-29 深圳大学 图像数据的压缩传输方法、系统和计算机可读存储介质
WO2021062624A1 (zh) * 2019-09-30 2021-04-08 深圳市大疆创新科技有限公司 可移动平台的图像处理方法、装置、可移动平台及介质
CN111131825A (zh) * 2019-10-28 2020-05-08 华为技术有限公司 一种视频处理方法及相关装置
CN113011210B (zh) * 2019-12-19 2022-09-16 北京百度网讯科技有限公司 视频处理方法和装置
CN113453007A (zh) * 2020-03-24 2021-09-28 合肥君正科技有限公司 一种提高监控场景h264编码效率的方法
CN111698505B (zh) * 2020-06-23 2022-03-25 湖南国科微电子股份有限公司 视频帧编码方法、装置、编码设备及可读存储介质
CN111787398A (zh) * 2020-06-24 2020-10-16 浙江大华技术股份有限公司 视频压缩方法、装置、设备及存储装置
CN112153317A (zh) * 2020-09-25 2020-12-29 杭州涂鸦信息技术有限公司 一种图像质量控制方法及其系统和设备
CN112367520B (zh) * 2020-11-11 2022-06-21 郑州师范学院 基于人工智能的视频质量诊断系统
CN114422788A (zh) * 2022-03-30 2022-04-29 浙江智慧视频安防创新中心有限公司 数字视网膜视频联合编码方法、译码方法、装置及电子设备
CN116886923A (zh) * 2023-06-19 2023-10-13 广州开得联软件技术有限公司 课堂视频编码方法、装置、存储介质和设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1217512A (zh) * 1997-11-18 1999-05-26 富士通株式会社 文件图象处理设备及其方法
CN1231101A (zh) * 1997-05-30 1999-10-06 索尼公司 图像映射装置和图像映射方法、以及图像生成装置和图像生成方法
CN101102495A (zh) * 2007-07-26 2008-01-09 武汉大学 一种基于区域的视频图像编解码方法和装置
CN101292538A (zh) * 2005-10-19 2008-10-22 汤姆森特许公司 使用可缩放的视频编码的多视图视频编码
CN101882316A (zh) * 2010-06-07 2010-11-10 深圳市融创天下科技发展有限公司 一种图像区域划分/编码方法、装置及系统
CN102428495A (zh) * 2009-05-05 2012-04-25 皇家飞利浦电子股份有限公司 对成像数据的置信度的自动评估
CN102752588A (zh) * 2011-04-22 2012-10-24 北京大学深圳研究生院 使用空间缩放预测的视频编解码方法
CN103179405A (zh) * 2013-03-26 2013-06-26 天津大学 一种基于多级感兴趣区域的多视点视频编码方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4375452B2 (ja) * 2007-07-18 2009-12-02 ソニー株式会社 画像処理装置、画像処理方法、及びプログラム、並びに表示装置
CN101252687B (zh) * 2008-03-20 2010-06-02 上海交通大学 实现多通道联合的感兴趣区域视频编码及传输的方法
TW201328359A (zh) * 2011-12-19 2013-07-01 Ind Tech Res Inst 基於壓縮域的移動物件偵測方法及裝置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1231101A (zh) * 1997-05-30 1999-10-06 索尼公司 图像映射装置和图像映射方法、以及图像生成装置和图像生成方法
CN1217512A (zh) * 1997-11-18 1999-05-26 富士通株式会社 文件图象处理设备及其方法
CN101292538A (zh) * 2005-10-19 2008-10-22 汤姆森特许公司 使用可缩放的视频编码的多视图视频编码
CN101102495A (zh) * 2007-07-26 2008-01-09 武汉大学 一种基于区域的视频图像编解码方法和装置
CN102428495A (zh) * 2009-05-05 2012-04-25 皇家飞利浦电子股份有限公司 对成像数据的置信度的自动评估
CN101882316A (zh) * 2010-06-07 2010-11-10 深圳市融创天下科技发展有限公司 一种图像区域划分/编码方法、装置及系统
CN102752588A (zh) * 2011-04-22 2012-10-24 北京大学深圳研究生院 使用空间缩放预测的视频编解码方法
CN103179405A (zh) * 2013-03-26 2013-06-26 天津大学 一种基于多级感兴趣区域的多视点视频编码方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106791862A (zh) * 2015-11-19 2017-05-31 掌赢信息科技(上海)有限公司 一种视频编码方法和设备

Also Published As

Publication number Publication date
CN104427337A (zh) 2015-03-18

Similar Documents

Publication Publication Date Title
CN104427337B (zh) 基于目标检测的感兴趣区域视频编码方法及其装置
CN102395030B (zh) 基于视频压缩码流的运动分析方法、码流转换方法及其装置
CN108495135B (zh) 一种屏幕内容视频编码的快速编码方法
JP5988577B2 (ja) 画像符号化装置、画像符号化方法及びプログラム
WO2021068598A1 (zh) 共享屏幕的编码方法、装置、存储介质及电子设备
US11336915B2 (en) Global motion vector video encoding systems and methods
CN104243992B (zh) 图像处理装置及图像处理方法
CN106682094B (zh) 一种人脸视频检索方法和系统
JP2008504750A5 (zh)
CN111988611A (zh) 量化偏移信息的确定方法、图像编码方法、装置及电子设备
CN104902276B (zh) 变换单元划分方法及装置
CN110495178A (zh) 3d视频编码的装置和方法
CN112437301B (zh) 一种面向视觉分析的码率控制方法、装置、存储介质及终端
JPWO2006100946A1 (ja) 画像信号再符号化装置及び画像信号再符号化方法
CN109219960B (zh) 视频编码质量平滑度的优化方法、装置、设备及存储介质
CN103281532A (zh) 一种基于运动强度检测的量化调整方法及系统
CN104702954A (zh) 视频编码方法及装置
EP3985983A1 (en) Interpolation filtering method and apparatus for intra-frame prediction, medium, and electronic device
CN105359508A (zh) 视频多级时空分辨率的增加
CN109862207B (zh) 一种基于压缩域的kvm视频内容变化检测方法
CN114827603A (zh) 基于avs3纹理信息的cu块划分方法、装置及介质
CN104995917A (zh) 一种自适应运动估计方法和模块
US11006143B2 (en) Motion vector candidate pruning systems and methods
CN114697656B (zh) 一种编码方法、装置、电子设备及介质
US11622118B2 (en) Determination of coding modes for video content using order of potential coding modes and block classification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant