CN103077542A - 一种深度图的感兴趣区域压缩方法 - Google Patents

一种深度图的感兴趣区域压缩方法 Download PDF

Info

Publication number
CN103077542A
CN103077542A CN2013100637265A CN201310063726A CN103077542A CN 103077542 A CN103077542 A CN 103077542A CN 2013100637265 A CN2013100637265 A CN 2013100637265A CN 201310063726 A CN201310063726 A CN 201310063726A CN 103077542 A CN103077542 A CN 103077542A
Authority
CN
China
Prior art keywords
depth map
interest
area
edge
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100637265A
Other languages
English (en)
Other versions
CN103077542B (zh
Inventor
关宇东
提纯利
滕艺丹
戴翊轩
李尔佳
杜克
仲小挺
于博良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin University of Technology Robot Group Co., Ltd.
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201310063726.5A priority Critical patent/CN103077542B/zh
Publication of CN103077542A publication Critical patent/CN103077542A/zh
Application granted granted Critical
Publication of CN103077542B publication Critical patent/CN103077542B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种深度图的感兴趣区域压缩方法,涉及一种深度图的压缩方法,解决现有的深度图感兴趣区域压缩方法无法实现感兴趣区域的自动选取问题。利用边缘检测方法获取深度图的灰度边缘;利用数学形态学膨胀操作获取深度图边缘及其周边区域;利用图像分割方法对深度图进行区域分割;求解分割后各区域内像素的灰度平均值,并作为该区域的灰度值;根据深度图边缘及其周边区域和像素灰度平均值确定感兴趣区域;采用时域与空域联合的高斯平滑滤波方法将非感兴趣区域进行平滑处理;对深度图边缘及其周边区域采用无损压缩的方式进行编码。本发明可广泛应用与对深度图的感兴趣区域自动选取的压缩。

Description

一种深度图的感兴趣区域压缩方法
技术领域
本发明涉及一种深度图的压缩方法。
背景技术
深度图是与二维图像大小相等的灰度图像,如图1与图2所示,其各像素的灰度值反应了二维图像中相同位置像素的深度值,即该像素所代表实物与观察者的距离,灰度值越高,代表距离越近,反之,则较远。深度z可由以下方程求出:
z ( r , c ) = 1.0 ( P ( r , c ) / 255.0 ) × ( 1.0 / MinZ - 1.0 / MaxZ ) + 1.0 / MaxZ - - - ( 1 )
其中z(r,c)代表r行c列处像素的实际深度值,P(r,c)为该位置深度图的灰度值,MinZ和MaxZ分别为深度最小和最大值。
深度图广泛应用与多种三维视频编码技术中,包括二维视频加深度图个事、多视点视频加深度图个事、分层深度视频格式以及深度增强的双路立体视频格式。深度图中包含了视频的三维信息,对视频的三维显示效果、适应性和灵活性都至关重要。而深度图的压缩也成为了三维视频压缩编码的关键技术之一。感兴趣区域(ROI)压缩是一种根据人眼视觉提点或特定需求,对图像/视频的不同区域采用不同程度的压缩来提高压缩效率同时提高其主观质量或满足特定需求的压缩方式。ROI压缩的重点和难点在于感兴趣区域的选取过程。现有技术很难实现感兴趣区域的自动选取。
发明内容
本发明为了解决现有的深度图感兴趣区域压缩方法无法实现感兴趣区域的自动选取的问题,从而提供一种深度图的感兴趣区域压缩方法。
一种深度图的感兴趣区域压缩方法,它包括如下步骤:
步骤一:利用边缘检测方法获取深度图的灰度边缘;
步骤二:利用数学形态学膨胀操作获取深度图边缘及其周边区域;
所述数学形态学膨胀操作是将与物体接触的所有背景点合并到该物体中,使边界向外部扩张的过程;膨胀操作定义为:
Figure BDA00002869351400012
即对深度图边缘及其周边区域X进行大小为S的膨胀操作所产生的图像满足:像素x的大小为膨胀操作S的邻域与区域X的交集非空;
步骤三:利用图像分割方法对深度图进行区域分割;
步骤四:求解分割后各区域内像素的灰度平均值,并作为该区域的灰度值;
步骤五:根据步骤二获得的深度图边缘及其周边区域和步骤四获得的像素灰度平均值确定感兴趣区域;
用参数I表示感兴趣程度,感兴趣程度I的范围为0-1,设深度图边缘及其周边区域的感兴趣程度I为1,所述感兴趣程度I为1时则该区域为感兴趣区域,其他区域的感兴趣程度按下式定义:
I(r,c)=P(r,c)/255.0
其中I(r,c)代表r行c列处像素的感兴趣程度,P(r,c)为该位置深度图的灰度值;
步骤六:采用时域与空域联合的高斯平滑滤波方法将非感兴趣区域进行平滑处理,所述非感兴趣区域为I小于0.6的区域,所用高斯窗函数的方差与感兴趣程度I成反比;
步骤七:对深度图边缘及其周边区域采用无损压缩的方式进行编码。
本发明实现了感兴趣区域的自动选取的感兴趣区域压缩方法。提高了感兴趣区域压缩算法的自动化程度和计算效率。采用本发明一种深度图的感兴趣区域压缩方法,对深度图进行感兴趣区域压缩,能够在不影响主观质量的条件下提高压缩比10%~20%。
附图说明
图1为本发明一种深度图的感兴趣区域压缩方法的流程图。
具体实施方式
具体实施方式一、结合图1说明本具体实施方式。一种深度图的感兴趣区域压缩方法,它包括如下步骤:
步骤一:利用边缘检测方法获取深度图的灰度边缘;
步骤二:利用数学形态学膨胀操作获取深度图边缘及其周边区域;
所述数学形态学膨胀操作是将与物体接触的所有背景点合并到该物体中,使边界向外部扩张的过程;膨胀操作定义为:
Figure BDA00002869351400021
即对深度图边缘及其周边区域X进行大小为S的膨胀操作所产生的图像满足:像素x的大小为膨胀操作S的邻域与区域X的交集非空;
步骤三:利用图像分割方法对深度图进行区域分割;
步骤四:求解分割后各区域内像素的灰度平均值,并作为该区域的灰度值;
步骤五:根据步骤二获得的深度图边缘及其周边区域和步骤四获得的像素灰度平均值确定感兴趣区域;
用参数I表示感兴趣程度,感兴趣程度I的范围为0-1,设深度图边缘及其周边区域的感兴趣程度I为1,所述感兴趣程度I为1时则该区域为感兴趣区域,其他区域的感兴趣程度按下式定义:
I(r,c)=P(r,c)/255.0
其中I(r,c)代表r行c列处像素的感兴趣程度,P(r,c)为该位置深度图的灰度值;
步骤六:采用时域与空域联合的高斯平滑滤波方法将非感兴趣区域进行平滑处理,所述非感兴趣区域为I小于0.6的区域,所用高斯窗函数的方差与感兴趣程度I成反比;
步骤七:对深度图边缘及其周边区域采用无损压缩的方式进行编码。
所述MPEG4为运动图像专家组第四代视频编码标准;H.264为先进视频编码标准;
具体实施方式二、本具体实施方式与具体实施方式一不同的是步骤二所述膨胀操作所选取S大小范围为3-8。
具体实施方式三、本具体实施方式与具体实施方式一不同的是所述步骤六:采用时域与空域联合的高斯平滑滤波方法将非感兴趣区域进行平滑处理的方法为:
利用MxNxF的三维高斯窗函数与深度图序列的灰度进行卷积操作,M为高斯窗函数宽度,N为高斯窗函数高度,F为高斯窗函数深度,即对前后共F帧进行高斯平滑滤波;
所述高斯窗函数宽度M、高斯窗函数高度N、高斯窗函数深度F的取值范围均为5-9;
其中所用高斯窗函数的方差与该区域感兴趣程度成反比关系。
具体实施方式四、本具体实施方式与具体实施方式一不同的是所述步骤七:对深度图边缘及其周边区域采用无损压缩的方式进行编码的方法为:
对深度图边缘及其周边区域以外区域可用MPEG4和H.264的压缩标准进行压缩编码,压缩品质因数Q随编码区域感兴趣程度降低而降低,且二者的关系为:
Q=28+6×I。
本技术的特色和创新之处在于根据人眼立体视觉对前景区域深度变化敏感,对背景区域深度变化不敏感以及深度图存在大部分灰度平滑区域,而边缘处灰度变化剧烈的特点,利用边缘检测和图像分割技术实现深度图感兴趣区域的自动选取。再根据上述感兴趣区域选取结果对深度图进行感兴趣区域压缩。

Claims (4)

1.一种深度图的感兴趣区域压缩方法,其特征在于它包括如下步骤:
步骤一:利用边缘检测方法获取深度图的灰度边缘;
步骤二:利用数学形态学膨胀操作获取深度图边缘及其周边区域;
所述数学形态学膨胀操作是将与物体接触的所有背景点合并到该物体中,使边界向外部扩张的过程;膨胀操作定义为:
Figure FDA00002869351300011
即对深度图边缘及其周边区域X进行大小为S的膨胀操作所产生的图像满足:像素x的大小为膨胀操作S的邻域与区域X的交集非空;
步骤三:利用图像分割方法对深度图进行区域分割;
步骤四:求解分割后各区域内像素的灰度平均值,并作为该区域的灰度值;
步骤五:根据步骤二获得的深度图边缘及其周边区域和步骤四获得的像素灰度平均值确定感兴趣区域;
用参数I表示感兴趣程度,感兴趣程度I的范围为0~1,设深度图边缘及其周边区域的感兴趣程度I为1,所述感兴趣程度I为1时则该区域为感兴趣区域,其他区域的感兴趣程度按下式定义:
I(r,c)=P(r,c)/255.0
其中I(r,c)代表r行c列处像素的感兴趣程度,P(r,c)为该位置深度图的灰度值;
步骤六:采用时域与空域联合的高斯平滑滤波方法将非感兴趣区域进行平滑处理,所述非感兴趣区域为I小于0.6的区域,所用高斯窗函数的方差与感兴趣程度I成反比;
步骤七:对深度图边缘及其周边区域采用无损压缩的方式进行编码。
2.根据权利要求1所述的一种深度图的感兴趣区域压缩方法,其特征在于步骤二所述膨胀操作所选取S大小范围为3~8。
3.根据权利要求1所述的一种深度图的感兴趣区域压缩方法,其特征在于所述步骤六:采用时域与空域联合的高斯平滑滤波方法将非感兴趣区域进行平滑处理的方法为:
利用MxNxF的三维高斯窗函数与深度图序列的灰度进行卷积操作,M为高斯窗函数宽度,N为高斯窗函数高度,F为高斯窗函数深度,即对前后共F帧进行高斯平滑滤波;
所述高斯窗函数宽度M、高斯窗函数高度N、高斯窗函数深度F的取值范围均为5~9;
其中所用高斯窗函数的方差与该区域感兴趣程度成反比关系。
4.根据权利要求1所述的一种深度图的感兴趣区域压缩方法,其特征在于所述步骤七:对深度图边缘及其周边区域采用无损压缩的方式进行编码的方法为:
对深度图边缘及其周边区域以外区域可用MPEG4和H.264的压缩标准进行压缩编码,压缩品质因数Q随编码区域感兴趣程度降低而降低,且二者关系为:
Q=28+6×I。
CN201310063726.5A 2013-02-28 2013-02-28 一种深度图的感兴趣区域压缩方法 Active CN103077542B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310063726.5A CN103077542B (zh) 2013-02-28 2013-02-28 一种深度图的感兴趣区域压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310063726.5A CN103077542B (zh) 2013-02-28 2013-02-28 一种深度图的感兴趣区域压缩方法

Publications (2)

Publication Number Publication Date
CN103077542A true CN103077542A (zh) 2013-05-01
CN103077542B CN103077542B (zh) 2016-03-02

Family

ID=48154061

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310063726.5A Active CN103077542B (zh) 2013-02-28 2013-02-28 一种深度图的感兴趣区域压缩方法

Country Status (1)

Country Link
CN (1) CN103077542B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103414900A (zh) * 2013-08-24 2013-11-27 渭南高新区金石为开咨询有限公司 配置视频编码质量和分级传输视频数据的方法
CN106340024A (zh) * 2016-08-30 2017-01-18 厦门美图之家科技有限公司 一种图像分割方法、应用和计算设备
CN107943389A (zh) * 2017-11-14 2018-04-20 维沃移动通信有限公司 一种图像处理方法和移动终端
CN109492454A (zh) * 2017-09-11 2019-03-19 比亚迪股份有限公司 对象识别方法及装置
CN110728173A (zh) * 2019-08-26 2020-01-24 华北石油通信有限公司 基于感兴趣目标显著性检测的视频传输方法和装置
CN112750109A (zh) * 2021-01-14 2021-05-04 金陵科技学院 一种基于形态学和深度学习的制药设备安全监测模型
WO2022022348A1 (zh) * 2020-07-28 2022-02-03 阿里巴巴集团控股有限公司 视频压缩方法、解压方法、装置、电子设备及存储介质
CN114189670A (zh) * 2020-09-15 2022-03-15 北京小米移动软件有限公司 显示方法、显示装置、显示设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101470806A (zh) * 2007-12-27 2009-07-01 东软集团股份有限公司 车灯检测方法和装置、感兴趣区域分割方法和装置
US20100232698A1 (en) * 2009-02-25 2010-09-16 The Government Of The United States Of America As Represented By The Secretary Of The Navy Computationally Efficient Method for Image Segmentation with Intensity and Texture Discrimination

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101470806A (zh) * 2007-12-27 2009-07-01 东软集团股份有限公司 车灯检测方法和装置、感兴趣区域分割方法和装置
US20100232698A1 (en) * 2009-02-25 2010-09-16 The Government Of The United States Of America As Represented By The Secretary Of The Navy Computationally Efficient Method for Image Segmentation with Intensity and Texture Discrimination

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
L.S.KARLSSON 等: "REGION-OF-INTEREST 3D VIDEO CODING BASED ON DEPTH IMAGES", 《3DTV-CON’08》, 30 May 2008 (2008-05-30), pages 141 - 144, XP031275231 *
夏召强 等: "基于边缘与深度特征的感兴趣区域检测技术", 《计算机仿真》, 31 July 2009 (2009-07-31), pages 248 - 251 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103414900A (zh) * 2013-08-24 2013-11-27 渭南高新区金石为开咨询有限公司 配置视频编码质量和分级传输视频数据的方法
CN103414900B (zh) * 2013-08-24 2016-06-29 倪效宽 配置视频编码质量和分级传输视频数据的方法
CN106340024A (zh) * 2016-08-30 2017-01-18 厦门美图之家科技有限公司 一种图像分割方法、应用和计算设备
CN106340024B (zh) * 2016-08-30 2019-07-02 厦门美图之家科技有限公司 一种图像分割方法、应用和计算设备
CN109492454A (zh) * 2017-09-11 2019-03-19 比亚迪股份有限公司 对象识别方法及装置
CN107943389A (zh) * 2017-11-14 2018-04-20 维沃移动通信有限公司 一种图像处理方法和移动终端
CN110728173A (zh) * 2019-08-26 2020-01-24 华北石油通信有限公司 基于感兴趣目标显著性检测的视频传输方法和装置
WO2022022348A1 (zh) * 2020-07-28 2022-02-03 阿里巴巴集团控股有限公司 视频压缩方法、解压方法、装置、电子设备及存储介质
CN114189670A (zh) * 2020-09-15 2022-03-15 北京小米移动软件有限公司 显示方法、显示装置、显示设备及存储介质
CN114189670B (zh) * 2020-09-15 2024-01-23 北京小米移动软件有限公司 显示方法、显示装置、显示设备及存储介质
CN112750109A (zh) * 2021-01-14 2021-05-04 金陵科技学院 一种基于形态学和深度学习的制药设备安全监测模型
CN112750109B (zh) * 2021-01-14 2023-06-30 金陵科技学院 一种基于形态学和深度学习的制药设备安全监测方法

Also Published As

Publication number Publication date
CN103077542B (zh) 2016-03-02

Similar Documents

Publication Publication Date Title
CN103077542B (zh) 一种深度图的感兴趣区域压缩方法
CN104869387B (zh) 基于光流法的双目图像最大视差获取方法
CN101282492B (zh) 三维影像显示深度调整方法
Čech et al. Scene flow estimation by growing correspondence seeds
CN102271262B (zh) 用于3d显示的基于多线索的视频处理方法
CN102972038B (zh) 图像处理装置、图像处理方法、程序、集成电路
CN104156957B (zh) 一种稳定高效的高分辨率立体匹配方法
CN103957397B (zh) 一种基于图像特征的低分辨率深度图像上采样方法
CN104077808A (zh) 一种用于计算机图形图像处理的、基于深度信息的实时三维人脸建模方法
CN102263979B (zh) 一种平面视频立体化的深度图生成方法及装置
CN101527043B (zh) 基于运动目标轮廓信息的视频对象分割方法
CN101873509B (zh) 消除深度图序列背景和边缘抖动的方法
CN103440664B (zh) 一种生成高分辨率深度图的方法、系统及计算设备
CN102420985B (zh) 一种多视点视频对象提取方法
CN104680496A (zh) 一种基于彩色图像分割的Kinect深度图修复方法
CN101542529A (zh) 图像的深度图的生成
CN101588445A (zh) 一种基于深度的视频感兴趣区域提取方法
CN103428514B (zh) 深度图产生装置及方法
CN104270624B (zh) 一种分区域的3d视频映射方法
CN103985128A (zh) 一种基于颜色内相关和自适应支撑权重的立体匹配方法
CN101605271A (zh) 一种基于单幅图像的2d转3d方法
CN104010180A (zh) 三维视频滤波方法和装置
CN103763564A (zh) 基于边缘无损压缩的深度图编码方法
CN101557534A (zh) 一种从视频相近帧中生成视差图的方法
CN104301706A (zh) 一种增强裸眼立体显示效果的合成方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190611

Address after: 150000 Heilongjiang Harbin Dalian economic and Trade Zone, the North Road and Xingkai Road intersection

Patentee after: Harbin University of Technology Robot Group Co., Ltd.

Address before: 150001 No. 92 West straight street, Nangang District, Heilongjiang, Harbin

Patentee before: Harbin Institute of Technology

TR01 Transfer of patent right