CN102957923A - 立体影像深度图的校正系统及方法 - Google Patents
立体影像深度图的校正系统及方法 Download PDFInfo
- Publication number
- CN102957923A CN102957923A CN2011102514222A CN201110251422A CN102957923A CN 102957923 A CN102957923 A CN 102957923A CN 2011102514222 A CN2011102514222 A CN 2011102514222A CN 201110251422 A CN201110251422 A CN 201110251422A CN 102957923 A CN102957923 A CN 102957923A
- Authority
- CN
- China
- Prior art keywords
- depth map
- input image
- stereopsis
- object boundary
- boundary pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
Abstract
本发明是有关于一种立体影像深度图的校正系统及方法,空间频谱转换单元根据输入影像以萃取物体边界像素,其中该空间频谱转换单元使用希尔伯特黄转换(HHT)。校正单元根据物体边界像素,用以校正相应于输入影像的输入深度图,因而产生输出深度图。
Description
技术领域
本发明涉及一种立体影像处理,特别是涉及一种使用希尔伯特黄(Hilbert-Huang)转换以校正立体影像深度图的方法。
背景技术
立体(或三维)显示装置可将立体深度感知(percept ion)传递给观者。由于立体显示装置的逐渐普及,使得立体影像处理成为重要的课题。其中,深度图(depth map)在立体影像处理中更是占有重要地位。深度资讯的产生并没有一个标准作法,目前有许多方法可用以产生深度图,大致上可分为两类:使用单眼深度提示(monocular depth cue)的单眼影像方法,以及使用双眼像差(binocular disparity)的立体影像方法。
关于单眼影像方法,一般使用对比或/且模糊资讯以产生深度资讯。然而,位于物体边界的像素,所估算的深度图通常并不可靠。至于立体影像方法,一般使用阐述立体匹配(stereo matching)问题的信任传递(beliefpropagation)以产生深度资讯。然而,位于物体边界的像素,深度图的品质通常会降低。
因此,如何创设一种新颖的机制,用以改善深度图,因而提供优于传统方法的深度品质,实属当前重要研发课题之一,亦成为当前业界极需改进的目标。
发明内容
本发明的目的在于,提供一种立体影像深度图的校正系统及方法,用以强化空间频谱(spatial spectrum)的深度品质。
本发明的目的及解决其技术问题是采用以下技术方案来实现的。依据本发明提出的一种立体影像深度图的校正系统,其包含:一空间频谱转换单元,其根据一输入影像以萃取物体边界像素,其中该空间频谱转换单元使用希尔伯特黄转换(HHT);及一校正单元,其根据该物体边界像素,用以校正相应于该输入影像的一输入深度图,因而产生一输出深度图。
本发明的目的及解决其技术问题还可采用以下技术措施进一步实现。
前述的立体影像深度图的校正系统,其中所述的希尔伯特黄转换(HHT)使用经验模态分解(EMD)将该输入影像分解为多个本质模态函数(IMF),且频率低于一预设临界值的本质模态函数(IMF)的转变点定义为该物体边界像素。
前述的立体影像深度图的校正系统,其中所述的空间频谱转换单元分解该输入影像的列信号或该输入影像的行信号。
前述的立体影像深度图的校正系统,其中所述的校正单元根据该输入深度图及该物体边界像素,用以建构一最小生成树(minimal spanningtree)。
前述的立体影像深度图的校正系统,其中所述的最小生成树的建构包含以下步骤:分割该输入影像为多个巨集区块(MB);分别映射该多个巨集区块至一生成树的顶点,其中该巨集区块以边缘(edge)连接,且该边缘的权重定义为相邻二巨集区块之间的平均色彩差异值;以相邻二巨集区块之间的物体边界像素,切割该生成树为多个独立片段;及对于每一该片段,平均该片段相应的输入深度图的信息,因而得到一平均值,用以分派作为该输出深度图的新深度信息。
前述的立体影像深度图的校正系统,其还包含一改善单元,其根据该输入影像以改善该输出深度图。
前述的立体影像深度图的校正系统,其中所述的改善单元使用一交叉双测(cross-bilateral)滤波器以改善该输出深度图。
本发明的目的及解决其技术问题还采用以下技术方案来实现。依据本发明提出的一种立体影像深度图的校正方法,其包含以下步骤:根据一输入影像,使用一空间频谱转换以萃取物体边界像素,其中该空间频谱转换使用希尔伯特黄转换(HHT);及根据该物体边界像素,以校正相应于该输入影像的一输入深度图,因而产生一输出深度图。
本发明的目的及解决其技术问题还可采用以下技术措施进一步实现。
前述的立体影像深度图的校正方法,其中所述的希尔伯特黄转换(HHT)使用经验模态分解(EMD)将该输入影像分解为多个本质模态函数(IMF),且频率低于一预设临界值的本质模态函数(IMF)的转变点定义为该物体边界像素。
前述的立体影像深度图的校正方法,其中所述的空间频谱转换分解该输入影像的列信号或该输入影像的行信号。
前述的立体影像深度图的校正方法,其中所述的校正步骤根据该输入深度图及该物体边界像素,用以建构一最小生成树(minimal spanningtree)。
前述的立体影像深度图的校正方法,其中所述的最小生成树的建构包含以下步骤:分割该输入影像为多个巨集区块(MB);分别映射该多个巨集区块至一生成树的顶点,其中该巨集区块以边缘(edge)连接,且该边缘的权重定义为相邻二巨集区块之间的平均色彩差异值;以相邻二巨集区块之间的物体边界像素,切割该生成树为多个独立片段;及对于每一该片段,平均该片段相应的输入深度图的信息,因而得到一平均值,用以分派作为该输出深度图的新深度信息。
前述的立体影像深度图的校正方法,其还更包含一改善步骤,其根据该输入影像以改善该输出深度图。
前述的立体影像深度图的校正方法,其中所述的改善步骤使用一交叉双测(cross-bilateral)滤波器以改善该输出深度图。
本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明立体影像深度图的校正系统及方法至少具有下列优点及有益效果:本发明可用以强化空间频谱(spatial spectrum)的深度品质。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
图1显示本发明实施例的立体影像深度图的校正系统及方法的方块图。
图2A至图2C显示图1的校正单元的最小生成树图的建构示意图。
10:空间频谱转换单元 12:校正单元
14:改善单元 Din:输入深度图
Dout:输出深度图 I:输入影像
Q:像素集 MB:巨集区块
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的立体影像深度图的校正系统及方法其具体实施方式、结构、特征及其功效,详细说明如后。
图1显示本发明实施例的立体(三维)影像深度图的校正系统及方法的方块图。
首先,使用空间频谱转换单元10处理二维输入影像I,用以得到(或萃取)像素集Q,其由物体边界所组成。在本实施例中,空间频谱转换单元10使用希尔伯特黄(Hilbert-Huang)转换(HHT)。希尔伯特黄转换(HHT)提供一种方法以分解信号,特别是非稳态(nonstationary)及非线性信号,使其分解为本质模态函数(intrinsic mode function,IMF),因而获得瞬时频率(instantaneous frequency)信息。在希尔伯特黄转换(HHT)中,通常使用经验模态分解(empirical mode decomposition,EMD)将信号分解为多个元件或本质模态函数(IMF)。关于希尔伯特黄转换(HHT)及经验模态分解(EMD)的细节可参考黄(N.E.Huang)等人于Proc.of The RoyalSociety,vol.454,no.1971,pp.903-995,8Mar.1998所提出的“Theempirical mode decomposition and the Hilbert spectrum for nonlinearand nonstationary time series analysis”。
相较于其他的转换,例如傅力叶(Fourier)转换,希尔伯特黄转换(HHT)具可调适性且具较佳局部性(locality)。因此,得以提供适当资讯并藉由本质模态函数(IMF)以估算不同频率元件的转变点。藉此,较低频率的本质模态函数(IMF)的转变点可定义出物体边界,而较高频率的本质模态函数(IMF)则用以得到纹理。在本说明书中,较低频率的本质模态函数(IMF)是指频率低于预设临界值的本质模态函数(IMF)。
在本实施例中,并非对输入影像I直接进行二维分解,而是对输入影像I的列信号Hor或/且行信号Ver进行一维分解。列信号Hor及行信号Ver可定义如下:
HorI.k(x)=I(x,k),
VerI,m(y)=I(m,y)。
藉由分解可得到所有非负整数j的IMF(j,HorI,k(x))及IMF(j,VerI,m(y))。在本实施例中,像素集Q可定义如下:
Q={(x,y)|grad(x,y)>threhsold},
其中,p为定义低频本质模态函数(IMF)的预设临界值。
接下来,校正单元12根据像素集Q的物体边界,对相应于输入影像I的输入深度图Din进行自动校正,因而产生输出深度图Dout。在本实施例中,在校正单元12内建构最小生成树(minimal spanning tree)的图(graph)。详而言的,如图2A所例示,将输入影像I切割为多个巨集区块(macro block,MB),如图式中的4x4巨集区块。如图2B所示,该些巨集区块被分别映射至生成树的顶点。这些巨集区块藉由边缘(edge)予以连接,且边缘的权重则由相邻巨集区块之间的平均色彩差异值(mean colordifference)来定义。接着,使用相邻巨集区块之间的物体边界像素用以将生成树切割为多个互为独立的片段(segment),如第二C图所例示的三个独立片段。对于每一片段,相应的输入深度图Din的信息则予以平均,因而得到一平均值,用以分派作为输出深度图Dout的新深度信息。
再者,根据输入影像I,选择性使用改善单元14以处理输出深度图Dout。在本实施例中,改善单元14使用交叉双侧(cross-bilateral)滤波器。使用交叉双侧滤波器以进行信息改善的细节可参考Elmar Eisemann等人于ACM Transactions on Graphics,vol.23,no.3,pp.673-678,July2004所提出的“Fla sh photography enhancement via intrinsicrelighting”。
上述实施例提供一种强化空间频谱深度品质的自动深度校正方法。根据萃取的物体边界,本实施例的深度校正提供较传统方法(例如暗通道优先(dark channel prior)或立体匹配)更佳的改良效果。再者,本实施例还可适用于遮蔽(occlus ion)的处理。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (14)
1.一种立体影像深度图的校正系统,其特征在于其包含:
一空间频谱转换单元,其根据一输入影像以萃取物体边界像素,其中该空间频谱转换单元使用希尔伯特黄转换;及
一校正单元,其根据该物体边界像素,用以校正相应于该输入影像的一输入深度图,因而产生一输出深度图。
2.根据权利要求1所述的所述立体影像深度图的校正系统,其特征在于其中所述的希尔伯特黄转换使用经验模态分解将该输入影像分解为多个本质模态函数,且频率低于一预设临界值的本质模态函数的转变点定义为该物体边界像素。
3.根据权利要求1所述的所述立体影像深度图的校正系统,其特征在于其中所述的空间频谱转换单元分解该输入影像的列信号或该输入影像的行信号。
4.根据权利要求1所述的所述立体影像深度图的校正系统,其特征在于其中所述的校正单元根据该输入深度图及该物体边界像素,用以建构一最小生成树。
5.根据权利要求1所述的所述立体影像深度图的校正系统,其特征在于其中所述的最小生成树的建构包含以下步骤:
分割该输入影像为多个巨集区块;
分别映射该多个巨集区块至一生成树的顶点,其中该巨集区块以边缘连接,且该边缘的权重定义为相邻二巨集区块之间的平均色彩差异值;
以相邻二巨集区块之间的物体边界像素,切割该生成树为多个独立片段;及
对于每一该片段,平均该片段相应的输入深度图的信息,因而得到一平均值,用以分派作为该输出深度图的新深度信息。
6.根据权利要求1所述的所述立体影像深度图的校正系统,其特征在于其还包含一改善单元,其根据该输入影像以改善该输出深度图。
7.根据权利要求6所述的所述立体影像深度图的校正系统,其特征在于其中所述的改善单元使用一交叉双测滤波器以改善该输出深度图。
8.一种立体影像深度图的校正方法,其特征在于其包含以下步骤:
根据一输入影像,使用一空间频谱转换以萃取物体边界像素,其中该空间频谱转换使用希尔伯特黄转换;及
根据该物体边界像素,以校正相应于该输入影像的一输入深度图,因而产生一输出深度图。
9.根据权利要求8所述的立体影像深度图的校正方法,其特征在于其中所述的希尔伯特黄转换使用经验模态分解将该输入影像分解为多个本质模态函数,且频率低于一预设临界值的本质模态函数的转变点定义为该物体边界像素。
10.根据权利要求8所述的立体影像深度图的校正方法,其特征在于其中所述的空间频谱转换分解该输入影像的列信号或该输入影像的行信号。
11.根据权利要求8所述的立体影像深度图的校正方法,其特征在于其中所述的校正步骤根据该输入深度图及该物体边界像素,用以建构一最小生成树。
12.根据权利要求11所述的立体影像深度图的校正方法,其特征在于其中所述的最小生成树的建构包含以下步骤:
分割该输入影像为多个巨集区块;
分别映射该多个巨集区块至一生成树的顶点,其中该巨集区块以边缘连接,且该边缘的权重定义为相邻二巨集区块之间的平均色彩差异值;
以相邻二巨集区块之间的物体边界像素,切割该生成树为多个独立片段;及
对于每一该片段,平均该片段相应的输入深度图的信息,因而得到一平均值,用以分派作为该输出深度图的新深度信息。
13.根据权利要求8所述的立体影像深度图的校正方法,其特征在于其还更包含一改善步骤,其根据该输入影像以改善该输出深度图。
14.根据权利要求13所述的立体影像深度图的校正方法,其特征在于其中所述的改善步骤使用一交叉双测滤波器以改善该输出深度图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110251422.2A CN102957923B (zh) | 2011-08-24 | 2011-08-24 | 立体影像深度图的校正系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110251422.2A CN102957923B (zh) | 2011-08-24 | 2011-08-24 | 立体影像深度图的校正系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102957923A true CN102957923A (zh) | 2013-03-06 |
CN102957923B CN102957923B (zh) | 2015-06-03 |
Family
ID=47766078
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110251422.2A Active CN102957923B (zh) | 2011-08-24 | 2011-08-24 | 立体影像深度图的校正系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102957923B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104767986A (zh) * | 2014-01-02 | 2015-07-08 | 财团法人工业技术研究院 | 景深图校正方法及系统 |
CN104796684A (zh) * | 2015-03-24 | 2015-07-22 | 深圳市广之爱文化传播有限公司 | 裸眼3d视频处理方法 |
CN105141937A (zh) * | 2015-06-29 | 2015-12-09 | 西安交通大学 | 一种基于二维经验模式分解的自适应立体视差估计方法 |
US9462251B2 (en) | 2014-01-02 | 2016-10-04 | Industrial Technology Research Institute | Depth map aligning method and system |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060038891A1 (en) * | 2003-01-31 | 2006-02-23 | Masatoshi Okutomi | Method for creating high resolution color image, system for creating high resolution color image and program creating high resolution color image |
CN101751661A (zh) * | 2008-12-01 | 2010-06-23 | 奇景光电股份有限公司 | 深度相关的影像加强系统及方法 |
CN102075780A (zh) * | 2011-02-25 | 2011-05-25 | 福建华映显示科技有限公司 | 立体影像产生装置及其方法 |
CN102098526A (zh) * | 2011-01-28 | 2011-06-15 | 清华大学 | 一种深度图求取方法及装置 |
-
2011
- 2011-08-24 CN CN201110251422.2A patent/CN102957923B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060038891A1 (en) * | 2003-01-31 | 2006-02-23 | Masatoshi Okutomi | Method for creating high resolution color image, system for creating high resolution color image and program creating high resolution color image |
CN101751661A (zh) * | 2008-12-01 | 2010-06-23 | 奇景光电股份有限公司 | 深度相关的影像加强系统及方法 |
CN102098526A (zh) * | 2011-01-28 | 2011-06-15 | 清华大学 | 一种深度图求取方法及装置 |
CN102075780A (zh) * | 2011-02-25 | 2011-05-25 | 福建华映显示科技有限公司 | 立体影像产生装置及其方法 |
Non-Patent Citations (2)
Title |
---|
ANASTASIOS D.DOULAMIS,NIKOLAOS D.DOULAMIS ETC: "Unsupervised Semantic Object Segmentation of Stereoscopic Video Sequences", 《INFORMATION INTELLIGENCE AND SYSTEMS》 * |
DONGFENG HAN,WENHUI LI,WU GUO,ZONGCHENG LI: "Hilbert-Huang Transform-based Local Regions Descriptors", 《BRITISH MACHINE VISION CONFERENCE》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104767986A (zh) * | 2014-01-02 | 2015-07-08 | 财团法人工业技术研究院 | 景深图校正方法及系统 |
US9462251B2 (en) | 2014-01-02 | 2016-10-04 | Industrial Technology Research Institute | Depth map aligning method and system |
CN104796684A (zh) * | 2015-03-24 | 2015-07-22 | 深圳市广之爱文化传播有限公司 | 裸眼3d视频处理方法 |
CN105141937A (zh) * | 2015-06-29 | 2015-12-09 | 西安交通大学 | 一种基于二维经验模式分解的自适应立体视差估计方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102957923B (zh) | 2015-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108921799B (zh) | 基于多尺度协同学习卷积神经网络的遥感图像薄云去除方法 | |
CN109472260B (zh) | 一种基于深度神经网络的移除图像内台标和字幕的方法 | |
CN105989322B (zh) | 一种基于高分辨率遥感影像的多指标融合滑坡检测方法 | |
CN102077244B (zh) | 用于在基于至少两个图像而估算的深度图或视差图的掩蔽域中进行填充的方法和装置 | |
CN109785236B (zh) | 一种基于超像素和卷积神经网络的图像超分辨方法 | |
CN102957923B (zh) | 立体影像深度图的校正系统及方法 | |
JP2011223566A (ja) | 画像変換装置及びこれを含む立体画像表示装置 | |
CN104574404A (zh) | 一种立体图像重定位方法 | |
CN107564078B (zh) | 一种带有干扰像素的栅格分区图自动矢量化方法 | |
CN103606134A (zh) | 一种弱光照视频图像的增强方法 | |
CN108921942A (zh) | 对图像进行2d转制3d的方法及装置 | |
CN103136748A (zh) | 一种基于特征图的立体图像质量客观评价方法 | |
CN103971120A (zh) | 基于空时极向局部二值模式的极光图像序列分类方法 | |
CN103955907A (zh) | 指针式sf6气体密度表的遥测方法 | |
US8655054B2 (en) | System and method of correcting a depth map for 3D image | |
CN103905812A (zh) | 一种纹理/深度联合上采样方法 | |
CN103108209B (zh) | 基于视觉阈值与通道融合的立体图像客观质量评价方法 | |
CN104463968A (zh) | 基于电网gis三维平台的遥感影像双目立体视觉匹配及三维重建方法 | |
CN101610422A (zh) | 立体图像视频序列压缩方法 | |
CN103854248A (zh) | 基于内容解析和感知分层的水印嵌入方法及装置 | |
CN102999911A (zh) | 一种基于能量图的立体图像质量客观评价方法 | |
CN109697693A (zh) | 一种实现基于大数据空间运算的方法 | |
CN104732508A (zh) | 基于分布式压缩感知的图像融合方法 | |
CN110958449B (zh) | 三维视频主观感知质量预测方法 | |
CN114743245A (zh) | 增强模型的训练方法、图像处理方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |