CN102722862A - 采用优化技术的单张图片半自动二维转三维方法和装置 - Google Patents

采用优化技术的单张图片半自动二维转三维方法和装置 Download PDF

Info

Publication number
CN102722862A
CN102722862A CN2012101601389A CN201210160138A CN102722862A CN 102722862 A CN102722862 A CN 102722862A CN 2012101601389 A CN2012101601389 A CN 2012101601389A CN 201210160138 A CN201210160138 A CN 201210160138A CN 102722862 A CN102722862 A CN 102722862A
Authority
CN
China
Prior art keywords
picture
depth
tri
pixel
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101601389A
Other languages
English (en)
Other versions
CN102722862B (zh
Inventor
刘琚
王地长生
曹广昊
孙建德
任艳楠
葛川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN201210160138.9A priority Critical patent/CN102722862B/zh
Publication of CN102722862A publication Critical patent/CN102722862A/zh
Application granted granted Critical
Publication of CN102722862B publication Critical patent/CN102722862B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供一种将单幅二维图片转换成三维图片的半自动转换方法和装置。该方法首先需要用户设定一些代表像素的深度值,然后将整个图片的深度图求解问题建模成一个有约束的优化问题,采用最小二乘算法求得此优化问题的最优解。本发明提出的半自动转换方法只需用户少量的参与就能获得较高质量的深度图,从而能转换出高质量的三维图片,在三维内容生成领域有广泛的应用价值。

Description

采用优化技术的单张图片半自动二维转三维方法和装置
技术领域
本发明涉及二维图片到三维图片的半自动转换技术,属于图像、多媒体信号处理技术领域。
背景技术
由于三维视频内容的短缺,二维视频到三维视频的转换技术越来越成为研究热点。自动的转换技术虽然不用人工参与,但是得到的三维效果还不能满足人们的要求,与其相比,半自动的转换技术通过增加少量的人力,却能得到更为准确的深度图,因此,这种方法普遍被人接受。
在半自动的二维视频到三维视频转换系统中,一般的做法是:先是对整个视频提取关键帧,然后人工设定关键帧的深度,最后根据非关键帧与关键帧的相关性,通过深度传播算法插值出非关键帧的深度。在这个过程中,关键帧的深度分配至关重要。关键帧的深度分配属于单幅图片的深度分配,如何快速方便而且准确的为图片分配深度,许多研究者都提出了不同的方法。
所有方法的目的都是一致的,即采用最少和最方便的人工输入得到最好的深度质量。Xun Cao等人采用的是基于分割的单幅图片的二维-三维转换,该方法先利用人工辅助进行图像分割,然后针对每个分割的物体的特征,采用合适的深度模型对其进行分配深度。但是如果图片中的物体数量太多,那么这种方法势必需要大量的人工参与,而且该方法依赖于图像分割算法的性能。Xi Yan等提出一种基于T-型结的深度传播算法。该算法需要用户设定一些代表性像素的深度值和T-型结的大概位置,然后深度传播算法结合这些先验知识,颜色和边缘信息得到整个图的深度。该方法能得到较好的深度图,但是需要用户了解T-型结的定义,而且算法也依赖于T-型结点的精确定位。
本发明针对当前算法用户输入复杂,算法对其他算法的依赖性强等缺点,提出一种基于优化方法的单幅图半自动二维转三维方法。该方法只需用户简单的设定代表像素的深度值,就能得到整个图片的深度,简单方便,而且不需要用户学习任何相关的专业知识也不依赖其他算法的性能。
发明内容
本发明的二维图片到三维图片的半自动转换方法,根据单幅图片中的深度一致性原理,将单幅图片的深度分配问题建模成一个有约束的优化问题并求解,具体步骤为:
(1)根据图片场景的结构特征和场景中物体的深度特性,人工选定若干在深度上具有代表性的代表像素,并为选出的代表像素设定相应的深度值;
(2)以步骤(1)中人工设定的代表像素的深度值为约束条件,通过最小化代表像素的深度值与其相邻像素的加权深度之间的差异,求得整幅图片全部像素的深度值,从而得到该幅图片的深度图;
(3)根据步骤(2)中得到的该幅图片的深度图,通过基于深度的渲染技术得到高质量的三维图片。
本发明的二维图片到三维图片的半自动转换装置,包括如下组成部分:
(1)深度值人工设定模块,该模块将图片进行显示,并提供操作界面,使用户能够在单幅图片上人工选定若干在深度上具有代表性的代表像素,并为选出的代表像素设定相应的深度值;
(2)深度图计算模块,该模块以人工设定的代表像素的深度值为约束条件,通过最小化代表像素的深度值与其相邻像素的加权深度之间的差异,求得整幅图片全部像素的深度值,从而得到该幅图片的深度图;
(3)三维图片形成模块,该模块根据该幅图片的深度图,通过基于深度的渲染技术得到高质量的三维图片。
附图说明
图1是根据本发明开发的软件界面;
图2是本发明针对一些测试图片得到的深度图,其中第一列是原始图片并带有用户设定的代表像素的深度值,第二列是本发明得到的整个图片的深度图。
具体实施方式
本发明的半自动二维转三维方法,先要求用户通过直观观察,根据图片场景的结构特征和场景中物体的深度特性,人工选定若干在深度上具有代表性的代表像素,并为选出的代表像素设定相应的深度值。具体实现时,可采用涂鸦的方式在计算机显示屏上为图片设定一些代表像素的深度值,然后本发明将图片的深度计算建模成一个有约束的优化问题,通过最小二乘算法求解该问题。
图1是根据本发明开发的友好用户界面。该界面不仅能辅助用户方便快速地设定一些代表像素的深度值,而且用户只需单击“Extract Depth”按钮就能完成整个深度问题的建模和求解过程。此外,该界面还有保存结果,重置结果,擦除错误的深度设定等额外功能。
对照图1中的界面,本发明的二维转三维装置包括以下模块:
1.深度值人工设定模块:该模块将图片进行显示,并提供操作界面,是用户能够根据输入图片的特征,人为的设定一些代表像素的深度,该模块的实现流程如下:
(1)单击界面中的“Open Image”按钮,选择要处理的图片,图片将显示在界面中;
(2)在“Gray Level”下选定一个深度等级,该深度等级也可以在下面的编辑框中手动输入,深度等级一共有0到255这256个层次;
(3)鼠标在显示的图片中划线,画出的线所在像素的深度值就是在第(2)步中选定的深度值;
(4)重复步骤(2)和(3),直到所有的代表像素设定完毕。
2.深度图计算模块:将问题建模成一个有约束的优化问题并求解,具体实现流程如下:
(1)根据单幅图片中的深度一致性原理,即如果相邻像素的颜色值或亮度值类似,那么他们的深度值也要保持一致,本发明将单幅图片的深度分配问题建模成一个有约束的优化问题。假设图像中的像素表示为r,优化函数通过最小化像素r的深度与其相邻像素的加权深度之间的差异来实现,约束条件是用户设定的N个像素的深度值,N的取值随着图片的不同场景特征而变化。该优化问题的完整的公式表达如下:
min J ( D ) = Σ r ( D ( r ) - Σ s ∈ N ( r ) w rs D ( s ) ) 2 - - - ( 1 )
sub.to D(ri)=di,i=1,2,…
这里D(r)表示像素r的深度值,di是用户设定的深度值,N(r)是像素r的邻域窗口,s是r邻域窗口中的像素,wrs是一个归一化的加权函数,该函数有个特点:如果r和s的亮度值越相近那么加权值就越大,反之,加权值就越小。实验中我们采用的加权函数如下:
w rs = e - ( Y ( r ) - Y ( s ) ) / 2 σ r 2 - - - ( 2 )
公式(2)中,Y(r)是指像素r的亮度值,σr是邻域窗口的像素灰度值的方差。
(2)采用最小二乘算法求得优化问题(1)的最优解。图2展示了一些测试图片的深度图片。由上述结果可知,采用本方法得到的深度图质量较高。
3.三维图片形成模块:根据得到的整幅图片的深度图,通过基于深度的渲染技术(DIBR)得到高质量的三维图片。

Claims (10)

1.一种二维图片到三维图片的半自动转换方法,该方法根据单幅图片中的深度一致性原理,将单幅图片的深度分配问题建模成一个有约束的优化问题并求解,具体步骤为:
(1)根据图片场景的结构特征和场景中物体的深度特性,人工选定若干在深度上具有代表性的代表像素,并为选出的代表像素设定相应的深度值;
(2)以步骤(1)中人工设定的代表像素的深度值为约束条件,通过最小化代表像素的深度值与其相邻像素的加权深度之间的差异,求得整幅图片全部像素的深度值,从而得到该幅图片的深度图;
(3)根据步骤(2)中得到的该幅图片的深度图,通过基于深度的渲染技术得到高质量的三维图片。
2.根据权利要求1所述的二维图片到三维图片的半自动转换方法,其特征是:步骤(1)中,通过将图片显示在计算机显示屏上,采用用鼠标划过欲选定的代表像素并选中的方式完成对代表像素的选定。
3.根据权利要求1所述的二维图片到三维图片的半自动转换方法,其特征是:步骤(1)中,对代表像素深度值的设定是通过选择若干深度等级中的相应等级完成的。
4.根据权利要求1至3中任意一项所述的二维图片到三维图片的半自动转换方法,其特征是:步骤(2)中的优化问题采用最小二乘算法求解。
5.根据权利要求1至4中任意一项所述的二维图片到三维图片的半自动转换方法,其特征是:步骤(2)中加权函数的选取满足如下条件:选定像素与其邻域像素之间的亮度值越相近则加权值越大。
6.一种二维图片到三维图片的半自动转换装置,该装置包括如下组成部分:
(1)深度值人工设定模块,该模块将图片进行显示,并提供操作界面,使用户能够在单幅图片上人工选定若干在深度上具有代表性的代表像素,并为选出的代表像素设定相应的深度值;
(2)深度图计算模块,该模块以人工设定的代表像素的深度值为约束条件,通过最小化代表像素的深度值与其相邻像素的加权深度之间的差异,求得整幅图片全部像素的深度值,从而得到该幅图片的深度图;
(3)三维图片形成模块,该模块根据该幅图片的深度图,通过基于深度的渲染技术得到高质量的三维图片。
7.根据权利要求6所述的二维图片到三维图片的半自动转换装置,其特征在于:深度值人工设定模块将图片显示在计算机显示屏上,使用户能够采用用鼠标划过欲选定的代表像素并选中的方式完成对代表像素的选定。
8.根据权利要求6所述的二维图片到三维图片的半自动转换装置,其特征在于:深度值人工设定模块使用户能够通过选择若干深度等级中的相应等级来完成对代表像素深度值的设定。
9.根据权利要求6至8中任意一项所述的二维图片到三维图片的半自动转换装置,其特征在于:深度图计算模块中,采用最小二乘算法求解优化问题。
10.根据权利要求6至9中任意一项所述的二维图片到三维图片的半自动转换装置,其特征在于:深度图计算模块中,加权函数的选取满足如下条件:选定像素与其邻域像素之间的亮度值越相近则加权值越大。
CN201210160138.9A 2012-05-22 2012-05-22 采用优化技术的单张图片半自动二维转三维方法和装置 Expired - Fee Related CN102722862B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210160138.9A CN102722862B (zh) 2012-05-22 2012-05-22 采用优化技术的单张图片半自动二维转三维方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210160138.9A CN102722862B (zh) 2012-05-22 2012-05-22 采用优化技术的单张图片半自动二维转三维方法和装置

Publications (2)

Publication Number Publication Date
CN102722862A true CN102722862A (zh) 2012-10-10
CN102722862B CN102722862B (zh) 2014-08-20

Family

ID=46948609

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210160138.9A Expired - Fee Related CN102722862B (zh) 2012-05-22 2012-05-22 采用优化技术的单张图片半自动二维转三维方法和装置

Country Status (1)

Country Link
CN (1) CN102722862B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103916658A (zh) * 2014-04-18 2014-07-09 山东大学 采用深度传播技术的3dv系统视点间深度图生成方法
CN104200525B (zh) * 2014-09-12 2017-04-19 清华大学 基于挤压物体图像的三维建模方法及系统
CN107172416A (zh) * 2017-06-26 2017-09-15 上海与德科技有限公司 一种裸眼3d显示屏、方法及装置
CN112561793A (zh) * 2021-01-18 2021-03-26 深圳市图南文化设计有限公司 一种平面设计空间转换方法及系统
WO2021213067A1 (zh) * 2020-04-23 2021-10-28 腾讯科技(深圳)有限公司 物品显示方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101015220A (zh) * 2004-09-10 2007-08-08 江良一成 三维图像再现设备
CN101635859A (zh) * 2009-08-21 2010-01-27 清华大学 一种实现平面视频转立体视频的方法和装置
US20100135581A1 (en) * 2008-12-02 2010-06-03 Samsung Electronics Co., Ltd. Depth estimation apparatus and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101015220A (zh) * 2004-09-10 2007-08-08 江良一成 三维图像再现设备
US20100135581A1 (en) * 2008-12-02 2010-06-03 Samsung Electronics Co., Ltd. Depth estimation apparatus and method
CN101635859A (zh) * 2009-08-21 2010-01-27 清华大学 一种实现平面视频转立体视频的方法和装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103916658A (zh) * 2014-04-18 2014-07-09 山东大学 采用深度传播技术的3dv系统视点间深度图生成方法
CN104200525B (zh) * 2014-09-12 2017-04-19 清华大学 基于挤压物体图像的三维建模方法及系统
CN107172416A (zh) * 2017-06-26 2017-09-15 上海与德科技有限公司 一种裸眼3d显示屏、方法及装置
WO2021213067A1 (zh) * 2020-04-23 2021-10-28 腾讯科技(深圳)有限公司 物品显示方法、装置、设备及存储介质
CN112561793A (zh) * 2021-01-18 2021-03-26 深圳市图南文化设计有限公司 一种平面设计空间转换方法及系统
CN112561793B (zh) * 2021-01-18 2021-07-06 深圳市图南文化设计有限公司 一种平面设计空间转换方法及系统

Also Published As

Publication number Publication date
CN102722862B (zh) 2014-08-20

Similar Documents

Publication Publication Date Title
CN102722862B (zh) 采用优化技术的单张图片半自动二维转三维方法和装置
CN104376529B (zh) 一种基于glcm的灰度图像彩色化系统和方法
CN110728707B (zh) 基于非对称深度卷积神经网络的多视角深度预测方法
CN108961152B (zh) 平面户型图生成方法和装置
CN104036501A (zh) 一种基于稀疏表示的立体图像质量客观评价方法
CN110310317A (zh) 一种基于深度学习的单目视觉场景深度估计的方法
CN103281554B (zh) 一种基于人眼视觉特性的视频客观质量评价方法
CN105407349A (zh) 基于双目视觉感知的无参考立体图像质量客观评价方法
CN101699512A (zh) 一种基于背景差异抠图和稀疏光流法的深度的生成方法
CN103136748B (zh) 一种基于特征图的立体图像质量客观评价方法
CN109242834A (zh) 一种基于卷积神经网络的无参考立体图像质量评价方法
CN110349087A (zh) 基于适应性卷积的rgb-d图像高质量网格生成方法
CN114004754B (zh) 一种基于深度学习的场景深度补全系统及方法
CN110335350A (zh) 基于地形特征的虚拟地形生成方法
CN109146946A (zh) 一种图像非局部立体匹配方法
CN104182970A (zh) 一种基于摄影构图规则的留念照人像站位推荐方法
CN105654465A (zh) 一种采用视差补偿视点间滤波的立体图像质量评价方法
CN104361583B (zh) 一种确定非对称失真立体图像客观质量的方法
CN106447718B (zh) 一种2d转3d深度估计方法
CN102682115A (zh) 一种基于Voronoi图的点密度专题图制作方法
JP7244996B2 (ja) 人口統計データ作成装置及び人口統計データ作成プログラム
CN104166992A (zh) 基于网格变形的内容感知双目图像缩放方法
CN105488792B (zh) 基于字典学习和机器学习的无参考立体图像质量评价方法
CN106023152B (zh) 一种无参考立体图像质量客观评价方法
Wu et al. Towards Open-ended Visual Quality Comparison

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140820

Termination date: 20150522

EXPY Termination of patent right or utility model