CN102722862B - 采用优化技术的单张图片半自动二维转三维方法和装置 - Google Patents
采用优化技术的单张图片半自动二维转三维方法和装置 Download PDFInfo
- Publication number
- CN102722862B CN102722862B CN201210160138.9A CN201210160138A CN102722862B CN 102722862 B CN102722862 B CN 102722862B CN 201210160138 A CN201210160138 A CN 201210160138A CN 102722862 B CN102722862 B CN 102722862B
- Authority
- CN
- China
- Prior art keywords
- depth
- picture
- pixel
- value
- tri
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Processing Or Creating Images (AREA)
- Image Generation (AREA)
Abstract
本发明提供一种将单幅二维图片转换成三维图片的半自动转换方法和装置。该方法首先需要用户设定一些代表像素的深度值,然后将整个图片的深度图求解问题建模成一个有约束的优化问题,采用最小二乘算法求得此优化问题的最优解。本发明提出的半自动转换方法只需用户少量的参与就能获得较高质量的深度图,从而能转换出高质量的三维图片,在三维内容生成领域有广泛的应用价值。
Description
技术领域
本发明涉及二维图片到三维图片的半自动转换技术,属于图像、多媒体信号处理技术领域。
背景技术
由于三维视频内容的短缺,二维视频到三维视频的转换技术越来越成为研究热点。自动的转换技术虽然不用人工参与,但是得到的三维效果还不能满足人们的要求,与其相比,半自动的转换技术通过增加少量的人力,却能得到更为准确的深度图,因此,这种方法普遍被人接受。
在半自动的二维视频到三维视频转换系统中,一般的做法是:先是对整个视频提取关键帧,然后人工设定关键帧的深度,最后根据非关键帧与关键帧的相关性,通过深度传播算法插值出非关键帧的深度。在这个过程中,关键帧的深度分配至关重要。关键帧的深度分配属于单幅图片的深度分配,如何快速方便而且准确的为图片分配深度,许多研究者都提出了不同的方法。
所有方法的目的都是一致的,即采用最少和最方便的人工输入得到最好的深度质量。Xun Cao等人采用的是基于分割的单幅图片的二维-三维转换,该方法先利用人工辅助进行图像分割,然后针对每个分割的物体的特征,采用合适的深度模型对其进行分配深度。但是如果图片中的物体数量太多,那么这种方法势必需要大量的人工参与,而且该方法依赖于图像分割算法的性能。Xi Yan等提出一种基于T-型结的深度传播算法。该算法需要用户设定一些代表性像素的深度值和T-型结的大概位置,然后深度传播算法结合这些先验知识,颜色和边缘信息得到整个图的深度。该方法能得到较好的深度图,但是需要用户了解T-型结的定义,而且算法也依赖于T-型结点的精确定位。
本发明针对当前算法用户输入复杂,算法对其他算法的依赖性强等缺点,提出一种基于优化方法的单幅图半自动二维转三维方法。该方法只需用户简单的设定代表像素的深度值,就能得到整个图片的深度,简单方便,而且不需要用户学习任何相关的专业知识也不依赖其他算法的性能。
发明内容
本发明的二维图片到三维图片的半自动转换方法,根据单幅图片中的深度一致性原理,将单幅图片的深度分配问题建模成一个有约束的优化问题并求解,具体步骤为:
(1)根据图片场景的结构特征和场景中物体的深度特性,人工选定若干在深度上具有代表性的代表像素,并为选出的代表像素设定相应的深度值;
(2)以步骤(1)中人工设定的代表像素的深度值为约束条件,通过最小化代表像素的深度值与其相邻像素的加权深度之间的差异,求得整幅图片全部像素的深度值,从而得到该幅图片的深度图;
(3)根据步骤(2)中得到的该幅图片的深度图,通过基于深度的渲染技术得到高质量的三维图片。
本发明的二维图片到三维图片的半自动转换装置,包括如下组成部分:
(1)深度值人工设定模块,该模块将图片进行显示,并提供操作界面,使用户能够在单幅图片上人工选定若干在深度上具有代表性的代表像素,并为选出的代表像素设定相应的深度值;
(2)深度图计算模块,该模块以人工设定的代表像素的深度值为约束条件,通过最小化代表像素的深度值与其相邻像素的加权深度之间的差异,求得整幅图片全部像素的深度值,从而得到该幅图片的深度图;
(3)三维图片形成模块,该模块根据该幅图片的深度图,通过基于深度的渲染技术得到高质量的三维图片。
附图说明
图1是根据本发明开发的软件界面;
图2是本发明针对一些测试图片得到的深度图,其中第一列是原始图片并带有用户设定的代表像素的深度值,第二列是本发明得到的整个图片的深度图。
具体实施方式
本发明的半自动二维转三维方法,先要求用户通过直观观察,根据图片场景的结构特征和场景中物体的深度特性,人工选定若干在深度上具有代表性的代表像素,并为选出的代表像素设定相应的深度值。具体实现时,可采用涂鸦的方式在计算机显示屏上为图片设定一些代表像素的深度值,然后本发明将图片的深度计算建模成一个有约束的优化问题,通过最小二乘算法求解该问题。
图1是根据本发明开发的友好用户界面。该界面不仅能辅助用户方便快速地设定一些代表像素的深度值,而且用户只需单击“Extract Depth”按钮就能完成整个深度问题的建模和求解过程。此外,该界面还有保存结果,重置结果,擦除错误的深度设定等额外功能。
对照图1中的界面,本发明的二维转三维装置包括以下模块:
1.深度值人工设定模块:该模块将图片进行显示,并提供操作界面,是用户能够根据输入图片的特征,人为的设定一些代表像素的深度,该模块的实现流程如下:
(1)单击界面中的“Open Image”按钮,选择要处理的图片,图片将显示在界面中;
(2)在“Gray Level”下选定一个深度等级,该深度等级也可以在下面的编辑框中手动输入,深度等级一共有0到255这256个层次;
(3)鼠标在显示的图片中划线,画出的线所在像素的深度值就是在第(2)步中选定的深度值;
(4)重复步骤(2)和(3),直到所有的代表像素设定完毕。
2.深度图计算模块:将问题建模成一个有约束的优化问题并求解,具体实现流程如下:
(1)根据单幅图片中的深度一致性原理,即如果相邻像素的颜色值或亮度值类似,那么他们的深度值也要保持一致,本发明将单幅图片的深度分配问题建模成一个有约束的优化问题。假设图像中的像素表示为r,优化函数通过最小化像素r的深度与其相邻像素的加权深度之间的差异来实现,约束条件是用户设定的N个像素的深度值,N的取值随着图片的不同场景特征而变化。该优化问题的完整的公式表达如下:
sub.to D(ri)=di,i=1,2,…
这里D(r)表示像素r的深度值,di是用户设定的深度值,N(r)是像素r的邻域窗口,s是r邻域窗口中的像素,wrs是一个归一化的加权函数,该函数有个特点:如果r和s的亮度值越相近那么加权值就越大,反之,加权值就越小。实验中我们采用的加权函数如下:
公式(2)中,Y(r)是指像素r的亮度值,σr是邻域窗口的像素灰度值的方差。
(2)采用最小二乘算法求得优化问题(1)的最优解。图2展示了一些测试图片的深度图片。由上述结果可知,采用本方法得到的深度图质量较高。
3.三维图片形成模块:根据得到的整幅图片的深度图,通过基于深度的渲染技术(DIBR)得到高质量的三维图片。
Claims (10)
1.一种二维图片到三维图片的半自动转换方法,该方法根据单幅图片中的深度一致性原理,将单幅图片的深度分配问题建模成一个有约束的优化问题并求解,具体步骤为:
(1)根据图片场景的结构特征和场景中物体的深度特性,人工根据直观观察选定若干在深度上具有代表性的代表像素,并为选出的代表像素设定相应的深度值;
(2)以步骤(1)中人工设定的代表像素的深度值为约束条件,通过最小化代表像素的深度值与其相邻像素的加权深度之间的差异,建立并求解优化问题的方程,求得整幅图片全部像素的深度值,从而得到该幅图片的深度图,优化问题的方程为:约束条件为:D(ri)=di,i=1,2,…,N,其中在求相邻像素的加权深度时,采用公式作为加权函数计算权重,其中,D(r)表示像素r的深度值,di是用户设定的深度值,N(r)是像素r的邻域窗口,s是r邻域窗口中的像素,ωrs是一个归一化的加权函数,加权函数中,Y(r)是指像素r的亮度值,Y(s)是指r邻域窗口中的像素s的亮度值,σr是领域窗口的像素灰度值的方差;
(3)根据步骤(2)中得到的该幅图片的深度图,通过基于深度的渲染技术得到高质量的三维图片。
2.根据权利要求1所述的二维图片到三维图片的半自动转换方法,其特征是:步骤(1)中,通过将图片显示在计算机显示屏上,采用用鼠标划过欲选定的代表像素并选中的方式完成对代表像素的选定。
3.根据权利要求1所述的二维图片到三维图片的半自动转换方法,其特征是:步骤(1)中,对代表像素深度值的设定是通过选择若干深度等级中的相应等级完成的。
4.根据权利要求1至3中任意一项所述的二维图片到三维图片的半自动转换方法,其特征是:步骤(2)中的优化问题采用最小二乘算法求解。
5.根据权利要求4所述的二维图片到三维图片的半自动转换方法,其特征是:步骤(2)中加权函数的选取满足如下条件:选定像素与其邻域像素之间的亮度值越相近则加权值越大。
6.一种二维图片到三维图片的半自动转换装置,该装置包括如下组成部分:
(1)深度值人工设定模块,该模块将图片进行显示,并提供操作界面,使用户能够在单幅图片上人工选定若干在深度上具有代表性的代表像素,并为选出的代表像素设定相应的深度值;
(2)深度图计算模块,该模块以人工设定的代表像素的深度值为约束条件,通过最小化代表像素的深度值与其相邻像素的加权深度之间的差异,建立并求解优化问题的方程,求得整幅图片全部像素的深度值,从而得到该幅图片的深度图,优化问题的方程为:约束条件为:D(ri)=di,i=1,2,…,N,其中在求相邻像素的加权深度时,采用公式作为加权函数计算权重,其中,D(r)表示像素r的深度值,di是用户设定的深度值,N(r)是像素r的邻域窗口,s是r邻域窗口中的像素,ωrs是一个归一化的加权函数,加权函数中,Y(r)是指像素r的亮度值,Y(s)是指r邻域窗口中的像素s的亮度值,σr是领域窗口的像素灰度值的方差;
(3)三维图片形成模块,该模块根据该幅图片的深度图,通过基于深度的渲染技术得到高质量的三维图片。
7.根据权利要求6所述的二维图片到三维图片的半自动转换装置,其特征在于:深度值人工设定模块将图片显示在计算机显示屏上,使用户能够根据主观观察场景结构和深度特性采用用鼠标划过欲选定的代表像素并选中的方式完成对代表像素的选定。
8.根据权利要求6所述的二维图片到三维图片的半自动转换装置,其特征在于:深度值人工设定模块使用户能够通过选择若干深度等级中的相应等级来完成对代表像素深度值的设定。
9.根据权利要求6至8中任意一项所述的二维图片到三维图片的半自动转换装置,其特征在于:深度图计算模块中,采用最小二乘算法求解优化问题。
10.根据权利要求9所述的二维图片到三维图片的半自动转换装置,其特征在于:深度图计算模块中,加权函数的选取满足如下条件:选定像素与其邻域像素之间的亮度值越相近则加权值越大。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210160138.9A CN102722862B (zh) | 2012-05-22 | 2012-05-22 | 采用优化技术的单张图片半自动二维转三维方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210160138.9A CN102722862B (zh) | 2012-05-22 | 2012-05-22 | 采用优化技术的单张图片半自动二维转三维方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102722862A CN102722862A (zh) | 2012-10-10 |
CN102722862B true CN102722862B (zh) | 2014-08-20 |
Family
ID=46948609
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210160138.9A Expired - Fee Related CN102722862B (zh) | 2012-05-22 | 2012-05-22 | 采用优化技术的单张图片半自动二维转三维方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102722862B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103916658B (zh) * | 2014-04-18 | 2015-08-05 | 山东大学 | 采用深度传播技术的3dv系统视点间深度图生成方法 |
CN104200525B (zh) * | 2014-09-12 | 2017-04-19 | 清华大学 | 基于挤压物体图像的三维建模方法及系统 |
CN107172416A (zh) * | 2017-06-26 | 2017-09-15 | 上海与德科技有限公司 | 一种裸眼3d显示屏、方法及装置 |
CN111541907B (zh) * | 2020-04-23 | 2023-09-22 | 腾讯科技(深圳)有限公司 | 物品显示方法、装置、设备及存储介质 |
CN112561793B (zh) * | 2021-01-18 | 2021-07-06 | 深圳市图南文化设计有限公司 | 一种平面设计空间转换方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101015220A (zh) * | 2004-09-10 | 2007-08-08 | 江良一成 | 三维图像再现设备 |
CN101635859A (zh) * | 2009-08-21 | 2010-01-27 | 清华大学 | 一种实现平面视频转立体视频的方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101491556B1 (ko) * | 2008-12-02 | 2015-02-09 | 삼성전자주식회사 | 깊이 추정 장치 및 방법 |
-
2012
- 2012-05-22 CN CN201210160138.9A patent/CN102722862B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101015220A (zh) * | 2004-09-10 | 2007-08-08 | 江良一成 | 三维图像再现设备 |
CN101635859A (zh) * | 2009-08-21 | 2010-01-27 | 清华大学 | 一种实现平面视频转立体视频的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN102722862A (zh) | 2012-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102722862B (zh) | 采用优化技术的单张图片半自动二维转三维方法和装置 | |
CN110728707B (zh) | 基于非对称深度卷积神经网络的多视角深度预测方法 | |
CN108961152B (zh) | 平面户型图生成方法和装置 | |
CN104376529B (zh) | 一种基于glcm的灰度图像彩色化系统和方法 | |
Tabrizian et al. | Modeling restorative potential of urban environments by coupling viewscape analysis of lidar data with experiments in immersive virtual environments | |
CN107316286B (zh) | 一种图像中雨雾同步合成、去除的方法和装置 | |
CN114004754B (zh) | 一种基于深度学习的场景深度补全系统及方法 | |
CN103218619A (zh) | 一种图像美学评价方法 | |
CN103177451B (zh) | 基于图像边缘的自适应窗口和权重的立体匹配算法 | |
CN102542593A (zh) | 一种基于视频解译的交互式视频风格化渲染方法 | |
CN108305266A (zh) | 基于条件随机场图结构学习的语义图像分割方法 | |
CN103617596A (zh) | 一种基于流型转换的图像色彩风格变换方法 | |
CN104103052A (zh) | 一种基于稀疏表示的图像超分辨率重建方法 | |
CN101710418A (zh) | 基于测地距离的交互方式图象分割方法 | |
CN103281554A (zh) | 一种基于人眼视觉特性的视频客观质量评价方法 | |
CN113963081B (zh) | 一种基于图卷积网络的图像图表智能合成方法 | |
CN105654465A (zh) | 一种采用视差补偿视点间滤波的立体图像质量评价方法 | |
CN103260043A (zh) | 基于学习的双目立体图像匹配方法及系统 | |
CN110782448A (zh) | 渲染图像的评价方法及装置 | |
CN109887008A (zh) | 基于前后向平滑和o(1)复杂度视差立体匹配方法、装置和设备 | |
CN103106671B (zh) | 一种基于视觉注意机制的图像感兴趣区域检测方法 | |
CN104361583A (zh) | 一种非对称失真立体图像客观质量评价方法 | |
CN103108209B (zh) | 基于视觉阈值与通道融合的立体图像客观质量评价方法 | |
CN105488792B (zh) | 基于字典学习和机器学习的无参考立体图像质量评价方法 | |
CN104143203A (zh) | 一种图像编辑传播方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140820 Termination date: 20150522 |
|
EXPY | Termination of patent right or utility model |