CN111932658B - 一种流形结构保持的360度全景图像的高效编辑扩散方法 - Google Patents

一种流形结构保持的360度全景图像的高效编辑扩散方法 Download PDF

Info

Publication number
CN111932658B
CN111932658B CN202010691142.2A CN202010691142A CN111932658B CN 111932658 B CN111932658 B CN 111932658B CN 202010691142 A CN202010691142 A CN 202010691142A CN 111932658 B CN111932658 B CN 111932658B
Authority
CN
China
Prior art keywords
editing
pixel
diffusion
image
degree panoramic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010691142.2A
Other languages
English (en)
Other versions
CN111932658A (zh
Inventor
张赟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Media and Communications
Original Assignee
Zhejiang University of Media and Communications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Media and Communications filed Critical Zhejiang University of Media and Communications
Priority to CN202010691142.2A priority Critical patent/CN111932658B/zh
Publication of CN111932658A publication Critical patent/CN111932658A/zh
Application granted granted Critical
Publication of CN111932658B publication Critical patent/CN111932658B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/40Filling a planar surface by adding surface attributes, e.g. colour or texture

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种流形结构保持的360度全景图像的编辑扩散方法,包括:S1,将平面图像映射到球面坐标;S2,建立360度全景图像的球面流形;S3,基于球面流形保持的编辑扩散;S4,基于多分辨率的高效编辑扩散。该方法能够将用户的简单笔画上的编辑操作快速准确地在球面上进行传播,实现360度全景图的交互式高效编辑。

Description

一种流形结构保持的360度全景图像的高效编辑扩散方法
技术领域
本发明属于图像编辑和虚拟现实技术领域,具体涉及一种流形结构保持的360度全景图像的高效编辑扩散方法。
背景技术
编辑扩散最早由An和Pellacini提出,该方法提出了一种简单直观的交互手段用于图像编辑,用户只需在图像上添加简单笔画表明编辑意图,算法就可以自动地将编辑扩散到整个图像,其核心是基于用户编辑以及像素间的相似性构建能量方程,通过求解线性方程组得到编辑结果。为了提升编辑扩散的计算速度,学者们先后提出了基于K-D树、四叉树、RBF等插值方法。为了提升编辑的视觉效果,Ma等人将反走样方法应用于编辑扩散,能够改善先前编辑扩散在图像边缘颜色的错误混合。Chen等人提出了基于流形保持的编辑扩散方法,该方法将每个像素表示成近邻像素的线性组合,能够生成高质量的编辑扩散结果,并且从根本上解决了颜色混合问题。
近年来,基于机器学习的方法开始广泛应用于图像编辑。Oh等人将编辑扩散问题构造成分类问题并能够通过SVM高效求解。Chen等人提出了使用稀疏字典学习方法能够灵活地实现图像上色并保持图像内部的颜色特征。Endo等人对用户的编辑笔画进行深度神经网络训练,并通过训练的模型来决定编辑扩散的结果。
360度全景图像能够展示360度场景的内容,目前广泛应用于虚拟现实。用户使用可穿戴设备如Oculus Rift,HTC Vive等,通过拖拽或转动头部实现交互式浏览。如果直接将以上普通图像编辑的方法直接应用于全景图像会引起诸多问题,原因在于360度全景图通常定义于球面且包含更宽广视角下的图像内容,直接应用2D图像的编辑方法难以保证左右边界的连续性、球面两极点附近的正常扩散以及编辑扩散的计算效率。
为了较好地实现360度全景图像的编辑扩散,需要充分考虑其球面的几何属性,重新在球面上定义各像素的流形结构,从而实现编辑笔画在球面上的正确传播。
发明内容
本发明要解决的技术问题是提供一种流形结构保持的360度全景图像的高效编辑扩散方法,该方法在球面上定义流形结构,通过构建全局能量优化实现高效的编辑传播。
为了解决上述技术问题,本发明采用如下技术方案:
一种流形结构保持的360度全景图像的高效编辑扩散方法,包括以下步骤:
S1,将平面图像映射到球面坐标,具体为,以等效矩形的图像为输入,提取出其颜色和位置信息,然后将平面上的像素点映射到球面并转换成对应的经纬度,并进一步转换为单位球体上的3D坐标;
S2,建立360度全景图像的球面流形,具体为,对每个像素,用颜色和3D坐标组成的高维特征向量表示其特征,并通过高维向量之间的欧氏距离度量像素间的相似度,然后基于该度量进一步寻找每个像素的K个最近邻,最后通过求解基于局部线性嵌入约束的优化得到K近邻的相应权值,从而将任意一个像素表示为K个邻近像素的线性组合;
S3,基于球面流形保持的编辑扩散,具体为,给定用户编辑的笔画和相应的编辑参数,建立能量优化函数实现编辑扩散,其约束为保持用户笔画上的编辑和每个像素的流形结构;
S4,基于多分辨率的高效编辑扩散,具体为,对于超高分辨率的全景图输入,首先将图像进行下采样,并在下采样的图像上进行编辑扩散,然后对编辑扩散的结果进行上采样,并通过导向性滤波进行编辑结果提升,最后结合原输入图像渲染出高质量编辑结果。
优选地,步骤2所述的流形结构中,近邻数量根据像素与近邻的相似度和球面坐标上该像素的纬度自适应调整,公式如下:
Figure BDA0002589413430000031
其中θ是纬度,a是常量,通常取0.6,di是邻域像素与中心像素在特征空间的距离,dmin和dmax是该距离的最小和最大值,Kmin和Kmax给出了近邻数量的取值范围。
优选地,步骤2所述的流形结构中,每个近邻的权值进一步根据近邻与中心像素点的相似度进行调整,使得相似近邻的权值更大,公式如下:
Figure BDA0002589413430000032
其中,ζij=1-S(D(fi,fj)),β是通常取0.5,S()是Sigmoid函数,D(fi,fj)表示两像素的特征向量之间的距离,由两像素的颜色距离和大圆距离之和组成,wi,j为每个近邻像素的权值。
优选地,步骤3所述的能量优化的求解能够通过K-D树结构进行加速,使得能量优化的求解能够基于聚类后的角点,从而能够大大减少未知数的个数,公式如下:
Figure BDA0002589413430000033
其中,
Figure BDA0002589413430000034
是结点i的编辑强度和数值,由相邻结点的中的像素加权得到,mi表示对结点i有贡献的像素数目,通过求解方程得到结点的编辑强度数值
Figure BDA0002589413430000035
后,每个像素的编辑强度由结点的多重线性插值得到。
采用本发明具有如下的有益效果:
(1)本发明所述的流形结构保持的360度全景图像的高效编辑扩散是首次提出的基于笔画交互的360度全景图像编辑方法,能够产生无缝自然的编辑结果,且用户能够得到快速反馈。
(2)本发明所述的流形结构保持的360度全景图像的高效编辑扩散方法提出了基于球面的像素流形结构。
(3)本发明所述的流形结构保持的360度全景图像的高效编辑扩散方法提出了高效的求解方法通过快速扩散用户的编辑操作并同时能够保持球面上的流形结构。
附图说明
图1为本发明实施例一种流形结构保持的360度全景图像的高效编辑扩散方法的处理流程示意图;
图2为基于图1所示处理方法的360度全景图像编辑扩散系统。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1与图2,本发明公开了一种流形结构保持的360度全景图像的高效编辑扩散方法,该方法包括:
S1,将平面图像映射到球面坐标
以等效矩形的图像为输入,对于其中任一像素P,首先计算出其在球面上对应的经度λ、纬度
Figure BDA0002589413430000041
然后将单位球上坐标为(1,0,0)的经纬度设为0,从而计算出P在单位球上的3D坐标,公式如下:
Figure BDA0002589413430000051
S2,建立360度全景图像的球面流形
对每个像素i,用颜色和3D坐标组成的高维特征向量fi=(r,g,b,x,y,z)表示其特征,并通过高维向量之间的欧氏距离度量像素间的相似度,然后基于该度量进一步寻找每个像素的K个最近邻,其特征向量为fj,由于高维特征向量的各维度彼此独立,能够通过建立K-D树结构加速K近邻的搜索过程。最后构造基于局部线性嵌入约束的能量优化求解K个近邻像素的权值wi,j(即wi,j为每个近邻像素的权值),公式如下:
Figure BDA0002589413430000052
S3,基于球面流形保持的编辑扩散
以用户指定的笔画编辑为输入,笔画上的每个像素的编辑表示为gi,编辑扩散的目标就是以用户笔画编辑和像素上的流形结构为约束,构建能量方程,最终获取所有像素点上的最优的编辑ei,能量方程的公式如下:
Figure BDA0002589413430000053
其中ui∈[0,1],用于指示像素i上是否有用户编辑,0-表示没有笔画编辑的约束,1-表示有笔画编辑的约束;ej和wi,j分别是像素i的邻域像素j的编辑及其相应的权值,该权值由步骤S2决定。
S4,基于多分辨率的高效编辑扩散
对于超高分辨率的全景图输入,首先将源图像进行下采样到低分辨率,然后采用步骤S3的策略通过K-D树重新组织低分辨率的像素,基于聚类后的角点计算编辑扩散图。进一步地,将低分辨率下的编辑扩散图通过双线性插值的方式上采样到原始分辨率,并通过导向滤波器(Guided Filter)提升上采样后的编辑扩散图的质量。最后,根据滤波后编辑扩散图和用户编辑输入,计算源图像编辑后的结果。
一优选实施例中,步骤2还包括:为了实现编辑扩散中能量优化的高效求解,降低待求解方程的复杂度,提出了根据像素与邻域的相似度以及在球面上的位置,来适应性地调整邻域大小,具体策略是:若邻域像素与中心像素的相似度较高,或纬度较高,则相应减少邻域的数量,公式如下:
Figure BDA0002589413430000061
其中θ是纬度,a是常量,通常取0.6,di是邻域像素与中心像素在特征空间的距离,dmin和dmax是该距离的最小和最大值,Kmin和Kmax给出了近邻数量的取值范围。
一优选实施例中,步骤2还包括:为了进一步加速编辑扩散中能量优化的高效求解,提出了更新像素流形结构中各近邻权值,其策略是增加在特征空间上距离较小结点的权值,同时相应减少距离较大结点的权值,公式如下:
Figure BDA0002589413430000062
其中,ζij=1-S(D(fi,fj)),β是通常取0.5,S()是Sigmoid函数,D(fi,fj)表示两像素的特征向量之间的距离,由两像素的颜色距离和大圆距离之和组成。
一优选实施例中,步骤3包括:采用K-D树结构在特征空间上对360度全景图的像素进行聚类,然后基于K-D树的角点构建其球面上的流形结构,并进下建立基于角点的编辑扩散的能量方程,从而能够大大减少未知数的个数,实现编辑扩散的快速求解,公式如下:
Figure BDA0002589413430000063
其中,
Figure BDA0002589413430000064
是结点i的编辑强度和数值,由相邻结点的中的像素加权得到,mi表示对结点i有贡献的像素数目。通过求解方程得到结点的编辑强度数值
Figure BDA0002589413430000071
后,每个像素的编辑强度由结点的多重线性插值得到。
通过以上技术方案,本发明实施例的流形结构保持的360度全景图像的高效编辑扩散方法能够有效解决传统编辑扩散方法的边界不连续问题,通过球面流形结构的构建、K-D树、适应性近邻数量和权值、下采样和滤波等方式能够高效地实现360度全景图的编辑扩散,并提升其视觉效果。
本发明能够有效实现360度全景图像的交互式编辑扩散,其关键算法是360度全景图像编辑处理的基本框架,有着广泛的应用,如全景图像的滤波、增强、去模糊等。
应当理解,本文所述的示例性实施例是说明性的而非限制性的。尽管结合附图描述了本发明的一个或多个实施例,本领域普通技术人员应当理解,在不脱离通过所附权利要求所限定的本发明的精神和范围的情况下,可以做出各种形式和细节的改变。

Claims (4)

1.一种流形结构保持的360度全景图像的高效编辑扩散方法,其特征在于,包括以下步骤:
S1,将平面图像映射到球面坐标,具体为,以等效矩形的图像为输入,提取出其颜色和位置信息,然后将平面上的像素点映射到球面并转换成对应的经纬度,并进一步转换为单位球体上的3D坐标;
S2,建立360度全景图像的球面流形,具体为,对每个像素,用颜色和3D坐标组成的高维特征向量表示其特征,并通过高维向量之间的欧氏距离度量像素间的相似度,然后基于该度量进一步寻找每个像素的K个最近邻,最后通过求解基于局部线性嵌入约束的优化得到K近邻的相应权值,从而将任意一个像素表示为K个邻近像素的线性组合;
S3,基于球面流形结构保持的编辑扩散,具体为,给定用户编辑的笔画和相应的编辑参数,建立能量优化函数实现编辑扩散,其约束为保持用户笔画上的编辑和每个像素的流形结构;
S4,基于多分辨率的高效编辑扩散,具体为,对于超高分辨率的全景图输入,首先将图像进行下采样,并在下采样的图像上进行编辑扩散,然后对编辑扩散的结果进行上采样,并通过导向性滤波进行编辑结果提升,最后结合原输入图像渲染出高质量编辑结果。
2.如权利要求1所述的流形结构保持的360度全景图像的高效编辑扩散方法,其特征在于,步骤2所述的流形结构中,近邻数量根据像素与近邻的相似度和球面坐标上该像素的纬度自适应调整,公式如下:
Figure FDA0003594785930000011
其中θ是纬度,a是常量,取0.6,di是邻域像素与中心像素在特征空间的距离,dmin和dmax是该距离的最小和最大值,Kmin和Kmax给出了近邻数量的取值范围。
3.如权利要求1所述的流形结构保持的360度全景图像的高效编辑扩散方法,其特征在于,步骤2所述的流形结构中,每个近邻的权值进一步根据近邻与中心像素点的相似度进行调整,使得相似近邻的权值更大,公式如下:
Figure FDA0003594785930000021
其中,ζij=1-S(D(fi,fj)),β是常量,取0.5,S()是Sigmoid函数,D(fi,fj)表示两像素的特征向量之间的距离,由两像素的颜色距离和大圆距离之和组成,wi,j为每个近邻像素的权值。
4.如权利要求1所述的流形结构保持的360度全景图像的高效编辑扩散方法,其特征在于,步骤3所述的能量优化的求解能够通过K-D树结构进行加速,使得能量优化的求解能够基于聚类后的角点,公式如下:
Figure FDA0003594785930000022
其中,
Figure FDA0003594785930000023
是结点i的编辑强度和数值,由相邻结点的中的像素加权得到,mi表示对结点i有贡献的像素数目,通过求解方程得到结点的编辑强度数值
Figure FDA0003594785930000024
后,每个像素的编辑强度由结点的多重线性插值得到。
CN202010691142.2A 2020-07-17 2020-07-17 一种流形结构保持的360度全景图像的高效编辑扩散方法 Active CN111932658B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010691142.2A CN111932658B (zh) 2020-07-17 2020-07-17 一种流形结构保持的360度全景图像的高效编辑扩散方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010691142.2A CN111932658B (zh) 2020-07-17 2020-07-17 一种流形结构保持的360度全景图像的高效编辑扩散方法

Publications (2)

Publication Number Publication Date
CN111932658A CN111932658A (zh) 2020-11-13
CN111932658B true CN111932658B (zh) 2022-05-27

Family

ID=73313151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010691142.2A Active CN111932658B (zh) 2020-07-17 2020-07-17 一种流形结构保持的360度全景图像的高效编辑扩散方法

Country Status (1)

Country Link
CN (1) CN111932658B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102903128A (zh) * 2012-09-07 2013-01-30 北京航空航天大学 基于局部特征结构保持的视频图像内容编辑传播方法
CN103413331A (zh) * 2013-07-29 2013-11-27 北京航空航天大学 一种支持编辑传播的高分辨率视频图像内容稀疏表达方法
CN104143203A (zh) * 2014-07-29 2014-11-12 清华大学深圳研究生院 一种图像编辑传播方法
CN105096362A (zh) * 2015-07-21 2015-11-25 华南农业大学 一种基于重采样的颜色编辑扩散方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8368720B2 (en) * 2006-12-13 2013-02-05 Adobe Systems Incorporated Method and apparatus for layer-based panorama adjustment and editing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102903128A (zh) * 2012-09-07 2013-01-30 北京航空航天大学 基于局部特征结构保持的视频图像内容编辑传播方法
CN103413331A (zh) * 2013-07-29 2013-11-27 北京航空航天大学 一种支持编辑传播的高分辨率视频图像内容稀疏表达方法
CN104143203A (zh) * 2014-07-29 2014-11-12 清华大学深圳研究生院 一种图像编辑传播方法
CN105096362A (zh) * 2015-07-21 2015-11-25 华南农业大学 一种基于重采样的颜色编辑扩散方法

Also Published As

Publication number Publication date
CN111932658A (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
Dong et al. RRSGAN: Reference-based super-resolution for remote sensing image
CN107123089B (zh) 基于深度卷积网络的遥感图像超分辨重建方法及系统
US20210383242A1 (en) Joint unsupervised object segmentation and inpainting
CN110610526B (zh) 一种基于wnet对单目人像进行分割和景深渲染的方法
CN110910486A (zh) 室内场景光照估计模型、方法、装置、存储介质以及渲染方法
CN111899295B (zh) 一种基于深度学习的单目场景深度预测方法
WO2022228383A1 (zh) 一种图形渲染方法以及装置
CN113240687A (zh) 图像处理方法、装置、电子设备和可读存储介质
CN111951368A (zh) 一种点云、体素和多视图融合的深度学习方法
CN113313828A (zh) 基于单图片本征图像分解的三维重建方法与系统
CN114677479A (zh) 一种基于深度学习的自然景观多视图三维重建方法
CN110889854B (zh) 一种基于多尺度深度学习的草图部件分割方法、系统、装置及存储介质
Li et al. High-resolution network for photorealistic style transfer
He Application of local color simulation method of landscape painting based on deep learning generative adversarial networks
Han Texture Image Compression Algorithm Based on Self‐Organizing Neural Network
CN117635801A (zh) 基于实时渲染可泛化神经辐射场的新视图合成方法及系统
CN111932658B (zh) 一种流形结构保持的360度全景图像的高效编辑扩散方法
CN110322548B (zh) 一种基于几何图像参数化的三维网格模型生成方法
CN114882197B (zh) 一种基于图神经网络的高精度三维人脸重建方法
Ye et al. Image style transfer method based on improved style loss function
Li et al. Point-Based Neural Scene Rendering for Street Views
CN115797489A (zh) 一种基于深度网络的岩石ct数字图像真彩色化处理方法
Ma A comparison of art style transfer in Cycle-GAN based on different generators
Ren et al. Depth up-sampling via pixel-classifying and joint bilateral filtering
He et al. Freditor: High-Fidelity and Transferable NeRF Editing by Frequency Decomposition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant