CN106296749A - 基于l1范数约束的rgb‑d图像本征分解方法 - Google Patents

基于l1范数约束的rgb‑d图像本征分解方法 Download PDF

Info

Publication number
CN106296749A
CN106296749A CN201610645510.3A CN201610645510A CN106296749A CN 106296749 A CN106296749 A CN 106296749A CN 201610645510 A CN201610645510 A CN 201610645510A CN 106296749 A CN106296749 A CN 106296749A
Authority
CN
China
Prior art keywords
matrix
pixel
image
point
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610645510.3A
Other languages
English (en)
Other versions
CN106296749B (zh
Inventor
李坤
王玉洁
杨敬钰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Lingyun Shixun Technology Co ltd
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201610645510.3A priority Critical patent/CN106296749B/zh
Publication of CN106296749A publication Critical patent/CN106296749A/zh
Application granted granted Critical
Publication of CN106296749B publication Critical patent/CN106296749B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Generation (AREA)
  • Image Processing (AREA)

Abstract

本发明涉及计算机应用、图像处理技术,为实现易于求解,并能够展现出更多的细节,获取更好的图像处理结果,本发明采用的技术方案是,基于L1范数约束的RGB‑D图像本征分解方法,具体包括以下步骤:1)通过输入的彩色图及其对应的深度图计算得到图像每一点的色度、表面法向量;2)建立出优化方程的数据项部分Edata:3)建立整个优化方程的正则项Ereg;4)建立总的优化方程;5)由D、N、C三个部分得到亮度部分的log值矩阵S;6)得到反照率图a、亮度图s。本发明主要应用于图像处理场合。

Description

基于L1范数约束的RGB-D图像本征分解方法
技术领域
本发明属于计算机应用领域,具体讲,涉及基于L1范数约束的RGB-D图像本征分解方法。
背景技术
本征图像分解问题是一个在计算机视觉和图形图像领域长期存在的问题,旨在将输入的图像分解成几张不同成分图像,这些图像分别描述输入图像中的物体的本质的材质特性和环境光照,描述图像中真实的物理世界。最普遍的分解方法是将图像分解成一个albedo(反照率)图像和一个shading(亮度)图像。本征图像分解得到的结果将使很多应用变得可能,如图像重新光照、图像中物体表面重新上色、材质转换以及基于图像的材质编辑,这些应用当中很多都可以用于增强现实的场景当中。从一幅图片中估计物体的本征反照率是由Land和McCann提出的(Land E H,Mccann J J.Lightness and RetinexTheory.In Journal of the Optical Society of America,1971),他们提出的Retinex模型奠定了本征图像分解的基础。Retinex模型提出了一个比较理想的蒙德里安世界——图像满足局部一致性,即一个平面画布的图像是由一块块的图像块形成的,在每个块内,反照率和亮度是恒定不变的,并且图像块所接收到的光照是缓慢变化的。那么由于光照是缓慢变化的,在这种图像的log域中,大的导数产生的地方可以被假设为相应的反照率边界。基于这个假设,Land和McCann提出了一个通过沿着两点间的路径进行积分来计算两点间相应的反照率的算法。这个算法被Horn从一维扩展到了两维(B.K.Hom.Determining lightnessfrom an image.In Computer graphics and image processing,1974),之后Finlayson等人(G.D.Finlayson,S.D.Hordley,and M.S.Drew.Removing shadows from images[M].inComputer Vision—ECCV,2002)将同样的方法应用到移除图像阴影的算法中,通过对比色信息进行计算,然后把这些信息应用于寻找由阴影引起的导数,并且把这些由阴影引起的导数设置为0,剩下的导数进行分类处理,分类的时候将其分为亮度导数或反照率导数,再进行积分,就可以获得不含阴影的图像。尽管在这个问题上已经有很多的人做了大量的研究,想要高质量的分解结果依然是一个非常具有挑战性的任务。传统的算法解决每个像素上的shading和albedo,例如彩色Retinex理论,材质线索或者训练分类器。之后,人工辅助、图像序列法等方法也被引入,来提高分解质量。
RGB-D成像设备的商业化和普及,提供了一个机会来更进一步地研究本征图像分解问题,有可能在不需要人工辅助的情况下获得更高质量的分解结果。Qifeng Chen和Vladlen Koltun(Qifeng Chen and Vladlen Koltun.A simple model for intrinsicimage decomposition with depth cues.In ICCV,2013)通过对图像成像过程的更加细节性地分析,建立了一个效果很好的RGB-D图像本征分解模型。在他们的方法中,将图像首先分解为四个部分,直接光照部分,非直接光照部分,光照颜色部分,反照率部分,最后用前三个部分合成shading部分。并且实验结果表明,他们的方法要优于之前提出的其他的比较好的本征图像分解方法,平均的误差值比较小,大大提高了分解结果的质量。不过该方法中也存在着一些不足,比如在shading(亮度)图像中可能出现比较多地彩色信息、过度地估计光照颜色、亮度图中细 节可能有些模糊等。
发明内容
为克服现有技术的不足,实现易于求解,并能够展现出更多的细节,本发明采用的技术方案是,基于L1范数约束的RGB-D图像本征分解方法,具体包括以下步骤:
1)通过输入的彩色图及其对应的深度图计算得到图像每一点的色度、表面法向量,计算色度的公式为:其中,ip表示输入的彩色图i在p点处的值,ch(ip)表示p点处的色度值,rp、gp、bp分别表示输入的彩色图在p点处红、绿、蓝三个通道上的值;
2)根据ip=apdpnpcp,其中ip、ap、np、dp、cp分别表示输入的彩色图i、反照率图a、直接光照图d、非直接光照图n、光照颜色图c在p点处的值,对等式的两边求log,则得到:Ip=Ap+Dp+Np+Cp,其中Ip、Ap、Dp、Np、Cp分别表示ip、ap、dp、np、cp的log值,由此建立出优化方程的数据项部分Edata
E d a t a = Σ p | | l u m ( i p ) ( I p - A p - 1 → D p - 1 → N p - C p ) | | 2 2 - - - ( 1 )
其中,||.||2表示L2范数,表示L2范数的平方,表示全1的向量,通过相乘,将Dp、Np变为三维以便于计算。像素p的权重是通过像素p处的亮度lum(ip)来计算,为了方便之后的求解,对数据项中的变量,分别用矩阵来定义,然后用矩阵形式来表示整个数据项,于是,数据项形式化为
E d a t a = | | W ( I - A - D K - N K - C ) | | 2 2 - - - ( 2 )
其中,
W = d i a g ( l u m ( i 1 ) , ... , l u m ( i n ) ) - - - ( 3 )
K=[1 1 1] (4)
diag(.)表示对角阵,所以W为一个n×n的对角矩阵,n表示图像的像素总个数,I、A、D、N、C分别表示输入的彩色图、反照率部分、直接关照部分、非直接光照部分、光照颜色组分的log值矩阵,也就是要求的未知数;
3)建立整个优化方程的正则项Ereg为:
Ereg=∑j∈{A,D,N,N',C}λjEj (5)
Ej即EA、ED、EN、EN'、EC,分别表示A、D、N、C的正则项,其中对于非直接关照的log值矩阵N,正则项由EN、EN'构成,λj即λA、λD、λN、λN'、λC分别表示正则项中A、D、N、C的正则项所占的权重;
4)建立总的优化方程为:
E = E d a t a + E r e g = E d a t a + Σ j ∈ { A , D , N , N ′ , C } λ j E j = | | W ( I - A - D K - N K - C ) | | 2 2 + λ A | | Q 1 A | | 1 + λ D | | Q 2 D | | 1 + λ N | | Q 3 N | | 2 2 + λ N ′ | | Q 3 N | | 2 2 + λ C | | Q 5 C | | 2 2 - - - ( 16 )
通过最小化上式总能量E来求解各个分量成分的log值矩阵:A、D、N、C;
5)由D、N、C三个部分得到亮度部分的log值矩阵S:
S=DK+NK+C (29)
其中,K=[1 1 1],亮度图s中每个像素上的log值,都是由D与K相乘、N与K相乘、C这三个矩阵对应位置的值相加得到的;
6)对反照率组分log值矩阵A和亮度部分的log值矩阵S的每一点处的值求自然指数: ap、sp、Ap、Sp分别表示反照率图A、亮度图S、反照率图log值矩阵A、亮度图log值矩阵S在p点处的值,e( . )表示自然指数,由此得到反照率图a、亮度图s。
步骤3)中求解各正则项的具体步骤是:
3-1)建立反照率部分的正则项:其中,Ap、Aq分别表示反照率log值矩阵A在p、q点处的值,||.||1表示L1范数,MA是将每个像素简单地连接到图像中k个随机的点而得到的一个两两成对的像素点的集合,权重αpq调节了正则项的力度,是由p、q两点之间色度的差值,以及亮度值的差异来构成的:
其中ch(ip)表示输入彩色图上p点处的色度,lum(ip)表示输入彩色图ip处的亮度,max(.)表示求最大值,对于反照率部分的正则项,为了之后求解的方便,仍然要把它变成矩阵形式,对MA中的每一对像素点,定义边epq,表示像素点p与像素点q之间的连接,则得到边的集合LA
LA={ep,q|(p,q)∈MA} (6)
然后,定义一个矩阵Q1,与LA有相同的行数,列数为彩色图i中所有像素点的个数,矩阵Q1中的每一行与LA中的每一条边对应,每一列对应于图像I中的点,在Q1的每一行,只有两个非零值,假设Q1中第rth行对应的边为epq,则第r行第p列值为第q列的值为反照率组分A的正则项则表示为:
EA=||Q1A||1 (7)
3-2)建立直接光照部分的正则项:Dp、Dq分别表示直接光照log值矩阵D在p、q点处的值,MD是两两连接的“像素对”的集合:对于每个像素p,计算一个特征向量(x,y,z,nx,ny,nz);向量(x,y,z)是三维空间点的坐标,由p像素点在图像中 的坐标以及对应的深度信息来获得;向量(nx,ny,nz)是在p点处表面的法线向量,由p点和临近的点的深度值来计算得到;由此,图像中所有的像素都被放置到一个六维的特征空间,为了使这些特征值规范化,在(x,y,z)三维做了白化变换,然后,对每个像素p,在这个特征空间里寻找k个最近点,对每个临近点q,添加像素对{p,q}到“像素对”集合MD中,对于MD中的每一对像素点,定义边epq,表示像素p与像素q之间的连接,则得到边的集合LD
LD={epq|(p,q)∈MD} (8)
类似于Q1,定义一个矩阵矩阵Q2中的每一行与LD中的每一条边对应,每一列对应于图像i中的点,在Q2的每一行,只有两个非零值,假设Q2中第r行对应的边为epq,则第r行第p列值为1,第q列的值为-1,那么,直接光照组分D的正则项表示为:
ED=||Q2D||1 (9)
3-3)建立非直接光照部分的正则项EN与EN',其中Np、Nq分别表示非直接光照log值矩阵N在p、q点处的值,MN是两两连接的“像素对”的集合:对N中的每个像素p,在矩阵N中寻找k个最近点,对每个临近点q,添加像素对{p,q}到“像素对”集合MN中。将EN写成矩阵形式的过程为:对于MN中的像素点对{p,q},定义边epq表示像素点p与像素点q之间的连接,则得到边的集合LN
LN={epq|(p,q)∈MN} (10)
根据边的集合LN,构建矩阵Q3,矩阵Q3的每一行对应于LN中的每一条边,每一列对应于图像中的每个像素点,每行只有两列值不等于0,然后,EN就被表示为:
E N = | | Q 3 N | | 2 2 - - - ( 11 )
其中,||.||2表示L2范数,表示L2范数的平方。
构建EN'=∑pNp 2,将EN'表示为矩阵形式,首先构造矩阵Q4:
Q4=diag(1,1,....,1) (12)
即Q4是一个n×n的单位矩阵,EN'就表示为:
E N ′ = | | Q 4 N | | 2 2 - - - ( 13 )
3-4)光照颜色部分的正则项为:Cp、Cq分别表示光照颜色log值矩阵在p、q点处的值,权重γp,q调整了约束项的力度,是根据p与q在三维空间内的位置的欧几里得距离来计算得到的: 表示该点的位置坐标,Mc是两两连接的“像素对”的集合,建立的方法为:连接每个像素点p到图像中k个随机的像素点;
对于MC中的每一对像素点,定义边epq,表示像素点p与像素点q之间的连接,得到的边的集合LC如下:
LC={epq|(p,q)∈MC} (14)
随后,定义矩阵Q5,与LC有相同的行数,列数为输入彩色图像i中所有像素点的个数,矩阵Q5中的每一行与LC中的每一条边对应,每一列对应于图像i中的点,在Q5的每一行,只有两个非零值,假设Q5中第r行对应的边为epq,则第r行第p列值为第q列的值为构建Q5时使用是因为在求解的过程中用到的是Q5 TQ5,其中.T表示矩阵的转置,那么,C的正则项则表示为:
E C = | | Q 5 C | | 2 2 - - - ( 15 ) .
步骤4)具体是利用增广拉格朗日方法进行最终求解,包括以下步骤:
4-1)把优化方程进行转换,令B1=Q1A,B2=Q2D,转换之后的能量最小化方程为:
argmin X = ( A , D , N , C ) | | W ( I - A - D K - N K - C ) | | 2 2 + λ A | | B 1 | | 1 + λ D | | B 2 | | 1 + λ N | | Q 3 N | | 2 2 + λ N ′ | | Q 4 N | | 2 2 + λ C | | Q 5 C | | 2 2 - - - ( 17 )
s.t B1=Q1A,B2=Q2D
其中,X为A、D、N、C的一个组合,求解方法的目的是找到最优的X,使得能量函数的值最小;
4-2)用拉格朗日乘子法来对(4-1)中转换后的式子进行转换,列出相应的增广拉格朗日方程:
E ( B 1 , B 2 , Y 1 , Y 2 , &mu; 1 , &mu; 2 ) = | | W ( I - A - D &times; K - N &times; K - C ) | | 2 2 + &lambda; A | | B 1 | | 1 + < Y 1 , B 1 - Q 1 A > + &mu; 1 2 | | B 1 - Q 1 A | | 2 2 + &lambda; D | | B 2 | | 1 + < Y 2 , B 2 - Q 2 D > + &mu; 2 2 | | B 2 - Q 2 D | | 2 2 + &lambda; N | | Q 3 N | | 2 2 + &lambda; N &prime; | | Q 4 N | | 2 2 + &lambda; C | | Q 5 C | | 2 2 - - - ( 18 )
其中,μ1、μ2为两个常量,值为正数,Y1、Y2是拉格朗日乘子,<·,·>表示两个矩阵的内积,E是目标方程的总能量;
4-3)使用交替求解的迭代求解过程来求解,获得最优的A、D、N、C,第k+1次迭代过程如下:
B 1 ( k + 1 ) = argmin B 1 &lambda; A | | B 1 | | + < Y 1 ( k ) , B 1 - Q 1 A ( k ) > + &mu; 1 ( k ) 2 | | B 1 - Q 1 A ( k ) | | 2 2 - - - ( 19 )
A ( k + 1 ) = argmin A | | W ( I - A - D ( k ) K - N ( k ) K - C ( k ) | | 2 2 + < Y 1 ( k ) , B 1 ( k + 1 ) > + &mu; 1 ( k ) 2 | | B 1 ( k + 1 ) - Q 1 A | | 2 2 - - - ( 20 )
B 2 ( k + 1 ) = argmin B 2 &lambda; D | | B 2 | | + < Y 2 ( k ) , B 2 - Q 2 D ( k ) > + &mu; 2 ( k ) 2 | | B 2 - Q 2 D ( k ) | | 2 2 - - - ( 21 )
D ( k + 1 ) = argmin D | | W ( I - A ( k +1 ) - D K - N ( k ) K - C ( k ) | | 2 2 + < Y 2 ( k ) , B 2 ( k + 1 ) > + &mu; 2 ( k ) 2 | | B 2 ( k + 1 ) - Q 2 D | | 2 2 - - - ( 22 )
N ( k + 1 ) = argmin N | | W ( I - A ( k + 1 ) - D ( k + 1 ) K - N K - C ( k ) | | 2 2 + &lambda; N | | Q 3 N | | 2 2 + &lambda; N &prime; | | Q 4 N | | 2 2 - - - ( 23 )
C ( k + 1 ) = argmin C | | W ( I - A ( k + 1 ) - D ( k + 1 ) K - N ( k + 1 ) K - C | | 2 2 + &lambda; C | | Q 4 C | | 2 2 - - - ( 24 )
Y1 (k+1)=Y1 (k)+(B1 (k+1)-Q1A(k+1)) (25)
Y2 (k+1)=Y2 (k)+(B2 (k+1)-Q2D(k+1)) (26)
μ1 (k+1)=ρ1μ1 (k)ρ1>1 (27)
μ2 (k+1)=ρ2μ2 (k)ρ2>1 (28)
其中,.(k)、.(k+1)分别表示第k次、第k+1次迭代得到的结果,ρ1、ρ2为两个大于1常数系数,随着迭代次数的增加,使得μ1、μ2不断增大,对变量B1、B2、A、D、N、C这六个变量不断迭代最小化,不断地更新μ1、μ2、Y1、Y2直到总能量方程收敛,得到最优的A、D、N、C。
与已有技术相比,本发明的技术特点与效果:
本发明方法针对单张RGB-D图像进行本征分解,将一幅彩色图分解为反照率图、直接光照图、非直接光照图、光照颜色图,提出了使用L1范数表示反照率部分和直接光照部分的正则项,用tv-l1模型进行建模,使用交替迭代求解,具有以下特点:
1、程序简单,易于实现。
2、由于0范数的非凸特性,使得求解变得非常困难,本发明采用L0范数的最优凸近似L1范数进行约束,L1范数最小化是凸优化问题,可以进行线性方程的求解。
3、分解得到的亮度图(shading)部分展现出更多的细节。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解:
图1为本发明方法的总框图;
图2为一张图片的分解效果图。
具体实施方式
本发明提出一种基于L1范数约束的RGB-D图像本征分解方法。具体包括以下步骤:
1)通过输入的彩色图及其对应的深度图计算得到图像每一点的色度、表面法向量,计算色度的公式为:其中,ip表示输入的彩色图i在p点处的值,ch(ip)表示p点处的色度值,rp、gp、bp分别表示输入的彩色图在p点处红、绿、蓝三个通道上的值;
2)根据ip=apdpnpcp,其中ip、ap、np、dp、cp分别表示输入的彩色图i、反照率图a、直接光照图d、非直接光照图n、光照颜色图c在p点处的值,对等式的两边求log,则得到:Ip=Ap+Dp+Np+Cp,其中Ip、Ap、Dp、Np、Cp分别表示ip、ap、dp、np、cp的log值,由此建立出优化方程的数据项部分Edata
E d a t a = &Sigma; p | | l u m ( i p ) ( I p - A p - 1 &RightArrow; D p - 1 &RightArrow; N p - C p ) | | 2 2 - - - ( 1 )
其中,||.||2表示L2范数,表示L2范数的平方,表示全1的向量,通过相乘,将Dp、Np变为三维以便于计算。像素p的权重是通过像素p处的亮度lum(ip)来计算,为了方便之后的求解,对数据项中的变量,分别用矩阵来定义,然后用矩阵形式来表示整个数据项,于是,数据项形式化为
E d a t a = | | W ( I - A - D K - N K - C ) | | 2 2 - - - ( 2 )
其中,
W = d i a g ( l u m ( i 1 ) , ... , l u m ( i n ) ) - - - ( 3 )
K=[1 1 1] (4)
diag(.)表示对角阵,所以W为一个n×n的对角矩阵,n表示图像的像素总个数,I、A、D、N、C分别表示输入的彩色图、反照率部分、直接关照部分、非直接光照部分、光照颜色组分的log值矩阵,也就是要求的未知数;
3)建立整个优化方程的正则项Ereg为:
Ereg=∑j∈{A,D,N,N',C}λjEj (5)
Ej即EA、ED、EN、EN'、EC,分别表示A、D、N、C的正则项,其中对于非直接关照N,正则项由EN、EN'构成,λj即λA、λD、λN、λN'、λC分别表示正则项中A、D、N、C的正则项所占的权重;
3-1)建立反照率部分的正则项:其中,Ap、Aq分别表示反照率log值矩阵A在p、q点处的值,||.||1表示L1范数,MA是将每个像素简单地连接到图像中k个随机的点而得到的一个两两成对的像素点的集合,权重αpq调节了正则项的力度,是由p、q两点之间色度的差值,以及亮度值的差异来构成的:
其中ch(ip)表示输入彩色图上p点处的色度,lum(ip)表示输入彩色图ip处的亮度,max(.)表示求最大值,对于反照率部分的正则 项,为了之后求解的方便,仍然要把它变成矩阵形式,对MA中的每一对像素点,定义边epq,表示像素点p与像素点q之间的连接,则可以得到边的集合LA
LA={epq|(p,q)∈MA} (6)
然后,定义一个矩阵Q1,与LA有相同的行数,列数为彩色图i中所有像素点的个数,矩阵Q1中的每一行与LA中的每一条边对应,每一列对应于图像I中的点,在Q1的每一行,只有两个非零值,假设Q1中第rth行对应的边为epq,则第r行第p列值为第q列的值为反照率组分A的正则项则表示为:
EA=||Q1A||1 (7)
3-2)建立直接光照部分的正则项:Dp、Dq分别表示直接光照log值矩阵D在p、q点处的值,MD是两两连接的“像素对”的集合:对于每个像素p,计算一个特征向量(x,y,z,nx,ny,nz);向量(x,y,z)是三维空间点的坐标,由p像素点在图像中的坐标以及对应的深度信息来获得;向量(nx,ny,nz)是在p点处表面的法线向量,由p点和临近的点的深度值来计算得到;由此,图像中所有的像素都被放置到一个六维的特征空间,为了使这些特征值规范化,在(x,y,z)三维做了白化变换,然后,对每个像素p,在这个特征空间里寻找k个最近点,对每个临近点q,添加像素对{p,q}到“像素对”集合MD中,对于MD中的每一对像素点,定义边epq,表示像素p与像素q之间的连接,则得到边的集合LD
LD={epq|(p,q)∈MD} (8)
类似于Q1,定义一个矩阵矩阵Q2中的每一行与LD中的每一条边对应,每一列对应于图像i中的点,在Q2的每一行,只有两个非零值,假设Q2中第r行对应的边为epq,则第r行第p列值为1,第q列的值为-1,那么,直接光照组分D的正则项可以表示为:
ED=||Q2D||1 (9)
3-3)建立非直接光照部分的正则项EN与EN',其中Np、Nq分别表示非直接光照log值矩阵在p、q点处的值,MN是两两连接的“像素对”的集合:对N中的每个像素p,在矩阵N中寻找k个最近点,对每个临近点q,添加像素对{p,q}到“像素对”集合MN中。将EN写成矩阵形式的过程为:对于MN中的像素点对{p,q},定义边epq表示像素点p与像素点q之间的连接,则得到边的集合LN
LN={epq|(p,q)∈MN} (10)
根据边的集合LN,构建矩阵Q3,矩阵Q3的每一行对应于LN中的每一条边,每一列对应于图像中的每个像素点,每行只有两列值不等于0,然后,EN就被表示为:
E N = | | Q 3 N | | 2 2 - - - ( 11 )
其中,||.||2表示L2范数,表示L2范数的平方。
构建EN'=∑pNp 2,将EN'表示为矩阵形式,首先构造矩阵Q4:
Q4=diag(1,1,....,1) (12)
即Q4是一个n×n的单位矩阵,EN'就表示为:
E N &prime; = | | Q 4 N | | 2 2 - - - ( 13 )
3-4)光照颜色部分的正则项为:Cp、Cq分别表示光照颜色log值矩阵在p、q点处的值,权重γp,q调整了约束项的力度,是根据p与q在三维空间内的位置的欧几里得距离来计算得到的: 表示该点的位置坐标,Mc是两两连接的“像素对”的集合,建立的方法为:连接每个像素点p到图像中k个随机的像素点;
对于MC中的每一对像素点,定义边epq,表示像素点p与像素点q之间的连接,得到的边的集合LC如下:
LC={epq|(p,q)∈MC} (14)
随后,定义矩阵Q5,与LC有相同的行数,列数为输入彩色图像i中所有像素点的个数,矩阵Q5中的每一行与LC中的每一条边对应,每一列对应于图像i中的点,在Q5的每一行,只有两个非零值,假设Q5中第r行对应的边为epq,则第r行第p列值为第q列的值为构建Q5时使用是因为在求解的过程中用到的是Q5 TQ5,其中.T表示矩阵的转置,那么,C的正则项则表示为:
E C = | | Q 5 C | | 2 2 - - - ( 15 ) ;
4)建立总的优化方程为:
E = E d a t a + E r e g = E d a t a + &Sigma; j &Element; { A , D , N , N &prime; , C } &lambda; j E j = | | W ( I - A - D K - N K - C ) | | 2 2 + &lambda; A | | Q 1 A | | 1 + &lambda; D | | Q 2 D | | 1 + &lambda; N | | Q 3 N | | 2 2 + &lambda; N &prime; | | Q 3 N | | 2 2 + &lambda; C | | Q 5 C | | 2 2 - - - ( 16 )
通过最小化上式总能量E来求解各个分量成分的log值矩阵:A、D、N、C。具体来说,利用增广拉格朗日方法进行最终求解,包括以下步骤:
4-1)把优化方程进行转换,令B1=Q1A,B2=Q2D,转换之后的能量最小化方程为:
argmin X = ( A , D , N , C ) | | W ( I - A - D K - N K - C ) | | 2 2 + &lambda; A | | B 1 | | 1 + &lambda; D | | B 2 | | 1 + &lambda; N | | Q 3 N | | 2 2 + &lambda; N &prime; | | Q 4 N | | 2 2 + &lambda; C | | Q 5 C | | 2 2 - - - ( 17 )
s.t B1=Q1A,B2=Q2D
其中,X为A、D、N、C的一个组合,求解方法的目的是找到最优的X,使得能量函数的值最小。
4-2)用拉格朗日乘子法来对(4-1)中转换后的式子进行转换,列出相应的增广拉格朗日方程:
E ( B 1 , B 2 , Y 1 , Y 2 , &mu; 1 , &mu; 2 ) = | | W ( I - A - D &times; K - N &times; K - C ) | | 2 2 + &lambda; A | | B 1 | | 1 + < Y 1 , B 1 - Q 1 A > + &mu; 1 2 | | B 1 - Q 1 A | | 2 2 + &lambda; D | | B 2 | | 1 + < Y 2 , B 2 - Q 2 D > + &mu; 2 2 | | B 2 - Q 2 D | | 2 2 + &lambda; N | | Q 3 N | | 2 2 + &lambda; N &prime; | | Q 4 N | | 2 2 + &lambda; C | | Q 5 C | | 2 2 - - - ( 18 )
其中,μ1、μ2为两个常量,值为正数,Y1、Y2是拉格朗日乘子,<·,·>表示两个矩阵的内积,E是目标方程的总能量。
4-3)使用交替求解的迭代求解过程来求解,获得最优的A、D、N、C,第k+1次迭代过程如下:
B 1 ( k + 1 ) = argmin B 1 &lambda; A | | B 1 | | + < Y 1 ( k ) , B 1 - Q 1 A ( k ) > + &mu; 1 ( k ) 2 | | B 1 - Q 1 A ( k ) | | 2 2 - - - ( 19 )
A ( k + 1 ) = argmin A | | W ( I - A - D ( k ) K - N ( k ) K - C ( k ) | | 2 2 + < Y 1 ( k ) , B 1 ( k + 1 ) > + &mu; 1 ( k ) 2 | | B 1 ( k + 1 ) - Q 1 A | | 2 2 - - - ( 20 )
B 2 ( k + 1 ) = argmin B 2 &lambda; D | | B 2 | | + < Y 2 ( k ) , B 2 - Q 2 D ( k ) > + &mu; 2 ( k ) 2 | | B 2 - Q 2 D ( k ) | | 2 2 - - - ( 21 )
D ( k + 1 ) = argmin D | | W ( I - A ( k +1 ) - D K - N ( k ) K - C ( k ) | | 2 2 + < Y 2 ( k ) , B 2 ( k + 1 ) > + &mu; 2 ( k ) 2 | | B 2 ( k + 1 ) - Q 2 D | | 2 2 - - - ( 22 )
N ( k + 1 ) = argmin N | | W ( I - A ( k + 1 ) - D ( k + 1 ) K - N K - C ( k ) | | 2 2 + &lambda; N | | Q 3 N | | 2 2 + &lambda; N &prime; | | Q 4 N | | 2 2 - - - ( 23 )
C ( k + 1 ) = argmin C | | W ( I - A ( k + 1 ) - D ( k + 1 ) K - N ( k + 1 ) K - C | | 2 2 + &lambda; C | | Q 4 C | | 2 2 - - - ( 24 )
Y1 (k+1)=Y1 (k)+(B1 (k+1)-Q1A(k+1)) (25)
Y2 (k+1)=Y2 (k)+(B2 (k+1)-Q2D(k+1)) (26)
μ1 (k+1)=ρ1μ1 (k)ρ1>1 (27)
μ2 (k+1)=ρ2μ2 (k)ρ2>1 (28)
其中,.(k)、.(k+1)分别表示第k次、第k+1次迭代得到的结果,ρ1、ρ2为两个大于1常数系数,随着迭代次数的增加,使得μ1、μ2不断增大。对变量B1、B2、A、D、N、C这六个变量不断迭代最小化,不断地更新μ1、μ2、Y1、Y2直到总能量方程收敛,得到最优的A、D、N、C;
5)由D、N、C三个部分得到亮度部分的log值矩阵S:
S=DK+NK+C (29)
其中,K=[1 1 1],亮度图s中每个像素上的log值,都是由DK、NK、C这三个矩阵对应位置的值相加得到的;
6)对反照率组分log值矩阵A和亮度部分的log值矩阵S的每一点处的值求自然指数: ap、sp、Ap、Sp分别表示反照率图A、亮度图S、反照率图log值矩阵A、亮度图log值矩阵S在p点处的值,e(.)表示自然指数,由此得到反照率图a、亮度图s。
下表为对来自MPI-Sintel数据集中的五张图片的实验结果的定量评估数据,
图像1 图像2 图像3 图像4 图像5 平均值
DSSIM(反照率) 0.2808 0.1905 0.3785 0.2793 0.3302 0.2799
DSSIM(亮度) 0.2687 0.1822 0.2628 0.2787 0.2609 0.2609
LMSE(反照率) 0.0152 0.0137 0.0211 0.0080 0.0165 0.0149
LMSE(亮度) 0.0287 0.0116 0.0115 0.0170 0.0400 0.0214
其中有两种定量评估标准:LMSE为局部均方误差,把图片分成若干个小的区域(在本实验中分为10个小的窗口),然后在局部区域分别计算结果与标定数据对应的点之间的误差;DSSIM是由SSIM计算得到的:DSSIM=(1-SSIM)/2,其中SSIM(structural similaritymeasurement)计算的是实验结果与标定数据之间的结构的相似度。

Claims (3)

1.一种基于L1范数约束的RGB-D图像本征分解方法,其特征是,包括以下步骤:
1)通过输入的彩色图及其对应的深度图计算得到图像每一点的色度、表面法向量,计算色度的公式为:其中,ip表示输入的彩色图i在p点处的值,ch(ip)表示p点处的色度值,rp、gp、bp分别表示输入的彩色图在p点处红、绿、蓝三个通道上的值;
2)根据ip=apdpnpcp,其中ip、ap、np、dp、cp分别表示输入的彩色图i、反照率图a、直接光照图d、非直接光照图n、光照颜色图c在p点处的值,对等式的两边求log,则得到:Ip=Ap+Dp+Np+Cp,其中Ip、Ap、Dp、Np、Cp分别表示ip、ap、dp、np、cp的log值,由此建立出优化方程的数据项部分Edata
其中,||.||2表示L2范数,表示L2范数的平方,表示全1的向量,通过相乘,将Dp、Np变为三维以便于计算,像素p的权重是通过像素p处的亮度lum(ip)来计算,为了方便之后的求解,对数据项中的变量,分别用矩阵来定义,然后用矩阵形式来表示整个数据项,于是,数据项形式化为
其中,
K=[1 1 1] (4)
diag(.)表示对角阵,所以W为一个n×n的对角矩阵,n表示图像的像素总个数,I、A、D、N、C分别表示输入的彩色图、反照率部分、直接关照部分、非直接光照部分、光照颜色组分的log值矩阵,也就是要求的未知数;
3)建立整个优化方程的正则项Ereg为:
Ereg=∑j∈{A,D,N,N',C}λjEj (5)
Ej即EA、ED、EN、EN'、EC,分别表示A、D、N、C的正则项,其中对于非直接关照的log值矩阵N,正则项由EN、EN'构成,λj即λA、λD、λN、λN'、λC分别表示正则项中A、D、N、C的正则项所占的权重;
4)建立总的优化方程为:
通过最小化上式总能量E来求解各个分量成分的log值矩阵:A、D、N、C;
5)由D、N、C三个部分得到亮度部分的log值矩阵S:
S=DK+NK+C (29)
其中,K=[1 1 1],亮度图s中每个像素上的log值,都是由D与K相乘、N与K相乘、C这三个矩阵对应位置的值相加得到的;
6)对反照率组分log值矩阵A和亮度部分的log值矩阵S的每一点处的值求自然指数:ap、sp、Ap、Sp分别表示反照率图A、亮度图S、反照率图log值矩阵A、亮度图log值矩阵S在p点处的值,e(.)表示自然指数,由此得到反照率图a、亮度图s。
2.如权利要求1所述的基于L1范数约束的图像本征分解方法,其特征是,步骤3)中求解各正则项的具体步骤是,
3-1)建立反照率部分的正则项:其中,Ap、Aq分别表示反照率log值矩阵A在p、q点处的值,||.||1表示L1范数,MA是将每个像素简单地连接到图像中k个随机的点而得到的一个两两成对的像素点的集合,权重αpq调节了正则项的力度,是由p、q两点之间色度的差值,以及亮度值的差异来构成的:其中ch(ip)表示输入彩色图上p点处的色度,lum(ip)表示输入彩色图ip处的亮度,max(.)表示求最大值,对于反照率部分的正则项,为了之后求解的方便,仍然要把它变成矩阵形式,对MA中的每一对像素点,
定义边epq,表示像素点p与像素点q之间的连接,则得到边的集合LA
LA={ep,q|(p,q)∈MA} (6)
然后,定义一个矩阵Q1,与LA有相同的行数,列数为彩色图i中所有像素点的个数,矩阵Q1中的每一行与LA中的每一条边对应,每一列对应于图像I中的点,在Q1的每一行,只有两个非零值,假设Q1中第rth行对应的边为epq,则第r行第p列值为第q列的值为反照率组分A的正则项则表示为:
EA=||Q1A||1 (7)
3-2)建立直接光照部分的正则项:Dp、Dq分别表示直接光照log值矩阵D在p、q点处的值,MD是两两连接的“像素对”的集合:对于每个像素p,计算一个特征向量(x,y,z,nx,ny,nz);向量(x,y,z)是三维空间点的坐标,由p像素点在图像中的坐标以及对应的深度信息来获得;向量(nx,ny,nz)是在p点处表面的法线向量,由p点和临近的点的深度值来计算得到;由此,图像中所有的像素都被放置到一个六维的特征空间,为了使这些特征值规范化,在(x,y,z)三维做了白化变换,然后,对每个像素p,在这个特征空间里寻找k个最近点,对每个临近点q,添加像素对{p,q}到“像素对”集合MD中,对于MD中的每一对像素点,定义边epq,表示像素p与像素q之间的连接,则得到边的集合LD
LD={epq|(p,q)∈MD} (8)
类似于Q1,定义一个矩阵矩阵Q2中的每一行与LD中的每一条边对应,每一列对应于图像i中的点,在Q2的每一行,只有两个非零值,假设Q2中第r行对应的边为epq,则第r行第p列值为1,第q列的值为-1,那么,直接光照组分D的正则项表示为:
ED=||Q2D||1 (9)
3-3)建立非直接光照部分的正则项EN与EN',其中Np、Nq分别表示非直接光照log值矩阵N在p、q点处的值,MN是两两连接的“像素对”的集合:对N中的每个像素p,在矩阵N中寻找k个最近点,对每个临近点q,添加像素对{p,q}到“像素对”集合MN中;将EN写成矩阵形式的过程为:对于MN中的像素点对{p,q},定义边epq表示像素点p与像素点q之间的连接,则得到边的集合LN
LN={epq|(p,q)∈MN} (10)
根据边的集合LN,构建矩阵Q3,矩阵Q3的每一行对应于LN中的每一条边,每一列对应于图像中的每个像素点,每行只有两列值不等于0,然后,EN就被表示为:
其中,||.||2表示L2范数,表示L2范数的平方;
构建EN'=∑pNp 2,将EN'表示为矩阵形式,首先构造矩阵Q4:
Q4=diag(1,1,....,1) (12)
即Q4是一个n×n的单位矩阵,EN'就表示为:
3-4)光照颜色部分的正则项为:Cp、Cq分别表示光照颜色log值矩阵在p、q点处的值,权重γp,q调整了约束项的力度,是根据p与q在三维空间内的位置的欧几里得距离来计算得到的: 表示该点的位置坐标,Mc是两两连接的“像素对”的集合,建立的方法为:连接每个像素点p到图像中k个随机的像素点;
对于MC中的每一对像素点,定义边epq,表示像素点p与像素点q之间的连接,得到的边的集合LC如下:
LC={epq|(p,q)∈MC} (14)
随后,定义矩阵Q5,与LC有相同的行数,列数为输入彩色图像i中所有像素点的个数,矩阵Q5中的每一行与LC中的每一条边对应,每一列对应于图像i中的点,在Q5的每一行,只有两个非零值,假设Q5中第r行对应的边为epq,则第r行第p列值为第q列的值为构建Q5时使用是因为在求解的过程中用到的是Q5 TQ5,其中.T表示矩阵的转置,那么,C的正则项则表示为:
3.如权利要求1所述的基于L1范数约束的RGB-D图像本征分解方法,其特征是,步骤4)具体是利用增广拉格朗日方法进行最终求解,包括以下步骤:
4-1)把优化方程进行转换,令B1=Q1A,B2=Q2D,转换之后的能量最小化方程为:
其中,X为A、D、N、C的一个组合,求解方法的目的是找到最优的X,使得能量函数的值最小;
4-2)用拉格朗日乘子法来对(4-1)中转换后的式子进行转换,列出相应的增广拉格朗日方程:
其中,μ1、μ2为两个常量,值为正数,Y1、Y2是拉格朗日乘子,<·,·>表示两个矩阵的内积,E是目标方程的总能量;
4-3)使用交替求解的迭代求解过程来求解,获得最优的A、D、N、C,第k+1次迭代过程如下:
Y1 (k+1)=Y1 (k)+(B1 (k+1)-Q1A(k+1)) (25)
Y2 (k+1)=Y2 (k)+(B2 (k+1)-Q2D(k+1)) (26)
μ1 (k+1)=ρ1μ1 (k)ρ1>1 (27)
μ2 (k+1)=ρ2μ2 (k)ρ2>1 (28)
其中,.(k)、.(k+1)分别表示第k次、第k+1次迭代得到的结果,ρ1、ρ2为两个大于1常数系数,随着迭代次数的增加,使得μ1、μ2不断增大,对变量B1、B2、A、D、N、C这六个变量不断迭代最小化,不断地更新μ1、μ2、Y1、Y2直到总能量方程收敛,得到最优的A、D、N、C。
CN201610645510.3A 2016-08-05 2016-08-05 基于l1范数约束的rgb-d图像本征分解方法 Active CN106296749B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610645510.3A CN106296749B (zh) 2016-08-05 2016-08-05 基于l1范数约束的rgb-d图像本征分解方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610645510.3A CN106296749B (zh) 2016-08-05 2016-08-05 基于l1范数约束的rgb-d图像本征分解方法

Publications (2)

Publication Number Publication Date
CN106296749A true CN106296749A (zh) 2017-01-04
CN106296749B CN106296749B (zh) 2019-10-18

Family

ID=57666970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610645510.3A Active CN106296749B (zh) 2016-08-05 2016-08-05 基于l1范数约束的rgb-d图像本征分解方法

Country Status (1)

Country Link
CN (1) CN106296749B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108765448A (zh) * 2018-05-28 2018-11-06 青岛大学 一种基于改进tv-l1模型的虾苗计数分析方法
CN109903320A (zh) * 2019-01-28 2019-06-18 浙江大学 一种基于肤色先验的人脸本征图像分解方法
CN110929686A (zh) * 2019-12-09 2020-03-27 佛山市熠瞳科技有限公司 本征图像分解方法、装置、设备及可读存储介质
WO2022042470A1 (zh) * 2020-08-31 2022-03-03 浙江商汤科技开发有限公司 图像分解方法和相关装置、设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268897A (zh) * 2014-10-28 2015-01-07 天津大学 一种协同本征图像分解方法
CN104484884A (zh) * 2014-12-30 2015-04-01 天津大学 一种基于多尺度l0稀疏约束的本征图像分解方法
US20160171755A1 (en) * 2013-08-08 2016-06-16 Adobe Systems Incorporated Automatic geometry and lighting inference for realistic image editing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160171755A1 (en) * 2013-08-08 2016-06-16 Adobe Systems Incorporated Automatic geometry and lighting inference for realistic image editing
CN104268897A (zh) * 2014-10-28 2015-01-07 天津大学 一种协同本征图像分解方法
CN104484884A (zh) * 2014-12-30 2015-04-01 天津大学 一种基于多尺度l0稀疏约束的本征图像分解方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MOHAMMED HACHAMA 等: "Intrinsic Scene Decomposition from RGB-D images", 《2015 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION》 *
QIFENG CHEN 等: "A Simple Model for Intrinsic Image Decomposition with Depth Cues", 《2013 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION》 *
戴海鹏: "本征图像分解方法与应用研究", 《万方数据》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108765448A (zh) * 2018-05-28 2018-11-06 青岛大学 一种基于改进tv-l1模型的虾苗计数分析方法
CN109903320A (zh) * 2019-01-28 2019-06-18 浙江大学 一种基于肤色先验的人脸本征图像分解方法
CN109903320B (zh) * 2019-01-28 2021-06-08 浙江大学 一种基于肤色先验的人脸本征图像分解方法
CN110929686A (zh) * 2019-12-09 2020-03-27 佛山市熠瞳科技有限公司 本征图像分解方法、装置、设备及可读存储介质
WO2022042470A1 (zh) * 2020-08-31 2022-03-03 浙江商汤科技开发有限公司 图像分解方法和相关装置、设备

Also Published As

Publication number Publication date
CN106296749B (zh) 2019-10-18

Similar Documents

Publication Publication Date Title
Liu et al. A spectral grouping and attention-driven residual dense network for hyperspectral image super-resolution
CN104008538B (zh) 基于单张图像超分辨率方法
CN112862792B (zh) 一种用于小样本图像数据集的小麦白粉病孢子分割方法
CN106296749B (zh) 基于l1范数约束的rgb-d图像本征分解方法
Lau et al. Cluster-based color space optimizations
CN107507138A (zh) 一种基于Retinex模型的水下图像增强方法
US9424231B2 (en) Image reconstruction method and system
CN111275643A (zh) 基于通道和空间注意力的真实噪声盲去噪网络模型及方法
Fang et al. Variational single image dehazing for enhanced visualization
CN104484884A (zh) 一种基于多尺度l0稀疏约束的本征图像分解方法
Avi-Aharon et al. Deephist: Differentiable joint and color histogram layers for image-to-image translation
CN109785242B (zh) 一种基于逐波段广义双线性模型的高光谱图像的解混方法
CN104268897A (zh) 一种协同本征图像分解方法
CN102592129B (zh) 基于场景驱动的智能手机图像特征点选取方法
CN105761292A (zh) 一种基于颜色转移和修正的图像着色方法
Choi et al. Deep learning-based computational color constancy with convoluted mixture of deep experts (CMoDE) fusion technique
Parihar et al. A comprehensive analysis of fusion-based image enhancement techniques
Huang et al. Color correction and restoration based on multi-scale recursive network for underwater optical image
Huang et al. A fully-automatic image colorization scheme using improved CycleGAN with skip connections
Alenezi Image Dehazing Based on Pixel Guided CNN with PAM via Graph Cut.
CN114022371B (zh) 基于空间和通道注意力残差网络的去雾装置及其去雾方法
CN112330639A (zh) 一种用于彩色-热红外图像的显著性检测方法
CN111814884A (zh) 一种基于可变形卷积的目标检测网络模型的升级方法
Song et al. Dual-model: Revised imaging network and visual perception correction for underwater image enhancement
CN108171651B (zh) 基于多模型几何拟合和分层单应变换的图像对齐方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200715

Address after: 411, block a, Zhizao street, Zhongguancun, No. 45, Chengfu Road, Haidian District, Beijing 100080

Patentee after: Beijing Youke Nuclear Power Technology Development Co.,Ltd.

Address before: 300072 Tianjin City, Nankai District Wei Jin Road No. 92

Patentee before: Tianjin University

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201014

Address after: 115, 1 / F, block C, Zhizao street, Zhongguancun, 45 Chengfu Road, Haidian District, Beijing

Patentee after: Beijing chaofang Information Technology Co.,Ltd.

Address before: 411, block a, Zhizao street, Zhongguancun, No. 45, Chengfu Road, Haidian District, Beijing 100080

Patentee before: Beijing Youke Nuclear Power Technology Development Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210208

Address after: 518005 1001, building C2, Nanshan wisdom garden, 1001 Xueyuan Avenue, Changyuan community, Taoyuan Street, Nanshan District, Shenzhen City, Guangdong Province

Patentee after: Shenzhen Lingyun Shixun Technology Co.,Ltd.

Address before: 115, 1 / F, block C, Zhizao street, Zhongguancun, 45 Chengfu Road, Haidian District, Beijing

Patentee before: Beijing chaofang Information Technology Co.,Ltd.