CN107424122A - 一种大位移下形变辅助的图像插补方法 - Google Patents
一种大位移下形变辅助的图像插补方法 Download PDFInfo
- Publication number
- CN107424122A CN107424122A CN201710544572.XA CN201710544572A CN107424122A CN 107424122 A CN107424122 A CN 107424122A CN 201710544572 A CN201710544572 A CN 201710544572A CN 107424122 A CN107424122 A CN 107424122A
- Authority
- CN
- China
- Prior art keywords
- image
- deformation
- target
- interpolation
- source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000006073 displacement reaction Methods 0.000 title claims abstract description 44
- 230000007704 transition Effects 0.000 claims abstract description 39
- 238000005457 optimization Methods 0.000 claims abstract description 12
- 239000011159 matrix material Substances 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 17
- 230000009466 transformation Effects 0.000 claims description 15
- 230000002457 bidirectional effect Effects 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 8
- 238000007499 fusion processing Methods 0.000 claims description 7
- 238000002372 labelling Methods 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 2
- 238000011524 similarity measure Methods 0.000 claims description 2
- 230000002123 temporal effect Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 18
- 230000004927 fusion Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 101001022170 Homo sapiens FYN-binding protein 2 Proteins 0.000 description 4
- 101000990990 Homo sapiens Midkine Proteins 0.000 description 4
- 102100030335 Midkine Human genes 0.000 description 4
- 238000009499 grossing Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007500 overflow downdraw method Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4023—Scaling of whole images or parts thereof, e.g. expanding or contracting based on decimating pixels or lines of pixels; based on inserting pixels or lines of pixels
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20016—Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明公开了一种大位移下形变辅助的图像插补方法,基本目标是对给出的两幅存在较大位移的源图像进行插补实现源图像到目标图像的平滑过渡,首先对输入的源图像和目标图像进行关联点标注。进而根据关联点,对图像作形变操作,得到前向和后向形变图像序列。考虑源相似性和时间相关性,用一种迭代优化策略融合前向和后向形变图像序列,从而插补得到平滑自然的图像中间过渡帧。
Description
技术领域
本发明涉及一种目标图像和源图像存在大位移情况的图像插补方法,属于图像插补领域。
背景技术
在现有的图像插补技术中,通常涉及如下技术要点:源图像与目标图像关联特征点确定、中间过渡像素运动路径的确定、插补映射空间和混合投影像素。
基于网格的插补算法[1,2],不仅需要大量的人工标注工作,由于网格变化的全局特性,不适用于局部大尺度变化的图像过渡。基于点的插补算法[3,4,5,6,7],直接利用图像结构、颜色等信息计算出源图像与目标图像的特征关联点,然而当图像间差异太大时,很难实现准确的图像匹配。基于块的插补算法[8,9],直接限制目标图像和源图像之间的局部相似性,同时能较好地保留图像结构和细节,但同样无法很好处理目标图像和源图像存在大位移的情况。
由于传统的图像插补方法依赖于准确的图像匹配,因此上述各技术均并不适用于大位移下图像插补问题。
[1]Smythe DB.A two-pass mesh warping algorithm for objecttransformation and image interpolation[J].Rapport technique,1990,1030:31.
[2]Wu E,Liu F.Robust image metamorphosis immune from ghost and blur[J].The Visual Computer,2013,29(4):311-321.
Lee,S.,Chwa,K.Y.,Hahn,J.,Shin,S.Y.,Wolberg,G..Image metamorphosisusing snakes and free-form deformations[C]//InProceedings of SIGGRAPH 95,1995:439–448.
[3]Baker S,Scharstein D,Lewis J P,et al.A database and evaluationmethodology for optical flow[J].International Journal of Computer Vision,2011,92(1):1-31.
[4]Liu C,Yuen J,Torralba A.Sift flow:Dense correspondence acrossscenes and its applications[J].IEEE transactions on pattern analysis andmachine intelligence,2011,33(5):978-994.
[5]Lowe D G.Distinctive image features from scale-invariant keypoints[J].International journal of computer vision,2004,60(2):91-110.
[6]Lipski,C.,Linz,C.,Magnor,M.Belief propagation optical Flow forhigh-resolution image morphing[C]//ACM SIGGRAPH 2010Posters,ACM,2010:67.
[7]Linz,C.,Lipski,C.,Magnor,M.Multi-image interpolation based ongraph-cuts and symmetric optic flow[C]//ACM SIGGRAPH 2010Posters,ACM,2010:115–122.
[8]Shechtman E,Rav-Acha A,Irani M,et al.Regenerative morphing[C]//Computer Vision and Pattern Recognition(CVPR),2010IEEE Conference on.IEEE,2010:615-622.
[9]Darabi S,Shechtman E,Barnes C,et al.Image melding:Combininginconsistent images using patch-based synthesis[J].ACM Trans.Graph.,2012,31(4):82:1-82:10.
发明内容
本发明技术解决问题:克服现有技术的不足,提供一种大位移下形变辅助的图像插补方法,对源图像和目标图像进行插补,实现具有较大位移情况下的平滑过渡。
为了实现上述目的,现提出的方案如下:
步骤S101:对输入的源图像和目标图像进行关联点标注,从而实现人工控制插补路径;
步骤S102:根据步骤S101中的关联点,对源图像和目标图像分别作形变操作,得到前向和后向形变图像序列;
步骤S103:考虑源相似性和时间相关性,利用一种迭代优化策略,融合步骤S102得到的前向和后向形变图像序列,从而插补得到平滑自然的图像中间过渡帧。
步骤S101:对输入的源图像和目标图像进行关联点标注时,根据源图像与目标图像形状和结构特征,对源图像和目标图像进行人工标记特征关联点,实现用户控制图像插补路径。
步骤S102中:对源图像和目标图像作形变操作,得到前向和后向形变图像序列,包括以下步骤:
(1)对输入源图像和目标图像分别提取前景并进行三角网格化,得到一个前景的三角网格;
(2)利用用户人工标记的关联点作为图柄,基于一种局部控制的近似刚性形变模型LC-ARAP(locally controlled as-rigid-as-possible,LC-ARAP)对所述三角网格进行形变操作,在求解三角网格中单个三角形的最优变换和整体三角网格形变位移中迭代解三角网格的形变结果;
(3)根据三角网格的形变结果,对源图像和目标图像分别插值得到前向和后向形变图像序列。
步骤S03中,融合步骤S102得到的前向和后向形变图像序列,从而得到图像插补结果,具体包括:
(1)根据源相似性和时间相关性要求,即待插补图像与相邻前向、后向形变图像和相邻前帧、后帧插补图像的相似性要求,确定能量函数,将图像插补问题转化为目标能量函数优化问题;
(2)基于图像的拉普拉斯金字塔和高斯金字塔,确定相似性度量,利用“重建-融合”两步迭代算法优化所述目标能量函数,得到满足源相似性和时间相关性的中间过渡帧。
所述步骤(2)中,基于一种局部控制的近似刚性形变模型LC-ARAP具体过程如下:
(21)根据形变的近似刚性、局部控制性、形状感知性和平滑性要求,确定目标能量函数,所述目标能量函数包括近似刚性能量项、稀疏能量项和平滑能量项;
(22)采用两步迭代“局部-全局”算法解出满足所述能量函数的最优形变位移:“局部”阶段,固定位移矩阵D,计算三角网格中每个三角形的最优变换矩阵Rt;“全局”阶段,固定Rt,利用快速交替方向乘子法计算出全局最优位移D,据此对三角网格进行位移得到三角网格的形变结果。
所述步骤(2)具体过程如下:
(31)基于图像的拉普拉斯金字塔和高斯金字塔,确定基于块的双向相似性度量;
(32)利用“重建-融合”两步迭代算法优化前述目标能量函数:“重建”过程,根据当前过渡图像帧不仅与时间相邻过渡图像帧相关而且与其对应的前向、后向形变图像相似的特点,基于块的双向相似性度量方法,采用双向最近邻映射重建出当前过渡图像帧与相邻四幅图像,即前向、后向形变图像,相邻前帧、后帧图像的双向映射高斯金字塔和拉普拉斯金字塔;“融合”过程,融合重建的高斯金字塔和拉普拉斯金字塔,获得更新的当前插补过渡图像帧;
(33)对所有帧实施“重建-融合”过程并迭代多次,得到满足源相似性和时间相关性的中间过渡帧。
本发明与现有技术相比的优点在于:本发明首先利用一种局部控制的图像形变算法对源图像和目标图像进行形变操作,在满足形变局部控制性、近似刚性、形状感知性和平滑性要求的基础上,矫正源图像和目标图像之间存在的较大的位移;其次利用基于块的拉普拉斯图像融合方法,迭代融合前向和后向形变图像序列获得平滑自然的图像中间过渡帧。与现有方法相比,本发明能很好地处理源图像和目标图像存在较大位移的情况,改善传统图像插补方法在源图像和目标图像未能精确对准带来的严重的鬼影现象。在融合形变图像序列的过程中本发明采用了基于块的插补算法,能更好地保留图像细节并处理图像未精确配准的情况。同时,本发明相比于传统的基于梯度算子或泊松融合方法,降低了计算量。通过评估,上述策略使本发明公开的图像方法在源图像和目标图像存在大位移下的图像插补问题上表现出良好的性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1示出了本发明一个实施例公开的一种大位移情况下形变辅助的图像插补方法的基本流程;
图2示出了本发明的公开方法的一种形象化的表示;
图3示出了本发明在人脸过渡实施例的实施结果;
图4示出了本发明在手语视频合成过渡帧插补实施例的实施结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
1、如图1所示,对输入的源图像和目标图像进行关联点标注,从而实现人工控制插补路径;
2、根据关联点,对源图像和目标图像分别作形变操作,得到前向和后向形变图像序列,包括:
对输入源图像和目标图像分别提取前景,并用二维Delaunay三角网格对前景进行三角网格化;
利用用户人工标记的关联点作为图柄,考虑形变位移的近似刚性、局部控制性、形状感知性和平滑性,基于一种局部控制的近似刚性形变模型LC-ARAP对网格进行形变操作,采用一种轮换最小平方策略——“局部-全局”算法对模型求解,迭代计算单个最优三角形变换和计算整体三角网格形变位移;
根据形变网格,对源图像和目标图像分别插值得到前向和后向形变序列。
3、融合前向和后向形变序列,从而得到从源图像到目标图像平滑自然过渡的图像插补结果。包括:
根据前向后和向形变图像序列对待插补图像进行初始化;
考虑源相似性和时间相关性,定义目标能量函数,将图像插补问题转化为目标函数优化问题;
基于上采样高斯金字塔和拉普拉斯金字塔,定义双向相似性距离;
分别针对当前待更新的过渡帧与相邻过渡帧和相邻形变图像的块的相似性,迭代搜索双向最近邻映射,获取并叠加双向更新的金字塔,重建过渡帧的上采样高斯金字塔和拉普拉斯金字塔;
根据目标能量函数,加权叠加重建过程获取的四个上采样高斯金字塔,对表示高频成分的拉普拉斯金字塔采用一种贪婪的近似,融合最终的上采样高斯金字塔和拉普拉斯金字塔更新当前的插补过渡帧。
更新所有插补过渡帧,迭代上述重建和融合过程,得到满足源相似性和时间相关性的平滑自然的图像中间过渡帧。
本发明一个实施例公开公开的一种大位移下二维图像形变辅助的图像插补方法。
由图1可知,该方法包括:
S101:对输入的源图像和目标图像标注关联点。
为了控制图像插补的路径,需输入的源图像和目标图像进行关联点标注。如图2源图像A和目标图像B所示,线段端点即为标注的关联点。
S102:根据关联点,对源图像和目标图像分别进行形变操作,获得前向和后向形变图像序列。
本发明提出一种改进的基于稀疏模型的近似刚性形变模型——局部控制的近似刚性形变模型LC-ARAP。
(1)模型构建
首先对输入源图像和目标图像分别提取前景并进行三角网格化。将提取的前景二维形状三角剖分为包含n个顶点的三角网格S,在网格上设置m个形变约束。令为点b在网格S中的位置,代表图柄约束(Ω是图柄集)。形变的目标就是计算出根据约束变形后形状S′中各点的位置p′i。定义形变位移矩阵(由点位移di=p′i-pi构成的矩阵),其中第i行di为点vi的位移向量。
目标函数定义如下:
上式中,Earap是目标形状的近似刚性能量,Esparse衡量位移的稀疏性,Esmooth避免位移突变,非负权重α、β分别反映局部性和平滑性在形变中的重要性。
定义形变方程f在点p的雅克比矩阵为Jf(p),点p的线性变换方程定义为h(p),则ARAP能量为:
这里||·||F是Frobenius范数,衡量局部形变和线性变换的差异。
为了实现局部控制,在目标函数中引入稀疏项:
形变位移D的范数等价于向量[||d1||,||d2||,...,||dn||]的范数,用于惩罚位移非零区域的多少。φi是惩罚权重,与网格点到控制图柄的距离相关。采用双调和距离(计算表面上两点的距离,有全局形状感知性)用于构建点vi的惩罚权重方程:
φi=g(min(xi))
xi=[xi1,xi2,...,xim]是双调和距离向量,其中xij是点vi到图柄Hj的双调和距离,g(·)是单调递增的函数。min(·)挑选最小距离,意味着点的移动是由最近的图柄控制的。该稀疏项的引入,使得形变模型同时满足局部性和形状感知性。
为了在局部控制的同时更好地保持形状特性,在目标函数中引入平滑正则项如下:
在上式中,Δ是拉普拉斯算子,dx(vi)=dix,dy(vi)=diy。位移向量di=[dix,diy]是由两个相互垂直方向的位移dix和diy构成。拉普拉斯能量使得位移在表面各处C∞连续,在图柄处C1连续。
(2)模型求解
模型求解采用轮换最小平方策略——“局部-全局”算法,先求解单个三角形的最优变换,然后组合所有变换后的三角形构成整个三角网格。用二维Delaunay三角网格网格化形状。假设三角形网格S由标记为t=1,2,...,F的三角形构成。定义三角形t的线性变换的矩阵为与点vi相邻接的点集为N(i)。ARAP能量式可以离散化为如下形式:
是三角形t内点vi的余切角,R′t=Rt-I,Γt是三角形Lp内的顶点集合。用有限元方法离散化平滑能量式,得到如下:
上式中,Q=LM-1L,是由两个互相垂直的位移向量和组成的矩阵。在标准线性FEM拉普拉斯算子M-1L中,M是集中质量矩阵,L是对称刚度矩阵。
“局部”阶段。固定位移矩阵D,计算每个三角形的最优变换矩阵Rt;当D为定值时,稀疏项Esparse和平滑项Esmooth是常数。三角形t的局部ARAP能量如下:
从而得到:
tr(·)表示矩阵的迹。将协方差矩阵定义为:
上式中,Ut和Vt是正交矩阵,Σt是对角矩阵,则:
令则M是正交矩阵,即从而推得mij≤1。因此,可以得到:
当mii=1,上式达到最大值。此时则最优变换矩阵Rt可以通过奇异值分解求得:
“全局”阶段。固定Rt,计算全局最优位移D。根据“局部”阶段得到的Rt,求解全局形变位移的问题可以视为一个凸优化问题。图柄上的点位移是用户预设的,记为DΩ={di|vi∈Ω},形变目标则是求剩余位置的位移因此,可以将平滑项重写为:
类似地,ARAP能量可以转化为:
上式中,变换矩阵已经在“局部”阶段解得,则A,B和C是常数矩阵。因此,将“全局”优化目标重新表达为:
求解全局最优位移,采用快速交替方向乘子法(fast alternating directionmethod of multiplies,FADMM)。引入变量Z,则全局优化问题可以表示为:
増广拉格朗日方程为:
惩罚项使得对偶函数在更一般的条件下可导。是拉格朗日乘子,μ是惩罚参数,是对角化权重矩阵。<A,B>=tr(ATB)表示两矩阵的内积。引入变量 更新步长t和更新步长γ。迭代过程如下:
Step1更新Z(k+1)
Step2更新
Step3更新Λ(k+1)和c(k+1)
Step4更新和
如果c(k+1)<ηc(k)(0<η<1):
否则t(k+1)=1,c(k+1)=c(k)/η。
直到达到迭代次数上限或者位移更新小于阈值,停止迭代,输出形变位移,据此对三角网格进行位移得到三角网格的形变结果。
S103:用一种迭代优化策略融合前向和后向形变图像序列,得到最终的图像插补结果。
采用简单的插值融合方法会使得融合结果因为待融合图像不对准而出现伪影现象。为提高融合质量,融合所得的过渡帧需同时满足源相似性和时间相干性,即图3中的Tn既要与An和Bn相似,又要与Tn-1和Tn+1相似。定义目标能量函数:
α1、α2、α3和α4为分别为Tn与An、Bn、Tn-1和Tn+1的相似性权重。给定的两幅图像I1和I2的相似性采用双向相似性进行评价,
Ebds(I1,I2)=Ecomplete(I1,I2)+Ecoherence(I1,I2)
其中,P和Q为图像I1和I2中大小为w×w的块,E(P,Q)为P和Q的距离度量,Ecomplete和Ecoherence分别表示双向相似性距离中的完整性度量和一致性度量。完整性度量保证生成的每一帧尽可能地描述源图像的信息,而一致性度量避免了目标图像出现源图像没有的信息和不自然的结构。利用拉普拉斯金字塔的低计算复杂度和的良好结构保持特性,采用拉普拉斯金字塔对图像块表示。对一幅图像I建立高斯金字塔和拉普拉斯金字塔,且有:
为图像I的第i+1层高斯金字塔,为第i层拉普拉斯金字塔。则E(P,Q)可表示为:
其中,和分别为I1和I2对应U金字塔的块P和块Q。D2为均方距离和,D0为范数距离。λ因子决定距离度量中低频成分和高频成分所占权重的比。
目标能量函数的求解采用一种包含重建和融合两步的迭代优化算法。
(1)重建过程
记图像I1的金字塔为I2的金字塔为首先根据完整性要求,优化Ecomplete。依据距离度量E(P,Q),从I2金字塔中选择与I1金字塔中块P最相似的块,构建各尺度下图像I2→I1的最近邻块映射NNF。记第i层尺度对应的最近邻块映射关系为NNFi。假定金字塔共有0,1,...,s共s+1层,在给出的初始化下,初始化最近邻块映射:
在尺度i下,I1重构金字塔坐标为(x,y)的像素值:
其中Qx,y表示像素(x,y)在左上角的w×w的块,为未更新中的块Qx,y在中的最近邻图像块。由上式可见,更新后即为在尺度i下根据最近邻场对应关系下中块Qx,y的最近邻图像块像素平均值。同理。此时,重构高斯金字塔:
为将以上过程拓展到更精细尺度上,在i>0时,对尺度i-1的金字塔初始化采用如下方式,
NNFi-1=upsample(NNFi)
在上继续搜索更新最近邻场并重复以上过程至尺度i=0。得到依据完整性的I1金字塔重建结果:
类似地,依据相干性要求,可以求解出和再根据双向相似性距离要求,得到最终关于图像I1和I2的重建金字塔:
(2)融合过程
根据重建过程得到与Tn相关的如下金字塔:
根据公式得:
为避免损失过多的源图像细节,本发明对高频成分采用一种贪婪的近似,即:
这样就将4个拉普拉斯金字塔中具有最大加权幅度的像素作为最终输出拉普拉斯金字塔的像素。最后,融合和得到更新的中间过渡帧:
迭代上述重建和融合过程至预先设置的终止条件(如迭代次数),获得最终的满足源相似性和时间相关性的平滑自然的图像中间过渡帧。
图3和图4分别示出了以上过程在人脸变换过渡和手语过渡帧插补的实施结果。图3人脸变换实施例中,左右两端为给出的源图像和目标图像,基本实施流程:先采用ASM(Active shape model)算法检测源图像和目标图像中人脸的关键点,并标记为关联点;再用本发明提出的局部控制的近似刚性形变模型LC-ARAP对源图像和目标图像进行形变得到前向形变图像序列和后向图像形变序列;最后利用本发明的基于块的图像插补算法融合前向、后向形变图像序列,得到平滑自然过渡的人脸变换序列。图4手语过渡帧插补实施例的目标是插补过渡帧实现手部存在错位的两幅图像的自然过渡,用于手语的视频合成。该实施例基本流程与上述类似,只在关联点标注上略有不同,其关联点采用的是手工标注或人体骨骼点检测算法检测的人体骨骼点。图4显示,运用本发明的方法实现了两个具有较大手部错位的手语图像帧之间的平滑过渡。
总之,本发明相比于传统的图像插补方法,本发明针对传统方法难以处理的源图像和目标图像之间存在大位移情况,采用一种局部控制的近似刚性形变模型LC-ARAP对源图像与目标图像进行变形生成前向和后向的形变图像序列;再基于源相似性和时间相干性,采用一种迭代优化的方式对目标能量函数进行优化将形变图像序列进行融合,生成平滑自然的过渡帧。本发明可应用于视频过渡帧的插补生成等场景,例如手语视频合成。
最后,还需要说明的是,在本发明中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本发明中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
提供以上实施例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。
Claims (6)
1.一种大位移下形变辅助的图像插补方法,其特征在于,包括:
步骤S101:对输入的源图像和目标图像进行关联点标注,从而实现人工控制插补路径;
步骤S102:根据步骤S101中的关联点,对源图像和目标图像分别作形变操作,得到前向和后向形变图像序列;
步骤S103:考虑源相似性和时间相关性,利用一种迭代优化策略,融合步骤S102得到的前向和后向形变图像序列,从而插补得到平滑自然的图像中间过渡帧。
2.根据权利要求1所述的方法,其特征在于:步骤S101:对输入的源图像和目标图像进行关联点标注时,根据源图像与目标图像形状和结构特征,对源图像和目标图像进行人工标记特征关联点,实现用户控制图像插补路径。
3.根据权利要求1所述的方法,其特征在于:步骤S102中:对源图像和目标图像作形变操作,得到前向和后向形变图像序列,包括以下步骤:
(1)对输入源图像和目标图像分别提取前景并进行三角网格化,得到一个前景的三角网格;
(2)利用用户人工标记的关联点作为图柄,基于一种局部控制的近似刚性形变模型LC-ARAP(locally controlled as-rigid-as-possible,LC-ARAP)对所述三角网格进行形变操作,在求解三角网格中单个三角形的最优变换和整体三角网格形变位移中迭代解三角网格的形变结果;
(3)根据三角网格的形变结果,对源图像和目标图像分别插值得到前向和后向形变图像序列。
4.根据权利要求1所述的方法,其特征在于:步骤S03中,融合步骤S102得到的前向和后向形变图像序列,从而得到图像插补结果,具体包括:
(1)根据源相似性和时间相关性要求,即待插补图像与相邻前向、后向形变图像和相邻前帧、后帧插补图像的相似性要求,确定能量函数,将图像插补问题转化为目标能量函数优化问题;
(2)基于图像的拉普拉斯金字塔和高斯金字塔,确定相似性度量,利用“重建-融合”两步迭代算法优化所述目标能量函数,得到满足源相似性和时间相关性的中间过渡帧。
5.根据权利要求3所述的方法,其特征在于:所述步骤(2)中,基于一种局部控制的近似刚性形变模型LC-ARAP具体过程如下:
(21)根据形变的近似刚性、局部控制性、形状感知性和平滑性要求,确定目标能量函数,所述目标能量函数包括近似刚性能量项、稀疏能量项和平滑能量项;
(22)采用两步迭代“局部-全局”算法解出满足所述能量函数的最优形变位移:“局部”阶段,固定位移矩阵D,计算三角网格中每个三角形的最优变换矩阵Rt;“全局”阶段,固定Rt,利用快速交替方向乘子法计算出全局最优位移D,据此对三角网格进行位移得到三角网格的形变结果。
6.根据权利要求4所述的方法,其特征在于:所述步骤(2)具体过程如下:
(31)基于图像的拉普拉斯金字塔和高斯金字塔,确定基于块的双向相似性度量;
(32)利用“重建-融合”两步迭代算法优化前述目标能量函数:“重建”过程,根据当前过渡图像帧不仅与时间相邻过渡图像帧相关而且与其对应的前向、后向形变图像相似的特点,基于块的双向相似性度量方法,采用双向最近邻映射重建出当前过渡图像帧与相邻四幅图像,即前向、后向形变图像,相邻前帧、后帧图像的双向映射高斯金字塔和拉普拉斯金字塔;“融合”过程,融合重建的高斯金字塔和拉普拉斯金字塔,获得更新的当前插补过渡图像帧;
(33)对所有帧实施“重建-融合”过程并迭代多次,得到满足源相似性和时间相关性的中间过渡帧。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710544572.XA CN107424122A (zh) | 2017-07-06 | 2017-07-06 | 一种大位移下形变辅助的图像插补方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710544572.XA CN107424122A (zh) | 2017-07-06 | 2017-07-06 | 一种大位移下形变辅助的图像插补方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107424122A true CN107424122A (zh) | 2017-12-01 |
Family
ID=60426956
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710544572.XA Pending CN107424122A (zh) | 2017-07-06 | 2017-07-06 | 一种大位移下形变辅助的图像插补方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107424122A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109360166A (zh) * | 2018-09-30 | 2019-02-19 | 北京旷视科技有限公司 | 一种图像处理方法、装置、电子设备和计算机可读介质 |
CN110858879A (zh) * | 2018-08-23 | 2020-03-03 | 浙江宇视科技有限公司 | 视频流处理方法、装置及计算机可读存储介质 |
CN112136153A (zh) * | 2018-04-19 | 2020-12-25 | 上海科技大学 | 基于光场的反射消除 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103310458A (zh) * | 2013-06-19 | 2013-09-18 | 北京理工大学 | 结合凸包匹配和多尺度分级策略的医学图像弹性配准方法 |
-
2017
- 2017-07-06 CN CN201710544572.XA patent/CN107424122A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103310458A (zh) * | 2013-06-19 | 2013-09-18 | 北京理工大学 | 结合凸包匹配和多尺度分级策略的医学图像弹性配准方法 |
Non-Patent Citations (3)
Title |
---|
JIAXU CHEN等: "Image Morphing Using Deformation and Patch-based Synthesis", 《2017 2ND INTERNATIONAL CONFERENCE ON IMAGE, VISION AND COMPUTING》 * |
JIAXU CHEN等: "Locally controlled as-rigid-as-possible deformation for 2D characters", 《COMPUTER ANIMATION AND VIRTUAL WORLDS》 * |
YONATAN WEXLER等: "Space-Time Completion of Video", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112136153A (zh) * | 2018-04-19 | 2020-12-25 | 上海科技大学 | 基于光场的反射消除 |
CN112136153B (zh) * | 2018-04-19 | 2024-05-17 | 上海科技大学 | 基于光场的反射消除 |
CN110858879A (zh) * | 2018-08-23 | 2020-03-03 | 浙江宇视科技有限公司 | 视频流处理方法、装置及计算机可读存储介质 |
CN109360166A (zh) * | 2018-09-30 | 2019-02-19 | 北京旷视科技有限公司 | 一种图像处理方法、装置、电子设备和计算机可读介质 |
CN109360166B (zh) * | 2018-09-30 | 2021-06-22 | 北京旷视科技有限公司 | 一种图像处理方法、装置、电子设备和计算机可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Neuris: Neural reconstruction of indoor scenes using normal priors | |
Wu et al. | Pointpwc-net: A coarse-to-fine network for supervised and self-supervised scene flow estimation on 3d point clouds | |
CN111325794A (zh) | 一种基于深度卷积自编码器的视觉同时定位与地图构建方法 | |
Li et al. | Robust 3d self-portraits in seconds | |
KR20190065287A (ko) | 통계적 모델을 이용한 이미지 데이터로부터의 깊이 예측 | |
CN108876814B (zh) | 一种生成姿态流图像的方法 | |
CN111091624B (zh) | 一种从单张图片生成高精度可驱动人脸三维模型的方法 | |
Agudo et al. | Real-time 3D reconstruction of non-rigid shapes with a single moving camera | |
CN106934827A (zh) | 三维场景的重建方法和装置 | |
CN103456038A (zh) | 一种井下环境三维场景重建方法 | |
CN113538667B (zh) | 动态场景光场重建方法及装置 | |
Jordt et al. | Direct model-based tracking of 3d object deformations in depth and color video | |
Chun et al. | Learnable human mesh triangulation for 3d human pose and shape estimation | |
CN114429555A (zh) | 由粗到细的图像稠密匹配方法、系统、设备及存储介质 | |
CN107424122A (zh) | 一种大位移下形变辅助的图像插补方法 | |
CN111460741B (zh) | 一种基于数据驱动的流体模拟方法 | |
Han et al. | Robust shape estimation for 3D deformable object manipulation | |
CN110580715B (zh) | 一种基于照度约束和格网变形的图像对齐方法 | |
CN114723884A (zh) | 三维人脸重建方法、装置、计算机设备及存储介质 | |
JP2024510230A (ja) | 顔表情、身体ポーズ形状及び衣服パフォーマンスキャプチャのための暗黙的微分可能レンダラーを用いたマルチビューニューラル人間予測 | |
CN106484511A (zh) | 一种谱姿态迁移方法 | |
CN116597112A (zh) | 基于几何先验网络的三维重建方法及装置 | |
CN114219900B (zh) | 基于混合现实眼镜的三维场景重建方法、重建系统和应用 | |
Cai et al. | Two-view curve reconstruction based on the snake model | |
Sengupta et al. | Visual tracking of deforming objects using physics-based models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20171201 |