CN103907109B9 - 为图像处理目的用滤波器应用卷积的快速数值逼近 - Google Patents

为图像处理目的用滤波器应用卷积的快速数值逼近 Download PDF

Info

Publication number
CN103907109B9
CN103907109B9 CN201280031391.2A CN201280031391A CN103907109B9 CN 103907109 B9 CN103907109 B9 CN 103907109B9 CN 201280031391 A CN201280031391 A CN 201280031391A CN 103907109 B9 CN103907109 B9 CN 103907109B9
Authority
CN
China
Prior art keywords
convolution
kernel
wave filter
image
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280031391.2A
Other languages
English (en)
Other versions
CN103907109A (zh
CN103907109B (zh
Inventor
丹尼尔·利斯钦斯基
拉阿南·法塔尔
泽埃夫·法布曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yissum Research Development Co of Hebrew University of Jerusalem
Original Assignee
Yissum Research Development Co of Hebrew University of Jerusalem
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yissum Research Development Co of Hebrew University of Jerusalem filed Critical Yissum Research Development Co of Hebrew University of Jerusalem
Publication of CN103907109A publication Critical patent/CN103907109A/zh
Publication of CN103907109B publication Critical patent/CN103907109B/zh
Application granted granted Critical
Publication of CN103907109B9 publication Critical patent/CN103907109B9/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4084Transform-based scaling, e.g. FFT domain scaling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration by the use of local operators

Abstract

一种计算机实现的方法,用于用滤波器f应用由级l的分层信号al表示的图像I的卷积的数值逼近,所述方法包括步骤:通过对于每一层级l应用al和内核hI之间的卷积以及通过对卷积的al和hI的结果进行向下采样,生成正变换;通过对于每一层级l应用内核h2和向上采样的正变换之间的卷积以及将该结果与a1和内核g的卷积组合,生成逆变换;以及将正变换和逆变换组合来产生为a和f之间的卷积的逼近的其中,内核hI,hI和g是滤波器f的优化内核。

Description

为图像处理目的用滤波器应用卷积的快速数值逼近
技术领域
本发明涉及图像处理,以及更具体地说,涉及在图像处理中用滤波器应用卷积的快速数值逼近。
背景技术
计算机图形和图像处理中的许多任务涉及将大型线性平移不变(LTI)滤波器应用于图像。共同的例子包括图像的低通和高通滤波,以及响应于各种滤波器组而测量图像。在图1中示出了使用大型LTI滤波器也能实现的一些不太显然的任务:图10示出通过积分它们的梯度场10A来重构图像10B;图20示出拟合平滑膜20B来内插一组边界值20A;以及图30示出散开数据内插,30A作为输入以及30B作为输出。
尽管卷积是将LTI滤波器应用于图像的最直接方式,但它带来高的计算成本:要求O(n2)运算来卷积具有相当大小的内核的n像素图像。快速傅立叶变换(FFT)为周期域提供更有效的O(nlogn)替代方案。已经提出了用于某些特定情形的其他快速方法。例如,一种诸如自组算法描述了多尺度方法,能在分层二次采样位置,O(n)次逼近具有大的高斯内核的卷积。
除卷积的直接O(n2)实现外,还有能更有效地计算的某些情况。在周期域,能将每一卷积算子表示为由傅立叶基础对角线化的循环Topelitz矩阵。因此,使用快速傅立叶变换,可以O(nlogn)次执行周期域上的大内核卷积。
通过首先执行1D水平卷积,接着在垂直方向中执行(或反之亦然),能加速具有可以表示为两个1D内核的外积的可分的2D内核的卷积。因此,成本是O(kn),其中,k是1D内核的长度。使用各个顺序的内核B样条滤波器的SVD分解,通过可分内核,可以逼近不可分内核,以及使用重复积分或广义积分图像,每一像素以恒定时间可以估计尺度。
因为它们的重要作用,已经专门开发了许多方法来逼近具有高斯内核的卷积。与该工作特别有关的是所提出的分层离散相关方案。该多尺度方案O(n)次逼近高斯金字塔。由于通过高斯带的卷积限制信号,将粗糙级内插回精细级提供对具有O(n)的大型高斯内核的卷积的逼近。然而,该逼近仅对某些宽度的高斯精确。
上述想法在拉普拉斯金字塔中达到顶点,并且后来与小波关联。更具体地说,拉普拉斯金字塔可以视作高密度小波变换。这些想法还被效仿,其中,O(nlogn)次构建多尺度双边滤波器金字塔。拉普拉斯金字塔以及各种其他小波变换将信号分解成表明对各种分析和合成任务有用的低频和高频。特别地,可以逼近大内核的卷积的效果。然而,即使这些方案依赖于重复卷积(通常具有小内核),但它们不是平移不变的,即,如果平移输入,最终分析和合成将不仅仅区别于平移。这是由于这些方案使用二次采样运算,用于实现它们的快速O(n)性能。
在过去数十年认为相当重要的一种情况是从其卷积形式恢复信号,例如,从其梯度场恢复图像。这产生诸如泊松方程的线性方程的平移不变系统。相应的矩阵再次是Topelitz矩阵,在周期域上使用FFT,能O(nlogn)次倒置。然而,存在用于在周期和非周期域上处理特定类型的这样方程的甚至更快O(n)的解算器。多重网格方法和基于分层的预处理通过以多尺度操作实现线性性能。描述了用于大梯度域问题的现有技术的多重网格解算器,以及描述了用于较小问题的GPU实现。由于这些线性系统中的矩阵是循环行列式(或接近循环行列式,由域而定),它们的互逆也是循环卷积矩阵。因此,原则上,通过卷积具有内核的右手侧,例如,在无限泊松方程的情况下的格林函数,能获得(或逼近)解决方案。我们的方法使得能够精确地逼近具有这些内核的卷积,因此,提供更有效以及更容易的实现用于求解这种方程的替代方案。
梯度域技术还广泛用于无缝克隆和拼接,产生类似的线性系统,但具有不同(Dirichlet)边界条件,通常在不规则形状域上求解。在这种情况下,求解通常归结为计算内插一组指定边界值的平滑膜来描述用于这些系统的基于专用四叉树的解算器,同时通过使用平均值内插,避免求解线性系统。
当将内插许多数据点时或当需要内插函数的密集估计时,该方法也能用在更常见的散开数据内插情形中。因此,在使用将信息传播到整个域的大卷积滤波器很重要的情况下,对散开数据内插提供有效的逼近将是有利的。
发明内容
本发明在其实施例中为图像处理目的用大支撑滤波器提供卷积的快速数值逼近的方法。在此所提出的方法包括在小波变换后形成的多尺度方案,其线性实时计算逼近。假定专用大目标滤波器逼近,首先使用数值优化来设计一组小内核,其然后用来执行所提出的多尺度变换的分析和合成步骤。在完成优化时,将最终变换线性实时地应用于任何信号。将在此证实所提出的方法非常适用于诸如梯度场积分、无缝图像克隆和散开数据内插的任务,优于现有技术的方法。
本发明的实施例针对通过降低复杂度,通用化逼近卷积的算法。在此提出了多尺度框架,不限于逼近特定内核,而是能被协调来再现多个有用大LTI滤波器的效果,同时O(n)次操作。特别地,在下文中,将证实所提出的框架对横跨泊松方程的解的格林函数、互逆距离加权内核和用于散开数据内插的广泛支持的高斯内核的适用性。
本发明在其实施例中提供多尺度方案,类似拉普拉斯金字塔,以及某些小波变换。然而,不同于这些更通用目的的变换,所提出的方法是定制设计该变换来直接逼近指定LTI算子的效果。换句话说,尽管现有技术的多尺度结构通常用于将该问题变换成能更好求解的空间,但在所提出的方法中,变换本身直接产生所需的解。
例如,本发明的非限制性实施例重复地执行具有三个小的固定宽度内核的卷积,同时对图像向下采样和向上采样,以便在所有尺度上操作。数值优化这些内核的每一个的加权,使得变换的整体动作通过某个目标滤波器最逼近卷积运算。对每一目标滤波器,优化仅需要完成一次,然后可以将最终多尺度变换应用于任何输入信号O(n)次。该设计后的动机将是避免处理由非理想的小的有限滤波器引起的分析难题,另一方面,尝试对其他实现最有效线性计算预算。
紧密地逼近具有自由空间格林函数的卷积的本发明的实施例的足以允许反转泊松方程的某些变量。在此将证实对该方程,所建议的方法快于现有技术的解算器,诸如基于多重网格方法的解算器,对相当大量的方程提供提高的精度和更高实现便利。
附图说明
为更好理解本发明的实施例以及示出如何实施,现在将仅通过例子参考附图,其中,相同的数字始终表示相应的元件或部件。
在附图中,
图1示出图示本发明的若干方面的若干图像处理应用;
图2是图示根据本发明的一些实施例的方面的高级框图;
图3A-3G示出说明本发明的方面的若干图像;
图4A-4F示出说明本发明的方面的若干图像;
图5A-5E示出说明本发明的方面的若干图像;
图6A-6F示出说明本发明的方面的若干图像和图;以及
图7A-7I示出说明本发明的方面的若干图像和图;
附图结合下述的详细描述对本领域的技术人员如何实际上具体化本发明将变得显而易见。
具体实施方式
现在参考详细地具体参考附图,强调所示的细节仅是示例性的和为本发明的优选实施例的说明性讨论目的,为提供认为最有用和最容易理解本发明的原理和概念方面而呈现。关于这一点,不尝试比本发明的基本理解所需更详细地示出本发明的结构细节,结合附图所做的描述使本领域的技术人员如何实际上具体化本发明的若干形式显而易见。
在详细地解释本发明的至少一个实施例之前,应理解本发明在其应用方面不限于在下述描述中阐述或在附图中所图示的部件的结构和排列的细节。本发明可应用于其他实施例或以各种方式实施或执行。同时,应理解在此所采用的措辞或术语是为了描述目的而不应被视作限制。
接下来是所提出的框架的一般描述以及由发明人所做的一些示例性设计决策的动机。稍后将论述使框架适应计算机图形学中的若干重要具体问题。
在用于尺度分离的计算机图形学和图像处理中,广泛地使用线性平移不变滤波。实际上,许多图像分析和操作算法在没有适当结构化的多尺度(子带)分解的情况下不能成功。在大多数应用中,当提取特定带时所需的频谱精度与带水平成比例:通常通过在频域中实现低定位的小型滤波器,提取高频分量,而低频通常需要以较高频谱精度,因此,使用大的低通滤波器。
诸如小波变换和拉普拉斯金字塔的子带体系结构依赖于频谱“分治”策略,其中,在每个尺度,经滤波划分频谱,然后进一步递归地拆分无大量数据丢失的情况下二次采样的频谱的低端。二次采样步骤允许使用小的固定长度的滤波器渐进地提取低频,因为由于使用二次采样,域本身缩小以及远点变得更近。该方法导致信号的高效线性时间处理,并且能达最大空间尺度地隔离低频模式(图像的DC分量)。
尽管对一些应用来说不是主要障碍,但这些分解遇到两个主要缺点。首先,最终变换的坐标,因此使用这些坐标执行的运算,对平移来说是不变量。
因此,不同于卷积,位移输入图像可以比仅空间偏移更大地改变结果。其次,为实现O(n)运行时间,有必要使用有限脉冲响应滤波器。这些滤波器能实现一些空间和频谱定位,但不提供频谱的理想划分。如在此所说明的,这些属性对一些应用(诸如求解泊松方程)和对特定形状内核的设计很关键。事实上,这两个缺点支配下述的新方案的设计,其目的是在O(n)的计算成本预算下,实现某些平移不变算子的最佳逼近。
图2图示可以实现在此公开的多尺度滤波方案的非限制性示例系统(100)。应注意到可以通过使用在数字信号处理(DSP)处理器或通用计算机上运行的软件,或在专用集成电路(ASIC)中,实现系统(100)。在所提出的多尺度滤波方案中,通过分析滤波器h1(104)对信号a0(102)卷积,以及使用二次采样器(106)以因子2二次采样该结果,执行正变换。然后,在二次采样数据(112)上重复该过程。此外,在每一级保持该信号的未滤波和未采样副本。形式上,在层次的每一级,执行下述计算:
a l 0 = a l - - - ( 1 )
a l + 1 = ↓ ( h l * a l ) - - - ( 2 )
其中,下标l表示层次中的级,以及是在每一级保持的未滤波数据,以及↓表示二次采样算子。通过设定启动变换,其中,是将滤波的输入信号。
逆变换(合成)包括使用向上采样器(116),通过在每两个采样之间插入0来向上采样,接着通过另一滤波器h2(118)卷积。通过合成器(120),将内插信号与在通过第三滤波器g(108)卷积后的那一级存储的信号合成,即:
a ^ l = h 2 * ( ↑ a ^ l + 1 ) + g * a l 0 - - - ( 3 )
其中,个表示0向上采样算子。应注意与在大多数子带体系结构中不同,所提出的合成不打算倒置分析和再现输入信号而是正反变换的组合动作(122)是指逼近应用于输入(102)的一些特定线性平移不变滤波运算的结果。
该方案类似于离散快速小波变换,区别在于如在拉普拉斯金字塔中,不二次采样所分解的信号(这些变换中的高频带和在此所示的情况中的所有频带)。与高密度小波变换类似,做出该选择以便最小化二次采样效果和增加平移不变。
假定理想滤波计算上可行,能选择以便最佳地隔离和渐近地重构原始数据的低频带,在这种情况下,g的作用将是逼近预期滤波运算。
然而,由于期望保持运算数量滤波器和g必须是有限的并且小。这意味着这些滤波器的设计必须考虑缺乏理想化,以及不同频带之间的最终复杂的相互关系。由此,不是由明确的分析滤波器设计方法导出滤波器和g,而是数值优化这些滤波器使得它们的接合动作将最佳地实现预期滤波运算。
总的来说,在此所提出的方法包括通过减少二次采样量,识别和和分配某些计算量,同时保持在计算的体制中,然后优化所分配的计算以便通过大滤波器最佳地逼近卷积。
优化
为逼近具有指定目标内核f的卷积,我们寻求最小化下述函数的一组内核
arg min F | | a ^ 0 F - f * a | | 2 - - - ( 4 )
其中,是在一些输入上具有内核F的建议多尺度变换的结果。为执行该优化,仍然确定内核的类型和它们的未知参数的数量。训练数据的选择取决于应用,并将在下文中论述。注意,一旦完成该优化并找到最佳内核,在此所提出的方案准备好用于在任何指定信号上逼近在补充材料中提供用来产生结果的最佳内核,因此,在实际使用它们时不要求进一步优化。
为最小化全体算术运算的数量,F中的内核应当小且分离。下面报告的特定选择在由发明人所做的实验中,对应于运算计数和逼近精度之间的良好折衷。使用较大和/或非分离滤波器增加精度,因此,特定选择取决于应用需求。值得注意的是,即使对非可分离目标滤波器使用F中的分离内核,可以实现相当精度结果。这能通过建议的变换对这些内核的结果求和,以及分离内核的和本身不一定分离的事实来解释。
此外,逼近的目标滤波器具有可旋转和镜像对称。由此,内核上的非对称性很显然被强制,降低自由度数和优化中的局部最小化的数。例如,仅通过两个参数定义分离3×3内核,以及通过三个参数,定义分离5×5内核。关于非分离内核,通过6个参数定义具有这对称性的5×5内核。取决于应用,选择目标滤波器的属性和预期逼近精度,以及F中的内核的不同组合。
为执行优化,在此使用BFGS准牛顿方法。为了提供初始猜测值,将内核设定成高斯型。在滤波前,按每一级的F中的最大内核的尺寸,对每一级补零。通常,优化过程在低分辨率网格(32×32)上开始。这很快速,但结果可能会受边界和所使用的填充方案影响。因此,该结果于是被用作用于在高分辨率网格上的优化的初始猜测值,其中,边界的影响变得可忽略。
应用和结果
在下述段落中,上述论述的方法应用于特定图像处理任务来逼近三种不同类型的卷积。可以使用试验和误差实验,确定对这些应用的每一个优化的特定内核集F。运行时间仅取决于这些内核的大小。为说明目的,在下表1中提供一些实际记录的运行时间性能:
网格大小(百万) 时间(秒,单核)
0.26 0.00019
1.04 0.010
4.19 0.047
16.77 0.19
67.1 0.99
表1
对具有用于的可分离5×5内核和用于g的可分离3×3内核的卷积金字塔,实现上表1所示的实际运行时间结果。表1中记录的时间排除盘I/O并且在2.3GHZ Inter Core i7TM(2820qm)MacBookProTM上测量。
许多计算机图形应用处理图像的梯度场。这些应用通过求解泊松方程,恢复在L2标准中最接近修改的梯度场的图像u。
Δu = div v - - - ( 5 )
其中,Δ是离散拉普拉斯算子。通常,实施诺埃曼边界条件其中,n是单位边界法向矢量。
格林函数定义泊松方程的基本解,并通过下述定义:
ΔG ( x , x , ) = δ ( x - x , ) - - - ( 6 )
其中,δ是离散δ函数。当在不具有边界条件的无限域上定义(5)时,拉普拉斯算子变为空间不变,因此,其反转也是如此。在这种情况下,仅取决于之间的(标量)距离,格林函数变为平移不变。在二维中,通过下述给出该自由空间格林函数:
G ( x , x , ) = G ( | | x - x , | | ) = 1 2 π log 1 | | x - x , | | - - - ( 7 )
由此,为紧密支持右手侧,通过下述卷积,给出(5)的解:
u = G * div v - - - ( 8 )
该解也称为的牛顿位势。使用我们的卷积金字塔,例如通过对右手侧补零,能有效地逼近。该公式和利用von诺埃曼边界条件的区别在于后者在边界上实施零梯度,而在自由空间公式中,在仅用作软约束的右手侧中编码边界上的零梯度。强制边界梯度为0是有点武断的决策,有人会坚称优选允许它们由域内的函数来确定。
为在(4)中执行优化,已经选择自然灰度级图像I,以及将训练信号设定成其梯度场的散度:同时
由于训练数据不应当太局限在空间(诸如δ函数)中,选择自然图像I。建议的方案不仅仅是平移不变并且局部化a会导致将在训练信号为零的其他区域中不执行的过拟合优化。已知自然图像是不具有绝对空间依赖性的稳定信号,此外,是希望最好在其上执行的信号类。实际上,最终内核集和方案的性能未显示所使用的特定图像的依赖性。
计算两个内核集,一个调整到较高精度,另一个倾向最快计算。第一集合由用于的同样7×7可分内核和用于g的另一7×7可分内核组成。更小型集合由用于的5×5可分内核和用于g的3×3可分内核组成。的内核大小对应于上表1中所报告的时间。
图3(a)示出通过对我们的方法将中心δ函数作为输入获得的自由空间格林函数的重构。与基本事实((6)的解)的比较揭示即使对内核集,平均绝对误差(MAE)也非常小:
沿x轴改变δ函数的尖峰信号的位置和通过每一最终重构的中心绘制水平切片(图3b)提示所建议的重构显示出非常小的空间偏差。
图3(c)示出自然图像(与为优化过程而选择的图像无关),将其梯度场散度被提供为在此所提出的方法的输入。
在图像(d)-(g)中示出了具有的两个重构和它们的相应误差。的重构的平均绝对误差为0.0027,以及为0.0052。视觉上,难以分辨重构和/或原始图像之间的差异。
在图4中,示出使用梯度域图像压缩产生的HDR压缩结果。使用具有von诺埃曼边界条件的泊松解算器获得左边的结果,而右边的结果使用我们的逼近。在两种情况下,使用同样的后处理,包括拉伸结果以便暗修剪0.5%的像素。
尽管可以注意到结果间的一些差异,但难以优选一个胜过另一个。另外的结果包括在补充材料中。在该图像重构的上下文中,我们的方法提出对线性解算器的更快替代方案,同时更易于实现。
比较表明用于这种重构的最快可用基于CPU的多重网格编码的一个是解算器的核内版本。由此,对于4.2兆像素图像,该解算器的运行时间为2.2秒,大于比在同一分辨率的彩色图像的三通道上运行我们的方法所需的0.15慢的数量级(在同一机器上测量两个时间)。
现有技术已知多重网格解算器的基于GPU的实现,同时实现每秒积分一兆像素图像约20次,支持交互梯度域绘图。在一种实现中,可以使用基于单核的CPU来实现上述方案。已经示出所建议的方案已经使得能够每秒积分这种图像33次。期望GPU实现产生显著的额外加速因子。
由于精确运行时间取决于所需精度和实现细节,在运算计数方面获得加速的更好理解很重要。多重网格解算器执行限制和延伸运算来改变网格分辨率,在每一分辨率具有少量松弛迭代和一个残差计算。尽管限制/延伸内核可以在不同方案间改变,但它们的大小(以及成本)通常可与我们的内核的大小(以及成本)相比。单高斯-塞德尔松弛迭代的成本为6n。结合残差计算,当在每一限制前后(也称为V(1,1)方案),仅通过一个松弛迭代,执行单一V循环时,在精细分辨率网格上产生18n运算。
相比较而言,在我们的方法中应用3×3g内核在最精细分辨率网格上花费12n运算(乘法和加法)。
由此,所提议的方法的运算计数小于V(1,1)的运算计数,而其获得的精度更佳。在所提议的方法的多重网格实现中,V(1,1)实现最大绝对误差0.05,其几乎是高于使用所提议的具有3×3g内核的方法实现的0.005误差的数量级。为实现更高精度,多重网格解算器可以执行更多V循环以及使用更松弛迭代,运算的数量相应增加。在所提议的方法中,还可以通过使用较大内核,改进逼近精度,如前所述。
边界内插
诸如无缝图像克隆和图像拼接的应用能被表述为边界值问题并且通过构造在一些感兴趣的区域上沿两个图像之间的接缝内插差异的平滑膜来有效地解决。
这些膜初始通过求解拉普拉斯方程来构建。然而,已经示出也可以使用其他平滑内插方案,诸如均值内插,提供计算优点。因此,在此示出如何通过逼近使用卷积金字塔的谢巴德的散开数据内插方法,甚至更快地构造适当的膜。
假定Ω表示感兴趣的区域(离散规则网格上),通过b(x)给出其边界值。目的是将这些值平滑地内插到Ω内的所有网格点。谢巴德的方法将x处的内插式r定义为已知边界值的加权平均值:
r ( x ) = Σ k w k ( x ) b ( x k ) Σ k w k ( x ) - - - ( 9 )
其中,是边界点。在由发明人所做的实验中,已经发现通过使用下述加权函数,获得满意的膜内插式:
w k ( x ) = w ( x k , x ) = l / d ( x k , x ) 3 - - - ( 10 )
在边界点具有强的尖峰信号,以及快速地衰减远离它。
(9)的朴素评估昂贵:假定边界值的数为K以及Ω中的点数为n,计算成本为所提议的多尺度变换允许逼近次计算。第一步是在卷积方面重写谢巴德的方法。被定义为将b扩展到整个域:
以及将(9)重写为卷积比:
r ( x i ) = Σ j = 0 n w ( x i , x j ) r ^ ( x j ) Σ j = 0 n w ( x i , x j ) X r ^ ( x j ) = w * r ^ w * X r ^ - - - ( 9 )
其中,是对应于的特征函数(在为非零的情况下,为1,否则为0)。直观地,在分母中包括特征函数X确保不累积中的零的加权。
再次,使用优化来找出内核集F,通过内核集F,能将所提议的卷积金字塔应用于评估(12)。为定义训练数据,将b设定成具有在边界网格点分配的随机值的简单矩形域的边界,以及使用(12)计算精确膜r(x)。然后,我们的优化尝试直接匹配r,其是两个卷积的比,而不是单独地匹配每一卷积。这对确保在整个域上通过我们的变换精确地再现滤波器w的衰减很重要。
如在前应用中,我们能使用由用于的5×5可分离滤波器和用于g的单一3×3可分离滤波器组成的内核集F产生满意的内插膜,与域的大小和形状无关。在补充材料中提供这些内核。
在图5中,使用通过拉普拉斯膜产生的我们的方法,比较无缝图像克隆。
注意尽管两个膜之间的稍微区别,两个方法的最终无缝合成结果难以视觉上区分。该方法的运行时间等于逼近卷积的两个评估,一个通过以及一个通过其中,在表1中报告用于单一卷积的时间。在前一部分中已经确定所提议的方法胜过现有技术的线性解算器。然而,仍然将所提议的方法与计算域的自适应三角测量的顶点的平均值坐标的快速平均值克隆(MVC)方法进行比较。与该方法相比,所提议的方法不要求三角测量域和预计算每一像素的重心坐标来在CPU上实现交互性能。此外,我们的方法完全独立于边界的大小,并且避免MVC对于边界的分层采样采用的略复杂的方案。实验已经表明在3.6秒的预处理时间后,花费0.37秒来无缝地克隆4.2兆像素区域(在2.5MHz Athlon CPU上)。相比较而言,所提议的方法不包含预处理,以及在0.15秒内克隆相同数量的像素。
高斯内核
在该部分中,说明了如何使用卷积金字塔来逼近具有高斯内核的卷积。已经表明如何使用多尺度方案完成以及描述了仅在粗糙网格上计算结果的变量,其间隔与高斯的宽度成反比。尽管最终值能内插到原始网格来产生整体方法,但截断两个变量中的高效内核并且它们的支持取决于尺度Ω。使用所提议的方案,能在运算中,在原始精细网格中逼近解,而不截断滤波器支持。
为在(4)中执行优化,将训练信号设定成随机平移和缩放的δ函数的和,以及通过目标高斯滤波器,经完全卷积获得这意图强加最佳内核来在整个域上实现充分逼近,导致有效平移不变的变换。最初尝试找出将提供良好逼近的集合失败。原因在于高斯型是相当有效的低通滤波器,并且取决于它们的尺度σ,不应当包含来自金字塔的精细级的高频分量。这些分量由具有(3)中的g内核的卷积引入,以及能通过标量权重调制每一级l的g的基值,获得相当好的结果。
这些权重被增加为额外的自由度来优化,以及事实上,在最接近目标高斯尺度的级通过显著高的产生优化。
注意必须拟合不同内核集F来获得不同尺度的高斯滤波器。
图6示出为逼近十个不同σ值的高斯型而优化并且与目标高斯型的精确脉冲响应叠加的十个卷积金字塔的脉冲响应。在这些金字塔中,使用用于和g的5×5可分离内核。注意,对σ的某些值,该逼近不太准确。为提高精度,增加分配的计算预算以及使用7×7可分离内核。图6(e-f)说明了精度的最终提高。
在空间中截断积分图像产生的有效滤波器,即,它们具有取决于高斯尺度σ的有限支持。尽管当滤波用于诸如图像模糊的应用时,这不是主要的问题,但当滤波器用于散开数据内插,诸如在前一部分中概述的谢巴德方法时,该截断具有显著效果。在该应用中,需要在整个域上以单调减的方式传播数据。截断的内核会导致(12)中除0或在内插值中引入突变。
图7示出了两个不同高斯滤波器的逼近,区别在于它们的宽度。使用较小的5×5内核计算这些逼近。(a)中的较宽高斯的逼近在整个域上提供良好拟合。对(b)中的较窄高斯,当高斯达到非常低的值时,逼近丢失其相对精度。这在(d)中的对数图中可以看出。然而,注意该逼近仍然平滑并且单调地衰减。与精确散开数据内插相比,该较慢衰减导致内插函数中的更模糊转变,如(h)和(i)中所示。
总的来说,当使用宽高斯权重函数或在更密集输入数据集上操作时,我们的方法提供对散开数据内插有效和精确的逼近。稀疏数据集和较窄高斯展现了我们的逼近的局限。
如本领域的技术人员将理解的,本发明的方面可以具体化为系统、方法或计算机程序产品。因此,本发明的方面可以采用完全硬件实施例、完全软件实施例(包括固件、常驻软件、微代码等等)或在此可以统称为“电路”、“模块”或“系统”的组合软件和硬件方面的实施例的形式。此外,本发明的方面可以采用在其上具体化有计算机可读程序代码的一个或多个计算机可读介质中具体化的计算机程序产品的形式。
上文参考根据本发明的实施例的方法、装置(系统)和计算机程序产品的流程图图示和/或框图,描述了本发明的方面。将理解到通过计算机程序指令,能实现流程图图示和/或框图的每一块,以及流程图图示和/或框图中的块的组合。可以将这些计算机程序指令提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器来产生机器,使得经计算机或其他可编程数据处理装置的处理器执行的指令产生用于实现在流程图和/或框图块或多个块中指定的功能/动作的装置。
这些计算机程序指令也可以存储在能指示计算机、其他可编程数据处理装置或其他设备以特定方式起作用的计算机可读介质中,使得在计算机可读介质中存储的指令产生包括实现在流程图和/或框图块或多个块中指定的功能/动作的指令的制造产品。
计算机程序指令还可以加载到计算机、其他可编程数据处理装置或其他设备来使一系列操作步骤在计算机、其他可编程装置或其他设备上执行来产生计算机实现的过程,使得在计算机或其他可编程装置上执行的指令提供用于实现在流程图和/或框图块或多个块中指定的功能/动作的过程。
上述流程图和图说明了根据本发明的各个实施例的系统、方法和计算机程序产品的可能实现的体系结构、功能和操作。关于这一点,流程图或框图中的每一块可以表示模块、段或部分代码,包括用于实现特定逻辑功能的一个或多个可执行指令。还应当注意在一些替代实现中,在块中提到的功能可以不按图中所指出的顺序出现。例如,接连所示的两个块事实上可以基本上同时执行,或有时以相反的顺序执行这些块,由所涉及的功能而定。还将注意框图和/或流程图图示中的每一块,以及框图和/或流程图图示中的块的组合能由执行特定功能或动作的基于专用硬件的系统、或专用硬件和计算机指令的组合实现。
在上述描述中,实施例是本发明的例子或实现。“一个实施例”、“实施例”或“一些实施例”的各种出现不一定均指相同的实施例。
尽管在单一实施例的上下文中描述了本发明的各个特征,但也可以单独或以任何适当组合提供这些特征。相反,尽管为清楚起见,在单独的实施例的上下文中描述了本发明,但本发明也可以在单一实施例中实现。
说明书中对“一些实施例”、“实施例”、“一个实施例”或“其他实施例”的引用是指结合实施例所述的特定特征、结构或特性包括在本发明的至少一些实施例中,但不一定全部实施例。
应理解在此采用的措辞和术语不应被解释为限制并且仅用于描述目的。
参考所附的描述、图和例子,可以更好地理解本发明的教导原理和使用。
应理解在此所述的细节不解释为对本发明的应用的限制。
此外,应理解本发明能以各种方式执行或实施以及本发明能在除上文的描述中概述的实施例以外的实施例中实现。
应理解术语“包括”、“组成”、“包含”及其语法变形不排除增加一个或多个部件、特征、步骤或整数或其组合以及术语应当被解释为指定部件、特征、步骤或整数。
如果说明书或权利要求书参考“另外的”元件,不排除不至一个以上的另外的元件。
应理解权利要求或说明书参考“一”或“一个”元件,这种参考不应被解释为仅存在一个该元件。
应理解在说明书陈述“可以”、“可能”、“能”或“能够”包括部件、特征、结构或特性,但不要求包括该特定部件、特征、结构或特性。
在适合的情况下,尽管可以使用状态图、流程图或两者来描述实施例,但本发明不限于那些图或相应的描述。例如,流程不需要通过每一所示块或状态,或精确地以所示和描述的相同顺序移动。
可以通过手动或自动或其组合执行或完成被选步骤或任务,实现本发明的方法。
在权利要求和说明书中提出的描述、例子、方法和材料不应被解释为限制,而仅是示例。
在此使用的技术和科学术语的含义应是本发明所属的领域内的普通技术人员普遍所理解的,除非另有说明。
可以通过与在此所述的方法或材料等效或类似的方法和材料的试验或实施中实现本发明。
以与就像特定或单独地指出包含每一单独的公开内容的相同程度上,将在本说明书中引用或提及的任何公开内容,包括专利、专利应用和产品,全部包含在本说明书中。此外,本发明的一些实施例的描述中的任何引用的引证或标识不应当解释为承认这些引用作为现有技术可用于本发明。
尽管参考有限多个实施例描述了本发明,但这些不应当被解释为限制本发明的范围,而是作为一些优选实施例的例证。其他可能的变形、改进和应用也在本发明的范围内。

Claims (11)

1.一种计算机实现的方法,用于用滤波器 应用由级的分层信号 表示的图像的卷积的数值逼近,所述方法包括:
通过对于每一层级应用和内核之间的卷积以及通过对卷积的的结果进行向下采样,生成正变换;
通过对于每一层级应用内核和向上采样的正变换之间的卷积以及将结果与和内核g的卷积组合,生成逆变换;以及
将正变换和逆变换组合来产生,其中和滤波器之间的卷积的逼近,
其中,内核和g是滤波器的优化内核。
2.根据权利要求1所述的方法,进一步包括:根据特定图像处理应用需求,确定层级
3.根据权利要求1所述的方法,其中,滤波器是线性平移不变(LTI)滤波器。
4.根据权利要求1所述的方法,其中,通过选择最小化arg 的内核集合实现所述优化内核,其中是内核集合在输入上的多尺度变换的结果。
5.根据权利要求1所述的方法,其中,以比率2来向下采样。
6.根据权利要求1所述的方法,其中,通过以比率2补零来向上采样。
7.根据权利要求1所述的方法,其中,拟合所述优化内核来获得不同尺度的高斯滤波器。
8.根据权利要求1所述的方法,其中,图像和滤波器之间的卷积结果导致梯度场积分。
9.根据权利要求1所述的方法,其中,图像和滤波器之间的卷积结果导致无缝图像克隆。
10.根据权利要求1所述的方法,其中,图像和滤波器之间的卷积结果导致散开数据内插。
11.一种系统,被配置成执行根据权利要求1至10中的任何一个所述的方法。
CN201280031391.2A 2011-06-27 2012-06-27 为图像处理目的用滤波器应用卷积的快速数值逼近 Active CN103907109B9 (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161501392P 2011-06-27 2011-06-27
US61/501,392 2011-06-27
PCT/IB2012/053251 WO2013001467A2 (en) 2011-06-27 2012-06-27 Applying rapid numerical approximation of convolutions with filters for image processing purposes

Publications (3)

Publication Number Publication Date
CN103907109A CN103907109A (zh) 2014-07-02
CN103907109B CN103907109B (zh) 2016-11-16
CN103907109B9 true CN103907109B9 (zh) 2017-02-22

Family

ID=46640073

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280031391.2A Active CN103907109B9 (zh) 2011-06-27 2012-06-27 为图像处理目的用滤波器应用卷积的快速数值逼近

Country Status (7)

Country Link
US (1) US9361663B2 (zh)
EP (1) EP2724255B1 (zh)
JP (1) JP6049098B2 (zh)
CN (1) CN103907109B9 (zh)
BR (1) BR112013033514B1 (zh)
CA (1) CA2839098C (zh)
WO (1) WO2013001467A2 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9036909B2 (en) * 2013-01-28 2015-05-19 Adove Systems Incorporated Pyramid collapse color interpolation
KR101470488B1 (ko) * 2013-03-04 2014-12-09 동국대학교 산학협력단 V 사이클을 이용한 멀티그리드 방법 및 장치
US10049435B2 (en) 2014-07-31 2018-08-14 Adobe Systems Incorporated Controlling smoothness of a transmission between images
US9721332B2 (en) 2015-02-16 2017-08-01 Hrl Laboratories, Llc Spike domain convolution circuit
US10503999B2 (en) 2015-03-24 2019-12-10 Hrl Laboratories, Llc System for detecting salient objects in images
US10262229B1 (en) 2015-03-24 2019-04-16 Hrl Laboratories, Llc Wide-area salient object detection architecture for low power hardware platforms
WO2017106603A1 (en) * 2015-12-16 2017-06-22 Stc.Unm System and methods for computing 2-d convolutions and cross-correlations
CN105976358B (zh) * 2016-04-27 2018-07-27 北京以萨技术股份有限公司 一种用于特征金字塔多卷积核的快速卷积计算的方法
CN111199523B (zh) * 2019-12-24 2023-08-25 深圳供电局有限公司 电力设备识别方法、装置、计算机设备和存储介质
CN111489319A (zh) * 2020-04-17 2020-08-04 电子科技大学 基于多尺度双边滤波和视觉显著性的红外图像增强方法
US11978143B2 (en) * 2022-05-23 2024-05-07 Lemon Inc. Creation of videos using virtual characters

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1696975A (zh) * 2004-05-14 2005-11-16 蒲恬 一种数字图像增强方法
CN1989525A (zh) * 2004-06-28 2007-06-27 高通股份有限公司 自适应滤波器和用于图像处理的设备、方法与系统

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3675896B2 (ja) 1995-07-27 2005-07-27 富士写真フイルム株式会社 画像処理方法および装置
US6757645B2 (en) 1997-09-17 2004-06-29 Numerical Technologies, Inc. Visual inspection and verification system
JP3733260B2 (ja) 1999-04-30 2006-01-11 キヤノン株式会社 画像処理装置及び画像処理方法
JP2001056856A (ja) * 1999-06-10 2001-02-27 Fuji Photo Film Co Ltd 画像処理方法および装置並びに記録媒体
US6973218B2 (en) 2001-04-25 2005-12-06 Lockheed Martin Corporation Dynamic range compression
US6993200B2 (en) 2001-11-20 2006-01-31 Sony Corporation System and method for effectively rendering high dynamic range images
US7352911B2 (en) * 2003-07-31 2008-04-01 Hewlett-Packard Development Company, L.P. Method for bilateral filtering of digital images
US7856150B2 (en) * 2007-04-10 2010-12-21 Arcsoft, Inc. Denoise method on image pyramid
US7889949B2 (en) 2007-04-30 2011-02-15 Microsoft Corporation Joint bilateral upsampling
US7675524B1 (en) * 2007-05-17 2010-03-09 Adobe Systems, Incorporated Image processing using enclosed block convolution
JP5547739B2 (ja) * 2008-10-15 2014-07-16 イノベイティブ テクノロジー ディストリビューターズ エルエルシー オプティカルフローの決定のためのデジタル処理方法およびシステム
US8401265B2 (en) * 2010-05-10 2013-03-19 Canon Kabushiki Kaisha Processing of medical image data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1696975A (zh) * 2004-05-14 2005-11-16 蒲恬 一种数字图像增强方法
CN1989525A (zh) * 2004-06-28 2007-06-27 高通股份有限公司 自适应滤波器和用于图像处理的设备、方法与系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《An Image Watermarking Technique Using Pyramid Transform》;Qiang Cheng 等;《Proceedings of the ninth ACM International conference on Multimedia》;20010930;全文 *
《Optimizing Continuity in Multiscale Imagery》;Charles Han, Hugues Hoppe;《ACM Transactions on Graphics》;20101231;第29卷(第6期);全文 *

Also Published As

Publication number Publication date
JP6049098B2 (ja) 2016-12-21
US9361663B2 (en) 2016-06-07
CN103907109A (zh) 2014-07-02
EP2724255B1 (en) 2020-12-09
JP2014524084A (ja) 2014-09-18
CN103907109B (zh) 2016-11-16
WO2013001467A3 (en) 2013-06-27
WO2013001467A2 (en) 2013-01-03
EP2724255A2 (en) 2014-04-30
BR112013033514B1 (pt) 2021-08-24
BR112013033514A2 (pt) 2017-08-15
CA2839098C (en) 2016-09-20
CA2839098A1 (en) 2013-01-03
US20140219579A1 (en) 2014-08-07

Similar Documents

Publication Publication Date Title
CN103907109B9 (zh) 为图像处理目的用滤波器应用卷积的快速数值逼近
Yu et al. Monte Carlo data-driven tight frame for seismic data recovery
Moeller et al. Variational depth from focus reconstruction
CN104156994B (zh) 一种压缩感知磁共振成像的重建方法
Wang et al. A new alternating minimization algorithm for total variation image reconstruction
Belge et al. Wavelet domain image restoration with adaptive edge-preserving regularization
CN104063886B (zh) 一种基于稀疏表示和非局部相似的核磁共振图像重建方法
CN104835130A (zh) 一种多曝光图像融合方法
CN106204447A (zh) 基于总变差分和卷积神经网络的超分辨率重建方法
Casaca et al. Combining anisotropic diffusion, transport equation and texture synthesis for inpainting textured images
CN111666721B (zh) 全波形反演方法、装置及电子设备
Akl et al. A survey of exemplar-based texture synthesis methods
CN110139046B (zh) 一种基于张量的视频帧合成方法
Liu et al. Adaptive sparse coding on PCA dictionary for image denoising
CN115950837B (zh) 基于即插即用先验的快照式光谱成像方法、系统及介质
CN102810202B (zh) 基于分数阶差分加权的图像多步残差反馈迭代滤波方法
Liu et al. Multi-filters guided low-rank tensor coding for image inpainting
Canabal et al. Dispersion kernels for water wave simulation
Lu et al. MF-LRTC: Multi-filters guided low-rank tensor coding for image restoration
CN109559278B (zh) 基于多特征学习的超分辨图像重建方法及系统
Brinkmann et al. Regularization with sparse vector fields: From image compression to TV-type reconstruction
Akl et al. Structure tensor based synthesis of directional textures for virtual material design
Liu et al. Low-rank matrix completion to reconstruct incomplete rendering images
Calatroni et al. ADI splitting schemes for a fourth-order nonlinear partial differential equation from image processing
He et al. Deep frequency-recurrent priors for inverse imaging reconstruction

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C53 Correction of patent of invention or patent application
CI03 Correction of invention patent

Correction item: Description|Claims

Correct: Correct

False: Error

Number: 46

Page: full text

Volume: 32