CN102194241A - 基于互联网的艺术拼图系统设计方法 - Google Patents
基于互联网的艺术拼图系统设计方法 Download PDFInfo
- Publication number
- CN102194241A CN102194241A CN2011101078103A CN201110107810A CN102194241A CN 102194241 A CN102194241 A CN 102194241A CN 2011101078103 A CN2011101078103 A CN 2011101078103A CN 201110107810 A CN201110107810 A CN 201110107810A CN 102194241 A CN102194241 A CN 102194241A
- Authority
- CN
- China
- Prior art keywords
- image
- piecemeal
- hierarchical relationship
- block
- alternate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明提出了一种基于互联网的艺术拼图系统设计方法。该方法参考了图像检索领域中基于内容的图像检索技术以及计算机图形学中有关图像合成的相关方法,根据输入图像,将从互联网上搜索到的若干图像拼接成一幅具有艺术特质的拼接图像。与传统的基于内容的图像检索方法不同,本发明提出了一个全新的、基于形状和颜色进行检索的能量函数,得到了比较理想的检索结果;在确定各分快之间层次顺序时,提出了三个重要的用于判断相邻分块间层次关系的线索,并引入拓扑排序,有效地将所有的局部层次关系综合起来,得到合理的全局层次关系。本发明根据输入图像得到一幅具有艺术特质的拼接图,在娱乐和艺术领域是一个全新的尝试。
Description
技术领域
本发明属于计算机图像处理方法,具体涉及一种基于互联网的艺术拼图系统设计方法。
背景技术
意大利画家朱塞佩·阿尔钦博托(1527-1593)的代表作品《四季》别出心裁地用水果、蔬菜等拼合而成,产生了别具一格的艺术效果,对后来的超现实主义产生了重要的影响。
从计算机图形学的角度来看,阿尔钦博托的作品与图像合成有着密不可分的关系。图像合成是指将两个或两个以上的图像进行加工处理,叠加或组合成一幅具有特殊效果的图像的过程。这方面的工作已经有很多,比如图像马赛克(A.Hausner.Simulating decorative mosaics,Proceedings of the 28thannual conference on Computer graphics and interactive techniques,2001)和数字照片合成(A.Agarwala,M.Dontcheva,M.Agrawala,et al.Interactive digital photomontage.ACM Transactions on Graphics(TOG),23(3):294-302,2004),Gal等甚至提出了基于3D模型的拼图设计系统(R.Gal,O.Sorkine,T.Popa,et al.3D collage:Expressive non-realistic modeling,ACM,2007)。以上图像合成工作生成了较具吸引力的合成结果,但是由于其数据库中的元素有限,其系统的表现能力受到了很大的限制。
随着电子设备的普及以及互联网技术的发展,互联网上数字图像的数量急剧增加:国外著名社交网站Facebook的图片数量已经突破150亿,国内著名社交网站51.com的用户上传的图片数量也超过110亿。如果能利用互联网上海量图像数据库来辅助图像合成工作,定能解决当前多数图像合成系统的表现能力过低的问题。
但是,如何对如此大规模的图像进行有效的管理和利用是一个十分重要的课题。目前,搜索引擎是对互联网信息进行有效管理和利用的有效手段,但是对于图像来说,当前的搜索引擎多是基于图像的文本注释进行搜索,由于图像的文本注释完全依靠人工完成,而且不同的人对同一幅图像有着不同的理解,随意性较大,不够客观,同时随着多媒体技术的注入,图像数量急剧增加,对实现图像库自动检索的需求更加迫切,单纯依靠手工注释是不现实的,所以从九十年代开始,基于内容的图像检索CBIR(Content-based Image Retrieval)技术受到人们越来越多的关注。基于内容的图像检索,就是把图像的视觉特征作为图像的内容表示,进行匹配、查找。迄今,已有许多基于内容的图像检索系统问世,比如IBM的QBIC和MIT的Photobook等。尽管如此,基于内容的图像检索技术仍然处于研究阶段,根据具体的应用范围设计具体的检索规则仍是使用该方法的常用方法。
发明内容
本发明的目的是提供一种基于互联网的艺术拼图系统设计方法,该方法能够利用互联网上的海量图像,根据输入图像,生成具有艺术特质的拼接图像。
为达到上述目的,本发明采用的技术方案是:
1)对输入的图像进行分割得到分块图像,并提供交互工具对分块图像进行调整和修正;
2)根据用户输入的替代物的类别标签在互联网上进行搜索,并去除内容不相关以及前景复杂的图像,然后采用前景提取算法进行前景分割,得到前景物体和对应的掩码图像;
3)构造能量函数,保证所选用的替代图像和步骤1)中得到的对应分块图像在形状和颜色特征方面尽可能地保持一致;
4)求取各分块的层次关系,并提供交互工具对得到的层次关系进行调整;
5)对输入图像进行对称性检测,找到对称的分块;
6)采用高斯融合算法对拼接图像的边界进行处理,并提供交互工具对替代图像的位置、大小和旋转角度进行调整;
7)对拼接图像进行亮度调整。
所述步骤1)对于输入的图像,采用经典的均值偏移算法进行分割,在图像分割阶段引入用户交互工具,通过鼠标在分割结果图像上画一笔,即将该笔画覆盖的分块合并成一个分块,或将一个分块进一步分割成两个分块,且该交互工具实现像素级的操作,用来对分割边界进行修正,即分块的合并是指将待合并分块中的所有像素合并到一个分块中;分块的进一步分割是指根据用户的交互,采用图割算法将指定分块分成两块。
所述步骤2)在图像搜索之前要求用户输入该拼接图像所用替代图像的物体所属的分类标签在互联网上进行搜索,对于搜索到的图像,仅需要包含相关物体的前景区域,用以作为各分块的替代图像,采用基于内容的图像过滤方法对互联网上得到的图像进行内容相关的过滤去除不易进行前景分割的图像,采用Grabcut(C.Rother,V.Kolmogorov,and A.Blake.Grabcut:Interactive foreground extraction using iterated graph cuts,ACM,2004)方法进行前景分割,得到前景物体和对应的掩码图像。
所述步骤3)所选用的替代图像Si和对应分块图像Pi在形状和颜色特征方面保持一致;其中替代图像Si通过最小化下面的能量函数得到:
[式1]
E(Qj)=G(Qj,Pi)+λC(Qj,Pi),Qj∈I
其中,G(Qj,Pi)表示从互联网上下载的并进行了前景分割的图像Qj与分块图像Pi在形状特征方面的相似性,C(Qj,Pi)表示Qj与Pi在颜色特征方面的相似性,λ用来调节形状和颜色特征之间的相对重要性,I表示前景分割之后的图像数据库;
选取仿射变换对步骤2)得到的前景图像进行处理,即对前景图像进行平移、缩放、旋转、切变等仿射变换,再采用基于矩分布的仿射注册方法(J.Ho,A.Peter,A.Rangarajan,et al.An algebraic approach to affine registration of point sets,IEEE 12th International Conference on Computer Vision,2009)得到上述仿射变换,所得仿射变换包括一个2×2的仿射矩阵Aij和一个1×2的平移矩阵vij,通过最小化G(Qj,pi)得到与分块图像匹配的前景图像,G(Qj,Pi)定义如下:
[式2]
颜色相似性定义为前景图像与分块图像之间的颜色分布之间的差异,首先将RGB彩色图像转换到YUV空间,定义颜色相似性如下:
[式3]
C(Qj,Pi)=DQC(Hu(Qj),Hu(Pi))+DQC(Hv(Qj),Hv(Pi))
其中,Hu和Hv分表表示U通道和V通道的颜色直方图,DQC(·)表示直方图之间的QC距离(O.Pele and M.Werman.The Quadratic-Chi Histogram Distance Family.Computer Vision-ECCV:749-762,2010),该距离对量化带来的影响比较稳定;
通过最小化[式1]所示的能量函数,得到在形状和颜色特征方面与分块图像比较一致的替代图像集{Si,i=1,2,...,N},N表示分块图像的数目。
所述步骤4)在将步骤3)得到的替代图像集拼接成最终的图像之前,需要确定各分块之间的层次关系,即恢复图像的深度信息,采用三个用以判断各分块之间遮挡关系的线索——包含关系、“T”点信息和阴影分布,并通过投票方式将这三个线索得到的结果综合起来,得到相邻分块之间的层次关系,将各相邻分块之间的层次关系综合起来,得到一个全局的层次关系,用Pi<Pj表示分块图像Pi位于分块图像Pj的上面,
1)包含关系
如果分块图像Pj的边界完全包含分块图像Pi的边界,那么Pi<Pj;
2)“T”点信息
当两个分块图像的边界相交的时候会出现“T”点,假设在“T”点t周围存在一系列分块图像{Pk|k=1,2,...,m},Ωt,r是以t点为圆心,r为半径的圆,t点周围的分块图像的层次关系依据各分块图像与Ωt,r相交部分的面积来确定,面积越大,层次在上面的可能性越大,即,如果d(Pk∩Ωt,r)<d(Pl∩Ωt,r),则判断Pl<Pk,为了去除分割不准确带来的影响,用一系列半径不同的圆来重复上述操作,对于每一个圆,得到该图像分块系列{Pk|k=1,2,...,m}的一个相对层次关系;
3)阴影信息
阴影是判断分块图像层次关系的一个重要因素,如果分块图像上有阴影分布,那么该分块图像位于周围分块图像下面的可能性更大一些,给定两个相邻分块图像Pi和Pj,记其相交边界为s,可能存在阴影的区域R=(Pi∪Pj)∩dia(s),其中dia(s)表示对边界s进行形态学膨胀操作得到的区域,区域R在亮度通道中对应像素值的分布通过一个双高斯分布组成的高斯混合模型来近似表示,这两个高斯分布表示为{g1(y;μ1,σ1);g2(y;μ2,σ2)},其中μ1,μ2(μ1<μ2)分别表示g1,g2的均值,σ1,σ2分别表示g1,g2的标准差,如果μ2-μ1大于一给定的阈值,则认为在区域R中包含阴影区域,对于区域R中的像素pi,其亮度值为yi,如果g1(yi)<g2(yi),则认为该像素为阴影像素;最后通过比较两分块图像中包含的阴影像素的数目,来判断其层次关系,包含阴影像素的数目多的分块图像位于下方;
通过上面的三个线索,得到一系列用来表示相邻分块间层次关系的不等式,根据上述不等式对相邻两分块之间的层次关系进行投票,具体投票方法如下:对于由包含关系和阴影关系得到的不等式,投票算法为对应分块间的层次关系投1票;对于由“T”点确定的不等式,投票算法为对应分块间的层次关系投1/h票,其中h表示在该“T”点周围取的圆的数目,通过投票算法,得到一个不等式集合∑,在该集合中可能存在互相矛盾的不等式,为了得到一个全局一致的层次关系,采用拓扑排序算法(D.Sykora,D.Sedlacek,S.Jinchao,et al.Adding Depth to Cartoons Using Sparse Depth(In)equalities,John Wiley & Sons Computer Graphics Forum,2010)对该不等式集合∑进行处理。
所述步骤5)对于具有明显对称性的输入图像,先进行对称性检测:采用三维模型的对称性检测算法(N.Mitra,L.Guibas,and M.Pauly.Partial and approximate symmetry detection for 3D geometry.ACM Transactions on Graphics(TOG),25(3):560-568,2006)应用在二维图像上,对于输入图像先进行对称性检测,得到分块图像之间的对称关系。
所述步骤6)根据步骤4)中确定的各分块之间的层次关系,先后摆放替代图像,组合形成拼接图像,并采用高斯融合算法对拼接图像的边界进行处理,高斯融合算法如下:
假设拼接系统已经按照各分块之间的层次关系拼接完成了前k个分块,得到临时拼接图像需要将第k+1个替代图像Sk+1和临时拼接图像进行融合,记替代图像Sk+1与临时拼接图像相交的边界为通过对该边界进行形态学膨胀操作,得到一个与替代图像Sk+1相交的宽度为w的二值带状区域然后,用窗口宽度为w/2的高斯滤波器对区域进行滤波,并结合原掩码图像,得到一个边缘模糊的掩码图像α,用前k+1个替代图像合成的临时拼接图像上位于(i,j)位置的像素值通过下式计算得到:
[式4]
所述步骤7)在进行亮度调整的时候以输入图像的亮度分布为目标,亮度调整是通过在替代图像Si与分块图像Pi之间进行直方图匹配实现的,假设AHP和AHS分别表示分块图像Pi和替代图像Si的亮度通道归一化累积直方图分布,对于替代图像中的每一个像素p∈Si,其亮度值y0用y′来替换,即
[式5]
y0←y′,s.t.AHS(y0)=AHP(y′)。
本发明采用基于内容的图像检索方法,结合计算机图形学领域的图像合成技术以及若干其它图像处理技术,根据输入图像,对互联网上的图像进行过滤、处理,并合成一幅具有艺术特质的拼接图像。即对输入图像进行分割,并对分割结果进行层次的确定和对称性检测,并在互联网上搜索替代图像用来合成拼接图像,同时尽可能地保证各替代图像的可识别性。
本发明首先对给定的输入图像进行分割,系统在该过程中允许用户交互,以保证最终的分割结果符合用户的要求;同时,为了更好地保证替代图像的可识别性,本发明要求用户为输入图像指定所用替换物的类别标签,比如水果、蔬菜。系统根据用户提供的标签,在互联网上搜索相关图像,并采用内容相关的图像过滤方法对搜索到的图像进行过滤,并对过滤得到的图像进行前景分割,得到前景图像的轮廓;最后结合形状和颜色等特征信息,筛选得到与对应分块最相似的搜索结果,用来作为该分块的替换图像。对于分割得到的各分块之间的层次关系,通过分析各分块之间的覆盖关系、相交关系和阴影分布,确定相邻分块之间的层次关系,在此基础上,创新性地应用拓扑排序算法得到全局的层次关系,实现各分块之间层次关系的自动确定。对于一些对称性较强的输入图像,采用对称性检测算法得到对称关系,并结合分割结果得到各分块之间的对称关系,以保证在最终的分割结果中,对称的部分采用的是相同种类的图像,以提高拼接图像的视觉欣赏性。在拼接过程,为了消除拼接时边缘的不连续性,应用高斯融合算法处理,保证各分块边缘之间的平滑过渡。为了保证最终的拼接图像和输入图像在亮度上的一致性,本发明对每一个分块的替代图像进行了亮度调整。
附图说明
图1是基于互联网的艺术拼图系统设计流程图;
图2是分块图像层次确定示意图;
图3是对称性检测及其对应的拼接图效果比较;
图4是对拼接边界进行高斯融合处理的过程;
图5是亮度调整效果图比较;
图6是一些卡通图像的拼接图效果展示,每组图像中左边为拼接图像,右边为输入图像。
具体实施方式
下面将根据附图对本发明进行详细说明。
本发明流程图如
图1所示,主要分为7个步骤。
步骤1:图像分割
对于输入图像,采用经典的均值偏移算法(D.Comaniciu and P.Meer.Mean shift:A robust approach toward feature space analysis.IEEE Transactions on Pattern Analysis and Machine Intelligence,24(5):603-619,2002)进行分割。为了更好地满足用户的要求,最大限度地发挥用户的设计能力和创造性,本发明在图像分割阶段引入了用户交互工具,使得用户可以通过鼠标在分割结果图像上简单地画一笔,即可将该笔画覆盖的分块合并成一个分块,也可以将一个分块分成两个分块。且该交互工具实现像素级的操作,用来对分割边界进行修正,即分块的合并是指将待合并分块中的所有像素合并到一个分块中;分块的进一步分割是指根据用户的交互,采用图割算法将指定分块分成两块。
步骤2:图像搜索、过滤、前景分割
由于互联网上的图像数量巨大,逐一进行处理是不现实的;而且,为了保证每一个分块的替代图像的可识别性,本发明要求对于一个拼接图像所用的替代图像属于同一或者相近的分类。所以,本发明在图像搜索之前要求用户输入该拼接图像所用替代图像的物体所属的分类标签,比如水果、蔬菜。
然而,基于文本的图像搜索仍然会搜索到很多内容不相关的图像;而且,对于搜索到的图像,本发明仅需要包含相关物体的前景区域,用以作为各分块的替代图像。因此,需要对互联网上得到的图像进行内容相关的过滤,并且去除不易进行前景分割的图像。本发明采用陈等提出的基于内容的图像过滤方法(T.Chen,M.Cheng,P.Tan,et al.Sketch2Photo:internet image montage.ACM Transactions on Graphics(TOG),28(5):1-10,2009)达到上述目的,并采用Grabcut(C.Rother,V.Kolmogorov,and A.Blake.Grabcut:Interactive foreground extraction using iterated graph cuts,ACM,2004)方法进行前景分割,得到前景物体和对应的掩码图像。
对于搜索到的图像,仅需要包含相关物体的前景区域,用以作为各分块的替代图像,采用基于内容的图像过滤方法对互联网上得到的图像进行内容相关的过滤去除不易进行前景分割的图像,采用Grabcut(C.Rother,V.Kolmogorov,and A.Blake.Grabcut:Interactive foreground extraction using iterated graph cuts,ACM,2004)方法进行前景分割,得到前景物体和对应的掩码图像。
步骤3:图像匹配
为了保证拼接图像和原图像在视觉上的一致性,同时保证替代图像的可识别性,要求所选用的替代图像Si和对应分块图像Pi在形状和颜色特征方面尽可能地保持一致。
其中替代图像Si通过最小化下面的能量函数得到:
[式1]
E(Qj)=G(Qj,Pi)+λC(Qj,Pi),Qj∈I
其中,G(Qj,Pi)表示从互联网上下载的并进行了前景分割的图像Qj与分块图像Pi在形状特征方面的相似性,C(Qj,Pi)表示Qj与Pi在颜色特征方面的相似性,λ用来调节形状和颜色特征之间的相对重要性,I表示前景分割之后的图像数据库;
下面将分别对G(Qj,Pi)和C(Qj,Pi)进行详细说明。
选取仿射变换对步骤2)得到的前景图像进行处理,即对前景图像进行平移、缩放、旋转、切变仿射变换,再采用基于矩分布的仿射注册方法(J.Ho,A.Peter,A.Rangarajan,et al.An algebraic approach to affine registration of point sets,IEEE 12th International Conference on Computer Vision,2009)得到上述仿射变换,所得仿射变换包括一个2×2的仿射矩阵Aij和一个1×2的平移矩阵vij,通过最小化G(Qj,Pi)得到与分块图像匹配的前景图像,G(Qj,Pi)定义如下:
[式2]
颜色相似性定义为前景图像与分块图像之间的颜色分布之间的差异,首先将RGB彩色图像转换到YUV空间,定义颜色相似性如下:
[式3]
C(Qj,Pi)=DQC(Hu(Qj),Hu(Pi))+DQC(Hv(Qj),Hv(Pi))
其中,Hu和Hv分表表示U通道和V通道的颜色直方图,DQC(·)表示直方图之间的QC距离(O.Pele and M.Werman.The Quadratic-Chi Histogram Distance Family.Computer Vision-ECCV:749-762,2010),该距离对量化带来的影响比较稳定;
通过最小化[式1]所示的能量函数,得到在形状和颜色特征方面与分块图像比较一致的替代图像集{Si,i=1,2,...,N},N表示分块图像的数目。
步骤4:层次关系确定
在将步骤3)得到的替代图像集拼接成最终的图像之前,需要确定各分块之间的层次关系,即恢复图像的深度信息。受Hoiem等基于单幅图像判断遮挡边界的信息(D.Hoiem,A.Efros,and M.Hebert.Recovering occlusion boundaries from an image.International Journal of Computer Vision:1-19,2010)的启发,本发明提出了三个用以判断各分块之间遮挡关系的线索——包含关系、“T”点信息和阴影分布,并通过投票方式将这三个线索得到的结果综合起来,得到相邻分块之间的层次关系。在此基础上,创新性地引入拓扑排序算法,将各相邻分块之间的层次关系综合起来,得到一个全局的层次关系。下面首先介绍一下这三条线索(在本发明中,用Pi<Pj表示分块图像Pi位于分块图像Pj的上面)。
1)包含关系
如果分块图像Pj的边界完全包含分块图像Pi的边界,那么Pi<Pj(见图2(b))。
2)“T”点信息
当两个分块图像的边界相交的时候会出现“T”点,如图2(c)所示。假设在“T”点t周围存在一系列分块图像{Pk|k=1,2,...,m},Ωt,r是以t点为圆心,r为半径的圆。t点周围的分块图像的层次关系即可依据各分块图像与Ωt,r相交部分的面积来确定,面积越大,层次在上面的可能性越大,即,如果d(Pk∩Ωt,r)<d(Pl∩Ωt,r),则判断Pl<Pk。为了去除分割不准确带来的影响,本发明创新性地用一系列半径不同的圆来重复上述操作,对于每一个圆,可以得到该图像分块系列{Pk|k=1,2,...,m}的一个相对层次关系。
3)阴影信息
阴影是判断分块图像层次关系的一个重要因素,如果分块图像上有阴影分布,那么该分块图像位于周围分块图像下面的可能性更大一些。给定两个相邻分块图像Pi和Pj,记其相交边界为s,如图2(d)所示。可能存在阴影的区域R=(Pi∪Pj)∩dia(s),其中dia(s)表示对边界s进行形态学膨胀操作得到的区域。区域R在亮度通道中对应像素值的分布可以通过一个双高斯分布组成的高斯混合模型来近似表示,这两个高斯分布可以表示为{g1(y;μ1,σ1);g2(y;μ2,σ2)},其中μ1,μ2(μ1<μ2)分别表示g1,g2的均值,σ1,σ2分别表示g1,g2的标准差。如果μ2-μ1大于一给定的阈值,则认为在区域R中包含阴影区域。对于区域R中的像素pi,其亮度值为yi,如果g1(yi)<g2(yi),则认为该像素为阴影像素。最后通过比较两分块图像中包含的阴影像素的数目,来判断其层次关系,包含阴影像素的数目多的分块图像位于下方。
通过上面的三个线索,可以得到一系列用来表示相邻分块间层次关系的不等式。本发明设计了一种投票算法,根据上述不等式对相邻两分块之间的层次关系进行投票,具体投票方法如下:对于由包含关系和阴影关系得到的不等式,投票算法为对应分块间的层次关系投1票;对于由“T”点确定的不等式,投票算法为对应分块间的层次关系投1/h票,其中h表示在该“T”点周围取的圆的数目。通过投票算法,我们可以得到一个不等式集合∑,在该集合中可能存在互相矛盾的不等式。为了得到一个全局一致的层次关系,本发明引入拓扑排序算法(D.Sykora,D.Sedlacek,S.Jinchao,et al.Adding Depth to Cartoons Using Sparse Depth(In)equalities,John Wiley & Sons Computer Graphics Forum,2010)对该不等式集合∑进行处理。即便如此,仍然可能出现不正确的层次关系,针对这个问题,本发明设计了一套允许用户交互的层次调整工具,用户可以调整任意两分块之间的层次关系。
步骤5:对称性检测
对称性是一个重要的视觉特征,往往能够引起人的特别关注。对于具有明显对称性的输入图像,可以先进行对称性检测。本发明采用三维模型的对称性检测算法(N.Mitra,L.Guibas,and M.Pauly.Partial and approximate symmetry detection for 3D geometry.ACM Transactions on Graphics(TOG),25(3):560-568,2006)应用在二维图像上,对于输入图像先进行对称性检测,得到分块图像之间的对称关系如图3(a)所示;在拼接过程中,对称的分块改用相同的替代图像,明显提高了拼接图像的视觉观赏性,如图3(b)所示。
步骤6:拼接融合
根据步骤4)中确定的各分块之间的层次关系,先后摆放替代图像,组合形成拼接图像。并采用高斯融合算法对拼接图像的边界进行处理。高斯融合算法如下:
由于拼接图像所选用替代图像的前景和背景之间的边界比较清晰,前景分割效果较好,可以得到比较理想的掩码图像,所以,本发明采用简单的高斯融合方法对拼接过程的边界进行处理。假设拼接系统已经按照各分块之间的层次关系拼接完成了前k个分块,得到临时拼接图像现在需要将第k+1个替代图像Sk+1和临时拼接图像进行融合。记替代图像Sk+1与临时拼接图像相交的边界为通过对该边界进行形态学膨胀操作,得到一个与替代图像Sk+1相交的宽度为w的二值带状区域然后,用窗口宽度为w/2的高斯滤波器对区域进行滤波,并结合原掩码图像,得到一个边缘模糊的掩码图像α。用前k+1个替代图像合成的临时拼接图像上位于(i,j)位置的像素值通过下式计算得到:
[式4]
步骤7:亮度调整
由于替代图像在亮度上可能存在严重的不一致性,因此需要对合成的拼接图像进行亮度调整。在进行亮度调整的时候以输入图像的亮度分布为目标,既可以保持拼接图像和输入图像在亮度分布上的一致性,同时又能保证各替代图像之间亮度的协调性。
本发明的亮度调整是通过在替代图像Si与分块图像Pi之间进行直方图匹配实现的。假设AHP和AHS分别表示分块图像Pi和替代图像Si的亮度通道归一化累积直方图分布,对于替代图像中的每一个像素p∈Si,其亮度值y0用y′来替换,即
[式5]
y0←y′,s.t.AHS(y0)=AHP(y′)
图5展示的是亮度调整的效果。亮度调整并不是必须的,尤其是在输入图像没有真实亮度的情况下,比如卡通图像。同时,为了保证替代图像的可识别性,并不总是必须将替代图像的亮度调整到与分块图像完全一致,比如当分块图像为一全黑的分块时,如果将替代图像的亮度分布调整的和分块图像完全一致,很可能导致其不可识别。针对这一问题,本发明实现了一个工具,可以对拼接图像的亮度分布进行连续调整,选出一个合适的亮度分布。
另外,本发明还实现了直接对各替代图像的位置、大小、旋转角度进行编辑的工具,以保证替代图像能更好地与分块图像匹配。
以上就是基于互联网的艺术拼图系统设计的所有步骤,图6展示了一些卡通图像拼接图的效果。
如上所述,本发明提出了一种基于互联网的艺术拼图系统的设计方法。该方法是一个综合了若干图像处理技术的艺术拼图系统,其中基于形状和颜色相似性对图像进行筛选的机制是基于内容的图像检索技术的成功应用;另外,在确定各分快之间层次顺序时,创新性地提出三个线索并引入拓扑排序,得到一个合理的全局的层次关系。
尽管已经参考附图对本发明进行了解释和描述,专业技术人员应该理解,在不脱离本发明精神和范围的情况下,可以在其中或对其进行各种其他改变,增删。
Claims (8)
1.一种基于互联网的艺术拼图系统设计方法,其特征在于包含以下步骤:
1)对输入的图像进行分割得到分块图像,并提供交互工具对分块图像进行调整和修正;
2)根据用户输入的替代物的类别标签在互联网上进行搜索,并去除内容不相关以及前景复杂的图像,然后采用前景提取算法进行前景分割,得到前景物体和对应的掩码图像;
3)构造能量函数,保证所选用的替代图像和步骤1)中得到的对应分块图像在形状和颜色特征方面尽可能地保持一致;
4)求取各分块的层次关系,并提供交互工具对得到的层次关系进行调整;
5)对输入图像进行对称性检测,找到对称的分块;
6)采用高斯融合算法对拼接图像的边界进行处理,并提供交互工具对替代图像的位置、大小和旋转角度进行调整;
7)对拼接图像进行亮度调整。
2.根据权利要求1所述的基于互联网的艺术拼图系统设计方法,其特征在于:所述步骤1)对于输入的图像,采用经典的均值偏移算法进行分割,在图像分割阶段引入用户交互工具,通过鼠标在分割结果图像上画一笔,即将该笔画覆盖的分块合并成一个分块,或将一个分块进一步分割成两个分块,且该交互工具实现像素级的操作,用来对分割边界进行修正,即分块的合并是指将待合并分块中的所有像素合并到一个分块中;分块的进一步分割是指根据用户的交互,采用图割算法将指定分块分成两块。
3.根据权利要求1所述的基于互联网的艺术拼图系统设计方法,其特征在于:所述步骤2)在图像搜索之前要求用户输入该拼接图像所用替代图像的物体所属的分类标签在互联网上进行搜索,对于搜索到的图像,仅需要包含相关物体的前景区域,用以作为各分块的替代图像,采用基于内容的图像过滤方法对互联网上得到的图像进行内容相关的过滤去除不易进行前景分割的图像,采用Grabcut(C.Rother,V.Kolmogorov,and A.Blake.Grabcut:Interactive foreground extraction using iterated graph cuts,ACM,2004)方法进行前景分割,得到前景物体和对应的掩码图像。
4.根据权利要求1所述的基于互联网的艺术拼图系统设计方法,其特征在于:所述步骤3)所选用的替代图像Si和对应分块图像Pi在形状和颜色特征方面保持一致;其中替代图像Si通过最小化下面的能量函数得到:
[式1]
E(Qj)=G(Qj,Pi)+λC(Qj,Pi),Qj∈I
其中,G(Qj,Pi)表示从互联网上下载的并进行了前景分割的图像Qj与分块图像Pi在形状特征方面的相似性,C(Qj,Pi)表示Qj与Pi在颜色特征方面的相似性,λ用来调节形状和颜色特征之间的相对重要性,I表示前景分割之后的图像数据库;
选取仿射变换对步骤2)得到的前景图像进行处理,即对前景图像进行平移、缩放、旋转、切变等仿射变换,再采用基于矩分布的仿射注册方法(J.Ho,A.Peter,A.Rangarajan,et al.An algebraic approach to affine registration of point sets,IEEE 12th International Conference on Computer Vision,2009)得到上述仿射变换,所得仿射变换包括一个2×2的仿射矩阵Aij和一个1×2的平移矩阵vij,通过最小化G(Qj,Pi)得到与分块图像匹配的前景图像,G(Qj,Pi)定义如下:
[式2]
颜色相似性定义为前景图像与分块图像之间的颜色分布之间的差异,首先将RGB彩色图像转换到YUV空间,定义颜色相似性如下:
[式3]
C(Qj,Pi)=DQC(Hu(Qj),Hu(Pi))+DQC(Hv(Qj),Hv(Pi))
其中,Hu和Hv分表表示U通道和V通道的颜色直方图,DQC(·)表示直方图之间的QC距离(O.Pele and M.Werman.The Quadratic-Chi Histogram Distance Family.Computer Vision-ECCV:749-762,2010),该距离对量化带来的影响比较稳定;
通过最小化[式1]所示的能量函数,得到在形状和颜色特征方面与分块图像比较一致的替代图像集{Si,i=1,2,...,N},N表示分块图像的数目。
5.根据权利要求1所述的基于互联网的艺术拼图系统设计方法,其特征在于:所述步骤4)在将步骤3)得到的替代图像集拼接成最终的图像之前,需要确定各分块之间的层次关系,即恢复图像的深度信息,采用三个用以判断各分块之间遮挡关系的线索——包含关系、“T”点信息和阴影分布,并通过投票方式将这三个线索得到的结果综合起来,得到相邻分块之间的层次关系,将各相邻分块之间的层次关系综合起来,得到一个全局的层次关系,用Pi<Pj表示分块图像Pi位于分块图像Pj的上面,
1)包含关系
如果分块图像Pj的边界完全包含分块图像Pi的边界,那么Pi<Pj;
2)“T”点信息
当两个分块图像的边界相交的时候会出现“T”点,假设在“T”点t周围存在一系列分块图像{Pk|k=1,2,...,m},Ωt,r是以t点为圆心,r为半径的圆,t点周围的分块图像的层次关系依据各分块图像与Ωt,r相交部分的面积来确定,面积越大,层次在上面的可能性越大,即,如果d(Pk∩Ωt,r)<d(Pl∩Ωt,r),则判断Pl<Pk,为了去除分割不准确带来的影响,用一系列半径不同的圆来重复上述操作,对于每一个圆,得到该图像分块系列{Pk|k=1,2,...,m}的一个相对层次关系;
3)阴影信息
阴影是判断分块图像层次关系的一个重要因素,如果分块图像上有阴影分布,那么该分块图像位于周围分块图像下面的可能性更大一些,给定两个相邻分块图像Pi和Pj,记其相交边界为s,可能存在阴影的区域R=(Pi∪Pj)∩dia(s),其中dia(s)表示对边界s进行形态学膨胀操作得到的区域,区域R在亮度通道中对应像素值的分布通过一个双高斯分布组成的高斯混合模型来近似表示,这两个高斯分布表示为{g1(y;μ1,σ1);g2(y;μ2,σ2)},其中μ1,μ2(μ1<μ2)分别表示g1,g2的均值,σ1,σ2分别表示g1,g2的标准差,如果μ2-μ1大于一给定的阈值,则认为在区域R中包含阴影区域,对于区域R中的像素pi,其亮度值为yi,如果g1(yi)<g2(yi),则认为该像素为阴影像素;最后通过比较两分块图像中包含的阴影像素的数目,来判断其层次关系,包含阴影像素的数目多的分块图像位于下方;
通过上面的三个线索,得到一系列用来表示相邻分块间层次关系的不等式,根据上述不等式对相邻两分块之间的层次关系进行投票,具体投票方法如下:对于由包含关系和阴影关系得到的不等式,投票算法为对应分块间的层次关系投1票;对于由“T”点确定的不等式,投票算法为对应分块间的层次关系投1/h票,其中h表示在该“T”点周围取的圆的数目,通过投票算法,得到一个不等式集合∑,在该集合中可能存在互相矛盾的不等式,为了得到一个全局一致的层次关系,采用拓扑排序算法(D.Sykora,D.Sedlacek,S.Jinchao,et al.Adding Depth to Cartoons Using Sparse Depth(In)equalities,John Wiley & Sons Computer Graphics Forum,2010)对该不等式集合∑进行处理。
6.根据权利要求1所述的基于互联网的艺术拼图系统设计方法,其特征在于:所述步骤5)对于具有明显对称性的输入图像,先进行对称性检测:采用三维模型的对称性检测算法(N.Mitra,L.Guibas,and M.Pauly.Partial and approximate symmetry detection for 3D geometry.ACM Transactions on Graphics(TOG),25(3):560-568,2006)应用在二维图像上,对于输入图像先进行对称性检测,得到分块图像之间的对称关系。
7.根据权利要求1所述的基于互联网的艺术拼图系统设计方法,其特征在于:所述步骤6)根据步骤4)中确定的各分块之间的层次关系,先后摆放替代图像,组合形成拼接图像,并采用高斯融合算法对拼接图像的边界进行处理,高斯融合算法如下:
假设拼接系统已经按照各分块之间的层次关系拼接完成了前k个分块,得到临时拼接图像需要将第k+1个替代图像Sk+1和临时拼接图像进行融合,记替代图像Sk+1与临时拼接图像相交的边界为通过对该边界进行形态学膨胀操作,得到一个与替代图像Sk+1相交的宽度为w的二值带状区域然后,用窗口宽度为w/2的高斯滤波器对区域进行滤波,并结合原掩码图像,得到一个边缘模糊的掩码图像α,用前k+1个替代图像合成的临时拼接图像上位于(i,j)位置的像素值通过下式计算得到:
[式4]
8.根据权利要求1所述的基于互联网的艺术拼图系统设计方法,其特征在于:所述步骤7)在进行亮度调整的时候以输入图像的亮度分布为目标,亮度调整是通过在替代图像Si与分块图像Pi之间进行直方图匹配实现的,假设AHP和AHS分别表示分块图像Pi和替代图像Si的亮度通道归一化累积直方图分布,对于替代图像中的每一个像素p∈Si,其亮度值y0用y′来替换,即
[式5]
y0←y′,s.t.AHS(y0)=AHP(y′)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110107810 CN102194241B (zh) | 2011-04-28 | 2011-04-28 | 基于互联网的艺术拼图系统设计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110107810 CN102194241B (zh) | 2011-04-28 | 2011-04-28 | 基于互联网的艺术拼图系统设计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102194241A true CN102194241A (zh) | 2011-09-21 |
CN102194241B CN102194241B (zh) | 2013-07-10 |
Family
ID=44602254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110107810 Expired - Fee Related CN102194241B (zh) | 2011-04-28 | 2011-04-28 | 基于互联网的艺术拼图系统设计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102194241B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103064961A (zh) * | 2012-12-29 | 2013-04-24 | 苏州市职业大学 | 一种为移动终端服务的图像检索系统装置 |
CN104103085A (zh) * | 2013-04-11 | 2014-10-15 | 三星电子株式会社 | 屏幕图像中的对象 |
WO2014176971A1 (zh) * | 2013-11-22 | 2014-11-06 | 中兴通讯股份有限公司 | 畸变图像校正复原与分析报警的方法和装置 |
CN107133920A (zh) * | 2017-06-13 | 2017-09-05 | 华侨大学 | 一种基于视觉特征的马赛克拼图的自动生成方法 |
CN107155012A (zh) * | 2016-03-02 | 2017-09-12 | 富士施乐株式会社 | 图像形成设备、图像形成系统和图像形成方法 |
CN107864360A (zh) * | 2017-11-15 | 2018-03-30 | 秦广民 | 监控型收音机数据存储方法 |
CN104966092B (zh) * | 2015-06-16 | 2018-06-01 | 中国联合网络通信集团有限公司 | 一种图像处理方法和装置 |
CN108388670A (zh) * | 2018-03-20 | 2018-08-10 | 华北电力大学(保定) | 基于局部码本的四叉树分形的图像检索方法 |
CN110211039A (zh) * | 2019-04-29 | 2019-09-06 | 西安电子科技大学 | 一种图像处理方法及其装置 |
CN110675356A (zh) * | 2019-09-30 | 2020-01-10 | 中国科学院软件研究所 | 一种基于用户意图推断的嵌入式图像合成方法 |
CN111340721A (zh) * | 2020-02-18 | 2020-06-26 | 国网电子商务有限公司 | 一种像素的修正方法、装置、设备及可读存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1462958A (zh) * | 2002-05-29 | 2003-12-24 | 明日工作室股份有限公司 | 线上游戏的图像编辑生成方法以及系统 |
US20070110335A1 (en) * | 2004-11-12 | 2007-05-17 | Microsoft Corporation | Image Processing System for Digital Collage |
CN101080744A (zh) * | 2004-11-05 | 2007-11-28 | 因特格莱弗软件技术公司 | 产生合成图像的方法 |
CN101577010A (zh) * | 2009-06-11 | 2009-11-11 | 清华大学 | 基于图像库的图像合成质量自动评测方法 |
CN101739697A (zh) * | 2008-11-25 | 2010-06-16 | 王源源 | 一种图像马赛克拼图的合成方法及系统 |
CN101887366A (zh) * | 2010-06-01 | 2010-11-17 | 云南大学 | 云南重彩画艺术风格的数字模拟和合成技术 |
US7848596B2 (en) * | 2006-05-24 | 2010-12-07 | Hewlett-Packard Development Company, L.P. | Templated collage generation with occlusion costing |
CN101976449A (zh) * | 2010-11-25 | 2011-02-16 | 上海合合信息科技发展有限公司 | 拍摄多幅文本图像并拼接的方法 |
CN102005061A (zh) * | 2010-11-24 | 2011-04-06 | 西安交通大学 | 基于分层-补洞的卡通动画再利用方法 |
-
2011
- 2011-04-28 CN CN 201110107810 patent/CN102194241B/zh not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1462958A (zh) * | 2002-05-29 | 2003-12-24 | 明日工作室股份有限公司 | 线上游戏的图像编辑生成方法以及系统 |
CN101080744A (zh) * | 2004-11-05 | 2007-11-28 | 因特格莱弗软件技术公司 | 产生合成图像的方法 |
US20070110335A1 (en) * | 2004-11-12 | 2007-05-17 | Microsoft Corporation | Image Processing System for Digital Collage |
US7848596B2 (en) * | 2006-05-24 | 2010-12-07 | Hewlett-Packard Development Company, L.P. | Templated collage generation with occlusion costing |
CN101739697A (zh) * | 2008-11-25 | 2010-06-16 | 王源源 | 一种图像马赛克拼图的合成方法及系统 |
CN101577010A (zh) * | 2009-06-11 | 2009-11-11 | 清华大学 | 基于图像库的图像合成质量自动评测方法 |
CN101887366A (zh) * | 2010-06-01 | 2010-11-17 | 云南大学 | 云南重彩画艺术风格的数字模拟和合成技术 |
CN102005061A (zh) * | 2010-11-24 | 2011-04-06 | 西安交通大学 | 基于分层-补洞的卡通动画再利用方法 |
CN101976449A (zh) * | 2010-11-25 | 2011-02-16 | 上海合合信息科技发展有限公司 | 拍摄多幅文本图像并拼接的方法 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103064961A (zh) * | 2012-12-29 | 2013-04-24 | 苏州市职业大学 | 一种为移动终端服务的图像检索系统装置 |
CN104103085A (zh) * | 2013-04-11 | 2014-10-15 | 三星电子株式会社 | 屏幕图像中的对象 |
US9852491B2 (en) | 2013-04-11 | 2017-12-26 | Samsung Electronics Co., Ltd. | Objects in screen images |
WO2014176971A1 (zh) * | 2013-11-22 | 2014-11-06 | 中兴通讯股份有限公司 | 畸变图像校正复原与分析报警的方法和装置 |
US10304169B2 (en) | 2013-11-22 | 2019-05-28 | Zte Corporation | Method and device for correction restoration and analysis alarming of distorted image |
CN104966092B (zh) * | 2015-06-16 | 2018-06-01 | 中国联合网络通信集团有限公司 | 一种图像处理方法和装置 |
CN107155012B (zh) * | 2016-03-02 | 2019-09-06 | 富士施乐株式会社 | 图像形成设备、图像形成系统和图像形成方法 |
CN107155012A (zh) * | 2016-03-02 | 2017-09-12 | 富士施乐株式会社 | 图像形成设备、图像形成系统和图像形成方法 |
CN107133920A (zh) * | 2017-06-13 | 2017-09-05 | 华侨大学 | 一种基于视觉特征的马赛克拼图的自动生成方法 |
CN107133920B (zh) * | 2017-06-13 | 2021-07-30 | 华侨大学 | 一种基于视觉特征的马赛克拼图的自动生成方法 |
CN107864360A (zh) * | 2017-11-15 | 2018-03-30 | 秦广民 | 监控型收音机数据存储方法 |
CN108388670A (zh) * | 2018-03-20 | 2018-08-10 | 华北电力大学(保定) | 基于局部码本的四叉树分形的图像检索方法 |
CN110211039A (zh) * | 2019-04-29 | 2019-09-06 | 西安电子科技大学 | 一种图像处理方法及其装置 |
CN110675356A (zh) * | 2019-09-30 | 2020-01-10 | 中国科学院软件研究所 | 一种基于用户意图推断的嵌入式图像合成方法 |
CN110675356B (zh) * | 2019-09-30 | 2022-02-22 | 中国科学院软件研究所 | 一种基于用户意图推断的嵌入式图像合成方法 |
CN111340721A (zh) * | 2020-02-18 | 2020-06-26 | 国网电子商务有限公司 | 一种像素的修正方法、装置、设备及可读存储介质 |
CN111340721B (zh) * | 2020-02-18 | 2021-02-12 | 国网电子商务有限公司 | 一种像素的修正方法、装置、设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102194241B (zh) | 2013-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102194241B (zh) | 基于互联网的艺术拼图系统设计方法 | |
Lu et al. | Salient object detection using concavity context | |
Huang et al. | Arcimboldo-like collage using internet images | |
Goferman et al. | Context-aware saliency detection | |
Gong | Intelligent image databases: towards advanced image retrieval | |
TW577227B (en) | Method and apparatus for removing background of visual content | |
Xiao et al. | Efficient shadow removal using subregion matching illumination transfer | |
Lin et al. | Painterly animation using video semantics and feature correspondence | |
Yadav et al. | Survey on content-based image retrieval and texture analysis with applications | |
CN101794439A (zh) | 基于边缘分类信息的图像拼接方法 | |
Cui et al. | Transductive object cutout | |
CN108829711A (zh) | 一种基于多特征融合的图像检索方法 | |
Zhou et al. | Identifying designs from incomplete, fragmented cultural heritage objects by curve-pattern matching | |
Jouili et al. | NAVIDOMASS: structural-based approaches towards handling historical documents | |
Lin et al. | Layered graph match with graph editing | |
Fu et al. | Fast accurate and automatic brushstroke extraction | |
Li et al. | Optimal seamline detection in dynamic scenes via graph cuts for image mosaicking | |
Li et al. | Saliency-seeded region merging: Automatic object segmentation | |
Park et al. | Line-based single view 3D reconstruction in Manhattan world for augmented reality | |
Zhao et al. | MindCamera: Interactive Image Retrieval and Synthesis | |
Chauhan et al. | Dominant and LBP-based content image retrieval using combination of color, shape and texture features | |
Zhang et al. | Texture Object Segmentation Based on Affine Invariant Texture Detection | |
Lengauer et al. | Motif-driven Retrieval of Greek Painted Pottery. | |
Lee et al. | Enhancing the realism of sketch and painted portraits with adaptable patches | |
Liu et al. | Video Forgery Detection Using Spatio-Temporal Dual Transformer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130710 Termination date: 20160428 |