CN102903128B - 基于局部特征结构保持的视频图像内容编辑传播方法 - Google Patents

基于局部特征结构保持的视频图像内容编辑传播方法 Download PDF

Info

Publication number
CN102903128B
CN102903128B CN201210331180.2A CN201210331180A CN102903128B CN 102903128 B CN102903128 B CN 102903128B CN 201210331180 A CN201210331180 A CN 201210331180A CN 102903128 B CN102903128 B CN 102903128B
Authority
CN
China
Prior art keywords
pixel
color
image
video
editor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210331180.2A
Other languages
English (en)
Other versions
CN102903128A (zh
Inventor
陈小武
邹冬青
赵沁平
李健伟
丁峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201210331180.2A priority Critical patent/CN102903128B/zh
Priority to US13/693,062 priority patent/US9036860B2/en
Publication of CN102903128A publication Critical patent/CN102903128A/zh
Application granted granted Critical
Publication of CN102903128B publication Critical patent/CN102903128B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/001Texturing; Colouring; Generation of texture or colour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • H04N1/6002Corrections within particular colour systems
    • H04N1/6008Corrections within particular colour systems with primary colour signals, e.g. RGB or CMY(K)
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • H04N1/6083Colour correction or control controlled by factors external to the apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • H04N1/62Retouching, i.e. modification of isolated colours only or in isolated picture areas only

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于局部特征结构保持的视频图像内容编辑传播方法,包括如下步骤:将输入的图像/视频中所有像素点映射到预设的特征空间;在特征空间中,对每一个像素点,求取其最近K个邻居;利用局部线性嵌入降维方法,将所有像素点构建局部线性关系;将用户预设的图像/视频编辑请求对应到所述图像/视频的部分像素上;根据像素间的结构关系,利用步骤S400中的部分像素的对应,将用户预设的编辑请求传播到图像/视频所有其他像素。其保持图像/视频的编辑传播不受对象形状影响,具有一定的适应性和鲁棒性。

Description

基于局部特征结构保持的视频图像内容编辑传播方法
技术领域
本发明涉及图像处理、计算机视觉和增强处理技术领域,具体地说是一种基于局部特征结构保持的视频图像内容编辑传播方法。
背景技术
数字图像领域中,最常见的图像处理方法之一是根据视频图像内容,进行编辑处理。例如,改变视频图像的颜色;将不同视频源的对象融合到一起,形成一个无编辑痕迹的视频;精确提取图像中的毛发等。对于艺术设计者或者从事影视编辑的工作人员来说,为了对一个视频的颜色、内容进行编辑,将进行大量的手工编辑。事实上,视频图像内容特征之间通常具有某种内在联系。能根据这些内在联系,自动的进行视频图像编辑,可以在很大程度上提高视频图像编辑效率。
目前,一些科研工作者在相关技术上开展了研究。在图像编辑方面,大量的研究工作已经对此进行了探讨。Fabio Pellacini等人在2008年提出了基于所有像素相似性的编辑传播方法,但是该方法需要的时空资源太大,无法处理大图像或者视频数据;Kun Xu等人基于Fabio Pellacini等人的工作,在2009年提出了基于KD tree的编辑传播方法,该方法解决了Fabio Pellacini等提出方法的时空消耗问题,节省了系统资源,但是其针对颜色过渡区域会出现颜色异常现象。Zeev Farbman等人在2010年提出了基于扩散图(diffusionmap)的编辑传播方法,该方法利用扩散距离(diffusion distance)来衡量所有像素点之间的相似度,但是其依然在效率上不高,同时,这种方法不能有效的反映出像素之间的不相似性,而且针对颜色过渡区域的像素点,处理结果不理想。
在颜色风格一致化方面,2001年,布里斯托大学的Eric Reinhard等人是利用颜色空间的转换,将目标图像和参考图像首先从RGB颜色空间转换到lαβ颜色空间,然后在这三个通道上分别求取二阶统计量期望方差,再针对目标图像的每一个像素,进行缩放旋转,求得的最终结果转换为RGB颜色空间即为结果图像的像素颜色值,该方法简单有效,但是针对复杂的图像,需要用户指定样本进行颜色转换。针对这个问题,2005年,日本的Chang等人提出了一种基于颜色分类的方法实现颜色转换。其首先将目标图像和参考图像按照颜色差异,分成多个颜色类,然后在对应的颜色类之间进行颜色转换。Pitie.F等人以一种全新的思路,在证明了N维概率密度函数转移的可行性并将它运用到颜色迁移领域,在灰度图像中,利用直方图规定化实现图像灰度变换使其具有特定的直方图形式。直方图是概率分布密度的体现,而直方图规定化是目标图像概率分布密度映射到期望概率分布密度的过程,也就一维概率密度函数转移。而N维概率密度函数转移是基于一维展开的。设f(x)和g(x)是源图像和目标图像的颜色概率密度分布,xi=(ri,gi,bi),ri、gi、bi分别代表红绿蓝三色,选择任意一个旋转矩阵尺,旋转后对N维分别作一维概率密度函数转移,重复多次,直到收敛,得到迁移后的新图像。但是,现有技术的生成的结果图像颜色过渡不平滑,有很多块状,需要通过二次处理对图像进行平滑,并且容易产生一些不自然的着色效果。因此,针对自动颜色转换方法中的这些问题,出现了一些基于交互式的颜色转换方法。Takahiko将概率松弛法引入颜色迁移,以选取最优的颜色信息迁移给目标图像素。2003年Takahiko等人又提出种子像素的概念,由用户选取一些彩色像素作为灰度图像的种子,利用颜色繁殖完成颜色迁移。Tomohisa等人改进了颜色繁殖算法,引入图像分割防止错误繁殖边缘像素颜色,并提出了新的基于CIELAB颜色空间的彩色化算法,但是该方法不能保证结果图像既能在颜色视觉上逼近参考图像的颜色的同时,保持目标图像的颜色流形线性结构。
在场景对象融合方面,一些研究机构在这方面也开展了研究。2003年Perez等人提出了一种基于泊松方程和狄利克雷边界条件的图像场景融合方法。该种方法能够较好的融合插入的对象,但是时间空间消耗率太大。2009年,Zeev Farbman等人提出了基于中值坐标的视频图像场景快速融合方法,很大程度上改善了泊松方法的时空效率,但是该种方法容易受到插入对象的形状影响。
在精确对象提取方面,Jian Sun等人在2004年提出了基于泊松方程的精确对象提取方法,该方法为国际首次提出的精确对象提取方法,但是该方法计算速度慢,存储空间耗费大,而且在半透明的图像区域不能很好的提取前景。Ahat Levin等人在2008年提出了一种基于频谱聚类的方法,该方法一定程度上提高了前景提取的准确率,但是效率低,而且在半透明的图像区域不能很好的提取前景。
在灰度图像着色方面,Welsh等人在2001年首先提出基于灰度匹配的灰度图像着色方法,该方法需要给定一张与灰度图像场景类似的彩色图像,然后根据两幅图像的灰度匹配,给灰度图像着色。但是该方法对场景复查的图像,不能很好的着色,着色过程中交互量太大。
发明内容
根据上述实际需求和关键问题,本发明的目的在于:提出一种基于局部特征结构保持的视频图像内容编辑传播方法。其保持图像/视频的编辑传播不受对象形状影响,具有一定的适应性和鲁棒性。
为实现本发明目的而提供的一种基于局部特征结构保持的视频图像内容编辑传播方法,该方法包括以下步骤:
步骤S100,将输入的图像/视频中所有像素点映射到预设的特征空间;
步骤S200,在特征空间中,对每一个像素点,求取其最近K个邻居;
步骤S300,利用局部线性嵌入降维方法,将所有像素点构建局部线性关系;
步骤S400,将用户预设的图像/视频编辑请求对应到所述图像/视频的部分像素上;
步骤S500,根据像素间的结构关系,利用步骤S400中的部分像素的对应,将用户预设的编辑请求传播到图像/视频所有其他像素。
步骤S600,对异常结果进行处理,包括异常颜色值、边缘,生成最终结果。
较优地,所述步骤S100中,将输入的图像/视频中所有像素点映射到预设的特征空间,是根据预设的应用需求,包括自动颜色变换、交互式颜色编辑、精准对象提取、场景对象融合、灰度图像着色,选定不同的特征;
其中,针对颜色变换和交互式颜色编辑,所选择的特征空间为RGB颜色空间;
针对对象精准提取和场景对象融合,所选择的特征空间为RGBXYT六维空间,其中RGB指示颜色,XY指示像素的坐标,T指示第几帧;
针对灰度图像着色,选择的特征空间为:灰度-SIFT-纹理-位置特征空间。
较优地,在步骤S300中,在特征空间中,对每一个像素点,求取其最近K个邻居,是指对特征空间中的每个像素,求取与其特征最接近的K个像素点;
其中,针对颜色变换和交互式颜色编辑,所选择的K个特征邻居为颜色距离上最接近的K个邻居;
针对对象精准提取和场景对象融合,所选择的K个特征邻居为颜色和空间位置距离上最接近的K个邻居;
针对灰度图像着色,所选择的K个特征邻居为在灰度、SIFT、纹理和空间位置四种特征距离上最接近的K个邻居。
其中,所采用的距离计算方法为欧氏距离计算方法。
较优地,所述步骤S300中的局部线性嵌入降维方法,为所有像素点构建局部线性关系,包括如下步骤:
步骤S310,针对每一个像素,根据其特征,寻找与其在欧氏距离上最接近的K个像素;
步骤S320,通过求得最优的每组K近邻的线性组合系数,使得当前像素特征向量值与它的K近邻线性组合值尽可能的接近;
所述求得最优的每组K近邻的线性组合系数,是通过构建当前像素特征值与其K近邻的线性组合值的平方差之和,采用最小二乘法求解该方程,得到最优每组K近邻的线性组合系数。
较优地,设定Xi表示像素i的特征,Xi1,...,Xik表示Xi的K个邻居的特征向量,其局部特征的结构关系构建方法为:
min Σ i = 1 N | | X i - Σ j = 1 K w ij X ij | | 2
通过求解上述公式,得到Wij的数值,{wij|i=1,..,N}反映了数据之间的结构关系;
在此基础之上,编辑传播通过最小化如下能量公式实现:
E = λ Σ i ∈ S ( z i - g i ) 2 + Σ i = 1 N ( z i - Σ z j ∈ N i w ij z j ) 2
其中,gi为用户预设的稀疏编辑,zi为编辑传播的结果。
较优地,所述步骤S400中的在根据用户预设的编辑,对应到部分像素上,包括如下步骤:
步骤S410,将用户预设的自动色调调整请求对应到预设的色调模板的像素的色调上;
步骤S420,将用户预设的交互式色调调整请求对应到在图像/视频的关键帧上指定部分像素的色调上;
步骤S430,将用户预设的精细分割请求对应到预设的三分图的像素上;
步骤S440,将用户预设的无缝融合请求对应到选定的目标融合区域的像素上;
步骤S450,将用户预设的灰度图像着色要求对应到在部分区域上指定部分像素的色调上。
较优地,所述步骤S500包括如下步骤:
步骤S510,针对自动色调调整,将指定的色调传递到其他像素上,改变像素颜色;
步骤S520,针对交互式色调调整,将用户指定部分像素的色调,传递到其他像素颜色;
步骤S530,针对精细分割,根据三分图确定的前景和背景,得到未知区域的像素属于前景的概率;
步骤S540,针对无缝融合,根据插入区域边界和目标背景的色差,改变插入区域的颜色;
步骤S550,针对灰度图像着色,根据超像素的特征关系,将其着色。
本发明与现有的技术相比,其有益的特点是:1、本发明提出的方法能够应用到各种应用,包括:自动颜色变换、交互式颜色编辑、精准对象提取、场景对象融合及灰度图像着色。2、本发明提出的框架简单有效,不需要用户进行大量的手工编辑,要不需要专业的技能,只需要用户粗略的交互,就能在短时间内得到期望结果,节省了计算时间,提高了计算效率。3、本发明有效的解决了视频图像中颜色过渡区域的特征关系保持的问题,避免了在这些区域出现编辑异常。4、本发明提出的方法保持图像/视频的编辑传播不受对象形状影响,具有一定的适应性和鲁棒性。。
附图说明
图1是本发明基于局部特征结构保持的视频图像内容编辑传播方法流程图;
图2(a)-图2(c)是本发明的原理示意图;
图3是本发明的自动颜色转换流程图;
图4是本发明的交互式颜色编辑流程图;
图5是本发明的场景对象无缝融合的流程图;
图6是本发明的精准对象提取的流程图;
图7是本发明的灰度图像着色流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明的一种基于局部特征结构保持的视频图像内容编辑传播方法进行解释。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明的提出一个框架,其能够保持视频图像中局部特征的关系,以避免视频图像处理过程中出现问题;同时,将该框架应用到五个典型应用,包括:动颜色变换、交互式颜色编辑、精准对象提取、场景对象融合、灰度图像着色。
本发明实施例基于局部特征结构保持的视频图像内容处理方法的优势在于:对于视频/图像中的颜色过渡区域,能够在视频/图像的编辑处理过程中保持这些区域中像素之间的关系,避免在颜色过渡区域出现颜色分裂或异常颜色的问题,确保生成的结果颜色过渡平滑。
本发明实施例提供了一种基于局部特征结构保持的视频图像内容编辑传播方法,如图1所示,包括如下步骤:
步骤S100,将输入的图像/视频中所有像素点映射到预设的特征空间;
将输入的图像/视频中所有像素点映射到预设的特征空间,作为一种可实施方式,是根据预设的应用需求,包括自动颜色变换、交互式颜色编辑、精准对象提取、场景对象融合、灰度图像着色,选定不同的特征。
具体而言,作为一种可实施方式,针对颜色变换和交互式颜色编辑,所选择的特征空间为RGB颜色空间;
针对对象精准提取和场景对象融合,所选择的特征空间为RGBXYT六维空间,其中RGB指示颜色,XY指示像素的坐标,T指示第几帧。
针对灰度图像着色,选择的特征空间为:灰度-SIFT-纹理-位置特征空间。
步骤S200,在特征空间中,对每一个像素点,求取其最近K个邻居;
在特征空间中,对每一个像素点,求取其最近K个邻居,作为一种可实施方式,是指对特征空间中的每个像素,求取与其特征最接近的K个像素点。
具体而言,作为一种可实施方式,针对颜色变换和交互式颜色编辑,所选择的K个特征邻居为颜色距离上最接近的K个邻居;
针对对象精准提取和场景对象融合,所选择的K个特征邻居为颜色和空间位置距离上最接近的K个邻居。
针对灰度图像着色,所选择的K个特征邻居为在灰度、SIFT、纹理和空间位置四种特征距离上最接近的K个邻居。
其中,较佳地,作为一种可实施方式,所采用的距离计算方法为欧氏距离计算方法。
步骤S300,利用局部线性嵌入降维方法,将所有像素点构建局部线性关系;
利用局部线性嵌入降维方法,为所有像素点构建局部线性关系,是为了计算出整个特征空间中所有像素之间的关系。这种关系本质上反应了像素之间的相似度及其可区别性。因此,针对颜色过渡区域的颜色,能更好的保持住他们之间的关系,以及和其他区域的颜色的可区别性。K近邻的数量越多,则整个特征空间的分布结构在编辑传播过程中会保持的越好。
较佳地,作为一种可实施方式,所述步骤S300中的局部线性嵌入降维方法,为所有像素点构建局部线性关系,包括如下步骤:
步骤S310,针对每一个像素,根据其特征,寻找与其在欧氏距离上最接近的K个像素;
步骤S320,通过求得最优的每组K近邻的线性组合系数,使得当前像素特征向量值与它的K近邻线性组合值尽可能的接近;
较佳地,作为一种可实施方式,所述求得最优的每组K近邻的线性组合系数,是通过构建当前像素特征值与其K近邻的线性组合值的平方差之和,采用最小二乘法求解该方程,得到最优每组K近邻的线性组合系数。
较佳地,作为一种可实施例,所述构建局部特征结构关系为:设定Xi表示像素i的特征,Xi1,...,Xik表示Xi的K个邻居的特征向量,其局部特征的结构关系构建方法如式(1)所示,为:
min Σ i = 1 N | | X i - Σ j = 1 K w ij X ij | | 2 - - - ( 1 )
通过求解公式(1),得到Wij的数值。{wij|i=1,..,N}反映了数据之间的结构关系(Wij反映了地i个数据点和第j个数据点之间的关系,即,Wij越大,则表示这两个数据点特征越接近,反之则反。在此基础之上,编辑传播通过最小化如下能量公式(2)实现:
E = λ Σ i ∈ S ( z i - g i ) 2 + Σ i = 1 N ( z i - Σ z j ∈ N i w ij z j ) 2 - - - ( 2 )
其中,gi为用户预设的稀疏编辑,zi为编辑传播的结果。由此公式可以看出,本发明提出的基于局部特征结构保持的视频图像内容编辑传播方法能够既保持局部特征结构,又能实现编辑传播。
步骤S300中对局部特征结构保持,能够避免在视频图像颜色过渡区域出现颜色异常的问题。
步骤S400,将用户预设的图像/视频编辑请求对应到所述图像/视频的部分像素上;
为了利用特征结构保持的框架来实现不同的应用,其用户预设的编辑请求是不一样的。
具体而言,作为一种可实施方式,针对自动颜色变换,用户预设的编辑为提供颜色模板,然后根据输入视频图像的颜色值与颜色模板的颜色值进行匹配,建立起视频图像中的像素点的颜色值与颜色模板的颜色值的映射关系;
针对交互式颜色编辑,用户预设的编辑是为某些对象或者区域指定新的颜色,标记某些像素的新颜色。因此,可以建立起这些标记的像素的颜色和用户指定的新颜色的映射关系;
针对精准对象提取,用户预设的编辑为标记图像中哪些区域是确定的前景,哪些区域是确定的背景,哪些区域是待精确提取的区域,从而建立起图像像素与前景、背景、未知区域的对应关系;
针对场景对象融合,用户预设的编辑为放入的目标场景的位置。根据对象放入目标场景的位置,建立起对象边界像素与被对象边界所覆盖的目标场景像素的映射关系;
针对灰度图像着色,用户预设的编辑是指为某些对象或者区域指定新的颜色,标记某些像素的新颜色。
较佳地,作为一种可实施方式,所述步骤S400中的在根据用户预设的编辑,对应到部分像素上,包括如下步骤:
步骤S410,将用户预设的自动色调调整请求对应到预设的色调模板的像素的色调上;
较佳地,作为一种可实施方式,所述步骤S410中的色调模板可以为预先设计好的色调模板,也可以根据11标准色从其他图像或者视频中预先提取的得到的色调模板。
作为一种可实施方式,所述从其他图像或者视频中提取色调模板时,采用11标准色和K聚类的方法进行聚类,提取每一类的平均颜色,作为色调模板。
步骤S420,将用户预设的交互式色调调整请求对应到在图像/视频的关键帧上指定部分像素的色调上;
步骤S430,将用户预设的精细分割请求对应到预设的三分图(tri-map)的像素上;
步骤S440,将用户预设的无缝融合请求对应到选定的目标融合区域的像素上;
较佳地,作为一种可实施方式,所述步骤S440中的无缝融合,是通过求目标区域中的每一个像素点和边界上每一个像素点的线性关系,来实现颜色插值。
步骤S450,将用户预设的灰度图像着色要求对应到在某些区域上指定部分像素的色调上。
步骤S500,根据像素间的结构关系,利用步骤S400中的部分像素的对应,将用户预设的编辑请求传播到图像/视频所有其他像素;
根据像素间的结构关系,将编辑传播到所有其他像素。根据用户的应用需求,即自动颜色变换、交互式颜色编辑、精准对象提取、场景对象融合及灰度图像着色,像素之间的结构关系,以及用户指定的编辑和映射,将用户指定的编辑传播到其他未知像素。
具体而言,作为一种可实施方式,针对自动颜色变换和交互式颜色编辑,是指将用户指定的颜色模板或者用户指定的颜色传播到其他像素;
针对精准对象提取,是指根据确定的前景和背景,传播到未知区域的像素,推理出未知像素属于前景背景的概率;
针对场景对象融合,是指根据插入对象的边界和被覆盖的目标场景的颜色差,将其传播到插入对象的其他像素上,形成最终的融合结果。
针对灰度图像着色,是指根据灰度图像的超像素之间的关系,将指定的颜色传播到其他超像素上。
较佳地,作为一种可实施方式,所述步骤S500根据像素间的结构关系,将编辑传播到所有其他像素,包括如下步骤:
步骤S510,针对自动色调调整,将指定的色调传递到其他像素上,改变像素颜色;
步骤S520,针对交互式色调调整,将用户指定部分像素的色调,传递到其他像素颜色;
步骤S530,针对精细分割,根据三分图(tri-map)确定的前景和背景,得到未知区域的像素属于前景的概率;
步骤S540,针对无缝融合,根据插入区域边界和目标背景的色差,改变插入区域的颜色;
步骤S550,针对灰度图像着色,根据超像素的特征关系,将其着色。
步骤S600,对异常结果进行处理,包括异常颜色值、边缘等,生成最终结果。
对颜色异常处理的方法为:对所有的结果颜色值的范围进行约束,将其限制在0到255的数值范围之内。同时,结合原图像的梯度,对结果图像的梯度进行修正,尽可能的保留结果图像的边缘细节。
下面举例进一步详细说明本发明实施例的基于局部特征结构保持的视频图像内容编辑传播方法
以交互式颜色编辑为例,如图2所示,图2(a)中的像素点A处在颜色过渡的区域,而图2(a)中的像素点B、C则分别处在颜色一致区域,即非颜色过渡区域。
图2(b)是图2(a)中所有像素点颜色在LAB颜色空间中的颜色分布图,像素点A处在B和C的过渡区域。
图2(c)是由本发明实施例的结构保持的编辑传播方法生成的结果。可以看出,相比于现有技术,本发明实施例基于局部特征结构保持的视频图像内容编辑传播方法在针对具有颜色过渡区域的视频/图像数据有一定的优势。总体而言,本发明实施例的基于局部特征结构保持的视频图像内容编辑传播方法可分为两大步骤:1)局部特征结构关系构建;2)视频图像内容编辑传播。
参阅如图3,本发明实施例的自动颜色转换流程图。本发明实施例通过求取输入视频图像的主色调,建立与给定的色调模板的映射关系,完成颜色转换。视频图像的主色调指能代表给定视频图像颜色风格的几种颜色值。
作为一种可实施方式,较佳地,所述主色调的求取方法是:
首先,根据通过K聚类,对颜色分类,并求取每一类中像素的个数;
其次,对每一类像素在RGB三个通道上分别求取三个通道的颜色值和;
最后,在三个通道上求取均值,得到该类的主色调颜色值。
颜色映射关系的求取方法是:通过求取两组颜色模板的最小欧氏距离和,得到最优映射关系。
参阅图4本发明的交互式颜色编辑流程图,目的是根据用户在某些关键帧上为某些区域或者对象指定的颜色进行视频图像颜色变换。本发明实施例的用户编辑包括指定的前景颜色及其限定不变的颜色。在满足用户编辑约束的前提下,根据局部特征结构关系,编辑传播到其他像素,生成最终的结果。
参考图5场景对象无缝融合的流程图,将新插入的对象与场景无缝融合,保证视觉结果的合理性。
作为一种可实施方式,所述将新插入的对象与场景无缝融合,包括如下步骤:
在选定插入对象区域的基础上,对该区域进行三角剖分;
插入的对象可以用户用画笔选取,也可以是根据已经制作好的马斯克(mask)进行选取;
然后计算该插入区域的边缘各像素点与区域中各个三角形顶点的特征结构关系;
其后根据插入对象区域的边缘各个像素与被覆盖的目标场景像素点的颜色差,得出插入对象各个三角顶点的颜色修改值;
根据三角顶点的颜色值,线性插值出每个三角形中像素点的颜色值,得到最终的生成效果。
参考图6本发明的精准对象提取的流程图,其根据目标图像和给定的三分图(Trimap)图像,得到目标图像中各个像素点的性质,包括:前景、背景及待确定区域;为待确定区域中的每个像素点,在前景和背景区域中选择K近邻并构建局部特征结构关系,计算出待确定区域中每个像素点为前景的概率值,输出最终结果。
参考图7本发明的灰度图像着色流程图,以超像素为单位提取每个超像素的特征,构建局部特征结构关系。其根据用户指定的部分超像素的颜色,推理出其他超像素的颜色;在YUV颜色空间中,用原灰度图像的强度信息替换Y通道的值,然后进行平滑处理,获得最终效果。
本发明实施例基于局部特征结构保持的视频图像内容编辑传播方法,该框架简单且易于实现,执行时空效率高。提出并实现了局部特征结构保持的方法,解决了视频图像中颜色过渡区域的处理问题,提高了效果的逼真性。同时,本发明自动程度高,减少了用户交互。本发明实施例的基于局部特征机构保持的视频图像内容编辑传播方法,设计并实现了五个典型应用,分别为:自动颜色变换、交互式颜色编辑、精准对象提取、场景对象融合及灰度图像着色,证明的方法的可扩展性。
最后应当说明的是,很显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,如果本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型。

Claims (5)

1.一种基于局部特征结构保持的视频图像内容编辑传播方法,其特征在于,包括如下步骤:
步骤S100,将输入的图像/视频中所有像素点映射到预设的特征空间;
步骤S200,在特征空间中,对每一个像素点,求取其最近K个邻居;
步骤S300,利用局部线性嵌入降维方法,将所有像素点构建局部线性关系;
步骤S400,将用户预设的图像/视频编辑请求对应到所述图像/视频的部分像素上;
步骤S500,根据像素间的结构关系,利用步骤S400中的部分像素的对应,将用户预设的编辑请求传播到图像/视频所有其他像素;
步骤S600,对异常结果进行处理,包括异常颜色值、边缘,生成最终结果;
其中,所述步骤S100中,将输入的图像/视频中所有像素点映射到预设的特征空间,是根据预设的应用需求,包括自动颜色变换、交互式颜色编辑、精准对象提取、场景对象融合、灰度图像着色,选定不同的特征;
其中,针对颜色变换和交互式颜色编辑,所选择的特征空间为RGB颜色空间;
针对对象精准提取和场景对象融合,所选择的特征空间为RGBXYT六维空间,其中RGB指示颜色,XY指示像素的坐标,T指示第几帧;
针对灰度图像着色,选择的特征空间为:灰度-SIFT-纹理-位置特征空间;
此外,在步骤S300中,在特征空间中,对每一个像素点,求取其最近K个邻居,是指对特征空间中的每个像素,求取与其特征最接近的K个像素点;
其中,针对颜色变换和交互式颜色编辑,所选择的K个特征邻居为颜色距离上最接近的K个邻居;
针对对象精准提取和场景对象融合,所选择的K个特征邻居为颜色和空间位置距离上最接近的K个邻居;
针对灰度图像着色,所选择的K个特征邻居为在灰度、SIFT、纹理和空间位置四种特征距离上最接近的K个邻居。
其中,所采用的距离计算方法为欧氏距离计算方法。
2.根据权利要求1所述的视频图像内容编辑传播方法,其特征在于,设定Xi表示像素i的特征,Xi1,...,Xik表示Xi的K个邻居的特征向量,其局部特征的结构关系构建方法为:
m i n Σ i = 1 N | | X i - Σ j = 1 K w i j X i j | | 2
通过求解上述公式得到Wij的数值;{wij|i=1,..,N}反映了数据之间的结构关系;
在此基础之上,编辑传播通过最小化如下能量公式实现:
E = λ Σ i ∈ S ( z i - g i ) 2 + Σ i = 1 N ( z i - Σ z j ∈ N i w i j z j ) 2
其中,gi为用户预设的稀疏编辑,zi为编辑传播的结果。
3.根据权利要求1所述的视频图像内容编辑传播方法,其特征在于,所述步骤S300中的局部线性嵌入降维方法,为所有像素点构建局部线性关系,包括如下步骤:
步骤S310,针对每一个像素,根据其特征,寻找与其在欧氏距离上最接近的K个像素;
步骤S320,通过求得最优的每组K近邻的线性组合系数,使得当前像素特征向量值与它的K近邻线性组合值尽可能的接近;
所述求得最优的每组K近邻的线性组合系数,是通过构建当前像素特征值与其K近邻的线性组合值的平方差之和,采用最小二乘法求解该方程,得到最优每组K近邻的线性组合系数。
4.根据权利要求1所述的视频图像内容编辑传播方法,其特征在于,所述步骤S400中的在根据用户预设的编辑,对应到部分像素上,包括如下步骤:
步骤S410,将用户预设的自动色调调整请求对应到预设的色调模板的像素的色调上;
步骤S420,将用户预设的交互式色调调整请求对应到在图像/视频的关键帧上指定部分像素的色调上;
步骤S430,将用户预设的精细分割请求对应到预设的三分图的像素上;
步骤S440,将用户预设的无缝融合请求对应到选定的目标融合区域的像素上;
步骤S450,将用户预设的灰度图像着色要求对应到在部分区域上指定部分像素的色调上。
5.根据权利要求1所述的视频图像内容编辑传播方法,其特征在于,所述步骤S500包括如下步骤:
步骤S510,针对自动色调调整,将指定的色调传递到其他像素上,改变像素颜色;
步骤S520,针对交互式色调调整,将用户指定部分像素的色调,传递到其他像素颜色;
步骤S530,针对精细分割,根据三分图确定的前景和背景,得到未知区域的像素属于前景的概率;
步骤S540,针对无缝融合,根据插入区域边界和目标背景的色差,改变插入区域的颜色;
步骤S550,针对灰度图像着色,根据超像素的特征关系,将其着色。
CN201210331180.2A 2012-09-07 2012-09-07 基于局部特征结构保持的视频图像内容编辑传播方法 Active CN102903128B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201210331180.2A CN102903128B (zh) 2012-09-07 2012-09-07 基于局部特征结构保持的视频图像内容编辑传播方法
US13/693,062 US9036860B2 (en) 2012-09-07 2012-12-04 Method for editing propagation of video and image content based on local feature structure preservation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210331180.2A CN102903128B (zh) 2012-09-07 2012-09-07 基于局部特征结构保持的视频图像内容编辑传播方法

Publications (2)

Publication Number Publication Date
CN102903128A CN102903128A (zh) 2013-01-30
CN102903128B true CN102903128B (zh) 2016-12-21

Family

ID=47575341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210331180.2A Active CN102903128B (zh) 2012-09-07 2012-09-07 基于局部特征结构保持的视频图像内容编辑传播方法

Country Status (2)

Country Link
US (1) US9036860B2 (zh)
CN (1) CN102903128B (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11131734B2 (en) * 2012-12-13 2021-09-28 Gagan Sidhu Processing multidimensional signals
CN103177446B (zh) * 2013-03-13 2016-03-30 北京航空航天大学 基于邻域和非邻域平滑先验的图像前景精准提取方法
US20160111129A1 (en) * 2013-05-28 2016-04-21 Thomson Licensing Image edits propagation to underlying video sequence via dense motion fields
EP3014484A4 (en) * 2013-06-28 2017-05-03 Microsoft Technology Licensing, LLC Selecting and editing visual elements with attribute groups
CN103413331B (zh) * 2013-07-29 2016-03-30 北京航空航天大学 一种支持编辑传播的高分辨率视频图像内容稀疏表达方法
WO2015022208A1 (en) * 2013-08-16 2015-02-19 Thomson Licensing Method and apparatus for generating temporally consistent superpixels
WO2015042901A1 (en) 2013-09-29 2015-04-02 Microsoft Technology Licensing, Llc Media presentation effects
CN105303519A (zh) 2014-06-20 2016-02-03 汤姆逊许可公司 用于生成时间一致的超像素的方法和装置
CN104143203B (zh) * 2014-07-29 2017-02-15 清华大学深圳研究生院 一种图像编辑传播方法
CN104376529B (zh) * 2014-11-25 2017-08-11 深圳北航天汇创业孵化器有限公司 一种基于glcm的灰度图像彩色化系统和方法
CN105096362B (zh) * 2015-07-21 2018-10-26 华南农业大学 一种基于重采样的颜色编辑扩散方法
US9449252B1 (en) 2015-08-27 2016-09-20 Sony Corporation System and method for color and brightness adjustment of an object in target image
KR102477265B1 (ko) * 2015-09-24 2022-12-13 삼성전자주식회사 그래픽스 프로세싱 장치 및 그래픽스 파이프라인의 텍스쳐링을 위한 LOD(level of detail)를 결정하는 방법
TWI596572B (zh) * 2016-07-06 2017-08-21 Method of automatically coloring image blocks
JP6789762B2 (ja) * 2016-11-02 2020-11-25 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
EP3422298A1 (en) * 2017-06-28 2019-01-02 Thomson Licensing Device and method for propagating edits in a virtual reality scene represented in a curved shape form
CN108022268B (zh) * 2017-11-21 2020-03-17 长沙理工大学 图像颜色编辑方法及装置
CN111742345A (zh) * 2018-06-13 2020-10-02 谷歌有限责任公司 通过着色的视觉跟踪
CN109712145B (zh) * 2018-11-28 2021-01-08 山东师范大学 一种图像抠图方法及系统
CN109905670B (zh) * 2019-03-02 2020-11-24 湛江广通科技有限公司 一种多级平台监控系统
CN114463367A (zh) * 2019-04-30 2022-05-10 腾讯科技(深圳)有限公司 一种图像处理方法和装置
CN110443743A (zh) * 2019-07-31 2019-11-12 中山市奥珀金属制品有限公司 一种图像矩阵内存防止溢出处理方法及系统
CN111161130B (zh) * 2019-11-25 2024-05-17 北京智汇云舟科技有限公司 一种基于三维地理信息的视频矫正方法
AU2021204186B2 (en) 2020-06-29 2022-09-01 Canva Pty Ltd. Systems and methods for recolouring vector graphics
CN111932658B (zh) * 2020-07-17 2022-05-27 浙江传媒学院 一种流形结构保持的360度全景图像的高效编辑扩散方法
US11145109B1 (en) * 2020-10-05 2021-10-12 Weta Digital Limited Method for editing computer-generated images to maintain alignment between objects specified in frame space and objects specified in scene space
CN114913273B (zh) * 2022-05-30 2024-07-09 大连理工大学 一种基于深度学习的动画视频线稿上色方法
CN117176979B (zh) * 2023-04-24 2024-05-03 青岛尘元科技信息有限公司 多源异构视频的内容帧提取方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101441763A (zh) * 2008-11-11 2009-05-27 浙江大学 基于颜色传递的多色调图像统一调整方法
US8031202B2 (en) * 2008-03-11 2011-10-04 Xerox Corporation Color transfer between images through color palette adaptation
CN102360490A (zh) * 2011-09-30 2012-02-22 北京航空航天大学 基于颜色转换和编辑传播的图像季节特征增强方法
CN102360506A (zh) * 2011-09-30 2012-02-22 北京航空航天大学 一种基于局部线性保持的场景颜色风格一致化处理方法
CN102521807A (zh) * 2011-12-02 2012-06-27 中国科学院自动化研究所 利用颜色空间分布对颜色进行传递的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6947042B2 (en) * 2002-11-12 2005-09-20 Mitsubishi Electric Research Labs, Inc. Method for mapping high-dimensional samples to reduced-dimensional manifolds
US7756342B2 (en) * 2004-09-20 2010-07-13 The United States Of America As Represented By The Secretary Of The Navy Method for image data processing
US9311567B2 (en) * 2010-05-10 2016-04-12 Kuang-chih Lee Manifold learning and matting

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8031202B2 (en) * 2008-03-11 2011-10-04 Xerox Corporation Color transfer between images through color palette adaptation
CN101441763A (zh) * 2008-11-11 2009-05-27 浙江大学 基于颜色传递的多色调图像统一调整方法
CN102360490A (zh) * 2011-09-30 2012-02-22 北京航空航天大学 基于颜色转换和编辑传播的图像季节特征增强方法
CN102360506A (zh) * 2011-09-30 2012-02-22 北京航空航天大学 一种基于局部线性保持的场景颜色风格一致化处理方法
CN102521807A (zh) * 2011-12-02 2012-06-27 中国科学院自动化研究所 利用颜色空间分布对颜色进行传递的方法

Also Published As

Publication number Publication date
US20140071347A1 (en) 2014-03-13
US9036860B2 (en) 2015-05-19
CN102903128A (zh) 2013-01-30

Similar Documents

Publication Publication Date Title
CN102903128B (zh) 基于局部特征结构保持的视频图像内容编辑传播方法
CN102360490B (zh) 基于颜色转换和编辑传播的图像季节特征增强方法
CN108830912A (zh) 一种深度特征对抗式学习的交互式灰度图像着色方法
CN104732506A (zh) 一种基于人脸语义分析的人物照片颜色风格转换方法
CN104239855B (zh) 一种基于笔画合成的图像风格迁移合成方法
CN109849576B (zh) 一种参考灰度图辅助绘画的方法
CN107045551B (zh) 一种湘绣图像基因构建以及湘绣图像数字化处理方法
US11551384B2 (en) Flow-based color transfer from source graphic to target graphic
CN103617596A (zh) 一种基于流型转换的图像色彩风格变换方法
CN105893649B (zh) 一种基于最优化模型的交互式图像重新着色方法
CN109272467A (zh) 一种基于多尺度边缘线索的层次化图像分割方法
CN102521807B (zh) 利用颜色空间分布对颜色进行传递的方法
Ren et al. Two-stage sketch colorization with color parsing
CN109598770A (zh) 一种城市建筑物的智能配色方法及智能配色系统
CN103413331B (zh) 一种支持编辑传播的高分辨率视频图像内容稀疏表达方法
CN115587930B (zh) 图像色彩风格迁移方法、设备及介质
CN113642262B (zh) 基于人工智能的牙膏包装外观辅助设计方法
CN106021228A (zh) 一种利用知识地形图进行文本分析的方法及系统
CN112446382B (zh) 一种基于细粒度语义级的民族服饰灰度图像着色方法
CN115564667A (zh) 一种专题地图风格自动迁移的方法
CN111161286B (zh) 一种交互式自然图像抠图方法
CN114581557A (zh) 一种面向设计属性解缠表示的服装图像生成方法
CN113807173A (zh) 一种车道线数据集的构建标注方法及应用系统
CN116258660A (zh) 口腔鳞癌侵袭深度智能测量系统
CN109903348B (zh) 基于分块特征交互图像色彩编辑方法、数字图像处理系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant