CN111383289A - 图像处理方法、装置、终端设备及计算机可读存储介质 - Google Patents
图像处理方法、装置、终端设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111383289A CN111383289A CN201811630574.1A CN201811630574A CN111383289A CN 111383289 A CN111383289 A CN 111383289A CN 201811630574 A CN201811630574 A CN 201811630574A CN 111383289 A CN111383289 A CN 111383289A
- Authority
- CN
- China
- Prior art keywords
- image
- style
- content
- characteristic value
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Abstract
本发明适用于图像处理技术领域,提供了一种图像处理方法、装置、终端设备及计算机可读存储介质,通过获取内容图像以及风格图像,并将该内容图像和该风格图像输入至图像处理模型中,其中,该图像处理模型包括编码层、图像处理层以及解码层;然后通过该编码层提取该内容图像的内容特征值以及该风格图像的风格特征值,并将该内容特征值及该风格特征值输入至图像处理层,再通过该图像处理层对内容特征值和风格特征值进行归一化处理,得到风格化的图像特征值,再通过解码层对该图像特征值进行解码以生成风格化后的目标图像,从而降低了图像迁移所需耗费的时间,提高了图像迁移的效率,使得用户体验更好。
Description
技术领域
本发明属于图像处理技术领域,尤其涉及一种图像处理方法、装置、终端设备及计算机可读存储介质。
背景技术
随着人工智能技术的迅猛发展,其在社会各个领域中得到了广泛应用,而人工智能和艺术的交叉碰撞,引起了人们的高度关注,以人工智能技术为基础而开发的各类工作和滤镜的应用,使得人们能够将一幅图像的风格迁移到另一幅图像的内容上,最终得到的图像呈现出不同的图像内容和图像风格的完美结合,满足了人们的对图像的艺术化的需求。
然而,在进行图像迁移的过程中,由于所需要的处理时长较长,迁移效率比较低,使得在对某一图像内容进行不同风格迁移时所耗费的时间较长,使得用户体验非常不好。
发明内容
有鉴于此,本发明实施例提供了一种图像处理方法、装置及终端设备,以解决现有图像处理过程中对图像进行迁移处理所需时长较长,效率较低的问题。
本发明实施例的第一方面提供了一种图像处理方法,包括:
获取内容图像以及风格图像;
将所述内容图像和所述风格图像输入至图像处理模型中,其中,所述图像处理模型包括编码层、图像处理层以及解码层;
通过所述编码层提取所述内容图像的内容特征值以及所述风格图像的风格特征值,并将所述内容特征值及所述风格特征值输入至所述图像处理层;
通过所述图像处理层对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值;
通过所述解码层对所述图像特征值进行解码以生成风格化后的目标图像。
本发明实施例的第二方面提供了一种图像处理装置,包括:
图像获取单元,用于获取内容图像以及风格图像;
图像输入单元,用于将所述内容图像和所述风格图像输入至图像处理模型中,其中,所述图像处理模型包括编码层、图像处理层以及解码层;
特征值提取单元,用于通过所述编码层提取所述内容图像的内容特征值以及所述风格图像的风格特征值,并将所述内容特征值及所述风格特征值输入至所述图像处理层;
归一化处理单元,用于通过所述图像处理层对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值;
目标图像生成单元,用于通过所述解码层对所述图像特征值进行解码以生成风格化后的目标图像。
本发明实施例的第三方面提供了一种终端设备,包括:
存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现本发明实施例的第一方面提供的图像处理方法的步骤。
其中,所述计算机程序包括:
图像获取单元,用于获取内容图像以及风格图像;
图像输入单元,用于将所述内容图像和所述风格图像输入至图像处理模型中,其中,所述图像处理模型包括编码层、图像处理层以及解码层;
特征值提取单元,用于通过所述编码层提取所述内容图像的内容特征值以及所述风格图像的风格特征值,并将所述内容特征值及所述风格特征值输入至所述图像处理层;
归一化处理单元,用于通过所述图像处理层对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值;
目标图像生成单元,用于通过所述解码层对所述图像特征值进行解码以生成风格化后的目标图像。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理器执行时实现本发明实施例的第一方面提供的图像处理方法的步骤。
其中,所述计算机程序包括:
图像获取单元,用于获取内容图像以及风格图像;
图像输入单元,用于将所述内容图像和所述风格图像输入至图像处理模型中,其中,所述图像处理模型包括编码层、图像处理层以及解码层;
特征值提取单元,用于通过所述编码层提取所述内容图像的内容特征值以及所述风格图像的风格特征值,并将所述内容特征值及所述风格特征值输入至所述图像处理层;
归一化处理单元,用于通过所述图像处理层对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值;
目标图像生成单元,用于通过所述解码层对所述图像特征值进行解码以生成风格化后的目标图像。
本发明实施例与现有技术相比存在的有益效果是:通过获取内容图像以及风格图像,并将该内容图像和该风格图像输入至图像处理模型中,其中,该图像处理模型包括编码层、图像处理层以及解码层;然后通过该编码层提取该内容图像的内容特征值以及该风格图像的风格特征值,并将该内容特征值及该风格特征值输入至图像处理层,再通过该图像处理层对内容特征值和风格特征值进行归一化处理,得到风格化的图像特征值,再通过解码层对该图像特征值进行解码以生成风格化后的目标图像,从而降低了图像迁移所需耗费的时间,提高了图像迁移的效率,使得用户体验更好。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种图像处理方法的实现流程图;
图2是本发明实施例提供的一种根据图像处理确认指令生成目标图像的方法的具体实现流程图;
图3是本发明实施例提供的一种生成预览图像的方法的具体实现流程图;
图4是本发明实施例提供的一种生成风格化后的目标图像的方法的具体实现流程图;
图5是本发明实施例提供的一种根据场景分类查找对应的风格图像的方法的具体实现流程图;
图6是本发明实施例提供的进行风格化处理过程中的不同图像,其中,图 6(1)是风格图像,图6(2)是内容图像,图6(3)是风格化后的目标图像;
图7是本发明实施例提供的一种图像处理装置的示意图;
图8是本发明实施例提供的一种终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、系统、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。请参考图1,图1示出了本发明实施例提供的一种图像处理方法的实现流程,详述如下:
在步骤S101中,获取内容图像以及风格图像。
在本发明实施例中,内容图像和风格图像包括但不限于人们在日常生活中拍摄的图像、在杂志上的时尚大片、画展中所展示的一幅画、漫画插画,甚至有孩子的涂鸦,一颗小草,即任意图像的风格都可以作为图像处理的对象,从而丰富了风格使用的场景,提高了用户的使用兴趣,增加了用户粘性。
在步骤S102中,将所述内容图像和所述风格图像输入至图像处理模型中。
在本发明实施例中,图像处理模型为基于神经网络模型所构建的图像处理网络模型,包括编码层、图像处理层以及解码层。通过图像处理模型实现将风格图像的风格迁移至内容图像中,使得内容图像的风格变换为风格图像的风格,呈现出与其原始风格不一样的其他风格,从而呈现出不同美感的图像,满足了人们对图像艺术的多样化需求。
在这里,神经网络模型包括但不限于卷积神经网络CNN(Convolutional NeuralNetwork)、残差网络ResNet(Residual Network)、VGGNet(Visual Geometry Group)、循环神经网络RNN(recurrent neural network)等网络模型。
在步骤S103中,通过所述编码层提取所述内容图像的内容特征值以及所述风格图像的风格特征值,并将所述内容特征值及所述风格特征值输入至所述图像处理层。
在本发明实施例中,通过图像处理模型中的编码层提取内容图像的内容特征值以及风格图像的风格特征值。
其中,内容特征值具体为对图像中所有物体的内容,比如物体的形象或者结构,进行量化后得到的特征值。在这里,内容特征值中不包括该图像中所有物体的色彩、光线、线条等进行量化后得到的特征值。
风格特征值具体为对图像中的线条粗细、色彩、光线等特征进行量化后得到的特征值。
在这里,对内容图像的内容特征值和对风格图像的风格特征值的提取,是通过具有相同结构的神经网络模型来进行提取的,以保证数据的唯一性和统一性,方便后续数据的量化处理。
在这里,在进行图像处理之前,将具有不同风格的内容图像输入至图像处理模型以对图像处理模型进行训练,从而使得该图像处理模型对应不同的风格图像的风格时其各个参数具有不同的参数值,从而能够实现对同一内容图像实现不同风格的迁移,使得该内容图像能够呈现出不同于其原始风格的其他风格。
在步骤S104中,通过所述图像处理层对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值。
在本发明实施例中,根据预设函数对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值;
其中,所述预设函数A(x,y)具体为:
A(x,y)=σ(y)(x-μ(x)/σ(x))+μ(y);
其中,x为内容特征值;x为风格特征值;μ(x)为所述内容特征值的均值;μ(y)为所述风格特征值的均值;σ(x)为所述内容特征值的方差;σ(y)为所述风格特征值的方差。
在本发明实施例中,内容特征值为通过图像处理模型的编码层对内容图像的内容进行量化后所得到的向量;风格特征值为通过通过图像处理模型的编码层对风格图像的风格进行量化后所得到的向量,在通过预设函数对内容特征值和风格特征值所组成的向量进行归一化处理后,可以得到风格化的图像特征值,从而根据该图像特征值能够有效并快速地实现将风格图像的风格迁移至内容图像中,以使得内容图像的原始风格变换为风格图像的风格。
在步骤S105中,通过所述解码层对所述图像特征值进行解码以生成风格化后的目标图像。
在本发明实施例中,在通过解码层对图像特征值进行解码后,可以得到风格化的目标图像,该目标图像就是将风格图像的风格迁移至内容图像之后所得到的高质量图像,使得内容图像的风格表现为风格图像的风格。
在这里,通过解码层将风格化后的图像特征值还原到像素空间,使得经图像处理处理后能够得到较高图像质量的目标图像。
在这里,目标图像为将内容图像的原始风格变换为风格图像的风格之后所得到的图像,也就是内容图像的图像内容并没有发生变化,但是风格发生了变化,从而使得内容图像呈现出不同于其原始风格的其他风格。
可选的,所述风格图像包括至少一个图像;在步骤S101之后,还包括一种根据图像处理确认指令生成目标图像的实现步骤,请参考图2,图2示出了本发明实施例提供的一种根据图像处理确认指令生成目标图像的具体实现流程,详述如下:
在步骤S201中,在图像预览模式下展示所述内容图像和所述风格图像。
在本发明实施例中,为了提高图像处理的效率,并提高用户的操作效率,在获取到内容图像和多个风格图像后,将在图像预览模式下展示该内容图像和该多个风格图像,以方便用户选择不同风格的风格图像,并在图像预览框中展示由内容图像和所选中的风格图像在进行图像处理之后所得到的图像,从而使得用户能够快速选择自己所喜欢的风格图像。
在步骤S202中,获取用户所选择的目标风格图像,在图像预览框中显示根据所述内容图像和所述目标风格图像得到的风格化后的预览图像,所述目标风格图像为用户所选择的任意一个所述风格图像。
在本发明实施中,由于风格图像存在多个,为了方便用户能够快速预览不同风格图像的风格变换为内容图像的风格之后所展示的图像效果,首先获取用户所选择的目标风格图像,该目标风格图像为用户所选择的任意一个风格图像,在通过图像处理模型对内容图像和用户所选择的目标风格图像进行图像迁移之后得到的风格化后的预览图像。该预览图像用于向用户展示基于不同风格图像的风格对内容图像进行风格变换后所得到的图像,同时在预览模式中展示用于进行图像确认生成的控件,以在用户点击该控件后生成图像确认指令。
在步骤S203中,接收用户输入的图像处理确认指令以根据所述图像处理确认指令生成风格化后的目标图像。
在本发明实施例中,图像处理确认指令用于确定按照当前所选定的目标风格图像和内容图像进行图像处理的指令,即确定将内容图像的风格变换为风格图像的风格。
在这里,由于进行图像预览时对图像的像素要求不高,如果直接根据预览模式下的图像生成第一图像,所得到的图像质量较差,不能满足人们对图像质量的需求,因而在确定根据图像确认指令生成第一图像后,还需继续执行步骤 S102至步骤S105,以得到较高图像质量的图像。
可选的,为了提高图像预览及预览图像生成的效率,步骤S202中还包括一种生成预览图像的具体实现步骤,请参考图3,图3示出了本发明实施例提供的一种生成预览图像的具体实现流程,详述如下:
在步骤S301中,对所述内容图像和所述风格图像进行图像预处理。
在本发明实施例中,图像预处理包括但不限于对图像进行像素降维处理,以得到较低像素的图像,以及对图像进行尺寸缩小处理,以得到较小尺寸的图像,以改变内容图像和风格图像的像素或者大小,从而使得图像处理效率更高,能够快速地展示预览图像。
在这里,在对图像进行图像预处理后,由于所需要处理的像素数据较小,从而提高了图像处理的效率,从而可以在图像预览框中快速地展示进行风格迁移后得到的图像。
在步骤S302中,将经预处理后的内容图像和风格图像输入至图像处理模型中。
在本发明实施例中,由于对内容图像和风格图像进行了预处理,使得图像像素降低或尺寸减小,从而进一步提高了图像处理模型的迁移效率。
在步骤S303中,通过所述编码层提取经预处理后的内容图像的内容特征值以及经预处理后的风格图像的风格特征值,并将所述内容特征值及所述风格特征值输入至所述图像处理层。
在本发明实施例中,通过图像处理模型的编码层提取经预处理后的内容图像的内容特征值以及经预处理后的风格图像的风格特征值,由于对内容图像和风格图像进行了预处理,使得图像像素降低或尺寸减小,从而使得提取的效率相应地提高了。
在步骤S304中,通过所述图像处理层对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值。
在本发明实施例中,步骤S304的具体实现可以参考步骤S104,两者不相同的仅是图像的内容特征值和风格特征值,这里的不同只要是指两者所含数据量的大小。
在步骤S305中,通过所述解码层对所述图像特征值进行解码以生成风格化后的预览图像。
在本发明实施例中,在图像预览模式下,通过对内容图像和风格图像进行预处理以提高预览生成的效率,使得用户能够快速预览到对内容图像进行不同风格迁移后所得到的图像,从而选择自己所喜欢的风格图像,使得用户体验更好。
可选的,在本发明的另一具体实施例中,所述风格图像为N个风格图像,所述N为大于1的正整数,请参考图4,图4示出了本发明实施例提供的一种生成风格化后的目标图像的具体实现流程,详述如下:
在步骤S401中,通过所述编码层提取所述风格图像的风格特征值,得到由N个风格特征值所组成的风格特征值数据集。
在本发明实施例中,通过图像处理模型中的编码层分别对风格图像中的每一个风格图像进行风格特征提取,得到N个不同的风格特征值,该N个不同的风格特征值组成了风格特征值数据集。
在步骤S402中,对所述内容特征值和所述风格特征值数据集中的每一个风格特征值进行归一化处理,得到风格化的图像特征值。
在本发明实施例中,上述图像特征值为融合了内容特征值和N个不同的风格特征值的图像特征值,即该图像特征值中包含了融合之后的N个不同的风格特征值所形成的不同于该N个不同的风格特征值的风格特征值。
在步骤S403中,通过所述解码层对所述图像特征值进行解码以生成风格化后的目标图像。
在本发明实施例,在通过解码层将上述得到的图像特征值进行解码还原到像素空间之后,生成了融合有多种风格的目标图像,该目标图像当前的风格与内容图像以及所有风格图像的风格均不相同,呈现出另外一种风格,从而提供了多样化的图像风格,满足了人们对图像风格的多样化需求,使得用户体验更好。
可选的,在步骤S101中,还包括根据内容图像的场景分类查找对应的风格图像的具体实现步骤,请参考图5,图5示出了本发明实施例提供的一种根据内容图像的场景分类查找对应的风格图像的具体实现流程,详述如下:
在步骤S501中,获取所述内容图像,并对所述内容图像进行场景分类。
在本发明实施例中,在用户选择其要进行图像风格变换的内容图像后,图像处理装置获取到该内容图像,通过场景识别算法对内容图像中的场景进行场景分类,这里所指的场景分类包括但不限于人物、风景、食物、水果、海洋、山川、日落等场景。
在这里,步骤S501具体为:
获取所述内容图像,并通过图像处理模型对所述内容图像进行场景分类。
可选的,为了加快对内容图像进行场景分类的效率,在获取内容图像之后,还包括对该内容图像进行预处理的过程,以降低内容图像的像素或者减小内容图像的尺寸,从而能够快速地根据经预处理后的内容图像的内容对内容图像进行场景分类。
可以理解的是,图像的像素越低,或者图像的尺寸越小,图像处理的速度越快。
在步骤S502中,根据经场景分类后的内容图像,从数据库中查找并获取对应的风格图像。
在本发明实施例中,在对内容图像进行分类后,得到内容图像的场景分类信息,根据该场景分类信息从数据库中查找具有相同场景分类的风格图像,或者根据与该场景分类信息相关联的预设推荐信息查找对应的风格图像,比如内容图像的场景分类信息为人物,与该场景分类信息相关联的预设推荐信息为推荐素描风格的图像,这时,图像处理装置就从数据库中查找素描风格的图像并展示给用户以供用户进行选择。
在这里,通过场景分类对内容图像的内容进行分析后向用户推荐适合其内容的风格的风格图像,使得用户能够快速地选择适合内容图像的风格的风格图像进行风格变换,节省了用户选择的时间,使得用户体验更好。
可选的,在步骤S105之后,还包括:
将所述目标图像上传至预设数据库。
在本发明实施例中,通过将目标图像上传至预设数据库中,使得人们能够快速地分享该目标图像。
这里所指的预设数据库包括但不限于本地数据库、社交平台数据库比如微信、QQ等等。
可选的,在步骤S105之后,还包括:
对所述目标图像进行自适应调整。
在本发明实施例中,这里所指的自适应调整具体为对图像的亮度、对比度、饱和度和清晰度进行调整,以达到最佳的处理效果,得到图像质量较高的目标图像。
在步骤S302中,提取经预处理后的第一原始图像的第二内容特征值。
在本发明实施例中,通过神经网络模型的编码模型提取经预处理后的第一原始图像的第二内容特征值,由于对第一原始图像进行了预处理,使得图像像素降低或尺寸减小,从而使得提取的效率相应地提高了。
在步骤S303中,提取经预处理后的目标图像的第二风格特征值。
请参考图6,在一个应用场景中,在获取如图6(1)所示的风格图像和图 6(2)所示的内容图像后,将它们输入到图像处理模型后,通过图像处理模型中的编码层提取该内容图像的内容特征值以及该风格图像的风格特征值,并将该内容特征值及该风格特征值输入至图像处理层,再通过该图像处理层对内容特征值和风格特征值进行归一化处理,得到风格化的图像特征值,再通过解码层对该图像特征值进行解码以生成风格化后的如图6(3)所示的目标图像。
在本发明实施例中,通过获取内容图像以及风格图像,并将该内容图像和该风格图像输入至图像处理模型中,其中,该图像处理模型包括编码层、图像处理层以及解码层;然后通过该编码层提取该内容图像的内容特征值以及该风格图像的风格特征值,并将该内容特征值及该风格特征值输入至图像处理层,再通过该图像处理层对内容特征值和风格特征值进行归一化处理,得到风格化的图像特征值,再通过解码层对该图像特征值进行解码以生成风格化后的目标图像,从而降低了图像迁移所需耗费的时间,提高了图像迁移的效率,使得用户体验更好。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑控制,而不应对本发明实施例的实施过程构成任何限定。
对应于上文实施例所述的一种图像处理方法,图6示出了本发明实施例提供的一种图像处理装置的示意图,为了便于说明,仅示出了与本发明实施例相关的部分。
参照图7,该装置包括:
图像获取单元71,用于获取内容图像以及风格图像;
图像输入单元72,用于将所述内容图像和所述风格图像输入至图像处理模型中,其中,所述图像处理模型包括编码层、图像处理层以及解码层;
特征值提取单元73,用于通过所述编码层提取所述内容图像的内容特征值以及所述风格图像的风格特征值,并将所述内容特征值及所述风格特征值输入至所述图像处理层;
归一化处理单元74,用于通过所述图像处理层对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值;
目标图像生成单元75,用于通过所述解码层对所述图像特征值进行解码以生成风格化后的目标图像。
可选的,所述风格图像包括至少一个图像;所述装置还包括:
图像预览单元,用于在图像预览模式下展示所述内容图像和所述风格图像;
预览图像生成单元,用于获取用户所选择的目标风格图像,在图像预览框中显示根据所述内容图像和所述目标风格图像得到的风格化后的预览图像,所述目标风格图像为用户所选择的任意一个所述风格图像;
图像处理确认指令接收单元,用于接收用户输入的图像处理确认指令以根据所述图像处理确认指令生成风格化后的目标图像。
可选的,所述预览图像生成单元包括:
图像预处理子单元,用于对所述内容图像和所述风格图像进行图像预处理;
图像输入子单元,用于将经预处理后的内容图像和风格图像输入至图像处理模型中;
第一特征值提取子单元,用于通过所述编码层提取经预处理后的内容图像的内容特征值以及经预处理后的风格图像的风格特征值,并将所述内容特征值及所述风格特征值输入至所述图像处理层;
第一归一化处理子单元,用于通过所述图像处理层对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值;
预览图像生成子单元,用于通过所述解码层对所述图像特征值进行解码以生成风格化后的预览图像。
可选的,所述风格图像为N个风格图像,所述N为大于1的正整数,所述第一特征值提取子单元包括:
第二特征值提取子单元,用于通过所述编码层提取所述风格图像的风格特征值,得到由N个风格特征值所组成的风格特征值数据集;
第二归一化处理子单元,用于对所述内容特征值和所述风格特征值数据集中的每一个风格特征值进行归一化处理,得到风格化的图像特征值;
目标图像生成子单元,用于通过所述解码层对所述图像特征值进行解码以生成风格化后的目标图像。
可选的,所述图像获取单元71包括:
图像分类子单元,用于获取所述内容原始图像,并对所述内容图像进行场景分类;
图像查找子单元,用于根据经场景分类后的内容图像,从数据库中查找并获取对应的风格图像。
可选的,所述归一化处理单元74具体用于:
根据预设函数对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值;
其中,所述预设函数A(x,y)具体为:
A(x,y)=σ(y)(x-μ(x)/σ(x))+μ(y);
其中,x为内容特征值;x为风格特征值;μ(x)为所述内容特征值的均值;μ(y)为所述风格特征值的均值;σ(x)为所述内容特征值的方差;σ(y)为所述风格特征值的方差。
可选的,所述装置还包括:
图像上传单元,用于将所述目标图像上传至预设数据库。
在本发明实施例中,通过获取内容图像以及风格图像,并将该内容图像和该风格图像输入至图像处理模型中,其中,该图像处理模型包括编码层、图像处理层以及解码层;然后通过该编码层提取该内容图像的内容特征值以及该风格图像的风格特征值,并将该内容特征值及该风格特征值输入至图像处理层,再通过该图像处理层对内容特征值和风格特征值进行归一化处理,得到风格化的图像特征值,再通过解码层对该图像特征值进行解码以生成风格化后的目标图像,从而降低了图像迁移所需耗费的时间,提高了图像迁移的效率,使得用户体验更好。
图8是本发明一实施例提供的一种终端设备的示意图。如图8所示,该实施例的终端设备8包括:处理器80、存储器81以及存储在所述存储器81中并可在所述处理器80上运行的计算机程序82。所述处理器80执行所述计算机程序82时实现上述各个图像处理方法实施例中的步骤,例如图1所示的步骤101 至105。或者,所述处理器80执行所述计算机程序82时实现上述各系统实施例中各单元的功能,例如图7所示模块71至75的功能。
示例性的,所述计算机程序82可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器81中,并由所述处理器80执行,以完成本发明。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序82在所述终端设备8中的执行过程。例如,所述计算机程序82可以被分割成图像获取单元71、图像输入单元72、特征值提取单元73、归一化处理单元74、目标图像生成单元75,各单元具体功能如下:
图像获取单元71,用于获取内容图像以及风格图像;
图像输入单元72,用于将所述内容图像和所述风格图像输入至图像处理模型中,其中,所述图像处理模型包括编码层、图像处理层以及解码层;
特征值提取单元73,用于通过所述编码层提取所述内容图像的内容特征值以及所述风格图像的风格特征值,并将所述内容特征值及所述风格特征值输入至所述图像处理层;
归一化处理单元74,用于通过所述图像处理层对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值;
目标图像生成单元75,用于通过所述解码层对所述图像特征值进行解码以生成风格化后的目标图像。
可选的,所述风格图像包括至少一个图像;所述计算机程序82还可以被分割成图像预览单元、预览图像生成单元、图像处理确认指令接收单元,各单元具体功能如下:
图像预览单元,用于在图像预览模式下展示所述内容图像和所述风格图像;
预览图像生成单元,用于获取用户所选择的目标风格图像,在图像预览框中显示根据所述内容图像和所述目标风格图像得到的风格化后的预览图像,所述目标风格图像为用户所选择的任意一个所述风格图像;
图像处理确认指令接收单元,用于接收用户输入的图像处理确认指令以根据所述图像处理确认指令生成风格化后的目标图像。
可选的,所述预览图像生成单元包括:
图像预处理子单元,用于对所述内容图像和所述风格图像进行图像预处理;
图像输入子单元,用于将经预处理后的内容图像和风格图像输入至图像处理模型中;
第一特征值提取子单元,用于通过所述编码层提取经预处理后的内容图像的内容特征值以及经预处理后的风格图像的风格特征值,并将所述内容特征值及所述风格特征值输入至所述图像处理层;
第一归一化处理子单元,用于通过所述图像处理层对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值;
预览图像生成子单元,用于通过所述解码层对所述图像特征值进行解码以生成风格化后的预览图像。
可选的,所述风格图像为N个风格图像,所述N为大于1的正整数,所述第一特征值提取子单元包括:
第二特征值提取子单元,用于通过所述编码层提取所述风格图像的风格特征值,得到由N个风格特征值所组成的风格特征值数据集;
第二归一化处理子单元,用于对所述内容特征值和所述风格特征值数据集中的每一个风格特征值进行归一化处理,得到风格化的图像特征值;
目标图像生成子单元,用于通过所述解码层对所述图像特征值进行解码以生成风格化后的目标图像。
可选的,所述图像获取单元71包括:
图像分类子单元,用于获取所述内容原始图像,并对所述内容图像进行场景分类;
图像查找子单元,用于根据经场景分类后的内容图像,从数据库中查找并获取对应的风格图像。
可选的,所述归一化处理单元74具体用于:
根据预设函数对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值;
其中,所述预设函数A(x,y)具体为:
A(x,y)=σ(y)(x-μ(x)/σ(x))+μ(y);
其中,x为内容特征值;x为风格特征值;μ(x)为所述内容特征值的均值;μ(y)为所述风格特征值的均值;σ(x)为所述内容特征值的方差;σ(y)为所述风格特征值的方差。
可选的,所述计算机程序82还可以被分割成图像上传单元,该单元具体功能如下:
图像上传单元,用于将所述目标图像上传至预设数据库。
所述终端设备8可以是智能手机、IPad、平板电脑、笔记本电脑、桌上型电脑等终端设备。所述终端设备8可包括,但不仅限于,处理器80、存储器81。本领域技术人员可以理解,图8仅仅是终端设备8的示例,并不构成对终端设备8的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端还可以包括输入输出设备、网络接入设备、总线等。
所称处理器80可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器81可以是所述终端设备8的内部存储单元,例如终端设备8 的硬盘或内存。所述存储器81也可以是所述终端设备8的外部存储设备,例如所述终端设备8上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器81还可以既包括所述终端设备8的内部存储单元也包括外部存储设备。所述存储器81用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述存储器81还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述系统的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的系统/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的系统/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,系统或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或系统、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种图像处理方法,其特征在于,所述方法包括:
获取内容图像以及风格图像;
将所述内容图像和所述风格图像输入至图像处理模型中,其中,所述图像处理模型包括编码层、图像处理层以及解码层;
通过所述编码层提取所述内容图像的内容特征值以及所述风格图像的风格特征值,并将所述内容特征值及所述风格特征值输入至所述图像处理层;
通过所述图像处理层对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值;
通过所述解码层对所述图像特征值进行解码以生成风格化后的目标图像。
2.如权利要求1所述的方法,其特征在于,所述风格图像包括至少一个图像;在所述获取内容图像以及风格图像的步骤之后,包括:
在图像预览模式下展示所述内容图像和所述风格图像;
获取用户所选择的目标风格图像,在图像预览框中显示根据所述内容图像和所述目标风格图像得到的风格化后的预览图像,所述目标风格图像为用户所选择的任意一个所述风格图像;
接收用户输入的图像处理确认指令以根据所述图像处理确认指令生成风格化后的目标图像。
3.如权利要求2所述的方法,其特征在于,所述获取用户所选择的目标风格图像,在图像预览框中显示根据所述内容图像和所述目标风格图像得到的风格化后的预览图像的步骤,包括:
对所述内容图像和所述风格图像进行图像预处理;
将经预处理后的内容图像和风格图像输入至图像处理模型中;
通过所述编码层提取经预处理后的内容图像的内容特征值以及经预处理后的风格图像的风格特征值,并将所述内容特征值及所述风格特征值输入至所述图像处理层;
通过所述图像处理层对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值;
通过所述解码层对所述图像特征值进行解码以生成风格化后的预览图像。
4.如权利要求1所述的方法,其特征在于,所述风格图像为N个风格图像,所述N为大于1的正整数,所述通过所述编码层提取所述内容图像的内容特征值以及所述风格图像的风格特征值的步骤,包括:
通过所述编码层提取所述风格图像的风格特征值,得到由N个风格特征值所组成的风格特征值数据集;
对所述内容特征值和所述风格特征值数据集中的每一个风格特征值进行归一化处理,得到风格化的图像特征值;
通过所述解码层对所述图像特征值进行解码以生成风格化后的目标图像。
5.如权利要求1至4任一所述的方法,其特征在于,所述获取内容图像以及风格图像的步骤,包括:
获取所述内容原始图像,并对所述内容图像进行场景分类;
根据经场景分类后的内容图像,从数据库中查找并获取对应的风格图像。
6.如权利要求1至4任一所述的方法,其特征在于,所述对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值的步骤,包括:
根据预设函数对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值;
其中,所述预设函数A(x,y)具体为:
A(x,y)=σ(y)(x-μ(x)/σ(x))+μ(y);
其中,x为内容特征值;x为风格特征值;μ(x)为所述内容特征值的均值;μ(y)为所述风格特征值的均值;σ(x)为所述内容特征值的方差;σ(y)为所述风格特征值的方差。
7.一种图像处理装置,其特征在于,所述装置包括:
图像获取单元,用于获取内容图像以及风格图像;
图像输入单元,用于将所述内容图像和所述风格图像输入至图像处理模型中,其中,所述图像处理模型包括编码层、图像处理层以及解码层;
特征值提取单元,用于通过所述编码层提取所述内容图像的内容特征值以及所述风格图像的风格特征值,并将所述内容特征值及所述风格特征值输入至所述图像处理层;
归一化处理单元,用于通过所述图像处理层对所述内容特征值和所述风格特征值进行归一化处理,得到风格化的图像特征值;
目标图像生成单元,用于通过所述解码层对所述图像特征值进行解码以生成风格化后的目标图像。
8.如权利要求7所述的装置,其特征在于,所述风格图像包括至少一个图像;所述装置还包括:
图像预览单元,用于在图像预览模式下展示所述内容图像和所述风格图像;
预览图像生成单元,用于获取用户所选择的目标风格图像,在图像预览框中显示根据所述内容图像和所述目标风格图像得到的风格化后的预览图像,所述目标风格图像为用户所选择的任意一个所述风格图像;
图像处理确认指令接收单元,用于接收用户输入的图像处理确认指令以根据所述图像处理确认指令生成风格化后的目标图像。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述图像处理方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述图像处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811630574.1A CN111383289A (zh) | 2018-12-29 | 2018-12-29 | 图像处理方法、装置、终端设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811630574.1A CN111383289A (zh) | 2018-12-29 | 2018-12-29 | 图像处理方法、装置、终端设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111383289A true CN111383289A (zh) | 2020-07-07 |
Family
ID=71217160
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811630574.1A Pending CN111383289A (zh) | 2018-12-29 | 2018-12-29 | 图像处理方法、装置、终端设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111383289A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112241941A (zh) * | 2020-10-20 | 2021-01-19 | 北京字跳网络技术有限公司 | 获取图像的方法、装置、设备和计算机可读介质 |
CN113052757A (zh) * | 2021-03-08 | 2021-06-29 | Oppo广东移动通信有限公司 | 图像处理方法、装置、终端及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180082407A1 (en) * | 2016-09-22 | 2018-03-22 | Apple Inc. | Style transfer-based image content correction |
US20180082715A1 (en) * | 2016-09-22 | 2018-03-22 | Apple Inc. | Artistic style transfer for videos |
CN107948529A (zh) * | 2017-12-28 | 2018-04-20 | 北京麒麟合盛网络技术有限公司 | 图像处理方法及装置 |
US20180158224A1 (en) * | 2015-07-31 | 2018-06-07 | Eberhard Karls Universitaet Tuebingen | Method and device for image synthesis |
CN108734653A (zh) * | 2018-05-07 | 2018-11-02 | 商汤集团有限公司 | 图像风格转换方法及装置 |
CN108765278A (zh) * | 2018-06-05 | 2018-11-06 | Oppo广东移动通信有限公司 | 一种图像处理方法、移动终端及计算机可读存储介质 |
-
2018
- 2018-12-29 CN CN201811630574.1A patent/CN111383289A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180158224A1 (en) * | 2015-07-31 | 2018-06-07 | Eberhard Karls Universitaet Tuebingen | Method and device for image synthesis |
US20180082407A1 (en) * | 2016-09-22 | 2018-03-22 | Apple Inc. | Style transfer-based image content correction |
US20180082715A1 (en) * | 2016-09-22 | 2018-03-22 | Apple Inc. | Artistic style transfer for videos |
CN107948529A (zh) * | 2017-12-28 | 2018-04-20 | 北京麒麟合盛网络技术有限公司 | 图像处理方法及装置 |
CN108734653A (zh) * | 2018-05-07 | 2018-11-02 | 商汤集团有限公司 | 图像风格转换方法及装置 |
CN108765278A (zh) * | 2018-06-05 | 2018-11-06 | Oppo广东移动通信有限公司 | 一种图像处理方法、移动终端及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
HUANG X ET AL: "ARBITRARY STYLE TRANSFER IN REAL-TIME WITH ADAPTIVE INSTANCE NORMALIZATION", 《2017 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112241941A (zh) * | 2020-10-20 | 2021-01-19 | 北京字跳网络技术有限公司 | 获取图像的方法、装置、设备和计算机可读介质 |
CN112241941B (zh) * | 2020-10-20 | 2024-03-22 | 北京字跳网络技术有限公司 | 获取图像的方法、装置、设备和计算机可读介质 |
CN113052757A (zh) * | 2021-03-08 | 2021-06-29 | Oppo广东移动通信有限公司 | 图像处理方法、装置、终端及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110503703B (zh) | 用于生成图像的方法和装置 | |
CN108734653B (zh) | 图像风格转换方法及装置 | |
CN107920202B (zh) | 基于增强现实的视频处理方法、装置及电子设备 | |
CN112602088B (zh) | 提高弱光图像的质量的方法、系统和计算机可读介质 | |
CN114331820A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN114529490B (zh) | 一种数据处理方法、装置、设备以及可读存储介质 | |
CN111383232A (zh) | 抠图方法、装置、终端设备及计算机可读存储介质 | |
CN112102422B (zh) | 图像处理方法及装置 | |
WO2023056835A1 (zh) | 视频封面生成方法、装置、电子设备及可读介质 | |
CN116205820A (zh) | 图像增强方法、目标识别方法、设备及介质 | |
CN110516598B (zh) | 用于生成图像的方法和装置 | |
CN111967397A (zh) | 人脸影像处理方法和装置、存储介质和电子设备 | |
CN111383289A (zh) | 图像处理方法、装置、终端设备及计算机可读存储介质 | |
US11887277B2 (en) | Removing compression artifacts from digital images and videos utilizing generative machine-learning models | |
CN114170472A (zh) | 图像处理方法、可读存储介质及计算机终端 | |
Cai et al. | A structure-preserving and illumination-consistent cycle framework for image harmonization | |
CN112200817A (zh) | 基于图像的天空区域分割和特效处理方法、装置及设备 | |
CN112102200A (zh) | 图像补全模型初始化方法、训练方法和图像补全方法 | |
CN114004750A (zh) | 图像处理方法、装置和系统 | |
CN115953597B (zh) | 图像处理方法、装置、设备及介质 | |
EP4047547A1 (en) | Method and system for removing scene text from images | |
CN116051593A (zh) | 服装图像提取方法及其装置、设备、介质、产品 | |
US20230131418A1 (en) | Two-dimensional (2d) feature database generation | |
CN114782249A (zh) | 一种图像的超分辨率重建方法、装置、设备以及存储介质 | |
CN113989404A (zh) | 图片处理方法、装置、设备、存储介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200707 |