CN109636764A - 一种基于深度学习与显著性检测的图像风格转移方法 - Google Patents

一种基于深度学习与显著性检测的图像风格转移方法 Download PDF

Info

Publication number
CN109636764A
CN109636764A CN201811294280.6A CN201811294280A CN109636764A CN 109636764 A CN109636764 A CN 109636764A CN 201811294280 A CN201811294280 A CN 201811294280A CN 109636764 A CN109636764 A CN 109636764A
Authority
CN
China
Prior art keywords
image
style
content
saliency maps
conspicuousness
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811294280.6A
Other languages
English (en)
Inventor
刘志
刘秀文
陈敏昱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN201811294280.6A priority Critical patent/CN109636764A/zh
Publication of CN109636764A publication Critical patent/CN109636764A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于深度学习与显著性检测的图像风格转移方法。其具体步骤是:(1)、输入内容图像和风格图像;(2)、利用风格转移的方法生成转换图像;(3)、利用显著性模型计算出内容图像的显著性图;(4)、根据显著性图对内容图像和转换图像进行融合,生成融合图像;(5)、根据显著性图确定优化区域,对于优化区域中的像素进行平滑后,生成了一种混合了自然场景与艺术风格的全新形式的输出图像

Description

一种基于深度学习与显著性检测的图像风格转移方法
技术领域
本发明涉及图像,视频处理技术领域,具体地说是涉及一种基于深度学习与显著性检测的图像风格转移方法。
背景技术
近年来,深度学习开始越来越广泛地应用到社会各个领域。这其中,人工智能与艺术的结合,不仅在相关的技术领域和艺术领域引起了很高的关注,以相关的技术为基础开发的各种图像处理软件也层出不穷,并且在短时间内吸引了大量用户的注意。在这些软件中,最核心的技术就是基于深度学习的风格转移技术。另外一方面,深度学习在显著性检测的应用上也取得了巨大的成功。显著性检测是用来检测一张图像显著区域的方法。它被用在很多应用中,例如显著性物体分割和检测、基于内容的图像或视频压缩和图像编辑等等。
现有技术中已经有许多关于风格转移的工作。2016年,Gatys等人提出了一种基于深度学习的风格转移方法,这个方法利用训练好的深度卷积神经网络(例如VGG19)提取出来的语义特征来构造可以代表图像风格的格拉姆矩阵。同年,李飞飞等人提出了用一个简化版的“感知损失函数”计算图像之间的相似性的方法来加速风格转移的速度,但是速度加快的同时这个方法有一定局限性,即不能转移训练集以外的风格图像。为了解决这个局限,Chen,T.Q.提出了一个优化的方法可以实现图像的任意风格转换,不再局限于单个风格的训练,基于局部匹配的方法,在与训练好的网络的单独一层上,将内容与风格结合起来。但是这些方法基本上都是对整张图像进行风格转移。2017年,Carlos Castillo等人提出了一个对于目标区域进行风格转移的方法,这个方法会对于用户选择的物体进行分割以及风格转移,但这种方法还是需要手动地去选择需要改变的区域。
发明内容
本发明的目的在于针对已有风格转移的技术中存在的不足和缺陷,提出一种基于深度学习与显著性检测的图像风格转移方法,该方法能够实现自动感知的语义级的风格转移。
为了达到上述目的,本发明采用的技术方案如下:
一种基于深度学习与显著性检测的图像风格转移方法,具体步骤如下:
(1)、输入内容图像C和风格图像S;
(2)、利用风格转移方法生成转换图像T;
(3)、利用显著性模型计算出内容图像的显著性图M;
(4)、根据显著性图M对内容图像C和转换图像T进行融合,生成融合结果F;
(5)、根据显著性图M确定优化区域,对于优化区域中的像素进行平滑后,生成最后的输出图像O。
上述步骤(2)所述获取转换图像T的具体步骤如下:
(2-1)、对于风格图像S,计算能代表图像风格的格拉姆矩阵G:
其中l代表深度卷积神经网络的第l层,代表输入图像的在第l层相对应的特征,其中的每一列代表一张矢量化的特征图,Nl则表示第l层特征图的数目;
(2-2)、为了生成一张新的转换图像T,既拥有与内容图像C相似的深度特征,同时又具备从风格图像S中提取出的风格信息,由最小化下面的能量公式所实现:
其中,
其中L是卷积层的总数,Ml是每一张特征图的长宽之积,Gl是矢量特征图的内积,代表了风格图像S的信息,αl和βl是每一层对于总的损失函数来说的权重因子,Γ是用来平衡风格与内容的权重;为了获得转换图像,用向前传播的方式计算总的损失函数的导数,这个导数值将被用来迭代更新转换图像,直到转换图像满足既有内容图像的内容信息又有风格图像的风格信息,将此时生成的转换图像记作T。
上述步骤(3)用显著性模型生成显著性图M,具体步骤如下:
(3-1)、首先利用现有的图像分类网络VGG16,提取原始图像的五层卷积特征;由于卷积层之间进行了池化操作,不同卷积层的特征图尺寸大小不一,将五层卷积特征分别通过卷积和反卷积操作,归一化为五种不同的分辨率,并在每种分辨率下进行串联融合;
(3-2)、将五种不同分辨率的融合特征反卷积为原始图像的尺寸,结合比本分辨率小一个尺度的分辨率下的预测结果,得到五张初始的显著性预测结果;
(3-3)、融合初始的显著性预测结果,得到最终的显著性图M。
上述步骤(4)中的对图像进行融合的方法,具体步骤如下:
(4-1)、将转换图像T看作是前景图像,内容图像C看作是背景图像,将显著性图M作为参考;
(4-2)、利用显著性图M融合内容图像C和转换图像T,得到融合结果:
F(x,y)=(1-M(x,y))·C(x,y)+M(x,y)·T(x,y)
生成的融合结果记作F。
上述步骤(5)中的对融合结果进行优化的方法,具体步骤如下:
(5-1)、给定显著性图M,通过canny边缘检测的算法获取到图像的边缘,对获取到的边缘进行膨胀,获取优化区域;
(5-2)、在优化区域内,需要使最后输出图像的梯度尽可能地接近内容图像C,在满足这一点的同时,还需要使输出图像的内容与融合结果一致,为了达到这两个条件,需要满足以下公式:
其中,λ是一个平衡内容与梯度的常数权重;
(5-3)、优化以上方程即为解下面的公式:
O-λ▽2O=F-λ▽2C(x,y)
这个目标定义了一组线性方程,用最小二乘法、傅里叶变换或者卷积来解;最后的输出图像记作O。
本发明的基于深度学习与显著性检测的图像风格转移方法与现有的技术相比,具有如下优点:
本发明基于深度学习的方法,利用显著性图实现了全自动的显著目标对象的风格转移,同时还利用显著性对对象边缘的像素进行了平滑,生成了一种混合了自然场景与艺术风格的全新形式的图像。
附图说明
图1是本发明的基于深度学习与显著性检测的图像风格转移方法的流程图。
图2(a)是本发明输入的内容图像C。
图2(b)是本发明输入的风格图像S。
图3是本发明获得的转换图像T。
图4是本发明获得的内容图像的显著性图M。
图5是本发明获得的融合结果F。
图6是本发明得到的优化后的最后输出图像O。
具体实施方式
下面结合说明书附图对本发明的实施例作进一步详细说明。
本发明进行的仿真实验是在CPU为4.0GHz、内存为16G的PC测试平台上编程实现。
如图1所示,本发明的一种基于深度学习与显著性检测的图像风格转移方法,其具体步骤如下:
(1)、输入内容图像C和风格图像S,如图2(a)、图2(b)所示。
(2)、利用风格转移的方法生成转换图像T;
(2-1)、对于风格图像,我们计算能代表图像风格的格拉姆矩阵G:
其中l代表深度卷积神经网络的第l层,代表输入图像的在第l层相对应的特征,其中的每一列代表一张矢量化的特征图,Nl则表示第l层特征图的数目;
(2-2)、为了生成一张新的转换图像,既拥有与内容图像相似的深度特征,同时又具备从风格图像中提取出的风格信息。这由最小化下面的能量公式所实现:
其中,
其中L是卷积层的总数,Ml是每一张特征图的长宽之积,Gl是矢量特征图的内积,代表了风格图像的信息,αl和βl是每一层对于总的损失函数来说的权重因子,Γ是用来平衡风格与内容的权重。为了获得转换图像,用向前传播的方式计算总的损失函数的导数,这个导数值将被用来迭代更新转换图像,直到转换图像满足既有内容图像的内容信息又有风格图像的风格信息,将此时生成的转换图像记作T,如图3所示。
(3)、利用显著性模型计算出内容图像的显著性图M;
(3-1)、首先利用现有的图像分类网络VGG16,提取原始图像的五层卷积特征;由于卷积层之间进行了池化操作,不同卷积层的特征图尺寸大小不一,将五层卷积特征分别通过卷积和反卷积操作,归一化为五种不同的分辨率,并在每种分辨率下进行串联融合;
(3-2)、将五种不同分辨率的融合特征反卷积为原始图像的尺寸,结合比本分辨率小一个尺度的分辨率下的预测结果,得到五张初始的显著性预测结果;
(3-3)、融合初始的显著性预测结果,得到最终的显著性图M,如图4所示。
(4)、根据显著性图M对内容图像C和转换图像T进行融合,生成融合结果F;
(4-1)、将转换图像T看作是前景图像,内容图像C看作是背景图像,将显著性图M作为参考;
(4-2)、利用显著性图M融合内容图像C和转换图像T,得到融合结果:
F(x,y)=(1-M(x,y))·C(x,y)+M(x,y)·T(x,y)
生成的融合结果记作F,如图5所示。
(5)、根据显著性图M确定优化区域,对于优化区域中的像素进行平滑后,生成最后的输出图像O;
(5-1)、给定显著性图M,通过canny边缘检测的算法获取到图像的边缘,对获取到的边缘进行膨胀,获取优化区域;
(5-2)、在优化区域内,需要使最后输出图像的梯度尽可能地接近内容图像,在满足这一点的同时,还需要使输出图像的内容与融合结果一致,为了达到这两个条件,需要满足以下公式:
其中,λ是一个平衡内容与梯度的常数权重;
(5-3)、优化以上方程即为解下面的公式:
O-λ▽2O=F-λ▽2C(x,y)
这个目标定义了一组线性方程,可以用最小二乘法、傅里叶变换或者卷积来解。
最后的输出图像记作O,如图6所示。
从上述实施例结果可以看出,本发明利用显著性图实现了全自动的显著目标对象的风格转移,同时还利用显著性对对象边缘的像素进行了平滑,生成了一种混合了自然场景与艺术风格的全新形式的图像。

Claims (5)

1.一种基于深度学习与显著性检测的图像风格转移方法,其特征在于,具体步骤如下:
(1)、输入内容图像C和风格图像S;
(2)、利用风格转移方法生成转换图像T;
(3)、利用显著性模型计算出内容图像的显著性图M;
(4)、根据显著性图M对内容图像C和转换图像T进行融合,生成融合结果F;
(5)、根据显著性图M确定优化区域,对于优化区域中的像素进行平滑后,生成最后的输出图像O。
2.根据权利要求1所述的基于深度学习与显著性检测的图像风格转移方法,其特征在于,所述步骤(2)所述获取转换图像T的具体步骤如下:
(2-1)、对于风格图像S,计算能代表图像风格的格拉姆矩阵G:
其中l代表深度卷积神经网络的第l层,代表输入图像的在第l层相对应的特征,其中的每一列代表一张矢量化的特征图,Nl则表示第l层特征图的数目;
(2-2)、为了生成一张新的转换图像T,既拥有与内容图像C相似的深度特征,同时又具备从风格图像S中提取出的风格信息,由最小化下面的能量公式所实现:
其中,
其中L是卷积层的总数,Ml是每一张特征图的长宽之积,Gl是矢量特征图的内积,代表了风格图像S的信息,αl和βl是每一层对于总的损失函数来说的权重因子,Γ是用来平衡风格与内容的权重;为了获得转换图像,用向前传播的方式计算总的损失函数的导数,这个导数值将被用来迭代更新转换图像,直到转换图像满足既有内容图像的内容信息又有风格图像的风格信息,将此时生成的转换图像记作T。
3.根据权利要求1所述的基于深度学习与显著性检测的图像风格转移方法,其特征在于,所述步骤(3)用显著性模型生成显著性图M,具体步骤如下:
(3-1)、首先利用现有的图像分类网络VGG16,提取原始图像的五层卷积特征;由于卷积层之间进行了池化操作,不同卷积层的特征图尺寸大小不一,将五层卷积特征分别通过卷积和反卷积操作,归一化为五种不同的分辨率,并在每种分辨率下进行串联融合;
(3-2)、将五种不同分辨率的融合特征反卷积为原始图像的尺寸,结合比本分辨率小一个尺度的分辨率下的预测结果,得到五张初始的显著性预测结果;
(3-3)、融合初始的显著性预测结果,得到最终的显著性图M。
4.根据权利要求1所述的基于深度学习与显著性检测的图像风格转移方法,其特征在于,所述步骤(4)中的对图像进行融合的方法,具体步骤如下:
(4-1)、将转换图像T看作是前景图像,内容图像C看作是背景图像,将显著性图M作为参考;
(4-2)、利用显著性图M融合内容图像C和转换图像T,得到融合结果:
F(x,y)=(1-M(x,y))·C(x,y)+M(x,y)·T(x,y)
生成的融合结果记作F。
5.根据权利要求1所述的基于深度学习与显著性检测的图像风格转移方法,其特征在于,所述步骤(5)中的对融合结果进行优化的方法,具体步骤如下:
(5-1)、给定显著性图M,通过canny边缘检测的算法获取到图像的边缘,对获取到的边缘进行膨胀,获取优化区域;
(5-2)、在优化区域内,需要使最后输出图像的梯度尽可能地接近内容图像C,在满足这一点的同时,还需要使输出图像的内容与融合结果一致,为了达到这两个条件,需要满足以下公式:
其中,λ是一个平衡内容与梯度的常数权重;
(5-3)、优化以上方程即为解下面的公式:
这个目标定义了一组线性方程,用最小二乘法、傅里叶变换或者卷积来解;最后的输出图像记作O。
CN201811294280.6A 2018-11-01 2018-11-01 一种基于深度学习与显著性检测的图像风格转移方法 Pending CN109636764A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811294280.6A CN109636764A (zh) 2018-11-01 2018-11-01 一种基于深度学习与显著性检测的图像风格转移方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811294280.6A CN109636764A (zh) 2018-11-01 2018-11-01 一种基于深度学习与显著性检测的图像风格转移方法

Publications (1)

Publication Number Publication Date
CN109636764A true CN109636764A (zh) 2019-04-16

Family

ID=66067065

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811294280.6A Pending CN109636764A (zh) 2018-11-01 2018-11-01 一种基于深度学习与显著性检测的图像风格转移方法

Country Status (1)

Country Link
CN (1) CN109636764A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110084741A (zh) * 2019-04-26 2019-08-02 衡阳师范学院 基于显著性检测和深度卷积神经网络的图像风络迁移方法
CN110276753A (zh) * 2019-06-20 2019-09-24 兰州理工大学 基于特征空间统计信息映射的目标自适应隐藏方法
CN110796583A (zh) * 2019-10-25 2020-02-14 南京航空航天大学 一种风格化可见水印添加方法
CN110796594A (zh) * 2019-10-28 2020-02-14 腾讯科技(深圳)有限公司 一种图像生成方法、装置及设备
CN111738911A (zh) * 2020-06-17 2020-10-02 杭州云汽配配科技有限公司 图像风格转移方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914834A (zh) * 2014-03-17 2014-07-09 上海交通大学 一种基于前景先验和背景先验的显著性物体检测方法
CN105590319A (zh) * 2015-12-18 2016-05-18 华南理工大学 一种深度学习的图像显著性区域检测方法
CN107274419A (zh) * 2017-07-10 2017-10-20 北京工业大学 一种基于全局先验和局部上下文的深度学习显著性检测方法
CN107481185A (zh) * 2017-08-24 2017-12-15 深圳市唯特视科技有限公司 一种基于视频图像优化的风格转换方法
CN108230243A (zh) * 2018-02-09 2018-06-29 福州大学 一种基于显著性区域检测模型背景虚化方法
CN108470320A (zh) * 2018-02-24 2018-08-31 中山大学 一种基于cnn的图像风格化方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914834A (zh) * 2014-03-17 2014-07-09 上海交通大学 一种基于前景先验和背景先验的显著性物体检测方法
CN105590319A (zh) * 2015-12-18 2016-05-18 华南理工大学 一种深度学习的图像显著性区域检测方法
CN107274419A (zh) * 2017-07-10 2017-10-20 北京工业大学 一种基于全局先验和局部上下文的深度学习显著性检测方法
CN107481185A (zh) * 2017-08-24 2017-12-15 深圳市唯特视科技有限公司 一种基于视频图像优化的风格转换方法
CN108230243A (zh) * 2018-02-09 2018-06-29 福州大学 一种基于显著性区域检测模型背景虚化方法
CN108470320A (zh) * 2018-02-24 2018-08-31 中山大学 一种基于cnn的图像风格化方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LEON A. GATYS ET AL.: "Controlling Perceptual Factors in Neural Style Transfer", 《IEEE》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110084741A (zh) * 2019-04-26 2019-08-02 衡阳师范学院 基于显著性检测和深度卷积神经网络的图像风络迁移方法
CN110276753A (zh) * 2019-06-20 2019-09-24 兰州理工大学 基于特征空间统计信息映射的目标自适应隐藏方法
CN110276753B (zh) * 2019-06-20 2021-07-23 兰州理工大学 基于特征空间统计信息映射的目标自适应隐藏方法
CN110796583A (zh) * 2019-10-25 2020-02-14 南京航空航天大学 一种风格化可见水印添加方法
CN110796594A (zh) * 2019-10-28 2020-02-14 腾讯科技(深圳)有限公司 一种图像生成方法、装置及设备
CN111738911A (zh) * 2020-06-17 2020-10-02 杭州云汽配配科技有限公司 图像风格转移方法及系统
CN111738911B (zh) * 2020-06-17 2024-02-27 杭州云汽配配科技有限公司 图像风格转移方法及系统

Similar Documents

Publication Publication Date Title
CN109299274B (zh) 一种基于全卷积神经网络的自然场景文本检测方法
CN109636764A (zh) 一种基于深度学习与显著性检测的图像风格转移方法
CN111126472B (zh) 一种基于ssd改进的目标检测方法
CN108830912B (zh) 一种深度特征对抗式学习的交互式灰度图像着色方法
CN108961245A (zh) 基于双通道深度并行卷积网络的图像质量分类方法
CN110533084A (zh) 一种基于自注意力机制的多尺度目标检测方法
CN106372648A (zh) 基于多特征融合卷积神经网络的浮游生物图像分类方法
CN108647639A (zh) 实时人体骨骼关节点检测方法
CN110210551A (zh) 一种基于自适应主体敏感的视觉目标跟踪方法
CN107871134A (zh) 一种人脸检测方法及装置
CN109035260A (zh) 一种天空区域分割方法、装置和卷积神经网络
CN107729819A (zh) 一种基于稀疏全卷积神经网络的人脸标注方法
CN110991435A (zh) 一种基于深度学习的快递运单关键信息定位方法和装置
CN108961220B (zh) 一种基于多层卷积特征融合的图像协同显著性检测方法
CN105825502B (zh) 一种基于显著性指导的词典学习的弱监督图像解析方法
CN107993238A (zh) 一种基于注意力模型的头肩部分图像分割方法及装置
CN109492596B (zh) 一种基于K-means聚类和区域推荐网络的行人检测方法及系统
CN110992238A (zh) 一种基于双通道网络的数字图像篡改盲检测方法
CN112348036A (zh) 基于轻量化残差学习和反卷积级联的自适应目标检测方法
CN112507904B (zh) 一种基于多尺度特征的教室人体姿态实时检测方法
CN105718932A (zh) 一种基于果蝇优化算法和光滑孪生支持向量机的彩色图像分类方法与系统
CN108710893A (zh) 一种基于特征融合的数字图像相机源模型分类方法
CN109523558A (zh) 一种人像分割方法及系统
CN107273933A (zh) 一种图像追踪分类器的构建方法及应用其的人脸追踪方法
CN110390673A (zh) 一种监控场景下基于深度学习的香烟自动检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190416

RJ01 Rejection of invention patent application after publication