CN106548208B - 一种照片图像快速智能风格化方法 - Google Patents

一种照片图像快速智能风格化方法 Download PDF

Info

Publication number
CN106548208B
CN106548208B CN201610962162.2A CN201610962162A CN106548208B CN 106548208 B CN106548208 B CN 106548208B CN 201610962162 A CN201610962162 A CN 201610962162A CN 106548208 B CN106548208 B CN 106548208B
Authority
CN
China
Prior art keywords
image
characteristic
style
error
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610962162.2A
Other languages
English (en)
Other versions
CN106548208A (zh
Inventor
伍赛
金海云
张梦丹
庞志飞
柯杨斌
吴参森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU MURUI TECHNOLOGY CO., LTD.
Original Assignee
Hangzhou Micha Science And Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Micha Science And Technology Co Ltd filed Critical Hangzhou Micha Science And Technology Co Ltd
Priority to CN201610962162.2A priority Critical patent/CN106548208B/zh
Publication of CN106548208A publication Critical patent/CN106548208A/zh
Application granted granted Critical
Publication of CN106548208B publication Critical patent/CN106548208B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Abstract

本发明公开了一种照片图像快速智能风格化方法。该方法基于两种神经网络技术:CNN(卷积网络)和RNN(时间递归网络),是一种自动合成风格化照片的方法。该方法通过对特定风格化图像(如梵高风格、毕加索风格、动漫风格)进行迭代学习,产生代表风格材质的神经网络模型,再对输入的照片的内容进行深度学习,从而抽取出代表内容的高级特征,以和训练好的风格材质进行智能融合,最终产生新的风格化图像,从而达到形似和神似的两个目标。

Description

一种照片图像快速智能风格化方法
技术领域
本发明涉及神经网络、深度学习、图像识别领域,特别是涉及到基于神经网络的模式学习和预测。
背景技术
近年来深度学习在图像处理、图像识别领域取得了巨大成功,在人脸识别、图像分类等应用中达到了80%以上的准确率,远远超过传统的机器学习算法(SVM模型、决策树模型)。
然而深度学习的能力不仅仅限于这些目标明确的单一任务,它更重要的部分在于能够模拟人的大脑,产生全新的内容。例如,德国的研究者利用深度学习算法自动谱曲和写词,美国的研究者使用深度学习模型来生成文章。在图像领域,如何使用深度学习来进行绘画创作是另一个火热的研究领域。然而图像作为高维度数据,比文字和声音蕴含更多的信息。如何让机器创造出来既有现实意义,又具有一定的美感的图像是非常具有挑战的课题。
德国的研究者首先提出了使用风格化的方式来实现图像创作,他们将著名画家的风格与用户的照片融合,产生新的图片,效果非常吸引人。然而他们方法的主要问题是速度极慢,一个中等大小的图片(1024*768)需要几十分钟的学习和训练;而一个相对较大的图片(2000*2000)则需要几个小时。因此,该方法无法满足互联网用户在线生成照片的需要。本发明则采用新的神经网络模型,提供接近实时的图像风格化算法。
发明内容
本发明的目的在于针对照片风格化性能方面的不足,提供了一种照片图像快速智能风格化方法。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1、基于多层卷积网络的图像分类网络;
该图像分类网络采用标准的16层VGG网络,每一层包含多个卷积层和ReLU层,负责对图像的内容和材质进行分段抽象,通过反复将卷积层、采样层进行叠加,从而抽取出高层级的图像特征;提取出高层次的语义特征,最终能够准确的识别出图像中包含的物体信息;
步骤2、基于时间递归网络的内容学习模型;
该模型能够抽象出图像中的多粒度信息,该多粒度信息用于图像风格和内容的学习;该模型将图像中每一个点看作是其他若干点时间延续结果,从而构建出一个基于时间递归网络的模型,该模型利用概率分布能够预测出图像在下一行的可能的像素值分布,从而对整个图像的风格和内容形成一个准确的描述;
步骤3、建立风格化训练模块;
该模块负责协调步骤1和步骤2的神经网络模型,从用户选择的图像中抽取出风格信息,用于风格化的图像生成;该模块接受一个风格化图像和一个种子训练图像集合;对于任意一张种子训练图,该模块首先生成一张和该图大小一致的随机图,随机图通过步骤2的时间递归网络抽取出的特征向量再输入到步骤1的分类模型中,在分类模型内计算和风格化图以及种子图的误差,并用梯度下降的方法反馈训练步骤1和步骤2的神经网络;训练过程持续5万次左右,当训练结束,步骤2的神经网络已经包含了该风格化图片的特征信息;
步骤4、风格化图像生成模块;
该模块使用步骤3训练好的时间递归网络进行图像的风格化;对于任意一张输入图像,该模块首先使用一个全连接卷积层将输入图像转化为和训练图一样的高度和宽度,然后在通过步骤2的时间递归网络将输入图像的内容和网络中的风格特性进行融合,融合的结果最终输出为一个新的和输入大小一样的图像。
步骤1具体实现过程如下:
1-1.首先采用64个2*2的内核对原图像进行卷积,卷积的结果为和原图像大小一致的64个特征图像,特征图像通过ReLU层进行数值处理;如此过程连续2次,在通过2*2的最大采样层对图像进行压缩,共得到64个特征图像,特征图像变成原来长宽的一半;
1-2.继续采用64个2*2的内核对步骤1-1获得的特征图像进行卷积,特征图像通过ReLU层进行数值处理;如此过程连续2次,在通过2*2的最大采样层对图像进行压缩,共得到128个特征图像,特征图变成原来长宽的四分之一;
1-3.继续采用64个2*2的内核对步骤1-2获得的特征图像进行卷积,特征图像通过ReLU层进行数值处理;如此过程连续2次,在通过2*2的最大采样层对图像进行压缩,共得到256个特征图像,特征图变成原来长宽的八分之一;
1-4.继续采用64个2*2的内核对步骤1-3获得的特征图像进行卷积,特征图像通过ReLU层进行数值处理;如此过程连续2次,在通过2*2的最大采样层对图像进行压缩,共得到512个特征图像,特征图变成原来长宽的十六分之一;
1-5.采用2*2的最大采样层对图像进行压缩,仍然是512个特征图像,但特征图像变为原图的长宽的三十二分之一;
1-6.将1-5所产生的所有512个特征图像通过一个包含4096个神经元的全连接层,全连接层在连接指向1000个最终的图像分类标签,每一个指向边的权重等于某个图像属于该标签类的概率,最终模型将选择拥有最大概率的标签作为图像的最终分类结果。
步骤2所述的内容学习模型的建立步骤如下:
2-1.为一个像素建立一个神经元,采用窗口为k的时间递归网络,则:代表第i行第j列像素的神经元,其像素值是由来自于第i-1行的第(j-k)/2列到第(j+k)/2列的像素神经元的值进行加权平均,并经过神经网络激活函数而计算得到的;如此能够扫描图像内容,建立一个h层的时间递归网络,每一层拥有w个神经元;其中h为图像高度,w为图像宽度;
2-2.不同于卷积网络,时间递归网络要一层层计算,速度较慢,因此,对2-1建立的h层的时间递归网络进行调整,每一行像素相比上一行向右平移k-1个像素;如此,在计算第j列像素点新值的时候,只需要知道上一行第j列以及第j列之前的像素值即可;因此,能够将2-1建立的h层的时间递归网络转化为一个卷积网络,增加计算速度。
步骤3的具体实现过程如下:
3-1.生成一张全白的和风格化图大小一致的图做为训练图;
3-2.训练图经过步骤2的时间循环网络,产生一张新的生成图,该图即为最终的图Ⅰ和图Ⅱ的融合训练结果;
3-3.生成图和图Ⅰ、图Ⅱ分别经过步骤1的卷积网络,生成的向量进行像素之间的色彩误差计算;生成图和图Ⅰ的误差为风格误差,生成图和图Ⅱ的误差为内容误差,整个的训练结果的目标是最小化风格误差和内容误差之和,这两者的重要程度能够通过权重进行调节;
具体误差公式如下:
其中W、H、C分别表示图像的宽、高以及特征图片的数量,xij表示第i行第j列的像素值,α表示内容和风格的权重;
3-4.将步骤3-3的总误差,即风格误差和内容误差的加权总和通过SGD传递到时间递归网络,误差值函数的导数乘以预先设置的学习率作为修正值,神经元的原值减去修正值作为其新值,来接近达到降低误差的目标;
3-5.采用多个图像作为图Ⅰ内容图输入到网络中,对同一个风格化图进行反复训练,从而达到对该风格的描述网络。
本发明有益效果如下:
本发明提升了图像风格化的速度,支持对超大图片(分辨率1920*1080以上)的实时风格化过程。本发明针对特定的风格化底板图案进行后台学习,将风格化滤镜存储在时间循环网络(RNN)中,然后利用该网络快速的对新图片进行风格化变化。产生的图片风格化效果远高于photoshop、美图秀秀等传统滤镜的风格化,接近神经网络滤镜DeepArt,但速度比DeepArt快100倍以上。
附图说明
图1是本发明实施步骤流程图。
图2是本发明的卷积网络的图像分类模型图。
图3是本发明的基于时间递归网络的模型图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
如图1-3所示,一种照片图像快速智能风格化方法,具体包括如下步骤:
步骤1、基于多层卷积网络的图像分类网络;
1-1.首先采用64个2*2的内核(带边缘补全padding)对原图像进行卷积,卷积的结果为和原图像大小一致的64个特征图像,特征图像通过ReLU层进行数值处理;如此过程连续2次,在通过2*2的最大采样层对图像进行压缩,共得到64个特征图像,特征图像变成原来长宽的一半。
1-2.继续采用64个2*2的内核(带边缘补全padding)对步骤1-1获得的特征图像进行卷积,特征图像通过ReLU层进行数值处理;如此过程连续2次,在通过2*2的最大采样层对图像进行压缩,共得到128个特征图像,特征图变成原来长宽的四分之一。
1-3.继续采用64个2*2的内核(带边缘补全padding)对步骤1-2获得的特征图像进行卷积,特征图像通过ReLU层进行数值处理;如此过程连续2次,在通过2*2的最大采样层对图像进行压缩,共得到256个特征图像,特征图变成原来长宽的八分之一。
1-4.继续采用64个2*2的内核(带边缘补全padding)对步骤1-3获得的特征图像进行卷积,特征图像通过ReLU层进行数值处理;如此过程连续2次,在通过2*2的最大采样层对图像进行压缩,共得到512个特征图像,特征图变成原来长宽的十六分之一。
1-5.采用2*2的最大采样层对图像进行压缩,仍然是512个特征图像,但特征图像变为原图的长宽的三十二分之一。
1-6.将1-5所产生的所有512个特征图像通过一个包含4096个神经元的全连接层,全连接层在连接指向1000个最终的图像分类标签,每一个指向边的权重等于某个图像属于该标签类的概率,最终模型将选择拥有最大概率的标签作为图像的最终分类结果。
该图像分类网络采用标准的16层VGG网络,每一层包含多个卷积层和ReLU层,负责对图像的内容和材质进行分段抽象,通过反复将卷积层、采样层进行叠加,从而抽取出高层级的图像特征;提取出高层次的语义特征,最终能够准确的识别出图像中包含的物体信息。
步骤2、基于时间递归网络的内容学习模型,该模型能够抽象出图像中的多粒度信息,该多粒度信息用于图像风格和内容的学习。该模型将图像中每一个点看作是其他若干点时间延续结果,从而构建出一个基于时间递归网络的模型,该模型利用概率分布能够预测出图像在下一行的可能的像素值分布,从而对整个图像的风格和内容形成一个准确的描述。该内容学习模型的建立步骤如下:
2-1.为一个像素建立一个神经元,采用窗口为k的时间递归网络,则:代表第i行第j列像素的神经元,其像素值是由来自于第i-1行的第(j-k)/2列到第(j+k)/2列的像素神经元的值进行加权平均,并经过神经网络激活函数而计算得到的。如此能够扫描图像内容,建立一个h层的时间递归网络,每一层拥有w个神经元;其中h为图像高度,w为图像宽度。
2-2.不同于卷积网络,时间递归网络要一层层计算,速度较慢,因此,对2-1建立的h层的时间递归网络进行调整,每一行像素相比上一行向右平移k-1个像素。如此,在计算第j列像素点新值的时候,只需要知道上一行第j列(包括第j列)之前的像素值即可。因此,能够将2-1建立的h层的时间递归网络转化为一个卷积网络,增加计算速度。
步骤3、风格化训练模块;
该模块负责协调步骤1和步骤2的神经网络模型,从用户选择的图像中抽取出风格信息,用于风格化的图像生成。该模块接受一个风格化图像和一个种子训练图像集合。对于任意一张种子训练图,该模块首先生成一张和该图大小一致的随机图,随机图通过步骤2的时间递归网络抽取出的特征向量再输入到步骤1的分类模型中,在分类模型内计算和风格化图以及种子图的误差,并用梯度下降的方法反馈训练步骤1和步骤2的神经网络。训练过程持续5万次左右,当训练结束,步骤2的神经网络已经包含了该风格化图片的特征信息。
实施例:
3-1.生成一张全白的和风格化图大小一致的图做为训练图。
3-2.训练图经过步骤2的时间循环网络,产生一张新的生成图,该图即为最终的图1和图2的融合训练结果。
3-3.生成图和图1、图2分别经过步骤1的卷积网络,生成的向量进行像素之间的色彩误差计算。生成图和图1的误差为风格误差,生成图和图2的误差为内容误差,整个的训练结果的目标是最小化风格误差和内容误差之和,这两者的重要程度能够通过权重进行调节。
具体误差公式如下(其中W、H、C分别表示图像的宽、高以及特征图片的数量,xij表示第i行第j列的像素值,α表示内容和风格的权重):
3-4.将步骤3-3的总误差,即风格误差和内容误差的加权总和通过SGD(梯度下降法)传递到时间递归网络,误差值函数的导数乘以预先设置的学习率(一般为0.01)作为修正值,神经元的原值减去修正值作为其新值,来接近达到降低误差的目标。
3-5.采用多个图像作为图1内容图输入到网络中,对同一个风格化图进行反复训练,从而达到对该风格的描述网络。
步骤4、风格化图像生成模块;
该模块使用步骤3训练好的时间递归网络进行图像的风格化。对于任意一张输入图像,该模块首先使用一个全连接卷积层将输入图像转化为和训练图一样的高度和宽度,然后在通过步骤2的时间递归网络将输入图像的内容和网络中的风格特性进行融合,融合的结果最终输出为一个新的和输入大小一样的图像。

Claims (3)

1.一种照片图像快速智能风格化方法,其特征在于包括如下步骤:
步骤1、基于多层卷积网络的图像分类网络;
该图像分类网络采用标准的16层VGG网络,每一层包含多个卷积层和ReLU层,负责对图像的内容和材质进行分段抽象,通过反复将卷积层、采样层进行叠加,从而抽取出高层级的图像特征;提取出高层次的语义特征,最终能够准确的识别出图像中包含的物体信息;
步骤2、基于时间递归网络的内容学习模型;
该模型能够抽象出图像中的多粒度信息,该多粒度信息用于图像风格和内容的学习;该模型将图像中每一个点看作是其他若干点时间延续结果,从而构建出一个基于时间递归网络的模型,该模型利用概率分布能够预测出图像在下一行的可能的像素值分布,从而对整个图像的风格和内容形成一个准确的描述;
步骤3、建立风格化训练模块;
该模块负责协调步骤1和步骤2的神经网络模型,从用户选择的图像中抽取出风格信息,用于风格化的图像生成;该模块接受一个风格化图像和一个种子训练图像集合;对于任意一张种子训练图,该模块首先生成一张和该图大小一致的随机图,随机图通过步骤2的时间递归网络抽取出的特征向量再输入到步骤1的分类模型中,在分类模型内计算和风格化图以及种子图的误差,并用梯度下降的方法反馈训练步骤1和步骤2的神经网络;训练过程持续5万次,当训练结束,步骤2的神经网络已经包含了该风格化图片的特征信息;
步骤4、风格化图像生成模块;
该模块使用步骤3训练好的时间递归网络进行图像的风格化;对于任意一张输入图像,该模块首先使用一个全连接卷积层将输入图像转化为和训练图一样的高度和宽度,然后在通过步骤2的时间递归网络将输入图像的内容和网络中的风格特性进行融合,融合的结果最终输出为一个新的和输入大小一样的图像;
步骤3的具体实现过程如下:
3-1.生成一张全白的和风格化图大小一致的图做为训练图;
3-2.训练图经过步骤2的时间循环网络,产生一张新的生成图,该图即为最终的图Ⅰ和图Ⅱ的融合训练结果;
3-3.生成图和图Ⅰ、图Ⅱ分别经过步骤1的卷积网络,生成的向量进行像素之间的色彩误差计算;生成图和图Ⅰ的误差为风格误差,生成图和图Ⅱ的误差为内容误差,整个的训练结果的目标是最小化风格误差和内容误差之和,这两者的重要程度能够通过权重进行调节;
具体误差公式如下:
其中W、H、C分别表示图像的宽、高以及特征图片的数量,xij表示第i行第j列的像素值,α表示内容和风格的权重;
3-4.将步骤3-3的总误差,即风格误差和内容误差的加权总和通过SGD传递到时间递归网络,误差值函数的导数乘以预先设置的学习率作为修正值,神经元的原值减去修正值作为其新值,来达到降低误差的目标;
3-5.采用多个图像作为图Ⅰ内容图输入到网络中,对同一个风格化图进行反复训练,从而达到对该风格的描述网络。
2.根据权利要求1所述的一种照片图像快速智能风格化方法,其特征在于步骤1具体实现过程如下:
1-1.首先采用64个2*2的内核对原图像进行卷积,卷积的结果为和原图像大小一致的64个特征图像,特征图像通过ReLU层进行数值处理;如此过程连续2次,在通过2*2的最大采样层对图像进行压缩,共得到64个特征图像,特征图像变成原来长宽的一半;
1-2.继续采用64个2*2的内核对步骤1-1获得的特征图像进行卷积,特征图像通过ReLU层进行数值处理;如此过程连续2次,在通过2*2的最大采样层对图像进行压缩,共得到128个特征图像,特征图变成原来长宽的四分之一;
1-3.继续采用64个2*2的内核对步骤1-2获得的特征图像进行卷积,特征图像通过ReLU层进行数值处理;如此过程连续2次,在通过2*2的最大采样层对图像进行压缩,共得到256个特征图像,特征图变成原来长宽的八分之一;
1-4.继续采用64个2*2的内核对步骤1-3获得的特征图像进行卷积,特征图像通过ReLU层进行数值处理;如此过程连续2次,在通过2*2的最大采样层对图像进行压缩,共得到512个特征图像,特征图变成原来长宽的十六分之一;
1-5.采用2*2的最大采样层对图像进行压缩,仍然是512个特征图像,但特征图像变为原图的长宽的三十二分之一;
1-6.将1-5所产生的所有512个特征图像通过一个包含4096个神经元的全连接层,全连接层在连接指向1000个最终的图像分类标签,每一个指向边的权重等于某个图像属于标签类的概率,最终模型将选择拥有最大概率的标签作为图像的最终分类结果。
3.根据权利要求2所述的一种照片图像快速智能风格化方法,其特征在于步骤2所述的内容学习模型的建立步骤如下:
2-1.为一个像素建立一个神经元,采用窗口为k的时间递归网络,则:代表第i行第j列像素的神经元,其像素值是由来自于第i-1行的第(j-k)/2列到第(j+k)/2列的像素神经元的值进行加权平均,并经过神经网络激活函数而计算得到的;如此能够扫描图像内容,建立一个h层的时间递归网络,每一层拥有w个神经元;其中h为图像高度,w为图像宽度;
2-2.不同于卷积网络,时间递归网络要一层层计算,速度较慢,因此,对2-1建立的h层的时间递归网络进行调整,每一行像素相比上一行向右平移k-1个像素;如此,在计算第j列像素点新值的时候,只需要知道上一行第j列以及第j列之前的像素值即可;因此,能够将2-1建立的h层的时间递归网络转化为一个卷积网络,增加计算速度。
CN201610962162.2A 2016-10-28 2016-10-28 一种照片图像快速智能风格化方法 Active CN106548208B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610962162.2A CN106548208B (zh) 2016-10-28 2016-10-28 一种照片图像快速智能风格化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610962162.2A CN106548208B (zh) 2016-10-28 2016-10-28 一种照片图像快速智能风格化方法

Publications (2)

Publication Number Publication Date
CN106548208A CN106548208A (zh) 2017-03-29
CN106548208B true CN106548208B (zh) 2019-05-28

Family

ID=58395243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610962162.2A Active CN106548208B (zh) 2016-10-28 2016-10-28 一种照片图像快速智能风格化方法

Country Status (1)

Country Link
CN (1) CN106548208B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180410A (zh) * 2017-04-11 2017-09-19 中国农业大学 一种图像的风格化重建方法及装置
CN107122736B (zh) * 2017-04-26 2020-06-12 北京邮电大学 一种基于深度学习的人体朝向预测方法及装置
CN108805169B (zh) * 2017-05-04 2021-06-01 宏达国际电子股份有限公司 影像处理方法、非暂态电脑可读取媒体以及影像处理系统
CN107240085A (zh) * 2017-05-08 2017-10-10 广州智慧城市发展研究院 一种基于卷积神经网络模型的图像融合方法及系统
CN107220667B (zh) * 2017-05-24 2020-10-30 北京小米移动软件有限公司 图像分类方法、装置及计算机可读存储介质
CN107392842B (zh) * 2017-06-30 2021-05-21 北京奇虎科技有限公司 图像风格化处理方法、装置、计算设备及计算机存储介质
CN109522254B (zh) * 2017-10-30 2022-04-12 上海寒武纪信息科技有限公司 运算装置及方法
CN108924528B (zh) * 2018-06-06 2020-07-28 浙江大学 一种基于深度学习的双目风格化实时渲染方法
CN109102457B (zh) * 2018-06-12 2023-01-17 杭州米绘科技有限公司 一种基于卷积神经网络的智能化变色系统及方法
CN108960408B (zh) * 2018-06-12 2021-07-13 杭州米绘科技有限公司 一种面向超高清分辨率图案的风格化系统及方法
CN112424834A (zh) 2018-08-01 2021-02-26 Oppo广东移动通信有限公司 用于图像处理的方法和设备
US20200050710A1 (en) * 2018-08-09 2020-02-13 Autodesk, Inc. Techniques for generating designs that reflect stylistic preferences
CN109299687A (zh) * 2018-09-18 2019-02-01 成都网阔信息技术股份有限公司 一种基于cnn的模糊异常视频识别方法
CN109325533A (zh) * 2018-09-18 2019-02-12 成都网阔信息技术股份有限公司 一种人工智能框架进行cnn迭代训练方法
CN111127304B (zh) 2018-10-31 2024-02-20 微软技术许可有限责任公司 跨域图像转换
CN109886206B (zh) * 2019-02-21 2021-09-14 电子科技大学中山学院 一种三维物体识别方法及设备
CN110009644B (zh) * 2019-03-26 2021-02-23 深兰科技(上海)有限公司 一种特征图行像素分段的方法和装置
CN110222722A (zh) * 2019-05-14 2019-09-10 华南理工大学 交互式图像风格化处理方法、系统、计算设备及存储介质
CN112908146A (zh) * 2020-12-26 2021-06-04 云景文旅科技有限公司 一种手绘地图切割呈现方法以及智慧导游导览系统
CN113628101B (zh) * 2021-08-12 2023-11-24 杭州电子科技大学 基于gan网络结构的三阶段瓷砖图像生成方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678293A (zh) * 2015-12-30 2016-06-15 成都数联铭品科技有限公司 一种基于cnn-rnn的复杂图像字序列识别方法
CN105844239A (zh) * 2016-03-23 2016-08-10 北京邮电大学 一种基于cnn和lstm的暴恐视频检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130088583A1 (en) * 2011-10-07 2013-04-11 Aoptix Technologies, Inc. Handheld Iris Imager

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678293A (zh) * 2015-12-30 2016-06-15 成都数联铭品科技有限公司 一种基于cnn-rnn的复杂图像字序列识别方法
CN105844239A (zh) * 2016-03-23 2016-08-10 北京邮电大学 一种基于cnn和lstm的暴恐视频检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于卷积神经网络的人脸检测和性别识别研究";汪济民;《中国优秀硕士学位论文全文数据库(电子期刊) 信息科技辑》;20160115(第1期);期刊第2.1-2.3节,图2.3

Also Published As

Publication number Publication date
CN106548208A (zh) 2017-03-29

Similar Documents

Publication Publication Date Title
CN106548208B (zh) 一种照片图像快速智能风格化方法
CN109299274B (zh) 一种基于全卷积神经网络的自然场景文本检测方法
CN107766447B (zh) 一种使用多层注意力网络机制解决视频问答的方法
CN108510012B (zh) 一种基于多尺度特征图的目标快速检测方法
CN110378985B (zh) 一种基于gan的动漫绘画辅助创作方法
CN108304826A (zh) 基于卷积神经网络的人脸表情识别方法
US20180373999A1 (en) Targeted data augmentation using neural style transfer
US11354792B2 (en) System and methods for modeling creation workflows
CN108875807A (zh) 一种基于多注意力多尺度的图像描述方法
CN107749052A (zh) 基于深度学习神经网络的图像去雾方法及系统
CN107798349A (zh) 一种基于深度稀疏自编码机的迁移学习方法
CN110929610A (zh) 基于cnn模型和迁移学习的植物病害识别方法及系统
CN107369147B (zh) 基于自我监督学习的图像融合方法
CN109086768A (zh) 卷积神经网络的语义图像分割方法
CN109345446A (zh) 一种基于对偶学习的图像风格转移算法
CN109740695A (zh) 基于自适应全卷积注意力网络的图像识别方法
DiPaola et al. Using artificial intelligence techniques to emulate the creativity of a portrait painter
Kantipudi et al. Color channel perturbation attacks for fooling convolutional neural networks and a defense against such attacks
CN109215036A (zh) 基于卷积神经网络的人体分割方法
Alipourfard et al. Virtual training sample generation by generative adversarial networks for hyperspectral images classification
CN114897884A (zh) 基于多尺度边缘特征融合的无参考屏幕内容图像质量评估方法
CN109086868A (zh) 一种抽象图像情感识别方法
Xiang et al. Semi-supervised image classification via attention mechanism and generative adversarial network
CN106778558A (zh) 一种基于深度分类网络的面部年龄估计方法
Sutedy et al. Text to image latent diffusion model with dreambooth fine tuning for automobile image generation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20180514

Address after: 310000 room 1206, block B, 581 Torch Road, Binjiang District, Hangzhou, Zhejiang.

Applicant after: Hangzhou Micha science and Technology Co., Ltd.

Address before: 310012 422, 4 floor, 3 story A building, No. 301, Binxing Road, Changhe street, Binjiang District, Hangzhou, Zhejiang.

Applicant before: HANGZHOU MURUI TECHNOLOGY CO., LTD.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20191118

Address after: 310000 room 3001-8, Tianren building, No. 188, Liyi Road, ningwei street, Xiaoshan District, Hangzhou City, Zhejiang Province (self segmentation)

Patentee after: HANGZHOU MURUI TECHNOLOGY CO., LTD.

Address before: 310000 room 1206, block B, 581 Torch Road, Binjiang District, Hangzhou, Zhejiang.

Patentee before: Hangzhou Micha science and Technology Co., Ltd.

TR01 Transfer of patent right