CN113205574B - 一种基于注意力机制的艺术字风格迁移系统 - Google Patents

一种基于注意力机制的艺术字风格迁移系统 Download PDF

Info

Publication number
CN113205574B
CN113205574B CN202110478237.0A CN202110478237A CN113205574B CN 113205574 B CN113205574 B CN 113205574B CN 202110478237 A CN202110478237 A CN 202110478237A CN 113205574 B CN113205574 B CN 113205574B
Authority
CN
China
Prior art keywords
style
attention
migration
neural network
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110478237.0A
Other languages
English (en)
Other versions
CN113205574A (zh
Inventor
何发智
邓杰希
金千千
吴浩然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN202110478237.0A priority Critical patent/CN113205574B/zh
Publication of CN113205574A publication Critical patent/CN113205574A/zh
Application granted granted Critical
Publication of CN113205574B publication Critical patent/CN113205574B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/40Filling a planar surface by adding surface attributes, e.g. colour or texture

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Generation (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于注意力机制的艺术字风格迁移系统。涉及图像合成领取与风格迁移领域。该方法采用对抗网络模型,通过生成器学习更好的内容特征,学习更好的纹理特征,然后通过判别器对生成器生成的好坏进行判断,从而引导生成器生成更好的带有风格图的艺术字图片。采用本发明的系统能够生成各种样式的艺术字,并通过关键词生成海报的宣传海报,可以用在电影里面生成各种带有不同风格样式的字体,并且还能实时调整字体的形状,生成想要形状的字体。同时还能保存古字体,一些古字体照片通过风格迁移,可以通过本发明的系统生成对应的古字体汉字,这对保留中华民族的文化有着重大的意义。

Description

一种基于注意力机制的艺术字风格迁移系统
技术领域
本方法属于图像合成领域,是一种基于注意力机制的针对艺术字风格迁移的图像合成算法。
背景技术
随着大数据随着大数据时代的来临与深度学习技术的兴起,人工智能领域取得了快速发展,使得研究者对人工智能的关注度以及社会大众对人工智能的憧憬得到空前提升。图像艺术风格化是近年来非真实感绘制领域的研究热点之一,其主要考虑通过参考图像指定的样式呈现文本,实现艺术文本样式转移。根据参考图像,可以通过对现有精心设计的文本效果进行类比来对文本进行艺术化,通过对字体的艺术化,展现不同的样式,来满足各种不同的视觉任务。这在许多视觉创作任务例如海报上面的艺术字设计,广告还有word,任何需要展现字体的地方,都有很广泛的应用。将图像的风格渲染字体,改变字体的纹理,使得字体有不同的样式,使得字体有不同的风格,使得字体有不同艺术特征,不仅仅能展现图像的艺术气息,也能展现字体的艺术气息。通过风格迁移的方法可以很好的将图像的艺术风格融入到传统的字体当中来,对传统的字体的样式进行创新,并且节省了很多艺术字的创作过程的人力和时间。
图像艺术风格迁移技术在卷积神经网络(CNN)的启发下取得了进一步的发展,通过分离和重新组合图片语义与风格,卷积神经网络可以将一张图片的语义内容与不同的风格融合在一起。风格迁移的算法使用到了VGG网络,这个网络之前被用于做上述的图像分类识别,从较浅层的的卷积层提供图像特征信息,再通过后面的全连接层作一个预测判别。而我们风格迁移正好与之相反,输入内容图像和风格图像的特征,再输出对应的生成图像。将一张白噪声的图像输入到网络中,计算其与内容图像之间的距离即为内容损失函数,再计算其与风格图像之间的距离为风格损失函数,最后用梯度下降的方式使之迭代最小化,这样我们生成的图片就既可以保留内容图片的内容特征,又可以具有风格图片的某种艺术风格。
发明内容
本发明的上述技术问题主要是通过下述技术方案得以解决的:
一种基于注意力机制的艺术字风格迁移系统,其特征在于,包括:
图像预处理模块:形成风格图的简化结构;与风格图构成成对的训练集;
生成器,用于生成待判别的目标文字图像;
判别器,用于对生成模块生成的图像进行判别。
在上述的基于注意力机制的艺术字风格迁移系统,生成器基于一个生成对抗网络模型,该模型包含三个模块:
反向结构迁移模块:包括一个基于级联注意力的神经网络,先将得到的结构简图做高斯模糊化处理,然后模糊化的图像通过基于级联注意力的神经网络还原成原来没有模糊之前的样子;这样获得的简化结构图与风格图构成成对的训练集;
训练结构迁移模块:通过训练神经网络,使文字轮廓的周围获得风格图的边缘特征;这个模块包括一个基于级联注意力的神经网络;
纹理迁移模块:通过训练神经网络,给文字添加风格图纹理特征,例如颜色等;这个模块也是包括一个基于级联注意力的神经网络。
在上述的基于注意力机制的艺术字风格迁移系统,所述基于级联注意力的神经网络包含一个空间注意力模块和一个通道注意力模块;这两个模块通过串联相连。
在上述的基于注意力机制的艺术字风格迁移系统,所述结构迁移模块具体包括一个基于级联注意力的神经网络,级联的注意力机制模块包含一个空间注意力模块和一个通道注意力模块;这两个模块通过串联相连;纹理迁移模块包括一个基于级联注意力的前馈神经网络。
在上述的基于注意力机制的艺术字风格迁移系统,判别器为一个全连接的神经网络层,这个网络和生成器是同时使用;生成器的输出为判别器的输入,判别器是一个全连接的神经网络层,输出为0到1之间的值,通过值的大小判定生成器生成数据的好坏,越接近1表示生成的数据越好。
在上述的基于注意力机制的艺术字风格迁移系统,纹理迁移模块的具体步骤包括:输入文字集,训练网络,得到具有风格特征的艺术字。
在上述的基于注意力机制的艺术字风格迁移系统,生成对抗网络模型中的双向注意力机制的模型的损失函数为:
Figure BDA0003048097700000021
公式中x表示样本,y表示实际的标签,a表示预测的输出,n表示样本总数量
生成对抗网络模型的总的损失函数loss,该损失函数用来约束生成器和判别器之间的关系,使得两者更加均衡,总的损失函数分别由LGAN,内容风格函数Ltotal(p,a,f)两个部分组成:
loss=argminmaxα LGAN+β Ltotal(p,a,f)
生成对抗网络的对抗性损失LGAN,该损失函数定义如下:
Figure BDA0003048097700000031
其中,P,P^和PS分别表示风格图,简化风格图和艺术字的分布,Pt表示目标图像,Pg表示生成图像,Pc为条件图像;
内容风格损失函数由内容损失函数和风格损失函数构成:
Ltotal(p,a,f)=α Lcontent(p,f)+β Lstyle(a,f)
其中Ltotal(p,a,f)为内容风格损失函数,Lcontent(p,f)为内容损失函数,Lstyle(a,x)为风格损失函数;α和β分别代表内容和风格损失的权重,其和为1;
内容损失函数为:
Figure BDA0003048097700000032
Fij和Pij各自表示内容图经过某一层卷积层得到的特征图、生成图经过卷积层生成的特征图
风格损失函数为:
Figure BDA0003048097700000033
Figure BDA0003048097700000034
Figure BDA0003048097700000035
代表生成图和风格图经过卷积层得到的特征图(也就是一个矩阵)、然后自相关得到的Gram matrix(二维矩阵)。
因此,本发明具有如下优点:本发明主要应用于艺术字风格迁移上面,可以应用于海报制作,标题制作等。采用本发明的系统能够生成各种样式的艺术字,并通过关键词生成海报的宣传海报,可以用在电影里面生成各种带有不同风格样式的字体,并且还能实时调整字体的形状,生成想要形状的字体。同时还能保存古字体,一些古字体照片通过风格迁移,可以通过本发明的系统生成对应的古字体汉子,这对保留中华民族的文化有着重大的意义。
附图说明
附图1是本发明的方法流程示意图。
具体实施方式
本发明提出一种新型的形状匹配GAN。我们的关键思想是基于注意力机制的双向形状匹配的策略,可通过向后和向前传递在源样式和目标字形之间建立形状映射。字形变形可以建模为样式图像的从粗到细的形状映射,其中变形程度由图像的粗细水平控制。基于此思想,我们开发了一种基于双向连接的注意力机制的映射模块,通过将形状特征从文本向后迁移到艺术图像,从而将样式图像简化为各种粗略级别。所得的粗精细图像对为数据驱动的学习提供了鲁棒的多尺度形状映射。利用这些获得的数据,我们构建了一个可比例控制的模块,该模块使网络能够学习从映射以连续的比例来表征和推断样式特征。最终,我们可以将任何指定比例的特征转发到目标字形,以实现比例可控的样式转换。同时,我们还加入了深度超参数卷积层,防止过拟合,提高卷积神经网络的性能。
采用上述思路可以实现图像的风格到字体的迁移,形成具有各种图像风格的艺术字,同时之前提出的可比例控制的模块可以通过参数控制,使得图像迁移而来的艺术字可以有着不同的变化程度,从可读到更艺术风格化。
以下为该发明内容的整体思路(总共为三个阶段):
第一个阶段(基于注意力机制的反向结构迁移),通过训练基于注意力机制的卷积神经网络,反向迁移,提取出图像的风格图的结构,反向将文字的形状风格迁移到结构图上面,获得简化的结构图。
第二个阶段(基于注意力机制的正向结构迁移),通过训练基于注意力机制的卷积神经网络,正向学习刚才的反向结构迁移的逆过程,可以得到文字的风格图,形成训练集跟验证集,并形成对应的映射。学习将简化的结构映射到原始结构再进一步映射回风格图,这样基于注意力机制的神经网络就学会了为该文字增添风格图的效果了。
第三阶段(输入图片阶段),训练好上述两个过程之后,该基于注意力机制的卷积神经网络就学会了该单一风格图的迁移方式,保存上述的基于注意力机制的卷积神经网络的参数任意输入文字信息,就可以得到该风格图(风景图)的艺术字信息。
接下来详细介绍上述三个阶段:
第一个阶段也就是反向结构迁移,为了将文字的形状迁移到风格图的结构图上,首先将风景图通过一个基于注意力机制的卷积神经网络进行训练,得到风格图的简化的结构图,这一过程生成了风格图的结构图与简化的结构图,与风格图构成成对的训练集。我们改进了之前的注意力模式,采用双重注意力模块进行连接,企图获得更好的特征,更好的简化的结构图。基于注意力机制的卷积神经网络是通过两个3*3和5*5两种大小的卷积核进行的一个双向网络,在进行一系列卷积操作之后,采用全连接的方式交互信息。这样做的目的是为了扩大感受野,采用一种卷积核进行卷积,容易忽视一些其他的特性以及信息,通过这种双向网络,可以获得更好的特性。
第二个阶段是正向结构迁移阶段,总共包含两个小阶段,包含结构迁移和纹理迁移。结构迁移是通过一个基于注意力机制的卷积神经网络,将结构图映射回原来的结构图,形成一个对应关系。同时上述网络通过一个参数L控制风格图简化的程度,该参数L取值范围为0到1,参数为0简化程度越低,参数为1简化程度越高。经过结构迁移之后,接下啦是纹理迁移。纹理迁移是通过一个基于注意力机制的卷积神经网络,将结构图映射为风格图,也就是为文字增条了纹理。两个网络都是通过两个3*3和5*5两种大小的卷积核进行的一个双向网络,在进行一系列卷积操作以及下采样,池化等操作之后,采用全连接的方式还原为原来的风格图。这是一个逆训练过程,还原到原来的风格图,由风格图的简化结构图得到原来的风格图。但是加入了结构迁移和纹理迁移的部分,使得基于注意力机制的卷积神经网络学会为图像增加文字的结构,为文字增添纹理。保存第二个阶段所获得的模型的参数,这就是对应风格图迁移到文字上面的对应的参数集。
第三个阶段就是导入上面第二阶段保存的基于注意力机制的神经网络的的参数,这些参数对应某一个风格图,如果将任意文字渲染成该风格图的样式,就导入相应风格图的参数。同时,可以通过参数L控制字体的变形程度。
生成对抗网络模型中的双向注意力机制的模型的损失函数为:
Figure BDA0003048097700000051
公式中x表示样本,y表示实际的标签,a表示预测的输出,n表示样本总数量
生成对抗网络模型的总的损失函数loss,该损失函数用来约束生成器和判别器之间的关系,使得两者更加均衡,总的损失函数分别由LGAN,内容风格函数Ltotal(p,a,f)两个部分组成:
loss=argminmaxα LGAN+β Ltotal(p,a,f)
生成对抗网络的对抗性损失LGAN,该损失函数定义如下:
Figure BDA0003048097700000061
其中,P,P^和PS分别表示风格图,简化风格图和艺术字的分布,Pt表示目标图像,Pg表示生成图像,Pc条件图像。
内容风格损失函数由内容损失函数和风格损失函数构成:
Ltotal(p,a,f)=α Lcontent(p,f)+β Lstyle(a,f)
其中Ltotal(p,a,f)为内容风格损失函数,Lcontent(p,f)为内容损失函数,Lstyle(a,x)为风格损失函数;α和β分别代表内容和风格损失的权重,其和为1;
内容损失函数为:
Figure BDA0003048097700000062
Fij和Pij各自表示内容图经过某一层卷积层得到的特征图、生成图经过卷积层生成的特征图
风格损失函数为:
Figure BDA0003048097700000063
Figure BDA0003048097700000064
Figure BDA0003048097700000065
代表生成图和风格图经过卷积层得到的特征图、然后自相关得到的Grammatrix;
本发明未尽事宜为公知技术。
上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所的等效变化或修饰,都应涵盖在本发明的保护范围之内。

Claims (6)

1.一种基于注意力机制的艺术字风格迁移系统,其特征在于,包括:
图像预处理模块:形成风格图的简化结构;与风格图构成成对的训练集;
生成器,用于生成待判别的目标文字图像;
判别器,用于对生成模块生成的图像进行判别;
生成器基于一个生成对抗网络模型,该模型包含三个模块:
反向结构迁移模块:包括一个基于级联注意力的神经网络,先将得到的结构简图做高斯模糊化处理,然后模糊化的图像通过基于级联注意力的神经网络还原成原来没有模糊之前的样子;这样获得的简化结构图与风格图构成成对的训练集;
首先将风景图通过一个基于注意力机制的卷积神经网络进行训练,得到风格图的简化的结构图,这一过程生成了风格图的结构图与简化的结构图,与风格图构成成对的训练集;改进了之前的注意力模式,采用双重注意力模块进行连接,企图获得更好的特征,更好的简化的结构图;基于注意力机制的卷积神经网络是通过两个3*3和5*5两种大小的卷积核进行的一个双向网络,在进行一系列卷积操作之后,采用全连接的方式交互信息;
训练结构迁移模块:通过训练神经网络,使文字轮廓的周围获得风格图的边缘特征;这个模块包括一个基于级联注意力的神经网络;
具体包含两个小阶段,包含结构迁移和纹理迁移;结构迁移是通过一个基于注意力机制的卷积神经网络,将结构图映射回原来的结构图,形成一个对应关系;同时上述网络通过一个参数L控制风格图简化的程度,该参数L取值范围为0到1,参数为0简化程度越低,参数为1简化程度越高;经过结构迁移之后,接下来是纹理迁移;纹理迁移是通过一个基于注意力机制的卷积神经网络,将结构图映射为风格图,也就是为文字增加了纹理;两个网络都是通过两个3*3和5*5两种大小的卷积核进行的一个双向网络,在进行一系列卷积操作以及下采样,池化操作之后,采用全连接的方式还原为原来的风格图;这是一个逆训练过程,还原到原来的风格图,由风格图的简化结构图得到原来的风格图;但是加入了结构迁移和纹理迁移的部分,使得基于注意力机制的卷积神经网络学会为图像增加文字的结构,为文字增添纹理;保存第二个阶段所获得的模型的参数,这就是对应风格图迁移到文字上面的对应的参数集;
纹理迁移模块:通过训练神经网络,给文字添加风格图纹理特征,这个模块也是包括一个基于级联注意力的神经网络;
具体是导入训练结构迁移模块保存的基于注意力机制的神经网络的参数,这些参数对应某一个风格图,如果将任意文字渲染成该风格图的样式,就导入相应风格图的参数;同时,可以通过参数L控制字体的变形程度。
2.如权利要求1所述的基于注意力机制的艺术字风格迁移系统,其特征在于,所述基于级联注意力的神经网络包含一个空间注意力模块和一个通道注意力模块;这两个模块通过串联相连。
3.如权利要求1所述的基于注意力机制的艺术字风格迁移系统,其特征在于,所述结构迁移模块具体包括一个基于级联注意力的神经网络,级联的注意力机制模块包含一个空间注意力模块和一个通道注意力模块;这两个模块通过串联相连;纹理迁移模块包括一个基于级联注意力的前馈神经网络。
4.如权利要求1所述的基于注意力机制的艺术字风格迁移系统,其特征在于,判别器为一个全连接的神经网络层,这个网络和生成器是同时使用;生成器的输出为判别器的输入,判别器是一个全连接的神经网络层,输出为0到1之间的值,通过值的大小判定生成器生成数据的好坏,越接近1表示生成的数据越好。
5.如权利要求1所述的基于注意力机制的艺术字风格迁移系统,其特征在于,纹理迁移模块的具体步骤包括:输入文字集,训练网络,得到具有风格特征的艺术字。
6.如权利要求1所述的基于注意力机制的艺术字风格迁移系统,其特征在于,生成对抗网络模型中的双向注意力机制的模型的损失函数为:
Figure FDA0004121535910000021
公式中x表示样本,y表示实际的标签,a表示预测的输出,n表示样本总数量
生成对抗网络模型的总的损失函数loss,该损失函数用来约束生成器和判别器之间的关系,使得两者更加均衡,总的损失函数分别由LGAN,内容风格函数Ltotal(p,a,f)两个部分组成:
loss=argminmaxαLGAN+βLtotal(p,a,f)
生成对抗网络的对抗性损失LGAN,该损失函数定义如下:
Figure FDA0004121535910000031
其中,P,P^和PS分别表示风格图,简化风格图和艺术字的分布,Pt表示目标图像,Pg表示生成图像,Pc为条件图像;
内容风格损失函数由内容损失函数和风格损失函数构成:
Ltotal(p,a,f)=αLcontent(p,f)+βLstyle(a,f)
其中Ltotal(p,a,f)为内容风格损失函数,Lcontent(p,f)为内容损失函数,
Lstyle(a,x)为风格损失函数;α和β分别代表内容和风格损失的权重,其和为1;
内容损失函数为:
Figure FDA0004121535910000032
Fij和Pij各自表示内容图经过某一层卷积层得到的特征图、生成图经过卷积层生成的特征图
风格损失函数为:
Figure FDA0004121535910000033
Figure FDA0004121535910000034
Figure FDA0004121535910000035
代表生成图和风格图经过卷积层得到的特征图、然后自相关得到的二维矩阵Gram matrix。
CN202110478237.0A 2021-04-30 2021-04-30 一种基于注意力机制的艺术字风格迁移系统 Active CN113205574B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110478237.0A CN113205574B (zh) 2021-04-30 2021-04-30 一种基于注意力机制的艺术字风格迁移系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110478237.0A CN113205574B (zh) 2021-04-30 2021-04-30 一种基于注意力机制的艺术字风格迁移系统

Publications (2)

Publication Number Publication Date
CN113205574A CN113205574A (zh) 2021-08-03
CN113205574B true CN113205574B (zh) 2023-04-21

Family

ID=77028722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110478237.0A Active CN113205574B (zh) 2021-04-30 2021-04-30 一种基于注意力机制的艺术字风格迁移系统

Country Status (1)

Country Link
CN (1) CN113205574B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113610085B (zh) * 2021-10-10 2021-12-07 成都千嘉科技有限公司 基于注意力机制的字轮图像识别方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111553837A (zh) * 2020-04-28 2020-08-18 武汉理工大学 一种基于神经风格迁移的艺术文本图像生成方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110660037B (zh) * 2018-06-29 2023-02-10 京东方科技集团股份有限公司 图像间脸部交换的方法、装置、系统和计算机程序产品
CN110021051B (zh) * 2019-04-01 2020-12-15 浙江大学 一种基于生成对抗网络通过文本指导的人物图像生成方法
WO2020227971A1 (en) * 2019-05-15 2020-11-19 Microsoft Technology Licensing, Llc Image generation
CN112070658B (zh) * 2020-08-25 2024-04-16 西安理工大学 一种基于深度学习的汉字字体风格迁移方法
CN112669242A (zh) * 2021-03-16 2021-04-16 四川大学 基于改进图像增强算法与生成对抗网络的夜景复原方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111553837A (zh) * 2020-04-28 2020-08-18 武汉理工大学 一种基于神经风格迁移的艺术文本图像生成方法

Also Published As

Publication number Publication date
CN113205574A (zh) 2021-08-03

Similar Documents

Publication Publication Date Title
CN106547880B (zh) 一种融合地理区域知识的多维度地理场景识别方法
Yim et al. A gift from knowledge distillation: Fast optimization, network minimization and transfer learning
CN109886121A (zh) 一种遮挡鲁棒的人脸关键点定位方法
CN109711481A (zh) 用于画作多标签识别的神经网络、相关方法、介质和设备
CN104866810A (zh) 一种深度卷积神经网络的人脸识别方法
CN110196945B (zh) 一种基于LSTM与LeNet融合的微博用户年龄预测方法
CN111832573B (zh) 一种基于类激活映射和视觉显著性的图像情感分类方法
Sharma et al. Deep eigen space based ASL recognition system
CN111310766A (zh) 基于编解码和二维注意力机制的车牌识别方法
CN113205574B (zh) 一种基于注意力机制的艺术字风格迁移系统
Schnürer et al. Detection of pictorial map objects with convolutional neural networks
Qu et al. Perceptual-DualGAN: perceptual losses for image to image translation with generative adversarial nets
CN116258990A (zh) 一种基于跨模态亲和力的小样本参考视频目标分割方法
Heo et al. Automatic sketch colorization using DCGAN
CN113128455A (zh) 一种细胞图像重构模型训练方法和系统
CN111275646B (zh) 一种基于深度学习知识蒸馏技术的保边图像平滑方法
Guo et al. Semantic image segmentation based on SegNetWithCRFs
Zhang et al. An algorithm of bidirectional RNN for offline handwritten Chinese text recognition
Golyadkin et al. Semi-automatic manga colorization using conditional adversarial networks
Zhuo et al. Attention-based deformable convolutional network for Chinese various dynasties character recognition
CN114299184A (zh) 基于语义匹配的藏式建筑彩绘线稿图上色方法及装置
CN114037644A (zh) 一种基于生成对抗网络的艺术字图像合成系统及方法
Scius-Bertrand et al. Annotation-free character detection in historical Vietnamese stele images
Mitani et al. Evaluation of Transfer Learning for Handwritten Character Classification Using Small Training Samples
Xiao et al. MFRNet: a multipath feature refinement network for semantic segmentation in high-resolution remote sensing images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant