CN108170649A - 一种基于dcgan深度网络的汉字字库生成方法及装置 - Google Patents
一种基于dcgan深度网络的汉字字库生成方法及装置 Download PDFInfo
- Publication number
- CN108170649A CN108170649A CN201810079205.1A CN201810079205A CN108170649A CN 108170649 A CN108170649 A CN 108170649A CN 201810079205 A CN201810079205 A CN 201810079205A CN 108170649 A CN108170649 A CN 108170649A
- Authority
- CN
- China
- Prior art keywords
- target
- picture
- character
- standard letter
- font
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/245—Font recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
本发明实施例公开了一种基于DCGAN深度网络的汉字字库生成方法及装置,用于解决由于汉字字符结构本身具有一定的相似性,设计六千多个新字体汉字常用字和几万个非常用字必然包含着大量的重复劳动,导致的耗时耗力,浪费人力成本的技术问题。
Description
技术领域
本发明涉及计算机文字处理技术领域,尤其涉及一种基于DCGAN深度网络的汉字字库生成方法及装置。
背景技术
已有基于深度神经网络(DCNN),通过给定某种特定字体的一小组字母,生成相同样式的剩余字母。
例如,在论文1(Baluja S.Learning Typographic Style[J].arXiv:ComputerVision and Pattern Recognition,2016.)中,论述了一种基于深度神经网络(DCNN)的英文字体生成方法。通过将某种字体的“B、A、S、Q”四个字母输入到DCNN网络,能够生成出该种字体下的其余大写英文字母图片。该方法主要基于逐像素的L2损失,通过学习“B、A、S、Q”四个字母在各种不同字体下的线条、弧度、倾斜度等字体信息,训练得到一个能够提取英文字母字体信息的DCNN网络;当将一种未知字体的“B、A、S、Q”四个字母输入到训练完成的DCNN网络时,该网络能自动提取此种字体的线条、弧度、倾斜度等信息,并生成出该种字体下的其余大写英文字母图片。
例如,在论文2(Yang S,Liu J,Lian Z,et al.Awesome Typography:Statistics-Based Text Effects Transfer[J].arXiv:Computer Vision and Pattern Recognition,2016.)中,论述了一种基于统计学的艺术字生成方法,可将某一个艺术字的艺术效果如火焰,霓虹灯,特殊纹理等迁移到另外一个不同的字符上去。该方法是一种机器学习的方法,主要是构建了一个合成某一字符的笔画信息与另一字符的艺术效果信息的过程,其关键思想是基于特征距离分析和建模出高质量的文本效果的基本特征,并利用它们来指导合成过程。
论文1的方法中,利用DCNN作为字符图像生成网络,并用逐像素的L2损失来比较生成结果和目标结果两幅图像之间的差异,以此作为损失函数来训练生成网络。但众所周知,L2损失容易导致生成结果模糊不清。论文1的方法生成的特定字体的英文字符往往十分模糊,没有明确的边缘,虽能看出是属于某一种字体,但模糊的字符并不具备实用价值。此外,中华文明源远流长,中文字体独具魅力,我们希望能有一种生成中文字体字符的方法,既减轻字体设计师的工作压力,又能发扬光大古人的书法瑰宝。我们要有一套自己的中文字体字符生成方法。
论文2的方法中,基于统计学分析和建模,提出一种文字效果迁移的方法。可将复杂多彩的艺术字效果和简单的黑白字符进行结合,得到新的艺术字。这种方法虽然也能对汉字字符进行处理,但字符的艺术效果迁移与字体转换是不同的两个概念,艺术效果迁移是在三通道彩色空间的迁移,更看重整体的视觉效果;而字体转换是在单通道黑白空间的迁移,不仅看重整体的视觉效果,还要求笔画角度、折角、勾提等细节处的匹配。论文2的方法无法胜任字体转换任务。
字体设计是一项非常需要专业知识,且费时费力的工作。汉字常用字有六千多个,加上非常用字共有几万个,当要设计一种新字体时,就需要专业人员根据新字体的特点,逐一地为这两千多个汉字赋予新字体,设计新字形,并在最后制作出相应的文件格式供用户使用。然而,由于汉字字符结构本身具有一定的相似性,设计六千多个新字体汉字常用字和几万个非常用字必然包含着大量的重复劳动,导致了耗时耗力,浪费人力成本的技术问题。
发明内容
本发明提供了一种基于DCGAN深度网络的汉字字库生成方法及装置,解决了由于汉字字符结构本身具有一定的相似性,设计六千多个新字体汉字常用字和几万个非常用字必然包含着大量的重复劳动,导致的耗时耗力,浪费人力成本的技术问题。
本发明提供了一种基于DCGAN深度网络的汉字字库生成方法,包括:
S1、确定标准字体和目标字体并获取字符对应的标准字体样本字库和目标字体样本字库;
S2、对标准字体样本字库和目标字体样本字库进行预处理,得到目标-标准字体字符图片数据集;
S3、采用编码器-解码器架构作为生成器,二分类卷积神经网络作为判别器,构建深度卷积对抗生成网络DCGAN;
S4、利用目标-标准字体字符图片数据集对深度卷积对抗生成网络DCGAN进行训练,得到训练后的深度卷积对抗生成网络DCGAN;
S5、获取标准字体完整字库,并将标准字体完整字库转换为完整的标准字体字符图片;
S6、依次将完整的标准字体字符图片输入至训练后的深度卷积对抗生成网络DCGAN的生成器中,由训练后的深度卷积对抗生成网络DCGAN的生成器输出对应的完整的目标字体字符图片;
S7、将完整的目标字体字符图片转换为目标字体完整字库。
优选地,步骤S2具体包括:
S21、将标准字体样本字库转换为标准字体样本字符图片,将目标字体样本字库转换为目标字体样本字符图片;
S22、对标准字体样本字符图片和目标字体样本字符图片进行裁剪和去空白处理;
S23、将字符对应的目标字体样本字符图片与标准字体样本字符图片拼接成目标-标准字体字符图片,并进行去空白处理,得到目标-标准字体字符图片数据集。
优选地,步骤S4具体包括:
S41、将目标-标准字体字符图片中的标准字体样本字符部分图片输入至深度卷积对抗生成网络DCGAN的生成器中,得到深度卷积对抗生成网络DCGAN的生成器输出的转换后的目标字体字符图片;
S42、将目标-标准字体字符图片中对应的目标字体样本字符部分图片和转换后的目标字体字符图片输入至深度卷积对抗生成网络DCGAN的判别器中,得到判别器根据转换后的目标字体字符图片和目标字体样本字符图片之间的差异性输出的布尔变量;
S43、通过深度卷积对抗生成网络DCGAN的目标函数,得到目标-标准字体字符图片的损失值;
S44、返回步骤S41进行迭代训练,直至迭代的次数与预置迭代次数相同或目标-标准字体字符图片的损失值低于第一预置损失值阈值,得到训练后的深度卷积对抗生成网络DCGAN。
优选地,步骤S43之后还包括:
S431、获取转换后的目标字体字符图片和目标字体样本字符图片之间的L1距离;
S432、获取L1距离在目标-标准字体字符图片的损失值之中的权重值λ;
S433、根据目标-标准字体字符图片的损失值以及L1距离在目标-标准字体字符图片的损失值之中的权重值λ,通过生成器的目标函数,得到生成器的损失值;
S44、返回步骤S41进行迭代训练,直至迭代的次数与预置迭代次数相同或目标-标准字体字符图片的损失值低于第一预置损失值阈值并且生成器的损失值低于第二预置损失值阈值,得到训练后的深度卷积对抗生成网络DCGAN。
优选地,步骤S7具体包括:
S71、将每一张目标字体字符图片进行标准化编码处理,确定每一张目标字体字符在字库中的标准化编码;
S72、调用BMFont平台、预置配置文件以及预置批量处理脚本文件,将完整的目标字体字符图片转换为目标字体完整字库FNT文件。
本发明提供了一种基于DCGAN深度网络的汉字字库生成装置,包括:
第一获取单元,用于确定标准字体和目标字体并获取字符对应的标准字体样本字库和目标字体样本字库;
第一预处理单元,用于对标准字体样本字库和目标字体样本字库进行预处理,得到目标-标准字体字符图片数据集;
构建单元,用于采用编码器-解码器架构作为生成器,二分类卷积神经网络作为判别器,构建深度卷积对抗生成网络DCGAN;
训练单元,用于利用目标-标准字体字符图片数据集对深度卷积对抗生成网络DCGAN进行训练,得到训练后的深度卷积对抗生成网络DCGAN;
第二获取单元,用于获取标准字体完整字库,并将标准字体完整字库转换为完整的标准字体字符图片;
转换单元,用于依次将完整的标准字体字符图片输入至训练后的深度卷积对抗生成网络DCGAN的生成器中,由训练后的深度卷积对抗生成网络DCGAN的生成器输出对应的完整的目标字体字符图片;
字库生成单元,用于将完整的目标字体字符图片转换为目标字体完整字库。
优选地,第一预处理单元具体包括:
转换子单元,用于将标准字体样本字库转换为标准字体样本字符图片,将目标字体样本字库转换为目标字体样本字符图片;
处理子单元,用于对标准字体样本字符图片和目标字体样本字符图片进行裁剪和去空白处理;
拼接子单元,用于将字符对应的目标字体样本字符图片与标准字体样本字符图片拼接成目标-标准字体字符图片,并进行去空白处理,得到目标-标准字体字符图片数据集。
优选地,训练单元具体包括:
第一输入子单元,用于将目标-标准字体字符图片中的标准字体样本字符部分图片输入至深度卷积对抗生成网络DCGAN的生成器中,得到深度卷积对抗生成网络DCGAN的生成器输出的转换后的目标字体字符图片;
判别子单元,用于将目标-标准字体字符图片中对应的目标字体样本字符部分图片和转换后的目标字体字符图片输入至深度卷积对抗生成网络DCGAN的判别器中,得到判别器根据转换后的目标字体字符图片和目标字体样本字符图片之间的差异性输出的布尔变量;
第一计算子单元,用于通过深度卷积对抗生成网络DCGAN的目标函数,得到目标-标准字体字符图片的损失值;
迭代子单元,用于跳转至第一输入子单元进行迭代训练,直至迭代的次数与预置迭代次数相同或目标-标准字体字符图片的损失值低于第一预置损失值阈值,得到训练后的深度卷积对抗生成网络DCGAN。
优选地,训练单元还包括:
第一获取子单元,用于获取转换后的目标字体字符图片和目标字体样本字符图片之间的L1距离;
第二获取子单元,用于获取L1距离在目标-标准字体字符图片的损失值之中的权重值λ;
第二计算子单元,用于根据目标-标准字体字符图片的损失值以及L1距离在目标-标准字体字符图片的损失值之中的权重值λ,通过生成器的目标函数,得到生成器的损失值;
迭代子单元,用于跳转至第一输入子单元进行迭代训练,直至迭代的次数与预置迭代次数相同或目标-标准字体字符图片的损失值低于第一预置损失值阈值并且生成器的损失值低于第二预置损失值阈值,得到训练后的深度卷积对抗生成网络DCGAN。
优选地,字库生成单元具体包括:
编码子单元,用于将每一张目标字体字符图片进行标准化编码处理,确定每一张目标字体字符在字库中的标准化编码;
转换子单元,用于调用BMFont平台、预置配置文件以及预置批量处理脚本文件,将完整的目标字体字符图片转换为目标字体完整字库FNT文件。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明提供了一种基于DCGAN深度网络的汉字字库生成方法,包括:S1、确定标准字体和目标字体并获取字符对应的标准字体样本字库和目标字体样本字库;S2、对标准字体样本字库和目标字体样本字库进行预处理,得到目标-标准字体字符图片数据集;S3、采用编码器-解码器架构作为生成器,二分类卷积神经网络作为判别器,构建深度卷积对抗生成网络DCGAN;S4、利用目标-标准字体字符图片数据集对深度卷积对抗生成网络DCGAN进行训练,得到训练后的深度卷积对抗生成网络DCGAN;S5、获取标准字体完整字库,并将标准字体完整字库转换为完整的标准字体字符图片;S6、依次将完整的标准字体字符图片输入至训练后的深度卷积对抗生成网络DCGAN的生成器中,由训练后的深度卷积对抗生成网络DCGAN的生成器输出对应的完整的目标字体字符图片;S7、将完整的目标字体字符图片转换为目标字体完整字库。
本发明中,通过确定与已设计好的目标字体样本字库中字符对应的标准字体样本字库,再对标准字体样本字库和目标字体样本字库进行预处理,得到符合后续深度卷积对抗生成网络DCGAN的输入要求的目标-标准字体字符图片数据集,构建深度卷积对抗生成网络DCGAN,并对深度卷积对抗生成网络DCGAN进行训练,使得深度卷积对抗生成网络DCGAN能够根据输入的标准字体字符图片,输出转换后的目标字体字符图片,最后通过依次将完整的标准字体字符图片输入至训练后的深度卷积对抗生成网络DCGAN之中,得到完整的目标字体字符图片,并转换为目标字体完整字库,解决了由于汉字字符结构本身具有一定的相似性,设计六千多个新字体汉字常用字和几万个非常用字必然包含着大量的重复劳动,导致的耗时耗力,浪费人力成本的技术问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明提供了一种基于DCGAN深度网络的汉字字库生成方法的一个实施例的流程示意图;
图2为本发明提供了一种基于DCGAN深度网络的汉字字库生成方法的另一个实施例的流程示意图;
图3为本发明提供了一种基于DCGAN深度网络的汉字字库生成装置的一个实施例的结构示意图;
图4为本发明实施例中编码器-解码器架构示意图;
图5为本发明实施例中判别器型结构示意图;
图6为本发明实施例中将标准字体宋体转换为目标字体黑体的初步效果图;
图7为本发明实施例中生成的目标字体完整字库FNT文件和png文件示意图。
具体实施方式
本发明实施例提供了一种基于DCGAN深度网络的汉字字库生成方法及装置,解决了由于汉字字符结构本身具有一定的相似性,设计六千多个新字体汉字常用字和几万个非常用字必然包含着大量的重复劳动,导致的耗时耗力,浪费人力成本的技术问题。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明提供了一种基于DCGAN深度网络的汉字字库生成方法的一个实施例,包括:
101、确定标准字体和目标字体并获取字符对应的标准字体样本字库和目标字体样本字库;
需要说明的是,选取一种较为工整,笔画线条简单的字体作为标准字体,本发明实施例中使用宋体作为标准字体,同时选取已经设计了一部分字符,但并未设计完整的字体作为目标字体,并且,标准字体和目标字体中的字符需要对应相同。
102、对标准字体样本字库和目标字体样本字库进行预处理,得到目标-标准字体字符图片数据集;
需要说明的是,对标准字体样本字库和目标字体样本字库进行预处理,预处理的步骤将在下一个实施例中进行详细说明,而最终得到符合深度卷积对抗生成网络DCGAN的输入要求的目标字体字符图片在左,标准字体字符图片在右的目标-标准字体字符图片数据集。
103、采用编码器-解码器架构作为生成器,二分类卷积神经网络作为判别器,构建深度卷积对抗生成网络DCGAN;
需要说明的是,本实施例中,采用编码器-解码器架构作为生成器,二分类卷积神经网络作为判别器来构建深度卷积对抗生成网络DCGAN;
请参阅图4,生成器采用输入和输出均为256*256大小的编码器-解码器架构,其中输入部分还包含一个随机噪声向量z,架构之中的编码器部分,通过每一层时都会对输入进一步进行采样,这种架构的设计会让字体笔画这一类共享着的突出边缘的位置信息直接通过架构来到瓶颈层,而架构之中的解码器部分,通过每一层时都包含着一个解卷积的操作,解卷积的操作将赋予输入一些创造性的内容,从而实现字体的变换;
请参阅图5,图5为判别器型结构,在判别器的最后一层后面是一个卷积计算,用于匹配一维输出,接下来是Sigmoid函数;而判别器型结构之中的C64层不适用批正规化处理;判别器型结构中使用的所有ReLU激活函数类型都是斜率为0.2的LeakyReLU;
请参阅图6,图6为将标准字体宋体转换为目标字体黑体的初步效果图。
104、利用目标-标准字体字符图片数据集对深度卷积对抗生成网络DCGAN进行训练,得到训练后的深度卷积对抗生成网络DCGAN;
需要说明的是,利用目标-标准字体字符图片数据集对深度卷积对抗生成网络DCGAN进行训练,训练中以输入的标准字体字符图片为条件,生成为对应的目标字体字符图片,判别器通过判断生成的目标字体字符图片与输入的实际的目标字体字符图片之间的差异性,来约束生成器,从而完成训练,得到训练后的深度卷积对抗生成网络DCGAN。
105、获取标准字体完整字库,并将标准字体完整字库转换为完整的标准字体字符图片;
需要说明的是,为了转换出完整的目标字体字符图片,首先需要获取标准字体完整字库,并将标准字体完整字库转换为完整的标准字体字符图片。
106、依次将完整的标准字体字符图片输入至训练后的深度卷积对抗生成网络DCGAN的生成器中,由训练后的深度卷积对抗生成网络DCGAN的生成器输出对应的完整的目标字体字符图片;
需要说明的是,在得到训练后的深度卷积对抗生成网络DCGAN后,利用训练后的深度卷积对抗生成网络DCGAN来将完整的标准字体字符图片转换为完整的目标字体字符图片。
107、将完整的目标字体字符图片转换为目标字体完整字库。
需要说明的是,得到完整的目标字体字符图片后,将完整的目标字体字符图片转换为目标字体完整字库,得到了和标准字体完整字库对应的目标字体完整字库。
本发明实施例中,通过确定与已设计好的目标字体样本字库中字符对应的标准字体样本字库,再对标准字体样本字库和目标字体样本字库进行预处理,得到符合后续深度卷积对抗生成网络DCGAN的输入要求的目标-标准字体字符图片数据集,构建深度卷积对抗生成网络DCGAN,并对深度卷积对抗生成网络DCGAN进行训练,使得深度卷积对抗生成网络DCGAN能够根据输入的标准字体字符图片,输出转换后的目标字体字符图片,最后通过依次将完整的标准字体字符图片输入至训练后的深度卷积对抗生成网络DCGAN之中,得到完整的目标字体字符图片,并转换为目标字体完整字库,解决了由于汉字字符结构本身具有一定的相似性,设计六千多个新字体汉字常用字和几万个非常用字必然包含着大量的重复劳动,导致的耗时耗力,浪费人力成本的技术问题。
以上是对本发明提供的一种基于DCGAN深度网络的汉字字库生成方法的一个实施例进行的说明,以下将对本发明提供的一种基于DCGAN深度网络的汉字字库生成方法的另一个实施例进行说明。
请参阅图2,本发明提供了一种基于DCGAN深度网络的汉字字库生成方法的另一个实施例,包括:
201、确定标准字体和目标字体并获取字符对应的标准字体样本字库和目标字体样本字库;
需要说明的是,选取一种较为工整,笔画线条简单的字体作为标准字体,本发明实施例中使用宋体作为标准字体,同时选取已经设计了一部分字符,但并未设计完整的字体作为目标字体,并且,标准字体和目标字体中的字符需要对应相同。
步骤202至步骤204为对标准字体样本字库和目标字体样本字库进行预处理的详细步骤,包括:
202、将标准字体样本字库转换为标准字体样本字符图片,将目标字体样本字库转换为目标字体样本字符图片;
需要说明的是,首先将标准字体样本字库和目标字体样本字库转换为单个字符的标准字体样本字符图片和目标字体样本字符图片。
203、对标准字体样本字符图片和目标字体样本字符图片进行裁剪和去空白处理;
需要说明的是,将得到的标准字体样本字符图片和目标字体样本字符图片进行裁剪和去空白处理,裁剪至预置大小,并将除了字符以外的部分透明化,仅保留字符在图片中。
204、将字符对应的目标字体样本字符图片与标准字体样本字符图片拼接成目标-标准字体字符图片,并进行去空白处理,得到目标-标准字体字符图片数据集;
需要说明的是,按照深度卷积对抗生成网络DCGAN的要求,将字符对应的目标字体样本字符图片与标准字体样本字符图片,以目标字体样本字符在左,标准字体样本字符在右的顺序拼接起来,合成目标-标准字体字符图片,并进行去空白处理,最终将所有字符都对应合成,得到目标-标准字体字符图片数据集。
205、采用编码器-解码器架构作为生成器,二分类卷积神经网络作为判别器,构建深度卷积对抗生成网络DCGAN;
需要说明的是,本实施例中,采用编码器-解码器架构作为生成器,二分类卷积神经网络作为判别器来构建深度卷积对抗生成网络DCGAN;
请参阅图4,生成器采用输入和输出均为256*256大小的编码器-解码器架构,其中输入部分还包含一个随机噪声向量z,架构之中的编码器部分,通过每一层时都会对输入进一步进行采样,这种架构的设计会让字体笔画这一类共享着的突出边缘的位置信息直接通过架构来到瓶颈层,而架构之中的解码器部分,通过每一层时都包含着一个解卷积的操作,解卷积的操作将赋予输入一些创造性的内容,从而实现字体的变换;
请参阅图5,图5为判别器型结构,在判别器的最后一层后面是一个卷积计算,用于匹配一维输出,接下来是Sigmoid函数;而判别器型结构之中的C64层不适用批正规化处理;判别器型结构中使用的所有ReLU激活函数类型都是斜率为0.2的LeakyReLU;
请参阅图6,图6为将标准字体宋体转换为目标字体黑体的初步效果图。
步骤206至步骤212为对深度卷积对抗生成网络DCGAN的训练过程,具体包括:
206、将目标-标准字体字符图片中的标准字体样本字符部分图片输入至深度卷积对抗生成网络DCGAN的生成器中,得到深度卷积对抗生成网络DCGAN的生成器输出的转换后的目标字体字符图片;
需要说明的是,将目标-标准字体字符图片中的标准字体样本字符部分图片输入至深度卷积对抗生成网络DCGAN的生成器中,得到深度卷积对抗生成网络DCGAN的生成器输出的转换后的目标字体字符图片。
207、将目标-标准字体字符图片中对应的目标字体样本字符部分图片和转换后的目标字体字符图片输入至深度卷积对抗生成网络DCGAN的判别器中,得到判别器根据转换后的目标字体字符图片和目标字体样本字符图片之间的差异性输出的布尔变量;
需要说明的是,将目标-标准字体字符图片中对应的目标字体样本字符部分图片和转换后的目标字体字符图片输入至深度卷积对抗生成网络DCGAN的判别器中,得到判别器根据转换后的目标字体字符图片和目标字体样本字符图片之间的差异性输出的布尔变量,其中,布尔变量为0-1。
208、通过深度卷积对抗生成网络DCGAN的目标函数,得到目标-标准字体字符图片的损失值;
需要说明的是,通过深度卷积对抗生成网络DCGAN的目标函数,得到目标-标准字体字符图片的损失值,其中,深度卷积对抗生成网络DCGAN的目标函数为:
其中,x表示标准字体字符图片,y表示目标字体字符图片,Pdata(x,y)表示真实样本分布,G(x,z)表示生成器输出的目标字体字符图片,D(x,y)是判别器的判别结果,表示y属于真实分布的概率。
209、获取转换后的目标字体字符图片和目标字体样本字符图片之间的L1距离;
需要说明的是,对于生成器而言,生成器的目标是通过最大化判别器的损失值从而来最小化自身的损失值,获取转换后的目标字体字符图片与目标字体样本字符图片之间的L1距离,并将转换后的目标字体字符图片与目标字体样本字符图片之间的L1距离作为生成器的损失值之一,这将有效改善生成器输出字符图像的质量。
210、获取L1距离在目标-标准字体字符图片的损失值之中的权重值λ;
需要说明的是,获取L1距离在目标-标准字体字符图片的损失值之中的权重值λ。
211、根据目标-标准字体字符图片的损失值以及L1距离在目标-标准字体字符图片的损失值之中的权重值λ,通过生成器的目标函数,得到生成器的损失值;
需要说明的是,根据目标-标准字体字符图片的损失值以及L1距离在目标-标准字体字符图片的损失值之中的权重值λ,通过生成器的目标函数,得到生成器的损失值,其中,生成器的目标函数为:
其中,λ为L1距离在目标-标准字体字符图片的损失值之中的权重值。
212、返回步骤206进行迭代训练,直至迭代的次数与预置迭代次数相同或目标-标准字体字符图片的损失值低于第一预置损失值阈值并且生成器的损失值低于第二预置损失值阈值,得到训练后的深度卷积对抗生成网络DCGAN;
需要说明的是,返回步骤206进行迭代训练,直至迭代的次数与预置迭代次数相同或目标-标准字体字符图片的损失值低于第一预置损失值阈值并且生成器的损失值低于第二预置损失值阈值,得到训练后的深度卷积对抗生成网络DCGAN。
213、获取标准字体完整字库,并将标准字体完整字库转换为完整的标准字体字符图片;
需要说明的是,为了转换出完整的目标字体字符图片,首先需要获取标准字体完整字库,并将标准字体完整字库转换为完整的标准字体字符图片。
214、依次将完整的标准字体字符图片输入至训练后的深度卷积对抗生成网络DCGAN的生成器中,由训练后的深度卷积对抗生成网络DCGAN的生成器输出对应的完整的目标字体字符图片;
需要说明的是,在得到训练后的深度卷积对抗生成网络DCGAN后,利用训练后的深度卷积对抗生成网络DCGAN来将完整的标准字体字符图片转换为完整的目标字体字符图片。
步骤215和步骤216为将完整的目标字体字符图片转换为目标字体完整字库的具体过程,包括:
215、将每一张目标字体字符图片进行标准化编码处理,确定每一张目标字体字符在字库中的标准化编码;
需要说明的是,根据GB2312标准,对每一张目标字体字符图片进行标准化编码处理,确定每一张目标字体字符在字库中的标准化编码。
216、调用BMFont平台、预置配置文件以及预置批量处理脚本文件,将完整的目标字体字符图片转换为目标字体完整字库FNT文件。
需要说明的是,调用BMFont平台、预置配置文件以及预置批量处理脚本文件,其中,预置配置文件config.bmfc内包括了完整的目标字体字符图片的保存路径,目标字体字符的长度、色深和源文件格式等属性,并录入了每一张目标字体字符在字库中的标准化编码;
预置批量处理脚本文件make.bat能够使得BMFont对目标字体进行批量处理生成,以提交工作的效率;
通过预置批量处理脚本文件进行批量处理,并在预置配置文件中说明字库文件生成的细节,能有效地将完整的目标字体字符图片转换为目标字体完整字库FNT文件,供操作系统直接使用;
请参阅图7,图7为生成的目标字体完整字库FNT文件和png文件示意图。
本发明实施例中,通过确定与已设计好的目标字体样本字库中字符对应的标准字体样本字库,再对标准字体样本字库和目标字体样本字库进行预处理,得到符合后续深度卷积对抗生成网络DCGAN的输入要求的目标-标准字体字符图片数据集,构建深度卷积对抗生成网络DCGAN,并对深度卷积对抗生成网络DCGAN进行训练,使得深度卷积对抗生成网络DCGAN能够根据输入的标准字体字符图片,输出转换后的目标字体字符图片,最后通过依次将完整的标准字体字符图片输入至训练后的深度卷积对抗生成网络DCGAN之中,得到完整的目标字体字符图片,并转换为目标字体完整字库,解决了由于汉字字符结构本身具有一定的相似性,设计六千多个新字体汉字常用字和几万个非常用字必然包含着大量的重复劳动,导致的耗时耗力,浪费人力成本的技术问题,进一步地,将生成器的输出图片与目标图片之间的L1距离作为生成器损失之一。训练得到性能良好的生成器,能生成清晰的,具备实用价值的中文字符图片。
以上是对本发明提供的一种基于DCGAN深度网络的汉字字库生成方法的另一个实施例进行的说明,以下将对本发明提供的一种基于DCGAN深度网络的汉字字库生成装置进行说明。
请参阅图3,本发明提供的一种基于DCGAN深度网络的汉字字库生成装置的一个实施例,包括:
第一获取单元301,用于确定标准字体和目标字体并获取字符对应的标准字体样本字库和目标字体样本字库;
第一预处理单元302,用于对标准字体样本字库和目标字体样本字库进行预处理,得到目标-标准字体字符图片数据集;
构建单元303,用于采用编码器-解码器架构作为生成器,二分类卷积神经网络作为判别器,构建深度卷积对抗生成网络DCGAN;
训练单元304,用于利用目标-标准字体字符图片数据集对深度卷积对抗生成网络DCGAN进行训练,得到训练后的深度卷积对抗生成网络DCGAN;
第二获取单元305,用于获取标准字体完整字库,并将标准字体完整字库转换为完整的标准字体字符图片;
转换单元306,用于依次将完整的标准字体字符图片输入至训练后的深度卷积对抗生成网络DCGAN的生成器中,由训练后的深度卷积对抗生成网络DCGAN的生成器输出对应的完整的目标字体字符图片;
字库生成单元307,用于将完整的目标字体字符图片转换为目标字体完整字库;
进一步地,第一预处理单元301具体包括:
转换子单元3011,用于将标准字体样本字库转换为标准字体样本字符图片,将目标字体样本字库转换为目标字体样本字符图片;
处理子单元3012,用于对标准字体样本字符图片和目标字体样本字符图片进行裁剪和去空白处理;
拼接子单元3013,用于将字符对应的目标字体样本字符图片与标准字体样本字符图片拼接成目标-标准字体字符图片,并进行去空白处理,得到目标-标准字体字符图片数据集。
进一步地,训练单元304具体包括:
第一输入子单元3041,用于将目标-标准字体字符图片中的标准字体样本字符部分图片输入至深度卷积对抗生成网络DCGAN的生成器中,得到深度卷积对抗生成网络DCGAN的生成器输出的转换后的目标字体字符图片;
判别子单元3042,用于将目标-标准字体字符图片中对应的目标字体样本字符部分图片和转换后的目标字体字符图片输入至深度卷积对抗生成网络DCGAN的判别器中,得到判别器根据转换后的目标字体字符图片和目标字体样本字符图片之间的差异性输出的布尔变量;
第一计算子单元3043,用于通过深度卷积对抗生成网络DCGAN的目标函数,得到目标-标准字体字符图片的损失值;
迭代子单元3044,用于跳转至第一输入子单元3041进行迭代训练,直至迭代的次数与预置迭代次数相同或目标-标准字体字符图片的损失值低于第一预置损失值阈值,得到训练后的深度卷积对抗生成网络DCGAN。
进一步地,训练单元304还包括:
第一获取子单元3045,用于获取转换后的目标字体字符图片和目标字体样本字符图片之间的L1距离;
第二获取子单元3046,用于获取L1距离在目标-标准字体字符图片的损失值之中的权重值λ;
第二计算子单元3047,用于根据目标-标准字体字符图片的损失值以及L1距离在目标-标准字体字符图片的损失值之中的权重值λ,通过生成器的目标函数,得到生成器的损失值;
迭代子单元3044,用于跳转至第一输入子单元进行迭代训练,直至迭代的次数与预置迭代次数相同或目标-标准字体字符图片的损失值低于第一预置损失值阈值并且生成器的损失值低于第二预置损失值阈值,得到训练后的深度卷积对抗生成网络DCGAN。
进一步地,字库生成单元307具体包括:
编码子单元3071,用于将每一张目标字体字符图片进行标准化编码处理,确定每一张目标字体字符在字库中的标准化编码;
转换子单元3072,用于调用BMFont平台、预置配置文件以及预置批量处理脚本文件,将完整的目标字体字符图片转换为目标字体完整字库FNT文件。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于DCGAN深度网络的汉字字库生成方法,其特征在于,包括:
S1、确定标准字体和目标字体并获取字符对应的标准字体样本字库和目标字体样本字库;
S2、对标准字体样本字库和目标字体样本字库进行预处理,得到目标-标准字体字符图片数据集;
S3、采用编码器-解码器架构作为生成器,二分类卷积神经网络作为判别器,构建深度卷积对抗生成网络DCGAN;
S4、利用目标-标准字体字符图片数据集对深度卷积对抗生成网络DCGAN进行训练,得到训练后的深度卷积对抗生成网络DCGAN;
S5、获取标准字体完整字库,并将标准字体完整字库转换为完整的标准字体字符图片;
S6、依次将完整的标准字体字符图片输入至训练后的深度卷积对抗生成网络DCGAN的生成器中,由训练后的深度卷积对抗生成网络DCGAN的生成器输出对应的完整的目标字体字符图片;
S7、将完整的目标字体字符图片转换为目标字体完整字库。
2.根据权利要求1所述的基于DCGAN深度网络的汉字字库生成方法,其特征在于,步骤S2具体包括:
S21、将标准字体样本字库转换为标准字体样本字符图片,将目标字体样本字库转换为目标字体样本字符图片;
S22、对标准字体样本字符图片和目标字体样本字符图片进行裁剪和去空白处理;
S23、将字符对应的目标字体样本字符图片与标准字体样本字符图片拼接成目标-标准字体字符图片,并进行去空白处理,得到目标-标准字体字符图片数据集。
3.根据权利要求2所述的基于DCGAN深度网络的汉字字库生成方法,其特征在于,步骤S4具体包括:
S41、将目标-标准字体字符图片中的标准字体样本字符部分图片输入至深度卷积对抗生成网络DCGAN的生成器中,得到深度卷积对抗生成网络DCGAN的生成器输出的转换后的目标字体字符图片;
S42、将目标-标准字体字符图片中对应的目标字体样本字符部分图片和转换后的目标字体字符图片输入至深度卷积对抗生成网络DCGAN的判别器中,得到判别器根据转换后的目标字体字符图片和目标字体样本字符图片之间的差异性输出的布尔变量;
S43、通过深度卷积对抗生成网络DCGAN的目标函数,得到目标-标准字体字符图片的损失值;
S44、返回步骤S41进行迭代训练,直至迭代的次数与预置迭代次数相同或目标-标准字体字符图片的损失值低于第一预置损失值阈值,得到训练后的深度卷积对抗生成网络DCGAN。
4.根据权利要求3所述的基于DCGAN深度网络的汉字字库生成方法,其特征在于,步骤S43之后还包括:
S431、获取转换后的目标字体字符图片和目标字体样本字符图片之间的L1距离;
S432、获取L1距离在目标-标准字体字符图片的损失值之中的权重值λ;
S433、根据目标-标准字体字符图片的损失值以及L1距离在目标-标准字体字符图片的损失值之中的权重值λ,通过生成器的目标函数,得到生成器的损失值;
S44、返回步骤S41进行迭代训练,直至迭代的次数与预置迭代次数相同或目标-标准字体字符图片的损失值低于第一预置损失值阈值并且生成器的损失值低于第二预置损失值阈值,得到训练后的深度卷积对抗生成网络DCGAN。
5.根据权利要求1所述的基于DCGAN深度网络的汉字字库生成方法,其特征在于,步骤S7具体包括:
S71、将每一张目标字体字符图片进行标准化编码处理,确定每一张目标字体字符在字库中的标准化编码;
S72、调用BMFont平台、预置配置文件以及预置批量处理脚本文件,将完整的目标字体字符图片转换为目标字体完整字库FNT文件。
6.一种基于DCGAN深度网络的汉字字库生成装置,其特征在于,包括:
第一获取单元,用于确定标准字体和目标字体并获取字符对应的标准字体样本字库和目标字体样本字库;
第一预处理单元,用于对标准字体样本字库和目标字体样本字库进行预处理,得到目标-标准字体字符图片数据集;
构建单元,用于采用编码器-解码器架构作为生成器,二分类卷积神经网络作为判别器,构建深度卷积对抗生成网络DCGAN;
训练单元,用于利用目标-标准字体字符图片数据集对深度卷积对抗生成网络DCGAN进行训练,得到训练后的深度卷积对抗生成网络DCGAN;
第二获取单元,用于获取标准字体完整字库,并将标准字体完整字库转换为完整的标准字体字符图片;
转换单元,用于依次将完整的标准字体字符图片输入至训练后的深度卷积对抗生成网络DCGAN的生成器中,由训练后的深度卷积对抗生成网络DCGAN的生成器输出对应的完整的目标字体字符图片;
字库生成单元,用于将完整的目标字体字符图片转换为目标字体完整字库。
7.根据权利要求6所述的基于DCGAN深度网络的汉字字库生成装置,其特征在于,第一预处理单元具体包括:
转换子单元,用于将标准字体样本字库转换为标准字体样本字符图片,将目标字体样本字库转换为目标字体样本字符图片;
处理子单元,用于对标准字体样本字符图片和目标字体样本字符图片进行裁剪和去空白处理;
拼接子单元,用于将字符对应的目标字体样本字符图片与标准字体样本字符图片拼接成目标-标准字体字符图片,并进行去空白处理,得到目标-标准字体字符图片数据集。
8.根据权利要求7所述的基于DCGAN深度网络的汉字字库生成装置,其特征在于,训练单元具体包括:
第一输入子单元,用于将目标-标准字体字符图片中的标准字体样本字符部分图片输入至深度卷积对抗生成网络DCGAN的生成器中,得到深度卷积对抗生成网络DCGAN的生成器输出的转换后的目标字体字符图片;
判别子单元,用于将目标-标准字体字符图片中对应的目标字体样本字符部分图片和转换后的目标字体字符图片输入至深度卷积对抗生成网络DCGAN的判别器中,得到判别器根据转换后的目标字体字符图片和目标字体样本字符图片之间的差异性输出的布尔变量;
第一计算子单元,用于通过深度卷积对抗生成网络DCGAN的目标函数,得到目标-标准字体字符图片的损失值;
迭代子单元,用于跳转至第一输入子单元进行迭代训练,直至迭代的次数与预置迭代次数相同或目标-标准字体字符图片的损失值低于第一预置损失值阈值,得到训练后的深度卷积对抗生成网络DCGAN。
9.根据权利要求8所述的基于DCGAN深度网络的汉字字库生成装置,其特征在于,训练单元还包括:
第一获取子单元,用于获取转换后的目标字体字符图片和目标字体样本字符图片之间的L1距离;
第二获取子单元,用于获取L1距离在目标-标准字体字符图片的损失值之中的权重值λ;
第二计算子单元,用于根据目标-标准字体字符图片的损失值以及L1距离在目标-标准字体字符图片的损失值之中的权重值λ,通过生成器的目标函数,得到生成器的损失值;
迭代子单元,用于跳转至第一输入子单元进行迭代训练,直至迭代的次数与预置迭代次数相同或目标-标准字体字符图片的损失值低于第一预置损失值阈值并且生成器的损失值低于第二预置损失值阈值,得到训练后的深度卷积对抗生成网络DCGAN。
10.根据权利要求6所述的基于DCGAN深度网络的汉字字库生成装置,其特征在于,字库生成单元具体包括:
编码子单元,用于将每一张目标字体字符图片进行标准化编码处理,确定每一张目标字体字符在字库中的标准化编码;
转换子单元,用于调用BMFont平台、预置配置文件以及预置批量处理脚本文件,将完整的目标字体字符图片转换为目标字体完整字库FNT文件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810079205.1A CN108170649B (zh) | 2018-01-26 | 2018-01-26 | 一种基于dcgan深度网络的汉字字库生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810079205.1A CN108170649B (zh) | 2018-01-26 | 2018-01-26 | 一种基于dcgan深度网络的汉字字库生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108170649A true CN108170649A (zh) | 2018-06-15 |
CN108170649B CN108170649B (zh) | 2021-06-01 |
Family
ID=62516159
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810079205.1A Active CN108170649B (zh) | 2018-01-26 | 2018-01-26 | 一种基于dcgan深度网络的汉字字库生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108170649B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108647786A (zh) * | 2018-07-10 | 2018-10-12 | 电子科技大学 | 基于深度卷积对抗神经网络的旋转机械在线故障监测方法 |
CN108960425A (zh) * | 2018-07-05 | 2018-12-07 | 广东工业大学 | 一种渲染模型训练方法、系统、设备、介质及渲染方法 |
CN109146868A (zh) * | 2018-08-27 | 2019-01-04 | 北京青燕祥云科技有限公司 | 3d肺结节生成方法、装置及电子设备 |
CN109285111A (zh) * | 2018-09-20 | 2019-01-29 | 广东工业大学 | 一种字体转换的方法、装置、设备及计算机可读存储介质 |
CN110033054A (zh) * | 2019-03-14 | 2019-07-19 | 上海交通大学 | 基于协同笔画优化的个性化手写体迁移方法和系统 |
CN110097615A (zh) * | 2018-12-06 | 2019-08-06 | 北京大学 | 一种联合风格化和去风格化的艺术字编辑方法和系统 |
CN110135530A (zh) * | 2019-05-16 | 2019-08-16 | 京东方科技集团股份有限公司 | 转换图像中汉字字体的方法及系统、计算机设备及介质 |
CN110246197A (zh) * | 2019-05-21 | 2019-09-17 | 北京奇艺世纪科技有限公司 | 验证码字符生成方法、装置、电子设备及存储介质 |
CN110852037A (zh) * | 2019-09-18 | 2020-02-28 | 宁波江丰生物信息技术有限公司 | 一种图片字库的调取方法 |
CN110956133A (zh) * | 2019-11-29 | 2020-04-03 | 上海眼控科技股份有限公司 | 单字符文本归一化模型训练方法、文本识别方法及装置 |
CN110969681A (zh) * | 2019-11-29 | 2020-04-07 | 山东浪潮人工智能研究院有限公司 | 一种基于gan网络的手写体书法文字生成方法 |
CN111079374A (zh) * | 2019-12-06 | 2020-04-28 | 腾讯科技(深圳)有限公司 | 字体生成方法、装置和存储介质 |
JP2022058696A (ja) * | 2021-04-30 | 2022-04-12 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 敵対的ネットワークモデルのトレーニング方法、文字ライブラリの作成方法、並びにそれらの装置、電子機器、記憶媒体並びにコンピュータプログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116848524A (zh) * | 2022-01-28 | 2023-10-03 | 约翰·楚 | 检索库生成方法、装置、电子设备和介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012037721A1 (en) * | 2010-09-21 | 2012-03-29 | Hewlett-Packard Development Company,L.P. | Handwritten character font library |
CN106384094A (zh) * | 2016-09-18 | 2017-02-08 | 北京大学 | 一种基于书写风格建模的中文字库自动生成方法 |
CN107392973A (zh) * | 2017-06-06 | 2017-11-24 | 中国科学院自动化研究所 | 像素级手写体汉字自动生成方法、存储设备、处理装置 |
CN107577651A (zh) * | 2017-08-25 | 2018-01-12 | 上海交通大学 | 基于对抗网络的汉字字体迁移系统 |
-
2018
- 2018-01-26 CN CN201810079205.1A patent/CN108170649B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012037721A1 (en) * | 2010-09-21 | 2012-03-29 | Hewlett-Packard Development Company,L.P. | Handwritten character font library |
CN106384094A (zh) * | 2016-09-18 | 2017-02-08 | 北京大学 | 一种基于书写风格建模的中文字库自动生成方法 |
CN107392973A (zh) * | 2017-06-06 | 2017-11-24 | 中国科学院自动化研究所 | 像素级手写体汉字自动生成方法、存储设备、处理装置 |
CN107577651A (zh) * | 2017-08-25 | 2018-01-12 | 上海交通大学 | 基于对抗网络的汉字字体迁移系统 |
Non-Patent Citations (2)
Title |
---|
_大猪: "bmFont的使用方法", 《HTTPS://BLOG.CSDN.NET/U013654125/ARTICLE/DETAILS/78672809》 * |
SHUMEET BALUJA: "Learning typographic style: from discrimination to synthesis", 《MACHINE VISION AND APPLICATIONS》 * |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108960425A (zh) * | 2018-07-05 | 2018-12-07 | 广东工业大学 | 一种渲染模型训练方法、系统、设备、介质及渲染方法 |
CN108960425B (zh) * | 2018-07-05 | 2022-04-19 | 广东工业大学 | 一种渲染模型训练方法、系统、设备、介质及渲染方法 |
CN108647786A (zh) * | 2018-07-10 | 2018-10-12 | 电子科技大学 | 基于深度卷积对抗神经网络的旋转机械在线故障监测方法 |
CN109146868A (zh) * | 2018-08-27 | 2019-01-04 | 北京青燕祥云科技有限公司 | 3d肺结节生成方法、装置及电子设备 |
CN109285111A (zh) * | 2018-09-20 | 2019-01-29 | 广东工业大学 | 一种字体转换的方法、装置、设备及计算机可读存储介质 |
CN110097615A (zh) * | 2018-12-06 | 2019-08-06 | 北京大学 | 一种联合风格化和去风格化的艺术字编辑方法和系统 |
CN110097615B (zh) * | 2018-12-06 | 2021-01-19 | 北京大学 | 一种联合风格化和去风格化的艺术字编辑方法和系统 |
CN110033054A (zh) * | 2019-03-14 | 2019-07-19 | 上海交通大学 | 基于协同笔画优化的个性化手写体迁移方法和系统 |
WO2020228493A1 (zh) * | 2019-05-16 | 2020-11-19 | 京东方科技集团股份有限公司 | 转换图像中汉字字体的方法及系统、计算机设备及介质 |
CN110135530A (zh) * | 2019-05-16 | 2019-08-16 | 京东方科技集团股份有限公司 | 转换图像中汉字字体的方法及系统、计算机设备及介质 |
US11587343B2 (en) | 2019-05-16 | 2023-02-21 | Boe Technology Group Co., Ltd. | Method and system for converting font of Chinese character in image, computer device and medium |
CN110246197A (zh) * | 2019-05-21 | 2019-09-17 | 北京奇艺世纪科技有限公司 | 验证码字符生成方法、装置、电子设备及存储介质 |
CN110246197B (zh) * | 2019-05-21 | 2023-12-26 | 北京奇艺世纪科技有限公司 | 验证码字符生成方法、装置、电子设备及存储介质 |
CN110852037A (zh) * | 2019-09-18 | 2020-02-28 | 宁波江丰生物信息技术有限公司 | 一种图片字库的调取方法 |
CN110852037B (zh) * | 2019-09-18 | 2023-10-10 | 宁波江丰生物信息技术有限公司 | 一种图片字库的调取方法 |
CN110956133A (zh) * | 2019-11-29 | 2020-04-03 | 上海眼控科技股份有限公司 | 单字符文本归一化模型训练方法、文本识别方法及装置 |
CN110969681A (zh) * | 2019-11-29 | 2020-04-07 | 山东浪潮人工智能研究院有限公司 | 一种基于gan网络的手写体书法文字生成方法 |
CN110969681B (zh) * | 2019-11-29 | 2023-08-29 | 山东浪潮科学研究院有限公司 | 一种基于gan网络的手写体书法文字生成方法 |
CN111079374A (zh) * | 2019-12-06 | 2020-04-28 | 腾讯科技(深圳)有限公司 | 字体生成方法、装置和存储介质 |
CN111079374B (zh) * | 2019-12-06 | 2023-06-16 | 腾讯科技(深圳)有限公司 | 字体生成方法、装置和存储介质 |
JP2022058696A (ja) * | 2021-04-30 | 2022-04-12 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 敵対的ネットワークモデルのトレーニング方法、文字ライブラリの作成方法、並びにそれらの装置、電子機器、記憶媒体並びにコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN108170649B (zh) | 2021-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108170649A (zh) | 一种基于dcgan深度网络的汉字字库生成方法及装置 | |
Rahman et al. | A new benchmark on american sign language recognition using convolutional neural network | |
Azadi et al. | Multi-content gan for few-shot font style transfer | |
Wang et al. | Deepfont: Identify your font from an image | |
CN105320965B (zh) | 基于深度卷积神经网络的空谱联合的高光谱图像分类方法 | |
CN110032635B (zh) | 一种基于深度特征融合神经网络的问题对匹配方法和装置 | |
CN109783666B (zh) | 一种基于迭代精细化的图像场景图谱生成方法 | |
CN106570521B (zh) | 多语言场景字符识别方法及识别系统 | |
CN105678293A (zh) | 一种基于cnn-rnn的复杂图像字序列识别方法 | |
CN109711465B (zh) | 基于mll和asca-fr的图像字幕生成方法 | |
CN109522553A (zh) | 命名实体的识别方法及装置 | |
CN107516096A (zh) | 一种字符识别方法及装置 | |
CN108304357A (zh) | 一种基于字体流形的中文字库自动生成方法 | |
CN110175248B (zh) | 一种基于深度学习和哈希编码的人脸图像检索方法和装置 | |
CN108537120A (zh) | 一种基于深度学习的人脸识别方法及系统 | |
Kamal et al. | Textmage: The automated bangla caption generator based on deep learning | |
CN104036242B (zh) | 基于Centering Trick卷积限制玻尔兹曼机的物体识别方法 | |
CN106355210B (zh) | 基于深度神经元响应模式的绝缘子红外图像特征表达方法 | |
CN115240201B (zh) | 利用汉字骨架信息减缓网络模式崩溃问题的汉字生成方法 | |
Guo et al. | Creating New Chinese Fonts based on Manifold Learning and Adversarial Networks. | |
CN108537855B (zh) | 一种草图一致的陶瓷花纸图案生成方法及装置 | |
Qin et al. | Restore the incomplete calligraphy based on style transfer | |
CN115331236A (zh) | 一种手写整行样本的生成方法和装置 | |
Panda et al. | Complex Odia Handwritten Character Recognition using Deep Learning Model | |
Zheng et al. | Image captioning with integrated bottom-up and multi-level residual top-down attention for game scene understanding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |