CN110956678B - 字形的处理方法和装置 - Google Patents

字形的处理方法和装置 Download PDF

Info

Publication number
CN110956678B
CN110956678B CN201911291043.9A CN201911291043A CN110956678B CN 110956678 B CN110956678 B CN 110956678B CN 201911291043 A CN201911291043 A CN 201911291043A CN 110956678 B CN110956678 B CN 110956678B
Authority
CN
China
Prior art keywords
font
skeleton line
font type
model
target text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911291043.9A
Other languages
English (en)
Other versions
CN110956678A (zh
Inventor
刘成东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201911291043.9A priority Critical patent/CN110956678B/zh
Publication of CN110956678A publication Critical patent/CN110956678A/zh
Application granted granted Critical
Publication of CN110956678B publication Critical patent/CN110956678B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/203Drawing of straight lines or curves

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

本发明实施例提供一种字形的处理方法和装置,通过获取第一字体类型的目标文本的字形对应的骨架线图像;骨架线图像用于指示第一字体类型的目标文本的字形的结构信息;根据骨架线图像和第二字体类型对应的第一模型,生成第三字体类型的目标文本的字形;其中,第一模型用于指示第二字体类型的笔触信息,第三字体类型、第二字体类型与第一字体类型均不相同。由于第二字体类型对应的第一模型包含第二字体类型的目标文本的字形的笔触信息,可以在第一字体的骨架线图像经过第一模型处理时,将第二字体的笔触信息添加进去,实现了自动把第一字体类型对应的的结构信息和第二字体类型对应的笔触信息融合在一起,产生一种新字体类型,提高新字体的开发效率。

Description

字形的处理方法和装置
技术领域
本发明涉及计算机图像处理技术领域,尤其涉及一种字形的处理方法和装置。
背景技术
随着计算机技术的发展与人们审美艺术的变化,各种风格的字体层出不穷,现有字库制作精良,风格独特,利用已有字库风格,进行字体风格融合,尤其是将两款字体的结构与笔触进行融合,可快速完成新字体生成工作,大幅提升制作效率。
目前,学术界与工业界对于风格迁移与融合的研究很多,以Zi2Zi为代表的深度生成对抗网络,已经在字体生成方面取得良好效果。但是,尚未存在能够自动将特定字体的结构与笔触信息进行融合的方法,导致新字体开发效率低。
发明内容
本发明实施例提供一种字形的处理方法和装置,利用深度网络实现字体风格的融合,使得能够自动将特定字体的结构与笔触信息进行有效融合,提高了新字体开发效率。
第一方面,本发明实施例提供一种字形的处理方法,包括:
获取第一字体类型的目标文本的字形对应的骨架线图像;所述骨架线图像用于指示所述第一字体类型的目标文本的字形的结构信息;
根据所述骨架线图像和第二字体类型对应的第一模型,生成第三字体类型的目标文本的字形;其中,所述第一模型用于指示所述第二字体类型的笔触信息,所述第三字体类型、第二字体类型与所述第一字体类型均不相同。
可选地,所述根据所述骨架线图像和第二字体类型对应的第一模型,生成第三字体类型的目标文本的字形,包括:
将所述骨架线图像输入至所述第一模型,得到所述目标文本的字形对应的字符图像;
对所述目标文本的字形对应的字符图像进行矢量化处理,得到所述目标文本的字形。
可选地,所述根据所述骨架线图像和第二字体类型对应的第一模型,生成第三字体类型的目标文本的字形之前,还包括:
获取多个所述第二字体类型的第一历史文本的字形对应的骨架线图像,以及每一个第一历史文本的字形对应的字符图像;
根据所述多个第一历史文本的字形对应的骨架线图像,以及所述每一个第一历史文本的字形对应的字符图像,对第一初始模型进行训练得到所述第一模型。
可选地,所述获取第一字体类型的目标文本的字形对应的骨架线图像,包括:
获取所述目标文本的字形对应的第一字符图像;
根据所述第一字符图像和第二模型,获取所述目标文本的字形对应的所述骨架线图像;其中,所述第二模型用于提取字符图像中的骨架线图像。
可选地,所述根据所述第一字符图像和第二模型,获取所述目标文本的字形对应的所述骨架线图像之前,还包括:
获取多个第二历史文本的字形对应的字符图像,以及每一个第二历史文本的字形对应的骨架线图像;
根据所述多个第二历史文本的字形对应的字符图像,以及所述每一个第二历史文本的字形对应的骨架线图像,对第二初始模型进行训练得到所述第二模型。
第二方面,本发明实施例提供一种字形的处理装置,包括:
获取单元,用于获取第一字体类型的目标文本的字形对应的骨架线图像;所述骨架线图像用于指示所述第一字体类型的目标文本的字形的结构信息;
处理单元,用于根据所述骨架线图像和第二字体类型对应的第一模型,生成第三字体类型的目标文本的字形;其中,所述第一模型用于指示所述第二字体类型的笔触信息,所述第三字体类型、第二字体类型与所述第一字体类型均不相同。
可选地,所述处理单元,具体用于将所述骨架线图像输入至所述第一模型,得到所述目标文本的字形对应的字符图像;对所述目标文本的字形对应的字符图像进行矢量化处理,得到所述目标文本的字形。
可选地,所述获取单元,还用于获取多个所述第二字体类型的第一历史文本的字形对应的骨架线图像,以及每一个第一历史文本的字形对应的字符图像;
所述处理单元,还用于根据所述多个第一历史文本的字形对应的骨架线图像,以及所述每一个第一历史文本的字形对应的字符图像,对第一初始模型进行训练得到所述第一模型。
可选地,所述获取单元,具体用于获取所述目标文本的字形对应的第一字符图像;根据所述第一字符图像和第二模型,获取所述目标文本的字形对应的所述骨架线图像;其中,所述第二模型用于提取字符图像中的骨架线图像。
可选地,所述获取单元,还用于获取多个第二历史文本的字形对应的字符图像,以及每一个第二历史文本的字形对应的骨架线图像;
所述处理单元,还用于根据所述多个第二历史文本的字形对应的字符图像,以及所述每一个第二历史文本的字形对应的骨架线图像,对第二初始模型进行训练得到所述第二模型。
第三方面,本发明实施例提供一种电子设备,包括存储器和处理器;
存储器,用于存储计算机程序;
处理器,用于读取存储器存储的计算机程序,并根据所述存储器中的计算机程序执行如第一方面中任一所述的字形的处理方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面中任一所述的字形的处理方法。
本发明实施例提供一种字形的处理方法和装置,通过获取第一字体类型的目标文本的字形对应的骨架线图像;骨架线图像用于指示第一字体类型的目标文本的字形的结构信息;根据骨架线图像和第二字体类型对应的第一模型,生成第三字体类型的目标文本的字形;其中,第一模型用于指示第二字体类型的笔触信息,第三字体类型、第二字体类型与第一字体类型均不相同。由于第二字体类型对应的第一模型包含了第二字体类型的目标文本的字形的笔触信息,可以在第一字体类型的目标文本的字形的骨架线图像经过第一模型处理的时候,将第二字体类型的目标文本的字形的笔触信息添加进去,从而实现了自动把第一字体类型的目标文本的字形的结构信息和第二字体类型的目标文本的字形的笔触信息融合在一起,即自动将两种待融合的特定字体的结构与笔触信息有效融合,产生一种第三字体类型,即新字体类型,从而提高了新字体的开发效率。
应当理解,上述发明内容部分中所描述的内容并非旨在限定本发明的实施例的关键或重要特征,亦非用于限制本发明的范围。本发明的其它特征将通过以下的描述变得容易理解。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本发明实施例提供的一种字形的处理方法的流程图;
图2是本发明实施例提供的另一种字形的处理方法的流程图;
图3为本申请实施例提供的一种骨架线提取网络模型训练示意图;
图4为本申请实施例提供的一种骨架线提取网络模型的架构示意图;
图5为本发明实施例提的一种获取第一字体类型的目标文本的字形对应的骨架线图像的流程示意图;
图6为本申请实施例提供的一种笔触蒙皮渲染模型训练示意图;
图7为本申请实施例提供的一种笔触蒙皮渲染网络的架构示意图;
图8为本发明实施例提的一种生成第三字体类型的目标文本的字形流程示意图;
图9为本申请实施例提供的一种第三字体类型的目标文本的字形对应的字符图像生成示意图;
图10为本发明实施例三提供的字形的处理装置的结构示意图;
图11为本发明实施例提供的一种电子设备90的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在本发明的实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,其中A,B可以是单数或者复数。在本发明的文字描述中,字符“/”一般表示前后关联对象是一种“或”的关系。
本发明实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明实施例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先对本发明所涉及的名词进行解释:
字体结构信息:字体风格的重要组成部分,表示字体的整体架构,具体到每一个字符上,用骨架线表示。
字体笔触信息:字体风格的重要组成部分,表示字体在笔画细节实现,具体到每一个字符上,用外部轮廓表示起笔、运笔与收笔等信息。
生成对抗网络:一种深度网络结构,包括生成器与判别器,通过对抗训练的形式不断提升生成器的仿真能力。
图像矢量化:普通字符图像是位图形式,而字库图像都是用矢量轮廓来表征字符的字形,以提升字库质量、降低存储空间。图像矢量化是指将位图转换为矢量轮廓的过程。
下面结合附图对本发明实施例进行说明。
实施例一
图1为本发明实施例提供的一种文本的处理方法的流程图,如图1所示,本实施例的执行主体是文本的处理装置,则本实施例提供的字形的处理方法包括以下几个步骤:
步骤101:获取第一字体类型的目标文本的字形对应的骨架线图像。
其中,骨架线图像用于指示第一字体类型的目标文本的字形的结构信息。
本实施例中,第一字体类型是指已有的任意字体类型,例如:楷体、宋体、篆书、瘦金体等,用来提供字体的结构信息。目标文本的字形是指由第一字体类型的文字构成的目标文本的字形,还可以称为待融合文本,该目标文本的字形可以是单独一个文字,一个二字词、四字词,甚至一段话,又或是一篇文章,本发明实施例中对此不做限定。
具体地,本实施例中,通过将第一字体类型的目标文本的字形输入到骨架线图像提取网络中,获取第一字体类型的目标文本的字形对应的骨架线图像,也就是获取第一字体类型的目标文本的字形的结构信息。
步骤102:根据骨架线图像和第二字体类型对应的第一模型,生成第三字体类型的目标文本的字形。
其中,第一模型用于指示第二字体类型的笔触信息,第三字体类型、第二字体类型与第一字体类型均不相同,第一模型用来融合结构信息与笔触信息得到字符图像。
本实施例中,第二字体类型是指已有的除第一字体类型以外的其他字体类型,例如:方正姚体、微软雅黑、幼圆、隶书等,用来提供笔触信息。第一模型可以是由生成对抗网络经过迭代训练得到的笔触蒙皮渲染网络,用以融合第一字体类型的目标文本的字形的结构信息和第二字体类型的笔触信息。
具体地,本实施例中,通过将第一字体类型的目标文本的字形对应的骨架线图像,也就是第一字体类型的目标文本的字形的结构信息,输入至第二字体类型对应的笔触蒙皮渲染网络中,得到第三字体类型的目标文本的字形。其中,第二字体类型对应的笔触蒙皮渲染模型将第一字体类型的目标文本的字形的结构信息和第二字体类型的目标文本的字形的笔触信息融合在一起,形成第三字体类型的目标文本的字形,第三字体类型的字体是一种新的字体类型,这里第三字体类型、第二字体类型与第一字体类型均不相同。
本实施例提供的字形的处理方法,通过获取第一字体类型的目标文本的字形对应的骨架线图像;其中,骨架线图像用于指示第一字体类型的目标文本的字形的结构信息;根据骨架线图像和第二字体类型对应的第一模型,生成第三字体类型的目标文本的字形;其中,第一模型用于指示第二字体类型的笔触信息,第三字体类型、第二字体类型与第一字体类型均不相同。由于第二字体类型对应的第一模型包含了第二字体类型的目标文本的字形的笔触信息,可以在第一字体类型的目标文本的字形的骨架线图像经过第一模型处理的时候,将第二字体类型的目标文本的字形的笔触信息添加进去,从而实现了自动把第一字体类型的目标文本的字形的结构信息和第二字体类型的目标文本的字形的笔触信息融合在一起,即自动将两种待融合的特定字体的结构与笔触信息有效融合,产生一种第三字体类型,即新字体类型,从而提高了新字体的开发效率。
实施例二
图2是本发明实施例提供的另一种字形的处理方法的流程图,如图2所示,是在本发明实施例一的基础上,对步骤101和步骤102的进一步细化,并且在步骤101之前,还包括第二模型的训练过程,以及在步骤102之前,还包括第一模型的训练过程,则本实施例提供的文本的处理方法包括以下步骤。
步骤201,获取多个第二历史文本的字形对应的字符图像,以及每一个第二历史文本的字形对应的骨架线图像。
其中,字符图像表征字体的结构与笔触的完整信息,骨架线图像表征字体的结构信息。
本实施例中,从提供结构信息的不同字体类型的文本的字符图像集合SetAcharacter中获取多个第二历史文本的字形对应的字符图像
Figure BDA0002319092570000071
以及从提供结构信息的不同字体类型的文本的骨架线图像集合SetAskeleton中获取每一个第二历史文本的字形对应的骨架线图像
Figure BDA0002319092570000072
其中,每一个字符图像与每一个骨架线图像是同一历史文本的字形中的每一个文字的不同信息,并且一一对应。
步骤202,根据多个第二历史文本的字形对应的字符图像,以及每一个第二历史文本的字形对应的骨架线图像,对第二初始模型进行训练得到第二模型。
其中,第二初始模型是未经训练的深度神经网络,深度神经网络可以是生成对抗网络,当然也可以是其他生成式网络,本实施例中仅采用生成对抗网络进行详细说明,但是本发明实施例对此不作限定。第二模型是指由第二初始模型经过迭代训练后得到的稳定的模型,用于提取骨架线图像。
具体地,本实施例中,通过将多个不同字体类型的第二历史文本的字形对应的字符图像以及对应的骨架线图像输入到第二初始模型即未经训练的生成对抗网络中,对网络进行迭代训练,直到训练的网络的输出结果与预设结果相同或相近为止,从而得到稳定的生成对抗网络,即第二模型,也叫骨架线提取网络模型,示例的,请参见图3所示,图3为本申请实施例提供的一种骨架线提取网络模型训练示意图,该骨架线提取网络模型即为图3中所示的ModelA。
在通过迭代训练得到的骨架线提取网络模型,其架构可以参见图4所示,图4为本申请实施例提供的一种骨架线提取网络模型的架构示意图。骨架线提取网络模型ModelA包括生成器与判别器,其中,生成器用于提取骨架线图像,判别器用于判断生成骨架线图像的真伪,完成迭代训练后的生成器作为骨架线提取模型,以方便后续所有融合工作直接调用骨架线提取模型进行骨架线提取即可。
步骤203,获取第一字体类型的目标文本的字形对应的骨架线图像。
其中,骨架线图像用于指示第一字体类型的目标文本的字形的结构信息。
进一步地,如图5所示,图5为本发明实施例提的一种获取第一字体类型的目标文本的字形对应的骨架线图像的流程示意图,步骤203获取第一字体类型的目标文本的字形对应的骨架线图像可以包括以下步骤:
步骤2031,获取目标文本的字形对应的第一字符图像。
其中,第一字符图像是指第一文字类型的目标文本的字形的字符图像。
具体地,本实施例中,通过对第一字体类型的目标文本的字形的字库文件进行渲染操作,转换为若干单字字符图像,从而获取第一字体类型的目标文本的字形对应的第一字符图像,或者通过从第一字体类型的目标文本的字形对应的第一字符图像集合中获取第一字体类型的目标文本的字形对应的第一字符图像,本发明实施例对此不作限定。
步骤2032,根据第一字符图像和第二模型,获取目标文本的字形对应的骨架线图像。
其中,第二模型用于提取字符图像中的骨架线图像。
具体地,本实施例中通过将第一字符图像输入到第二模型中,由第二模型输出第一字符图像包含的骨架线图像,从而获取第一字体类型的目标文本的字形对应的骨架线图像。
步骤204,获取多个第二字体类型的第一历史文本的字形对应的骨架线图像,以及每一个第一历史文本的字形对应的字符图像。
具体地,本实施例中,通过从提供笔触信息的第二字体类型的文本的骨架线图像集合SetBskeleton中获取多个第二字体类型的第一历史文本的字形对应的骨架线图像
Figure BDA0002319092570000091
以及从提供笔触信息的第二字体类型的文本的骨架线图像集合SetBcharacter中每一个第一历史文本的字形对应的字符图像
Figure BDA0002319092570000092
其中,每一个骨架线图像与每一个字符图像是第二字体类型的历史文本的字形中的每一个文字的信息,并且一一对应。
可以理解的是,还可以获取多个除提供结构信息的第一字体类型以外的其他已有的字体类型的历史文本的字形对应的骨架线图像,以及每一个历史文本的字形对应的字符图像,用以训练出笔触信息不同的第一模型,第一模型的数量不做限定。
步骤205,根据多个第一历史文本的字形对应的骨架线图像,以及每一个第一历史文本的字形对应的字符图像,对第一初始模型进行训练得到第一模型。
其中,第一初始模型是未经训练的深度神经网络,深度神经网络可以是生成对抗网络,当然也可以是其他生成式网络,本实施例中仅采用生成对抗网络进行详细说明,但是本发明实施例对此不作限定。第一模型是指由第一初始模型经过迭代训练后得到的稳定的模型,用于指示第二字体类型的笔触信息,在提供结构信息的文本的骨架线图像里添加笔触信息以得到新字体的文本。
具体地,本实施例中,通过将多个第二字体类型的第一历史文本的字形对应的骨架线图像以及对应的字符图像输入到第一初始模型即未经训练的生成对抗网络中,即将第二字体类型的第一历史文本的字形对应的骨架线图像与对应的字符图像组合
Figure BDA0002319092570000093
作为网络数据的训练数据,对网络进行迭代训练,直到训练的网络的输出结果与预设结果相同或相近为止,从而得到稳定的生成对抗网络,即第一模型,也叫笔触蒙皮渲染模型。示例的,请参见图6所示,图6为本申请实施例提供的一种笔触蒙皮渲染模型训练示意图,该笔触蒙皮渲染模型即为图6中所示的ModelB。
在通过迭代训练得到的笔触蒙皮渲染模型,其架构可以参见图7所示,图7为本申请实施例提供的一种笔触蒙皮渲染模型的架构示意图。笔触蒙皮渲染模型ModelB包括生成器与判别器,其中,生成器用于生成新字体的字符图像,判别器用于判断生成字符图像的真伪。
可以理解的是,可以用不同字体类型的历史文本的字形对应的骨架线图像与对应的字符图像组合作为网络数据的训练数据,对网络进行迭代训练,直到训练的网络的输出结果与预设结果相同或相近为止,从而得到稳定的生成对抗网络,从而获得无数不同的提供笔触信息的笔触蒙皮渲染模型,需要说明的是,该第一模型不仅仅局限于指示第二字体类型的笔触信息,还可以指示更多的除了第一字体类型以外的其他已有的字体类型的笔触信息,并且一种字体类型对应一个训练好的第一模型,用以与提供结构信息的第一字体类型的目标文本的字形生成不同新字体类型的目标文本的字形。
步骤206,根据骨架线图像和第二字体类型对应的第一模型,生成第三字体类型的目标文本的字形。
进一步地,如图8所示,图8为本发明实施例提的一种生成第三字体类型的目标文本的字形的流程示意图,步骤206根据骨架线图像和第二字体类型对应的第一模型,生成第三字体类型的目标文本的字形可以包括以下步骤:
步骤2061,将骨架线图像输入至第一模型,得到目标文本的字形对应的字符图像。
其中,骨架线图像是指提供结构信息的第一字体类型的目标文本的字形对应的骨架线图像。
具体地,本实施例中,将提供结构信息的第一字体类型的目标文本的字形对应的骨架线图像输入至笔触蒙皮渲染网络中,由笔触蒙皮渲染网络输出新字体类型的目标文本的字形对应的字符图像,从而得到第三字体类型的目标文本的字形对应的字符图像,其中,该第三字体类型的目标文本的字形对应的字符图像表征第一字体类型的结构和第二字体类型的笔触信息,示例的,如图9所示,图9为本申请实施例提供的一种第三字体类型的目标文本的字形对应的字符图像生成示意图,图9中的新字体字符图像就是第三字体类型的目标文本的字形对应的字符图像。
可以理解的是,笔触蒙皮渲染模型ModelB为提供结构信息的第一字体类型的目标文本的字形对应的骨架线图像加入了除第一字体类型的其他已有字体类型的目标文本的字形的笔触信息,例如加入了第二字体类型的目标文本的字形的笔触信息,从而形成新的字体类型的目标文本的字形对应的字符图像。
步骤2062,对目标文本的字形对应的字符图像进行矢量化处理,得到目标文本的字形。
其中,目标文本的字形是指形成的第三字体类型的目标文本的字形。字符图像是位图形式,而字库图像都是用矢量轮廓来表征字符的字形,以提升字库质量、降低存储空间,所以需要将字符图像进行矢量化处理。
具体地,本实施例中,对形成的新字体的目标文本的字形的字符图像进行轮廓提取与矢量化处理,得到第三字体的目标文本的字形对应的字库文件。
本实施例提供的字形的处理方法,通过获取多个第二历史文本的字形对应的字符图像,以及每一个第二历史文本的字形对应的骨架线图像;根据多个第二历史文本的字形对应的字符图像,以及每一个第二历史文本的字形对应的骨架线图像,对第二初始模型进行训练得到第二模型;获取第一字体类型的目标文本的字形对应的骨架线图像;获取多个第二字体类型的第一历史文本的字形对应的骨架线图像,以及每一个第一历史文本的字形对应的字符图像;根据多个第一历史文本的字形对应的骨架线图像,以及每一个第一历史文本的字形对应的字符图像,对第一初始模型进行训练得到第一模型;根据骨架线图像和第二字体类型对应的第一模型,生成第三字体类型的目标文本的字形。由于提供笔触信息的字体类型对应的第一模型包含了除提供结构信息的第一字体类型以外的其他字体类型的目标文本的字形的笔触信息,可以在第一字体类型的目标文本的字形的骨架线图像经过第一模型处理的时候,将除第一字体类型以外的其他字体类型,例如第二字体类型的目标文本的字形的笔触信息添加进去,从而实现了自动把第一字体类型的目标文本的字形的结构信息和其他字体类型的目标文本的字形的笔触信息融合在一起,即自动将两种待融合的特定字体的结构与笔触信息有效融合,产生一种第三字体类型,即新字体类型,从而提高了新字体的开发效率。
实施例三
图10为本发明实施例三提供的字形的处理装置的结构示意图,如图10所示,本实施例提供的字形的处理装置80包括:获取单元801,处理单元802。
其中,获取单元801,用于获取第一字体类型的目标文本的字形对应的骨架线图像;骨架线图像用于指示第一字体类型的目标文本的字形的结构信息;处理单元80232,用于根据骨架线图像和第二字体类型对应的第一模型,生成第三字体类型的目标文本的字形;其中,第一模型用于指示第二字体类型的笔触信息,第三字体类型、第二字体类型与第一字体类型均不相同。
可选的,处理单元802,具体用于将骨架线图像输入至第一模型,得到目标文本的字形对应的字符图像;对目标文本的字形对应的字符图像进行矢量化处理,得到目标文本的字形。
可选的,获取单元801,还用于获取多个第二字体类型的第一历史文本的字形对应的骨架线图像,以及每一个第一历史文本的字形对应的字符图像。
处理单元802,还用于根据多个第一历史文本的字形对应的骨架线图像,以及每一个第一历史文本的字形对应的字符图像,对第一初始模型进行训练得到第一模型。
可选的,获取单元801,具体用于获取目标文本的字形对应的第一字符图像;根据第一字符图像和第二模型,获取目标文本的字形对应的骨架线图像;其中,第二模型用于提取字符图像中的骨架线图像。
可选的,获取单元801,还用于获取多个第二历史文本的字形对应的字符图像,以及每一个第二历史文本的字形对应的骨架线图像。
处理单元802,还用于根据多个第二历史文本的字形对应的字符图像,以及每一个第二历史文本的字形对应的骨架线图像,对第二初始模型进行训练得到第二模型。
本发明实施例所示的字形的处理装置80,可以执行上述任一附图所示的实施例中字形的处理方法的技术方案,其实现原理以及有益效果与字形的处理方法的实现原理及有益效果类似,此处不再进行赘述。
实施例四
图11为本发明实施例提供的一种电子设备90的结构示意图,示例的,请参见图11所示,该电子设备90可以包括存储器901和处理器902。
存储器901,用于存储计算机程序;
处理器902,用于读取存储器901存储的计算机程序,并根据存储器901中的计算机程序执行上述任一实施例所示的字形的处理方法。
可选地,存储器901既可以是独立的,也可以跟处理器902集成在一起。当存储器901是独立于处理器902之外的器件时,电子设备还可以包括:总线,用于连接存储器901和处理器902。
可选地,本实施例还包括:通信接口,该通信接口可以通过总线与处理器902连接。处理器902可以控制通信接口来实现上述电子设备的接收和发送的功能。
本发明实施例所示的电子设备90,可以执行上述任一附图所示的实施例中字形的处理方法的技术方案,其实现原理以及有益效果与字形的处理方法的实现原理及有益效果类似,此处不再进行赘述。
本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如上述任一实施例的字形的处理方法,其实现原理以及有益效果与字形的处理方法的实现原理及有益效果类似,此处不再进行赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所展示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元展示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例方法的部分步骤。
应理解的是,上述处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital SignalProcessor,简称:DSP)、专用集成电路(英文:Application Specific IntegratedCircuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本发明附图中的总线并不限定仅有一根总线或一种类型的总线。
上述计算机可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种字形的处理方法,其特征在于,包括:
获取第一字体类型的目标文本的字形对应的骨架线图像;所述骨架线图像用于指示所述第一字体类型的目标文本的字形的结构信息;
根据所述骨架线图像和第二字体类型对应的第一模型,生成第三字体类型的目标文本的字形;其中,所述第一模型用于指示所述第二字体类型的笔触信息,所述第三字体类型、第二字体类型与所述第一字体类型均不相同;
所述根据所述骨架线图像和第二字体类型对应的第一模型,生成第三字体类型的目标文本的字形,包括:
将所述骨架线图像输入至所述第一模型,得到所述目标文本的字形对应的字符图像;
对所述目标文本的字形对应的字符图像进行矢量化处理,得到所述目标文本的字形。
2.根据权利要求1所述的方法,其特征在于,所述根据所述骨架线图像和第二字体类型对应的第一模型,生成第三字体类型的目标文本的字形之前,还包括:
获取多个所述第二字体类型的第一历史文本的字形对应的骨架线图像,以及每一个第一历史文本的字形对应的字符图像;
根据所述多个第一历史文本的字形对应的骨架线图像,以及所述每一个第一历史文本的字形对应的字符图像,对第一初始模型进行训练得到所述第一模型。
3.根据权利要求1或2所述的方法,其特征在于,所述获取第一字体类型的目标文本的字形对应的骨架线图像,包括:
获取所述目标文本的字形对应的第一字符图像;
根据所述第一字符图像和第二模型,获取所述目标文本的字形对应的所述骨架线图像;其中,所述第二模型用于提取字符图像中的骨架线图像。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一字符图像和第二模型,获取所述目标文本的字形对应的所述骨架线图像之前,还包括:
获取多个第二历史文本的字形对应的字符图像,以及每一个第二历史文本的字形对应的骨架线图像;
根据所述多个第二历史文本的字形对应的字符图像,以及所述每一个第二历史文本的字形对应的骨架线图像,对第二初始模型进行训练得到所述第二模型。
5.一种字形的处理装置,其特征在于,包括:
获取单元,用于获取第一字体类型的目标文本的字形对应的骨架线图像;所述骨架线图像用于指示所述第一字体类型的目标文本的字形的结构信息;
处理单元,用于根据所述骨架线图像和第二字体类型对应的第一模型,生成第三字体类型的目标文本的字形;其中,所述第一模型用于指示所述第二字体类型的笔触信息,所述第三字体类型、第二字体类型与所述第一字体类型均不相同;
所述处理单元,具体用于将所述骨架线图像输入至所述第一模型,得到所述目标文本的字形对应的字符图像;对所述目标文本的字形对应的字符图像进行矢量化处理,得到所述目标文本的字形。
6.根据权利要求5所述的装置,其特征在于,
所述获取单元,还用于获取多个所述第二字体类型的第一历史文本的字形对应的骨架线图像,以及每一个第一历史文本的字形对应的字符图像;
所述处理单元,还用于根据所述多个第一历史文本的字形对应的骨架线图像,以及所述每一个第一历史文本的字形对应的字符图像,对第一初始模型进行训练得到所述第一模型。
7.根据权利要求5或6所述的装置,其特征在于,
所述获取单元,具体用于获取所述目标文本的字形对应的第一字符图像;根据所述第一字符图像和第二模型,获取所述目标文本的字形对应的所述骨架线图像;其中,所述第二模型用于提取字符图像中的骨架线图像。
8.根据权利要求7所述的装置,其特征在于,
所述获取单元,还用于获取多个第二历史文本的字形对应的字符图像,以及每一个第二历史文本的字形对应的骨架线图像;
所述处理单元,还用于根据所述多个第二历史文本的字形对应的字符图像,以及所述每一个第二历史文本的字形对应的骨架线图像,对第二初始模型进行训练得到所述第二模型。
9.一种电子设备,其特征在于,包括存储器和处理器;
存储器,用于存储计算机程序;
处理器,用于读取存储器存储的计算机程序,并根据所述存储器中的计算机程序执行如权利要求1至4任一项所述的字形的处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至4任一项所述的字形的处理方法。
CN201911291043.9A 2019-12-16 2019-12-16 字形的处理方法和装置 Active CN110956678B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911291043.9A CN110956678B (zh) 2019-12-16 2019-12-16 字形的处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911291043.9A CN110956678B (zh) 2019-12-16 2019-12-16 字形的处理方法和装置

Publications (2)

Publication Number Publication Date
CN110956678A CN110956678A (zh) 2020-04-03
CN110956678B true CN110956678B (zh) 2022-02-22

Family

ID=69981760

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911291043.9A Active CN110956678B (zh) 2019-12-16 2019-12-16 字形的处理方法和装置

Country Status (1)

Country Link
CN (1) CN110956678B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111695323B (zh) * 2020-05-25 2023-11-17 维沃移动通信有限公司 信息处理方法、装置及电子设备
CN112347288B (zh) * 2020-11-10 2024-02-20 北京北大方正电子有限公司 一种字图的矢量化方法
CN113140018B (zh) * 2021-04-30 2023-06-20 北京百度网讯科技有限公司 训练对抗网络模型的方法、建立字库的方法、装置和设备
CN114418834A (zh) * 2021-12-29 2022-04-29 北京字跳网络技术有限公司 一种文字生成方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107092917A (zh) * 2017-03-24 2017-08-25 北京大学 一种基于流形学习的汉字笔画自动提取方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5594809A (en) * 1995-04-28 1997-01-14 Xerox Corporation Automatic training of character templates using a text line image, a text line transcription and a line image source model
GB0808988D0 (en) * 2008-05-16 2008-06-25 Symbian Software Ltd Method and device for generating custom points
CN107644006B (zh) * 2017-09-29 2020-04-03 北京大学 一种基于深度神经网络的手写体中文字库自动生成方法
CN109697275A (zh) * 2017-10-20 2019-04-30 北大方正集团有限公司 字库生成方法及装置
CN110135530B (zh) * 2019-05-16 2021-08-13 京东方科技集团股份有限公司 转换图像中汉字字体的方法及系统、计算机设备及介质
CN110427989B (zh) * 2019-07-18 2021-07-09 北京大学 汉字骨架自动合成方法及大规模中文字库自动生成方法
CN110570481A (zh) * 2019-07-31 2019-12-13 中国地质大学(武汉) 基于风格迁移的书法字库自动修复方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107092917A (zh) * 2017-03-24 2017-08-25 北京大学 一种基于流形学习的汉字笔画自动提取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种女书手写字符规范字形自动生成方法;李波等;《中文信息学报》;20150315(第02期);第146-153页 *

Also Published As

Publication number Publication date
CN110956678A (zh) 2020-04-03

Similar Documents

Publication Publication Date Title
CN110956678B (zh) 字形的处理方法和装置
CN108170649B (zh) 一种基于dcgan深度网络的汉字字库生成方法及装置
Phan et al. Flexyfont: Learning transferring rules for flexible typeface synthesis
Karasneh et al. Extracting UML models from images
CN111243571B (zh) 文本的处理方法、装置、设备及计算机可读存储介质
CN112861806A (zh) 基于生成对抗网络的字体数据处理方法及装置
CN112115678A (zh) 信息展示方法及装置、存储介质及电子设备
CN109615671A (zh) 一种字库样本自动生成方法、计算机装置及可读存储介质
CN113516136A (zh) 一种手写图像生成方法、模型训练方法、装置及设备
JP2019028094A (ja) 文字生成装置、プログラム及び文字出力装置
CN108319578B (zh) 一种用于数据记录的介质的生成方法
CN112418310A (zh) 文本风格迁移模型训练方法和系统及图像生成方法和系统
KR101229175B1 (ko) 자필 폰트 생성 방법 및 장치
CN110211032B (zh) 汉字字符的生成方法、装置及可读存储介质
CN113962192B (zh) 汉字字体生成模型的生成方法、汉字字体生成方法及装置
CN110516125A (zh) 识别异常字符串的方法、装置、设备及可读存储介质
Zhang et al. Visual knowledge guided intelligent generation of Chinese seal carving
KR101229164B1 (ko) 네트워크를 통한 개인폰트 생성 방법 및 폰트 클라우드 서비스 시스템
CN114332476A (zh) 维语识别方法、装置、电子设备、存储介质和产品
CN110276051B (zh) 拆分字体部件的方法及装置
CN111695333B (zh) 一种商标字形相似度检测方法、装置及设备
US11580292B2 (en) Style transfer
TWI664604B (zh) 電腦手寫中文字集創建及應用系統
US20230099764A1 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
KR102185851B1 (ko) 전자책 제작방법 및 그를 위한 컴퓨터 프로그램

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230613

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

Address before: 100871, Beijing, Haidian District, Cheng Fu Road, No. 298, Zhongguancun Fangzheng building, 9 floor

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: BEIJING FOUNDER ELECTRONICS Co.,Ltd.