CN114330236A - 文字生成方法、装置、电子设备及存储介质 - Google Patents
文字生成方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114330236A CN114330236A CN202111644361.6A CN202111644361A CN114330236A CN 114330236 A CN114330236 A CN 114330236A CN 202111644361 A CN202111644361 A CN 202111644361A CN 114330236 A CN114330236 A CN 114330236A
- Authority
- CN
- China
- Prior art keywords
- character
- style
- target
- characters
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 96
- 238000006243 chemical reaction Methods 0.000 claims abstract description 100
- 238000012549 training Methods 0.000 claims description 139
- 238000000605 extraction Methods 0.000 claims description 138
- 238000012545 processing Methods 0.000 claims description 85
- 230000006870 function Effects 0.000 claims description 58
- 239000013598 vector Substances 0.000 claims description 6
- 230000003993 interaction Effects 0.000 claims description 5
- 238000013461 design Methods 0.000 abstract description 5
- 238000012938 design process Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 29
- 238000010586 diagram Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 8
- 238000013473 artificial intelligence Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
本公开实施例提供了一种文字生成方法、装置、电子设备及存储介质,该方法包括:获取待显示文字以及预先选择的目标风格类型;将所述待显示文字转换为与所述目标风格类型相对应的目标文字;其中,所述目标文字是基于风格类型转换模型预先生成的和/或实时生成的;将所述目标文字显示在目标显示界面上。本公开实施例提供的技术方案,不仅提供了简洁高效的文字设计方案,也避免了传统手工设计过程中出现的效率低、成本高、无法准确得到期望字体的问题。
Description
技术领域
本公开实施例涉及人工智能技术领域,尤其涉及一种文字生成方法、装置、电子设备及存储介质。
背景技术
目前,在设计一套风格独特的汉字的过程中,相关开发人员往往需要付出大量的时间成本、物质成本和人力成本。
同时,由于不同的风格的汉字之间存在较大差异,即使是专业水平较高的设计师,在针对汉字进行手工设计以及多次修改后,可能也难以得到所期望的风格的字体。
发明内容
本公开实施例提供一种文字生成方法、装置、电子设备及存储介质,不仅提供了简洁高效的文字设计方案,也避免了传统手工设计过程中出现的效率低、成本高、无法准确得到期望字体的问题。
第一方面,本公开实施例提供了一种文字生成方法,该方法包括:
获取待显示文字以及预先选择的目标风格类型;
将所述待显示文字转换为与所述目标风格类型相对应的目标文字;其中,所述目标文字是基于风格类型转换模型预先生成的和/或实时生成的;
将所述目标文字显示在目标显示界面上。
第二方面,本公开实施例还提供了一种文字生成装置,该装置包括:
风格类型确定模块,用于获取待显示文字以及预先选择的目标风格类型;
目标文字确定模块,用于将所述待显示文字转换为与所述目标风格类型相对应的目标文字;其中,所述目标文字是基于风格类型转换模型预先生成的和/或实时生成的;
文字显示模块,用于将所述目标文字显示在目标显示界面上。
第三方面,本公开实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开实施例任一所述的文字生成方法。
第四方面,本公开实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本公开实施例任一所述的文字生成方法。
本公开实施例的技术方案,先获取待显示文字以及预先选择的目标风格类型,再将待显示文字转换为目标风格类型的目标文字,其中,目标文字是基于风格类型转换模型预先生成和/或实时生成的,最后将目标文字显示在目标显示界面上,通过引入人工智能模型生成特定风格的字体,不仅提供了简洁高效的文字设计方案,也避免了传统手工设计过程中出现的效率低、成本高、无法准确得到期望字体的问题。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例一所提供的一种文字生成方法的流程示意图;
图2为本公开实施例二所提供的一种文字生成方法的流程示意图;
图3为本公开实施例二所提供的风格类型转换模型的整体网络结构图;
图4为本公开实施例三所提供的一种文字生成方法的流程示意图;
图5为本公开实施例三所提供的待训练的字体特征提取子模型;
图6为本公开实施例三所提供的训练完毕的字体特征提取子模型;
图7为本公开实施例四所提供的一种文字生成方法的流程示意图;
图8为本公开实施例五所提供的一种文字生成装置的结构框图;
图9为本公开实施例六所提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
实施例一
图1为本公开实施例一所提供的一种文字生成方法的流程示意图,本实施例可适用于对现有文字进行设计以得到期望的字体的情形,该方法可以由文字生成装置来执行,该装置可以通过软件和/或硬件的形式实现,该硬件可以是电子设备,如移动终端、PC端或服务器等。
在介绍本技术方案之前,可以先对应用场景进行示例性说明。该技术方案可以应用在任意需要生成特定风格类型的文字的场景中,例如,用户发现某一个字或多个字对应的风格类型符合自己的期望时,基于本实施例的方案,便可以将任意汉字在上述风格类型下进行呈现;或者,在已经获取到某用户部分文字笔迹的基础上,基于本实施例的方案,可以快速地为该用户生成其专属的手写风格类型的计算机字库。
如图1,本实施例的方法包括:
S110、获取待显示文字以及预先选择的目标风格类型。
其中,待显示文字可以是用户书写的一个或多个文字,还可以是能够在显示设备上显示的文字,例如,可以是用户通过手写板或计算机中的相关应用写出的文字,对应的,在用户写出一个或多个文字后,计算机即可获取这些文字并将其确定为待显示文字。可以理解,在实际应用过程中,还可以对包含有用户手写文字的图像进行识别,进而将识别得到的文字作为待显示文字,例如,用户在一个写字板上写下“永”字后,可以对其进行拍照并将图像上传至系统中,系统对图像进行识别后,即可获取到用户书写的“永”字,进而将其作为待显示文字。
在本实施例中,待显示文字还可以是已经在计算机中设计完毕、并为其分配好特定的指令序列的文字,如,计算机现有的简体字库或繁体字库中的文字。可以理解,基于特定的指令序列,系统至少可以描述该文字的字形,并将其在相关联的显示装置上进行显示。示例性的,当用户在计算机上通过拼音输入法输入“yong”,并在结果列表中选择一个对应发音的汉字(如“永”字)时,计算机即可在现有简体字库中获取该字的机内码(如“永”字的机内码),并将该机内码对应字形的文字确定为待显示文字。
在本实施例中,在获取到待显示文字后,还需要确定出预先选择的目标风格类型。其中,目标风格类型即是用户期望得到的文字风格类型,例如,对于汉字来说,其风格类型可以是已获得相应版权的宋体、楷体、黑体等。当然,在实际应用过程中,用户所期望的文字风格类型可以是与自身书写风格相似的字体,在这种情况下,目标风格类型即是与该用户手写体相似风格类型。
可以理解,对于不同风格类型的文字来说,其笔画风格和间架结构都存在差异。例如,同一个汉字在不同风格类型下所呈现的笔画的粗细、方圆不同,同时,笔画的搭配、排列、组合也不同,而针对于不同用户的手写体来说,文字风格类型上的差异会被进一步扩大。
在本实施例中,用户可以基于预先在系统中开发的风格类型选择控件选择出目标风格类型,例如,对于汉字来说,在其对应的风格类型选择控件的下拉菜单中可以包括已获得版权的宋体、楷体,以及用户A手写体、用户B手写体等。
S120、将待显示文字转换为与目标风格类型相对应的目标文字。
在本实施例中,当系统获取到待显示文字,并确定出对应的目标风格类型后,即可将待显示文字进行转换,从而得到目标风格类型的目标文字,这一过程可以理解为,将一种笔画风格、间架结构的文字转换为另一种笔画风格、间架结构。
具体来说,可以基于风格类型转换模型将目标文字转换为目标文字。其中,风格类型转换模型可以是预先训练好的卷积神经网络模型,模型的输入为待显示文字以及目标风格类型,对应的,模型的输出即为目标文字。示例性的,当确定用户基于输入法输入的、已获得版权的宋体的字为待显示文字,并确定预先选择的目标风格类型为“用户A手写体”后,即可将已获得版权的宋体“永”字,以及目标风格类型关联的信息输入至风格类型转换模型中,经过模型处理后即可得到与用户A手写体相似的“永”字,并将该字确定为目标文字。可以理解,当用户所期望的文字风格类型是与自身书写风格相似的字体时,上述基于风格类型转换模型的文字处理过程,实质上即是模仿用户的书写习惯(笔迹)生成与待显示文字相对应的目标文字的过程。
在实际应用过程中,目标文字是基于风格类型转换模型预先生成的和/或实时生成的。也即是说,系统可以利用风格类型转换模型对待显示文字进行实时处理,从而生成对应的目标文字;还可以利用风格类型转换模型预先对字库中现有的多个文字进行处理,从而得到对应的多种风格类型的文字,进一步的,基于现有字库中的文字以及对应的多种风格类型的文字构建表征其关联关系的映射表,当从现有字库中确定出待显示文字,并确定目标风格类型时,通过查表的方式即可直接确定出对应的目标文字进行调用,通过这种方式进一步优化了文字生成的效率。
S130、将目标文字显示在目标显示界面上。
在本实施例中,当基于风格类型转换模型确定出目标文字后,系统至少能够基于模型输出结果对目标文字进行描述和呈现。可以理解为,系统基于风格类型转换模型的输出至少能够确定与目标文字对应的图像信息,并将其显示在目标显示界面上。其中,目标显示界面可以是与系统相关联的可视化界面,至少可以对目标文字对应的图像信息进行调用和显示。
需要说明的是,在实际应用过程中,当确定出目标文字后,还可以以相关图像文件的形式将目标文字导出,或者,将相关图像文件发送至用户对应的客户端;当转换得到的目标文字有多个时,还可以针对这些文字构建出特定的字库,即,基于目标文字的图像信息生成一套图像源,并将该图像源与文字对应的内码进行关联,以作为目标风格类型的字体在后续过程中由用户直接使用,可以理解,通过这种处理方式,为用户快速生成与自己的手写体相似的文字字库提供了简洁高效的途径。
本实施例的技术方案,先获取待显示文字以及预先选择的目标风格类型,再将待显示文字转换为目标风格类型的目标文字,其中,目标文字是基于风格类型转换模型预先生成和/或实时生成的,最后将目标文字显示在目标显示界面上,通过引入人工智能模型生成特定风格的字体,不仅提供了简洁高效的文字设计方案,也避免了传统手工设计过程中出现的效率低、成本高、无法准确得到期望字体的问题。
实施例二
图2为本公开实施例二所提供的一种文字生成方法的流程示意图,在前述实施例的基础上,基于字体特征提取子模型、解耦模型、特征拼接子模型以及特征处理子模型构建出风格类型转换模型,通过引入多种人工智能算法确定出文字的特征,为用户提供了高效、智能的字库生成方法;直接从目标文字包中确定与待显示文字相对应的目标文字,进一步提高了文字生成效率。其具体的实施方式可以参见本实施例技术方案。其中,与上述实施例相同或者相应的技术术语在此不再赘述。
如图2所示,该方法具体包括如下步骤:
S210、在检测到编辑待显示文字时,确定从风格类型列表中选择的目标风格类型。
在本实施例中,系统可以对用户在文本框中的输入进行检测,当检测到用户在文本框中编辑文字时,即可在现有字库中获取对应的文字作为待显示文字。同时,根据用户针对于风格类型选择控件的触控操作,显示对应的风格类型列表,可以理解,列表中至少包括一种风格类型,如用户A手写体、用户B手写体等。由于在后续过程中需要利用风格类型转换模型对待显示文字进行处理,因此可以理解,风格类型列表中包括与风格类型转换模型相对应的风格类型。进一步的,基于用户在列表中的选择结果即可确定出目标风格类型,即,确定出用户期望得到的字体。
S220、将待显示文字转换为与目标风格类型相对应的目标文字。
在将待显示文字转换为目标文字的过程中,可选的,从与目标风格类型相对应的目标文字包中,获取与待显示文字相一致的目标文字。
具体来说,在确定出目标风格类型后,系统可以根据该风格类型的标识确定出目标文字包。其中,目标文字包是基于风格类型转换模型将各文字转换至目标字体后生成的,可以理解为,基于风格类型转换模型,系统预先将现有字库中的各个文字转换为对应风格类型的文字,并得到这些文字的相关数据(如文字标识、图像信息以及对应的机内码),从而根据转换得到的文字的相关数据构建出目标文字包,同时,将目标文字包与风格类型列表中对应的风格类型进行关联,例如,目标文字包与风格类型列表中“用户A手写体”相对应。
进一步的,当确定出目标文字包后,根据待显示文字的相关数据即可在目标文字包中获取到与待显示文字相一致的目标文字,也即是说,从目标文字包中获取到与待显示文字内容相同,风格类型(如笔画风格、间架结构)不同的目标文字。
这种处理方式的好处在于,当确定出待显示文字以及目标风格类型时,可以从目标文字包中调取对应的目标文字,进一步提高了文字生成效率。
在实际应用过程中,当用户在风格类型列表中选择出目标风格类型时,还可能出现系统并未基于风格类型转换模型为该字体预先构建目标文字包的情况,此时,系统还可以将待显示文字直接输入至风格类型转换模型中,得到与目标字体相对应的目标文字。下面结合图3所示的风格类型转换模型的整体网络结构图,对生成目标文字的过程进行详细说明。
参见图3,在本实施例中,风格类型转换模型中包括第一字体特征提取子模型、第二字体特征提取子模型、与第一字体特征提取子模型相连接的第一解耦模型、与第二字体特征提取子模型相连接的第二解耦模型、与第一解耦模型和第二解耦模型相连接的特征拼接子模型,以及特征处理子模型。
其中,第一字体特征提取子模型和第二特征提取子模型的模型结构相同,用于确定各文字的文字特征,具体的,文字特征中包括风格类型特征和文字内容特征,可以理解为,包括反映文字字体的笔画顺序、间架结构的特征(即风格类型特征),还包括反映文字在计算机内对应的含义或标识信息的特征(即文字内容特征)。因此,第一字体特征提取子模型和第二特征提取子模型也可以作为文字的多模态特征提取器。
具体来说,基于第一特征提取子模型确定待显示文字的第一待解耦文字特征,以及基于第二特征提取子模型确定目标风格文字的第二待解耦文字特征。可以理解为,第一字体特征提取子模型可以用于确定待显示文字的风格类型特征和文字内容特征(即第一待解耦文字特征),第二字体特征提取子模型可以用于确定与目标文字属于同一风格类型的、任意一个文字的风格类型特征和文字内容特征(即第二待解耦文字特征),在实际应用过程中,可以将与目标文字属于同一风格类型的任意一个文字作为目标风格文字,可以理解,目标风格文字的文字类型与目标风格类型相一致。
以图3为例,将待显示文字输入至第一字体特征提取子模型进行处理后,计算机即可确定该文字为已获得版权的宋体笔画顺序、间架结构下的“永”字;当目标风格类型为“用户A手写体”时,为了得到该字体对应的“永”字,可以将现有的、用户A手写的“春”字输入至第二字体特征提取子模型中,计算机即可确定出该文字为用户A手写体笔画顺序、间架结构下的“春”字。
在本实施例中,解耦模型,用于对字体特征提取子模型提取的文字特征解耦处理,以区分风格类型特征和文字内容特征。具体的,基于第一解耦模型对第一待解耦文字特征处理,得到待显示文字的待显示风格类型和待显示内容特征;以及,基于第二解耦模型对第二待解耦文字特征处理,得到目标风格文字的目标风格类型和目标内容特征。可以理解为,基于第一解耦模型对待显示文字进行处理后,将解耦得到的待显示文字的风格类型特征作为待显示风格类型特征,并将待显示文字的文字内容特征作为待显示内容特征;同时,基于第二解耦模型对目标风格文字进行处理后,将解耦得到的目标风格文字的风格类型特征作为目标风格类型特征,将目标风格文字的文字内容特征作为目标内容特征。
继续参见图3,当第一字体特征提取子模型确定出待显示文字为已获得版权的宋体“永”字时,可以利用对应的第一解耦模型将该字的风格类型特征和文字内容特征进行解耦,得到该字在已获得版权的宋体笔画顺序、间架结构下的特征以及该字含义或标识信息对应的特征;当第二字体特征提取子模型确定出待显示文字为用户A手写的“春”字时,同样可以利用对应的第二解耦模型将该字的风格类型特征和文字内容特征进行解耦,得到该字在用户A手写体笔画顺序、间架结构下的特征以及该字含义或标识信息对应的特征。
在本实施例中,特征拼接子模型,用于对解耦模型提取的文字特征拼接处理,得到相应文字风格特征。具体的,基于特征拼接模型获取待显示内容特征和目标风格类型,得到与待显示文字相对应的文字风格特征。可以理解为,基于待显示文字的文字内容特征,以及目标风格文字的风格类型特征,拼接得到与待显示文字相对应的文字风格特征。
继续参见图3,当第一解耦模型与第二解耦模型分别对“永”字和“春”字的多模态特征进行解耦后,特征拼接子模型可以从解耦得到的特征中,选择“永”字的文字内容特征,以及“春”字的风格类型特征,进一步的,将上述两种特征进行拼接,即可得到用户A手写体风格类型下的、用于生成“永”字的特征。
在本实施例中,特征处理子模型,用于对文字风格特征处理,得到待显示文字在目标风格类型下的目标文字,可以是卷积神经网络(Convolutional Neural Networks,CNN)模型。具体的,基于特征处理子模型对文字风格特征处理,得到待显示文字在目标风格类型下对应的目标文字。
继续参见图3,当特征拼接子模型输出用户A手写体风格类型下的、用于生成“永”字的特征向量后,可以利用CNN模型对其进行处理,从而输出可被计算机调用并显示的“永”字的图像信息。
S230、将目标文字显示在目标显示界面上。
本实施例的技术方案,基于字体特征提取子模型、解耦模型、特征拼接子模型以及特征处理子模型构建出风格类型转换模型,通过引入多种人工智能算法确定出文字的特征,为用户提供了高效、智能的字库生成方法;直接从目标文字包中确定与待显示文字相对应的目标文字,进一步提高了文字生成效率。
实施例三
图4为本公开实施例三所提供的一种文字生成方法的流程示意图,在前述实施例的基础上,基于第一训练样本,对风格类型转换模型中的至少两个待训练字体特征提取子模型进行训练,进一步的,基于第一预设损失函数以及第二预设损失函数分别对子模型进行参数优化,最后将解码模块剔除,即可得到风格类型转换模型中的多模态特征提取器。其具体的实施方式可以参见本实施例技术方案。其中,与上述实施例相同或者相应的技术术语在此不再赘述。
如图4所示,该方法具体包括如下步骤:
S310、训练得到风格类型转换模型中的至少两个字体特征提取子模型。
需要说明的是,在基于风格类型转换模型生成目标文字之前,需要先对该模型中至少两个字体特征提取子模型进行训练,可以理解为,至少训练出一个字体特征提取子模型来提取文字的风格类型特征(如笔画顺序、间架结构),同时还要至少训练出一个字体特征提取子模型来提取文字的文字内容特征(如文字含义、文字标识)。下面结合图5所示的待训练的字体特征提取子模型,对训练至少两个字体特征提取子模型的过程进行详细说明。
为了对至少两个字体特征提取子模型进行训练,首先需要获取第一训练样本集合,可以理解,在实际应用过程中,为了提高模型的准确性,可以获取尽可能多而丰富的训练样本以构建出训练样本集合。
具体的,第一训练样本集合中包括多个第一训练样本,每个第一训练样本中包括与第一训练文字对应的理论文字图片和理论文字笔画,以及掩膜部分理论文字笔画的掩膜文字笔画。可以理解为,理论文字图片即是一个汉字在特定字体下呈现出来的图片,理论文字笔画则是反映该汉字各笔画在理论上的书写顺序的信息,同时,为了使计算机从汉字书写的深层次角度理解汉字特征,还需要选择理论文字笔画中的部分内容做掩膜(mask)处理,即,将该汉字部分笔画进行屏蔽,使其不参加字体特征提取子模型后续的处理过程,可以理解,将理论文字笔画中的部分笔画进行屏蔽后,即得到该汉字对应的掩膜文字笔画。
以图5为例,当确定“永”字作为第一训练文字时,该文字在特定字体下对应的文字图片即是理论文字图片,构成“永”字的五个笔画及顺序即是理论文字笔画,进一步的,对理论文字笔画做掩膜处理,即,将“永”字五个笔画中的第一、二、四画屏蔽之后,便得到“永”字对应的掩膜文字笔画。
进一步地,针对各第一训练样本,将当前第一训练样本中的理论文字图片和掩膜文字笔画,输入至待训练字体特征提取子模型中,得到与当前第一训练样本相对应的实际文字图片和预测文字笔画。继续参见图5,将反映“永”字在特定字体下所呈现样式的图片,以及屏蔽了第一、二、四画的掩膜文字笔画分别输入至对应的待训练字体特征提取子模型后,即可得到模型输出的文字图片以及模型针对“永”字预测的完整的文字笔画。
在上述确定实际文字图片的过程中,可选的,提取理论文字图片所对应的图像特征,并对图像特征压缩处理,得到第一待使用特征;通过对与掩膜文字笔画对应的特征向量进行处理,得到第二待使用特征;通过对第一待使用特征和第二待使用特征进行特征交互,得到与第一待使用特征对应的文字图像特征,以及与第二待使用特征对应的实际笔画特征。
继续参见图5,基于CNN模型提取到“永”字对应的图像特征后,可以基于Transformer模型对所提取的图像特征进行压缩处理,进而得到第一待使用特征;同理,基于Transformer模型对掩膜文字笔画的特征向量进行处理,可以得到第二待使用特征。进一步的,针对第一待使用特征以及第二待使用特征做cross attention处理,以实现文字图片信息以及文字笔画信息之间的特征交互,即可得到“永”字对应的文字图像特征,以及“永”字的实际笔画特征。
需要说明的是,待训练字体特征提取子模型中包括解码模块,即图5所示的Decoder模块。基于此,在得到上述文字图像特征以及实际笔画特征后,基于实际笔画特征,得到预测文字笔画,并基于解码模块对文字图像特征解码处理,得到实际文字图片。继续参见图5,在得到“永”字的文字图像特征及其实际笔画特征后,即可得到其预测笔画,进一步的,基于Decoder模块对“永”字的文字图像特征进行解码处理,即得到待训练字体特征提取子模型输出的与“永”字相对应的实际文字图片。
可以理解,在本实施例中,上述将各第一训练样本输入至待训练字体特征提取子模型,并得到与样本中文字对应的预测文字笔画以及实际文字图片的过程,即是一个使计算机从汉字书写的深层次角度理解汉字特征的过程。
在训练至少两个字体特征提取子模型的过程中,还涉及对模型参数的优化,可选的,基于待训练特征提取子模型中的第一预设损失函数对实际文字图片和理论文字图片进行损失处理,以及基于第二预设损失函数对预测文字笔画和理论文字笔画损失处理,以根据得到的各损失值对待训练字体特征提取子模型中的模型参数进行修正;将第一预设损失函数和第二预设损失函数收敛作为训练目标,得到待使用字体特征提取子模型。
在本实施例中,基于第一预设损失函数可以修正待训练特征提取子模型中的参数。在此以针对于一个待训练字体特征提取子模型的第一预设损失函数为例进行说明,具体的,基于一个待训练字体特征提取子模型,在针对训练样本集合中多个文字得到多组实际文字图片和理论文字图片后,可以确定出对应的多个损失值;进一步的,在利用多个损失值以及第一预设损失函数对子模型中的模型参数进行修正时,可以将损失函数的训练误差,即损失参数作为检测损失函数当前是否达到收敛的条件,比如训练误差是否小于预设误差或误差变化趋势是否趋于稳定,或者当前的迭代次数是否等于预设次数。若检测达到收敛条件,比如损失函数的训练误差小于预设误差,或者误差变化趋势趋于稳定,表明该待训练字体特征提取子模型训练完成,此时可以停止迭代训练。若检测到当前未达到收敛条件,可以进一步获取其他文字对应的实际文字图片和理论文字图片以对模型继续进行训练,直至损失函数的训练误差在预设范围之内。当损失函数的训练误差达到收敛时,即可将训练完成的待训练字体特征提取子模型作为待使用字体特征提取子模型,即,此时将某个文字的理论文字图片输入至待使用字体特征提取子模型中后,即可得到该文字对应的实际文字图片。
针对于用来处理文字笔画的待训练特征提取子模型来说,可以基于第二预设损失函数、以及多组预测文字笔画和理论文字笔画,按照上述同样的方式对模型参数进行修正,本公开实施例在此不再赘述。
在本实施例中,对至少两个待训练字体特征提取子模型训练完毕,并得到对应的待使用字体特征提取子模型后,可以模型中的参数冻结,以为后续的文字处理过程提供优质的特征信息。
同时,为了将待使用字体特征提取子模型插入至整体的模型网络结构中,还需要对待使用字体特征提取子模型剔除处理,才能得到字体特征提取子模型。可选的,在待训练字体特征提取子模型中包括解码模块时,将待使用字体特征提取子模型中的解码模块剔除处理,得到风格类型转换模型中的字体特征提取子模型。如图6所示,将任意汉字输入至字体特征提取子模型后,子模型即可针对该汉字的风格类型特征以及文字内容特征进行处理,进而得到该汉字的多模态特征,如该汉字在当前字体下的笔画顺序、间架结构、文字含义或文字标识等。本领域技术人员应当理解,对于剔除解码模块后的字体特征提取子模型来说,输入解码模块前的、与文字相关联的特征图即是字体特征提取子模型的输出;同时,将CNN模型中与每个卷积层对应的、二维形式的特征图作为后续处理过程中解耦模型的输入,可以保留更多的空间信息。
S320、获取待显示文字以及预先选择的目标风格类型。
S330、将待显示文字转换为与目标风格类型相对应的目标文字。
S340、将目标文字显示在目标显示界面上。
本实施例的技术方案,基于第一训练样本,对风格类型转换模型中的至少两个待训练字体特征提取子模型进行训练,进一步的,基于第一预设损失函数以及第二预设损失函数分别对子模型进行参数优化,最后将解码模块剔除,即可得到风格类型转换模型中的多模态特征提取器。
实施例四
图7为本公开实施例四所提供的一种文字生成方法的流程示意图,在前述实施例的基础上,字体特征提取子模型训练完毕后,基于第二训练样本集对风格类型转换模型进行训练,从而得到训练完毕的风格类型转换模型;在训练过程中,利用至少三个预设损失函数对模型中的参数进行优化,进一步减少了模型所生成目标文字的错误率。其具体的实施方式可以参见本实施例技术方案。其中,与上述实施例相同或者相应的技术术语在此不再赘述。
如图7所示,该方法具体包括如下步骤:
S410、训练得到风格类型转换模型中的至少两个字体特征提取子模型。
S420、训练得到风格类型转换模型。
在本实施例中,对至少两个字体特征提取子模型训练完毕,即,得到风格类型转换模型中的多模态特征提取器之后,便需要对风格类型转换模型进行训练。
在训练过程中,首先需要获取第二训练样本集;其中,第二训练样本集中包括多个第二训练样本,第二训练样本中包括两组待处理子数据和校准数据,第一组待处理子数据中包括与待训练文字对应的第二文字图像、第二文字笔顺;第二组待处理子数据中包括目标风格类型的第三文字图像、第三文字笔顺;校准数据为第二文字图像在目标风格类型下对应的第四文字图像。
示例性的,第一组待处理子数据可以包括多个已获得版权的宋体的文字,对应的,第二文字图像即反映这些文字在已获得版权的宋体风格类型下呈现出的效果,第二文字笔顺即表示这些文字以已获得版权的宋体进行书写时所采用的笔顺。可以理解,第二组待处理子数据可以包括另一种字体的文字,对应的,第三文字图像以及第三文笔顺序也能够反映这些文字在另一种字体风格类型下的效果与笔顺,本公开实施例在此不再赘述。
在获取到第二训练样本集后,进一步的,针对各第二训练样本,将当前第二训练样本输入至待训练风格类型转换模型中,得到与当前第二训练样本对应的实际文字图像;其中,待训练风格类型转换模型中包括第一字体特征提取子模型、第二特征提取子模型、第一待训练解耦模型、第二待训练解耦模型、待训练特征拼接子模型以及待训练特征处理子模型。本领域技术人员应当理解,对于上述各待训练的模型来说,模型中的参数虽未训练完毕,但其依然能够在一定程度上实现本公开实施例二中所介绍的作用。
可选的,基于第一字体特征提取子模型,对当前训练样本中的第二文字图像和第二文字笔顺进行处理,得到第二文字图像的第二待解耦文字特征;以及,基于第二字体特征提取子模型,对当前训练样本中的第三文字图像和第三文字笔顺进行处理,得到第三文字图像的第三待解耦文字特征;基于第一待训练解耦模型,对第二待解耦文字特征进行解耦处理,得到第二文字图像的第二风格类型特征和第二文字内容特征;以及,基于第二待训练解耦模型,对第三待解耦文字特征解耦处理,得到第三文字图像的第三风格类型特征和第三文字内容特征;基于待训练特征拼接模型对第三风格类型特征和第二文字内容特征拼接处理,得到与当前第二训练样本对应的实际文字图像。
以图3为例,当“永”字的文字图像和文字笔顺作为第二文字图像和第二文字笔顺时,可以将其输入至多媒体特征提取器(即训练完毕的第一字体特征提取子模型)中,从而得到反映“永”字风格类型特征以及文字内容特征的第二待解耦文字特征;当“春”字的文字图像和文笔顺序作为第三文字图像和第三文字笔顺时,同样将其输入至多媒体特征提取器中,从而得到反映“春”字的风格类型特征以及文字内容特征的第三待解耦文字特征。
进一步的,利用对应的解耦网络分别将第二待解耦文字特征以及第三待解耦文字特征解耦,即可将“永”字风格类型特征以及文字内容特征进行区分,并将“春”字的风格类型特征以及文字内容特征进行区分。
最后,基于待训练特征拼接模型将“永”字的文字内容特征,与“春”字的风格类型特征进行拼接,即得到“永”字的实际文字图像,可以理解,在模型未训练完毕时,实际文字图像中的“永”字可以在一定程度上呈现出“春”字所属字体的风格,只有在模型训练完毕后,所得到的实际文字图像才会完全呈现出目标风格类型,可以理解为,风格类型转换模型所对应的风格类型与第二组待处理子数据中的目标风格类型相匹配。
基于待训练风格类型转换模型中的至少三个预设损失函数对实际文字图像和第四文字图像进行损失处理,以根据得到的损失值对待训练风格类型转换模型中第一待训练解耦模型、第二待训练解耦模型、待训练特征拼接子模型以及待训练特征处理子模型的模型参数进行修正;将至少三个预设损失函数收敛作为训练目标,得到风格类型转换模型。
在实际应用过程中,三个预设损失函数可以包括重建损失函数(Rec Loss)、笔画损失函数(Stroke Order Loss)以及对抗性损失函数(Adv Loss)。具体的,对于重建损失函数来说,该函数用于直观约束网络输出是否符合预期;对于笔画损失函数来说,可以预训练一个自行设计的可预测笔顺信息的循环神经网络(Recurrent Neural Network,RNN),其中,RNN中的节点数为汉字最多笔画数,将每个节点预测的特征通过连接函数结合在一起,即形成一个笔顺特征矩阵。对于笔顺损失来说,可以通过计算网络生成与第二训练样本对应的实际文字图像,与目标风格类型下的第四文字图像的笔顺特征矩阵之间的损失值的方式得到,通过笔顺损失函数的处理,可以在文字生成过程中大量减少所得到的目标文字的错误率;对于对抗性损失函数来说,可以采用基于辅助分类器的条件生成对抗网络(Auxiliary Classifier GAN,ACGAN)对应的判别器结构,具体的,判别器在对模型最终生成的字体(即第二训练样本对应的实际文字图像中的字体)的真假进行判断的同时,还将最终生成字体的种类进行分类,通过在模型中部署该判别器,进一步减少了模型所得到的目标文字的错误率。
S430、获取待显示文字以及预先选择的目标风格类型。
S440、将待显示文字转换为与目标风格类型相对应的目标文字。
S450、将目标文字显示在目标显示界面上。
本实施例的技术方案,字体特征提取子模型训练完毕后,基于第二训练样本集对风格类型转换模型进行训练,从而得到训练完毕的风格类型转换模型;在训练过程中,利用至少三个预设损失函数对模型中的参数进行优化,进一步减少了模型所生成目标文字的错误率。
实施例五
图8为本公开实施例五所提供的一种文字生成装置的结构框图,可执行本公开任意实施例所提供的文字生成方法,具备执行方法相应的功能模块和有益效果。如图8所示,该装置具体包括:风格类型确定模块510、目标文字确定模块520以及文字显示模块530。
风格类型确定模块510,用于获取待显示文字以及预先选择的目标风格类型。
目标文字确定模块520,用于将所述待显示文字转换为与所述目标风格类型相对应的目标文字;其中,所述目标文字是基于风格类型转换模型预先生成的和/或实时生成的。
文字显示模块530,用于将所述目标文字显示在目标显示界面上。
可选的,风格类型确定模块510,还用于在检测到编辑待显示文字时,确定从风格类型列表中选择的目标风格类型;其中,所述风格类型列表中包括与所述风格类型转换模型相对应的风格类型。
可选的,目标文字确定模块520,还用于从与所述目标风格类型相对应的目标文字包中,获取与所述待显示文字相一致的目标文字;其中,所述目标文字包是基于所述风格类型转换模型将各文字转换至目标字体后生成的;或,将所述待显示文字输入至所述风格类型转换模型中,得到与所述目标字体相对应的目标文字。
在上述各技术方案的基础上,所述风格类型转换模型中包括第一字体特征提取子模型、第二字体特征提取子模型、与所述第一字体特征提取子模型相连接的第一解耦模型、与第二字体特征提取子模型相连接的第二解耦模型、与所述第一解耦模型和所述第二解耦模型相连接的特征拼接子模型,以及特征处理子模型;其中,所述第一字体特征提取子模型和所述第二特征提取子模型的模型结构相同,用于确定各文字的文字特征,所述文字特征中包括风格类型特征和文字内容特征;所述解耦模型,用于对所述字体特征提取子模型提取的文字特征解耦处理,以区分风格类型特征和文字内容特征;所述特征拼接子模型,用于对所述解耦模型提取的文字特征拼接处理,得到相应文字风格特征;所述特征处理子模型,用于对所述文字风格特征处理,得到所述待显示文字在目标风格类型下的目标文字。
可选的,目标文字确定模块520,还用于基于第一特征提取子模型确定所述待显示文字的第一待解耦文字特征,以及基于第二特征提取子模型确定目标风格文字的第二待解耦文字特征;其中,所述目标风格文字的文字类型与所述目标风格类型相一致;基于第一解耦模型对所述第一待解耦文字特征处理,得到所述待显示文字的待显示风格类型和待显示内容特征;以及,基于所述第二解耦模型对所述第二待解耦文字特征处理,得到所述目标风格文字的目标风格类型和目标内容特征;基于所述特征拼接模型获取所述待显示内容特征和所述目标风格类型,得到与所述待显示文字相对应的文字风格特征;基于所述特征处理子模型对所述文字风格特征处理,得到所述待显示文字在所述目标风格类型下对应的目标文字。
在上述各技术方案的基础上,文字生成装置还包括字体特征提取子模型训练模块。
字体特征提取子模型训练模块,用于训练得到所述风格类型转换模型中的所述至少两个字体特征提取子模型。
在上述各技术方案的基础上,字体特征提取子模型训练模块包括第一训练样本集合获取单元、第一训练样本处理单元、第一修正单元、待使用字体特征提取子模型确定单元以及字体特征提取子模型确定单元。
第一训练样本集合获取单元,用于获取第一训练样本集合;其中,所述第一训练样本集合中包括多个第一训练样本,每个第一训练样本中包括与第一训练文字对应的理论文字图片和理论文字笔画,以及掩膜部分所述理论文字笔画的掩膜文字笔画。
第一训练样本处理单元,用于针对各第一训练样本,将当前第一训练样本中的理论文字图片和掩膜文字笔画,输入至待训练字体特征提取子模型中,得到与所述当前第一训练样本相对应的实际文字图片和预测文字笔画。
第一修正单元,用于基于所述待训练特征提取子模型中的第一预设损失函数对实际文字图片和理论文字图片进行损失处理,以及基于第二预设损失函数对所述预测文字笔画和理论文字笔画损失处理,以根据得到的各损失值对所述待训练字体特征提取子模型中的模型参数进行修正。
待使用字体特征提取子模型确定单元,用于将所述第一预设损失函数和所述第二预设损失函数收敛作为训练目标,得到待使用字体特征提取子模型。
字体特征提取子模型确定单元,用于通过对所述待使用字体特征提取子模型剔除处理,得到所述字体特征提取子模型。
在上述各技术方案的基础上,所述待训练字体特征提取子模型中包括解码模块。
可选的,第一训练样本处理单元,还用于提取所述理论文字图片所对应的图像特征,并对所述图像特征压缩处理,得到第一待使用特征;通过对与所述掩膜文字笔画对应的特征向量进行处理,得到第二待使用特征;通过对所述第一待使用特征和所述第二待使用特征进行特征交互,得到与所述第一待使用特征对应的文字图像特征,以及与所述第二待使用特征对应的实际笔画特征;基于所述实际笔画特征,得到所述预测文字笔画,并基于所述解码模块对所述文字图像特征解码处理,得到所述实际文字图片。
可选的,字体特征提取子模型确定单元,还用于将所述待使用字体特征提取子模型中的所述解码模块剔除处理,得到所述风格类型转换模型中的字体特征提取子模型。
在上述各技术方案的基础上,文字生成装置还包括风格类型转换模型训练模块。
风格类型转换模型训练模块,用于训练得到所述风格类型转换模型。
在上述各技术方案的基础上,风格类型转换模型训练模块包括第二训练样本集获取单元、第二训练样本处理单元、第二修正单元以及风格类型转换模型确定单元。
第二训练样本集获取单元,用于获取第二训练样本集;其中,所述第二训练样本集中包括多个第二训练样本,所述第二训练样本中包括两组待处理子数据和校准数据,第一组待处理子数据中包括与待训练文字对应的第二文字图像、第二文字笔顺;第二组待处理子数据中包括目标风格类型的第三文字图像、第三文字笔顺;所述校准数据为所述第二文字图像在所述目标风格类型下对应的第四文字图像。
第二训练样本处理单元,用于针对各第二训练样本,将当前第二训练样本输入至待训练风格类型转换模型中,得到与所述当前第二训练样本对应的实际文字图像;其中,所述待训练风格类型转换模型中包括第一字体特征提取子模型、第二特征提取子模型、第一待训练解耦模型、第二待训练解耦模型、待训练特征拼接子模型以及待训练特征处理子模型。
第二修正单元,用于基于所述待训练风格类型转换模型中的至少三个预设损失函数对所述实际文字图像和第四文字图像进行损失处理,以根据得到的损失值对所述待训练风格类型转换模型中第一待训练解耦模型、第二待训练解耦模型、待训练特征拼接子模型以及待训练特征处理子模型的模型参数进行修正。
风格类型转换模型确定单元,用于将所述至少三个预设损失函数收敛作为训练目标,得到所述风格类型转换模型。
可选的,第二训练样本处理单元,还用于基于第一字体特征提取子模型,对所述当前训练样本中的第二文字图像和第二文字笔顺进行处理,得到所述第二文字图像的第二待解耦文字特征;以及,基于第二字体特征提取子模型,对所述当前训练样本中的第三文字图像和第三文字笔顺进行处理,得到所述第三文字图像的第三待解耦文字特征;基于所述第一待训练解耦模型,对所述第二待解耦文字特征进行解耦处理,得到所述第二文字图像的第二风格类型特征和第二文字内容特征;以及,基于所述第二待训练解耦模型,对所述第三待解耦文字特征解耦处理,得到所述第三文字图像的第三风格类型特征和第三文字内容特征;基于所述待训练特征拼接模型对所述第三风格类型特征和所述第二文字内容特征拼接处理,得到与所述当前第二训练样本对应的实际文字图像。
在上述各技术方案的基础上,所述风格类型转换模型所对应的风格类型与所述第二组待处理子数据中的目标风格类型相匹配。
本实施例所提供的技术方案,先获取待显示文字以及预先选择的目标风格类型,再将待显示文字转换为目标风格类型的目标文字,其中,目标文字是基于风格类型转换模型预先生成和/或实时生成的,最后将目标文字显示在目标显示界面上,通过引入人工智能模型生成特定风格的字体,不仅提供了简洁高效的文字设计方案,也避免了传统手工设计过程中出现的效率低、成本高、无法准确得到期望字体的问题。
本公开实施例所提供的文字生成装置可执行本公开任意实施例所提供的文字生成方法,具备执行方法相应的功能模块和有益效果。
值得注意的是,上述装置所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本公开实施例的保护范围。
实施例六
图9为本公开实施例六所提供的一种电子设备的结构示意图。下面参考图9,其示出了适于用来实现本公开实施例的电子设备(例如图9中的终端设备或服务器)600的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图9示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图9所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置606加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。编辑/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的编辑装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图9示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置606被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开实施例的方法中限定的上述功能。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
本公开实施例提供的电子设备与上述实施例提供的文字生成方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例与上述实施例具有相同的有益效果。
实施例七
本公开实施例提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例所提供的文字生成方法。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:
获取待显示文字以及预先选择的目标风格类型;
将所述待显示文字转换为与所述目标风格类型相对应的目标文字;其中,所述目标文字是基于风格类型转换模型预先生成的和/或实时生成的;
将所述目标文字显示在目标显示界面上。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,【示例一】提供了一种文字生成方法,该方法包括:
获取待显示文字以及预先选择的目标风格类型;
将所述待显示文字转换为与所述目标风格类型相对应的目标文字;其中,所述目标文字是基于风格类型转换模型预先生成的和/或实时生成的;
将所述目标文字显示在目标显示界面上。
根据本公开的一个或多个实施例,【示例二】提供了一种文字生成方法,还包括:
可选的,在检测到编辑待显示文字时,确定从风格类型列表中选择的目标风格类型;
其中,所述风格类型列表中包括与所述风格类型转换模型相对应的风格类型。
根据本公开的一个或多个实施例,【示例三】提供了一种文字生成方法,还包括:
可选的,从与所述目标风格类型相对应的目标文字包中,获取与所述待显示文字相一致的目标文字;其中,所述目标文字包是基于所述风格类型转换模型将各文字转换至目标字体后生成的;或,
将所述待显示文字输入至所述风格类型转换模型中,得到与所述目标字体相对应的目标文字。
根据本公开的一个或多个实施例,【示例四】提供了一种文字生成方法,还包括:
可选的,所述风格类型转换模型中包括第一字体特征提取子模型、第二字体特征提取子模型、与所述第一字体特征提取子模型相连接的第一解耦模型、与第二字体特征提取子模型相连接的第二解耦模型、与所述第一解耦模型和所述第二解耦模型相连接的特征拼接子模型,以及特征处理子模型;
其中,所述第一字体特征提取子模型和所述第二特征提取子模型的模型结构相同,用于确定各文字的文字特征,所述文字特征中包括风格类型特征和文字内容特征;所述解耦模型,用于对所述字体特征提取子模型提取的文字特征解耦处理,以区分风格类型特征和文字内容特征;所述特征拼接子模型,用于对所述解耦模型提取的文字特征拼接处理,得到相应文字风格特征;所述特征处理子模型,用于对所述文字风格特征处理,得到所述待显示文字在目标风格类型下的目标文字。
根据本公开的一个或多个实施例,【示例五】提供了一种文字生成方法,还包括:
可选的,基于第一特征提取子模型确定所述待显示文字的第一待解耦文字特征,以及基于第二特征提取子模型确定目标风格文字的第二待解耦文字特征;其中,所述目标风格文字的文字类型与所述目标风格类型相一致;
基于第一解耦模型对所述第一待解耦文字特征处理,得到所述待显示文字的待显示风格类型和待显示内容特征;以及,基于所述第二解耦模型对所述第二待解耦文字特征处理,得到所述目标风格文字的目标风格类型和目标内容特征;
基于所述特征拼接模型获取所述待显示内容特征和所述目标风格类型,得到与所述待显示文字相对应的文字风格特征;
基于所述特征处理子模型对所述文字风格特征处理,得到所述待显示文字在所述目标风格类型下对应的目标文字。
根据本公开的一个或多个实施例,【示例六】提供了一种文字生成方法,还包括:
可选的,训练得到所述风格类型转换模型中的所述至少两个字体特征提取子模型;
所述训练得到所述风格类型转换模型中的所述至少两个字体特征提取子模型,包括:
获取第一训练样本集合;其中,所述第一训练样本集合中包括多个第一训练样本,每个第一训练样本中包括与第一训练文字对应的理论文字图片和理论文字笔画,以及掩膜部分所述理论文字笔画的掩膜文字笔画;
针对各第一训练样本,将当前第一训练样本中的理论文字图片和掩膜文字笔画,输入至待训练字体特征提取子模型中,得到与所述当前第一训练样本相对应的实际文字图片和预测文字笔画;
基于所述待训练特征提取子模型中的第一预设损失函数对实际文字图片和理论文字图片进行损失处理,以及基于第二预设损失函数对所述预测文字笔画和理论文字笔画损失处理,以根据得到的各损失值对所述待训练字体特征提取子模型中的模型参数进行修正;
将所述第一预设损失函数和所述第二预设损失函数收敛作为训练目标,得到待使用字体特征提取子模型;
通过对所述待使用字体特征提取子模型剔除处理,得到所述字体特征提取子模型。
根据本公开的一个或多个实施例,【示例七】提供了一种文字生成方法,还包括:
可选的,所述待训练字体特征提取子模型中包括解码模块;
提取所述理论文字图片所对应的图像特征,并对所述图像特征压缩处理,得到第一待使用特征;
通过对与所述掩膜文字笔画对应的特征向量进行处理,得到第二待使用特征;
通过对所述第一待使用特征和所述第二待使用特征进行特征交互,得到与所述第一待使用特征对应的文字图像特征,以及与所述第二待使用特征对应的实际笔画特征;
基于所述实际笔画特征,得到所述预测文字笔画,并基于所述解码模块对所述文字图像特征解码处理,得到所述实际文字图片。
根据本公开的一个或多个实施例,【示例八】提供了一种文字生成方法,还包括:
可选的,将所述待使用字体特征提取子模型中的所述解码模块剔除处理,得到所述风格类型转换模型中的字体特征提取子模型。
根据本公开的一个或多个实施例,【示例九】提供了一种文字生成方法,还包括:
可选的,训练得到所述风格类型转换模型;
所述训练得到所述风格类型转换模型,包括:
获取第二训练样本集;其中,所述第二训练样本集中包括多个第二训练样本,所述第二训练样本中包括两组待处理子数据和校准数据,第一组待处理子数据中包括与待训练文字对应的第二文字图像、第二文字笔顺;第二组待处理子数据中包括目标风格类型的第三文字图像、第三文字笔顺;所述校准数据为所述第二文字图像在所述目标风格类型下对应的第四文字图像;
针对各第二训练样本,将当前第二训练样本输入至待训练风格类型转换模型中,得到与所述当前第二训练样本对应的实际文字图像;其中,所述待训练风格类型转换模型中包括第一字体特征提取子模型、第二特征提取子模型、第一待训练解耦模型、第二待训练解耦模型、待训练特征拼接子模型以及待训练特征处理子模型;
基于所述待训练风格类型转换模型中的至少三个预设损失函数对所述实际文字图像和第四文字图像进行损失处理,以根据得到的损失值对所述待训练风格类型转换模型中第一待训练解耦模型、第二待训练解耦模型、待训练特征拼接子模型以及待训练特征处理子模型的模型参数进行修正;
将所述至少三个预设损失函数收敛作为训练目标,得到所述风格类型转换模型。
根据本公开的一个或多个实施例,【示例十】提供了一种文字生成方法,还包括:
可选的,基于第一字体特征提取子模型,对所述当前训练样本中的第二文字图像和第二文字笔顺进行处理,得到所述第二文字图像的第二待解耦文字特征;以及,基于第二字体特征提取子模型,对所述当前训练样本中的第三文字图像和第三文字笔顺进行处理,得到所述第三文字图像的第三待解耦文字特征;
基于所述第一待训练解耦模型,对所述第二待解耦文字特征进行解耦处理,得到所述第二文字图像的第二风格类型特征和第二文字内容特征;以及,
基于所述第二待训练解耦模型,对所述第三待解耦文字特征解耦处理,得到所述第三文字图像的第三风格类型特征和第三文字内容特征;
基于所述待训练特征拼接模型对所述第三风格类型特征和所述第二文字内容特征拼接处理,得到与所述当前第二训练样本对应的实际文字图像。
根据本公开的一个或多个实施例,【示例十一】提供了一种文字生成方法,还包括:
可选的,所述风格类型转换模型所对应的风格类型与所述第二组待处理子数据中的目标风格类型相匹配。
根据本公开的一个或多个实施例,【示例十二】提供了一种文字生成装置,包括:
风格类型确定模块,用于获取待显示文字以及预先选择的目标风格类型;
目标文字确定模块,用于将所述待显示文字转换为与所述目标风格类型相对应的目标文字;其中,所述目标文字是基于风格类型转换模型预先生成的和/或实时生成的;
文字显示模块,用于将所述目标文字显示在目标显示界面上。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
Claims (14)
1.一种文字生成方法,其特征在于,包括:
获取待显示文字以及预先选择的目标风格类型;
将所述待显示文字转换为与所述目标风格类型相对应的目标文字;其中,所述目标文字是基于风格类型转换模型预先生成的和/或实时生成的;
将所述目标文字显示在目标显示界面上。
2.根据权利要求1所述的方法,其特征在于,所述获取待显示文字以及预先选择的目标风格类型,包括:
在检测到编辑待显示文字时,确定从风格类型列表中选择的目标风格类型;
其中,所述风格类型列表中包括与所述风格类型转换模型相对应的风格类型。
3.根据权利要求1所述的方法,其特征在于,所述将所述待显示文字转换为与所述目标风格类型相对应的目标文字,包括:
从与所述目标风格类型相对应的目标文字包中,获取与所述待显示文字相一致的目标文字;其中,所述目标文字包是基于所述风格类型转换模型将各文字转换至目标字体后生成的;或,
将所述待显示文字输入至所述风格类型转换模型中,得到与所述目标字体相对应的目标文字。
4.根据权利要求1-3中任一所述的方法,其特征在于,所述风格类型转换模型中包括第一字体特征提取子模型、第二字体特征提取子模型、与所述第一字体特征提取子模型相连接的第一解耦模型、与第二字体特征提取子模型相连接的第二解耦模型、与所述第一解耦模型和所述第二解耦模型相连接的特征拼接子模型,以及特征处理子模型;
其中,所述第一字体特征提取子模型和所述第二字体特征提取子模型的模型结构相同,用于确定各文字的文字特征,所述文字特征中包括风格类型特征和文字内容特征;所述解耦模型,用于对所述字体特征提取子模型提取的文字特征解耦处理,以区分风格类型特征和文字内容特征;所述特征拼接子模型,用于对所述解耦模型提取的文字特征拼接处理,得到相应文字风格特征;所述特征处理子模型,用于对所述文字风格特征处理,得到所述待显示文字在目标风格类型下的目标文字。
5.根据权利要求4所述的方法,其特征在于,基于风格类型转换模型确定目标风格类型的目标文字,包括:
基于第一特征提取子模型确定所述待显示文字的第一待解耦文字特征,以及基于第二特征提取子模型确定目标风格文字的第二待解耦文字特征;其中,所述目标风格文字的文字类型与所述目标风格类型相一致;
基于第一解耦模型对所述第一待解耦文字特征处理,得到所述待显示文字的待显示风格类型和待显示内容特征;以及,基于所述第二解耦模型对所述第二待解耦文字特征处理,得到所述目标风格文字的目标风格类型和目标内容特征;
基于所述特征拼接模型获取所述待显示内容特征和所述目标风格类型,得到与所述待显示文字相对应的文字风格特征;
基于所述特征处理子模型对所述文字风格特征处理,得到所述待显示文字在所述目标风格类型下对应的目标文字。
6.根据权利要求4所述的方法,其特征在于,还包括:
训练得到所述风格类型转换模型中的两个字体特征提取子模型;
所述训练得到所述风格类型转换模型中的两个字体特征提取子模型,包括:
获取第一训练样本集合;其中,所述第一训练样本集合中包括多个第一训练样本,每个第一训练样本中包括与第一训练文字对应的理论文字图片和理论文字笔画,以及掩膜部分所述理论文字笔画的掩膜文字笔画;
针对各第一训练样本,将当前第一训练样本中的理论文字图片和掩膜文字笔画,输入至待训练字体特征提取子模型中,得到与所述当前第一训练样本相对应的实际文字图片和预测文字笔画;
基于所述待训练特征提取子模型中的第一预设损失函数对实际文字图片和理论文字图片进行损失处理,以及基于第二预设损失函数对所述预测文字笔画和理论文字笔画损失处理,以根据得到的各损失值对所述待训练字体特征提取子模型中的模型参数进行修正;
将所述第一预设损失函数和所述第二预设损失函数收敛作为训练目标,得到待使用字体特征提取子模型;
通过对所述待使用字体特征提取子模型剔除处理,得到所述字体特征提取子模型。
7.根据权利要求6所述的方法,其特征在于,所述待训练字体特征提取子模型中包括解码模块,所述将当前第一训练样本中的理论文字图片和掩膜文字笔画,输入至待训练字体特征提取子模型中,得到与所述当前第一训练样本相对应的实际文字图片和预测文字笔画,包括:
提取所述理论文字图片所对应的图像特征,并对所述图像特征压缩处理,得到第一待使用特征;
通过对与所述掩膜文字笔画对应的特征向量进行处理,得到第二待使用特征;
通过对所述第一待使用特征和所述第二待使用特征进行特征交互,得到与所述第一待使用特征对应的文字图像特征,以及与所述第二待使用特征对应的实际笔画特征;
基于所述实际笔画特征,得到所述预测文字笔画,并基于所述解码模块对所述文字图像特征解码处理,得到所述实际文字图片。
8.根据权利要求7所述的方法,其特征在于,所述通过对所述待使用字体特征提取子模型剔除处理,得到所述字体特征提取子模型,包括:
将所述待使用字体特征提取子模型中的所述解码模块剔除处理,得到所述风格类型转换模型中的字体特征提取子模型。
9.根据权利要求6所述的方法,其特征在于,还包括:
训练得到所述风格类型转换模型;
所述训练得到所述风格类型转换模型,包括:
获取第二训练样本集;其中,所述第二训练样本集中包括多个第二训练样本,所述第二训练样本中包括两组待处理子数据和校准数据,第一组待处理子数据中包括与待训练文字对应的第二文字图像、第二文字笔顺;第二组待处理子数据中包括目标风格类型的第三文字图像、第三文字笔顺;所述校准数据为所述第二文字图像在所述目标风格类型下对应的第四文字图像;
针对各第二训练样本,将当前第二训练样本输入至待训练风格类型转换模型中,得到与所述当前第二训练样本对应的实际文字图像;其中,所述待训练风格类型转换模型中包括第一字体特征提取子模型、第二特征提取子模型、第一待训练解耦模型、第二待训练解耦模型、待训练特征拼接子模型以及待训练特征处理子模型;
基于所述待训练风格类型转换模型中的至少三个预设损失函数对所述实际文字图像和第四文字图像进行损失处理,以根据得到的损失值对所述待训练风格类型转换模型中第一待训练解耦模型、第二待训练解耦模型、待训练特征拼接子模型以及待训练特征处理子模型的模型参数进行修正;
将所述至少三个预设损失函数收敛作为训练目标,得到所述风格类型转换模型。
10.根据权利要求9所述的方法,其特征在于,所述将当前第二训练样本输入至待训练风格类型转换模型中,得到与所述当前第二训练样本对应的实际文字图像,包括:
基于第一字体特征提取子模型,对所述当前训练样本中的第二文字图像和第二文字笔顺进行处理,得到所述第二文字图像的第二待解耦文字特征;以及,基于第二字体特征提取子模型,对所述当前训练样本中的第三文字图像和第三文字笔顺进行处理,得到所述第三文字图像的第三待解耦文字特征;
基于所述第一待训练解耦模型,对所述第二待解耦文字特征进行解耦处理,得到所述第二文字图像的第二风格类型特征和第二文字内容特征;以及,
基于所述第二待训练解耦模型,对所述第三待解耦文字特征解耦处理,得到所述第三文字图像的第三风格类型特征和第三文字内容特征;
基于所述待训练特征拼接模型对所述第三风格类型特征和所述第二文字内容特征拼接处理,得到与所述当前第二训练样本对应的实际文字图像。
11.根据权利要求9所述的方法,其特征在于,所述风格类型转换模型所对应的风格类型与所述第二组待处理子数据中的目标风格类型相匹配。
12.一种文字生成装置,其特征在于,包括:
风格类型确定模块,用于获取待显示文字以及预先选择的目标风格类型;
目标文字确定模块,用于将所述待显示文字转换为与所述目标风格类型相对应的目标文字;其中,所述目标文字是基于风格类型转换模型预先生成的和/或实时生成的;
文字显示模块,用于将所述目标文字显示在目标显示界面上。
13.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-11中任一所述的文字生成方法。
14.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-11中任一所述的文字生成方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111644361.6A CN114330236A (zh) | 2021-12-29 | 2021-12-29 | 文字生成方法、装置、电子设备及存储介质 |
PCT/CN2022/141827 WO2023125379A1 (zh) | 2021-12-29 | 2022-12-26 | 文字生成方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111644361.6A CN114330236A (zh) | 2021-12-29 | 2021-12-29 | 文字生成方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114330236A true CN114330236A (zh) | 2022-04-12 |
Family
ID=81016218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111644361.6A Pending CN114330236A (zh) | 2021-12-29 | 2021-12-29 | 文字生成方法、装置、电子设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114330236A (zh) |
WO (1) | WO2023125379A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023125379A1 (zh) * | 2021-12-29 | 2023-07-06 | 北京字跳网络技术有限公司 | 文字生成方法、装置、电子设备及存储介质 |
WO2023202543A1 (zh) * | 2022-04-18 | 2023-10-26 | 北京字跳网络技术有限公司 | 文字处理方法、装置、电子设备及存储介质 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116776828B (zh) * | 2023-08-28 | 2023-12-19 | 福昕鲲鹏(北京)信息科技有限公司 | 文本渲染方法、装置、设备和存储介质 |
CN117934974B (zh) * | 2024-03-21 | 2024-06-14 | 中国科学技术大学 | 场景文本任务处理方法、系统、设备及存储介质 |
CN118351553B (zh) * | 2024-06-17 | 2024-08-20 | 江西师范大学 | 一种基于笔顺动态学习的可解释性少样本字体生成方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012173833A (ja) * | 2011-02-18 | 2012-09-10 | Brother Ind Ltd | 電子筆記装置 |
CN109285111A (zh) * | 2018-09-20 | 2019-01-29 | 广东工业大学 | 一种字体转换的方法、装置、设备及计算机可读存储介质 |
CN112115678A (zh) * | 2020-09-21 | 2020-12-22 | 京东方科技集团股份有限公司 | 信息展示方法及装置、存储介质及电子设备 |
CN112419174A (zh) * | 2020-11-04 | 2021-02-26 | 中国科学院自动化研究所 | 基于门循环单元的图像文字去除方法、系统及装置 |
CN113807430A (zh) * | 2021-09-15 | 2021-12-17 | 网易(杭州)网络有限公司 | 模型训练的方法、装置、计算机设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020170309A (ja) * | 2019-04-02 | 2020-10-15 | キヤノン株式会社 | 画像処理システム、画像処理装置、画像処理方法、及びプログラム |
CN113569080A (zh) * | 2021-01-15 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 基于人工智能的字库处理方法、装置、设备及存储介质 |
CN114330236A (zh) * | 2021-12-29 | 2022-04-12 | 北京字跳网络技术有限公司 | 文字生成方法、装置、电子设备及存储介质 |
-
2021
- 2021-12-29 CN CN202111644361.6A patent/CN114330236A/zh active Pending
-
2022
- 2022-12-26 WO PCT/CN2022/141827 patent/WO2023125379A1/zh unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012173833A (ja) * | 2011-02-18 | 2012-09-10 | Brother Ind Ltd | 電子筆記装置 |
CN109285111A (zh) * | 2018-09-20 | 2019-01-29 | 广东工业大学 | 一种字体转换的方法、装置、设备及计算机可读存储介质 |
CN112115678A (zh) * | 2020-09-21 | 2020-12-22 | 京东方科技集团股份有限公司 | 信息展示方法及装置、存储介质及电子设备 |
CN112419174A (zh) * | 2020-11-04 | 2021-02-26 | 中国科学院自动化研究所 | 基于门循环单元的图像文字去除方法、系统及装置 |
CN113807430A (zh) * | 2021-09-15 | 2021-12-17 | 网易(杭州)网络有限公司 | 模型训练的方法、装置、计算机设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
白海娟;周未;王存睿;王磊;: "基于生成式对抗网络的字体风格迁移方法", 大连民族大学学报, no. 03, 15 May 2019 (2019-05-15), pages 60 - 66 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023125379A1 (zh) * | 2021-12-29 | 2023-07-06 | 北京字跳网络技术有限公司 | 文字生成方法、装置、电子设备及存储介质 |
WO2023202543A1 (zh) * | 2022-04-18 | 2023-10-26 | 北京字跳网络技术有限公司 | 文字处理方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2023125379A1 (zh) | 2023-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114330236A (zh) | 文字生成方法、装置、电子设备及存储介质 | |
WO2023125361A1 (zh) | 文字生成方法、装置、电子设备及存储介质 | |
WO2023125374A1 (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN111399729A (zh) | 图像的绘制方法、装置、可读介质和电子设备 | |
CN112084920B (zh) | 提取热词的方法、装置、电子设备及介质 | |
CN112839223B (zh) | 图像压缩方法、装置、存储介质及电子设备 | |
CN112037792A (zh) | 一种语音识别方法、装置、电子设备及存储介质 | |
CN113778419B (zh) | 多媒体数据的生成方法、装置、可读介质及电子设备 | |
CN112785669B (zh) | 一种虚拟形象合成方法、装置、设备及存储介质 | |
CN114416260B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
WO2023138498A1 (zh) | 生成风格化图像的方法、装置、电子设备及存储介质 | |
WO2023202543A1 (zh) | 文字处理方法、装置、电子设备及存储介质 | |
CN112950640A (zh) | 视频人像分割方法、装置、电子设备及存储介质 | |
CN115965840A (zh) | 图像风格迁移和模型训练方法、装置、设备和介质 | |
CN114937192A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN114913061A (zh) | 一种图像处理方法、装置、存储介质及电子设备 | |
CN114564606A (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN110188782B (zh) | 图像相似性确定方法、装置、电子设备及可读存储介质 | |
CN113610034B (zh) | 识别视频中人物实体的方法、装置、存储介质及电子设备 | |
US20240127406A1 (en) | Image quality adjustment method and apparatus, device, and medium | |
CN117171573A (zh) | 多模态模型的训练方法、装置、设备和存储介质 | |
CN111626922A (zh) | 图片生成方法、装置、电子设备及计算机可读存储介质 | |
CN110674813A (zh) | 汉字识别方法、装置、计算机可读介质及电子设备 | |
CN114862720A (zh) | 画布还原方法、装置、电子设备和计算机可读介质 | |
CN111626044A (zh) | 文本生成方法、装置、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |