CN114283422A - 一种手写字体生成方法、装置、电子设备和存储介质 - Google Patents

一种手写字体生成方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN114283422A
CN114283422A CN202111001073.9A CN202111001073A CN114283422A CN 114283422 A CN114283422 A CN 114283422A CN 202111001073 A CN202111001073 A CN 202111001073A CN 114283422 A CN114283422 A CN 114283422A
Authority
CN
China
Prior art keywords
font
target
handwritten
text
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111001073.9A
Other languages
English (en)
Inventor
董广泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202111001073.9A priority Critical patent/CN114283422A/zh
Publication of CN114283422A publication Critical patent/CN114283422A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本申请涉及计算机技术领域,尤其涉及一种手写字体生成方法、装置、电子设备和存储介质,用以降低操作复杂度,提高手写字体的生成效率。其中,方法包括:响应于目标对象触发的文字素材采集操作,获取目标对象上传的字体素材图像,以及基于字体素材图像确定的目标对象对应的字形特征信息,字体素材图像为目标对象的历史手写字稿的图像;响应于目标对象触发的输入操作,获取目标对象输入的标准字体目标文本,并在文字预览界面中,展示生成的标准字体目标文本对应的手写字体目标文本,其中,手写字体目标文本至少是基于字形特征信息生成的。由于本申请只需上传目标对象历史手写字稿的图像,不受字体模板的文字限制,灵活性更高,更加方便快捷。

Description

一种手写字体生成方法、装置、电子设备和存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种手写字体生成方法、装置、电子设备和存储介质。
背景技术
随着互联网的飞速发展,个性化字体使得信息传播更加生动、直观。人们追求美观、个性化的意愿越来越强烈。
相比于规范的印刷字体,越来越多的人希望在进行沟通交流时可以使用个性化字体,尤其是手写字体。个性化字体能够更加灵活地表达书写者的风格和感情。
相关技术下,在手写字体生成软件中,首先需要下载官网提供的字体模板,进而基于模板来生成手写字体。由于字体模板规定了模板中具体所包含哪些文字,受模板限制仅能手写模板中出现的文字,且需要严格按照模板要求进行书写,因而生成个性化字体的灵活性较差,且按照模板书写的操作过程较为繁琐,需要耗费大量时间。
发明内容
本申请实施例提供一种手写字体生成方法、装置、电子设备和存储介质,用以降低操作复杂度,提高手写字体的生成效率。
本申请实施例提供的第一种手写字体生成方法,包括:
响应于目标对象触发的文字素材采集操作,获取所述目标对象上传的字体素材图像,以及基于所述字体素材图像确定的所述目标对象对应的字形特征信息,所述字体素材图像为所述目标对象的历史手写字稿的图像;
响应于所述目标对象触发的输入操作,获取所述目标对象输入的标准字体目标文本,并在文字预览界面中,展示生成的所述标准字体目标文本对应的手写字体目标文本,其中,所述手写字体目标文本至少是基于所述字形特征信息生成的。
本申请实施例提供的第二种手写字体生成方法,包括:
获取目标对象上传的字体素材图像,所述字体素材图像为所述目标对象的历史手写字稿的图像;
通过对所述字体素材图像进行字形特征识别,获取所述目标对象对应的字形特征信息;
获取所述目标对象输入的标准字体目标文本,基于所述字形特征信息生成所述标准字体目标文本对应的手写字体目标文本,并将所述手写字体目标文本反馈给客户端,以使所述客户端在文字预览界面中,展示所述手写字体目标文本。
本申请实施例提供的第一种手写字体生成装置,包括:
特征获取单元,用于响应于目标对象触发的文字素材采集操作,获取所述目标对象上传的字体素材图像,以及基于所述字体素材图像确定的所述目标对象对应的字形特征信息,所述字体素材图像为所述目标对象的历史手写字稿的图像;
展示单元,用于响应于所述目标对象触发的输入操作,获取所述目标对象输入的标准字体目标文本,并在文字预览界面中,展示生成的所述标准字体目标文本对应的手写字体目标文本,其中,所述手写字体目标文本至少是基于所述字形特征信息生成的。
可选的,所述手写字体目标文本包括基于所述字形特征信息生成的第一类手写字体目标子文本,以及基于语境信息生成的第二类手写字体目标子文本;所述展示单元具体用于:
通过对所述标准字体目标文本进行语义分词,确定所述标准字体目标文本的语境信息;
在所述文字预览界面中展示所述第一类手写字体目标子文本,以及基于所述语境信息生成的第二类手写字体目标子文本,其中,不同语境信息对应不同的手写字体字形。
可选的,所述第二类手写字体目标子文本的字形是:基于所述语境信息对所述第一类手写字体目标子文本的字形进行调整而生成的;或者,基于不同语境信息与不同字形之间的映射关系确定的,所述语境信息对应的字形。
可选的,所述手写字体目标文本包括基于所述字形特征信息生成的第一类手写字体目标子文本,以及基于指定语言生成的第三类手写字体目标子文本;所述展示单元具体用于:
确定所述标准字体目标文本对应的指定语言;
在所述文字预览界面中展示所述第一类手写字体目标子文本,以及所述指定语言的第三类手写字体目标子文本,所述第三类手写字体目标文本的字形是基于所述字形特征信息确定的。
可选的,若所述手写字体目标文本的数目为多个,则所述装置还包括:
反馈单元,用于在所述展示单元在文字预览界面中,展示生成的所述标准字体目标文本对应的手写字体目标文本之后,响应于所述目标对象针对多个手写字体目标文本触发的选中操作,获得所述目标对象选中的目标手写字体目标文本,以及将所述目标手写字体目标文本和相应的标准字体目标文本发送给所述目标对象的交互对象,以使所述交互对象在相应的交互界面中查看所述目标手写字体目标文本,并在触发辅助控件时,在所述交互界面中展示所述标准字体目标文本。
可选的,所述装置还包括:
第一转换单元,用于获取所述交互对象的第一对象特征信息;
基于所述第一对象特征信息,确定所述交互对象对应的第一文字格式特征;
将所述目标对象选中的目标手写字体目标文本,转换为符合所述第一文字格式特征的目标手写字体目标文本,并将转换后的目标手写字体目标文本发送给所述交互对象。
可选的,所述展示单元还用于:
接收所述目标对象的交互对象发送的交互消息,并在交互界面中展示所述交互消息对应的手写字体交互文本,所述手写字体交互文本为基于所述字形特征信息生成的;
响应于所述目标对象针对辅助控件的触发操作,在所述交互消息的关联展示位置展示所述交互消息对应的标准字体交互文本。
可选的,所述装置还包括:
第二转换单元,用于获取所述目标对象的第二对象特征信息;
基于所述第二对象特征信息,确定所述目标对象对应的第二文字格式特征;
将所述手写字体交互文本,转换为符合所述第二文字格式特征的手写字体交互文本,并在所述交互界面展示转换后的手写字体交互文本。
可选的,所述展示单元还用于:
在所述特征获取单元获取所述目标对象上传的字体素材图像,以及基于所述字体素材图像确定的所述目标对象对应的字形特征信息之后,响应于所述目标对象触发的输入操作之前,在文字识别界面中展示针对所述字体素材图像的文字识别结果,所述文字识别结果包括已识别的各个手写字体文字,以及所述各个手写字体文字各自对应的标准字体文字;
响应于所述目标对象选中目标文字的触发操作,对所述目标文字对应的手写字体文字与标准字体文字中的至少一类进行校正。
可选的,所述文字预览界面还包括用于对手写字体进行样式调整的调整控件;所述装置还包括:
调整单元,用于响应于针对所述调整控件触发的查看操作,展示各个字体调整样式对应的样式参考信息;
响应于所述目标对象针对多个字体调整样式触发的选中操作,获取所述目标对象选中的目标字体调整样式,以及基于所述目标字体调整样式对应的样式参考信息,对所述手写字体目标文本进行相应的样式调整。
本申请实施例提供的第二种手写字体生成装置,包括:
图像获取单元,用于获取目标对象上传的字体素材图像,所述字体素材图像为所述目标对象的历史手写字稿的图像;
特征获取单元,用于通过对所述字体素材图像进行字形特征识别,获取所述目标对象对应的字形特征信息;
生成单元,用于获取所述目标对象输入的标准字体目标文本,基于所述字形特征信息生成所述标准字体目标文本对应的手写字体目标文本,并将所述手写字体目标文本反馈给客户端,以使所述客户端在文字预览界面中,展示所述手写字体目标文本。
可选的,所述特征获取单元具体用于:
将所述字体素材图像输入已训练的字体生成模型,基于所述字体生成模型对所述字体素材图像进行字形特征识别,获取所述目标对象对应的字形特征信息;
所述生成单元具体用于:
将所述标准字体目标文本输入所述字体生成模型,基于所述字形特征信息,获得所述字体生成模型生成的所述手写字体目标文本。
可选的,所述字体生成模型包括判别器和生成器;所述装置还包括:
训练单元,用于通过下列方式训练得到所述字体生成模型:
根据训练样本数据集中的训练样本,对未训练的字体生成模型执行循环迭代训练,并在训练完毕时,输出训练完毕的字体生成模型;其中,每一次循环迭代训练过程包括以下操作:
从所述训练样本数据集中选取训练样本,所述训练样本包括含随机噪声的标准字体图像,以及用于标识标准字体图像中各个文字的标签信息;
将所述训练样本中的标准字体图像以及对应的标签信息,输入所述字体生成模型中的生成器,获取所述生成器生成的所述标准字体图像对应的手写字体图像;
将所述标准字体图像与所述手写字体图像,输入所述字体生成模型中的判别器,通过对所述手写字体图像中的各个文字进行识别,获得所述判别器输出的各个文字对应的预测文字标签以及相应的识别准确率;
基于所述各个文字对应的预测文字标签、标签信息以及相应的识别准确率,对所述字体生成模型的模型参数进行调整。
可选的,所述装置还包括:
反馈单元,用于对所述字体素材图像进行文字识别,获取识别出的所述字体素材图像中的各个手写字体文字,以及所述各个手写字体文字各自对应的标准字体文字;
将所述各个手写字体文字以及所述各个手写字体文字各自对应的标准字体文字作为文字识别结果,反馈给所述目标对象对应的客户端,以使所述目标对象对应的客户端在文字识别界面中展示针对所述字体素材图像的文字识别结果。
可选的,若所述手写字体目标文本的数目为多个,则所述装置还包括:
第一交互单元,用于获得所述目标对象选中的目标手写字体目标文本;
将所述目标手写字体目标文本和相应的标准字体目标文本发送给所述目标对象的交互对象对应的客户端,以使所述交互对象对应的客户端在相应的交互界面中展示所述目标手写字体目标文本,并在所述交互对象触发辅助控件时,在所述交互界面中展示所述标准字体目标文本。
可选的,所述装置还包括:
第二交互单元,用于接收所述目标对象的交互对象发送的交互消息;
基于所述字迹特征信息生成所述交互消息对应的手写字体交互文本,并将所述手写字体交互文本以及所述交互消息对应的标准字体交互文本,发送给所述目标对象对应的客户端,以使所述目标对象对应的客户端在交互界面中展示所述手写字体交互文本,并在所述目标对象触发辅助控件时,在所述交互消息的关联展示位置展示所述标准字体交互文本。
本申请实施例提供的一种电子设备,包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行上述任意一种手写字体生成方法的步骤。
本申请实施例提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任意一种手写字体生成方法的步骤。
本申请实施例提供一种计算机可读存储介质,其包括程序代码,当所述程序产品在电子设备上运行时,所述程序代码用于使所述电子设备执行上述任意一种手写字体生成方法的步骤。
本申请有益效果如下:
本申请实施例提供了一种手写字体生成方法、装置、电子设备和存储介质。由于本申请实施例中,目标对象只需要上传字体素材图像,进而通过字体素材图像学习目标对象对应的字形特征,基于此,在目标对象输入标准字体目标文本时,即可生成的所述标准字体目标文本对应的手写字体目标文本。该方式下目标对象不需要下载字体模板,只需上传自己的历史手写字稿的图像即可,并且,不受字体模板的文字限制,灵活性更高,更加方便快捷,可以有效提高手写字体生成效率。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1A为相关技术中的一种个人计算机端的手写字体生成软件相关的操作流程图的一个可选的示意图;
图1B为相关技术中的一种平台提供的模板的一个可选的示意图;
图1C为相关技术中的一种手写英文字体的一个可选的示意图;
图1D为相关技术中的一种字体生成软件获取用户字迹方式的示意图的一个可选的示意图;
图1E为相关技术中的另一种字体生成软件获取用户字迹方式的示意图的一个可选的示意图;
图2为本申请实施例中的一种应用场景的示意图;
图3为本申请实施例中的第一种手写字体生成方法的流程示意图;
图4为本申请实施例中的一种字体素材图像的一个可选的示意图;
图5为本申请实施例中的一种目标文本的一个可选的示意图;
图6为本申请实施例中的一种文字预览界面的一个可选的示意图;
图7为本申请实施例中的一种语境与字形映射表的一个可选的示意图;
图8为本申请实施例中的一种聊天界面的一个可选的示意图;
图9为本申请实施例中的另一种聊天界面的一个可选的示意图;
图10为本申请实施例中的一种文字识别结果的一个可选的示意图;
图11为本申请实施例中的又一种文字预览界面的一个可选的示意图;
图12为本申请实施例中的第二种手写字体生成方法的流程示意图;
图13为本申请实施例中的一种产品使用流程的示意图;
图14A为本申请实施例中的一种生成器的网络结构示意图;
图14B为本申请实施例中的一种判别器的网络结构示意图;
图15为本申请实施例中的一种字体生成模型的训练方法的流程示意图;
图16为本申请实施例中的一种不同网络生成字形的对比结果示意图;
图17为本申请实施例中的一个可选的交互实现时序流程示意图;
图18为本申请实施例中的第一种手写字体生成装置的组成结构示意图;
图19为本申请实施例中的第二种手写字体生成装置的组成结构示意图;
图20为应用本申请实施例的一种电子设备的一个硬件组成结构示意图;
图21为应用本申请实施例的另一种电子设备的一个硬件组成结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请技术方案的一部分实施例,而不是全部的实施例。基于本申请文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请技术方案保护的范围。
下面对本申请实施例中涉及的部分概念进行介绍。
字体素材图像:包含用户手写字体的图像,在本申请实施例中,字体图像可以指目标对象的历史手写字稿的图像,比如用户之前书写的古诗词手写品。
标准字体:是指经过设计的专用以表现企业名称或品牌的字体。故标准字体设计,包括企业名称标准字和品牌标准字的设计。在本申请实施例中,是指常用办公软件中常见的非用户手写生成的字体,如宋体,楷体,隶书等等。
手写字体:是一种使用硬笔或者软笔纯手工写出的文字,也可以指通过屏幕手写出的文字。这种手写体文字,大小不一、形态各异,在计算机字库中很难实现错落有致的效果。只能使用手工写字的方法传承下去。在本申请实施例中,主要是指用户手写生成的字体。
生成式对抗网络(Generative Adversarial Networks,GAN):是一种深度学习模型。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。其核心就是通过对抗损失(adversarial loss)来促使生成器G生成图像无法与真实图像区分开。
条件式生成对抗网络(Cycle-Generative Adversarial Networks,CGAN):是在对抗网络的基础上添加标签条件。对抗网络已经成为一个训练机器预测能力新方法,简单地通过观察就能进行预测。一个对抗网络带有一个发生器,从随机输入中生成某类数据。还带有一个判别器,它从发生器中获取输入,或者从一个真实数据组中获取输入,判别器必须区分来源不同的输入,判别真伪。两个神经网络能实现自身优化,从而生成更加真实的输入,以及世界观更为合理的网络。判别器会优化自身,防止被生成器欺骗。反过来,生成器也正在优化自己,尽可能地迷惑鉴别器,让其难辨真伪。
客户端(Client)或称为用户端:是指与服务器相对应,为客户提供本地服务的程序。除了一些只在本地运行的应用程序之外,一般安装在普通的客户机上,需要与服务端互相配合运行。因特网发展以后,较常用的用户端包括了如万维网使用的网页浏览器,收寄电子邮件时的电子邮件客户端,以及即时通信的客户端软件等。对于这一类应用程序,需要网络中有相应的服务器和服务程序来提供相应的服务,如数据库服务,电子邮件服务等等,这样在客户机和服务器端,需要建立特定的通信连接,来保证应用程序的正常运行。
文字预览界面:是一个面向用户的,用于向用户展示生成的手写字体的页面;另外,该界面中还可进一步包括调整控件,用户还可基于该控件,对文字预览界面展示的手写字体目标文本进行样式调整。
文字识别界面:是一个面向用户的,用于展示针对用户上传的字体素材图像的文字识别结果的页面。户可在文字识别界面中查阅针对用户上传的字体素材图像识别出的各个手写字体文字,以及相对应的标准字体文字,允许用户人工校正。
本申请实施例涉及人工智能(Artificial Intelligence,AI)和机器学习技术,基于人工智能中的计算机视觉技术和机器学习(Machine Learning,ML)而设计。
人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。
人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术主要包括计算机视觉技术、自然语言处理技术、以及机器学习/深度学习等几大方向。随着人工智能技术研究和进步,人工智能在多个领域展开研究和应用,例如常见的智能家居、智能客服、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、机器人、智能医疗等,相信随着技术的发展,人工智能将在更多的领域得到应用,并发挥越来越重要的价值。
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。对比于数据挖掘从大数据之间找相互特性而言,机器学习更加注重算法的设计,让计算机能够自动地从数据中“学习”规律,并利用规律对未知数据进行预测。
机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。本申请实施例中的字体生成模型就是采用机器学习或深度学习技术训练得到的。基于本申请实施例中的字体生成模型的训练方法,可以生成目标文本对应的手写字体文本。
在本申请实施例中提出的训练字体生成模型的方法可分为两部分,包括训练部分和应用部分;其中,训练部分就涉及到机器学习这一技术领域,在训练部分中,通过机器学习这一技术训练字体生成模型。具体的,使用本申请实施例中给出的训练样本来训练字体生成模型,训练样本通过字体生成模型后,获取字体生成模型的输出结果,结合输出结果,不断调整模型参数,输出训练完毕的字体生成模型;应用部分用于使用在训练部分训练得到的字体生成模型来生成目标对象输入的标准字体目标文本对应的手写字体目标文本。
下面对本申请实施例的设计思想进行简要介绍:
在相关技术中,常见的手写字体生成软件主要有三种,首先是英文字体生成软件,这类软件只需根据手写的26个字母的大小写来训练相应模型,较为简单,如图1A所示,其为相关技术中的一种个人计算机(personal computer,PC)端的手写字体生成软件相关的操作流程图。
该平台采用了让用户填写平台提供的模板,如图1B所示,其为相关技术中的一种字体模板的示意图,模板上有26个字母的填写并用二维码定位,类似于考试所用的“答题卡”,用户填写完成后可拍照上传,平台使用文字识别技术提取用户的写字风格特征,最后生成英文字体,如图1C所示,其为相关技术中的一种手写英文字体的示意图。相较于英文的26个字母,GB 18030-2000标准下的汉字多达27533个,显然,这样的方式显然不能类推到手写汉字的生成。
其次是基于模板的字体生成软件,需要按要求将文字一一书写拍照上传到系统,对拍照的规范要求很高,或者,需要用户下载官网提供的模板,打印手写完毕后拍照上传。因此,生成个性化字体的灵活性较差,是一件费时费力的工作。
如图1D所示,其为相关技术中的一种字体生成软件获取用户字迹方式的示意图,需要用户在屏幕上手写指定的文字集,软件会根据书写的文字生成相应的字体,需要用户花费较多时间,且使用手指在屏幕上书写很难与平时书写字迹一致,且书写难度大,操作难度高。
或者,如图1E所示,其为相关技术中的另一种字体生成软件获取用户字迹方式的示意图,用户需要下载系统提供的模板并打印,在填写完成后要一一对应的上传到系统。需要下载并打印填写,操作复杂。
有鉴于此,本申请实施例提供一种手写字体生成方法、装置、电子设备和存储介质。由于本申请实施例中,目标对象只需要上传字体素材图像,进而通过字体素材图像学习目标对象对应的字形特征,基于此,在目标对象输入标准字体目标文本时,即可生成的标准字体目标文本对应的手写字体目标文本。该方式下目标对象不需要下载字体模板,只需上传自己的历史手写字稿的图像即可,并且,不受字体模板的文字限制,灵活性更高,更加方便快捷。
以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请,并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
如图2所示,其为本申请实施例的应用场景示意图。该应用场景图中包括两个终端设备210和一个服务器220。本申请实施例中的终端设备210上可以安装有用于生成手写字体的客户端,该客户端可以是软件,也可以是网页、小程序等,服务器则是与软件或是网页、小程序等相对应的后台服务器,本申请不做具体限定。
在本申请实施例中,用户通过终端设备210可登陆应用相关操作界面,终端设备210通过响应用户在相关操作界面触发的各种操作,来生成手写字体并展示等,相关操作界面则可以是包含文字预览界面、文字结果界面等。
在一种实施方式中,终端设备210与服务器220之间可以通过通信网络进行通信。
在一种实施方式中,通信网络是有线网络或无线网络。
在本申请实施例中,终端设备210为用户使用的计算机设备,该计算机设备可以是个人计算机、手机、平板电脑、笔记本、电子书阅读器、车载终端等具有一定计算能力并且运行有即时通讯类软件及网站或者社交类软件及网站的计算机设备。各终端设备210通过无线网络与服务器220连接,服务器220是一台服务器或若干台服务器组成的服务器集群或云计算中心,或者是一个虚拟化平台。
需要说明的是,图2所示只是举例说明,实际上终端设备和服务器的数量不受限制,在本申请实施例中不做具体限定。
下面结合上述描述的应用场景,参考附图来描述本申请示例性实施方式提供的视频检测方法,需要注意的是,上述应用场景仅是为了便于理解本申请的精神和原理而示出,本申请的实施方式在此方面不受任何限制。
参阅图3所示,其为本申请实施例提供的第一种手写字体生成方法的实施流程图,应用于终端设备,该方法的具体实施流程如下:
S31:终端设备响应于目标对象触发的文字素材采集操作,获取目标对象上传的字体素材图像,以及基于字体素材图像确定的目标对象对应的字形特征信息;
其中,字体素材图像为目标对象的历史手写字稿的图像,例如目标对象之前书写的古诗词手写品。字形特征信息则是指通过对用户上传的字体素材图像中的手写字体进行学习得到的,用于表征用户的书写风格、字形风格的信息。
如图4所示,其为本申请实施例中的一种字体素材图像的示意图。该字体素材图像为用户已有的纸质手写品的图像,用户通过拍摄已有纸质手写品并上传即可。另外,用户还可点击图4所示虚线框中的加号,上传更多的字体素材图像。
需要说明的是,本申请实施例不需要下载官网提供的字体模板,该字体素材图像不受字体模板的限制,不需要用户严格按照模板要求进行书写,严格按照既定的拍照规则拍摄上传。本申请实施例中的字体素材图像是用户历史手写字稿的图像,即用户仅需要找到之前手写品并上传即可,更加简单便捷。
S32:终端设备响应于目标对象触发的输入操作,获取目标对象输入的标准字体目标文本,并在文字预览界面中,展示生成的标准字体目标文本对应的手写字体目标文本,其中,手写字体目标文本至少是基于字形特征信息生成的。
参阅图5所示,其为本申请实施例中的一种目标文本的示意图。用户可键入或语音输入目标文本。例如用户键入的目标文本为“江畔何年初见月,江月何年初照人”,进而系统根据字体生成模型,将目标文本转换为用户手写字体供用户选择,如图6所示,其为本申请实施例中的一种文字预览界面的示意图,展示了三个生成的手写字体,两类为中文手写字体,一类为英文手写字体。其中的两类中文手写字体的字形差异很小。
在本申请实施例中,手写字体目标文本的数目可以为多个,具体地,可以将基于字形特征信息生成的手写字体目标文本作为第一类手写字体目标子文本。另外,手写字体目标文本还可进一步包括:基于目标文本的语境信息生成的第二类手写字体目标子文本;基于指定语言生成的第三类手写字体目标子文本。
其中,第一类手写字体目标子文本为基于目标对象的字形特征信息生成的,手写字体目标文本至少是基于目标对象的字形特征信息生成的,另外还可以是基于语境信息与指定语言中的至少一种生成的,在此不做具体限定。
可选的,手写字体目标文本除了包括基于字形特征信息生成的第一类手写字体目标子文本外,还可进一步包括基于语境信息生成的第二类手写字体目标子文本;该情况下,可通过如下方式在文字预览界面中展示手写字体目标文本:
首先,通过对标准字体目标文本进行语义分词,确定标准字体目标文本的语境信息;进而,在文字预览界面中展示第一类手写字体目标子文本,以及基于语境信息生成的第二类手写字体目标子文本,其中,不同语境信息对应不同的手写字体字形。
在本申请实施例中,第二类手写字体目标子文本的字形可以是基于语境信息对第一类手写字体目标子文本的字形进行调整而生成的;或者,可以是基于不同语境信息与不同字形之间的映射关系确定的,某种语境信息对应的字形。
例如,本申请中预先设置了几种不同的语境信息与不同的字形之间的映射关系,如图7所示,其为本申请实施例中的一种语境与字形映射表的示意图,其中,语境A对应字形a,语境B对应字形b,语境c对应字形c,语境D对应字形d,…。通过对用户输入的目标文本“江畔何人初照月,江月何年初照人”进行语义分词,即对目标文本进行语义分析和分词处理,根据语义分析和分词结果,确定该目标文本的语境。若该目标文本的语境为语境A,则可确定对应的手写字体为字形a,生成字形a对应的手写字体,即为本申请实施例中的第二类手写字体目标子文本;若该目标文本的语境为语境B,则可确定对应的手写字体为字形b,生成字形b对应的手写字体,即为本申请实施例中的另一种第二类手写字体目标子文本。
基于上述实施方式,本申请可基于语境分析,根据目标文字的语境而修改目标文字的字形,语境不同,字形不同,丰富生成的手写字体文本的样式。
可选的,手写字体目标文本除了包括基于字形特征信息生成的第一类手写字体目标子文本之外,还可进一步包括基于指定语言生成的第三类手写字体目标子文本;该情况下,可通过如下方式在文字预览界面中展示手写字体目标文本:
首先确定标准字体目标文本对应的指定语言;进而,在文字预览界面中展示第一类手写字体目标子文本,以及指定语言的第三类手写字体目标子文本,第三类手写字体目标文本的字形是基于字形特征信息确定的。
仍以图6所示为例,其为本申请实施例中的一种第三类手写字体目标子文本的示意图。其中,用户输入的标准字体目标文本的语言为中文,对应的指定语言为英文,该指定语言可以是用户设置的,或者是系统默认的,或者是基于用户偏好分析得到的等,在此不做具体限定。
需要说明的是,通过上述方式所得到的第三类手写字体目标子文本的字形仍是基于目标对象的字形特征信息确定的,例如通过无监督的机器学习方式学习得到等,在此不做具体限定。
基于上述实施方式,可以生成多种语言,多种语境对应的不同的手写字体文本,丰富生成的手写字体文本的样式。
在本申请实施例中,还可将上述所列举的字体生成方法应用于社交软件中,在使用社交软件聊天的过程中即时生成手写文字,使用户具有个性化的聊天场景。
一种可选的实施方式为,若手写字体目标文本的数目为多个,则在步骤S32之后,可基于用户选中的目标手写字体目标文本进行信息交互,具体包括以下过程:
在当前文字预览页面展示有生成的多个手写字体目标文本,目标对象选中某一手写字体目标文本时,客户端响应于目标对象针对多个手写字体目标文本触发的选中操作,获得目标对象选中的目标手写字体目标文本,以及将目标手写字体目标文本和相应的标准字体目标文本发送给目标对象的交互对象,以使交互对象在相应的交互界面中查看目标手写字体目标文本,并在触发辅助控件时,在交互界面中展示标准字体目标文本。
其中,目标对象的交互对象可以是在在聊天过程中的某个好友、群组,或者是关注的用户等,也称聊天对象。
在本申请实施例中,手写字体目标文本的数目有多个时,分为多种情况,这多个手写字体目标文本中有多个第一类手写字体目标子文本;或者,这多个手写字体目标文本中有至少一个第一类手写字体目标子文本,另外还有至少第一第二类或第三类手写字体目标子文本。如图6所示,其中有两个第一类手写字体目标子文本,以及一个第三类手写字体目标子文本。
假设目标对象为用户A,用户A的交互对象为用户B,则在用户A选中一个目标手写字体目标文本,比如选中其中一个第一类手写字体目标子文本作为目标手写字体目标文本后,即可将用户A选中的这一目标手写字体目标文本发送给用户B,另外,为了便于用户B对一些特色显著、不容易识别的字体进行辨认,还可进一步将对应的标准字体目标文本一同发送给用户B,以便用户B在不确定目标手写字体目标文本时,可通过辅助控件,查看该目标手写字体目标文本对应的标准字体目标文本。
另外,本申请实施例中的客户端,还进一步提供对接收到的手写字体文字转换为系统标准字体的功能。在只将用户A选中的目标手写字体目标文本发送给用户B的情况下,即可基于上述功能,将目标手写字体目标文本转换为对应的标准字体目标文本,以辅助用户对一些特色显著、不容易识别的字体进行辨认。
参阅图8所示,其为本申请实施例中的一种聊天界面的示意图。图8为用户B侧的聊天界面,在用户B与用户A聊天过程中,用户A向用户B发送了目标手写字体目标文本“江畔何人初照月,江月何年初照人”。当用户B长按目标手写字体目标文本时,即可显示辅助控件,用户可通过点击操作触发辅助控件,即图8中的“转标准字体”控件,即可在交互界面中聊天消息的关联展示位置处,例如聊天消息的下方(也可以是聊天消息的上方,或者其他位置,在此不做具体限定),显示对应的标准字体目标文本。
在上述实施方式中,用户可在使用社交软件聊天的过程中即时生成手写文字,为用户提供个性化的聊天场景。
另外,本申请实施例除了可以根据语境、指定语言等来生成手写字体之外,还可对生成的手写字体进一步转换。
一种可选的实施方式为,在聊天场景下,可获取目标对象的交互对象的第一对象特征信息;其中,对象特征信息可表征对象在书写文字,或者使用文字时的常用格式习惯,例如常用简体字,常用繁体字,加粗、倾斜等;进而,基于第一对象特征信息,确定交互对象对应的第一文字格式特征;若当前目标对象选中的目标手写字体目标文本的文字格式与确定的第一文字格式不一致,则将目标对象所选中的目标手写字体目标文本,转换为符合第一文字格式特征的目标手写字体目标文本,并将转换后的目标手写字体目标文本发送给交互对象。
例如,目标对象为用户A,目标对象的交互对象为用户B,基于用户B的对象特征信息(即本申请中的第一对象特征信息),确定出用户B常用的第一文字格式为繁体,而当前用户A选中的目标手写字体目标文本为简体,则可对该目标手写字体目标文本进行文字格式转换,所得到的转换后的目标手写字体目标文本即为繁体手写文本。
除此之外,也可不直接向用户B发送转换后的目标手写字体目标文本(繁体),而是在用户B接收到目标手写字体目标文本之后,再将该文本进行文字格式转换,转换为繁体等,在此不做具体限定。
基于上述实施方式,可以实现文字格式的自动转换,例如根据面向对象不同简-繁自动转换,在此不做具体限定。
在聊天场景下,除了可以在聊天过程中即时生成手写文字并发送给交互对象之外,还可进一步接收交互对象发送的交互消息,并在交互界面中展示交互消息中的交互文本对应的手写字体,即手写字体交互文本。该手写字体交互文本是通过对交互消息中的文本信息进行字体转换。
一种可选的实施方式为,接收目标对象的交互对象发送的交互消息,并在交互界面中展示交互消息对应的手写字体交互文本,手写字体交互文本为基于字形特征信息生成的;响应于目标对象针对辅助控件的触发操作,在交互消息的关联展示位置展示交互消息对应的标准字体交互文本。
在聊天场景下,例如目标对象为用户A,目标对象的交互对象为用户B,在用户B向用户A发送交互消息时,该交互消息中的文本信息为“江畔何人初照月,江月何年初照人”,在用户B的客户端将交互消息发送至聊天软件对应的服务器后,可由该服务器对文本信息进行字体转换,基于用户A的字形特征信息生成交互消息对应的手写字体交互文本,并发送给用户A的客户端,用户A的客户端即可在聊天界面中展示,并在用户A触发辅助控件时,响应于针对辅助控件的触发操作,在交互消息的关联展示位置展示交互消息对应的标准字体交互文本。如图9所示,其为本申请实施例中的另一种聊天界面的示意图,图9为用户A的聊天界面,在用户A与用户B的聊天过程中,用户A接收到用户B发送的交互消息时,交互文本为“江畔何人初照月,江月何年初照人”。当用户A长按目标手写字体目标文本时,即可显示辅助控件,用户可通过点击操作触发辅助控件,即图9中的“转标准字体”控件,即可在交互界面中聊天消息的关联展示位置处,例如聊天消息的下方(也可以是聊天消息的上方,或者其他位置,在此不做具体限定),显示对应的标准字体目标文本。
在一种可选的实施方式中,还可获取目标对象的第二对象特征信息;基于第二对象特征信息,确定目标对象对应的第二文字格式特征;若当前交互对象发送的交互消息中交互文本的文字格式与确定的第二文字格式不一致,则将交互消息对应的手写字体交互文本,转换为符合第二文字格式特征的手写字体交互文本,并在交互界面展示转换后的手写字体交互文本。
例如,基于用户A的对象特征信息(即本申请中的第二对象特征信息),确定出用户A常用的第二文字格式为简体,而当前用户B发送的交互消息对应的手写字体交互文本为繁体,则可对该手写字体交互文本进行文字格式转换,所得到的转换后的手写字体交互文本即为简体手写文本。
除此之外,也可不直接向用户A发送转换后的手写字体交互文本(简体),而是在用户A接收到目标手写字体目标文本之后,再将该文本进行文字格式转换,转换为简体等,在此不做具体限定。
基于上述实施方式,可以实现文字格式的自动转换,例如根据面向对象不同简-繁自动转换等,在此不做具体限定。
在一种可选的实施方式中,在步骤S31之后,步骤S32之前,还可进一步展示文字识别结果,具体实现方式为:
在文字识别界面中展示针对字体素材图像的文字识别结果,文字识别结果包括已识别的各个手写字体文字,以及各个手写字体文字各自对应的标准字体文字;响应于目标对象选中目标文字的触发操作,对目标文字对应的手写字体文字与标准字体文字中的至少一类进行校正。
参阅图10所示,其为本申请实施例中的一种文字识别结果的示意图。在该示意图中分别展示有识别出的各个手写字体文字,图10中一共有17个手写字体文字,以及各个手写字体文字各自对应的标准字体文字。用户可通过长按,或者是勾选等选中一个或多个文字作为目标文字,进而可对选中的目标文字对应的手写字体文字或标准字体文字进行修改、校正等,以提高数据集的准确性。
比如,通过文字识别得到的标准字体文字“月”对应的手写字体文字有两个,系统通过分析将更加清晰、特征更加明显的一个作为识别结果时,用户还可通过上述操作触发校正,选择另一个手写字体文字作为识别结果进行展示;再比如,通过文字识别得到的手写字体文字“土”对应的标准字体文字为“士”,此时即可对该文字对应的标准字体文字进行校正等。
需要说明的是,上述所列举的几种校正方式只是举例说明,任何一种文字识别结果的校正方式都适用于本申请实施例。在上述实施方式中,用户可在文字识别界面中查阅针对用户上传的字体素材图像识别出的各个手写字体文字,以及相对应的标准字体文字,允许用户人工校正。
在一种可选的实施方式中,文字预览界面还包括用于对手写字体进行样式调整的调整控件;用户还可基于该控件,对文字预览界面展示的手写字体目标文本进行样式调整。
例如11所示,其为本申请实施例中的又一种文字预览界面的示意图。图11中的“自定义”控件即为本申请实施例中的一种调整控件,用户可通过点击该控件触发查看操作,客户端响应于针对调整控件触发的查看操作,展示各个字体调整样式对应的样式参考信息;如图11所示,在用户点击自定义之后,可以进行彩色字体转换、个性化修饰等。当用户点击“彩色字体转换”,并确定调整后的颜色之后,客户端响应于目标对象针对多个字体调整样式触发的选中操作,获取目标对象选中的目标字体调整样式,以及基于目标字体调整样式对应的样式参考信息,对手写字体目标文本进行相应的样式调整,将文字预览界面中的各个手写字体目标文本(或者是用户选中的目标手写字体目标文本)的字体颜色进行调整。
基于上述实施方式,可对生成的手写字体进行个性化样式调整,使得生成的手写字体除传统黑白色外,还提供了彩色字体变化、添加个性化修饰等功能,满足用户的个性化多元化需求。
参阅图12所示,其为本申请实施例提供的第二种手写字体生成方法的实施流程图,应用于服务器,该方法的具体实施流程如下:
S121:服务器获取目标对象上传的字体素材图像,字体素材图像为目标对象的历史手写字稿的图像;
S122:服务器通过对字体素材图像进行字形特征识别,获取目标对象对应的字形特征信息;
S123:服务器获取目标对象输入的标准字体目标文本,基于字形特征信息生成标准字体目标文本对应的手写字体目标文本,并将手写字体目标文本反馈给客户端,以使客户端在文字预览界面中,展示手写字体目标文本。
参阅图13所示,其为本申请实施例中的一种手写字体生成产品使用流程的示意图。用户通过客户端拍摄已有纸质手写品上传之后,服务器即可获取到用户上传的字体素材图像。进而,通过服务器侧部署的字体生成模型来学习目标对象的字形特征信息,根据用户手写品学习笔迹特征,生成对应字体生成模型;进而,用户通过客户端键入或语音输入目标文本;系统根据字体生成模型将目标文本转为用户手写字体供用户选择;用户可选择将自己的字体上传到字体仓库供大家分享。
本申请实施例中的手写字体生成方法,只需要上传已有手写品的照片,系统通过文字识别识别出所书写的文字信息,然后学习字形特征,生成对应的生成模型,待到用户键入标准字体目标文本时,只需要通过生成模型生成即可,使用更加方便快捷。
可选的,本申请实施例中的步骤S122和步骤S123也可基于机器学习实现。
一种可选的实施方式为,可将字体素材图像输入已训练的字体生成模型,基于字体生成模型对字体素材图像进行字形特征识别,获取目标对象对应的字形特征信息;进而,将标准字体目标文本输入字体生成模型,基于字形特征信息,获得字体生成模型生成的手写字体目标文本。
在本申请实施例中,为了实现由少量手写数据进一步生成更多数据,抛弃传统将汉字拆分并重新组合的方法,转而使用GANs网络构建字体生成模型,来进行手写汉字风格的学习,进而能生成具有现有少量汉字风格的其他汉字。
此外,考虑到相关技术中大量的成对的手写汉字训练集在现实条件下难以取得,而Pix2pix和zi2zi等基于成对数据集的条件式生成对抗网络难以得到推广,所以本申请选择能够透过正向、逆向两种映射实现非成对数据集训练的CycleGAN网络。
另外,考虑到虽然基于最大平均偏差(Maximum Mean Discrepancy,MMD)的特征匹配方法相比于GANs提高了训练的稳定性,但训练过程不仅需要较大批次的数据输入,使得训练速度非常缓慢,并且在实际应用中无法生成令人信服的图像,因而,本申请实施例中采用改进的特征匹配算法的条件式生成对抗网络(Optimized Feature MatchingConditional GAN,OFM-cGAN)作为字体生成模型,也可称作OFM-CycleGAN,包含两个GANs网络,实现没有成对数据时生成器到判别器的映射,加快训练,减少生成汉字的轮廓模糊。
下面对本申请实施例中的GANs网络进行详细介绍,为了实现能由少量手写数据进一步生成更多的数据,抛弃相关技术中将汉字进行拆分并重新组合的方法,转而选择使用GANs网络,来进行手写汉字风格的学习,从而能生成具有已有的少量汉字的风格的更多字体。
下面对本申请实施例中的字体生成模型的结构进行详细介绍。结合图14A和图14B对本申请实施例中的生成器G和判别器D进行详细介绍。参阅表1所示:
表1
Figure BDA0003235377910000221
Figure BDA0003235377910000231
由图14A、图14B和表1可知,本申请中的生成器G与判别器D分别是两个构造不同的卷积神经网络。生成器G由一个全连接层、三个反卷积层及激活函数组成。这三个反卷积层的卷积核个数依次为128、64与1个,卷积核大小均为5x5,步长设置为2。每一个反卷积层后是ReLU激活函数。判别器D由三个卷积层、激活函数及两个全连接层组成。卷积层的卷积核个数分别为64、128与256个,卷积核大小均为5x5,步长为2。每一个卷积层后同为ReLU激活函数。
其中,生成器用于生成与原始数据空间尽可能相似的手写汉字数据;判别器用于生成尽量准确的判别真实样本和生成样本,使得标准汉字向手写汉字的风格转换的生成的数据更加准确。判别器最后两层为全连接层,其中第一层输出判断输入图像的真假的概率值(图像是真的概率值),第二层输出对输入图像标签的预测值。
需要说明的是,本申请在训练字体生成模型时,则是采用半监督学习方法,对于手写汉字生成任务,由于不同汉字的结构差异较大,此时无监督下的GANs难以学到每一类汉字的特征,所以本申请实施例中采用基于条件式生成对抗网络的手写汉字生成,通过将无监督学习扩展为半监督学习,汉字的标签能够作为训练中的先验信息,来引导模型学得更加真实的数据分布。
参阅图15所示,其为本申请实施例中的一种字体生成模型的训练方法的流程示意图,具体包括以下步骤:
根据训练样本数据集中的训练样本,对未训练的字体生成模型执行循环迭代训练,并在训练完毕时,输出训练完毕的字体生成模型;其中,每一次循环迭代训练过程包括以下操作:
S151:服务器从训练样本数据集中选取训练样本,训练样本包括含随机噪声的标准字体图像,以及用于标识标准字体图像中各个文字的标签信息;
S152:服务器将训练样本中的标准字体图像以及对应的标签信息,输入字体生成模型中的生成器,获取生成器生成的标准字体图像对应的手写字体图像;
S153:服务器将标准字体图像与手写字体图像,输入字体生成模型中的判别器,通过对手写字体图像中的各个文字进行识别,获得判别器输出的各个文字对应的预测文字标签以及相应的识别准确率;
S154:服务器基于各个文字对应的预测文字标签、标签信息以及相应的识别准确率,对字体生成模型的模型参数进行调整。
在步骤S154中,可基于各个文字对应的预测文字标签、标签信息以及相应的识别准确率,计算特征匹配损失。其中,特征匹配损失中采用L1范数。具体的,与原始的L2范数相比,L1范数比L2范数能够产生更加稀疏的模型,L1正则在参数w比较小的情况下,能够直接缩减到0,因此可以起到特征选择的作用,来减少生成汉字的轮廓模糊。
在本申请实施例中,通过将标准字体图像(含随机噪声)与标签信息(哪个字),输入字体生成模型中的生成器,生成器输出生成数据(手写文字图片);判别器的输入为标准字体图像与生成器生成的图像,每个卷积层输出对应特征图(这里指生成器生成的图片的特征),最终输出预测的文字标签以及准确率(识别为这个字的概率有多大)。
可选的,服务器还用于对字体素材图像进行文字识别,获取识别出的字体素材图像中的各个手写字体文字,以及各个手写字体文字各自对应的标准字体文字;将各个手写字体文字以及各个手写字体文字各自对应的标准字体文字作为文字识别结果,反馈给目标对象对应的客户端,以使目标对象对应的客户端在文字识别界面中展示针对字体素材图像的文字识别结果,如图10所示,具体实现方式参见上述实施例,重复之处不再赘述。
另外,本申请实施例中的字体生成方法还可应用在聊天场景下,用户可在使用社交软件聊天的过程中即时生成手写文字,为用户提供个性化的聊天场景。
在一种可选的实施方式中,若手写字体目标文本的数目为多个,则可由目标对象选择一个作为目标手写字体目标文本,进而服务器获得目标对象选中的目标手写字体目标文本;将目标手写字体目标文本和相应的标准字体目标文本发送给目标对象的交互对象对应的客户端,以使交互对象对应的客户端在相应的交互界面中展示目标手写字体目标文本,并在交互对象触发辅助控件时,在交互界面中展示标准字体目标文本,如图8所示,重复之处不再赘述。
在一种可选的实施方式,服务器还可在接收目标对象的交互对象发送的交互消息;基于目标对象的字迹特征信息生成交互消息对应的手写字体交互文本,并将手写字体交互文本以及交互消息对应的标准字体交互文本,发送给目标对象对应的客户端,以使目标对象对应的客户端在交互界面中展示手写字体交互文本,并在目标对象触发辅助控件时,在交互消息的关联展示位置展示标准字体交互文本。
此外,还可基于服务器进行消息转发时,由服务器对交互消息中的交互文本进行文字格式转换。或者,由服务器对目标对象发送的目标手写字体目标文本进行文字格式转换。
例如,基于用户A的对象特征信息(即本申请中的第二对象特征信息),确定出用户A常用的第二文字格式为简体,而当前用户B发送的交互消息对应的手写字体交互文本为繁体,则可对该手写字体交互文本进行文字格式转换,所得到的转换后的手写字体交互文本即为简体手写文本等,具体实施方式可参见删除实施例,重复之处不再赘述。
在本申请实施例中,将使用CycleGAN和OFM-CycleGAN生成的字型进行了对比,参阅图16所示,其为本申请实施例中的一种CycleGAN和OFM-CycleGAN生成字形的对比结果示意图。
表2表示CycleGAN和OFM-CycleGAN生成的字体经过HCCRN手写辨识模型的准确率比较(数值愈高愈好),最右边一列是使用的汉字训练集HW252、HW292手写辨识的准确率。
表2
汉字 CycleGAN OFM-CycleGAN 训练集
36.30% 99.98% 89.58%
98.94% 99.98% 99.99%
39.72% 99.86% 98.65%
10.46% 98.46% 99.10%
6.69% 97.83% 99.95%
6.44% 99.99% 99.99%
37.76% 96.96% 99.92%
2.24% 74.93% 99.99%
平均值 29.82% 95.99% 98.40%
由表2中的数据可知,OFM-CycleGAN产生的结果比CycleGAN的容易识别。
综上,本申请实施例中的手写字体生成方法,能够为有制作个性化字体的人解决需求,提供一种方便有效的生成手段,以解决相关技术中中文字体过于稀少的问题,使用手写字体生成方法可以根据个人的笔迹生成,让单调的计算机字体更加具有深度与情怀,提供多种风格的字体风格,用户可挑选适合的样式应用于各种场景。
除此之外,本申请实施例中的手写字体生成方法使用了生成对抗网络来产生风格相近的手写风格中文字体,大幅提升中文字体的制作效率,相较于相关技术中的中文字体设计流程,以往中文字体设计需要投入多人来设计至少3500字的常用字,才能应用于日常使用手写字体生成方法不需要再耗费大量时间一个字一个字绘制,也不用去购买昂贵的字型设计软件授权,只需拍下手边的手写笔记,上传到基于该方法制作的手写字体生成产品上,经过模型识别提取手写特征,即可简易生成属于自己风格的中文字体,跟传统设计模式相比,该手写字体生成方法的字体生成不需要投入大量人力与时间,大幅降低成本资源。
参阅图17所示,其为本申请实施例中的一种终端设备与服务器之间的交互时序图。该方法的具体实施流程如下:
步骤S1701:客户端响应于目标对象触发的文字素材采集操作,获取目标对象上传的字体素材图像,并反馈给服务器;
步骤S1702:服务器对字体素材图像进行文字识别,获取识别出的字体素材图像中的各个手写字体文字,以及各个手写字体文字各自对应的标准字体文字;
步骤S1703:服务器将各个手写字体文字以及各个手写字体文字各自对应的标准字体文字作为文字识别结果,反馈给目标对象对应的客户端;
步骤S1704:客户端在文字识别界面中展示针对字体素材图像的文字识别结果;
步骤S1705:客户端响应于目标对象选中目标文字的触发操作,对目标文字对应的手写字体文字与标准字体文字中的至少一类进行校正;
步骤S1706:客户端响应于目标对象触发的输入操作,获取目标对象输入的标准字体目标文本,并反馈给服务器;
步骤S1707:服务器通过对字体素材图像进行字形特征识别,获取目标对象对应的字形特征信息;
步骤S1708:服务器获取目标对象输入的标准字体目标文本,基于字形特征信息生成标准字体目标文本对应的手写字体目标文本,并将手写字体目标文本反馈给客户端;
步骤S1709:客户端在文字预览界面中,展示生成的标准字体目标文本对应的手写字体目标文本。
基于相同的发明构思,本申请实施例还提供一种字体生成装置。如图18所示,其为字体生成装置1800的结构示意图,可以包括:
特征获取单元1801,用于响应于目标对象触发的文字素材采集操作,获取目标对象上传的字体素材图像,以及基于字体素材图像确定的目标对象对应的字形特征信息,字体素材图像为目标对象的历史手写字稿的图像;
展示单元1802,用于响应于目标对象触发的输入操作,获取目标对象输入的标准字体目标文本,并在文字预览界面中,展示生成的标准字体目标文本对应的手写字体目标文本,其中,手写字体目标文本至少是基于字形特征信息生成的。
可选的,手写字体目标文本包括基于字形特征信息生成的第一类手写字体目标子文本,以及基于语境信息生成的第二类手写字体目标子文本;展示单元1802具体用于:
通过对标准字体目标文本进行语义分词,确定标准字体目标文本的语境信息;
在文字预览界面中展示第一类手写字体目标子文本,以及基于语境信息生成的第二类手写字体目标子文本,其中,不同语境信息对应不同的手写字体字形。
可选的,第二类手写字体目标子文本的字形是:基于语境信息对第一类手写字体目标子文本的字形进行调整而生成的;或者,基于不同语境信息与不同字形之间的映射关系确定的,语境信息对应的字形。
可选的,手写字体目标文本包括基于字形特征信息生成的第一类手写字体目标子文本,以及基于指定语言生成的第三类手写字体目标子文本;展示单元1802具体用于:
确定标准字体目标文本对应的指定语言;
在文字预览界面中展示第一类手写字体目标子文本,以及指定语言的第三类手写字体目标子文本,第三类手写字体目标文本的字形是基于字形特征信息确定的。
可选的,若手写字体目标文本的数目为多个,则装置还包括:
反馈单元1803,用于在展示单元1802在文字预览界面中,展示生成的标准字体目标文本对应的手写字体目标文本之后,响应于目标对象针对多个手写字体目标文本触发的选中操作,获得目标对象选中的目标手写字体目标文本,以及将目标手写字体目标文本和相应的标准字体目标文本发送给目标对象的交互对象,以使交互对象在相应的交互界面中查看目标手写字体目标文本,并在触发辅助控件时,在交互界面中展示标准字体目标文本。
可选的,装置还包括:
第一转换单元1804,用于获取交互对象的第一对象特征信息;
基于第一对象特征信息,确定交互对象对应的第一文字格式特征;
将目标对象选中的目标手写字体目标文本,转换为符合第一文字格式特征的目标手写字体目标文本,并将转换后的目标手写字体目标文本发送给交互对象。
可选的,展示单元1802还用于:
接收目标对象的交互对象发送的交互消息,并在交互界面中展示交互消息对应的手写字体交互文本,手写字体交互文本为基于字形特征信息生成的;
响应于目标对象针对辅助控件的触发操作,在交互消息的关联展示位置展示交互消息对应的标准字体交互文本。
可选的,装置还包括:
第二转换单元1805,用于获取目标对象的第二对象特征信息;
基于第二对象特征信息,确定目标对象对应的第二文字格式特征;
将手写字体交互文本,转换为符合第二文字格式特征的手写字体交互文本,并在交互界面展示转换后的手写字体交互文本。
可选的,展示单元1802还用于:
在特征获取单元1801获取目标对象上传的字体素材图像,以及基于字体素材图像确定的目标对象对应的字形特征信息之后,响应于目标对象触发的输入操作之前,在文字识别界面中展示针对字体素材图像的文字识别结果,文字识别结果包括已识别的各个手写字体文字,以及各个手写字体文字各自对应的标准字体文字;
响应于目标对象选中目标文字的触发操作,对目标文字对应的手写字体文字与标准字体文字中的至少一类进行校正。
可选的,文字预览界面还包括用于对手写字体进行样式调整的调整控件;装置还包括:
调整单元1806,用于响应于针对调整控件触发的查看操作,展示各个字体调整样式对应的样式参考信息;
响应于目标对象针对多个字体调整样式触发的选中操作,获取目标对象选中的目标字体调整样式,以及基于目标字体调整样式对应的样式参考信息,对手写字体目标文本进行相应的样式调整。
基于相同的发明构思,本申请实施例还提供一种字体生成装置。如图19所示,其为字体生成装置1900的结构示意图,可以包括:
图像获取单元1901,用于获取目标对象上传的字体素材图像,字体素材图像为目标对象的历史手写字稿的图像;
特征获取单元1902,用于通过对字体素材图像进行字形特征识别,获取目标对象对应的字形特征信息;
生成单元1903,用于获取目标对象输入的标准字体目标文本,基于字形特征信息生成标准字体目标文本对应的手写字体目标文本,并将手写字体目标文本反馈给客户端,以使客户端在文字预览界面中,展示手写字体目标文本。
可选的,特征获取单元1902具体用于:
将字体素材图像输入已训练的字体生成模型,基于字体生成模型对字体素材图像进行字形特征识别,获取目标对象对应的字形特征信息;
生成单元1903具体用于:
将标准字体目标文本输入字体生成模型,基于字形特征信息,获得字体生成模型生成的手写字体目标文本。
可选的,字体生成模型包括判别器和生成器;装置还包括:
训练单元1904,用于通过下列方式训练得到字体生成模型:
根据训练样本数据集中的训练样本,对未训练的字体生成模型执行循环迭代训练,并在训练完毕时,输出训练完毕的字体生成模型;其中,每一次循环迭代训练过程包括以下操作:
从训练样本数据集中选取训练样本,训练样本包括含随机噪声的标准字体图像,以及用于标识标准字体图像中各个文字的标签信息;
将训练样本中的标准字体图像以及对应的标签信息,输入字体生成模型中的生成器,获取生成器生成的标准字体图像对应的手写字体图像;
将标准字体图像与手写字体图像,输入字体生成模型中的判别器,通过对手写字体图像中的各个文字进行识别,获得判别器输出的各个文字对应的预测文字标签以及相应的识别准确率;
基于各个文字对应的预测文字标签、标签信息以及相应的识别准确率,对字体生成模型的模型参数进行调整。
可选的,装置还包括:
反馈单元1905,用于对字体素材图像进行文字识别,获取识别出的字体素材图像中的各个手写字体文字,以及各个手写字体文字各自对应的标准字体文字;
将各个手写字体文字以及各个手写字体文字各自对应的标准字体文字作为文字识别结果,反馈给目标对象对应的客户端,以使目标对象对应的客户端在文字识别界面中展示针对字体素材图像的文字识别结果。
可选的,若手写字体目标文本的数目为多个,则装置还包括:
第一交互单元1906,用于获得目标对象选中的目标手写字体目标文本;
将目标手写字体目标文本和相应的标准字体目标文本发送给目标对象的交互对象对应的客户端,以使交互对象对应的客户端在相应的交互界面中展示目标手写字体目标文本,并在交互对象触发辅助控件时,在交互界面中展示标准字体目标文本。
可选的,装置还包括:
第二交互单元1907,用于接收目标对象的交互对象发送的交互消息;
基于字迹特征信息生成交互消息对应的手写字体交互文本,并将手写字体交互文本以及交互消息对应的标准字体交互文本,发送给目标对象对应的客户端,以使目标对象对应的客户端在交互界面中展示手写字体交互文本,并在目标对象触发辅助控件时,在交互消息的关联展示位置展示标准字体交互文本。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本申请时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
在介绍了本申请示例性实施方式的手写字体生成方法和装置之后,接下来,介绍根据本申请的另一示例性实施方式的用于手写字体生成装置。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本申请的手写字体生成装置可以至少包括处理器和存储器。其中,存储器存储有程序代码,当程序代码被处理器执行时,使得处理器执行本说明书中描述的根据本申请各种示例性实施方式的手写字体生成方法中的步骤。例如,处理器可以执行如图3中所示的步骤。
与上述方法实施例基于同一发明构思,本申请实施例中还提供了一种电子设备。在一种实施例中,该电子设备可以是服务器,如图2所示的服务器220。在该实施例中,电子设备的结构可以如图20所示,包括存储器2001,通讯模块2003以及一个或多个处理器2002。
存储器2001,用于存储处理器2002执行的计算机程序。存储器2001可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。
存储器2001可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器2001也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);或者存储器2001是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器2001可以是上述存储器的组合。
处理器2002,可以包括一个或多个中央处理单元(central processing unit,CPU)或者为数字处理单元等等。处理器2002,用于调用存储器2001中存储的计算机程序时实现上述手写字体生成方法。
通讯模块2003用于与终端设备和其他服务器进行通信。
本申请实施例中不限定上述存储器2001、通讯模块2003和处理器2002之间的具体连接介质。本申请实施例在图20中以存储器2001和处理器2002之间通过总线2004连接,总线2004在图20中以粗线描述,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线2004可以分为地址总线、数据总线、控制总线等。为便于描述,图20中仅用一条粗线描述,但并不描述仅有一根总线或一种类型的总线。
存储器2001中存储有计算机存储介质,计算机存储介质中存储有计算机可执行指令,计算机可执行指令用于实现本申请实施例的手写字体生成方法。处理器2002用于执行上述的手写字体生成方法,如图12所示。
在另一种实施例中,电子设备也可以是其他电子设备,如图2所示的终端设备210。在该实施例中,电子设备的结构可以如图21所示,包括:通信组件2110、存储器2120、显示单元2130、摄像头2140、传感器2150、音频电路2160、蓝牙模块2170、处理器2180等部件。
通信组件2110用于与服务器进行通信。在一些实施例中,可以包括电路无线保真(Wireless Fidelity,WiFi)模块,WiFi模块属于短距离无线传输技术,电子设备通过WiFi模块可以帮助用户收发信息。
存储器2120可用于存储软件程序及数据。处理器2180通过运行存储在存储器2120的软件程序或数据,从而执行终端设备210的各种功能以及数据处理。存储器2120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器2120存储有使得终端设备210能运行的操作系统。本申请中存储器2120可以存储操作系统及各种应用程序,还可以存储执行本申请实施例手写字体生成方法的代码。
显示单元2130还可用于显示由用户输入的信息或提供给用户的信息以及终端设备210的各种菜单的图形用户界面(graphical user interface,GUI)。具体地,显示单元2130可以包括设置在终端设备210正面的显示屏2132。其中,显示屏2132可以采用液晶显示器、发光二极管等形式来配置。显示单元2130可以用于显示本申请实施例中的应用操作界面等。
显示单元2130还可用于接收输入的数字或字符信息,产生与终端设备210的用户设置以及功能控制有关的信号输入,具体地,显示单元2130可以包括设置在终端设备210正面的触摸屏2131,可收集用户在其上或附近的触摸操作,例如点击按钮,拖动滚动框等。
其中,触摸屏2131可以覆盖在显示屏2132之上,也可以将触摸屏2131与显示屏2132集成而实现终端设备210的输入和输出功能,集成后可以简称触摸显示屏。本申请中显示单元2130可以显示应用程序以及对应的操作步骤。
摄像头2140可用于捕获静态图像,用户可以将摄像头2140拍摄的图像通过应用发布评论。摄像头2140可以是一个,也可以是多个。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给处理器2180转换成数字图像信号。
终端设备还可以包括至少一种传感器2150,比如加速度传感器2151、距离传感器2152、指纹传感器2153、温度传感器2154。终端设备还可配置有陀螺仪、气压计、湿度计、温度计、红外线传感器、光传感器、运动传感器等其他传感器。
音频电路2160、扬声器2161、传声器2162可提供用户与终端设备210之间的音频接口。音频电路2160可将接收到的音频数据转换后的电信号,传输到扬声器2161,由扬声器2161转换为声音信号输出。终端设备210还可配置音量按钮,用于调节声音信号的音量。另一方面,传声器2162将收集的声音信号转换为电信号,由音频电路2160接收后转换为音频数据,再将音频数据输出至通信组件2110以发送给比如另一终端设备210,或者将音频数据输出至存储器2120以便进一步处理。
蓝牙模块2170用于通过蓝牙协议来与其他具有蓝牙模块的蓝牙设备进行信息交互。例如,终端设备可以通过蓝牙模块2170与同样具备蓝牙模块的可穿戴电子设备(例如智能手表)建立蓝牙连接,从而进行数据交互。
处理器2180是终端设备的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器2120内的软件程序,以及调用存储在存储器2120内的数据,执行终端设备的各种功能和处理数据。在一些实施例中,处理器2180可包括一个或多个处理单元;处理器2180还可以集成应用处理器和基带处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,基带处理器主要处理无线通信。可以理解的是,上述基带处理器也可以不集成到处理器2180中。本申请中处理器2180可以运行操作系统、应用程序、用户界面显示及触控响应,以及本申请实施例的手写字体生成方法。另外,处理器2180与显示单元2130耦接。
在一些可能的实施方式中,本申请提供的手写字体生成方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的手写字体生成方法中的步骤,例如,计算机设备可以执行如图3或图12中所示方法的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请的实施方式的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算装置上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被命令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由命令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算装置上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算装置上部分在远程计算装置上执行、或者完全在远程计算装置或服务器上执行。在涉及远程计算装置的情形中,远程计算装置可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户计算装置,或者,可以连接到外部计算装置(例如利用因特网服务提供商来通过因特网连接)。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (20)

1.一种手写字体生成方法,其特征在于,该方法包括:
响应于目标对象触发的文字素材采集操作,获取所述目标对象上传的字体素材图像,以及基于所述字体素材图像确定的所述目标对象对应的字形特征信息,所述字体素材图像为所述目标对象的历史手写字稿的图像;
响应于所述目标对象触发的输入操作,获取所述目标对象输入的标准字体目标文本,并在文字预览界面中,展示生成的所述标准字体目标文本对应的手写字体目标文本,其中,所述手写字体目标文本至少是基于所述字形特征信息生成的。
2.如权利要求1所述的方法,其特征在于,所述手写字体目标文本包括基于所述字形特征信息生成的第一类手写字体目标子文本,以及基于语境信息生成的第二类手写字体目标子文本;所述在文字预览界面中,展示生成的所述标准字体目标文本对应的手写字体目标文本,包括:
通过对所述标准字体目标文本进行语义分词,确定所述标准字体目标文本的语境信息;
在所述文字预览界面中展示所述第一类手写字体目标子文本,以及基于所述语境信息生成的第二类手写字体目标子文本,其中,不同语境信息对应不同的手写字体字形。
3.如权利要求2所述的方法,其特征在于,所述第二类手写字体目标子文本的字形是:基于所述语境信息对所述第一类手写字体目标子文本的字形进行调整而生成的;或者,基于不同语境信息与不同字形之间的映射关系确定的,所述语境信息对应的字形。
4.如权利要求1所述的方法,其特征在于,所述手写字体目标文本包括基于所述字形特征信息生成的第一类手写字体目标子文本,以及基于指定语言生成的第三类手写字体目标子文本;所述在文字预览界面中,展示生成的所述标准字体目标文本对应的手写字体目标文本,包括:
确定所述标准字体目标文本对应的指定语言;
在所述文字预览界面中展示所述第一类手写字体目标子文本,以及所述指定语言的第三类手写字体目标子文本,所述第三类手写字体目标文本的字形是基于所述字形特征信息确定的。
5.如权利要求1所述的方法,其特征在于,若所述手写字体目标文本的数目为多个,则在所述在文字预览界面中,展示生成的所述标准字体目标文本对应的手写字体目标文本之后,还包括:
响应于所述目标对象针对多个手写字体目标文本触发的选中操作,获得所述目标对象选中的目标手写字体目标文本,以及将所述目标手写字体目标文本和相应的标准字体目标文本发送给所述目标对象的交互对象,以使所述交互对象在相应的交互界面中查看所述目标手写字体目标文本,并在触发辅助控件时,在所述交互界面中展示所述标准字体目标文本。
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
获取所述交互对象的第一对象特征信息;
基于所述第一对象特征信息,确定所述交互对象对应的第一文字格式特征;
将所述目标对象选中的目标手写字体目标文本,转换为符合所述第一文字格式特征的目标手写字体目标文本,并将转换后的目标手写字体目标文本发送给所述交互对象。
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
接收所述目标对象的交互对象发送的交互消息,并在交互界面中展示所述交互消息对应的手写字体交互文本,所述手写字体交互文本为基于所述字形特征信息生成的;
响应于所述目标对象针对辅助控件的触发操作,在所述交互消息的关联展示位置展示所述交互消息对应的标准字体交互文本。
8.如权利要求7所述的方法,其特征在于,所述方法还包括:
获取所述目标对象的第二对象特征信息;
基于所述第二对象特征信息,确定所述目标对象对应的第二文字格式特征;
将所述手写字体交互文本,转换为符合所述第二文字格式特征的手写字体交互文本,并在所述交互界面展示转换后的手写字体交互文本。
9.如权利要求1所述的方法,其特征在于,在所述获取所述目标对象上传的字体素材图像,以及基于所述字体素材图像确定的所述目标对象对应的字形特征信息之后,所述响应于所述目标对象触发的输入操作之前,还包括:
在文字识别界面中展示针对所述字体素材图像的文字识别结果,所述文字识别结果包括已识别的各个手写字体文字,以及所述各个手写字体文字各自对应的标准字体文字;
响应于所述目标对象选中目标文字的触发操作,对所述目标文字对应的手写字体文字与标准字体文字中的至少一类进行校正。
10.如权利要求1~9任一项所述的方法,其特征在于,所述文字预览界面还包括用于对手写字体进行样式调整的调整控件;所述方法还包括:
响应于针对所述调整控件触发的查看操作,展示各个字体调整样式对应的样式参考信息;
响应于所述目标对象针对多个字体调整样式触发的选中操作,获取所述目标对象选中的目标字体调整样式,以及基于所述目标字体调整样式对应的样式参考信息,对所述手写字体目标文本进行相应的样式调整。
11.一种手写字体生成方法,其特征在于,该方法包括:
获取目标对象上传的字体素材图像,所述字体素材图像为所述目标对象的历史手写字稿的图像;
通过对所述字体素材图像进行字形特征识别,获取所述目标对象对应的字形特征信息;
获取所述目标对象输入的标准字体目标文本,基于所述字形特征信息生成所述标准字体目标文本对应的手写字体目标文本,并将所述手写字体目标文本反馈给客户端,以使所述客户端在文字预览界面中,展示所述手写字体目标文本。
12.如权利要求11所述的方法,其特征在于,所述通过对所述字体素材图像进行字形特征识别,获取所述目标对象对应的字形特征信息,包括:
将所述字体素材图像输入已训练的字体生成模型,基于所述字体生成模型对所述字体素材图像进行字形特征识别,获取所述目标对象对应的字形特征信息;
所述获取所述目标对象输入的标准字体目标文本,基于所述字形特征信息生成所述标准字体目标文本对应的手写字体目标文本,包括:
将所述标准字体目标文本输入所述字体生成模型,基于所述字形特征信息,获得所述字体生成模型生成的所述手写字体目标文本。
13.如权利要求12所述的方法,其特征在于,所述字体生成模型包括判别器和生成器;通过下列方式训练得到所述字体生成模型:
根据训练样本数据集中的训练样本,对未训练的字体生成模型执行循环迭代训练,并在训练完毕时,输出训练完毕的字体生成模型;其中,每一次循环迭代训练过程包括以下操作:
从所述训练样本数据集中选取训练样本,所述训练样本包括含随机噪声的标准字体图像,以及用于标识标准字体图像中各个文字的标签信息;
将所述训练样本中的标准字体图像以及对应的标签信息,输入所述字体生成模型中的生成器,获取所述生成器生成的所述标准字体图像对应的手写字体图像;
将所述标准字体图像与所述手写字体图像,输入所述字体生成模型中的判别器,通过对所述手写字体图像中的各个文字进行识别,获得所述判别器输出的各个文字对应的预测文字标签以及相应的识别准确率;
基于所述各个文字对应的预测文字标签、标签信息以及相应的识别准确率,对所述字体生成模型的模型参数进行调整。
14.如权利要求11所述的方法,其特征在于,所述方法还包括:
对所述字体素材图像进行文字识别,获取识别出的所述字体素材图像中的各个手写字体文字,以及所述各个手写字体文字各自对应的标准字体文字;
将所述各个手写字体文字以及所述各个手写字体文字各自对应的标准字体文字作为文字识别结果,反馈给所述目标对象对应的客户端,以使所述目标对象对应的客户端在文字识别界面中展示针对所述字体素材图像的文字识别结果。
15.如权利要求11~14任一项所述的方法,其特征在于,若所述手写字体目标文本的数目为多个,则所述方法还包括:
获得所述目标对象选中的目标手写字体目标文本;
将所述目标手写字体目标文本和相应的标准字体目标文本发送给所述目标对象的交互对象对应的客户端,以使所述交互对象对应的客户端在相应的交互界面中展示所述目标手写字体目标文本,并在所述交互对象触发辅助控件时,在所述交互界面中展示所述标准字体目标文本。
16.如权利要求11~14任一项所述的方法,其特征在于,所述方法还包括:
接收所述目标对象的交互对象发送的交互消息;
基于所述字迹特征信息生成所述交互消息对应的手写字体交互文本,并将所述手写字体交互文本以及所述交互消息对应的标准字体交互文本,发送给所述目标对象对应的客户端,以使所述目标对象对应的客户端在交互界面中展示所述手写字体交互文本,并在所述目标对象触发辅助控件时,在所述交互消息的关联展示位置展示所述标准字体交互文本。
17.一种手写字体生成装置,其特征在于,该装置包括:
特征获取单元,用于响应于目标对象触发的文字素材采集操作,获取所述目标对象上传的字体素材图像,以及基于所述字体素材图像确定的所述目标对象对应的字形特征信息,所述字体素材图像为所述目标对象的历史手写字稿的图像;
展示单元,用于响应于所述目标对象触发的输入操作,获取所述目标对象输入的标准字体目标文本,并在文字预览界面中,展示生成的所述标准字体目标文本对应的手写字体目标文本,其中,所述手写字体目标文本至少是基于所述字形特征信息生成的。
18.一种手写字体生成装置,其特征在于,该装置包括:
图像获取单元,用于获取目标对象上传的字体素材图像,所述字体素材图像为所述目标对象的历史手写字稿的图像;
特征获取单元,用于通过对所述字体素材图像进行字形特征识别,获取所述目标对象对应的字形特征信息;
生成单元,用于获取所述目标对象输入的标准字体目标文本,基于所述字形特征信息生成所述标准字体目标文本对应的手写字体目标文本,并将所述手写字体目标文本反馈给客户端,以使所述客户端在文字预览界面中,展示所述手写字体目标文本。
19.一种电子设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行权利要求1~10中任一所述方法的步骤或权利要求11~16中任一所述方法的步骤。
20.一种计算机可读存储介质,其特征在于,其包括程序代码,当所述存储介质在电子设备上运行时,所述程序代码用于使所述电子设备执行权利要求1~10中任一所述方法的步骤或权利要求11~16中任一所述方法的步骤。
CN202111001073.9A 2021-08-30 2021-08-30 一种手写字体生成方法、装置、电子设备和存储介质 Pending CN114283422A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111001073.9A CN114283422A (zh) 2021-08-30 2021-08-30 一种手写字体生成方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111001073.9A CN114283422A (zh) 2021-08-30 2021-08-30 一种手写字体生成方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN114283422A true CN114283422A (zh) 2022-04-05

Family

ID=80868474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111001073.9A Pending CN114283422A (zh) 2021-08-30 2021-08-30 一种手写字体生成方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN114283422A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114881612A (zh) * 2022-05-31 2022-08-09 湖南匠云创新科技有限公司 工程资料的一体化打印撰写实现方法、装置、设备及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114881612A (zh) * 2022-05-31 2022-08-09 湖南匠云创新科技有限公司 工程资料的一体化打印撰写实现方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN112200062B (zh) 一种基于神经网络的目标检测方法、装置、机器可读介质及设备
CN107609092B (zh) 智能应答方法和装置
WO2017003756A1 (en) Methods and systems for detecting and recognizing text from images
Singh et al. Mobile Deep Learning with TensorFlow Lite, ML Kit and Flutter: Build scalable real-world projects to implement end-to-end neural networks on Android and iOS
CN110719525A (zh) 弹幕表情包的生成方法、电子设备和可读存储介质
CN106462572A (zh) 用于分布式光学字符识别和分布式机器语言翻译的技术
CN106909270A (zh) 聊天数据输入方法、装置及通讯终端
US20230082715A1 (en) Method for training image processing model, image processing method, apparatus, electronic device, and computer program product
WO2021237227A1 (en) Method and system for multi-language text recognition model with autonomous language classification
CN111158924A (zh) 内容分享方法、装置、电子设备及可读存储介质
CN114283422A (zh) 一种手写字体生成方法、装置、电子设备和存储介质
CN113867875A (zh) 标记对象的编辑及显示方法、装置、设备、存储介质
CN113762261A (zh) 一种对图像的字符识别方法、装置、设备及介质
CN112862558B (zh) 产品详情页面的生成方法和系统、数据处理方法
CN113938739B (zh) 信息显示方法、装置、电子设备及存储介质
CN111353532A (zh) 图像生成方法及装置、计算机可读存储介质、电子设备
CN113837157B (zh) 题目类型识别方法、系统和存储介质
CN113673277B (zh) 线上绘本内容的获取方法、装置以及智能屏设备
CN114398858A (zh) 一种文档显示的方法、相关装置、设备以及存储介质
KR20220061763A (ko) 화상 회의를 제공하는 전자 장치 및 화상 회의를 제공하는 방법
CN113761281A (zh) 虚拟资源处理方法、装置、介质及电子设备
CN114550185B (zh) 一种文档生成的方法、相关装置、设备以及存储介质
CN111131913A (zh) 基于虚拟现实技术的视频生成方法、装置及存储介质
CN116304163B (zh) 一种图像检索方法、装置、计算机设备及介质
US20230336839A1 (en) Method, computer device, and storage medium for generating video cover

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination