汉字字符的生成方法、装置及可读存储介质
技术领域
本发明涉及文字信息处理技术,尤其涉及一种汉字字符的生成方法、装置及可读存储介质。
背景技术
随着设计行业的不断发展,汉字的字体作为汉字展示的必备元素,越来越多的人们希望能够通过变换字体来更好的表达思想。
在现有技术中,为了获得具备个性化字体的汉字字符,较为常用的是利用用于表示部件复用关系的组字模板并结合计算机技术以快速生成字库,开发人员需要制作少量的具备个性化字体的汉字部件,并利用已有字体的组字信息作为字符组字模板将具备个性化字体的汉字部件组合在一起生成新的汉字,进而获得全新的全库字符。
但是,由于不同汉字部件在具备个性化字体的情况下,其在组成每个汉字字符时的位置和大小会有一定差异,直接使用已有字体的组字模板自动生成的汉字字符中,其部件的大小和位置有一定的偏差。这将导致字符组成结构不合理,不但无法满足原有的字体设计要求,而且还需要对生成的字符进行人工精修,其开发成本大大增加,开发效率低下。
发明内容
针对上述提及采用现有的方式对于目标字体的汉字字符进行开发时,开发成本高,开发效率低下的问题,本发明提供了一种汉字字符的生成方法、装置及可读存储介质。
一方面,本发明提供了一种汉字字符的生成方法,包括:
将待处理的处于原始字体下的目标汉字的字符图像输入至训练后的对抗网络模型,以使所述训练后的对抗网络模型对所述目标汉字的字符图像进行风格转化处理,并输出处于目标字体下的目标汉字的字符图像;
对所述处于目标字体下的目标汉字的字符图像进行矢量化处理,获得目标汉字的每个字符部件的矢量信息;
根据所述矢量信息对原始字体的拼字模板进行密排处理,并根据处理后的目标字体的拼字模板,生成目标字体下的目标汉字的汉字字符。
在其中一种可选的实施方式中,所述对所述处于目标字体下的目标汉字的字符图像进行矢量化处理,获得目标汉字的每个字符部件的矢量信息,包括:
将所述处于目标字体下的目标汉字的字符图像进行二值化处理,获得所述处于目标字体下的目标汉字的字符图像的二值图像;
提取所述二值图像的离散点,获得所述目标汉字的各字符部件的轮廓信息;
根据各字符部件的轮廓信息,确定所述各字符部件在所述目标汉字中的位置和尺寸。
在其中一种可选的实施方式中,所述根据各字符部件的轮廓信息,确定所述各字符部件在所述目标汉字中的位置和尺寸,包括:
根据各字符部件的轮廓信息,确定每个字符部件的矢量坐标区域;
根据所述每个字符部件的矢量坐标区域和各矢量坐标区域之间的相对矢量位置关系,确定所述各字符部件在所述目标汉字中的位置和尺寸。
在其中一种可选的实施方式中,所述根据所述矢量信息对原始字体的拼字模板进行密排处理,并根据处理后的目标字体的拼字模板,生成目标字体下的目标汉字的汉字字符,包括:
根据所述矢量信息中各字符部件在所述目标汉字中的位置和尺寸,对原始字体的拼字模板中各字符部件在所述目标汉字中的位置和尺寸进行平移处理,和/或,缩放处理,获得处理后的目标字体的拼字模板;
根据所述处理后的目标字体的拼字模板以及目标汉字的每个字符部件的图形轮廓,生成目标字体下的目标汉字的汉字字符。
在其中一种可选的实施方式中,还包括:
获得训练数据,所述训练数据包括多个汉字字符在原始字体下的字符图像,以及在目标字体下的字符图像;
利用所述训练数据对预设的对抗网络模型进行训练,获得训练后的对抗网络模型。
在其中一种可选的实施方式中,所述根据处理后的目标字体的拼字模板,生成目标字体下的目标汉字的汉字字符,包括:
在预设的目标字体的字符部件库中,调用目标字体的各字符部件的图形轮廓;
根据处理后的目标字体的拼字模板和目标字体的各字符部件的图形轮廓,生成目标字体下的目标汉字的汉字字符。
另一方面,本发明提供了一种汉字字符的生成装置,包括:
对抗网络模型模块,用于将待处理的处于原始字体下的目标汉字的字符图像输入至训练后的对抗网络模型,以使所述训练后的对抗网络模型对所述目标汉字的字符图像进行风格转化处理,并输出处于目标字体下的目标汉字的字符图像;
矢量处理模块,用于对所述处于目标字体下的目标汉字的字符图像进行矢量化处理,获得目标汉字的每个字符部件的矢量信息;
字符生成模块,用于根据所述矢量信息对原始字体的拼字模板进行密排处理,并根据处理后的目标字体的拼字模板,生成目标字体下的目标汉字的汉字字符。
在其中一种可选的实施方式中,对抗网络模型模块,还用于:
获得训练数据,所述训练数据包括多个汉字字符在原始字体下的字符图像,以及在目标字体下的字符图像;
利用所述训练数据对预设的对抗网络模型进行训练,获得训练后的对抗网络模型。
再一方面,本发明提供了一种汉字字符的生成装置,包括:存储器、处理器以及计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如前任一项所述的方法。
最后一方面,本发明提供了一种可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理执行以实现如前任一项所述的方法。
本发明提供的汉字字符的生成方法、装置及可读存储介质,通过将待处理的处于原始字体下的目标汉字的字符图像输入至训练后的对抗网络模型,以使所述训练后的对抗网络模型对所述目标汉字的字符图像进行风格转化处理,并输出处于目标字体下的目标汉字的字符图像;对所述处于目标字体下的目标汉字的字符图像进行矢量化处理,获得目标汉字的每个字符部件的矢量信息;根据所述矢量信息对原始字体的拼字模板进行密排处理,并根据处理后的目标字体的拼字模板,生成目标字体下的目标汉字的汉字字符,从而使得通过该技术方案自动生成符合目标字体需求的,结构合理的汉字字符,有效降低了人工成本,提高了开发效率。
附图说明
图1为利用现有的汉字字符的生成方法所生成的汉字字符的示意图;
图2为本发明示例一提供的一种汉字字符的生成方法的流程示意图;
图3为本发明示例一提供的汉字字符的生成方法所获得的目标汉字的各字符部件的轮廓的示意图;
图4为本发明示例一提供的汉字字符的生成方法所获得的矢量坐标区域的示意图;
图5为本发明示例一提供的汉字字符的生成方法所生成的汉字字符的示意图;
图6为本发明示例二提供的一种汉字字符的生成方法的流程示意图;
图7为本发明示例三提供的一种汉字字符的开发装置的结构示意图;
图8为本发明示例四提供的一种汉字字符的开发装置的硬件结构示意图。
具体实施方式
为使本发明示例的目的、技术方案和优点更加清楚,下面将结合本发明示例中的附图,对本发明示例中的技术方案进行清楚、完整地描述。
随着设计行业的不断发展,汉字的字体作为汉文字展示的必备元素,越来越多的人们希望能够通过变换字体来更好的表达思想。
在现有技术中,为了获得具备个性化字体的汉字字符,较为常用的是利用用于表示部件复用关系的组字模板并结合计算机技术以快速生成字库,开发人员需要编辑少量的具备个性化字体的汉字部件,并利用已有字体的组字信息作为字符组字模板将具备个性化字体的汉字部件组合在一起生成新的汉字,进而获得全新的全库字符。
图1为利用现有的汉字字符的生成方法所生成的汉字字符的示意图,如图1所示的,由于不同汉字部件在具备个性化字体的情况下,其在组成每个汉字字符时的位置和大小会有一定差异,直接使用已有字体的组字模板自动生成的汉字字符中,其部件的大小和位置有一定的偏差。这将导致字符组成结构不合理,不但无法满足原有的字体设计要求,而且还需要对生成的字符进行人工精修,其开发成本大大增加,开发效率低下。
针对上述问题,本发明提供了一种汉字字符的生成方法、装置及可读存储介质。
其中需要说明的是,汉字字符的生成装置也可基于硬件实现,其包括但不限于具备计算处理功能的电子设备,如智能手机、平板电脑、膝上型便携计算机等等。此外,汉字字符的生成装置可由软件实现,其可安装与前述的电子设备上,并配合其电子设备的计算逻辑以实现相应功能。
汉字字符的生成装置还可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
图2为本发明示例一提供的一种汉字字符的生成方法的流程示意图,如图2所示,该汉字字符的生成方法包括:
步骤101、将待处理的处于原始字体下的目标汉字的字符图像输入至训练后的对抗网络模型,以使所述训练后的对抗网络模型对所述目标汉字的字符图像进行风格转化处理,并输出处于目标字体下的目标汉字的字符图像;
步骤102、对所述处于目标字体下的目标汉字的字符图像进行矢量化处理,获得目标汉字的每个字符部件的矢量信息;
步骤103、根据所述矢量信息对原始字体的拼字模板进行密排处理,并根据处理后的目标字体的拼字模板,生成目标字体下的目标汉字的汉字字符。
需要说明的是,本发明提供的汉字字符的生成方法的执行主体为汉字字符的生成装置。
为了解决现有技术中存在的利用原有的组字模板生成汉字字符生成的目标字体的汉字字符容易出现字符组成结构不合理,无法满足设计需求的问题,本示例中的汉字字符的生成装置中将预存有训练后的对抗网络模型。该训练后的对抗网络模型可用于将输入的处于原始字体下的目标汉字的字符图像进行风格转化,以输出处于目标字体下的目标汉字的字符图像。
也就是说,该训练后的对抗网络模型可用于对不同风格字体的字符图像进行风格迁移,以使字符图像从一种字体风格转移至另一种字体风格。
随后,汉字字符的生成装置将训练后的对抗网络模型输出的处于目标字体下的目标汉字的字符图像进行矢量化处理,以获得目标汉字的每个字符部件的矢量信息。
具体来说,在本步骤中获得的目标汉字的每个字符部件的矢量信息具体可用于表示目标字体下的目标汉字中各字符部件的位置、尺寸等信息。
进一步的,在其中一种可选的实施方式中,汉字字符的生成装置,将所述处于目标字体下的目标汉字的字符图像进行二值化处理,获得所述处于目标字体下的目标汉字的字符图像的二值图像。其中,该二值化处理方法可参见现有技术,在此不做赘述。图3为本发明示例一提供的汉字字符的生成方法所获得的目标汉字的各字符部件的轮廓的示意图,如图3所示的,在获取目标汉字的字符图像的二值图像之后,汉字字符的生成装置可提取所述二值图像的离散点,获得图3所示的目标汉字的各字符部件的轮廓信息。其中,轮廓信息具体可对图像轮廓的离散点拟合为曲线或直线段获得。
随后,汉字字符的生成装置将根据各字符部件的轮廓信息,确定所述各字符部件在所述目标汉字中的位置和尺寸。
更具体的,图4为本发明示例一提供的汉字字符的生成方法所获得的矢量坐标区域的示意图,如图4所示的,根据各字符部件的轮廓信息,可确定每个字符部件的矢量坐标区域,而根据所述每个字符部件的矢量坐标区域和各矢量坐标区域之间的相对矢量位置关系,确定所述各字符部件在所述目标汉字中的位置和尺寸。
随后,汉字字符的生成装置将根据所述矢量信息对原始字体的拼字模板进行密排处理,并根据处理后的目标字体的拼字模板,生成目标字体下的目标汉字的汉字字符。
具体来说,汉字字符的生成装置可根据所述矢量信息中各字符部件在所述目标汉字中的位置和尺寸,对原始字体的拼字模板中各字符部件在所述目标汉字中的位置和尺寸进行平移处理,和/或,缩放处理,获得处理后的目标字体的拼字模板。
例如,拼字模板描述了字符的部件组成及各个部件的相对位置和大小信息,如字符“
”的拼字模板中记录了“土(P
1,P
2),日(P
3,P
4),罒(P
5,P
6),方(P
7,P
8)”,其中(P
1,P
2)表示了部件“土”的矢量坐标区域,其中P
1和P
2分别为其左上角点和右下角点的矢量坐标;日(P
3,P
4)表示部件“日”的矢量坐标区域,其中P
3和P
4分别为其左上角点和右下角点的矢量坐标;罒(P
5,P
6)表示部件“罒”的矢量坐标区域,其中P
5和P
6分别为其左上角点和右下角点的矢量坐标;方(P
7,P
8)表示部件“方”的矢量坐标区域,其中P
7和P
8分别为其左上角点和右下角点的矢量坐标。
通过对矢量信息中各字符部件在目标汉字中的位置和尺寸,对原始字体的拼字模板中各字符部件在所述目标汉字中的位置和尺寸进行平移处理,和/或,缩放处理,获得处理后的目标字体的拼字模板。也就是说,可基于各字符部件在目标汉字中的位置和尺寸对各部件的矢量坐标进行调整,以使其各字符部件的矢量坐标区域发生平移,和/或,缩放,进而获得由调整后的各字符部件的矢量坐标区域所组成的该目标汉字的拼字模板,该拼字模板中的字符部件的构成将与目标字体的架构匹配。
最后,根据所述处理后的目标字体的拼字模板以及目标汉字的每个字符部件的图形轮廓,生成目标字体下的目标汉字的汉字字符。
图5为本发明示例一提供的汉字字符的生成方法所生成的汉字字符的示意图,如图5所示的,例如,汉字字符“
”的生成,利用处理后的目标字体的拼字模板结合目标字体的各字符部件的图像,然后将部件“土”、“日”、“罒”和部件“方”的字形轮廓数据,经过缩放平移放置到拼字模板中各部件相应的位置,最终得到相应的拼字“
”。
本发明提供的汉字字符的生成方法,通过将待处理的处于原始字体下的目标汉字的字符图像输入至训练后的对抗网络模型,以使所述训练后的对抗网络模型对所述目标汉字的字符图像进行风格转化处理,并输出处于目标字体下的目标汉字的字符图像;对所述处于目标字体下的目标汉字的字符图像进行矢量化处理,获得目标汉字的每个字符部件的矢量信息;根据所述矢量信息对原始字体的拼字模板进行密排处理,并根据处理后的目标字体的拼字模板,生成目标字体下的目标汉字的汉字字符,从而使得通过该技术方案自动生成符合目标字体需求的,结构合理的汉字字符,有效降低了人工成本,提高了开发效率。
在上述各实施方式的基础上,图6为本发明示例二提供的一种汉字字符的生成方法的流程示意图,如图6所示的,该汉字字符的生成方法,包括:
步骤201、获得训练数据,所述训练数据包括多个汉字字符在原始字体下的原始字符图像,以及在目标字体下的目标字符图像;
步骤202、利用所述训练数据对预设的对抗网络模型进行训练,获得训练后的对抗网络模型;
步骤203、将待处理的处于原始字体下的汉字的字符图像输入至训练后的对抗网络模型,以使所述训练后的对抗网络模型对所述汉字的字符图像进行风格转化处理,并输出处于目标字体下的目标汉字的字符图像;
步骤204、对所述处于目标字体下的目标汉字的字符图像进行矢量化处理,获得目标汉字的每个字符部件的矢量信息;
步骤205、根据所述矢量信息对原始字体的拼字模板进行密排处理,并根据处理后的目标字体的拼字模板,生成目标字体下的目标汉字的汉字字符。
具体来说,与前述实施方式不同的是,在本示例中,汉字字符的生成装置首先将根据已有的拼字模板,统计使用到的所有字符部件,包括不同大小的字符部件,然后从已有字体的字库中获取所有部件数据并编码,生成目标字体的字符部件的图像库,每个字符部件包括部件编码和组成部件的轮廓数据。
在本示例中,汉字字符的生成装置获得训练数据,所述训练数据包括多个汉字字符在原始字体下的字符图像,以及在目标字体下的字符图像。
例如,从已有的原始字体的图像库和目标字符部件的图像库中分别获取相同的1000个汉字字符作为训练数据,两两配对以建立关联关系,相同汉字字符为一对。
然后,利用训练数据对对抗网络模型进行训练,以使得对抗网络模型能够学习到从原始字体到目标字体这种字体风格变换。其中,对抗网络模型将字体的设计过程转化为一个“风格迁移”的问题,利用两种不同风格的字体作为训练数据,训练一个神经网络,使得训练好的神经网络能够自动的将输入汉字转化为另一种风格的汉字。
再后,与前述实施方式类似的是,训练后的对抗网络模型可用于将输入的处于原始字体下的目标汉字的字符图像进行风格转化,以输出处于目标字体下的目标汉字的字符图像。该训练后的对抗网络模型可用于对不同风格字体的字符图像进行风格迁移,以使字符图像从一种字体风格转移至另一种字体风格。
随后,汉字字符的生成装置将训练后的对抗网络模型输出的处于目标字体下的目标汉字的字符图像进行矢量化处理,以获得目标汉字的每个字符部件的矢量信息。具体来说,在本步骤中获得的目标汉字的每个字符部件的矢量信息具体可用于表示目标字体下的目标汉字中各字符部件的位置、尺寸等信息。
随后,汉字字符的生成装置将根据所述矢量信息对原始字体的拼字模板进行密排处理,并根据处理后的目标字体的拼字模板,生成目标字体下的目标汉字的汉字字符。
最后,根据所述处理后的目标字体的拼字模板以及目标汉字的每个字符部件的图形轮廓,生成目标字体下的目标汉字的汉字字符。
其中,在本示例中,汉字字符的生成装置可在预设的目标字体的字符部件的图像库中,调用目标字体的各字符部件的图像;然后,根据处理后的目标字体的拼字模板和目标字体的各字符部件的图形轮廓,生成目标字体下的目标汉字的汉字字符。
本发明提供的汉字字符的生成方法,通过将待处理的处于原始字体下的目标汉字的字符图像输入至训练后的对抗网络模型,以使所述训练后的对抗网络模型对所述目标汉字的字符图像进行风格转化处理,并输出处于目标字体下的目标汉字的字符图像;对所述处于目标字体下的目标汉字的字符图像进行矢量化处理,获得目标汉字的每个字符部件的矢量信息;根据所述矢量信息对原始字体的拼字模板进行密排处理,并根据处理后的目标字体的拼字模板,生成目标字体下的目标汉字的汉字字符,从而使得通过该技术方案自动生成符合目标字体需求的,结构合理的汉字字符,有效降低了人工成本,提高了开发效率。
图7为本发明示例三提供的一种汉字字符的开发装置的结构示意图,如图7所示的,该汉字字符的开发装置,包括:
对抗网络模型模块10,用于将待处理的处于原始字体下的目标汉字的字符图像输入至训练后的对抗网络模型,以使所述训练后的对抗网络模型对所述目标汉字的字符图像进行风格转化处理,并输出处于目标字体下的目标汉字的字符图像;
矢量处理模块20,用于对所述处于目标字体下的目标汉字的字符图像进行矢量化处理,获得目标汉字的每个字符部件的矢量信息;
字符生成模块30,用于根据所述矢量信息对原始字体的拼字模板进行密排处理,并根据处理后的目标字体的拼字模板,生成目标字体下的目标汉字的汉字字符。
在其中一种可选的实施方式中,对抗网络模型模块10,还用于:
获得训练数据,所述训练数据包括多个汉字字符在原始字体下的字符图像,以及在目标字体下的字符图像;利用所述训练数据对预设的对抗网络模型进行训练,获得训练后的对抗网络模型。
在其中一种可选的实施方式中,所述矢量处理模块20,具体用于:
将所述处于目标字体下的目标汉字的字符图像进行二值化处理,获得所述处于目标字体下的目标汉字的字符图像的二值图像;提取所述二值图像的离散点,获得所述目标汉字的各字符部件的轮廓信息;根据各字符部件的轮廓信息,确定所述各字符部件在所述目标汉字中的位置和尺寸。
在其中一种可选的实施方式中,所述矢量处理模块20,具体用于:
根据各字符部件的轮廓信息,确定每个字符部件的矢量坐标区域;根据所述每个字符部件的矢量坐标区域和各矢量坐标区域之间的相对矢量位置关系,确定所述各字符部件在所述目标汉字中的位置和尺寸。
在其中一种可选的实施方式中,所述字符生成模块30,具体用于:
根据所述矢量信息中各字符部件在所述目标汉字中的位置和尺寸,对原始字体的拼字模板中各字符部件在所述目标汉字中的位置和尺寸进行平移处理,和/或,缩放处理,获得处理后的目标字体的拼字模板;根据所述处理后的目标字体的拼字模板以及目标汉字的每个字符部件的图形轮廓,生成目标字体下的目标汉字的汉字字符。
在其中一种可选的实施方式中,所述字符生成模块30,具体用于:
在预设的目标字体的字符部件库中,调用目标字体的各字符部件的图形轮廓;根据处理后的目标字体的拼字模板和目标字体的各字符部件的图形轮廓,生成目标字体下的目标汉字的汉字字符。
本发明提供的汉字字符的生成装置,通过将待处理的处于原始字体下的目标汉字的字符图像输入至训练后的对抗网络模型,以使所述训练后的对抗网络模型对所述目标汉字的字符图像进行风格转化处理,并输出处于目标字体下的目标汉字的字符图像;对所述处于目标字体下的目标汉字的字符图像进行矢量化处理,获得目标汉字的每个字符部件的矢量信息;根据所述矢量信息对原始字体的拼字模板进行密排处理,并根据处理后的目标字体的拼字模板,生成目标字体下的目标汉字的汉字字符,从而使得通过该技术方案自动生成符合目标字体需求的,结构合理的汉字字符,有效降低了人工成本,提高了开发效率。
图8为本发明示例四提供的一种汉字字符的开发装置的硬件结构示意图;如图8所示,该汉字字符的开发装置包括:
存储器41、处理器42及存储在存储器41上并可在处理器42上运行的计算机程序,处理器42运行计算机程序时执行上述示例的方法。
本领域普通技术人员可以理解:实现上述各方法示例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法示例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程以及相应的有益效果,可以参考前述方法示例中的对应过程,在此不再赘述。
最后,本发明还提供一种可读存储介质,包括上存储有计算机程序,所述计算机程序被处理执行以实现上述任一示例的方法。
最后应说明的是:以上各示例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各示例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各示例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各示例技术方案的范围。