CN112434763A

CN112434763A - 一种基于计算机的汉字骨架生成方法

Info

Publication number: CN112434763A
Application number: CN202011326562.7A
Authority: CN
Inventors: 伍曙光; 韩金宝; 陶天毅
Original assignee: 伍曙光
Current assignee: Chengdu zigou Technology Co.,Ltd.
Priority date: 2020-11-24
Filing date: 2020-11-24
Publication date: 2021-03-02

Abstract

本发明提供一种基于计算机的汉字骨架生成方法，包括如下步骤:步骤a.将设定好的代表字按配置的标准字体和像素面积图像化，得到代表字的图片表示形式；步骤b.应用灰度化、二值化和形态学变换，得到所需的代表字二值图像表示形式；步骤c.将汉字图形拆分为基元并单独存储，利用细化算法将其细化为基元骨架；步骤d.利用数据库中的参数，对骨架基元仿射变换后进行重组；步骤e.裁剪多余的像素元素，得到需要生成的新字的骨架。本发明解决了目前字库需要一个字一个字的设计，周期长、工作繁琐、效率低下，需要设计师工作大量时间，成本很高的问题。

Description

一种基于计算机的汉字骨架生成方法

技术领域

本发明涉及字库技术领域，更具体地涉及一种基于计算机的汉字骨架生成方法。

背景技术

汉字是最古老的象形文字之一，结构复杂，数量庞大，传统的字体设计需要人工手动去设计每一个字形，这对设计一套完整的字库来说是一件工作量特别大的事情，甚至需要两三年的时间才能完成。而且设计师需要不断的对每一个字形的设计进行修正，以期望字库里的全部汉字整体显得协调和美观。中文字库设计标准：GB2312-80是1980年发布的国家标准，收集汉字6763个；GBK是1995年发布的《汉字编码扩展规范》，包含了GB2312-80的全部汉字，一共收集汉字20902字；2013年国家发布的通用汉字规范表，一共收集汉字8105个。所以，传统的字库设计需要花费大量的成本，而且效率低下。

目前也出现了一种常用的设计方法，就是通过事先设计好汉字的通用笔画结构，规定好笔画弯折的方位，弧度等要素，然后由这些基本元素拼接成汉字。但是这个过程仍然是手动的，少不了大量的人工干预，虽然一定程度上提高了设计效率，但仍没有改变传统字库设计耗费巨大人工成本的本质。

另外，近几年人工智能技术的快速进步也给传统字体设计提供了新的思路。比如现有的计算机算法可以通过人手写100个左右的汉字，学习人的汉字书写习惯，进而自动生成其他的部分符合书写者风格的手写体汉字。但是这种方式仍存在问题，就是每次的生成结果都具有随机性，即学习同一个书写者的写字习惯，多次生成出来的汉字虽然看起来风格的确相近，但即便是同一个字形，每一次自动生成的结果都是不同的。比如大书法家王羲之的《兰亭集序》里面出现的21个“之”字各个字形迥异，但都是王羲之的行楷风格。出现这个问题的本质原因就是因为风格本身是很难量化的，他是肉眼观察到的一种反馈；而字库的设计则不同，要求的是一种标准，是比风格更严谨的表示形式。所以现有的计算机算法也不适用于字库设计领域。

现有的利用通用笔画拼接的方法：

虽然通过复用笔画的方法，减少了一部分复杂度，但拼接的过程中仍需要大量的人工调整与校验，设计师工作量并没有减少很多。对相似但又有一定差别的笔画元素，这种方法不能直接复用，需要设计师手动再去调整这个笔画元素为合适的形式。这种方法在设计过程中做了大量的重复工作，没有合理的总结设计过程中的规律。

现有技术主要具有以下缺点：

现有技术需要挨个设计每一个汉字，或者使用事先设计好的笔画结构来拼接，这个过程需要长时间且很繁琐的人工干预。现有技术设计一套字库需要花费半年以上，如果是完整的汉字字库需要一两年，甚至需要两三年。

发明内容

本发明提供了一种基于计算机的汉字骨架生成方法，以解决目前字库需要一个字一个字的设计，周期长、工作繁琐、效率低下，需要设计师工作大量时间，成本很高的问题。

为解决上述技术问题，本发明所采用的技术方案是：一种基于计算机的汉字骨架生成方法，包括如下步骤:

步骤a.将设定好的代表字按配置的标准字体和像素面积图像化，得到代表字的图片表示形式；

步骤b.应用灰度化、二值化和形态学变换，得到所需的代表字二值图像表示形式；

步骤c.将汉字图形拆分为基元并单独存储，利用细化算法将其细化为基元骨架；

步骤d.利用数据库中的参数，对骨架基元仿射变换后进行重组；

步骤e.裁剪多余的像素元素，得到需要生成的新字的骨架。

进一步地，步骤a中，图像化后得到一张一定像素大小的RGB图像。

进一步地，步骤b中，得到二值图像后，对二值图像做形态学变换处理，消除字型周边轮廓的毛刺并修复凹陷，得到待处理的字型。

进一步地，步骤c中，将步骤b得到待处理的字型拆解为基本的笔画基元，每一个笔画基元被单独存储为一张二值图像，将二值图像储存为汉字笔画基元库。

进一步地，步骤c中，将得到的所有基元骨架存储为汉字骨架基元库。

进一步地，步骤d中，新建一张一定大小的空白图像，命名为画布，后续拼接字型骨架的所有步骤都在这张画布上进行。

进一步地，步骤d中，数据库为汉字基元组合参数库，从汉字基元组合参数库中读取要生成的字的骨架的基元组成列表。

进一步地，步骤d中，给定仿射变换的参数，对读取出来的骨架进行仿射变换。

进一步地，步骤d中，给定一个坐标参数，规定得到的仿射变换后的骨架的中心点位置。

进一步地，步骤e中，取出画布中心的像素面积的内容，另存为一幅新的二值图像，对新的二值图像进行裁剪，还原实际的像素面积大小，得到完整的被拼接后的新字的骨架。

本发明的构思如下：

通过对大量成品字体的观察，对字体设计过程的研究和对传统计算机算法自动生成字体方法的尝试，总结了一些规律：

1、不同字型相同笔画之间的设计形式具有很强的相似性，所以我们可以尝试通过总结一定的规律来描述这种相似性，从而对笔画元素进行合理的复用。

2、字体在设计过程中，并不是简单的对笔画进行拼接，如我们汉字被称作方块字，我们在设计的时候必然要考虑整个字在“方块”中的字形是怎样的，这里的“方块”就是汉字外面看不到的框，汉字要美观，必然要考虑中宫，重心等几何元素，在观察过同一个字不同字体下的表现形式后，我们发现最终决定一个字好看与否的就是这个字的结构，再抽象一点，就是这个字的骨架结构，美人在骨不在皮，字也是如此，骨架比拟美人的骨，成型字就比拟美人的皮，骨相美才是真的美，骨架结构很大程度决定了每一个笔画填充丰满后的成型字的好看与否。这里骨架就是字的每一个笔画被细化成单像素后的表现形式，就像从一个字中抽取出的骨骼结构。

3、在尝试传统机器学习方法中发现，尽管每次的结果具有随机性，但可以看出其骨架是几乎不变的，只是字的轮廓在生成的时候具有很大的不确定性，所以骨架在生成字的过程是一个相对稳定的变量，在一定程度上能被量化。

与现有技术相比，本发明具有以下有益效果：本发明通过骨架来描述汉字的结构，使其可以倍更好的量化，从而进一步减少设计师及人工干预的工作量；解决了现有通过通用笔画结构拼接成汉字这一设计方法中遇到相似但又有一定差别的笔画元素不能直接复用的问题，通过算法可以自动对笔画进行形变与调整。大幅度提高字库设计效率，节约字库设计时间。

本发明优化了现有的通过通用笔画结构拼接成汉字的逻辑，通过更容易被量化的骨架来描述汉字的结构，更好的用算法来实现，让字库设计的工作变得更加高效、简单。

基于计算机算法尽可能自动完成，本发明在字库设计师设计的风格字体基础上，字体的设计会更加标准、规范、美观，字库设计质量将大幅户提高。

本发明能分析设计师设计出的汉字的结构，生成符合设计师设计风格的所有汉字的骨架。

使用本发明，设计师只需要设计100个左右的汉字，字库设计剩下的所有工作都由计算机算法来完成，无需过多的人工干预。

使用本发明，设计师只需要工作一到两个星期(甚至更短的时间)，即可以设计一套完整字库的设计。

附图说明

图1为本发明的一种基于计算机的汉字骨架生成方法的步骤示意图。

图2为本发明的一种基于计算机的汉字骨架生成方法的原理示意图。

图3为本发明的一种基于计算机的八邻域的示意图。

具体实施方式

下面结合附图进一步详细描述本发明的技术方案，但本发明的保护范围不局限于以下所述。

为使本发明实施方式的目的、技术方案和优点更加清楚，下面将结合本发明实施方式中的附图，对本发明实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式是本发明一部分实施方式，而不是全部的实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。因此，以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。

下面结合实施例对本发明作进一步的描述，所描述的实施例仅仅是本发明一部分实施例，并不是全部的实施例。基于本发明中的实施例，本领域的普通技术人员在没有做出创造性劳动前提下所获得的其他所用实施例，都属于本发明的保护范围。

请参阅图1至图3，图中所示者为本发明所选用的实施例结构，此仅供说明之用，在专利申请上并不受此种结构的限制。

实施例一

如图1和图2所示，一种基于计算机的汉字骨架生成方法，包括如下步骤:

步骤e.裁剪多余的像素元素，得到需要生成的新字的骨架。

步骤a包括：

步骤a1.准备好所需要的代表字和标准字体文件，并将所有代表字存到一个文本文件中，将该文本文件称作代表字文件。

步骤a2.从代表字文件中按顺序取出一个单独的字符。

步骤a3.将步骤a2取出的字符图像化，得到一张RGB图像。

步骤b包括：

步骤b1.将步骤a3得到的RGB图像做灰度变化，得到灰度图像。

步骤b2.设置一定的阈值，将步骤b1得到的灰度图像做二值化处理，得到二值图像。

步骤b3.将步骤b2得到的二值图像做形态学变换处理，消除字型周边轮廓的毛刺并修复凹陷，得到待处理的字型。

步骤c包括：

步骤c1.将步骤b3得到的字型拆解为基本的笔画基元，每一个笔画基元被单独存储为一张二值图像。

步骤c2.从代表字文件中按顺序取出下一个单独的字符，重复步骤a3、步骤b1至步骤b3和步骤c1。

步骤c3.步骤c2结束后，即得到所有代表字拆解得到的基元的二值图像元素，将二值图像元素储存为汉字笔画基元库。

实施例二

实施例二是在实施例一的基础上的进一步优化。

步骤c还包括：

步骤c4.取出步骤c3得到的汉字笔画基元库中的一个二值图像元素送入细化程序中；

步骤c5.读取步骤c4选中的元素中第一个像素的内容，并比较当前像素与其八邻域像素间的关系，判断这个像素点是否需要保留；

步骤c6.遍历该元素的每一个像素，重复步骤c5的过程；

步骤c7.步骤c6结束后，得到一个笔画基元被细化后的骨架；

步骤c8.从汉字笔画基元库中按顺序取出下一个元素，重复步骤c5至步骤c7的过程；

步骤c9.步骤c8结束后，得到汉字笔画基元库中每一个笔画基元被细化后的骨架，将得到的所有笔画基元骨架存储为汉字骨架基元库。

步骤d包括：

步骤d1.新建一张空白图像，命名为画布，后续拼接字型骨架的所有步骤都在这张画布上进行；

步骤d2.从汉字基元组合参数库里面读取要生成的字骨架的基元组成列表；

步骤d3.从基元组成列表中，选取一个特定的基元，从汉字骨架基元库中读取其对应的骨架；

步骤d4.给定仿射变换的参数，对步骤d3读取出来的骨架进行仿射变换；

步骤d5.给定一个坐标参数，规定步骤d4得到的仿射变换后的骨架的中心点位置；

步骤d6.按照基元组成列表的顺序，选取下一个基元并从汉字骨架基元库中读取其对应的骨架，重复步骤d4和步骤d5；

步骤d7.步骤d6结束后，得到完整的被拼接后的新字的骨架。

实施例三

为了方便说明，这里首先解释频繁出现的基元的概念。

本发明中，认为基元是组成汉字的基本元素，比如“字”由偏旁“宝盖头”和独体字“子”组成，这两个元素就是组成“字”这个字的基元。其中，基元不一定是非要小到如“横”、“竖”、“撇”、“捺”这样的基本笔画，比如有“宝盖头”的汉字，每个字中其“宝盖头”的部分都很相似，很明显是可以被复用的，所以“宝盖头”就是一个基元。通过总结，我们发现基元可以是基本笔画，偏旁部首甚至独体字，判断是不是基元主要看其能不能在其他字中被灵活复用，只要满足这个条件，都可以看作是基元。

将汉字的基元存储为汉字基元组合参数库，汉字基元组合参数库存储了组成汉字的各种基元组合。

如图1和图2所示，本发明的技术方案的具体应用包括以下步骤：

1、准备好所需要的代表字和标准字体文件，这里的标准字体默认选择微软雅黑，并将所有代表字存到一个文本文件中，我们将其称作代表字文件；

2、从代表字文件中按顺序取出一个单独的字符；

3、将这个字符图像化，这里我们将得到一张256*256像素大小的RGB图像；其中，不一定非是256*256像素大小，这里的像素面积只是固定下来字符所占的范围，甚至不一定非是一个正方形范围，但这里确定了像素面积大小后，后面步骤中涉及到像素设定的问题都要与这一步的设置相互对应；

4、将上一步得到的图像做灰度变化，得到一张256*256像素大小的灰度图像；

5、设置一定的阈值，将上一步得到的灰度图像做二值化处理，得到一张256*256像素大小的二值图像；

其中，该阈值的设定是现有技术，是由一篇论文中的开源算法自动生成的，阈值如何生成不属于本发明的实际内容，本发明是直接运用生成的阈值。实际操作中可以先通过开源算法得到阈值，再应用阈值进行二值化。

6、将上一步得到的二值图像做形态学变换处理，消除字型周边轮廓的毛刺并修复凹陷，得到待处理的字型；

7、将上一步得到的字型拆解为基本的笔画基元，这里的基元指的是如“横”、“竖”、“单人旁”等可以在汉字中广泛复用的元素，每一个笔画基元被单独存储为一张256*256的二值图像，其中，笔画基元分布在256*256像素面积范围内的正中央，这里设置的256*256就是为了与第3步相对应；

8、从代表字文件中按顺序取出下一个单独的字符，重复步骤3～7；

9、上一步结束后，我们即可得到所有代表字拆解得到的基元的二值图像元素，将这些元素储存为汉字笔画基元库；

10、取出上一步得到的汉字笔画基元库中的一个元素送入细化程序中；

11、读取上一步选中的元素中第一个像素的内容，并比较当前像素与其八邻域像素间的关系，判断这个像素点是否需要保留；其中，如图3所示，八邻域定义：假设当前像素为P点，其周围8个像素点即为P点的八邻域；

其中，判断这个像素点是否需要保留的过程为：假设二值图像是白底黑字，那么黑色像素即为字型的有效像素；是否保留的意思是指，当前选中的一个像素点，通过对其本身与其八邻域之间的关系运算会得到一个判断结果，如果选中的像素点是黑色，判断结果是不需要保留，就把这个像素点置为白色，如果是需要保留，就保持黑色，因为细化就是在剥落字型周边轮廓像素并最终得到一个近似单像素的字型骨架的过程，所以需要做是否保留这个判断；

12、遍历这个元素的每一个像素，重复上一步的过程；

13、上一步结束后，即可得到一个笔画基元被细化后的骨架；

14、从汉字笔画基元库中顺序取出下一个元素，重复步骤11～13；

15、上一步结束后，即可得到汉字笔画基元库中每一个基元被细化后的骨架；

16、将上一步细化得到的所有笔画基元骨架存储为汉字骨架基元库，并认为所有汉字都可以由这个基元库中的元素通过仿射变换和拼接组合得到；

17、新建一张512*512的空白图像，称其为画布，后续拼接字型骨架的所有步骤都在这张画布上进行，实际笔画元素其实都分布在正中心的256*256的矩形范围内；

其中，这里设置的512*512也是为了与第3步与第7步中的设置相对应，因为笔画基元的提取是在256*256的像素面积范围内完成的，所以如果设定的重组参数正确，那么笔画基元骨架无论怎么重组都不会超出256*256这个预定的范围，考虑到笔画基元实际分布在基元二值图像的正中央，所以其四周会有一定的留白，这里我们把像素在高和宽两个维度上直接扩展为原来的两倍，即由256*256扩大为512*512，从而保证即便在极限情况，如笔画基元放置在256*256实际范围的四个边角时，笔画基元骨架的载体——二值图像在放置过程中都不会超过画布的范围；

18、从汉字基元组合参数库里面读取要生成的字的骨架的基元组成列表，如要组合“字”这个字，那么从汉字基元组合参数库中读取出来基元的就是偏旁“宝盖头”和独体字“子”，很明显这两个基元按照上下结构通过一定的参数进行拼接就可以得到完整的字型；

19、从基元组成列表中，选取一个特定的基元，从汉字骨架基元库中读取其对应的骨架二值图像；

20、给定仿射变换的参数，对上一步读取出来的基元骨架进行仿射变换，最简单的如在宽方向缩放x倍，在高方向缩放y倍，那x，y就是所需要的参数；

其中，在实际拼接中，直接读取到的基元骨架往往不能满足拼接的需求，如“字”这个字在拼接过程中要用到独体字“子”，但很明显“字”中的基元“子”是被上下压缩过的，以适应“字”这个字的结构，所以需要用到仿射变换这一步；

21、给定一个坐标参数，规定上一步得到的仿射变换后的基元骨架的中心点位置；

其中，如中心点位置坐标为(100，100)，即选定的基元骨架的中心点将会被放在256*256像素范围内点(100，100)处，但现在我们的画布是512*512像素面积的，所以需要自动对输入的坐标参数进行调整，即目标点的横坐标为给定参数横坐标+画布宽度的1/4，纵坐标为给定参数横坐标+画布高度的1/4，这里具体为(100+128，100+128)即(228，228)处；

22、按照基元组成列表的顺序，选取下一个基元并从汉字骨架基元库中读取其对应的骨架二值图像，重复步骤20和21；

23、上一步结束后，即可看到完整的被拼接后的“新”字的骨架；需要注意的是，这时候的像素面积是512*512；

24、取出画布中心的256*256像素面积的内容，另存为一幅新的二值图像，即最终生成的“新”字的骨架；

其中，由于步骤17为了避免空白元素越界，我们扩大了实际像素面积的大小，即由256*256扩大为512*512，所以这一步需要做一个裁剪的工作，还原为实际的像素面积大小，这个大小与步骤3中的设置相对应。

最后着重说明下为什么选择对骨架进行变换和重组，这里为什么只讨论骨架，因为骨架更多的是和字的结构有关，在一定程度上是可以被量化的，不像一个字中具体的一个笔画具有很强的风格从而不好量化。而且由于骨架的单像素特征，在仿射变换的过程中造成的细节损失(如笔画边角)几乎可以忽略不计。

以上所述实施例是用以说明本发明，并非用以限制本发明，所以举例数值的变更或等效元件的置换仍应隶属本发明的范畴。

由以上详细说明，可使本领域普通技术人员明了本发明的确可达成前述目的，实已符合专利法的规定。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，应当指出的是，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于计算机的汉字骨架生成方法，其特征在于，包括如下步骤:

步骤e.裁剪多余的像素元素，得到需要生成的新字的骨架。

2.如权利要求1所述的一种基于计算机的汉字骨架生成方法，其特征在于，步骤a中，图像化后得到一张一定像素大小的RGB图像。

3.如权利要求2所述的一种基于计算机的汉字骨架生成方法，其特征在于，步骤b中，得到二值图像后，对二值图像做形态学变换处理，消除字型周边轮廓的毛刺并修复凹陷，得到待处理的字型。

4.如权利要求3所述的一种基于计算机的汉字骨架生成方法，其特征在于，步骤c中，将步骤b得到待处理的字型拆解为基本的笔画基元，每一个笔画基元被单独存储为一张二值图像，将二值图像储存为汉字笔画基元库。

5.如权利要求4所述的一种基于计算机的汉字骨架生成方法，其特征在于，步骤c中，将得到的所有基元骨架存储为汉字骨架基元库。

6.如权利要求5所述的一种基于计算机的汉字骨架生成方法，其特征在于，步骤d中，新建一张一定大小的空白图像，命名为画布，后续拼接字型骨架的所有步骤都在这张画布上进行。

7.如权利要求6所述的一种基于计算机的汉字骨架生成方法，其特征在于，步骤d中，数据库为汉字基元组合参数库，从汉字基元组合参数库中读取要生成的字的骨架的基元组成列表。

8.如权利要求7所述的一种基于计算机的汉字骨架生成方法，其特征在于，步骤d中，给定仿射变换的参数，对读取出来的骨架进行仿射变换。

9.如权利要求8所述的一种基于计算机的汉字骨架生成方法，其特征在于，步骤d中，给定一个坐标参数，规定得到的仿射变换后的骨架的中心点位置。

10.如权利要求9所述的一种基于计算机的汉字骨架生成方法，其特征在于，步骤d中，取出画布中心的像素面积的内容，另存为一幅新的二值图像，对新的二值图像进行裁剪，还原实际的像素面积大小，得到完整的被拼接后的新字的骨架。