CN103488711A

CN103488711A - 一种快速制作矢量字库的方法及系统

Info

Publication number: CN103488711A
Application number: CN201310407337.XA
Authority: CN
Inventors: 潘婉琼; 连宙辉; 唐英敏; 肖建国
Original assignee: Peking University
Current assignee: Peking University
Priority date: 2013-09-09
Filing date: 2013-09-09
Publication date: 2014-01-01
Anticipated expiration: 2033-09-09
Also published as: CN103488711B

Abstract

本发明涉及一种快速制作矢量字库的方法及系统，由计算机、打印机以及扫描仪组成的系统中，其步骤包括：1）指定待建立字库中的文字内容并机器写入一标准表格中；2）在打印出的标准表格上按照书写规范手写入文字，同时以标准表格为单位采集手写入文字得到若干表格图像；3）切分表格图得到文字闭合轮廓，根据文字闭合轮廓选出其中部分点作为关键点，对关键点筛选后得到最优关键点；4）根据最优关键点得到文字的矢量化轮廓，根据矢量化轮廓生成标准TrueType字库。本发明得到的矢量字库质量较高，可以完整的保持原作者的书写风格。在生成字库的过程中完全不需人工干预，扫描得到的图像一步生成高质量的标准字库，利于个性化字库批量生产。

Description

一种快速制作矢量字库的方法及系统

技术领域

本发明涉及一种矢量字库的方法及系统，具体涉及一种通过图像旋转、切割、边缘检测、关键点检测和曲线拟合的方法进行快速制作矢量字库的方法及其系统，属于计算机图像处理技术领域。

背景技术

手写字库是一种利用手写文字图像生成的、可在计算机上安装使用的标准TrueType字库。中国有句古话：见字如见人，手写字库可将人的手写笔迹融入到日常的工作生活中，例如邮件、短信、微博和博客等，都可以选择使用自己的字库，来彰显自己的个性。

TrueType字库是由Apple公司和Microsoft公司联合提出的一种新型数学字形描述技术。TrueType采用几何学中二次贝塞尔曲线及直线来描述字体的外形轮廓，其特点是具有伸缩不变性。

相较于传统商业设计出来的TrueType字库，例如楷体、宋体和黑体等商业字体的字形由专业设计人员设计而得到，个性化字库的文字字形直接来源于用户手写文字图像的矢量化结果，这就需要矢量化算法能够尽量完整的体现用户的手写特点，并保持用户原有的书写风格。

现有的方法和系统中，一方面，它们常常采用硬件的输入设备进行手写字形图像的采集，这样的书写设备与纸的差别较大，导致输入的文字图像与用户真正的字体有一定差距，生成的字库也无法完整的保持用户的书写风格；另一方面，在字库的生成过程中，经常需要一些人工干预，对字形的轮廓进行修改和美化，致使字库的生成周期比较长，并且不利于字库的批量自动化生产。

发明内容

本发明的目的在于提出了一种全自动的个性化字库生成方法及系统，用以快速准确的将手写文字图像转换成高质量可使用的标准TrueType字库。

为了实现上述目的，本发明采用的技术方案如下：

一种快速制作矢量字库的方法，其步骤包括：

1）指定待建立字库中的文字内容并机器写入一标准表格中；

2）在打印出的标准表格上按照书写规范手写入文字，同时以所述标准表格为单位采集所述手写入文字得到若干表格图像；

3）切分所述表格图像得到单独的文字图像，并根据文字图像中的像素点对所述文字图像进行轮廓检测得到文字闭合轮廓；

4）根据所述文字闭合轮廓选出其中部分点作为关键点，对所述关键点筛选后得到最优关键点；

5）根据所述最优关键点将该文字闭合轮廓拟合成二次贝塞尔曲线和直线描述的矢量化形式，得到文字的矢量化轮廓，根据所述矢量化轮廓生成标准的TrueType字库。

更进一步，所述标准表格表设置以下几个部分：

1）在表格边缘处设置不少于4个黑色矩形标记区，

2）在位于表格右上角设置用户信息区，标记至少包括用户名字和对应字库版本号的信息；

3）建立一文字书写区，所述文字书写区包括错字标记区域和文字字体提示；

4）设置页码识别区域和/或表格页码区域，将识别区域涂黑或者空白用来表示该位为1或0，用于人工或者机器识别表格页码。

更进一步，所述切分所述表格图像得到单独的文字图像的具体方法如下：

1）找到4个角的黑色矩形区域，识别出表格的倾斜角度，然后对表格进行旋转，保持表格内的文字横平竖直；

2）找到页码识别区域，识别出表格的编号；根据表格的编号在数据库中的文件里查找该表格中所包含的文字内容，然后将表格切分为若干单个文字的图像；

3）所述文字的图像分辨率与表格相同，并对每个文字图像以文字的Unicode编码进行命名，并以bmp格式的文字图像存储在指定的文件夹中；

4）所述指定文件夹是每个用户对应的一固定的独立的文件夹，其中存储着该用户之前输入的txt文件，已经扫描得到的表格图片，以及在生成字库的过程中所得到的切分后和单个文字图片和最后生成的字库文件。

更进一步，根据文字图像中的像素点对所述文字图像进行轮廓检测得到文字闭合轮廓的具体方法如下：

1）用宽度优先搜索算法，检测出文字的轮廓，找出本身颜色是黑色并且与白色像素相邻的像素点，作为文字的轮廓点；

2）用深度优先搜索算法，找到汉字轮廓中的闭合轮廓将每个轮廓点作为图论模型中的节点；如果两个轮廓点在彼此的8邻域中，则它们对应的节点之间存在一条边，接着用深度优先搜索的算法，在该图论模型中找出闭合的路径，每一条闭合路径都对应着一个闭合文字轮廓；

3）用删除代价算法在所述闭合文字轮廓点中选出一部分作为关键点，每次都选取一个代价最小的轮廓点进行删除，直到剩余的轮廓点数达到给定阈值；

4）根据得到的所述关键点使用动态规划算法和启发式搜索来筛选出最优的关键点；

5）根据所述最优关键点并采用最小二乘法将字形轮廓拟合成二次贝塞尔曲线和直线描述的矢量化形式；

6）由文字的矢量化轮廓生成标准的TrueType字库。

更进一步，，在步骤5）中采用并用Newton Raphson算法来对拟合的结果进行参数上的优化得到矢量化轮廓。

可选地，以文本文件txt的形式将所述文字内容并机器写入一标准表格中，文本包括中文汉字，英文字母，数字以及符号。

可选地，按照如下书写规范进行手写入文字：

用户书写时选用钢笔和/或签字笔，在每个小表格内只能书写一个字符，并且书写的字符不与表格的边缘接触；每个小表格左上方有两个小正方形作为错字标记区域，如果用户书写错误时，将该区域都涂黑。

可选地，通过扫描仪将手写的文字图像采集到计算机，图像输入格式为黑白二值图像。

可选地，所述图像分辨率优选为600dpi。

本发明还提出一种快速制作矢量字库的系统，包括：计算机、打印机、扫描仪，其特征在于，

所述打印机，用于物理打印出指定待建立字库中的文字内容并机器写入一标准表格；

所述扫描仪，将手写入文字图像采集到计算机；

所述计算机包含实现以下功能的模块：

用于指定待建立字库中的文字内容并机器写入一标准表格中的模块；

用于在打印出的标准表格上按照书写规范手写入文字，同时以所述标准表格为单位采集所述手写入文字得到若干表格图像的模块；

用于切分所述表格图像得到单独的文字图像，并根据文字图像中的像素点对所述文字图像进行轮廓检测得到文字闭合轮廓的模块；

用于根据所述文字闭合轮廓选出其中部分点作为关键点，对所述关键点筛选后得到最优关键点的模块；

用于根据所述文字闭合轮廓拟合成二次贝塞尔曲线和直线描述的矢量化形式得到文字的矢量化轮廓，根据所述矢量化轮廓生成标准的TrueType字库的模块。

与现有技术相比，本发明的积极效果在于：

本发明利用高效准确的矢量化算法，将手写文字图像快速有效地转换成高质量的TrueType字库。相较于现有技术，本方法在矢量化的过程中模拟字形设计人员的设计方法，得到的TrueType字库质量较高，可以完整的保持原作者的书写风格；另一方面，本发明在生成字库的过程中，完全不需人工干预，可以由扫描得到的图像一步生成高质量的标准字库，有利于个性化字库的批量生产。

方正静蕾字体是一款个性化手写字库，是首先通过矢量化软件对文字图像进行初步的矢量化，再由专业字库设计人员对每个字符的矢量轮廓进行修订。为了测试本方法的性能，我们将方正静蕾字体打印在表格的输入框中，扫描后由系统自动生成字库，图8（a）-图8（d）显示了由本方法自动生成的字库与标准字库的细节对比。本发明的方法只花费了2个小时来生成整套字库，而专业字库设计人员则花费了几个月的时间，并且从图8（d）和图8（c）的细节中可以看出，本方法生成的字库使用了更少的关键点，并且得到的文字轮廓也更加平滑。

附图说明

图1是本发明所述的个性化字库生成的方法及系统的流程图；

图2是本发明所述的A4表格设计图；

图3是本发明所述的由表格图像直接生成字库的方法的示意图；

图4（a）-4（b）是本发明所述的删除代价定义的示意图；

图5（a）-5（b）是本发明所述的启发式搜索算法的示意图；

图6是本发明所述的启发式搜索算法的示意图；

图7（a）是本发明所述的个性化字库安装后在Word中显示的示意图；

图7（b）是本发明所述的楷体字库在Word中显示的示意图；

图8（a）-8（d）是本发明所述的方正静蕾字体对比示意图；

图9是本发明所述的楷体“心”字的矢量化流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，可以理解的是，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1是本发明所述快速制作矢量字库的方法流程图，具体步骤如下：

1）由用户指定待建立字库中所包含的文字内容，并以文本文件txt的形式输入。文本可以包含中文汉字，英文字母，数字和符号等所有字符。

2）将用户给定的文字内容去重后生成若干张文字内容排列格式按照A4大小的标准表格，表格的细节如图2所示。文本文件中可能包含相同的文字，系统会自动去重，每个文字只会在表格中出现一次，即用户不需重复书写相同的字符。表格的大小可以任意缩放，系统可以通过标记区域来计算表格的缩放比例。

3）用户通过物理打印，打印出表格，并按照要求在表格上书写文字。具体要求如下：用户书写时可选用钢笔或签字笔，最好不要用铅笔；每个小表格内只能书写一个字符，并且书写的字符请勿与表格的边缘有接触。每个小表格左上方有两个小正方形，如图2所示，作为错字标记区域，如果用户书写错误时，可以将该区域都涂黑。

4）通过扫描仪将手写的文字图像采集到计算机，为了节省存储空间，输入格式为黑白二值图像，分辨率为600dpi。经实验测试，当表格大小为A4时，600dpi的扫描得到的字符大小最合适。若选用更大的分辨率，则会浪费存储空间和处理时间；若选用更小的分辨率，扫描得到的字符会偏小，处理时可能会丢失一些细节。

上述的步骤应该属于方法的预处理部分，即得到了根据设定标准表格书写入带有文字的图像；将该图像输入计算机，进行进一步的处理：

5）系统将扫描得到的表格图像一步生成标准TrueType字库，具体步骤如图3所示。

图2是本发明所述的A4表格设计图，包含以下几个部分：

1）位于表格边缘处的4个黑色矩形标记区，用来精确识别表格的方向，便于后期对表格的旋转来矫正方向；

2）位于右上角的用户信息区，标有用户的名字和对应字库的版本号，便于表格的管理和与相应字库的对应；

3）文字书写区，包含文字楷体提示和错字标记区域。用户书写时，参照左侧的提示，将文字写在右边的空白格子中；如果用户书写时发现书写有误，则可以将错字标记区域涂黑，系统在处理时可自动识别。表格中的文字个数由实际情况决定，不需要完全占满120个位置；

4）页码识别区域，用于系统自动识别表格页码信息，由系统自动生成，共有7个小方格，每个方格对应一位，涂黑表示该位为1，空白则表示该位为0，该标记区域可以表示的页码范围是1到127；

5）表格页码区域，用于人工识别表格页码。

图3是本发明所述的由表格图像直接生成字库的方法的示意图，具体步骤如下；

1）切分表格。由于表格在打印和扫描的时候，可能会有一定角度的倾斜，因此处理时，首先找到4个角的黑色矩形区域，识别出表格的倾斜角度，然后对表格进行旋转，保持表格内的文字横平竖直。然后找到页码识别区域，自动识别出表格的编号。根据表格的编号在数据库中的文件里查找该表格中所包含的文字内容，然后将表格切分为若干单个文字的图像，该文字的图像分辨率与表格相同，并对每个文字图像以文字的Unicode编码进行命名，以bmp格式的图像存储在指定的文件夹中。每个用户都对应着一个固定的独立的文件夹，其中存储着该用户之前输入的txt文件，已经扫描得到的表格图片，以及在生成字库的过程中所得到的切分后和单个文字图片和最后生成的字库文件。

2）预处理文字图像，对于每张文字图像，首先用宽度优先搜索算法（具体可参考http://baike.baidu.com/view/288267.htm），检测出文字的轮廓，该搜索算法的规则是找出那些本身颜色是黑色并且与白色像素相邻的像素点，作为文字的轮廓点。其他常用的边缘检测算法有Canny算子（具体可参考Canny J.A computational approach to edge detection[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,1986(6):679-698.）等，但是这些算法常常针对彩色或灰度图像，处理过程非常复杂，且生成的轮廓并不能保证完全闭合。相比之下，宽度优先搜索算法更加简单有效。

然后用深度优先搜索算法（可参考http://baike.baidu.com/view/288277.htm），找到汉字轮廓中的闭合轮廓。该搜索算法的规则是首先一个图论的模型：每个轮廓点作为图论模型中的节点；如果两个轮廓点在彼此的8邻域中，则它们对应的节点之间存在一条无向边。然后从任意一个轮廓点出发，用深度优先搜索的算法，沿着所有可达的路径进行搜索，直到回到起始点，则表示找到了一个闭合的路径。在该图论模型中找出闭合的路径，每一条闭合路径都对应着一个闭合的汉字轮廓。该算法的思路简单，实现起来也较容易，是较通用的算法。

3）用删除代价算法在文字的闭合轮廓点中选出一部分作为关键点。删除代价的定义如图4（a）和图4（b）所示，其基本思想是给每个轮廓点赋予一个“被删除的代价”，算法每次都选取一个代价最小的轮廓点进行删除，直到剩余的轮廓点数达到给定阈值。本领域技术人员可以根据图中的说明来实现该算法。

4）由步骤3）得到的关键点，同时使用动态规划算法（具体可参考http://baike.baidu.com/view/28146.htm）和启发式搜索（http://baike.baidu.com/view/752809.htm）来筛选出最优的关键点。最后用最小二乘法（可参考http://baike.baidu.com/view/139822.htm）将字形轮廓拟合成二次贝塞尔曲线（http://baike.baidu.com/view/60154.htm）和直线描述的矢量化形式，该操作是本领域的标准处理过程，并用Newton Raphson算法（可参考http://baike.baidu.com/view/1504001.htm）来对拟合的结果进行参数上的优化。

5）由文字的矢量化轮廓生成标准的TrueType字库。该部分是通过研究TrueType官方格式说明来编程实现的，代码量大，但是所用技术都是公开的。

如图4（a）、图4（b）所示是删除代价定义的示意图。

删除代价算法首先将文字轮廓上的所有点都放入候选集合S中，然后计算S中每个点的删除代价，并将删除代价最小的点从S中删除，重复以上过程，直到S中的点数小于等于给定的阈值T。

其中，图4（a）、图4（b）中的灰色方块代表S中的点，白色方块代表被删除的点。如图4（a）所示，在算法最开始的时候，轮廓上的每个点都在S中；随着一些点被删除，情况变成了图4（b）。

为了衡量点P_k对拟合效果的影响，该算法选择点P_m作为参考。假设用直接来拟合轮廓，当点P_k被删除了之后，拟合的直线就由（P_i,P_k）变成了（P_i,P_j）。因此，该算法定义P_k对P_m的影响值为V_m=y–x，其中y是P_m到直线（P_i,P_j）的距离，x是P_m到直线（P_i,P_k）的距离。

综上，该算法定义P_k的删除代价D_k=max{V_m|m∈(i,j)}。

如图5（a）-图5（b）以及图6所示是不同情况下启发式搜索算法的示意图。

启发式算法的整体思想是在拟合过程中加入算法，来模拟字形设计人员优化轮廓的方法，目标是让拟合出来的文字矢量轮廓更加平滑美观。

图5（a）中定义了关键点的角度：P_m是轮廓上的关键点，CP1和CP2是用最小二乘法拟合得到的贝赛尔曲线的离线控制点，则P_m的角度定义为向量（P_m,CP1）和（P_m,CP2）的内夹角。

在图5（b）中，如果P_i的夹角小于阈值（10度），且将P_i分为两个点P_i1和P_i2，使得总的拟合误差更小。

在图6中，如果P_m的角度大于阈值（150度），那么就调整CP2的位置，使得CP1，P_m和CP2在同一条直线上，使得拟合得到的曲线轮廓更加光滑。

在本发明的一具体实施例中，个性化字库生成的方法，包括以下步骤：

1）由用户指定字库中所包含的文字内容，并以文本的形式输入；

2）将用户给定的文字内容生成若干张A4大小的标准表格；

3）用户打印表格，并按照要求在表格上书写文字；

4）通过扫描仪将手写的文字图像采集到计算机；

5）将扫描得到的表格图像一步生成标准TrueType字库。

由表格图像直接生成标准TrueType字库的方法，包括以下步骤：

1）预处理图像，包括表格图像的旋转和切分，文字图像的边缘检测和轮廓检测；

2）用删除代价算法在文字的轮廓点中选出一部分作为关键点；

3）由步骤2）得到的关键点，结合动态规划算法和启发式搜索，将字形轮廓拟合成二次贝塞尔曲线和直线描述的矢量化形式，并在拟合过程中加入算法来模拟字形设计人员优化轮廓的方法；

4）由文字的矢量化轮廓生成标准的TrueType字库。

本发明使用自适应的参数设置方法，字库的效果可通过多个参数进行灵活的控制，生成的字库可在PC中直接安装使用。系统生成的一款字库在Word中的显示效果见图7（a），同样大小同样内容的楷体字库在Word中的显示效果见图7（b）。

如图7（a）所示是本发明所述的个性化字库安装后在Word中显示的示意图。如图7（b）所示是本发明所述的楷体字库在Word中显示的示意图。本发明使用自适应的参数设置方法，字库的效果可通过多个参数进行灵活的控制，生成的字库可在PC中直接安装使用。系统生成的一款字库在Word中的显示效果见图7（a），同样大小同样内容的楷体字库在Word中的显示效果见图7（b）。

如图8（a）-8（d）所示是本发明所述的方正静蕾字体对比示意图。其中，图8（a）是方正静蕾字体“美”字经打印和扫描之后得到的原图，图8（b）是方正静蕾字体的官方轮廓图，图8（c）是用FontCreator软件对图8（a）进行矢量化操作之后得到的轮廓图，图8（d）是使用本方法得到的矢量化轮廓图，从图中的细节可以看出，本方法得到的轮廓可以很好的保持原字的细节风格，并且使用的关键点数更少，从而节约了字库文件的存储空间。

如图9所示是本发明所述的楷体“心”字的矢量化流程示意图。

自上而下分别：扫描和切分后得到的汉字原图，宽度优先搜索得到的轮廓图，深度优先搜索得到的若干闭合轮廓，删除代价算法得到的候选关键点在轮廓上的分布图，经过动态规划算法优化后得到的剩余关键点拟合得到的轮廓图，经过启发式算法优化之后得到的最终矢量化轮廓。

Claims

1.一种快速制作矢量字库的方法，其步骤包括：

1）指定待建立字库中的文字内容并机器写入一标准表格中；

2.如权利要求1所述的快速制作矢量字库的方法，其特征在于，所述标准表格表设置以下几个部分：

1）在表格边缘处设置不少于4个黑色矩形标记区，

3.如权利要求2所述的快速制作矢量字库的方法，其特征在于，所述切分所述表格图像得到单独的文字图像的具体方法如下：

4.如权利要求1或3所述的快速制作矢量字库的方法，其特征在于，根据文字图像中的像素点对所述文字图像进行轮廓检测得到文字闭合轮廓的具体方法如下：

6）由文字的矢量化轮廓生成标准的TrueType字库。

5.如权利要求4所述的快速制作矢量字库的方法，其特征在于，在步骤5）中采用并用NewtonRaphson算法来对拟合的结果进行参数上的优化得到矢量化轮廓。

6.如权利要求1或2所述的快速制作矢量字库的方法，其特征在于，以文本文件txt的形式将所述文字内容并机器写入一标准表格中，文本包括中文汉字，英文字母，数字以及符号。

7.如权利要求1或2所述的快速制作矢量字库的方法，其特征在于，按照如下书写规范进行手写入文字：

8.如权利要求1或2所述的快速制作矢量字库的方法，其特征在于，通过扫描仪将手写的文字图像采集到计算机，图像输入格式为黑白二值图像。

9.如权利要求8所述的快速制作矢量字库的方法，其特征在于，所述图像分辨率优选为600dpi。

10.一种快速制作矢量字库的系统，包括：计算机、打印机、扫描仪，其特征在于，

所述扫描仪，将手写入文字图像采集到计算机；

所述计算机包含实现以下功能的模块：