CN103927537B

CN103927537B - 一种自适应的汉字笔画交叉区域提取方法

Info

Publication number: CN103927537B
Application number: CN201410193650.2A
Authority: CN
Inventors: 董乐; 徐宗懿; 封宁; 梁燕; 张宁
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2014-05-08
Filing date: 2014-05-08
Publication date: 2017-01-25
Anticipated expiration: 2034-05-08
Also published as: CN103927537A

Abstract

本发明公开了一种自适应的汉字笔画交叉区域提取方法，属于模式识别与信息处理技术领域，其主要包括以下步骤：一、计算汉字图像的骨架图，二、计算交叉点，三、交叉点合并，四、计算交点处的PBOD，五、根据PBOD直方图，计算分割点，六、连接分割点，得到自适应的交叉区域。本发明通过动态地提取交叉点对应的分割点，并得到适用不同笔画粗细的笔画交叉区域和不同形状的笔画交叉区域，解决了固定大小、固定形状提取交叉区域存在的问题。

Description

一种自适应的汉字笔画交叉区域提取方法

技术领域

本发明涉及一种自适应的汉字笔画交叉区域提取算法，其根据笔画的粗细、形状得到汉字交叉区域，并提取交叉区域，属于模式识别与信息处理技术领域。

背景技术

由于汉字集合的庞大及汉字本身的复杂性，基于结构分解和分析的模式匹配方法被认为是必要和必须的，而在脱机汉字识别中抽取笔画信息又是很重要的，故出现了许多关于汉字笔画抽取或分解的文章。关于笔画抽取需要解决两个主要问题：一是如何取出基本笔画；二是如何解决交叉点处笔画成分分割的模糊性。许多已有的笔画抽取方法建立在细分的基础上，这些方法的本质问题是会产生虚假分支和模式的畸变，从而导致不可靠的抽取结果；另一类不基于细化的笔画抽取算法利用了其它种类的笔画信息，如笔画宽度、弧度变化或笔画的连续属性。

由于汉字是一种结构性非常强的文字，因此结构分析是印刷体文本图像处理的重要方法，而笔画作为汉字结构的基本组成元素，是字符图像的重要特征，笔画，在新华字典上定义是：组成汉字的点横直撇等。由于汉字都是由笔画按照一定结构组合起来的，因此汉字笔画提取是汉字结构分析中的一个非常重要的步骤，对汉字识别有着重要的意义。基于此我们对汉字结构和拆分深入分析，从汉字的结构出发，研究汉字的交叉点检测和交叉点区域提取算法。

目前，笔画提取的主要方法有细化法、轮廓信息法和段化法等。轮廓信息法是利用轮廓信息，将字符分割成线状区域和相交区域两部分，但由于不能有效地确定相交区域，因此容易造成笔画的变形和丢失；段化法是通过相邻行和列连通段的关系来提取笔画，计算量较大，作者对汉字比较的轮廓进行跟踪，在跟踪的过程中标记相交笔画的交点，即凹点连接起来得到交叉区域，但该方法要遍历所有的轮廓像素点，计算量较大。提出了一种基于模糊区域检测的笔画提取算法，但该算法首先利用图模型对字笔画和模糊区域进行建模，之后构造贝叶斯模型分类器来分析字笔画对的连续性，需要一定量的训练，复杂度较高。

基于此，本发明利用汉字细化得到的骨架图计算汉字交叉点，再通过计算交叉点到笔画轮廓的距离得到交叉区域分割点，之后连接分割点形成交叉区域。由于印刷体汉字有许多不同的字体，不同字体之间汉字笔画粗细不同，并且，即使是同一字体的不同笔画之间粗细也不相同，此外，在交叉点处，为了将笔画完全分割开来，交叉区域的形状也是不固定的，因此，固定大小、固定形状的交叉区域是不适用的。

发明内容

针对上述现有技术，本发明要解决的技术问题为：如何实现汉字笔画分割以及对印刷体汉字交叉区域的提取，由于不同字体的印刷体汉字、同一印刷体汉字的不同笔画之间的粗细不同，交叉区域的形状、大小不同，因此一方面需要能够将汉字笔画分开，另一方面又要根据笔画的粗细、形状得到交叉区域。

为了解决上述技术问题，本发明采用如下技术方案：

一种自适应的汉字笔画交叉区域提取方法，其特征在于，根据汉字笔画交叉点到笔画轮廓的距离统计特征动态地获取分割点，得到能够将汉字笔画分割开来的最小交叉区域，包括如下步骤：

步骤一：得到汉字图像的骨架图；

步骤二：计算交叉点；

步骤三：判断是否有交叉点，若有对位于同一个交叉区域的交叉点进行合并；

步骤四：计算PBOD；

步骤五：根据PBOD直方图，计算分割点；

步骤六：连接分割点，得到自适应的交叉区域。

在本发明中，该自适应的汉字笔画交叉区域提取算法，其具体步骤如下：

步骤一：得到汉字图像的骨架图

首先对图像进行规范化、二值化，得到二值图像中笔画点像素值为1，背景像素值为0，再根据现已有的经典算法对汉字进行细化，得到汉字的骨架图；

步骤二：计算交叉点

对步骤一所获得的骨架图计算交叉点，采用像素点8邻域范围内的像素相交关系判断该像素是否为交叉点，根据公式1，利用汉字骨架图计算笔画像素的相交数N_c(p):

其中，x_i(i＝1,…,9)是像素点p的邻接点，且x₁＝x₉，若N_c(p)＞2则p为交叉点，对于没有交叉点的笔画结构我们直接输出笔画；

步骤三：对位于同一个交叉区域的交叉点进行合并

计算交叉点之间的距离，计算公式为：

dis＜p,q＞＝sqrt((x_p-x_q)²+(y_p-y_q)²)，其中，(x_p,y_p)(x_q,y_q)分别表示点p,q的坐标；如果距离小于一定的阈值，再通过如下公式得到交叉点坐标的平均值，作为合并之后的交叉点坐标；

其中，locs(x,y)表示新的交叉点的坐标，n表示距离小于阈值的交叉点个数，x_i,y_i分别表示距离小于阈值的交叉点的横纵坐标；

步骤四：计算PBOD直方图

得到合并以后的交叉点之后，对交叉点进行PBOD统计，计算公式如下:

h_i,j＝n(j),j＝1,2,…,R，其中，h_i,j表示第i个交叉点PBOD分布直方图的第j个分量，整个方向被划分为R的小方向，n(j)表示第j个方向内交叉点到轮廓的距离；

步骤五：根据PBOD直方图，计算每一个交叉点的PBOD，得到分割点；

步骤六：连接分割点，得到自适应的交叉区域。

更进一步，在所述步骤五中，所述分割点的计算包括以下步骤：

①预处理PBOD，对连续等值的点只取其中一个点，其余的点舍去；

②依次取出PBOD中n(j)，计算n(j)前后两个邻点n(j-2)、n(j-1)、n(j+1)和n(j+2)，对PBOD中的首尾两端点做相邻点考虑；

③如果n(j)大于它四个相邻点中的某一个，j＝j+1，转到第2步；若n(j)均小于它的四个相邻点，则第j个方向上轮廓的点将作为笔画的分割点；

④计算得到的分割点之间的距离，如果距离太近则合并为一个分割点，新分割点的坐标为旧分割点坐标的平均值。

与现有技术相比，本发明具有以下有益效果：

本发明通过利用汉字笔画交叉点到笔画轮廓的距离统计特征动态地获取分割点，得到将汉字笔画分割开来的最小交叉区域，适用于不同字体的笔画、笔画粗细不同的笔画和不同交叉结构的笔画，解决了固定大小、固定形状提取交叉区域存在的问题，因而具有以下优点：

1、从汉字笔画提取系统的易于实现的角度出发，通过仅对交叉点计算点到汉字轮廓的距离直方图，大大的减少了一副图像的直方图数量，提高了提取的速度，降低了存储开销；

2、从信息处理技术的角度出发，通过计算每个交叉点的点到轮廓距离直方图，系统可以准确地得到交叉笔画的凹点，即分割点。有效地避免了固定大小提取交叉区域时，交叉区域过小或过大，交叉区域形状固定等难以适应不同笔画结构的汉字笔画提取等问题；

3、从消费者对用户体验的要求出发，通过计算交叉点到笔画轮廓距离直方图，能够快速实现快速高效的汉字笔画分割效果。

附图说明

图1为自适应的汉字笔画交叉区域提取算法的流程图；

图2为汉字骨架图；

图3-a、3-b、3-c、3-d、3-e为部分实验的PBOD直方图；

图4为汉字笔画凹点示意图；

图5为部分实验结果图；

图6交叉区域提取效果对比图。

具体实施方式

下面将结合附图及具体实施方式对本发明作进一步的描述。

本发明是用于汉字笔画提取中的笔画分割部分，为了适应不同字体的汉字和同一字体的不同笔画，本发明提出了一种自适应的汉字笔画交叉区域提取算法，该方法不需要人为设置分割半径，能够根据交叉点到轮廓的距离找出凹点，获得交叉区域，能够适用于不同字体的汉字。该提取方法能够很好地满足用户对汉字笔画拆分的需求，同时可在很大程度上增加汉字笔画提取的用户体验，并通过大量的实验验证了本发明能用很少的计算量就达到了让人满意的效果，同时展示了本发明方法在分割准确率和分割效率上都具有很好的表现。

我们的测试实验软硬件环境为：

硬件环境：

电脑类型：PC

CPU：双核奔腾CPU每核主频2.70GHz

内存：4.00GB

系统类型：32位WINDOWS操作系统

软件环境：

IDE：Visual Studio 2010

图像处理SDK：OpenCV2.3.4

开发语言：C++

如图1本发明基于交叉区域提取算法的流程图，自适应的汉字笔画交叉区域提取算法包括如下步骤：

步骤一：为了寻找汉字的交叉点，首先对图像进行规范化、二值化，得到二值图像中笔画点像素值为1，背景像素值为0。之后根据现已有的经典算法对汉字进行细化，得到汉字的骨架图。本发明细化之后的效果见附图2。

步骤二：对步骤一所获得的骨架图计算交叉点，采用像素点8邻域范围内的像素相交关系判断该像素时候为交叉点。根据公式1，针对汉字骨架图计算笔画像素的相交数N_c(p):

其中x_i(i＝1,…,9)是像素点p的邻接点，且x₁＝x₉。若N_c(p)＞2则p为交叉点。对于没有交叉点的笔画结构我们直接输出笔画。

步骤三：对交叉点进行合并。由于在细化的过程中可能会对笔画造成畸变，如附图1所示。因此本发明对位于同一个交叉区域的交叉点进行合并。根据公式2计算交叉点之间的距离，如果距离小于一定的阈值，再通过公式3得到交叉点坐标的平均值，作为合并之后的交叉点坐标。

dis＜p,q＞＝sqrt((x_p-x_q)²+(y_p-y_q)²),(公式2)

其中，(x_p,y_p)(x_q,y_q)分别表示点p和q的坐标。

其中，locs(x,y)表示新的交叉点的坐标，n表示距离小于阈值的交叉点个数。x_i,y_i分别表示距离小于阈值的交叉点的坐标。

步骤四：得到合并以后的交叉点之后，本发明要对交叉点进行PBOD统计。PBOD即点到轮廓距离直方图，见附图3-a至图3-e。根据所计算的距离统计PBOD直方图：

h_i,j＝n(j),j＝1,2,…,R(公式4)

其中h_i,j表示第i个交叉点PBOD分布直方图的第j个分量。整个方向被划分为R个小方向，n(j)表示第j个方向内交叉点到轮廓的距离。

步骤五：根据PBOD直方图，计算每一个交叉点的PBOD，得到分割点

步骤六：得到交叉点的PBOD之后，找到交点对应的交叉区域的分割点，即凹点。分割点的寻找实质上是寻找PBOD直方图的波谷点的位置。分割点的寻找问题转化为了PBOD的波谷的寻找问题。PBOD的波谷是局部最小值，不同的交叉点的PBOD形状各异，设置一个统一阈值的方法是不适用的，本发明从每个PBOD自身特征出发，寻找波谷点。分割点即凹点，凹点的示意图参见图4。凹点对应到PBOD直方图上即位于波谷的位置，因此本发明找到PBOD直方图的波谷点，即交叉区域的分割点。再将分割点连接起来得到交叉区域，即得到了能够将笔画完全分割开来的最小交叉区域。交叉区域提取的效果图请见附图5。本发明与固定区域的提取方法进行了对比，实验证明该方法能够根据笔画的形状、粗细来决定交叉区域的形状和大小，提取效果较好。

Claims

1.一种自适应的汉字笔画交叉区域提取方法，其特征在于，根据汉字笔画交叉点到笔画轮廓的距离统计特征动态地获取分割点，得到能够将汉字笔画分割开来的最小交叉区域，包括如下步骤：

步骤一：得到汉字图像的骨架图

对图像进行规范化、二值化，得到二值图像中笔画点像素值为1，背景像素值为0，再根据现已有的经典算法对汉字进行细化，得到汉字的骨架图；

步骤二：计算交叉点

对步骤一所获得的骨架图计算交叉点，采用像素点8邻域范围内的像素相交关系判断该像素是否为交叉点，根据如下公式，利用汉字骨架图计算笔画像素的相交数N_c(p):

其中，x_i(i＝1,…,9)是像素点p的邻接点，且x₁＝x₉，若N_c(p)＞2则p为交叉点，对于没有交叉点的笔画直接输出；

步骤三：对位于同一个交叉区域的交叉点进行合并

计算交叉点之间的距离，计算公式为：

dis＜p,q＞＝sqrt((x_p-x_q)²+(y_p-y_q)²)，其中，(x_p,y_p)(x_q,y_q)分别表示点p和q的坐标；如果距离小于一定的阈值，再通过如下公式得到交叉点坐标的平均值，作为合并之后的交叉点坐标；

步骤四：计算PBOD直方图

h_i,j＝n(j),j＝1,2,…,R，其中，h_i,j表示第i个交叉点PBOD分布直方图的第j个分量，整个方向被划分为R的小方向，n(j)表示第j个方向上交叉点到笔画轮廓的距离；

步骤六：连接分割点，得到自适应的交叉区域；

在所述步骤五中，所述分割点的计算包括以下步骤：