CN102314252B

CN102314252B - 一种手写字符串的字符切分方法和装置

Info

Publication number: CN102314252B
Application number: CN 201010223556
Authority: CN
Inventors: 秦超; 王利娟; 邹明福; 郭育生
Original assignee: Hanwang Technology Co Ltd
Current assignee: Hanwang Technology Co Ltd
Priority date: 2010-06-30
Filing date: 2010-06-30
Publication date: 2013-09-11
Anticipated expiration: 2030-06-30
Also published as: CN102314252A

Abstract

本发明实施例公开了一种手写字符串的字符切分方法和装置，涉及文字识别技术，为提高手写字符串识别的准确率而发明。其中所述方法包括：获取手写字符串的笔划信息；以所述笔划信息中的笔划作为基本部件，计算每个所述基本部件的可信度框；对每个所述可信度框进行基于方向趋势的字符切分；对字符切分后的字符块进行基于预定规则的合并，并输出最终的字符切分结果。本发明实施例主要用于手写字符识别领域。

Description

一种手写字符串的字符切分方法和装置

技术领域

本发明涉及文字识别技术，特别涉及一种手写字符串的字符切分方法和装置。

背景技术

以往的手写产品都是基于单字符的输入和识别。一般有两种方式限定单字符的输入：一是在交互界面上采用书写框来限制输入的轨迹范围和个数；二是采用书写停顿检测技术，比如以时间间隔方式来区分两个字的识别。很明显，这两种方式都是低效的输入方式，既不满足自然手写连续输入的模式，也不满足高效输入的需求。事实上，随着单字识别技术的不断成熟，手写识别的研究重心已经从单字符识别领域转向包括字符切分在内的字符串识别领域。

对于手写字符串识别而言，最典型的特征是书写的随意性较大，输入的字数不固定，且切分点不确定。同时，由于汉字的结构复杂、字体形式多样、个人书写风格的差异等原因，字符之间很容易出现粘连、笔画交错、字符大小不一的现象，所以字符切分一直是手写字符串识别工作中的一个棘手问题。

在实现本发明的过程中发明人发现，字符切分的优劣是决定手写字符串识别性能的一个重要因素，如何准确地进行字符切分以提高手写字符串识别的准确率是当前文字识别技术的一个重要研究方向。

发明内容

本发明实施例提供一种手写字符串的字符切分方法和装置，以提高手写字符串识别的准确率。

本发明实施例采用如下技术方案：

一种手写字符串的字符切分方法，包括：

获取手写字符串的笔划信息；

以所述笔划信息中的笔划作为基本部件，计算每个所述基本部件的可信度框；

对每个所述可信度框进行基于方向趋势的字符切分；

对字符切分后的字符块进行基于预定规则的合并，并输出最终的字符切分结果。

一种手写字符串的字符切分装置，包括：

获取单元，用于获取手写字符串的笔划信息；

可信度框计算单元，用于以所述获取单元获取的笔划信息中的笔划作为基本部件，计算每个基本部件的可信度框；

字符切分单元，用于对每个所述可信度框计算单元计算的可信度框进行基于方向趋势的字符切分；

字符合并单元，用于对所述字符切分单元切分后的字符块进行基于预定规则的合并；

输出单元，用于输出所述字符合并单元最终的字符切分结果。

本发明实施例的手写字符串的字符切分方法和装置，对获取的手写字符串的笔划信息，以笔划作为基本部件，首先计算每个基本部件的可信度框，然后对每个可信度框进行基于方向趋势的字符切分，并对字符切分后的字符块进行基于预定规则的合并，最后才输出最终的字符切分结果。由于可信度框可以消除由于书写随意性出现的一些过长的笔划对计算外框的影响，从而避免在字符切分过程中出现过合并；基于方向趋势的字符切分是按照相邻可信度框中心的方向偏转关系对可信度框进行合并，得到一系列的字符块；对字符切分后的字符块进行基于预定规则的合并，能够对上述较零散的字符块进一步的合并，可以有效地降低字符的过切分，并形成最终的字符切分结果，因此，利用本发明实施例的方法和装置能够提高手写字符串识别的准确率。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的手写字符串的字符切分方法的流程图；

图2为汉字部件间的位置关系；

图3为本发明实施例使用外接矩形和可信度框的效果对比示例，其中a为使用外接矩形框的效果，b为使用可信度框的效果；

图4为本发明实施例使用外接矩形和可信度框进行字符切分效果对比示例，其中a为使用外接矩形框的字符切分效果，b为使用可信度框的字符切分效果；

图5为本发明实施例基于方向趋势进行字符切分的“合”区域和“分”区域示意图；

图6为本发明实施例的一个手写字符串可信度框的示例；

图7为对图6可信度框采用基于方向趋势进行字符切分得到字符块的示例；

图8为对图7字符块进行基于预定规则的合并得到字符块序列的示例；

图9和图10为另外两个手写字符串样本采用本发明实施例的手写字符串的字符切分方法进行字符切分的结果示意图；

图11为本发明实施例提供的手写字符串的字符切分装置的结构图；

图12为本发明实施例装置中字符切分单元的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明实施例的手写字符串的字符切分方法中，对获取的手写字符串的笔划信息，以笔划作为基本部件，首先计算每个基本部件的可信度框，然后对每个所述可信度框进行基于方向趋势的字符切分，得到一个字符块序列，最后对字符切分后的字符块进行基于预定规则的合并，并输出最终的字符切分结果。

通过上述技术方案可以看出，在本发明实施例的方法中，采用可信度框能够消除由于书写随意性出现的一些过长的笔划对计算外框的影响，避免在字符切分过程中出现过合并；对每个所述可信度框进行基于方向趋势的字符切分，能够按照相邻可信度框中心的方向偏转关系对可信度框进行合并，得到一系列的字符块；对字符切分后的字符块进行基于预定规则的合并，能够对上述较零散的字符块进一步的合并，可以有效地降低字符的过切分，并形成最终的字符切分结果，因此，利用本发明实施例的方法，能够以简单、有效的方式对手写字符串进行字符切分，得到一些可靠的候选切分点，这些候选切分点即可将整个待识别的手写字符串切分为一系列的字符块，作为下一步识别的有效输入，从而能够提高手写字符串识别的准确率。

以下结合具体的实施例详细描述上述技术方案的实现过程。

如图1所示，本发明实施例提供的手写字符串的字符切分方法包括：

步骤11，获取手写字符串的笔划信息。

本步骤是对手写字符串进行字符切分的基础，目的是为字符切分提供基本的操作部件。首先，本发明实施例所处理的样本需符合以下限制：

1)一个笔划不会同时属于一个以上字符，即连笔不会跨越两个字符，这里的笔划指的是在书写文字时，从落笔到抬笔之间笔尖所描绘的笔迹。

2)已经书写好的字符不会被后续的笔划修改。

3)每行字符从左到右书写。

4)所书写的各个字符大小基本一致。

这些限制与人们的日常书写习惯是一致的，在此列出这些限制，仅为明确本发明实施例是在符合这些日常书写习惯的前提下进行的。

在获取手写字符串的笔划信息过程中，可依据书写时从落笔到抬笔之间笔尖移动的轨迹的笔划定义，将用户输入的手写字符串(含中文、数字、标点、英文字母)划分为一个笔划串序列，这种笔划串含有笔划数目、笔划走向、笔顺和书写速度等信息，从而完成了对手写字符串笔划信息的提取。

步骤12，以所述笔划信息中的笔划作为基本部件，计算每个所述基本部件的可信度框。

在本发明实施例中，认为笔划是组成汉字的基本单位，也称为构成汉字的基本部件。部件与部件的组合可以构成新的部件或构成最终的文字，两个部件之间有如图2所示的位置关系，这些位置关系包括：上、下、左、右、左上、左下、右上、右下、包含、相切。

可信度框是在外接矩形的基础上，向内收缩，直到寻找到可信度较高的外框。该可信度框优于外接矩形的边框，能够更准确地描述每个基本部件的位置和形状信息。如图3所示的为手写汉字“又”分别使用外接矩形和可信度框的效果对比示例，其中a为使用外接矩形框的效果，b为使用可信度框的效果。

可信度框消除了由于书写随意性出现的一些过长的笔划对计算外框的影响。因为这些过长笔划会造成字符的外接矩形过大，此时如果以外接矩形描述包含该笔划的部件外框时，易使两个原本独立、但有粘连的字符合并在一起，造成过合并。而可信度框方案可以有效地避免由于某些笔划在自由书写时拉的过长造成的字符粘连，从而避免在手写字符串的字符切分过程中，出现过合并。如图4所示的为手写“账户”字符串分别使用外接矩形和可信度框进行字符切分效果对比示例，其中a为使用外接矩形框的字符切分效果，b为使用可信度框的字符切分效果。

可信度框的具体计算方式为：以基本部件的外接矩形为起始扫描线，向内收缩扫描。搜索终止的条件：所述基本部件上至少有两个点与该扫描线相交。

比如：对可信度框的左边缘而言，其计算方式为：以基本部件的外接矩形的左边框为起始扫描线，然后向右移动该扫描线，移动时以基本部件与扫描线的交点个数作为衡量是否继续向右移动扫描线的依据。当交点数大于等于2时，停止搜索，此时对应的分界线即为部件可信度框的左边缘。

当然，这里可能存在如下问题：对于简单笔画而言，上述方法将会造成边框的过分收缩，如：横、撇、捺等笔划，在搜索其可信度框时，由于达不到搜索终止条件：至少有两个距离相对较大的点与该扫描线相交，因此会造成可信度框的过分收缩。例如，计算笔划横的可信度框的左边缘时，按照上述方法将会出现搜索得到可信度框左边缘为笔划外接矩形的右边框，显然这并不是我们所期望的。为避免发生这种过分收缩的情况，必须在搜索前设定收缩的阈值，当达到此阈值时，即使尚未达到搜索停止的条件，也必须停止搜索，并将此阈值作为可信度框的一个边缘。

步骤13，对每个所述可信度框进行基于方向趋势的字符切分。

本步骤是以上述得到的每个可信度框为部件开始合并工作，从最左边的部件开始，根据部件的可信度框中心，寻找相邻部件中心之间的方向偏转角度，若该偏转角度在如图5所示的“分”区域，则这两个部件间将产生一个候选切分点，该切分点将前后相连的两个部件分开；若偏转角度在如图5所示的“合”区域，则应将后面的部件合并到前面的部件中，并更新合并后部件的可信度框。这就是基于方向趋势的字符切分，切分结果是获得一系列的候选切分点，这些候选切分点将待识别的手写字符串分为若干个字符块。

上述图5所示的“合”区域或“分”区域是基于统计的方法获取的。可以有以下两种具体统计结果：

统计结果一：在方向偏转角度大于等于90度且小于等于281度之间时，则属于“合”区域；在方向偏转角度大于281度或小于90度之间时，则属于“分”区域。

统计二：在方向偏转角度大于等于90度且小于等于290度之间时，则属于“合”区域；在方向偏转角度大于290度或小于90度之间时，则属于“分”区域。

基于方向趋势的字符切分方法的详细步骤描述如下：

1)以当前可信度框为基础，从左到右计算当前可信度框与其后面相邻可信度框各自的可信度框中心；

2)计算上述两个可信度框中心之间的方向偏转角度；

3.1)若方向偏转角度属于“合”区域，则将两个相邻可信度框中后面的可信度框合并到前一个可信度框中，并以合并后的可信度框作为当前可信度框，继续字符切分工作，即：若所有的可信度框已经操作完毕，则字符切分过程结束，否则，继续1)；

3.2)若方向偏转角度属于“分”区域，则将两个相邻可信度框分在不同的字符块中，即：进行切分操作，切分操作主要是在两个待分开的部件间插入一个候选切分点，该候选切分点和前一个候选切分点之间的部分即为一个切分出的字符块。而后，以所述两个相邻可信度框中后面的可信度框为当前可信度框，继续字符切分工作，即：若所有的可信度框已经操作完毕，则字符切分过程结束，否则，继续1)。

如图6所示，图6中标出的数字序号为按照书写顺序书写的各个笔划的可信度框，图中的手写字符串共有19个可信度框，折线为各个可信度框中心的连线，其中，折线上的圆点表示各个笔划的可信度框中心。图7为采用基于方向趋势进行字符切分得到的字符块。

步骤14，对字符切分后的字符块进行基于预定规则的合并，并输出最终的字符切分结果。

根据方向趋势进行的字符切分是基于统计的方法，仅是对手写字符串的初始切分，由于它仅仅将手写输入的文字看作一维数字序列，并没有充分考虑到汉字的结构信息。因此为提高字符切分准确率，本发明实施例在采用基于方向趋势的字符切分获得的字符块基础上，再根据笔划的位置关系，对字符切分后的字符块进行基于结构的规则合并，这个过程往往可以对步骤13的结果——比较零散的字符块进行进一步的合并，形成最终的字符切分结果。

如图7所示，基于方式趋势的字符切分能够将构成手写字符的笔划按照方向特征进行合并，最终形成一个字符块序列。但是，此时的字符块存在如下问题：候选切分点较多，过切分现象严重。

对于汉字而言，预定的合并规则可以为：如果部件与部件之间是上下、包含、交叉或后一部件位于当前部件的左边等情况时，往往应将两个部件合在一起，构成一个新的部件。因此，在基于方向趋势进行字符切分之后，还应根据汉字的结构信息进行部件合并，再最终输出手写字符串的候选切分点。如图8所示即为对图7进行预定规则合并得到字符块序列。显然，经过规则合并后的字符块，有效地降低了字符的过切分。

需要注意的是，字符切分是一个不可逆过程。因为对于手写字符串识别而言，字符切分是整个手写字符串识别工作的基础，字符切分得到的一系列字符块是字符识别的输入，通过对这些输入进行识别并寻找最优候选路径，从而得到最优的手写字符串识别结果。一旦在字符切分阶段出现了过合并(将属于不同字符的笔划合并到同一个字符块中)，后期将无法消除由此产生的错误，导致最终识别结果错误。因此，字符切分的基本原则是：在尽可能地降低过合并概率的前提下，对手写字符串进行字符切分。

整个手写字符串识别工作是以字符切分得到的一系列字符块为基元进行的，字符切分的目的是寻找手写字符串的一系列候选切分点，通过这些候选切分点将整个手写字符串切分为一个字符块序列，然后依据这个字符块序列进行手写字符串识别。识别系统会对这些所有基元及基元的组合进行识别，然后综合多种因素，比如：语义上下文等，寻找最优路径，作为整个手写字符串识别的结果。字符切分的优劣将对整个手写字符串识别产生两大重要影响：

a)识别率：过合并将对手写字符串识别结果产生不可逆转的错误；而过切分也会为手写字符串识别引入误识的风险。

b)识别速度：如果在字符切分阶段，获得的字符块过切分现象比较严重，如：极端情况下，单个笔划为一个字符块，则整个手写字符串识别花费的时间将以指数级增长。

图9、图10为另外两个手写字符串样本采用本发明实施例的手写字符串的字符切分方法进行字符切分的结果示意图。

如图11所示，基于上述的方法实施例，本发明实施例还提供了一种手写字符串的字符切分装置，包括：获取单元111，可信度框计算单元112，字符切分单元113，字符合并单元114以及输出单元115。

其中，所述笔划获取单111元，用于获取手写字符串的笔划信息；所述可信度框计算单元112，用于以所述获取单元获取的笔划信息中的笔划作为基本部件，计算每个基本部件的可信度框；所述字符切分单元113，用于对每个所述可信度框计算单元112计算的可信度框进行基于方向趋势的字符切分；所述字符合并单元114，用于对所述字符切分单元113切分后的字符块进行基于预定规则的合并；所述输出单元115，用于输出所述字符合并单元114最终的字符切分结果。

其中，所述可信度框计算单元112可具体用于以所述获取单元111获取的笔划信息中的笔划作为基本部件，以每个基本部件的外接矩形为起始扫描线，向内收缩扫描，直至所述基本部件上至少有两个点与该扫描线相交或者达到设定收缩阈值时，则停止搜索，此时对应的扫描线即为可信度框的外缘。所述字符合并单元114可具体用于根据笔划的位置关系对所述字符切分单元切分后的字符块进行规则合并。

进一步地，如图12所示，所述字符切分单元113可包括：中心计算模块1131，角度计算模块1132和切分模块1133。其中，

所述中心计算模块1131，用于以当前可信度框为基础，从左到右计算当前可信度框与其后面相邻可信度框各自的可信度框中心；

所述角度计算模块1132，用于计算所述中心计算模块1131得到的两个可信度框中心之间的方向偏转角度；

所述切分模块1133，用于根据所述角度计算模块1132得到的方向偏转角度对字符进行切分。

根据方向偏转角度对字符进行切分可以具体是，若方向偏转角度大于等于90度且小于等于281度之间时，则将两个相邻可信度框中后面的可信度框合并到前一个可信度框中，并以合并后的可信度框作为当前可信度框，继续字符切分工作；若方向偏转角度大于281度或小于90度之间时，则将两个相邻可信度框分在不同的字符块中，并以所述两个相邻可信度框中后面的可信度框为当前可信度框，继续字符切分工作。

根据方向偏转角度对字符进行切分也可以具体是，若方向偏转角度大于等于90度且小于等于290度之间时，则将两个相邻可信度框中后面的可信度框合并到前一个可信度框中，并以合并后的可信度框作为当前可信度框，继续字符切分工作；若方向偏转角度大于290度或小于90度之间时，则将两个相邻可信度框分在不同的字符块中，并以所述两个相邻可信度框中后面的可信度框为当前可信度框，继续字符切分工作。

由上可以看出，本发明实施例提供的手写字符串的字符切分装置，通过对获取单元111获取的手写字符串的笔划信息，以笔划作为基本部件，首先由可信度框计算单元112计算每个基本部件的可信度框，该可信度框是在外接矩形的基础上向内收缩得到，可以消除由于书写随意性出现的一些过长的笔划对计算外框的影响，从而避免在字符切分过程中出现过合并；然后由字符切分单元113对每个可信度框进行基于方向趋势的字符切分，能够按照相邻可信度框中心的方向偏转关系对可信度框进行合并，得到一系列的字符块；最后再根据笔划的位置关系，由字符合并单元114进行基于预定规则的合并，将上述较零散的字符块进一步的合并，能够有效地降低字符的过切分，并形成最终的字符切分结果由输出单元115进行输出。因此，利用本发明实施例的装置，能够提高手写字符串识别的准确率。

本领域普通技术人员可以理解，本发明实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。其中，上述提到的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory，ROM)或随机存储记忆体(Random Access Memory，RAM)等等。

上述具体实施例并不用以限制本发明，对于本技术领域的普通技术人员来说，凡在不脱离本发明原理的前提下，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种手写字符串的字符切分方法，其特征在于，包括：

获取手写字符串的笔划信息，所述笔划信息是指书写时从落笔到抬笔之间笔尖移动的轨迹；

对每个所述可信度框进行基于方向趋势的字符切分；

2.根据权利要求1所述的方法，其特征在于，所述获取手写字符串的笔划信息包括：

依据书写时从落笔到抬笔之间笔尖移动轨迹的笔划定义，将用户输入的手写字符串转换为一个笔划串序列。

3.根据权利要求2所述的方法，其特征在于，所述以所述笔划信息中的笔划作为基本部件，计算每个所述基本部件的可信度框包括：

以每个所述基本部件的外接矩形为起始扫描线，向内收缩扫描，直至所述基本部件上至少有两个点与该扫描线相交或者达到设定收缩阈值时，则停止搜索，此时对应的扫描线即为可信度框的外缘。

4.根据权利要求3所述的方法，其特征在于，对每个所述可信度框进行基于方向趋势的字符切分包括：

以当前可信度框为基础，从左到右计算当前可信度框与其后面相邻可信度框各自的可信度框中心；

计算所述两个可信度框中心之间的方向偏转角度；

根据所述方向偏转角度对字符进行切分。

5.根据权利要求4所述的方法，其特征在于，所述根据所述方向偏转角度对字符进行切分具体为：

若方向偏转角度大于等于90度且小于等于281度之间时，则将两个相邻可信度框中后面的可信度框合并到前一个可信度框中，并以合并后的可信度框作为当前可信度框，继续字符切分工作；

若方向偏转角度大于281度或小于90度之间时，则将两个相邻可信度框分在不同的字符块中，并以所述两个相邻可信度框中后面的可信度框为当前可信度框，继续字符切分工作。

6.根据权利要求4所述的方法，其特征在于，所述根据所述方向偏转角度对字符进行切分具体为：

若方向偏转角度大于等于90度且小于等于290度之间时，则将两个相邻可信度框中后面的可信度框合并到前一个可信度框中，并以合并后的可信度框作为当前可信度框，继续字符切分工作；

若方向偏转角度大于290度或小于90度之间时，则将两个相邻可信度框分在不同的字符决中，并以所述两个相邻可信度框中后面的可信度框为当前可信度框，继续字符切分工作。

7.根据权利要求1-6任一所述的方法，其特征在于，所述对字符切分后的字符块进行基于预定规则的合并包括：

根据笔划的位置关系对字符切分后的字符块进行规则合并。

8.根据权利要求7所述的方法，其特征在于，所述手写字符串包括中文、数字、标点、英文字母。

9.一种手写字符串的字符切分装置，其特征在于，包括：

获取单元，用于获取手写字符串的笔划信息，所述笔划信息是指书写时从落笔到抬笔之间笔尖移动的轨迹；

10.根据权利要求9所述的装置，其特征在于，所述可信度框计算单元具体用于以所述获取单元获取的笔划信息中的笔划作为基本部件，以每个基本部件的外接矩形为起始扫描线，向内收缩扫描，直至所述基本部件上至少有两个点与该扫描线相交或者达到设定收缩阈值时，则停止搜索，此时对应的扫描线即为可信度框的外缘。

11.根据权利要求10所述的装置，其特征在于，所述字符切分单元包括：

中心计算模块，用于以当前可信度框为基础，从左到右计算当前可信度框与其后面相邻可信度框各自的可信度框中心；

角度计算模块，用于计算所述中心计算模决得到的两个可信度框中心之间的方向偏转角度；

切分模块，用于根据所述角度计算模块得到的方向偏转角度对字符进行切分。