CN116597458B

CN116597458B - 一种手写字母识别方法、系统和应用

Info

Publication number: CN116597458B
Application number: CN202310864141.7A
Authority: CN
Inventors: 陈德忠; 黄阿信
Original assignee: Xiamen Dachenxin Education Technology Co ltd
Current assignee: Xiamen Dachenxin Education Technology Co ltd
Priority date: 2023-07-14
Filing date: 2023-07-14
Publication date: 2023-09-08
Anticipated expiration: 2043-07-14
Also published as: CN116597458A

Abstract

本发明提供一种手写字母识别方法、系统和应用，其方法包括：获取笔迹数据、将笔迹时空展开、字符块抽取、创建模板和字母识别。本发明采集的笔迹数据不仅包括空间坐标，还包括其时间信息，从而形成三维的笔迹数据，再结合空间切分和时空切分，能够将相互重叠的字符进行划分，同时将被划掉的字符剔除，从而能够获取准确的字符块，再通过最后的识别，即可获得准确率较高的识别结果。

Description

一种手写字母识别方法、系统和应用

技术领域

本发明涉及文字识别技术领域，尤其涉及一种手写字母识别方法。

背景技术

字符识别技术分联机识别和脱机识别，联机识别是基于笔画轨迹的数据识别算法，脱机识别是基于图像数据的识别算法，如OCR技术属于脱机识别方法。手写输入法采用的技术是联机识别方法，联机手写的数据具有时间和空间的信息，而脱机识别只有空间的信息，信息维度的增加有利于识别算法的实现，所以联机手写识别相对于脱机手写识别在技术实现上更简单，也更准确。

手写输入识别的应用场景很广，例如教学场景中，可应用手写输入识别及时反馈学生对选择题的选择，老师能够马上获取所有学生的答题情况和计分情况，或者是在一些问卷调查过程中，通过手写输入识别技术，能够及时将填写人员的问卷填写情况及时地识别并汇入所有的样本数据中。

上述的场景中，主要是针对小范围字母的识别，看似简单，实则不然，小范围字母识别，经常存在单个字符或者多个字符连笔快速书写的问题，也存在字符重叠，甚至还存在涂改字母的情况，均会造成字符识别不正确的问题，为此，本发明提出一种手写字母识别方法，通过提高手写输入识别的正确率，让其成为稳定可靠的手写识别工具。

发明内容

本发明实施例提供一种手写字母识别方法，能够更加准确地识别手写字母。

第一方面，提供一种手写字母识别方法，包括：

获取笔迹数据：所述笔迹数据是三维数据，包括书写轨迹的空间坐标和时间，其中，所述空间坐标为X和Y。

将笔迹时空展开：建立笔迹的X与时间、Y与时间的关系，将笔迹划分成两条独立的时空曲线，分别是X-T时空曲线和Y-T时空曲线。

字符块抽取：根据空间分布（空间间隔）初步划分字符块，初步划分后，判断字符块中是否存在重叠字符，若有，则再根据空间分布的重叠程度判断重叠字符是否存在涂改情况，若存在涂改情况，表示涂改情况重叠的字符是被书写人员涂改掉的，不是想要的输入，则剔除涂改情况所在的字符块，再判断并去除标点和其它异常笔画，最后得到需要识别的字符块。

创建模板：收集样本并训练，获取识别模板。

字母识别：将字符块中字符的笔迹数据与模板库中的字符轨迹数据对比并识别出对应的字母。

本发明采集的笔迹数据不仅包括空间坐标，还包括其时间信息，从而形成三维的笔迹数据，再结合空间切分和时空切分，能够将相互重叠的字符进行划分，同时将被划掉的字符剔除，从而能够获取准确的字符块，再通过最后的识别，即可获得准确率较高的识别结果。

优选的，笔迹数据是以距离长短不一的坐标点按出现时间为序来存储的，主要原因是书写过程有急有缓，数据采集也会出现丢失数据的问题，为了让笔迹数据可以进行相关性分析，在进行数据比较之前需要对数据分布进行归一化，让数据点尽可能均匀分布（由于精度的原因，算法很难做到两点之间等距），并且保证所有字符的轨迹点数量一样（两组轨迹点进行相关性分析时，需要具备这样的条件：轨迹点数量要一致，两组轨迹点需要成对出现），对笔迹数据进行轨迹点分布均匀化处理方法为：以笔画为单位，计算出单个笔画轨迹长度，用固定的轨迹点数按等距分布在轨迹上。

优选的，为了稳定识别过程中的参数，需对笔迹数据进行字符大小归一化处理：把轨迹坐标数据（X，Y）分别减去X和Y的最小值，使得所有的笔迹数据都对齐于原点（0，0）坐标，获取对齐后的坐标X和Y的最大值，再计算出X和Y的最大值要分别缩放至64和96时的比例，最后把所有坐标值按该比例系数进行缩放。

优选的，根据空间分布划分出的字符块中，计算相邻笔画之间的时间间隔，若时间间隔大于预设值，则判断为存在重叠字符，并将存在重叠问题的字符块进一步划分，从而将重叠写在一起的字符划分开来。

优选的，字母识别过程中，计算字符相似度时，相似度越小的笔画所占权重越大。

优选的，把相似度最小和次小的笔画时空展开曲线作为字符相似度计算参数，字符相似度=最小的笔画相似度 × 次小的笔画相似度。

优选的，计算笔画的相似度时，需提取笔画结构特征值。所述笔画结构特征值的提取方法：找出时空曲线中的凹凸点位置，其凹凸的深度为凹凸特征值，深度用凹凸中最短一侧的轨迹点数来表示，凹凸特征值为笔画结构特征值。笔画相似度 = （（皮尔逊相关性系数+1）/ 2）×（凹特征值/32）×（凸特征值/32）。

优选的，样本训练时，采用空间思维，利用字符相似度表示样本的空间距离，以形成不同的字母样本空间。为了减少模板的占用空间，筛选样本，尽量保留字母样本空间边缘的样本，形成识别模板集。

优选的，样本训练步骤包括：

S10: 对训练样本进行归集，把相同字母的样本放在同一个目录下；

S20: 运行训练程序，先对相同字母的样本进行聚类，聚类方法是利用相似度计算，去除相似度大于90%的样本，把剩下的样本归集为识别模板集；

S30: 利用步骤S20获取的识别模板对步骤S20中被去除的样本进行识别，把无法被正确识别的样本归入到识别模板库，循环该步骤，直至被去除的样本都可以被正确识别；

S40：把以上步骤中生成的模板文件复制到识别程序指定的目录中以被分类器算法使用。

第二方面，提供一种手写字母识别系统，包括：

数据采集模块，用于获取笔迹数据。

数据处理模块，将笔迹时空展开，建立笔迹的X与时间、Y与时间的关系，将笔迹划分成两条曲线，分别是X-T时空曲线和Y-T时空曲线。根据空间分布划分字符块，判断字符块中是否存在重叠字符，并根据空间分布的重叠程度判断重叠字符是否存在涂改情况，若存在涂改情况，则剔除涂改情况所在的字符块。收集样本并训练，获取识别模板。将字符块中字符的笔迹数据与模板库中的字符模板对比并识别出对应的字母。

第三方面，提出一种手写字母识别设备，包括：存储器、处理器。所述存储器上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如第一方面所述的手写字母识别方法。

第四方面，发明实施例提供了一种非暂时性机器可读存储介质，所述非暂时性机器可读存储介质上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器至少可以实现第一方面中的手写字母识别方法。

在本发明实施例中，给出了一种手写字母识别方法、系统和应用，具有以下有益效果：

本发明采集的笔迹数据不仅包括空间坐标，还包括其时间信息，从而形成三维的笔迹数据，再对笔迹数据进行时空展开，时空展开后可以得到两条曲线，后续算法模块主要是根据这样的曲线进行分析和识别，识别精度较高；

结合空间切分和时空切分，能够将相互重叠的字符进行划分，同时将被划掉的字符剔除，从而能够获取准确的字符块，再通过最后的识别，即可获得准确率较高的识别结果；

采用轨迹点之间等距离的方法实现笔迹数据的空间分布均匀化，并把字符大小归一化至64ⅹ96大小，从而使得笔迹数据可以进行相关性分析；

把皮尔逊相关性系数缩放至0~1的区间，使得多个系数可以进行联合计算；

采用统计识别和结构识别相结合的方法，使得分类器能够对易混淆的字母能很好地区分出来（其中，统计识别是指利用统计分析的方法进行识别，如相关性分析，结构识别是指利用结构特征进行识别，如凹凸的特征）；

利用高维度数据的空间分布特点进行样本数据训练，使得识别模板在空间分布上尽量处于空间分布的边缘，处于边缘内的同类字符模板之间的距离保持在一定范围内，从而减少匹配模板的数量。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

其中：

图1为手写字母D的示意图；

图2表示手写字母D的X-T时空曲线和Y-T时空曲线；

图3是手写字母A的X-T时空曲线和Y-T时空曲线；

图4是轨迹点分布均匀化的示意图；

图5是样本数据训练方法流程示意图；

图6是识别算法主流程的示意图；

图7表示的是一些可识别的复杂情况示意图；

图8表示的是可识别的掉笔不是很严重的字符示意图；

图9表示的是可被分割出的重叠和粘连的字符示意图；

图10表示的是可以识别并排除的无关笔画示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义，“多种”一般包含至少两种。

取决于语境，如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测（陈述的条件或事件）”可以被解释成为“当确定时”或“响应于确定”或“当检测（陈述的条件或事件）时”或“响应于检测（陈述的条件或事件）”。

手写输入识别的应用场景很广，例如教学场景中，可应用手写输入识别及时反馈学生对选择题的选择，老师能够马上获取所有学生的答题情况和计分情况，或者是在一些问卷调查过程中，通过手写输入识别技术，能够及时将填写人员的问卷填写情况及时地识别并汇入所有的样本数据中。上述的场景中，主要是针对小范围字母的识别，看似简单，实则不然，小范围字母识别，经常存在单个字符或者多个字符连笔快速书写的问题，也存在字符重叠，甚至还存在涂改字母的情况，均会造成字符识别不正确的问题，为此，本发明提出一种手写字母识别方法，通过采集三维的笔迹数据，再结合空间切分和时空切分，能够将相互重叠的字符进行划分，同时将被划掉的字符剔除，从而能够获取准确的字符块，再通过最后的识别，即可获得准确率较高的识别结果。

本发明的方法、系统、设备和介质的实现原理相似，此处不再赘述。

在介绍了本发明的基本原理之后，下面具体介绍本发明的各种非限制性实施方式，要注意的是，本发明提供的实施例仅是为了便于理解本发明的精神和原理而示出，本发明的实施方式在此方面不受任何限制。相反，本发明的实施方式可以应用于适用的任何系统。

实施例

一种手写字母识别方法，包括：

获取笔迹数据：所述笔迹数据是三维数据，包括书写轨迹的空间坐标和时间，其中，所述空间坐标为X和Y。在一实施例中，可以采用带有识别OID码功能的智能笔进行书写，从而能够获取笔迹数据。

对于时空曲线，可以参看图1和图2，图1为手写字母D，图2表示手写字母D的X-T时空曲线和Y-T时空曲线。又或者，可以参考图3，图3为手写字母A（一笔写成，没有采用正确的书写顺序，如图4的写法，也将其加入样本中）的X-T时空曲线和Y-T时空曲线。

在一实施例中，时空展开前，对笔迹数据进行预处理，归一化处理，从而使得笔迹数据可以进行相关性分析。预处理包括两个，分别是轨迹点分布均匀化和字符大小归一化。具体如下：

笔迹数据是以距离长短不一的坐标点按出现时间为序来存储的，主要原因是书写过程有急有缓，数据采集也会出现丢失数据的问题，所以在进行数据比较之前需要对数据分布进行归一化，让数据点尽可能均匀分布（由于精度的原因，算法很难做到两点之间等距），可参阅图4，对笔迹数据进行轨迹点分布均匀化处理方法为：以笔画为单位，计算出单个笔画轨迹长度，用固定的轨迹点数按等距分布在轨迹上。

为了稳定识别过程中的参数值，需对笔迹数据进行字符大小归一化处理：把轨迹坐标数据（X，Y）分别减去X和Y的最小值，使得所有的笔迹数据都对齐于原点（0，0）坐标，获取对齐后的坐标X和Y的最大值，再计算出X和Y的最大值要分别缩放至64和96时的比例，最后把所有坐标值按该比例系数进行缩放。

字符块抽取：根据空间分布（空间间隔）初步划分字符块，初步划分后，判断字符块中是否存在重叠字符，若有，则再根据空间分布的重叠程度判断重叠字符是否存在涂改情况，若存在涂改情况，表示涂改情况重叠的字符是被书写人员涂改掉的，不是想要的输入，则剔除涂改情况所在的字符块，再判断并去除标点和其它异常笔画，最后得到需要识别的字符块。这里的重叠程度用重叠程度值表示，当字符之间的重叠程度值大于预设值（比如30%，当然，也可以是其它数值，均在本申请的保护范围内）时，则判断出现涂改情况，在一实施例中，重叠程度值=两字符之间重叠写在一起的面积/两个字符之中的最大面积。

在一实施例中，根据空间分布划分出的字符块中，计算相邻笔画之间的时间间隔，若时间间隔大于预设值（700ms），则判断为存在重叠字符，并将存在重叠问题的字符块进一步划分，从而将重叠写在一起的字符划分开来。

创建模板：收集样本并训练，获取识别模板。

在一实施例中，样本训练时，采用空间思维，利用字符相似度表示样本的空间距离，以形成不同的字母样本空间。为了减少模板的占用空间，筛选样本，尽量保留字母样本空间边缘的样本，形成识别模板集，样本训练步骤可以包括：

在一实施例中，具体的样本训练流程包括如图5所述距离计算流程：循环遍历每个字母集i、循环遍历其它字母集j、循环遍历字母集i所有样本、计算字母i样本与已学习字母i样本的最小距离d1、计算字母i样本与字母j样本的最小距离d2、如果d1大于d2,则把样本归入到已学习样本集中、退出。

字母识别：将字符块中字符的笔迹数据与模板库中的字符模板对比并识别出对应的字母。

在一实施例，字母识别过程中，计算字符相似度时，相似度越小的笔画所占权重越大，比如，把相似度最小和次小的笔画时空展开曲线作为字符相似度计算参数，字符相似度=最小的笔画相似度 × 次小的笔画相似度。而计算笔画的相似度时，需提取笔画结构特征值。所述笔画结构特征值的提取方法：找出时空曲线中的凹凸点位置，其凹凸的深度为凹凸特征值，深度用凹凸中最短一侧的轨迹点数来表示，凹凸特征值为笔画结构特征值。笔画相似度 = （（皮尔逊相关性系数+1）/ 2）×（凹特征值/32）×（凸特征值/32）。

以下是采用发明实施例提供的字母识别方法，如图6，具体包括系统初始化、识别块抽取、字符块识别、识别结果后处理和输出识别结果。本实施例对21718个手写大写字母样本“ABCD”进行识别测试，识别准确率达到了95%，平均识别时间为0.7ms，并且对图7所示这些情况的复杂数据具备较好的识别能力，另外，对于掉笔不是很严重的字符，也可以正常识别，如图8所示的，可以分割出重叠和粘连的字符，如图9所示的，可以排除无关笔画，如图10所示的。

实施例

一种手写字母识别系统，包括：

数据采集模块，用于获取笔迹数据。

数据处理模块，将笔迹时空展开，建立笔迹的X与时间、Y与时间的关系，将笔迹划分成两条曲线，分别是X-T时空曲线和Y-T时空曲线。根据空间分布划分字符块，判断字符块中是否存在重叠字符，再根据空间分布的重叠程度判断重叠字符是否存在涂改情况，若存在涂改情况，则剔除涂改情况所在的字符块。收集样本并训练，获取识别模板。将字符块中字符的笔迹数据与模板库中的字符模板对比并识别出对应的字母。

实施例

一种手写字母识别设备，包括：存储器、处理器。所述存储器上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如实施例一所述的手写字母识别方法。

实施例

一种非暂时性机器可读存储介质，所述非暂时性机器可读存储介质上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器至少可以实现实施例一中的手写字母识别方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种手写字母识别方法，其特征在于，包括：

获取笔迹数据：所述笔迹数据是三维数据，包括书写轨迹的空间坐标和时间；所述空间坐标为X和Y；

将笔迹时空展开：建立笔迹的X与时间、Y与时间的关系，将笔迹划分成两条曲线，分别是X-T时空曲线和Y-T时空曲线；对笔迹数据进行字符大小归一化处理：把轨迹坐标数据（X，Y）分别减去X和Y的最小值，使得所有的笔迹数据都对齐于原点（0，0）坐标，获取对齐后的坐标X和Y的最大值，再计算出X和Y的最大值要分别缩放至64和96时的比例，最后把所有坐标值按该比例系数进行缩放；

字符块抽取：根据空间分布初步划分字符块后，利用书写时间间隔判断字符块中是否存在重叠字符，并根据空间分布的重叠程度判断重叠字符是否存在涂改情况，若存在涂改情况，则剔除涂改情况所在的字符块，获取最后待识别的字符块；

创建模板：收集样本并训练，获取识别模板；

字母识别：将字符块中字符的笔迹数据与模板库中的字符模板对比并识别出对应的字母；字母识别过程中，计算字符相似度时，相似度越小的笔画所占权重越大；把相似度最小和次小的笔画时空展开曲线作为字符相似度计算参数，字符相似度=最小的笔画相似度 ×次小的笔画相似度；计算笔画的相似度时，需提取笔画结构特征值；所述笔画结构特征值的提取方法：找出时空曲线中的凹凸点位置，其凹凸的深度为凹凸特征值，深度用凹凸中最短一侧的轨迹点数来表示，凹凸特征值为笔画结构特征值；笔画相似度 = （（皮尔逊相关性系数+1）/ 2）×（凹特征值/32）×（凸特征值/32）；样本训练时，采用空间思维，利用字符相似度表示样本的空间距离，以形成不同的字母样本空间；筛选样本，保留字母样本空间边缘的样本，形成识别模板集；样本训练步骤包括：

2.据权利要求1所述的一种手写字母识别方法，其特征在于，对笔迹数据进行轨迹点分布均匀化处理：以笔画为单位，计算出单个笔画轨迹长度，用固定的轨迹点数按等距分布在轨迹上。

3.根据权利要求1所述的一种手写字母识别方法，其特征在于，根据空间分布划分出的字符块中，计算相邻笔画之间的时间间隔，若时间间隔大于预设值，则判断为存在重叠字符，并将存在重叠问题的字符块进一步划分。

4.一种手写字母识别系统，所述系统应用于权利要求1所述的一种手写字母识别方法，其特征在于，包括：

数据采集模块，用于获取笔迹数据；

数据处理模块，将笔迹时空展开，建立笔迹的X与时间、Y与时间的关系，将笔迹划分成两条曲线，分别是X-T时空曲线和Y-T时空曲线；根据空间分布划分字符块，判断字符块中是否存在重叠字符，并根据空间分布的重叠程度判断重叠字符是否存在涂改情况，若存在涂改情况，则剔除涂改情况所在的字符块；收集样本并训练，获取识别模板；将字符块中字符的笔迹数据与模板库中的字符模板对比并识别出对应的字母。