CN116612483A

CN116612483A - 一种智能笔手写矢量的识别方法及装置

Info

Publication number: CN116612483A
Application number: CN202310883745.6A
Authority: CN
Inventors: 徐丹; 白世亮
Original assignee: Guangzhou Hongtu Digital Technology Co ltd
Current assignee: Guangzhou Hongtu Digital Technology Co ltd
Priority date: 2023-07-19
Filing date: 2023-07-19
Publication date: 2023-08-18
Anticipated expiration: 2043-07-19
Also published as: CN116612483B

Abstract

本发明涉及矢量化后的手写字体识别技术领域，尤其涉及一种智能笔手写矢量的识别方法及装置,包括获取矢量化后的待识别文字；轮廓识别模块对待识别文字进行外部轮廓识别，并基于识别的外部轮廓得到第一识别目标；路径识别模块识别待识别文字的书写路径以得到第二识别目标；分解模块对第二识别目标中各文字进行拆解并计算拆解后对应部分的一致率，以确定待识别文字的识别部分和待确定部分；中控模块基于待确定部分文字轮廓的面积和待确定部分文字书写路径的长度计算待确定部分的识别复杂度以及第二识别目标中各文字对应的待确定部分的对比复杂度，基于对比复杂度与识别复杂度的误差确定待确定部分。

Description

一种智能笔手写矢量的识别方法及装置

技术领域

本发明涉及矢量化后的手写字体识别技术领域，尤其涉及一种智能笔手写矢量的识别方法及装置。

背景技术

随着社会对审美观念的提高，艺术字的应用越来越广泛，艺术字可以是手绘的艺术字，也可以是使用电脑绘制的独特字体；与设计感强的艺术字和流行文化紧密相连，与时代的发展也有密切关系；艺术字还是视觉传达与画面布局中重要的元素，它可以烘托气氛、突出重点，吸引观众目光，起到画龙点睛的效果等。目前，手绘的艺术字的矢量化的应用技术较为成熟，而手绘艺术字更能体现创意和美感，与其要表现的主题更为贴切，由此，对矢量化后的文字的识别的需求也日益提高，在实际应用中具有重要意义。

中国专利公开号：CN110287840B公开了一种手写图像识别方法，对数据集中随机选取数据进行预处理后送入BP神经网络进行训练，训练后BP神经网络对数据进行图像识别，以BP神经网络为核心，针对BP网络进行改进，在大大降低网络识别复杂度的同时还能增加其判别能力，从而大大增强了分类器的分辨能力，通过改进结构后的算法对手写数字进行识别，极大的降低由于人员经验不足与疏忽大意所造成的诊断失误，从而提高了检测的准确率，减少误判和漏判问题的发生。

然而，通过神经网络对手写字体进行识别存在以下缺陷：

1、依赖于神经网络的底层构建以及对神经网络的训练程度，而神经网络的底层构建以及对神经网络的训练程度受人为主观因素的影响较大，导致神经网络的识别精度有待提高；

2、神经网络的运算量相对较大，导致对手写字体的识别效率较低；

3、手写艺术字特异性较强，不适于神经网络识别的方法。

发明内容

为此，本发明提供一种智能笔手写矢量的识别方法及装置，用以克服现有技术中对矢量化后的文字的识别效率较低的问题。

为实现上述目的，一方面，本发明提供一种智能笔手写矢量的识别方法，包括：

步骤S1，文字获取模块获取并归一化处理矢量化后的待识别文字；

步骤S2，轮廓识别模块对所述待识别文字进行外部轮廓识别，并基于识别的外部轮廓与储存模块中储存的任一文字的相似度得到第一识别目标；

步骤S3，路径识别模块识别所述待识别文字的书写路径以计算与所述第一识别目标中各文字的书写路径的拟合度，得到第二识别目标，所述第二识别目标中的字体为所述第一识别目标中的字体中的一部分；

步骤S4，分解模块对所述第二识别目标中各文字进行拆解并计算拆解后对应部分的一致率，以确定所述待识别文字的识别部分和待确定部分；

步骤S5，中控模块基于待确定部分文字轮廓的面积和待确定部分文字书写路径的长度计算待确定部分的识别复杂度以及第二识别目标中各文字对应的待确定部分的对比复杂度，基于对比复杂度与所述识别复杂度的误差确定待确定部分。

进一步地，在所述步骤S2中，所述轮廓识别模块对所述待识别文字进行外部轮廓识别，计算识别的外部轮廓与储存模块中储存的任一文字的相似度，提取相似度大于95%的文字作为第一识别目标。

进一步地，在所述步骤S2中，所述轮廓识别模块统计所述第一识别目标中文字的数量，若该数量小于预设数量标准，则提取相似度大于90%的文字作为第一识别目标。

进一步地，在所述步骤S3中，所述路径识别模块对待识别文字的书写路径进行识别，并模拟所述第一识别目标中各文字的书写路径，将模拟的书写路径与待识别文字的书写路径进行拟合，计算拟合度，提取拟合度大于90%的字体以作为第二识别目标。

进一步地，在所述步骤S4中，所述分解模块根据字体的结构，对第二识别目标中各文字进行拆解，若各文字拆解后的对应的部分一致率大于一致率标准，则将该部分作为已识别部分，所述分解模块将一致率小于等于一致率标准的拆解部分作为待确定部分；

所述一致率R的计算方法为R=S/N；

其中，S为拆解后的对应的部分相同的数量，N为第二识别目标中字体的数量。

进一步地，在所述步骤S5中，对于所述待确定部分，所述中控模块通过归一化处理得到所述待识别文字规整后的坐标序列，在规整后的待识别文字中划分出待确定部分，对待确定部分中的图像进行捕捉，以得到待确定部分中的字体轮廓，基于坐标序列获取该待确定部分的字体轮廓面积。

进一步地，在所述步骤S5中，所述中控模块按照以下公式计算所述待确定部分的识别复杂度E；

其中，S为待确定部分文字轮廓的面积，L为待确定部分文字书写路径的长度，β为识别复杂度归一化参数。

进一步地，在所述步骤S5中，所述中控模块计算所述第二识别目标中各文字对应的待确定部分的对比复杂度，计算对比复杂度与所述识别复杂度的误差，选取误差最小值对应的字体的待确定部分作为待识别文字的待确定部分。

进一步地，在所述步骤S5中，若存在两个以上的误差值相同时，所述中控模块选取轮廓相似度较高值对应的文字，以该对应的文字对应的待确定部分作为待识别文字的待确定部分。

另一方面，本发明提供一种智能笔手写矢量的识别装置，包括：

文字获取模块，用以获取并归一化处理矢量化后的待识别文字；

轮廓识别模块，其与所述文字获取模块相连，用以对所述待识别文字进行外部轮廓识别，并基于识别的外部轮廓得到第一识别目标；

路径识别模块，其分别与所述文字获取模块和所述轮廓识别模块相连，用以识别所述待识别文字的书写路径以得到第二识别目标；

分解模块，其分别与所述文字获取模块和所述路径识别模块相连，用以对第二识别目标中各文字进行拆解并计算拆解后对应部分的一致率，以确定所述待识别文字的识别部分和待确定部分；

中控模块，其分别与所述文字获取模块、路径识别模块以及分解模块相连，用以基于待确定部分文字轮廓的面积和待确定部分文字书写路径的长度计算待确定部分的识别复杂度以及第二识别目标中各文字对应的待确定部分的对比复杂度，基于对比复杂度与所述识别复杂度的误差确定待确定部分。

与现有技术相比，本发明的有益效果在于，本发明通过识别矢量化后的待识别文字的轮廓，在储存模块中筛选出相似度符合标准的文字形成第一识别目标，通过初步的筛选，缩小了进一步识别的选择范围，在保证识别准确率的同时，提高了识别的效率；路径识别模块识别所述待识别文字的书写路径，以及第一识别目标中各文字的书写路径，通过书写路径拟合筛选出拟合度符合标准的文字形成第二识别目标，通过第二次筛选，进一步缩小了识别的选择范围，进而在保证识别准确率的同时，提高了识别的效率；分解模块通过对第二识别目标中各文字进行拆解，通过拆解的方式，将拆解后对应的部分进行单独对比以确定识别部分，由于拆解的动作仅限于第二识别目标中的文字，运算量较小，从而提高了运算速度，而通过拆解后各部分单独对比的方式，降低了整体文字的识别复杂度，从而提高了识别的准确性；对于一致率较低的部分，通过计算识别复杂度以进一步确认，进一步保证了识别的准确性。

进一步地，本发明通过待识别文字的外部轮廓选定第一识别目标，缩小了识别范围，在确定第一识别目标字体数量时，综合考虑运算量和识别的准确度，将相似度和文字数量共同作为确定第一识别目标的考量因素，在保证识别准确度的同时，提高了运算速度。

进一步地，本发明通过识别待识别文字的书写路径，以及模拟第一识别目标中各文字的书写路径，并对识别的书写路径进行拟合运算，从而在第一识别目标进一步缩小识别范围，确定第二识别目标，通过拟合书写路径，进一步提高了识别准确度。

进一步地，本发明通过将待识别文字进行拆解的方式进行分步识别，通过轮廓相似度和书写路径拟合的方式筛选出的第二识别目标中的文字，若拆解后对应的部分的一致率大于一致率标准，说明该对应部分的一致性较高，可将该部分作为已识别部分，通过以上分步识别的方式，降低了现有技术中将待识别文字作为一个整体进行识别的识别难度，进而提高了识别的准确度。

进一步地，本发明对于一致率小于等于一致率标准的拆解部分作为待确定部分，并对该待确定部分通过计算识别复杂度做进一步识别和确认，进而提高了识别的准确度。

进一步地，本发明通过将待识别文字进行归一化处理，使待识别文字与第二识别目标中的文字进行统一，分解模块通过捕捉待确定部分的文字的图像，并基于规整后的坐标序列获取该待确定部分的字体轮廓面积，由于采取了归一化处理，使该待确定部分的字体轮廓面积与第二识别目标中各文字对应的待确定部分的轮廓面积具有可比较性，因此通过归一化处理后，并以此计算的识别复杂度具有文字识别的实际意义。

附图说明

图1为本发明实施例智能笔手写矢量的识别方法的流程图；

图2为本发明实施例智能笔手写矢量的识别装置的结构框图。

具体实施方式

为了使本发明的目的和优点更加清楚明白，下面结合实施例对本发明作进一步描述；应当理解，此处所描述的具体实施例仅仅用于解释本发明，并不用于限定本发明。

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非在限制本发明的保护范围。

需要说明的是，在本发明的描述中，术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系，这仅仅是为了便于描述，而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，还需要说明的是，在本发明的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域技术人员而言，可根据具体情况理解上述术语在本发明中的具体含义。

请参阅图1所示，其为本发明实施例智能笔手写矢量的识别方法的流程图，本发明所述智能笔手写矢量的识别方法包括：

进行归一化处理的目的，是将待识别文字与储存模块中储存的文字进行格式统一，使待识别文字更为规整，便于处理和识别的操作。

具体而言，在所述步骤S2中，所述轮廓识别模块对所述待识别文字进行外部轮廓识别，计算识别的外部轮廓与储存模块中储存的任一文字的相似度，提取相似度大于95%的文字作为第一识别目标。

本实施例所述储存模块，可以是直接储存若干字体形态的文字，也可以是建立若干字体库，每个字体库均对应一种字体形态，在计算待识别文字的外部轮廓与储存模块中储存的任一文字的相似度时，可以首先将待识别文字的字体形态与字体库中的字体形态进行比对以确定最接近的字体形态，然后在最接近的字体形态对应的字体库中通过计算选定与待识别文字的外部轮廓相似度大于95%的字体作为第一识别目标，通过上述方案，可以减小系统运算量，提高识别效率。可以理解的是，本领域技术人员还可以通过遍历计算储存模块中任一文字的外部轮廓与待识别文字的外部轮廓的相似度以确定第一识别目标，该种方法，由于采用了遍历的计算方式，提高了识别准确度。

本发明通过待识别文字的外部轮廓选定第一识别目标，缩小了识别范围，在确定第一识别目标字体数量时，综合考虑运算量和识别的准确度，将相似度和文字数量共同作为确定第一识别目标的考量因素，在保证识别准确度的同时，提高了运算速度。

具体而言，在所述步骤S2中，所述轮廓识别模块统计所述第一识别目标中文字的数量，若该数量小于预设数量标准，则提取相似度大于90%的文字作为第一识别目标。

本实施例中的预设数量标准20-30，优选20-25，通过多次的实验数据得出，在选定相似度大于90%的字体中的20-30个文字作为第一识别目标时，准确度可达98%，在选定相似度大于90%的字体中的30-40个文字作为第一识别目标时，准确度可达98.5%，识别过程的运算时间需要增加20%，在选定相似度大于90%的字体中的10-20个文字作为第一识别目标时，准确度可达95%，识别过程的运算时间减少5%，在选定相似度大于85%的字体中的20-30个文字作为第一识别目标时，准确度可达93%，基于多次的实验数据，本实施例优选相似度大于90%的字体作为第一识别目标，当相似度大于95%的文字的数量满足标准时，优选相似度大于95%。

具体而言，在所述步骤S3中，所述路径识别模块对待识别文字的书写路径进行识别，并模拟所述第一识别目标中各文字的书写路径，将模拟的书写路径与待识别文字的书写路径进行拟合，计算拟合度，提取拟合度大于90%的字体以作为第二识别目标。

优选的，本实施例中拟合度的计算的方法可通过曲线拟合的方式进行计算，此为成熟的现有技术，此处不在赘述。

本发明通过识别待识别文字的书写路径，以及模拟第一识别目标中各文字的书写路径，并对识别的书写路径进行拟合运算，从而在第一识别目标进一步缩小识别范围，确定第二识别目标，通过拟合书写路径，进一步提高了识别准确度。

具体而言，在所述步骤S4中，所述分解模块根据字体的结构，对第二识别目标中各文字进行拆解，若各文字拆解后的对应的部分一致率大于一致率标准，则将该部分作为已识别部分，所述分解模块将一致率小于等于一致率标准的拆解部分作为待确定部分；

所述一致率R的计算方法为R=S/N；

本发明通过将待识别文字进行拆解的方式进行分步识别，通过轮廓相似度和书写路径拟合的方式筛选出的第二识别目标中的文字，若拆解后对应的部分的一致率大于一致率标准，说明该对应部分的一致性较高，可将该部分作为已识别部分，通过以上分步识别的方式，降低了现有技术中将待识别文字作为一个整体进行识别的识别难度，进而提高了识别的准确度。

本实施例在对文字进行拆解时，可通过对偏旁、部首、文字结构等文字组成的识别方法将文字拆解成若干部分，此为成熟的现有技术，在此不再赘述。

具体而言，在所述步骤S5中，对于所述待确定部分，所述中控模块通过归一化处理得到所述待识别文字规整后的坐标序列，在规整后的待识别文字中划分出待确定部分，对待确定部分中的图像进行捕捉，以得到待确定部分中的字体轮廓，基于坐标序列获取该待确定部分的字体轮廓面积。

本发明对于一致率小于等于一致率标准的拆解部分作为待确定部分，并对该待确定部分通过计算识别复杂度做进一步识别和确认，进而提高了识别的准确度。

本发明通过将待识别文字进行归一化处理，使待识别文字与第二识别目标中的文字进行统一，分解模块通过捕捉待确定部分的文字的图像，并基于规整后的坐标序列获取该待确定部分的字体轮廓面积，由于采取了归一化处理，使该待确定部分的字体轮廓面积与第二识别目标中各文字对应的待确定部分的轮廓面积具有可比较性，因此通过归一化处理后，并以此计算的识别复杂度具有文字识别的实际意义。

本实施例对待识别文字进行归一化处理的方法，可采用专利文献号CN101482920B一种手写字符识别方法及系统公开的待识别文字归一化处理方法。

具体而言，在所述步骤S5中，所述中控模块按照以下公式计算所述待确定部分的识别复杂度E；

具体而言，在所述步骤S5中，所述中控模块计算所述第二识别目标中各文字对应的待确定部分的对比复杂度，计算对比复杂度与所述识别复杂度的误差，选取误差最小值对应的字体的待确定部分作为待识别文字的待确定部分。

本实施例中，所述中控模块根据计算识别复杂度E的公式计算对比复杂度E0，在计算对比复杂度与所述识别复杂度的误差σ时，根据以下公式计算：

所述中控模块选取误差最小值对应的字体的待确定部分作为待识别文字的待确定部分。

具体而言，在所述步骤S5中，若存在两个以上的误差值相同时，所述中控模块选取轮廓相似度较高值对应的文字，以该对应的文字对应的待确定部分作为待识别文字的待确定部分。

本发明通过识别矢量化后的待识别文字的轮廓，在储存模块中筛选出相似度符合标准的文字形成第一识别目标，通过初步的筛选，缩小了进一步识别的选择范围，在保证识别准确率的同时，提高了识别的效率；路径识别模块识别所述待识别文字的书写路径，以及第一识别目标中各文字的书写路径，通过书写路径拟合筛选出拟合度符合标准的文字形成第二识别目标，通过第二次筛选，进一步缩小了识别的选择范围，进而在保证识别准确率的同时，提高了识别的效率；分解模块通过对第二识别目标中各文字进行拆解，通过拆解的方式，将拆解后对应的部分进行单独对比以确定识别部分，由于拆解的动作仅限于第二识别目标中的文字，运算量较小，从而提高了运算速度，而通过拆解后各部分单独对比的方式，降低了整体文字的识别复杂度，从而提高了识别的准确性；对于一致率较低的部分，通过计算识别复杂度以进一步确认，进一步保证了识别的准确性。

请参阅图2所示，其为本发明实施例智能笔手写矢量的识别装置的结构框图，本发明所述智能笔手写矢量的识别装置包括：

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

以上所述仅为本发明的优选实施例，并不用于限制本发明；对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种智能笔手写矢量的识别方法，其特征在于，包括：

2.根据权利要求1所述的智能笔手写矢量的识别方法，其特征在于，在所述步骤S2中，所述轮廓识别模块对所述待识别文字进行外部轮廓识别，计算识别的外部轮廓与储存模块中储存的任一文字的相似度，提取相似度大于95%的文字作为第一识别目标。

3.根据权利要求2所述的智能笔手写矢量的识别方法，其特征在于，在所述步骤S2中，所述轮廓识别模块统计所述第一识别目标中文字的数量，若该数量小于预设数量标准，则提取相似度大于90%的文字作为第一识别目标。

4.根据权利要求3所述的智能笔手写矢量的识别方法，其特征在于，在所述步骤S3中，所述路径识别模块对待识别文字的书写路径进行识别，并模拟所述第一识别目标中各文字的书写路径，将模拟的书写路径与待识别文字的书写路径进行拟合，计算拟合度，提取拟合度大于90%的字体以作为第二识别目标。

5.根据权利要求4所述的智能笔手写矢量的识别方法，其特征在于，在所述步骤S4中，所述分解模块根据字体的结构，对第二识别目标中各文字进行拆解，若各文字拆解后的对应的部分一致率大于一致率标准，则将该部分作为已识别部分，所述分解模块将一致率小于等于一致率标准的拆解部分作为待确定部分；所述一致率R的计算方法为R=S/N；其中，S为拆解后的对应的部分相同的数量，N为第二识别目标中字体的数量。

6.根据权利要求5所述的智能笔手写矢量的识别方法，其特征在于，在所述步骤S5中，对于所述待确定部分，所述中控模块通过归一化处理得到所述待识别文字规整后的坐标序列，在规整后的待识别文字中划分出待确定部分，对待确定部分中的图像进行捕捉，以得到待确定部分中的字体轮廓，基于坐标序列获取该待确定部分的字体轮廓面积。

7.根据权利要求6所述的智能笔手写矢量的识别方法，其特征在于，在所述步骤S5中，所述中控模块按照以下公式计算所述待确定部分的识别复杂度E；

8.根据权利要求7所述的智能笔手写矢量的识别方法，其特征在于，在所述步骤S5中，所述中控模块计算所述第二识别目标中各文字对应的待确定部分的对比复杂度，计算对比复杂度与所述识别复杂度的误差，选取误差最小值对应的字体的待确定部分作为待识别文字的待确定部分。

9.根据权利要求8所述的智能笔手写矢量的识别方法，其特征在于，在所述步骤S5中，若存在两个以上的误差值相同时，所述中控模块选取轮廓相似度较高值对应的文字，以该对应的文字对应的待确定部分作为待识别文字的待确定部分。

10.一种应用权利要求1-9任一项所述方法的装置，其特征在于，