CN116612483A - 一种智能笔手写矢量的识别方法及装置 - Google Patents
一种智能笔手写矢量的识别方法及装置 Download PDFInfo
- Publication number
- CN116612483A CN116612483A CN202310883745.6A CN202310883745A CN116612483A CN 116612483 A CN116612483 A CN 116612483A CN 202310883745 A CN202310883745 A CN 202310883745A CN 116612483 A CN116612483 A CN 116612483A
- Authority
- CN
- China
- Prior art keywords
- recognition
- character
- determined
- module
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 239000013598 vector Substances 0.000 title claims abstract description 21
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 27
- 239000000284 extract Substances 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 description 11
- 238000012216 screening Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
- G06V30/19013—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
- G06V30/1902—Shifting or otherwise transforming the patterns to accommodate for positional errors
- G06V30/19027—Matching of contours
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
- G06V30/19093—Proximity measures, i.e. similarity or distance measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
本发明涉及矢量化后的手写字体识别技术领域,尤其涉及一种智能笔手写矢量的识别方法及装置,包括获取矢量化后的待识别文字;轮廓识别模块对待识别文字进行外部轮廓识别,并基于识别的外部轮廓得到第一识别目标;路径识别模块识别待识别文字的书写路径以得到第二识别目标;分解模块对第二识别目标中各文字进行拆解并计算拆解后对应部分的一致率,以确定待识别文字的识别部分和待确定部分;中控模块基于待确定部分文字轮廓的面积和待确定部分文字书写路径的长度计算待确定部分的识别复杂度以及第二识别目标中各文字对应的待确定部分的对比复杂度,基于对比复杂度与识别复杂度的误差确定待确定部分。
Description
技术领域
本发明涉及矢量化后的手写字体识别技术领域,尤其涉及一种智能笔手写矢量的识别方法及装置。
背景技术
随着社会对审美观念的提高,艺术字的应用越来越广泛,艺术字可以是手绘的艺术字,也可以是使用电脑绘制的独特字体;与设计感强的艺术字和流行文化紧密相连,与时代的发展也有密切关系;艺术字还是视觉传达与画面布局中重要的元素,它可以烘托气氛、突出重点,吸引观众目光,起到画龙点睛的效果等。目前,手绘的艺术字的矢量化的应用技术较为成熟,而手绘艺术字更能体现创意和美感,与其要表现的主题更为贴切,由此,对矢量化后的文字的识别的需求也日益提高,在实际应用中具有重要意义。
中国专利公开号:CN110287840B公开了一种手写图像识别方法,对数据集中随机选取数据进行预处理后送入BP神经网络进行训练,训练后BP神经网络对数据进行图像识别,以BP神经网络为核心,针对BP网络进行改进,在大大降低网络识别复杂度的同时还能增加其判别能力,从而大大增强了分类器的分辨能力,通过改进结构后的算法对手写数字进行识别,极大的降低由于人员经验不足与疏忽大意所造成的诊断失误,从而提高了检测的准确率,减少误判和漏判问题的发生。
然而,通过神经网络对手写字体进行识别存在以下缺陷:
1、依赖于神经网络的底层构建以及对神经网络的训练程度,而神经网络的底层构建以及对神经网络的训练程度受人为主观因素的影响较大,导致神经网络的识别精度有待提高;
2、神经网络的运算量相对较大,导致对手写字体的识别效率较低;
3、手写艺术字特异性较强,不适于神经网络识别的方法。
发明内容
为此,本发明提供一种智能笔手写矢量的识别方法及装置,用以克服现有技术中对矢量化后的文字的识别效率较低的问题。
为实现上述目的,一方面,本发明提供一种智能笔手写矢量的识别方法,包括:
步骤S1,文字获取模块获取并归一化处理矢量化后的待识别文字;
步骤S2,轮廓识别模块对所述待识别文字进行外部轮廓识别,并基于识别的外部轮廓与储存模块中储存的任一文字的相似度得到第一识别目标;
步骤S3,路径识别模块识别所述待识别文字的书写路径以计算与所述第一识别目标中各文字的书写路径的拟合度,得到第二识别目标,所述第二识别目标中的字体为所述第一识别目标中的字体中的一部分;
步骤S4,分解模块对所述第二识别目标中各文字进行拆解并计算拆解后对应部分的一致率,以确定所述待识别文字的识别部分和待确定部分;
步骤S5,中控模块基于待确定部分文字轮廓的面积和待确定部分文字书写路径的长度计算待确定部分的识别复杂度以及第二识别目标中各文字对应的待确定部分的对比复杂度,基于对比复杂度与所述识别复杂度的误差确定待确定部分。
进一步地,在所述步骤S2中,所述轮廓识别模块对所述待识别文字进行外部轮廓识别,计算识别的外部轮廓与储存模块中储存的任一文字的相似度,提取相似度大于95%的文字作为第一识别目标。
进一步地,在所述步骤S2中,所述轮廓识别模块统计所述第一识别目标中文字的数量,若该数量小于预设数量标准,则提取相似度大于90%的文字作为第一识别目标。
进一步地,在所述步骤S3中,所述路径识别模块对待识别文字的书写路径进行识别,并模拟所述第一识别目标中各文字的书写路径,将模拟的书写路径与待识别文字的书写路径进行拟合,计算拟合度,提取拟合度大于90%的字体以作为第二识别目标。
进一步地,在所述步骤S4中,所述分解模块根据字体的结构,对第二识别目标中各文字进行拆解,若各文字拆解后的对应的部分一致率大于一致率标准,则将该部分作为已识别部分,所述分解模块将一致率小于等于一致率标准的拆解部分作为待确定部分;
所述一致率R的计算方法为R=S/N;
其中,S为拆解后的对应的部分相同的数量,N为第二识别目标中字体的数量。
进一步地,在所述步骤S5中,对于所述待确定部分,所述中控模块通过归一化处理得到所述待识别文字规整后的坐标序列,在规整后的待识别文字中划分出待确定部分,对待确定部分中的图像进行捕捉,以得到待确定部分中的字体轮廓,基于坐标序列获取该待确定部分的字体轮廓面积。
进一步地,在所述步骤S5中,所述中控模块按照以下公式计算所述待确定部分的识别复杂度E;
其中,S为待确定部分文字轮廓的面积,L为待确定部分文字书写路径的长度,β为识别复杂度归一化参数。
进一步地,在所述步骤S5中,所述中控模块计算所述第二识别目标中各文字对应的待确定部分的对比复杂度,计算对比复杂度与所述识别复杂度的误差,选取误差最小值对应的字体的待确定部分作为待识别文字的待确定部分。
进一步地,在所述步骤S5中,若存在两个以上的误差值相同时,所述中控模块选取轮廓相似度较高值对应的文字,以该对应的文字对应的待确定部分作为待识别文字的待确定部分。
另一方面,本发明提供一种智能笔手写矢量的识别装置,包括:
文字获取模块,用以获取并归一化处理矢量化后的待识别文字;
轮廓识别模块,其与所述文字获取模块相连,用以对所述待识别文字进行外部轮廓识别,并基于识别的外部轮廓得到第一识别目标;
路径识别模块,其分别与所述文字获取模块和所述轮廓识别模块相连,用以识别所述待识别文字的书写路径以得到第二识别目标;
分解模块,其分别与所述文字获取模块和所述路径识别模块相连,用以对第二识别目标中各文字进行拆解并计算拆解后对应部分的一致率,以确定所述待识别文字的识别部分和待确定部分;
中控模块,其分别与所述文字获取模块、路径识别模块以及分解模块相连,用以基于待确定部分文字轮廓的面积和待确定部分文字书写路径的长度计算待确定部分的识别复杂度以及第二识别目标中各文字对应的待确定部分的对比复杂度,基于对比复杂度与所述识别复杂度的误差确定待确定部分。
与现有技术相比,本发明的有益效果在于,本发明通过识别矢量化后的待识别文字的轮廓,在储存模块中筛选出相似度符合标准的文字形成第一识别目标,通过初步的筛选,缩小了进一步识别的选择范围,在保证识别准确率的同时,提高了识别的效率;路径识别模块识别所述待识别文字的书写路径,以及第一识别目标中各文字的书写路径,通过书写路径拟合筛选出拟合度符合标准的文字形成第二识别目标,通过第二次筛选,进一步缩小了识别的选择范围,进而在保证识别准确率的同时,提高了识别的效率;分解模块通过对第二识别目标中各文字进行拆解,通过拆解的方式,将拆解后对应的部分进行单独对比以确定识别部分,由于拆解的动作仅限于第二识别目标中的文字,运算量较小,从而提高了运算速度,而通过拆解后各部分单独对比的方式,降低了整体文字的识别复杂度,从而提高了识别的准确性;对于一致率较低的部分,通过计算识别复杂度以进一步确认,进一步保证了识别的准确性。
进一步地,本发明通过待识别文字的外部轮廓选定第一识别目标,缩小了识别范围,在确定第一识别目标字体数量时,综合考虑运算量和识别的准确度,将相似度和文字数量共同作为确定第一识别目标的考量因素,在保证识别准确度的同时,提高了运算速度。
进一步地,本发明通过识别待识别文字的书写路径,以及模拟第一识别目标中各文字的书写路径,并对识别的书写路径进行拟合运算,从而在第一识别目标进一步缩小识别范围,确定第二识别目标,通过拟合书写路径,进一步提高了识别准确度。
进一步地,本发明通过将待识别文字进行拆解的方式进行分步识别,通过轮廓相似度和书写路径拟合的方式筛选出的第二识别目标中的文字,若拆解后对应的部分的一致率大于一致率标准,说明该对应部分的一致性较高,可将该部分作为已识别部分,通过以上分步识别的方式,降低了现有技术中将待识别文字作为一个整体进行识别的识别难度,进而提高了识别的准确度。
进一步地,本发明对于一致率小于等于一致率标准的拆解部分作为待确定部分,并对该待确定部分通过计算识别复杂度做进一步识别和确认,进而提高了识别的准确度。
进一步地,本发明通过将待识别文字进行归一化处理,使待识别文字与第二识别目标中的文字进行统一,分解模块通过捕捉待确定部分的文字的图像,并基于规整后的坐标序列获取该待确定部分的字体轮廓面积,由于采取了归一化处理,使该待确定部分的字体轮廓面积与第二识别目标中各文字对应的待确定部分的轮廓面积具有可比较性,因此通过归一化处理后,并以此计算的识别复杂度具有文字识别的实际意义。
附图说明
图1为本发明实施例智能笔手写矢量的识别方法的流程图;
图2为本发明实施例智能笔手写矢量的识别装置的结构框图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1所示,其为本发明实施例智能笔手写矢量的识别方法的流程图,本发明所述智能笔手写矢量的识别方法包括:
步骤S1,文字获取模块获取并归一化处理矢量化后的待识别文字;
进行归一化处理的目的,是将待识别文字与储存模块中储存的文字进行格式统一,使待识别文字更为规整,便于处理和识别的操作。
步骤S2,轮廓识别模块对所述待识别文字进行外部轮廓识别,并基于识别的外部轮廓与储存模块中储存的任一文字的相似度得到第一识别目标;
步骤S3,路径识别模块识别所述待识别文字的书写路径以计算与所述第一识别目标中各文字的书写路径的拟合度,得到第二识别目标,所述第二识别目标中的字体为所述第一识别目标中的字体中的一部分;
步骤S4,分解模块对所述第二识别目标中各文字进行拆解并计算拆解后对应部分的一致率,以确定所述待识别文字的识别部分和待确定部分;
步骤S5,中控模块基于待确定部分文字轮廓的面积和待确定部分文字书写路径的长度计算待确定部分的识别复杂度以及第二识别目标中各文字对应的待确定部分的对比复杂度,基于对比复杂度与所述识别复杂度的误差确定待确定部分。
具体而言,在所述步骤S2中,所述轮廓识别模块对所述待识别文字进行外部轮廓识别,计算识别的外部轮廓与储存模块中储存的任一文字的相似度,提取相似度大于95%的文字作为第一识别目标。
本实施例所述储存模块,可以是直接储存若干字体形态的文字,也可以是建立若干字体库,每个字体库均对应一种字体形态,在计算待识别文字的外部轮廓与储存模块中储存的任一文字的相似度时,可以首先将待识别文字的字体形态与字体库中的字体形态进行比对以确定最接近的字体形态,然后在最接近的字体形态对应的字体库中通过计算选定与待识别文字的外部轮廓相似度大于95%的字体作为第一识别目标,通过上述方案,可以减小系统运算量,提高识别效率。可以理解的是,本领域技术人员还可以通过遍历计算储存模块中任一文字的外部轮廓与待识别文字的外部轮廓的相似度以确定第一识别目标,该种方法,由于采用了遍历的计算方式,提高了识别准确度。
本发明通过待识别文字的外部轮廓选定第一识别目标,缩小了识别范围,在确定第一识别目标字体数量时,综合考虑运算量和识别的准确度,将相似度和文字数量共同作为确定第一识别目标的考量因素,在保证识别准确度的同时,提高了运算速度。
具体而言,在所述步骤S2中,所述轮廓识别模块统计所述第一识别目标中文字的数量,若该数量小于预设数量标准,则提取相似度大于90%的文字作为第一识别目标。
本实施例中的预设数量标准20-30,优选20-25,通过多次的实验数据得出,在选定相似度大于90%的字体中的20-30个文字作为第一识别目标时,准确度可达98%,在选定相似度大于90%的字体中的30-40个文字作为第一识别目标时,准确度可达98.5%,识别过程的运算时间需要增加20%,在选定相似度大于90%的字体中的10-20个文字作为第一识别目标时,准确度可达95%,识别过程的运算时间减少5%,在选定相似度大于85%的字体中的20-30个文字作为第一识别目标时,准确度可达93%,基于多次的实验数据,本实施例优选相似度大于90%的字体作为第一识别目标,当相似度大于95%的文字的数量满足标准时,优选相似度大于95%。
具体而言,在所述步骤S3中,所述路径识别模块对待识别文字的书写路径进行识别,并模拟所述第一识别目标中各文字的书写路径,将模拟的书写路径与待识别文字的书写路径进行拟合,计算拟合度,提取拟合度大于90%的字体以作为第二识别目标。
优选的,本实施例中拟合度的计算的方法可通过曲线拟合的方式进行计算,此为成熟的现有技术,此处不在赘述。
本发明通过识别待识别文字的书写路径,以及模拟第一识别目标中各文字的书写路径,并对识别的书写路径进行拟合运算,从而在第一识别目标进一步缩小识别范围,确定第二识别目标,通过拟合书写路径,进一步提高了识别准确度。
具体而言,在所述步骤S4中,所述分解模块根据字体的结构,对第二识别目标中各文字进行拆解,若各文字拆解后的对应的部分一致率大于一致率标准,则将该部分作为已识别部分,所述分解模块将一致率小于等于一致率标准的拆解部分作为待确定部分;
所述一致率R的计算方法为R=S/N;
其中,S为拆解后的对应的部分相同的数量,N为第二识别目标中字体的数量。
本发明通过将待识别文字进行拆解的方式进行分步识别,通过轮廓相似度和书写路径拟合的方式筛选出的第二识别目标中的文字,若拆解后对应的部分的一致率大于一致率标准,说明该对应部分的一致性较高,可将该部分作为已识别部分,通过以上分步识别的方式,降低了现有技术中将待识别文字作为一个整体进行识别的识别难度,进而提高了识别的准确度。
本实施例在对文字进行拆解时,可通过对偏旁、部首、文字结构等文字组成的识别方法将文字拆解成若干部分,此为成熟的现有技术,在此不再赘述。
具体而言,在所述步骤S5中,对于所述待确定部分,所述中控模块通过归一化处理得到所述待识别文字规整后的坐标序列,在规整后的待识别文字中划分出待确定部分,对待确定部分中的图像进行捕捉,以得到待确定部分中的字体轮廓,基于坐标序列获取该待确定部分的字体轮廓面积。
本发明对于一致率小于等于一致率标准的拆解部分作为待确定部分,并对该待确定部分通过计算识别复杂度做进一步识别和确认,进而提高了识别的准确度。
本发明通过将待识别文字进行归一化处理,使待识别文字与第二识别目标中的文字进行统一,分解模块通过捕捉待确定部分的文字的图像,并基于规整后的坐标序列获取该待确定部分的字体轮廓面积,由于采取了归一化处理,使该待确定部分的字体轮廓面积与第二识别目标中各文字对应的待确定部分的轮廓面积具有可比较性,因此通过归一化处理后,并以此计算的识别复杂度具有文字识别的实际意义。
本实施例对待识别文字进行归一化处理的方法,可采用专利文献号CN101482920B一种手写字符识别方法及系统公开的待识别文字归一化处理方法。
具体而言,在所述步骤S5中,所述中控模块按照以下公式计算所述待确定部分的识别复杂度E;
其中,S为待确定部分文字轮廓的面积,L为待确定部分文字书写路径的长度,β为识别复杂度归一化参数。
具体而言,在所述步骤S5中,所述中控模块计算所述第二识别目标中各文字对应的待确定部分的对比复杂度,计算对比复杂度与所述识别复杂度的误差,选取误差最小值对应的字体的待确定部分作为待识别文字的待确定部分。
本实施例中,所述中控模块根据计算识别复杂度E的公式计算对比复杂度E0,在计算对比复杂度与所述识别复杂度的误差σ时,根据以下公式计算:
所述中控模块选取误差最小值对应的字体的待确定部分作为待识别文字的待确定部分。
具体而言,在所述步骤S5中,若存在两个以上的误差值相同时,所述中控模块选取轮廓相似度较高值对应的文字,以该对应的文字对应的待确定部分作为待识别文字的待确定部分。
本发明通过识别矢量化后的待识别文字的轮廓,在储存模块中筛选出相似度符合标准的文字形成第一识别目标,通过初步的筛选,缩小了进一步识别的选择范围,在保证识别准确率的同时,提高了识别的效率;路径识别模块识别所述待识别文字的书写路径,以及第一识别目标中各文字的书写路径,通过书写路径拟合筛选出拟合度符合标准的文字形成第二识别目标,通过第二次筛选,进一步缩小了识别的选择范围,进而在保证识别准确率的同时,提高了识别的效率;分解模块通过对第二识别目标中各文字进行拆解,通过拆解的方式,将拆解后对应的部分进行单独对比以确定识别部分,由于拆解的动作仅限于第二识别目标中的文字,运算量较小,从而提高了运算速度,而通过拆解后各部分单独对比的方式,降低了整体文字的识别复杂度,从而提高了识别的准确性;对于一致率较低的部分,通过计算识别复杂度以进一步确认,进一步保证了识别的准确性。
请参阅图2所示,其为本发明实施例智能笔手写矢量的识别装置的结构框图,本发明所述智能笔手写矢量的识别装置包括:
文字获取模块,用以获取并归一化处理矢量化后的待识别文字;
轮廓识别模块,其与所述文字获取模块相连,用以对所述待识别文字进行外部轮廓识别,并基于识别的外部轮廓得到第一识别目标;
路径识别模块,其分别与所述文字获取模块和所述轮廓识别模块相连,用以识别所述待识别文字的书写路径以得到第二识别目标;
分解模块,其分别与所述文字获取模块和所述路径识别模块相连,用以对第二识别目标中各文字进行拆解并计算拆解后对应部分的一致率,以确定所述待识别文字的识别部分和待确定部分;
中控模块,其分别与所述文字获取模块、路径识别模块以及分解模块相连,用以基于待确定部分文字轮廓的面积和待确定部分文字书写路径的长度计算待确定部分的识别复杂度以及第二识别目标中各文字对应的待确定部分的对比复杂度,基于对比复杂度与所述识别复杂度的误差确定待确定部分。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种智能笔手写矢量的识别方法,其特征在于,包括:
步骤S1,文字获取模块获取并归一化处理矢量化后的待识别文字;
步骤S2,轮廓识别模块对所述待识别文字进行外部轮廓识别,并基于识别的外部轮廓与储存模块中储存的任一文字的相似度得到第一识别目标;
步骤S3,路径识别模块识别所述待识别文字的书写路径以计算与所述第一识别目标中各文字的书写路径的拟合度,得到第二识别目标,所述第二识别目标中的字体为所述第一识别目标中的字体中的一部分;
步骤S4,分解模块对所述第二识别目标中各文字进行拆解并计算拆解后对应部分的一致率,以确定所述待识别文字的识别部分和待确定部分;
步骤S5,中控模块基于待确定部分文字轮廓的面积和待确定部分文字书写路径的长度计算待确定部分的识别复杂度以及第二识别目标中各文字对应的待确定部分的对比复杂度,基于对比复杂度与所述识别复杂度的误差确定待确定部分。
2.根据权利要求1所述的智能笔手写矢量的识别方法,其特征在于,在所述步骤S2中,所述轮廓识别模块对所述待识别文字进行外部轮廓识别,计算识别的外部轮廓与储存模块中储存的任一文字的相似度,提取相似度大于95%的文字作为第一识别目标。
3.根据权利要求2所述的智能笔手写矢量的识别方法,其特征在于,在所述步骤S2中,所述轮廓识别模块统计所述第一识别目标中文字的数量,若该数量小于预设数量标准,则提取相似度大于90%的文字作为第一识别目标。
4.根据权利要求3所述的智能笔手写矢量的识别方法,其特征在于,在所述步骤S3中,所述路径识别模块对待识别文字的书写路径进行识别,并模拟所述第一识别目标中各文字的书写路径,将模拟的书写路径与待识别文字的书写路径进行拟合,计算拟合度,提取拟合度大于90%的字体以作为第二识别目标。
5.根据权利要求4所述的智能笔手写矢量的识别方法,其特征在于,在所述步骤S4中,所述分解模块根据字体的结构,对第二识别目标中各文字进行拆解,若各文字拆解后的对应的部分一致率大于一致率标准,则将该部分作为已识别部分,所述分解模块将一致率小于等于一致率标准的拆解部分作为待确定部分;所述一致率R的计算方法为R=S/N;其中,S为拆解后的对应的部分相同的数量,N为第二识别目标中字体的数量。
6.根据权利要求5所述的智能笔手写矢量的识别方法,其特征在于,在所述步骤S5中,对于所述待确定部分,所述中控模块通过归一化处理得到所述待识别文字规整后的坐标序列,在规整后的待识别文字中划分出待确定部分,对待确定部分中的图像进行捕捉,以得到待确定部分中的字体轮廓,基于坐标序列获取该待确定部分的字体轮廓面积。
7.根据权利要求6所述的智能笔手写矢量的识别方法,其特征在于,在所述步骤S5中,所述中控模块按照以下公式计算所述待确定部分的识别复杂度E;
其中,S为待确定部分文字轮廓的面积,L为待确定部分文字书写路径的长度,β为识别复杂度归一化参数。
8.根据权利要求7所述的智能笔手写矢量的识别方法,其特征在于,在所述步骤S5中,所述中控模块计算所述第二识别目标中各文字对应的待确定部分的对比复杂度,计算对比复杂度与所述识别复杂度的误差,选取误差最小值对应的字体的待确定部分作为待识别文字的待确定部分。
9.根据权利要求8所述的智能笔手写矢量的识别方法,其特征在于,在所述步骤S5中,若存在两个以上的误差值相同时,所述中控模块选取轮廓相似度较高值对应的文字,以该对应的文字对应的待确定部分作为待识别文字的待确定部分。
10.一种应用权利要求1-9任一项所述方法的装置,其特征在于,
文字获取模块,用以获取并归一化处理矢量化后的待识别文字;
轮廓识别模块,其与所述文字获取模块相连,用以对所述待识别文字进行外部轮廓识别,并基于识别的外部轮廓得到第一识别目标;
路径识别模块,其分别与所述文字获取模块和所述轮廓识别模块相连,用以识别所述待识别文字的书写路径以得到第二识别目标;
分解模块,其分别与所述文字获取模块和所述路径识别模块相连,用以对第二识别目标中各文字进行拆解并计算拆解后对应部分的一致率,以确定所述待识别文字的识别部分和待确定部分;
中控模块,其分别与所述文字获取模块、路径识别模块以及分解模块相连,用以基于待确定部分文字轮廓的面积和待确定部分文字书写路径的长度计算待确定部分的识别复杂度以及第二识别目标中各文字对应的待确定部分的对比复杂度,基于对比复杂度与所述识别复杂度的误差确定待确定部分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310883745.6A CN116612483B (zh) | 2023-07-19 | 2023-07-19 | 一种智能笔手写矢量的识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310883745.6A CN116612483B (zh) | 2023-07-19 | 2023-07-19 | 一种智能笔手写矢量的识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116612483A true CN116612483A (zh) | 2023-08-18 |
CN116612483B CN116612483B (zh) | 2023-09-29 |
Family
ID=87685716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310883745.6A Active CN116612483B (zh) | 2023-07-19 | 2023-07-19 | 一种智能笔手写矢量的识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116612483B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6436387A (en) * | 1987-07-31 | 1989-02-07 | Toyota Central Res & Dev | Character recognition device |
JPH0773275A (ja) * | 1993-09-02 | 1995-03-17 | Fuji Facom Corp | 文字認識装置 |
CN1652138A (zh) * | 2005-02-08 | 2005-08-10 | 华南理工大学 | 一种手写文字的识别方法 |
CN109472234A (zh) * | 2018-11-01 | 2019-03-15 | 北京爱知之星科技股份有限公司 | 一种手写输入智能识别的方法 |
CN113011413A (zh) * | 2021-04-15 | 2021-06-22 | 深圳市鹰硕云科技有限公司 | 基于智能笔手写图像的处理方法、装置、系统及存储介质 |
CN113496263A (zh) * | 2020-03-18 | 2021-10-12 | 北京易真学思教育科技有限公司 | 字符识别方法、设备及字符识别芯片 |
WO2022100452A1 (zh) * | 2020-11-16 | 2022-05-19 | 深圳壹账通智能科技有限公司 | Ocr系统的评估方法、装置、设备及可读存储介质 |
WO2022160330A1 (zh) * | 2021-02-01 | 2022-08-04 | 京东方科技集团股份有限公司 | 手写体识别方法及装置 |
KR20230028071A (ko) * | 2021-08-21 | 2023-02-28 | 황현 | 손글씨를 이용한 필기체 한글폰트 생성 시스템 및 그 운용방법 |
CN116246278A (zh) * | 2022-12-16 | 2023-06-09 | 科大讯飞股份有限公司 | 文字识别方法、装置、存储介质及电子设备 |
-
2023
- 2023-07-19 CN CN202310883745.6A patent/CN116612483B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6436387A (en) * | 1987-07-31 | 1989-02-07 | Toyota Central Res & Dev | Character recognition device |
JPH0773275A (ja) * | 1993-09-02 | 1995-03-17 | Fuji Facom Corp | 文字認識装置 |
CN1652138A (zh) * | 2005-02-08 | 2005-08-10 | 华南理工大学 | 一种手写文字的识别方法 |
CN109472234A (zh) * | 2018-11-01 | 2019-03-15 | 北京爱知之星科技股份有限公司 | 一种手写输入智能识别的方法 |
CN113496263A (zh) * | 2020-03-18 | 2021-10-12 | 北京易真学思教育科技有限公司 | 字符识别方法、设备及字符识别芯片 |
WO2022100452A1 (zh) * | 2020-11-16 | 2022-05-19 | 深圳壹账通智能科技有限公司 | Ocr系统的评估方法、装置、设备及可读存储介质 |
WO2022160330A1 (zh) * | 2021-02-01 | 2022-08-04 | 京东方科技集团股份有限公司 | 手写体识别方法及装置 |
CN113011413A (zh) * | 2021-04-15 | 2021-06-22 | 深圳市鹰硕云科技有限公司 | 基于智能笔手写图像的处理方法、装置、系统及存储介质 |
KR20230028071A (ko) * | 2021-08-21 | 2023-02-28 | 황현 | 손글씨를 이용한 필기체 한글폰트 생성 시스템 및 그 운용방법 |
CN116246278A (zh) * | 2022-12-16 | 2023-06-09 | 科大讯飞股份有限公司 | 文字识别方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN116612483B (zh) | 2023-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10929649B2 (en) | Multi-pose face feature point detection method based on cascade regression | |
CN111339990B (zh) | 一种基于人脸特征动态更新的人脸识别系统和方法 | |
JP2669583B2 (ja) | 手書き認識のためのコンピュータベース方法及びシステム | |
CN108108751B (zh) | 一种基于卷积多特征和深度随机森林的场景识别方法 | |
CN106980856B (zh) | 公式识别方法及系统和符号推理计算方法及系统 | |
CN110555896B (zh) | 一种图像生成方法、装置以及存储介质 | |
CN106372624B (zh) | 人脸识别方法及系统 | |
CN109977958A (zh) | 一种离线手写体数学公式识别重构方法 | |
CN113449704B (zh) | 人脸识别模型训练方法、装置、电子设备及存储介质 | |
JP7337203B2 (ja) | 文字生成モデルのトレーニング方法、文字生成方法、装置および機器 | |
CN111079374A (zh) | 字体生成方法、装置和存储介质 | |
CN114937285B (zh) | 动态手势识别方法、装置、设备及存储介质 | |
CN112966685A (zh) | 用于场景文本识别的攻击网络训练方法、装置及相关设备 | |
CN112381047A (zh) | 一种人脸表情图像的增强识别方法 | |
CN110263631B (zh) | 一种手写化学公式识别与配平方法 | |
Yang et al. | Combination of manual and non-manual features for sign language recognition based on conditional random field and active appearance model | |
Awal et al. | Improving online handwritten mathematical expressions recognition with contextual modeling | |
CN116612483B (zh) | 一种智能笔手写矢量的识别方法及装置 | |
US11847401B2 (en) | Method and apparatus for recognizing handwriting inputs in multiple-user environment | |
CN110390268B (zh) | 一种基于几何特性和方向特征的三维掌纹识别方法 | |
CN115035592A (zh) | 一种用于美术作品在线教育的手势识别方法及装置 | |
CN112329389B (zh) | 一种基于语义分割与禁忌搜索的汉字笔画自动提取方法 | |
CN113920291A (zh) | 基于图片识别结果的纠错方法、装置、电子设备及介质 | |
CN115346225A (zh) | 书写测评方法、装置及设备 | |
CN111832370A (zh) | 人脸姿态的识别方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |