CN101893960A - 一种基于方向向量的文字识别方法和识别装置 - Google Patents
一种基于方向向量的文字识别方法和识别装置 Download PDFInfo
- Publication number
- CN101893960A CN101893960A CN 201010221048 CN201010221048A CN101893960A CN 101893960 A CN101893960 A CN 101893960A CN 201010221048 CN201010221048 CN 201010221048 CN 201010221048 A CN201010221048 A CN 201010221048A CN 101893960 A CN101893960 A CN 101893960A
- Authority
- CN
- China
- Prior art keywords
- vector
- direction vector
- literal
- matrix
- directions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
本发明提供了一种基于方向向量的文字识别方法和识别装置,通过接收输入笔迹信息,求取所接收的笔迹信息的方向向量,并统计各方向向量的个数,用所求取的方向向量和所统计的方向向量的个数构建矩阵A1,求取其特征向量T1,将所述矩阵A1中各方向向量调整180度得到矩阵A2,求取其特征向量T2,分别用特征向量T1和T2与预建的识别引擎的文字模型进行匹配,获取匹配度,将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字,当输入的笔迹信息与常规习惯不同,为相反方向时,通过对方向向量进行旋转调整,保证了文字识别的准确性。
Description
技术领域
本发明涉及手写识别技术领域,特别是涉及一种基于方向向量的文字识别方法和识别装置。
背景技术
手写识别(Handwriting Recognize),是指将在手写设备上书写时产生的手写轨迹信息化转化为汉字内码的过程,实际上是手写轨迹的坐标序列到汉字的内码的一个映射过程,是人机交互最自然、最方便的手段之一。随着智能手机、掌上电脑等移动信息工具的普及,手写识别技术也进入了规模应用时代。手写识别能够使用户按照最自然、最方便的输入方式进行文字输入,易学易用,可取代键盘或者鼠标。实际应用中,用于手写输入的设备有许多种,比如电磁感应手写板、压感式手写板、触摸屏、触控板、超声波笔等。
在手写识别中,不同的人的书写习惯不同,例如:写0是大多数人是逆时针的,但也有人是顺时针的。目前,对于反方向书写习惯的文字,所采用基于方向向量的文字识别方法往往会出现一些错误,识别出的文字与输入笔迹信息不符。
因此,目前需要本领域技术人员迫切解决的一个技术问题就是:如何能够创新地提出一种基于方向向量的文字识别方法和识别装置,以解决现有技术中存在的不足,提高文字识别的准确性和体验度。
发明内容
本发明所要解决的技术问题是提供一种基于方向向量的文字识别方法和识别装置,用以有效提高文字识别的准确性、可靠性以及体验度。
为了解决上述问题,本发明公开了一种基于方向向量的文字识别方法,所述方法包括:
接收输入笔迹信息;
求取所接收的笔迹信息的方向向量,并统计各方向向量的个数;
用所求取的方向向量和所统计的方向向量的个数构建矩阵A1,求取其特征向量T1;
将所述矩阵A1中各方向向量调整180度得到矩阵A2,求取其特征向量T2;
分别用特征向量T1和T2与预建的识别引擎的文字模型进行匹配,获取匹配度;
将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字。
优选的,所述方向向量的取值范围为为0°到360°。
优选的,所述调整180度具体指加上或减去180度。
优选的,所述方向向量包括0°、45°、90°、135°、180°、225°、270°和315°8个方向的向量。
优选的,所述方法还包括:
在识别引擎中创建每一文字的文字模型。
优选的,所述创建每一文字的文字模型具体包括以下子步骤:
采集文字的输入样本;
提取各输入样本的方向向量,并统计各方向向量的个数;
分别用所求取的方向向量和所统计的方向向量的个数构建矩阵,求取其特征向量;
对所求取的各特征向量进行聚类;
存储聚类结果到识别引擎作为当前文字的文字模型。
本发明还提供了一种基于方向向量的文字识别装置,所述装置包括:
接收模块,用于接收输入笔迹信息;
处理模块,用于求取所接收的笔迹信息的方向向量,并统计各方向向量的个数;
第一求取模块,用于用所求取的方向向量和所统计的方向向量的个数构建矩阵A1,求取其特征向量T1;
第二求取模块,用于将所述矩阵A1中各方向向量调整180度得到矩阵A2,求取其特征向量T2;
匹配模块,用于分别用特征向量T1和T2与预建的识别引擎的文字模型进行匹配,获取匹配度;
输出模块,用于将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字。
优选的,所述装置还包括:
创建模块,在识别引擎中创建每一文字的文字模型。
优选的,所述创建模块包括以下子模块:
采集子模块,用于采集文字的输入样本;
提取子模块,用于提取各输入样本的方向向量,并统计各方向向量的个数;
构建子模块,用于分别用所求取的方向向量和所统计的方向向量的个数构建矩阵,求取其特征向量;
聚类子模块,用于对所求取的各特征向量进行聚类;
存储子模块,用于存储聚类结果到识别引擎作为当前文字的文字模型。
优选的,所述方向向量包括0°、45°、90°、135°、180°、225°、270°和315°8个方向的向量。
与现有技术相比,本发明具有以下优点:
本发明通过接收输入笔迹信息,求取所接收的笔迹信息的方向向量,并统计各方向向量的个数,用所求取的方向向量和所统计的方向向量的个数构建矩阵A1,求取其特征向量T1,将所述矩阵A1中各方向向量调整180度得到矩阵A2,求取其特征向量T2,分别用特征向量T1和T2与预建的识别引擎的文字模型进行匹配,获取匹配度,将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字,当输入的笔迹信息与常规习惯不同,为相反方向时,通过对方向向量进行旋转调整,保证了文字识别的准确性。
附图说明
图1是本发明实施例一所述的一种基于方向向量的文字识别方法的流程图;
图2是本发明实施例二所述的一种基于方向向量的文字识别装置的结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
随着数字时代的到来,各种数字产品纷纷问世,便携式掌上电脑、个人数字助理(PDA,Personal Digital Assistant)、智能手机、导航设备、学习机、电子书等移动信息工具逐日普及,手写输入成为越来越多用户的需要。如果能够提出一种有效识别文字的方法,那么将会给数字产品的发展提供强有力的帮助。
因此,本专利发明人创造性地提出了本发明实施例的核心构思之一,即提供一种基于方向向量的文字识别方法和识别装置,通过接收输入笔迹信息,求取所接收的笔迹信息的方向向量,并统计各方向向量的个数,用所求取的方向向量和所统计的方向向量的个数构建矩阵A1,求取其特征向量T1,将所述矩阵A1中各方向向量调整180度得到矩阵A2,求取其特征向量T2,分别用特征向量T1和T2与预建的识别引擎的文字模型进行匹配,获取匹配度,将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字。
实施例一:
参照图1,示出了本发明的一种基于方向向量的文字识别方法的流程图,所述方法具体包括:
S101,接收输入笔迹信息;
笔迹,是人在书写的过程中留下的痕迹,是书写者的主观因素和客观条件之间相互作用、相互矛盾的产物。本实施例中所述的笔迹信息简单的来说,是指用户在使用电子设备时,手写输入所产生的痕迹。其中,手写所输入的痕迹,也即这里所要接收的输入笔迹信息。
S102,求取所接收的笔迹信息的方向向量,并统计各方向向量的个数;
优选的,所述方向向量的取值范围为0°到360°。
优选的,所述方向向量包括0°、45°、90°、135°、180°、225°、270°和315°8个方向的向量。
S103,用所求取的方向向量和所统计的方向向量的个数构建矩阵A1,求取其特征向量T1;
对于不同的文字,其书写的笔迹信息是不相同的,接收到输入笔迹信息时,提取其笔迹信息的方向向量并统计各方向向量的个数。具体的来说,提取输入笔迹信息在0°、45°、90°、135°、180°、225°、270°和315°8个方向的向量。为更为直观的介绍所述的方法,以输入0的笔迹信息为例进行介绍,假设所提取笔迹信息在所述8个方向上的方向向量的个数分别为10,20,30,15,25,5,35,40。用所求取的方向向量和所统计的方向向量的个数构建矩阵A1,求取其特征向量T1,具体求取过程这里不做详细介绍。
S104,将所述矩阵A1中各方向向量调整180度得到矩阵A2,求取其特征向量T2;
优选的,所述调整180度具体指加上或减去180度。
实际应用中,人们书写习惯的不同,以书写“8”和“0”为例来说明,最为常见的书写习惯都是从上而下,从左而右的,是逆时针方向书写的,也有一部分人会采用顺时针的方向进行书写。显然,这两种常见的书写习惯下所产生的笔迹信息是不同的,相应的其方向向量也会存在差异,针对这种情况,对各方向向量进行180度的调整,对应到前面的介绍进行说明,具体为0°、45°、90°、135°、180°、225°、270°和315°分别加上或减去180度,调整后的方向向量值落在0°到360°,调整后对应8个方向的方向向量分别为:180°、225°、270、315°、°0°、45°、90°和135°,用调整后的方向向量替换矩阵A1中对应的方向向量,得到新的矩阵A2,求取新矩阵A2的特征向量T2。
S105,分别用特征向量T1和T2与预建的识别引擎的文字模型进行匹配,获取匹配度;
所述识别引擎中包含有各文字的文字模型。
优选的,所述方法还包括:
S100,在识别引擎中创建每一文字的文字模型。
识别方法中所涉及到的识别引擎,是之前所创建的,因此,所述的方法优选的包括在识别引擎中创建每一文字的文字模型。
更为优选的,所述S100具体包括以下子步骤:
S1,采集文字的输入样本;
输入样本的采集,实际中针对各个文字可以采集100个不同背景人书写的文字样本,也即收集100个输入笔迹信息作为输入样本。
S2,提取各输入样本的方向向量,并统计各方向向量的个数;
S3,分别用所求取的方向向量和所统计的方向向量的个数构建矩阵,求取其特征向量;
通过提取各个输入样本的方向向量,并且统计各方向向量的个数,并用各个输入样本所统计的方向向量和方向向量的个数构建矩阵,求取其特征向量。各个输入样本对应各自的特征向量。
S4,对所求取的各特征向量进行聚类;
每一个文字,其多个输入样本会相应的求取的多个特征向量,对所求取的多个特征向量进行聚类处理。具体实现中可以聚为一类或多类。
S5,存储聚类结果到识别引擎作为当前文字的文字模型。
存储聚类处理的聚类结果到识别引擎作为当前文字的文字模型。
在实际的识别中,按照前面所介绍的方法,求取其对应的特征向量T1和T2后,分别用特征向量T1和T2与预建的识别引擎的文字模型进行匹配,具体匹配中,同一文字所对应的多个类,叫做类内匹配;不同文字对应的类称为类间匹配,通过匹配获取相应的匹配度。
S106,将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字。
将所获取的匹配度进行排序,可采用从高到低的顺序进行排序,也可采用从低到高的顺序进行排序,需要具体介绍的是,对于类内匹配的匹配度选取匹配度最高的一个与其他类间的进行排序,完成排序后,按照所排的顺序从高到低输出所需数量的文字,具体应用中输出的文字数量可以进行设定,如输出前五个或前十个等等。这里所述的匹配度亦可以是相似度或者是匹配概率,同时还可以采用距离进行度量匹配度。
本实施例所述的方法,借助方向向量高效准确的完成了文字的识别,尤其保证了对于笔迹信息与常规习惯不同,为相反方向时,其文字识别的准确性。
实施例二:
参照图2,示出了本发明的一种基于方向向量的文字识别装置的结构图,所述装置包括:
接收模块201,用于接收输入笔迹信息;
处理模块202,用于求取所接收的笔迹信息的方向向量,并统计各方向向量的个数;
第一求取模块203,用于用所求取的方向向量和所统计的方向向量的个数构建矩阵A1,求取其特征向量T1;
第二求取模块204,用于将所述矩阵A1中各方向向量调整180度得到矩阵A2,求取其特征向量T2;
匹配模块205,用于分别用特征向量T1和T2与预建的识别引擎的文字模型进行匹配,获取匹配度;
输出模块206,用于将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字。
优选的,所述装置还包括:
创建模块200,在识别引擎中创建每一文字的文字模型。
优选的,所述创建模块200包括以下子模块:
采集子模块2001,用于采集文字的输入样本;
提取子模块2002,用于提取各输入样本的方向向量,并统计各方向向量的个数;
构建子模块2003,用于分别用所求取的方向向量和所统计的方向向量的个数构建矩阵,求取其特征向量;
聚类子模块2004,用于对所求取的各特征向量进行聚类;
存储子模块2005,用于存储聚类结果到识别引擎作为当前文字的文字模型。
优选的,所述方向向量包括0°、45°、90°、135°、180°、225°、270°和315°8个方向的向量。
本发明可以应用于各种具有手写输入功能的移动信息工具,如便携式掌上电脑、PDA、智能手机、导航设备、学习机、电子书等,用以准确可靠的完成文字的识别。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本发明所提供的一种基于方向向量的文字识别方法和识别装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种基于方向向量的文字识别方法,其特征在于,所述方法包括:
接收输入笔迹信息;
求取所接收的笔迹信息的方向向量,并统计各方向向量的个数;
用所求取的方向向量和所统计的方向向量的个数构建矩阵A1,求取其特征向量T1;
将所述矩阵A1中各方向向量调整180度得到矩阵A2,求取其特征向量T2;
分别用特征向量T1和T2与预建的识别引擎的文字模型进行匹配,获取匹配度;
将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字。
2.如权利要求1所述的识别方法,其特征在于:
所述方向向量的取值范围为为0°到360°。
3.如权利要求2所述的识别方法,其特征在于:
所述调整180度具体指加上或减去180度。
4.如权利要求3所述的识别方法,其特征在于:
所述方向向量包括0°、45°、90°、135°、180°、225°、270°和315°8个方向的向量。
5.如权利要求1所述的识别方法,其特征在于,所述方法还包括:
在识别引擎中创建每一文字的文字模型。
6.如权利要求5所述的识别方法,其特征在于,所述创建每一文字的文字模型具体包括以下子步骤:
采集文字的输入样本;
提取各输入样本的方向向量,并统计各方向向量的个数;
分别用所求取的方向向量和所统计的方向向量的个数构建矩阵,求取其特征向量;
对所求取的各特征向量进行聚类;
存储聚类结果到识别引擎作为当前文字的文字模型。
7.一种基于方向向量的文字识别装置,其中特征在于,所述装置包括:
接收模块,用于接收输入笔迹信息;
处理模块,用于求取所接收的笔迹信息的方向向量,并统计各方向向量的个数;
第一求取模块,用于用所求取的方向向量和所统计的方向向量的个数构建矩阵A1,求取其特征向量T1;
第二求取模块,用于将所述矩阵A1中各方向向量调整180度得到矩阵A2,求取其特征向量T2;
匹配模块,用于分别用特征向量T1和T2与预建的识别引擎的文字模型进行匹配,获取匹配度;
输出模块,用于将所获取的匹配度进行排序,按照匹配度从高到低输出预设数量的文字。
8.如权利要求7所述的识别装置,其特征在于,所述装置还包括:
创建模块,在识别引擎中创建每一文字的文字模型。
9.如权利要求8所述的识别装置,其特征在于,所述创建模块包括以下子模块:
采集子模块,用于采集文字的输入样本;
提取子模块,用于提取各输入样本的方向向量,并统计各方向向量的个数;
构建子模块,用于分别用所求取的方向向量和所统计的方向向量的个数构建矩阵,求取其特征向量;
聚类子模块,用于对所求取的各特征向量进行聚类;
存储子模块,用于存储聚类结果到识别引擎作为当前文字的文字模型。
10.如权利要求9所述的识别装置,其特征在于:
所述方向向量包括0°、45°、90°、135°、180°、225°、270°和315°8个方向的向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102210487A CN101893960B (zh) | 2010-06-28 | 2010-06-28 | 一种基于方向向量的文字识别方法和识别装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102210487A CN101893960B (zh) | 2010-06-28 | 2010-06-28 | 一种基于方向向量的文字识别方法和识别装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101893960A true CN101893960A (zh) | 2010-11-24 |
CN101893960B CN101893960B (zh) | 2011-12-21 |
Family
ID=43103168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010102210487A Active CN101893960B (zh) | 2010-06-28 | 2010-06-28 | 一种基于方向向量的文字识别方法和识别装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101893960B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102521521A (zh) * | 2011-12-23 | 2012-06-27 | 北京瑞信在线系统技术有限公司 | 实物识别方法及装置 |
CN102831418A (zh) * | 2011-06-17 | 2012-12-19 | 汉王科技股份有限公司 | 手写体汉字倾斜矫正方法及装置 |
CN103324275A (zh) * | 2012-03-23 | 2013-09-25 | 原相科技股份有限公司 | 使用者辨识系统及辨识使用者的方法 |
CN108875744A (zh) * | 2018-03-05 | 2018-11-23 | 南京理工大学 | 基于矩形框坐标变换的多方向文本行检测方法 |
CN111241221A (zh) * | 2020-01-06 | 2020-06-05 | 长江勘测规划设计研究有限责任公司 | 一种受损地形坐标数据的自动化匹配及高精度修复方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1234565A (zh) * | 1998-04-27 | 1999-11-10 | 三洋电机株式会社 | 手写文字识别方法及系统 |
CN1619583A (zh) * | 2003-11-20 | 2005-05-25 | 摩托罗拉公司 | 手写识别的方法和系统 |
CN101482920A (zh) * | 2008-12-30 | 2009-07-15 | 广东国笔科技股份有限公司 | 一种手写字符识别方法及系统 |
-
2010
- 2010-06-28 CN CN2010102210487A patent/CN101893960B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1234565A (zh) * | 1998-04-27 | 1999-11-10 | 三洋电机株式会社 | 手写文字识别方法及系统 |
CN1619583A (zh) * | 2003-11-20 | 2005-05-25 | 摩托罗拉公司 | 手写识别的方法和系统 |
CN101482920A (zh) * | 2008-12-30 | 2009-07-15 | 广东国笔科技股份有限公司 | 一种手写字符识别方法及系统 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831418A (zh) * | 2011-06-17 | 2012-12-19 | 汉王科技股份有限公司 | 手写体汉字倾斜矫正方法及装置 |
CN102831418B (zh) * | 2011-06-17 | 2015-11-25 | 汉王科技股份有限公司 | 手写体汉字倾斜矫正方法及装置 |
CN102521521A (zh) * | 2011-12-23 | 2012-06-27 | 北京瑞信在线系统技术有限公司 | 实物识别方法及装置 |
CN103324275A (zh) * | 2012-03-23 | 2013-09-25 | 原相科技股份有限公司 | 使用者辨识系统及辨识使用者的方法 |
CN103324275B (zh) * | 2012-03-23 | 2016-12-14 | 原相科技股份有限公司 | 使用者辨识系统及辨识使用者的方法 |
CN108875744A (zh) * | 2018-03-05 | 2018-11-23 | 南京理工大学 | 基于矩形框坐标变换的多方向文本行检测方法 |
CN111241221A (zh) * | 2020-01-06 | 2020-06-05 | 长江勘测规划设计研究有限责任公司 | 一种受损地形坐标数据的自动化匹配及高精度修复方法 |
CN111241221B (zh) * | 2020-01-06 | 2022-05-13 | 长江勘测规划设计研究有限责任公司 | 一种受损地形坐标数据的自动化匹配及高精度修复方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101893960B (zh) | 2011-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103093196B (zh) | 一种基于手势的汉字交互输入与识别方法 | |
CN101149804B (zh) | 自适应手写识别系统和方法 | |
CN102855082A (zh) | 用于重叠文本用户输入的字符识别 | |
CN101430623A (zh) | 输入笔迹自动转换系统和方法 | |
US20180300542A1 (en) | Drawing emojis for insertion into electronic text-based messages | |
CN101893960B (zh) | 一种基于方向向量的文字识别方法和识别装置 | |
CN102419645A (zh) | 组合输入汉字的方法和装置、掌上终端 | |
CN109446328A (zh) | 一种文本识别方法、装置及其存储介质 | |
CN104346408B (zh) | 一种对网络用户进行标注的方法与设备 | |
CN103902098A (zh) | 整形装置和整形方法 | |
CN106855851A (zh) | 知识抽取方法及装置 | |
CN112417121A (zh) | 客户意图识别方法、装置、计算机设备及存储介质 | |
CN106601256B (zh) | 语音识别的方法及移动终端 | |
CN108563683A (zh) | 标签添加方法、装置及终端 | |
CN101901348B (zh) | 一种基于归一化的手写识别方法和识别装置 | |
CN104407695A (zh) | 一种设备输入方法及装置 | |
CN104680196A (zh) | 手写字符识别方法和系统 | |
CN104699819A (zh) | 一种义原的分类方法及装置 | |
CN102236799A (zh) | 一种多字手写识别的方法及装置 | |
CN102375653A (zh) | 一种滑动输入方法及装置 | |
CN107071553A (zh) | 一种修改视频语音的方法、装置和计算机可读存储介质 | |
CN112084780B (zh) | 自然语言处理中共指消解方法、装置、设备及介质 | |
CN115311674A (zh) | 手写处理方法、装置、电子设备和可读存储介质 | |
CN111507366B (zh) | 推荐概率模型的训练方法、智能补全方法及相关装置 | |
CN113298265A (zh) | 一种基于深度学习的异构传感器潜在相关性学习方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: 100193 Haidian District, Beijing, Northeast China, Beijing Zhongguancun Software Park incubator 2 floor 1. Patentee after: Beijing InfoQuick SinoVoice Speech Technology Corp. Address before: 100193 two, 206-1, Zhongguancun Software Park, 8 Northeast Northeast Road, Haidian District, Beijing, 206-1 Patentee before: Jietong Huasheng Speech Technology Co., Ltd. |