CN104794485B - 一种识别书写字的方法及装置 - Google Patents
一种识别书写字的方法及装置 Download PDFInfo
- Publication number
- CN104794485B CN104794485B CN201510167463.1A CN201510167463A CN104794485B CN 104794485 B CN104794485 B CN 104794485B CN 201510167463 A CN201510167463 A CN 201510167463A CN 104794485 B CN104794485 B CN 104794485B
- Authority
- CN
- China
- Prior art keywords
- word
- information
- written
- matching degree
- alternative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 239000002689 soil Substances 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
本发明公开的识别书写字的方法及装置,所述方法包括:获取用户的书写字信息;找出与所述书写字信息对应的备选文字集合;分析所述书写字信息与所述备选文字集合中各文字的匹配度;根据所述匹配度将所述书写字信息识别为对应的文字。通过本发明的技术方案,能够在书写字识别时,将用户的书写字与若干字形相近的形近字分别进行匹配,从中确定出用户所要书写的汉字,解决了书写字识别时出现的形近字识别错误,提高对用户书写字的识别准确率。
Description
技术领域
本发明涉及书写字识别技术领域,尤其涉及一种识别书写字的方法及装置。
背景技术
现有点读机等产品包含练字功能,提供有自由练字模式,用户可书写任一汉字,系统识别出用户书写的字,然后从笔画数、笔顺、间架结构等多个维度对用户的书写进行综合评价,输出书写评价结果以指导用户的书写练字。
然而,现有技术在识别书写字时存在如下缺陷:当用户书写的汉字存在形近字时系统可能出现误判,出现形近字识别错误的问题,如果发生书写字的识别错误,那么给出的书写评价也是错误的;例如用户想书写的汉字是“土”,系统可能会识别为“士”,然后按照“士”的书写标准对用户的书写进行评价,误导用户学习,影响用户体验。
发明内容
本发明的目的在于提出一种识别书写字的方法及装置,能够解决书写字识别时出现的形近字识别错误的问题,提高对用户书写字识别的准确率。
为达此目的,本发明采用以下技术方案:
一种识别书写字的方法,包括:
获取用户的书写字信息;
找出与所述书写字信息对应的备选文字集合;
分析所述书写字信息与所述备选文字集合中各文字的匹配度;
根据所述匹配度将所述书写字信息识别为对应的文字。
其中,所述找出与所述书写字信息对应的备选文字集合,包括:
将所述书写字信息识别为第一备选文字;
以所述第一备选文字为索引,查找预设的形近字数据库,获得与所述第一备选文字关联的若干形近字;
所述第一备选文字以及所述形近字构成所述书写字信息对应的备选文字集合。
其中,所述找出与所述书写字信息对应的备选文字集合之前,还包括:
设置形近字数据库,所述形近字数据库存储有各文字的形近字关联信息。
其中,所述形近字数据库存储有各文字的特征信息;
所述分析所述书写字信息与所述备选文字集合中各文字的匹配度,包括:
将所述书写字信息分别与所述备选文字集合中各文字的特征信息进行比对,得到所述书写字信息与所述各文字的匹配度。
其中,所述文字的特征信息包括:笔画数、笔画、笔画对应的描红信息。
其中,所述根据所述匹配度将所述书写字信息识别为对应的文字,包括:
找到所述备选文字集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字。
其中,所述根据所述匹配度将所述书写字信息识别为对应的文字,包括:
设定所述书写字信息与所述第一备选文字的匹配度为第一匹配度,所述书写字信息与所述形近字的匹配度为第二匹配度,将所述第一匹配度与第二匹配度进行比较;
若所述第二匹配度减去第一匹配度的差值大于设定的阈值,找到所述备选文字集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字;
若所述第二匹配度减去第一匹配度的差值小于等于设定的阈值,将所述书写字信息识别为所述第一备选文字。
其中,所述根据所述匹配度将所述书写字信息识别为对应的文字,还包括:
若所述第二匹配度减去第一匹配度的差值小于等于零,将所述书写字信息识别为所述第一备选文字;
若所述第二匹配度减去第一匹配度的差值大于零、小于等于设定的阈值,获取所述备选文字集合中各文字的难度信息,获取预设的用户年级信息,找出所述备选文字集合中难度信息与所述用户年级信息对应的文字的集合;找到该集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字。
本发明另一方面提供一种识别书写字的装置,包括:
书写字获取模块,用于获取用户的书写字信息;
备选集确定模块,用于找出与所述书写字信息对应的备选文字集合;
分析模块,用于分析所述书写字信息与所述备选文字集合中各文字的匹配度;
识别模块,用于根据所述匹配度将所述书写字信息识别为对应的文字。
其中,所述找出与所述书写字信息对应的备选文字集合,包括:
将所述书写字信息识别为第一备选文字;
以所述第一备选文字为索引,查找预设的形近字数据库,获得与所述第一备选文字关联的若干形近字;
所述第一备选文字以及所述形近字构成所述书写字信息对应的备选文字集合。
其中,还包括:
设置模块,用于设置形近字数据库,所述形近字数据库存储有各文字的形近字关联信息。
其中,形近字数据库存储有各文字的特征信息;
所述分析所述书写字信息与所述备选文字集合中各文字的匹配度,包括:
将所述书写字信息分别与所述备选文字集合中各文字的特征信息进行比对,得到所述书写字信息与所述各文字的匹配度。
其中,所述文字的特征信息包括:笔画数、笔画、笔画对应的描红信息。
其中,所述根据所述匹配度将所述书写字信息识别为对应的文字,包括:
找到所述备选文字集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字。
其中,所述根据所述匹配度将所述书写字信息识别为对应的文字,包括:
设定所述书写字信息与所述第一备选文字的匹配度为第一匹配度,所述书写字信息与所述形近字的匹配度为第二匹配度,将所述第一匹配度与第二匹配度进行比较;
若所述第二匹配度减去第一匹配度的差值大于设定的阈值,找到所述备选文字集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字;
若所述第二匹配度减去第一匹配度的差值小于等于设定的阈值,将所述书写字信息识别为所述第一备选文字;
其中,所述阈值大于零。
其中,所述根据所述匹配度将所述书写字信息识别为对应的文字,还包括:
若所述第二匹配度减去第一匹配度的差值小于等于零,将所述书写字信息识别为所述第一备选文字;
若所述第二匹配度减去第一匹配度的差值大于零、小于等于设定的阈值,获取所述备选文字集合中各文字的难度信息,获取预设的用户年级信息,找出所述备选文字集合中难度信息与所述用户年级信息对应的文字的集合;找到该集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字。
实施本发明实施例,具有如下有益效果:
本发明实施例通过获取用户的书写字信息;找出与所述书写字信息对应的备选文字集合;分析所述书写字信息与所述备选文字集合中各文字的匹配度;根据所述匹配度将所述书写字信息识别为对应的文字。本发明方案通过将用户的书写字与若干字形相近的形近字分别进行匹配,从中确定出用户所要书写的汉字,解决了书写字识别时出现的形近字识别错误,提高对用户书写字识别的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明第一实施例的识别书写字的方法的流程示意图。
图2是本发明第一实施例的形近字数据库的示意图。
图3是本发明第二实施例的识别书写字的方法流程示意图。
图4是本发明第二实施例显示当前书写字的形近字的示意图。
图5是本发明第三实施例的识别书写字的方法流程示意图。
图6是本发明第四实施例的识别书写字的装置的结构示意图。
具体实施方式
下面结合本发明的附图对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
实现本发明以下实施例的硬件基础可为点读机或者其他提供练字辅助功能的电子设备,可接收用户的书写字信息,包括书写的笔顺、笔画和文字书写的间架结构信息,识别所述书写字信息对应的文字,进而对用户的书写情况进行评价。具体的,可通过触摸屏接收用户手指的书写字信息,或者通过感应屏接收书写笔的书写字信息,还可以为其他方式,本发明对此不作限定。
第一实施例
下面结合图1、图2对本发明第一实施例的识别书写字的方法流进行说明,包括如下步骤:
步骤S101,获取用户的书写字信息。
第一实施例中,所述的书写字信息包括用户书写的笔画信息、笔顺信息、文字的间架结构信息等。
步骤S102,找出与所述书写字信息对应的备选文字集合。
第一实施例中,需预先建立一形近字数据库,所述形近字数据库存储有各文字的形近字关联信息,通过查询该形近字数据库,可得到与所述书写字信息对应的备选文字集合,该备选文字集合中的文字字形相近。
本实施例中,获取用户的书写字信息之后,首选按照现有的书写字识别技术将所述书写字信息识别为第一备选文字;再以所述第一备选文字为索引查找预设的形近字数据库,获得与所述第一备选文字关联的若干形近字,所述第一备选文字以及所述形近字构成所述书写字信息对应的备选文字集合。
优选的,如图2所示建立形近字数据库,包括的属性有索引汉字、形近字、笔画数、笔画、各笔画的描红信息(每个笔画标准笔迹的绝对坐标点数据)、以及形近字的索引关联(体现为索引号)等。若用户想写的文字为“士”,由于用户书写不够规范,按照现有的书写字识别技术可能将所述书写字信息识别为“土”,通过本实施例可以“土”为索引查找所述形近字数据库,获得与“土”关联的形近字有“士”、“工”,则当前书写字信息对应的备选文字集合为{土,士,工}。
步骤S103,分析所述书写字信息与所述备选文字集合中各文字的匹配度。
第一实施例中,通过将所述书写字信息分别与所述备选文字集合中各文字的特征信息进行比对,得到所述书写字信息与各文字的匹配度,匹配度越高,表明字形越相似。优选的,本实施例中,即是将所述书写字信息分别与所述备选文字集合中各文字的笔画数、笔画、笔画对应的描红信息进行比对,得出所述书写字信息与所述第一备选文字、所述第一备选文字的各形近字的匹配度。
需要说明的是,计算书写字信息与文字的匹配度的方法可采用现有的计算方法,本发明对此不作限定。
步骤S104,根据所述匹配度将所述书写字信息识别为对应的文字。
第一实施例中,可找到所述备选文字集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字。例如,若所述备选文字集合{土,士,工}中各文字与用户书写字信息匹配度依次为0.8、0.87、0.4,则找出匹配度最高的为文字为“士”,将所述书写字信息识别为“士”。
实际生活中,用户想书写的文字可能为“士”,由于书写不够规范,现有技术可能会直接将书写字信息识别为“土”,此时若以“土”的书写标准评价用户的书写情况,显然对用户造成误导;通过本发明实施例,通过形近字匹配,可提高用户书写字识别的准确率,防止出现书写字的形近字识别错误,有效避免了错误的书写评价误导用户。
需要说明的是,若所述形近字数据库中不存在当前书写字信息对应的形近字集合,则直接按照现有技术识别前书写字信息。
通过本发明第一实施例,通过建立形近字数据库,把常见的字形相近的形近字组合建立索引关联,在书写字识别时,将用户的书写字特征与若干形近字分别进行匹配,从中确定出用户所要书写的汉字,解决了书写字识别时出现的形近字识别错误,提高对用户书写字识别的准确率。
第二实施例
第二实施例在第一实施例的基础上,给出了另外一种根据形近字匹配度将所述书写字信息识别为对应的文字的实施方式,下面结合图3对本发明的第二实施例进行说明,包括如下步骤。
步骤S201,获取用户的书写字信息。
第二实施例中,本步骤的具体实施方式可参考上述第一实施例所述,在作赘述。
步骤S202,将所述书写字信息识别为第一备选文字。
第二实施例中,可按照现有的任一书写字识别方法将所述书写字信息识别为对应的文字,本实施例中将识别出的该文字视为第一备选文字。
需要说明的是,现有设备的书写字识别方法只包含一步识别,即将所述第一备选文字确定为所述书写字信息的识别结果,本实施例中,所述第一备选文字只是作为一个参考文字,但并不一定是所述书写字信息的最终识别结果,由此防止出现形近字的识别错误。
步骤S203,查找预设的形近字数据库,是否存在与所述第一备选文字关联的形近字?若是,执行下一步骤,否则,执行步骤S210.
第二实施例中,需预先设置一形近字数据库,该形近字数据库的设置方式可参考上述第一实施例,不作赘述。
本实施例中,以所述第一备选文字为索引,查找预设的形近字数据库,若对应的形近字属性不为空,则获取与所述第一备选文字关联的形近字;若对应的形近字属性为空,表明不存在与所述第一备选文字关联的形近字,即是,若查找预设的形近字数据库,没有找到与所述第一备选文字关联的形近字,则将所述书写字信息识别为所述第一备选文字,文字识别结束。
优选的,若存在形近字,可在当前书写界面上显性化输出对应的形近字,以更人性化地让用户知道,避免让用户误解。显性化输出书写字的形近字的方式可参考图3所示,即在用户书写字的下方显示与当前书写字形近的形近字。
步骤S204,获得与所述书写字信息对应的备选文字集合。
本实施例中,所述第一备选文字以及所述形近字一起构成所述书写字信息对应的备选文字集合。
步骤S205,分析所述书写字信息与所述备选文字集合中各文字的匹配度。
本实施例中该步骤的实施方式具体为:分析所述书写字信息与所述第一备选文字的第一匹配度,分析所述书写字信息与所述形近字的第二匹配度。
可记所述第一匹配度为a,记所述第二匹配度为b,若与所述第一备选文字关联的形近字为n个,则可记所述第二匹配度为(b1、b2、b3、…、bn)。
步骤S206,将所述第一匹配度与第二匹配度进行比较。
第二实施例中,即是将所述第一匹配度a与所述第二匹配度b进行比较,若与所述第一备选文字关联的形近字为两个以上(n个),则是将所述第一匹配度a分别与第二匹配度b1、b2、b3、…、bn进行比较。
步骤S207,所述第二匹配度减去第一匹配度的差值是否大于设定的阈值?若是,执行下一步骤,否则,执行步骤S209。
第二实施例中,即是判断第二匹配度b减去第一匹配度a的差值是否大于设定的阈值。需要说明的是,若与所述第一备选文字关联的形近字为两个以上(n个),则需分别判断第二匹配度b1、b2、b3、…、bn与第一匹配度a的差值是否大于设定的阈值,若任一第二匹配度b1、b2、b3、…、bn与第一匹配度a的差值大于设定的阈值,则执行下一步骤,否则,执行步骤S209。
步骤S208,找到所述备选文字集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字。识别结束。
需要说明的是,若第一匹配度a大于任何第二匹配度,即第二匹配度b减去第一匹配度a的差值小于零,则将所述书写字信息识别为第一备选文字,否则,将所述书写字信息识别为与所述书写字信息的第二匹配度最高的形近字。
步骤S209,将所述书写字信息识别为所述第一备选文字。
第二实施例中,若第一备选文字与所述书写字信息的匹配度最高,或者形近字数据库中不存在第一备选文字关联的形近字,则排除形近字错误识别的可能,将所述书写字信息识别为所述第一备选文字。
通过上述第二实施例,将所述书写字信息识别为第一备选文字,找到与所述第一备选文字关联的若干形近字;若第一备选文字的形近字与所述书写字信息的匹配度与第一备选文字本身与所述书写字信息的匹配度相差较小时,则排除形近字错误识别的可能,将所述书写字信息识别为所述第一备选文字,可消除由于用户书写不规范导致的误判,识别机制更加灵活、准确。
第三实施例
在上述第一、第二实施例的基础上,第三实施例作出了进一步的改进,特别是当第一备选文字的形近字与所述书写字信息的匹配度与第一备选文字本身与所述书写字信息的匹配度相差较小时,可进一步的提高识别准确度。
下面结合图5,对本发明第三实施例的识别书写字的方法进行说明,包括如下步骤:
步骤S301,获取用户的书写字信息。
步骤S302,将所述书写字信息识别为第一备选文字。
步骤S303,查找预设的形近字数据库,是否存在与所述第一备选文字关联的形近字?若是,执行下一步骤,否则,执行步骤S311.
步骤S304,找到与所述书写字信息对应的备选文字集合。
步骤S305,分析所述书写字信息与所述备选文字集合中各文字的匹配度。
步骤S306,将所述第一匹配度与第二匹配度进行比较。
步骤S307,所述第二匹配度减去第一匹配度的差值是否大于设定的阈值?若是,执行下一步骤,否则,执行步骤S309。
步骤S308,找到所述备选文字集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字。识别结束。
步骤S309,所述第二匹配度减去第一匹配度的差值是否大于零?若是,执行下一步骤,否则,执行步骤S311.
步骤S310,若所述第二匹配度减去第一匹配度的差值大于零、小于设定的阈值,则根据所述备选文字集合中各文字的难度信息、预设的用户年级信息将所述书写字信息识别为对应的文字。识别结束。
第三实施例中,具体为:获取所述备选文字集合中各文字的难度信息,获取预设的用户年级信息。优选的,在上述形近字数据库中还存储有各文字的难度信息,例如文字“土”的难度为“一年级”,文字“疑”的难度为“二年级”等。然后找出所述备选文字集合中与用户年级信息对应难度的文字集合,例如获得用户年级信息为一年级,则找出所述备选文字集合中难度属性为“一年级”的文字的集合(该集合必然被包含在所述备选文字集合之中),从该集合中找出与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字。
步骤S311,将所述书写字信息识别为所述第一备选文字。
本实施例中,若形近字数据库中不存在第一备选文字关联的形近字,或者所述第二匹配度减去第一匹配度的差值小于等于零,则直接将所述书写字信息识别为所述第一备选文字,识别结束。
需要说明的是,上述步骤S301-S308的具体实施方式可参考上述第二实施例所述,本实施例不作赘述。
通过上述第三实施例,先按照现有识别方式将所述书写字信息识别为第一备选文字,再查找预设的形近字数据库,获得与所述第一备选文字关联的若干形近字。若第一备选文字的形近字与所述书写字信息的匹配度大于所述第一备选文字本身与所述书写字信息的匹配度但小于预设的阈值时,则进一步的根据所述备选文字集合中各文字的难度信息、预设的用户年级信息将所述书写字信息识别为对应的文字,识别机制更加智能,识别准确率更高。
第四实施例
第四实施例为一种识别书写字的装置的实施例,所述装置的实施例与上述的方法实施例属于同一构思,第四实施例中未详尽描述的细节内容,可以参考上述方法实施例。
如图6所示,所述识别书写字的装置包括:书写字获取模块310、备选集确定模块320、分析模块330和识别模块340,下面对各模块进行具体说明。
所述书写字获取模块310,用于获取用户的书写字信息。
本实施例中,所述书写字信息包括笔顺、笔画、以及文字的间架结构等属性信息。
所述备选集确定模块320,用于找出与所述书写字信息对应的备选文字集合。
第四实施例中,可先将所述书写字信息识别为第一备选文字,以所述第一备选文字为索引,查找预设的形近字数据库,获得与所述第一备选文字关联的若干形近字;所述第一备选文字以及所述形近字构成所述书写字信息对应的备选文字集合。
优选的,本实施例的识别书写字的装置还包括:设置模块,用于设置形近字数据库,所述形近字数据库存储有各文字的形近字关联信息。
所述分析模块330,用于分析所述书写字信息与所述备选文字集合中各文字的匹配度。
第四实施例中,所述形近字数据库还存储有各文字的特征信息,例如笔画数、笔画、笔画对应的描红信息;上述的分析所述书写字信息与所述备选文字集合中各文字的匹配度,具体可为:将所述书写字信息分别与所述备选文字集合中各文字的特征信息进行比对,得到所述书写字信息与各文字的匹配度。
所述识别模块340,用于根据所述匹配度将所述书写字信息识别为对应的文字。
作为一优选实施方式,所述识别模块340具体可用于:找到所述备选文字集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字。
作为另一优选实施方式,所述识别模块340具体可用于:设定所述书写字信息与所述第一备选文字的匹配度为第一匹配度,所述书写字信息与所述形近字的匹配度为第二匹配度,将所述第一匹配度与第二匹配度进行比较;若所述第二匹配度减去第一匹配度的差值大于设定的阈值,找到所述备选文字集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字;若所述第二匹配度减去第一匹配度的差值小于等于设定的阈值,将所述书写字信息识别为所述第一备选文字。
作为又一优选实施方式,所述识别模块340具体可用于:设定所述书写字信息与所述第一备选文字的匹配度为第一匹配度,所述书写字信息与所述形近字的匹配度为第二匹配度,将所述第一匹配度与第二匹配度进行比较;若所述第二匹配度减去第一匹配度的差值大于设定的阈值,找到所述备选文字集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字;若所述第二匹配度减去第一匹配度的差值小于等于零,则将所述书写字信息识别为所述第一备选文字;若所述第二匹配度减去第一匹配度的差值大于零、小于等于设定的阈值,获取所述备选文字集合中各文字的难度信息,获取预设的用户年级信息,找出所述备选文字集合中与用户年级信息对应难度的文字集合;找到该文字集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利要求范围,因此,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,仍属本发明所涵盖的范围。
Claims (8)
1.一种识别书写字的方法,其特征在于,包括:
获取用户的书写字信息,并将所述书写字信息识别为第一备选文字;
以所述第一备选文字为索引,查找预设的形近字数据库,获得与所述第一备选文字关联的若干形近字;
所述第一备选文字以及所述形近字构成所述书写字信息对应的备选文字集合;
分析所述书写字信息与所述备选文字集合中各文字的匹配度;
根据所述匹配度将所述书写字信息识别为对应的文字;
其中,所述分析所述书写字信息与所述备选文字集合中各文字的匹配度,包括:
设定所述书写字信息与所述第一备选文字的匹配度为第一匹配度,所述书写字信息与所述形近字的匹配度为第二匹配度,将所述第一匹配度与第二匹配度进行比较;
所述根据所述匹配度将所述书写字信息识别为对应的文字,包括:
若所述第二匹配度减去第一匹配度的差值大于设定的阈值,找到所述备选文字集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字;
若所述第二匹配度减去第一匹配度的差值小于等于零,将所述书写字信息识别为所述第一备选文字;
若所述第二匹配度减去第一匹配度的差值大于零、小于等于设定的阈值,获取所述备选文字集合中各文字的难度信息,获取预设的用户年级信息,找出所述备选文字集合中难度信息与所述用户年级信息对应的文字的集合,找到该集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字。
2.如权利要求1所述识别书写字的方法,其特征在于,所述找出与所述书写字信息对应的备选文字集合之前,还包括:
设置形近字数据库,所述形近字数据库存储有各文字的形近字关联信息。
3.如权利要求1所述识别书写字的方法,其特征在于,所述形近字数据库存储有各文字的特征信息;
所述分析所述书写字信息与所述备选文字集合中各文字的匹配度,包括:
将所述书写字信息分别与所述备选文字集合中各文字的特征信息进行比对,得到所述书写字信息与所述各文字的匹配度。
4.如权利要求3所述识别书写字的方法,其特征在于,所述文字的特征信息包括:笔画数、笔画、笔画对应的描红信息。
5.一种识别书写字的装置,其特征在于,包括:
书写字获取模块,用于获取用户的书写字信息;
备选集确定模块,用于找出与所述书写字信息对应的备选文字集合;
分析模块,用于分析所述书写字信息与所述备选文字集合中各文字的匹配度;
识别模块,用于根据所述匹配度将所述书写字信息识别为对应的文字;
其中,所述备选集确定模块,具体用于将所述书写字信息识别为第一备选文字,以所述第一备选文字为索引,查找预设的形近字数据库,获得与所述第一备选文字关联的若干形近字,所述第一备选文字以及所述形近字构成所述书写字信息对应的备选文字集合;
所述识别模块,具体用于设定所述书写字信息与所述第一备选文字的匹配度为第一匹配度,所述书写字信息与所述形近字的匹配度为第二匹配度,将所述第一匹配度与第二匹配度进行比较,若所述第二匹配度减去第一匹配度的差值大于设定的阈值,找到所述备选文字集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字,若所述第二匹配度减去第一匹配度的差值小于等于零,将所述书写字信息识别为所述第一备选文字,若所述第二匹配度减去第一匹配度的差值大于零、小于等于设定的阈值,获取所述备选文字集合中各文字的难度信息,获取预设的用户年级信息,找出所述备选文字集合中难度信息与所述用户年级信息对应的文字的集合,找到该集合中与所述书写字信息匹配度最高的文字,将所述书写字信息识别为该文字。
6.如权利要求5所述的识别书写字的装置,其特征在于,还包括:
设置模块,用于设置形近字数据库,所述形近字数据库存储有各文字的形近字关联信息。
7.如权利要求5所述的识别书写字的装置,其特征在于,形近字数据库存储有各文字的特征信息;
所述分析所述书写字信息与所述备选文字集合中各文字的匹配度,包括:
将所述书写字信息分别与所述备选文字集合中各文字的特征信息进行比对,得到所述书写字信息与所述各文字的匹配度。
8.如权利要求7所述的识别书写字的装置,其特征在于,所述文字的特征信息包括:笔画数、笔画、笔画对应的描红信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510167463.1A CN104794485B (zh) | 2015-04-09 | 2015-04-09 | 一种识别书写字的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510167463.1A CN104794485B (zh) | 2015-04-09 | 2015-04-09 | 一种识别书写字的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104794485A CN104794485A (zh) | 2015-07-22 |
CN104794485B true CN104794485B (zh) | 2018-04-03 |
Family
ID=53559272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510167463.1A Active CN104794485B (zh) | 2015-04-09 | 2015-04-09 | 一种识别书写字的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104794485B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105139698B (zh) * | 2015-07-31 | 2018-03-27 | 广东小天才科技有限公司 | 一种点读机的信息录入方法及装置 |
CN106354752A (zh) * | 2016-08-16 | 2017-01-25 | 广东小天才科技有限公司 | 一种文字查找方法及装置、电子设备 |
CN109598265B (zh) * | 2017-09-30 | 2021-09-28 | 顺丰科技有限公司 | 一种文字识别方法、系统、设备、计算机可读存储介质 |
CN107862024A (zh) * | 2017-10-31 | 2018-03-30 | 广东小天才科技有限公司 | 一种汉字的学习方法及电子设备 |
CN110019760B (zh) * | 2017-11-02 | 2022-05-06 | 中移(杭州)信息技术有限公司 | 一种文本信息的处理方法及系统 |
CN109472234B (zh) * | 2018-11-01 | 2021-07-20 | 北京爱知之星科技股份有限公司 | 一种手写输入智能识别的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06111076A (ja) * | 1992-09-28 | 1994-04-22 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
CN1470975A (zh) * | 2002-07-22 | 2004-01-28 | 北京大学 | 一种汉字输入方法和使用该方法的系统 |
CN102945369A (zh) * | 2012-10-17 | 2013-02-27 | 华南理工大学 | 一种文字识别方法 |
-
2015
- 2015-04-09 CN CN201510167463.1A patent/CN104794485B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06111076A (ja) * | 1992-09-28 | 1994-04-22 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
CN1470975A (zh) * | 2002-07-22 | 2004-01-28 | 北京大学 | 一种汉字输入方法和使用该方法的系统 |
CN102945369A (zh) * | 2012-10-17 | 2013-02-27 | 华南理工大学 | 一种文字识别方法 |
Non-Patent Citations (2)
Title |
---|
MLDA_LDA手写汉字识别中一种两级LDA分类方法;杨端端等;《广西师范大学学报自然科学版》;20061231;全文 * |
候选字静态生成技术及其在两级LDA汉字识别中的应用;刘志斌等;《proceedings of the 26th Chinese control conference》;20070731;第571-574页,图4 * |
Also Published As
Publication number | Publication date |
---|---|
CN104794485A (zh) | 2015-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104794485B (zh) | 一种识别书写字的方法及装置 | |
CN111753767B (zh) | 一种作业自动批改的方法、装置、电子设备和存储介质 | |
CN109271401B (zh) | 一种题目搜索、批改方法、装置、电子设备和存储介质 | |
CN109583429B (zh) | 一种批改试卷中应用题的方法及装置 | |
CN102609735B (zh) | 一种字符书写规范度评测的方法和装置 | |
CN106815192B (zh) | 模型训练方法及装置和语句情感识别方法及装置 | |
CN107622271B (zh) | 手写文本行提取方法及系统 | |
CN104008363B (zh) | 手写轨迹的检测、规范化和在线识别以及异常字根的收集 | |
CN107633250A (zh) | 一种文字识别纠错方法、纠错系统及计算机装置 | |
CN105260751B (zh) | 一种文字识别方法及其系统 | |
CN109993019A (zh) | 基于连通域分析的二维码识别方法、系统及设备和介质 | |
CN103455264B (zh) | 一种手写汉字输入方法及具有该方法的电子装置 | |
CN114549993B (zh) | 实验中线段图像的评分方法、系统、设备及可读存储介质 | |
CN102663454B (zh) | 一种字符书写规范度评测的方法和装置 | |
CN101763516A (zh) | 一种基于拟合函数的文字识别方法 | |
CN110414563A (zh) | 考试成绩统计方法、系统及计算机可读存储介质 | |
CN100555312C (zh) | 利用字符结构信息进行后处理的手写识别的方法和装置 | |
CN101894266A (zh) | 一种手写识别方法及系统 | |
CN109086336A (zh) | 试卷数据存储方法、装置及电子设备 | |
CN104750831A (zh) | 一种汉字智能学习方法及系统 | |
CN102243708B (zh) | 一种手写识别方法、系统及手写识别终端 | |
CN115641308A (zh) | 一种书法字临摹评价系统 | |
CN112163400B (zh) | 信息处理方法及装置 | |
CN101901348B (zh) | 一种基于归一化的手写识别方法和识别装置 | |
CN101216947B (zh) | 基于笔段网格的手写汉字输入方法和汉字识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |