CN102903136A - 一种手写笔迹电子化方法和系统 - Google Patents

一种手写笔迹电子化方法和系统 Download PDF

Info

Publication number
CN102903136A
CN102903136A CN2012103695342A CN201210369534A CN102903136A CN 102903136 A CN102903136 A CN 102903136A CN 2012103695342 A CN2012103695342 A CN 2012103695342A CN 201210369534 A CN201210369534 A CN 201210369534A CN 102903136 A CN102903136 A CN 102903136A
Authority
CN
China
Prior art keywords
handwriting
subarea
hand
information
written
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012103695342A
Other languages
English (en)
Other versions
CN102903136B (zh
Inventor
王平
姜吉喆
肖梨勇
姜辉
姜峰
滕晓敏
Original Assignee
王平
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 王平 filed Critical 王平
Priority to CN201210369534.2A priority Critical patent/CN102903136B/zh
Publication of CN102903136A publication Critical patent/CN102903136A/zh
Application granted granted Critical
Publication of CN102903136B publication Critical patent/CN102903136B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明提出了一种手写笔迹电子化方法,包括步骤:将实体的手写对象的手写区域划分为多个第一子区;采集所述实体的手写对象上的手写区域内的手写笔迹信息并存储;遍历所述手写笔迹信息,判断各笔迹所落入的第一子区,将采集到的手写笔迹划分进多个第一子区;独立识别每一第一子区内的手写笔迹信息,将其转换为电子格式。本发明还提供一种手写笔迹电子化系统,包括实体的手写对象、信息采集装置和手写笔迹电子化平台;实体的手写对象,其手写区域划分为多个第一子区;信息采集装置,用于采集手写笔迹信息,并导入到手写笔迹电子化平台;手写笔迹电子化平台,包括信息接入端口和识别引擎。该方法和系统,有效地提升了手写笔迹的识别准确程度。

Description

一种手写笔迹电子化方法和系统
技术领域
本发明涉及电子信息技术领域,尤其是涉及一种手写笔迹电子化方法和系统。
背景技术
随着电子信息技术的不断发展,日常生活中通过电子管理手段代替原始人工管理的现象越来越多。而电子管理中很多环节,需要将手写的笔迹转化为可以进行编辑和存储的电子格式,比较普遍的做法是人为将手写的笔迹信息通过键盘或者触摸屏等输入设备录入,这无疑增加了相关工作人员的工作量。
现有技术中,有几种较为有效的手段,能够实现手写笔迹的实时转化。有一种处理方式是手写笔自身带有摄像头和电子时钟,能够采集书写时的手写笔迹的相对坐标和书写时间,即能够获知手写笔迹的各笔划的空间信息和时间信息,再将采集的信息通过专门的识别引擎进行识别,即可实现对手写笔迹的分析。
对于上述处理方式,对各笔划的书写时间信息和空间信息进行分析,是通过各点的坐标和书写时间,结合汉字或者其他文字的构成特点,寻找相似度最高的文字,从而实现识别。而这样的识别方式,往往是对采集到的全部文字进行整体识别,识别每一区域的笔划时,都会受到相邻区域的笔划的干扰,会使得识别的准确程度受到一定的影响,导致识别准确度不高。
综上所述,现有技术中的手写笔迹电子化方法,存在识别准确度不高的问题。
发明内容
本发明提出了一种手写笔迹电子化方法和系统,提高了手写笔迹的识别准确度。
为了达到上述目的,本发明的技术方案是这样实现的:
一种手写笔迹电子化方法,包括步骤:
步骤A,将实体的手写对象的手写区域划分为多个第一子区;
步骤B,采集所述实体的手写对象上的手写区域内的手写笔迹信息并存储;
步骤C,遍历所述手写笔迹信息,判断各笔迹所落入的第一子区,将采集到的手写笔迹划分进多个第一子区;
步骤D,独立识别每一第一子区内的手写笔迹信息,将其转换为电子格式。
其中,所述步骤A还包括步骤:为每一个第一子区分配一个用于区分不同第一子区的第一编码;
所述步骤B中的所述笔迹信息包括各笔划的书写时间和各笔划每点的平面坐标;
所述步骤C包括步骤:
C1,采集每个第一子区的边界的平面坐标;将每个第一子区的第一编码和其边界的平面坐标一一对应存储;
C2,遍历当前手写记录文件的所有笔划,将各笔划的平面坐标与所述第一子区的边界坐标进行比较,将平面坐标落入同一第一子区的笔划,划入到同一第一子区,直到所有笔划遍历结束;
C3,根据划入到同一第一子区的笔划的书写时间,计算出该第一子区所包含笔划的所有开始时间点t1和结束时间点t2;
C4,再次遍历当前手写记录文件的所有笔划,将各笔划的书写时间与t1和t2进行比较,若该笔划的开始时间点大于或者等于t1并且结束时间小于或者等于t2,则将该笔划分配到该第一子区,直到所有笔划遍历结束。
其中,所述步骤D之后还包括步骤:
E1,设置与所述实体的手写对象相同分区格式的电子文档,电子显示原始手写笔迹;
E2,将每一第一子区内的笔迹识别出的电子字体按照分区进行显示,与该第一子区的原始手写笔迹进行对比;
E3,选中识别出的电子字体与原始手写笔迹不一致的第一子区,进行修改。
其中,所述步骤E3中进行修改包括步骤:
将被选中的第一子区设为可编辑状态,接受用户输入的内容;
或者,将被选中的第一子区设为可编辑状态,并显示多个备选识别结果供用户选择,接受用户选择的备选识别结果。
其中,用于识别手写记录文件时,所述步骤A之前还包括步骤:
预先为每一手写记录文件设置唯一标识该手写记录文件的第二编码;
进行手写之前,获取当前手写记录文件的第二编码,并记录获取所述第二编码的时间,作为该手写记录文件手写笔迹信息采集的起始点;
所述C中的步骤判断各笔迹所落入的第一子区之前,还包括步骤:
根据获取所述第二编码的时间,判断各笔迹所属的手写记录文件,将从获取当前第二编码的时间点至获取下个第二编码的时间点内的笔迹归属于当前手写记录文件。
其中,所述步骤获取当前手写记录文件的第二编码包括步骤:
在实体的手写记录文件上设置第二编码区,所述第二编码区包括多个第二子区;
采集每个第二子区的边界坐标;
为每个第二子区分配一个所述第二编码,并存储第二子区与第二编码的对应关系;
进行手写之前,在当前手写记录文件的第二编码所对应的区域内勾画;
采集勾画的笔迹的平面坐标,根据所述每个第二子区的边界坐标,判断所述勾画的笔试落入的第二子区,得到所述勾画的笔迹所在的第二子区的第二编码。
其中,所述第一编码为单个数字、数字组合、单个字母、字母组合,或者数字和字母的组合。
其中,所述第二编码为单个数字、数字组合、单个字母、字母组合,或者数字和字母的组合。
本发明还提供一种手写笔迹电子化系统,包括实体的手写对象、信息采集装置和手写笔迹电子化平台;所述实体的手写对象,其手写区域划分为多个第一子区;所述信息采集装置,用于采集手写区域内的手写笔迹信息,并将采集到的手写笔迹信息导入到所述手写笔迹电子化平台;所述手写笔迹电子化平台,包括信息接入端口和识别引擎;所述信息接入端口,用于接收所述信息采集装置导入的笔迹信息;所述识别引擎,用于遍历所述手写笔迹信息,判断各笔迹所落入的第一子区,将采集到的手写笔迹划分进多个第一子区;并独立识别每一第一子区内的手写笔迹信息,将其转换为电子格式。
其中,所述手写笔迹电子化平台还包括显示单元;所述显示单元,用于在与所述实体的手写对象相同分区格式的电子文档上,对比显示所述原始手写笔迹和识别出的电子字体。
其中,所述手写笔迹电子化平台还包括修改单元;所述修改单元,用于选中识别出的电子字体与手写笔迹不一致的第一子区,并实现用户修改。
其中,所述信息采集装置为数码手写笔或者声位笔。
其中,用于识别汉字时,所述第一子区容纳一个汉字;用于识别英语时,所述第一子区容纳一个单词。
其中,所述第一子区为多边形、圆形或者椭圆形;和/或,第一子区的边界为实线、虚线或者二者组合。
可见,本发明至少具有如下的有益效果:
本发明的一种手写笔迹电子化方法和系统,将手写区域进行分区分成多个第一子区,判断各笔迹所落入的第一子区,将属于同一第一子区的笔迹进行独立识别,这样每一第一子区内的内容识别过程中,由于是独立识别,不会受到相邻第一子区的文字笔迹信息的干扰,从而提高了识别准确程度;
优选地,每个第一子区只容纳一个汉字或者一个单词,使得对每个第一子区进行单独分析识别时,识别对象单一,分析难度进一步降低,不受其他文字或单词的笔划影响,从而进一步提高了识别的准确度;
优选地,还提供修改机制,设置与所述实体的手写对象相同分区格式的电子文档,电子显示原始手写笔迹,并将识别后的电子字体与原始手写笔迹一一进行对比,这样每个第一子区的文字单独对比,更易发现错误,发现不一致,则可进行修改,降低了修改的复杂度和工作量;
优选地,预先为每一手写记录文件设置一个用于区分不同手写记录文件的第二编码,每次手写之前,获取当前手写记录文件的第二编码,并记录获取所述第二编码的时间,作为该手写记录文件手写笔迹信息采集的起始点,这样采集的数据中对于每份手写记录文件都有了一个表示该文件开始记录的标记,从而能够明确采集的数据所属的文件,而现有技术中的采集过程,由于对不同文件的笔迹信息连续采集,没有进行任何标记,因此无法区分不同的文件,而本发明,则有效地实现了不同文件的区分。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种手写笔迹电子化方法的实施例一的流程图;
图2为本发明的一种手写笔迹电子化方法的实施例二的流程图;
图3为本发明的一种手写笔迹电子化方法的实施例二中第二编码区的示例图;
图4为本发明的一种手写笔迹电子化方法的实施例二中第一子区的示例图;
图5为本发明的一种手写笔迹电子化方法的实施例二中进行对比显示的示例图;
图6为本发明的一种手写笔迹电子化系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种手写笔迹电子化方法。
实施例一
参见图1所示,本发明实施例一的一种手写笔迹电子化方法,包括步骤:
步骤S110,将实体的手写对象的手写区域划分为多个第一子区。
设置与实体的手写对象相同格式的电子文档,将其手写区域划分为多个第一子区,将分区后的电子文档印刷或打印成实体的手写对象。
所述实体的手写对象为需要进行识别的手写笔迹的载体,可以为各种纸质表格或者具有多张纸质表格的一份文件,如现场勘验检查工作记录、交警用使用的简易处罚决定书、药物滥用监测调查等手写笔迹记录文件。
本发明实施例的该方法可用于识别多种语言,用于识别汉字时,优选地,所述第一子区仅容纳一个汉字;用于识别英语时,所述第一子区仅容纳一个单词。本领域技术人员能够根据本发明的技术构思对每个第一子区所容纳的字数做具体实施,本发明不做限定。
优选地,所述第一子区为多边形,如矩形或者圆角矩形,或者圆形,第一子区的边界为实线或者虚线,如单实线、单虚线、双实线或者双虚线,或外单实线、内单虚线等。
本领域技术人员,可根据本发明实施例的相关描述,对第一子区的划分形式,如每个第一子区内的字的个数、每个第一子区的大小、形状等作出调整,本发明实施例不一一列举。
优选地,为了对不同的第一子区进行区分,为每一个第一子区分配一个用于区分不同第一子区的第一编码。
第一编码可以为单个数字或者数字组合,单个字母或者字母组合,或者数字和字母的组合,或者单个汉字或者汉字组合。显而易见的是,本领域技术人员能够对第一编码的形式作出各种稍许调整和实施,都应属于本发明的保护范围。
步骤S111,采集所述实体的手写对象上的手写区域内的手写笔迹信息并存储。
所述笔迹信息包括各笔划的书写时间和各笔划每点的平面坐标,笔迹信息的采集可由数码手写笔或者声位笔等装置来完成,用数码手写笔进行笔迹采集时,应在实体的手写对象上设置二维点阵坐标。
步骤S112,遍历所述手写笔迹信息,判断各笔迹所落入的第一子区,将采集到的手写笔迹划分进多个第一子区。
在本发明实施例中,作为一种具体实施手段,本步骤具体实施如下:
采集每个第一子区的边界的平面坐标;将每个第一子区的第一编码和其边界的平面坐标一一对应存储。
遍历当前手写记录文件的所有笔划,将各笔划的平面坐标与所述第一子区的边界坐标进行比较,将平面坐标落入同一第一子区的笔划,划入到同一第一子区,直到所有笔划遍历结束。
根据划入到同一第一子区的笔划的书写时间,计算出该第一子区所包含笔划的所有开始时间点t1和结束时间点t2。
再次遍历当前手写记录文件的所有笔划,将各笔划的书写时间与t1和t2进行比较,若该笔划的开始时间点大于或者等于t1并且结束时间小于或者等于t2,则将该笔划分配到该第一子区,直到所有笔划遍历结束。
其中,由于采集到的笔迹信息中包括由各笔划的书写时间和平面坐标信息,因此,可由平面坐标判断各笔划的坐标点落在哪个第一子区,从而完成初步的笔划划分。
由于在书写过程中,可能出现,该笔划的起点和终点均在同一第一子区,但是该笔划的中间部分却被书写到了该第一子区外部,此时,需要再进行遍历,通过各笔划的书写时间判断其归属,此时应该能够判断该笔划的中间部分虽然坐标位于所述第一子区之外,但是从其书写时间来看,应该归属于该第一子区。
步骤S113,独立识别每一第一子区内的手写笔迹信息,将其转换为电子格式。
现有技术中对纸质记录本手写笔迹的电子化和自动识别,通常采用扫描仪进行扫描成图片,对图片进行再处理,该方式可以比较好的对手写笔迹电子化,但是自动识别处理的识别准确率不高。
另外采用超音波和红外线技术进行手写笔迹电子化,识别准确率率仍然不高,同时存在无法区分多份相同记录本的缺点。
本发明实施例的方法通过将手写区域进行分区,可对每一第一子区内的内容进行独立识别,不受到相邻第一子区的文字笔迹信息的干扰,从而提高了识别准确程度。
实施例二
参见图2,本发明实施例2提供了一种手写笔迹电子化方法,包括步骤:
步骤S210:预先为每一手写记录文件设置唯一标识该手写记录文件的第二编码。
本发明实施例二提供的方案,能够解决对多份手写记录文件的准确识别。
在本实施例中,以现场勘查检查笔录为实体的手写记录文件为例,来对本实施例进行详细描述。
当需要对多份现场勘查检查笔录进行识别时,需要对多份笔录进行区分。而现有技术当中,数码手写笔仅能依次采集笔迹信息,无法判断采集到的笔迹信息属于哪一份笔录,本实施例通过第二编码机制,解决了这一问题。
先设置一个与现场勘查检查笔录相同格式的电子文档,将该电子文档的顶部设置第二编码区,所述第二编码区包括多个第二子区,如图3所示的多个编码。设置完成后,将该电子文档印刷或者打印成可书写的实体文档。如此,完成对现场勘查检查笔录第二编码区的设置。
其中,第二子区的形状为多边形,可以为四边形,也可以为三角形、五边形、六边形、圆形等形状,其边界可为实线、虚线或者二者组合。本领域技术人员能够根据本发明的技术构思对第二子区的形状做出具体调整,本实施例不做限定,都应属于本发明的保护范围。
第二编码主要是确定当前笔录的身份,以区分不同的笔录,其获取过程具体包括:
采集每个第二子区的边界坐标;为每个第二子区分配一个所述第二编码,并存储第二子区与第二编码的对应关系。
如图3中所示,需要采集1-20各个编码的方框的坐标。
进行手写之前,在当前手写记录文件的第二编码所对应的区域内勾画;采集勾画的笔迹的平面坐标,根据所述每个第二子区的边界坐标,判断所述勾画的笔试落入的第二子区,得到所述勾画的笔迹所在的第二子区的第二编码。
在实际操作过程中,用户在书写前,告知用户在当前文件所对应的第二编码区域划勾,或者做出其他标记,如画圈,或者画叉等,此时手写笔可以实时将书写笔迹存到手写笔的存储器中,手写笔采集到该笔迹的坐标,由于该坐标属于第二编码区内,因此,后台的识别引擎能够得知其具体的第二编码,并且知道接下来的内容将归属于对本份记录文件,直到下一个标记出现。
将数码手写笔的存储器记录的书写笔迹信息通过USB或者其它数据接口导入到手写笔迹电子化平台。
对采集到的第二编码信息在进行分析,能够得到在记录本上的位置信息,其中包括页号、坐标信息等,所述第二编码为单个数字、数字组合、单个字母、字母组合,或者数字和字母的组合,如1、2、3.……或者A本、B本、C本。
参见图3所示,进行手写之前,获取当前现场勘查检查笔录的第二编码,第二编码在本实施例中即为图3中所示的1-20的编码;图3中在编码为1的方格处划勾,说明当前现场勘查检查笔录的第二编码为1,即为第一本笔录。
划勾的同时,所述手写数码笔会记录这一笔划的平面坐标和书写时间,根据平面坐标判断为哪一第二子区,同时记录了获取所述第二编码的时间,这样,在编码1处划勾的动作就作为该现场勘查检查笔录手写笔迹信息采集的起始点。
在本实施例中,笔迹信息的采集由数码手写笔来完成,这里的数码手写笔指的是基于Anoto技术的电子笔,其英文名为Anoto Digital Pen,也叫Anoto数码笔或Anoto电子笔,其为现有技术,因此不再赘述。
步骤S211,将实体的现场勘查检查笔录的手写区域划分为多个第一子区。
参见图4所示,在本实施例中,按照现场勘查检查笔录的格式,将其可手写的区域划分为多个方格,且每个方格仅能容纳一个汉字。
步骤S212,采集所述现场勘查检查笔录的手写区域内的手写笔迹信息并存储。
数码手写笔会采集到图4中所示的“1”“2”“0”“4”“2”“6”“0”“8”“0”“1”“大”“连”“市”“中”“山”“分”“局”“技”“术”“队”“刑”“警”“二”“中”“队”“姜”“峰”这些笔迹。
步骤S213,遍历所述手写笔迹信息,判断各笔迹所落入的第一子区,将采集到的手写笔迹划分进多个第一子区。
根据获取所述第二编码的时间,判断各笔迹所属的现场勘查检查笔录,将从获取当前第二编码的时间点至获取下个第二编码的时间点内的笔迹归属于当前手写记录文件。
如,在实际操作过程中,可能出现记录完第一份笔录后,又去进行第二份笔录的手写,此时发现第一份笔录的记录出现了问题,需要修改,则返回第一现场勘查检查笔录进行修改,这种情况在现有技术中,手写笔采集到的数据无法区分出到底属于哪一份笔录。而本发明实施例二提供的技术手段,由于在对每一份记录进行手写之前都需要在第二编码区进行标记,所以当从第二份笔录返回第一份笔录时,只需再次对第一份笔录的第二编码区进行标记,即再次在图3中所示的1出划勾,则进行识别时,则相关的识别引擎能够判断该部分的手写笔迹应属于第一份笔录,如此实现区分。
步骤S214,独立识别每一第一子区内的手写笔迹信息,将其转换为电子格式。
优选地,还应在识别之后,对识别结果进行修改。
设置与所述实体的手写对象相同分区格式的电子文档,电子显示原始手写笔迹;将每一第一子区内的笔迹识别出的电子字体按照分区进行显示,与该第一子区的原始手写笔迹进行对比;选中识别出的电子字体与原始手写笔迹不一致的第一子区,进行修改。
其中,修改的方式可以分为两种:将被选中的第一子区设为可编辑状态,接受用户输入的内容;或者,将被选中的第一子区设为可编辑状态,并显示多个备选识别结果供用户选择,接受用户选择的备选识别结果。
在本实施例中,如图5所示,将每个格子对应的识别结果显示在格子的左上或者右上角,这样原始笔迹与识别的结果一一对应,后台运行的手写笔迹电子化平台提供相应的显示单元,如提供一个当前格子指示器,显示当前被选中的方格,并且设定当前被选中方格为可编辑状态,如图5中的粗线条的方格,被选中的格子可以直接在原始笔迹格子上进行修改,其中指示器可以能过上下左右键或者单击鼠标左键进行定位,可以接收单字符或者多个字符修改。
在本实施例中,进行对比显示时,是将识别结果所在的电子文档与手写笔迹的电子文档进行重叠显示,本领域技术人员可根据本发明的技术构思,将所述识别结果的电子字体所在的电子文档与手写笔迹的单子文档进行并排对比或者上下对比等方式,都应属于本发明的保护范围。
其中指示器的形状可以与第一子区的形状相同,也可以与第一子区的形状不同,可以为矩形、圆角矩形或者圆形,指示器的边框同样可以是实线或者虚线。
在现有技术中,对经过电子化的手写笔迹进行再处理目前基本是空白;因此很难应用到实际工作当中,因为实际工作当中往往既要实现电子化手写笔迹,又要避免出错,而现有技术的识别手段,识别准确度无法保证,因为有必要建立修改机制。本发明实施例二提供的修改机制,能够有效地对电子化的笔迹进行及时修改,更具有实际应用的可能。
基于纸质记录本或者表格的手写笔迹电子化过程及后继处理,现有技术只停留在简单的采集原始笔迹采集阶段,然而现实中有大量的工作记录或者表格需要电子化,并希望利用计算机自动识别等技术,将从电子化的工作记录或者表格,减少重复录入到计算机的工作,本实施例提供的一种手写笔迹电子化方法,能够实现对各种表格和工作记录的识别。
本发明实施例提供的一种手写笔记电子化方法,在手写之前进行标记,在标记的同时信息被采集,手写笔实时将书写笔迹存到手写笔的存储器中;当确定记录完毕后,将数码手写笔的存储器记录的书写笔迹信息通过USB或者其它数据接口导入到手写笔迹电子化平台,所述手写笔迹电子化平台利用标记信息将自动区别出多份不同的记录文件的书写笔迹,并将不同的文件的笔迹信息以单独的文件进行存储,接着对单个记录文件中的每个第一子区进行自动识别处理,然后对识别结果按上下对照方式进行校正,最后将处理后的结果输出到第三方系统或者XML(Extensible Markup Language,可扩展标记语言)文件中,这样,提高了识别准确度的同时,能够对不同的文件进行区分,且能够及时校正,更有效地实现了手写笔迹的电子化。
本发明还提供一种手写笔迹电子化系统,参见图6所示,包括实体的手写对象、信息采集装置和手写笔迹电子化平台。
所述实体的手写对象,其手写区域划分为多个第一子区。
优选地,在本发明实施例中,所述第一子区为矩形、圆角矩形或者圆形。
优选地,第一子区的边界为实线或者虚线。
所述信息采集装置,用于采集手写区域内的手写笔迹信息,并将采集到的手写笔迹信息导入到所述手写笔迹电子化平台。
所述手写笔迹电子化平台,包括信息接入端口和识别引擎;所述信息接入端口,用于接收所述信息采集装置导入的笔迹信息;所述识别引擎,用于遍历所述手写笔迹信息,判断各笔迹所落入的第一子区,将采集到的手写笔迹划分进多个第一子区;并独立识别每一第一子区内的手写笔迹信息,将其转换为电子格式。
优选地,所述手写笔迹电子化平台还包括显示单元。所述显示单元,用于在与所述实体的手写对象相同分区格式的电子文档上,对比显示所述原始手写笔迹和识别出的电子字体。
优选地,所述手写笔迹电子化平台还包括修改单元;所述修改单元,用于选中识别出的电子字体与手写笔迹不一致的第一子区,并实现用户修改。
优选地,所述信息采集装置为手写笔或者声位笔。
本发明的一种手写笔迹电子化方法和系统,利用第一子区的划分和第一编码的设置,可以将书写笔迹按设定的方格拆分笔迹,按每个第一子区进行单独识别,这样比直接整行或者整页进行识别的抗干扰强,提升了手写笔迹识别正确率。同时通过第二编码的设置,实现了多份相同记录本的区分。并同时利用上下对照校正技术实现了较为方便的修改。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (14)

1.一种手写笔迹电子化方法,其特征在于,包括步骤:
步骤A,将实体的手写对象的手写区域划分为多个第一子区;
步骤B,采集所述实体的手写对象上的手写区域内的手写笔迹信息并存储;
步骤C,遍历所述手写笔迹信息,判断各笔迹所落入的第一子区,将采集到的手写笔迹划分进多个第一子区;
步骤D,独立识别每一第一子区内的手写笔迹信息,将其转换为电子格式。
2.根据权利要求1所述的手写笔迹电子化方法,其特征在于,所述步骤A还包括步骤:为每一个第一子区分配一个用于区分不同第一子区的第一编码;
所述步骤B中的所述笔迹信息包括各笔划的书写时间和各笔划每点的平面坐标;
所述步骤C包括步骤:
C1,采集每个第一子区的边界的平面坐标;将每个第一子区的第一编码和其边界的平面坐标一一对应存储;
C2,遍历当前手写记录文件的所有笔划,将各笔划的平面坐标与所述第一子区的边界坐标进行比较,将平面坐标落入同一第一子区的笔划,划入到同一第一子区,直到所有笔划遍历结束;
C3,根据划入到同一第一子区的笔划的书写时间,计算出该第一子区所包含笔划的所有开始时间点t1和结束时间点t2;
C4,再次遍历当前手写记录文件的所有笔划,将各笔划的书写时间与t1和t2进行比较,若该笔划的开始时间点大于或者等于t1并且结束时间小于或者等于t2,则将该笔划分配到该第一子区,直到所有笔划遍历结束。
3.根据权利要求1所述的手写笔迹电子化方法,其特征在于,所述步骤D之后还包括步骤:
E1,设置与所述实体的手写对象相同分区格式的电子文档,电子显示原始手写笔迹;
E2,将每一第一子区内的笔迹识别出的电子字体按照与所述电子文档相同的分区格式进行显示,与该第一子区的原始手写笔迹进行一一对比;
E3,选中识别出的电子字体与原始手写笔迹不一致的第一子区,进行修改。
4.根据权利要求3所述的手写笔迹电子化方法,其特征在于,所述步骤E3中进行修改包括步骤:
将被选中的第一子区设为可编辑状态,接受用户输入的内容;
或者,将被选中的第一子区设为可编辑状态,并显示多个备选识别结果供用户选择,接受用户选择的备选识别结果。
5.根据权利要求1所述的手写笔迹电子化方法,其特征在于,用于识别手写记录文件时,所述步骤A之前还包括步骤:
预先为每一手写记录文件设置唯一标识该手写记录文件的第二编码;
进行手写之前,获取当前手写记录文件的第二编码,并记录获取所述第二编码的时间,作为该手写记录文件手写笔迹信息采集的起始点;
所述C中的步骤判断各笔迹所落入的第一子区之前,还包括步骤:
根据获取所述第二编码的时间,判断各笔迹所属的手写记录文件,将从获取当前第二编码的时间点至获取下个第二编码的时间点内的笔迹归属于当前手写记录文件。
6.根据权利要求5所述的手写笔迹电子化方法,其特征在于,所述步骤获取当前手写记录文件的第二编码包括步骤:
在实体的手写记录文件上设置第二编码区,所述第二编码区包括多个第二子区;
采集每个第二子区的边界坐标;
为每个第二子区分配一个所述第二编码,并存储第二子区与第二编码的对应关系;
进行手写之前,在当前手写记录文件的第二编码所对应的区域内勾画;
采集勾画的笔迹的平面坐标,根据所述每个第二子区的边界坐标,判断所述勾画的笔试落入的第二子区,得到所述勾画的笔迹所在的第二子区的第二编码。
7.根据权利要求2所述的手写笔迹电子化方法,其特征在于,所述第一编码为单个数字、数字组合、单个字母、字母组合,或者数字和字母的组合。
8.根据权利要求5所述的手写笔迹电子化方法,其特征在于,所述第二编码为单个数字、数字组合、单个字母、字母组合,或者数字和字母的组合。
9.一种手写笔迹电子化系统,其特征在于,包括实体的手写对象、信息采集装置和手写笔迹电子化平台;
所述实体的手写对象,其手写区域划分为多个第一子区;
所述信息采集装置,用于采集手写区域内的手写笔迹信息,并将采集到的手写笔迹信息导入到所述手写笔迹电子化平台;
所述手写笔迹电子化平台,包括信息接入端口和识别引擎;所述信息接入端口,用于接收所述信息采集装置导入的笔迹信息;所述识别引擎,用于遍历所述手写笔迹信息,判断各笔迹所落入的第一子区,将采集到的手写笔迹划分进多个第一子区;并独立识别每一第一子区内的手写笔迹信息,将其转换为电子格式。
10.根据权利要求9所述的手写笔迹电子化系统,其特征在于,所述手写笔迹电子化平台还包括显示单元;
所述显示单元,用于在与所述实体的手写对象相同分区格式的电子文档上,对比显示所述原始手写笔迹和识别出的电子字体。
11.根据权利要求9所述的手写笔迹电子化系统,其特征在于,所述手写笔迹电子化平台还包括修改单元;
所述修改单元,用于选中识别出的电子字体与手写笔迹不一致的第一子区,并实现用户修改。
12.根据权利要求9-11任一项所述的手写笔迹电子化系统,其特征在于,所述信息采集装置为数码手写笔或者声位笔。
13.根据权利要求9-11任一项所述的手写笔迹电子化系统,其特征在于,用于识别汉字时,所述第一子区容纳一个汉字;
用于识别英语时,所述第一子区容纳一个单词。
14.根据权利要求9-11任一项所述的手写笔迹电子化系统,其特征在于,所述第一子区为多边形、圆形或者椭圆形;
和/或,第一子区的边界为实线、虚线或者二者组合。
CN201210369534.2A 2012-09-28 2012-09-28 一种手写笔迹电子化方法和系统 Active CN102903136B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210369534.2A CN102903136B (zh) 2012-09-28 2012-09-28 一种手写笔迹电子化方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210369534.2A CN102903136B (zh) 2012-09-28 2012-09-28 一种手写笔迹电子化方法和系统

Publications (2)

Publication Number Publication Date
CN102903136A true CN102903136A (zh) 2013-01-30
CN102903136B CN102903136B (zh) 2015-10-21

Family

ID=47575348

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210369534.2A Active CN102903136B (zh) 2012-09-28 2012-09-28 一种手写笔迹电子化方法和系统

Country Status (1)

Country Link
CN (1) CN102903136B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103176651A (zh) * 2013-03-05 2013-06-26 济南道能仁晟软件技术有限公司 一种手写信息快速采集方法
CN104636117A (zh) * 2013-11-12 2015-05-20 江苏奥博洋信息技术有限公司 一种表格图像的自动切分方法
CN105975445A (zh) * 2016-04-12 2016-09-28 简德亮 一种用于工程利用电脑批量随机手写方法
CN108351746A (zh) * 2015-08-25 2018-07-31 迈思慧公司 引导手写输入的系统和方法
CN108664966A (zh) * 2017-04-02 2018-10-16 田雪松 一种笔记记录方法和装置
CN108665503A (zh) * 2017-04-02 2018-10-16 田雪松 位置编码图像处理方法
CN109726989A (zh) * 2018-12-27 2019-05-07 青岛安然物联网科技有限公司 一种手写票证电子化系统
CN109886203A (zh) * 2019-02-26 2019-06-14 江西省农业科学院农业经济与信息研究所 远程签字方法、远程签字端及远程签字系统
CN110050277A (zh) * 2016-11-01 2019-07-23 Bja控股有限公司 用于将手写文本转换成数字墨水的方法和系统
CN111081102A (zh) * 2019-07-29 2020-04-28 广东小天才科技有限公司 一种听写结果的检测方法及学习设备
CN111985189A (zh) * 2020-08-20 2020-11-24 朵镇山 适用于深度学习及思考的模块化笔记系统及电子转换方法
CN112639700A (zh) * 2018-11-19 2021-04-09 深圳市柔宇科技股份有限公司 手写笔迹处理方法、手写输入设备及计算机可读存储介质
CN113330446A (zh) * 2019-05-24 2021-08-31 深圳市柔宇科技股份有限公司 手写识别方法、电子装置和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0981665A (ja) * 1995-09-20 1997-03-28 Canon Inc 文字入力装置及びその方法
JPH1125211A (ja) * 1997-07-04 1999-01-29 Sharp Corp 手書き文字入力システム及びその記憶媒体
CN101533317A (zh) * 2008-03-13 2009-09-16 三星电子株式会社 具备手写识别功能的快速记录装置和方法
CN101539822A (zh) * 2009-01-21 2009-09-23 宇龙计算机通信科技(深圳)有限公司 一种触摸屏手写区域识别方法、系统及触摸屏设备
CN102289322A (zh) * 2011-08-25 2011-12-21 盛乐信息技术(上海)有限公司 手写笔迹处理方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0981665A (ja) * 1995-09-20 1997-03-28 Canon Inc 文字入力装置及びその方法
JPH1125211A (ja) * 1997-07-04 1999-01-29 Sharp Corp 手書き文字入力システム及びその記憶媒体
CN101533317A (zh) * 2008-03-13 2009-09-16 三星电子株式会社 具备手写识别功能的快速记录装置和方法
CN101539822A (zh) * 2009-01-21 2009-09-23 宇龙计算机通信科技(深圳)有限公司 一种触摸屏手写区域识别方法、系统及触摸屏设备
CN102289322A (zh) * 2011-08-25 2011-12-21 盛乐信息技术(上海)有限公司 手写笔迹处理方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ANDREW SENIOR等: "DURATION MODELING RESULTS FOR AN ON-LINE HANDWRITING RECOGNIZER", 《1996 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 1996》, vol. 6, 10 May 1996 (1996-05-10), pages 3482 - 3485, XP000681786, DOI: doi:10.1109/ICASSP.1996.550778 *
郑军: "一种面向字形分析的汉字输入输出处理系统的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 06, 15 June 2010 (2010-06-15), pages 5 - 34 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103176651B (zh) * 2013-03-05 2016-08-03 山东明海软件技术有限公司 一种手写信息快速采集方法
CN103176651A (zh) * 2013-03-05 2013-06-26 济南道能仁晟软件技术有限公司 一种手写信息快速采集方法
CN104636117A (zh) * 2013-11-12 2015-05-20 江苏奥博洋信息技术有限公司 一种表格图像的自动切分方法
CN108351746A (zh) * 2015-08-25 2018-07-31 迈思慧公司 引导手写输入的系统和方法
CN108351746B (zh) * 2015-08-25 2021-07-09 迈思慧公司 引导手写输入的系统和方法
CN105975445A (zh) * 2016-04-12 2016-09-28 简德亮 一种用于工程利用电脑批量随机手写方法
CN110050277A (zh) * 2016-11-01 2019-07-23 Bja控股有限公司 用于将手写文本转换成数字墨水的方法和系统
CN108664966A (zh) * 2017-04-02 2018-10-16 田雪松 一种笔记记录方法和装置
CN108665503A (zh) * 2017-04-02 2018-10-16 田雪松 位置编码图像处理方法
CN112639700A (zh) * 2018-11-19 2021-04-09 深圳市柔宇科技股份有限公司 手写笔迹处理方法、手写输入设备及计算机可读存储介质
CN109726989A (zh) * 2018-12-27 2019-05-07 青岛安然物联网科技有限公司 一种手写票证电子化系统
CN109726989B (zh) * 2018-12-27 2020-08-11 青岛安然物联网科技有限公司 一种手写票证电子化系统
CN109886203A (zh) * 2019-02-26 2019-06-14 江西省农业科学院农业经济与信息研究所 远程签字方法、远程签字端及远程签字系统
CN109886203B (zh) * 2019-02-26 2021-04-06 江西省农业科学院农业经济与信息研究所 远程签字方法、远程签字端及远程签字系统
CN113330446A (zh) * 2019-05-24 2021-08-31 深圳市柔宇科技股份有限公司 手写识别方法、电子装置和存储介质
CN111081102A (zh) * 2019-07-29 2020-04-28 广东小天才科技有限公司 一种听写结果的检测方法及学习设备
CN111985189A (zh) * 2020-08-20 2020-11-24 朵镇山 适用于深度学习及思考的模块化笔记系统及电子转换方法
CN111985189B (zh) * 2020-08-20 2024-04-12 朵镇山 适用于深度学习及思考的模块化笔记系统及电子转换方法

Also Published As

Publication number Publication date
CN102903136B (zh) 2015-10-21

Similar Documents

Publication Publication Date Title
CN102903136B (zh) 一种手写笔迹电子化方法和系统
CN109308476B (zh) 票据信息处理方法、系统及计算机可读存储介质
US10824801B2 (en) Interactively predicting fields in a form
CN103065134B (zh) 一种具有提示信息的指纹识别装置和方法
CN106951400A (zh) 一种pdf文件的信息抽取方法及装置
CN102194123B (zh) 表格模板定义方法和装置
CN102156577B (zh) 实现连续手写识别输入的方法及系统
CN108470021A (zh) Pdf文档中表格的定位方法及装置
CN102156865A (zh) 手写文本行字符切分方法、识别方法
CN105511792A (zh) 一种表单在位手写输入方法及系统
CN107679442A (zh) 单证信息录入的方法、装置、计算机设备及存储介质
CN114253435A (zh) 笔迹显示方法、装置、电子设备和存储介质
EP2884425A1 (en) Method and system of extracting structured data from a document
CN112651331A (zh) 文本表格提取方法、系统、计算机设备及存储介质
CN113901933A (zh) 基于人工智能的电子发票信息抽取方法、装置及设备
CN109726369A (zh) 一种基于标准文献的智能模板化题录技术实现方法
CN104966109A (zh) 医疗化验单图像分类方法及装置
CN111310428A (zh) 一种纸质表格笔迹自动录入传输系统及方法
CN112084103B (zh) 界面测试方法、装置、设备和介质
CN112613367A (zh) 票据信息文本框获取方法、系统、设备及存储介质
CN115880702A (zh) 数据处理方法、装置、设备、程序产品及存储介质
CN112541505B (zh) 文本识别方法、装置以及计算机可读存储介质
JP6896260B1 (ja) レイアウト解析装置、その解析プログラムおよびその解析方法
CN113269101A (zh) 一种票据识别方法、装置和设备
CN106874684A (zh) 一种图像标注系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant