CN102385700B - 脱机手写识别的方法及装置 - Google Patents
脱机手写识别的方法及装置 Download PDFInfo
- Publication number
- CN102385700B CN102385700B CN 201010268489 CN201010268489A CN102385700B CN 102385700 B CN102385700 B CN 102385700B CN 201010268489 CN201010268489 CN 201010268489 CN 201010268489 A CN201010268489 A CN 201010268489A CN 102385700 B CN102385700 B CN 102385700B
- Authority
- CN
- China
- Prior art keywords
- block
- candidate
- recording layer
- rule
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
本发明公开了一种脱机手写识别的方法及装置,涉及文字识别领域,用以获取到符合规则的识别结果。本发明实施例提供的方法,包括:按照书写顺序对待识别字符进行过切分,从而得到至少一个切分块,每个所述切分块对应一个记录层;在每个记录层中记录下从第一个切分块到该记录层对应的切分块合并识别后得到的、且符合预设的规则的候选字块,所述候选字块记录有该候选字块与前向相邻的候选字块的衔接关系;从最后一记录层中选取一个与所述规则匹配程度最高的候选字块作为优选字块,并根据所述候选字块记录的衔接关系依次获取所述优选字块前向多个候选字块,以组成字符串。本发明实施例提供的方案,适用于对具有固定书写格式的文本进行准确识别。
Description
技术领域
本发明涉及文字识别领域,尤其涉及一种脱机手写识别的方法及装置。
背景技术
脱机手写识别,研究的是如何将记录或显示在纸质文件等载体上的字符转换成计算机可读取的字符或编码。目前常用的脱机手写识别,例如OCR(Optical Character Recognition,光学字符识别),基本上都是先对待识别的文字或者数字进行扫描、过切分,然后再根据识别、几何和语义的信息进行合并,查找最优合并路径,从而根据所述最优合并路径得到识别出的文字或数字。
针对支票、信封等具有固定书写格式的文本载体而言,在进行文字识别的过程中除了考虑文字或数字的识别、几何和语义信息之外,还需要考虑上述固定书写格式所依据的规则。目前,有研究者提出先查找多信息(识别、几何和语义)合并后的最优的Q(Q≥2)条路径,然后在这Q条路径中选择符合规则的路径作为候选路径。
在实现上述进行脱机手写识别的过程中,发明人发现现有技术中至少存在如下问题:
在查找最优合并路径的过程中,过切分后得到的切分块可能有几十块,经过合并后,每个合并字块的候选识别结果又有若干个,这样实际出现的合并路径就会达到上千条,从中选取的最优的Q条路径也只是其中的一小部分。而通常符合规则的路径可能会由于不符合通用的几何、语义模型而没有出现在所述最优的前Q条路径中,这样最终得到的合并路径可能是不符合规则的。
发明内容
本发明的实施例提供一种脱机手写识别的方法及装置,用以获取到符合规则的识别结果。
本发明的实施例采用如下技术方案:
一种脱机手写识别的方法,包括:
按照书写顺序对待识别字符进行过切分,从而得到至少一个切分块,每个所述切分块对应一个记录层;
在每个记录层中记录下从第一个切分块到该记录层对应的切分块合并识别后得到的、且符合预设的规则的候选字块,所述候选字块记录有该候选字块与其前向相邻的候选字块的衔接关系;
从最后一记录层中选取一个与所述规则匹配程度最高的候选字块作为优选字块,并根据所述候选字块记录的衔接关系依次获取所述优选字块前向多个候选字块,以组成字符串。
一种脱机手写识别的装置,包括:
过切分单元,用于按照书写顺序对待识别字符进行过切分,从而得到至少一个切分块,每个所述切分块对应一个记录层;
记录单元,用于在每个记录层中记录下从第一个切分块到该记录层对应的切分块合并识别后得到的、且符合预设的规则的候选字块,所述候选字块记录有该候选字块与其前向相邻的候选字块的衔接关系;
确定单元,用于从最后一记录层中选取一个与所述规则匹配程度最高的候选字块作为优选字块,并根据所述候选字块记录的衔接关系依次获取所述优选字块前向多个候选字块,以组成字符串。
本发明实施例提供的脱机手写识别的方法及装置,将规则引入到过切分后切分块的合并识别过程中,相当于在合并识别的过程中就同时考虑了规则、几何、识别和语义信息对识别结果的影响,从而最大可能地得到实际应用中所需要的识别结果,进而改善识别效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的脱机手写识别的方法流程图;
图2为本发明实施例一提供的规则示意图;
图3为本发明实施例一提供的输入图像;
图4为本发明实施例一提供的脱机手写识别方法的具体流程图;
图5为本发明实施例一提供的输入图像过切分后得到的切分块;
图6为本发明实施例一提供的各切分块对应的层结构图;
图7为本发明实施例一提供的第一个切分块识别结束后的层结构图;
图8为本发明实施例一提供的前两个切分块合并识别后的层结构图;
图9为本发明实施例一提供的最终的层结构图;
图10为本发明实施例一提供的使用规则后得到的识别结果;
图11为未使用规则进行识别后得到的识别结果;
图12为本发明实施例一提供的需要模糊规则评价的实例的输入图像;
图13为图12中的输入图像过切分后的切分块;
图14为图12中的输入图像的最终的层结构图;
图15为根据图14得到的合并路径1对应的矩阵图;
图16为根据图14得到的合并路径2对应的矩阵图;
图17为本发明提供的脱机手写识别的装置示意图;
图18为本发明实施例二提供的脱机手写识别的装置示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了获取到符合规则的手写识别结果,本发明实施例中提供了一种脱机手写识别方法和装置。下面将结合附图对本发明实施例中提供的方法和装置进行详细描述。
如图1所示,本发明实施例提供脱机手写识别的方法,包括:
11、按照书写顺序对待识别字符进行过切分,从而得到至少一个切分块,每个所述切分块对应一个记录层。
按照一般的书写习惯,所述书写顺序可以是从左到右、从上到下;当然,对于某些语言来说,其书写顺序也可以是从右至左。在本实施例中,并不对书写顺序进行限定,其需要根据具体的待识别字符来判断。
12、在每个记录层中记录下从第一个切分块到该记录层对应的切分块合并识别后得到的、且符合预设的规则的候选字块,所述候选字块记录有该候选字块与其前向相邻的候选字块的衔接关系。
其中,所述规则可以是根据实际需要所预设的书写规范。例如,邮政编码的规则是6个数字。
记录所述候选字块与其前向相邻的候选字块的衔接关系,是为了建立相邻候选字块之间的联系,以便于查找符合所述规则的字符串。
13、从最后一记录层中选取一个与所述规则匹配程度最高的候选字块作为优选字块,并根据所述候选字块记录的衔接关系依次获取所述优选字块前向多个候选字块,以组成字符串。
在最后一记录层中所述优选字块确定后,即可利用该优选字块记录的衔接关系获知到其前向相邻的一个候选字块;依次类推,一直回溯到第一个候选字块,即可得到一条串联了所有候选字块的路径,该路径上记录的字符串即为针对待识别字符的最终识别结果。
通过上述的脱机手写识别方法,可以将规则引入到过切分后切分块的合并识别过程中,相当于在合并识别的过程中就同时考虑了规则、几何、识别和语义信息对识别结果的影响,从而最大可能地得到实际应用中所需要的识别结果,进而提高识别效果。
实施例一:
下面将以一具体的实例来对上述方法的实现过程做详细描述。由于本发明实施例中的脱机手写识别方法是基于规则来实现的,因此在介绍具体的实现过程之前,首先引入“规则”的概念,如图2所示。
所述规则是指预设的实际应用规则,由每个位置上的字符个数以及对应位置上的字符集组成,记为子规则1,子规则2,...,子规则M(M≥2)。如日期“YYYY年MM月DD日”,可以定义为[4,数字],[1,“年”],[1-2,数字],[1,“月”],[1-2,数字],[0-1,“日”],终止符。
其中,所述对应位置上的字符集可以是预设规则中该位置上的字符或者字符类型,但该位置上的字符或者字符类型可以不唯一确定。在实际应用中,根据实际需求,可以对相应位置上的字符集进行设定。例如:日期规则“YYYY年MM月DD日”还可以写成“YYYY-MM-DD”的形式,所以对于子规则2的位置上的字符集来讲,可以是“年”或者“-”。
所定义子规则的具体含义如下:
例如,子规则[4,数字]中,“4”表示该位置上包含4个字符,“数字”表示该位置对应的字符类型为数字,即该子规则表示该位置上的字符为4个数字;
又如,子规则[1,“年”]中,“1”表示该位置上包含1个字符,“年”表示该位置上的字符为汉字“年”,则该子规则表示该位置上的字符为1个汉字“年”;
再如,子规则[1-2,数字]中,“1-2”表示该位置上包含1到2个字符,则该子规则表示该位置上的字符为1到2个数字。
每个子规则又包含若干个状态,一个状态记录着一个字符在子规则中所处的位置和该状态的字符集,如子规则[4,数字]可以包含(1,数字),(2,数字),(3,数字),(4,数字)四个状态。
下面,我们将结合一个具体实施实例对本发明提供的脱机手写识别方法进行阐述说明。
以从左往右书写的行图像为例,在本实施实例中输入的行图像如图3所示,该图为一幅日期的行图像,规则为日期规则“YYYY年MM月DD日”,子规则总数M为6。
如图4所示,本发明实施例提供的脱机手写识别方法,具体包括以下步骤:
21、按照书写顺序对待识别字符进行过切分,从而得到至少一个切分块,每个所述切分块对应一个记录层。
对待识别字符进行过切分,得到切分块总数为N(N≥2),图5所示的是对图3中的日期进行过切分后得到的结果,其中每个矩形框中的内容表示一个切分块,该实施例中切分块总数N为15;
如图6所示,其中每个切分块对应一个记录层。
22、在第一记录层中记录下对第一个切分块进行识别后的候选字块。
其具体实现步骤如下:
221、在第一记录层中,根据预设的规则以及综合评价对该记录层中的候选字块进行排序;其中,所述综合评价包括识别评价、语义评价、几何评价等。
其中,所述候选字块是指过切分后的切分块进行合并识别后得到的识别结果,但并不限定为两个或两个以上的切分块合并之后得到,也就是说,如果一个切分块未经过合并而得到的识别结果也符合规则或者其综合评价的结果比较好,则在本实施例中该识别结果也称为候选字块。
例如,在第一记录层中的候选字块就是对第一个切分块识别后的结果。
222、根据所述排序结果,记录下所述第一记录层中的前K个候选字块;其中,K≥2。
需要说明的是,K的取值是根据经验得来的。在每一记录层中只记录前K个候选字块,不记录其他的识别结果,这样就在不影响最终识别结果的前提下有效地减少了计算量。
对于记录在记录层中的符合规则的候选字块,还记录有该候选字块的规则状态以及其后续状态,即该候选字块的后向相邻候选字块所对应的规则状态。也就是说,某一候选字块所对应的规则记录在该候选字块的前向相邻候选字块中。
在判断某一候选字块的后向相邻候选字块是否符合预设规则时,需要考虑所述某一候选字块中所记录的规则状态,即:判断所述某一候选字块的后向相邻候选字块是否符合所述某一候选字块中记录的后续状态。也就是说,判断某一候选字块是否符合预设的规则时,需要判断该候选字块是否符合其前向相邻候选字块中记录的后续状态。
所述后续状态是规则中某个规则状态后续的那个规则状态。但一个规则状态可能有不止一个的后续状态。具体如,上述日期规则中子规则1的(4,数字)状态的后续状态只有一个是子规则2的(1,“年”)状态;又如,由于子规则3中可以是1到2个数字,则对于子规则3的(1,数字)状态的后续状态就包括子规则3的(2,数字)状态和子规则4的(1,“月”)状态这两个后续状态。针对后续状态这一概念,将在步骤23中进行运用。
223、若没有满足所述规则的候选字块或者满足所述规则的候选字块不足K个,则对不满足所述规则的候选字块也进行记录。
具体为,如图7所示,对于第一个切分块来说,满足规则的识别结果为“1”,在第一记录层中记录“1”以及该切分块规则状态即子规则1的规则状态(1,数字),第一记录层中的记录符合规则的未满K个,所以继续记录对第一个切分块识别后的候选字块中综合评价最高的前K-1个结果。
23、类似上述过程,在第二到第N记录层中,分别记录合并识别后的候选字块。
下面,以第二到第N记录层中的第j(j≥2)记录层为例来阐述这一步骤:
231、在第j记录层中,根据预设的规则以及综合评价对该记录层中的候选字块进行排序;
对于第j记录层中的候选字块是指从第一个切分块到该记录层对应的切分块合并识别后得到的候选字块,为:第i个切分块到第j个切分块进行合并识别后得到的候选字块的集合;其中,j≥2,i=1,2,...,j。
该集合具体包括:对从第一个到第j个切分块(共j个切分块)进行合并识别所得到的所有候选字块(如图8所示,第二记录层中暂时记录有第一个和第二个切分块进行合并识别所得到的候选字块);对从第二个到第j个切分块(共j-1个切分块)进行合并识别所得到的所有候选字块;...;对第j个切分块进行识别所得到的所有候选字块。
在第j记录层中,某一候选字块所对应的规则记录在该候选字块的前向相邻候选字块中,故判断某一候选字块是否符合预设规则,具体为:判断该候选字块是否符合记录在其前向相邻候选字块中的规则,也就是说,判断该候选字块是否符合记录在其前向相邻候选字块中的后续状态。将第j记录层中符合预设规则的候选字块记录在该记录层中。
对于第j记录层中得到的候选字块进行排序:若某个候选字块的规则状态符合根据其记录的衔接关系而得到的前一相邻候选字块的后续状态,则排序在前;若存在多个候选字块的规则状态均符合前一相邻候选字块的后续状态,或者没有一个候选字块的规则状态均符合前一相邻候选字块的后续状态,则根据综合评价对该层的候选字块进行排序。
232、根据步骤231中排序的结果,在第j记录层中记录下前K个候选字块。
233、若没有满足所述规则的候选字块或者满足所述规则的候选字块不足K个,则对不满足所述规则的候选字块也进行记录。
具体的记录结果如图9所示。本发明的优点也可在此步骤具体体现:
如图9所示,第三个和第四个过切分块合并识别后的候选字块没有一个满足第二记录层中规则状态的后续状态,而第四记录层中的记录不足K个,所以根据综合评价将“乃”等候选字填入第四记录层的记录中,当第四块识别的识别结果中的“3”满足第三记录层中规则1的状态3的后续状态即规则1的状态4时,将其添入第四记录层的记录中,并放置在其他不满足规则的记录之前。
下面为更好地阐述步骤24,首先引入“路径”这一概念。每个候选字块中都记录有与其前向相邻的候选字块的衔接关系,将多个相邻候选字块之间的衔接关系进行关联后,即可得到一条路径;该路径可以用以表示与所述多个相邻的候选字块组成的一个字符串。
例如,第一记录层的第一个候选字块与第二记录层的第一个候选字块之间建立有衔接关系,而第二记录层的第一个候选字块又和第四记录层的第二个候选字块之间建立有衔接关系,则由所述第四记录层的第二个候选字块回溯的话,即可得到一条路径,该路径中即代表着由第一记录层的第一个候选字块、第二记录层的第一个候选字块和第四记录层的第二个候选字块所组成的字符串;同时,该路径被称为到达第四记录层的一条路径。
24、选取到达第N记录层的符合规则的路径作为待识别字符的识别结果。
具体地,可以按照第N记录层中记录的K个候选字块的顺序对其进行遍历,并将后续状态为终止状态且排序在前的候选字块作为第N记录层的与所述规则匹配程度最高的候选字块,并确认为优选字块。
之后,根据所得到的第N记录层的优选字块向前回溯,得到一条符合规则的路径;即,根据所述优选字块中记录的衔接关系,依次获取到前向多个候选字块组成字符串,该字符串即为针对待识别对象得到的识别结果。
所述符合规则的路径是指该路径中的每一个候选字块均符合所述规则中其对应的规则状态。
如果得到的符合规则的路径不止一条,则将所得到的路径进行综合评价,选取综合评价最高的作为最终的识别结果。
结合图10和图11所示,图10为利用上述基于规则的方法获得的识别结果,而图11中为未考虑规则得到的识别结果;明显可以看出,图10中的识别结果比图11中的识别结果更为准确。
25、如果到达第N记录层的所有路径中没有符合所述规则的路径,则需要对每条路径分别进行模糊规则评价,最后选取出最接近所述规则的路径作为所述待识别字符的识别结果。
所述模糊规则评价,是指如果到达第N记录层的所有路径中没有符合所述规则的路径,则选取最接近规则的路径的一种方法。其大致过程包括:根据第N记录层中的候选字块中记录的衔接关系获取到至少一个候选字符串,并判断将所述候选字符串转换到符合所述规则的字符串所需的编辑次数,选取编辑次数最少的字符串对应的候选识别结果作为所述待识别字符的识别结果。
具体地,对一条路径的模糊规则进行评价需要使用一个矩阵MOΛ|x|,OΛ|y|,|x|表示该路径上识别结果字符的个数,|y|表示预设的规则中除去终止符后规则状态的个数,i表示某一识别结果在该路径中的位置,j表示某一规则状态在该规则状态串中的位置,xi表示路径上的第i个识别结果,yj表示第j个规则状态,x1,i表示路径上的第1个到第i个识别结果组成的字符串,y1,j表示第1个到第j个规则状态串,Mi,j的含义是将x1,i变成符合规则y1,j所需要的最少编辑操作的次数,计算矩阵Mi,j的步骤如下:
1Mi,0←i,M0,j←j
上述步骤的具体含义如下:
1、首先,将i的值赋给Mi,0,将j的值赋给M0,j;
2、如果识别结果xi满足规则状态yj,则Mi,j的值等于Mi-1,j-1的值;否则,则Mi,j的值等于1+min(Mi-1,j-1,Mi-1,j,Mi,j-1)。
根据上述步骤计算出矩阵M后,M|x|,|y|就是该条路径的识别结果字符串变成符合规则的形式所需要的最少操作次数,取M|x|,|y|为该条路径的模糊规则评价值。
最后在所有路径中模糊规则评价值最小的路径,即为最优路径作为待识别字符的识别结果。
下面给出一个没有符合规则的路径而使用模糊规则评价的实施例。在本实施例中,图12为输入的行图像,图13为该行图像过切分后的结果。如图14所示,在分层识别的结果中,第一记录层中有满足子规则1的状态1的识别结果“1”,而由于第二记录层中没有满足子规则1的状态2的识别结果,所以第二记录层没有满足规则的记录,同理其他记录层也都没有满足规则的记录。在进行步骤24路径选择时,没有一条符合规则的路径,这时我们对每条路径分别进行模糊规则评价。
模糊规则评价的准则是评估当前路径的结果字符串变成符合规则的字符串需要最少的编辑次数,如图15和图16所示的分别是图12中的行图像的前两条最优路径的识别结果。而图12中的行图像实际应符合的规则是日期规则“YYYY年MM月DD日”,即[4,数字],[1,“年”],[2,数字],[1,“月”],[2,数字],[1,“日”],终止符。
图15中所显示的是第一条路径的结果字符串,为“、明1年4月6日”,将上述结果字符串变成符合规则的字符串需要如下操作:由于上述规则中“年”之前有4个数字,因此针对第一条路径的识别结果应当先在识别结果前添加一个数字(例如“1”),替换“、”为数字,替换“明”为数字;同样地,由于在上述规则中“月”和“日”之前都是2位数字,因此需要在第一条路径的识别结果中的“月”前添加1个数字,“日”前添加1个数字,共进行了5次操作;
类似地,图16中所显示的是第二条路径的结果字符串,为“1aa1年4月6日”,将上述结果字符串变成符合规则的字符串需要如下操作:替换“a”为数字,替换“a”为数字,添加“月”前数字,添加“日”前数字,共进行4步操作。
根据上述模糊规则评价中的矩阵可以得到前两条路径的模糊规则评价结果:第一条路径的模糊规则评价值为5,即图15中表格右下角对应的数字;第二条路径的模糊规则评价值为4,即图16中表格右下角对应的数字。很容易得到,第二条路径的模糊规则评价值比第一条路径的模糊规则评价值小,所以选取第二条路径的识别结果为最终输出的识别结果。可见在没有得到完全符合规则的识别结果的情况下,使用模糊规则评价可以得到更加接近规则需求的结果。例如在本实施例中,识别结果“1aa1年4月6日”与“、明1年4月6日”相比较而言,前者的错误更少,并且用户的体验更好。
本发明实施例提供的脱机手写识别的方法,将规则引入到过切分后切分块的合并识别过程中,相当于在合并识别的过程中就同时考虑了规则、几何、识别和语义信息对识别结果的影响,从而最大可能地得到实际应用中所需要的识别结果,进而提高识别效果;并且,本方法在记录候选字块的过程中,通过在每一记录层选取前K个候选字块,对不符合规则或综合评价差的候选字块进行提前剪枝,这样就减少了合并识别过程中的运算量,进而达到提升速度的目的;同时,即使识别结果中没有满足规则的,根据本发明实施例所提供的方法也能够获取最接近规则的识别结果。
为了更好地实现上述脱机手写识别的方法,本发明实施例还提供了一种脱机手写识别的装置,如图17所示,包括:
过切分单元171,用于按照书写顺序对待识别字符进行过切分,从而得到至少一个切分块,每个所述切分块对应一个记录层;
其中,所述候选字块是指过切分后的切分块进行合并识别后得到的识别结果,但并不限定为两个或两个以上的切分块合并之后得到,也就是说,如果一个切分块未经过合并而得到的识别结果也符合规则或者其综合评价的结果比较好,则在本实施例中该识别结果也称为候选字块。
记录单元172,用于在每个记录层中记录下从第一个切分块到该记录层对应的切分块合并识别后得到的、且符合预设的规则的候选字块,所述候选字块记录有该候选字块与其前向相邻候选字块的衔接关系;
确定单元173,用于从最后一记录层中选取一个与所述规则匹配程度最高的候选字块作为优选字块,并根据所述候选字块记录的衔接关系依次获取所述优选字块前向多个候选字块,以组成字符串。
本发明实施例提供的脱机手写识别的装置,将规则引入到过切分后切分块的合并识别过程中,相当于在合并识别的过程中就同时考虑了规则、几何、识别和语义信息对识别结果的影响,从而最大可能地得到实际应用中所需要的识别结果,进而提高识别效果。
下面以一具体的实例来对上述脱机手写识别的装置做进一步详述。
实施例二:
在本实施例中,所述脱机手写识别的装置,如图18所示,包括:
过切分单元181,用于按照书写顺序对待识别字符进行过切分,从而得到至少一个切分块,每个所述切分块对应一个记录层;
记录单元182,用于在每个记录层中记录下从第一个切分块到该记录层对应的切分块合并识别后得到的、且符合预设的规则的候选字块,所述候选字块记录有该候选字块与其前向相邻候选字块的衔接关系;
确定单元183,用于从最后一记录层中选取一个与所述规则匹配程度最高的候选字块作为优选字块,并根据所述候选字块记录的衔接关系依次获取所述优选字块前向多个候选字块,以组成字符串。
其中,确定单元183在选择所述优选字块的过程中,是遍历记录单元182中第N记录层所记录的候选字块,并将后续状态为终止状态且排序在前的候选字块作为第N记录层的与所述规则匹配程度最高的候选字块,并确认为优选字块。
上述记录单元182进一步包括排序模块1821,择优模块1822,补偿模块1823;其中,
排序模块1821,用于在每一记录层中,根据预设的规则以及几何、识别和语义信息对该记录层中的候选字块进行排序;
择优模块1822,用于根据所述排序结果,记录下所述每个记录层中的前K个候选字块;其中,K≥2;
补偿模块1823,用于在没有满足所述规则的候选字块或者满足所述规则的候选字块不足K个时,记录下不满足所述规则的候选字块直至记录的候选字块达到K个。
进一步地,某一候选字块所对应的规则记录在该候选字块的前向相邻候选字块中;此时,所述记录单元182,具体用于在每个记录层中记录下从第一个切分块到该记录层对应的切分块合并识别后得到的候选字块,且该候选字块符合记录在其前向相邻候选字块中的规则。
本发明实施例提供的脱机手写识别的装置还可以包括:
模糊单元184,用于在所述最后一记录层中记录的候选字块均不符合所述规则时,选取最接近所述规则的字符串作为所述待识别字符对应的识别结果。
利用本实施例中的脱机手写识别的装置来完成脱机手写识别的过程,可以参考前述方法实施例中的描述,此处不再赘述。
本发明实施例提供的脱机手写识别的装置,将规则引入到过切分后切分块的合并识别过程中,相当于在合并识别的过程中就同时考虑了规则、几何、识别和语义信息对识别结果的影响,从而最大可能地得到实际应用中所需要的识别结果,进而提高识别效果;并且,本装置在记录候选字块的过程中,通过选取前K个候选字块,对不符合规则或综合评价差的候选字块进行提前剪枝,这样就减少了合并识别过程中的运算量,进而达到提升速度的目的;同时,即使识别结果中没有满足规则的,根据本发明实施例所提供的装置也能够获取最接近规则的识别结果。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (11)
1.一种脱机手写识别的方法,其特征在于,包括:
按照书写顺序对待识别字符进行过切分,从而得到至少一个切分块,每个所述切分块对应一个记录层;
在每个记录层中记录下从第一个切分块到该记录层对应的切分块合并识别后得到的、且符合预设的规则的候选字块,所述候选字块记录有该候选字块与其前向相邻的候选字块的衔接关系;其中,在每一记录层中,根据预设的规则以及几何、识别和语义信息对该记录层中的候选字块进行排序;所述预设的规则由每个位置上的字符个数以及对应位置上的字符集组成,所述对应位置上的字符集是字符或字符类型;
从最后一记录层中选取一个与所述规则匹配程度最高的候选字块作为优选字块,并根据所述候选字块记录的衔接关系依次获取所述优选字块前向多个候选字块,以组成字符串。
2.根据权利要求1所述的脱机手写识别的方法,其特征在于,对于第j记录层,所述从第一个切分块到该记录层对应的切分块合并识别后得到的候选字块,为:
第i个切分块到第j个切分块进行合并识别后得到的候选字块的集合;
其中,j≥1,i=1,2,…,j。
3.根据权利要求1或2所述的脱机手写识别的方法,其特征在于,所述在每个记录层中记录下从第一个切分块到该记录层对应的切分块合并识别后得到的、且符合预设的规则的候选字块,具体包括:
根据所述排序结果,记录下所述每个记录层中的前K个候选字块;其中,K≥2;
若没有满足所述规则的候选字块或者满足所述规则的候选字块不足K个,则对不满足所述规则的候选字块也进行记录。
4.根据权利要求3所述的脱机手写识别的方法,其特征在于,所述从最后一记录层中选取一个与所述规则匹配程度最高的候选字块作为优选字块,具体为:
按照所述排序后的顺序,遍历所述最后一记录层中记录的候选字块,并将其后续规则状态为终止状态且排序在前的候选字块作为与所述规则匹配程度最高的候选字块,并确认为优选字块。
5.根据权利要求1所述的脱机手写识别的方法,其特征在于,所述在每个记录层中记录下从第一个切分块到该记录层对应的切分块合并识别后得到的、且符合预设的规则的候选字块,具体为:某一候选字块所对应的规则记录在该候选字块的前向相邻候选字块中,在每个记录层中记录下从第一个切分块到该记录层对应的切分块合并识别后得到的候选字块,且该候选字块符合记录在其前向相邻候选字块中的规则。
6.根据权利要求1所述的脱机手写识别的方法,其特征在于,还包括:
如果所述最后一记录层中记录的候选字块均不符合所述规则,则选取最接近所述规则的字符串作为所述待识别字符对应的识别结果;
所述选取最接近所述规则的字符串,具体包括:根据最后一记录层中的候选字块记录的衔接关系而获取至少一个候选字符串,并判断将所述候选字符串转换到符合所述规则的字符串所需的编辑次数,选取编辑次数最少的字符串作为所述待识别字符对应的识别结果。
7.一种脱机手写识别的装置,其特征在于,包括:
过切分单元,用于按照书写顺序对待识别字符进行过切分,从而得到至少一个切分块,每个所述切分块对应一个记录层;
记录单元,用于在每个记录层中记录下从第一个切分块到该记录层对应的切分块合并识别后得到的、且符合预设的规则的候选字块,所述候选字块记录有该候选字块与其前向相邻的候选字块的衔接关系;其中,所述记录单元包括排序模块,用于在每一记录层中,根据预设的规则以及几何、识别和语义信息对该记录层中的候选字块进行排序;所述预设的规则由每个位置上的字符个数以及对应位置上的字符集组成,所述对应位置上的字符集是字符或字符类型;
确定单元,用于从最后一记录层中选取一个与所述规则匹配程度最高的候选字块作为优选字块,并根据所述候选字块记录的衔接关系依次获取所述优选字块前向多个候选字块,以组成字符串。
8.根据权利要求7所述的脱机手写识别的装置,其特征在于,所述记录单元还包括:
择优模块,用于根据所述排序结果,记录下所述每个记录层中的前K个候选字块;其中,K≥2;
补偿模块,用于在没有满足所述规则的候选字块或者满足所述规则的候选字块不足K个时,记录下不满足所述规则的候选字块直至记录的候选字块达到K个。
9.根据权利要求8所述的脱机手写识别的装置,其特征在于,
所述确定单元,具体用于按照所述排序后的顺序,遍历所述最后一记录层中记录的候选字块,并将其后续规则状态为终止状态且排序在前的候选字块作为与所述规则匹配程度最高的候选字块,并确认为优选字块。
10.根据权利要求7所述的脱机手写识别的装置,其特征在于,所述记录单元,具体用于在每个记录层中记录下从第一个切分块到该记录层对应的切分块合并识别后得到的候选字块,且该候选字块符合记录在其前向相邻候选字块中的规则。
11.根据权利要求7所述的脱机手写识别的装置,其特征在于,还包括:
模糊单元,用于在所述最后一记录层中记录的候选字块均不符合所述规则时,选取最接近所述规则的字符串作为所述待识别字符对应的识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010268489 CN102385700B (zh) | 2010-09-01 | 2010-09-01 | 脱机手写识别的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010268489 CN102385700B (zh) | 2010-09-01 | 2010-09-01 | 脱机手写识别的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102385700A CN102385700A (zh) | 2012-03-21 |
CN102385700B true CN102385700B (zh) | 2013-05-29 |
Family
ID=45825101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010268489 Active CN102385700B (zh) | 2010-09-01 | 2010-09-01 | 脱机手写识别的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102385700B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103559512B (zh) * | 2013-11-01 | 2017-11-03 | 中国联合网络通信集团有限公司 | 一种文字识别输出方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101082908A (zh) * | 2007-06-26 | 2007-12-05 | 腾讯科技(深圳)有限公司 | 一种中文分词方法及系统 |
CN101520851A (zh) * | 2008-02-29 | 2009-09-02 | 富士通株式会社 | 字符信息识别装置和方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040146200A1 (en) * | 2003-01-29 | 2004-07-29 | Lockheed Martin Corporation | Segmenting touching characters in an optical character recognition system to provide multiple segmentations |
EP1634135B1 (en) * | 2003-02-28 | 2011-09-14 | Gannon Technologies Group | Systems and methods for source language word pattern matching |
-
2010
- 2010-09-01 CN CN 201010268489 patent/CN102385700B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101082908A (zh) * | 2007-06-26 | 2007-12-05 | 腾讯科技(深圳)有限公司 | 一种中文分词方法及系统 |
CN101520851A (zh) * | 2008-02-29 | 2009-09-02 | 富士通株式会社 | 字符信息识别装置和方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102385700A (zh) | 2012-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101676838B (zh) | 输入装置 | |
CN110363252B (zh) | 趋向于端到端的场景文字检测与识别方法以及系统 | |
JP5071914B2 (ja) | 認識グラフ | |
JP3425408B2 (ja) | 文書読取装置 | |
CN101639830B (zh) | 一种输入过程中的中文术语自动纠错方法 | |
Eklundh et al. | A computer tool and framework for analyzing online revisions | |
CN112836052B (zh) | 一种汽车评论文本观点挖掘方法、设备及存储介质 | |
CN108090445A (zh) | 一种纸质作业或试卷的电子批改方法 | |
CN105718586A (zh) | 分词的方法及装置 | |
KR20080042877A (ko) | 전자 문서를 읽기 모드로 디스플레이하는 방법 | |
CN102810097A (zh) | 网页正文内容提取方法及装置 | |
CN108268884B (zh) | 一种文档对比方法及装置 | |
CN110889310B (zh) | 金融文档信息智能提取系统及方法 | |
CN110866388A (zh) | 基于多种神经网络混合的出版pdf版面分析识别方法 | |
CN113094288B (zh) | 一种基于Xmind思维导图转测试用例的方法 | |
CN107748745A (zh) | 一种企业名称关键字提取方法 | |
CN103778141A (zh) | 一种混合pdf图书目录自动抽取算法 | |
CN102385700B (zh) | 脱机手写识别的方法及装置 | |
CN114547232A (zh) | 一种低标注成本的嵌套实体识别方法及系统 | |
CN102254157A (zh) | 一种寻找左右字符的字符切分位置评价方法 | |
CN105095184A (zh) | 文本文档拼写及语法校对方法 | |
US20220076109A1 (en) | System for contextual and positional parameterized record building | |
CN112541505B (zh) | 文本识别方法、装置以及计算机可读存储介质 | |
CN107145947A (zh) | 一种信息处理方法、装置及电子设备 | |
CN102591850A (zh) | 一种基于条件语句的错误文本语句纠正方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |