CN102129560B - 字符识别的方法和设备 - Google Patents
字符识别的方法和设备 Download PDFInfo
- Publication number
- CN102129560B CN102129560B CN 201010004058 CN201010004058A CN102129560B CN 102129560 B CN102129560 B CN 102129560B CN 201010004058 CN201010004058 CN 201010004058 CN 201010004058 A CN201010004058 A CN 201010004058A CN 102129560 B CN102129560 B CN 102129560B
- Authority
- CN
- China
- Prior art keywords
- path
- segmentation candidates
- point
- segmentation
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
提供了用于字符识别的方法和设备。该方法包括:确定待识别的字符图像中的每个候选分割点上的一个或更多个候选分割路径,其中,至少一个候选分割点上具有多个候选分割路径;利用每个候选分割路径来分割所述待识别的字符图像,以产生多个图像部分;分别对所述多个图像部分进行识别,从而得到多个识别结果;及根据所述识别结果,在所述候选分割点及其候选分割路径中选择所述字符图像的最佳分割点和每个最佳分割点上的最佳分割路径。
Description
技术领域
本发明涉及字符识别领域,尤其涉及一种用于字符识别的方法和设备。
背景技术
在字符识别领域中,字符切分是一个重要的研究领域。切分不正确是导致后续的识别错误的重要原因之一。在字符切分中,特别是在粘连字符(例如手写字符、机器打印的斜体或花体字、草书等)的切分中,如何确定正确的分割位置与分割路径是一个难点。
公开号为US 5,787,194的美国专利申请披露了一种用于将包括多个字符的输入图像分割成单个字符图像的图像处理设备。该图像处理设备利用识别逻辑来识别输入图像中的粘连部分,利用分类逻辑对所识别的粘连部分进行分类,并根据分类结果来确定该粘连部分是否为单个字符图像。如果不是,则利用切分逻辑将粘连部分再次切分成更小的部分或者利用合并逻辑对相邻的部分进行合并。上述分类以及切分和合并过程反复进行,直到分割结果满足某一预定的条件。
Richard G.Casey和Eric Lecolinet在“A Survey of Methods andStrategies in Character Segmentation”(IEEE Transactions on PatternAnalysis and Machine Intelligence,Vol.18,No.7,1996年7月)一文中描述了字符图像的一些分割方法和策略,包括空白和间隙分析法(WhiteSpace and Pitch Analysis)、投影分析法(Projection Analysis)、粘连字符处理法(Connected Component Processing)、基于识别的字符分割方法、混合分割方法以及整体识别方法等等。
发明内容
在下文中给出关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
根据本发明的一个方面,提供了一种用于字符识别的方法。该方法包括:确定待识别的字符图像中的每个候选分割点上的一个或更多个候选分割路径,其中,至少一个候选分割点上具有多个候选分割路径;利用每个候选分割路径来分割所述待识别的字符图像,以产生多个图像部分;分别对所述多个图像部分进行识别,从而得到多个识别结果;及根据所述识别结果,在所述候选分割点及其候选分割路径中选择所述字符图像的最佳分割点和每个最佳分割点上的最佳分割路径。
根据本发明的一个方面,提供了一种用于字符识别的设备。该设备包括:候选路径确定装置,用于确定待识别的字符图像中的每个候选分割点上的一个或更多个候选分割路径,其中,至少一个候选分割点上具有多个候选分割路径;图像部分产生装置,用于利用每个候选分割路径来分割所述待识别的字符图像,以产生多个图像部分;识别装置,用于分别对所述多个图像部分进行识别,从而得到多个识别结果;及路径搜索装置,用于根据所述识别结果,在候选分割点及其候选分割路径中选择所述字符图像的最佳分割点和每个最佳分割点上的最佳分割路径。
另外,本发明的实施例还提供了用于实现上述方法的计算机程序。
此外,本发明的实施例还提供了至少计算机可读介质形式的计算机程序产品,其上记录有用于实现上述方法的计算机程序代码。
附图说明
参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。
图1是示出了字符图像分割的示例的示意图;
图2是示出了根据本发明的一个实施例的用于字符识别的方法的流程图;
图3是示出了根据本发明的另一实施例的用于字符识别的方法的流程图;
图4是示出了字符图像的分割点和分割路径进行标注的示意图;
图5是示出了对图像部分进行分割后再次进行分割或者合并处理的示意图;
图6是示出了根据本发明的另一实施例的用于字符识别的多方法的示意性流程图;
图7是示出了根据本发明的另一实施例的用于字符识别的方法的示意性流程图;
图8是示出了根据本发明的另一实施例的用于字符识别的方法的示意性流程图;
图9是示出了根据本发明的一个实施例的用于字符识别的设备的示意性框图;
图10是示出了根据本发明的另一实施例的用于字符识别的设备的示意性框图;
图11是示出了根据本发明的另一实施例的用于字符识别的多设备的示意性框图;
图12是示出了根据本发明的应用动态规划算法进行多路径搜索的一个示例的示意性框图;以及
图13是示出了可用于实施根据本发明的实施例的计算机的示意性框图。
具体实施方式
下面参照附图来说明本发明的实施例。在本发明的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。
在字符图像的切分过程中,为了将多个字符分成单个字符,需要确定各个字符之间的切分位置(下文中也称为分割点)以及每个切分位置的切分路径(下文中也称为分割路径)。通常情况下,可以在每个分割点确定一个分割路径,从而将字符图像中的各个字符分开。图1(a)示出了在每个分割点确定一个分割路径的情况。但是,在大多数情况下,特别是在粘连字符(例如手写字符、机器打印的斜体或花体字、草书等)的切分过程中,在每个分割点上可能有多个可以采用的分割路径。图1(b)示出了在字符图像中多个可能的分割点的每个上确定一个或者更多个可能的分割路径的情况。这些可能的分割点(下文也称为候选分割点)及其可能的分割路径(下文中也称为候选分割路径)是否正确将直接影响到字符识别的准确性。在一些方法中,需要首先在每个分割点确定一个分割路径,然后判断这样切割后的图像是否满足某个预定的准则。如果否,则进行重新分割或合并,即重新确定每个分割点和相应的一个分割路径,直到满足了该预定的准则。以这种方法确定的分割点和分割路径只是满足了预定的准则,但往往不是最优的分割点和最优的分割路径。
图2示出了本发明的一个实施例的方法,用于在每个候选分割点的多个候选分割路径中搜索出最优的分割路径。如图2所示,该方法可以包括步骤203-209。
在步骤203中,确定待识别的字符图像中的每个候选分割点上的一个或更多个候选分割路径,其中,在图像的多个候选分割点中,至少一个候选分割点上有多个候选分割路径。
这里,待识别的字符图像可以为任何适当的格式,例如二值图像、JPG图像、位图图像等,这里不一一列举。字符图像中可以包括任何种类的字符,例如数字、符号、各种语音的字母或字符等等,这里不作任何限定。
另外,可以采用任何适当的方法来确定候选分割点和候选分割路径,例如,可以采用空白和间隙分析法(White Space and Pitch Analysis)、投影分析法(Projection Analysis)、常用的粘连字符处理法(ConnectedComponent Processing)以及峰谷分析法(Ascender-Descender Analysis)等等,这里不一一详述。
为了能够找到最优的分割路径,可以尽可能地找到每个候选分割点上的所有可能的路径作为候选分割路径。
在步骤205中,在确定了各个候选分割点上的候选分割路径之后,则利用这些候选分割路径来分割待识别的字符图像,从而产生多个图像部分。
在步骤207中,对这些多个图像部分进行识别,从而得到多个识别结果。
在该步骤中,可以采用任何适当的方法对图像部分进行识别。图7所示的多路径搜索方法示出了一个示例。在图7中,步骤703、705和709分别与图2所示的步骤203、205和209相似,这里省略对其的描述。步骤707为对图像部分进行识别的步骤。该步骤包括子步骤707-1和707-2。在子步骤707-1中,对所产生的多个图像部分进行分类。可以根据图像中的字符种类而采用任何适当的模式识别方法(例如采用神经网络、贝叶斯决策、支持向量机、结构模式识别方法等、以及以上方法的组合)进行分类,这里不详细描述。在子步骤707-2中,根据每个图像部分的类别,计算每个图像部分与该类别的已知字符图像之间的匹配距离,作为对该图像部分的识别结果。例如,如果经过分类后,某个图像部分被分类为属于字母“a”,则计算该图像部分与字母“a”的已有图像之间的匹配距离。当然,图7中的步骤707仅仅给出了进行图像部分识别的一个示例,本发明并不限于该示例。如上所述,可以采用任何适当的识别技术,例如采用神经网络、贝叶斯决策、支持向量机、结构模式识别方法等、以及以上方法的组合,限于篇幅这里不一一详述。
作为一个示例,对于某一字符类别,可以有对应的多个已知图像。在将某个图像部分归类为该类别之后,可以计算该图像部分与多个已知图像中的每个之间的匹配距离。然后,可以选择其中最小的匹配距离作为与该图像部分对应的识别结果;还可以对所匹配距离求平均或者求和等,将所得到的值作为与该图像部分对应的识别结果。
最后,在步骤209中,根据所述识别结果,在多个候选分割点及其候选分割路径中选择字符图像的一个或多个最佳分割点和每个最佳分割点上的最佳分割路径。
例如,对于字符图像中的某个字符,由于其对应的分割点上可能有多个分割路径,因此,在步骤205中会产生与该字符对应的多个图像部分,相应地,在步骤207中会产生与这些图像部分对应的多个识别结果。例如,在图7的示例中,对于某个字符所对应的多个图像部分,计算得到多个匹配距离。所计算的匹配距离越小,则说明识别结果越好。因此,可以选择与最小的匹配距离对应的图像部分,即选择能够分割得到该图像部分的分割点和分割路径作为最优分割点及所述最优分割点上的最优分割路径。
在上述方法中,不需要预先确定一个判断准则,可以在一个分割点上确定多个候选分割路径,并能够从中选择出最优的分割路径,从而大大提高字符识别的准确性。
当然,在多个候选分割点和多个候选分割路径中选择字符图像的分割点和分割路径的方法并不限于以上示例。图3示出了采用动态规划算法进行多路径搜索的一个实施例。在图3所示的方法中,对每个候选分割点的每个候选分割路径分别进行标注,并采用动态规划算法在多个候选分割点和多个候选路径中选择最优的分割点及其对应的最优分割路径。
如图3所示,该方法包括步骤303、304、305、307和309。
步骤303与图2所示的实施例中的步骤203相似,这里不再重复。
在步骤304中,用二维标识对每个候选分割点的每个候选分割路径进行标注。这样,可以用这些分割路径的二维标识对多个图像部分进行标注。所述二维标识包括用于标注每个候选分割点的第一标识以及用于标注每个候选分割路径的第二标识。具体地,假设在待识别的字符图像中包括I(N>1)个候选分割点,且在第i(1≤i≤I)个候选分割点上确定了J(J≥1)个候选分割路径,则第i个候选分割点的第j(1≤j≤J)个候选分割路径可以标注为(i,j)或者(j,i)。这样,利用第i个候选分割点的第j个切割路径以及第m(1≤m≤I)个候选分割点上的第n个(假设第m个分割点上有N个候选路径,N≥1,1≤n≤N)切割路径切割得到的图像部分可以标注为{(i,j),(m,n)}或者{(j,i),(n,m)}。
图4示出了进行二维标注的一个示例。图4(a)所示的图像包括手写单词“net”,为待识别的字符图像,其中已确定的候选分割点包括“位置i”、“位置i+1”和“位置i+2”,i≥0。位置i上的候选分割路径可以标注为(i,1),位置i+1上的候选分割路径可以标注为(i+1,1),而位置i+2上的各候选分割路径可以标注为(i+2,1)、(i+2,2)和(i+2,3)。这样,在图4中,利用位置i的分割路径(i,1)和位置i+1的分割路径(i+1,1)切割得到的图像部分可以标注为{(i,1),(i+1,1)}。
步骤305和307与图2所示的实施例中的步骤205和207相似,这里不再重复。
在步骤309中,根据步骤307中得到的识别结果,基于所述二维标识,采用动态规划方法,在多个候选分割点及候选分割路径中搜索最佳候选分割点及最佳候选分割路径。
图12给出了采用动态规划算法进行多路径搜索的一个具体示例。
如图12所示,在对多个图像部分进行二维标注之后,采用动态规划算法,在多个候选分割点及其候选分割路径中选择一个或多个最佳分割点以及每个最佳分割点上的最佳分割路径的方法包括步骤1209-1、1209-2和1209-3。
首先,在步骤1209-1中对多个图像部分进行排序。具体地,可以根据与图像部分对应的分割点和分割路径的二维标识,将多个图像部分按照其左侧(或者右侧)分割点排序,其中,将左侧(或右侧)切割点相同的图像部分按照切割路径进行排序。
然后,在步骤1209-2中定义各个图像部分之间的相连关系。具体地,可以按照以下规则来定义这种相连关系:定义两个图像部分相连,当且仅当其中一个图像部分的右侧切割点和分割路径与另一图像部分的左侧分割点和分割路径相同。可以利用上述的二维标识来判断两个图像部分的对应分割点和分割路径是否相同。
之后,在步骤1209-3中进行路径搜索。具体地,基于上述定义的图像部分之间的相连关系,利用动态规划算法寻找最好的识别结果所对应的分割路径,作为图像的最佳分割路径,对应的分割点即为最佳分割点。在上述作为一个示例,对于某一字符类别,可以有对应的多个已知图像。在上述的计算每个图像部分与多个已知图像中的每个之间的匹配距离并将多个匹配距离的平均值或者总和作为对该图像部分的识别结果的示例中,可以利用动态规划算法来寻找匹配距离最短(识别结果最好)的切割路径。
上述方法采用动态规划算法进行字符分割路径的搜索,能够有效提高计算效率。
图6示出了根据本发明另一实施例的方法。在该实施例中,在确定了待识别的字符图像的各个候选分割点和各个候选分割路径之后,可以对所得到的图像部分再次进行合并和/或切分。如图6所示,该方法包括步骤603、605、606、607和609。
步骤603、605与前述实施例中的相应步骤相似,这里不再重复。
在步骤606中,可选地,对步骤605中得到的多个图像部分再次分割和/或合并。具体地,可以对相邻的图像部分进行合并,并且/或者,还可以对多个图像部分中的一个或更多个进行再次分割,从而形成新的图像部分。
图5示出了进行再次分割和/或合并的示例,其中,图5(a)示出了再次分割的一个示例,而图5(a)示出了进行合并的一个示例。在图5(a)中,假设经过步骤605之后,得到两个图像部分,即图5(a)中的“图像部分1”和“图像部分2”。可以对这两个图像部分再次进行分割。在该示例中,对图像部分2作了再次分割,得到图像部分3和图像部分4。在图5(b)中,假设经过步骤605之后,得到四个图像部分,即图5(b)中的“图像部分1′-4′”。可以对这些图像部分中的相邻部分进行合并。例如,将图像部分1′和图像部分2′合并,得到图像部分5′。作为另一示例,在步骤606中,还可以同时对相邻的图像部分进行合并,并对一个或多个图像部分进行再次切分。
在步骤607中,对在步骤605和606中得到的所有图像部分进行识别。例如,在图5(a)的示例中,对所得的四个图像部分1-4进行识别,得到相应的识别结果。又如,在图5(b)的示例中,对所得的五个图像部分(图像部分1′-5′)进行识别,得到相应的识别结果。该识别步骤与上述示例和/或实施例相同,这里不再重复。
步骤609与前述实施例/示例中的相应步骤相似,这里也不再重复。
在上述方法中,通过对图像部分进行再次分割和/或合并,能够防止图像部分的误分割,从而进一步提高路径搜索的准确性。
图8示出了根据本发明的另一实施例的方法。如图8所示,该方法包括对粘连部分进行识别的步骤801。
在步骤801中,识别字符图像中的一个或更多个粘连部分。例如,假设输入的图像为图1所示的包括手写字符“chorghuimig.net”的图像,则可以将其分成分别包括手写字符“chorghui”、“mig”、“`”和“net”的四个粘连部分。可以采用任何适当的方法进行粘连部分的识别,例如可以采用空白和间距分析法、常用的粘连部分分析法或者峰谷分析法等等,这里不一一详述。
可以对这些粘连部分分别进行处理。在步骤803中,确定每个粘连部分中的各个候选分割点,并对其进行标注;在步骤804中,确定每个候选分割点的一个或者更多个候选分割路径并对其进行标注。步骤803和804与图3所示的实施例中的步骤303和304相似。换言之,在步骤803和804中,确定粘连部分中的每个候选分割点上的一个或更多个候选分割路径,并使用二维标识对每个候选分割路径进行标注。标注方法与前述示例/实施例相同,这里不再重复。
在步骤805中,利用上述步骤确定的候选分割点和候选分割路径对每个粘连部分进行分割,从而产生多个图像部分。
在步骤806中,对步骤805中得到的多个图像部分再次分割和/或合并。具体地,可以对相邻的图像部分进行合并,并且/或者,还可以对多个图像部分中的一个或更多个进行再次分割,从而形成新的图像部分。
在该实施例中,还可以对这些新的图像部分进行标注。例如,在图5(a)所示的示例中,对图像部分2进行再次分割的分割点可以标注为位置i+2,而对应的候选分割路径则可以标注为(i+2,j),1≤j≤J,J为该分割点上的候选分割路径的数量。又如,在图5(b)所示的示例中,将图像部分1与图像部分2合并后得到的图像部分5可以标注为{(i,0),(i+2,0)},表示图像部分5的左边界为第i个分割点的第0条分割路径,右边界为第i+2个分割点的第0条分割路径;依此类推,即可完成对每个合并后得到的图像部分的标注。
在步骤807中,对在步骤805和806中得到的所有图像部分进行识别,得到相应的识别结果。识别的方法与上述实施例/示例相同,这里不再重复。
在步骤809中,根据步骤807中得到的识别结果,基于所述二维标识,采用动态规划方法,在多个候选分割点及候选分割路径中搜索最佳候选分割点及最佳候选分割路径。
在步骤811中,判断是否已处理完所有的粘连部分,如果没有则返回步骤803。否则,则处理完毕。
在上述实施例中,对输入图像中的每个粘连部分分别进行处理,能够有效提高对输入图像的处理的效率。
图9示出了根据本发明的一个实施例的用于字符识别的设备。如图9所示,该设备900包括候选路径确定装置902、图像部分产生装置904、识别装置906和路径搜索装置908。
候选路径确定装置902用于确定待识别的字符图像中的每个候选分割点上的一个或更多个候选分割路径,并将候选分割点和候选分割路径输出给图像部分产生装置904。其中,在图像的多个候选分割点中,至少一个候选分割点上有多个候选分割路径。
与上述方法实施例/示例相似,待识别的字符图像可以为任何适当的格式,例如二值图像、JPG图像、位图图像等,这里不一一列举。字符图像中可以包括任何种类的字符,例如数字、符号、各种语音的字母或字符等等,这里不作任何限定。另外,可以采用任何适当的方法来确定候选分割点和候选分割路径,例如,可以采用空白和间隙分析法(White Spaceand Pitch Analysis)、投影分析法(Projection Analysis)、常用的粘连字符处理法(Connected Component Processing)以及峰谷分析法(Ascender-Descender Analysis)等等,这里不一一详述。
图像部分产生装置904用于利用候选路径确定装置902所确定的候选分割路径来分割待识别的字符图像,以产生多个图像部分,并将多个图像部分输出给识别装置906。
识别装置906用于对从图像部分产生装置904接收的多个图像部分分别进行识别,从而得到对应的多个识别结果,并将识别结果输出给路径搜索装置908。
识别装置906可以采用上述方法实施例/示例中的方法进行图像部分的识别,这里不再重复。
路径搜索装置908用于根据从识别装置接收的识别结果,在多个候选分割点及其候选分割路径中选择所述字符图像的分割点和分割路径。
上述装置不需要预先确定一个判断准则,其可以在字符图像的一个分割点上确定多个候选分割路径,并能够从中选择出最优的分割路径,从而大大提高字符识别的准确性。
图10给出了根据本发明的另一实施例的设备。图10所示的设备1000包括候选路径确定装置1002、图像部分产生装置1004、识别装置1006和路径搜索装置1008。其中,候选路径确定装置1002和图像部分产生装置1004的功能与图9所示实施例中的相应装置类似,这里不再重复。
与图9所示实施例不同的是,识别装置1006包括分类单元1006-1和匹配单元1006-2。分类单元1006-1用于对图像部分产生装置1004产生的多个图像部分进行分类。分类单元1006-1可以采用上述方法示例/实施例中的分类方法,这里不再重复。匹配单元1006-2用于根据分类单元1006-1输出的分类结果(即根据每个图像部分的类别)来计算每个图像部分与该类别的已知字符图像之间的匹配距离,作为对该图像部分的识别结果。例如,如果经过分类后,某个图像部分被分类为属于字母“a”,则计算该图像部分与字母“a”的已有图像之间的匹配距离。作为一个示例,对于某一字符类别,识别装置1006可以保存有对应的多个已知图像。在分类单元1006-1将某个图像部分归类为该类别之后,匹配单元1006-2可以计算该图像部分与多个已知图像中的每个之间的匹配距离。可以选择其中最小的匹配距离作为与该图像部分对应的识别结果;还可以对所匹配距离求平均或者求和等,将所得到的值作为与该图像部分对应的识别结果。
路径搜索装置1008用于根据识别装置输出的识别结果(即所计算的匹配距离),在多个候选分割点及其候选分割路径中选择字符图像的分割点和分割路径。具体地,例如,对于字符图像中的某个字符,由于其对应的分割点上可能有多个分割路径,因此,图像部分产生装置1004中会产生与该字符对应的多个图像部分,相应地,识别装置1006会产生与这些图像部分对应的多个识别结果。例如,对于某个字符所对应的多个图像部分,匹配单元1006-2可以计算得到多个匹配距离。所计算的匹配距离越小,则说明识别结果越好。因此,路径搜索装置1008可以选择与最小的匹配距离对应的图像部分,即选择能够分割得到该图像部分的分割路径作为对应分割点上的最优分割路径。
在一个示例中,候选路径确定装置902/1002还可以被配置用于:使用二维标识对每个候选分割点的多个候选分割路径中的每个进行标注,其中,所述二维标识包括用于标注每个候选分割点的第一标识以及用于标注每个候选分割路径的第二标识。候选路径确定装置可以采用上述方法实施例/示例中采用的标注方法,这里不再重复。路径搜索装置908/1008可以被配置用于:基于候选路径确定装置所标注的二维标识,利用动态规划方法,在多个候选分割点及候选分割路径中搜索最佳候选分割点及最佳候选分割路径。这里,路径搜索装置908/1008可以采用上述方法实施例/示例中采用的动态规划算法进行路径搜索,这里不再重复。通过采用动态规划算法进行字符分割路径的搜索,能够有效地提高设备的处理效率。
在另一示例中,图像部分产生装置904/1004在对图像进行分割之后,还可以被配置用于对相邻的图像部分进行合并和/或对所述多个图像部分中的一个或更多个进行再次分割,并将得到的所有图像部分输出给识别装置906/1006。图像部分产生装置904/1004可以采用上述实施例/示例中的方法对所产生的图像部分进行再次分割和/或合并,这里不再重复。通过对图像部分进行再次分割和/或合并,能够防止图像部分的误分割,从而进一步提高路径搜索的准确性。
图11示出了根据本发明的另一实施例的设备1100。与前述实施例的设备1000相似,图11所示的设备1100也包括候选路径确定装置1102、图像部分产生装置1104、识别装置1106和路径搜索装置1108。不同之处在于,设备1100还包括粘连部分确定装置1101。
粘连部分确定装置1101用于识别待识别的字符图像中的一个或更多个粘连部分,并将得到的粘连部分输出给候选路径确定装置1102。粘连部分确定装置1101可以采用与上述方法实施例/示例相同的方法来工作,这里不再重复。
可以对这些粘连部分分别进行处理。候选路径确定装置1102用于确定每个粘连部分中的每个候选分割点上的一个或更多个候选分割路径。并且,还可以使用二维标识对每个候选分割路径进行标注。标注方法与前述示例/实施例相同,这里不再重复。
图像部分产生装置1004用于利用候选路径确定装置1102确定的候选分割点和候选分割路径对每个粘连部分进行分割,从而产生多个图像部分。作为一个示例,图像部分产生装置1004还可以对这些图像部分进行再次分割和/或合并。具体地,图像部分产生装置1004可以对相邻的图像部分进行合并,并且/或者,还可以对多个图像部分中的一个或更多个进行再次分割,从而形成新的图像部分。图像部分产生装置1004还可以对这些新的图像部分进行标注。标注方法与参考图8描述的方法实施例相同,这里不再重复。
识别装置1106用于对图像部分产生装置提供的所有图像部分进行识别,得到相应的识别结果。识别的方法可以与上述实施例/示例相同,这里也不再重复。路径搜索装置1108用于根据从识别装置1106接收的识别结果,在多个候选分割点及其候选分割路径中选择所述字符图像的分割点和分割路径。具体的搜索方法可以与上述方法实施例/示例所采用的方法相同。例如,路径搜索装置1108可以根据识别装置1106提供的识别结果,基于候选路径确定装置1102和图像部分产生装置1104标注的二维标识,采用动态规划方法,在多个候选分割点及候选分割路径中搜索最佳候选分割点及最佳候选分割路径。
在该实施例中,对输入图像中的每个粘连部分分别进行处理,能够有效提高对输入图像的处理的效率。
应理解,本文所述的各示例和实施例均是示例性的,本发明不限于此。
上述装置中各个组成装置、单元可通过软件、固件、硬件或其组合的方式进行配置。配置可使用的具体手段或方式为本领域技术人员所熟知,在此不再赘述。在通过软件或固件实现的情况下,从存储介质或网络向具有专用硬件结构的计算机(例如图13所示的通用计算机1300)安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等。
在图13中,中央处理单元(CPU)1301根据只读存储器(ROM)1302中存储的程序或从存储部分1308加载到随机存取存储器(RAM)1303的程序执行各种处理。在RAM 1303中,也根据需要存储当CPU 1301执行各种处理等等时所需的数据。CPU 1301、ROM 1302和RAM 1303经由总线1304彼此连接。输入/输出接口1305也连接到总线1304。
下述部件连接到输入/输出接口1305:输入部分1306(包括键盘、鼠标等等)、输出部分1307(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分1308(包括硬盘等)、通信部分1309(包括网络接口卡比如LAN卡、调制解调器等)。通信部分1309经由网络比如因特网执行通信处理。根据需要,驱动器1310也可连接到输入/输出接口1305。可拆卸介质1311比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器1310上,使得从中读出的计算机程序根据需要被安装到存储部分1308中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质1311安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图13所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质1311。可拆卸介质1311的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM 1302、存储部分1308中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
本发明还提出一种存储有机器可读取的指令代码的程序产品。所述指令代码由机器读取并执行时,可执行上述根据本发明实施例的方法。
相应地,用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。所述存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等等。
在上面对本发明具体实施例的描述中,针对一种实施方式描述和/或示出的特征可以用相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。
此外,本发明的方法不限于按照说明书中描述的时间顺序来执行,也可以按照其他的时间顺序地、并行地或独立地执行。因此,本说明书中描述的方法的执行顺序不对本发明的技术范围构成限制。
通过以上的描述可以看出,根据本发明的实施例,提供了如下的方案:
附记1.一种用于字符识别的方法,包括:
确定待识别的字符图像中的每个候选分割点上的一个或更多个候选分割路径,其中,至少一个候选分割点上具有多个候选分割路径;
利用每个候选分割路径来分割所述待识别的字符图像,以产生多个图像部分;
分别对所述多个图像部分进行识别,从而得到多个识别结果;及
根据所述识别结果,在所述候选分割点及其候选分割路径中选择所述字符图像的一个或多个最佳分割点和每个最佳分割点上的最佳分割路径。
附记2.如附记1所述的方法,其中,在确定了每个候选分割点上的候选分割路径之后,还包括:
用二维标识对每个候选分割点的多个候选分割路径中的每个进行标注,其中,所述二维标识包括用于标注每个候选分割点的第一标识以及用于标注每个候选分割路径的第二标识。
附记3.如附记2所述的方法,其中,根据所述识别结果在候选分割点及候选分割路径中选择所述字符图像的最佳分割点和每个最佳分割点上的最佳分割路径的步骤包括:基于每个候选分割路径的二维标识,利用动态规划方法,在候选分割点及候选分割路径中搜索最佳候选分割点及每个最佳候选分割点上的最佳候选分割路径。
附记4.如附记1所述的方法,其中,对所述多个图像部分进行识别包括:
对所述多个图像部分进行分类,及
根据每个图像部分的类别,计算每个图像部分与该类别的已知字符图像之间的匹配距离,作为对该图像部分的识别结果。
附记5.如附记1所述的方法,其中,在对所述多个图像部分进行识别之前,所述方法还包括:
对相邻的图像部分进行合并和/或对所述多个图像部分中的一个或更多个进行再次分割。
附记6.如附记1所述的方法,其中,在确定待识别的字符图像中的每个候选分割点上的多个候选分割路径之前,所述方法还包括:
识别所述待识别的字符图像中的一个或更多个粘连部分。
附记7.一种用于字符识别的设备,包括:
候选路径确定装置,用于确定待识别的字符图像中的每个候选分割点上的一个或更多个候选分割路径,其中,至少一个候选分割点上具有多个候选分割路径;
图像部分产生装置,用于利用每个候选分割路径来分割所述待识别的字符图像,以产生多个图像部分;
识别装置,用于分别对所述多个图像部分进行识别,从而得到多个识别结果;及
路径搜索装置,用于根据所述识别结果,在候选分割点及其候选分割路径中选择所述字符图像的一个或多个最佳分割点和每个最佳分割点上的最佳分割路径。
附记8.如附记7所述的设备,其中,所述候选路径确定装置还被配置用于:使用二维标识对每个候选分割点的多个候选分割路径中的每个进行标注,其中,所述二维标识包括用于标注每个候选分割点的第一标识以及用于标注每个候选分割路径的第二标识。
附记9.如附记8所述的设备,其中,所述路径搜索装置被配置用于:基于所述二维标识,利用动态规划方法,在多个候选分割点及候选分割路径中搜索最佳候选分割点及最佳候选分割路径。
附记10.如附记7所述的设备,其中,所述识别装置包括用于对所述多个图像部分进行分类的分类单元以及用于根据每个图像部分的类别来计算每个图像部分与该类别的已知字符图像之间的匹配距离的匹配单元。
附记11.如附记7所述的设备,其中,所述图像部分产生装置还被配置用于对相邻的图像部分进行合并和/或对所述多个图像部分中的一个或更多个进行再次分割,并将得到的图像部分输出给所述识别装置。
附记12.如附记7所述的设备,还包括粘连部分确定装置,用于识别所述待识别的字符图像中的一个或更多个粘连部分。
尽管上面已经通过对本发明的具体实施例的描述对本发明进行了披露,但是,应该理解,上述的所有实施例和示例均是示例性的,而非限制性的。本领域的技术人员可在所附权利要求的精神和范围内设计对本发明的各种修改、改进或者等同物。这些修改、改进或者等同物也应当被认为包括在本发明的保护范围内。
Claims (10)
1.一种用于字符识别的方法,包括:
确定待识别的字符图像中的每个候选分割点上的一个或更多个候选分割路径,其中,至少一个候选分割点上具有多个候选分割路径;
利用每个候选分割路径来分割所述待识别的字符图像,以产生多个图像部分;
分别对所述多个图像部分进行识别,从而得到多个识别结果;及
根据所述识别结果,在所述候选分割点及其候选分割路径中选择所述字符图像的最佳分割点和每个最佳分割点上的最佳分割路径。
2.如权利要求1所述的方法,其中,在确定了每个候选分割点上的候选分割路径之后,还包括:
用二维标识对每个候选分割点的多个候选分割路径中的每个进行标注,其中,所述二维标识包括用于标注每个候选分割点的第一标识以及用于标注每个候选分割路径的第二标识。
3.如权利要求2所述的方法,其中,根据所述识别结果在候选分割点及候选分割路径中选择所述字符图像的最佳分割点和每个最佳分割点上的最佳分割路径的步骤包括:基于每个候选分割路径的二维标识,利用动态规划方法,在候选分割点及候选分割路径中搜索最佳分割点及每个最佳分割点上的最佳分割路径。
4.如权利要求1所述的方法,其中,对所述多个图像部分进行识别包括:
对所述多个图像部分进行分类,及
根据每个图像部分的类别,计算每个图像部分与该类别的已知字符图像之间的匹配距离,作为对该图像部分的识别结果。
5.如权利要求1所述的方法,其中,在对所述多个图像部分进行识别之前,所述方法还包括:
对相邻的图像部分进行合并和/或对所述多个图像部分中的一个或更多个进行再次分割。
6.一种用于字符识别的设备,包括:
候选路径确定装置,用于确定待识别的字符图像中的每个候选分割点上的一个或更多个候选分割路径,其中,至少一个候选分割点上具有多个候选分割路径;
图像部分产生装置,用于利用每个候选分割路径来分割所述待识别的字符图像,以产生多个图像部分;
识别装置,用于分别对所述多个图像部分进行识别,从而得到多个识别结果;及
路径搜索装置,用于根据所述识别结果,在候选分割点及其候选分割路径中选择所述字符图像的最佳分割点和每个最佳分割点上的最佳分割路径。
7.如权利要求6所述的设备,其中,所述候选路径确定装置还被配置用于:使用二维标识对每个候选分割点的多个候选分割路径中的每个进行标注,其中,所述二维标识包括用于标注每个候选分割点的第一标识以及用于标注每个候选分割路径的第二标识。
8.如权利要求7所述的设备,其中,所述路径搜索装置被配置用于:基于所述二维标识,利用动态规划方法,在多个候选分割点及候选分割路径中搜索最佳分割点及每个最佳分割点上的最佳分割路径。
9.如权利要求6所述的设备,其中,所述识别装置包括用于对所述多个图像部分进行分类的分类单元以及用于根据每个图像部分的类别来计算每个图像部分与该类别的已知字符图像之间的匹配距离的匹配单元。
10.如权利要求6所述的设备,其中,所述图像部分产生装置还被配置用于对相邻的图像部分进行合并和/或对所述多个图像部分中的一个或更多个进行再次分割,并将得到的图像部分输出给所述识别装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010004058 CN102129560B (zh) | 2010-01-18 | 2010-01-18 | 字符识别的方法和设备 |
JP2010234922A JP2011146028A (ja) | 2010-01-18 | 2010-10-19 | 文字認識方法及び文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010004058 CN102129560B (zh) | 2010-01-18 | 2010-01-18 | 字符识别的方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102129560A CN102129560A (zh) | 2011-07-20 |
CN102129560B true CN102129560B (zh) | 2013-11-06 |
Family
ID=44267640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010004058 Expired - Fee Related CN102129560B (zh) | 2010-01-18 | 2010-01-18 | 字符识别的方法和设备 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2011146028A (zh) |
CN (1) | CN102129560B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915440A (zh) * | 2011-08-03 | 2013-02-06 | 汉王科技股份有限公司 | 一种字符切分的方法及装置 |
KR101905426B1 (ko) | 2012-01-11 | 2018-10-10 | 한국전자통신연구원 | 자연영상에서 추출된 문자 정보의 순서화 방법 및 시스템 |
CN103310435B (zh) * | 2012-03-21 | 2016-04-06 | 华中科技大学 | 将垂直投影和最优路径相结合对车牌字符进行分割的方法 |
JP6119952B2 (ja) * | 2012-05-15 | 2017-04-26 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
CN104573683B (zh) * | 2013-10-21 | 2018-02-16 | 富士通株式会社 | 字符串识别方法和装置 |
CN106446896B (zh) * | 2015-08-04 | 2020-02-18 | 阿里巴巴集团控股有限公司 | 一种字符分割方法、装置及电子设备 |
CN105447508A (zh) * | 2015-11-10 | 2016-03-30 | 上海珍岛信息技术有限公司 | 一种字符图像验证码识别的方法及系统 |
CN108108734B (zh) * | 2016-11-24 | 2021-09-24 | 杭州海康威视数字技术股份有限公司 | 一种车牌识别方法及装置 |
CN106682666A (zh) * | 2016-12-29 | 2017-05-17 | 成都数联铭品科技有限公司 | 用于非常见字体ocr识别的特征模板制备方法 |
CN110135426B (zh) * | 2018-02-09 | 2021-04-30 | 北京世纪好未来教育科技有限公司 | 样本标注方法及计算机存储介质 |
CN110533671A (zh) * | 2019-08-19 | 2019-12-03 | 温州大学 | 一种局部动态规划切割文字行的方法 |
CN111079762B (zh) * | 2019-11-26 | 2022-02-08 | 合肥联宝信息技术有限公司 | 一种粘连字符的切割方法及电子设备 |
CN113657234B (zh) * | 2021-08-10 | 2024-04-26 | 小叶子(北京)科技有限公司 | 图像识别方法、装置、存储介质及电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1187256A (zh) * | 1995-06-05 | 1998-07-08 | 摩托罗拉公司 | 以直线段为主的手写体字符的预处理方法和微处理器 |
CN1388947A (zh) * | 2000-08-31 | 2003-01-01 | 惠普公司 | 字符识别系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3260843B2 (ja) * | 1992-08-25 | 2002-02-25 | 株式会社リコー | 文字認識方法 |
JP2009199102A (ja) * | 2008-02-19 | 2009-09-03 | Fujitsu Ltd | 文字認識プログラム、文字認識装置及び文字認識方法 |
-
2010
- 2010-01-18 CN CN 201010004058 patent/CN102129560B/zh not_active Expired - Fee Related
- 2010-10-19 JP JP2010234922A patent/JP2011146028A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1187256A (zh) * | 1995-06-05 | 1998-07-08 | 摩托罗拉公司 | 以直线段为主的手写体字符的预处理方法和微处理器 |
CN1388947A (zh) * | 2000-08-31 | 2003-01-01 | 惠普公司 | 字符识别系统 |
Non-Patent Citations (4)
Title |
---|
一种基于词片识别的字符分割算法;岳思聪等;《中国图象图形学报》;20060131;第11卷(第1期);8-12 * |
传真收件人姓名字符识别技术研究与应用;林开标;《中国优秀硕士学位论文全文数据库》;20060630;论文摘要,论文第19,22,23,46页 * |
岳思聪等.一种基于词片识别的字符分割算法.《中国图象图形学报》.2006,第11卷(第1期), |
林开标.传真收件人姓名字符识别技术研究与应用.《中国优秀硕士学位论文全文数据库》.2006, |
Also Published As
Publication number | Publication date |
---|---|
CN102129560A (zh) | 2011-07-20 |
JP2011146028A (ja) | 2011-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102129560B (zh) | 字符识别的方法和设备 | |
US8131087B2 (en) | Program and apparatus for forms processing | |
CN106570453B (zh) | 用于行人检测的方法、装置和系统 | |
CN110879959B (zh) | 生成数据集的方法及装置、利用其的测试方法及测试装置 | |
CN110399878B (zh) | 表格版式恢复方法,计算机可读介质以及计算机 | |
JP5071914B2 (ja) | 認識グラフ | |
CN111046784A (zh) | 文档版面分析识别方法、装置、电子设备和存储介质 | |
CN112016605B (zh) | 一种基于边界框角点对齐和边界匹配的目标检测方法 | |
CN111967387A (zh) | 表单识别方法、装置、设备及计算机可读存储介质 | |
CN104346620A (zh) | 对输入图像中的像素分类的方法和装置及图像处理系统 | |
CN110879960B (zh) | 生成卷积神经网络学习用图像数据集的方法及计算装置 | |
CN102024138B (zh) | 字符识别方法和字符识别装置 | |
CN106255979A (zh) | 行分割方法 | |
CN105677878B (zh) | 一种基于bi系统的车辆信息多维展示的方法及系统 | |
CN104573683A (zh) | 字符串识别方法和装置 | |
CN102968610B (zh) | 收据图像处理方法和设备 | |
CN103310209A (zh) | 识别图像中的字符串的方法和装置 | |
JP2010198308A (ja) | 文字認識プログラム、文字認識方法および文字認識装置 | |
CN111488400B (zh) | 数据分类方法、装置和计算机可读存储介质 | |
CN102375990B (zh) | 图像处理方法和设备 | |
Suciati et al. | LONTAR_DETC: Dense and High Variance Balinese Character Detection Method in Lontar Manuscripts | |
Raffo et al. | The shape of chromatin: insights from computational recognition of geometric patterns in Hi-C data | |
CN107092902A (zh) | 字符串的识别方法和系统 | |
CN104778478A (zh) | 一种手写数字识别方法 | |
CN110826488B (zh) | 一种针对电子文档的图像识别方法、装置及存储设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20131106 Termination date: 20190118 |