CN107341429A - 手写粘连字符串的切分方法、切分装置和电子设备 - Google Patents

手写粘连字符串的切分方法、切分装置和电子设备 Download PDF

Info

Publication number
CN107341429A
CN107341429A CN201610274847.8A CN201610274847A CN107341429A CN 107341429 A CN107341429 A CN 107341429A CN 201610274847 A CN201610274847 A CN 201610274847A CN 107341429 A CN107341429 A CN 107341429A
Authority
CN
China
Prior art keywords
line segment
candidate
cutting line
cutting
correct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610274847.8A
Other languages
English (en)
Other versions
CN107341429B (zh
Inventor
许亮
范伟
孙俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to CN201610274847.8A priority Critical patent/CN107341429B/zh
Publication of CN107341429A publication Critical patent/CN107341429A/zh
Application granted granted Critical
Publication of CN107341429B publication Critical patent/CN107341429B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

本申请实施例提供一种手写粘连字符串的切分方法、切分装置和电子设备,该方法包括:确定手写字符串图像中的候选切分区域,所述候选切分区域具有上端点和下端点;对于每个候选切分区域,基于该手写字符串图像的灰度值和代价值,在所述上端点和所述下端点之间生成与所述上端点和所述下端点中至少一者连接的线段,作为候选切分线段;从所述候选切分线段中选择出正确切分线段;根据所述正确切分线段,对所述手写字符串图像中粘连的字符进行切分。根据本申请实施例,能降低硬件规模,并且定位性能更稳定。本申请能够对手写粘连字符串进行更为准确的切分。

Description

手写粘连字符串的切分方法、切分装置和电子设备
技术领域
本申请涉及信息技术领域,尤其涉及一种手写粘连字符串的切分方法、切分装置和电子设备。
背景技术
对手写字符串图像中的字符串进行识别时,经常会出现相邻字符之间粘连的情况。现有的字符识别器是基于单个字符训练得到的,因此在字符识别之前,有必要将粘连字符串正确地切分开。
对于手写字符串图像识别,目前主流的策略是基于过切分的识别方法:首先,利用过切分算法将手写字符串图像切分成较多的基元片段,其中,过切分算法通常利用字符串图像的几何形状等信息,在保证尽可能地将字符间粘连区域切分开的前提下,允许将一个字符串图像切分成几个基元片段,过切分得到的基元片段能够对应一个字符或者字符的一部分;然后,通过组合不同的连续基元片段,形成候选字符模式,得到切分候选网格(Segmentation candidate lattice);最后,利用字符识别器、语言模型等,得到基元片段的最佳合并方案和识别结果。
图1是现有技术中切分候选网格的一个示意图。如图1所示,手写字符串图像中的字符“提”和“及”之间粘连。过切分算法在手写字符串图像中产生了两个候选切分线段SP0和SP1,以及五个基元片段S0至S4,其中,三个基元片段S1,S2和S3是由该两个切分线段SP0和SP1进行切分所产生的。假设一个候选字符模式最多包含连续的三个基元片段,那么图1中的五个基元片段S0至S4总共可以形成十二个候选字符模式。通过调用字符分类器分别对这十二个模式进行识别,能够得到每个模式的识别分数,其中,具有最高识别分数的路径所包含的候选字符模式可以用来表示最终的切分结果。在图1中,路径A所表示的路径就是具有最高识别分数的路径,该路径上的候选字符模式M1和M2表示最终的切分结果。
在上述基于过切分的识别方法中,为了对粘连字符串进行切分,可以利用字符图像的投影、轮廓、骨架等信息生成一些候选切分线段,然后利用候选切分线段的几何特性,过滤掉其中的部分冗余的候选切分线段,最后根据保留的候选切分线段进行连通块提取,以得到切分后的基元片段序列。由于过滤掉了部分冗余的候选切分线段,因此,候选切分线段的数量被减少,能够减少候选字符模式的数量,降低识别的运算量。
应该注意,上面对技术背景的介绍只是为了方便对本申请的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本申请的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
本申请的发明人发现,在上述基于过切分的识别方法中,在对粘连字符串进行切分时,一般是根据手写字符串图像的二值图像的轮廓和骨架特征来生成候选切分线段,并且该候选切分线段一般是竖直的直线,但是,这种基于二值图像所生成的竖直形状的候选切分线段有时并不能对粘连的字符串进行准确地切分。
本申请的实施例提供一种手写粘连字符串的切分方法、切分装置和电子设备,根据手写字符串图像的灰度值和代价值来生成候选切分线段,该候选切分线段能够对粘连的字符串进行更为准确的切分。
根据本申请实施例的第一方面,提供一种手写粘连字符串的切分装置,用于对手写字符串图像中粘连的字符进行切分,该装置包括:
第一确定单元,其用于确定手写字符串图像中的候选切分区域,所述候选切分区域具有上端点和下端点;
第一生成单元,其对于每个候选切分区域,基于该手写字符串图像的灰度值和代价值,在所述上端点和所述下端点之间生成与所述上端点和所述下端点中至少一者连接的线段,作为候选切分线段,其中,所述代价值对应于所述候选切分线段上的每个像素点与相邻行的候选像素点之间连线相对于该手写字符串图像列方向的倾斜程度;
第一选择单元,其用于从所述候选切分线段中选择出正确切分线段;以及
第一切分单元,其根据所述正确切分线段,对所述手写字符串图像中粘连的字符进行切分。
根据本实施例的第二方面,提供一种手写粘连字符串的切分方法,用于对手写字符串图像中粘连的字符进行切分,该方法包括:
确定手写字符串图像中的候选切分区域,所述候选切分区域具有上端点和下端点;
对于每个候选切分区域,基于该手写字符串图像的灰度值和代价值,在所述上端点和所述下端点之间生成与所述上端点和所述下端点中至少一者连接的线段,作为候选切分线段,其中,所述代价值对应于所述候选切分线段上的每个像素点与相邻行的候选像素点之间连线相对于该手写字符串图像列方向的倾斜程度;
从所述候选切分线段中选择出正确切分线段;以及
根据所述正确切分线段,对所述手写字符串图像中粘连的字符进行切分。
根据本实施例的第三方面,提供一种电子设备,包括上述实施例第一方面所述的切分装置。
本申请的有益效果在于:能够对手写粘连字符串进行更为准确的切分。
参照后文的说明和附图,详细公开了本发明的特定实施方式,指明了本发明的原理可以被采用的方式。应该理解,本发明的实施方式在范围上并不因而受到限制。在所附权利要求的精神和条款的范围内,本发明的实施方式包括许多改变、修改和等同。
针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、整件、步骤或组件的存在,但并不排除一个或更多个其它特征、整件、步骤或组件的存在或附加。
附图说明
所包括的附图用来提供对本发明实施例的进一步的理解,其构成了说明书的一部分,用于例示本发明的实施方式,并与文字描述一起来阐释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是现有技术中切分候选网格的一个示意图;
图2是本申请实施例1的切分方法的一个示意图;
图3(A)是现有技术中生成的候选切分线段的一个示意图;
图3(B)是本申请实施例1生成的候选切分线段的一个示意图;
图4是本申请实施例1的生成候选切分线段的方法的一个示意图;
图5是本申请实施例1的候选切分线段的部分特征示意图;
图6是本申请实施例2的从全部候选切分线段中选择出正确切分线段的方法的一个示意图;
图7是将多个候选切分线段归类为不同集合的一个示意图;
图8是本申请实施例2的确定正确切分线段的方法的一个示意图;
图9是本申请实施例3的从全部候选切分线段中选择出正确切分线段的方法的一个示意图;
图10是本申请实施例4的切分装置的一个示意图;
图11是本申请实施例4的第一生成单元的一个示意图;
图12是本申请实施例4的第一选择单元的一个示意图;
图13是本申请实施例4的第三选择单元的一个示意图;
图14是本申请实施例4的第一选择单元的另一个示意图;
图15是本申请实施例5的电子设备的一个构成示意图。
具体实施方式
参照附图,通过下面的说明书,本发明的前述以及其它特征将变得明显。在说明书和附图中,具体公开了本发明的特定实施方式,其表明了其中可以采用本发明的原则的部分实施方式,应了解的是,本发明不限于所描述的实施方式,相反,本发明包括落入所附权利要求的范围内的全部修改、变型以及等同物。
实施例1
本申请实施例1提供一种手写粘连字符串的切分方法,用于对手写字符串图像中粘连的字符进行切分。图2是本实施例的切分方法的一个示意图,如图2所示,该方法包括:
S201、确定手写字符串图像中的候选切分区域,所述候选切分区域具有上端点和下端点;
S202、对于每个候选切分区域,基于该手写字符串图像的灰度值和代价值,生成与所述上端点和所述下端点中至少一者连接的线段,作为候选切分线段,其中,所述代价值对应于所述候选切分线段上的每个像素点与相邻行的候选像素点之间连线相对于该手写字符串图像列方向的倾斜程度;
S203、从所述候选切分线段中选择出正确切分线段;以及
S204、根据所述正确切分线段,对所述手写字符串图像中粘连的字符进行切分。
在手写字符串图像中,当相邻字符之间存在粘连区域时,该粘连区域的灰度值要低于字符的其他笔划区域,这种灰度信息的差异有助于正确地对粘连字符串进行切分。
图3(A)是现有技术中根据手写字符串图像的二值图像的轮廓和骨架特征生成的候选切分线段的一个示意图。如图3(A)所示,该候选切分线段31基于二值图像30a而生成,该候选切分线段31为竖直的直线线段,并且该候选切分线段31的位置偏离了字符“记”和“者”之间的粘连区域。
图3(B)是本实施例基于手写字符串图像的灰度值生成的候选切分线段的一个示意图。如图3(B)所示,该候选切分线段32基于手写字符串图像的灰度图像30b而生成,该候选切分线段32可以是弯曲的线段,其可以不沿着竖直方向延伸。如图3(B)所示,候选切分线段32的位置相比于候选切分线段31的位置,更靠近字符“记”和“者”之间的粘连区域。因此,在按照候选切分线段32的路径来切分字符串时,能够得到更为准确的切分结果。
在本实施例中,由于考虑了手写字符串图像的灰度值来生成候选切分线段,由此,能够更为准确地对粘连字符串进行切分。
在本实施例的步骤S201中,可以采用与现有技术相同的方式来确定手写字符串图像中的候选切分区域的上端点和下端点,例如,可以获得手写字符串图像的二值图像,并提取该二值图像的外轮廓,在该外轮廓上检测拐角较大的角点作为上端点和下端点,或者,提取二值图像的外轮廓并且对该二值图像进行骨架化,然后根据骨架上的叉点和外轮廓的角点,搜索上下外轮廓上对应的合适端点作为上端点和下端点,其中,提取该二值图像的外轮廓以及对二值图像进行骨架化的方法可以参考现有技术,本实施例不再进行说明。
在本实施例的步骤S202中,对于每个候选切分区域,可以生成该区域的候选切分线段,该候选切分线段可以与上端点和下端点中的至少一者连接。在本实施例中,候选切分线段可以以上端点或下端点中的任意一者作为起点,并结合手写字符串图像的灰度信息以及代价值,利用M领域搜索算法,从起点开始顺次确定候选切分线段的下一个像素点的位置,从而生成候选切分线段,其中,M是大于等于3的自然数。
图4是生成候选切分线段的方法的一个示意图,如图4所示,该方法包括:
S401、对于所述候选切分线段中的每一个像素点,根据该像素点的相邻行的各候选像素点的灰度值以及各候选像素点所对应的代价值,计算各候选像素点的路径代价值;以及
S402、根据各候选像素点的路径代价值,选择候选像素点,选择出的候选像素点被作为所述候选切分线段在所述相邻行上的像素点。
下面,结合实例来说明上述步骤S401和S402。
在本实施例中,假设手写字符串图像的灰度图像的宽度为W个像素点,高度为H个像素点,坐标为(r,c)的像素点的灰度值为G(r,c),其中,r为像素点的行号,c为像素点的列号;候选切分区域的上端点坐标为(r_u,c_u),下端点坐标为(r_d,c_d),候选切分线段以该上端点作为起点,并且,c_u=c_d,即,上端点和下端点位于该灰度图像的同一列;并且,该候选切分线段的第i个像素点的坐标为(r_i,c_i),该像素点的灰度值为G(r_i,c_i),其中,r_d<r_i≤r_u,1≤c_i≤W。
在本实例中,要根据步骤S401和S402,从与第r_i行相邻的第(r_i-1)行的候选像素点中,选择一个候选像素点,作为该候选切分线段在第(r_i-1)行的像素点。其中,第(r_i-1)行可以被设定为具有M个候选像素点,与M领域搜索算法对应,M可以是大于等于3的自然数。下面,以M等于3为例进行说明。
在步骤S401中,第(r_i-1)行的3个候选像素点A1、A2、A3的坐标可以分别是:像素点A1(r_i-1,c_i-1),像素点A2(r_i-1,c_i),像素点A3(r_i-1,c_i+1)。
该3个候选像素点A1、A2、A3的灰度值可以分别是:像素点A1的灰度值为G(r_i-1,c_i-1),像素点A2的灰度值为G(r_i-1,c_i),像素点A3的灰度值为G(r_i-1,c_i+1)。
该3个候选像素点A1、A2、A3对应的代价值分别为λ1、λ2、λ3。λ1、λ2、λ3为经验值,其可以是取值范围为0到255之间的整数。代价值λ1、λ2、λ3分别对应于该3个候选像素点A1、A2、A3与候选切分线段的第i个像素点之间连线相对于列方向的倾斜程度,例如,像素点A2与第i个像素点位于同一列,二者连线与列方向平行,λ2的值可以最小,例如等于0,像素点A2、A3与第i个像素点的连线可以认为相对于列方向的倾斜程度相同,因此,λ1和λ3可以相等。
在本实施例中,可以根据候选像素点A1、A2、A3的灰度值和代价值,计算各候选像素点A1、A2、A3的路径代价值CO1、CO2、CO3。各路径代价值可以是将候选像素的灰度值与代价值进行相乘或相加而得到的,例如,可以根据下面的式(1)计算各路径代价值CO1、CO2、CO3:
CO1=G(r_i-1,c_i-1)+λ1
CO2=G(r_i-1,c_i)+λ2
CO3=G(r_i-1,c_i+1)+λ3 (1)
在步骤S402中,可以根据步骤S401计算出的路径代价值CO1、CO2、CO3,从该3个候选像素点中选择出一个候选像素点,作为该候选切分线段在第(r_i-1)行的像素点,例如,可以选择路径代价值最低的候选像素点作为该候选切分线段在第(r_i-1)行的像素点。
在本实施例中,在根据S401和S402确定了第(r_i-1)行的像素点后,可以以该第(r_i-1)行的像素点为基础,重复上述S401和S402,以确定第(r_i-2)行的像素点,并以此类推,顺次地确定该候选切分线段在每一行的像素点,直到确定了第r_d行的像素点,这些被确定了的像素点构成该候选切分线段,并且,该候选切分线段位于上端点所在的第r_u行和下端点所在的第r_d行之间。
在本实施例中,可以以上端点为起点,生成第一候选切分线段,并且以下端点为起点,生成第二候选切分线段,如果第一候选切分线段与第二候选切分线段不重合,可以计算第一候选切分线段中各像素点的路径代价值的总和,并计算第二候选切分线段中各像素点的路径代价值的总和,将路径代价值的总和最小的候选切分线段作为该候选切分区域的候选切分线段。
在本实施例的S202中,基于手写字符串图像的灰度值来生成候选切分线段,能够使候选切分线段的位置和形状更为准确地匹配字符间粘连区域的位置和形状,从而便于对粘连字符串进行准确切分。
在本实施例的S203中,可以从全部的候选切分线段中选择出正确切分线段,即,去除全部的候选切分线段中的冗余切分线段,保留正确切分线段。例如,可以根据各候选切分线段的几何特征来判断该候选切分线段是否为正确切分线段。
在本实施例中,对于单个候选切分线段,可以提取该候选切分线段E维几何特征x,其中,x=(f1,f2,…,fE),f1-fE分别代表几何特征x的各维度的特征,E可以是自然数,例如,E可以等于9。
如下的表1是候选切分线段的9维几何特征中各维度的特征的描述的一个示例,图5是部分参数的示意图。其中,x位置对应于候选切分线段的像素点的列号,y坐标对应于候选切分线段的像素点的行号,候选切分线段所切分得到的左切分块和右切分块的外接框分别被表示为Bbleft和Bbright,左切分块的外接框和右切分块的外接框的重叠区域的外接框被表示为Bbcommon,并且,图5的H表示该手写字符串图像的高度。
表1:
在本实施例中,假设整个手写字符串图像中的候选切分线段的数量为N,其中,第n个候选切分线段的特征用xn表示,该候选切分线段的类别标号tn∈{0;1},tn=1表示该候选切分线段为正确切分线段,而tn=0表示该候选切分线段为冗余切分线段,n为自然数,且1≤n≤N。在本实施例中,可以利用由LibSVM工具包训练得到的一个线性SVM分类器来对各候选切分线段进行分类。分类器输出yn=y(xn)表示第n个候选切分线段基于几何特征xn被判断为正确切分线段的概率,基于该概率yn,可以判断第n个候选切分线段是否为正确切分线段,例如,当该概率yn大于阈值时,可以判定为第n个候选切分线段是正确切分线段。
此外,tn的概率分布可以被表示为下面的式(2):
p(tn|xn)=yn,(tn=1)or(1-yn),(tn=0) (2)
在本申请中,也可以采用其它的方式来从全部的候选切分线段中选择出正确切分线段。
在本实施例的步骤S204中,可以采用现有技术,根据从步骤S204所选择出的正确切分线段,对手写字符串图像中粘连的字符进行切分。
根据本实施例,基于手写字符串图像的灰度值来生成候选切分线段,能够使候选切分线段的位置和形状更为准确地匹配字符间粘连区域的位置和形状,从而便于对粘连字符串进行准确切分。
实施例2
本申请实施例2提供一种手写粘连字符串的切分方法,与实施例1的切分方法类似,区别在于,在实施例2中,采用与实施例1不同的方法来实现实施例1的步骤S203,并且,在实施例2的描述中,与实施例1相同的符号具有与实施例1相同的含义。
图6是本实施例2的从全部候选切分线段中选择出正确切分线段的方法的一个示意图,用于实现实施例1的步骤S203。如图6所示,该方法包括:
S601、确定每个候选切分线段是正确切分线段的概率;
S602、将候选切分线段归类到不同的集合;以及
S603、根据各个集合中各候选切分线段是正确切分线段的概率,以及相邻的候选切分线段之间的转移概率,确定正确切分线段,其中,所述转移概率表示当相邻的候选切分线段中的一者是正确切分线段或不是正确切分线段的情况下,该相邻的候选切分线段中的另一者是正确切分线段的概率。
在本实施例中,转移概率描述了相邻的候选切分线段的相关性,因此,在选择正确切分线段时,既考虑到各候选切分线段自身的特征,也考虑到相邻的候选切分线段之间的相关性,能够更为准确地确定正确切分线段。
在本实施例的S601中,可以根据各候选切分线段的几何特征来确定该候选切分线段是正确切分线段的概率,例如,可以采用实施例1的S203中所说明的方法,并根据上式(2)来计算第n个候选切分线段是正确切分线段的概率,该概率可以表示为p(tn|xn)。当然,本实施例可以不限于此,也可以采用其它的方法来确定该概率。
在本实施例的S602中,可以根据前后两个候选切分线段之间的轮廓距离,来确定该前后两个候选切分线段是否为相邻的候选切分线段,如果前后两个候选切分线段相邻,则二者被归类到同一集合,如果前后两个候选切分线段不相邻,则二者被归类到不同的集合。例如,如果前后两个候选切分线段之间的轮廓距离小于该手写字符串图像高度的1/3,则可以判断为该前后两个候选切分线段相邻,可以将二者归类到同一个集合。其中,前后两个候选切分线段之间的轮廓距离的计算方法可以参考现有技术,本实施例不再说明。
图7是将多个候选切分线段归类为不同集合的一个示意图,如图1所示,集合701中具有候选切分线段7011,集合702中具有候选切分线段7021、7022和7023,集合703中具有候选切分线段7031和7032。其中,在集合702中,候选切分线段7021与7022相邻,候选切分线段7022与7023相邻;在集合703中,候选切分线段7031与7032相邻;候选切分线段7011和7021不相邻,因此二者被归类到不同的集合;候选切分线段7023和7031不相邻,因此二者被归类到不同的集合。
在本实施例的S603中,可以根据各个集合中各候选切分线段是正确切分线段的概率,以及相邻的候选切分线段之间的转移概率,确定正确切分线段。例如,对于某一集合中的第n个候选切分线段,可以根据该候选切分线段是正确切分线段的概率p(tn|xn),以及第n-1个候选切分线段与该第n个候选切分线段之间的转移概率p(tn|tn-1),确定该第n个候选切分线段是否为正确切分线段。
在本实施例中,转移概率p(tn|tn-1)可以通过对训练数据进行统计来得到,下表2是相邻的候选切分线段的转移概率矩阵的一个示例,其中,tn为第n个候选切分线段的类别标号,tn-1为与该第n个候选切分线段相邻的第n-1个候选切分线段的类别标号,并且,对应于表2,设起始的候选切分线段的概率值p(t1=1)为边缘概率值,并且,p(t1=1)=0.32。
表2:
tn-1=1 tn-1=0
tn=1 0.0 0.49
tn=0 1.0 0.51
下面,对S603的实现方式进行说明。
图8是本实施例的根据各候选切分线段是正确切分线段的概率和转移概率,确定正确切分线段的方法的一个示意图,该方法用于实现S603。如图8所示,该方法包括:
S801、在每个集合中,根据各候选切分线段是正确切分线段的概率,以及所述转移概率,计算该集合对应的整体概率;
S802、在每个集合中,计算符合先验约束条件的所述整体概率的最大值,所述先验约束条件是指,该每个集合中最多具有1个正确切分线段;以及
S803、在每个集合中,判断所述整体概率为所述最大值时各候选切分线段是否为正确切分线段。
在本实施例中,假设所有的候选切分线段总共被划分为L个集合,对于其中的第w个集合,假设该集合中具有K个候选切分线段,该K个候选切分线段可以构成一个长度为K的序列。
在S801中,计算该第w个集合所对应的整体概率P(x1,…,xK;t1,…,tK),其中,该整体概率P(x1,…,xK;t1,…,tK)例如可以通过下式(3)来计算得到:
其中,起始转移概率为p(t1|t0),并且,p(t1|t0)=p(t1);p(xn|tn)被称为一阶似然,用于表示类别标号tn所对应的基于该第n个候选切分线段的几何特征的发射概率分布,并且,p(xn|tn)可以根据贝叶斯定理得到,例如,如下式(4)所示:
在上式(4)中,p(tn)是类别标号tn的先验概率,可以从训练数据中统计得到,p(xn)表示该几何特征xn的先验概率,跟类别标号无关。
在S802中,对于该第w个集合,可以计算符合先验约束条件的整体概率的最大值,该先验约束条件是指,该第w个集合中最多具有1个正确切分线段。在本实施例中,该第w个集合内的K条候选切分线段所对应的类别标号序列为t1,…,tn,…,tK,其中,tn=1表示该候选切分线段为正确切分线段,tn=0表示该候选切分线段为冗余切分线段。因此,该先验约束条件可以被转化为,K个类别标号中最多有1个为1,其他都为0,这样,该第w个集合所对应的符合该先验约束条件的类别标号序列共有K+1种。
在S802中,可以分别计算上述K+1种标号序列所对应的整体概率P(x1,…,xK;t1,…,tK),并确定计算出的整体概率的最大值。
在S803中,根据在S802中计算出的整体概率的最大值所对应的标号序列t* 1,…,t* n,…,t* K,来判断在该第w个集合中,各候选切分线段是否为正确切分线段,其中,如果t* n=1,则第n条候选切分线段为正确切分线段,如果t* n=0,则第n条候选切分线段为冗余切分线段,并且,n为自然数,且1≤n≤K。
在本实施例中,标号序列t* 1,…,t* n,…,t* K满足下式(5)的条件:
在本实施例中,在选择正确切分线段时,既考虑到各候选切分线段自身的特征,也考虑到相邻的候选切分线段之间的相关性,因此,能够更为准确地确定正确切分线段。
实施例3
本申请实施例3提供一种手写粘连字符串的切分方法,与实施例1和实施例2的切分方法类似,区别在于,在实施例3中,采用与实施例1和实施例2不同的方法来实现步骤S203,并且,在实施例3的描述中,与实施例1和实施例2相同的符号具有与实施例1和实施例2相同的含义。
图9是本实施例3的从全部候选切分线段中选择出正确切分线段的方法的一个示意图,用于实现实施例1的步骤S203。如图9所示,该方法包括:
S901、确定每个候选切分线段是正确切分线段的概率;
S902、将候选切分线段归类到不同的集合;
S903、在每个集合中,提取相邻的候选切分线段之间的几何特征;以及
S904、根据各个集合中各候选切分线段是正确切分线段的概率,所述几何特征,以及相邻的候选切分线段之间的转移概率,确定正确切分线段,其中,所述转移概率表示当相邻的候选切分线段中的一者是正确切分线段或不是正确切分线段的情况下,该相邻的候选切分线段中的另一者是正确切分线段的概率。
正确切分线段和其相邻的候选切分线段之间,相比较于相邻的两条冗余切分线段之间,存在一些不同的几何特性。本实施例在选择正确切分线段时,不仅考虑到各候选切分线段自身的特征,和相邻的候选切分线段之间的相关性,而且,考虑到相邻的候选切分线段之间的几何特性,因此,能够更为准确地确定正确切分线段。
本实施例的S901和S902与实施例2的S601和S602相同,本实施例中对于转移概率和各候选切分线段是正确切分线段的概率也与实施例2的说明相同,此处不再赘述。
在本实施例的步骤S903中,相邻的候选切分线段之间的几何特征z可以是F维,其中,z=(r1,r2,…,rF),r1,r2,…,rF分别代表几何特征z的各维度的特征,F可以是自然数,例如,F可以等于9。
如下的表3是相邻的候选切分线段之间的9维几何特征中各维度的特征的一个示例。其中,第i条候选切分线段与第j条候选切分线段相邻;πup(i)和πup(j)分别表示第i条和第j条候选切分线段的上端点在手写字符串图像的上轮廓中的索引号,该索引号例如可以是从该图像最左端开始遍历得到的索引号;πlo(i)和πlo(j)分别表示第i条和第j条候选切分线段的下端点在手写字符串图像的下轮廓中的索引号,该索引号例如可以是从该图像最左端开始遍历得到的索引号。
表3:
No. 特征描述
r1 切分线段间的水平距离
r2 切分线段中心间的竖直距离
r3 切分线段上端点间的轮廓距离:|πup(i)-πup(j)|
r4 切分线段下端点间的轮廓距离:|πlo(i)-πlo(j)|
r5 切分线段间的竖直投影平均值
r6 切分线段间的竖直穿越笔划数平均值
r7 切分线段间图像块的外接框面积的平方根
r8 切分线段间图像块的外接框内前景像素的比例
r9 切分线段间的水平方向单笔划区域的比例
本实施例的S904可以采用与实施例2的S603相似的实现方式。
在本实施例的S904中,对于第w个集合,可以计算该第w个集合所对应的整体概率P(x1,…,xK;z1,…,zK;t1,…,tK),其中,该整体概率P(x1,…,xK;z1,…,zK;t1,…,tK)例如可以通过下式(6)来计算得到:
其中,K,xK,tK,p(tn|tn-1)和p(xn|tn)的含义与实施例2相同,第n个候选切分线段与第n-1个候选切分线段之间的几何特征为zn。p(zn|tn-1,tn)被称为二阶似然,用于表示相邻的候选切分线段的类别标号tn和tn-1所共享的发射概率分布,p(zn|tn-1,tn)可以根据贝叶斯定理得到,例如,如下式(7)所示:
在上式(7)中,p(tn-1,tn)是先验概率,可以从训练数据中统计得到,并且,假定p(t0,t1)=p(t1);p(tn-1,tn|zn)可以由基于相邻的切分线段间的几何特征的分类器输出得到;p(zn)表示该几何特征zn的先验概率,跟类别标号无关。
在S904中,对于该第w个集合,可以计算符合先验约束条件的整体概率的最大值,并得到该整体概率的最大值所对应的标号序列t* 1,…,t* n,…,t* K。在本实施例中,计算该整体概率的最大值以及得到标号序列t* 1,…,t* n,…,t* K的方法与实施例2类似。
在本实施例中,标号序列t* 1,…,t* n,…,t* K可以满足下式(8)的条件:
在本实施例中,在选择正确切分线段时,不仅考虑到各候选切分线段自身的特征和相邻的候选切分线段之间的相关性,而且,考虑到相邻的候选切分线段之间的几何特性,因此,能够更为准确地确定正确切分线段。
实施例4
本申请实施例4提供一种手写粘连字符串的切分装置,与实施例1、实施例2和实施例3的切分方法对应。
图10是本实施例的切分装置的一个示意图,如图10所示,该切分装置1000包括:第一确定单元1001、第一生成单元1002、第一选择单元1003和第一切分单元1004。
其中,第一确定单元1001用于确定手写字符串图像中的候选切分区域,所述候选切分区域具有上端点和下端点;第一生成单元1002对于每个候选切分区域,基于该手写字符串图像的灰度值和代价值,生成与所述上端点和所述下端点中至少一者连接的线段,作为候选切分线段,其中,所述代价值对应于所述候选切分线段上的每个像素点与相邻行的候选像素点之间连线相对于该手写字符串图像列方向的倾斜程度;第一选择单元1003用于从所述候选切分线段中选择出正确切分线段;第一切分单元1004根据所述正确切分线段,对所述手写字符串图像中粘连的字符进行切分。
图11是第一生成单元1002的一个示意图,如图11所示,第一生成单元1002包括:第一计算单元1101和第二选择单元1102。
其中,第一计算单元1101对于所述候选切分线段中的每一个像素点,根据该像素点的相邻行的各候选像素点的灰度值以及各候选像素点所对应的代价值,计算各候选像素点的路径代价值;第二选择单元1102根据各候选像素点的路径代价值,选择候选像素点,选择出的候选像素点被作为所述候选切分线段在所述相邻行上的像素点。
图12是第一选择单元1003的一个示意图,如图12所示,第一选择单元1003包括:第二确定单元1201、第一分类单元1202以及第三确定单元1203。
其中,第二确定单元1201用于确定每个候选切分线段是正确切分线段的概率;第一分类单元1202用于将候选切分线段归类到不同的集合;第三确定单元1203根据各个集合中各候选切分线段是正确切分线段的概率,以及相邻的候选切分线段之间的转移概率,确定正确切分线段。
图13是第三选择单元1203的一个示意图,如图13所示,第三选择单元1203包括:第二计算单元1301、第三计算单元1302以及第一判断单元1303。
其中,第二计算单元1301在每个集合中,根据各候选切分线段是正确切分线段的概率,以及所述转移概率,计算该集合对应的整体概率;第三计算单元1302在每个集合中,计算符合先验约束条件的所述整体概率的最大值,所述先验约束条件是指,该每个集合中最多具有1个正确切分线段;第一判断单元1303在每个集合中,判断所述整体概率为所述最大值时各候选切分线段是否为正确切分线段。
图14是第一选择单元1003的另一个示意图,如图14所示,第一选择单元1003包括:第四确定单元1401、第二分类单元1402、第一提取单元1403以及第五确定单元1404。
其中,第四确定单元1401用于确定每个候选切分线段是正确切分线段的概率;第二分类单元1402用将候选切分线段归类到不同的集合;第一提取单元1403在每个集合中,提取相邻的候选切分线段之间的几何特征;第五确定单元1404根据各个集合中各候选切分线段是正确切分线段的概率,所述几何特征,以及相邻的候选切分线段之间的转移概率,确定正确切分线段。
在本实施例中,关于上述各单元的说明,可以参考实施例1-实施例3中对相应步骤的说明。
实施例5
本申请实施例5提供一种电子设备,所述电子设备包括:如实施例4所述的切分装置。
图15是本申请实施例4的电子设备的构成示意图。如图15所示,电子设备1500可以包括:中央处理器(CPU)1501和存储器1502;存储器1502耦合到中央处理器1501。其中该存储器1502可存储各种数据;此外还存储信息处理的程序,并且在中央处理器1501的控制下执行该程序。
在一个实施方式中,切分装置的功能可以被集成到中央处理器1501中。
其中,中央处理器1501可以被配置为:确定手写字符串图像中的候选切分区域,所述候选切分区域具有上端点和下端点;对于每个候选切分区域,基于该手写字符串图像的灰度值和代价值,生成与所述上端点和所述下端点中至少一者连接的线段,作为候选切分线段,其中,所述代价值对应于所述候选切分线段上的每个像素点与相邻行的候选像素点之间连线相对于该手写字符串图像列方向的倾斜程度;从所述候选切分线段中选择出正确切分线段;根据所述正确切分线段,对所述手写字符串图像中粘连的字符进行切分。
中央处理器1501还可以被配置为:对于所述候选切分线段中的每一个像素点,根据该像素点的相邻行的各候选像素点的灰度值以及各候选像素点所对应的代价值,计算各候选像素点的路径代价值;根据各候选像素点的路径代价值,选择候选像素点,选择出的候选像素点被作为所述候选切分线段在所述相邻行上的像素点。
中央处理器1501还可以被配置为:该候选像素点的灰度值与代价值进行相乘或相加,以得到该候选像素点的路径代价值。
中央处理器1501还可以被配置为:确定每个候选切分线段是正确切分线段的概率;将候选切分线段归类到不同的集合;根据各个集合中各候选切分线段是正确切分线段的概率,以及相邻的候选切分线段之间的转移概率,确定正确切分线段,其中,所述转移概率表示当相邻的候选切分线段中的一者是正确切分线段或不是正确切分线段的情况下,该相邻的候选切分线段中的另一者是正确切分线段的概率。
中央处理器1501还可以被配置为:在每个集合中,根据各候选切分线段是正确切分线段的概率,以及所述转移概率,计算该集合对应的整体概率;在每个集合中,计算符合先验约束条件的所述整体概率的最大值,所述先验约束条件是指,该每个集合中最多具有1个正确切分线段;在每个集合中,判断所述整体概率为所述最大值时各候选切分线段是否为正确切分线段。
中央处理器1501还可以被配置为:确定每个候选切分线段是正确切分线段的概率;将候选切分线段归类到不同的集合;在每个集合中,提取相邻的候选切分线段之间的几何特征;根据各个集合中各候选切分线段是正确切分线段的概率,所述几何特征,以及相邻的候选切分线段之间的转移概率,确定正确切分线段。
在另一个实施方式中,切分装置可以与中央处理器1501分开配置,例如可以将切分装置配置为与中央处理器1501连接的芯片,通过中央处理器1501的控制来实现切分装置的功能。
此外,如图15所示,电子设备1500还可以包括:输入输出单元1503和显示单元1504等;其中,上述部件的功能与现有技术类似,此处不再赘述。值得注意的是,电子设备1500也并不是必须要包括图15中所示的所有部件;此外,电子设备1500还可以包括图15中没有示出的部件,可以参考现有技术。
本发明实施例还提供一种计算机可读程序,其中当在电子设备中执行所述程序时,所述程序使得计算机在所述电子设备中执行如实施例1、实施例2或实施例3所述的切分方法。
本发明实施例还提供一种存储有计算机可读程序的存储介质,其中所述计算机可读程序使得计算机执行如实施例1、实施例2或实施例3所述的切分方法。
结合本发明实施例描述的定位装置可直接体现为硬件、由处理器执行的软件模块或二者组合。例如,图10-14中所示的功能框图中的一个或多个和/或功能框图的一个或多个组合,既可以对应于计算机程序流程的各个软件模块,亦可以对应于各个硬件模块。这些软件模块,可以分别对应于实施例1-3所示的各个步骤。这些硬件模块例如可利用现场可编程门阵列(FPGA)将这些软件模块固化而实现。
软件模块可以位于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域已知的任何其它形式的存储介质。可以将一种存储介质耦接至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息;或者该存储介质可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。该软件模块可以存储在移动终端的存储器中,也可以存储在可插入移动终端的存储卡中。例如,若设备(例如移动终端)采用的是较大容量的MEGA-SIM卡或者大容量的闪存装置,则该软件模块可存储在该MEGA-SIM卡或者大容量的闪存装置中。
针对图10-14描述的功能框图中的一个或多个和/或功能框图的一个或多个组合,可以实现为用于执行本申请所描述功能的通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或晶体管逻辑器件、分立硬件组件、或者其任意适当组合。针对图10-14描述的功能框图中的一个或多个和/或功能框图的一个或多个组合,还可以实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、与DSP通信结合的一个或多个微处理器或者任何其它这种配置。
以上结合具体的实施方式对本申请进行了描述,但本领域技术人员应该清楚,这些描述都是示例性的,并不是对本申请保护范围的限制。本领域技术人员可以根据本申请的原理对本申请做出各种变型和修改,这些变型和修改也在本申请的范围内。
关于包括以上实施例的实施方式,还公开下述的附记:
附记1、一种手写粘连字符串的切分装置,用于对手写字符串图像中粘连的字符进行切分,其特征在于,该装置包括:
第一确定单元,其用于确定手写字符串图像中的候选切分区域,所述候选切分区域具有上端点和下端点;
第一生成单元,其对于每个候选切分区域,基于该手写字符串图像的灰度值和代价值,生成与所述上端点和所述下端点中至少一者连接的线段,作为候选切分线段,其中,所述代价值对应于所述候选切分线段上的每个像素点与相邻行的候选像素点之间连线相对于该手写字符串图像列方向的倾斜程度;
第一选择单元,其用于从所述候选切分线段中选择出正确切分线段;以及
第一切分单元,其根据所述正确切分线段,对所述手写字符串图像中粘连的字符进行切分。
附记2、如附记1所述的手写粘连字符串的切分装置,其特征在于,所述第一生成单元包括:
第一计算单元,其对于所述候选切分线段中的每一个像素点,根据该像素点的相邻行的各候选像素点的灰度值以及各候选像素点所对应的代价值,计算各候选像素点的路径代价值;以及
第二选择单元,其根据各候选像素点的路径代价值,选择候选像素点,选择出的候选像素点被作为所述候选切分线段在所述相邻行上的像素点。
附记3、如附记2所述的手写粘连字符串的切分装置,其特征在于,
所述第一计算单元将该候选像素点的灰度值与代价值进行相乘或相加,以得到该候选像素点的路径代价值。
附记4、如附记1所述的手写粘连字符串的切分装置,其特征在于,所述第一选择单元包括:
第二确定单元,其用于确定每个候选切分线段是正确切分线段的概率;
第一分类单元,其用于将候选切分线段归类到不同的集合;以及
第三确定单元,其根据各个集合中各候选切分线段是正确切分线段的概率,以及相邻的候选切分线段之间的转移概率,确定正确切分线段,其中,所述转移概率表示当相邻的候选切分线段中的一者是正确切分线段或不是正确切分线段的情况下,该相邻的候选切分线段中的另一者是正确切分线段的概率。
附记5、如附记4所述的手写粘连字符串的切分装置,其特征在于,所述第三确定单元包括:
第二计算单元,其在每个集合中,根据各候选切分线段是正确切分线段的概率,以及所述转移概率,计算该集合对应的整体概率;
第三计算单元,其在每个集合中,计算符合先验约束条件的所述整体概率的最大值,所述先验约束条件是指,该每个集合中最多具有1个正确切分线段;以及
第一判断单元,其在每个集合中,判断所述整体概率为所述最大值时各候选切分线段是否为正确切分线段。
附记6、如附记1所述的手写粘连字符串的切分装置,其特征在于,所述第一选择单元包括:
第四确定单元,其用于确定每个候选切分线段是正确切分线段的概率;
第二分类单元,其用将候选切分线段归类到不同的集合;
第一提取单元,其在每个集合中,提取相邻的候选切分线段之间的几何特征;以及
第五确定单元,其根据各个集合中各候选切分线段是正确切分线段的概率,所述几何特征,以及相邻的候选切分线段之间的转移概率,确定正确切分线段,其中,所述转移概率表示当相邻的候选切分线段中的一者是正确切分线段或不是正确切分线段的情况下,该相邻的候选切分线段中的另一者是正确切分线段的概率。
附记7、一种手写粘连字符串的切分方法,用于对手写字符串图像中粘连的字符进行切分,其特征在于,该方法包括:
确定手写字符串图像中的候选切分区域,所述候选切分区域具有上端点和下端点;
对于每个候选切分区域,基于该手写字符串图像的灰度值和代价值,生成与所述上端点和所述下端点中至少一者连接的线段,作为候选切分线段,其中,所述代价值对应于所述候选切分线段上的每个像素点与相邻行的候选像素点之间连线相对于该手写字符串图像列方向的倾斜程度;
从所述候选切分线段中选择出正确切分线段;以及
根据所述正确切分线段,对所述手写字符串图像中粘连的字符进行切分。
附记8、如附记7所述的手写粘连字符串的切分方法,其特征在于,生成所述候选切分线段包括:
对于所述候选切分线段中的每一个像素点,根据该像素点的相邻行的各候选像素点的灰度值以及各候选像素点所对应的代价值,计算各候选像素点的路径代价值;以及
根据各候选像素点的路径代价值,选择候选像素点,选择出的候选像素点被作为所述候选切分线段在所述相邻行上的像素点。
附记9、如附记8所述的手写粘连字符串的切分方法,其特征在于,计算各候选像素点的路径代价值包括:
该候选像素点的灰度值与代价值进行相乘或相加,以得到该候选像素点的路径代价值。
附记10、如附记7所述的手写粘连字符串的切分方法,其特征在于,从所述候选切分线段中选择出正确切分线段包括:
确定每个候选切分线段是正确切分线段的概率;
将候选切分线段归类到不同的集合;以及
根据各个集合中各候选切分线段是正确切分线段的概率,以及相邻的候选切分线段之间的转移概率,确定正确切分线段,其中,所述转移概率表示当相邻的候选切分线段中的一者是正确切分线段或不是正确切分线段的情况下,该相邻的候选切分线段中的另一者是正确切分线段的概率。
附记11、如附记10所述的手写粘连字符串的切分方法,其特征在于,根据各个集合中各候选切分线段是正确切分线段的概率,以及所述转移概率,确定正确切分线段包括:
在每个集合中,根据各候选切分线段是正确切分线段的概率,以及所述转移概率,计算该集合对应的整体概率;
在每个集合中,计算符合先验约束条件的所述整体概率的最大值,所述先验约束条件是指,该每个集合中最多具有1个正确切分线段;以及
在每个集合中,判断所述整体概率为所述最大值时各候选切分线段是否为正确切分线段。
附记12、如附记7所述的手写粘连字符串的切分方法,其特征在于,从所述候选切分线段中选择出正确切分线段包括:
确定每个候选切分线段是正确切分线段的概率;
将候选切分线段归类到不同的集合;
在每个集合中,提取相邻的候选切分线段之间的几何特征;以及
根据各个集合中各候选切分线段是正确切分线段的概率,所述几何特征,以及相邻的候选切分线段之间的转移概率,确定正确切分线段,其中,所述转移概率表示当相邻的候选切分线段中的一者是正确切分线段或不是正确切分线段的情况下,该相邻的候选切分线段中的另一者是正确切分线段的概率。
附记13、一种电子设备,其具有附记1所述的手写粘连字符串的切分装置。

Claims (10)

1.一种手写粘连字符串的切分装置,用于对手写字符串图像中粘连的字符进行切分,其特征在于,该装置包括:
第一确定单元,其用于确定手写字符串图像中的候选切分区域,所述候选切分区域具有上端点和下端点;
第一生成单元,其对于每个候选切分区域,基于该手写字符串图像的灰度值和代价值,生成与所述上端点和所述下端点中至少一者连接的线段,作为候选切分线段,其中,所述代价值对应于所述候选切分线段上的每个像素点与相邻行的候选像素点之间连线相对于该手写字符串图像列方向的倾斜程度;
第一选择单元,其用于从所述候选切分线段中选择出正确切分线段;以及
第一切分单元,其根据所述正确切分线段,对所述手写字符串图像中粘连的字符进行切分。
2.如权利要求1所述的手写粘连字符串的切分装置,其特征在于,所述第一生成单元包括:
第一计算单元,其对于所述候选切分线段中的每一个像素点,根据该像素点的相邻行的各候选像素点的灰度值以及各候选像素点所对应的代价值,计算各候选像素点的路径代价值;以及
第二选择单元,其根据各候选像素点的路径代价值,选择候选像素点,选择出的候选像素点被作为所述候选切分线段在所述相邻行上的像素点。
3.如权利要求2所述的手写粘连字符串的切分装置,其特征在于,
所述第一计算单元将该候选像素点的灰度值与代价值进行相乘或相加,以得到该候选像素点的路径代价值。
4.如权利要求1所述的手写粘连字符串的切分装置,其特征在于,所述第一选择单元包括:
第二确定单元,其用于确定每个候选切分线段是正确切分线段的概率;
第一分类单元,其用于将候选切分线段归类到不同的集合;以及
第三确定单元,其根据各个集合中各候选切分线段是正确切分线段的概率,以及相邻的候选切分线段之间的转移概率,确定正确切分线段,其中,所述转移概率表示当相邻的候选切分线段中的一者是正确切分线段或不是正确切分线段的情况下,该相邻的候选切分线段中的另一者是正确切分线段的概率。
5.如权利要求4所述的手写粘连字符串的切分装置,其特征在于,所述第三确定单元包括:
第二计算单元,其在每个集合中,根据各候选切分线段是正确切分线段的概率,以及所述转移概率,计算该集合对应的整体概率;
第三计算单元,其在每个集合中,计算符合先验约束条件的所述整体概率的最大值,所述先验约束条件是指,该每个集合中最多具有1个正确切分线段;以及
第一判断单元,其在每个集合中,判断所述整体概率为所述最大值时各候选切分线段是否为正确切分线段。
6.如权利要求1所述的手写粘连字符串的切分装置,其特征在于,所述第一选择单元包括:
第四确定单元,其用于确定每个候选切分线段是正确切分线段的概率;
第二分类单元,其用将候选切分线段归类到不同的集合;
第一提取单元,其在每个集合中,提取相邻的候选切分线段之间的几何特征;以及
第五确定单元,其根据各个集合中各候选切分线段是正确切分线段的概率,所述几何特征,以及相邻的候选切分线段之间的转移概率,确定正确切分线段,其中,所述转移概率表示当相邻的候选切分线段中的一者是正确切分线段或不是正确切分线段的情况下,该相邻的候选切分线段中的另一者是正确切分线段的概率。
7.一种手写粘连字符串的切分方法,用于对手写字符串图像中粘连的字符进行切分,其特征在于,该方法包括:
确定手写字符串图像中的候选切分区域,所述候选切分区域具有上端点和下端点;
对于每个候选切分区域,基于该手写字符串图像的灰度值和代价值,生成与所述上端点和所述下端点中至少一者连接的线段,作为候选切分线段,其中,所述代价值对应于所述候选切分线段上的每个像素点与相邻行的候选像素点之间连线相对于该手写字符串图像列方向的倾斜程度;
从所述候选切分线段中选择出正确切分线段;以及
根据所述正确切分线段,对所述手写字符串图像中粘连的字符进行切分。
8.如权利要求7所述的手写粘连字符串的切分方法,其特征在于,生成所述候选切分线段包括:
对于所述候选切分线段中的每一个像素点,根据该像素点的相邻行的各候选像素点的灰度值以及各候选像素点所对应的代价值,计算各候选像素点的路径代价值;以及
根据各候选像素点的路径代价值,选择候选像素点,选择出的候选像素点被作为所述候选切分线段在所述相邻行上的像素点。
9.如权利要求7所述的手写粘连字符串的切分方法,其特征在于,从所述候选切分线段中选择出正确切分线段包括:
确定每个候选切分线段是正确切分线段的概率;
将候选切分线段归类到不同的集合;以及
根据各个集合中各候选切分线段是正确切分线段的概率,以及相邻的候选切分线段之间的转移概率,确定正确切分线段,其中,所述转移概率表示当相邻的候选切分线段中的一者是正确切分线段或不是正确切分线段的情况下,该相邻的候选切分线段中的另一者是正确切分线段的概率。
10.一种电子设备,其具有权利要求1所述的手写粘连字符串的切分装置。
CN201610274847.8A 2016-04-28 2016-04-28 手写粘连字符串的切分方法、切分装置和电子设备 Active CN107341429B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610274847.8A CN107341429B (zh) 2016-04-28 2016-04-28 手写粘连字符串的切分方法、切分装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610274847.8A CN107341429B (zh) 2016-04-28 2016-04-28 手写粘连字符串的切分方法、切分装置和电子设备

Publications (2)

Publication Number Publication Date
CN107341429A true CN107341429A (zh) 2017-11-10
CN107341429B CN107341429B (zh) 2020-09-01

Family

ID=60221748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610274847.8A Active CN107341429B (zh) 2016-04-28 2016-04-28 手写粘连字符串的切分方法、切分装置和电子设备

Country Status (1)

Country Link
CN (1) CN107341429B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108549896A (zh) * 2018-04-24 2018-09-18 大连民族大学 满文部件切分中删除多余候选切分行的方法
CN110033004A (zh) * 2019-03-25 2019-07-19 广东奥普特科技股份有限公司 一种粘连字符的识别方法
CN112288047A (zh) * 2020-12-25 2021-01-29 成都索贝数码科技股份有限公司 基于概率分布转换聚类的广播电视新闻拆条方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002312719A (ja) * 2001-04-11 2002-10-25 Nec Corp 文字切り出し装置及び文字切り出し方法並びに文字切り出し用プログラム
JP3343305B2 (ja) * 1995-01-26 2002-11-11 富士通株式会社 文字切り出し装置、及び文字切り出し方法
CN101770576A (zh) * 2008-12-31 2010-07-07 北京新岸线网络技术有限公司 字符提取方法和装置
CN102402686A (zh) * 2011-12-07 2012-04-04 北京云星宇交通工程有限公司 一种基于连通域分析的车牌字符分割方法
CN102663378A (zh) * 2012-03-22 2012-09-12 杭州新锐信息技术有限公司 连笔手写字符的识别方法
CN102915440A (zh) * 2011-08-03 2013-02-06 汉王科技股份有限公司 一种字符切分的方法及装置
CN104504385A (zh) * 2014-12-10 2015-04-08 上海大学 手写粘连数字串的识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3343305B2 (ja) * 1995-01-26 2002-11-11 富士通株式会社 文字切り出し装置、及び文字切り出し方法
JP2002312719A (ja) * 2001-04-11 2002-10-25 Nec Corp 文字切り出し装置及び文字切り出し方法並びに文字切り出し用プログラム
CN101770576A (zh) * 2008-12-31 2010-07-07 北京新岸线网络技术有限公司 字符提取方法和装置
CN102915440A (zh) * 2011-08-03 2013-02-06 汉王科技股份有限公司 一种字符切分的方法及装置
CN102402686A (zh) * 2011-12-07 2012-04-04 北京云星宇交通工程有限公司 一种基于连通域分析的车牌字符分割方法
CN102663378A (zh) * 2012-03-22 2012-09-12 杭州新锐信息技术有限公司 连笔手写字符的识别方法
CN104504385A (zh) * 2014-12-10 2015-04-08 上海大学 手写粘连数字串的识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
NING WANG: "A NOVEL PRE-SEGMENTATION of chineses character in E-commerce", 《2009 FIRST INTERNATIONAL WORKSHOP ON EDUCATION TECHNOLOGY AND COMPUTER SCIENCE》 *
SHUYAN ZHAO 等: "Handwritten Chinese Character Segmentation Using a Two-Stage Approach", 《 PROCEEDINGS OF SIXTH INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION》 *
玛依热_依布拉音: "联机手写维吾尔文字母与单词识别研究", 《中国优秀博士学位论文数据库》 *
陈艳: "基于灰度图像的字符切分技术的研究", 《中国优秀硕士学位论文全文数据库》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108549896A (zh) * 2018-04-24 2018-09-18 大连民族大学 满文部件切分中删除多余候选切分行的方法
CN110033004A (zh) * 2019-03-25 2019-07-19 广东奥普特科技股份有限公司 一种粘连字符的识别方法
CN110033004B (zh) * 2019-03-25 2021-01-05 广东奥普特科技股份有限公司 一种粘连字符的识别方法
CN112288047A (zh) * 2020-12-25 2021-01-29 成都索贝数码科技股份有限公司 基于概率分布转换聚类的广播电视新闻拆条方法

Also Published As

Publication number Publication date
CN107341429B (zh) 2020-09-01

Similar Documents

Publication Publication Date Title
CN110738207B (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
JP5522408B2 (ja) パターン認識装置
CN105184292B (zh) 自然场景图像中手写体数学公式结构分析与识别方法
CN106156761B (zh) 面向移动终端拍摄的图像表格检测与识别方法
US10354133B2 (en) Method for structural analysis and recognition of handwritten mathematical formula in natural scene image
US8170340B2 (en) Device, method and computer program for identifying a traffic sign in an image
Harouni et al. Online Persian/Arabic script classification without contextual information
US9665768B2 (en) Process of handwriting recognition and related apparatus
KR101690981B1 (ko) 형태 인식 방법 및 디바이스
US9875253B2 (en) Color sketch image searching
CN105574524B (zh) 基于对白和分镜联合识别的漫画图像版面识别方法和系统
CN110097044A (zh) 基于深度学习的一阶段车牌检测识别方法
CN102129560B (zh) 字符识别的方法和设备
CN110555433A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
CN111914838A (zh) 一种基于文本行识别的车牌识别方法
CN105224937A (zh) 基于人体部件位置约束的细粒度语义色彩行人重识别方法
CN111191652A (zh) 一种证件图像识别方法、装置、电子设备及存储介质
CN109977762B (zh) 一种文本定位方法及装置、文本识别方法及装置
CN107341429A (zh) 手写粘连字符串的切分方法、切分装置和电子设备
US8036461B2 (en) Method of graphical objects recognition using the integrity principle
JP2018060389A (ja) プログラム、情報記憶媒体及び文字分割装置
CN101393608A (zh) 一种基于流形距离分析的视觉对象识别方法和装置
CN104732247A (zh) 一种人脸特征定位方法
CN102073862A (zh) 一种快速的文档图像版面结构计算方法
US8612183B2 (en) Analysis model generation system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant