CN105095924A - 手写识别方法和设备 - Google Patents
手写识别方法和设备 Download PDFInfo
- Publication number
- CN105095924A CN105095924A CN201410171650.2A CN201410171650A CN105095924A CN 105095924 A CN105095924 A CN 105095924A CN 201410171650 A CN201410171650 A CN 201410171650A CN 105095924 A CN105095924 A CN 105095924A
- Authority
- CN
- China
- Prior art keywords
- stroke
- character
- cutting
- cut
- confidence level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000005520 cutting process Methods 0.000 claims description 149
- 230000015572 biosynthetic process Effects 0.000 claims description 27
- 230000006870 function Effects 0.000 claims description 19
- 238000003786 synthesis reaction Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 7
- 238000010612 desalination reaction Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
Abstract
本申请公开了一种手写识别方法以及相应的手写识别设备。所述方法包括:接收用户在同一输入区域连续输入的手写笔画序列;以及基于单字可信度,对所接收的手写笔画序列进行切分断字。所公开的手写识别方法以及相应的手写识别设备不但能够识别用户在同一输入区域内以重叠覆盖的方式连续输入的多个字符,还能保障较高的切分断字精度和手写输入效率。
Description
技术领域
本申请总体涉及人机交互技术领域,具体涉及手写识别。
背景技术
随着移动通信技术的日益发展,具有触摸屏的智能终端变得越来越普及。为了借助触摸屏以手写方式输入信息的需要,手写识别技术在这些终端上得到了广泛的应用。
传统上,屏幕尺寸有限的智能终端采用基于单字符输入的手写识别技术。即,用户在预定的书写区内(如预置的书写框或整个屏幕上)逐字输入,在单字结束后提笔等待系统反馈。在得到系统反馈的单字识别结果后,清空书写屏幕继续下个字符的输入。然而,这样的输入方式不符合人们日常连续输入字符的书写习惯,而且提笔轮候和等待识别影响了输入效率。
为了改善用户手写体验和提高手写输入效率,需要一种重叠手写输入识别方法,用以识别用户在同一输入区域内以重叠覆盖的方式连续输入的多个字符。
为此,题为“叠加手写输入显示方法及系统”的中国专利CN102141892B公开了一种方案,其中,根据笔画的手写特征和相邻笔画之间的位置关系,来确定笔画的隶属关系。并且,根据相邻笔画之间的停顿时间,来判断所输入的笔画是否组成同一字符。
然而,基于相邻笔画之间的停顿时间来进行切分断字不够精确。例如,用户在输入一个复杂字符的过程中可能会中途停下稍作思考或休息。基于该停顿进行切分断字将导致错误的识别结果。虽然能够通过强制用户在输入下一字符前等待相对较长的时间来区分字符间停顿和字符内停顿,但是这样做不符合人们日常连续输入字符的手写习惯,且势必降低手写输入的速度和效率。
发明内容
鉴于现有技术的上述问题和缺陷,本发明的目的在于提出一种新的重叠手写识别方案,不但能够识别用户在同一输入区域内以重叠覆盖的方式连续输入的多个字符,还能保障较高的切分断字精度和手写输入效率。
根据本发明的第一方面,提供了一种手写识别方法,包括:接收用户在同一输入区域连续输入的手写笔画序列;以及基于单字可信度,对所接收的手写笔画序列进行切分断字。
所述基于单字可信度对所接收的手写笔画序列进行切分断字可以包括前向切分和/或反向切分。所述前向切分按与笔画输入相同的顺序,确定所接收的手写笔画序列的切分点。所述反向切分按与笔画输入相反的顺序,确定所接收的手写笔画序列的切分点。
所述前向切分可以包括:将所接收的手写笔画序列中位于上一切分点之后的笔画读入前向切分集合;针对前向切分集合中的每个笔画,计算该笔画及其前笔画形成单字的可信度;将单字可信度最大的笔画与其后一笔画之间的间隙确定为切分点;以及重复执行上述三个步骤。当首次执行所述三个步骤时,所述上一切分点位于最先输入的笔画之前。
所述反向切分可以包括:将所接收的手写笔画序列中位于上一切分点之前的笔画读入反向切分集合;针对反向切分集合中的每个笔画,计算该笔画及其后笔画形成单字的可信度;将单字可信度最大的笔画与其前一笔画之间的间隙确定为切分点;以及重复执行上述三个步骤。当首次执行所述三个步骤时,所述上一切分点位于最后输入的笔画之后。
如果所述前向切分和反向切分确定的切分点不重合,可以针对非重合切分点前后两个切分点之间的笔画执行细切分。所述细切分可以包括:列举所述笔画的所有切分可能,其中,每一种切分可能对应于一种与切分点数目和位置有关的切分点配置;针对每一种切分可能,计算切分点之间的笔画形成单字的可信度,并根据所计算的单字可信度确定该切分可能的总可信度;以及将总可信度最大的切分可能所对应的切分点配置确定为切分结果。
所述方法还可以包括:确定切分点之间的笔画形成的单字之间是否存在重叠区域以及重叠区域的大小;以及基于所述确定,判断所述单字是否是构成一个合成字。
所述方法还可以包括:在用户进行笔画输入时,以淡色显示或消隐已识别出的完整字符。
在用户进行笔画输入时以淡色显示或消隐已识别出的完整字符可以包括:在用户新输入了一个笔画后,对用户输入的笔画序列进行手写识别,从而识别出字符串;如果新输入的一个笔画是所述字符串中最后一个字符的第一笔且所述字符串中倒数第二个字符与用户输入上一笔画后识别出的字符串的最后一个字符相同,或者如果新输入的一个笔画不是所述字符串中最后一个字符的第一笔且所述字符串中倒数第二个字符与用户输入上一笔画后识别出的字符串的倒数第二个字符相同,则判断倒数第二个字符的笔画数是否大于2;以及如果所述倒数第二个字符的笔画数大于2,则对所述倒数第二个字符及其之前的字符进行淡色显示或消隐。
对所接收的手写笔画序列进行切分断字还可以基于所接收的手写笔画序列中的部分或全部笔画与重叠字符模板的匹配程度。每个重叠字符模板可以由两个重叠的字符构成。
优选地,利用语言和/或书写规则,来辅助文字识别。
根据本发明的第二方面,提供了一种手写识别设备,包括:接收装置,用于接收用户在同一输入区域连续输入的手写笔画序列;以及切分装置,用于基于单字可信度,对所接收的手写笔画序列进行切分断字。
所述切分装置可以包括前向切分装置和/或反向切分装置。所述前向切分装置用于按与笔画输入相同的顺序,确定所接收的手写笔画序列的切分点。所述反向切分装置用于按与笔画输入相反的顺序,确定所接收的手写笔画序列的切分点。
所述前向切分装置可以包括:前向切分集合形成单元,用于将所接收的手写笔画序列中位于上一切分点之后的笔画读入前向切分集合;单字可信度计算单元,用于针对前向切分集合中的每个笔画,计算该笔画及其前笔画形成单字的可信度;切分点确定单元,用于将单字可信度最大的笔画与其后一笔画之间的间隙确定为切分点;以及控制单元,用于控制上述三个单元重复执行各自的功能。当所述前向切分集合形成单元首次执行其功能时,所述上一切分点位于最先输入的笔画之前。
所述反向切分装置可以包括:反向切分集合形成单元,用于将所接收的手写笔画序列中位于上一切分点之前的笔画读入反向切分集合;单字可信度计算单元,用于针对反向切分集合中的每个笔画,计算该笔画及其后笔画形成单字的可信度;切分点确定单元,用于将单字可信度最大的笔画与其前一笔画之间的间隙确定为切分点;以及控制单元,用于控制上述三个单元重复执行各自的功能。当所述反向切分集成形成单元首次执行其功能时,所述上一切分点位于最后输入的笔画之后。
所述设备还可以包括:细切分装置,用于在所述前向切分和反向切分确定的切分点不重合的情况下,针对非重合切分点前后两个切分点之间的笔画执行细切分。所述细切分装置可以包括:切分可能枚举单元,用于列举所述笔画的所有切分可能,其中,每一种切分可能对应于一种与切分点数目和位置有关的切分点配置;可信度计算单元,用于针对每一种切分可能,计算切分点之间的笔画形成单字的可信度,并根据所计算的单字可信度确定该切分可能的总可信度;以及切分结果确定单元,用于将总可信度最大的切分可能所对应的切分点配置确定为切分结果。
所述设备还可以包括后处理装置。所述后处理装置包括:重叠区域评估单元,用于确定切分点之间的笔画形成的单字之间是否存在重叠区域以及重叠区域的大小;以及合成字判定单元,用于基于所述确定,判断所述单字是否是构成一个合成字。
所述后处理装置还可以被配置为:在用户进行笔画输入时,以淡色显示或消隐已识别出的完整字符。
所述后处理装置还可以包括:字符串识别单元,用于在用户新输入了一个笔画后,对用户输入的笔画序列进行手写识别,从而识别出字符串;判断单元,用于在新输入的一个笔画是所述字符串中最后一个字符的第一笔且所述字符串中倒数第二个字符与用户输入上一笔画后识别出的字符串的最后一个字符相同的情况下,或者在新输入的一个笔画不是所述字符串中最后一个字符的第一笔且所述字符串中倒数第二个字符与用户输入上一笔画后识别出的字符串的倒数第二个字符相同的情况下,判断倒数第二个字符的笔画数是否大于2;以及淡色显示或消隐单元,用于在所述倒数第二个字符的笔画数大于2的情况下,对所述倒数第二个字符及其之前的字符进行淡色显示或消隐。
所述切分装置还可以基于所接收的手写笔画序列中的部分或全部笔画与重叠字符模板的匹配程度,对所接收的手写笔画序列进行切分断字。每个重叠字符模板可以由两个重叠的字符构成。
后处理装置可以被配置为利用语言和/或书写规则,来辅助文字识别。
附图说明
通过下面结合附图说明本发明的优选实施例,将使本发明的上述及其它目的、特征和优点更加清楚,其中:
图1是示出了根据本发明的手写识别方法的流程图;
图2是示出了根据本发明的前向切分操作的流程图;
图3是示出了根据本发明的反向切分操作的流程图;
图4是示出了根据本发明的细切分操作的流程图;
图5示出了单个字符“切”和“分”的分解笔画;
图6示出了字符“切”和“分”重叠输入的效果;
图7示出了对字符串“切分”的输入笔画序列应用根据本发明的切分操作的切分示例;
图8示出了根据本发明的在用户进行笔画输入时以淡色显示或消隐已识别出的完整字符的流程图;
图9示出了对重叠输入的日语应用根据本发明的前字淡化处理的实际效果;以及
图10示出了根据本发明的手写识别设备的示例结构的框图。
具体实施方式
下面参照附图对本发明的优选实施例进行详细说明,在描述过程中省略了对于本发明来说是不必要的细节和功能,以防止对本发明的理解造成混淆。
首先,参照图1,对根据本发明的手写识别方法100的过程进行描述。如图1所示,手写识别方法100起始于步骤s110,接收用户在同一输入区域连续输入的手写笔画序列。接着,在步骤s120中,基于单字可信度,对所接收的手写笔画序列进行切分断字。为了实现步骤s120,可以采用模板匹配法进行单字识别,并将匹配距离确定为步骤s120中的单字可信度。
模板匹配法的特征模板可以基于学习策略(如广义学习矢量量化GLVQ)使用样本训练法来产生。在单字符识别中使用的特征可以包括例如笔画方向分布特征、网格笔画特征、周边方向特征等。特征提取前的预处理可以包括例如等距离平滑处理、基于质心的线性归一化、非线性归一化等,用以对全部特征进行归一化。为了提高识别速度,可以采用多级级联匹配法。关于模板匹配法的上述内容可在题为“字典制作方法、手写输入方法和设备”的中国专利CN101354749B中找到,此处不再赘述。
与基于相邻笔画之间的停顿时间来进行切分断字的现有技术相比,基于单字可信度对所接收的手写笔画序列进行切分断字能够显著提高切分断字精度和手写输入效率。
在具体实现中,步骤s120可以包括前向切分和/或反向切分(统称粗切分)。所述前向切分按与笔画输入相同的顺序,确定所接收的手写笔画序列的切分点。所述反向切分按与笔画输入相反的顺序,确定所接收的手写笔画序列的切分点。
以下参照图2和图3,描述前向切分和反向切分操作的示例实现。如图2所示,前向切分起始于步骤s201。在该步骤中,将前向切分集合设置为空集。在步骤s202中,将计数器i初始化为0。
接着,在步骤s203中,令计数器i加1。在步骤s204中,将手写笔画序列中的笔画si添加至前向切分集合S中。在步骤s205中,针对前向切分集合中的每个笔画sk(k=1,……,i-1,i),对该笔画及其前笔画形成单字进行单字识别,并计算其单字可信度Pk。在步骤s206中,判断计数器i是否等于所接收的手写笔画序列中的笔画总数L。
如果步骤s206中的判断结果为是,则前进至步骤s207,在Pk中搜索最大值max{Pk}。接着,在步骤s208中,记录max{Pk}所对应的笔画索引K,将该笔画与其后一笔画之间的间隙确定为记录为前向切分点。在步骤s209中,将前向切分集合S清空。在步骤s210中,将计数器i设置为K,返回至步骤s203,此时,在步骤s205中,k不是从1开始了,而是从切分点后的笔画K+1开始,即,k=K+1,……,i-1,i。如果步骤s206中的判断结果为否,则返回至步骤s203。
如图3所示,反向切分起始于步骤s301。在该步骤中,将反向切分集合设置为空集。在步骤s302中,将计数器i初始化为L+1。
接着,在步骤s303中,令计数器i减1。在步骤s304中,将手写笔画序列中的笔画si添加至反向切分集合S中。在步骤s305中,针对反向切分集合中的每个笔画sk(k=i,i+1,……,L),对该笔画及其后笔画形成单字进行单字识别,并计算其单字可信度Pk。在步骤s306中,判断计数器i是否等于1。
如果步骤s306中的判断结果为是,则前进至步骤s307,在Pk中搜索最大值max{Pk}。接着,在步骤s308中,记录max{Pk}所对应的笔画索引K,将该笔画与其前一笔画之间的间隙确定为记录为反向切分点。在步骤s309中,将前向切分集合S清空。在步骤s310中,将计数器i设置为K,返回至步骤s303,此时,在步骤s305中,k不是到L结束了,而是到反向切分点前的笔画K-1结束,即,k=i,i+1,……,K-1。如果步骤s306中的判断结果为否,则返回至步骤s303。
在既执行前向切分又执行反向切分的情况下,如果前向切分点和反向切分点完全重合,则可以暂时固定住这些切分点。然而,可能存在前向切分和反向切分点不完全重合的情形。在该情形下,优选地,针对非重合切分点前后两个切分点之间的笔画执行细切分。
以下参考图4,描述根据本发明的细切分操作的流程图。如图所示,细切分起始于步骤s401。在该步骤中,列举所述笔画的所有切分可能,其中,每一种切分可能对应于一种与切分点数目和位置有关的切分点配置。接着,在步骤s402中,针对每一种切分可能,计算切分点之间的笔画形成单字的可信度,并根据所计算的单字可信度确定该切分可能的总可信度。最后,在步骤s403中,将总可信度最大的切分可能所对应的切分点配置确定为细切分结果。
下面,以对重叠输入的手写字符串“切分”的手写笔画序列进行切分断字为例,阐述根据本发明的切分断字操作。作为示意,图5示出了单个字符“切”和“分”的分解笔画,图6示出了重叠输入的效果。
假设通过执行前向切分操作,可以得到前向切分点a1和a2,如图7(a)所示。通过执行反向切分操作,可以得到反向切分点b1、b2和b3。前向切分点a1和a2分别与反向切分点b2和b1重合,因而可以暂时固定住这些切分点。反向切分点b3无对应的前向切分点,因而将其前后未被切分点断开的两段笔画子序列(即,和)作为一个整体(即,)执行细切分。
为此,首先如图7(c)所示补充s1和s2两个潜在切分点。对所有笔画进行任意组合,形成C1,C2,……,C9等笔画组合。然后,列出所有可能的切分路径,如(1)C1;(2)C2C9;(3)C4C5;(4)C4C8C9;……等。针对每一种可能的切分路径,首先,对构成该路径的每个组合进行单字识别并计算其单字可信度。然后,计算该切分路径的总可信度。接着,选择总可信度最大的切分路径,并将其所对应的切分点确定为切分结果。其中,计算切分最佳路径的方法可以用动态规划,也可以用N-best算法,等等。
在采用N-Best方法的情况下,计算最可能的N种切分路径。定义每个笔画的开始点为一个基元节点,基元或基元组合构成的路径即为对应的笔画组合,每个部分路径的代价函数为:C(Y)=1-f(Y),也就是说,切分可信度越高,部分路径的代价函数值越小。N-best方法就是要选取最佳的N种路径,使所经过的所有路径的代价函数的数值之和最小、第二小……第N小。
N-Best方法可以用多种方式实现,例如,把动态规划(DP)方法与堆栈(Stack)算法相结合来产生多个候选项,等等。本发明实施例中,N-Best方法包括两个步骤:前向搜索过程采用一种改进的维特比(Viterbi)算法(维特比算法就是一种用于查找最可能的隐含状态序列的动态规划方法),用来记录转移到每个基元节点的最优N个部分路径的状态(即为所经过路径的代价函数值之和);第m个基元节点的状态只和第m-1个基元结点的状态有关;后向搜索过程采用一种基于A*算法的堆栈算法,对每一个节点m,它的启发函数(heuristicfunction)为下列两个函数的和:一是“路径代价函数”,表示从起始点到第m节点的最短路径的代价函数值之和,二是“启发估计函数”,表示从第m节点到目标节点的路径代价的估计。在后向搜索过程中,堆栈中的路径得分是计算的全路径得分,且最优的路径总是位于栈顶,所以,该算法是一种全局最优算法。
以图7(c)所示的情形为例,与其他切分路径相比,切分路径C1具有更大的总可信度。因此,选择与其对应的切分点作为细切分结果。进而,消除了在反向切分操作中获得的切分点b3。
在确定了切分点之后,可以读取在执行切分操作的过程中识别的单字,作为手写识别的结果。仍以图7为例,在经过粗切分之后,确定了切分点a1=b2以及a2=b1。经过细切分之后,未增加新的切分点。进而,手写识别结果可以被读取为在执行粗切分操作的过程中识别出的单字“切”、“八”、“刀”。可以对手写识别结果进行后处理,以优化识别准确度。
在具体实现中,可以确定切分点之间的笔画形成的单字之间是否存在重叠区域以及重叠区域的大小。基于确定结果,判断所述单字是否是构成一个合成字。通常,重叠区域越小,构成合成字的可能性就越大;重叠区域越大,构成合成字的可能性就越小。例如,根据“八”和“刀”无重叠区域或重叠区域极小,可以判断出两者构成合成字“分”。
此外,可以利用语言和/或书写规则,来辅助文字识别。例如,当对重叠输入的平假名序列进行识别时,可以采用以下方式来区分大写和小写假名:つ和つ(促音);以及やゆよ和やゆよ(拗音)。具体地,对于やゆよ(拗音),如果其之前输入的字符是“きぎしじちぢにひぴびみり”之一并且其尺寸明显小于之前输入的字符,则将其确定为小写字符。否则,将其确定为大小字符。对于つ(促音),可以首先将其尺寸与其上下文的多个字符进行比较,然后利用一些规则(如字典匹配规则)来确定其是小写字符还是大写字符。
为了进一步提高识别准确度,可以考虑训练重叠字符模板,并基于所接收的手写笔画序列中的部分或全部笔画与重叠字符模板的匹配程度,对手写笔画序列进行切分断字。以两字符平假名重叠为例,可以将84个平假名中的每一个与84个平假名依此进行组合,形成84*84个重叠字符模板“ああ”,“あい”,“あう”,“あえ”,“あお”,…,“あん”,..,“いう”,“いえ”,“いお”,…“いん”,...,等。
为了便于用户区分已录入的字符的笔画和当前正在书写的字符的笔画,本发明的手写识别方法支持在用户进行笔画输入时,以淡色显示或消隐已识别出的完整字符。下面参照图8描述实现该功能的示例流程。
首先,在步骤s801中,将计数器n初始化为0。在步骤s802中,等待用户输入新笔画,并在用户输入了新笔画后,通过对用户输入的笔画序列进行手写识别,识别出字符串C1C2……Ck。
接着,在步骤s803中,判断新输入的一个笔画是所述字符串中最后一个字符Ck的第一笔。如果是则执行步骤s804,否则执行步骤s805。在步骤s804中,判断所述字符串中倒数第二个字符Ck-1是否与用户输入上一笔画后识别出的字符串的最后一个字符C’k相同。如果相同则执行步骤s806,否则执行步骤s809。在步骤s805中,判断所述字符串中倒数第二个字符Ck-1是否与用户输入上一笔画后识别出的字符串的倒数第二个字符C’k-1相同。如果相同则执行步骤s806,否则执行步骤s809。
在步骤s806中,将计数器n设置为1。接着,执行步骤s807,判断倒数第二个字符Ck-1的笔画数是否大于2。如果是则执行步骤s808,否则返回步骤s802。
在步骤s808中,将倒数第二个字符Ck-1及其之前的字符进行淡色显示或消隐。在步骤s809中,将n重置为0。然后,返回步骤s802。
表1以表格形式给出了对重叠输入的日语“にほん”进行前字淡化处理的分解过程。表1中的序号栏指示用户输入的笔画数(即执行步骤s802的回合数)。
表1
需要说明的是,在步骤s807中判断倒数第二个字符的笔画数大于2时才进行淡化处理是基于以下考虑:在切分过程中,当输入笔画较少时,笔画序列常会被误切分成单笔画或两笔画的字(如,汉字“一”、“二”等)。此时,如果把前字淡化显示,将导致不正确显示效果。例如,在表1的No.2一行,将导致被淡化显示。
图9给出了上述淡化显示处理的实际效果。由图可见,用户能够清楚地区分已录入的字符的笔画和当前正在书写的字符的笔画。
与上述手写识别方法相对应地,本发明还提出了相关的手写识别设备。图10示出了这样的手写识别设备1000的示意结构方框图。
如图所示,根据本发明的手写识别设备1000包括手写笔迹输入装置1100、手写信息存储装置1200、手写字符串识别装置1300、识别候选选择装置1400以及显示控制装置1500。
手写笔迹输入装置1100用于接收用户输入的笔画序列,并对其进行数字化,以得到手写笔迹,供其他装置使用。手写信息存储装置1200用于存储手写笔迹以及在手写过程中产生的其他信息。
手写字符串识别装置1300可以包括手写切分单元1310、单字符/重叠字符识别单元1320以及后处理单元1330。手写切分单元1310可以调用单字符/重叠字符识别单元1320,以基于单字可信度以及还可以基于所接收的手写笔画序列中的部分或全部笔画与重叠字符模板的匹配程度,对所接收的手写笔画序列进行切分断字。后处理单元1330可以判断所识别的单字是否构成合成字;基于语言和/或书写规则,对识别结果进行校正;和/或在用户进行笔画输入时,以淡色显示或消隐已识别出的完整字符。
识别候选选择装置1400向用户提供识别候选,供用户从中选择正确的识别结果。显示控制装置1500控制显示随手写笔迹、识别候选和最终识别结果等内容不断变化的显示内容。
根据本发明的手写识别方法和设备可以应用于支持手写输入的多种电子设备,如,电子白板、平板计算机、台式计算机、膝上型计算机、个人数字助理、移动电话等。此外,其原理适用于汉字和日文,还适用于其他多种文字(例如韩文)。
应当注意的是,在以上的描述中,仅以示例的方式,示出了本发明的技术方案,但并不意味着本发明局限于上述步骤和单元结构。在可能的情形下,可以根据需要对步骤和单元结构进行调整和取舍。因此,某些步骤和单元并非实施本发明的总体发明思想所必需的元素。因此,本发明所必需的技术特征仅受限于能够实现本发明的总体发明思想的最低要求,而不受以上具体实例的限制。
至此已经结合优选实施例对本发明进行了描述。应该理解,本领域技术人员在不脱离本发明的精神和范围的情况下,可以进行各种其它的改变、替换和添加。因此,本发明的范围不局限于上述特定实施例,而应由所附权利要求所限定。
Claims (22)
1.一种手写识别方法,包括:
接收用户在同一输入区域连续输入的手写笔画序列;以及
基于单字可信度,对所接收的手写笔画序列进行切分断字。
2.根据权利要求1所述的方法,其中,所述基于单字可信度对所接收的手写笔画序列进行切分断字包括前向切分和/或反向切分,
所述前向切分按与笔画输入相同的顺序,确定所接收的手写笔画序列的切分点,
所述反向切分按与笔画输入相反的顺序,确定所接收的手写笔画序列的切分点。
3.根据权利要求2所述的方法,其中,所述前向切分包括:
将所接收的手写笔画序列中位于上一切分点之后的笔画读入前向切分集合;
针对前向切分集合中的每个笔画,计算该笔画及其前笔画形成单字的可信度;
将单字可信度最大的笔画与其后一笔画之间的间隙确定为切分点;以及
重复执行上述三个步骤,
其中,当首次执行所述三个步骤时,所述上一切分点位于最先输入的笔画之前。
4.根据权利要求2所述的方法,其中,所述反向切分包括:
将所接收的手写笔画序列中位于上一切分点之前的笔画读入反向切分集合;
针对反向切分集合中的每个笔画,计算该笔画及其后笔画形成单字的可信度;
将单字可信度最大的笔画与其前一笔画之间的间隙确定为切分点;以及
重复执行上述三个步骤,
其中,当首次执行所述三个步骤时,所述上一切分点位于最后输入的笔画之后。
5.根据权利要求2所述的方法,其中,如果所述前向切分和反向切分确定的切分点不重合,则针对非重合切分点前后两个切分点之间的笔画执行细切分,其中,所述细切分包括:
列举所述笔画的所有切分可能,其中,每一种切分可能对应于一种与切分点数目和位置有关的切分点配置;
针对每一种切分可能,计算切分点之间的笔画形成单字的可信度,并根据所计算的单字可信度确定该切分可能的总可信度;以及
将总可信度最大的切分可能所对应的切分点配置确定为切分结果。
6.根据权利要求1所述的方法,还包括:
确定切分点之间的笔画形成的单字之间是否存在重叠区域以及重叠区域的大小;以及
基于所述确定,判断所述单字是否是构成一个合成字。
7.根据权利要求1所述的方法,还包括:在用户进行笔画输入时,以淡色显示或消隐已识别出的完整字符。
8.根据权利要求7所述的方法,其中,在用户进行笔画输入时以淡色显示或消隐已识别出的完整字符包括:
在用户新输入了一个笔画后,对用户输入的笔画序列进行手写识别,从而识别出字符串;
如果新输入的一个笔画是所述字符串中最后一个字符的第一笔且所述字符串中倒数第二个字符与用户输入上一笔画后识别出的字符串的最后一个字符相同,或者如果新输入的一个笔画不是所述字符串中最后一个字符的第一笔且所述字符串中倒数第二个字符与用户输入上一笔画后识别出的字符串的倒数第二个字符相同,则判断倒数第二个字符的笔画数是否大于2;以及
如果所述倒数第二个字符的笔画数大于2,则对所述倒数第二个字符及其之前的字符进行淡色显示或消隐。
9.根据权利要求1所述的方法,其中,对所接收的手写笔画序列进行切分断字还基于所接收的手写笔画序列中的部分或全部笔画与重叠字符模板的匹配程度。
10.根据权利要求9所述的方法,其中,每个重叠字符模板由两个重叠的字符构成。
11.根据权利要求1所述的方法,其中,利用语言和/或书写规则,来辅助文字识别。
12.一种手写识别设备,包括:
接收装置,用于接收用户在同一输入区域连续输入的手写笔画序列;以及
切分装置,用于基于单字可信度,对所接收的手写笔画序列进行切分断字。
13.根据权利要求12所述的设备,其中,所述切分装置包括前向切分装置和/或反向切分装置,
所述前向切分装置用于按与笔画输入相同的顺序,确定所接收的手写笔画序列的切分点,
所述反向切分装置用于按与笔画输入相反的顺序,确定所接收的手写笔画序列的切分点。
14.根据权利要求13所述的设备,其中,所述前向切分装置包括:
前向切分集合形成单元,用于将所接收的手写笔画序列中位于上一切分点之后的笔画读入前向切分集合;
单字可信度计算单元,用于针对前向切分集合中的每个笔画,计算该笔画及其前笔画形成单字的可信度;
切分点确定单元,用于将单字可信度最大的笔画与其后一笔画之间的间隙确定为切分点;以及
控制单元,用于控制上述三个单元重复执行各自的功能,
其中,当所述前向切分集合形成单元首次执行其功能时,所述上一切分点位于最先输入的笔画之前。
15.根据权利要求13所述的设备,其中,所述反向切分装置包括:
反向切分集合形成单元,用于将所接收的手写笔画序列中位于上一切分点之前的笔画读入反向切分集合;
单字可信度计算单元,用于针对反向切分集合中的每个笔画,计算该笔画及其后笔画形成单字的可信度;
切分点确定单元,用于将单字可信度最大的笔画与其前一笔画之间的间隙确定为切分点;以及
控制单元,用于控制上述三个单元重复执行各自的功能,
其中,当所述反向切分集成形成单元首次执行其功能时,所述上一切分点位于最后输入的笔画之后。
16.根据权利要求13所述的设备,还包括:细切分装置,用于在所述前向切分和反向切分确定的切分点不重合的情况下,针对非重合切分点前后两个切分点之间的笔画执行细切分,其中,
所述细切分装置包括:
切分可能枚举单元,用于列举所述笔画的所有切分可能,其中,每一种切分可能对应于一种与切分点数目和位置有关的切分点配置;
可信度计算单元,用于针对每一种切分可能,计算切分点之间的笔画形成单字的可信度,并根据所计算的单字可信度确定该切分可能的总可信度;以及
切分结果确定单元,用于将总可信度最大的切分可能所对应的切分点配置确定为切分结果。
17.根据权利要求12所述的设备,还包括后处理装置,所述后处理装置包括:
重叠区域评估单元,用于确定切分点之间的笔画形成的单字之间是否存在重叠区域以及重叠区域的大小;以及
合成字判定单元,用于基于所述确定,判断所述单字是否是构成一个合成字。
18.根据权利要求12所述的设备,其中,所述后处理装置还被配置为:在用户进行笔画输入时,以淡色显示或消隐已识别出的完整字符。
19.根据权利要求18所述的设备,其中,所述后处理装置还包括:
字符串识别单元,用于在用户新输入了一个笔画后,对用户输入的笔画序列进行手写识别,从而识别出字符串;
判断单元,用于在新输入的一个笔画是所述字符串中最后一个字符的第一笔且所述字符串中倒数第二个字符与用户输入上一笔画后识别出的字符串的最后一个字符相同的情况下,或者在新输入的一个笔画不是所述字符串中最后一个字符的第一笔且所述字符串中倒数第二个字符与用户输入上一笔画后识别出的字符串的倒数第二个字符相同的情况下,判断倒数第二个字符的笔画数是否大于2;以及
淡色显示或消隐单元,用于在所述倒数第二个字符的笔画数大于2的情况下,对所述倒数第二个字符及其之前的字符进行淡色显示或消隐。
20.根据权利要求12所述的设备,其中,所述切分装置还基于所接收的手写笔画序列中的部分或全部笔画与重叠字符模板的匹配程度,对所接收的手写笔画序列进行切分断字。
21.根据权利要求20所述的设备,其中,每个重叠字符模板由两个重叠的字符构成。
22.根据权利要求12所述的设备,还包括:后处理装置,被配置为利用语言和/或书写规则,来辅助文字识别。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410171650.2A CN105095924A (zh) | 2014-04-25 | 2014-04-25 | 手写识别方法和设备 |
PCT/CN2015/077367 WO2015161823A1 (zh) | 2014-04-25 | 2015-04-24 | 手写识别方法和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410171650.2A CN105095924A (zh) | 2014-04-25 | 2014-04-25 | 手写识别方法和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105095924A true CN105095924A (zh) | 2015-11-25 |
Family
ID=54331772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410171650.2A Pending CN105095924A (zh) | 2014-04-25 | 2014-04-25 | 手写识别方法和设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN105095924A (zh) |
WO (1) | WO2015161823A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654087A (zh) * | 2015-12-30 | 2016-06-08 | 李宇 | 一种基于彩色模板的脱机手写字符提取方法 |
CN107368248A (zh) * | 2017-06-19 | 2017-11-21 | 广东小天才科技有限公司 | 一种书写笔迹的回放方法及装置 |
CN111931710A (zh) * | 2020-09-17 | 2020-11-13 | 开立生物医疗科技(武汉)有限公司 | 一种联机手写文字识别方法、装置、电子设备及存储介质 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112613512B (zh) * | 2020-12-29 | 2022-08-12 | 西北民族大学 | 基于结构属性的乌金体藏文古籍字符切分方法及系统 |
CN113468972B (zh) * | 2021-06-07 | 2024-02-27 | 中金金融认证中心有限公司 | 用于复杂场景手写识别的手写轨迹切分方法及计算机产品 |
CN117519515A (zh) * | 2024-01-05 | 2024-02-06 | 深圳市方成教学设备有限公司 | 一种用于记忆黑板的文字识别方法、装置和记忆黑板 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007188512A (ja) * | 2000-09-29 | 2007-07-26 | Japan Science & Technology Agency | 文字認識方法、文字認識プログラム及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
CN101484907A (zh) * | 2006-07-06 | 2009-07-15 | 辛纳普蒂克斯公司 | 用于手写体符号的识别的方法和设备 |
CN102156577A (zh) * | 2011-03-28 | 2011-08-17 | 安徽科大讯飞信息科技股份有限公司 | 实现连续手写识别输入的方法及系统 |
CN102394061A (zh) * | 2011-11-08 | 2012-03-28 | 中国农业大学 | 基于语义检索的文语转换方法及系统 |
CN102855082A (zh) * | 2011-06-13 | 2013-01-02 | 谷歌公司 | 用于重叠文本用户输入的字符识别 |
CN103080878A (zh) * | 2010-08-24 | 2013-05-01 | 诺基亚公司 | 用于将重叠手写的笔画分割成一组或多组的方法和装置 |
-
2014
- 2014-04-25 CN CN201410171650.2A patent/CN105095924A/zh active Pending
-
2015
- 2015-04-24 WO PCT/CN2015/077367 patent/WO2015161823A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007188512A (ja) * | 2000-09-29 | 2007-07-26 | Japan Science & Technology Agency | 文字認識方法、文字認識プログラム及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
CN101484907A (zh) * | 2006-07-06 | 2009-07-15 | 辛纳普蒂克斯公司 | 用于手写体符号的识别的方法和设备 |
CN103080878A (zh) * | 2010-08-24 | 2013-05-01 | 诺基亚公司 | 用于将重叠手写的笔画分割成一组或多组的方法和装置 |
CN102156577A (zh) * | 2011-03-28 | 2011-08-17 | 安徽科大讯飞信息科技股份有限公司 | 实现连续手写识别输入的方法及系统 |
CN102855082A (zh) * | 2011-06-13 | 2013-01-02 | 谷歌公司 | 用于重叠文本用户输入的字符识别 |
CN102394061A (zh) * | 2011-11-08 | 2012-03-28 | 中国农业大学 | 基于语义检索的文语转换方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654087A (zh) * | 2015-12-30 | 2016-06-08 | 李宇 | 一种基于彩色模板的脱机手写字符提取方法 |
CN105654087B (zh) * | 2015-12-30 | 2019-03-12 | 李宇 | 一种基于彩色模板的脱机手写字符提取方法 |
CN107368248A (zh) * | 2017-06-19 | 2017-11-21 | 广东小天才科技有限公司 | 一种书写笔迹的回放方法及装置 |
CN111931710A (zh) * | 2020-09-17 | 2020-11-13 | 开立生物医疗科技(武汉)有限公司 | 一种联机手写文字识别方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2015161823A1 (zh) | 2015-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11727212B2 (en) | Touch keyboard using a trained model | |
US20210406578A1 (en) | Handwriting-based predictive population of partial virtual keyboards | |
US10489508B2 (en) | Incremental multi-word recognition | |
US10140284B2 (en) | Partial gesture text entry | |
EP3245580B1 (en) | Unlearning techniques for adaptive language models in text entry | |
US9471220B2 (en) | Posture-adaptive selection | |
EP2698692B1 (en) | System and method for implementing sliding input of text based upon on-screen soft keyboard on electronic equipment | |
US9552080B2 (en) | Incremental feature-based gesture-keyboard decoding | |
CN105095924A (zh) | 手写识别方法和设备 | |
US8713464B2 (en) | System and method for text input with a multi-touch screen | |
EP2909709A1 (en) | Multi-gesture text input prediction | |
US8994681B2 (en) | Decoding imprecise gestures for gesture-keyboards |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20151125 |