CN102063620A - 一种手写识别方法、系统及手写识别终端 - Google Patents

一种手写识别方法、系统及手写识别终端 Download PDF

Info

Publication number
CN102063620A
CN102063620A CN 201010620496 CN201010620496A CN102063620A CN 102063620 A CN102063620 A CN 102063620A CN 201010620496 CN201010620496 CN 201010620496 CN 201010620496 A CN201010620496 A CN 201010620496A CN 102063620 A CN102063620 A CN 102063620A
Authority
CN
China
Prior art keywords
candidate
cutting
recognition result
probable value
strokes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201010620496
Other languages
English (en)
Inventor
李健
张连毅
武卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JIETONG HUASHENG SPEECH TECHNOLOGY Co Ltd
Beijing Sinovoice Technology Co Ltd
Original Assignee
JIETONG HUASHENG SPEECH TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JIETONG HUASHENG SPEECH TECHNOLOGY Co Ltd filed Critical JIETONG HUASHENG SPEECH TECHNOLOGY Co Ltd
Priority to CN 201010620496 priority Critical patent/CN102063620A/zh
Publication of CN102063620A publication Critical patent/CN102063620A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明提供了一种手写识别方法、系统及手写识别终端,以解决现有的手写识别影响用户书写速度的问题。所述方法包括:采集以行或列连续输入的字符笔迹;对所述字符笔迹进行切割,得到至少一条切分路径;利用字符之间的关联信息对各切分路径进行综合判断,得到最终识别结果。本发明支持以行或列连续输入的字符笔迹的识别,用户可以在一块手写区域内以一行连续书写,也可以进行多行书写,字和字之间不需要等待时间,书写完成后得到识别结果,加快了用户输入速度。而且,针对用户连续输入的多个字符笔迹,识别时可以利用字符之间的关联信息进行综合识别,不仅提高了识别速度,还提高了识别准确率。

Description

一种手写识别方法、系统及手写识别终端
技术领域
本发明涉及模式识别技术,特别是涉及一种支持行或列输入的手写识别方法、系统及手写识别终端。
背景技术
手写识别(Handwriting Recognize),是指将在手写设备上书写时产生的有序轨迹信息转化为汉字内码的过程,实际上是手写轨迹的坐标序列到汉字内码的一个映射过程,是人机交互最自然、最方便的手段之一。
目前用于手写输入的设备有许多种,比如电磁感应手写板、压感式手写板、触摸屏、触控板、超声波笔等。用户在手写输入设备上书写的笔画以类似于矢量图的形式被计算机存储下来,通过对文字图像的抬笔、落笔、笔迹上各像素的空间位置等信息进行处理与对照,系统将数据转化为计算机所使用的文字编码进行输出。
随着智能手机、掌上电脑等移动信息工具的普及,手写识别技术也进入了规模应用时代,可广泛应用于各种桌面操作系统、嵌入式操作系统中。
但是,目前的手写识别技术存在以下问题:
用户若输入一句话,需要一个字一个字的输入,即:用户写完一个字后需要等待系统识别,系统识别后给出多个候选识别结果,用户从中进行选择从而完成一个字的输入,然后再开始输入下一个字,并重复上述识别过程。由于用户每写完一个字就需要进行等待,因此这种手写识别方法影响了用户的书写速度,使用户的输入较慢。
发明内容
本发明提供一种手写识别方法、系统及手写识别终端,以解决现有的手写识别影响用户书写速度的问题。
为了解决上述问题,本发明公开了一种手写识别方法,包括:
采集以行或列连续输入的字符笔迹;
对所述字符笔迹进行切割,得到至少一条切分路径;
利用字符之间的关联信息对各切分路径进行综合判断,得到最终识别结果。
优选的,所述利用字符之间的关联信息对各切分路径进行综合识别,得到最终识别结果,包括:对各切分路径进行单字识别,针对每一个切分路径得到候选识别结果及得到该候选识别结果的第一概率值;利用语言模型对各候选识别结果进行打分,得出针对每个候选识别结果的表示字符间关联信息的第二概率值;根据各候选识别结果的第一概率值和第二概率值得到各候选识别结果的综合概率值;按照综合概率值对各候选识别结果进行排序,并选择综合概率值最大的候选识别结果为最终识别结果。
优选的,对所述字符笔迹进行切割后还得到各候选识别结果的表示切割概率的第三概率值;则所述利用字符之间的关联信息对各切分路径进行综合识别还包括:根据各候选识别结果的第一概率值、第二概率值以及第三概率值得到各候选识别结果的综合概率值。
优选的,对所述字符笔迹进行切割,得到至少一条切分路径,包括:若以行连续输入,则根据字符笔迹中笔画的左右位置进行切割,得到至少一条切分路径;若以列连续输入,则根据字符笔迹中笔画的上下位置进行切割,得到至少一条切分路径。
优选的,若以行连续输入,则根据字符笔迹中笔画的左右位置进行切割包括:将字符笔迹中所有笔画的坐标点向X轴投影,若两个笔画在X轴投影的间隙满足预置阈值,则所述两个笔画之间为候选切割点;若不满足,则将所述两个笔画合并为一个切割块,并继续将该切割块与左或右相邻的笔画进行上述投影间隙的判断;切割后的笔画或切割块根据候选切割点组合成不同的切分路径;若以列连续输入,则根据字符笔迹中笔画的上下位置进行切割包括:将字符笔迹中所有笔画的坐标点向Y轴投影,若两个笔画在Y轴投影的间隙满足预置阈值,则所述两个笔画之间为候选切割点;若不满足,则将所述两个笔画合并为一个切割块,并继续将该切割块与上或下相邻的笔画进行上述投影间隙的判断;切割后的笔画或切割块根据候选切割点组合成不同的切分路径。
本发明还提供了一种手写识别系统,包括:
采集模块,用于采集以行或列连续输入的字符笔迹;
切割模块,用于对所述字符笔迹进行切割,得到至少一条切分路径;
手写识别模块,用于利用字符之间的关联信息对各切分路径进行综合判断,得到最终识别结果。
优选的,所述手写识别模块包括:单字识别引擎子模块,用于对各切分路径进行单字识别,针对每一个切分路径得到候选识别结果及得到该候选识别结果的第一概率值;语言打分子模块,用于利用语言模型对各候选识别结果进行打分,得出针对每个候选识别结果的表示字符间关联信息的第二概率值;综合判断子模块,用于根据各候选识别结果的第一概率值和第二概率值得到各候选识别结果的综合概率值;按照综合概率值对各候选识别结果进行排序,并选择综合概率值最大的候选识别结果为最终识别结果。
优选的,所述切割模块对所述字符笔迹进行切割后还得到各候选识别结果的表示切割概率的第三概率值;则所述综合判断子模块还用于:根据各候选识别结果的第一概率值、第二概率值以及第三概率值得到各候选识别结果的综合概率值;按照综合概率值对各候选识别结果进行排序,并选择综合概率值最大的候选识别结果为最终识别结果。
优选的,所述切割模块包括:行切割子模块,用于将字符笔迹中所有笔画的坐标点向X轴投影,若两个笔画在X轴投影的间隙满足预置阈值,则所述两个笔画之间为候选切割点;若不满足,则将所述两个笔画合并为一个切割块,并继续将该切割块与左或右相邻的笔画进行上述投影间隙的判断;切割后的笔画或切割块根据候选切割点组合成不同的切分路径;和/或,列切割子模块,用于将字符笔迹中所有笔画的坐标点向Y轴投影,若两个笔画在Y轴投影的间隙满足预置阈值,则所述两个笔画之间为候选切割点;若不满足,则将所述两个笔画合并为一个切割块,并继续将该切割块与上或下相邻的笔画进行上述投影间隙的判断;切割后的笔画或切割块根据候选切割点组合成不同的切分路径。
本发明还提供了一种手写识别终端,包括上述手写识别系统。
与现有技术相比,本发明具有以下优点:
本发明支持以行或列连续输入的字符笔迹的识别,用户可以在一块手写区域内以一行连续书写,也可以进行多行书写,字和字之间不需要等待时间,书写完成后得到识别结果,加快了用户输入速度。
而且,针对用户连续输入的多个字符笔迹,识别时可以利用字符之间的关联信息进行综合识别,不仅提高了识别速度,还提高了识别准确率。
附图说明
图1是本发明实施例所述一种支持行或列输入的手写识别方法流程图;
图2是本发明实施例所述一种支持行或列输入的手写识别系统的结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明提出一种以行或列输入的手写识别方法、系统及终端,支持以行或列连续输入的字符笔迹的识别,用户可以在一块手写区域内以一行连续书写,也可以进行多行书写,字和字之间不需要等待时间,书写完成后得到识别结果,加快了用户输入速度。
下面通过实施例进行详细说明。
参照图1,是本发明实施例所述一种支持行或列输入的手写识别方法流程图。
步骤11,采集以行或列连续输入的字符笔迹;
用户在手写区域中通常以行的方式连续输入多个字符,所述字符包含中文文字、标点符号、英文字母等形式。当然,用户也可以列的方式进行书写。
采集用户连续输入的字符笔迹,所述字符笔迹是指以笔画形式输入的信息。采集手写输入的设备有多种,如电磁感应手写板、压感式手写板、触摸屏、触控板、超声波笔等,不同设备在采集时都是利用设备上安装的感应装置记录下用户书写的坐标,即笔迹点。通常将落笔的位置记为一个笔画的起始位置,将抬笔的位置记为一个笔画的终止位置,落笔位置和抬笔位置之间的一系列笔迹点构成一个输入笔画。
步骤12,对所述字符笔迹进行切割,得到至少一条切分路径;
所述切割是一种过切割,是指将采集到的字符笔迹以候选切割点进行笔画切分,切分后的笔画根据候选切割点组合成不同的切分路径。对于同样的一组字符笔迹,切割后可能得到一条切分路径,也可能得到多条切分路径。
例如,用户手写输入“和平”,进行切割后得到两个候选切割点,分别位于“禾”与“口”之间以及“口”与“平”之间,即切为“禾”、“口”、“平”三个字。根据候选切割点,可能的切分路径有4条,即“禾|口|平”、“禾口|平”、“禾|口平”、“禾口平”。
下面说明如何进行切割:
若以行连续输入,主要是根据字符笔迹中笔画的左右位置进行切割,一种具体的切割方法是:
将字符笔迹中所有笔画的坐标点向X轴投影,若两个笔画在X轴投影的间隙满足预置阈值(如大于某个值),即判定这两个笔画之间存在间隙,则所述两个笔画之间为候选切割点;若两个笔画在X轴投影的间隙不满足所述预置阈值,即判定这两个笔画之间不存在间隙,则将所述两个笔画合并为一个切割块(例如“禾”即为由多个笔画合并成的切割块),然后继续将该切割块与左或右相邻的笔画进行上述投影间隙的判断,从而判定出该切割块与左或右相邻的笔画之间是否存在候选切割点。最后,如前所述,切割后的笔画或切割块根据候选切割点会组合成不同的切分路径。
此外,优选的,经过切割之后,还可以得到每条切分路径的切割概率,称为第三概率值。所述切割概率表示切分路径的切割代价,即根据坐标投影得出的切割正确的概率值。例如,将“和平”切割后得到4条切分路径,分别是“禾|口|平”、“禾口|平”、“禾|口平”、“禾口平”,每条切分路径都对应一个切割概率值。通常,如果两个笔画之间的间隙比较大,则在这两个笔画之间的位置进行切割的可能性(即切割概率)就比较大,反之则比较小。
类似的,若以列连续输入,主要是根据字符笔迹中笔画的上下位置进行切割,一种具体的切割方法是:
将字符笔迹中所有笔画的坐标点向Y轴投影,若两个笔画在Y轴投影的间隙满足预置阈值,即判定这两个笔画之间存在间隙,则所述两个笔画之间为候选切割点;若两个笔画在Y轴投影的间隙不满足所述预置阈值,即判定这两个笔画之间不存在间隙,则将所述两个笔画合并为一个切割块,并继续将该切割块与上或下相邻的笔画进行上述投影间隙的判断,从而判定出该切割块与上或下相邻的笔画之间是否存在候选切割点。最后,如前所述,切割后的笔画或切割块根据候选切割点会组合成不同的切分路径。
对于上述切割方法,为了控制过合并问题,可以对切割后构成的每一个字都设置一个宽高比限制,从而避免将多个字合并成一个字的情况。
步骤13,利用字符之间的关联信息对各切分路径进行综合判断,得到最终识别结果。
本实施例所述的手写识别方法中,采集到的是用户连续输入的多个字符笔迹,由于字符之间存在语义上的关联关系,可利用语言模型找到这种关联信息,因此识别过程中可充分利用字符之间的这种关联关系来进行更准确、更快速的识别。
所述利用字符之间的关联信息进行综合判断是指利用单字识别引擎和语言模型进行综合判断。具体的识别过程如下:
步骤131,对各切分路径进行单字识别,针对每一个切分路径得到候选识别结果及得到该候选识别结果的第一概率值;
其中,所述识别过程可采用现有的多种识别方法,本发明实施例在此不做限定。
每一个切分路径中,对以候选切割点切分开的每个单字进行识别,对于每个单字的识别可能得到多个候选识别结果(是单字候选识别结果),并得到每个候选识别结果的单字识别概率,称为第一概率值。
例如,对于输入较短的“和平”,对相应的4条切分路径“禾|口|平”、“禾口|平”、“禾|口平”、“禾口平”分别进行识别:针对切分路径“禾|口|平”分别对“禾”、“口”和“平”进行单字识别,对应“禾”得到的候选识别结果可能是“禾”、“木”、“本”等等,每一个候选识别结果都得到一个单字识别概率,如对应“禾”、“木”、“本”的第一概率值分别是A、B、C;同样,对于“口”和“平”也进行单字识别得到相应的一个或多个候选识别结果及每个候选识别结果的第一概率值。其他切分路径的单字识别过程相同,不再一一详述。。
步骤132,利用语言模型对各候选识别结果进行打分,得出针对每个候选识别结果的表示字符间关联信息的第二概率值;
所述语言模型可表示字符之间的关联信息,这种关联信息可通过概率来表示。语言模型是指用来计算短语或句子概率的模型,对于一句话,如果有多条切分路径就会有多个候选识别结果,此处的候选识别结果是指上述步骤131得到的单字候选识别结果根据语言模型组合成字、词、短语或句子的候选识别结果,如“禾”与“口”组合成一个字“和”,“和”即为一个候选识别结果,“文”与“件”组合成词组“文件”也为一个候选识别结果。则对每个候选识别结果,语言模型会计算出正确的概率有多大。例如,用户输入笔迹点的一个候选识别结果为“文仵”,另一个候选识别结果为“文件”,由语言模型可知,“文件”的概率要大于“文仵”的概率;若“文件”和“文仵”的识别概率相差不大,则语言模型会将结果确定为更为常用的“文件”。
关于语言模型的实现,一种简单的方法是只考虑前后两个字的概率,如“件”前面是“文”字的概率是多少,“仵”前面是“文”字的概率是多少,而与再往前是什么字无关。但实际上情况并不是这样,所以复杂一点的实现方法也可以考虑前前字(或更多的字),或者考虑基于词的语言模型,但计算量和存储空间会增加很多。
同样,对于候选识别结果“禾口平”、“和平”、“禾”,由于“和平”为常用词,因此根据语言模型得出的概率最高;而“禾口平”不是常用词,因此语言模型的概率较低。
步骤133,根据各候选识别结果的第一概率值和第二概率值得到各候选识别结果的综合概率值;
计算综合概率值时,一种简单的方法是将每个候选识别结果的第一概率值和第二概率值进行加权相加,得到对应该候选识别结果的一个综合概率值。当然,也可以采用其他更复杂的计算方法,本发明实施例在此不做限定。
此外,优选的,计算综合概率值时还可以考虑上述切割概率,即第三概率值。每条切分路径都对应一切割概率,每条切分路径下得到的候选识别结果就可以使用相对应的切割概率计算综合概率值。
可以采用的计算方法是:根据各候选识别结果的第一概率值、第二概率值以及第三概率值(即切割概率)得到各候选识别结果的综合概率值,如将每个候选识别结果的第一概率值、第二概率值和第三概率值(即切割概率)进行加权相加,得到对应该候选识别结果的一个综合概率值。
步骤134,按照综合概率值对各候选识别结果进行排序,并选择综合概率值最大的候选识别结果为最终识别结果。
将所有切分路径的候选识别结果计算综合概率值后,通过对所有的候选识别结果按照综合概率值的高低进行排序后,就可以选择出综合概率值最大的候选识别结果为最终识别结果并输出。
综上所述,经过以上流程的处理,上述支持行或列输入的手写识别方法可以对用户连续输入的多个字符进行连续识别,大大加快了识别速度,而且结合语言模型的识别还提高了识别准确度。同时,由于用户一次可输入多个字,大大提高了输入速度。
在实际应用中,本发明实施例所述手写识别方法可应用于一些有手写输入需求的产品中,如PC机、笔记本电脑、平板电脑、手写板等桌面操作系统中。此外,也可以应用到嵌入式操作系统中,例如掌上电脑、手机、PAD、PDA、大屏手机或者横屏手机等智能移动终端;个人信息终端、车载信息终端等GPS/GIS终端;eBOOK、电子词典、智能玩具等智能学习终端;税控机输入终端、二代身份证读卡信息终端、大型数据库查询终端、酒店管理系统输入终端、智能报警器、数字电视互动遥控器、卡拉OK点歌器、信息家电控制器等其他数据终端。本发明尤其适用于大屏幕设备的多行(或多列)输入与识别。
优选的,在多任务系统中,上述切割和综合识别过程可与书写过程(即笔迹采集过程)同步进行,从而进一步加快识别处理速度。所述多任务系统是指可以进行多线程的系统。在用户写字的时间段内,由于笔迹采集占用CPU较低或者基本不占用CPU,因此大部分CPU处于空闲状态。而在多任务系统中,可以将这部分空闲的CPU利用起来,边写边识别,所以可以加快识别速度。
基于上述内容,本发明实施例还提供了相应的系统实施例。
参照图2,是本发明实施例所述一种支持行或列输入的手写识别系统的结构图。
所述手写识别系统可以包括采集模块21、切割模块22和手写识别模块23,其中,
采集模块21,用于采集以行或列连续输入的字符笔迹;
切割模块22,用于对采集模块21采集到的所述字符笔迹进行切割,得到至少一条切分路径;
手写识别模块23,用于利用字符之间的关联信息对各切分路径进行综合判断,得到最终识别结果。
其中,所述手写识别模块23可充分利用字符之间的关联关系进行更准确、更快速的识别,因此所述手写识别模块23可进一步包括:
单字识别引擎子模块231,用于对各切分路径进行单字识别,针对每一个切分路径得到候选识别结果及得到该候选识别结果的第一概率值,并将各候选识别结果输入语言打分子模块232;
语言打分子模块232,用于将各候选识别结果输入语言模型,得出针对每个候选识别结果的表示字符间关联信息的第二概率值;
综合判断子模块233,用于根据各候选识别结果的第一概率值和第二概率值得到各候选识别结果的综合概率值;按照综合概率值对各候选识别结果进行排序,并选择综合概率值最大的候选识别结果为最终识别结果。
优选的,所述切割模块22对所述字符笔迹进行切割后还得到各候选识别结果的表示切割概率的第三概率值;则所述综合判断子模块233还可用于:根据各候选识别结果的第一概率值、第二概率值以及第三概率值得到各候选识别结果的综合概率值;按照综合概率值对各候选识别结果进行排序,并选择综合概率值最大的候选识别结果为最终识别结果。
优选的,所述切割模块22进一步可以包括行切割子模块221和/或列切割子模块222,所述“和”的关系是指所述手写识别系统可同时支持行输入和列输入,所述“或”的关系是指所述手写识别系统可支持行输入或支持列输入。
其中,所述行切割子模块221用于将字符笔迹中所有笔画的坐标点向X轴投影,若两个笔画在X轴投影的间隙满足预置阈值,则所述两个笔画之间为候选切割点;若不满足,则将所述两个笔画合并为一个切割块,并继续将该切割块与左或右相邻的笔画进行上述投影间隙的判断;切割后的笔画或切割块根据候选切割点组合成不同的切分路径;
所述列切割子模块222用于将字符笔迹中所有笔画的坐标点向Y轴投影,若两个笔画在Y轴投影的间隙满足预置阈值,则所述两个笔画之间为候选切割点;若不满足,则将所述两个笔画合并为一个切割块,并继续将该切割块与上或下相邻的笔画进行上述投影间隙的判断;切割后的笔画或切割块根据候选切割点组合成不同的切分路径。
如果所述切割模块22同时包含行切割子模块221和列切割子模块222,由于系统事先不知道用户输入的是行数据还是列数据,因此可以向X轴投影并向Y轴投影,分别进行判断,然后选取概率最大的路径。
基于上述支持行或列输入的手写识别系统,本发明实施例还提供了一种手写识别终端,该手写识别终端可包括上述的手写识别系统,从而支持行或列的多字输入。所述手写识别系统的具体结构可参照图2所示,在此不再详述。
所述手写识别终端可以是PC机、笔记本电脑、平板电脑、手写板等桌面操作系统终端,也可以是掌上电脑、手机、PAD、PDA、大屏手机或者横屏手机等智能移动终端,还可以是具有多任务系统的各类终端。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上对本发明所提供的一种手写识别方法、系统及手写识别终端,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种手写识别方法,其特征在于,包括:
采集以行或列连续输入的字符笔迹;
对所述字符笔迹进行切割,得到至少一条切分路径;
利用字符之间的关联信息对各切分路径进行综合判断,得到最终识别结果。
2.根据权利要求1所述的方法,其特征在于,所述利用字符之间的关联信息对各切分路径进行综合判断,得到最终识别结果,包括:
对各切分路径进行单字识别,针对每一个切分路径得到候选识别结果及得到该候选识别结果的第一概率值;
利用语言模型对各候选识别结果进行打分,得出针对每个候选识别结果的表示字符间关联信息的第二概率值;
根据各候选识别结果的第一概率值和第二概率值得到各候选识别结果的综合概率值;
按照综合概率值对各候选识别结果进行排序,并选择综合概率值最大的候选识别结果为最终识别结果。
3.根据权利要求2所述的方法,其特征在于:
对所述字符笔迹进行切割后还得到各候选识别结果的表示切割概率的第三概率值;
则所述利用字符之间的关联信息对各切分路径进行综合识别还包括:根据各候选识别结果的第一概率值、第二概率值以及第三概率值得到各候选识别结果的综合概率值。
4.根据权利要求1至3任一所述的方法,其特征在于,对所述字符笔迹进行切割,得到至少一条切分路径,包括:
若以行连续输入,则根据字符笔迹中笔画的左右位置进行切割,得到至少一条切分路径;
若以列连续输入,则根据字符笔迹中笔画的上下位置进行切割,得到至少一条切分路径。
5.根据权利要求4所述的方法,其特征在于:
若以行连续输入,则根据字符笔迹中笔画的左右位置进行切割包括:
将字符笔迹中所有笔画的坐标点向X轴投影,若两个笔画在X轴投影的间隙满足预置阈值,则所述两个笔画之间为候选切割点;若不满足,则将所述两个笔画合并为一个切割块,并继续将该切割块与左或右相邻的笔画进行上述投影间隙的判断;切割后的笔画或切割块根据候选切割点组合成不同的切分路径;
若以列连续输入,则根据字符笔迹中笔画的上下位置进行切割包括:
将字符笔迹中所有笔画的坐标点向Y轴投影,若两个笔画在Y轴投影的间隙满足预置阈值,则所述两个笔画之间为候选切割点;若不满足,则将所述两个笔画合并为一个切割块,并继续将该切割块与上或下相邻的笔画进行上述投影间隙的判断;切割后的笔画或切割块根据候选切割点组合成不同的切分路径。
6.一种手写识别系统,其特征在于,包括:
采集模块,用于采集以行或列连续输入的字符笔迹;
切割模块,用于对所述字符笔迹进行切割,得到至少一条切分路径;
手写识别模块,用于利用字符之间的关联信息对各切分路径进行综合判断,得到最终识别结果。
7.根据权利要求6所述的系统,其特征在于,所述手写识别模块包括:
单字识别引擎子模块,用于对各切分路径进行单字识别,针对每一个切分路径得到候选识别结果及得到该候选识别结果的第一概率值;
语言打分子模块,用于利用语言模型对各候选识别结果进行打分,得出针对每个候选识别结果的表示字符间关联信息的第二概率值;
综合判断子模块,用于根据各候选识别结果的第一概率值和第二概率值得到各候选识别结果的综合概率值;按照综合概率值对各候选识别结果进行排序,并选择综合概率值最大的候选识别结果为最终识别结果。
8.根据权利要求7所述的系统,其特征在于:
所述切割模块对所述字符笔迹进行切割后还得到各候选识别结果的表示切割概率的第三概率值;
则所述综合判断子模块还用于:根据各候选识别结果的第一概率值、第二概率值以及第三概率值得到各候选识别结果的综合概率值;按照综合概率值对各候选识别结果进行排序,并选择综合概率值最大的候选识别结果为最终识别结果。
9.根据权利要求6至8任一所述的系统,其特征在于,所述切割模块包括:
行切割子模块,用于将字符笔迹中所有笔画的坐标点向X轴投影,若两个笔画在X轴投影的间隙满足预置阈值,则所述两个笔画之间为候选切割点;若不满足,则将所述两个笔画合并为一个切割块,并继续将该切割块与左或右相邻的笔画进行上述投影间隙的判断;切割后的笔画或切割块根据候选切割点组合成不同的切分路径;
和/或,
列切割子模块,用于将字符笔迹中所有笔画的坐标点向Y轴投影,若两个笔画在Y轴投影的间隙满足预置阈值,则所述两个笔画之间为候选切割点;若不满足,则将所述两个笔画合并为一个切割块,并继续将该切割块与上或下相邻的笔画进行上述投影间隙的判断;切割后的笔画或切割块根据候选切割点组合成不同的切分路径。
10.一种手写识别终端,其特征在于,包括权利要求6至9任一所述的手写识别系统。
CN 201010620496 2010-12-31 2010-12-31 一种手写识别方法、系统及手写识别终端 Pending CN102063620A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010620496 CN102063620A (zh) 2010-12-31 2010-12-31 一种手写识别方法、系统及手写识别终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010620496 CN102063620A (zh) 2010-12-31 2010-12-31 一种手写识别方法、系统及手写识别终端

Publications (1)

Publication Number Publication Date
CN102063620A true CN102063620A (zh) 2011-05-18

Family

ID=43998889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010620496 Pending CN102063620A (zh) 2010-12-31 2010-12-31 一种手写识别方法、系统及手写识别终端

Country Status (1)

Country Link
CN (1) CN102063620A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236799A (zh) * 2011-06-20 2011-11-09 北京捷通华声语音技术有限公司 一种多字手写识别的方法及装置
CN102243708A (zh) * 2011-06-29 2011-11-16 北京捷通华声语音技术有限公司 一种手写识别方法、系统及手写识别终端
CN102663388A (zh) * 2012-03-27 2012-09-12 复旦大学 从背景图片中对手写体字符进行分割的方法
CN102750552A (zh) * 2012-06-18 2012-10-24 北京捷通华声语音技术有限公司 一种手写识别方法、系统及手写识别终端
CN106033316A (zh) * 2015-03-13 2016-10-19 北京搜狗科技发展有限公司 一种手写输入的方法和装置
CN103745202B (zh) * 2014-01-08 2017-04-05 宇龙计算机通信科技(深圳)有限公司 手写输入时的汉字识别方法及装置
CN107219935A (zh) * 2017-05-25 2017-09-29 哈尔滨工业大学 一种面向连续书写汉字的、支持交互的汉字输入系统及方法
CN110262733A (zh) * 2014-06-24 2019-09-20 苹果公司 计算设备上的字符识别
CN110858317A (zh) * 2018-08-24 2020-03-03 北京搜狗科技发展有限公司 手写识别方法及装置
CN111131178A (zh) * 2019-12-04 2020-05-08 北京奇虎科技有限公司 终端设备识别方法、装置、设备和计算机存储介质
CN111931710A (zh) * 2020-09-17 2020-11-13 开立生物医疗科技(武汉)有限公司 一种联机手写文字识别方法、装置、电子设备及存储介质
CN113064497A (zh) * 2021-03-23 2021-07-02 上海臣星软件技术有限公司 语句识别的方法、装置、设备及计算机存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1138909A (zh) * 1994-11-14 1996-12-25 摩托罗拉公司 分解手写体输入的方法
CN1260524A (zh) * 1999-01-13 2000-07-19 国际商业机器公司 手写汉字自动分割和识别方法以及使用该方法的系统
CN101930545A (zh) * 2009-06-24 2010-12-29 夏普株式会社 手写识别方法和设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1138909A (zh) * 1994-11-14 1996-12-25 摩托罗拉公司 分解手写体输入的方法
CN1260524A (zh) * 1999-01-13 2000-07-19 国际商业机器公司 手写汉字自动分割和识别方法以及使用该方法的系统
CN101930545A (zh) * 2009-06-24 2010-12-29 夏普株式会社 手写识别方法和设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《In International Conference on Computer Processing of Oriental Languages》 19971231 Chen Hong等 Segmentation and Recognition of Continuous Handwriting Chinese Text , *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236799A (zh) * 2011-06-20 2011-11-09 北京捷通华声语音技术有限公司 一种多字手写识别的方法及装置
CN102243708A (zh) * 2011-06-29 2011-11-16 北京捷通华声语音技术有限公司 一种手写识别方法、系统及手写识别终端
CN102663388A (zh) * 2012-03-27 2012-09-12 复旦大学 从背景图片中对手写体字符进行分割的方法
CN102663388B (zh) * 2012-03-27 2014-01-08 复旦大学 从背景图片中对手写体字符进行分割的方法
CN102750552A (zh) * 2012-06-18 2012-10-24 北京捷通华声语音技术有限公司 一种手写识别方法、系统及手写识别终端
CN102750552B (zh) * 2012-06-18 2015-07-22 北京捷通华声语音技术有限公司 一种手写识别方法、系统及手写识别终端
CN103745202B (zh) * 2014-01-08 2017-04-05 宇龙计算机通信科技(深圳)有限公司 手写输入时的汉字识别方法及装置
CN110262733B (zh) * 2014-06-24 2022-06-03 苹果公司 计算设备上的字符识别
CN110262733A (zh) * 2014-06-24 2019-09-20 苹果公司 计算设备上的字符识别
US11635888B2 (en) 2014-06-24 2023-04-25 Apple Inc. Character recognition on a computing device
CN106033316A (zh) * 2015-03-13 2016-10-19 北京搜狗科技发展有限公司 一种手写输入的方法和装置
CN107219935A (zh) * 2017-05-25 2017-09-29 哈尔滨工业大学 一种面向连续书写汉字的、支持交互的汉字输入系统及方法
CN110858317A (zh) * 2018-08-24 2020-03-03 北京搜狗科技发展有限公司 手写识别方法及装置
CN111131178A (zh) * 2019-12-04 2020-05-08 北京奇虎科技有限公司 终端设备识别方法、装置、设备和计算机存储介质
CN111931710A (zh) * 2020-09-17 2020-11-13 开立生物医疗科技(武汉)有限公司 一种联机手写文字识别方法、装置、电子设备及存储介质
CN113064497A (zh) * 2021-03-23 2021-07-02 上海臣星软件技术有限公司 语句识别的方法、装置、设备及计算机存储介质

Similar Documents

Publication Publication Date Title
CN102063620A (zh) 一种手写识别方法、系统及手写识别终端
CN102073884A (zh) 一种手写识别方法、系统及手写识别终端
KR101417286B1 (ko) 텍스트 사용자 입력을 오버랩하기 위한 문자 인식
CN100587660C (zh) 一种手写字符预测识别的方法和装置
US9323456B2 (en) Multi-character continuous handwriting input method
KR101825154B1 (ko) 중첩 쓰기 핸드라이팅 입력방법
CN111052064B (zh) 自动提供基于手势的自动完成建议的方法及其电子设备
CN102750552B (zh) 一种手写识别方法、系统及手写识别终端
CN104520877A (zh) 手写绘制设备和方法
CN103218160A (zh) 人机交互方法及终端
CN102243708B (zh) 一种手写识别方法、系统及手写识别终端
CN101894266A (zh) 一种手写识别方法及系统
CN103500332B (zh) 图片内文字显示方法及装置
CN103902098A (zh) 整形装置和整形方法
US20210350122A1 (en) Stroke based control of handwriting input
US20150134641A1 (en) Electronic device and method for processing clip of electronic document
CN102221976A (zh) 基于非完整识别的词语快速输入方法
CN102929394A (zh) 一种基于手势识别的盲文输入法
US9607080B2 (en) Electronic device and method for processing clips of documents
CN110308947A (zh) 问答信息的处理方法、系统、计算机设备和存储介质
WO2016034066A1 (zh) 一种汉字识别方法、装置及终端
JP2016085547A (ja) 電子機器および方法
CN102236799A (zh) 一种多字手写识别的方法及装置
KR20130021482A (ko) Html 테이블의 셀 단위 편집 방법
EP2026216A1 (en) Data processing method, computer program product and data processing system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110518