CN100555312C - 利用字符结构信息进行后处理的手写识别的方法和装置 - Google Patents
利用字符结构信息进行后处理的手写识别的方法和装置 Download PDFInfo
- Publication number
- CN100555312C CN100555312C CNB2006101542703A CN200610154270A CN100555312C CN 100555312 C CN100555312 C CN 100555312C CN B2006101542703 A CNB2006101542703 A CN B2006101542703A CN 200610154270 A CN200610154270 A CN 200610154270A CN 100555312 C CN100555312 C CN 100555312C
- Authority
- CN
- China
- Prior art keywords
- character
- candidate characters
- topology information
- height
- charcter topology
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
提供了一种利用字符结构信息进行后处理的手写字符识别的方法,该手写字符识别方法包括如下步骤:预先建立一个字符结构信息库,该字符结构信息库包含用户所用语言中的部分或全部字符,记录了一种或多种结构信息所对应的字符;在用户手写一个字符时,用一个基本的手写字符识别器对该手写字符笔迹进行识别,由此得到一组识别结果的候选字符,每一个候选字符都具有一个表示与该手写字符相似程度的数值,即相似值;对识别结果候选字符进行重排序;和将经过重新排序后的一组候选字符作为最终的识别结果提供给用户进行选择。
Description
技术领域
本发明涉及手写字符识别,更具体地讲,涉及一种利用后处理方法来改进的手写识别方法和系统。
背景技术
近年来,利用数字化设备进行手写文字字符的输入已经十分普及,这些数字化设备包括具有触摸屏或手写板/手写笔等输入装置的计算机、Tablet-PC、PDA、手机,等等。与之相应的手写识别技术则是其最为核心的技术之一。手写输入方法给人们输入字符带来了极大的方便,尤其是对于那些无法配备大键盘的设备,如手机、Tablet-PC、PDA,更是如此。另一方面,也为那些不太会或不方便使用键盘进行文字输入的人们,如老人、不会使用传统输入法的人,提供了一种快捷而有效的文字输入方式。
手写输入字符的过程一般是:用户在数字化设备上手写需要输入的字符,然后手写字符识别器对用户所写的字符笔迹进行识别,最后将识别结果——多个候选字符显示在屏幕上供用户选择。需要注意的是,为了提高输入速度,一般总是把第一个候选字符作为用户默认的选择,也就是说,如果用户没有点选候选字符而继续手写下一个字符时,系统会认为用户选择的是第一个候选字符,并把其输入到指定位置,这样就节约了用户点选的时间,从而大大提高用户的输入速度。
因此,第一候选字符的正确识别率是手写识别技术最为重要的指标。如何提高这一指标也成为业界重要的研究方向。目前,对于大多数书写比较规整的字符,手写字符识别器的第一候选识别率大致为85%到95%,大致可以满足用户的要求。但对于写得较为潦草的字符(包括汉字的行草书),以及笔画数少(即含的信息量少)的英文字母、标点符号,手写字符识别器的第一候选识别率一般要低于80%,不足以让用户信服,还有待于进一步提高。
当前,提高第一候选字符识别率的技术之一是对识别率的输出结果进行后处理,包括建立概率语言模型和预建关系字库等。
用建立概率语言模型的方法来提高第一候选识别率的技术虽然可行,但难度和复杂度都很大,需要对语言进行大量的研究和统一,因此将增加业者的制造成本。预建关系字库的方法虽然简单,但效果并不好,有时甚至会得到更低的识别率。
发明内容
本发明的一方面提供了利用后处理方法来改进的手写识别方法和系统,所述手写识别方法和系统能够有效提高第一候选字符的正确识别率。
根据本发明的一方面,提供了一种利用字符结构信息进行后处理的手写字符识别的方法,其特征在于,该手写字符识别方法包括如下步骤:1)预先建立一个字符结构信息库,该字符结构信息库包含用户所用语言中的部分或全部字符,记录了一种或多种结构信息所对应的字符;2)在用户手写一个字符时,用一个基本的手写字符识别器对该手写字符笔迹进行识别,由此得到一组识别结果的候选字符,每一个候选字符都具有一个表示与该手写字符相似程度的数值,即相似值;3)对识别结果候选字符进行重排序;和4)将经过重新排序后的一组候选字符作为最终的识别结果提供给用户进行选择。
根据本发明的一方面,提供了一种利用字符结构信息进行后处理的手写字符识别的装置,其特征在于,该装置包括:手写输入模块、手写字符识别器、字符结构信息提取模块、重排序模块、字符结构信息库和显示模块,其中,手写输入模块收集用户书写笔迹等相关信息并将这些信息提供给手写字符识别器以进行处理和识别,手写字符识别器识别手写字符,并将多个识别结果候选字符和每一个候选字符所对应的表示与该手写字符相似程度的相似值提供给重排序模块,字符结构信息提取模块从用户通过手写输入模块输入的用户书写笔迹中提取出一种或多种字符结构信息,并将提取出的字符结构信息提供给重排序模块,字符结构信息库包含用户所用语言中的部分或全部字符,记录了一种或多种结构信息所对应的字符,重排序模块对从手写字符识别器输出的多个识别结果候选字符进行重新排序,并将经重新排序后的最终识别结果候选字符输出给显示模块,显示模块显示最终识别结果候选字符,以提供给用户进行选择。
在下面的描述中将部分地阐明本发明另外的方面和/或优点,通过描述,其会变得更加清楚,或者通过实施本发明可以了解。
附图说明
通过下面结合附图对实施例进行的描述,本发明的这些和/或其他方面和优点将会变得清楚和更易于理解,其中:
图1是表示根据本发明的利用字符结构信息进行后处理的手写识别装置的方框图;
图2是表示根据本发明的字符结构信息库的示图;
图3是表示根据本发明的利用字符结构信息进行后处理的手写识别方法的流程图;
图4是表示根据本发明第一实施例的利用字符的高度和宽度的比率的信息进行后处理的手写识别方法的流程图;
图5是表示根据本发明第二实施例的利用字符的笔画数的信息进行后处理的手写识别方法的流程图;
图6是表示根据本发明第三实施例的利用字符的各笔画长度的信息进行后处理的手写识别方法的流程图;
图7是表示根据本发明第四实施例的利用字符的位置的信息进行后处理的手写识别方法的流程图;
图8是表示根据本发明第五实施例的利用字符的高度参数的信息进行后处理的手写识别方法的流程图;和
图9表示可以应用本发明的物理平台。
具体实施方式
现在对本发明实施例进行详细的描述,其示例表示在附图中,其中,相同的标号始终表示相同部件。下面通过参照附图对实施例进行描述以解释本发明。
根据本发明的手写识别的方法利用了字符结构信息进行后处理,从而能够有效地提高第一候选字符的正确识别率,该手写识别的方法的工作原理如下:
1)预先建立一个字符结构信息库,该字符结构信息库包含用户所用语言中的部分或全部字符,记录了一种或多种结构信息所对应的字符;
2)在用户手写一个字符时,用一个基本的手写字符识别器对该手写字符笔迹进行识别,由此得到一组识别结果的候选字符,每一个候选字符都具有一个表示与该手写字符相似程度的数值——相似值;
3)对识别结果候选字符进行重排序,方法如下:
a)在2)中的识别结果候选字符中,筛选出部分或全部字符;
b)从2)中用户所手写的字符笔迹中,提取出一种或多种字符结构信息;
c)从字符结构信息库中取出b)中所提取出的一种或多种字符结构信息所对应的所有字符,记为字符集M;
d)对a)中筛选出来的候选字符重新进行排序:如果有候选字符同时存在于字符集M中,则这些候选字符的排序优先靠前,且这些优先靠前的候选字符中,他们之间的先后顺序保持与2)中的识别结果顺序一致。对于不存在于c)中字符集M的其他候选字符,他们不具有优先靠前的权利,他们之间的先后顺序保持不变。
e)在d)中重新排序后的候选字符与没有在a)中被筛选出来的字符直接合并在一起,前者在前,后者在后,组成重新排序后的一组候选字符。其中,没有在a)中被筛选出来的字符与它们在2)中候选字符的排序位置相同。
4)经过重新排序后的一组候选字符作为最终的识别结果,提供给用户进行选择。
其中,以上提及的结构信息,包括以下结构信息中的一种或多种:
■字符的高度和宽度的比率。
■字符的笔画数。
■字符的各笔画长度,包括最长笔画的长度和最短笔画的长度。
■字符的位置。
■字符的高度参数。
所用的字符结构信息库可以包含一种或多种语言的字符。库中包含如下一种或多种结构信息所对应的字符:
■)字符的高度和宽度的比率大于1的字符(窄字符)。
■字符的高度和宽度的比率小于1的字符(宽字符)。
■各种笔画数分别对应的字符。
■每个笔画长度都很短的字符。
■笔画中含有长笔画的字符。
■位置在上部的字符。
■位置在下部的字符。
■高大于书写区域的高度2/3的字符。
■高小于书写区域的高度1/2的字符。
上述的笔画长度是指该笔画的始点和终点间的距离,单位一般为象素数。其中用以下两种距离中的一种来表示:
■垂直距离:其定义是,假设P1的坐标为(X1,Y1)、P2的坐标为(X2,Y2),则P1和P2点的垂直距离为|X2-X1|和|Y2-Y1|中的最大者。
■欧氏距离。
上述的字符的位置是指字符相对于书写区域的位置,分为3种位置的字符:
■上部字符:整个字符都处在书写区域上部的字符,如书写区域的上半部分或2/3高度以上的部分。
■下部字符:整个字符都处在书写区域下部的字符,如书写区域的下半部分或1/3高度以下的部分。
■普通字符:除上部字符和下部字符外的其他字符。
上述的字符的高度参数用字符的高度和书写区域的高度之比来表示。
步骤3)中a)所述的筛选出的部分或全部字符,是指通过筛选方法,筛选出与第一候选字符相似程度很接近的字符。筛选的方法基于以下步骤完成:
k)由步骤2)可知,每一个候选字符都具有一个表示与该手写字符相似程度的数值——相似值,为此,分别计算出每个候选字符的相似值与第一候选字符的相似值的比值;
l)预先设定一个比值阈值T,阈值T一般可通过统计的方法设定,即通过对足够多的有代表性的测试样本进行测试和统计来获得最高的总识别率时的阈值作为阈值T;
m)如果候选字符的相似值越大,表示与该手写字符越相似,则把k)中所有相似值比值大于阈值T的结果候选字符作为与第一候选字符相似程度很接近的字符;否则,把k)中所有相似值比值小于阈值T的结果候选字符作为与第一候选字符相似程度很接近的字符。
下面,将参照图1对根据本发明的利用字符结构信息进行后处理的手写识别装置进行详细的描述。
图1是表示根据本发明的利用字符结构信息进行后处理的手写识别装置的方框图。
参照图1,根据本发明的手写字符识别装置包括手写输入模块100、手写字符识别器110、字符结构信息提取模块120、重排序模块130、字符结构信息库140和显示模块150。其中,手写输入模块100与手写字符识别器110相连,重排序模块130同时与手写字符识别器110、字符结构信息提取模块120、字符结构信息库140相连,最后还与显示模块150相连进行输出显示。
手写输入模块100指的是用于收集用户书写笔迹等相关信息的装置,例如电子写字板/手写笔、触摸屏等。当用户用手写笔或手指在这些装置上书写字符时,手写输入模块100就能得到所书写的字符轨迹点坐标、压力和时间参数等信息,这些信息会被送到手写字符识别器110来进行处理和识别。
手写字符识别器110是一个传统的用来识别手写字符的装置,它的输入一般为用户书写的字符笔迹坐标,输出为多个识别结果候选字符,这些输出的候选字符一般已按其与该手写字符相似程度进行了排序,越相似的排在越前面。同时,手写字符识别器110还能输出每一个候选字符所对应的表示与该手写字符相似程度的数值——相似值。例如,当用户在手写输入模块100上书写字符“字”时,手写字符识别器110输出的10个可能的识别结果候选字符为:“字宇享子家守孚学孛宗”。同时输出10个对应的相似值——距离值:6324、9915、10527、10597、11008、11111、11263、11392、11421、11460。本发明采用目前现有的手写字符识别器。
字符结构信息提取模块120从用户通过手写输入模块100输入的手写字符笔迹中提取出一种或多种字符结构信息,并将提取出的字符结构信息提供给重排序模块130。
重排序模块130用来对手写字符识别器110输出的多个识别结果候选字符进行重新排序。具体重排序方法如上所述。重排序模块130输出经重新排序后的最终识别结果候选字符。
字符结构信息库140包含用户所用语言中的部分或全部字符,记录了一种或多种结构信息所对应的字符,例如:字符的高度和宽度的比率大于1的字符(窄字符)、字符的高度和宽度的比率小于1的字符(宽字符)、各种笔画数分别对应的字符、每个笔画长度都很短的字符、笔画中含有长笔画的字符、位置在上部的字符、位置在下部的字符、高大于书写区域的高度2/3的字符、高小于书写区域的高度1/2的字符。作为示例,图2给出了一个包含了部分英文字母、标点符号、数字和汉字的字符结构信息库。当然,字符结构信息库还可以包括其他语言的字符,如日文、韩文等,以便用于对这些语言的字符进行识别。
显示模块150用来显示重排序模块130输出的最终识别结果候选字符,以提供给用户进行选择。
图2是表示根据本发明的字符结构信息库的示图。
参照图2,根据本发明的字符结构信息库可以包含一种或多种语言的字符,并且可包含一种或多种结构信息所对应的字符,例如字符的高度和宽度的比率大于1的字符(窄字符);字符的高度和宽度的比率小于1的字符(宽字符);各种笔画数(例如,笔画数为1、2、3和4等)分别对应的字符;每个笔画长度都很短的字符;笔画中含有长笔画的字符;位置在上部的字符;位置在下部的字符;普通字符;高大于书写区域的高度2/3的字符;和高小于书写区域的高度1/2的字符等。
下面,将参照图3对根据本发明的利用字符结构信息进行后处理的手写识别方法进行详细的描述。
图3是表示根据本发明的利用字符结构信息进行后处理的手写识别方法的流程图。
在步骤302中,手写字符识别器110对所输入的一个手写字符进行识别,并输出多个识别结果候选字符和每个候选字符对应的相似值。
在步骤303中,读入预先设定的相似值比值阈值T。阈值T一般可通过统计的方法确定:通过对足够多的有代表性的测试样本进行测试和统计,以获得最高的总识别率时的阈值作为阈值T。
在步骤304中,根据阈值T筛选出参加重排序的候选字符。可使用距离作为相似值,候选字符的距离越小表示它与所写的字符越相似。所以,要从候选字符中,选出所有与第一候选字符的相似值比值小于T的字符,作为参加重排序的候选字符。
在步聚305中,从用户在手写输入模块100上所书写的字符笔迹,提取必要的字符结构信息,比如,提取得到笔迹实际书写的笔画数为2笔。
在步骤306中,从字符结构信息库140中取出所提取的结构信息对应的字符集M。比如,从字符结构信息库(见图2)中提取笔画数为2笔的字符集为:“?!″:;《》=$+×B D b h 4 5 二 丁”。
在步骤307中,对在步骤304中筛选出来的候选字符利用字符的结构信息进行重新排序,重排序过程由重排序模块130完成,重排序方法如前面所述。
在步骤308中,将参与重排序的候选字符的重排序结果和没有在步骤304中筛选出的候选字符(即未参与重排序的候选字符)合并在一起作为最终识别结果候选字符。合并的方法是把后者直接并在前者的后面。
在步骤309中,把最终识别结果候选字符通过显示模块150显示给用户,以便用户进行必要的选择。
在步骤310中,用户进行必要的选择,得到正确的输入字符,完成该字符的输入。
在步骤311中,如果用户还需要手写输入下一个字符,则返回步骤301;否则,程序结束,完成所有需要输入的字符的输入工作。
如前所述,结构信息包括以下结构信息中的一种或多种:字符的高度和宽度的比率、字符的笔画数、字符的各笔画长度、字符的位置和字符的高度参数。
以下,将参照图4至图8针对这5种字符结构信息分别列举一个实施例来进行描述。其中,相似值的比值阈值T均取为1.5,已预先建立好的字符信息库请参见图2。手写字符识别器110除了可以输出识别结果候选字符外,还同时输出每个候选字符的距离值,距离值就是表示与该手写字符相似程度的数值——相似值,距离值越小,表示与该手写字符越相似。
图4是表示根据本发明第一实施例的利用字符的高度和宽度的比率的信息进行后处理的手写识别方法的流程图。
参照图4,在此实施例中,假设用户需要把字符“~”输入到手机中,详细过程如下:
步骤402:手写字符识别器110识别输出10个结果候选字符“N~i l t 1 j T\ v”和10个对应的距离值:7388、7632、8006、8507、8549、9126、9376、9443、9715、9862。
步骤403:读入阈值T=1.5。
步骤404:分别计算出每个候选字符的相似值与第一候选字符的相似值的比值为:1.00、1.03、1.08、1.15、1.16、1.24、1.27、1.28、1.31、1.33。所以,把比值小于T=1.5的候选字筛选出来,被筛选出的参与重排序的候选字符有10个:“N~i l t 1 j T \ v”,即全部参与重排序。
步骤406:从字符结构信息库(见图2)中提取高度和宽度的比率小于1的字符集M为:“- _ ... ~ 一”。
步骤407:重排序。参与重排序的候选字符中,同时也存在于字符集M的字符为“~”,优先排于前面,所以,重排序结果为:“~N i l t 1 j T \ v”。
步骤408:没有相似值比值大于等于T的候选字符(即不参与步骤407中的重排序的候选字符),所以,最终识别结果候选字符:“~N i l t 1 j T \ v”。
步骤409:把候选字符“~N i l t 1 j T \ v”通过显示模块150显示给用户。
步骤410:用户点选“~”,完成其输入。
步骤411:用户不再需要输入下一个字符,程序结束。
图5是表示根据本发明第二实施例的利用字符的笔画数的信息进行后处理的手写识别方法的流程图。
参照图5,在此实施例中,假设用户需要把字符分号“;”输入到手机中,详细过程如下:
步骤502:手写字符识别器110识别输出10个结果候选字符“),;2 7′> ? ] >”和10个对应的距离值:6512、6956、8451、8538、8637、9050、9300、9883、10160、10180。
步骤503:读入阈值T=1.5。
步骤504:分别计算出每个候选字符的相似值与第一候选字符的相似值的比值为:1.00、1.07、1.30、1.31、1.33、1.39、1.43、1.52、1.56、1.56。所以,把比值小于T的候选字筛选出来,被筛选出的参与重排序的候选字符有7个:“ ) , ; 2 7 ′>”。
步骤506:从字符结构信息库(见图2)中提取笔画数为2笔的字符集M为:“?!″:;《》=$+×B D b h 45二丁”。
步骤507:重排序。参与重排序的候选字符中,同时也存在于字符集M的字符为“;”,优先排于前面,所以,重排序结果为:“;),27′>”。
步骤508:相似值比值大于等于T的候选字符(即不参与步骤507中的重排序的候选字符)为:“?]>”,与重排序结果并在一起,得到最终识别结果候选字符:“;),27′>?]>”。
步骤509:把候选字符“;),27′>?]>”通过显示模块150显示给用户。
步骤510:用户点选“;”,完成其输入。
步骤511:用户不再需要输入下一个字符,程序结束。
图6是表示根据本发明第三实施例的利用字符的各笔画长度的信息进行后处理的手写识别方法的流程图。
参照图6,在此实施例中,假设用户需要把字符顿号“、”输入到手机中,详细过程如下:
步骤602:手写字符识别器110识别输出10个结果候选字符“\i、`X)lh t 1”和10个对应的距离值:7841、8098、8979、9035、9203、9571、9672、9718、9874、10130。
步骤603:读入阈值T=1.5。
步骤604:分别计算出每个候选字符的相似值与第一候选字符的相似值的比值为:1.00、1.03、1.15、1.15、1.17、1.22、1.23、1.24、1.26、1.29。所以,把比值小于T的候选字筛选出来,被筛选出的参与重排序的候选字符有10个:“\i、`X) l h t 1”,即全部参与重排序。
步骤606:从字符结构信息库(见图2)中提取每笔都很短的字符集M为:“。、″:′...·.`0 O 8”(注:表示笔画长度的距离为垂直距离)。
步骤607:重排序。参与重排序的候选字符中,同时也存在于字符集M的字符为“、`”,优先排于前面,所以,重排序结果为:“、`\i X)l h t 1”。
步骤608:没有相似值比值大于等于T的候选字符(即不参与步骤607中的重排序的候选字符),所以得到最终识别结果候选字符:“、`\i X)l h t 1”。
步骤609:把候选字符“、`\i X)l h t 1”通过显示模块150显示给用户。
步骤610:用户点选“、”,完成其输入。
步骤611:用户不再需要输入下一个字符,程序结束。
图7是表示根据本发明第四实施例的利用字符的位置的信息进行后处理的手写识别方法的流程图。
参照图7,在此实施例中,假设用户需要把字符逗号“,”输入到手机中,详细过程如下:
步骤702:手写字符识别器110识别输出10个结果候选字符“′,y/J 1 )xX j”和10个对应的距离值:6806、6914、8112、8273、9066、9119、9248、9268、9328、9451。
步骤703:读入阈值T=1.5。
步骤704:分别计算出每个候选字符的相似值与第一候选字符的相似值的比值为:1.00、1.02、1.19、1.22、1.33、1.34、1.36、1.36、1.37、1.39。所以,把比值小于T的候选字符筛选出来,被筛选出的参与重排序的候选字符有10个:“′,y/J 1 )x Xj”,即全部参与重排序。
步聚705:用户实际所书写的笔迹为下部字符。
步骤706:从字符结构信息库(见图2)中提取下部字符集M为:“.,_、。”。
步骤707:重排序。参与重排序的候选字符中,同时也存在于字符集M的字符为“,”,优先排于前面,所以,重排序结果为:“,‘y/J 1)x Xj”。
步骤708:没有相似值比值大于等于T的候选字符(即不参与步骤707中的重排序的候选字符),所以得到最终识别结果候选字符:“,‘y/ J 1 ) x Xj”。
步骤709:把候选字符“,‘y/J 1 ) x X j”通过显示模块150显示给用户。
步骤710:用户点选“,”,完成其输入。
步骤711:用户不再需要输入下一个字符,程序结束。
图8是表示根据本发明第五实施例的利用字符的高度参数的信息进行后处理的手写识别方法的流程图。
参照图8,在此实施例中,假设用户需要把大写字母“C”输入到手机中,详细过程如下:
步骤802:手写字符识别器110识别输出10个结果候选字符“c C e ( L [ Eo 6 l”和10个对应的距离值:5814、6191、7443、7850、8096、8489、8569、8688、9154、9184。
步骤803:读入阈值T=1.5。
步骤804:分别计算出每个候选字符的相似值与第一候的比值为:1.00、1.06、1.28、1.35、1.39、1.46、1.47、1.49、1.57、1.58。所以,把比值小于T的候选字筛选出来,被筛选出的参与重排序的候选字符有选字符的相似值8个:“c C e ( L [ E o”。
步聚805:用户实际所书写的笔迹的高大于书写区域的高度的2/3。
步骤806:从字符结构信息库(见图2)中提取高大于书写区域的高度的2/3的字符集M为:“A B C D E F G H I J K L M N O P Q R S T U V W X Y Z bd fg h i j k l p q t y()[]”。
步骤807:重排序。参与重排序的候选字符中,同时也存在于字符集M的字符为“C ( L [ E”,优先排于前面,所以,重排序结果为:“C ( L [ E c e o”。
步骤808:相似值比值大于等于T的候选字符(即不参与步骤807中的重排序的候选字符)为:“6 1”,与重排序结果合并后,得到最终识别结果候选字符:“C ( L [ E c e o 6 1”。
步骤809:把候选字符“C(L [ E c e o 6 1”通过显示模块150显示给用户。
步骤810:用户点选“C”,完成其输入。
步骤811:用户不再需要输入下一个字符,程序结束。
以上列举的第一至第五实施例是分别单独利用了1种字符结构信息,实际应用中,一个字符的识别过程常常利用2种或2种以上的字符结构信息。
图9表示可以应用本发明的物理平台。
参照图9,本发明所涉及的系统具有很好的扩展性和易用性,适合PDA901、手写手机902和Tablet-PC 903等设备使用,尤其是对于手机这种计算能力弱,存储空间有限的终端来说,其优点尤为明显。本发明可以广泛的运用于各种可以进行手写输入的移动终端设备上,也可以用于有外接录入设备的有计算能力的设备上,如PC 900,服务器等。
为了验证本发明对于提高第一候选字符识别率的效果,根据本发明的方法在三星SCH-W399平台上进行了实验。测试样本是由3位不同的人分别在该平台上手写的2000个字符,字符包括大小写英文字母、标点符号、数字、汉字。识别率的定义为:识别率=第一候选识别正确的字符个数/被识别的字符总数。识别结果如表1所示。
表1识别率对照表
测试样本组 | 不应用本发明的识别率 | 应用本发明的识别率 | 识别率提高量 |
A | 71.73% | 83.93% | 12.23% |
B | 65.25% | 80.50% | 15.25% |
C | 75.02% | 87.59% | 12.57% |
参照表1可见,本发明对于提高第一候选字符的识别率有十分明显的效果。从大量实验得知,本发明对于书写比较潦草的字符,效果更为显著(如表1的测试样本组B)。另一方面,由于本发明方法简单,无需增加任何硬件,只需增加极少的内存空间,所以,应用本发明具有较高的成本效益。
虽然已表示和描述了本发明的一些实施例,但本领域技术人员应该理解,在不脱离由权利要求及其等同物限定其范围的本发明的原理和精神的情况下,可以对这些实施例进行修改。
Claims (16)
1、一种利用字符结构信息进行后处理的手写字符识别的方法,其特征在于,该手写字符识别方法包括如下步骤:
1)预先建立一个字符结构信息库,该字符结构信息库包含用户所用语言中的部分或全部字符,记录了一种或多种结构信息所对应的字符;
2)在用户手写一个字符时,用一个基本的手写字符识别器对该手写字符笔迹进行识别,由此得到一组识别结果的候选字符,每一个候选字符都具有一个表示与该手写字符相似程度的数值,即相似值;
3)对识别结果候选字符进行重排序;和
4)将经过重新排序后的一组候选字符作为最终的识别结果提供给用户进行选择。
2、如权利要求1所述的方法,其特征在于,步骤3)包括下述步骤:
a1)分别计算出每个候选字符的相似值与第一候选字符的相似值的比值;
a2)预先设定一个比值阈值T,阈值T通过统计的方法设定:通过对多个有代表性的测试样本进行测试和统计,以获得最高的总识别率时的阈值作为阈值T;
a3)如果候选字符的相似值越大,表示与手写字符越相似,则把a1)中所有相似值比值大于阈值T的结果候选字符作为与第一候选字符相似程度很接近的字符;否则,把a1)中所有相似值比值小于阈值T的结果候选字符作为与第一候选字符相似程度很接近的字符,从而筛选出部分或全部字符;
b)从2)中用户所手写的字符笔迹中,提取出一种或多种字符结构信息;
c)从字符结构信息库中取出b)中所提取出的一种或多种字符结构信息所对应的所有字符,记为字符集M;
d)对a3)中筛选出来的候选字符重新进行排序:如果有候选字符同时存在于字符集M中,则这些候选字符的排序优先靠前,且这些优先靠前的候选手符中,它们之间的先后顺序保持与2)中的识别结果顺序一致;对于不存在于字符集M的其他候选字符,它们不具有优先靠前的权利,并且它们之间的先后顺序保持不变;和
e)在d)中重新排序后的候选字符与没有在a3)中被筛选出来的字符直接合并在一起,前者在前,后者在后,组成重新排序后的一组候选字符,其中,没有在a3)中被筛选出来的字符与它们在2)中候选字符的排序位置相同。
3、如权利要求1或2所述的方法,其特征在于,所述字符结构信息包括下述结构信息中的一种或多种:字符的高度和宽度的比率、字符的笔画数、字符的各笔画长度、字符的位置和字符的高度参数。
4、如权利要求1或2所述的方法,其特征在于,所述字符结构信息库包含下述一种或多种结构信息所对应的字符:字符的高度和宽度的比率大于1的字符、字符的高度和宽度的比率小于1的字符、各种笔画数分别对应的字符、位置在上部的字符、位置在下部的字符、高大于书写区域的高度2/3的字符和高小于书写区域的高度1/2的字符。
5、如权利要求3所述的方法,其特征在于,所述笔画长度是笔画的始点和终点间的距离,用以下两种距离中的一种来表示:
垂直距离:其定义是,P1的坐标为(X1,Y1)、P2的坐标为(X2,Y2),且P1和P2点的垂直距离为|X2-X1|和|Y2-Y1|中的最大者;和
欧氏距离。
6、如权利要求3所述的方法,其特征在于,所述字符的位置是字符相对于书写区域的位置,所述字符包括3种位置的字符:
上部字符:整个字符都处在书写区域上部的字符,如书写区域的上半部分或2/3高度以上的部分;
下部字符:整个字符都处在书写区域下部的字符,如书写区域的下半部分或1/3高度以下的部分;
普通字符:除上部字符和下部字符外的其他字符。
7、如权利要求3所述的方法,其特征在于,所述字符的高度参数用字符的高度和书写区域的高度之比来表示。
8、如权利要求1或2所述的方法,其特征在于,所述相似值是候选字符的距离。
9、一种利用字符结构信息进行后处理的手写字符识别的装置,其特征在于,该装置包括:手写输入模块、手写字符识别器、字符结构信息提取模块、重排序模块、字符结构信息库和显示模块,
其中,手写输入模块收集用户书写笔迹等相关信息并将这些信息提供给手写字符识别器以进行处理和识别,
手写字符识别器识别手写字符,并将多个识别结果候选字符和每一个候选字符所对应的表示与该手写字符相似程度的相似值提供给重排序模块,
字符结构信息提取模块从用户通过手写输入模块输入的用户书写笔迹中提取出一种或多种字符结构信息,并将提取出的字符结构信息提供给重排序模块,
字符结构信息库包含用户所用语言中的部分或全部字符,记录了一种或多种结构信息所对应的字符,
重排序模块对从手写字符识别器输出的多个识别结果候选字符进行重新排序,并将经重新排序后的最终识别结果候选字符输出给显示模块,重排序模块在执行重排序操作时从字符结构信息库中取出字符结构信息所对应的字符,
显示模块显示最终识别结果候选字符,以提供给用户进行选择。
10、如权利要求9所述的装置,其特征在于,所述重排序模块:
a1)分别计算出每个候选字符的相似值与第一候选字符的相似值的比值;
a2)预先设定一个比值阈值T,阈值T通过统计的方法设定:通过对多个有代表性的测试样本进行测试和统计,以获得最高的总识别率时的阈值作为阈值T;
a3)如果候选字符的相似值越大,表示与手写字符越相似,则把a1)中所有相似值比值大于阈值T的结果候选字符作为与第一候选字符相似程度很接近的字符;否则,把a1)中所有相似值比值小于阈值T的结果候选字符作为与第一候选字符相似程度很接近的字符,从而筛选出部分或全部字符;
b)从用户所手写的字符笔迹中,提取出一种或多种字符结构信息;
c)从字符结构信息库中取出b)中所提取出的一种或多种字符结构信息所对应的所有字符,记为字符集M;
d)对a3)中筛选出来的候选字符重新进行排序:如果有候选字符同时存在于字符集M中,则这些候选字符的排序优先靠前,且这些优先靠前的候选字符中,它们之间的先后顺序保持与从手写字符识别器输出的识别结果中的识别结果顺序一致;对于不存在于字符集M的其他候选字符,它们不具有优先靠前的权利,并且它们之间的先后顺序保持不变;和
e)在d)中重新排序后的候选字符与没有在a3)中被筛选出来的字符直接合并在一起,前者在前,后者在后,组成重新排序后的一组候选字符,其中,没有在a3)中被筛选出来的字符与它们在从手写字符识别器输出的识别结果中的候选字符的排序位置相同。
11、如权利要求9或10所述的装置,其特征在于,所述字符结构信息包括下述结构信息中的一种或多种:字符的高度和宽度的比率、字符的笔画数、字符的各笔画长度、字符的位置和字符的高度参数。
12、如权利要求9或10所述的装置,其特征在于,所述字符结构信息库包含下述一种或多种结构信息所对应的字符:字符的高度和宽度的比率大于1的字符、字符的高度和宽度的比率小于1的字符、各种笔画数分别对应的字符、位置在上部的字符、位置在下部的字符、高大于书写区域的高度2/3的字符和高小于书写区域的高度1/2的字符。
13、如权利要求11所述的装置,其特征在于,所述笔画长度是笔画的始点和终点间的距离,用以下两种距离中的一种来表示:
垂直距离:其定义是,P1的坐标为(X1,Y1)、P2的坐标为(X2,Y2),且P1和P2点的垂直距离为|X2-X1|和|Y2-Y1|中的最大者;和
欧氏距离。
14、如权利要求11所述的装置,其特征在于,所述字符的位置是字符相对于书写区域的位置,包括3种位置的字符:
上部字符:整个字符都处在书写区域上部的字符,如书写区域的上半部分或2/3高度以上的部分;
下部字符:整个字符都处在书写区域下部的字符,如书写区域的下半部分或1/3高度以下的部分;
普通字符:除上部字符和下部字符外的其他字符。
15、如权利要求11所述的装置,其特征在于,所述字符的高度参数用字符的高度和书写区域的高度之比来表示。
16、如权利要求9或10所述的装置,其特征在于,所述相似值是候选字符的距离。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2006101542703A CN100555312C (zh) | 2006-09-19 | 2006-09-19 | 利用字符结构信息进行后处理的手写识别的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2006101542703A CN100555312C (zh) | 2006-09-19 | 2006-09-19 | 利用字符结构信息进行后处理的手写识别的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101149805A CN101149805A (zh) | 2008-03-26 |
CN100555312C true CN100555312C (zh) | 2009-10-28 |
Family
ID=39250320
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2006101542703A Active CN100555312C (zh) | 2006-09-19 | 2006-09-19 | 利用字符结构信息进行后处理的手写识别的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100555312C (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102208039B (zh) * | 2011-06-01 | 2013-02-20 | 汉王科技股份有限公司 | 一种多语言混合手写文本行的识别方法及装置 |
CN103513898A (zh) * | 2012-06-21 | 2014-01-15 | 夏普株式会社 | 手写字符切分方法和电子设备 |
CN102750272B (zh) * | 2012-07-02 | 2015-01-14 | 安徽科大讯飞信息科技股份有限公司 | 字符手写输入候选项优化方法及系统 |
CN104376336B (zh) * | 2014-12-01 | 2018-07-06 | 深圳如果技术有限公司 | 一种手写识别的方法及手写笔 |
CN104571587B (zh) * | 2014-12-30 | 2018-06-26 | 北京奇虎科技有限公司 | 对输入法的上屏候选项进行筛选的方法和装置 |
CN106326195B (zh) * | 2015-06-17 | 2019-06-11 | 北大方正集团有限公司 | 字符处理方法和处理系统 |
US9904847B2 (en) * | 2015-07-10 | 2018-02-27 | Myscript | System for recognizing multiple object input and method and product for same |
JP7298290B2 (ja) * | 2018-06-19 | 2023-06-27 | 株式会社リコー | 手書き入力表示装置、手書き入力表示方法およびプログラム |
CN109918984A (zh) * | 2018-12-15 | 2019-06-21 | 深圳壹账通智能科技有限公司 | 保险单号码识别方法、装置、电子设备及存储介质 |
CN110796140B (zh) * | 2019-10-17 | 2022-08-26 | 北京爱数智慧科技有限公司 | 一种字幕检测方法和装置 |
-
2006
- 2006-09-19 CN CNB2006101542703A patent/CN100555312C/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN101149805A (zh) | 2008-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100555312C (zh) | 利用字符结构信息进行后处理的手写识别的方法和装置 | |
CN102449640B (zh) | 识别手写单词 | |
CN100587660C (zh) | 一种手写字符预测识别的方法和装置 | |
CN101611417B (zh) | 用于字符识别的方法 | |
CN105260751B (zh) | 一种文字识别方法及其系统 | |
EP2650766A1 (en) | Multi-character continuous handwriting input method | |
CN101135946B (zh) | 汉字手写输入方法 | |
CN101539822B (zh) | 一种触摸屏手写区域识别方法、系统 | |
CN106250804A (zh) | 减少的文档笔划存储 | |
CN101149806B (zh) | 利用上下文信息进行手写字符识别后处理的方法和装置 | |
CN102419645A (zh) | 组合输入汉字的方法和装置、掌上终端 | |
CN107463331A (zh) | 手势轨迹模拟方法、装置及电子设备 | |
CN108701215B (zh) | 用于识别多对象结构的系统和方法 | |
CN102073884A (zh) | 一种手写识别方法、系统及手写识别终端 | |
CN103455264A (zh) | 一种手写汉字输入方法及具有该方法的电子装置 | |
CN103729087A (zh) | 一种多点触摸手势识别的输入法 | |
CN101581981A (zh) | 一种在普通纸上手写中文直接形成中文文本的方法和系统 | |
CN101281449B (zh) | 手写字识别方法和系统 | |
CN104794485A (zh) | 一种识别书写字的方法及装置 | |
CN112784720A (zh) | 基于银行回单的关键信息提取方法、装置、设备及介质 | |
CN102156889A (zh) | 一种识别手写文本行语言类别的方法及装置 | |
CN104978577A (zh) | 信息处理方法、装置及电子设备 | |
KR20040043454A (ko) | 펜 컴퓨팅 시스템에서의 펜 입력 방법 및 장치 | |
CN101893960B (zh) | 一种基于方向向量的文字识别方法和识别装置 | |
CN104077268B (zh) | 整形装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |