CN101630309A - 一种具有容错功能的文字处理系统及方法 - Google Patents

一种具有容错功能的文字处理系统及方法 Download PDF

Info

Publication number
CN101630309A
CN101630309A CN200910041836A CN200910041836A CN101630309A CN 101630309 A CN101630309 A CN 101630309A CN 200910041836 A CN200910041836 A CN 200910041836A CN 200910041836 A CN200910041836 A CN 200910041836A CN 101630309 A CN101630309 A CN 101630309A
Authority
CN
China
Prior art keywords
character
fault
tolerant
dictionary
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910041836A
Other languages
English (en)
Inventor
高精鍊
陈炳辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Guobi Technology Co Ltd
Original Assignee
Guangdong Guobi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Guobi Technology Co Ltd filed Critical Guangdong Guobi Technology Co Ltd
Priority to CN200910041836A priority Critical patent/CN101630309A/zh
Publication of CN101630309A publication Critical patent/CN101630309A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

一种具有容错功能的文字处理系统,包括:输入模块,标示有第一字符;字符容错表,包括第一字符和与之相容错的第二字符;容错处理模块,用于在字符容错表中查找出与第一字符相容错的第二字符;词库,存储若干个文字;文字搜索模块,用于在词库中查找出由第二字符所组成的文字;输出模块,用于将查找到的文字输出;容错关系设定于一个或多个第一字符与一个或多个第二字符之间。采用容错输入的技术,设定输入字符与输出字符之间的相互容错关系,并与在输入模块上的字符间的位置关系相关联,使得在输入字符的过程中,因不小心而误按了某一其他字符,也不影响正确输出字符,从而提高文字输入的准确率。本发明还提供采用该系统的使用方法。

Description

一种具有容错功能的文字处理系统及方法
技术领域
本发明涉及一种具有容错功能的文字处理系统及方法。
背景技术
目前,随着可文字输入的电子产品日趋小型化、便携化,其用于文字输入的键盘也随之小型化,键与键之间的间距也越来越小,每个字符键上的接触面积也相对缩小,各种按键更加紧密地组合在一起,这样,虽然可大大减小电子产品的体积,但同时也给使用者的操作上带来很多不便,在击键操作时,由于字符键的接触面积较小,指尖往往容易连带地点击到其相邻键,或因键位辨别不清而错误地点击到相邻键,输入的人为失误造成系统不能输出正确的文字,从而影响了文字输入的准确率。
因此,如何有效提高文字输入的准确率是文字输入领域亟待解决的问题。
发明内容
本发明的目的在于提供一种通过容错技术克服人为输入失误的干扰,纠正误输的字符,提高文字输入的准确率的文字处理技术和方法。
为了实现上述发明目的,本发明提供了一种具有容错功能的文字处理系统,其包括:
输入模块,用于输入字符,所述字符包括第一字符和第二字符;
字符容错表,包括具有容错兼容关系的第一字符与第二字符的组合;
容错处理模块,用于接收输入模块所输出的第一字符,并在字符容错表中查找出与之相互容错兼容的第二字符;
词库,用于存储文字;
文字搜索模块,用于在词库中查找出由第二字符所组成的文字;
输出模块,用于将经文字搜索模块查找出的文字输出;以及
分配模块,用于对所查找到的文字根据容错兼容关系进行分类处理。
在本发明中,在所述字符容错表进一步包括具有容错兼容关系的第一字符与第二字符在输入模块上的位置关系,所述第一字符在输入模块上的位置关系为相邻关系,优选相邻关系为左右相邻或/和上下相邻关系。
所述第一字符为词库中某一文字的组成或其音节,当第一字符为文字的组成时,第一字符可为任意一种语言的字母、注音符号或笔画的任选一种或多种。
本发明还提供了一种文字处理系统的文字处理方法:
步骤1)建立词库和字符容错表,所述词库中存储若干个文字,所述字符容错表中包括若干对具有容错兼容关系的第一字符与第二字符的组合;
步骤2)输入第一字符;
步骤3)容错处理,在所述字符容错表中查找出与所述第一字符相互容错兼容的至少一个第二字符;
步骤4)搜索处理,判断所述词库中是否存在由第二字符组成的文字或其音节,并输出词库比较结果,根据词库比较结果判定是否将该文字输出;
步骤5)将与词库中文字相匹配的文字加入词语候选区,以供使用者选取目标文字以输出。
与现有技术相比较,本发明的文字处理系统以及处理方法具有以下几点优点:
1)提高文字输入的准确率:采用容错输入的技术,设定输入字符与输出字符之间的相互容错关系,特别是一一对应的字符容错兼容关系,并与在输入模块上的字符间的某种位置关系相关联,使得在输入字符的过程中,因不小心而误按了某一其他字符,也不会影响正确地输出字符,从而提高文字输入的准确率;
2)应用范围广:可应用于各种文字的输入系统中,如中文、英文、日文等等各种语种,根据语种不同,建立不同的字库和词库,以文字的语音或音节为媒介进行输入处理的系统,还可建立与文字相对应的音节库,根据输入形式、语种以及词库大小的不同,来进行文字的输入。另一方面,所述输入模块可为各种全键盘,包括机械式键盘和触摸屏键盘,可应用于手机、电脑、PDA等各种文字输入装置中;
3)在输入模块中,具有容错兼容关系的两两字符可为相邻关系,这样,在文字输入过程中,解决了因键盘过小或操作失误时,误输入相邻字符而造成错误输出或中断输出的问题,通过容错技术的手段来自动纠正用户的误按,有效提高了文字输出的效率和准确率;
4)容错形式多样化:可在容错表中针对不同语言或输入形式建立各种不同的字符关系表,在字符关系表中,可以设定单一输入字符与单一输出字符之间一一对应的容错兼容关系,也可以设定单一输入字符与多个输出字符之间相互容错兼容关系等等;
5)在文字处理系统中,输入形式可多样化,所输入的第一字符可构成词库中的文字或其音节,当其为音节时,输入形式可选拼音输入或注音输入,根据不同语种,输入形式进行相应改变。
为使本发明更加容易理解,下面将结合附图进一步阐述本发明不同的具体实施例。
附图说明
图1为本发明文字处理系统的结构示意框图;
图2为本发明文字处理方法的流程图。
具体实施方式
本发明提供了一种具有容错功能的文字处理系统,可将各种语言文字的输入应用于各种全键盘的文字输入装置中(如电脑键盘、手机键盘或触摸式键盘等),通过对输入模块上的若干个字符之间的匹配关系进行定义,设定任意两个字符之间或者一个字符与多个字符之间的容错兼容关系,由此通过向文字处理系统输入某一第一字符或字符串,经容错兼容后,输出与之相同或相容错的第二字符或字符串,将该第二字符或字符串从词库中查找出相对应的文字并输出。
参照图1所示,在本发明文字处理系统的一个优选实施例中,包括输入模块1、解码模块2、字符容错表3、容错处理模块4、词库5、文字搜索模块6以及输出模块7,其中,所述输入模块1用于输入表征第一字符的代码,其可为键盘,优选各种文字输入装置的全键盘;所述解码模块2,其输入端与输入模块1的输出端相连接,用于接收输入模块1输出的代码,并对其进行解码,生成与之相对应的第一字符,表征为第一字符的图形;所述字符容错表3,其中记录有输入模块1上所有第一字符以及与之具有容错兼容关系的第二字符;所述容错处理模块4,其与字符容错表3相连接,且其输入端与解码模块2的输出端相连接,用于接收解码模块2所输出的第一字符,并在字符容错表1中查找出与之相互容错兼容的至少一个第二字符;所述词库5,用于存储某种语言的若干个文字,所述文字可为单字或词组;所述文字搜索模块6,其与词库5相连接,其输入端与容错处理模块4的输出端相连接,用于在词库5中查找出由第二字符所组成的文字;所述输出模块7,可为屏幕,其输入端与文字搜索模块6的输出端相连接,用于将经文字搜索模块6查找出的文字输出。
在本发明的字符容错表3中,划分有若干个存储空间,分别用于存储各个字符关系表,在本发明的一个优选实施例中,设输入模块1为英文键盘,某一字符关系表中,包括有输入模块1上某一第一字符和某一第二字符之间的容错兼容关系,通过三维数组的形式定义任意两个字符之间兼容关系,如{a,s,1},表示第一字符“a”和第二字符“s”之间为容错兼容关系;而在另一组字符关系表中,如{a,t,0},表示第一字符“a”和第二字符“t”之间无容错兼容关系。所述字符关系表的表现形式不受限制,可用三维数组或二维数组等等表示。在三维数组的字符关系表中,通过“1”和“0”分别表示“相互容错兼容”和“相互不容错兼容”两种字符之间的关系。一般地,在字符关系表中,仅记载若干对具有容错兼容关系的第一字符与第二字符的组合。对于英文字母或汉语拼音而言,字符容错表3中包含有26×26组字符关系表,对于注音而言,则包含有36×36组字符关系表。当然,字符关系表的个数根据输入模块1上的第一字符的个数而定。包括
在本发明的一个优选实施例中,在所述字符容错表进一步包括具有容错兼容关系的两两第一字符与第二字符在输入模块上的位置关系。换言之,表示第二字符也标示在输入模块上,且具有容错兼容关系的两两字符在输入模块上的位置相互关联。所述两两第一字符与第二字符在输入模块上的位置关系为相邻关系,优选为左右相邻或/和上下相邻关系。以一英文的全键盘为例,在英文字符区域,当在字符容错表中设定相互容错兼容字符之间在键盘上的位置关系为左右相邻关系时,以字符“g”作为第一字符为例,则与之左右相邻的字符“f”和字符“h”与该第一字符“g”之间具有容错兼容关系,可作为与第一字符“g”相容错兼容的第二字符,以此来定义输入模块1上的各个字符之间的容错兼容关系。
所述第一字符为词库5中某一文字的组成或其音节,如:在英文单词“about”中,5个英文字母作为第一字符构成该单词的组成;在汉字词语“雨伞”中,其拼音为“yusan”,通过由第一字符“yusan”组成的音节可从词库5中找出该词语来。所述第一字符为任意一种语言的字母、注音符号或笔画的任选一种或多种,即可通过这几种字符形式来反映某一文字的组成或音节。
在本发明的字符容错表中,所述容错兼容关系设于至少一个第一字符与至少一个第二字符之间。其中,包括有三种情况:其一,一个字符与一个字符之间的容错兼容关系;其二,一个字符与多个字符之间的容错兼容关系;其三,多个字符与多个字符之间的容错兼容关系。以第一种情况为例,预设输入模块上相邻的字符具有容错兼容关系,如字符“d”与字符“f”之间具有容错兼容关系,则当输入第一字符串“faxue”时,经容错分析处理,可查找出若干组第二字符串,其中包括“daxue”,导入词库,由此查找出与之音节相匹配的词组“大学”。以第二种情况为例,当第一字符为某一文字的音节时,在字符容错表中设定相互谐音的字符“c”与两个字符“ch”之间为容错兼容关系,即相互容错兼容的第一字符与第二字符之间具有相同或相近似的音节,如当输入第一字符串“cabie”时,经容错分析处理,查找出若干组第二字符串,其中包括“chabie”,将该第二字符串“chabie”导入词库中,查找出与之音节相匹配的词组“差别”。由此可见,可以通过设定谐音字符或字符串之间的容错兼容关系,使得文字处理系统能够查找出与所输入的第一字符或字符串的音节相匹配的字或词组,以帮助输出拼写不准的文字。
在本发明的另一个实施例中,所述解码模块2亦可省略,通过输入模块1直接对所输入的字符代码进行解码处理,再传输至字符容错表进行容错分析处理。
参照图2所示,以下具体介绍一下采用该文字处理系统进行文字处理的方法:
步骤1)建立词库和字符容错表,所述词库中存储若干个文字,所述字符容错表中包括若干对具有容错兼容关系的第一字符与第二字符的组合;
步骤2)输入第一字符;
步骤3)容错处理,在所述字符容错表中查找出与所述第一字符相互容错兼容的至少一个第二字符;
步骤4)搜索处理,判断所述词库中是否存在由第二字符组成的文字或其音节,并输出词库比较结果,根据词库比较结果判定是否将该文字输出;
步骤5)将与词库中文字相匹配的文字加入词语候选区,以供使用者根据自我意愿从中选取合意的目标以输出。
在步骤1)中,在某一文字处理系统中,所述词库中存储某种语言的若干个文字,所述文字至少包括单字和词组;在所述字符容错表中划分有若干个存储空间,分别用于存储若干个字符关系表,根据字符关系表的定义分别具有三个不同的实施例:
实施例一,在字符关系表中定义输入模块中的任意一个第一字符与一个第二字符之间的容错兼容关系。
实施例二,在字符关系表中定义输入模块中的一个第一字符与多个第二字符之间的容错兼容关系。
实施例三,在字符关系表中定义输入模块中的多个第一字符与多个第二字符之间的容错兼容关系。
在字符关系表的实施例一中,具有容错兼容关系的任意一个第一字符与一个第二字符在输入模块上具有相互关联的位置关系,所述位置关系可为相邻关系,如左右相邻或上下相邻,表示具有容错兼容关系的两个第一字符在输入模块上位于相邻位置,使得当使用者因击键失误而误输第一字符时,根据字符容错表可引出与之相邻的另一相容错字符并输出,这样,即便因击键失误而误输入与之相邻的其他键,也可通过容错处理而将目标字符映射并导入。如在一英文全键盘中,设定字符“u”和与其相邻的字符“y”和字符“i”之间为容错兼容关系,当输入字符“u”时,其作为第一字符,与之相兼容的两个第二字符“y”和“i”,以及该第一字符“u”均可被输出,这样,当使用者需要输入字符“y”,但却误输入与之相邻的第一字符“u”时,通过容错处理模块也可以将与该字符“u”相兼容的“y”导出,反之亦然。从而解决了因误输相邻键而造成的后果,引导字符的正确输出。
在字符关系表的实施例二中,具有容错兼容关系的一个第一字符与多个第二字符之间可在读音上相互容错兼容,即在具有相同或相近音节的字符与字符、字符与字符串、字符串与字符串之间建立容错兼容关系,在通过音节输入时,查找出由所输入的第一字符或字符串,或与之兼容的字符或字符串所组成的音节,并通过该音节查找出与之相对应的文字。如在一英文键盘中,设定具有相近读音的字符“z”与两个字符“zh”之间为容错兼容关系,当输入第一字符“z”时,经过容错处理,可以输出该字符“z”以及与之相容错兼容的另一组字符“zh”,输出两种结果以供选择,反之亦然。从而通过相同或相似读音相互兼容的方式,可帮助人们纠正文字或字符的读音,引导正确的输出。
根据适用的语言以及第一字符的形式的不同,在文字处理系统中可以设置不同的字符关系表,结合文字输入的不同特点,应用容错技术来提高字符或文字输出的准确率。
在步骤2)中,所述第二字符中可包含有第一字符,表明容错兼容的字符也包括有相同的字符,经容错处理后输出的第二字符中既包含有与之兼容的字符,还包含有第一字符本身。
如在一英文全键盘中,字符“j”和与其相邻的两个字符“k”和字符“h”为容错兼容关系,在输入第一字符“j”时,经过容错处理后,可输出该第一字符“j”和另两个第二字符“k”和“h”。
在步骤3)中,容错处理的过程根据容错表而定,在字符关系表的实施例一中,相互容错兼容的第一字符与第二符之间为一一对应关系,即输入某一第一字符,通过容错处理,仅能输出一个与之相互容错兼容的一个第二字符;以此类推。
在步骤4)中,搜索过程根据第二字符的形式而定,在某一文字处理系统中,当选用英文键盘以拼音输入法来输出中文文字时,第二字符为中文文字的音节,根据该音节在词库中查找出与其相匹配的单字或词组,输出至候选区,以备候选;同样地,当选用英文键盘来输出英文单词时,第二字符为文字本身,根据经兼容输出的第二字符所组成的英文字符串,在词库中查找出与其相匹配的英文单词。
步骤5)根据词库搜索比较结果来判定是否输出搜索结果,只有查找到与第二字符完全相同的文字或与之相同的音节时,比较结果方能判定为真,才能将搜索结果输出,不完全输入、多余输入、部分正确输入等情况都被视为比较结果为假,不能输出显示。
在本发明的一个优选实施例中,在字符关系表中定义输入模块中的任意一个第一字符与一个第二字符之间的容错兼容关系,当选用英文键盘以拼音输入法来输出中文文字时:
步骤1’)建立词库和字符容错表,所述词库中存储若干个中文单字或词组,所述字符容错表中包括输入模块上所有第一字符以及与之具有容错兼容关系的第二字符;
步骤2’)输入若干个第一字符,组成第一字符串;比如:输入第一字符串“fuhao”;
步骤3’)容错处理,在所述字符容错表中查找出分别与第一字符相互容错兼容的至少一个第二字符,将所查找出的第二字符按与其相兼容的第一字符的输入顺序进行排列,生成若干组第二字符串;
设具有容错兼容关系的任意两个第一字符在输入模块上具有左右相邻的位置关系,则上述第一字符串分别经过容错处理后,获得与之兼容的第二字符串,包括:fuhao、guhao、duhao、fihao、fyhao、fugao、fudao等等,可根据所述各第二字符串分别在词库中搜索比较,判断是否有与之相对应的文字。
在步骤4’)中进一步包括:
步骤41’)分别将上述每组第二字符串划分为若干组不同字长的字符段;
以第二字符串“fuhao”为例,分别划分为若干组不同字长的字符段,包括“f/uhao”、“fu/hao”、“fuh/ao”、“fuha/o”和“fuhao”等等;
步骤42’)将所述各字符段分别与词库中文字的音节相比较,并输出比较结果:
其中,按字长的升序逐一将所述字符段与词库中文字的音节相比较,即将“f/uhao”、“fu/hao”、“fuh/ao”、“fuha/o”和“fuhao”等各字符段分别与词库中文字的音节相比较;
步骤421’)在任意一组第二字符串中,将所述字符段按与其相兼容的第一字符的输入顺序进行一一比对;
若其第n个字符段与词库中的某一单字的音节相匹配,则转步骤4211’);
步骤4211’)进行第n+1个字符段的比较,当前字符下标(zifuindex)设置为词语第一个字对应的音节的长度加1,同时,字下标设置(zilndex)加1,表明将搜索光标指向音节的下个字符段,同时将光标指向字的已查找到的文字的下一个;
如,在第二字符串“fu/hao”中,包括有第一字符段“fu”和第二字符段“hao”,首先将第一字符段“fu”与词库中的文字的音节相比较,查找到若干个对应该音节的单字:符、服、富、复、扶等等,采用第一字符段可在词库中搜索到与之音节匹配的单字,将字符下标(zifuindex)设置为词语第一个字对应的音节的长度加1,同时,字下标设置(zilndex)加1,将搜索光标指向音节的第二个字符段,同时将光标指向下一个字。
若其第n个字符段与词库中的任何单字或其音节均不相匹配,则终止字符段搜索过程。
如,在第二字符串“f/uhao”中,包括有第一字符段“f”和第二字符段“uhao”,首先将第一字符段“f”与词库中的文字的音节相比较,没有找到与之相对应的单字或词组,则不再进行第二字符段“uhao”的比较,终止词库搜索过程。
步骤4212’)判断当前字下标(zilndex)是否大于当前词语的长度,即判断是否存在下一个字:
若当前字下标大于词语的长度,判定存在下一个字,则转步骤422’);
若当前字下标小于或等于词语的长度,判定不存在下一个字,则转步骤4213’);
步骤4213’)判断当前字符下标(zifulndex)是否大于当前第二字符串的总长度,即判断是否存在下一个音节字符段:
若当前字符下标大于第二字符串的总长度,判定还存在下一个音节,则转步骤4211’),进行下一个音节字符段的比较;
在本实施例中,则接下来进行第二个字符段“hao”的比较,在词库中查找到对应该音节的若干个单字:好、号、耗、好、豪等等,逐一比较各个音节字符段;
若当前字符下标小于或等于第二字符串的总长度,判定不存在下一个音节,字符段比较结束,则转步骤422’);
在本实施例中,当完成第二字符段“hao”的比较后,当前字符下标(zifuIndex)设置长度为5,与第二字符串的长度相同,则判定不存在下一个音节,结束字符段比较过程。
步骤422’)将对应第二字符中各字符段的单字按输入顺序进行组合,组成若干个词组,如:符好、符号、符耗、服好等等,将所述词组放入词库中进行比较,搜索词库中是否存在与之相同的词组:
若比较结果为不相匹配,则返回步骤421’),对另一组第二字符串进行音节字符段比较;
在本实施例中,如针对某一第二字符串“duhao”的音节字符段搜索,结果可能为“度好”,在词库比较中,不存在该词语,则进行另一组第二字符串的音节字符段比较。
若比较结果为相互匹配,则将转步骤4221’),对字下标(zilndex)加一,字光标指向下一个汉字;字符下标(zifuIndex)加一,字符光标指向下一个音节,且返回步骤4212’),重新对字符长度进行判断,并根据字符长度的比较来判定是否结束音节字符段比较过程;
步骤422’)将对应第二字符中各字符段的单字按输入顺序进行组合,组成若干个词组,如:符好、符号、符耗、服好等等,将所述词组放入词库中进行比较,根据词库比较结果判定是否输出该词组;
步骤4221’)若词库比较结果为真,即在词库中搜索到与之相同的词组,表示第二字符串构成词库中某一词组的音节,则转步骤5’),将其输出显示以供选取;
步骤4222’)若词库比较结果为假,即在词库中没有搜索到与之相同的词组,表示第二字符串不能组成某一文字,则终止词库搜索过程,不输出显示。
步骤5’)将与词库中词组相匹配的词组加入词语候选区,根据词库大小的不同、所输入的第一字符的不同以及对经容错后的第二字符的字符段划分的不同,在候选区中,可能出现若干个字或词组,以供使用者根据自我意愿从中选取合意的目标以输出。
在词组候选区中,优先按与第一字符串相同的比较结果的顺序输出;其次按所述搜索结果按其使用频率的降序由高到低进行排序,可帮助人们尽快地查找出合意的目标词组以输出。
在本实施例中,针对第二字符串“fuhao”依次进行音节字符段比较和词库比较后,导出以下词组:符号、富豪、负号、鼓号、讣告、辅导、妇道、辅道等等。
在本发明中,所述文字处理系统及其处理方法具有以下优点:
1)提高文字输入的准确率:采用容错输入的技术,设定输入字符与输出字符之间的相互容错关系,特别是一一对应的字符容错兼容关系,并与在输入模块上的字符间的某种位置关系相关联,使得在输入字符的过程中,因不小心而误按了某一其他字符,也不会影响正确地输出字符,从而提高文字输入的准确率;
2)应用范围广:可应用于各种文字的输入系统中,如中文、英文、日文等等各种语种,根据语种不同,建立不同的字库和词库,以文字的语音或音节为媒介进行输入处理的系统,还可建立与文字相对应的音节库,根据输入形式、语种以及词库大小的不同,来进行文字的输入。另一方面,所述输入模块可为各种全键盘,包括机械式键盘和触摸屏键盘,可应用于手机、电脑、PDA等各种文字输入装置中;
3)在输入模块中,具有容错兼容关系的两两字符可为相邻关系,这样,在文字输入过程中,解决了因键盘过小或操作失误时,误输入相邻字符而造成错误输出或中断输出的问题,通过容错技术的手段来自动纠正用户的误按,有效提高了文字输出的效率和准确率;
4)容错形式多样化:可在容错表中针对不同语言或输入形式建立各种不同的字符关系表,在字符关系表中,可以设定单一输入字符与单一输出字符之间一一对应的容错兼容关系,也可以设定单一输入字符与多个输出字符之间相互容错兼容关系等等;
5)在文字处理系统中,输入形式可多样化,所输入的第一字符可构成词库中的文字或其音节,当其为音节时,输入形式可选拼音输入或注音输入,根据不同语种,输入形式进行相应改变。
惟以上所述者,仅为本发明的较佳实施例而已,当不能以此限定本发明实施的范围,即大凡依本发明权利要求及发明说明书所记载的内容所作出简单的等效变化与修饰,皆仍属本发明权利要求所涵盖范围之内。

Claims (12)

1.一种具有容错功能的文字处理系统,其包括:
输入模块,用于输入字符,所述字符包括第一字符和第二字符;
字符容错表,包括具有容错兼容关系的第一字符与第二字符的组合;
容错处理模块,用于接收输入模块所输出的第一字符,并在字符容错表中查找出与之相互容错兼容的第二字符;
词库,用于存储文字;
文字搜索模块,用于在词库中查找出由第二字符所组成的文字;以及
输出模块,用于将文字搜索模块查找出的文字输出。
2.根据权利要求1所述的文字处理系统,其特征在于:所述容错兼容关系设于至少一个第一字符与至少一个第二字符之间。
3.根据权利要求2所述的文字处理系统,其特征在于:在所述字符容错表进一步包括相互容错兼容字符在输入模块上的位置关系。
4.根据权利要求3所述的文字处理系统,其特征在于:所述第一字符与第二字符在输入模块上的位置关系为相邻关系,所述相邻关系为左右相邻或/和上下相邻关系。
5.根据权利要求1所述的文字处理系统,其特征在于:所述第一字符为词库中文字的组成部分或其音节。
6.根据权利要求5所述的文字处理系统,其特征在于:相互容错兼容的第一字符与第二字符之间具有相同或相近似的音节。
7.一种采用容错技术的文字处理方法,其特征在于:
步骤1)建立词库和字符容错表,所述词库中存储若干个文字,所述字符容错表中包括具有容错兼容关系的第一字符与第二字符的组合;
步骤2)输入第一字符;
步骤3)容错处理,在所述字符容错表中查找出与所述第一字符相互容错兼容的第二字符;
步骤4)搜索处理,判断所述词库中是否存在由第二字符组成的文字或其音节,并输出词库比较结果,根据词库比较结果判定是否将该文字输出;
步骤5)将与词库中文字相匹配的文字加入词语候选区,以供使用者从中选取目标文字以输出。
8.根据权利要求7所述的一种文字处理方法,其特征在于:
步骤2)输入若干个第一字符,组成第一字符串;
步骤3)容错处理,在所述字符容错表中查找出与第一字符串相互容错兼容的至少一个第二字符,将所查找出的第二字符按与其相兼容的第一字符的输入顺序进行排列,生成若干组第二字符串。
9.根据权利要求8所述的一种文字处理方法,其特征在于:在步骤4)中进一步包括:
步骤41)分别将每组第二字符串划分为若干组不同字长的字符段
步骤42)将所述字符段分别与词库中的文字或其音节相比较,并输出比较结果。
10.根据权利要求9所述的一种文字处理方法,其特征在于:在步骤42)中:按字长的升序逐一将所述字符段与词库中的文字或其音节相比较。
11.根据权利要求10所述的一种文字处理方法,其特征在于:在步骤42)中进一步包括:
步骤421)在任意一组第二字符串中,将所述字符段按与其相兼容的第一字符的输入顺序进行一一比对;
若其第n个字符段与词库中的某一单字或其音节相匹配,则转步骤4211);
若其第n个字符段与词库中的任何单字或其音节均不相匹配,则完成字符段比较过程;
步骤4211)进行第n+1个字符段的比较;
步骤422)将对应第二字符串中各字符段的单字按输入顺序进行组合,组成若干个词组,将所述词组放入词库中进行比较,搜索词库中是否存在与之相同的词组:
若词库比较结果为相互匹配,即在词库中搜索到与之相同的词组,则转步骤5),将其输出显示以供选取;
若词库比较结果为相互不匹配,即在词库中没有搜索到与之相同的词组,则返回步骤421),对另一组第二字符串进行音节字符段比较,或终止词库搜索过程,不输出显示。
12.根据权利要求11所述的一种文字处理方法,其特征在于:在步骤421)中进一步包括:
步骤4211)若其第n个字符段与词库中的某一单字的音节相匹配,则进行第n+1个字符段的比较,当前字符下标设置为词语第一个字对应的音节的长度加1,字下标设置加1;
步骤4212)判断当前字下标是否大于当前词语的长度:
若当前字下标大于词语的长度,则转步骤422);
若当前字下标小于或等于词语的长度,则转步骤4213);
步骤4213)判断当前字符下标是否大于当前第二字符串的总长度:
若当前字符下标大于第二字符串的总长度,则转步骤4211),进行下一个音节字符段比较;
若当前字符下标小于或等于第二字符串的总长度,字符段比较结束,则转步骤422)。
CN200910041836A 2009-08-13 2009-08-13 一种具有容错功能的文字处理系统及方法 Pending CN101630309A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910041836A CN101630309A (zh) 2009-08-13 2009-08-13 一种具有容错功能的文字处理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910041836A CN101630309A (zh) 2009-08-13 2009-08-13 一种具有容错功能的文字处理系统及方法

Publications (1)

Publication Number Publication Date
CN101630309A true CN101630309A (zh) 2010-01-20

Family

ID=41575420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910041836A Pending CN101630309A (zh) 2009-08-13 2009-08-13 一种具有容错功能的文字处理系统及方法

Country Status (1)

Country Link
CN (1) CN101630309A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102226896A (zh) * 2011-05-13 2011-10-26 中山大学 一种基于模糊按键的信息容错输入方法
CN102566770A (zh) * 2010-12-24 2012-07-11 汉王科技股份有限公司 一种模糊笔顺的五笔画输入法
CN105589570A (zh) * 2014-10-23 2016-05-18 北京搜狗科技发展有限公司 一种处理输入错误的方法和装置
CN105929977A (zh) * 2016-06-02 2016-09-07 百度在线网络技术(北京)有限公司 一种笔画容错输入法及输入装置
CN110909535A (zh) * 2019-12-06 2020-03-24 北京百分点信息科技有限公司 命名实体校对方法、装置、可读存储介质及电子设备

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102566770A (zh) * 2010-12-24 2012-07-11 汉王科技股份有限公司 一种模糊笔顺的五笔画输入法
CN102226896A (zh) * 2011-05-13 2011-10-26 中山大学 一种基于模糊按键的信息容错输入方法
CN105589570A (zh) * 2014-10-23 2016-05-18 北京搜狗科技发展有限公司 一种处理输入错误的方法和装置
CN105589570B (zh) * 2014-10-23 2019-04-09 北京搜狗科技发展有限公司 一种处理输入错误的方法和装置
CN105929977A (zh) * 2016-06-02 2016-09-07 百度在线网络技术(北京)有限公司 一种笔画容错输入法及输入装置
CN105929977B (zh) * 2016-06-02 2018-08-07 百度在线网络技术(北京)有限公司 一种笔画容错输入法及输入装置
CN110909535A (zh) * 2019-12-06 2020-03-24 北京百分点信息科技有限公司 命名实体校对方法、装置、可读存储介质及电子设备
CN110909535B (zh) * 2019-12-06 2023-04-07 北京百分点科技集团股份有限公司 命名实体校对方法、装置、可读存储介质及电子设备

Similar Documents

Publication Publication Date Title
JP5997217B2 (ja) 言語変換において複数の読み方の曖昧性を除去する方法
US9026428B2 (en) Text/character input system, such as for use with touch screens on mobile phones
KR101116547B1 (ko) 데이터 입력 인터페이스 장치, 방법 및 시스템
US20080158023A1 (en) Apparatus and Method for Expressing Hangul
US20050027524A1 (en) System and method for disambiguating phonetic input
CN102455845B (zh) 一种文字输入方法和装置
JP2009116900A (ja) 曖昧なテキスト入力の明確な文字フィルタリング
CN101630309A (zh) 一种具有容错功能的文字处理系统及方法
CN100403239C (zh) 基于英文键盘的藏文输入法
CN101334692A (zh) 连连看拼音输入法
CN101630310A (zh) 一种具有容错功能的文字处理系统及方法
Niu et al. Stroke++: A new Chinese input method for touch screen mobile phones
US20110131488A1 (en) Word input method
CN103186247A (zh) 公式输入方法和系统
CN104850240A (zh) 一种基于手机20键位输入法的显示键盘及其输入方法
UzZaman et al. A comprehensive bangla spelling checker
CN101226430A (zh) 一种查字打字同码输入法及其输入装置和应用
CN101114196B (zh) 输入中文短语的方法和设备
CN102368177A (zh) 新汉字声韵输入方法及输入键盘
CN102053718B (zh) 用于生成汉字的方法以及键盘输入设备
CN101788853A (zh) 计算机标准键盘对称虚拟键位多指并击汉语拼音输入法
CA2584444C (en) Handheld electronic device and method for performing optimized spell checking during text entry by providing a sequentially ordered series of spell-check algorithms
CN101206525A (zh) 一种乱序输入方法
CN105807949B (zh) 藏文输入方法和系统
CN102622098B (zh) 新音形编码汉字输入法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1140559

Country of ref document: HK

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100120