具体实施方式
实施例一:
本发明实施例一提供一种错别字检测方法,该方法包括:
接收用户输入的字符,将所述用户输入的字符组成词语;
检测所述词语的概率是否小于预设数值;
根据所述检测结果确定所述词语中是否存在错别字。
其中,将所述用户输入的字符组成的词语可以是两字词语、三字词语或者四字词语。
本发明实施例将用户输入的字符组成词语,通过检测所述词语的概率是否小于预设数值来确定是否存在错别字,以实现对用户输入的词语中的错别字进行检测。
实施例二:
参阅图1,本发明实施例二提供一种错别字检测方法,适用于对两个字符组成的词语进行检测,该方法具体包括:
A1、接收用户输入的字符,所述用户输入的字符包括:第一字符和第二字符。
A2、根据第一字符的拼音和第二字符的拼音之间的关联标记确定词语类型,本实施例假定确定的词语类型为二个字符组成的两字词语类型。
在该步骤之前,预设现有词语的头两个字符拼音间的关联标记,比如,“事情”的拼音为“shi qing”,预设该两个拼音间的关联标记为两字关联,则对应的词语类型为两个字符组成的两字词语;“俄罗斯”的头两个字符的拼音为“eluo”预设该两个拼音间的关联标记为三字关联,则对应的词语类型为三个字符组成的三字词语。
A3、根据拼音输入法中预设的字与字之间的概率统计,获取第一字符后面接第二字符的概率X和第二字符前面接第一字符的概率Y。
具体的,假定用户输入拼音“shi shi”并选择对应的字符“事识”,此时,第一字符为“事”,第二字符为“识”,从拼音输入法中预设的字与字之间的概率统计中,获取“事”后面接“识”的概率和“识”前面接“事”的概率。
A4、将第一字符后面接第二字符的概率X与第二字符前面接第一字符的概率Y相加,判断X+Y是否小于预设的第一数值,如果是,执行A6,否则,执行A5。
A5、确定第一字符后面接第二字符组成的词语中不存在错别字,结束本流程。
A6、确定第一字符后面接第二字符组成的词语中存在错别字,显示错别字提示信息。
如上已经实现错别字检测,也可以在A6中不显示错别字提示信息,而根据拼音输入法中预设的字与字之间的概率统计,对错别字进行修正,后续过程描述如何实现对错别字进行修正。
A7、将第一字符与第二字符的拼音对应的多个字符组成对应的词语;根据拼音输入法中预设的字与字之间的概率统计,获取对应的词语的概率;从所获取的概率中查找最大值,用最大值所对应的词语替换上述存在错别字的两字词语,以形成正确的两字词语。
具体举实例说明,假定接收用户输入的第一字符“事”和第二字符“识”,即“事识”,根据拼音输入法中预设的字与字之间的概率统计,获知“事”后面接“识”的概率X几乎为0,“识”前面接“事”的概率Y也几乎为0,则X与Y的和一定小于预设的第一数值,则“事识”中存在错别字。“识”的拼音“shi”对应多个字符,“事”分别与对应的多个字符组合,判断其组合后的概率,通过比较得到,“事”后面接“实”的概率很大,“实”前面接“事”的概率也很大,最后得出在“事”分别与对应的多个字符组合的词语中,词语“事实”的概率最大,因此,将“实”替换输入的第二字符“识”,形成正确的词语“事实”。
本发明实施例二根据第一字符的拼音和第二字符的拼音之间的关联标记确定第一字符和第二字符组成两字词语,根据拼音输入法中预设的字与字之间的概率统计,检测该两字词语中是否存在错别字,以实现对用户输入的词语中的错别字进行检测;进一步的,可以利用拼音输入法中预设的字与字之间的概率统计,对词语中的错别字进行纠正。
实施例三:
参阅图2,本发明实施例三提供一种错别字检测方法,适用于对三个或者四个字符组成的词语进行检测,该方法具体包括:
B1、接收用户输入的第一字符、第二字符和第三字符。
B2、根据第一字符的拼音和第二字符的拼音之间的关联标记确定词语类型,本实施例假定确定的词语类型为三个字符组成的三字词语类型。
B3、根据第一字符的拼音、第二字符的拼音和第三字符的拼音,判断该三个字符是否可以组成词语,如果是,执行B5,否则执行B4。
举例说明,第一字符和第二字符分别为“俄”“罗”,如果第三个字符为
“国”,则根据三个字符的拼音“e luo guo”,确定其不能组成词语;如果第三个字符输入为“思”,则根据三个字符的拼音“e luo si”,确定该三个字符能组成词语。
B4、提示输入错误,结束本流程。
B5、判断三个字符组成的词语的概率是否小于预设的第二数值,如果否,执行B6;如果是,执行B7。
拼音输入法中,在设定N个拼音可以组成对应的词语后,会预先存储该N个拼音对应的多个字符交叉组合形成的词语的概率,比如,确定“e luo si”能组成词语后,会预先存储“俄罗斯”、“俄罗思”“鹅罗思”等词语的概率。续前面的例子,如果用户输入“俄罗思”,则系统查找“俄罗思”的概率,判断是否小于预设的第二数值。
B6、确认该三字词语中没有错别字,结束本流程。
B7、确认该三字词语中有错别字,显示错别字提示信息。
如上已经实现错别字检测,也可以在B8中不显示错别字提示信息,而根据拼音输入法中预设的字与字之间的概率统计,对错别字进行修正,后续过程描述如何实现对错别字进行修正。
B8、根据拼音输入法中预设的字与字之间的概率统计,获取第i-1字符与第i字符相连的概率和第i字符与第i+1字符相连的概率,其中1<i<N;本实施例中N=3,则该步骤中获取第一字符与第二字符间相连的概率,和,第二字符与第三字符间相连的概率。
B9、若第一字符与第二字符相连的概率大于预设的第三数值,第二字符与第三字符相连的概率小于预设的第四数值,则第三字符为错别字;若第一字符与第二字符相连的概率小于预设的第三数值,第二字符与第三字符相连的概率小于预设的第四数值,则第二字符为错别字;若第一字符与第二字符相连的概率小于预设的第三数值,第二字符与第三字符相连的概率大于预设的第四数值,则第一字符为错别字。
B10、将错别字的拼音对应的多个字符分别与三字词语中非错别字的其他字符组成对应的词语,获取对应的词语的概率;从所获取的概率中查找最大值,用最大值所对应的词语替换存在错别字的三字词语。
具体的,若确认第一字符为错别字,将第一字符的拼音对应的多个字符与第二字符、第三字符顺序连接,形成三个字符的组合,获取该三个字符组成的词语的概率,确定概率最大值对应的三个字符的组合为正确的词语,用正确的词语替换上述存在错别字的三字词语。
本发明实施例三确定用户输入的字符形成三字词语,根据拼音输入法中预设的字与字之间的概率统计,检测三字词语中是否存在错别字,以实现对用户输入的词语中的错别字进行检测;进一步的,可以利用拼音输入法中预设的字与字之间的概率统计,确认三字词语中哪个字是错别字,并对该词语中的错别字进行纠正。
本发发明实施例三所提供的方法也适用于四个字符组成的四字词语的检测及错别字纠正,比如接收用户输入的四个字符,在进行词语中错别字确定时,根据第一字符与第二字符、第二字符与第三字符、第三字符与第四字符间连接的概率确定是哪个字符错误,将错别字的拼音对应的多个字符分别与输入的四个字符中非错别字的字符组成对应的词语,获取对应的词语的概率;从所获取的概率中查找最大值,用最大值所对应的词语替换所接收的四个字符,形成正确的词语。
实施例四:
参阅图3,本发明实施例四提供一种移动终端,包括:
接收单元301,用于接收用户输入的字符;
词语构成单元302,用于将所述用户输入的字符组成词语;
检测单元303,用于检测所述词语的概率是否小于预设数值;
确认单元304,用于根据检测结果确定所述词语中是否存在错别字。
为了在词语中存在错别字时,显示错别字提示信息以提醒用户,该移动终端还包括:第一显示单元305,用于当所述确认单元304确认词语中存在错别字时,显示错别字提示信息。
该移动终端还包括:词语类型确定单元306,用于根据所述用户输入的字符的拼音之间的关联标记确定词语类型。
当所述词语类型为两字词语类型,且词语中存在错别字时,所述词语包括:第一字符和第二字符;该移动终端还包括:第一纠正单元307,用于当所述确认单元确定所述词语中存在错别字时,将第一字符与第二字符的拼音对应的多个字符组成对应的词语;获取所述对应的词语的概率;从所获取的概率中查找最大值,用所述最大值所对应的词语替换存在错别字的所述词语。
或者,当所述词语类型为N字词语类型,且词语中存在错别字时,N>2,所述词语包括N个字符,该移动终端还包括:错别字确认单元308,用于当所述确认单元确定所述词语中存在错别字时,根据拼音输入法中预设的字与字之间的概率统计,在N大于或者等于3时,获取第i-1字符与第i字符相连的概率和第i字符与第i+1字符相连的概率,其中1<i<N;若第i-1字符与第i字符相连的概率大于预设的第三数值,第i字符与第i+1字符相连的概率小于预设的第四数值,确认第i+1字符为错别字;若第i-1字符与第i字符相连的概率小于预设的第三数值,第i字符与第i+1字符相连的概率小于预设的第四数值,确认第i字符为错别字;若第i-1字符与第i字符相连的概率小于预设的第三数值,第i字符与第i+1字符相连的概率大于预设的第四数值,确认第i-1字符为错别字;和,第二纠正单元309,用于将错别字的拼音对应的多个字符分别与所述词语中非错别字的字符组成对应的词语,获取所述对应的词语的概率;从所获取的概率中查找最大值,用所述最大值所对应的词语替换存在错别字的所述词语。
当所述词语类型为N字词语类型时,该移动终端还包括:判断单元310,用于根据所述词语类型对应的所述用户输入的字符的拼音,判断所述用户输入的字符是否能够组成词语;和,第二显示单元311,用于当所述判断单元310的判断结果为否时,显示输入错误;
词语构成单元302,用于当所述判断单元310的判断结果为是时,将所述用户输入的字符组成词语。
本发明实施例四所提供的移动终端中的检测单元303检测由用户输入的字符组成的词语的概率是否小于预设数值,确认单元304根据检测单元303的检测结果确定该词语中是否存在错别字,以实现对用户输入的词语中的错别字进行检测;进一步的,该移动终端可以利用拼音输入法中预设的字与字之间的概率统计,对词语中的错别字进行纠正。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,例如只读存储器,磁盘或光盘。
以上对本发明实施例所提供的错别字检测方法及移动终端进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。