CN105302336A - 一种输入纠错方法和装置 - Google Patents

一种输入纠错方法和装置 Download PDF

Info

Publication number
CN105302336A
CN105302336A CN201510728116.1A CN201510728116A CN105302336A CN 105302336 A CN105302336 A CN 105302336A CN 201510728116 A CN201510728116 A CN 201510728116A CN 105302336 A CN105302336 A CN 105302336A
Authority
CN
China
Prior art keywords
string
error correction
current input
input string
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510728116.1A
Other languages
English (en)
Other versions
CN105302336B (zh
Inventor
马尔胡甫·曼苏尔
汤沛
张扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201510728116.1A priority Critical patent/CN105302336B/zh
Publication of CN105302336A publication Critical patent/CN105302336A/zh
Application granted granted Critical
Publication of CN105302336B publication Critical patent/CN105302336B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供了一种输入纠错方法和装置,其中的方法具体包括:在输入过程中,将当前输入串替换为所述当前输入串对应的纠错串;将所述纠错串作为第一输入串,将在所述当前输入串之后输入的按键串作为第二输入串,对所述第一输入串和所述第二输入串进行拼接,并将拼接结果作为更新后的当前输入串;对所述更新后的当前输入串进行纠错处理。本发明实施例能够在不增加运算复杂度、及保证纠错效率的前提下,实现包含一处以上错误的输入串的纠错。

Description

一种输入纠错方法和装置
技术领域
本发明涉及计算机信息输入技术领域,特别是涉及一种输入纠错方法和一种输入纠错装置。
背景技术
对于中文、日文、韩文等用户而言,一般都需要通过输入法系统与计算机进行交互。例如,用户可以通过键盘键入输入串,然后由输入法系统依据其预置的标准映射规则将该输入串转换为相应语言的候选项并展示,进而将用户选择的候选项上屏。
在实际应用中,用户很有可能因为按错键(PC上)或者点错屏幕位置(移动设备上)等原因而导致键入错误的输入串。输入纠错,正是针对上述错误的一种输入法系统解决方案,它能够主动识别用户的输入错误,并将错误的输入串纠正成正确的输入串,使用户在不需要修改输入串的前提下就能够输入正确的文字。
现有的输入纠错方案,一般通过纠错模型尝试针对输入串构建纠错拼音网络,从而在纠错拼音网络中搜索得到合宜的纠错候选。然而,由于纠错拼音网络的数据量比较大,故无论是纠错拼音网络的构建,还是纠错候选的搜索,均需要耗费大量的运算量、且对处理器的性能具有较高的要求,而多点纠错需要构建复杂的拼音网络、且需要众多维数的搜索空间,故为了避免这些运算量影响到输入法系统的响应效率,现有的输入纠错方案仅仅能够支持单点纠错,而无法支持多点纠错。
上述单点纠错是指仅具备对包含一处错误的输入串的纠错能力,例如,当用户输入“woxaing”这样的输入串时,由于“woxaing”仅包含一处错误(即ia被错输为ai),故现有的输入纠错方案可以提供纠错候选“我想”。
上述多点纠错是指具备对包含一处以上错误的输入串的纠错能力。例如当用户输入“wodoucileyiduenfanel”时,现有的输入纠错方案只会进行一处纠错,得到最佳纠错串“wodoucileyidunfanel”,并且生成对应的候选“我都辞了一顿饭饿了”,而这一结果显然不是用户所需要的文字“我都吃了一顿饭了”;此种情况下,用户需要重新编辑上述输入串,修正其中的错误,才能得到所需要的文字,因此影响了输入效率。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种输入纠错方法和相应的一种输入纠错装置,能够在不增加运算复杂度、及保证纠错效率的前提下,实现包含一处以上错误的输入串的纠错。
为了解决上述问题,本发明实施例公开了一种输入纠错方法,包括:
在输入过程中,将当前输入串替换为所述当前输入串对应的纠错串;
将所述纠错串作为第一输入串,将在所述当前输入串之后输入的按键串作为第二输入串,对所述第一输入串和所述第二输入串进行拼接,并将拼接结果作为更新后的当前输入串;
对所述更新后的当前输入串进行纠错处理。
优选的,在所述将当前输入串替换为所述当前输入串对应的纠错串的步骤之前,所述方法还包括:在输入过程中,判断所述纠错串是否应替换所述当前输入串,以得到第一判断结果;
所述将当前输入串替换为所述当前输入串对应的纠错串的步骤,包括:在所述第一判断结果为是时,将所述当前输入串替换为所述纠错串。
优选的,所述判断所述纠错串是否应替换所述当前输入串的步骤,包括:
对所述当前输入串和所述纠错串进行第一分析,以得到相应的第一分析结果;
在所述第一分析结果符合预置的替换条件时,得到的第一判断结果为是。
优选的,所述对所述当前输入串和所述纠错串进行第一分析的步骤,包括:
分别计算所述当前输入串对应的第一得分、及所述纠错串对应的第二得分;
所述预置的替换条件包括:所述第二得分减去第一惩罚值的差值大于所述第一得分,其中,所述第一惩罚值为正数。
优选的,所述预置的替换条件包括:所述当前输入串和所述纠错串的编码匹配规则符合预置条件。
优选的,所述判断所述纠错串是否应替换所述当前输入串的步骤,包括:
确定所述当前输入串中相邻按键之间的时间间隔;
依据所述当前输入串中相邻按键之间的时间间隔,判断是否完成了整体输入串的输入;
在确定未完成整体输入串的输入时,确定所述纠错串不应替换所述当前输入串。
优选的,所述方法还包括:
在输入过程中,判断是否展现所述纠错串对应的纠错候选,以得到第二判断结果;
在所述第二判断结果为是时,展现所述纠错串对应的纠错候选。
优选的,所述判断是否展现所述纠错串对应的纠错候选的步骤,包括:
对所述当前输入串和所述纠错串进行第二分析,以得到相应的第二分析结果;
在所述第二分析结果符合预置的展现条件时,得到的第二判断结果为是。
优选的,所述对所述当前输入串和所述纠错串进行第二分析的步骤,包括:
分别计算所述当前输入串对应的第一得分、及所述纠错串对应的第二得分;
所述预置的展现条件包括:所述第二得分减去第二惩罚值的差值大于所述第一得分,其中,所述第二惩罚值为正数,所述第二惩罚值小于所述第一惩罚值。
优选的,所述第一得分为所述当前输入串对应首选的得分,所述第二得分为所述纠错串对应首选的得分。
另一方面,本发明实施例还公开了一种输入纠错装置,包括:
替换模块,用于在输入过程中,将当前输入串替换为所述当前输入串对应的纠错串;
拼接模块,用于将所述纠错串作为第一输入串,将在所述当前输入串之后输入的按键串作为第二输入串,对所述第一输入串和所述第二输入串进行拼接,并将拼接结果作为更新后的当前输入串;及
纠错模块,用于对所述更新后的当前输入串进行纠错处理。
优选的,所述装置还包括:
第一判断模块,用于在输入过程中,在所述替换模块将当前输入串替换为所述当前输入串对应的纠错串之前,判断所述纠错串是否应替换所述当前输入串,以得到第一判断结果;
所述替换模块,具体用于在所述第一判断结果为是时,将所述当前输入串替换为所述纠错串。
优选的,所述第一判断模块,包括:
第一分析子模块,用于对所述当前输入串和所述纠错串进行第一分析,以得到相应的第一分析结果;
第一判定子模块,用于在所述第一分析结果符合预置的替换条件时,得到的第一判断结果为是。
优选的,所述第一判断模块,包括:
确定子模块,用于确定所述当前输入串中相邻按键之间的时间间隔;
第二判定子模块,用于依据所述当前输入串中相邻按键之间的时间间隔,判断是否完成了整体输入串的输入;在确定未完成整体输入串的输入时,确定所述纠错串不应替换所述当前输入串。
优选的,所述装置还包括:
第二判断模块,用于在输入过程中,判断是否展现所述纠错串对应的纠错候选,以得到第二判断结果;
展现模块,用于在所述第二判断结果为是时,展现所述纠错串对应的纠错候选。
本发明实施例包括以下优点:
本发明实施例在输入过程中,将当前输入串替换为所述当前输入串对应的纠错串,并对上述纠错串和按键串拼接得到的、更新后的当前输入串进行纠错处理;由于对包含错误的当前输入串的替换相当于用户键入了正确的当前输入串(没有错误的当前输入串),因此,本发明实施例可以将多点纠错分解为多次的单点纠错,从而能够在不增加运算复杂度、及保证纠错效率的前提下,实现包含一处以上错误的输入串的纠错。
附图说明
图1是本发明的一种输入纠错方法实施例一的步骤流程图;
图2是本发明的一种输入纠错方法实施例二的步骤流程图;
图3是本发明的一种输入纠错方法实施例三的步骤流程图;
图4是本发明的一种输入纠错方法实施例四的步骤流程图;
图5是本发明的一种输入纠错方法实施例五的步骤流程图;及
图6是本发明的一种输入纠错装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
方法实施例一
参照图1,示出了本发明的一种输入纠错方法实施例一的步骤流程图,具体可以包括如下步骤:
步骤101、在输入过程中,将当前输入串替换为所述当前输入串对应的纠错串;
步骤102、将所述纠错串作为第一输入串,将在所述当前输入串之后输入的按键串作为第二输入串,对所述第一输入串和所述第二输入串进行拼接,并将拼接结果作为更新后的当前输入串;
步骤103、对所述更新后的当前输入串进行纠错处理。
本发明可以应用于各种输入方式的输入法系统,包括键盘符号、手写信息等输入方式,即用户可以通过编码字符串、手写输入信息等输入上屏内容。下面仅以编码字符串(以下简称输入串)的输入方式为例进行说明,其它输入方式相互参见即可。
在输入法系统领域,无论是中文、日文、韩文还是其它语言的输入法系统,都是把用户输入的编码字符串转换成相应语言的候选项,然后由用户来选择输出至应用程序的内容,这里通过上屏操作输出至应用程序的内容也即上屏内容。
本发明实施例在输入过程中,将当前输入串替换为所述当前输入串对应的纠错串,并对该纠错串和按键串拼接得到的、更新后的当前输入串进行纠错处理;由于对包含错误的当前输入串的替换相当于用户键入了正确的当前输入串(没有错误的当前输入串),因此,本发明实施例可以将多点纠错分解为多次的单点纠错,从而能够在不增加运算复杂度、及保证纠错效率的前提下,实现包含一处以上错误的输入串的纠错。
在本发明的一种应用示例1中,假设用户欲通过输入串“wodoucileyiduenfanel”输入目标文字“我都吃了一顿饭了”,则在输入过程中,每产生一次按键输入,本发明实施例都可以对当前输入串进行纠错处理:
1、关于第一处错误的纠正;
例如,可以对当前输入串“w”、“wo”、“wod”、“wodo”、“wodou”、“wodouc”、“wodouci”、“wodoucil”、“wodoucile”等进行纠错尝试,假设对当前输入串“wodoucile”进行纠错得到对应的纠错串“wodouchile”,则可以将当前输入串替换为对应的纠错串“wodouchile”;
对上述纠错串“wodouchile”和在所述当前输入串“wodoucile”之后输入的按键串进行拼接,以得到更新后的当前输入串,例如,在当前输入串“wodoucile”之后输入的“y”、“yi”、“yid”、“yidu”、“yidue”、“yiduenf”、“yiduenf”、“yiduenfa”、“yiduenfan”等按键串时,可以拼接得到“wodouchiley”、“wodouchileyi”、“wodouchileyid”、“wodouchileyidu”、“wodouchileyidue”、“wodouchileyiduen”、“wodouchileyiduenf”、“wodouchileyiduenfa”、“wodouchileyiduenfan”等更新后的当前输入串;
2、关于第二处错误的纠错;
可以对更新后的当前输入串进行纠错尝试,假设对当前输入串“wodouchileyiduenfan”进行纠错得到对应的纠错串“wodouchileyidunfan”,则可以将当前输入串替换为对应的纠错串“wodouchileyidunfan”;
对上述纠错串“wodouchileyidunfan”和在所述当前输入串“wodouchileyidunfan”之后输入的按键串进行拼接,以得到更新后的当前输入串,并对更新后的当前输入串进行纠错处理;
按照上述第一处错误和第二处错误的纠错处理流程,可以实现输入过程中的第三处错误、第四处错误等后续错误的纠错。
可以看出,本发明实施例可以在纠正完第一处错误后,继续对更新后的当前输入串进行纠错处理,以纠正第二处错误、第三处错误等多处错误,从而实现包含一处以上错误的输入串的纠错。
在本发明的一种实施例中,上述拼接可以包括:将在所述当前输入串之后输入的按键串拼接在替换后的当前输入串后面,如应用示例1中将当前输入串“wodoucile”后输入的按键串拼接在替换后的当前输入串“wodouchile”之后。可以理解,在本发明的其它实施例中,还可以根据上述按键串的实际位置对上述纠错串和对应的按键串进行拼接,本发明实施例对于具体的拼接过程不加以限制。
需要说明的是,本发明实施例在拼接完成后对所述更新后的当前输入串进行纠错处理,是为了在纠正完一处错误后继续对第二处错误、第三处错误等后续的错误进行纠错,由此实现包含一处以上错误的输入串的纠错。可以理解,本发明实施例在拼接完成后,如果用户通过上屏操作结束当次输入,则本发明实施例也可以不对所述更新后的当前输入串进行纠错处理。也即,在本发明的一种可选实施例中,在拼接完成后,可以等待用户的后续操作,看用户是继续输入还是选择候选上屏,如果后续操作为继续输入,则可以对所述更新后的当前输入串进行纠错处理;如果后续操作为选择候选上屏,则可以不对所述更新后的当前输入串进行纠错处理。
方法实施例二
参照图2,示出了本发明的一种输入纠错方法实施例二的步骤流程图,具体可以包括如下步骤:
步骤201、在输入过程中,判断所述纠错串是否应替换所述当前输入串,以得到第一判断结果;
步骤202、在所述第一判断结果为是时,将所述当前输入串替换为所述纠错串;
步骤203、将所述纠错串作为第一输入串,将在所述当前输入串之后输入的按键串作为第二输入串,对所述第一输入串和所述第二输入串进行拼接,并将拼接结果作为更新后的当前输入串;
步骤204、对所述更新后的当前输入串进行纠错处理。
相对于方法实施例一,本实施例增加了判断所述纠错串是否应替换所述当前输入串的步骤201,并在第一判断结果为是时,执行将所述当前输入串替换为所述纠错串的操作;上述判断能够提高替换行为的准确率,从而防止输入法系统因对用户的输入串进行错误替换而导致的、用户付出额外操作代价的问题(如用户重新对替换后的当前输入串进行编辑等)。
本发明实施例可以提供判断所述纠错串是否应替换所述当前输入串的如下技术方案:
技术方案一
技术方案一中,所述判断所述纠错串是否应替换所述当前输入串的步骤,具体可以包括:
步骤S11、对所述当前输入串和所述纠错串进行第一分析,以得到相应的第一分析结果;
步骤S12、在所述第一分析结果符合预置的替换条件时,得到的第一判断结果为是,即执行将所述当前输入串替换为所述纠错串。
对所述当前输入串和所述纠错串进行的第一分析,可用于比较当前输入串和纠错串的质量;则所述预置的替换条件可用于表示纠错串的质量优于当前输入串所对应的条件。
在实际应用中,本领域技术人员可以根据实际应用需求,采用质量特征来衡量当前输入串和纠错串的质量。例如,在本发明的一种可选实施例中,上述质量特征可以包括:上述当前输入串和上述纠错串对应的首选的质量特征,其中,首选也即一个输入串的首个候选,首选的质量特征具体可以包括词频、分类信息、级别或权重信息等特征,本发明实施例对于首选的具体质量特征不加以限制。又如,在本发明的另一种可选实施例中,上述质量特征还可以包括:上述当前输入串和上述纠错串对应的编码匹配规则,例如,全拼编码规则可以优于简拼编码规则。可以理解,本发明实施例对于具体的质量特征不加以限制。
在本发明的另一种可选实施例中,所述对所述当前输入串和所述纠错串进行第一分析的步骤S11,具体可以包括:S111、分别计算所述当前输入串对应的第一得分、及所述纠错串对应的第二得分;则所述预置的替换条件具体可以包括:所述第二得分减去第一惩罚值的差值大于所述第一得分,其中,所述第一惩罚值为正数。
在本发明的一种应用示例中,所述第一得分具体可以包括:所述当前输入串对应首选的得分,所述第二得分具体可以包括:所述纠错串对应首选的得分和/或纠错模型的得分。其中,上述首选的得分可以为依据首选的词频、分类信息、级别和权重信息中至少一种特征计算得到的得分,其可用于衡量首选的质量;纠错模型的得分具体可以包括:系统纠错模型得分和用户纠错模型得分中的至少一种,对于系统纠错模型得分和用户纠错模型得分中的任一,纠错模型的得分均可以用方法实施例四中纠错模型概率的得分和各纠错候选串对应候选的词频得分来衡量。可以理解,本发明实施例对于第一得分和第二得分的具体计算过程不加以限制。
第一惩罚值可以用于在保证输入纠错的准确率的情况下,控制第二得分超出第一得分的程度,通常,第一惩罚值越大,则当前输入串被替换的概率越小,第一惩罚值越小,则当前输入串被替换的概率越大。在实际应用中,可以通过模拟用户输入过程的试验,确定第一惩罚值,以尽可能地保证输入纠错的准确率。
在本发明的再一种可选实施例中,所述预置的替换条件具体可以包括:所述第二得分减去第一惩罚值的差值大于所述第一得分,以及,所述当前输入串和所述纠错串的编码匹配规则符合预置条件。其中,上述预置条件具体可以包括:当前输入串的编码匹配规则为全拼匹配规则,纠错串的编码匹配规则为全拼匹配规则;或者,当前输入串的编码匹配规则为简拼匹配规则,纠错串的编码匹配规则为全拼匹配规则;或者,当前输入串的编码匹配规则为简拼匹配规则,纠错串的编码匹配规则为简拼匹配规则,本发明实施例对于具体的预置条件不加以限制。
技术方案二
技术方案二中,所述判断所述纠错串是否应替换所述当前输入串的步骤,具体可以包括:
步骤S21、确定所述当前输入串中相邻按键之间的时间间隔;
步骤S22、依据所述当前输入串中相邻按键之间的时间间隔,判断是否完成了整体输入串的输入;
步骤S23、在确定未完成整体输入串的输入时,确定所述纠错串不应替换所述当前输入串,即得到的第一判断结果为否。
在实际应用中,在用户输入长词时,由于用户会下意识地按照每个字的读音进行分块输入,故每个字的输入串中相邻按键之间的间隔通常小于字与字之间相邻按键的间隔,例如,在用户输入“anzhuang”这个拼音串时,a和n之间的按键间隔要小于n和z之间的按键间隔,也即用户首先快速输入“an”,在稍作停顿(用户自己可能没有感知)后继续快速输入“zhuang”,因此,技术方案二可以依据当前输入串中相邻按键之间的时间间隔判断用户是否完成了整体输入串的输入,如果没有完成整体输入串的输入,则可以不进行当前输入串的替换,因此能够保证输入纠错的准确率,且能够提高判断所述纠错串是否应替换所述当前输入串的效率。例如,如果用户将上述的“anzhuang”错输成了“anzhaung”,则在输入“anz”到“anzhaung”之间的时间节点上,可以不进行当前输入串的替换,而是在完成“anzhaung”的输入后进行当前输入串的替换。
在本发明的一种可选实施例中,依据当前输入串中相邻按键之间的时间间隔判断用户是否完成了整体输入串的输入的过程具体可以包括:判断相邻按键的时间间隔小于间隔阈值的连续输入串的长度是否达到了该输入串的首个或多个字母组合打头的正常拼音串的最大长度,若是,则确定已完成输入,否则确定未完成输入。例如,上述”zhaung”已经达到了“zh”这个声母开始的拼音最大长度,故可判断已完成输入。
在本发明的另一种可选实施例中,依据当前输入串中相邻按键之间的时间间隔判断用户是否完成了整体输入串的输入的过程具体可以包括:在当前输入串中相邻按键之间的时间间隔大于或等于间隔阈值时,确定后一按键之前的输入串为整体输入串。例如,当用户在上述”zhaung”后继续输入“s”,即当前输入串变成“anzhaungs”时,此时“g”和‘s’之间的间隔超出了间隔阈值,可以判断“anzhaung”是个整体输入串。
需要说明的是,上述间隔阈值可用于表示字与字之间相邻按键的时间间隔,在实际应用中,可以对用户的输入行为进行分析,以得到上述间隔阈值,本发明实施例对于具体的间隔阈值不加以限制。可选地,在确定完成整体输入串的输入时,可以得到不确定的第一判断结果,此种情况下,可以采用技术方案一或者其它技术方案继续判断所述纠错串是否应替换所述当前输入串。
以上对判断所述纠错串是否应替换所述当前输入串的技术方案进行了详细介绍,可以理解,本领域技术人员可以根据实际应用需求,采用上述技术方案中的任一或者组合,例如,在采用二者的组合时,可以首先采用技术方案二判断所述纠错串是否应替换所述当前输入串;若技术方案二输出的第一判断结果为否,则可以确定所述纠错串不应替换所述当前输入串,若技术方案二输出不确定的第一判断结果,则可以继续采用技术方案一判断所述纠错串是否应替换所述当前输入串,本发明实施例对于判断所述纠错串是否应替换所述当前输入串的具体技术方案不加以限制。
方法实施例三
参照图3,示出了本发明的一种输入纠错方法实施例三的步骤流程图,具体可以包括如下步骤:
步骤301、在输入过程中,判断是否展现当前输入串对应纠错串对应的纠错候选,以得到第二判断结果;
上述判断使得在纠错候选的质量较优的情况下进行纠错候选的展现,能够防止质量不优的(如错误纠正引起的)候选进入候选列表且打扰正常的候选排序,从而能够提高输入法系统的候选质量。
步骤302、在所述第二判断结果为是时,展现所述纠错串对应的纠错候选;
步骤303、在输入过程中,将当前输入串替换为所述当前输入串对应的纠错串;
步骤304、将所述纠错串作为第一输入串,将在所述当前输入串之后输入的按键串作为第二输入串,对所述第一输入串和所述第二输入串进行拼接,并将拼接结果作为更新后的当前输入串;
步骤305、对所述更新后的当前输入串进行纠错处理。
相对于方法实施例一,本实施例通过步骤301-步骤302增加了展现当前输入串对应纠错串对应的纠错候选的判断过程、及展现当前输入串对应纠错串对应的纠错候选的过程;由于上述判断使得在纠错候选的质量较优的情况下进行纠错候选的展现,能够防止质量不优的(如错误纠正引起的)候选进入候选列表且打扰正常的候选排序,从而能够提高输入法系统的候选质量。
在本发明的一种可选实施例中,上述展现所述纠错串对应的纠错候选的过程可以为,将所述纠错串对应的纠错候选展现在首选。相应地,可以将所述纠错串对应的纠错候选加入候选队列的首个位置,再对候选队列进行展现。可以理解,上述展现在首选只是作为可选实施例,本发明实施例对于所述纠错串对应的纠错候选在候选中的具体位置不加以限制。
需要说明的是,步骤301可以先于步骤303执行,以实现纠错候选的展现门槛低于当前输入串的替换门槛。
在本发明的一种可选实施例中,上述判断是否展现当前输入串对应纠错串对应的纠错候选的步骤,具体可以包括:
步骤S31、对所述当前输入串和所述纠错串进行第二分析,以得到相应的第二分析结果;
步骤S32、在所述第二分析结果符合预置的展现条件时,得到的第二判断结果为是。
对所述当前输入串和所述纠错串进行的第二分析,可用于比较当前输入串和纠错串的质量;则所述预置的展现条件可用于表示纠错串的质量优于当前输入串所对应的条件。
在实际应用中,本领域技术人员可以根据实际应用需求,采用质量特征来衡量当前输入串和纠错串的质量,例如,在本发明的一种可选实施例中,上述质量特征可以包括:上述当前输入串和上述纠错串对应的首选的质量特征,其中,首选也是一个输入串的首个候选,首选的质量特征具体可以包括词频、分类信息、级别或权重信息等特征,本发明实施例对于首选的具体质量特征不加以限制。
在本发明的另一种可选实施例中,所述对所述当前输入串和所述纠错串进行第二分析的步骤S31,具体可以包括:S311、分别计算所述当前输入串对应的第一得分、及所述纠错串对应的第二得分;所述预置的展现条件具体可以包括:所述第二得分减去第二惩罚值的差值大于所述第一得分,其中,所述第二惩罚值为正数,所述第二惩罚值小于所述第一惩罚值。
本发明实施例中,第二惩罚值小于第一惩罚值,能够实现纠错候选的展现门槛低于当前输入串的替换门槛,这样,在没有把握进行当前输入串的替换,但又认为当前输入串存在疑似错误时,可以向用户展现相应的纠错候选,以方便用户上屏该纠错候选;同时,在比较有把握(符合预置的替换条件)时才进行当前输入串的替换,这样,能提高替换行为的准确性,从而防止输入法系统因对用户的输入串进行错误替换而导致的、用户付出额外操作代价的问题(如用户重新对替换后的当前输入串进行编辑等)。
在本发明的一种应用示例中,所述第一得分可以为所述当前输入串对应首选的得分,所述第二得分可以为所述纠错串对应首选的得分。其中,上述首选的得分可以为依据首选的词频、分类信息、级别和权重信息中至少一种特征计算得到的得分,其可用于衡量首选的质量。
第二惩罚值可以用于在保证输入纠错的准确率的情况下,控制第二得分超出第一得分的程度,通常,第二惩罚值越大,则纠错候选被展现的概率越小,第二惩罚值越小,则纠错候选被展现的概率越大。在实际应用中,可以通过模拟用户输入过程的试验,确定第二惩罚值,以尽可能地保证输入法系统的候选质量。
在本发明的再一种可选实施例中,所述预置的替换条件具体可以包括:所述第二得分减去第二惩罚值的差值大于所述第一得分,以及,所述当前输入串和所述纠错串的编码匹配规则符合预置条件。其中,上述预置条件具体可以包括:当前输入串的编码匹配规则为全拼匹配规则,纠错串的编码匹配规则为全拼匹配规则;或者,当前输入串的编码匹配规则为简拼匹配规则,纠错串的编码匹配规则为全拼匹配规则;或者,当前输入串的编码匹配规则为简拼匹配规则,纠错串的编码匹配规则为简拼匹配规则,本发明实施例对于具体的预置条件不加以限制。
上述判断是否展现当前输入串对应纠错串对应的纠错候选的方案只是作为可选方案,实际上,本领域技术人员可以根据实际应用需求,采用判断是否展现当前输入串对应纠错串对应的纠错候选的其它方案,例如,可以首先比较当前输入串和所述纠错串的质量,并在纠错串的质量优于当前输入串的质量时,得到的第二判断结果为是,本发明实施例对于判断是否展现当前输入串对应纠错串对应的纠错候选的具体方案不加以限制。
方法实施例四
参照图4,示出了本发明的一种输入纠错方法实施例四的步骤流程图,具体可以包括如下步骤:
步骤401、在输入过程中,将当前输入串替换为所述当前输入串对应的纠错串;
步骤402、将所述纠错串作为第一输入串,将在所述当前输入串之后输入的按键串作为第二输入串,对所述第一输入串和所述第二输入串进行拼接,并将拼接结果作为更新后的当前输入串;
步骤403、对所述更新后的当前输入串进行纠错处理;
其中,所述对所述更新后的当前输入串进行纠错处理的步骤403,具体可以包括:
步骤431、对所述更新后的当前输入串进行纠错,以得到对应的纠错串;或者
步骤432、对所述更新后的当前输入串进行纠错,以得到对应的纠错串,并将所述更新后的当前输入串和对应的纠错串输出至所述将当前输入串替换为所述当前输入串对应的纠错串的步骤401。
相对于方法实施例一,本实施例分别通过步骤431和步骤432描述了对所述更新后的当前输入串进行纠错处理的过程,其中,步骤431可以仅仅对更新后的当前输入串进行纠错,而不对更新后的当前输入串进行替换;步骤432除了对更新后的当前输入串进行纠错外,还可以对更新后的当前输入串进行替换,此种情况下,输入纠错方法是一种对步骤401-步骤402-步骤432进行循环执行的过程。
在本发明的一种可选实施例中,上述对所述更新后的当前输入串进行纠错,以得到对应的纠错串的步骤,具体可以包括:
步骤S41、对所述更新后的当前输入串的每个位置进行如下四种纠错尝试:插入一个字符、删除一个字符、替换一个字符和替换前后两个字符位置,以产生当前输入串对应的纠错候选串序列;
步骤S42、从所述纠错候选串序列中选择最佳的纠错候选串,作为所述当前输入串对应的纠错串。
在本发明的另一种可选实施例中,在从所述纠错候选串序列中选择最佳的纠错候选串的过程中,可以基于纠错模型概率的得分和/或各纠错候选串对应候选的词频得分。其中,纠错模型概率可用于表示纠错候选串被错输为当前输入串的概率,例如,当前输入串为“anzhaung”,纠错候选串为“anzhuang”,则上述纠错模型概率可用于表示“anzhuang”被错输成“anzhaung”的概率,在实际应用中,可以对用户的输入行为进行统计分析,以得到上述纠错模型概率;纠错候选串对应候选的词频得分通常为纠错候选串对应首选的词频得分。其中,在依据纠错模型概率的得分和各纠错候选串对应候选的词频得分,从所述纠错候选串序列中选择最佳的纠错候选串的过程中,可以对纠错模型概率的得分和各纠错候选串对应候选的词频得分进行加权运算,依据加权运算结果对所有的纠错候选串进行排序,并依据排序结果选择最佳的纠错候选串。
可以理解,上述对所述更新后的当前输入串进行纠错的方案只是作为可选方案,本发明实施例对于对所述更新后的当前输入串进行纠错的具体方案不加限制。
方法实施例五
参照图5,示出了本发明的一种输入纠错方法实施例五的步骤流程图,具体可以包括如下步骤:
步骤501、获取当前输入串;
步骤502、对当前输入串进行纠错,以得到对应的纠错串;
步骤503、判断是否展现当前输入串对应纠错串对应的纠错候选,若是,则执行步骤504,否则,返回步骤501;
步骤504、展现所述纠错串对应的纠错候选;
步骤505、判断所述纠错串是否应替换所述当前输入串,若是,则执行步骤506,否则,返回步骤501;
步骤506、将所述当前输入串替换为所述纠错串;
步骤507、将所述纠错串作为第一输入串,将在所述当前输入串之后输入的按键串作为第二输入串,对所述第一输入串和所述第二输入串进行拼接,并将拼接结果作为更新后的当前输入串输出至步骤501。
相对于方法实施例一,本实施例通过具体的输入过程来说明本发明实施例的输入纠错,其中,在未执行过替换操作的情况下,当前输入串可以为用户键入的输入串,在执行过替换操作的情况下,当前输入串可以为替换后的当前输入串和在所述当前输入串之后输入的按键串的拼接结果。
为使本领域技术人员更好地理解本发明实施例,以下通过具体的应用场景来说明本发明实施例的输入纠错过程。
应用场景1
应用场景1涉及在PC(个人计算机,PersonalComputer)上进行文字输入,用户的目标词条是“我都吃了一顿饭了”,其输入纠错过程具体可以包括:
步骤S51、输入法系统在PC上接收到输入串“wodoucile”;
步骤S52、输入法系统尝试进行纠错,得到纠错串“wodouchile”,纠错串“wodouchile”的纠错候选(也即首选)为“我都吃了”;
步骤S53、输入法系统判断是否展现“wodouchile”的纠错候选“我都吃了”;
步骤S54、经过判断,输入法系统将“我都吃了”作为纠错串对应的候选加入候选队列;
步骤S55、输入法系统判断是否需要使用“wodouchile”替换“wodoucile”;
步骤S56、输入法系统使用“wodouchile”替换“wodoucile”;
步骤S57、输入法系统等待用户的后续操作,看用户是继续输入还是选择候选上屏;
步骤S58、输入法系统接收到用户继续输入的按键串“yiduenfan”,并对“wodouchile”和“yiduenfan”进行拼接,得到拼接结果“wodouchileyiduenfan”;
步骤S59、输入法系统尝试对“wodouchileyiduenfan”进行纠错,得到纠错串“wodouchileyidunfan”,“wodouchileyidunfan”的纠错候选为“我都吃了一顿饭”;
步骤S510、输入法系统判断是否展现“wodouchileyidunfan”的纠错候选“我都吃了一顿饭”;
步骤S511、经过判断,输入法系统将“我都吃了一顿饭”作为纠错串对应的候选加入候选队列;
步骤S512、输入法系统判断是否需要使用“wodouchileyidunfan”替换“wodouchileyiduenfan”;
步骤S513、输入法系统使用“wodouchileyidunfan”替换“wodouchileyiduenfan”;
步骤S514、输入法系统等待用户的后续操作,看用户是继续输入还是选择候选上屏;
步骤S515、输入法系统接收到用户继续输入的按键串“el”,并对“wodouchileyidunfan”和“el”进行拼接,得到拼接结果“wodouchileyidunfanel”;
步骤S516、输入法系统尝试对“wodouchileyidunfanel”进行纠错,得到纠错串“wodouchileyidunfanle”,“wodouchileyidunfanle”的纠错候选为“我都吃了一顿饭了”;
步骤S517、输入法系统判断是否展现“wodouchileyidunfanle”的纠错候选“我都吃了一顿饭了”;
步骤S518、经过判断,输入法系统将“我都吃了一顿饭了”作为纠错串对应的候选加入候选队列;
步骤S519、输入法系统判断是否需要使用“wodouchileyidunfanle”替换“wodouchileyiduenfanel”;
步骤S520、输入法系统使用“wodouchileyidunfanle”替换“wodouchileyiduenfanel”;
步骤S521、输入法系统等待用户的后续操作,看用户是继续输入还是选择候选上屏;
步骤S522、输入法系统接收用户对于“我都吃了一顿饭了”的选择操作,将“我都吃了一顿饭了”上屏,由此完成了本次输入到上屏的全过程。
应用场景2
应用场景2涉及在手机的九宫格键盘上进行文字输入,用户的目标词条是“我都吃了一顿饭了”,其输入纠错过程具体可以包括:
步骤S61、输入法系统在九宫格键盘上接收到输入串“963682453”,并将其解析为拼音串“963682453(wodoucile)”;
步骤S62、输入法系统尝试进行纠错,得到纠错串“9636824453(wodouchile)”,纠错串“9636824453(wodouchile)”的纠错候选(也即首选)为“我都吃了”;
步骤S63、输入法系统判断是否展现“9636824453(wodouchile)”的纠错候选“我都吃了”;
步骤S64、经过判断,输入法系统将“我都吃了”作为纠错串对应的候选加入候选队列;
步骤S65、输入法系统判断是否需要使用“9636824453(wodouchile)”替换“963682453(wodoucile)”;
步骤S66、输入法系统使用“9636824453(wodouchile)”替换“963682453(wodoucile)”;
步骤S67、输入法系统等待用户的后续操作,看用户是继续输入还是选择候选上屏;
步骤S68、输入法系统接收到用户继续输入的按键串“963682453”,并对“9636824453”和“963682453”进行拼接,得到拼接结果“9636824453943836326(wodouchileyiduenfan)”;
步骤S69、输入法系统尝试对“9636824453943836326(wodouchileyiduenfan)”进行纠错,得到纠错串“963682445394386326(wodouchileyidunfan)”,“963682445394386326(wodouchileyidunfan)”的纠错候选为“我都吃了一顿饭”;
步骤S610、输入法系统判断是否展现“963682445394386326(wodouchileyidunfan)”的纠错候选“我都吃了一顿饭”;
步骤S611、经过判断,输入法系统将“我都吃了一顿饭”作为纠错串对应的候选加入候选队列;
步骤S612、输入法系统判断是否需要使用“963682445394386326(wodouchileyidunfan)”替换“9636824453943836326(wodouchileyiduenfan)”;
步骤S613、输入法系统使用“963682445394386326(wodouchileyidunfan)”替换“9636824453943836326(wodouchileyiduenfan)”;
步骤S614、输入法系统等待用户的后续操作,看用户是继续输入还是选择候选上屏;
步骤S615、输入法系统接收到用户继续输入的按键串“35”,并对“963682445394386326(wodouchileyidunfan)”和“35(el)”进行拼接,得到拼接结果“96368244539438632635(wodouchileyidunfanel)”;
步骤S616、输入法系统尝试对“96368244539438632635(wodouchileyidunfanel)”进行纠错,得到纠错串“96368244539438632653(wodouchileyidunfanle)”,“96368244539438632653(wodouchileyidunfanle)”的纠错候选为“我都吃了一顿饭了”;
步骤S617、输入法系统判断是否展现“96368244539438632653(wodouchileyidunfanle)”的纠错候选“我都吃了一顿饭了”;
步骤S618、经过判断,输入法系统将“我都吃了一顿饭了”作为纠错串对应的候选加入候选队列;
步骤S619、输入法系统判断是否需要使用“96368244539438632653(wodouchileyidunfanle)”替换“96368244539438632635(wodouchileyidunfanel)”;
步骤S620、输入法系统使用“96368244539438632653(wodouchileyidunfanle)”替换“96368244539438632635(wodouchileyidunfanel)”;
步骤S621、输入法系统等待用户的后续操作,看用户是继续输入还是选择候选上屏;
步骤S622、输入法系统接收用户对于“我都吃了一顿饭了”的选择操作,将“我都吃了一顿饭了”上屏,由此完成了本次输入到上屏的全过程。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
装置实施例
参照图6,示出了本发明的一种输入纠错装置实施例的结构框图,具体可以包括如下模块:
替换模块601,用于在输入过程中,将当前输入串替换为所述当前输入串对应的纠错串;
拼接模块602,用于将所述纠错串作为第一输入串,将在所述当前输入串之后输入的按键串作为第二输入串,对所述第一输入串和所述第二输入串进行拼接,并将拼接结果作为更新后的当前输入串;及
纠错模块603,用于对所述更新后的当前输入串进行纠错处理。
在本发明的一种可选实施例中,所述装置还可以包括:
第一判断模块,用于在输入过程中,在所述替换模块将当前输入串替换为所述当前输入串对应的纠错串之前,判断所述纠错串是否应替换所述当前输入串,以得到第一判断结果;
则所述替换模块601,具体用于在所述第一判断结果为是时,将所述当前输入串替换为所述纠错串。
在本发明的另一种可选实施例中,所述第一判断模块,具体可以包括:
第一分析子模块,用于对所述当前输入串和所述纠错串进行第一分析,以得到相应的第一分析结果;
第一判定子模块,用于在所述第一分析结果符合预置的替换条件时,得到的第一判断结果为是。
在本发明的再一种可选实施例中,所述第一分析子模块,具体可以包括:
第一计算单元,用于分别计算所述当前输入串对应的第一得分、及所述纠错串对应的第二得分;
所述预置的替换条件具体可以包括:所述第二得分减去第一惩罚值的差值大于所述第一得分,其中,所述第一惩罚值可以为正数。
在本发明的又一种可选实施例中,所述预置的替换条件还可以包括:所述当前输入串和所述纠错串的编码匹配规则符合预置条件。
在本发明的一种可选实施例中,所述第一得分可以为所述当前输入串对应首选的得分,所述第二得分可以为所述纠错串对应首选的得分。
在本发明的另一种可选实施例中,所述第一判断模块,具体可以包括:
确定子模块,用于确定所述当前输入串中相邻按键之间的时间间隔;
第二判定子模块,用于依据所述当前输入串中相邻按键之间的时间间隔,判断是否完成了整体输入串的输入;在确定未完成整体输入串的输入时,确定所述纠错串不应替换所述当前输入串。
在本发明的再一种可选实施例中,所述装置还可以包括:
第二判断模块,用于在输入过程中,判断是否展现所述纠错串对应的纠错候选,以得到第二判断结果;
展现模块,用于在所述第二判断结果为是时,展现所述纠错串对应的纠错候选。
在本发明的又一种可选实施例中,所述第二判断模块,具体可以包括:
第二分析子模块,用于对所述当前输入串和所述纠错串进行第二分析,以得到相应的第二分析结果;
第三判定子模块,用于在所述第二分析结果符合预置的展现条件时,得到的第二判断结果为是。
在本发明的一种可选实施例中,所述第二分析子模块,具体可以包括:
第二计算单元,用于分别计算所述当前输入串对应的第一得分、及所述纠错串对应的第二得分;
所述预置的展现条件具体可以包括:所述第二得分减去第二惩罚值的差值大于所述第一得分,其中,所述第二惩罚值可以为正数,所述第二惩罚值可以小于所述第一惩罚值。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
在一个典型的配置中,所述计算机设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非持续性的电脑可读媒体(transitorymedia),如调制的数据信号和载波。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种输入纠错方法和一种输入纠错装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (15)

1.一种输入纠错方法,其特征在于,包括:
在输入过程中,将当前输入串替换为所述当前输入串对应的纠错串;
将所述纠错串作为第一输入串,将在所述当前输入串之后输入的按键串作为第二输入串,对所述第一输入串和所述第二输入串进行拼接,并将拼接结果作为更新后的当前输入串;
对所述更新后的当前输入串进行纠错处理。
2.根据权利要求1所述的方法,其特征在于,在所述将当前输入串替换为所述当前输入串对应的纠错串的步骤之前,所述方法还包括:在输入过程中,判断所述纠错串是否应替换所述当前输入串,以得到第一判断结果;
所述将当前输入串替换为所述当前输入串对应的纠错串的步骤,包括:在所述第一判断结果为是时,将所述当前输入串替换为所述纠错串。
3.根据权利要求2所述的方法,其特征在于,所述判断所述纠错串是否应替换所述当前输入串的步骤,包括:
对所述当前输入串和所述纠错串进行第一分析,以得到相应的第一分析结果;
在所述第一分析结果符合预置的替换条件时,得到的第一判断结果为是。
4.根据权利要求3所述的方法,其特征在于,所述对所述当前输入串和所述纠错串进行第一分析的步骤,包括:
分别计算所述当前输入串对应的第一得分、及所述纠错串对应的第二得分;
所述预置的替换条件包括:所述第二得分减去第一惩罚值的差值大于所述第一得分,其中,所述第一惩罚值为正数。
5.根据权利要求3所述的方法,其特征在于,所述预置的替换条件包括:所述当前输入串和所述纠错串的编码匹配规则符合预置条件。
6.根据权利要求2所述的方法,其特征在于,所述判断所述纠错串是否应替换所述当前输入串的步骤,包括:
确定所述当前输入串中相邻按键之间的时间间隔;
依据所述当前输入串中相邻按键之间的时间间隔,判断是否完成了整体输入串的输入;
在确定未完成整体输入串的输入时,确定所述纠错串不应替换所述当前输入串。
7.根据权利要求1至6中任一所述的方法,其特征在于,所述方法还包括:
在输入过程中,判断是否展现所述纠错串对应的纠错候选,以得到第二判断结果;
在所述第二判断结果为是时,展现所述纠错串对应的纠错候选。
8.根据权利要求7所述的方法,其特征在于,所述判断是否展现所述纠错串对应的纠错候选的步骤,包括:
对所述当前输入串和所述纠错串进行第二分析,以得到相应的第二分析结果;
在所述第二分析结果符合预置的展现条件时,得到的第二判断结果为是。
9.根据权利要求8所述的方法,其特征在于,所述对所述当前输入串和所述纠错串进行第二分析的步骤,包括:
分别计算所述当前输入串对应的第一得分、及所述纠错串对应的第二得分;
所述预置的展现条件包括:所述第二得分减去第二惩罚值的差值大于所述第一得分,其中,所述第二惩罚值为正数,所述第二惩罚值小于所述第一惩罚值。
10.根据权利要求4或9所述的方法,其特征在于,所述第一得分为所述当前输入串对应首选的得分,所述第二得分为所述纠错串对应首选的得分。
11.一种输入纠错装置,其特征在于,包括:
替换模块,用于在输入过程中,将当前输入串替换为所述当前输入串对应的纠错串;
拼接模块,用于将所述纠错串作为第一输入串,将在所述当前输入串之后输入的按键串作为第二输入串,对所述第一输入串和所述第二输入串进行拼接,并将拼接结果作为更新后的当前输入串;及
纠错模块,用于对所述更新后的当前输入串进行纠错处理。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
第一判断模块,用于在输入过程中,在所述替换模块将当前输入串替换为所述当前输入串对应的纠错串之前,判断所述纠错串是否应替换所述当前输入串,以得到第一判断结果;
所述替换模块,具体用于在所述第一判断结果为是时,将所述当前输入串替换为所述纠错串。
13.根据权利要求12所述的装置,其特征在于,所述第一判断模块,包括:
第一分析子模块,用于对所述当前输入串和所述纠错串进行第一分析,以得到相应的第一分析结果;
第一判定子模块,用于在所述第一分析结果符合预置的替换条件时,得到的第一判断结果为是。
14.根据权利要求12所述的装置,其特征在于,所述第一判断模块,包括:
确定子模块,用于确定所述当前输入串中相邻按键之间的时间间隔;
第二判定子模块,用于依据所述当前输入串中相邻按键之间的时间间隔,判断是否完成了整体输入串的输入;在确定未完成整体输入串的输入时,确定所述纠错串不应替换所述当前输入串。
15.根据权利要求11至14中任一所述的装置,其特征在于,所述装置还包括:
第二判断模块,用于在输入过程中,判断是否展现所述纠错串对应的纠错候选,以得到第二判断结果;
展现模块,用于在所述第二判断结果为是时,展现所述纠错串对应的纠错候选。
CN201510728116.1A 2015-10-30 2015-10-30 一种输入纠错方法和装置 Active CN105302336B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510728116.1A CN105302336B (zh) 2015-10-30 2015-10-30 一种输入纠错方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510728116.1A CN105302336B (zh) 2015-10-30 2015-10-30 一种输入纠错方法和装置

Publications (2)

Publication Number Publication Date
CN105302336A true CN105302336A (zh) 2016-02-03
CN105302336B CN105302336B (zh) 2019-01-18

Family

ID=55199687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510728116.1A Active CN105302336B (zh) 2015-10-30 2015-10-30 一种输入纠错方法和装置

Country Status (1)

Country Link
CN (1) CN105302336B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977089A (zh) * 2016-10-21 2018-05-01 北京搜狗科技发展有限公司 一种输入方法和装置、一种用于输入的装置
CN110069143A (zh) * 2018-01-22 2019-07-30 北京搜狗科技发展有限公司 一种信息防误纠方法、装置和电子设备
CN110389666A (zh) * 2018-04-16 2019-10-29 北京搜狗科技发展有限公司 一种输入纠错方法和装置
CN113435185A (zh) * 2020-03-23 2021-09-24 北京搜狗科技发展有限公司 输入纠错方法、装置和用于输入纠错的装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030014449A1 (en) * 2001-06-29 2003-01-16 Evalley Inc. Character input system and communication terminal
CN1556458A (zh) * 2004-01-05 2004-12-22 郑 方 一种中文整句输入法
CN1928860A (zh) * 2005-09-05 2007-03-14 日电(中国)有限公司 用于校正按键错误的方法、搜索引擎和搜索系统
CN101661331A (zh) * 2008-08-28 2010-03-03 北京搜狗科技发展有限公司 一种字词输入的方法和输入法系统
WO2010084973A1 (ja) * 2009-01-20 2010-07-29 日本電気株式会社 入力装置、情報処理装置、入力方法およびプログラム
CN102156551A (zh) * 2011-03-30 2011-08-17 北京搜狗科技发展有限公司 一种字词输入的纠错方法及系统
CN103699233A (zh) * 2013-12-20 2014-04-02 百度在线网络技术(北京)有限公司 字符串输入方法和输入装置
US20140104182A1 (en) * 2012-01-20 2014-04-17 International Business Machines Corporation Method for character correction

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030014449A1 (en) * 2001-06-29 2003-01-16 Evalley Inc. Character input system and communication terminal
CN1556458A (zh) * 2004-01-05 2004-12-22 郑 方 一种中文整句输入法
CN1928860A (zh) * 2005-09-05 2007-03-14 日电(中国)有限公司 用于校正按键错误的方法、搜索引擎和搜索系统
CN101661331A (zh) * 2008-08-28 2010-03-03 北京搜狗科技发展有限公司 一种字词输入的方法和输入法系统
WO2010084973A1 (ja) * 2009-01-20 2010-07-29 日本電気株式会社 入力装置、情報処理装置、入力方法およびプログラム
CN102156551A (zh) * 2011-03-30 2011-08-17 北京搜狗科技发展有限公司 一种字词输入的纠错方法及系统
US20140104182A1 (en) * 2012-01-20 2014-04-17 International Business Machines Corporation Method for character correction
CN103699233A (zh) * 2013-12-20 2014-04-02 百度在线网络技术(北京)有限公司 字符串输入方法和输入装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977089A (zh) * 2016-10-21 2018-05-01 北京搜狗科技发展有限公司 一种输入方法和装置、一种用于输入的装置
CN107977089B (zh) * 2016-10-21 2021-12-14 北京搜狗科技发展有限公司 一种输入方法和装置、一种用于输入的装置
CN110069143A (zh) * 2018-01-22 2019-07-30 北京搜狗科技发展有限公司 一种信息防误纠方法、装置和电子设备
CN110069143B (zh) * 2018-01-22 2024-06-07 北京搜狗科技发展有限公司 一种信息防误纠方法、装置和电子设备
CN110389666A (zh) * 2018-04-16 2019-10-29 北京搜狗科技发展有限公司 一种输入纠错方法和装置
CN113435185A (zh) * 2020-03-23 2021-09-24 北京搜狗科技发展有限公司 输入纠错方法、装置和用于输入纠错的装置

Also Published As

Publication number Publication date
CN105302336B (zh) 2019-01-18

Similar Documents

Publication Publication Date Title
US11157698B2 (en) Method of training a descriptive text generating model, and method and apparatus for generating descriptive text
CN111737411A (zh) 人机对话中的响应方法、对话系统及存储介质
CN110852106B (zh) 基于人工智能的命名实体处理方法、装置及电子设备
EP4131076A1 (en) Serialized data processing method and device, and text processing method and device
US20220083772A1 (en) Identifying matching fonts utilizing deep learning
CN105302336A (zh) 一种输入纠错方法和装置
CN112084752B (zh) 基于自然语言的语句标注方法、装置、设备及存储介质
CN113901836B (zh) 基于上下文语义的词义消歧方法、装置及相关设备
CN111382572A (zh) 一种命名实体识别方法、装置、设备以及介质
CN118114771B (zh) 可信执行环境中的函数工具调用方法及装置、介质、设备
CN107967304A (zh) 会话交互处理方法、装置及电子设备
KR102209076B1 (ko) 가상 키보드 오타 보정을 위한 방법과 시스템 및 비-일시적인 컴퓨터 판독가능한 기록 매체
CN117332823B (zh) 目标内容自动生成方法、装置、电子设备及可读存储介质
CN112799658B (zh) 模型训练方法、模型训练平台、电子设备和存储介质
CN114330704A (zh) 语句生成模型更新方法、装置、计算机设备和存储介质
CN117349424A (zh) 应用于语言模型的提示模板的处理方法、装置及电子设备
CN117540915A (zh) 基于大数据技术的选型方案生成方法、装置、设备和介质
CN115600601B (zh) 一种税法知识库构建方法、装置、设备及介质
CN116187353A (zh) 翻译方法、装置、计算机设备及其存储介质
CN108595395B (zh) 一种昵称的生成方法、装置及设备
CN114580399A (zh) 文本纠错方法、装置、电子设备及存储介质
CN112612979A (zh) 基于云计算和人工智能的页面服务处理方法及区块链中心
CN111919199A (zh) 用于应用导航的神经网络系统和方法
US12106062B2 (en) Method and apparatus for generating a text, and storage medium
CN112966085B (zh) 人机会话智能控制方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant