CN108182001B - 输入纠错方法及装置、存储介质、电子设备 - Google Patents

输入纠错方法及装置、存储介质、电子设备 Download PDF

Info

Publication number
CN108182001B
CN108182001B CN201711463345.0A CN201711463345A CN108182001B CN 108182001 B CN108182001 B CN 108182001B CN 201711463345 A CN201711463345 A CN 201711463345A CN 108182001 B CN108182001 B CN 108182001B
Authority
CN
China
Prior art keywords
key
error correction
character
standby
keys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711463345.0A
Other languages
English (en)
Other versions
CN108182001A (zh
Inventor
王磊
王晔晗
高洋
王博
周浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201711463345.0A priority Critical patent/CN108182001B/zh
Publication of CN108182001A publication Critical patent/CN108182001A/zh
Application granted granted Critical
Publication of CN108182001B publication Critical patent/CN108182001B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0234Character input methods using switches operable in different directions

Abstract

本公开提供一种输入纠错方法及装置、存储介质、电子设备。所述方法包括:获取用户输入字符串时的按键信息,按键信息包括用户输入每个字符时所按键盘的位置坐标;根据按键信息确定出每个字符对应的待用按键,待用按键的中心坐标与位置坐标之间的距离Dij≤D0;利用Dij计算待用按键的按键评分值;基于字符对应的待用按键,对字符串进行切分处理,获得至少一条切分路径及各切分路径的路径评分值,路径评分值由切分路径的原始评分值及切分路径包括的待用按键的按键评分值计算得到;按照路径评分值高低对切分路径排序,利用语言模型依序对各切分路径解码,将语言模型输出分值最高的N个解码结果,确定为纠错后的候选结果。如此方案,有助于提高输入纠错的准确性。

Description

输入纠错方法及装置、存储介质、电子设备
技术领域
本公开涉及输入法技术领域,具体地,涉及一种输入纠错方法及装置、存储介质、电子设备。
背景技术
随着信息技术的不断发展,各式各样的智能终端在人们的生活工作中日益普及。输入法作为用户与智能终端的交互入口,其自然方便、高效、高准确性等特点一直是用户所追求的。按键输入作为现今输入法中最重要的输入方式之一,其性能的提高一直是相关领域研发人员研究的热点。
对于虚拟键盘来说,受限于智能终端的屏幕大小,很容易出现误输入情况,需要进行输入纠错。目前,大多基于临近键位的方式进行纠错,以虚拟26键键盘为例,键盘相对于手机屏幕来说,位置是固定的,可以将手机屏幕的左下角确定为坐标原点,这样,每个按键的中心像素点坐标就是固定的,且每个按键占据的像素区域也是固定的。
在开启纠错功能时,可以获取用户所按位置的坐标,该位置坐标附近的按键均有一定的概率被映射,即均有可能是用户真实想输入的按键,通常,位置坐标所属像素区域对应的按键,被映射的概率相对较大,可以将此按键确定为原始按键;可能以一定概率被映射的其他按键确定为纠错按键。其中,纠错按键被映射的概率,主要是基于按键之间的相对位置确定出的固定值,例如,位于原始按键左侧或右侧的按键,容易被误输入,这种位置的按键的映射概率可以设置的较大一些,原始按键周边其他位置的按键的映射概率可以设置的较小一些。
现有的纠错方案,在利用原始按键和纠错按键构造音节切分路径时,原始按键构造的路径具有较高优先级,纠错按键构造的路径具有较低优先级,若原始按键确定错误,即,确定出的原始按键并非用户真实想输入的按键,则可能在音节切分过程中,导致含有用户真实想输入按键的路径被淘汰掉,致使最终切分和解码结果与用户实际期望出现较大偏差。纠错准确性较低,用户还需要进行回删操作,用户体验较差。
发明内容
本公开的主要目的是提供一种输入纠错方法及装置、存储介质、电子设备,有助于提高输入纠错的准确性,提高用户体验。
为了实现上述目的,本公开提供一种输入纠错方法,所述方法包括:
获取用户输入字符串时的按键信息,所述按键信息包括用户输入每个字符时所按键盘的位置坐标;
根据所述按键信息,确定出每个字符对应的待用按键,所述待用按键的中心坐标与该字符对应的位置坐标之间的距离Dij≤D0,Dij为第i个字符对应的第j个待用按键的中心坐标与第i个字符对应的位置坐标之间的距离,D0为相邻按键之间的中心坐标距离;
利用所述距离Dij,计算每个待用按键的按键评分值;
基于每个字符对应的待用按键,对所述字符串进行切分处理,获得至少一条切分路径以及各切分路径的路径评分值,所述路径评分值由所述切分路径的原始评分值以及所述切分路径包括的待用按键的按键评分值进行数学运算后得到;
按照路径评分值高低对所述切分路径排序,并利用预设语言模型,依序对各切分路径进行解码,将所述语言模型输出分值最高的N个解码结果,确定为纠错后的候选结果。
可选地,所述根据所述按键信息,确定出每个字符对应的待用按键,包括:
基于字符对应的位置坐标所属像素区域,确定出字符对应的原始按键;
根据按键分布位置,从所述原始按键的周边按键中确定出字符对应的纠错按键,所述纠错按键的中心坐标与所述位置坐标之间的距离不大于D0
将所述原始按键和所述纠错按键确定为字符对应的待用按键。
可选地,所述按键信息还包括用户输入所述字符串时相邻两个字符之间的按键间隔时间,所述方法还包括:
基于所述按键间隔时间,确定各字符的按键类型;
根据所述按键类型,确定各字符对应的待用按键的纠错系数,所述纠错系数用于调整各字符对应的待用按键的按键评分值。
可选地,如果预设有第一时间阈值T1和第二时间阈值T2,则所述基于所述按键间隔时间,确定各字符的按键类型,包括:
如果第(i-1)个字符与第i个字符之间的按键间隔时间T满足:T≥T1,则第i个字符的按键类型为间隔按键;
如果第(i-1)个字符与第i个字符之间的按键间隔时间T满足:T2<T<T1,则第i个字符的按键类型为待定按键;
如果第(i-1)个字符与第i个字符之间的按键间隔时间T满足:T≤T2,则第i个字符的按键类型为内结按键。
可选地,所述方法还包括:
所述字符串的首字符的按键类型为所述间隔按键或者所述待定按键。
可选地,如果所述待用按键包括原始按键和纠错按键,则所述根据所述按键类型,确定各字符对应的待用按键的纠错系数,包括:
如果所述按键类型为间隔按键,则所述待用按键中的原始按键的纠错系数K1为:0<K1<1,所述待用按键中的纠错按键的纠错系数K2为:1<K2<2;
如果所述按键类型为内结按键,则所述待用按键中的原始按键的纠错系数K1为:2≤K1≤10,所述待用按键中的纠错按键的纠错系数K2为:0.5<K2<1;
如果所述按键类型为待定按键,则所述待用按键中的原始按键的纠错系数K1=1,所述待用按键中的纠错按键的纠错系数K2=1。
可选地,如果所述待用按键包括原始按键和纠错按键,则利用所述纠错系数调整各字符对应的待用按键的按键评分值的方式为:
所述待用按键为纠错按键,且所述纠错按键位于所述原始按键的正左或者正右,所述纠错按键的调整后按键评分值Sˊ=K2*P1*Cx+S,1≤P1≤10;
所述待用按键为纠错按键,且所述纠错按键位于所述原始按键的正上或者正下,所述纠错按键的调整后按键评分值Sˊ=K2*P2*Cy+S,2≤P2≤20;
所述待用按键为纠错按键,且所述纠错按键位于所述原始按键的斜上方或者斜下方,所述纠错按键的调整后按键评分值Sˊ=K2*P3*(Cx+Cy)+S,1≤P3≤20;
所述待用按键为原始按键,所述原始按键的调整后按键评分值Sˊ=K1*P4+S,0.5≤P4≤10;
其中,Cx为所述位置坐标的X方向坐标值,Cy为所述位置坐标的Y方向坐标值,S为所述待用按键的按键评分值,K1为所述待用按键中的原始按键的纠错系数,K2为所述待用按键中的纠错按键的纠错系数。
可选地,所述方法还包括:
在判定用户输入所述字符串的行为满足以下条件中的至少一项时,开启输入纠错功能:
若所述字符串中属于同一音节的相邻两个字符之间的按键间隔时间小于第三时间阈值,和/或,所述字符串中属于不同音节的相邻两个字符之间的按键间隔时间小于第四时间阈值,则判定用户输入所述字符串的行为满足输入速度过快的条件;
统计用户输入的总条数Zall、执行删除操作的总条数St、执行回删操作的条数Zdel,若St>α*Zdel且Zdel>β*Zall,α>1,1>β>0.05,则判定用户输入所述字符串的行为满足输入准确度低的条件,所述删除操作包括输入过多执行的删减操作以及输入错误执行的回删操作。
可选地,所述方法还包括:
向用户展示所述候选结果,若用户进行回删操作,则获取用户重新输入的修正后字符串,利用所述修正后字符串进行输入纠错更新。
本公开提供一种输入纠错装置,所述装置包括:
按键信息获取模块,用于获取用户输入字符串时的按键信息,所述按键信息包括用户输入每个字符时所按键盘的位置坐标;
待用按键确定模块,用于根据所述按键信息,确定出每个字符对应的待用按键,所述待用按键的中心坐标与该字符对应的位置坐标之间的距离Dij≤D0,Dij为第i个字符对应的第j个待用按键的中心坐标与第i个字符对应的位置坐标之间的距离,D0为相邻按键之间的中心坐标距离;
按键评分值计算模块,用于利用所述距离Dij,计算每个待用按键的按键评分值;
切分处理模块,用于基于每个字符对应的待用按键,对所述字符串进行切分处理,获得至少一条切分路径以及各切分路径的路径评分值,所述路径评分值由所述切分路径的原始评分值以及所述切分路径包括的待用按键的按键评分值进行数学运算后得到;
切分路径解码模块,用于按照路径评分值高低对所述切分路径排序,并利用预设语言模型,依序对各切分路径进行解码,将所述语言模型输出分值最高的N个解码结果,确定为纠错后的候选结果。
可选地,所述待用按键确定模块,用于基于字符对应的位置坐标所属像素区域,确定出字符对应的原始按键;根据按键分布位置,从所述原始按键的周边按键中确定出字符对应的纠错按键,所述纠错按键的中心坐标与所述位置坐标之间的距离不大于D0;将所述原始按键和所述纠错按键确定为字符对应的待用按键。
可选地,所述按键信息还包括用户输入所述字符串时相邻两个字符之间的按键间隔时间,所述装置还包括:
按键类型确定模块,用于基于所述按键间隔时间,确定各字符的按键类型;
纠错系数确定模块,用于根据所述按键类型,确定各字符对应的待用按键的纠错系数,所述纠错系数用于调整各字符对应的待用按键的按键评分值。
可选地,如果预设有第一时间阈值T1和第二时间阈值T2,所述按键类型确定模块按照以下方式确定按键类型:
如果第(i-1)个字符与第i个字符之间的按键间隔时间T满足:T≥T1,则第i个字符的按键类型为间隔按键;
如果第(i-1)个字符与第i个字符之间的按键间隔时间T满足:T2<T<T1,则第i个字符的按键类型为待定按键;
如果第(i-1)个字符与第i个字符之间的按键间隔时间T满足:T≤T2,则第i个字符的按键类型为内结按键。
可选地,所述按键类型确定模块,用于将所述字符串的首字符的按键类型确定为所述间隔按键或者所述待定按键。
可选地,如果所述待用按键包括原始按键和纠错按键,所述纠错系数确定模块按照以下方式确定待用按键的纠错系数:
如果所述按键类型为间隔按键,则所述待用按键中的原始按键的纠错系数K1为:0<K1<1,所述待用按键中的纠错按键的纠错系数K2为:1<K2<2;
如果所述按键类型为内结按键,则所述待用按键中的原始按键的纠错系数K1为:2≤K1≤10,所述待用按键中的纠错按键的纠错系数K2为:0.5<K2<1;
如果所述按键类型为待定按键,则所述待用按键中的原始按键的纠错系数K1=1,所述待用按键中的纠错按键的纠错系数K2=1。
可选地,如果所述待用按键包括原始按键和纠错按键,所述装置还包括评分值调整模块,所述评分值调整模块按照以下方式调整待用按键的按键评分值:
所述待用按键为纠错按键,且所述纠错按键位于所述原始按键的正左或者正右,所述纠错按键的调整后按键评分值Sˊ=K2*P1*Cx+S,1≤P1≤10;
所述待用按键为纠错按键,且所述纠错按键位于所述原始按键的正上或者正下,所述纠错按键的调整后按键评分值Sˊ=K2*P2*Cy+S,2≤P2≤20;
所述待用按键为纠错按键,且所述纠错按键位于所述原始按键的斜上方或者斜下方,所述纠错按键的调整后按键评分值Sˊ=K2*P3*(Cx+Cy)+S,1≤P3≤20;
所述待用按键为原始按键,所述原始按键的调整后按键评分值Sˊ=K1*P4+S,0.5≤P4≤10;
其中,Cx为所述位置坐标的X方向坐标值,Cy为所述位置坐标的Y方向坐标值,S为所述待用按键的按键评分值,K1为所述待用按键中的原始按键的纠错系数,K2为所述待用按键中的纠错按键的纠错系数。
可选地,所述装置还包括:
条件判断模块,用于在判定用户输入所述字符串的行为满足以下条件中的至少一项时,开启输入纠错功能:
若所述字符串中属于同一音节的相邻两个字符之间的按键间隔时间小于第三时间阈值,和/或,所述字符串中属于不同音节的相邻两个字符之间的按键间隔时间小于第四时间阈值,则判定用户输入所述字符串的行为满足输入速度过快的条件;
统计用户输入的总条数Zall、执行删除操作的总条数St、执行回删操作的条数Zdel,若St>α*Zdel且Zdel>β*Zall,α>1,1>β>0.05,则判定用户输入所述字符串的行为满足输入准确度低的条件,所述删除操作包括输入过多执行的删减操作以及输入错误执行的回删操作。
可选地,所述装置还包括:
输入纠错更新模块,用于向用户展示所述候选结果,若用户进行回删操作,则获取用户重新输入的修正后字符串,利用所述修正后字符串进行输入纠错更新。
本公开提供一种存储介质,其中存储有多条指令,所述指令由处理器加载,执行上述输入纠错方法的步骤。
本公开提供一种电子设备,所述电子设备包括;
上述的存储介质;以及
处理器,用于执行所述存储介质中的指令。
本公开方案中,可以在用户输入字符串时,获取每个字符对应的位置坐标,并根据位置坐标确定出每个字符对应的待用按键。然后,可以基于每个字符对应的待用按键,对字符串进行切分处理,得到至少一条切分路径以及各切分路径的路径评分值,其中,利用待用按键对字符串进行切分处理时,可以不对待用按键做区分处理,即任何待用按键均具有相同优先等级,这样,有助于避免设置不同优先级对输入纠错产生影响。最后,可以利用预设语言模型对切分路径解码,得到字符串对应的纠错后的候选结果。如此方案,有助于提高输入纠错的准确性,提高用户体验。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1为本公开方案输入纠错方法的流程示意图;
图2为本公开方案中虚拟键盘的示意图;
图3为本公开方案中包含待用按键的字符串的示意图;
图4为本公开方案中字符串的按键间隔时间的示意图;
图5为本公开方案输入纠错装置的构成示意图;
图6为本公开方案用于进行输入纠错的电子设备的结构示意图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
参见图1,示出了本公开输入纠错方法的流程示意图。可以包括以下步骤:
S101,获取用户输入字符串时的按键信息,所述按键信息包括用户输入每个字符时所按键盘的位置坐标。
用户通过虚拟键盘进行字符串输入时,可以记录字符串中每个字符对应的位置坐标,即,用户输入字符时按在键盘什么位置。以输入字符串“aihao”为例,每个字符对应的位置坐标可以表示为Ca、Ci、Ch、Ca、Co
S102,根据所述按键信息,确定出每个字符对应的待用按键,所述待用按键的中心坐标与该字符对应的位置坐标之间的距离Dij≤D0,Dij为第i个字符对应的第j个待用按键的中心坐标与第i个字符对应的位置坐标之间的距离,D0为相邻按键之间的中心坐标距离。
通常,位置坐标对应的按键即为用户真实想输入的按键,但在实际输入过程中,受屏幕大小、用户手指粗细、输入速度快慢等因素影响,可能会使位置坐标对应的按键与用户真实想输入的按键之间出现偏差,但这种偏差一般是在一定范围内的,例如,用户想要输入“a”时,通常不会按在距离“a”较远的“g”处,即用户所按位置一般在按键“a”的附近。故,本公开方案可以基于字符对应的位置坐标,确定出该字符对应的待用按键。
作为一种示例,可以根据Dij≤D0,从位置坐标周边的按键中确定出字符对应的待用按键。
作为一种示例,可以按照以下方式确定出字符对应的待用按键:首先,可以基于字符对应的位置坐标所属像素区域,确定出字符对应的原始按键;其次,考虑到越是距离近的按键,越容易出现误输入,故可根据按键分布位置,从原始按键的周边按键中确定出字符对应的纠错按键,纠错按键的中心坐标与位置坐标之间的距离不大于D0;将原始按键和纠错按键确定为字符对应的待用按键。可以理解地,位置坐标位于原始按键的像素区域内,故原始按键的中心坐标与位置坐标之间的距离同样不大于D0
本公开方案对确定字符对应的待用按键的方式,可不做具体限定。
参照图2所示虚拟键盘,以字符串“aihao”为例,可以按照以下方式确定字符串中第i个字符对应的待用按键,1≤i≤5。
i=1时,即针对首字符“a”,若Ca位于按键a的像素区域的右下角,可以将按键a确定为字符“a”对应的原始按键;此外,由图2所示按键分布位置可知,按键a的周边按键包括:q、w、s、z,其中,按键s中心坐标与Ca之间的距离、按键z中心坐标与Ca之间的距离均不大于D0,故可将按键s、z确定为字符“a”对应的纠错按键。即,字符“a”对应的待用按键包括:a、s、z。
i=2时,即针对字符“i”,若Ci位于按键i的像素区域的左上角,可以将按键i确定为字符“i”对应的原始按键;此外,由图2所示按键分布位置可知,按键i的周边按键包括:o、k、j、u,根据D0,可以将按键u确定为字符“i”对应的纠错按键。即,字符“i”对应的待用按键包括:i、u。
i=3时,即针对字符“h”,若Ch位于按键h的像素区域的左下角,可以将按键h确定为字符“h”对应的原始按键;此外,由图2所示按键分布位置可知,按键h的周边按键包括:y、u、j、n、b、v、g,根据D0,可以将按键n、b、v、g确定为字符“h”对应的纠错按键。即,字符“h”对应的待用按键包括:h、n、b、v、g。
i=4时,即针对第二个字符“a”,若Ca位于按键a的像素区域的右上角,可以将按键a确定为字符“a”对应的原始按键;此外,由图2所示按键分布位置可知,按键a的周边按键包括:q、w、s、z,根据D0,可以将按键q、w、s确定为字符“a”对应的纠错按键。即,字符“a”对应的待用按键包括:a、q、w、s。
i=5时,即针对字符“o”,若Co位于按键o的像素区域的中心,可以将按键o确定为字符“o”对应的原始按键;此外,由图2所示按键分布位置可知,按键o的周边按键包括:p、l、k、i,根据D0,可以将按键p、l、k、i确定为字符“o”对应的纠错按键。即,字符“o”对应的待用按键包括:o、p、l、k、i。
可以理解地,不同厂商、不同型号的智能终端的按键分布位置可能有所不同,不同用户使用的虚拟键盘的按键数目也可能有所不同,例如26键或者9键等,具体可结合实际应用情况而定,本公开方案对按键分布位置、按键数目不做具体限定。
S103,利用所述距离Dij,计算每个待用按键的按键评分值。
获得字符对应的待用按键与该字符对应的位置坐标之间的距离Dij之后,可以据此计算每个待用按键的按键评分值。
作为一种示例,可以通过以下公式计算第i个字符的第j个待用按键的按键概率:
Figure BDA0001530735330000111
其中,n为第i个字符对应的待用按键的数目。
本公开方案中,可以将按键概率Pij作为第i个字符的第j个待用按键的按键评分值;或者,还可以按照以下公式,基于按键概率Pij计算第i个字符的第j个待用按键的按键评分值:
Sij=α1+A*Pij
其中,0<α1<1,-10≤A<0。例如,二者可优选设置为α1=0.5,A=-5。
仍以字符串“aihao”为例,按照上述方案可以计算得到如下按键评分值:首字符“a”对应的待用按键a、s、z的按键评分值,字符“i”对应的待用按键i、u的按键评分值,字符“h”对应的待用按键h、n、b、v、g的按键评分值,第二个字符“a”对应的待用按键a、q、w、s的按键评分值,字符“o”对应的待用按键o、p、l、k、i的按键评分值。
S104,基于每个字符对应的待用按键,对所述字符串进行切分处理,获得至少一条切分路径以及各切分路径的路径评分值,所述路径评分值由所述切分路径的原始评分值以及所述切分路径包括的待用按键的按键评分值进行数学运算后得到。
经上述处理,可以得到每个字符对应的待用按键,具体可参见图3所示示意图,基于此可以对字符串“aihao”进行切分处理,得到至少一条切分路径、以及每条切分路径的路径评分值F。
可以理解地,上述按键评分值可以视为该按键对应的惩罚分值,可以基于:按照预设切分原则,对字符串中每个字符对应的待用按键进行切分,得到的切分路径的原始评分值F0、切分路径包括的待用按键的按键评分值S,计算得到切分路径的评分值F。
作为一种示例,可以通过以下公式计算切分路径的评分值F:
Figure BDA0001530735330000121
其中,M为字符串包括的字符的数目,对于字符串“aihao”来说,M=5;Sg为切分路径包括的第g个待用按键的按键评分值。
作为一种示例,本公开方案还提供一种基于按键间隔时间,调整按键评分值的方案,下面进行解释说明。
具体地,如果按键信息还包括用户输入字符串时相邻两个字符之间的按键间隔时间,本公开方案还可以基于按键间隔时间,确定各字符的按键类型;进而根据按键类型,确定各字符对应的待用按键的纠错系数,纠错系数用于调整各字符对应的待用按键的按键评分值。
举例来说,如果预设有第一时间阈值T1和第二时间阈值T2,则基于按键间隔时间确定各字符的按键类型,可以体现为:
(1)如果第(i-1)个字符与第i个字符之间的按键间隔时间T满足:T≥T1,则第i个字符的按键类型为间隔按键。
(2)如果第(i-1)个字符与第i个字符之间的按键间隔时间T满足:T2<T<T1,则第i个字符的按键类型为待定按键。
(3)如果第(i-1)个字符与第i个字符之间的按键间隔时间T满足:T≤T2,则第i个字符的按键类型为内结按键。
需要说明的是,字符串的首字符的按键类型可以为待定按键;或者,结合实际应用,例如输入“alibaba”时,首字符是一个完整音节,即首字符的按键类型还可以为间隔按键,本公开方案对此可不做具体限定,可以结合实际应用需求设置。
举例来说,T1可以设置为500ms、T2可以设置为200ms,若用户输入“aihao”的按键间隔时间如图4所示,对应的按键类型分别是:a与i之间的按键间隔时间、a与o之间的按键间隔时间均小于200ms,故按键i、按键o的按键类型可以确定为内结按键;i与h之间的按键间隔时间大于500ms,故按键h的按键类型可以确定为间隔按键;h与a之间的按键间隔时间位于T1与T2之间,故按键a(字符串中第2个字符a)的按键类型可以确定为待定按键;首字符a对应的按键a的按键类型可以确定为预设的待定按键。
作为一种示例,可以按照以下方式确定T1、T2的取值:可以采集用户最近输入的E条历史字符串,统计各历史字符串中内结按键的历史按键间隔时间,得到第一时间均值
Figure BDA0001530735330000141
统计各历史字符串中间隔按键的历史按键间隔时间,得到第二时间均值
Figure BDA0001530735330000142
然后按照以下公式计算T1和T2
Figure BDA0001530735330000143
上面公式中的α2、α3均为常量,使
Figure BDA0001530735330000144
有助于提高内结按键的判断准确性;使
Figure BDA0001530735330000145
有助于提高间隔按键的判断准确性。
确定出每个字符的按键类型后,可以据此确定出字符对应的待用按键的纠错系数。举例来说,如果待用按键包括原始按键和纠错按键,字符对应的待用按键的纠错系数,可以体现为:
(1)对于间隔按键来说,两个字符之间的停顿时间稍长,原始按键的可信度相对较高,故可将待用按键中的原始按键的纠错系数K1设置为:0<K1<1,例如,原始按键的纠错系数可以优选为K1=0.5;将待用按键中的纠错按键的纠错系数K2设置为:1<K2<2,例如,纠错按键的纠错系数可以优选为K2=1.2。
(2)对于内结按键来说,两个字符之间的停顿时间稍短,原始按键的可信度相对较低,故可将待用按键中的原始按键的纠错系数K1设置为:2≤K1≤10,例如,原始按键的纠错系数可以优选为K1=3;将待用按键中的纠错按键的纠错系数K2设置为:0.5<K2<1,例如,纠错按键的纠错系数可以优选为K2=0.8。
(3)对于待定按键来说,两个字符之间的停顿时间适中,原始按键和纠错按键的可信度相差不大,故可将待用按键中的原始按键的纠错系数设置为K1=1,将待用按键中的纠错按键的纠错系数设置为K2=1。
由上文介绍可知,纠错系数主要用于调整字符对应的待用按键的按键评分值S,下面对调整方案进行解释说明。
(1)待用按键为纠错按键,且纠错按键位于原始按键的正左或者正右
以字符“h”对应的待用按键h、n、b、v、g为例,纠错按键g位于原始按键h的正左,即二者的Y轴方向的坐标值相同。对应于此,X轴方向的坐标对纠错的影响最大,可以基于位置坐标X方向的坐标值Cx调整按键评分值,具体可参照以下公式:
纠错按键的调整后按键评分值Sˊ=K2*P1*Cx+S,1≤P1≤10。例如,P1可优选设置为P1=3。
(2)待用按键为纠错按键,且纠错按键位于原始按键的正上或者正下
以字符“h”对应的待用按键h、n、b、v、g为例,纠错按键b位于原始按键h的正下,即二者的X轴方向的坐标值相同。对应于此,Y轴方向的坐标对纠错的影响最大,可以基于位置坐标Y方向的坐标值Cy调整按键评分值,具体可参照以下公式:
纠错按键的调整后按键评分值Sˊ=K2*P2*Cy+S,2≤P2≤20。例如,P2可优选设置为P2=4.5。
(3)待用按键为纠错按键,且纠错按键位于原始按键的斜上方或者斜下方
以字符“h”对应的待用按键h、n、b、v、g为例,纠错按键n位于原始按键h的右斜下方、纠错按键v位于原始按键h的左斜下方,不论是哪个纠错按键,X轴方向的坐标、Y轴方向的坐标均对纠错有影响,可以基于Cx、Cy调整按键评分值,具体可参照以下公式:
纠错按键的调整后按键评分值Sˊ=K2*P3*(Cx+Cy)+S,1≤P3≤20。例如,P3可优选设置为P3=6。
(4)待用按键为原始按键
以字符“h”对应的待用按键h、n、b、v、g为例,对于原始按键h来说,可以参照以下公式调整按键评分值:
原始按键的调整后按键评分值Sˊ=K1*P4+S,0.5≤P4≤10。例如,P4可优选设置为P4=5。
需要说明的是,上文计算切分路径的评分值F的公式中,可以利用待用按键的调整后按键评分值Sˊ实现,此处不做详述。
在实际应用过程中,不同厂商、不同型号的智能终端的分辨率可能会有所不同,对应于此,本公开方案还可以对坐标进行归一化处理。以坐标Kold(X,Y)为例,若按键的中心坐标为Kmin(X,Y),按键的宽度为KeyWidth,按键的高度为KeyHeight,归一化后的坐标为Knew(X,Y),具体如下:
Knew_X=(Kold_X-Kmin_X)*B1/KeyWidth,其中,1≤B1≤KeyWidth
Knew_Y=(Kold_Y-Kmin_Y)*B2/KeyHeight,其中,1≤B2≤KeyHeight
举例来说,KeyWidth可以为106个像素点,KeyHeight可以为170个像素点,B1=B2=100,本公开方案对此可不做具体限定。
通常,屏幕分辨率为1080P、720P,可以通过B1、B2将坐标转换到较小的单位上,同样地,上述计算纠错按键的调整后按键评分值时,亦可利用B1、B2进行单位转换,本公开方案对此不做限定。具体可以体现为:
(1)纠错按键位于原始按键的正左或者正右时,纠错按键的调整后按键评分值可以为Sˊ=K2*P1*Cx/B1+S。若B1=100,则Sˊ=K2*P1*Cx/100+S。
(2)纠错按键位于原始按键的正上或者正下时,纠错按键的调整后按键评分值可以为Sˊ=K2*P2*Cy/B2+S。若B2=100,则Sˊ=K2*P2*Cy/100+S。
(3)纠错按键位于原始按键的斜上方或者斜下方时,纠错按键的调整后按键评分值可以为Sˊ=K2*P3*(Cx/B1+Cy/B2)+S。若B1=B2=100,则Sˊ=K2*P3*(Cx+Cy)/100+S。
此外,在实际应用过程中,可以如图1所示,先计算按键评分值再进行切分处理;或者,可以先基于字符对应的待用按键对字符串进行切分处理,并在需要计算路径评分值时,再利用距离Dij计算待用按键的按键评分值。本公开方案对二者的执行顺序可不做具体限定。
S105,按照路径评分值高低对所述切分路径排序,并利用预设语言模型,依序对各切分路径进行解码,将所述语言模型输出分值最高的N个解码结果,确定为纠错后的候选结果。
可以理解地,获得每条切分路径的路径评分值后,可以按照路径评分值由高到低对切分路径排序,通常路径评分值可以表示切分处理的准确度,路径评分值越高,切分处理的准确度越高。如此,便可利用预设的语言模型,依序对切分路径进行解码。具体地,可以依序解码全部切分路径;或者,可以选取出评分值最高的Q条切分路径进行解码,本公开方案对此可不做具体限定。
本公开方案中,可以参照相关技术获得语言模型,此处不做详述。例如,可以通过ngram语言模型对切分路径进行解码,采用viterbi算法确定出语言模型输出分值最高的N个解码结果,作为用户输入的字符串对应的纠错后的候选结果。
综上所述,本公开方案可以记录用户输入字符串时,每个字符对应的位置坐标,基于位置坐标可以得到以下两方面信息:用户可能输入的按键,即字符对应的待用按键;待用按键的按键评分值。获得上述两方面信息后,可以基于待用按键对字符串进行切分处理,获得包含待用按键的切分路径,还可以基于待用按键的按键评分值,计算待用按键所属切分路径的路径评分值。最后,可以利用预设语言模型对排序后的切分路径解码,得到字符串对应的纠错后的候选结果。通常,待用按键可以包括原始按键和纠错按键,本公开方案在构造切分路径时,不对待用按键做区分处理,即任何待用按键均具有相同优先等级,如此,有助于避免设置不同优先级对输入纠错产生影响,提高输入纠错的准确性,进而提高用户体验。
作为一种示例,本公开方案向用户展示候选结果后,还可以监测用户操作,如果用户上屏了纠错后的候选结果,则说明纠错正确;如果用户进行回删操作,重新输入了修正后字符串,则说明纠错有误,可以获取修正后字符串,进行输入纠错更新,以便对用户后续输入进行更准确的输入纠错。举例来说,输入纠错更新可以是调整如下参数中的至少一个:待用按键的按键评分值Sij中的α1、A,时间阈值T1、T2,纠错系数K1、K2,待用按键的调整后按键评分值Sˊ中的P1、P2、P3、P4,等等,本公开方案对此可不做具体限定。
此外,需要说明的是,本公开方案的输入纠错方法,可以根据用户需求,由用户手动开启输入纠错功能或者手动关闭输入纠错功能;或者,可以按照以下方案进行输入纠错功能的智能开启或关闭。
具体地,可以在判定用户输入字符串的行为满足以下条件中的至少一项时,智能开启输入纠错功能。
举例来说,用户输入字符串的行为满足的条件可以是:输入速度过快。具体地,可以根据相邻两个字符之间的按键间隔时间,判断用户输入字符串的行为是否满足上述条件:若字符串中属于同一音节的相邻两个字符之间的按键间隔时间小于第三时间阈值T3,和/或,字符串中属于不同音节的相邻两个字符之间的按键间隔时间小于第四时间阈值T4,则可判定用户输入字符串的行为满足输入速度过快的条件。
可以采集用户在预设时间段内输入的历史字符串,统计历史字符串中属于同一音节的相邻两个字符之间的平均时间间隔Tnavg,以及属于不同音节的相邻两个字符之间的平均时间间隔Toavg,按照以下公式计算T3和T4
Figure BDA0001530735330000191
举例来说,α4=α5=0.5,γ1=γ2=10,本公开方案对此可不做具体限定。
可以理解地,计算T3和T4使用的历史字符串、计算T1和T2使用的历史字符串,二者可以相同,也可以不同,本公开方案对此可不做具体限定。
举例来说,用户输入字符串的行为满足的条件可以是:输入准确度低。具体地,可以统计用户输入的总条数Zall、执行删除操作的总条数St、执行回删操作的条数Zdel,若St>α*Zdel且Zdel>β*Zall,α>1,1>β>0.05,则可判定用户输入字符串的行为满足输入准确度低的条件。其中,删除操作可以包括输入过多进行的删减操作,即,删除多余的字符;以及输入错误进行的回删操作,即,删除输错的字符。
综上,当用户输入字符串的行为满足输入速度过快和/或输入准确度低时,可以智能开启输入纠错功能;否则可以智能关闭输入纠错功能。
参见图5,示出了本公开输入纠错装置的构成示意图。所述装置可以包括:
按键信息获取模块201,用于获取用户输入字符串时的按键信息,所述按键信息包括用户输入每个字符时所按键盘的位置坐标;
待用按键确定模块202,用于根据所述按键信息,确定出每个字符对应的待用按键,所述待用按键的中心坐标与该字符对应的位置坐标之间的距离Dij≤D0,Dij为第i个字符对应的第j个待用按键的中心坐标与第i个字符对应的位置坐标之间的距离,D0为相邻按键之间的中心坐标距离;
按键评分值计算模块203,用于利用所述距离Dij,计算每个待用按键的按键评分值;
切分处理模块204,用于基于每个字符对应的待用按键,对所述字符串进行切分处理,获得至少一条切分路径以及各切分路径的路径评分值,所述路径评分值由所述切分路径的原始评分值以及所述切分路径包括的待用按键的按键评分值进行数学运算后得到;
切分路径解码模块205,用于按照路径评分值高低对所述切分路径排序,并利用预设语言模型,依序对各切分路径进行解码,将所述语言模型输出分值最高的N个解码结果,确定为纠错后的候选结果。
可选地,所述待用按键确定模块,用于基于字符对应的位置坐标所属像素区域,确定出字符对应的原始按键;根据按键分布位置,从所述原始按键的周边按键中确定出字符对应的纠错按键,所述纠错按键的中心坐标与所述位置坐标之间的距离不大于D0;将所述原始按键和所述纠错按键确定为字符对应的待用按键。
可选地,所述按键信息还包括用户输入所述字符串时相邻两个字符之间的按键间隔时间,所述装置还包括:
按键类型确定模块,用于基于所述按键间隔时间,确定各字符的按键类型;
纠错系数确定模块,用于根据所述按键类型,确定各字符对应的待用按键的纠错系数,所述纠错系数用于调整各字符对应的待用按键的按键评分值。
可选地,如果预设有第一时间阈值T1和第二时间阈值T2,所述按键类型确定模块按照以下方式确定按键类型:
如果第(i-1)个字符与第i个字符之间的按键间隔时间T满足:T≥T1,则第i个字符的按键类型为间隔按键;
如果第(i-1)个字符与第i个字符之间的按键间隔时间T满足:T2<T<T1,则第i个字符的按键类型为待定按键;
如果第(i-1)个字符与第i个字符之间的按键间隔时间T满足:T≤T2,则第i个字符的按键类型为内结按键。
可选地,所述按键类型确定模块,用于将所述字符串的首字符的按键类型确定为所述间隔按键或者所述待定按键。
可选地,如果所述待用按键包括原始按键和纠错按键,所述纠错系数确定模块按照以下方式确定待用按键的纠错系数:
如果所述按键类型为间隔按键,则所述待用按键中的原始按键的纠错系数K1为:0<K1<1,所述待用按键中的纠错按键的纠错系数K2为:1<K2<2;
如果所述按键类型为内结按键,则所述待用按键中的原始按键的纠错系数K1为:2≤K1≤10,所述待用按键中的纠错按键的纠错系数K2为:0.5<K2<1;
如果所述按键类型为待定按键,则所述待用按键中的原始按键的纠错系数K1=1,所述待用按键中的纠错按键的纠错系数K2=1。
可选地,如果所述待用按键包括原始按键和纠错按键,所述装置还包括评分值调整模块,所述评分值调整模块按照以下方式调整待用按键的按键评分值:
所述待用按键为纠错按键,且所述纠错按键位于所述原始按键的正左或者正右,所述纠错按键的调整后按键评分值Sˊ=K2*P1*Cx+S,1≤P1≤10;
所述待用按键为纠错按键,且所述纠错按键位于所述原始按键的正上或者正下,所述纠错按键的调整后按键评分值Sˊ=K2*P2*Cy+S,2≤P2≤20;
所述待用按键为纠错按键,且所述纠错按键位于所述原始按键的斜上方或者斜下方,所述纠错按键的调整后按键评分值Sˊ=K2*P3*(Cx+Cy)+S,1≤P3≤20;
所述待用按键为原始按键,所述原始按键的调整后按键评分值Sˊ=K1*P4+S,0.5≤P4≤10;
其中,Cx为所述位置坐标的X方向坐标值,Cy为所述位置坐标的Y方向坐标值,S为所述待用按键的按键评分值,K1为所述待用按键中的原始按键的纠错系数,K2为所述待用按键中的纠错按键的纠错系数。
可选地,所述装置还包括:
条件判断模块,用于在判定用户输入所述字符串的行为满足以下条件中的至少一项时,开启输入纠错功能:
若所述字符串中属于同一音节的相邻两个字符之间的按键间隔时间小于第三时间阈值,和/或,所述字符串中属于不同音节的相邻两个字符之间的按键间隔时间小于第四时间阈值,则判定用户输入所述字符串的行为满足输入速度过快的条件;
统计用户输入的总条数Zall、执行删除操作的总条数St、执行回删操作的条数Zdel,若St>α*Zdel且Zdel>β*Zall,α>1,1>β>0.05,则判定用户输入所述字符串的行为满足输入准确度低的条件,所述删除操作包括输入过多执行的删减操作以及输入错误执行的回删操作。
可选地,所述装置还包括:
输入纠错更新模块,用于向用户展示所述候选结果,若用户进行回删操作,则获取用户重新输入的修正后字符串,利用所述修正后字符串进行输入纠错更新。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
参见图6,示出了本公开用于进行输入纠错的电子设备300的结构示意图。参照图6,电子设备300包括处理组件301,其进一步包括一个或多个处理器,以及由存储介质302所代表的存储设备资源,用于存储可由处理组件301的执行的指令,例如应用程序。存储介质302中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件301被配置为执行指令,以执行上述输入纠错方法。
电子设备300还可以包括一个电源组件303,被配置为执行电子设备300的电源管理;一个有线或无线网络接口304,被配置为将电子设备300连接到网络;和一个输入输出(I/O)接口305。电子设备300可以操作基于存储在存储介质302的操作系统,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

Claims (14)

1.一种输入纠错方法,其特征在于,所述方法包括:
获取用户输入字符串时的按键信息,所述按键信息包括用户输入每个字符时所按键盘的位置坐标;
根据所述按键信息,确定出每个字符对应的待用按键,所述待用按键的中心坐标与该字符对应的位置坐标之间的距离Dij≤D0,Dij为第i个字符对应的第j个待用按键的中心坐标与第i个字符对应的位置坐标之间的距离,D0为两个相邻按键的中心坐标之间的距离;
利用所述距离Dij,计算每个待用按键的按键评分值;所述按键信息还包括用户输入所述字符串时相邻两个字符之间的按键间隔时间,所述方法还包括:基于所述按键间隔时间,确定各字符的按键类型;根据所述按键类型,确定各字符对应的待用按键的纠错系数,所述纠错系数用于调整各字符对应的待用按键的按键评分值;
基于每个字符对应的待用按键,对所述字符串进行切分处理,获得至少一条切分路径以及各切分路径的路径评分值,所述路径评分值由所述切分路径的原始评分值以及所述切分路径包括的待用按键的按键评分值进行数学运算后得到;
按照路径评分值高低对所述切分路径排序,并利用预设语言模型,依序对各切分路径进行解码,将所述语言模型输出分值最高的N个解码结果,确定为纠错后的候选结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述按键信息,确定出每个字符对应的待用按键,包括:
基于字符对应的位置坐标所属像素区域,确定出字符对应的原始按键;
根据按键分布位置,从所述原始按键的周边按键中确定出字符对应的纠错按键,所述纠错按键的中心坐标与所述位置坐标之间的距离不大于D0
将所述原始按键和所述纠错按键确定为字符对应的待用按键。
3.根据权利要求1所述的方法,其特征在于,如果预设有第一时间阈值T1和第二时间阈值T2,则所述基于所述按键间隔时间,确定各字符的按键类型,包括:
如果第(i-1)个字符与第i个字符之间的按键间隔时间T满足:T≥T1,则第i个字符的按键类型为间隔按键;
如果第(i-1)个字符与第i个字符之间的按键间隔时间T满足:T2<T<T1,则第i个字符的按键类型为待定按键;
如果第(i-1)个字符与第i个字符之间的按键间隔时间T满足:T≤T2,则第i个字符的按键类型为内结按键。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
所述字符串的首字符的按键类型为所述间隔按键或者所述待定按键。
5.根据权利要求3或4所述的方法,其特征在于,如果所述待用按键包括原始按键和纠错按键,则所述根据所述按键类型,确定各字符对应的待用按键的纠错系数,包括:
如果所述按键类型为间隔按键,则所述待用按键中的原始按键的纠错系数K1为:0<K1<1,所述待用按键中的纠错按键的纠错系数K2为:1<K2<2;
如果所述按键类型为内结按键,则所述待用按键中的原始按键的纠错系数K1为:2≤K1≤10,所述待用按键中的纠错按键的纠错系数K2为:0.5<K2<1;
如果所述按键类型为待定按键,则所述待用按键中的原始按键的纠错系数K1=1,所述待用按键中的纠错按键的纠错系数K2=1。
6.根据权利要求1所述的方法,其特征在于,如果所述待用按键包括原始按键和纠错按键,则利用所述纠错系数调整各字符对应的待用按键的按键评分值的方式为:
所述待用按键为纠错按键,且所述纠错按键位于所述原始按键的正左或者正右,所述纠错按键的调整后按键评分值S’=K2*P1*Cx+S,1≤P1≤10;
所述待用按键为纠错按键,且所述纠错按键位于所述原始按键的正上或者正下,所述纠错按键的调整后按键评分值S’=K2*P2*Cy+S,2≤P2≤20;
所述待用按键为纠错按键,且所述纠错按键位于所述原始按键的斜上方或者斜下方,所述纠错按键的调整后按键评分值S’=K2*P3*(Cx+Cy)+S,1≤P3≤20;
所述待用按键为原始按键,所述原始按键的调整后按键评分值S’=K1*P4+S,0.5≤P4≤10;
其中,Cx为所述位置坐标的X方向坐标值,Cy为所述位置坐标的Y方向坐标值,S为所述待用按键的按键评分值,K1为所述待用按键中的原始按键的纠错系数,K2为所述待用按键中的纠错按键的纠错系数。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在判定用户输入所述字符串的行为满足以下条件中的至少一项时,开启输入纠错功能:
若所述字符串中属于同一音节的相邻两个字符之间的按键间隔时间小于第三时间阈值,和/或,所述字符串中属于不同音节的相邻两个字符之间的按键间隔时间小于第四时间阈值,则判定用户输入所述字符串的行为满足输入速度过快的条件;
统计用户输入的总条数Zall、执行删除操作的总条数St、执行回删操作的条数Zdel,若St>α*Zdel且Zdel>β*Zall,α>1,1>β>0.05,则判定用户输入所述字符串的行为满足输入准确度低的条件,所述删除操作包括输入过多执行的删减操作以及输入错误执行的回删操作。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
向用户展示所述候选结果,若用户进行回删操作,则获取用户重新输入的修正后字符串,利用所述修正后字符串进行输入纠错更新。
9.一种输入纠错装置,其特征在于,所述装置包括:
按键信息获取模块,用于获取用户输入字符串时的按键信息,所述按键信息包括用户输入每个字符时所按键盘的位置坐标;
待用按键确定模块,用于根据所述按键信息,确定出每个字符对应的待用按键,所述待用按键的中心坐标与该字符对应的位置坐标之间的距离Dij≤D0,Dij为第i个字符对应的第j个待用按键的中心坐标与第i个字符对应的位置坐标之间的距离,D0为两个相邻按键的中心坐标之间的距离;
按键评分值计算模块,用于利用所述距离Dij,计算每个待用按键的按键评分值;
所述按键信息还包括用户输入所述字符串时相邻两个字符之间的按键间隔时间,所述装置还包括:按键类型确定模块,用于基于所述按键间隔时间,确定各字符的按键类型;纠错系数确定模块,用于根据所述按键类型,确定各字符对应的待用按键的纠错系数,所述纠错系数用于调整各字符对应的待用按键的按键评分值;
切分处理模块,用于基于每个字符对应的待用按键,对所述字符串进行切分处理,获得至少一条切分路径以及各切分路径的路径评分值,所述路径评分值由所述切分路径的原始评分值以及所述切分路径包括的待用按键的按键评分值进行数学运算后得到;
切分路径解码模块,用于按照路径评分值高低对所述切分路径排序,并利用预设语言模型,依序对各切分路径进行解码,将所述语言模型输出分值最高的N个解码结果,确定为纠错后的候选结果。
10.根据权利要求9所述的装置,其特征在于,
所述待用按键确定模块,用于基于字符对应的位置坐标所属像素区域,确定出字符对应的原始按键;根据按键分布位置,从所述原始按键的周边按键中确定出字符对应的纠错按键,所述纠错按键的中心坐标与所述位置坐标之间的距离不大于D0;将所述原始按键和所述纠错按键确定为字符对应的待用按键。
11.根据权利要求9所述的装置,其特征在于,所述装置还包括:
条件判断模块,用于在判定用户输入所述字符串的行为满足以下条件中的至少一项时,开启输入纠错功能:
若所述字符串中属于同一音节的相邻两个字符之间的按键间隔时间小于第三时间阈值,和/或,所述字符串中属于不同音节的相邻两个字符之间的按键间隔时间小于第四时间阈值,则判定用户输入所述字符串的行为满足输入速度过快的条件;
统计用户输入的总条数Zall、执行删除操作的总条数St、执行回删操作的条数Zdel,若St>α*Zdel且Zdel>β*Zall,α>1,1>β>0.05,则判定用户输入所述字符串的行为满足输入准确度低的条件,所述删除操作包括输入过多执行的删减操作以及输入错误执行的回删操作。
12.根据权利要求9-11中任意一项所述的装置,其特征在于,所述装置还包括:
输入纠错更新模块,用于向用户展示所述候选结果,若用户进行回删操作,则获取用户重新输入的修正后字符串,利用所述修正后字符串进行输入纠错更新。
13.一种存储介质,其中存储有多条指令,其特征在于,所述指令由处理器加载,执行权利要求1至8任一项所述方法的步骤。
14.一种电子设备,其特征在于,所述电子设备包括:
权利要求13所述的存储介质;以及
处理器,用于执行所述存储介质中的指令。
CN201711463345.0A 2017-12-28 2017-12-28 输入纠错方法及装置、存储介质、电子设备 Active CN108182001B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711463345.0A CN108182001B (zh) 2017-12-28 2017-12-28 输入纠错方法及装置、存储介质、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711463345.0A CN108182001B (zh) 2017-12-28 2017-12-28 输入纠错方法及装置、存储介质、电子设备

Publications (2)

Publication Number Publication Date
CN108182001A CN108182001A (zh) 2018-06-19
CN108182001B true CN108182001B (zh) 2021-06-08

Family

ID=62548564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711463345.0A Active CN108182001B (zh) 2017-12-28 2017-12-28 输入纠错方法及装置、存储介质、电子设备

Country Status (1)

Country Link
CN (1) CN108182001B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110673753B (zh) * 2018-07-03 2024-04-12 北京搜狗科技发展有限公司 按键误触纠错方法及装置
CN110888577B (zh) * 2018-09-10 2021-09-28 百度在线网络技术(北京)有限公司 字符纠正方法、装置、设备以及存储介质
CN109857264B (zh) * 2019-01-02 2022-09-20 众安信息技术服务有限公司 一种基于空间键位的拼音纠错方法及装置
CN112015279B (zh) * 2019-05-28 2024-02-13 北京搜狗科技发展有限公司 按键误触纠错方法及装置
CN110263337B (zh) * 2019-06-17 2023-06-20 北京百度网讯科技有限公司 输入行为识别方法、装置、设备和介质
CN110764647B (zh) * 2019-10-21 2023-10-31 科大讯飞股份有限公司 输入纠错方法、装置、电子设备和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU5299700A (en) * 1999-05-27 2000-12-18 America Online, Inc. Keyboard system with automatic correction
US8994660B2 (en) * 2011-08-29 2015-03-31 Apple Inc. Text correction processing
CN103021412B (zh) * 2012-12-28 2014-12-10 安徽科大讯飞信息科技股份有限公司 语音识别方法和系统
US9760560B2 (en) * 2015-03-19 2017-09-12 Nuance Communications, Inc. Correction of previous words and other user text input errors
CN107229348B (zh) * 2016-03-23 2021-11-02 北京搜狗科技发展有限公司 一种输入纠错方法、装置和用于输入纠错的装置

Also Published As

Publication number Publication date
CN108182001A (zh) 2018-06-19

Similar Documents

Publication Publication Date Title
CN108182001B (zh) 输入纠错方法及装置、存储介质、电子设备
CN109344831B (zh) 一种数据表识别方法、装置及终端设备
CN107301865B (zh) 一种用于语音输入中确定交互文本的方法和装置
CN108595431B (zh) 语音交互文本纠错方法、装置、终端及存储介质
US10078631B2 (en) Entropy-guided text prediction using combined word and character n-gram language models
WO2016155564A1 (zh) 卷积神经网络模型的训练方法及装置
US20220130146A1 (en) Method for recognizing video action, and device and storage medium thereof
CN110163181B (zh) 手语识别方法及装置
US20220198137A1 (en) Text error-correcting method, apparatus, electronic device and readable storage medium
CN101976148B (zh) 一种手写输入系统和方法
CN107340880B (zh) 一种联想输入方法、装置及用于实现联想输入的电子设备
CN112560452B (zh) 一种自动生成纠错语料的方法和系统
US20230306765A1 (en) Recognition method and apparatus, and electronic device
CN111274785A (zh) 一种文本纠错方法、装置、设备及介质
CN110888577B (zh) 字符纠正方法、装置、设备以及存储介质
CN106886294B (zh) 一种输入法纠错方法和装置
CN107678560B (zh) 输入法的候选结果生成方法及装置、存储介质、电子设备
CN112580324A (zh) 文本纠错方法、装置、电子设备以及存储介质
CN112417848A (zh) 语料生成方法、装置及计算机设备
CN107564526B (zh) 处理方法、装置和机器可读介质
CN113359999B (zh) 候选词更新方法、装置和电子设备
CN112949261A (zh) 文本还原方法、装置及电子设备
CN112017670B (zh) 一种目标账户音频的识别方法、装置、设备及介质
US10963640B2 (en) System and method for cooperative text recommendation acceptance in a user interface
CN110298045B (zh) 机器翻译方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant