发明内容
本发明实施例提供了一种输入法中调整候选词顺序的方法及装置,能够针对不同输入场景对输入法候选词的排序方式进行调整,进一步提高了输入法的易用性。
本发明实施例的技术方案如下:
本发明实施例提出了一种输入法中调整候选词顺序的方法,包括:
获取输入法内核词表中候选词的词条信息;
根据预定的候选词排序词频的衰减系数及候选词的词条信息,确定所述候选词在当前输入场景中的排序词频;
按照所述排序词频调整所述候选词的排列顺序,并显示。
进一步的,确定所述候选词在当前输入场景中的排序词频,包括:
当输入法内核词表中按照候选词、所述候选词的词频及最后一次输入所述候选词的时间的方式,来记录所述候选词的词条信息时,确定所述排序词频包括;
M=N/[(T1-T2)*X]+Y
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,T1为当前时间,T2为最后一次输入该候选词的时间,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频。
进一步的,确定所述候选词在当前输入场景中的排序词频,包括:
当输入法内核词表中按照候选词、所述候选词的词频、第一次输入所述候选词的时间、第二次输入所述候选词的时间以及第N次输入所述候选词的时间的方式,来记录所述候选词的词条信息时,确定所述排序词频包括;
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频,T[k](时间数组,1<=k<=n),T(当前时间)。
进一步的,按照所述排序词频调整所述候选词的排列顺序,包括:
根据获得的所述排序词频按照从大到小的顺序确定该候选词在当前输入场景中的排列顺序,并将输入法内核词表中所述候选词的默认词频修改为所述候选词在当前输入场景中的排序词频。
进一步的,所述方法还包括:
将所述候选词在当前输入场景中的排列顺序通过候选词窗口进行显示。
本发明实施例还提出了一种输入法中调整候选词顺序的装置,包括:
词频处理模块,用于获取输入法内核词表中候选词的词条信息,根据预定的候选词排序词频的衰减系数及候选词的词条信息,确定所述候选词在当前输入场景中的排序词频;
词频调整模块,用于按照所述词频处理模块确定的所述排序词频调整所述候选词的排列顺序,并显示。
优选的,所述词频处理模块包括:
衰减系数设置单元,用于设置当前输入场景中所述候选词的衰减系数;
排序词频生成单元,用于在输入法内核词表中按照候选词、所述候选词的词频及最后一次输入所述候选词的时间,来记录所述候选词的词条信息时,根据所述时间设置单元设定的衰减系数以及所述词条信息,通过如下算法确定该候选词在当前输入场景中的排序词频:
M=N/[(T1-T2)*X]+Y
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,T1为当前时间,T2为最后一次输入该候选词的时间,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频。
优选的,所述词频处理模块包括:
衰减系数设置单元,用于设置当前输入场景中所述候选词的衰减系数;
排序词频生成单元,用于在输入法内核词表中按照候选词、所述候选词的词频、第一次输入所述候选词的时间、第二次输入所述候选词的时间以及第N次输入所述候选词的时间的方式来记录所述候选词的词条信息时,根据所述衰减系数设置单元设定的衰减系数以及所述词条信息通过如下算法,确定该候选词在当前输入场景中的排序词频:
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频,T[k](时间数组,1<=k<=n),T(当前时间)。
优选的,所述词频调整模块包括:
位置调整单元,用于根据获得的所述排序词频按照从小到大的顺序确定该候选词在当前输入场景中的排列顺序;
数据修改单元,用于将输入法内核词表中所述候选词的默认词频修改为所述候选词在当前输入场景中的排序词频。
优选的,所述词频调整模块还包括:
窗口显示模块,用于将所述候选词在当前输入场景中的排列顺序进行显示。
上述本发明实施例提出的一种输入法中调整候选词顺序的方法及装置,通过根据预定的候选词排序词频的衰减系数及候选词的词条信息,确定该候选词在当前输入场景中的排序词频;并按照所述排序词频调整所述候选词的排列顺序,能够针对不同输入场景对输入法候选词的排序方式进行调整,进一步提高了输入法的易用性,更加满足了用户在不同输入场景下对输入法的个性化需求。
具体实施
本发明实施例针对现有输入法的候选词排序方式对于不同输入场景不能提供一种合理的排序方式,无法满足用户需求的问题,提出的一种输入法中调整候选词顺序的方法及装置。
本发明实施例与现有输入法的候选词排序方式相结合,根据用户设定的候选词排序词频的衰减系数以及获取到的候选词的词条信息确定在当前输入场景中候选词的排列词频,从而修改输入法内核词表数据结构中该候选词的默认词频,智能的调整候选词在当前输入场景中的排列顺序,能够针对不同的输入场景提供相应的候选词排列顺序,完善了现有输入法技术方案中候选词的排序方式,进一步提高了输入法的易用性。
例如:当用户采用五笔输入法录入中文时,在输入栏中输入“aqtg”,此时现有候选词的排序方式中“敬重”排在“蕕”之前,理由是“敬重”相对“蕕”来说是比较常用的词,“蕕”是相对较生僻的字,因此输入机会较少。此时当用户在输入比较常用的中文内容时,现有候选词排序方式是可以满足用户需求的;
但当用户需要输入一篇关于中草药的文章时,由于“蕕”是浙江民间常用草药,因此就有可能会多次输入“蕕”字,此时,现有输入法提供的排序方式中“蕕”排在“敬重”之后,所以不能满足用户的录入需求,采用本发明实施例提供的技术方案能够在用户录入关于中草药的文章时,将“蕕”排在“敬重”之前,通过向用户提供衰减系数的设置功能,由用户自行根据需求设定的当前输入场景下候选词排列词频的衰减系数,同时结合“蕕”在输入法内核词表中的词条信息,重新确定“蕕”在当前输入场景中的排序词频,使其排在“敬重”之前,便于用户提高录入速度。
此外,由于用户设定了候选词排序词频的衰减系数,当用户写完这篇文章之后,随着“蕕”的输入次数逐渐减少,根据衰减系数及词条信息确定的“蕕”的排序词频就会递减,“敬重”这个词便会恢复到初始状态排在“蕕”的之前,不会影响输入法候选词排序方式的日常需求。
下面结合附图和具体实施方式对本发明的技术方案进行详细说明:
如图1所示,本发明实施例提出了一种输入法中调整候选词顺序的方法,技术方案包括:
步骤101:获取输入法内核词表中候选词的词条信息;
步骤102:根据预定的候选词排序词频的衰减系数及候选词的词条信息,确定该候选词在当前输入场景中的排序词频;
步骤103:按照所述排序词频调整所述候选词的排列顺序,并显示。
可见,通过上述步骤根据衰减系数及词条信息能够确定候选词在当前输入场景中的排序词频,并根据确定的排序词频重新调整候选词的排列顺序,能够在不同输入场景下,提高输入法对用户的易用性。
具体的说,在本发明的一个实施例中,通常输入法内核词表中是按照两种方式来记录每个候选词的词条信息的,因此,本发明实施例针对两种不同的记录词条信息的方式也对应的提供了两种确定该候选词在当前输入场景中的排序词频的方法,具体如下:
第一种方式:当输入法内核词表中是按照“候选词、候选词的词频及最后一次输入候选词的时间”的方式,来记录所述候选词的词条信息时,确定该候选词的排序词频可以通过如下算法实现;
M=N/[(T1-T2)*X]+Y
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,T1为当前时间,T2为最后一次输入该候选词的时间,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频。
(2)当输入法内核词表中按照“候选词、所述候选词的词频、第一次输入所述候选词的时间、第二次输入所述候选词的时间以及第N次输入所述候选词的时间”的方式,来记录所述候选词的词条信息时,确定所述排序词频包括;
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频,T[k](时间数组,1<=k<=n),T(当前时间)。
针对上述方案具体的说,本发明实施例中衰减系数是指候选词的排序词频在一个衰减周期内的衰减次数,通常可以将一个衰减周期设定为一小时,或大于等于两小时,衰减周期的具体取值本发明实施例不作具体限定,用户可以根据自身经验值、待输入文件的预计时长或者工作时长来自行设定,0<衰减系数<1,衰减系数设定的越大,候选词排序词频衰减速度越快;
如:用户设定一个衰减周期为一小时,衰减系数为0.5,其含义是在当前输入场景下,候选词排序词频每小时按照0.5速度进行衰减。
又如:用户设定一个衰减周期为两小时,衰减系数为0.5,其含义是在当前输入场景下,候选词排序词频每两小时按照0.5的速度进行衰减。
需要说明的是,衰减系数的设定方式遵循0<衰减系数<1的取值原则,衰减系数设定的越大,候选词排序词频衰减速度越快,衰减系数设定的越小,候选词排序词频衰减速度越慢,取值不作具体限定,用户可以根据不同输入场景来自行根据需求设定的,如:待输入文档所需时间,会议时长,工作时长等等。
上述两种计算候选词排序词频的算法中提到的默认词频,本发明实施例中所述默认词频是候选词在输入法词表中的初始词频,通常表示了候选词具有一般的适用性,满足用户对日常输入法排序方式的需求。本发明实施例中的默认词频的获取方式是采用现有技术中通过大语料训练的方式获得的,因此本发明实施例中不对该默认词频的获取方式进行详细阐述。
在本发明的一个实施例中,按照所述排序词频调整所述候选词的排列顺序,可以通过如下技术方案实现:
根据获得的所述排序词频按照从大到小的顺序确定该候选词在当前输入场景中的排列顺序,并将输入法内核词表中所述候选词的默认词频修改为所述候选词在当前输入场景中的排序词频。
具体的说,在确定每个候选词在当前输入场景中的排序词频后,由于本发明实施例提出的技术方案是根据排序词频对候选词的排列顺序进行调整,该候选词的排序词频与该输入法内核词表中的默认词频不同,因此要对输入法内核词表中候选词的默认词频进行修改,以便在当前输入场景中根据获得的排序词频对候选词进行排列。
需要说明的是,本发明在具体实现的过程中,根据候选词排列词频确定当前输入场景中的排列顺序,以及,根据候选词的排序词频修改输入法内核词表中的默认词频,这两个步骤本发明实施例不限定具体的先后顺序,可以先修改输入法内核词表中的默认词频,也可以先调整当前输入场景中的排列顺序,还可以两个步骤同时执行,只要能够实现本发明的技术方案即可。
在本发明的一个实施例中,输入法中调整候选词顺序的方法还可以包括:
将所述候选词在当前输入场景中的排列顺序通过候选词窗口进行显示。
具体的说,根据当前输入场景中候选词的排序词频对现有候选词排序方式进行调整,通过候选词窗口显示给用户的候选词,很大程度上可以满足用户在不同输入场景下的需求,能够提高用户的录入速度。
如图2所示,基于上述图1实施例所述方法,本发明还提供了一种输入法中调整候选词顺序的装置,可以包括如下功能模块:
词频处理模块21,用于获得输入法内核词表中候选词的词条信息,并根据预定的候选词排序词频的衰减系数及候选词的词条信息,确定所述候选词在当前输入场景中的排序词频;
词频调整模块22,用于按照所述词频处理模块确定的所述排序词频调整所述候选词的排列顺序,并显示。
可见,通过上述功能模块,根据衰减系数及词条信息能够确定候选词在当前输入场景中的排序词频,并根据确定的排序词频重新调整候选词的排列顺序,能够在不同输入场景下,提高输入法对用户的易用性。
在本发明的一个实施例中,通常输入法内核词表中是按照两种方式来记录每个候选词的词条信息的,因此本发明实施例针对两种不同的记录词条信息的方式也对应的提供了两种确定该候选词在当前输入场景中的排序词频的方式:
第一种方式,如图3所示,所述词频处理模块21可以进一步包括:
衰减系数设置单元211,用于设置当前输入场景中所述候选词的衰减系数;
排序词频生成单元212,用于在输入法内核词表中按照候选词、所述候选词的词频及最后一次输出所述候选词的时间来记录所述候选词的词条信息时,根据所述时间设置单元设定的衰减系数以及所述词条信息,通过如下算法确定该候选词在当前输入场景中的排序词频:
M=N/[(T1-T2)*X]+Y
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,T1为当前时间,T2为最后一次输入该候选词的时间,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频。
第二种方式,所述词频处理模块21可以进一步包括:
衰减系数设置单元211,用于设置当前输入场景中所述候选词的衰减系数;
排序词频生成单元212,用于在输入法内核词表中按照候选词、所述候选词的词频、第一次输入所述候选词的时间、第二次输入所述候选词的时间以及第N次输入所述候选词的时间的方式来记录所述候选词的词条信息时,根据所述衰减系数设置单元设定的衰减系数以及所述词条信息通过如下算法,确定该候选词在当前输入场景中的排序词频:
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频,T[k](时间数组,1<=k<=n),T(当前时间)。
针对上述方案具体的说,本发明实施例中衰减系数是指候选词的排序词频在一个衰减周期内的衰减次数,通常可以将一个衰减周期设定为一小时,或大于等于两小时,衰减周期的具体取值本发明实施例不作具体限定,用户可以根据自身经验值、待输入文件的预计时长或者工作时长来自行设定,0<衰减系数<1,衰减系数设定的越大,候选词排序词频衰减速度越快;衰减周期和衰减系数的具体具体可以参见图1的方法实施例中的相关描述,在此不作赘述。
衰减系数的设定方式遵循0<衰减系数<1的取值原则,衰减系数设定的越大,候选词排序词频衰减速度越快,衰减系数设定的越小,候选词排序词频衰减速度越慢,取值不作具体限定,用户可以根据不同输入场景来自行根据需求设定的,如:待输入文档所需时间,会议时长,工作时长等等。
上述两种计算候选词排序词频的算法中提到的默认词频,本发明实施例中所述默认词频是候选词在输入法词表中的初始词频,通常表示了候选词具有一般的适用性,满足用户对日常输入法排序方式的需求。本发明实施例中的默认词频的获取方式是采用现有技术中通过大语料训练的方式获得的,因此本发明实施例中不对该默认词频的获取方式进行详细阐述。
在本发明的一个实施例中,所述词频调整模块22可以进一步包括:
位置调整单元221,用于根据获得的所述排序词频按照从小到大的顺序确定该候选词在当前输入场景中的排列顺序;
数据修改单元222,用于将输入法内核词表中所述候选词的默认词频修改为所述候选词在当前输入场景中的排序词频。
需要说明的是,本发明在具体实现的过程中,位置调整单元和数据修改单元的实现过程的先后顺序,本发明实施例中不作具体限定,数据修改单元可以先修改输入法内核词表中的默认词频,位置调整单元也可以先调整当前输入场景中的排列顺序,还可以两个模块同时执行其功能,只要能够实现本发明的技术方案即可。
在本发明的一个实施例中,上述词频调整模块22还可以进一步包括:
窗口显示模块223,用于将所述候选词在当前输入场景中的排列顺序进行显示。
需要说明的是,由于上述装置实施例是基于图1所述方法实施例获得的,因此各功能模块涉及的技术方案与图1实施例中的各步骤涉及的技术方案对应,在此不作一一赘述,具体可参见上述图1实施例中的具体说明。
为了更加清楚的对本发明实施例一种输入法中调整候选词顺序的方法的技术方案的理解,下面以现有输入法为五笔输入法为例进行说明,但并不限定于如下实例:
当输入法内核词表数据结构中采用候选词、该候选词的词频、最后一次输入该候选词的时间的方式,来记录词条信息时,输入法内核词表数据结构如下表所示:
在上述表格中,“敬重”的默认词频为1,“蕕”的默认词频为0.1,采用现有的五笔输入法候选词排序方式时,在用户输入“aqtg”后,由于“敬重”的默认词频大于“蕕”的默认词频,因此“敬重”排在了“蕕”之前,因此现有输入法排序方式如下表所示:
当用户要输入一篇关于中草药的文章时,由于“敬重”默认词频大于“蕕”的默认词频,“敬重”排在了“蕕”之前,但用户会在录入过程中多次输入“蕕”,因此现有的候选词排序方法不能满足用户在当前输入场景中的需求。
针对这种输入场景采用本发明实施例提出的输入法中调整候选词顺序的技术方案的具体流程如下:
401、设定当前输入场景下候选词排序词频的衰减系数;
具体的,用户针对当前输入场景,根据自身需求或经验值自行设定衰减周期及衰减系数,例如在本发明实施例中,用户待输入文件的预计工作时长为两小时,因此用户可以将衰减周期设定为一小时,衰减系数设定为0.5,注:0<衰减系数<1,衰减系数设定的越大,候选词的排列词频衰减的速度越快,反之,则候选词的排列词频衰减的速度越慢;
402、根据用户设定的候选词排序词频的衰减系数及候选词的词条信息确定候选词当前输入场景中的排序词频;
具体的,当用户在当前输入场景中,多次输入“蕕”这个候选词上屏后,如:词库文件中记录的“蕕”的累计总词频为100次,最后一次输入时间是2000,当前时间是2100,用户设定的候选词排序词频的衰减系数为0.5,“蕕”的默认词频是0.1,那么通过图1实施例中第一种确定该排序词频的方法,计算出“蕕”在当前输入场景中的排序词频:
M1=100/[(2100-2000)*O.5]+0.1=2.1;
此时,词库文件中记录的“敬重”的累计总词频为10次,最后一次输入时间为1900,“敬重”的默认词频为1,因此“敬重”在当前输入场景中的排序词频:
M2=10/[(2100-1900)*0.5]+1=1.1;
403、根据获得的候选词的排序词频,将输入法内核词表中候选词的默认词频修改为该候选词在当前输入场景中的排序词频;
具体的,根据步骤402中获得的当前应用场景中,“蕕”的排序词频2.1,“敬重”的排序词频1.1,对此时输入法内核词表中分别对应的两个词的初始词频记录进行修改,修改后的词表结构如下表所示:
404、根据获得的所述排序词频按照从小到大的顺序确定该候选词在当前输入场景中的排列顺序,并显示;
具体的,按照重新确定的排序词频对该候选词的排列顺序进行调整,当用户下次再输入“aqtg”的时候,候选词窗口就是调整后的顺序,如下表所示:
aqtg|
1.蕕 2.敬重
需要说明的是,本发明在具体实现的过程中,步骤403和步骤404执行的先后顺序,本发明实施例不作具体限定,可以先执行步骤403,也可以先执行步骤404,还可以两个步骤同时执行,只要能够实现本发明的技术方案即可。
需要说明的是,当用户将中草药的文章输入完毕后,很长一段时间没有再次输入“蕕”,此时当前时间为3000,根据图1实施例中第一种确定该排序词频的方法计算获得当前时刻“蕕”的排序词频:
M1=100/(3000-2000)*0.5+0.1=0.3;
“敬重”的排序词频:
M2=10/(3000-1900)*0.5+1=1.02,
这时“敬重”的排序词频就高于“蕕”的排序词频,因此“敬重”就又排到了“蕕”的前面,此时,根据当前的排序词频对输入法内核中的词表数据结构的“aqtg”记录做相应的修改,修改后的词表结构如下表所示:
按照获得的排序词频对候选词的排列顺序进行调整,当用户下次输入“aqtg”的时候,候选词窗口显示的就是如下表所示的调整后的顺序,“敬重”排在了“蕕”之前,能够满足用户日常输入过程中的需求:
aqtg|
1.敬重 2.蕕
需要说明的是,上述应用实例是采用图1方法实施例中第一种确定该排序词频的方法计算获得候选词的排列词频的,但上述具体流程对于第二种确定该排序词频的方法计算出的候选词的排列词频同样适用,差别仅在于获得排列词频的计算过程不同,因此不论是采用图1实施例中第一种还是第二种确定该排序词频的方法,均属于本发明实施例的保护范围。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。