CN102346560A - 一种输入法中调整候选词顺序的方法及装置 - Google Patents

一种输入法中调整候选词顺序的方法及装置 Download PDF

Info

Publication number
CN102346560A
CN102346560A CN2010102443985A CN201010244398A CN102346560A CN 102346560 A CN102346560 A CN 102346560A CN 2010102443985 A CN2010102443985 A CN 2010102443985A CN 201010244398 A CN201010244398 A CN 201010244398A CN 102346560 A CN102346560 A CN 102346560A
Authority
CN
China
Prior art keywords
word
candidate word
frequency
candidate
ordering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010102443985A
Other languages
English (en)
Other versions
CN102346560B (zh
Inventor
吴运声
邓欣
曾远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shiji Guangsu Information Technology Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201010244398.5A priority Critical patent/CN102346560B/zh
Publication of CN102346560A publication Critical patent/CN102346560A/zh
Application granted granted Critical
Publication of CN102346560B publication Critical patent/CN102346560B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种输入法中调整候选词顺序的方法及装置,技术方案中该方法包括:获取输入法内核词表中候选词的词条信息;根据预定的候选词排序词频的衰减系数及候选词的词条信息,确定所述候选词在当前输入场景中的排序词频;按照所述排序词频调整所述候选词的排列顺序,并显示。本发明的技术方案中该装置包括词频处理模块以及词频调整模块。本发明的实现完善了现有输入法候选词的排序方案,能够针对不同输入场景对候选词的排列顺序进行调整,进一步提高了输入法的易用性。

Description

一种输入法中调整候选词顺序的方法及装置
技术领域
本发明涉及文字输入技术领域,更具体的说,涉及一种输入法中调整候选词顺序的方法及装置。
背景技术
中文输入软件是一种电脑使用者将汉字输入电脑中的必要工具,运行于操作系统上,能够将通过键盘输入的编码或其他非键盘输入的媒体数据转换成汉字。目前,中文输入软件可分为键盘输入和非键盘输入两种,其中,技术最为成熟,使用最为广泛的要算是基于键盘输入的中文输入软件。
基于键盘输入的中文输入软件是利用键盘,按照一定的编码规则来输入汉字的一种方法。由于英文字母共有26个,分别对应着键盘上的26个字母,因此对于英文而言不存在什么输入软件,直接输入英文字母就可以实现将英文输入电脑中。对于汉字来说,由于汉字字数繁多,并且与键盘之间不存在对应关系,如果要实现向电脑中输入汉字,就必须对汉字进行编码,并将每个汉字对应的编码与键盘上的按键关联起来。因此在向电脑输入汉字时,通过键盘输入某个汉字的编码,这样,在电脑中就可以根据该输入的汉字编码转换成对应的汉字。
目前,汉字编码技术已经非常成熟,常用在电脑上运行的就有几十种,作为一种图形文字,汉字是由字的音、形、义来共同表达的,因此汉字输入的编码方法,基本上也都是采用将音、形、义与特定的键相关联,再根据不同汉字进行组合来完成汉字的输入的。
非键盘中文输入软件包括手写输入软件、语音输入软件、OCR(Optical CharacterRecognition,光学字符识别)输入软件等。
手写输入软件是一种笔式环境下的手写中文识别输入软件,很大程度上符合中国人用笔写字的习惯,只要在手写板上按平常的习惯写字,电脑就能将其识别并显示出来。这种手写输入方式不仅便捷,而且错字率也比较低。此外,手写输入软件也可以直接通过鼠标在屏幕的指定区域内写字来实现中文的输入,通过于写软件将其转换成汉字,但是这种方式对鼠标操作熟练程度要求较高,否则会降低文字识别质量。
语音输入软件是一种通过话筒输入声音,将声音转换成文字的输入软件,硬件方面要求电脑必须配备符合录音要求的声卡,调试优良的麦克风,因此在这种配置下用户可以将其需要录入电脑的内容通过麦克风以语音格式录入,这种语音输入软件虽然使用起来很方便,但错字率较高,尤其对于一些未经训练的专业名词以及生僻字,此外,由于用户口音存在差异化,如果用户普通话口音不标准,就要通过语音输入软件提供的语音训练程序通过一段时间的训练,才能保证语音输入软件的输入质量。
OCR输入软件要求把要输入的文稿通过扫描仪转化为图形格式后才能识别,对原稿的印刷质量要求很高,印刷质量越高识别准确率越高,通常使用的文稿优选印刷体的文字,如图书、杂志等,此外,对原稿的印刷纸张要求也较高,如果纸张较薄,在扫描时纸张背面的图形或文字就会透射过来,干扰最终的识别效果。
目前,在实现本发明的过程中发明人发现,用户在使用输入法的过程中,现有技术已经存在多种候选词的排序方式,如:固定次序排序、按输入次数排序、按最近输入排序等,其中,按固定次序排序时,候选词的顺序是固定的,能够便于用户对常用字的输入,但大多应用场景下,候选词固定顺序必然会影响到用户的输入速度;按输入次数排序是通过候选词输出次数来累积词频的,词频最高的候选词排在候选词序列的首位,然后其它候选词的排序位置随着词频的递减依次递减,因此输入次数多的词语通常会优先排在候选词的前端,当输入非常用词时,会因为菲常用词的词频过低,排序位置靠后,用户在候选词中重复选择,很大程度上影响到用户输入速度;按最近输入排序是将用户最近一次输入的词排列在候选词的首位,其它词的排序位置随着时间依次递减,这种排序方式会导致候选词排序位置不断变化,尽管最近一次输入的词是非常用词时,也会排在候选词的首位,因此用户输入速度也会受到影响。
综上所述,现有候选词的排序方式不能针对不同的输入场景,对候选词的排序方式进行调整,难以满足用户的特定需求。
发明内容
本发明实施例提供了一种输入法中调整候选词顺序的方法及装置,能够针对不同输入场景对输入法候选词的排序方式进行调整,进一步提高了输入法的易用性。
本发明实施例的技术方案如下:
本发明实施例提出了一种输入法中调整候选词顺序的方法,包括:
获取输入法内核词表中候选词的词条信息;
根据预定的候选词排序词频的衰减系数及候选词的词条信息,确定所述候选词在当前输入场景中的排序词频;
按照所述排序词频调整所述候选词的排列顺序,并显示。
进一步的,确定所述候选词在当前输入场景中的排序词频,包括:
当输入法内核词表中按照候选词、所述候选词的词频及最后一次输入所述候选词的时间的方式,来记录所述候选词的词条信息时,确定所述排序词频包括;
M=N/[(T1-T2)*X]+Y
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,T1为当前时间,T2为最后一次输入该候选词的时间,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频。
进一步的,确定所述候选词在当前输入场景中的排序词频,包括:
当输入法内核词表中按照候选词、所述候选词的词频、第一次输入所述候选词的时间、第二次输入所述候选词的时间以及第N次输入所述候选词的时间的方式,来记录所述候选词的词条信息时,确定所述排序词频包括;
M = Σ k = 1 n 1 / [ ( T [ k ] - T ) * X ] + Y
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频,T[k](时间数组,1<=k<=n),T(当前时间)。
进一步的,按照所述排序词频调整所述候选词的排列顺序,包括:
根据获得的所述排序词频按照从大到小的顺序确定该候选词在当前输入场景中的排列顺序,并将输入法内核词表中所述候选词的默认词频修改为所述候选词在当前输入场景中的排序词频。
进一步的,所述方法还包括:
将所述候选词在当前输入场景中的排列顺序通过候选词窗口进行显示。
本发明实施例还提出了一种输入法中调整候选词顺序的装置,包括:
词频处理模块,用于获取输入法内核词表中候选词的词条信息,根据预定的候选词排序词频的衰减系数及候选词的词条信息,确定所述候选词在当前输入场景中的排序词频;
词频调整模块,用于按照所述词频处理模块确定的所述排序词频调整所述候选词的排列顺序,并显示。
优选的,所述词频处理模块包括:
衰减系数设置单元,用于设置当前输入场景中所述候选词的衰减系数;
排序词频生成单元,用于在输入法内核词表中按照候选词、所述候选词的词频及最后一次输入所述候选词的时间,来记录所述候选词的词条信息时,根据所述时间设置单元设定的衰减系数以及所述词条信息,通过如下算法确定该候选词在当前输入场景中的排序词频:
M=N/[(T1-T2)*X]+Y
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,T1为当前时间,T2为最后一次输入该候选词的时间,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频。
优选的,所述词频处理模块包括:
衰减系数设置单元,用于设置当前输入场景中所述候选词的衰减系数;
排序词频生成单元,用于在输入法内核词表中按照候选词、所述候选词的词频、第一次输入所述候选词的时间、第二次输入所述候选词的时间以及第N次输入所述候选词的时间的方式来记录所述候选词的词条信息时,根据所述衰减系数设置单元设定的衰减系数以及所述词条信息通过如下算法,确定该候选词在当前输入场景中的排序词频:
M = Σ k = 1 n 1 / [ ( T [ k ] - T ) * X ] + Y
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频,T[k](时间数组,1<=k<=n),T(当前时间)。
优选的,所述词频调整模块包括:
位置调整单元,用于根据获得的所述排序词频按照从小到大的顺序确定该候选词在当前输入场景中的排列顺序;
数据修改单元,用于将输入法内核词表中所述候选词的默认词频修改为所述候选词在当前输入场景中的排序词频。
优选的,所述词频调整模块还包括:
窗口显示模块,用于将所述候选词在当前输入场景中的排列顺序进行显示。
上述本发明实施例提出的一种输入法中调整候选词顺序的方法及装置,通过根据预定的候选词排序词频的衰减系数及候选词的词条信息,确定该候选词在当前输入场景中的排序词频;并按照所述排序词频调整所述候选词的排列顺序,能够针对不同输入场景对输入法候选词的排序方式进行调整,进一步提高了输入法的易用性,更加满足了用户在不同输入场景下对输入法的个性化需求。
附图说明
图1为本发明实施例提供的输入法中调整候选词顺序的方法的流程图;
图2为本发明实施例提供的输入法中调整候选词顺序的装置的结构示意图;
图3为本发明实施例提供的输入法中调整候选词顺序的装置的具体结构示意图;
图4为本发明实施例提供的输入法中调整候选词顺序的方法的具体流程图。
具体实施
本发明实施例针对现有输入法的候选词排序方式对于不同输入场景不能提供一种合理的排序方式,无法满足用户需求的问题,提出的一种输入法中调整候选词顺序的方法及装置。
本发明实施例与现有输入法的候选词排序方式相结合,根据用户设定的候选词排序词频的衰减系数以及获取到的候选词的词条信息确定在当前输入场景中候选词的排列词频,从而修改输入法内核词表数据结构中该候选词的默认词频,智能的调整候选词在当前输入场景中的排列顺序,能够针对不同的输入场景提供相应的候选词排列顺序,完善了现有输入法技术方案中候选词的排序方式,进一步提高了输入法的易用性。
例如:当用户采用五笔输入法录入中文时,在输入栏中输入“aqtg”,此时现有候选词的排序方式中“敬重”排在“蕕”之前,理由是“敬重”相对“蕕”来说是比较常用的词,“蕕”是相对较生僻的字,因此输入机会较少。此时当用户在输入比较常用的中文内容时,现有候选词排序方式是可以满足用户需求的;
但当用户需要输入一篇关于中草药的文章时,由于“蕕”是浙江民间常用草药,因此就有可能会多次输入“蕕”字,此时,现有输入法提供的排序方式中“蕕”排在“敬重”之后,所以不能满足用户的录入需求,采用本发明实施例提供的技术方案能够在用户录入关于中草药的文章时,将“蕕”排在“敬重”之前,通过向用户提供衰减系数的设置功能,由用户自行根据需求设定的当前输入场景下候选词排列词频的衰减系数,同时结合“蕕”在输入法内核词表中的词条信息,重新确定“蕕”在当前输入场景中的排序词频,使其排在“敬重”之前,便于用户提高录入速度。
此外,由于用户设定了候选词排序词频的衰减系数,当用户写完这篇文章之后,随着“蕕”的输入次数逐渐减少,根据衰减系数及词条信息确定的“蕕”的排序词频就会递减,“敬重”这个词便会恢复到初始状态排在“蕕”的之前,不会影响输入法候选词排序方式的日常需求。
下面结合附图和具体实施方式对本发明的技术方案进行详细说明:
如图1所示,本发明实施例提出了一种输入法中调整候选词顺序的方法,技术方案包括:
步骤101:获取输入法内核词表中候选词的词条信息;
步骤102:根据预定的候选词排序词频的衰减系数及候选词的词条信息,确定该候选词在当前输入场景中的排序词频;
步骤103:按照所述排序词频调整所述候选词的排列顺序,并显示。
可见,通过上述步骤根据衰减系数及词条信息能够确定候选词在当前输入场景中的排序词频,并根据确定的排序词频重新调整候选词的排列顺序,能够在不同输入场景下,提高输入法对用户的易用性。
具体的说,在本发明的一个实施例中,通常输入法内核词表中是按照两种方式来记录每个候选词的词条信息的,因此,本发明实施例针对两种不同的记录词条信息的方式也对应的提供了两种确定该候选词在当前输入场景中的排序词频的方法,具体如下:
第一种方式:当输入法内核词表中是按照“候选词、候选词的词频及最后一次输入候选词的时间”的方式,来记录所述候选词的词条信息时,确定该候选词的排序词频可以通过如下算法实现;
M=N/[(T1-T2)*X]+Y
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,T1为当前时间,T2为最后一次输入该候选词的时间,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频。
(2)当输入法内核词表中按照“候选词、所述候选词的词频、第一次输入所述候选词的时间、第二次输入所述候选词的时间以及第N次输入所述候选词的时间”的方式,来记录所述候选词的词条信息时,确定所述排序词频包括;
M = Σ k = 1 n 1 / [ ( T [ k ] - T ) * X ] + Y
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频,T[k](时间数组,1<=k<=n),T(当前时间)。
针对上述方案具体的说,本发明实施例中衰减系数是指候选词的排序词频在一个衰减周期内的衰减次数,通常可以将一个衰减周期设定为一小时,或大于等于两小时,衰减周期的具体取值本发明实施例不作具体限定,用户可以根据自身经验值、待输入文件的预计时长或者工作时长来自行设定,0<衰减系数<1,衰减系数设定的越大,候选词排序词频衰减速度越快;
如:用户设定一个衰减周期为一小时,衰减系数为0.5,其含义是在当前输入场景下,候选词排序词频每小时按照0.5速度进行衰减。
又如:用户设定一个衰减周期为两小时,衰减系数为0.5,其含义是在当前输入场景下,候选词排序词频每两小时按照0.5的速度进行衰减。
需要说明的是,衰减系数的设定方式遵循0<衰减系数<1的取值原则,衰减系数设定的越大,候选词排序词频衰减速度越快,衰减系数设定的越小,候选词排序词频衰减速度越慢,取值不作具体限定,用户可以根据不同输入场景来自行根据需求设定的,如:待输入文档所需时间,会议时长,工作时长等等。
上述两种计算候选词排序词频的算法中提到的默认词频,本发明实施例中所述默认词频是候选词在输入法词表中的初始词频,通常表示了候选词具有一般的适用性,满足用户对日常输入法排序方式的需求。本发明实施例中的默认词频的获取方式是采用现有技术中通过大语料训练的方式获得的,因此本发明实施例中不对该默认词频的获取方式进行详细阐述。
在本发明的一个实施例中,按照所述排序词频调整所述候选词的排列顺序,可以通过如下技术方案实现:
根据获得的所述排序词频按照从大到小的顺序确定该候选词在当前输入场景中的排列顺序,并将输入法内核词表中所述候选词的默认词频修改为所述候选词在当前输入场景中的排序词频。
具体的说,在确定每个候选词在当前输入场景中的排序词频后,由于本发明实施例提出的技术方案是根据排序词频对候选词的排列顺序进行调整,该候选词的排序词频与该输入法内核词表中的默认词频不同,因此要对输入法内核词表中候选词的默认词频进行修改,以便在当前输入场景中根据获得的排序词频对候选词进行排列。
需要说明的是,本发明在具体实现的过程中,根据候选词排列词频确定当前输入场景中的排列顺序,以及,根据候选词的排序词频修改输入法内核词表中的默认词频,这两个步骤本发明实施例不限定具体的先后顺序,可以先修改输入法内核词表中的默认词频,也可以先调整当前输入场景中的排列顺序,还可以两个步骤同时执行,只要能够实现本发明的技术方案即可。
在本发明的一个实施例中,输入法中调整候选词顺序的方法还可以包括:
将所述候选词在当前输入场景中的排列顺序通过候选词窗口进行显示。
具体的说,根据当前输入场景中候选词的排序词频对现有候选词排序方式进行调整,通过候选词窗口显示给用户的候选词,很大程度上可以满足用户在不同输入场景下的需求,能够提高用户的录入速度。
如图2所示,基于上述图1实施例所述方法,本发明还提供了一种输入法中调整候选词顺序的装置,可以包括如下功能模块:
词频处理模块21,用于获得输入法内核词表中候选词的词条信息,并根据预定的候选词排序词频的衰减系数及候选词的词条信息,确定所述候选词在当前输入场景中的排序词频;
词频调整模块22,用于按照所述词频处理模块确定的所述排序词频调整所述候选词的排列顺序,并显示。
可见,通过上述功能模块,根据衰减系数及词条信息能够确定候选词在当前输入场景中的排序词频,并根据确定的排序词频重新调整候选词的排列顺序,能够在不同输入场景下,提高输入法对用户的易用性。
在本发明的一个实施例中,通常输入法内核词表中是按照两种方式来记录每个候选词的词条信息的,因此本发明实施例针对两种不同的记录词条信息的方式也对应的提供了两种确定该候选词在当前输入场景中的排序词频的方式:
第一种方式,如图3所示,所述词频处理模块21可以进一步包括:
衰减系数设置单元211,用于设置当前输入场景中所述候选词的衰减系数;
排序词频生成单元212,用于在输入法内核词表中按照候选词、所述候选词的词频及最后一次输出所述候选词的时间来记录所述候选词的词条信息时,根据所述时间设置单元设定的衰减系数以及所述词条信息,通过如下算法确定该候选词在当前输入场景中的排序词频:
M=N/[(T1-T2)*X]+Y
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,T1为当前时间,T2为最后一次输入该候选词的时间,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频。
第二种方式,所述词频处理模块21可以进一步包括:
衰减系数设置单元211,用于设置当前输入场景中所述候选词的衰减系数;
排序词频生成单元212,用于在输入法内核词表中按照候选词、所述候选词的词频、第一次输入所述候选词的时间、第二次输入所述候选词的时间以及第N次输入所述候选词的时间的方式来记录所述候选词的词条信息时,根据所述衰减系数设置单元设定的衰减系数以及所述词条信息通过如下算法,确定该候选词在当前输入场景中的排序词频:
M = Σ k = 1 n 1 / [ ( T [ k ] - T ) * X ] + Y
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频,T[k](时间数组,1<=k<=n),T(当前时间)。
针对上述方案具体的说,本发明实施例中衰减系数是指候选词的排序词频在一个衰减周期内的衰减次数,通常可以将一个衰减周期设定为一小时,或大于等于两小时,衰减周期的具体取值本发明实施例不作具体限定,用户可以根据自身经验值、待输入文件的预计时长或者工作时长来自行设定,0<衰减系数<1,衰减系数设定的越大,候选词排序词频衰减速度越快;衰减周期和衰减系数的具体具体可以参见图1的方法实施例中的相关描述,在此不作赘述。
衰减系数的设定方式遵循0<衰减系数<1的取值原则,衰减系数设定的越大,候选词排序词频衰减速度越快,衰减系数设定的越小,候选词排序词频衰减速度越慢,取值不作具体限定,用户可以根据不同输入场景来自行根据需求设定的,如:待输入文档所需时间,会议时长,工作时长等等。
上述两种计算候选词排序词频的算法中提到的默认词频,本发明实施例中所述默认词频是候选词在输入法词表中的初始词频,通常表示了候选词具有一般的适用性,满足用户对日常输入法排序方式的需求。本发明实施例中的默认词频的获取方式是采用现有技术中通过大语料训练的方式获得的,因此本发明实施例中不对该默认词频的获取方式进行详细阐述。
在本发明的一个实施例中,所述词频调整模块22可以进一步包括:
位置调整单元221,用于根据获得的所述排序词频按照从小到大的顺序确定该候选词在当前输入场景中的排列顺序;
数据修改单元222,用于将输入法内核词表中所述候选词的默认词频修改为所述候选词在当前输入场景中的排序词频。
需要说明的是,本发明在具体实现的过程中,位置调整单元和数据修改单元的实现过程的先后顺序,本发明实施例中不作具体限定,数据修改单元可以先修改输入法内核词表中的默认词频,位置调整单元也可以先调整当前输入场景中的排列顺序,还可以两个模块同时执行其功能,只要能够实现本发明的技术方案即可。
在本发明的一个实施例中,上述词频调整模块22还可以进一步包括:
窗口显示模块223,用于将所述候选词在当前输入场景中的排列顺序进行显示。
需要说明的是,由于上述装置实施例是基于图1所述方法实施例获得的,因此各功能模块涉及的技术方案与图1实施例中的各步骤涉及的技术方案对应,在此不作一一赘述,具体可参见上述图1实施例中的具体说明。
为了更加清楚的对本发明实施例一种输入法中调整候选词顺序的方法的技术方案的理解,下面以现有输入法为五笔输入法为例进行说明,但并不限定于如下实例:
当输入法内核词表数据结构中采用候选词、该候选词的词频、最后一次输入该候选词的时间的方式,来记录词条信息时,输入法内核词表数据结构如下表所示:
Figure BSA00000218868700111
在上述表格中,“敬重”的默认词频为1,“蕕”的默认词频为0.1,采用现有的五笔输入法候选词排序方式时,在用户输入“aqtg”后,由于“敬重”的默认词频大于“蕕”的默认词频,因此“敬重”排在了“蕕”之前,因此现有输入法排序方式如下表所示:
Figure BSA00000218868700112
当用户要输入一篇关于中草药的文章时,由于“敬重”默认词频大于“蕕”的默认词频,“敬重”排在了“蕕”之前,但用户会在录入过程中多次输入“蕕”,因此现有的候选词排序方法不能满足用户在当前输入场景中的需求。
针对这种输入场景采用本发明实施例提出的输入法中调整候选词顺序的技术方案的具体流程如下:
401、设定当前输入场景下候选词排序词频的衰减系数;
具体的,用户针对当前输入场景,根据自身需求或经验值自行设定衰减周期及衰减系数,例如在本发明实施例中,用户待输入文件的预计工作时长为两小时,因此用户可以将衰减周期设定为一小时,衰减系数设定为0.5,注:0<衰减系数<1,衰减系数设定的越大,候选词的排列词频衰减的速度越快,反之,则候选词的排列词频衰减的速度越慢;
402、根据用户设定的候选词排序词频的衰减系数及候选词的词条信息确定候选词当前输入场景中的排序词频;
具体的,当用户在当前输入场景中,多次输入“蕕”这个候选词上屏后,如:词库文件中记录的“蕕”的累计总词频为100次,最后一次输入时间是2000,当前时间是2100,用户设定的候选词排序词频的衰减系数为0.5,“蕕”的默认词频是0.1,那么通过图1实施例中第一种确定该排序词频的方法,计算出“蕕”在当前输入场景中的排序词频:
M1=100/[(2100-2000)*O.5]+0.1=2.1;
此时,词库文件中记录的“敬重”的累计总词频为10次,最后一次输入时间为1900,“敬重”的默认词频为1,因此“敬重”在当前输入场景中的排序词频:
M2=10/[(2100-1900)*0.5]+1=1.1;
403、根据获得的候选词的排序词频,将输入法内核词表中候选词的默认词频修改为该候选词在当前输入场景中的排序词频;
具体的,根据步骤402中获得的当前应用场景中,“蕕”的排序词频2.1,“敬重”的排序词频1.1,对此时输入法内核词表中分别对应的两个词的初始词频记录进行修改,修改后的词表结构如下表所示:
Figure BSA00000218868700121
404、根据获得的所述排序词频按照从小到大的顺序确定该候选词在当前输入场景中的排列顺序,并显示;
具体的,按照重新确定的排序词频对该候选词的排列顺序进行调整,当用户下次再输入“aqtg”的时候,候选词窗口就是调整后的顺序,如下表所示:
aqtg|
1.蕕  2.敬重
需要说明的是,本发明在具体实现的过程中,步骤403和步骤404执行的先后顺序,本发明实施例不作具体限定,可以先执行步骤403,也可以先执行步骤404,还可以两个步骤同时执行,只要能够实现本发明的技术方案即可。
需要说明的是,当用户将中草药的文章输入完毕后,很长一段时间没有再次输入“蕕”,此时当前时间为3000,根据图1实施例中第一种确定该排序词频的方法计算获得当前时刻“蕕”的排序词频:
M1=100/(3000-2000)*0.5+0.1=0.3;
“敬重”的排序词频:
M2=10/(3000-1900)*0.5+1=1.02,
这时“敬重”的排序词频就高于“蕕”的排序词频,因此“敬重”就又排到了“蕕”的前面,此时,根据当前的排序词频对输入法内核中的词表数据结构的“aqtg”记录做相应的修改,修改后的词表结构如下表所示:
Figure BSA00000218868700131
按照获得的排序词频对候选词的排列顺序进行调整,当用户下次输入“aqtg”的时候,候选词窗口显示的就是如下表所示的调整后的顺序,“敬重”排在了“蕕”之前,能够满足用户日常输入过程中的需求:
aqtg|
1.敬重  2.蕕
需要说明的是,上述应用实例是采用图1方法实施例中第一种确定该排序词频的方法计算获得候选词的排列词频的,但上述具体流程对于第二种确定该排序词频的方法计算出的候选词的排列词频同样适用,差别仅在于获得排列词频的计算过程不同,因此不论是采用图1实施例中第一种还是第二种确定该排序词频的方法,均属于本发明实施例的保护范围。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (10)

1.一种输入法中调整候选词顺序的方法,其特征在于,包括:
获取输入法内核词表中候选词的词条信息;
根据预定的候选词排序词频的衰减系数及候选词的词条信息,确定所述候选词在当前输入场景中的排序词频;
按照所述排序词频调整所述候选词的排列顺序,并显示。
2.根据权利要求1所述的方法,其特征在于,确定所述候选词在当前输入场景中的排序词频,包括:
当输入法内核词表中按照候选词、所述候选词的词频及最后一次输入所述候选词的时间的方式,来记录所述候选词的词条信息时,确定所述排序词频包括;
M=N/[(T1-T2)*X]+Y
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,T1为当前时间,T2为最后一次输入该候选词的时间,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频。
3.根据权利要求1所述的方法,其特征在于,确定所述候选词在当前输入场景中的排序词频,包括:
当输入法内核词表中按照候选词、所述候选词的词频、第一次输入所述候选词的时间、第二次输入所述候选词的时间以及第N次输入所述候选词的时间的方式,来记录所述候选词的词条信息时,确定所述排序词频包括;
M = Σ k = 1 n 1 / [ ( T [ k ] - T ) * X ] + Y
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频,T[k](时间数组,1<=k<=n),T(当前时间)。
4.根据权利要求2或3所述的方法,其特征在于,按照所述排序词频调整所述候选词的排列顺序,包括:
根据获得的所述排序词频按照从大到小的顺序确定该候选词在当前输入场景中的排列顺序,并将输入法内核词表中所述候选词的默认词频修改为所述候选词在当前输入场景中的排序词频。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
将所述候选词在当前输入场景中的排列顺序通过候选词窗口进行显示。
6.一种输入法中调整候选词顺序的装置,其特征在于,包括:
词频处理模块,用于获取输入法内核词表中候选词的词条信息,根据预定的候选词排序词频的衰减系数及候选词的词条信息,确定所述候选词在当前输入场景中的排序词频;
词频调整模块,用于按照所述词频处理模块确定的所述排序词频调整所述候选词的排列顺序,并显示。
7.根据权利要求6所述的装置,其特征在于,所述词频处理模块包括:
衰减系数设置单元,用于设置当前输入场景中所述候选词的衰减系数;
排序词频生成单元,用于在输入法内核词表中按照候选词、所述候选词的词频及最后一次输入所述候选词的时间,来记录所述候选词的词条信息时,根据所述时间设置单元设定的衰减系数以及所述词条信息,通过如下算法确定该候选词在当前输入场景中的排序词频:
M=N/[(T1-T2)*X]+Y
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,T1为当前时间,T2为最后一次输入该候选词的时间,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频。
8.根据权利要求6所述的装置,其特征在于,所述词频处理模块包括:
衰减系数设置单元,用于设置当前输入场景中所述候选词的衰减系数;
排序词频生成单元,用于在输入法内核词表中按照候选词、所述候选词的词频、第一次输入所述候选词的时间、第二次输入所述候选词的时间以及第N次输入所述候选词的时间的方式来记录所述候选词的词条信息时,根据所述衰减系数设置单元设定的衰减系数以及所述词条信息通过如下算法,确定该候选词在当前输入场景中的排序词频:
M = Σ k = 1 n 1 / [ ( T [ k ] - T ) * X ] + Y
其中,M为该候选词在当前输入场景中的排序词频,N为词库文件中记录的该候选词的总词频,X为预定的候选词排序词频的衰减系数,Y为该候选词的默认词频,T[k](时间数组,1<=k<=n),T(当前时间)。
9.根据权利要求7或8所述的装置,其特征在于,所述词频调整模块包括:
位置调整单元,用于根据获得的所述排序词频按照从小到大的顺序确定该候选词在当前输入场景中的排列顺序;
数据修改单元,用于将输入法内核词表中所述候选词的默认词频修改为所述候选词在当前输入场景中的排序词频。
10.根据权利要求9所述的装置,其特征在于,所述词频调整模块还包括:
窗口显示模块,用于将所述候选词在当前输入场景中的排列顺序进行显示。
CN201010244398.5A 2010-07-29 2010-07-29 一种输入法中调整候选词顺序的方法及装置 Active CN102346560B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010244398.5A CN102346560B (zh) 2010-07-29 2010-07-29 一种输入法中调整候选词顺序的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010244398.5A CN102346560B (zh) 2010-07-29 2010-07-29 一种输入法中调整候选词顺序的方法及装置

Publications (2)

Publication Number Publication Date
CN102346560A true CN102346560A (zh) 2012-02-08
CN102346560B CN102346560B (zh) 2016-09-28

Family

ID=45545293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010244398.5A Active CN102346560B (zh) 2010-07-29 2010-07-29 一种输入法中调整候选词顺序的方法及装置

Country Status (1)

Country Link
CN (1) CN102346560B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103376909A (zh) * 2012-04-19 2013-10-30 腾讯科技(深圳)有限公司 输入法中调整候选词顺序的方法和系统
CN104111737A (zh) * 2014-03-13 2014-10-22 邵德子 办公自动化
CN104536976A (zh) * 2014-12-05 2015-04-22 苏州沃斯麦机电科技有限公司 基于九宫格输入模式的联想输入系统
CN104731364A (zh) * 2015-03-30 2015-06-24 天脉聚源(北京)教育科技有限公司 一种输入法及输入法系统
WO2016150346A1 (zh) * 2015-03-20 2016-09-29 上海触乐信息科技有限公司 文本输入方法和装置
CN106873799A (zh) * 2017-02-16 2017-06-20 北京百度网讯科技有限公司 输入方法和装置
CN106933381A (zh) * 2017-03-16 2017-07-07 联想(北京)有限公司 一种信息处理方法及装置
CN108319377A (zh) * 2018-02-07 2018-07-24 北京百度网讯科技有限公司 场景化文字输入的方法及系统、终端以及计算机可读存储介质
CN109145126A (zh) * 2018-06-27 2019-01-04 珠海市魅族科技有限公司 一种备选词的展示方法和装置、终端、可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080100579A1 (en) * 1999-05-27 2008-05-01 Robinson B A Keyboard System with Automatic Correction
CN101271459A (zh) * 2007-03-22 2008-09-24 北京搜狗科技发展有限公司 一种生成词库的方法、一种输入的方法和一种输入法系统
CN201307268Y (zh) * 2008-11-13 2009-09-09 无敌科技(西安)有限公司 可更新的输入装置
CN101727201A (zh) * 2009-12-14 2010-06-09 北京搜狗科技发展有限公司 一种对符号排列进行自动调整的方法、装置和输入法系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080100579A1 (en) * 1999-05-27 2008-05-01 Robinson B A Keyboard System with Automatic Correction
CN101271459A (zh) * 2007-03-22 2008-09-24 北京搜狗科技发展有限公司 一种生成词库的方法、一种输入的方法和一种输入法系统
CN201307268Y (zh) * 2008-11-13 2009-09-09 无敌科技(西安)有限公司 可更新的输入装置
CN101727201A (zh) * 2009-12-14 2010-06-09 北京搜狗科技发展有限公司 一种对符号排列进行自动调整的方法、装置和输入法系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103376909A (zh) * 2012-04-19 2013-10-30 腾讯科技(深圳)有限公司 输入法中调整候选词顺序的方法和系统
CN104111737A (zh) * 2014-03-13 2014-10-22 邵德子 办公自动化
CN104536976A (zh) * 2014-12-05 2015-04-22 苏州沃斯麦机电科技有限公司 基于九宫格输入模式的联想输入系统
WO2016150346A1 (zh) * 2015-03-20 2016-09-29 上海触乐信息科技有限公司 文本输入方法和装置
CN104731364A (zh) * 2015-03-30 2015-06-24 天脉聚源(北京)教育科技有限公司 一种输入法及输入法系统
CN106873799A (zh) * 2017-02-16 2017-06-20 北京百度网讯科技有限公司 输入方法和装置
CN106873799B (zh) * 2017-02-16 2020-10-09 北京百度网讯科技有限公司 输入方法和装置
CN106933381A (zh) * 2017-03-16 2017-07-07 联想(北京)有限公司 一种信息处理方法及装置
CN108319377A (zh) * 2018-02-07 2018-07-24 北京百度网讯科技有限公司 场景化文字输入的方法及系统、终端以及计算机可读存储介质
CN108319377B (zh) * 2018-02-07 2019-05-31 北京百度网讯科技有限公司 场景化文字输入的方法及系统、终端以及计算机可读存储介质
CN109145126A (zh) * 2018-06-27 2019-01-04 珠海市魅族科技有限公司 一种备选词的展示方法和装置、终端、可读存储介质

Also Published As

Publication number Publication date
CN102346560B (zh) 2016-09-28

Similar Documents

Publication Publication Date Title
CN102346560A (zh) 一种输入法中调整候选词顺序的方法及装置
CN110110041B (zh) 错词纠正方法、装置、计算机装置及存储介质
CN100555203C (zh) 修正已输入文字的系统及方法
CN100472411C (zh) 输入法中取消字符串的方法及文字输入系统
US8504350B2 (en) User-interactive automatic translation device and method for mobile device
CN1259632C (zh) 纠正文本文档的文本输入的方法和系统
CN101622616B (zh) 共享语言模型
US20080180283A1 (en) System and method of cross media input for chinese character input in electronic equipment
US4468756A (en) Method and apparatus for processing languages
CN105404621A (zh) 一种用于盲人读取汉字的方法及系统
CN101004738A (zh) 文字输入装置、具备该文字输入装置及文字输入方法
CN102165438A (zh) 信息处理装置及信息处理方法
CN100559332C (zh) 恢复已删文字的系统及方法
CN101520693A (zh) 一种批量信息快速输入的方法及系统
Kirmizialtin et al. Automated transcription of non-Latin script periodicals: a case study in the ottoman Turkish print archive
Wolf-Sonkin et al. Latin script keyboards for South Asian languages with finite-state normalization
Koanantakool et al. Computers and the thai language
CN100535836C (zh) 在中文输入法中恢复候选词顺序的方法及系统
Nkiko et al. Information Technology and Transcription of Reading Materials for the Visually Impaired Persons in Nigeria.
CN101488044B (zh) 一种语音和单笔混合式计算机汉字输入法
CN103853705A (zh) 计算机汉语语音与外语语音实时语音字幕翻译方法
CN102375817A (zh) 一种获取自造词的方法及装置
CN101373407A (zh) 手机汉字韵母族群录入法
CN105487684A (zh) 拼音汉字字符的输出方法和拼音汉字字符的输出装置
Bahar et al. Take the hint: Improving Arabic diacritization with partially-diacritized text

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: SHENZHEN SHIJI LIGHT SPEED INFORMATION TECHNOLOGY

Free format text: FORMER OWNER: TENGXUN SCI-TECH (SHENZHEN) CO., LTD.

Effective date: 20131030

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 518028 SHENZHEN, GUANGDONG PROVINCE TO: 518057 SHENZHEN, GUANGDONG PROVINCE

TA01 Transfer of patent application right

Effective date of registration: 20131030

Address after: A Tencent Building in Shenzhen Nanshan District City, Guangdong streets in Guangdong province science and technology 518057 16

Applicant after: Shenzhen Shiji Guangsu Information Technology Co., Ltd.

Address before: 2 East 403 room, SEG science and technology garden, Futian District, Guangdong, Shenzhen 518028, China

Applicant before: Tencent Technology (Shenzhen) Co., Ltd.

C14 Grant of patent or utility model
GR01 Patent grant