CN105446495A - 一种候选排序方法和装置 - Google Patents

一种候选排序方法和装置 Download PDF

Info

Publication number
CN105446495A
CN105446495A CN201510897919.XA CN201510897919A CN105446495A CN 105446495 A CN105446495 A CN 105446495A CN 201510897919 A CN201510897919 A CN 201510897919A CN 105446495 A CN105446495 A CN 105446495A
Authority
CN
China
Prior art keywords
candidate item
candidate
character string
item
adjustment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510897919.XA
Other languages
English (en)
Inventor
汤沛
刘辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201510897919.XA priority Critical patent/CN105446495A/zh
Publication of CN105446495A publication Critical patent/CN105446495A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供了一种候选排序方法和装置。所述方法包括:获取用户输入的字符串;转换所述字符串得到至少一个第一候选项;接收用户选择的第一候选项,转换剩余字符串得到至少一个第二候选项;利用所述至少一个第一候选项调整所述至少一个第二候选项。本发明可以避免原有的重复展现方式浪费用户筛选的时间,提升输入法在半选状态下的候选展现的质量,提高输入效率。

Description

一种候选排序方法和装置
技术领域
本发明涉及计算机信息输入技术领域,特别是涉及一种候选排序方法和一种候选排序装置。
背景技术
语言是时代文化的产物,每时每刻都处在变化和发展中,在当下的互联网时代新的词汇和表达方式更是层出不穷。由于汉语言本身也具有高度个性化和灵活多变的特点,所以发展至今,输入法依然无法100%覆盖用户的表达,总会出现的一种情况是:用户输入某一字母串后,输入法无法提供用户所需的目标字词。
手动组词是输入法中最为普遍和基础的功能,输入法不仅会提供完整匹配的文字候选项,还会提供前缀匹配的文字片段候选项,若完整匹配并非用户所需目标字词,则可以手动选择文字片段,这种“选择片段”的状态称为手动组词的半选状态。此时输入法会保留用户选择的片段作为上文,结合词对信息对剩余的字母串再进行转换,得到当前候选项。这种“选择片段+转换剩余字符串”的过程可能重复多次,直至所有的字母串都转换完毕,此时用户会最终得到自己想要的文字。
而半选状态下候选项的排序策略是独立于用户输入字母串后输入法的第一次转换过程的,几乎与完整转换时无异。而这样的相对独立可能会增加无效的展现,影响候选排序的质量。目前已有方案会将用户已经选择的文字片段作为上文,来对当前候选项进行顺序调整,也就是上下文调频。
但存在一个较为明显的局限是,在借鉴上下文调频技术时,用于上下文调频的词对信息和对原始字母串进行转换时参考的是同一份词对信息。而用户开始进行手动组词,也就等同于确认了之前输入法展现的完整匹配的候选项都未命中。所以常常会出现这样的情况:半选文字片段和当前候选项组成的词,是用户已经在半选状态下确认的未命中文字,而且这样的候选项由于经过词对信息调频,往往会展现在非常靠前的位置。
例如,用户想打“需要手钳”,于是输入“xuyaoshouqian”,输入法正常转换得到了唯一的完整匹配候选项,是组词“需要收钱”;接着用户半选“需要”,还剩下字母串“shouqian”,此时输入法给出的候选项中“收钱”被排在第一位,而用户真正需要的“手钳”则被挤到更靠后的位置。
因此,现有方案并未考虑手动组词的场景特殊性,从而影响输入法在半选状态下的候选排序质量。本发明则旨在针对半选状态的特点,提供一种有针对性的候选排序优化方案。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种候选排序方法和一种候选排序装置。
为了解决上述问题,本发明实施例公开了一种候选排序方法,包括:
获取用户输入的字符串;
转换所述字符串得到至少一个第一候选项;
接收用户选择的第一候选项,转换剩余字符串得到至少一个第二候选项;
利用所述至少一个第一候选项调整所述至少一个第二候选项。
优选地,所述利用所述至少一个第一候选项调整所述至少一个第二候选项包括:
判断所述至少一个第二候选项是否与所述已选的第一候选项组成所述字符串对应的某个第一候选项;
若是,则调整所述至少一个第二候选项。
优选地,所述某个第一候选项为完整匹配所述字符串的至少一个第一候选项,在所述接收用户选择的第一候选项之前,所述方法还包括:
记录完整匹配所述字符串的至少一个第一候选项。
优选地,所述调整所述至少一个第二候选项为,调整所述至少一个第二候选项的排序。
优选地,所述调整所述至少一个第二候选项的排序包括:
提取与所述已选的第一候选项组成所述某个第一候选项的第二候选项;
对所述提取的第二候选项进行词频惩罚,并按序展示词频惩罚后的至少一个第二候选项。
优选地,所述对所述提取的第二候选项进行词频惩罚,并按序展示词频惩罚后的至少一个第二候选项包括:
对提取的第二候选项配置惩罚权重;
按照所述惩罚权重重新计算所述提取的第二候选项的词条频率;
按照重新计算的词条频率对各第二候选项进行排序并按序展示。
优选地,所述方法还包括:
重复执行所述转换字符串、所述接收用户选择和所述调整第二候选项的步骤,直至所述字符串全部转换完毕。
优选地,在所述利用所述至少一个第一候选项调整所述至少一个第二候选项之前,所述方法还包括:
将所述至少一个第一候选项存入缓存;
在所述利用所述至少一个第一候选项调整所述至少一个第二候选项之后,所述方法还包括:
清除所述缓存中的至少一个第一候选项。
本发明还提供了一种候选排序装置,包括:
字符串获取模块,用于获取用户输入的字符串;
第一转换模块,用于转换所述字符串得到至少一个第一候选项;
选择接收模块,用于接收用户选择的第一候选项;
第二转换模块,用于转换剩余字符串得到至少一个第二候选项;
候选项调整模块,用于利用所述至少一个第一候选项调整所述至少一个第二候选项。
本发明还提供了一种用于候选排序的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户输入的字符串;
转换所述字符串得到至少一个第一候选项;
接收用户选择的第一候选项,转换剩余字符串得到至少一个第二候选项;
利用所述至少一个第一候选项调整所述至少一个第二候选项。
优选地,所述处理器还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:
判断所述至少一个第二候选项是否与所述已选的第一候选项组成所述字符串对应的某个第一候选项;
若是,则调整所述至少一个第二候选项。
优选地,所述处理器还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:
所述某个第一候选项为完整匹配所述字符串的至少一个第一候选项,
在所述接收用户选择的第一候选项之前,记录完整匹配所述字符串的至少一个第一候选项。
优选地,所述处理器还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:
重复执行所述转换字符串、所述接收用户选择和所述调整第二候选项的步骤,直至所述字符串全部转换完毕。
依据本发明实施例,转换字符串得到至少一个第一候选项,在用户选择第一候选项之后,对剩余字符串继续转换得到第二候选项,并利用所述第一候选项调整第二候选项,避免原有的重复展现方式浪费用户筛选的时间,提升输入法在半选状态下的候选展现的质量,提高输入效率。
附图说明
图1是本发明的一种候选排序方法实施例1的步骤流程图;
图2是本发明的一种候选排序方法实施例2的步骤流程图;
图3是本发明的候选排序过程示意图;
图4是本发明的一种候选排序装置实施例的结构框图;
图5是根据一示例性实施例示出的一种用于候选排序的装置的框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明的一种候选排序方法实施例1的步骤流程图,具体可以包括如下步骤:
步骤101,获取用户输入的字符串。
本发明所涉及的输入法客户端,包括但不限于PC、手机、平板等输入法客户端。
此处字符串可以是字母串或包括符号的字母串,也可以是标记字母或字符的至少一个标识组成的字符串,其中,一个标识可以对应标记一个字母,也可以同时标记多个字母。
步骤102,转换所述字符串得到至少一个第一候选项。
输入法对字符串进行转换后,可以得到完整匹配该字符串的一个或多个候选项,以及前缀匹配该字符串的一个或多个候选项。所述候选项可以为字符串对应文字,也可以为符号,或是文字与字符的组合,或是其他与字符串对应的转换结果。
步骤103,接收用户选择的第一候选项,转换剩余字符串得到至少一个第二候选项。
在用户进入手动组词的半选状态时,即选择前缀匹配字符串的候选项时,根据用户选择的第一候选项,以及第一候选项对应的部分字符串,可以得到剩余未转换的字符串,进一步对剩余字符串进行转换,得到供用户选择的一个或多个第二候选项。
具体而言,输入法对剩余字符串会重新进行转换,按照拼音转换的方式进行。
当字符串为字母串或包括符号的字母串时,首先需要将剩余字符串转化成拼音串,再用拼音串去匹配获得第二候选项。
具体可以在预置的词库中,利用拼音串匹配得到相应的词库词,也可以利用预置的语言模型中的词对信息对拼音串进行组词,这两种方式可以择一使用、或同时使用或先后使用,还可以单一采用或是组合使用其他任意适用的方式转换字符串,本发明对此并不做限制。
在进行字符串转换时,同时对拼音串和拼音串的前缀进行转换,以得到完整匹配字符串的第二候选项以及前缀匹配字符串的第二候选项。
当字符串由标记字母或字符的至少一个标识组成时,在转换剩余字符串时,首先需要将所述剩余字符串中各个标识标记的字母或符号,组合为多种字母串或包含字符的字母串,需要按照各个标识所标记的多个字母进行组合,得到多种不同的字母串组合,进一步可以展示给用户,并检测用户的对其中一个字母串或包含字符的字母串的选择操作。
以九宫格输入法为例,九个对应九个数字,每个数字分别对应多个不同的字母,例如,2对应字母A、B和C,3对应字母D、E和F,九个字母共标记26个英文字母,用户通过九宫格选择字母时,点选的数字分别对应的字母,可以组成不同的字母组合。例如,字母串“74687426”对应的字母组合可以有多种,用户可以通过点选选择所需的[shou][qian]。
步骤104,利用所述至少一个第一候选项调整所述至少一个第二候选项。
本发明实施例根据至少一个第一候选项对至少一个第二候选项进行调整,以对其中至少一个第二候选项进行区分,可以是调整第二候选项的排序,也可以是调整第二候选项的展示方式,可以是进行字体和展示效果的特殊处理等,例如,字体调大或是高亮显示,还可以是其他任意适用的方式。
本发明实施例中,根据至少一个第一候选项对待展示的至少一个第二候选项进行调整,相比于原有的对第二候选项进行展示的方案,可以避免原有的重复展现方式浪费用户筛选的时间,提升输入法在半选状态下的候选展现的质量,提高输入效率。
本发明实施例中,优选地,所述步骤104可以包括:
子步骤A1,判断所述至少一个第二候选项是否与已选的第一候选项组成所述字符串对应的某个第一候选项,若是,则执行子步骤A2;
子步骤A2,调整所述至少一个第二候选项。
本发明在得到至少一个第二候选项后,进一步需要将第一候选项作为参考,由于在半选状态下,除去用户已经选择的第一候选项之外,其余未被选择的第一候选项是用户不需要的,针对与已选第一候选项组成某个未被选择的第一候选项的第二候选项,可以确定该第二候选项并非用户所需,因此需要在展示第二候选项时,对该第二候选项进行调整,提高候选展现的质量。
本发明实施例中,优选地,在利用所述至少一个第一候选项调整所述至少一个第二候选项之前,还可以将所述至少一个第一候选项存入缓存,以便在利用第一候选项调整第二候选项时快速提取该第一候选项。
相应的,在所述利用所述至少一个第一候选项调整所述至少一个第二候选项之后,还可以清除所述缓存中的第一候选项,以减少无用数据对缓存的占用。
基于上述实施例一,提供本发明优选的实施例二。
参照图2,示出了本发明的一种候选排序实施例2的步骤流程图,具体可以包括如下步骤:
步骤201,获取用户输入的字符串。
步骤202,转换所述字符串得到至少一个第一候选项。
步骤203,记录完整匹配所述字符串的至少一个第一候选项。
与上个实施例区别的是,本实施例中,在得到至少一个候选项之后,记录完整匹配字符串的至少一个第一候选项,作为下一次候选项的排序参考。
步骤204,接收用户选择的第一候选项,转换剩余字符串得到至少一个第二候选项。
步骤205,判断所述至少一个第二候选项是否与已选的第一候选项组成完整匹配所述字符串的至少一个第一候选项,若是,则执行步骤206。
步骤206,调整所述至少一个第二候选项的排序。
本发明在得到第二候选项后,进一步需要参考完整匹配的字符串的第一候选项作为参考,由于在处于半选状态时,已经确认该完整匹配的第一候选项未被选中,从而可以确定与已选第一候选项组成完整匹配的第一候选项的第二候选项并非用户所需,因此需要在展示第二候选项时,对将提取该第二候选项并对其排序进行调整,提高候选展现的质量。
具体调序可以是对与已选第一候选项组成完整匹配的第一候选项的第二候选项的展示顺序进行调整,也可以是对所有第二候选项的排序进行调整。针对将该目标第二候选项,可以将其排序调整至某个预设排序,或是降低预设位数,或是调整至不在首屏展示,或是其他任意适用的方式。
步骤207,重复执行步骤202-步骤206,直至所述字符串都转换完毕。
对至少一个第二候选项进行调整后,进一步展示给用户,在用户选择某个第二候选项之后,继续对剩余字符串进行转换,并根据至少一个第二候选项继续调整对剩余字符串进行转换后得到的候选项,如此循环,直至所有字符串都转换完毕,将用户各次选择的候选项进行拼接得到用户输入的字符串对应的转换结果。
本发明实施例中,优选地,所述步骤206可以包括:
子步骤A3,提取与所述已选的第一候选项组成所述某个第一候选项的第二候选项;
子步骤A4,对所述提取的第二候选项进行词频惩罚,并按序展示词频惩罚后的至少一个第二候选项。
在提取出与已选的第一候选项组成完整匹配的第一候选项的第二候选项后,本发明对该第二候选项进行词频惩罚,通过降低其词频的方式来将其在所有第二候选项中的排序调后。
词频惩罚方式的方式有多种,例如,采用权重计算法,对待惩罚的第二候选项的词条频率配置惩罚权重,并按照惩罚权重重新计算其词条频率,以使得调整后的词条频率排序靠后。具体而言,惩罚权重用于对待惩罚的第二候选项进行词频惩罚,可以依据当前需求动态生成,即依据各第二候选项的词条频率动态配置生成,用以保证惩罚后的第二候选项排序靠后。确定惩罚权重后,按照惩罚权重对待惩罚的第二候选项重新进行权重计算,例如,将惩罚权重配置为负值,则采用将其词条频率与惩罚权重进行加权,再与该词条频率相加作为调整后的词条频率;或将惩罚权重配置为小于1的百分数,从而计算待惩罚的第二候选项与惩罚权重的乘积作为调整后的词条频率;还可以采用其他适用的权重计算方法与惩罚权重的确定方法。具体采用的权重计算方法与惩罚权重的确定方法可以对应,以确保惩罚后的第二候选项的词条频率排序靠后。
词频惩罚还可以采用差值法,计算待惩罚的第二候选项的词条频率与某个第二候选项或是所有第二候选项的均值的差值,将该差值或是根据该差值确定的另一个值作为调频值,将待惩罚的第二候选项的词条频率减去该调频值,作为调整后的词条频率,按照重新计算的词条频率对各第二候选项进行排序并按序展示,以使调整后的待惩罚的第二候选项的词条频率排序靠后。
具体实现中,还可以采用任意适用的词频惩罚方式,本发明对此并不做限制。
对词频进行惩罚时,为避免无效展现,可以将待惩罚的第二候选项的词频调整至小于本次候选的首屏展示范围,首屏展示的候选是对候选项按照词条频率由大到小排序在前N位的候选进行展示,N为待上屏区展示的候选项的个数,即首屏展示候选项的个数,待上屏区是指展示候选项的区域。
具体可以在确定首屏展示候选项的个数N后,将待惩罚的第二候选项的词频调整至排序前N位之外,将其排除在首屏候选之外,从而避免展示在首屏展示范围。
在对与已选的第一候选项组成所记录的第一候选项的第二候选项进行词频惩罚后,可以对第二候选项进行排序,由于在半选状态时已经确认该第二候选项并未命中,对其进行词频惩罚,可以避免该第二候选项展示在靠前的位置,避免无效的展现,提高了候选排序的质量。
本发明实施例中,优选地,在根据所述至少一个第一候选项对所述至少一个第二候选项进行调整之前,还可以根据已选的第一候选项对转换所选择的字母串得到第二候选项进行上下文调频。即,在转换剩余字符串得到第二候选项后,可以将已选的第一候选项作为上文,结合词对信息(比如二元)对剩余字母串进行转换。例如可以利用输入法语言模型中的词对信息来调整当前所有候选项的排序,对于和已选的第一候选项有强关系的第二候选项,在排序时会被赋予更高的词频。
具体而言,根据已选的第一候选项对转换所选择的字母串得到第二候选项进行上下文调频可以包括:
子步骤A5,按照语言模型的词对信息对所述已选的第一候选项和各个第二候选项进行匹配;
子步骤A6,提取与所述已选的第一候选项组成某个词对信息的第二候选项,并赋予优先词频。
在根据已选的第一候选项对第二候选项进行调频时,可以按照预置的语言模型的词对信息,查找能与已选的第一候选项配对组成某个词对信息的第二候选项,即将已选的第一候选项与各个第二候选项进行配对,并查找配对后的文字是否符合语言模型的词对信息,符合词对信息的第二候选项则与已选的第一候选项强相关,可以对其赋予优先词频,以使该第二候选项排序靠前,提升了输入效率。
具体实现中,可以采用任意适用的调频方式对强相关的第二候选项赋予优先词频,例如,将强相关的第二候选项的词条频率增加某个数值,或是直接调整至某个数值,或是直接调整其排序靠前。
为使本领域技术人员更好地理解本发明实施例,以下通过具体的示例对本发明的一种候选排序方法进行说明。图3示出了本发明的候选排序过程示意图。
其中,S1-0、S1-1、S1-2为通过转换字母串得到至少一个候选项的步骤。
S1-0是在用户输入完字母串后进行的首次转换,得到候选组0,其结果包括完整匹配的候选项,以及非完整匹配的片段候选项;S1-1和S1-2则是在半选状态下,对于剩余字母串进行的转换得到的结果,具体的,S1-1是对用户选择片段1后剩余的字母串1进行转换得到候选组1,此处可以根据片段1对候选组1进行调频;S1-2是对用户选择片段2后剩余的字母串2进行转换得到候选组2,此处可以根据片段2对候选组2进行调频。
S2-1、S2-2为对于重复候选项进行词频惩罚的步骤。
重复候选项即上述实施例所述的与已选的第一候选项组成所记录的第一候选项的第二候选项,用户已经选择的片段加上该候选项所组成的完整字词,跟之前步骤中记录在缓存中的候选项重复。对于这样的候选项,既然在之前已经展现而没有被选择,那么可以预期它的命中概率极低,所以需要对其进行词频惩罚,使其在所有候选项中排序靠后。如图4所示每一次进行转换后,都需要根据缓存结果进行惩罚。
其中,S2-1是在得到候选组1后,如果某个候选项加上片段1可以得到已缓存的候选项,则对该候选项进行词频惩罚;S2-2是在得到候选组2后,如果某个候选项加上片段2可以得到已缓存的候选项,则对该候选项进行词频惩罚。
S3-0、S3-1、S3-2为保存本次转换中展现的完整匹配当前字母串的所有候选,将之记入本地缓存的步骤。
其中,S3-0是在用户输入完字母串后进行首次转换后发生,缓存内容是完整匹配字母串的所有候选项;S3-1和S3-2则是在半选状态下,对于剩余字母串进行转换时发生,缓存内容是完整匹配当前字母串的所有候选项,S3-0保存的是完整匹配剩余字母串1的一个或多个候选项;S3-2保存的是完整匹配剩余字母串2的一个或多个候选项。
其中,根据实际情况,步骤S3-2至S4之间可以有一次或多次半选的过程。
最后执行S4,输出完整字句。当用户选择完最后一个片段对应的候选项时,所有的字母串都已经转换完毕时,输入法将所有文字片段拼接输出,完成本次输入。
以下通过两个具体的例子对图3进行说明。
例1中,用户输入的是字母串。
S1-0、在PC端上用户输入“xuyaoshouqian”,目标文字是“需要手钳”。本地首选是唯一完整匹配字母串的“需要收钱”,这并不是词库中的词条,而是输入法根据词对信息(比如二元)计算得到的组词。从二选开始,则是供用户手动组词提供的片段候选,分别是“需要”、“须要”、“徐瑶”、“许瑶”等。
S3-0、输入法将展现的完整匹配的候选项“需要收钱”记入缓存。
S1-1、用户半选“需要”,开始进行手动组词。输入法使用“需要”替换对应的字母串“xuyao”,并对剩下的字母串“shouqian”重新进行转换。同时,将“需要”作为上文,使用词对信息对得到的候选项进行词频调整,适合作为下文的候选项被赋予优先词频。此时,输入法得到的候选项按照优先顺序依次是:“收钱”、“售前”、“手欠”,同时还包括非完整匹配的候选项“手”、“收”等。
S2-1、将S1-1的候选项与S3-0缓存的内容进行比较,发现候选项“收钱”和用户已经选择“需要”是之前已经展现给用户的“需要收钱”,对“收钱”进行词频惩罚。最终输入法展现的候选项排序是“售前”、“手欠”、“收钱”、“手”、“收”等。
S3-1、输入法将S2-1中展现的完整匹配的候选项“售前”、“收钱”、“手欠”也记入缓存。
S1-2、用户继续半选“手”。输入法继续使用“手”替换对应的字母串“shou”,并对剩下的字母串“qian”重新进行转换。同时,分别将“需要手”和“手”作为上文,使用词对信息对得到的候选项进行词频调整,适合作为下文的候选项被赋予优先词频。此时,输入法得到的候选项按照优先顺序依次是:“欠”、“钳”、“前”等。
S2-2、将S1-2的候选项与S3-1的缓存内容进行比较,发现候选项“欠”和用户已经选择的“手”是之前已经展现给用户的“(需要)手欠”,对“欠”进行词频惩罚。最终输入法展现的候选项排序是“钳”、“欠”、“前”等。
S3-2、由于S2-2中展现的完整匹配的候选项已经全部为单字,即是本次输入的最后片段,所以不再缓存S2-2的候选项。
S4、用户选择“钳”,至此字母串“xuyaoshouqian”全部转换完成。输入法将用户之前选择的“需要”、“手”和本次选择的“钳”完整输出,用户最终得到想要的字词“需要手钳”。
本次输入完成,清空S3-0、S3-1和S3-2中缓存的候选项。
例2中,用户输入字符串为标记字母的多个标识组成的字符串。
S1-0、在手机客户端上,九宫格键盘下,用户输入“9892674687426”,目标文字是“需要手钳”。本地首选是唯一完整匹配字母串的“需要收钱”,这并不是词库中的词条,而是输入法根据词对信息(比如二元)计算得到的组词。从二选开始,则是供用户手动组词提供的片段候选,分别是“需要”、“语言”、“五万”等。
S3-0、输入法将展现的完整匹配的候选项“需要收钱”记入缓存。
S1-1、用户半选“需要”,开始进行手动组词,并通过点选确认剩余字母串“74687426”对应的音节是[shou][qian]。输入法使用“需要”替换对应的字母串“98926”,并根据剩下的音节[shou][qian]重新进行转换。同时,将“需要”作为上文,使用词对信息对得到的候选项进行词频调整,适合作为下文的候选项被赋予优先词频。此时,输入法得到的候选项按照优先顺序依次是:“收钱”、“售前”、“手欠”,同时还包括非完整匹配的候选项“手”、“收”等。
S2-1、将S1-1的候选项与S3-0缓存的内容进行比较,发现候选项“收钱”和用户已经选择“需要”是之前已经展现给用户的“需要收钱”,对“收钱”进行词频惩罚。最终输入法展现的候选项排序是“售前”、“手欠”、“收钱”、“手”、“收”等。
S3-1、输入法将S2-1中展现的完整匹配的候选项“售前”、“收钱”、“手欠”也记入缓存。
S1-2、用户继续半选“手”。输入法继续使用“手”替换对应的音节[shou],并对剩下的音节[qian]重新进行转换。同时,分别将“需要手”和“手”作为上文,使用词对信息对得到的候选项进行词频调整,适合作为下文的候选项被赋予优先词频。此时,输入法得到的候选项按照优先顺序依次是:“欠”、“钳”、“前”等。
S2-2、将S1-2的候选项与S3-1的缓存内容进行比较,发现候选项“欠”和用户已经选择的“手”是之前已经展现给用户的“(需要)手欠”,对“欠”进行词频惩罚。最终输入法展现的候选项排序是“钳”、“欠”、“前”等。
S3-2、由于S2-2中展现的完整匹配的候选项已经全部为单字,即是本次输入的最后片段,所以不再缓存S2-2的候选项。
S4、用户选择“钳”,至此“9892674687426”全部转换完成。输入法将用户之前选择的“需要”、“手”和本次选择的“钳”完整输出,用户最终得到想要的字词“需要手钳”。
本次输入完成,清空S3-0、S3-1和S3-2中缓存的候选项。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图4,示出了本发明的一种候选排序装置实施例的结构框图,具体可以包括如下模块:
字符串获取模块301,用于获取用户输入的字符串;
第一转换模块302,用于转换所述字符串得到至少一个第一候选项;
选择接收模块303,用于接收用户选择的第一候选项;
第二转换模块304,用于转换剩余字符串得到至少一个第二候选项;
候选项调整模块305,用于利用所述至少一个第一候选项调整所述至少一个第二候选项。
本发明实施例中,优选地,所述候选项调整模块包括:
判断子模块,用于判断所述至少一个第二候选项是否与所述已选的第一候选项组成所述字符串对应的某个第一候选项,若是,则执行调整子模块;
调整子模块,用于调整所述至少一个第二候选项。
本发明实施例中,优选地,所述某个第一候选项为完整匹配所述字符串的至少一个第一候选项,所述装置还包括:
记录模块,用于在所述接收用户选择的第一候选项之前,记录完整匹配所述字符串的至少一个第一候选项。
本发明实施例中,优选地,所述调整子模块,具体用于利用所述至少一个第一候选项调整所述第二候选项的排序。
本发明实施例中,优选地,所述调整子模块包括:
候选项提取子模块,用于提取与所述已选的第一候选项组成所述某个第一候选项的第二候选项;
词频惩罚及展示子单元,用于对所述提取的第二候选项进行词频惩罚;并按序展示词频惩罚后的至少一个第二候选项。
本发明实施例中,优选地,所述词频惩罚及展示子单元包括:
权重配置子单元,用于对提取的第二候选项配置惩罚权重;
频率计算子单元,用于按照所述惩罚权重重新计算所述提取的第二候选项的词条频率;
候选排序子单元,用于按照重新计算的词条频率对各第二候选项进行排序并按序展示。
本发明实施例中,优选地,所述装置还包括:
重复执行模块,用于重复所述转换字符串、所述接收用户选择和所述调整第二候选项的步骤,直至所述字符串全部转换完毕。
本发明实施例中,优选地,所述装置还包括:
缓存模块,用于将所述第一候选项存入缓存;
所述装置还包括:
候选清除模块,用于在所述利用所述至少一个第一候选项调整所述至少一个第二候选项之后,清除所述缓存中的第一候选项。
依据本发明实施例,转换字符串得到至少一个第一候选项,在用户选择第一候选项之后,对剩余字符串继续转换得到第二候选项,并利用所述第一候选项调整第二候选项,避免原有的重复展现方式浪费用户筛选的时间,提升输入法在半选状态下的候选展现的质量,提高输入效率。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
图5是根据一示例性实施例示出的一种用于候选排序的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理部件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种候选排序方法,所述方法包括:获取用户输入的字符串;转换所述字符串得到至少一个第一候选项;接收用户选择的第一候选项,转换剩余字符串得到至少一个第二候选项;利用所述至少一个第一候选项调整所述至少一个第二候选项。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制,以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (13)

1.一种候选排序方法,其特征在于,包括:
获取用户输入的字符串;
转换所述字符串得到至少一个第一候选项;
接收用户选择的第一候选项,转换剩余字符串得到至少一个第二候选项;
利用所述至少一个第一候选项调整所述至少一个第二候选项。
2.根据权利要求1所述的方法,其特征在于,所述利用所述至少一个第一候选项调整所述至少一个第二候选项包括:
判断所述至少一个第二候选项是否与所述已选的第一候选项组成所述字符串对应的某个第一候选项;
若是,则调整所述至少一个第二候选项。
3.根据权利要求2所述的方法,其特征在于,所述某个第一候选项为完整匹配所述字符串的至少一个第一候选项,在所述接收用户选择的第一候选项之前,所述方法还包括:
记录完整匹配所述字符串的至少一个第一候选项。
4.根据权利要求2所述的方法,其特征在于,所述调整所述至少一个第二候选项为,调整所述至少一个第二候选项的排序。
5.根据权利要求4所述的方法,其特征在于,所述调整所述至少一个第二候选项的排序包括:
提取与所述已选的第一候选项组成所述某个第一候选项的第二候选项;
对所述提取的第二候选项进行词频惩罚,并按序展示词频惩罚后的至少一个第二候选项。
6.根据权利要求5所述的方法,其特征在于,所述对所述提取的第二候选项进行词频惩罚,并按序展示词频惩罚后的至少一个第二候选项包括:
对提取的第二候选项配置惩罚权重;
按照所述惩罚权重重新计算所述提取的第二候选项的词条频率;
按照重新计算的词条频率对各第二候选项进行排序并按序展示。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
重复执行所述转换字符串、所述接收用户选择和所述调整第二候选项的步骤,直至所述字符串全部转换完毕。
8.根据权利要求1所述的方法,其特征在于,在所述利用所述至少一个第一候选项调整所述至少一个第二候选项之前,所述方法还包括:
将所述至少一个第一候选项存入缓存;
在所述利用所述至少一个第一候选项调整所述至少一个第二候选项之后,所述方法还包括:
清除所述缓存中的至少一个第一候选项。
9.一种候选排序装置,其特征在于,包括:
字符串获取模块,用于获取用户输入的字符串;
第一转换模块,用于转换所述字符串得到至少一个第一候选项;
选择接收模块,用于接收用户选择的第一候选项;
第二转换模块,用于转换剩余字符串得到至少一个第二候选项;
候选项调整模块,用于利用所述至少一个第一候选项调整所述至少一个第二候选项。
10.一种用于候选排序的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户输入的字符串;
转换所述字符串得到至少一个第一候选项;
接收用户选择的第一候选项,转换剩余字符串得到至少一个第二候选项;
利用所述至少一个第一候选项调整所述至少一个第二候选项。
11.根据权利要求10所述的装置,其特征在于,所述处理器还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:
判断所述至少一个第二候选项是否与所述已选的第一候选项组成所述字符串对应的某个第一候选项;
若是,则调整所述至少一个第二候选项。
12.根据权利要求11所述的装置,其特征在于,所述处理器还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:
所述某个第一候选项为完整匹配所述字符串的至少一个第一候选项,
在所述接收用户选择的第一候选项之前,记录完整匹配所述字符串的至少一个第一候选项。
13.根据权利要求10所述的装置,其特征在于,所述处理器还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:
重复执行所述转换字符串、所述接收用户选择和所述调整第二候选项的步骤,直至所述字符串全部转换完毕。
CN201510897919.XA 2015-12-08 2015-12-08 一种候选排序方法和装置 Pending CN105446495A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510897919.XA CN105446495A (zh) 2015-12-08 2015-12-08 一种候选排序方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510897919.XA CN105446495A (zh) 2015-12-08 2015-12-08 一种候选排序方法和装置

Publications (1)

Publication Number Publication Date
CN105446495A true CN105446495A (zh) 2016-03-30

Family

ID=55556788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510897919.XA Pending CN105446495A (zh) 2015-12-08 2015-12-08 一种候选排序方法和装置

Country Status (1)

Country Link
CN (1) CN105446495A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106251869A (zh) * 2016-09-22 2016-12-21 浙江吉利控股集团有限公司 语音处理方法及装置
CN106484138A (zh) * 2016-10-14 2017-03-08 北京搜狗科技发展有限公司 一种输入方法及装置
CN107526527A (zh) * 2016-06-22 2017-12-29 北京搜狗科技发展有限公司 一种输入方法和装置、及一种用于输入的装置
CN108459864A (zh) * 2018-01-23 2018-08-28 维沃移动通信有限公司 一种更新显示内容的方法及移动终端
CN108536653A (zh) * 2017-03-03 2018-09-14 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN109213332A (zh) * 2017-06-29 2019-01-15 北京搜狗科技发展有限公司 一种表情图片的输入方法和装置
CN109558016A (zh) * 2017-09-25 2019-04-02 北京搜狗科技发展有限公司 一种输入方法和装置
WO2019140735A1 (zh) * 2018-01-22 2019-07-25 平安科技(深圳)有限公司 文字排序方法、装置、终端设备及介质
WO2021082780A1 (zh) * 2019-11-01 2021-05-06 深圳前海微众银行股份有限公司 一种日志分类方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1920829A (zh) * 2005-08-23 2007-02-28 佳能株式会社 字符输入辅助方法和信息处理装置
CN101493729A (zh) * 2008-01-24 2009-07-29 普天信息技术研究院有限公司 多类型字符的混合输入方法
CN101661331A (zh) * 2008-08-28 2010-03-03 北京搜狗科技发展有限公司 一种字词输入的方法和输入法系统
CN102023782A (zh) * 2009-09-15 2011-04-20 北京搜狗科技发展有限公司 一种输入转换过程中确定修改点的方法及装置
JP2011248499A (ja) * 2010-05-25 2011-12-08 Nec Corp 文字入力装置、文字入力制御方法及び文字入力制御プログラム
CN102520875A (zh) * 2011-12-31 2012-06-27 张海光 一种点划兼用的汉字拼音输入法
CN104777916A (zh) * 2014-01-10 2015-07-15 北京搜狗科技发展有限公司 一种文字输入方法和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1920829A (zh) * 2005-08-23 2007-02-28 佳能株式会社 字符输入辅助方法和信息处理装置
CN101493729A (zh) * 2008-01-24 2009-07-29 普天信息技术研究院有限公司 多类型字符的混合输入方法
CN101661331A (zh) * 2008-08-28 2010-03-03 北京搜狗科技发展有限公司 一种字词输入的方法和输入法系统
CN102023782A (zh) * 2009-09-15 2011-04-20 北京搜狗科技发展有限公司 一种输入转换过程中确定修改点的方法及装置
JP2011248499A (ja) * 2010-05-25 2011-12-08 Nec Corp 文字入力装置、文字入力制御方法及び文字入力制御プログラム
CN102520875A (zh) * 2011-12-31 2012-06-27 张海光 一种点划兼用的汉字拼音输入法
CN104777916A (zh) * 2014-01-10 2015-07-15 北京搜狗科技发展有限公司 一种文字输入方法和系统

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107526527A (zh) * 2016-06-22 2017-12-29 北京搜狗科技发展有限公司 一种输入方法和装置、及一种用于输入的装置
CN106251869B (zh) * 2016-09-22 2020-07-24 浙江吉利控股集团有限公司 语音处理方法及装置
CN106251869A (zh) * 2016-09-22 2016-12-21 浙江吉利控股集团有限公司 语音处理方法及装置
US11011170B2 (en) 2016-09-22 2021-05-18 Zhejiang Geely Holding Group Co., Ltd. Speech processing method and device
CN106484138A (zh) * 2016-10-14 2017-03-08 北京搜狗科技发展有限公司 一种输入方法及装置
CN106484138B (zh) * 2016-10-14 2019-11-19 北京搜狗科技发展有限公司 一种输入方法及装置
CN108536653B (zh) * 2017-03-03 2022-09-30 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN108536653A (zh) * 2017-03-03 2018-09-14 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN109213332A (zh) * 2017-06-29 2019-01-15 北京搜狗科技发展有限公司 一种表情图片的输入方法和装置
CN109558016A (zh) * 2017-09-25 2019-04-02 北京搜狗科技发展有限公司 一种输入方法和装置
CN109558016B (zh) * 2017-09-25 2022-12-13 北京搜狗科技发展有限公司 一种输入方法和装置
WO2019140735A1 (zh) * 2018-01-22 2019-07-25 平安科技(深圳)有限公司 文字排序方法、装置、终端设备及介质
CN108459864A (zh) * 2018-01-23 2018-08-28 维沃移动通信有限公司 一种更新显示内容的方法及移动终端
WO2021082780A1 (zh) * 2019-11-01 2021-05-06 深圳前海微众银行股份有限公司 一种日志分类方法及装置

Similar Documents

Publication Publication Date Title
CN105446495A (zh) 一种候选排序方法和装置
CN110381371B (zh) 一种视频剪辑方法及电子设备
TWI720062B (zh) 語音輸入方法、裝置和終端設備
CN105117384A (zh) 分类器训练方法、类型识别方法及装置
CN107291690A (zh) 标点添加方法和装置、用于标点添加的装置
CN106484138B (zh) 一种输入方法及装置
CN109597557A (zh) 控制列表滚动条的方法和使用该方法的电子装置
CN107885826B (zh) 多媒体文件播放方法、装置、存储介质及电子设备
CN105335712A (zh) 图像识别方法、装置及终端
CN109144285B (zh) 一种输入方法和装置
CN109558599B (zh) 一种转换方法、装置和电子设备
CN104615663A (zh) 文件排序方法、装置及终端
CN105139848B (zh) 数据转换方法和装置
CN104461348A (zh) 信息选取方法及装置
CN107146631A (zh) 音乐识别方法、音符识别模型建立方法、装置及电子设备
CN105528403A (zh) 目标数据识别方法及装置
CN109002184A (zh) 一种输入法候选词的联想方法和装置
CN109460556A (zh) 一种翻译方法和装置
CN105487799A (zh) 内容转换方法及装置
CN105243051A (zh) 酒店订单短信模板的创建方法、提取方法及装置
CN105183721B (zh) 模板构建方法、信息提取方法及装置
CN113055529B (zh) 录音控制方法和录音控制装置
KR102327790B1 (ko) 정보 처리 방법, 장치 및 저장 매체
CN109871128B (zh) 一种题型识别方法及装置
CN109558017B (zh) 一种输入方法、装置和电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160330