CN109917927B - 一种候选项确定方法和装置 - Google Patents

一种候选项确定方法和装置 Download PDF

Info

Publication number
CN109917927B
CN109917927B CN201711328457.5A CN201711328457A CN109917927B CN 109917927 B CN109917927 B CN 109917927B CN 201711328457 A CN201711328457 A CN 201711328457A CN 109917927 B CN109917927 B CN 109917927B
Authority
CN
China
Prior art keywords
word
string
encoding
full
code string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711328457.5A
Other languages
English (en)
Other versions
CN109917927A (zh
Inventor
王丹
张扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201711328457.5A priority Critical patent/CN109917927B/zh
Publication of CN109917927A publication Critical patent/CN109917927A/zh
Application granted granted Critical
Publication of CN109917927B publication Critical patent/CN109917927B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本申请实施例公开了一种候选项确定方法,该方法根据所输入编码串切分得到的多个词编码串,若相邻的两个编码串例如第一词编码串和第二词编码串中包括简拼部分,可以计算该第一词编码串和第二词编码串各自对应词构成的词组的关联程度,若前述构成的某一词组的关联程度满足第一预设条件,可以明确组成该词组的两个词在输入时同时出现的概率较大,那么该词组与用户编码串所希望上屏词组相符的可能性较高,故将该词组作为第一词编码串和第二词编码串对应的候选项更有可能满足用户的输入需求,从而提高了用户的输入体验。本申请实施例还公开了一种候选项确定装置。

Description

一种候选项确定方法和装置
技术领域
本申请涉及输入法领域,特别是涉及一种候选项确定方法和装置。
背景技术
输入法是指为将各种符号输入计算机或其他设备(如手机)而采用的编码方法,用户可以使用输入法便利的将需要的字符输入电子设备。例如在汉字输入法中,可以通过输入编码串将汉字输入到电子设备中。
用户在使用输入法时,会有自己的使用习惯。一些用户习惯于通过纯简拼或者半简拼的形式输入编码串,而且一次性会输入较多的编码串,例如通过输入纯简拼编码串“wxxzsgsrf”上屏文字“我想下载搜狗输入法”。
在用户使用类似上述纯简拼或半简拼输入编码串时,由于包括了纯简拼或半简拼的编码串对应着很多可能的全编码串的组合形式,若对每种可能的组合形式都进行全面的认定,需要较长的处理时间,导致输入法在展示对应的候选项时出现卡顿,降低了用户的输入体验。
故针对包括了纯简拼或半简拼的编码串时,传统方式采用只取出一定数目的高频词条作为候选项,例如用户希望通过输入纯简拼编码串“sjwc”上屏“实际完成”,若该编码串被切分为“sj”和“wc”两部分,输入法将选取“sj”对应的高频词条例如“手机”,以及选取“wc”对应的高频词条例如“我才”构成“sjwc”的候选项“手机我才”展示给用户。显然这一候选项并没有实际含义,往往也不是用户所需要的。可见,传统方式中针对包括了纯简拼或半简拼的编码串确定的候选项通常难以满足用户需求,难以提高用户的输入体验。
发明内容
为了解决上述技术问题,本申请提供了一种候选项确定方法和装置,使得确定的候选项更有可能满足用户的输入需求,从而提高了用户的输入体验。
本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供了一种候选项确定方法,所述方法包括:
根据获取的编码串切分得到多个词编码串,其中一个词编码串对应一个词,所述多个词编码串中包括相邻的第一词编码串和第二词编码串,所述第一词编码串和所述第二词编码串中的至少一个词编码串包括简拼部分;
计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度;
将第一关联程度满足第一预设条件的词组作为所述第一词编码串和所述第二词编码串对应的候选项。
可选的,在所述根据获取的编码串切分得到多个词编码串之前,所述方法包括:
判断编码库中是否存在与所述编码串相匹配的编码串;
若否,则执行所述根据获取的编码串切分得到多个词编码串的步骤。
可选的,所述计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度包括:
根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述全编码串组合是由所述第一词编码串扩展的全编码串和所述第二词编码串扩展的全编码串组成的。
可选的,所述根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度包括:
计算全编码串组合的第二关联程度;
计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述第一关联程度包括所述第二关联程度。
可选的,所述根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度包括:
计算全编码串组合的第二关联程度;
若目标全编码串组合的第二关联程度满足第二预设条件,计算由所述第一词编码串扩展的目标全编码串所对应词和所述第二词编码串扩展的目标全编码串所对应词构成词组的第一关联程度,所述目标全编码串是由所述第一词编码串扩展的目标全编码串和所述第二词编码串扩展的目标全编码串组成的。
可选的,所述第一词编码串和所述第二词编码串均为纯简拼编码串。
第二方面,本申请实施例提供了一种候选项确定装置,所述装置包括切分单元、计算单元和确定单元:
所述切分单元,用于根据获取的编码串切分得到多个词编码串,其中一个词编码串对应一个词,所述多个词编码串中包括相邻的第一词编码串和第二词编码串,所述第一词编码串和所述第二词编码串中的至少一个词编码串包括简拼部分;
所述计算单元,用于计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度;
所述确定单元,用于将第一关联程度满足第一预设条件的词组作为所述第一词编码串和所述第二词编码串对应的候选项。
可选的,所述装置还包括判断单元:
所述判断单元,用于判断编码库中是否存在与所述编码串相匹配的编码串;
若否,则触发所述切分单元。
可选的,所述计算单元用于:
根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述全编码串组合是由所述第一词编码串扩展的全编码串和所述第二词编码串扩展的全编码串组成的。
可选的,所述计算单元包括第一计算子单元和第二计算子单元:
所述第一计算子单元,用于计算全编码串组合的第二关联程度;
所述第二计算子单元,用于计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述第一关联程度包括所述第二关联程度。
可选的,所述计算单元包括第三计算子单元和第四计算子单元:
所述第三计算子单元,用于计算全编码串组合的第二关联程度;
所述第四计算子单元,用于若目标全编码串组合的第二关联程度满足第二预设条件,计算由所述第一词编码串扩展的目标全编码串所对应词和所述第二词编码串扩展的目标全编码串所对应词构成词组的第一关联程度,所述目标全编码串是由所述第一词编码串扩展的目标全编码串和所述第二词编码串扩展的目标全编码串组成的。
可选的,所述第一词编码串和所述第二词编码串均为纯简拼编码串。
第三方面,本申请实施例提供了一种用于候选项确定的处理设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
根据获取的编码串切分得到多个词编码串,其中一个词编码串对应一个词,所述多个词编码串中包括相邻的第一词编码串和第二词编码串,所述第一词编码串和所述第二词编码串中的至少一个词编码串包括简拼部分;
计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度;
将第一关联程度满足第一预设条件的词组作为所述第一词编码串和所述第二词编码串对应的候选项。
第四方面,本申请实施例提供了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行第一方面中的一个或多个所述的候选项确定方法。
由上述技术方案可以看出,针对根据所输入编码串切分得到的多个词编码串,若相邻的两个编码串例如第一词编码串和第二词编码串中包括简拼部分,可以计算该第一词编码串和第二词编码串各自对应词构成的词组的关联程度,若前述构成的某一词组的关联程度满足第一预设条件,可以明确组成该词组的两个词在输入时同时出现的概率较大,那么该词组与用户编码串所希望上屏词组相符的可能性较高,故将该词组作为第一词编码串和第二词编码串对应的候选项更有可能满足用户的输入需求,从而提高了用户的输入体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种应用场景示例图;
图2为本申请实施例提供的一种候选项确定方法的流程图;
图3为本申请实施例提供的一种候选项的展示界面示例图;
图4为本申请实施例提供的一种候选项的展示界面示例图;
图5为本申请实施例提供的一种候选项确定方法的流程图;
图6为本申请实施例提供的一种候选项确定装置的结构框图;
图7为本申请实施例提供的一种用于候选项确定的装置的框图;
图8为本申请实施例提供的一种用于候选项确定的服务器的框图。
具体实施方式
下面结合附图,对本申请的实施例进行描述。
发明人经研究发现,在用户通过纯简拼或者半简拼的形式输入编码串生成候选项时,针对编码串包括多个词编码串以生成词组作为候选项的情况,传统方式采用只取出一定数目的高频词条作为候选项,从而导致部分词与词间有关联程度的词组漏掉,使得生成的词条没有实际含义,难以根据纯简拼或半简拼的编码串确定出满足用户需求的候选项,难以提高用户的输入体验。
如图1所示,用户在输入框101中输入纯简拼编码串102“sjwc”,希望上屏“实际完成”,在传统方式中,由于“sj”对应的高频词条为“手机”,“wc”对应的高频词条为“我才”,这样,输入法便直接将“手机”和“我才”结合起来得到“手机我才”在候选项展示页面103中展示给用户,其中,“手机我才”作为“sjwc”的候选项104。
然而,这一候选项“手机我才”并没有实际含义,主要是由于传统方式只取出高频词条“手机”作为“sj”对应的词条,高频词条“我才”作为“wc”对应的词条,而没有考虑简拼串“sjwc”扩展成不同全拼串的不同概率分布,比如sj|wc扩展成“shiji|wancheng”的概率比扩展成“shouji|wocai”的概率更大,从而忽略了“sj”对应的词“手机”和“wc”对应的词“我才”之间是否有关联,而直接将“手机”和“我才”结合起来生成“手机我才”这一没有实际含义的候选项,导致词与词间有关联程度的词组漏掉,最终生成“手机我才”并不是用户所需要的候选项。
为此,本申请实施例提供了一种针对上述问题的解决方法,以便在用户通过纯简拼或者半简拼的形式输入编码串的情况下,通过关联程度的计算明确组成该词组的不同词在输入时同时出现的概率,将概率较大的词组作为候选项,那么该词组与用户编码串所希望上屏词组相符的可能性较高,更有可能满足用户的输入需求,从而提高了用户的输入体验。
以前述用户在输入框101中输入纯简拼编码串102“sjwc”,希望上屏“实际完成”为例,本申请实施例所提供的方法首先可以将编码串“sjwc”进行切分得到多个词编码串,例如切分得到“sj”和“wc”两个词编码串,则“sj”可以作为第一词编码串,“wc”可以作为第二词编码串。输入法可以确定“sj”对应的词可以包括“实际”和“手机”,“wc”对应的词可以包括“完成”和“我才”。由于“sj”和“wc”相邻的词编码串,这样,输入法可以通过计算“实际”和“完成”构成词组“实际完成”的第一关联程度,以及“手机”和“我才”构成词组“手机我才”的第一关联程度等,将第一关联程度满足第一预设条件的词组“实际完成”作为第一词编码串和第二词编码串对应的候选项104,从而得到更有可能满足用户的输入需求的候选项104,提高了用户的输入体验。
本申请实施例中所提到的输入法可以是一种为了将各种符号输入到如计算机、手机等电子设备而采用的编码方法,用户可以使用输入法便利的将用户需要的字符或者字符串输入电子设备。需要注意的是,在本申请实施例中输入法除了可以包括常见的中文输入法(比如拼音输入法、五笔输入法、注音输入法等)以外,也可以包括其他语种的输入法(比如日文平假名输入法、韩文输入法等),在此不对输入法以及输入法的语言种类做任何限定。
在本申请实施例中,编码串可以是用户希望上屏某内容而输入的与该内容对应的一串字母。其中,一个编码串可以是与该内容对应的音节或音节组合的完整输入,也可以是与该内容对应的音节或音节组合的不完整输入。例如,用户希望上屏的内容为“搜狗”,“搜狗”对应的音节组合为“sougou”,其中“sou”为“搜”对应的音节,“gou”为“狗”对应的音节。那么,所述编码串可以是用户输入的“sougou”,也可以是“sg”、“soug”和“sougo”等,其中,“sougou”可以为与“搜狗”对应的音节或音节组合的完整输入,“sg”、“soug”和“sougo”可以为与“搜狗”对应的音节或音节组合的不完整输入。
需要说明的是,由于本申请实施例中输入法可以包括常见的中文输入法,也可以包括其他语种的输入法,在不同语种输入法下输入的编码串的形式可以不同,例如,在中文输入法下,编码串可以是拼音串的形式;在日文输入法下,编码串可以平假名的形式。本实施例对输入法的语言种类不做任何限定,相应的,编码串的形式也不做任何限定。为了便于描述,在之后的实施例中,将主要以输入法为中文输入法、编码串为拼音串的形式为例进行说明。
简拼可以是指与用户希望上屏的内容对应的音节或音节组合的不完整输入,所述简拼可以包括纯简拼和半简拼。例如,用户在使用拼音输入法希望上屏“搜狗”时,“搜狗”的音节组合为“sougou”,“sougou”的简拼例如可以为“sg”、“soug”、“sougo”、“sgou”和“sogo”等,其中,“sg”可以作为“sougou”的纯简拼,“soug”、“sougo”、“sgou”和“sogo”可以作为“sougou”的半简拼。
词能够表示完整的含义,词一般可以由一个或多个字符组成。例如,“我们”的含义是包括本身在内的若干人,因此“我们”可以是一个词,该词由“我”和“们”两个字符组成。例如,“我”的含义是指自己一方,因此“我”也可以是一个词,该词由“我”一个字符组成。但是“们”没有实际含义,不能作为一个词。
词编码串是指与词所对应的编码串,词编码串可以是全编码串,也可以是简拼编码串。以词为“搜狗”为例,与“搜狗”对应的词编码串可以包括“sougou”、“sg”等,其中,“sougou”可以作为全编码串,“sg”可以作为简拼编码串,也就是前述的简拼。
所述切分可以是将输入的编码串拆分成多个词编码串,以便后续确定切分成的多个词编码串各自对应的词,并根据多个词编码串各自对应的词构成词组的关联程度确定输入的编码串对应的词组。例如,用户输入的编码串为“sjwc”,则可以将“sjwc”切分成“sj”和“wc”,其中,“sj”和“wc”各自为一个词编码串,这里切分出的“sj”和“wc”可以是相邻的词编码串。
需要注意的是,切分后的每一个编码串都应该是一个词编码串,各自都应该能够对应一个词。在一些情况下,例如,用户输入编码串“women”以希望上屏“我们”,由于“wo”对应的词可以为“我”,所以“wo”是一个词编码串,而“men”对应的为“们”,“们”没有实际含义,并不能作为一个词,所以,“men”不是一个词编码串,也就是说,“women”不能拆分成“wo”和“men”。
所述关联程度可以表示相邻的两个词以某一语序同时出现构成词组的概率大小,所述关联程度越高,可以表示该相邻的两个词以该语序同时出现的概率越大,该相邻的两个词之间的语义上的联系越大,该相邻的两个词构成用户希望上屏的词组的可能性越大。
候选项可以是输入法根据用户输入的编码串所展示的对应的词,比如,当输入法为拼音输入法时,候选项是汉字;当输入法为平假名输入法,候选项是日文汉字;当输入法为韩文输入法,候选项是韩语文字。这里需要注意的是,候选项的语言种类除了上述几种可能的方式以外,还可以为其它不同的语言种类,在此不对候选项的语言种类做任何限定。
为了便于描述,在之后的实施例中,将主要以拼音输入法,候选项为汉字为例进行说明。
下面结合附图,详细说明本申请实施例提供的候选项确定方法。
参见图2,图2为本申请实施例提供的一种候选项确定方法的流程图,该方法包括:
S201、根据获取的编码串切分得到多个词编码串,其中一个词编码串对应一个词。当用户希望上屏某内容时,用户可以通过输入法输入与该内容对应的编码串,输入法在获取到该编码串后,可以将该编码串进行切分得到多个词编码串,以便后续根据每个词编码串所对应的词确定该编码串所对应的候选项。
传统方式由于没有考虑到词与词构成词组的关联程度导致针对包括了纯简拼或半简拼的编码串确定的候选项难以满足用户需求,本实施例主要为了解决针对纯简拼或半简拼的编码串确定的候选项难以满足用户需求的问题,因此,在本实施中第一词编码串和所述第二词编码串可以是相邻的词编码串,且其中的至少一个词编码串包括简拼部分,当然,第一词编码串和所述第二词编码串也可以均为纯简拼编码串。
例如,用户希望通过输入编码串“sjwc”上屏“实际完成”,其中,编码串“sjwc”为纯简拼编码串,输入法可以获取编码串“sjwc”,并将“sjwc”切分为“sj”和“wc”两部分,“sj”可以作为第一词编码串,“wc”可以作为第二词编码串。
可以理解的是,由于输入法本身具有编码库,该编码库中可以包括一些编码串,用户输入的编码串可能与编码库中的编码串相匹配,这时,输入法可以直接根据编码库中与用户输入的编码串相匹配的编码串确定候选项。但是,由于输入法自身的资源或者内存有限,可能出现编码库中不存在与用户输入的编码串相匹配的编码串的情况,在这种情况下,则可以通过S201所述的方法对用户输入的编码串进行处理,以便确定用户输入的编码串对应的候选项。因此,在本实施例中,在执行S201之前,可以判断编码库中是否存在与用户输入的编码串相匹配的编码串,若存在,则输入法可以直接根据编码库中与用户输入的编码串相匹配的编码串确定候选项,若不存在,则执行S201。
其中,所述编码库中存在与用户输入的编码串相匹配的编码串可以是编码库中存在与用户输入的编码串完全一致的编码串,也可以是编码库中存在与用户输入的编码串相比扩展了的编码串。
S202、计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度。
输入法可以根据切分得到的多个词编码串,确定每个词编码串所对应的词,以根据每个词编码串所对应的词确定该编码串所对应的词组。针对一个词编码串来说,该词编码串所对应的词可能包括多个,这样,根据每个词编码串所对应的词确定该编码串所对应的词组可能包括多组。为了从该多组词组中确定出用户希望上屏的词组,可以对词组的第一关联程度进行计算,从而根据第一关联程度的大小确定出用户希望上屏的词组。
以多个词编码串中包括的第一词编码串和第二词编码串为例,则输入法在确定出第一词编码串和第二词编码串各自对应的词后,可以计算第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度。
在本实施例中,所述第一关联程度可以用第一词编码串所对应词和第二词编码串所对应词构成词组的得分来表示,词组的得分越小,可以表示该词组的第一关联程度越大,该词组越有可能是用户希望上屏的词组。
例如,用户希望通过输入法输入编码串“sjwc”上屏“实际完成”,其中,切分后第一词编码串为“sj”,第二词编码串为“wc”。首先,输入法可以根据“sj”和“wc”可以确定“sj”所对应的词和“wc”所对应的词构成的词组包括:“实际|完成”、“瞬间|完成”和“手机|我才”。其中,在词组“实际|完成中”,“实际”为“sj”所对应的词,“完成”为“wc”所对应的词;在词组“瞬间|完成”中,“瞬间”为“sj”所对应的词,“完成”为“wc”所对应的词;在词组“手机|我才”中,“手机”为“sj”所对应的词,“我才”为“wc”所对应的词。然后,输入法可以计算上述“sj”所对应的词和“wc”所对应的词构成的词组的第一关联程度,其中,第一关联程度可以用词组的得分来表示。通过计算,分别得到“实际|完成”、“瞬间|完成”和“手机|我才”的第一关联程度可以如下所示:
实际|完成 1200
瞬间|完成 1500
手机|我才 2000
其中,1200、1500和2000表示相应词组的得分,即表示相应词组的第一关联程度。
所述第一关联程度还包括其他计算方式,将在后续进行详细介绍,此处不再赘述。
S203、将第一关联程度满足第一预设条件的词组作为所述第一词编码串和所述第二词编码串对应的候选项。
在本实施例中,第一预设条件可以是根据经验预先设定的,当词组的第一关联程度满足第一预设条件时,可以表示该词组可能是用户希望上屏的词组,可以将该词组作为第一词编码串和第二词编码串对应的候选项。
当第一关联程度用词组的得分表示时,所述第一关联程度满足第一预设条件可以是词组的得分小于阈值,所述阈值可以是根据经验预先设定的。
例如,用户希望通过输入法输入编码串“sjwc”上屏“实际完成”,词组的得分表示第一关联程度,前述“实际|完成”的第一关联程度为1200,“瞬间|完成”的第一关联程度为1500,“手机|我才”的第一关联程度为2000。若所述第一关联程度满足第一预设条件为词组的得分小于1500,其中,1500为阈值,由于词组的得分小于1500的词组只有“实际|完成”,因此,可以将“实际|完成”作为第一词编码串和第二词编码串对应的候选项,所述候选项的展示界面如图3所示。
在图3中,“sjwc”为编码串302,对应于图1中的102,“实际完成”和“瞬间完成”为候选项304,对应于图1中的104,图中301对应图1中的101,图中303对应图1中的103。
由于词组的第一关联程度越高,该词组与用户所希望上屏词组相符的可能性较高,因此,在执行S203时,如果确定出第一关联程度满足第一预设条件的词组包括多个,可以根据第一关联程度的高低,优先展示第一关联程度高的候选项。
以上述用户希望通过输入法输入编码串“sjwc”上屏“实际完成”为例,若所述第一关联程度满足第一预设条件为词组的得分小于1800,其中,1800为阈值,由于词组的得分小于1800的词组包括“实际|完成”和“瞬间|完成”,因此,可以将“实际|完成”和“瞬间|完成”作为第一词编码串和第二词编码串对应的候选项。另外,由于“实际|完成”的第一关联程度高于“瞬间|完成”的第一关联程度,因此,可以优先展示候选项“实际完成”,所述候选项的展示界面如图4所示。
在图4中,“sjwc”为编码串402,对应于图1中的102,“实际完成”和“瞬间完成”为候选项404,对应于图1中的104,图中401对应图1中的101,图中403对应图1中的103。
需要说明的是,上述实施例以多个词编码串中包括的两个相邻的词编码串生成对应的候选项为例对候选项确定方法进行说明。本实施例提供的方法可以针对多个词编码串中包括的至少两个相邻的词编码串生成对应的候选项,例如,在针对多个词编码串中包括的三个相邻的词编码串生成对应的候选项时,可以将前两个相邻的词编码串组合得到的结果作为第一词编码串,将余下的相邻的词编码串作为第二词编码串,然后,采用本实施例所提供的候选项确定方法确定出该三个相邻的词编码串对应的候选项。当多个词编码串中包括更多个相邻的编码串时,可以采用类似的方法确定其对应的候选项,此处不再赘述。
由上述技术方案可以看出,针对根据所输入编码串切分得到的多个词编码串,若相邻的两个编码串例如第一词编码串和第二词编码串中包括简拼部分,可以计算该第一词编码串和第二词编码串各自对应词构成的词组的关联程度,若前述构成的某一词组的关联程度满足第一预设条件,可以明确组成该词组的两个词在输入时同时出现的概率较大,那么该词组与用户输入第一词编码串和第二词编码串所希望上屏词组相符的可能性较高,故将该词组作为第一词编码串和第二词编码串对应的候选项更有可能满足用户的输入需求,从而提高了用户的输入体验。
需要说明的是,在本实施例中,确定第一词编码串所对应词和所述第二词编码串所对应词构成词组的实际过程可以是,对第一词编码串进行扩展得到第一词编码串所对应的全编码串,对第二词编码串进行扩展得到第二词编码串对应的全编码串,所述第一词编码串扩展的全编码串和所述第二词编码串扩展的全编码串可以组成全编码串组合,第一词编码串扩展的全编码串所对应词和所述第二词编码串扩展的全编码串所对应词构成词组。
以前述用户希望通过输入法输入编码串“sjwc”上屏“实际完成”,切分后第一词编码串为“sj”,第二词编码串为“wc”为例,“sj”扩展的全编码串可以为“shiji”,“wc”扩展的全编码串可以为“wancheng”,这样,“shiji”和“wancheng”可以组成全编码串组合“shiji|wancheng”。输入法可以确定“shiji”对应的才为“实际”,确定“wancheng”对应的词为“完成”,进而确定“实际”和“完成”构成词组“实际完成”。
通过前述论述可以看出确定第一词编码串所对应词和所述第二词编码串所对应词构成词组可能之前可以先确定全编码串组合。由于,全编码串组合包括第一词编码串扩展的全编码串和第二词编码串扩展的全编码串,因此,在确定全编码串组合时应该考虑全编码串组合的第二关联程度,只有当全编码串组合的第二关联程度足够高时,才能表示第一词编码串扩展的全编码串和第二词编码串扩展的全编码串能够同时出现组成该全编码串组合,使得确定出来的全编码串组合更能符合用户希望上屏的词组所对应的全编码串组合。也就是说,如果全编码串组合的第二关联程度越高,表示该全编码串组合越准确,这样,根据该全编码串组合确定出来的词组更能满足用户的需求。
例如,以上述用户希望通过输入法输入编码串“sjwc”上屏“实际完成”为例,输入法确定出来的全编码串组合包括“shiji|wancheng”和“shouji|wocai”,其中,“shiji|wancheng”的第二关联程度为1000,“shouji|wocai”的第二关联程度为1600,由于“wan|cheng”的第二关联程度高于“shouji|wocai”的第二关联程度,因此,全编码串组合“wan|cheng”更准确,这样,根据“wan|cheng”确定出的词组“实际完成”比根据“shouji|wocai”确定出的词组“手机我才”更能满足用户的需求。
为此,在执行S202时,可以根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度。
在一种计算第一关联程度的实现方式中,由于确定第一词编码串所对应词和所述第二词编码串所对应词构成词组可能之前可以先确定全编码串组合,如果全编码串组合的第二关联程度越高,那么第一词编码串扩展的全编码串所对应词和第二词编码串扩展的全编码串所对应词构成词组的第一关联程度越高,该全编码串组合由该第一词编码串扩展的全编码串和该第二词编码串扩展的全编码串组成。因此,在计算所述第一关联程度时,为了提高第一关联程度的准确性,使得可以根据第一关联程度确定出的候选项越能满足用户需求,可以首先计算全编码串组合的第二关联程度,再计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,其中,所述第一关联程度应该包括所述第二关联程度。例如,可以在之前计算得到的第一关联程度的基础上,综合由编码串扩展到全编码串组合的第二关联程度得到新的第一关联程度。
在之前计算得到的第一关联程度的基础上,综合由编码串扩展到全编码串组合的第二关联程度得到新的第一关联程度的方式例如可以是:利用全编码串组合的第二关联程度,以及之前计算得到的第一关联程度进行加权得到新的第一关联程度。
具体地,以S202中用户希望通过输入法输入编码串“sjwc”上屏“实际完成”为例,输入法可以根据“sj”和“wc”可以确定“sj”所对应的全编码串和“wc”所对应的全编码串构成的全编码串组合包括:shiji|wancheng、shunjian|wancheng和shouji|wocai。其中,在全编码串组合shiji|wancheng中,“shiji”为“sj”所对应的全编码串,“wancheng”为“wc”所对应的全编码串;在全编码串组合shunjian|wancheng中,“shunjian”为“sj”所对应的全编码串,“wancheng”为“wc”所对应的全编码串;在全编码串组合shouji|wocai中,“shouji”为“sj”所对应的全编码串,“wocai”为“wc”所对应的全编码串。然后,输入法可以计算上述“sj”所对应的全编码串和“wc”所对应的全编码串构成的全编码串组合的第二关联程度,其中,第二关联程度可以用词组的得分来表示。通过计算,分别得到shiji|wancheng、shunjian|wancheng和shouji|wocai的第二关联程度可以如下所示:
shiji|wancheng 1000
shunjian|wancheng 1100
shouji|wocai 1600
而之前计算得到的第一关联程度为:
实际|完成 1200
瞬间|完成 1500
手机|我才 2000
这样,利用全编码串组合的第二关联程度,以及之前计算得到的第一关联程度进行加权得到新的第一关联程度的计算公式例如可以是:
f=w1*py_score+w2*hz_score
其中,f可以为第一关联程度,py_score可以为第二关联程度,hz_score可以为之前计算得到的第一关联程度,w1、w2分别可以为权重。
w1可以表示第二关联程度对于确定第一关联程度的重要性,w2可以表示之前计算得到的第一关联程度对于确定新的第一关联程度的重要性。权重越大,表示第二关联程度或之前计算得到的第一关联程度对确定第一关联程度越重要。w1和w2可以是根据经验进行设定的,w1和w2可以相同,也可以不同。一般情况下,对于确定新的第一关联程度来说,之前计算得到的第一关联程度比第二关联程度重要,因此,可以取w2>w1。
在本实施例中,若w1和w2分别为1,则根据上述公式计算得到的新的第一关联程度分别为:
实际完成 2200
瞬间完成 2600
手机我才 3600
在另一种计算第一关联程度的实现方式中,由于第一词编码串扩展的全编码串和所述第二词编码串扩展的全编码串组成的全编码串组合可能包括多组,如果根据每一个全编码串组合确定第一词编码串所对应词和第二词编码串所对应词构成的词组,就会得到多组词组,从而需要计算多组词组的第一关联程度。在这种情况下,为了避免根据每一个全编码串组合确定第一词编码串所对应词和第二词编码串所对应词构成的词组,减少计算第一关联程度的计算量,本实施例在执行S202之前可以计算全编码串组合的第二关联程度,然后,从所述全编码串组合中选择第二关联程度满足第二预设条件的目标全编码串组合,计算由所述第一词编码串扩展的目标全编码串所对应词和所述第二词编码串扩展的目标全编码串所对应词构成词组的第一关联程度,所述目标全编码串是由所述第一词编码串扩展的目标全编码串和所述第二词编码串扩展的目标全编码串组成的。
在本实施例中,第二预设条件可以是根据经验预先设定的,当第二关联程度用词组的得分表示时,所述第二关联程度满足第二预设条件可以是全编码串组合的得分小于阈值,所述阈值可以是根据经验预先设定。
若第二关联程度用词组的得分表示,所述第二关联程度满足第二预设条件为全编码串组合的得分小于阈值,以前述得到全编码串组合shiji|wancheng的第二关联程度为1000,全编码串组合shunjian|wancheng的第二关联程度为1100,全编码串组合shouji|wocai的第二关联程度为1600为例,可以预先设定阈值为1100,则全编码串组合的得分小于1100的全编码串组合只有全编码串组合shiji|wancheng,因此,可以将shiji|wancheng作为目标全编码串组合,其中,“shiji”可以为第一词编码串扩展的目标全编码串,“wancheng”可以为第二词编码串扩展的目标全编码串。
基于上述实施例提供的一种候选项确定方法,本实施例可以将上述实施例提供的一种候选项确定方法在终端设备上实现,本实施例将结合具体应用场景介绍针对候选项确定方法。在该应用场景中,用户利用拼音输入法在输入框中输入纯简拼编码串“sjwc”,希望在终端设备上上屏“实际完成”。
参见图5,示出了本申请实施例提供的一种候选项确定方法的流程图,所述方法包括以下步骤:
S501、输入法获取纯简拼编码串“sjwc”。
S502、输入法判断编码库中是否存在与“sjwc”相匹配的编码串,若否,则执行S503。
S503、输入法将“sjwc”切分得到词编码串“sj”和“wc”。
其中,“sj”可以作为第一词编码串,“wc”可以作为第二词编码串。
S504、输入法确定“sjwc”对应的全编码串组合shiji|wancheng、shunjian|wancheng和shouji|wocai。
S505、输入法分别计算全编码串组合shiji|wancheng、shunjian|wancheng和shouji|wocai的第二关联程度。
S506、输入法确定shiji|wancheng对应的词组为“实际|完成”,shunjian|wancheng对应的词组为“瞬间|完成”,shouji|wocai对应的词组为“手机|我才”。
S507、输入法分别计算“实际|完成”、“瞬间|完成”和“手机|我才”的第一关联程度,其中,所述第一关联程度包括所述第二关联程度。
S508、将第一关联程度满足第一预设条件的词组“实际完成”和“瞬间完成”作为所述第一词编码串和所述第二词编码串对应的候选项。
S509、根据“实际完成”的第一关联程度和“瞬间完成”的第一关联程度,优先展示第一关联程度较大的候选项“实际完成”。
其中,候选项“实际完成”和“瞬间完成”的展示界面可以如图4所示。
由上述技术方案可以看出,针对根据所输入编码串切分得到的多个词编码串,若相邻的两个编码串例如第一词编码串和第二词编码串中包括简拼部分,可以计算该第一词编码串和第二词编码串各自对应词构成的词组的关联程度,若前述构成的某一词组的关联程度满足第一预设条件,可以明确组成该词组的两个词在输入时同时出现的概率较大,那么该词组与用户输入第一词编码串和第二词编码串所希望上屏词组相符的可能性较高,故将该词组作为第一词编码串和第二词编码串对应的候选项更有可能满足用户的输入需求,从而提高了用户的输入体验。
基于前述实施例提供的一种候选项确定方法,本实施例提供了一种一种候选项确定装置,图6示出了一种候选项确定装置的结构框图,所述装置包括切分单元601、计算单元602和确定单元603:
所述切分单元601,用于根据获取的编码串切分得到多个词编码串,其中一个词编码串对应一个词,所述多个词编码串中包括相邻的第一词编码串和第二词编码串,所述第一词编码串和所述第二词编码串中的至少一个词编码串包括简拼部分;
所述计算单元602,用于计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度;
所述确定单元603,用于将第一关联程度满足第一预设条件的词组作为所述第一词编码串和所述第二词编码串对应的候选项。
可选的,所述装置还包括判断单元:
所述判断单元,用于判断编码库中是否存在与所述编码串相匹配的编码串;
若否,则触发所述切分单元。
可选的,所述计算单元用于:
根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述全编码串组合是由所述第一词编码串扩展的全编码串和所述第二词编码串扩展的全编码串组成的。
可选的,所述计算单元包括第一计算子单元和第二计算子单元:
所述第一计算子单元,用于计算全编码串组合的第二关联程度;
所述第二计算子单元,用于计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述第一关联程度包括所述第二关联程度。
可选的,所述计算单元包括第三计算子单元和第四计算子单元:
所述第三计算子单元,用于计算全编码串组合的第二关联程度;
所述第四计算子单元,用于若目标全编码串组合的第二关联程度满足第二预设条件,计算由所述第一词编码串扩展的目标全编码串所对应词和所述第二词编码串扩展的目标全编码串所对应词构成词组的第一关联程度,所述目标全编码串是由所述第一词编码串扩展的目标全编码串和所述第二词编码串扩展的目标全编码串组成的。
可选的,所述第一词编码串和所述第二词编码串均为纯简拼编码串。
由上述技术方案可以看出,针对根据所输入编码串切分得到的多个词编码串,若相邻的两个编码串例如第一词编码串和第二词编码串中包括简拼部分,可以计算该第一词编码串和第二词编码串各自对应词构成的词组的关联程度,若前述构成的某一词组的关联程度满足第一预设条件,可以明确组成该词组的两个词在输入时同时出现的概率较大,那么该词组与用户编码串所希望上屏词组相符的可能性较高,故将该词组作为第一词编码串和第二词编码串对应的候选项更有可能满足用户的输入需求,从而提高了用户的输入体验。
图7是根据一示例性实施例示出的一种用于候选项确定的装置700的框图。例如,装置700可以是机器人,移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图7,装置700可以包括以下一个或多个组件:处理组件702,存储器704,电源组件706,多媒体组件708,音频组件710,输入/输出(I/O)的接口712,传感器组件714,以及通信组件716。
处理组件702通常控制装置700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件702可以包括一个或多个处理器720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理部件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
存储器704被配置为存储各种类型的数据以支持在装置700的操作。这些数据的示例包括用于在装置700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件706为装置700的各种组件提供电力。电源组件706可以包括电源管理系统,一个或多个电源,及其他与为装置700生成、管理和分配电力相关联的组件。
多媒体组件708包括在所述装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当装置700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当装置700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件714包括一个或多个传感器,用于为装置700提供各个方面的状态评估。例如,传感器组件714可以检测到装置700的打开/关闭状态,组件的相对定位,例如所述组件为装置700的显示器和小键盘,传感器组件714还可以检测装置700或装置700一个组件的位置改变,用户与装置700接触的存在或不存在,装置700方位或加速/减速和装置700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通信。装置700可以接入基于通信标准的无线网络,如WiFi,2G或8G,或它们的组合。在一个示例性实施例中,通信部件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由装置700的处理器720执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种用于候选项确定方法,所述方法包括:
根据获取的编码串切分得到多个词编码串,其中一个词编码串对应一个词,所述多个词编码串中包括相邻的第一词编码串和第二词编码串,所述第一词编码串和所述第二词编码串中的至少一个词编码串包括简拼部分;
计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度;
将第一关联程度满足第一预设条件的词组作为所述第一词编码串和所述第二词编码串对应的候选项。
图8是本发明实施例中服务器的结构示意图。该服务器800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)822(例如,一个或一个以上处理器)和存储器832,一个或一个以上存储应用程序842或数据844的存储介质830(例如一个或一个以上海量存储设备)。其中,存储器832和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器822可以设置为与存储介质830通信,在服务器800上执行存储介质830中的一系列指令操作。
服务器800还可以包括一个或一个以上电源824,一个或一个以上有线或无线网络接口850,一个或一个以上输入输出接口858,一个或一个以上键盘854,和/或,一个或一个以上操作系统841,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (12)

1.一种候选项确定方法,其特征在于,所述方法包括:
根据获取的编码串切分得到多个词编码串,其中一个词编码串对应一个词,所述多个词编码串中包括相邻的第一词编码串和第二词编码串,所述第一词编码串和所述第二词编码串中的至少一个词编码串包括简拼部分;
根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述全编码串组合是由所述第一词编码串扩展的全编码串和所述第二词编码串扩展的全编码串组成的;
将第一关联程度满足第一预设条件的词组作为所述第一词编码串和所述第二词编码串对应的候选项。
2.根据权利要求1所述的方法,其特征在于,在所述根据获取的编码串切分得到多个词编码串之前,所述方法包括:
判断编码库中是否存在与所述编码串相匹配的编码串;
若否,则执行所述根据获取的编码串切分得到多个词编码串的步骤。
3.根据权利要求1所述的方法,其特征在于,所述根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度包括:
计算全编码串组合的第二关联程度;
计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述第一关联程度包括所述第二关联程度。
4.根据权利要求1所述的方法,其特征在于,所述根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度包括:
计算全编码串组合的第二关联程度;
若目标全编码串组合的第二关联程度满足第二预设条件,计算由所述第一词编码串扩展的目标全编码串所对应词和所述第二词编码串扩展的目标全编码串所对应词构成词组的第一关联程度,所述目标全编码串组合是由所述第一词编码串扩展的目标全编码串和所述第二词编码串扩展的目标全编码串组成的。
5.根据权利要求1所述的方法,其特征在于,所述第一词编码串和所述第二词编码串均为纯简拼编码串。
6.一种候选项确定装置,其特征在于,所述装置包括切分单元、计算单元和确定单元:
所述切分单元,用于根据获取的编码串切分得到多个词编码串,其中一个词编码串对应一个词,所述多个词编码串中包括相邻的第一词编码串和第二词编码串,所述第一词编码串和所述第二词编码串中的至少一个词编码串包括简拼部分;
所述计算单元,用于根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述全编码串组合是由所述第一词编码串扩展的全编码串和所述第二词编码串扩展的全编码串组成的;
所述确定单元,用于将第一关联程度满足第一预设条件的词组作为所述第一词编码串和所述第二词编码串对应的候选项。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括判断单元:
所述判断单元,用于判断编码库中是否存在与所述编码串相匹配的编码串;
若否,则触发所述切分单元。
8.根据权利要求6所述的装置,其特征在于,所述计算单元包括第一计算子单元和第二计算子单元:
所述第一计算子单元,用于计算全编码串组合的第二关联程度;
所述第二计算子单元,用于计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述第一关联程度包括所述第二关联程度。
9.根据权利要求6所述的装置,其特征在于,所述计算单元包括第三计算子单元和第四计算子单元:
所述第三计算子单元,用于计算全编码串组合的第二关联程度;
所述第四计算子单元,用于若目标全编码串组合的第二关联程度满足第二预设条件,计算由所述第一词编码串扩展的目标全编码串所对应词和所述第二词编码串扩展的目标全编码串所对应词构成词组的第一关联程度,所述目标全编码串组合是由所述第一词编码串扩展的目标全编码串和所述第二词编码串扩展的目标全编码串组成的。
10.根据权利要求6所述的装置,其特征在于,所述第一词编码串和所述第二词编码串均为纯简拼编码串。
11.一种用于候选项确定的处理设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
根据获取的编码串切分得到多个词编码串,其中一个词编码串对应一个词,所述多个词编码串中包括相邻的第一词编码串和第二词编码串,所述第一词编码串和所述第二词编码串中的至少一个词编码串包括简拼部分;
根据全编码串组合的第二关联程度计算所述第一词编码串所对应词和所述第二词编码串所对应词构成词组的第一关联程度,所述全编码串组合是由所述第一词编码串扩展的全编码串和所述第二词编码串扩展的全编码串组成的;
将第一关联程度满足第一预设条件的词组作为所述第一词编码串和所述第二词编码串对应的候选项。
12.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至5中一个或多个所述的候选项确定方法。
CN201711328457.5A 2017-12-13 2017-12-13 一种候选项确定方法和装置 Active CN109917927B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711328457.5A CN109917927B (zh) 2017-12-13 2017-12-13 一种候选项确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711328457.5A CN109917927B (zh) 2017-12-13 2017-12-13 一种候选项确定方法和装置

Publications (2)

Publication Number Publication Date
CN109917927A CN109917927A (zh) 2019-06-21
CN109917927B true CN109917927B (zh) 2022-07-08

Family

ID=66958648

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711328457.5A Active CN109917927B (zh) 2017-12-13 2017-12-13 一种候选项确定方法和装置

Country Status (1)

Country Link
CN (1) CN109917927B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112987941B (zh) * 2019-12-17 2024-02-13 北京搜狗科技发展有限公司 生成候选词的方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11238051A (ja) * 1998-02-23 1999-08-31 Toshiba Corp 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
CN100458795C (zh) * 2007-02-13 2009-02-04 北京搜狗科技发展有限公司 一种智能组词输入的方法和一种输入法系统及其更新方法
CN102214238B (zh) * 2011-07-01 2012-10-24 临沂大学 一种汉语词语相近性匹配装置及方法
CN103365573B (zh) * 2012-03-27 2017-07-21 北京搜狗科技发展有限公司 一种对多键输入字符进行识别的方法和装置
CN103076892B (zh) * 2012-12-31 2016-09-28 百度在线网络技术(北京)有限公司 一种用于提供输入字符串所对应的输入候选项的方法与设备
CN104951099B (zh) * 2015-06-16 2017-12-19 北京奇虎科技有限公司 一种基于输入法的展示候选项的方法和装置
CN107291260B (zh) * 2016-04-13 2021-11-02 北京搜狗科技发展有限公司 一种信息输入方法和装置、及用于信息输入的装置
CN106873799B (zh) * 2017-02-16 2020-10-09 北京百度网讯科技有限公司 输入方法和装置

Also Published As

Publication number Publication date
CN109917927A (zh) 2019-06-21

Similar Documents

Publication Publication Date Title
US10296201B2 (en) Method and apparatus for text selection
CN107291704B (zh) 处理方法和装置、用于处理的装置
US11335348B2 (en) Input method, device, apparatus, and storage medium
CN111831806A (zh) 语义完整性确定方法、装置、电子设备和存储介质
CN109725736B (zh) 一种候选排序方法、装置及电子设备
CN107943317B (zh) 输入方法及装置
CN108628461B (zh) 一种输入方法和装置、一种更新词库的方法和装置
CN110648657A (zh) 一种语言模型训练方法、构建方法和装置
CN109917927B (zh) 一种候选项确定方法和装置
CN110780749B (zh) 一种字符串纠错方法和装置
CN109901726B (zh) 一种候选词生成方法、装置及用于候选词生成的装置
CN109799916B (zh) 一种候选项联想方法和装置
CN109308126B (zh) 一种候选词展示方法和装置
CN109144286B (zh) 一种输入方法及装置
CN108073294B (zh) 一种智能组词方法和装置、一种用于智能组词的装置
CN109426359B (zh) 一种输入方法、装置以及机器可读介质
CN109558017B (zh) 一种输入方法、装置和电子设备
CN107015736B (zh) 一种按键处理方法和装置、一种用于按键处理的装置
CN110716653B (zh) 一种联想源确定方法和装置
CN112015281A (zh) 一种云端联想方法和相关装置
CN111381685B (zh) 一种句联想方法和装置
CN110580126B (zh) 一种虚拟键盘和基于虚拟键盘的输入方法
CN110781270A (zh) 一种解码网络中非关键词模型的构建方法和装置
CN111722726B (zh) 一种颜文字的确定方法和装置
CN111198619A (zh) 联想候选生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant