CN111026281A - 一种客户端的词组推荐方法、客户端及存储介质 - Google Patents
一种客户端的词组推荐方法、客户端及存储介质 Download PDFInfo
- Publication number
- CN111026281A CN111026281A CN201911063161.4A CN201911063161A CN111026281A CN 111026281 A CN111026281 A CN 111026281A CN 201911063161 A CN201911063161 A CN 201911063161A CN 111026281 A CN111026281 A CN 111026281A
- Authority
- CN
- China
- Prior art keywords
- character string
- character
- matched
- client
- tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
Abstract
本发明实施例公开了一种客户端的词组推荐方法、客户端及存储介质,其中方法包括:获取用户在客户端输入的文本,将所述文本转换为字符串,并确定所述字符串对应的候选字符串集,将所述候选字符串集中的候选字符串与所述客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应的词组作为目标词组,所述字符串树是根据所述垂直领域专有词库包括的词组的字符串建立的,每个词组对应一棵字符串树,根据所述目标词组和所述目标词组对应的词频生成词组推荐结果。通过实施上述方法,可以利用客户端的垂直领域专有词库为用户的输入推荐相匹配的词组,降低用户的无效输入,提升用户体验。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种客户端的词组推荐方法、客户端及存储介质。
背景技术
随着电子技术和互联网技术的快速发展,人们对智能手机,平板电脑等终端的使用越来越频繁,人们需要经常在终端的客户端内利用输入法软件输入文本,有些用户在输入文本的过程中可能会打错拼音,或者由于个人的输入习惯,在输入文本的过程中使用比较多的缩写或一部分缩写,现在输入法软件可以针对用户的这些错误输入进行纠正,但输入法软件对于用户的输入都是基于用户本身的输入习惯和云端大量用户的输入习惯来推荐词组,而当用户在使用率低的客户端内输入文本时,基于用户本身的输入习惯和云端大量用户的输入习惯来推荐词组的方式准确性不高,现在输入法软件并不能根据不同客户端的特点来针对用户的错误输入进行推荐词组,用户体验较差。
发明内容
本发明实施例提供了一种客户端的词组推荐方法、客户端及存储介质,可以利用客户端的垂直领域专有词库为用户的输入推荐相匹配的词组,降低用户的无效输入,提升用户体验。
本发明实施例第一方面公开了一种客户端的词组推荐方法,所述方法包括:
获取用户在客户端输入的文本;
将所述文本转换为字符串,并确定所述字符串对应的候选字符串集;
将所述候选字符串集中的候选字符串与所述客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应的词组作为目标词组,所述字符串树是根据所述垂直领域专有词库包括的词组的字符串建立的,每个词组对应一棵字符串树;
根据所述目标词组和所述目标词组对应的词频生成词组推荐结果。
本发明实施例第二方面公开了一种客户端,所述客户端包括:
获取模块,用于获取用户在客户端输入的文本;
确定模块,用于将所述文本转换为字符串,并确定所述字符串对应的候选字符串集;
匹配模块,用于将所述候选字符串集中的候选字符串与所述客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应的词组作为目标词组,所述字符串树是根据所述垂直领域专有词库包括的词组的字符串建立的,每个词组对应一棵字符串树;
生成模块,用于根据所述目标词组和所述目标词组对应的词频生成词组推荐结果。
本发明实施例第三方面公开了一种终端,包括处理器、存储器、输入设备和输出设备,所述处理器、存储器、输入设备和输出设备相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第一方面的方法。
本发明实施例第四方面公开了一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。
本发明实施例中,客户端获取用户在客户端输入的文本,将文本转换为字符串,并确定字符串对应的候选字符串集,将候选字符串集中的候选字符串与客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应的词组作为目标词组,字符串树是根据垂直领域专有词库包括的词组的字符串建立的,每个词组对应一棵字符串树,进一步的,客户端根据目标词组和目标词组对应的词频生成词组推荐结果。通过实施上述方法,可以利用客户端的垂直领域专有词库为用户的输入推荐相匹配的词组,降低用户的无效输入,提升用户体验。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种客户端的词组推荐方法的流程示意图;
图2a是本发明实施例提供的一种输入法九宫格界面的示意图;
图2b是本发明实施例提供的一种输入法全键盘界面的示意图;
图2c是本发明实施例提供的一种输入法推荐结果界面的示意图;
图2d是本发明实施例提供的一种字符串树的示意图;
图3是本发明实施例提供的另一种客户端的词组推荐的流程示意图;
图4是本发明实施例提供的又一种客户端的词组推荐的流程示意图;
图5是本发明实施例提供的一种客户端的结构示意图;
图6是本发明实施例提供的一种终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,为本发明实施例提供的一种客户端的词组推荐方法的流程示意图。本实施例中所描述的客户端的词组推荐方法,包括以下步骤:
101:获取用户在客户端输入的文本。
具体的,用户可以在客户端内使用输入法在待输入框输入用户需要的文本,客户端获取该文本,其中客户端是指有针对某些相关业务的客户端,例如金融理财类、旅游出行类、购物类、外卖类、新闻阅读类客户端,上述客户端可以运行在终端上,终端例如可以是智能手机、平板电脑等。
102:将文本转换为字符串,并确定字符串对应的候选字符串集。
具体的,客户端在获取到用户在客户端输入的文本后,可以将用户文本转换为字符串,其中,字符串即为文本对应的拼音,并获取客户端当前输入法的输入模式,客户端根据输入模式确定字符串中每个字符对应的可选字符,其中,每个字符即为文本对应的拼音中的每个字母,将字符串中每个字符和可选字符进行排列组合,得到组合结果,并将组合结果确定为字符串对应的候选字符串集。
其中,输入模式可以是九宫格或全键盘,候选字符串集的产生个数为M为候选字符串长度,对于九宫格而言,如图2a所示,N为候选字符串中第m个字符对应的九宫格按键上的字符个数,比如字符串中第m个字符为c,则N为3,再比如字符串中第m个字符为x,则N为4,针对输入模式为九宫格的候选字符串集的产生个数为字符串中每个字符对应的在九宫格按键上的字符个数的相乘。对于全键盘而言,如图2b所示,N为字符串中第m个字符对应的全键盘按键上的周围字符个数,比如字符串中第m个字符为f,则N为7,再比如字符串中第m个字符为x,则N为5,针对输入模式为全键盘的候选字符串集的产生个数为字符串中每个字符对应的在全键盘按键上的周围字符个数的相乘。
举例来说,如图2c所示,用户在旅游出行类客户端使用输入法在待输入框输入想要的文本是“欢乐谷”,用户可能因为会使用比较多的缩写或一部分缩写的输入习惯,在九宫格按照“hualeg”进行输入,输入法会推荐“花蕾”、“瓜类”等词,因为这部分缩写也能组成一些正确的词语,输入法推荐出的第一个词“花蕾”这个词有可能会误输入在客户端中,则客户端根据“花蕾”这个词的字符串“hualei”确定候选字符串集,由字符串“hualei”可以产生“htaldg”、“hualeh”、“huajei”、“hualeg”等候选字符串,字符串“hualei”中每个字符在九宫格按键上的字符个数均为3,则字符串“hualei”的候选字符串个数为3*3*3*3*3*3-1=728。
在一种实现方式中,客户端获取用户在客户端输入的文本可以是获取用户在客户端的待输入框输入的文本,在获取用户在客户端输入的文本之后,还可以通过解析待输入框的属性来判断是否要启动词组推荐功能,输入框的属性可以分为个性化属性和通用属性,目标属性为通用属性,即每个用户都可以在此输入相同的信息,比如用户在新闻阅读类客户端中在待输入框输入当前热点新闻关键词,个性化属性为每个用户在此输入的信息是不同的,比如姓名、地址等。如果待输入框的属性为目标属性时,客户端启动词组推荐功能,并执行所述查询所述垂直领域专有词库中是否存在与所述文本匹配的词组的步骤,如果待输入框的属性为个性化属性时,就可以直接使用用户输入作为输入,而不需要启动词组推荐功能。
在一种实现方式中,客户端在获取用户在客户端输入的文本之后,在将文本转换为字符串,并确定字符串对应的候选字符串集之前,客户端还可以查询客户端对应的垂直领域专有词库中是否存在与文本匹配的词组。具体的,终端可以基于文本与客户端对应的垂直领域专有词库中的词组之间的相似度确定两者是否相匹配,若文本与客户端对应的垂直领域专有词库中的词组的相似度大于预设相似度阈值,则可以确定该文本与客户端对应的垂直领域专有词库中的词组相匹配。其中,相似度的具体计算方式可以为,计算文本的第一词向量以及客户端对应的垂直领域专有词库中的词组的第二词向量,并确定第一词向量与第二词向量之间的欧式距离,根据欧式距离与相似度的对应关系确定文本与客户端对应的垂直领域专有词库中的词组之间的相似度,其中,欧式距离与相似度的对应关系具体可以由研发人员预先设置,具体可以为欧式距离越小,则相似度越大。如果垂直领域专有词库中存在与文本匹配的词组,则根据垂直领域专有词库中与文本匹配的词组和对应的词频生成词组推荐结果,如果垂直领域专有词库中不存在与文本匹配的词组,则将文本转换为字符串,并确定字符串对应的候选字符串集。
其中,客户端对应的垂直领域专有词库可以包括客户端自己垂直领域的专有词汇,例如金融理财类客户端的“基金”、“黄金”、“股票”、“定期保”等专有词汇,外卖类客户端的“粥”,“蟹”,一些特色的餐馆名等专有词汇,还可以包括客户端中累积的用户输入数据。
103:将候选字符串集中的候选字符串与客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应的词组作为目标词组,字符串树是根据垂直领域专有词库包括的词组的字符串建立的,每个词组对应一棵字符串树。
其中,客户端对应的垂直领域专有词库中每个词组都对应一颗字符串树,字符串树即拼音树,每个词组的字符串树包括三层节点,字符串树的第一层节点为根节点,该词组中每个字对应字符串的第一个字符,即拼音中的声母作为字符串树的第二层节点,该词组中每个字对应字符串的剩余字符,即拼音中的每个声母对应的韵母作为该字第一个字符所在第二层节点的子节点,组成字符串树的第三层节点。例如,针对旅游出行类客户端的垂直领域专有词库中的词组有“欢乐谷”、“颐和园”等等,则“欢乐谷”的字符串“huanlegu”所对应的字符串树如图2d所示,字符串树的第一层节点为根节点,“欢乐谷”由“欢”、“乐”、“谷”三个字组成,每个字对应的字符串分别为“huan”、“le”、“gu”,这三个字符串的第一个字符“h”、“l”、“g”为字符串树的第二层节点,每个字对应的字符串剩余字符,即“uan”、“e”、“u”为字符串树的第三层节点,并且“u”、“a”、“n”是“欢”字对应字符串“huan”的第一个字符“h”的子节点,“e”是“乐”字对应字符串“le”的第一个字符“l”的子节点,“u”是“谷”字对应字符串“gu”的第一个字符“g”的子节点。
具体的,客户端可以获取候选字符串集中的候选字符串对应词组的长度,其中,候选字符串对应词组的长度可以是候选字符串中声母的个数,并依次判断候选字符串集中的候选字符串对应词组的长度是否超过预设长度阈值,其中,预设长度阈值可以为垂直领域专有词库中词组的最大长度,如果候选字符串对应词组的长度超过预设长度阈值,则放弃该候选字符串进行匹配,继续遍历候选字符串集中下一个候选字符串,判断其对应词组的长度是否超过预设长度阈值,如果不超过预设长度阈值,则将该候选字符串确定为待匹配候选字符串,将待匹配候选字符串和客户端对应的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应词组作为目标词组。
在一种实现方式中,将待匹配候选字符串和客户端对应的垂直领域专有词库的字符串树进行匹配的具体方式可以是客户端针对所述客户端的垂直领域专有词库的每个字符串树,按照从左至右的顺序,将该字符串树的第二层节点的字符与待匹配候选字符串的字符依次进行匹配;如果第二层节点中第i个节点的字符与待匹配候选字符串的第j个字符未匹配,且i与j均大于1,则按照从左至右的顺序,将第二层节点中第i-1个节点对应子节点的字符与第j个字符进行匹配,其中,i小于或等于第二层节点的总数,j小于或等于待匹配候选字符串的字符总数,i=j;如果子节点中第k个子节点的字符与待匹配候选字符串的第j+k-1个字符未匹配,且k>1,则将第j+k-1个字符与第i个节点的字符进行匹配,且k小于或等于子节点的总数,例如,i=j=2,k=3,第二层节点中第二个节点的字符与待匹配候选字符串的第二个字符未匹配,则按照从左至右的顺序,将第二层节点中第一个节点对应子节点的字符与第二个字符进行匹配,子节点中第3个子节点的字符与待匹配候选字符串的第4个字符未匹配,则将第4个字符与第2个节点的字符进行匹配,在待匹配候选字符串的最后一个字符与该字符串树的节点对应字符匹配的情况下,将该字符串树对应的词组作为目标词组;如果i=1,且j=1,或者k=1,或者第j+k-1个字符与第i个节点的字符未匹配,或者最后一个字符与该字符串树的节点对应字符未匹配,则结束匹配。
举例来说,将待匹配候选字符串和客户端对应的垂直领域专有词库的字符串树进行匹配的方法可以利用如下步骤1-步骤8。
步骤1:假设待匹配候选字符串的字符串s为“abcd”,代表4个字符,初始化,j(代表遍历到s的第几个字符)赋值为0,A指针(指代字符串树的第二层正确匹配上的字符)赋值为空,A2指针(指代字符串树的第二层正确匹配上的字符下面的子节点)赋值为空。
步骤2:针对某一字符串树,取s的第j个字符s[j];
步骤3:若A为空,则取根节点最左边的子节点(字符串树的第二层节点最左边一个节点)判断是否一致,若不一致,则结束匹配,跳转步骤8;若一致,则将A赋值为根节点最左边的子节点(字符串树的第二层节点最左边一个节点),j++,跳转步骤7;
步骤4:若A不为空A2为空,则判断A指针所指节点右边的节点与s[j]是否一致,若一致,j++,跳转步骤7;若不一致,判断A指针所指节点是否有子节点(字符串树的第三层节点),如果没有子节点,则结束匹配,跳转步骤8;若A有子节点,则跳转步骤6;
步骤5:若A不为空A2不为空,直接判断A2指针所指节点右边一个节点与s[j]是否一致,若一致,则将A2赋值为A2指针所指节点右边一个节点,j++,跳转步骤7;若不一致,则判断A指针所指节点的右边一个节点是否存在,若不存在,则直接结束匹配,跳转步骤8;若存在,则返回上一层将A赋值为A指针所指节点的右边一个节点,A2赋值为空,判断A指针所指节点与s[j]是否一致,如果不一致,则结束匹配,跳转步骤8,若一致,则j++,跳转步骤7;
步骤6:从左到右判断A指针所指节点的子节点,若A指针所指节点最左边一个子节点与s[j]不一致,则结束匹配,跳转步骤8;若A指针所指节点最左边一个子节点与s[j]一致,则将A2赋值为A指针所指节点最左边一个子节点,j++,跳转步骤7;若不是第一个子节点与s[j]不一致,则判断A指针所指节点的右边一个节点是否存在,若不存在,则直接结束匹配,跳转步骤8;若存在,则返回上一层将A赋值为A指针所指节点的右边一个节点,A2赋值为空,判断A指针所指节点与s[j]是否一致,如果不一致,则结束匹配,跳转步骤8,若一致,则j++,跳转步骤7;若A指针所指节点最右边一个子与s[j]一致,则返回上一层将A赋值为A指针所指节点的右边一个节点,A2赋值为空,j++,跳转步骤7;
步骤7:若j小于等于s的总长度则跳转步骤2,否则结束匹配,并且该词组的字符串满足条件。
步骤8:遍历下一个字符串树。
举例再说,针对用户在旅游出行类客户端使用输入法在待输入框输入想要的文本是“欢乐谷”,但用户在九宫格按照“hualeg”进行输入,根据输入法推荐出的第一个词“花蕾”这个词的字符串“hualei”的候选字符串与客户端对应的垂直领域专有词库的字符串树进行匹配,其中,该客户端对应的垂直领域专有词库的预设长度阈值设置为4,假设已经遍历到垂直领域专有词库中“欢乐谷”这个词组对应的字符串树,其匹配过程如下:
遍历到“htaldg”这个候选字符串时,这个候选字符串的声母有5个,大于预设长度阈值4,则直接跳过,不予判断。
遍历到“hualeh”这个候选字符串时,这个候选字符串的声母有3个,不大于预设长度阈值4,进行后续操作。把这个候选字符串和已有词组构成的字符串树,如图2d所示,进行匹配,首先遍历到字符串树的第二层节点h满足,继续遍历l不满足,则继续判断第二层节点h的子节点(第三层节点),u满足,遍历a满足,遍历n不满足,则返回上一层(第二层节点)继续判断,l满足,继续遍历g不满足,则继续遍历l的子节点(第三层节点),遍历e满足,返回上一层(第二层节点)继续判断,g不满足,不能继续判断g的子节点或同一层后续节点,字符串串不满足条件,结束。
遍历到“hualeg”这个候选字符串时,这个候选字符串的声母有3个,不大于预设长度阈值4,进行后续操作。把这个候选字符串和已有词组构成的字符串树,如图2d所示,进行匹配,首先遍历到字符串树的第二层节点h满足,继续遍历l不满足,则继续判断第二层节点h的子节点(第三层节点),u满足,遍历a满足,遍历n不满足,则返回上一层(第二层节点)继续判断,l满足,继续遍历g不满足,则继续遍历l的子节点(第三层节点),遍历e满足,返回上一层(第二层节点)继续判断,g满足,所有字符串串都满足条件,结束,则将这个字符串树对应的垂直领域专有词库中的词组“欢乐谷”作为目标词组。
继续遍历候选字符串并按照规则判断,返回找到的所有目标词组。
104:根据目标词组和目标词组对应的词频生成词组推荐结果。
其中,客户端垂直领域的专有词汇中的每一个词组的字符串对应有一颗字符串树,每一个词组都对应一个词频,词组对应的词频可以离线统计,是在历史数据中每个词组出现的频率。
具体的,客户端可以获取目标词组对应的词频,并按照词频从高到低的排列生成词组推荐结果。
本发明实施例中,客户端获取用户在客户端输入的文本,将文本转换为字符串,并确定字符串对应的候选字符串集,将候选字符串集中的候选字符串与客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应的词组作为目标词组,字符串树是根据垂直领域专有词库包括的词组的字符串建立的,每个词组对应一棵字符串树,进一步的,客户端根据目标词组和目标词组对应的词频生成词组推荐结果。通过实施上述方法,可以利用客户端的垂直领域专有词库为用户的输入推荐相匹配的词组,降低用户的无效输入,提升用户体验。
请参阅图3,为本发明实施例提供的另一种客户端的词组推荐方法的流程示意图。本实施例中所描述的客户端的词组推荐方法,包括以下步骤:
301:获取用户在客户端输入的文本。
302:将文本转换为字符串,并确定字符串对应的候选字符串集。
303:获取候选字符串集中的候选字符串对应词组的长度。
具体的,客户端可以获取候选字符串集中的候选字符串对应词组的长度,其中,候选字符串对应词组的长度可以为字符串中声母的个数,预设长度阈值可以是客户端对应的垂直领域专有词库中词组的最大长度。例如,客户端根据“花蕾”这个词的字符串“hualei”确定候选字符串集,由字符串“hualei”可以产生“htaldg”、“hualeh”、“huakei”、“hualeg”等候选字符串,候选字符串“htaldg”、“hualeh”、“huakei”、“hualeg”中声母个数分别为5、3、2、3,即候选字符串“htaldg”、“hualeh”、“huakei”、“hualeg”对应词组的长度分别为5、3、2、3。
304:将长度不超过预设长度阈值的候选字符串确定为待匹配候选字符串。
具体的,客户端在获取候选字符串集中的候选字符串对应词组的长度的过程中,将候选字符串集中对应的词组的长度不超过预设长度阈值的候选字符串确定为待匹配候选字符串,例如,客户端对应的垂直领域专有词库中词组的最大长度为4,即垂直领域专有词库中组成某个词组的字最多为4个字,则预设长度阈值为4,对于由字符串“hualei”可以产生“htaldg”、“hualeh”、“huakei”、“hualeg”等候选字符串,候选字符串“htaldg”中有5个声母,是大于预设长度阈值4的,则这个候选字符串不能为待匹配候选字符串,候选字符串“hualeh”、“huakei”、“hualeg”中声母个数分别为3、2、3,是小于预设长度阈值4的,则这3个候选字符串为待匹配候选字符串。
305:将待匹配候选字符串与客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应词组作为目标词组。
具体的,将待匹配候选字符串和客户端对应的垂直领域专有词库的字符串树进行匹配,匹配的具体方式可以是客户端按照预设字符串截断规则将待匹配候选字符串分为n(n大于等于1)个字符组,其中,预设字符串截断规则可以是声母截断,针对客户端的垂直领域专有词库的每个字符串树,将n个字符组中每个字符组的第一个字符依次与该字符串树第二层节点的字符进行匹配,如果每个字符组的第一个字符均与该字符串树第二层节点的字符匹配,则将每个字符组除第一个字符之外的字符依次与该字符串树第三层节点中目标节点的字符进行匹配,目标节点为字符与每个字符组第一个字符匹配的第二层节点的子节点,在每个字符组除第一个字符之外的字符均与该字符串树第三层节点的字符匹配的情况下,将该字符串树对应词组作为目标词组,如果每个字符组中存在目标字符组,即目标字符组的第一个字符与该字符串树第二层节点的字符不匹配,或目标字符组除第一个字符之外的字符与该字符串树第三层节点的字符不匹配,则结束匹配。
举例来说,将待匹配候选字符串和客户端对应的垂直领域专有词库的字符串树进行匹配的方法可以利用如下步骤1-步骤2。
步骤1:假设待匹配候选字符串的字符串s为“abcd”,代表4个字符,按照声母截断方式将其分为n个字的字符串S[n];
步骤2:从左到右依次匹配每个字的字符串S[n]和垂直领域专有词组的字符串树的每个分支,首先看每个字的字符串S[n]中的声母是否与字符串树的第二层节点所表示的声母一致,不一致则直接结束匹配,遍历下一个字符串树;声母一致后,如果声母后面对应的还有韵母,则依次匹配每个字的字符串S[n]中的韵母是否与字符串树的第三层节点所表示的韵母一致。如果全部都一致,则将该字符串树对应的词组作为目标词组。
举例再说,针对用户在旅游出行类客户端使用输入法在待输入框输入想要的文本是“欢乐谷”,但用户在九宫格按照“hualeg”进行输入,根据输入法推荐出的第一个词“花蕾”这个词的字符串“hualei”的待匹配候选字符串与客户端对应的垂直领域专有词库的字符串树进行匹配,假设已经遍历到垂直领域专有词库中“欢乐谷”这个词组对应的字符串树,其匹配过程如下:
遍历到“hualeh”这个待匹配候选字符串,这个待匹配候选字符串按照声母切分成了“hua”、“le”、“h”三个字的字符串,与字符串树的第二层节点个数3一致,然后对比这三个字符串的声母与字符串树的第二层节点所表示的声母是否一致,是不一致的,结束匹配。
遍历到“huakei”这个待匹配候选字符串,这个待匹配候选字符串按照声母切分成了“hua”、“kei”两个字的字符串,这个待匹配候选词语字符串只有两个,小于字符串树的第二层节点个数3,是不一致的,结束匹配。
遍历到“hualeg”这个待匹配候选字符串,这个待匹配候选字符串按照声母切分成了“hua”、“le”、“g”三个字的字符串,与字符串树的第二层节点个数3一致,然后对比这三个字符串的声母与字符串树的第二层节点所表示的声母是否一致,是一致的,则继续比对这三个字符串的韵母与第三层节点所表示的韵母是否一致,都是一致的,结束,则将这个字符串树对应的垂直领域专有词库中的词组“欢乐谷”作为目标词组。
继续遍历候选字符串并按照规则判断,返回找到的所有目标词组。
306:根据目标词组和目标词组对应的词频生成词组推荐结果。
其中,步骤301、302、306的具体实施方式可以参见上述实施例步骤101、102、104的具体描述,此处不再赘述。
本发明实施例中,客户端获取用户在客户端输入的文本,将文本转换为字符串,并确定字符串对应的候选字符串集,接着,客户端获取候选字符串集中的候选字符串对应词组的长度,将长度不超过预设长度阈值的候选字符串确定为待匹配候选字符串,进一步的,客户端将待匹配候选字符串与客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应词组作为目标词组,根据目标词组和目标词组对应的词频生成词组推荐结果。通过实施上述方法,可以利用客户端的垂直领域专有词库为用户的输入推荐相匹配的词组,降低用户的无效输入,提升用户体验。
请参阅图4,为本发明实施例提供的又一种客户端的词组推荐方法的流程示意图。在图4的流程中,用户可以在客户端内使用输入法在待输入框输入用户需要的文本,客户端获取该文本,并且可以根据待输入框的属性来判断是否要启动词组推荐功能,输入框的属性可以分为个性化属性和通用属性,目标属性为通用属性,即每个用户都可以在此输入相同的信息,个性化属性为每个用户在此输入的信息是不同的,比如姓名、地址等。如果待输入框的属性为个性化属性时,就可以直接使用用户输入作为输入,而不需要启动词组推荐功能。如果待输入框的属性为目标属性时,客户端可以启动词组推荐功能,进一步的,客户端查询客户端对应的垂直领域专有词库中是否存在与文本匹配的词组,如果垂直领域专有词库中存在与文本匹配的词组,则根据垂直领域专有词库中与文本匹配的词组和对应的词频生成词组推荐结果,如果垂直领域专有词库中不存在与文本匹配的词组,则将文本转换为字符串,并确定字符串对应的候选字符串集,用客户端可以获取候选字符串集中的候选字符串对应词组的长度,其中,候选字符串对应词组的长度可以是候选字符串中声母的个数,如果候选字符串对应词组的长度超过预设长度阈值,其中,预设长度阈值可以为垂直领域专有词库中词组的最大长度,则放弃该候选字符串进行匹配,继续遍历候选字符串集中下一个候选字符串,如果候选字符串对应词组的长度不超过预设长度阈值,则将该候选字符串确定为待匹配候选字符串,将待匹配候选字符串和客户端对应的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应词组作为目标词组,终端可以获取目标词组对应的词频,并按照词频从高到低的排列生成词组推荐结果,通过实施上述方法,可以利用客户端的垂直领域专有词库为用户的输入推荐相匹配的词组,降低用户的无效输入,提升用户体验。
请参阅图5,为本发明实施例提供的一种客户端的结构示意图。所述客户端包括:
获取模块501,用于获取用户在客户端输入的文本;
确定模块502,用于将所述文本转换为字符串,并确定所述字符串对应的候选字符串集;
匹配模块503,用于将所述候选字符串集中的候选字符串与所述客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应的词组作为目标词组,所述字符串树是根据所述垂直领域专有词库包括的词组的字符串建立的,每个词组对应一棵字符串树;
生成模块504,用于根据所述目标词组和所述目标词组对应的词频生成词组推荐结果。
在一种实现方式中,所述每个词组的字符串树包括三层节点,所述字符串树的第一层节点为根节点,该词组中每个字对应字符串的第一个字符作为所述字符串树的第二层节点,该词组中每个字对应字符串的剩余字符作为该字第一个字符所在第二层节点的子节点,组成所述字符串树的第三层节点。
在一种实现方式中,所述装置还包括查询模块505,具体用于:
查询所述垂直领域专有词库中是否存在与所述文本匹配的词组;
若是,则根据所述垂直领域专有词库中与所述文本匹配的词组和对应的词频生成词组推荐结果;
若否,则执行所述将所述文本转换为字符串,并确定所述字符串对应的候选字符串集的步骤。
在一种实现方式中,所述获取模块501,具体用于获取用户在客户端的待输入框输入的文本;
所述装置还包括启动模块506,具体用于在所述待输入框的属性为目标属性时,启动词组推荐功能,并执行所述查询所述垂直领域专有词库中是否存在与所述文本匹配的词组的步骤。
在一种实现方式中,所述匹配模块503,具体用于:
获取所述候选字符串集中的候选字符串对应词组的长度;
将长度不超过所述预设长度阈值的候选字符串确定为待匹配候选字符串;
将所述待匹配候选字符串与所述客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应词组作为目标词组。
在一种实现方式中,所述匹配模块503,具体用于:
针对所述客户端的垂直领域专有词库的每个字符串树,按照从左至右的顺序,将该字符串树的第二层节点的字符与所述待匹配候选字符串的字符依次进行匹配;
若所述第二层节点中第i个节点的字符与所述待匹配候选字符串的第j个字符未匹配,且i与j均大于1,则按照从左至右的顺序,将所述第二层节点中第i-1个节点对应子节点的字符与所述第j个字符进行匹配,所述i小于或等于所述第二层节点的总数,所述j小于或等于所述待匹配候选字符串的字符总数,i=j;
若所述子节点中第k个子节点的字符与所述待匹配候选字符串的第j+k-1个字符未匹配,且k>1,则将所述第j+k-1个字符与所述第i个节点的字符进行匹配,所述k小于或等于所述子节点的总数;
在所述待匹配候选字符串的最后一个字符与该字符串树的节点对应字符匹配的情况下,将该字符串树对应的词组作为目标词组;
若i=1,且j=1,或者k=1,或者所述第j+k-1个字符与所述第i个节点的字符未匹配,或者所述最后一个字符与该字符串树的节点对应字符未匹配,则结束匹配。
在一种实现方式中,所述匹配模块503,具体用于:
按照预设字符串截断规则将所述待匹配候选字符串分为n个字符组,其中,n大于等于1;
针对所述客户端的垂直领域专有词库的每个字符串树,将所述n个字符组中每个字符组的第一个字符依次与该字符串树第二层节点的字符进行匹配;
若所述每个字符组的第一个字符均与该字符串树第二层节点的字符匹配,则将所述每个字符组除第一个字符之外的字符依次与该字符串树第三层节点中目标节点的字符进行匹配,所述目标节点为字符与所述每个字符组第一个字符匹配的第二层节点的子节点;
在所述每个字符组除第一个字符之外的字符均与该字符串树第三层节点的字符匹配的情况下,将该字符串树对应词组作为目标词组;
若所述每个字符组中存在目标字符组,则结束匹配,所述目标字符组的第一个字符与该字符串树第二层节点的字符不匹配,或所述目标字符组除第一个字符之外的字符与该字符串树第三层节点的字符不匹配。
在一种实现方式中,所述确定模块502,具体用于:
获取所述客户端当前输入法的输入模式;
根据所述输入模式确定所述字符串中每个字符对应的可选字符;
将所述字符串中每个字符和所述可选字符进行排列组合,得到组合结果,将所述组合结果确定为所述字符串对应的候选字符串集。
可以理解的是,本发明实施例所描述的客户端的词组推荐装置的各功能模块的功能可根据图1或者图3或者图4所述的方法实施例中的方法具体实现,其具体实现过程可以参照图1或者图3或者图4的方法实施例的相关描述,此处不再赘述。
本发明实施例中,获取模块501获取用户在客户端输入的文本,确定模块502将所述文本转换为字符串,并确定所述字符串对应的候选字符串集,匹配模块503将所述候选字符串集中的候选字符串与所述客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应的词组作为目标词组,所述字符串树是根据所述垂直领域专有词库包括的词组的字符串建立的,每个词组对应一棵字符串树,进一步的,生成模块504根据所述目标词组和所述目标词组对应的词频生成词组推荐结果。通过实施上述方法,可以利用客户端的垂直领域专有词库为用户的输入推荐相匹配的词组,降低用户的无效输入,提升用户体验。
请参阅图6,为本发明实施例提供了一种终端的结构示意图。其中,图5所描述的客户端运行在所述终端上,本实施例中所描述的终端,包括:处理器601、存储器602、输入设备603以及输出设备604。上述处理器601、存储器602、输入设备603以及输出设备604之间可以交互数据。
上述处理器601可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
上述存储器602可以包括只读存储器和随机存取存储器,并向处理器601提供程序指令和数据。存储器602的一部分还可以包括非易失性随机存取存储器。其中,所述处理器601调用所述程序指令时用于执行:
获取用户在客户端输入的文本;
将所述文本转换为字符串,并确定所述字符串对应的候选字符串集;
将所述候选字符串集中的候选字符串与所述客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应的词组作为目标词组,所述字符串树是根据所述垂直领域专有词库包括的词组的字符串建立的,每个词组对应一棵字符串树;
根据所述目标词组和所述目标词组对应的词频生成词组推荐结果。
在一种实现方式中,所述每个词组的字符串树包括三层节点,所述字符串树的第一层节点为根节点,该词组中每个字对应字符串的第一个字符作为所述字符串树的第二层节点,该词组中每个字对应字符串的剩余字符作为该字第一个字符所在第二层节点的子节点,组成所述字符串树的第三层节点。
在一种实现方式中,所述处理器601,还用于:
查询所述垂直领域专有词库中是否存在与所述文本匹配的词组;
若是,则根据所述垂直领域专有词库中与所述文本匹配的词组和对应的词频生成词组推荐结果;
若否,则执行所述将所述文本转换为字符串,并确定所述字符串对应的候选字符串集的步骤。
在一种实现方式中,所述处理器601,具体用于获取用户在客户端的待输入框输入的文本;
所述处理器601,还用于在所述待输入框的属性为目标属性时,启动词组推荐功能,并执行所述查询所述垂直领域专有词库中是否存在与所述文本匹配的词组的步骤。
在一种实现方式中,所述处理器601,具体用于:
获取所述候选字符串集中的候选字符串对应词组的长度;
将长度不超过所述预设长度阈值的候选字符串确定为待匹配候选字符串;
将所述待匹配候选字符串与所述客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应词组作为目标词组。
在一种实现方式中,所述处理器601,具体用于:
针对所述客户端的垂直领域专有词库的每个字符串树,按照从左至右的顺序,将该字符串树的第二层节点的字符与所述待匹配候选字符串的字符依次进行匹配;
若所述第二层节点中第i个节点的字符与所述待匹配候选字符串的第j个字符未匹配,且i与j均大于1,则按照从左至右的顺序,将所述第二层节点中第i-1个节点对应子节点的字符与所述第j个字符进行匹配,所述i小于或等于所述第二层节点的总数,所述j小于或等于所述待匹配候选字符串的字符总数,i=j;
若所述子节点中第k个子节点的字符与所述待匹配候选字符串的第j+k-1个字符未匹配,且k>1,则将所述第j+k-1个字符与所述第i个节点的字符进行匹配,所述k小于或等于所述子节点的总数;
在所述待匹配候选字符串的最后一个字符与该字符串树的节点对应字符匹配的情况下,将该字符串树对应的词组作为目标词组;
若i=1,且j=1,或者k=1,或者所述第j+k-1个字符与所述第i个节点的字符未匹配,或者所述最后一个字符与该字符串树的节点对应字符未匹配,则结束匹配。
在一种实现方式中,所述处理器601,具体用于:
按照预设字符串截断规则将所述待匹配候选字符串分为n个字符组,其中,n大于等于1;
针对所述客户端的垂直领域专有词库的每个字符串树,将所述n个字符组中每个字符组的第一个字符依次与该字符串树第二层节点的字符进行匹配;
若所述每个字符组的第一个字符均与该字符串树第二层节点的字符匹配,则将所述每个字符组除第一个字符之外的字符依次与该字符串树第三层节点中目标节点的字符进行匹配,所述目标节点为字符与所述每个字符组第一个字符匹配的第二层节点的子节点;
在所述每个字符组除第一个字符之外的字符均与该字符串树第三层节点的字符匹配的情况下,将该字符串树对应词组作为目标词组;
若所述每个字符组中存在目标字符组,则结束匹配,所述目标字符组的第一个字符与该字符串树第二层节点的字符不匹配,或所述目标字符组除第一个字符之外的字符与该字符串树第三层节点的字符不匹配。
在一种实现方式中,所述处理器601,具体用于:
获取所述客户端当前输入法的输入模式;
根据所述输入模式确定所述字符串中每个字符对应的可选字符;
将所述字符串中每个字符和所述可选字符进行排列组合,得到组合结果,将所述组合结果确定为所述字符串对应的候选字符串集。
具体实现中,本发明实施例中所描述的处理器601和存储器602可执行本发明实施例图1或者图3或者图4提供的客户端的词组推荐方法中所描述的实现方式,也可执行本发明实施例图5所描述的客户端的词组推荐装置的实现方式,在此不再赘述。
本发明实施例中,处理器601可以获取用户在客户端输入的文本,将所述文本转换为字符串,并确定所述字符串对应的候选字符串集,将所述候选字符串集中的候选字符串与所述客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应的词组作为目标词组,所述字符串树是根据所述垂直领域专有词库包括的词组的字符串建立的,每个词组对应一棵字符串树,进一步的,根据所述目标词组和所述目标词组对应的词频生成词组推荐结果。通过实施上述方法,可以利用客户端的垂直领域专有词库为用户的输入推荐相匹配的词组,降低用户的无效输入,提升用户体验。
本发明实施例还提供了一种存储介质,该存储介质中存储有程序指令,所述程序执行时可包括如图1或者图3或者图4对应实施例中的客户端的词组推荐方法的部分或全部步骤。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random AccessMemory,RAM)、磁盘或光盘等。
以上对本发明实施例所提供的一种客户端的词组推荐方法、客户端及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种客户端的词组推荐方法,其特征在于,包括:
获取用户在客户端输入的文本;
将所述文本转换为字符串,并确定所述字符串对应的候选字符串集;
将所述候选字符串集中的候选字符串与所述客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应的词组作为目标词组,所述字符串树是根据所述垂直领域专有词库包括的词组的字符串建立的,每个词组对应一棵字符串树;
根据所述目标词组和所述目标词组对应的词频生成词组推荐结果。
2.根据权利要求1所述的方法,其特征在于,所述每个词组的字符串树包括三层节点,所述字符串树的第一层节点为根节点,该词组中每个字对应字符串的第一个字符作为所述字符串树的第二层节点,该词组中每个字对应字符串的剩余字符作为该字第一个字符所在第二层节点的子节点,组成所述字符串树的第三层节点。
3.根据权利要求1或2所述的方法,其特征在于,所述获取用户在客户端输入的文本之后,所述将所述文本转换为字符串,并确定所述字符串对应的候选字符串集之前,所述方法还包括:
查询所述垂直领域专有词库中是否存在与所述文本匹配的词组;
若是,则根据所述垂直领域专有词库中与所述文本匹配的词组和对应的词频生成词组推荐结果;
若否,则执行所述将所述文本转换为字符串,并确定所述字符串对应的候选字符串集的步骤。
4.根据权利要求3所述的方法,其特征在于,所述获取用户在客户端输入的文本,包括:
获取用户在客户端的待输入框输入的文本;
所述获取用户在客户端输入的文本之后,所述方法还包括
在所述待输入框的属性为目标属性时,启动词组推荐功能,并执行所述查询所述垂直领域专有词库中是否存在与所述文本匹配的词组的步骤。
5.根据权利要求2所述的方法,其特征在于,所述将所述候选字符串集中的候选字符串与所述客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应的词组作为目标词组,包括:
获取所述候选字符串集中的候选字符串对应词组的长度;
将长度不超过所述预设长度阈值的候选字符串确定为待匹配候选字符串;
将所述待匹配候选字符串与所述客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应词组作为目标词组。
6.根据权利要求5所述的方法,其特征在于,所述将所述待匹配候选字符串与所述客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应词组作为目标词组,包括:
针对所述客户端的垂直领域专有词库的每个字符串树,按照从左至右的顺序,将该字符串树的第二层节点的字符与所述待匹配候选字符串的字符依次进行匹配;
若所述第二层节点中第i个节点的字符与所述待匹配候选字符串的第j个字符未匹配,且i与j均大于1,则按照从左至右的顺序,将所述第二层节点中第i-1个节点对应子节点的字符与所述第j个字符进行匹配,所述i小于或等于所述第二层节点的总数,所述j小于或等于所述待匹配候选字符串的字符总数,i=j;
若所述子节点中第k个子节点的字符与所述待匹配候选字符串的第j+k-1个字符未匹配,且k>1,则将所述第j+k-1个字符与所述第i个节点的字符进行匹配,所述k小于或等于所述子节点的总数;
在所述待匹配候选字符串的最后一个字符与该字符串树的节点对应字符匹配的情况下,将该字符串树对应的词组作为目标词组;
若i=1,且j=1,或者k=1,或者所述第j+k-1个字符与所述第i个节点的字符未匹配,或者所述最后一个字符与该字符串树的节点对应字符未匹配,则结束匹配。
7.根据权利要求5所述的方法,其特征在于,所述将所述待匹配候选字符串和所述客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应词组作为目标词组,包括:
按照预设字符串截断规则将所述待匹配候选字符串分为n个字符组,其中,n大于等于1;
针对所述客户端的垂直领域专有词库的每个字符串树,将所述n个字符组中每个字符组的第一个字符依次与该字符串树第二层节点的字符进行匹配;
若所述每个字符组的第一个字符均与该字符串树第二层节点的字符匹配,则将所述每个字符组除第一个字符之外的字符依次与该字符串树第三层节点中目标节点的字符进行匹配,所述目标节点为字符与所述每个字符组第一个字符匹配的第二层节点的子节点;
在所述每个字符组除第一个字符之外的字符均与该字符串树第三层节点的字符匹配的情况下,将该字符串树对应词组作为目标词组;
若所述每个字符组中存在目标字符组,则结束匹配,所述目标字符组的第一个字符与该字符串树第二层节点的字符不匹配,或所述目标字符组除第一个字符之外的字符与该字符串树第三层节点的字符不匹配。
8.根据权利要求1所述的方法,其特征在于,所述确定所述字符串对应的候选字符串集,包括:
获取所述客户端当前输入法的输入模式;
根据所述输入模式确定所述字符串中每个字符对应的可选字符;
将所述字符串中每个字符和所述可选字符进行排列组合,得到组合结果,将所述组合结果确定为所述字符串对应的候选字符串集。
9.一种客户端,其特征在于,所述客户端包括:
获取模块,用于获取用户在所述客户端输入的文本;
确定模块,用于将所述文本转换为字符串,并确定所述字符串对应的候选字符串集;
匹配模块,用于将所述候选字符串集中的候选字符串与所述客户端的垂直领域专有词库的字符串树进行匹配,并将匹配到的字符串树对应的词组作为目标词组,所述字符串树是根据所述垂直领域专有词库包括的词组的字符串建立的,每个词组对应一棵字符串树;
生成模块,用于根据所述目标词组和所述目标词组对应的词频生成词组推荐结果。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911063161.4A CN111026281B (zh) | 2019-10-31 | 2019-10-31 | 一种客户端的词组推荐方法、客户端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911063161.4A CN111026281B (zh) | 2019-10-31 | 2019-10-31 | 一种客户端的词组推荐方法、客户端及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111026281A true CN111026281A (zh) | 2020-04-17 |
CN111026281B CN111026281B (zh) | 2023-09-12 |
Family
ID=70204726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911063161.4A Active CN111026281B (zh) | 2019-10-31 | 2019-10-31 | 一种客户端的词组推荐方法、客户端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111026281B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112684907A (zh) * | 2020-12-24 | 2021-04-20 | 科大讯飞股份有限公司 | 一种文本输入方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050114131A1 (en) * | 2003-11-24 | 2005-05-26 | Kirill Stoimenov | Apparatus and method for voice-tagging lexicon |
CN101271459A (zh) * | 2007-03-22 | 2008-09-24 | 北京搜狗科技发展有限公司 | 一种生成词库的方法、一种输入的方法和一种输入法系统 |
CN102346743A (zh) * | 2010-08-02 | 2012-02-08 | 腾讯科技(深圳)有限公司 | 生成候选词的方法及装置 |
US20120173500A1 (en) * | 2010-12-29 | 2012-07-05 | Microsoft Corporation | Progressive spatial searching using augmented structures |
CN106156103A (zh) * | 2015-04-02 | 2016-11-23 | 广州爱九游信息技术有限公司 | 一种搜索处理方法及装置 |
CN107102746A (zh) * | 2016-02-19 | 2017-08-29 | 北京搜狗科技发展有限公司 | 候选词生成方法、装置以及用于候选词生成的装置 |
CN107590214A (zh) * | 2017-08-30 | 2018-01-16 | 腾讯科技(深圳)有限公司 | 搜索关键词的推荐方法、装置及电子设备 |
-
2019
- 2019-10-31 CN CN201911063161.4A patent/CN111026281B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050114131A1 (en) * | 2003-11-24 | 2005-05-26 | Kirill Stoimenov | Apparatus and method for voice-tagging lexicon |
CN101271459A (zh) * | 2007-03-22 | 2008-09-24 | 北京搜狗科技发展有限公司 | 一种生成词库的方法、一种输入的方法和一种输入法系统 |
CN102346743A (zh) * | 2010-08-02 | 2012-02-08 | 腾讯科技(深圳)有限公司 | 生成候选词的方法及装置 |
US20120173500A1 (en) * | 2010-12-29 | 2012-07-05 | Microsoft Corporation | Progressive spatial searching using augmented structures |
CN106156103A (zh) * | 2015-04-02 | 2016-11-23 | 广州爱九游信息技术有限公司 | 一种搜索处理方法及装置 |
CN107102746A (zh) * | 2016-02-19 | 2017-08-29 | 北京搜狗科技发展有限公司 | 候选词生成方法、装置以及用于候选词生成的装置 |
CN107590214A (zh) * | 2017-08-30 | 2018-01-16 | 腾讯科技(深圳)有限公司 | 搜索关键词的推荐方法、装置及电子设备 |
Non-Patent Citations (2)
Title |
---|
LUO XIANGANG,LUO JIN,XIE ZHONG * |
王D: "基于Trie结构的带通配符的相似字符串匹配算法", no. 10 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112684907A (zh) * | 2020-12-24 | 2021-04-20 | 科大讯飞股份有限公司 | 一种文本输入方法、装置、设备及存储介质 |
CN112684907B (zh) * | 2020-12-24 | 2024-04-26 | 科大讯飞股份有限公司 | 一种文本输入方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111026281B (zh) | 2023-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10997370B2 (en) | Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time | |
KR102648306B1 (ko) | 음성 인식 오류 정정 방법, 관련 디바이스들, 및 판독 가능 저장 매체 | |
US11017178B2 (en) | Methods, devices, and systems for constructing intelligent knowledge base | |
CN108287858B (zh) | 自然语言的语义提取方法及装置 | |
US8055498B2 (en) | Systems and methods for building an electronic dictionary of multi-word names and for performing fuzzy searches in the dictionary | |
TWI666558B (zh) | 語意分析方法、語意分析系統及非暫態電腦可讀取媒體 | |
CN111709243A (zh) | 一种基于深度学习的知识抽取方法与装置 | |
CN110083681B (zh) | 基于数据分析的搜索方法、装置及终端 | |
US20180173694A1 (en) | Methods and computer systems for named entity verification, named entity verification model training, and phrase expansion | |
CN112214593A (zh) | 问答处理方法、装置、电子设备及存储介质 | |
CN110472043B (zh) | 一种针对评论文本的聚类方法及装置 | |
CN107895024B (zh) | 用于网页新闻分类推荐的用户模型构建方法及推荐方法 | |
CN112256822A (zh) | 文本搜索方法、装置、计算机设备和存储介质 | |
JP2020004382A (ja) | 音声対話方法及び装置 | |
CN114154487A (zh) | 文本自动纠错方法、装置、电子设备及存储介质 | |
CN111462751A (zh) | 解码语音数据的方法、装置、计算机设备和存储介质 | |
CN113343692B (zh) | 搜索意图的识别方法、模型训练方法、装置、介质及设备 | |
CN111046217A (zh) | 组合歌曲生成方法、装置、设备以及存储介质 | |
JP2016102866A (ja) | 誤認識修正装置およびプログラム | |
CN113254588B (zh) | 一种数据搜索方法及系统 | |
CN111026281B (zh) | 一种客户端的词组推荐方法、客户端及存储介质 | |
KR101890207B1 (ko) | 개체명 연결 방법, 장치 및 컴퓨터 프로그램 | |
CN111428487B (zh) | 模型训练方法、歌词生成方法、装置、电子设备及介质 | |
CN108845682B (zh) | 一种输入预测方法及装置 | |
CN114548093A (zh) | 自然语言处理方法、装置、设备、介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |