CN108073293A - 一种目标词组的确定方法和装置 - Google Patents
一种目标词组的确定方法和装置 Download PDFInfo
- Publication number
- CN108073293A CN108073293A CN201610998430.6A CN201610998430A CN108073293A CN 108073293 A CN108073293 A CN 108073293A CN 201610998430 A CN201610998430 A CN 201610998430A CN 108073293 A CN108073293 A CN 108073293A
- Authority
- CN
- China
- Prior art keywords
- score value
- candidate
- phrase
- environment
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明实施例提供了一种目标词组的确定方法和装置,所述方法包括:接收用户输入的字符串;确定与所述字符串相匹配的一个或多个候选词组;识别已上屏的文本信息和当前的输入环境;依据所述已上屏的文本信息和当前的输入环境,分别计算所述一个或多个候选词组的特征分值;根据所述特征分值,确定目标词组,解决了已有技术中在进行智能组词时所获得的组词结果可能并不符合用户的实际需求的问题,减少了用户查找目标词组的操作次数,提高了用户的输入效率。
Description
技术领域
本发明涉及输入法技术领域,特别是涉及一种目标词组的确定方法和一种目标词组的确定装置。
背景技术
输入法由于受到词库大小的限制,只能在词库中储存一些非常基础、用户使用频率较高的词条或词组,而一些比较长的词组就只能借助于分析用户输入的字符串,通过智能组词的方式获得。
已有技术中,智能组词主要是通过分析词与词之间是否具有某种特定关系来完成的,例如,对于A、B、C和D四个词,如果A和B、B和C之间分别存在某种特定关系,那么就能够通过智能组词获得词组ABC,而如果B和D之间不存在上述特定关系,那么就无法通过智能组词获得词组ABD。但是,对于用户使用频率较高的简拼输入方式而言,由于简拼可以只输入声母或声母的首字母,对于用户输入的一个字符串,简拼输入方式下会有包括很多的重码,该字符串中各个词与词之间也就会存在多个符合上述特定关系的情况。因此,按照已有技术中的方式进行组词,所获得的结果可能并不符合用户的实际需求。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种目标词组的确定方法和相应的一种目标词组的确定装置。
为了解决上述问题,本发明实施例公开了一种目标词组的确定方法,包括:
接收用户输入的字符串;
确定与所述字符串相匹配的一个或多个候选词组;
识别已上屏的文本信息和当前的输入环境;
依据所述已上屏的文本信息和当前的输入环境,分别计算所述一个或多个候选词组的特征分值;
根据所述特征分值,确定目标词组。
可选地,所述确定与所述字符串相匹配的一个或多个候选词组的步骤包括:
将所述字符串切分为一个或多个字符子串;
从预设的词库中查找出与所述一个或多个字符子串相匹配的多个候选词;
根据所述多个候选词,生成一个或多个候选词组。
可选地,所述一个或多个字符子串具有对应的输入顺序,所述根据所述多个候选词,生成一个或多个候选词组的步骤包括:
按照所述输入顺序,将所述一个或多个字符子串对应的候选词进行组合,生成一个或多个候选词组。
可选地,所述依据所述已上屏的文本信息和当前的输入环境,分别计算所述一个或多个候选词组的特征分值的步骤包括:
根据所述已上屏的文本信息,计算所述一个或多个候选词组的文本分值;
根据所述当前的输入环境,计算所述一个或多个候选词组的环境分值;
采用所述文本分值和所述环境分值,确定所述一个或多个候选词组的特征分值。
可选地,所述已上屏的文本信息为在所述字符串前上屏的最后一个目标词或目标词组,所述候选词组包括一个或多个关键词,所述根据所述已上屏的文本信息,计算所述一个或多个候选词组的文本分值的步骤包括:
分别确定所述目标词或目标词组与所述候选词组中的每个关键词的连接关系;
针对所述连接关系,计算所述一个或多个候选词组的文本分值。
可选地,所述连接关系包括二元关系,和/或,远距离关系,所述针对所述连接关系,计算所述一个或多个候选词组的文本分值的步骤包括:
当所述关键词与所述目标词或目标词组具有二元关系时,确定所述关键词的文本分值为预设的第一文本分值;
当所述关键词与所述目标词或目标词组具有远距离关系时,确定所述关键词的文本分值为预设的第二文本分值;
根据所述预设的第一文本分值和预设的第二文本分值,计算每个关键词的文本分值;
根据每个关键词的文本分值,计算所述候选词组的文本分值。
可选地,所述候选词组包括一个或多个关键词,所述当前的输入环境具有预置的特征词库,所述根据所述当前的输入环境,计算所述一个或多个候选词组的环境分值的步骤包括:
分别判断所述一个或多个关键词是否位于所述预置的特征词库中;
当所述关键词位于所述预置的特征词库中时,确定所述关键词的环境分值为预设的环境分值;
根据每个关键词的环境分值,计算所述候选词组的环境分值。
可选地,所述文本分值和环境分值分别具有对应的权重,所述采用所述文本分值和所述环境分值,确定所述一个或多个候选词组的特征分值的步骤包括:
对所述文本分值和所述环境分值进行加权,获得所述一个或多个候选词组的特征分值。
可选地,所述根据所述特征分值,确定目标词组的步骤包括:
对所述特征分值进行排序;
提取所述特征分值在前N位的候选词组为目标词组。
可选地,还包括:
当接收到用户选择所述目标词组的指令时,对所述目标词组执行上屏操作。
为了解决上述问题,本发明实施例还公开了一种目标词组的确定装置,包括:
接收模块,用于接收用户输入的字符串;
候选词组确定模块,用于确定与所述字符串相匹配的一个或多个候选词组;
识别模块,用于识别已上屏的文本信息和当前的输入环境;
计算模块,用于依据所述已上屏的文本信息和当前的输入环境,分别计算所述一个或多个候选词组的特征分值;
目标词组确定模块,用于根据所述特征分值,确定一个或多个目标词组。
可选地,所述候选词组确定模块包括:
切分子模块,用于将所述字符串切分为一个或多个字符子串;
查找子模块,用于从预设的词库中查找出与所述一个或多个字符子串相匹配的多个候选词;
生成子模块,用于根据所述多个候选词,生成一个或多个候选词组。
可选地,所述一个或多个字符子串具有对应的输入顺序,所述生成子模块包括:
生成单元,用于按照所述输入顺序,将所述一个或多个字符子串对应的候选词进行组合,生成一个或多个候选词组。
可选地,所述计算模块包括:
文本分值计算子模块,用于根据所述已上屏的文本信息,计算所述一个或多个候选词组的文本分值;
环境分值计算子模块,用于根据所述当前的输入环境,计算所述一个或多个候选词组的环境分值;
特征分值计算子模块,用于采用所述文本分值和所述环境分值,确定所述一个或多个候选词组的特征分值。
可选地,所述已上屏的文本信息为在所述字符串前上屏的最后一个目标词或目标词组,所述候选词组包括一个或多个关键词,所述文本分值计算子模块包括:
连接关系确定单元,用于分别确定所述目标词或目标词组与所述候选词组中的每个关键词的连接关系;
文本分值计算单元,用于针对所述连接关系,计算所述一个或多个候选词组的文本分值。
可选地,所述连接关系包括二元关系,和/或,远距离关系,所述文本分值计算单元包括:
第一文本分值确定子单元,用于在所述关键词与所述目标词或目标词组具有二元关系时,确定所述关键词的文本分值为预设的第一文本分值;
第二文本分值确定子单元,用于在所述关键词与所述目标词或目标词组具有远距离关系时,,确定所述关键词的文本分值为预设的第二文本分值;
关键词文本分值计算子单元,用于根据所述预设的第一文本分值和预设的第二文本分值,计算每个关键词的文本分值;
候选词组文本分值计算子单元,用于根据每个关键词的文本分值,计算所述候选词组的文本分值。
可选地,所述候选词组包括一个或多个关键词,所述当前的输入环境具有预置的特征词库,所述环境分值计算子模块包括:
判断单元,用于分别判断所述一个或多个关键词是否位于所述预置的特征词库中;
关键词环境分值确定单元,用于在所述关键词位于所述预置的特征词库中时,确定所述关键词的环境分值为预设的环境分值;
候选词组环境分值确定单元,用于根据每个关键词的环境分值,计算所述候选词组的环境分值。
可选地,所述文本分值和环境分值具有对应的权重,所述特征分值计算子模块包括:
加权单元,用于对所述文本分值和所述环境分值进行加权,获得所述一个或多个候选词组的特征分值。
可选地,所述目标词组确定模块包括:
排序子模块,用于对所述特征分值进行排序;
提取子模块,用于提取所述特征分值在前N位的候选词组为目标词组。
可选地,所述装置还包括:
上屏模块,用于在接收到用户选择所述目标词组的指令时,对所述目标词组执行上屏操作。
为了解决上述问题,本发明实施例还公开了一种目标词组的确定装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收用户输入的字符串;
确定与所述字符串相匹配的一个或多个候选词组;
识别已上屏的文本信息和当前的输入环境;
依据所述已上屏的文本信息和当前的输入环境,分别计算所述一个或多个候选词组的特征分值;
根据所述特征分值,确定目标词组。
与背景技术相比,本发明实施例包括以下优点:
本发明实施例,在接收到用户输入的字符串后,可以首选确定出与所述字符串相匹配的一个或多个候选词组,然后通过识别已上屏的文本信息和当前的输入环境,并依据所述已上屏的文本信息和当前的输入环境,分别计算所述一个或多个候选词组的特征分值,从而可以根据所述特征分值,确定目标词组,解决了已有技术中在进行智能组词时所获得的组词结果可能并不符合用户的实际需求的问题,减少了用户查找目标词组的操作次数,提高了用户的输入效率。
附图说明
图1是本发明的一种目标词组的确定方法实施例的步骤流程图;
图2是本发明的一种目标词组的确定装置实施例的结构框图;
图3是根据一示例性实施例示出的一种目标词组的确定装置的框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明的一种目标词组的确定方法实施例的步骤流程图,具体可以包括如下步骤:
步骤101,接收用户输入的字符串;
在具体实现中,本发明实施例可以应用于各类电子设备中,例如,手机、PDA(Personal Digital Assistant,个人数字助理)、计算机、掌上电脑等等,本发明实施例对电子设备的具体类型不作限定。
这些电子设备可以支持包括Windows、Android(安卓)、IOS、WindowsPhone等操作系统,可以通过外接输入设备进行输入,例如键盘;还可以运行通过虚拟键盘进行输入的应用程序,例如,输入法程序。
以计算机为例,用户可以通过敲击键盘上的实体按键输入字符串,而对于具有触摸屏的移动终端而言,用户可以通过点击虚拟键盘上的虚拟按键进行字符串的输入。
通常,在中文、日文等语音里,作为基本语言单位的汉字、日文等文字一般不直接与键盘上的按键进行映射,因此,在输入时一般需要进行字符与字词的转换。
具体而言,输入法系统可以通过编码规则将汉字、日文等文字与能够直接输入的字符串建立映射关系,如在汉语中通常用的编码是拼音(如简拼、双拼、全拼、模糊音等)、五笔等。
在本发明实施例中,用户输入的字符串可以是指用户输入的拼音字符串。
步骤102,确定与所述字符串相匹配的一个或多个候选词组;
在本发明实施例中,当接收到用户输入的字符串后,可以根据所述字符串的特性,确定出与该字符串相匹配的一个或多个候选词组。
例如,对于用户输入的字符串“guoqing”,可以确定出相应的候选词组可以是“国庆”、“国情”或者“国青”等等。
当然,用户输入的字符串可以是完整的全拼字符串,还可以是简拼字符串。例如用户可以只输入字符串“gq”,此时,可以确定出的候选词组不仅可以包括上述的“国庆”、“国情”、“国青”,还可以包括“过去”、“高清”等等。
在本发明的一种优选实施例中,所述确定与所述字符串相匹配的一个或多个候选词组的步骤具体可以包括如下子步骤:
子步骤1021,将所述字符串切分为一个或多个字符子串;
以汉字的拼音输入为例,用户可以将字符通过键盘输入至输入法中,由输入法进行解码。具体地,输入法可以首选将用户输入的字符串切分为以拼音的音节为基础的一个或多个字符子串。
例如,将字符串“zhuanli”切分为“zhuan’li”,将字符串“fangan”切分为“fang’an”和“fan’gan”,将字符串“yidalidg”切分为“yidali’dg”等等。
子步骤1022,从预设的词库中查找出与所述一个或多个字符子串相匹配的多个候选词;
在本发明实施例中,可以预先设置一个或多个词库,可以包括记载基础字词的系统词库,也可以包括记载扩展字词的细胞词库(细胞词库中的字词至少具有一个共同属性),如记载某个游戏专用字词的细胞词库、记载生物专用字词的细胞词库等,也可以包括用户个性化字词(如自造词)的用户词库,也可以包括以通讯录中的信息(如姓名、电话)作为词条的通讯录词库,等等,本发明实施例对此不作限定。
在词库中存放了输入法所需的语言信息,由于不同的文字可能对应相同的编码,对于特定的字符,输入法通过词库可以完成字符串与字、词、句的转换,猜测用户真实的输入意图。
因此,当用户输入字符串“zhuanli”时,可以获得与该字符串相匹配的候选词为“专利”、“转隶”等等,而对于用户输入的“fangan”字符串,按照上述切分所获得的候选词则可以是“方案”、“反感”等等,对于字符串“yidalidg”,其切分后获得候选词则可以是“意大利”、“代购”、“夺冠”、“定稿”等等。
子步骤1023,根据所述多个候选词,生成一个或多个候选词组。
在本发明实施例中,当分别根据用户输入的字符串进行切分,获得多个候选词后,可以将所述多个候选词组合成一个或多个候选词组。
需要说明的是,在将输入的字符串进行切分获得字符子串,并根据字符子串匹配出候选词时,每个切分后的字符子串可以对应有多个候选词,例如,对于字符子串“dg”,可以对应匹配出“夺冠”、“代购”、“大哥”等等。因此,在将多个候选词组合成候选词组时,可以分别将字符子串的不同匹配结果与其他字符子串的不同匹配结果分别组合,获得一个多层次的排列组合结果,即获得多个候选词组。
通常,用户在进行输入时,是按照一定的顺序输入的多个字符,然后将多个字符组成字符串,例如,对于字符串“yidalidg”,切分后所获得的字符子串为“yidali”、“dg”,其输入顺序为“yidali”第一,“dg”第二。
因此,在具体实现中,所述根据所述多个候选词,生成一个或多个候选词组的子步骤可以进一步包括:
S11,按照所述输入顺序,将所述一个或多个字符子串对应的候选词进行组合,生成一个或多个候选词组。
以字符串“yidalidg”为例,对于输入顺序为第一的字符子串“yidali”可以确定其候选词为“意大利”,而对于输入顺序为第二的字符子串“dg”,其候选词可以是“代购”、“夺冠”和“定稿”等等。
例如,对于字符串“yidalidg”,字符子串“yidali”的输入顺序在先,字符子串“dg”的输入顺序在后,那么字符子串“yidali”对应的匹配结果“意大利”应该是在字符子串“dg”的匹配结果之前。即可以按照相应的输入顺序,可以生成词组“意大利代购”、“意大利夺冠”和“意大利定稿”等等。
由于“意大利定稿”明显不符合组词规则,可以排除,从而可以确定字符串“yidalidg”的候选词组为“意大利代购”和“意大利夺冠”。
步骤103,识别已上屏的文本信息和当前的输入环境;
在本发明实施例中,所述已上屏的文本信息可以是指用户在输入当前的字符串之前,已经上屏的文本,进一步地,所述已上屏的文本信息可以是特指在所述字符串前上屏的最后一个目标词或目标词组,例如,用户在输入字符串“yidalidg”前,最后一个上屏的目标词或目标词组。
所述当前的输入环境可以是指用户当前正在使用输入法的应用程序的类型或网络环境,例如,用户在某个电商网站的搜索框中搜索商品时使用输入法输入了字符串,则当前的输入环境可以是“购物环境”。
步骤104,依据所述已上屏的文本信息和当前的输入环境,分别计算所述一个或多个候选词组的特征分值;
在本发明的一种优选实施例中,所述依据所述已上屏的文本信息和当前的输入环境,分别计算所述一个或多个候选词组的特征分值的步骤具体可以包括如下子步骤:
子步骤1041,根据所述已上屏的文本信息,计算所述一个或多个候选词组的文本分值;
在本发明实施例中,在识别出已上屏的文本信息后,可以根据已上屏的文本计算该文本与候选词组的文本分值。
通常,可以将一个候选词组看作是由多个关键词组成的,例如,对于候选词组“意大利夺冠”,可以认为该候选词组由关键词“意大利”和关键词“夺冠”组成,因此,可以首选分别计算每一个关键词与已上屏的文本之间的文本分值。
作为本发明的一种示例,当已输入的文本为在所述字符串前上屏的最后一个目标词或目标词组时,所述根据所述已上屏的文本信息,计算所述一个或多个候选词组的文本分值的子步骤可以进一步包括:
S21,分别确定所述目标词或目标词组与所述候选词组中的每个关键词的连接关系;
在本发明实施例中,所述连接关系可以包括二元关系,和/或,远距离关系。所述二元关系是指两个不同的词,可以通过直接连接从而构成一个具有明确意义的词条的关系,例如,对于“吃”和“苹果”,其能够构成词条“吃苹果”,因此,“吃”和“苹果”之间就可以认为具有二元关系。而对于词条“吃大苹果”,在该词条中,“吃”和“苹果”之间不具有直接的二元关系,而是远距离关系。
在具体实现中,在识别出在所述字符串前最后一个上屏的目标词或目标词组后,可以首先判断该目标词或目标词组与候选词组中的每个关键词是否具有某种连接关系。
例如,若在所述字符串前最后一个上屏的目标词为“从”,对于当前的候选词组“意大利夺冠”和“意大利代购”,相应的关键词分别为“意大利”、“夺冠”和“代购”,经分析可知,目标词“从”与关键词“意大利”不具有二元关系,目标词“从”与关键词“夺冠”不具有远距离关系,目标词“从”与关键词“代购”具有远距离关系。
S22,针对所述连接关系,计算所述一个或多个候选词组的文本分值。
在具体实现中,可以根据目标词或目标词组与每个关键词之间的具体的连接关系,分别计算目标词或目标词组与每个关键词之间的文本分值,从而得到目标词或目标词组与候选词组之间的文本分值。
具体地,所述针对所述连接关系,计算所述一个或多个候选词组的文本分值可以包括:
S221,当所述关键词与所述目标词或目标词组具有二元关系时,确定所述关键词的文本分值为预设的第一文本分值;
S222,当所述关键词与所述目标词或目标词组具有远距离关系时,确定所述关键词的文本分值为预设的第二文本分值;
S223,根据所述预设的第一文本分值和预设的第二文本分值,计算每个关键词的文本分值;
S223,根据每个关键词的文本分值,计算所述候选词组的文本分值。
在具体实现中,可以分别为二元关系和远距离关系设定一预设分值,当目标词或目标词组与关键词具有某种连接关系时,可以将该预设分值确定为该关键词与目标词或目标词组之间的文本分值,当确定出某个候选词组中每一个关键词的文本分值后,可以通过加总每个关键词的文本分值,获得候选词组的文本分值。
当然,本领域技术人员还可以根据实际需要,为二元关系和远距离关系设定相应的权重,或者对不同的关键词设定权重,在对每个关键词的文本分值进行加总时,可以通过加权求和的方式计算候选词组的文本分值,本发明实施例对此不作限定。
子步骤1042,根据所述当前的输入环境,计算所述一个或多个候选词组的环境分值;
在本发明实施例中,在识别出当前的输入环境后,可以根据当前的输入环境计算候选词组的环境分值。
在具体实现中,可以首选分别计算每一个关键词的环境分值,例如对于候选词组“意大利夺冠”和“意大利代购”,可以分别计算关键词“意大利”、“代购”和“夺冠”的环境分值。
作为本发明的一种示例,所述根据所述当前的输入环境,计算所述一个或多个候选词组的环境分值的子步骤可以进一步包括:
S31,分别判断所述一个或多个关键词是否位于所述预置的特征词库中;
S32,当所述关键词位于所述预置的特征词库中时,确定所述关键词的环境分值为预设的环境分值;
S33,根据每个关键词的环境分值,计算所述候选词组的环境分值。
通常,不同的输入环境可以包括有不同的特征词库,例如,在购物环境下,可以根据用户在购物时经常使用的词或词条,生成购物环境的特征词库,而当用户在游戏环境下时,则可以根据用户在游戏过程中经常使用的词或词条,生成游戏环境的特征词库。
然后,可以通过判断候选词组中的每个关键词是否被包括在当前的输入环境的特征词库中,若是,则可以将预设的环境分值看作是该关键词的环境分值,当确定出每个关键词的环境分值后,可以通过加总求和的方式计算该候选词组的环境分值。
当然,本领域技术人员还可以根据实际需要,对不同的关键词设定不同的权重,从而在计算该候选词组的环境分值时,采用加权求和的方式,本发明实施例对此不作限定。
子步骤1043,采用所述文本分值和所述环境分值,确定所述一个或多个候选词组的特征分值。
在本发明实施例中,当分别计算出候选词组的文本分值和环境分值后,可以将该文本分值和环境分值相加,从而获得该候选词组的特征分值。
作为本发明的一种示例,还可以为文本分值和环境分值设定不同的权重,因此,所述采用所述文本分值和所述环境分值,确定所述一个或多个候选词组的特征分值的子步骤可以进一步包括:
S41,对所述文本分值和所述环境分值进行加权,获得所述一个或多个候选词组的特征分值。
在具体实现中,可以分别将文本分值与其相应的文本分值权重相乘,将环境分值与其相应的环境分值权重相乘,并将两部分结果相加,从而获得候选词组的特征分值。
步骤105,根据所述特征分值,确定目标词组。
在本发明实施例中,当分别获得每个候选词组的特征分值后,可以对所述特征分值进行排序,然后提取所述特征分值在前N位的候选词组为目标词组,其中N为大于等于1的正整数,本领域技术人员可以根据实际需要确定N的具体大小,本发明实施例对此不作限定。
在本发明实施例中,在确定出目标词组后,所述方法还可以包括如下步骤:
步骤106,当接收到用户选择所述目标词组的指令时,对所述目标词组执行上屏操作。
在具体实现中,输入法可以按照特征分值的排序将确定出的目标词组展现给用户,供用户进一步选择,当接收到用户选择该目标词组的指令时,可以对所述目标词组执行上屏操作,从而完成对该目标词组的输入。
在本发明实施例中,在接收到用户输入的字符串后,可以首选确定出与所述字符串相匹配的一个或多个候选词组,然后通过识别已上屏的文本信息和当前的输入环境,并依据所述已上屏的文本信息和当前的输入环境,分别计算所述一个或多个候选词组的特征分值,从而可以根据所述特征分值,确定目标词组,解决了已有技术中在进行智能组词时所获得的组词结果可能并不符合用户的实际需求的问题,减少了用户查找目标词组的操作次数,提高了用户的输入效率。
为了便于理解,下面以一个具体的示例,对本发明确定目标词组的方法作一详细介绍:
1、当用户在某电商网站进行购物时,可以通过电商网站提供的搜索服务查找商品,当用户输入字符串“yidalidg”后,输入法可以接收到该字符串,并将该字符串切分为字符子串“yidali”和“dg”,并通过匹配输入法词库,获得与字符子串“yidali”相对应的候选词为“意大利”、“易打理”和“一大李”,以及与字符子串“dg”相对应的候选词为“代购”、“夺冠”和“多个”等等;
2、输入法可以按照字符子串的输入顺序,确定出多个词组,例如“意大利代购”、“意大利夺冠”、“意大利多个”、“易打理代购”、“一大李夺冠”等等,然后,输入法可以根据词组关系等因素,例如,词组间的语法逻辑是否正确等等,确定出候选词组为“意大利夺冠”和“意大利代购”;此时,还可以分别为候选词组赋予一初始分,例如“意大利代购”得分为S1,“意大利夺冠”得分为S2;
3、进一步地,可以通过识别已上屏的文本信息,分别计算上述候选词组的文本分值。例如,若已上屏的文本为目标词“从”,通过判断候选词组中的每个关键词与该目标词“从”的连接关系,可以获得候选词组的文本分值。具体地,经分析可知,目标词“从”与关键词“意大利”不具有二元关系,目标词“从”与关键词“夺冠”不具有远距离关系,目标词“从”与关键词“代购”具有远距离关系,因此,可以为候选词组“意大利代购”赋予一文本分值A;此时,候选词组“意大利代购”得分为S1+A;而候选词组“意大利夺冠”得分仍然为S2;
4、考虑在当前的输入环境下,候选词组的每一部分关键词是否与该环境符合,如果符合,则为该候选词组赋予一定的环境分值。例如,当前输入环境是购物环境,关键词“意大利”和关键词“夺冠”都不符合该环境,而关键词“代购”则符合该环境,因此,可以为候选词组“意大利代购”赋予一定的环境分值B,此时,候选词组“意大利代购”得分为S1+A+B;而候选词组“意大利夺冠”得分仍然为S2;
5、通过比较候选词的得分,若候选词组“意大利代购”得分S1+A+B大于候选词组“意大利夺冠”的得分S2,则可以将候选词组“意大利代购”确定为目标词组,并展现给用户,当接收到用户选择该目标词组的指令时,可以对该目标词组执行上屏操作,从而解决了已有技术中在进行智能组词时所获得的组词结果可能并不符合用户的实际需求的问题,减少了用户查找目标词组的操作次数,提高了用户的输入效率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图2,示出了本发明的一种目标词组的确定装置实施例的结构框图,具体可以包括如下模块:
接收模块201,用于接收用户输入的字符串;
候选词组确定模块202,用于确定与所述字符串相匹配的一个或多个候选词组;
识别模块203,用于识别已上屏的文本信息和当前的输入环境;
计算模块204,用于依据所述已上屏的文本信息和当前的输入环境,分别计算所述一个或多个候选词组的特征分值;
目标词组确定模块205,用于根据所述特征分值,确定一个或多个目标词组。
在本发明实施例中,所述候选词组确定模块202具体可以包括如下子模块:
切分子模块,用于将所述字符串切分为一个或多个字符子串;
查找子模块,用于从预设的词库中查找出与所述一个或多个字符子串相匹配的多个候选词;
生成子模块,用于根据所述多个候选词,生成一个或多个候选词组。
在本发明实施例中,所述一个或多个字符子串可以具有对应的输入顺序,所述生成子模块具体可以包括如下单元:
生成单元,用于按照所述输入顺序,将所述一个或多个字符子串对应的候选词进行组合,生成一个或多个候选词组。
在本发明实施例中,所述计算模块204具体可以包括如下子模块:
文本分值计算子模块,用于根据所述已上屏的文本信息,计算所述一个或多个候选词组的文本分值;
环境分值计算子模块,用于根据所述当前的输入环境,计算所述一个或多个候选词组的环境分值;
特征分值计算子模块,用于采用所述文本分值和所述环境分值,确定所述一个或多个候选词组的特征分值。
在本发明实施例中,所述已上屏的文本信息可以为在所述字符串前上屏的最后一个目标词或目标词组,所述候选词组可以包括一个或多个关键词,所述文本分值计算子模块具体可以包括如下单元:
连接关系确定单元,用于分别确定所述目标词或目标词组与所述候选词组中的每个关键词的连接关系;
文本分值计算单元,用于针对所述连接关系,计算所述一个或多个候选词组的文本分值。
在本发明实施例中,所述连接关系可以包括二元关系,和/或,远距离关系,所述文本分值计算单元具体可以包括如下子单元:
第一文本分值确定子单元,用于在所述关键词与所述目标词或目标词组具有二元关系时,确定所述关键词的文本分值为预设的第一文本分值;
第二文本分值确定子单元,用于在所述关键词与所述目标词或目标词组具有远距离关系时,,确定所述关键词的文本分值为预设的第二文本分值;
关键词文本分值计算子单元,用于根据所述预设的第一文本分值和预设的第二文本分值,计算每个关键词的文本分值;
候选词组文本分值计算子单元,用于根据每个关键词的文本分值,计算所述候选词组的文本分值。
在本发明实施例中,所述候选词组可以包括一个或多个关键词,所述当前的输入环境可以具有预置的特征词库,所述环境分值计算子模块具体可以包括如下单元:
判断单元,用于分别判断所述一个或多个关键词是否位于所述预置的特征词库中;
关键词环境分值确定单元,用于在所述关键词位于所述预置的特征词库中时,确定所述关键词的环境分值为预设的环境分值;
候选词组环境分值确定单元,用于根据每个关键词的环境分值,计算所述候选词组的环境分值。
在本发明实施例中,所述文本分值和环境分值还可以具有对应的权重,所述特征分值计算子模块具体可以包括如下单元:
加权单元,用于对所述文本分值和所述环境分值进行加权,获得所述一个或多个候选词组的特征分值。
在本发明实施例中,所述目标词组确定模块205具体可以包括如下子模块:
排序子模块,用于对所述特征分值进行排序;
提取子模块,用于提取所述特征分值在前N位的候选词组为目标词组。
在本发明实施例中,所述装置还可以包括如下模块:
上屏模块,用于在接收到用户选择所述目标词组的指令时,对所述目标词组执行上屏操作。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
图3是根据一示例性实施例示出的一种目标词组的确定装置300的框图。例如,装置300可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图3,装置300可以包括以下一个或多个组件:处理组件302,存储器304,电源组件306,多媒体组件308,音频组件310,输入/输出(I/O)的接口312,传感器组件314,以及通信组件316。
处理组件302通常控制装置300的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件302可以包括一个或多个处理器320来执行指令,以完成上述的目标词组的确定方法的全部或部分步骤。此外,处理组件302可以包括一个或多个模块,便于处理组件302和其他组件之间的交互。例如,处理组件302可以包括多媒体模块,以方便多媒体组件308和处理组件302之间的交互。
存储器304被配置为存储各种类型的数据以支持在装置300的操作。这些数据的示例包括用于在装置300上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器304可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件306为装置300的各种组件提供电力。电源组件306可以包括电源管理系统,一个或多个电源,及其他与为装置300生成、管理和分配电力相关联的组件。
多媒体组件308包括在所述装置300和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件308包括一个前置摄像头和/或后置摄像头。当装置300处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件310被配置为输出和/或输入音频信号。例如,音频组件310包括一个麦克风(MIC),当装置300处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器304或经由通信组件316发送。在一些实施例中,音频组件310还包括一个扬声器,用于输出音频信号。
I/O接口312为处理组件302和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件314包括一个或多个传感器,用于为装置300提供各个方面的状态评估。例如,传感器组件314可以检测到装置300的打开/关闭状态,组件的相对定位,例如所述组件为装置300的显示器和小键盘,传感器组件314还可以检测装置300或装置300一个组件的位置改变,用户与装置300接触的存在或不存在,装置300方位或加速/减速和装置300的温度变化。传感器组件314可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件314还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件316被配置为便于装置300和其他设备之间有线或无线方式的通信。装置300可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件316经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件316还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置300可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述目标词组的确定方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器304,上述指令可由装置300的处理器320执行以完成上述目标词组的确定方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行如下操作:
接收用户输入的字符串;确定与所述字符串相匹配的一个或多个候选词组;识别已上屏的文本信息和当前的输入环境;依据所述已上屏的文本信息和当前的输入环境,分别计算所述一个或多个候选词组的特征分值;根据所述特征分值,确定目标词组。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种目标词组的确定方法和一种目标词组的确定装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (14)
1.一种目标词组的确定方法,其特征在于,包括:
接收用户输入的字符串;
确定与所述字符串相匹配的一个或多个候选词组;
识别已上屏的文本信息和当前的输入环境;
依据所述已上屏的文本信息和当前的输入环境,分别计算所述一个或多个候选词组的特征分值;
根据所述特征分值,确定目标词组。
2.根据权利要求1所述的方法,其特征在于,所述确定与所述字符串相匹配的一个或多个候选词组的步骤包括:
将所述字符串切分为一个或多个字符子串;
从预设的词库中查找出与所述一个或多个字符子串相匹配的多个候选词;
根据所述多个候选词,生成一个或多个候选词组。
3.根据权利要求2所述的方法,其特征在于,所述一个或多个字符子串具有对应的输入顺序,所述根据所述多个候选词,生成一个或多个候选词组的步骤包括:
按照所述输入顺序,将所述一个或多个字符子串对应的候选词进行组合,生成一个或多个候选词组。
4.根据权利要求1所述的方法,其特征在于,所述依据所述已上屏的文本信息和当前的输入环境,分别计算所述一个或多个候选词组的特征分值的步骤包括:
根据所述已上屏的文本信息,计算所述一个或多个候选词组的文本分值;
根据所述当前的输入环境,计算所述一个或多个候选词组的环境分值;
采用所述文本分值和所述环境分值,确定所述一个或多个候选词组的特征分值。
5.根据权利要求4所述的方法,其特征在于,所述已上屏的文本信息为在所述字符串前上屏的最后一个目标词或目标词组,所述候选词组包括一个或多个关键词,所述根据所述已上屏的文本信息,计算所述一个或多个候选词组的文本分值的步骤包括:
分别确定所述目标词或目标词组与所述候选词组中的每个关键词的连接关系;
针对所述连接关系,计算所述一个或多个候选词组的文本分值。
6.根据权利要求5所述的方法,其特征在于,所述连接关系包括二元关系,和/或,远距离关系,所述针对所述连接关系,计算所述一个或多个候选词组的文本分值的步骤包括:
当所述关键词与所述目标词或目标词组具有二元关系时,确定所述关键词的文本分值为预设的第一文本分值;
当所述关键词与所述目标词或目标词组具有远距离关系时,确定所述关键词的文本分值为预设的第二文本分值;
根据所述预设的第一文本分值和预设的第二文本分值,计算每个关键词的文本分值;
根据每个关键词的文本分值,计算所述候选词组的文本分值。
7.根据权利要求4所述的方法,其特征在于,所述候选词组包括一个或多个关键词,所述当前的输入环境具有预置的特征词库,所述根据所述当前的输入环境,计算所述一个或多个候选词组的环境分值的步骤包括:
分别判断所述一个或多个关键词是否位于所述预置的特征词库中;
当所述关键词位于所述预置的特征词库中时,确定所述关键词的环境分值为预设的环境分值;
根据每个关键词的环境分值,计算所述候选词组的环境分值。
8.根据权利要求4-7任一所述的方法,其特征在于,所述文本分值和环境分值分别具有对应的权重,所述采用所述文本分值和所述环境分值,确定所述一个或多个候选词组的特征分值的步骤包括:
对所述文本分值和所述环境分值进行加权,获得所述一个或多个候选词组的特征分值。
9.根据权利要求1所述的方法,其特征在于,所述根据所述特征分值,确定目标词组的步骤包括:
对所述特征分值进行排序;
提取所述特征分值在前N位的候选词组为目标词组。
10.根据权利要求1所述的方法,其特征在于,还包括:
当接收到用户选择所述目标词组的指令时,对所述目标词组执行上屏操作。
11.一种目标词组的确定装置,其特征在于,包括:
接收模块,用于接收用户输入的字符串;
候选词组确定模块,用于确定与所述字符串相匹配的一个或多个候选词组;
识别模块,用于识别已上屏的文本信息和当前的输入环境;
计算模块,用于依据所述已上屏的文本信息和当前的输入环境,分别计算所述一个或多个候选词组的特征分值;
目标词组确定模块,用于根据所述特征分值,确定目标词组。
12.根据权利要求11所述的装置,其特征在于,所述计算模块包括:
文本分值计算子模块,用于根据所述已上屏的文本信息,计算所述一个或多个候选词组的文本分值;
环境分值计算子模块,用于根据所述当前的输入环境,计算所述一个或多个候选词组的环境分值;
特征分值计算子模块,用于采用所述文本分值和所述环境分值,确定所述一个或多个候选词组的特征分值。
13.根据权利要求12所述的装置,其特征在于,所述候选词组包括一个或多个关键词,所述当前的输入环境具有预置的特征词库,所述环境分值计算子模块包括:
判断单元,用于分别判断所述一个或多个关键词是否位于所述预置的特征词库中;
关键词环境分值确定单元,用于在所述关键词位于所述预置的特征词库中时,确定所述关键词的环境分值为预设的环境分值;
候选词组环境分值确定单元,用于根据每个关键词的环境分值,计算所述候选词组的环境分值。
14.一种目标词组的确定装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收用户输入的字符串;
确定与所述字符串相匹配的一个或多个候选词组;
识别已上屏的文本信息和当前的输入环境;
依据所述已上屏的文本信息和当前的输入环境,分别计算所述一个或多个候选词组的特征分值;
根据所述特征分值,确定目标词组。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610998430.6A CN108073293B (zh) | 2016-11-11 | 2016-11-11 | 一种目标词组的确定方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610998430.6A CN108073293B (zh) | 2016-11-11 | 2016-11-11 | 一种目标词组的确定方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108073293A true CN108073293A (zh) | 2018-05-25 |
CN108073293B CN108073293B (zh) | 2022-01-14 |
Family
ID=62161824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610998430.6A Active CN108073293B (zh) | 2016-11-11 | 2016-11-11 | 一种目标词组的确定方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108073293B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109683723A (zh) * | 2018-11-06 | 2019-04-26 | 闽江学院 | 一种在输入法系统中处理文库的控制方法及装置 |
CN110780749A (zh) * | 2018-07-11 | 2020-02-11 | 北京搜狗科技发展有限公司 | 一种字符串纠错方法和装置 |
CN112650398A (zh) * | 2020-12-21 | 2021-04-13 | 北京搜狗科技发展有限公司 | 输入方法、装置和介质 |
CN113534973A (zh) * | 2020-04-16 | 2021-10-22 | 北京搜狗科技发展有限公司 | 输入方法、装置和用于输入的装置 |
CN115016652A (zh) * | 2021-03-03 | 2022-09-06 | 北京搜狗科技发展有限公司 | 输入方法、装置和介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101013443A (zh) * | 2007-02-13 | 2007-08-08 | 北京搜狗科技发展有限公司 | 一种智能组词输入的方法和一种输入法系统及其更新方法 |
US20080072143A1 (en) * | 2005-05-18 | 2008-03-20 | Ramin Assadollahi | Method and device incorporating improved text input mechanism |
CN101271459A (zh) * | 2007-03-22 | 2008-09-24 | 北京搜狗科技发展有限公司 | 一种生成词库的方法、一种输入的方法和一种输入法系统 |
CN103226393A (zh) * | 2013-04-12 | 2013-07-31 | 百度在线网络技术(北京)有限公司 | 一种输入方法和设备 |
CN103631385A (zh) * | 2012-08-23 | 2014-03-12 | 北京搜狗科技发展有限公司 | 一种在文字输入中筛选候选项的方法和装置 |
CN104423621A (zh) * | 2013-08-22 | 2015-03-18 | 北京搜狗科技发展有限公司 | 拼音字符串处理方法和装置 |
-
2016
- 2016-11-11 CN CN201610998430.6A patent/CN108073293B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080072143A1 (en) * | 2005-05-18 | 2008-03-20 | Ramin Assadollahi | Method and device incorporating improved text input mechanism |
CN101013443A (zh) * | 2007-02-13 | 2007-08-08 | 北京搜狗科技发展有限公司 | 一种智能组词输入的方法和一种输入法系统及其更新方法 |
CN101271459A (zh) * | 2007-03-22 | 2008-09-24 | 北京搜狗科技发展有限公司 | 一种生成词库的方法、一种输入的方法和一种输入法系统 |
CN103631385A (zh) * | 2012-08-23 | 2014-03-12 | 北京搜狗科技发展有限公司 | 一种在文字输入中筛选候选项的方法和装置 |
CN103226393A (zh) * | 2013-04-12 | 2013-07-31 | 百度在线网络技术(北京)有限公司 | 一种输入方法和设备 |
CN104423621A (zh) * | 2013-08-22 | 2015-03-18 | 北京搜狗科技发展有限公司 | 拼音字符串处理方法和装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110780749A (zh) * | 2018-07-11 | 2020-02-11 | 北京搜狗科技发展有限公司 | 一种字符串纠错方法和装置 |
CN110780749B (zh) * | 2018-07-11 | 2024-03-08 | 北京搜狗科技发展有限公司 | 一种字符串纠错方法和装置 |
CN109683723A (zh) * | 2018-11-06 | 2019-04-26 | 闽江学院 | 一种在输入法系统中处理文库的控制方法及装置 |
CN113534973A (zh) * | 2020-04-16 | 2021-10-22 | 北京搜狗科技发展有限公司 | 输入方法、装置和用于输入的装置 |
CN113534973B (zh) * | 2020-04-16 | 2024-08-02 | 北京搜狗科技发展有限公司 | 输入方法、装置和用于输入的装置 |
CN112650398A (zh) * | 2020-12-21 | 2021-04-13 | 北京搜狗科技发展有限公司 | 输入方法、装置和介质 |
CN115016652A (zh) * | 2021-03-03 | 2022-09-06 | 北京搜狗科技发展有限公司 | 输入方法、装置和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108073293B (zh) | 2022-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107102746B (zh) | 候选词生成方法、装置以及用于候选词生成的装置 | |
CN109145213B (zh) | 基于历史信息的查询推荐方法及装置 | |
CN108073293A (zh) | 一种目标词组的确定方法和装置 | |
CN107291690A (zh) | 标点添加方法和装置、用于标点添加的装置 | |
CN107608532A (zh) | 一种联想输入方法、装置及电子设备 | |
CN107544684B (zh) | 一种候选词显示方法及装置 | |
CN109002184A (zh) | 一种输入法候选词的联想方法和装置 | |
CN106484138B (zh) | 一种输入方法及装置 | |
CN108073303B (zh) | 一种输入方法、装置及电子设备 | |
CN107918496A (zh) | 一种输入纠错方法和装置、一种用于输入纠错的装置 | |
CN108121736A (zh) | 一种主题词确定模型的建立方法、装置及电子设备 | |
CN105531758A (zh) | 使用外国单词语法的语音识别 | |
CN107870677A (zh) | 一种输入方法、装置和用于输入的装置 | |
WO2021046958A1 (zh) | 语音信息处理方法、装置及存储介质 | |
CN109144285A (zh) | 一种输入方法和装置 | |
CN107844199A (zh) | 一种输入方法、系统和用于输入的装置 | |
CN108803890A (zh) | 一种输入方法、输入装置和用于输入的装置 | |
CN107092424A (zh) | 一种纠错项的显示方法、装置和用于纠错项的显示的装置 | |
CN105139848B (zh) | 数据转换方法和装置 | |
CN108073292A (zh) | 一种智能组词方法和装置、一种用于智能组词的装置 | |
CN107155121A (zh) | 语音控制文本的显示方法及装置 | |
CN109799916A (zh) | 一种候选项联想方法和装置 | |
CN109725736A (zh) | 一种候选排序方法、装置及电子设备 | |
CN108536653A (zh) | 一种输入方法、装置和用于输入的装置 | |
CN107422872A (zh) | 一种输入方法、装置和用于输入的装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |