CN110908523A - 一种输入方法及装置 - Google Patents
一种输入方法及装置 Download PDFInfo
- Publication number
- CN110908523A CN110908523A CN201811072268.0A CN201811072268A CN110908523A CN 110908523 A CN110908523 A CN 110908523A CN 201811072268 A CN201811072268 A CN 201811072268A CN 110908523 A CN110908523 A CN 110908523A
- Authority
- CN
- China
- Prior art keywords
- candidate
- speech
- information
- next word
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000012216 screening Methods 0.000 claims abstract description 17
- 238000012549 training Methods 0.000 claims description 13
- 230000007613 environmental effect Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 23
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 238000013136 deep learning model Methods 0.000 description 7
- 230000011218 segmentation Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
- G06F3/0237—Character input methods using prediction or retrieval techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种输入方法及装置,该方法包括:实时获取上文并得到候选项;根据所述上文确定下一个词的词性信息;根据所述下一个词的词性信息对所述候选项进行筛选,得到待输出的候选项。利用本发明,可以提高候选项的准确性,提升用户输入体验。
Description
技术领域
本发明涉及输入法领域,具体涉及一种输入方法及装置。
背景技术
输入法是一种将各种符号输入电子设备的编码方法,是人类和电子设备打交道不可或缺的工具。
现有的一些输入法,在用户输入过程中会对用户后续可能要输入的内容进行联想,并作为候选项提供给用户,以方便用户输入。目前输入法通常利用大规模语料数据训练得到语言模型,在用户输入时,利用所述语言模型模型,根据用户已输入内容和输入环境等信息得到联想结果。
这种方法虽然在一定程度上方便了用户输入,但目前的模型难以感知较长的上文,因此常常会出现断章取义的联想结果。例如,用户输入“一次性展现几万条数据”时,在输入到“一次性展现几万条”时,输入法可能仅会利用部分上文“万条”联想出“垂下绿丝绦”。可见现有的联想方案,难以命中用户的输入需求,导致了较差的用户体验。
发明内容
本发明实施例提供一种输入方法及装置,以提高候选词的准确性,提升用户输入体验。
为此,本发明提供如下技术方案:
一种输入方法,所述方法包括:
实时获取上文并得到候选项;
根据所述上文确定下一个词的词性信息;
根据所述下一个词的词性信息对所述候选项进行筛选,得到待输出的候选项。
可选地,所述上文为以下任意一种或多种:文本、语音、图片。
可选地,所述方法还包括:预先构建词性预测模型;
所述根据所述上文确定下一个词的词性信息包括:
提取所述上文的文本信息;
利用所述文本信息及所述词性预测模型,得到下一个词的词性信息。
可选地,所述词性预测模型为深度学习模型;所述提取所述上文的文本信息包括:获取所述上文对应的词序列,确定所述词序列中各词的词向量;或者所述词性预测模型为上下文无关语法模型;所述提取所述上文的文本信息包括:获取所述上文对应的词序列,确定所述词序列中各词的ID。
可选地,所述根据所述上文确定下一个词的词性信息还包括:
获取辅助信息,所述辅助信息包括:当前环境信息和/或位置信息;
利用所述文本信息、所述辅助信息及所述词性预测模型,得到下一个词的词性信息。
可选地,所述方法还包括:
获取各候选项的候选得分;
所述根据所述下一个词的词性信息对所述候选项进行筛选,得到待输出的候选项包括:
根据所述下一个词的词性信息调整所述候选项的候选得分,得到所述候选项的最终得分;
根据所述最终得分确定待输出的候选项。
可选地,所述根据所述下一个词的词性信息调整所述候选项的候选得分,得到所述候选项的最终得分包括:
根据所述下一个词的词性信息确定各候选项的词性得分;
将所述候选项的候选得分与所述词性得分进行加权求和,得到所述候选项的最终得分。
可选地,所述根据所述下一个词的词性信息调整所述候选项的候选得分,得到所述候选项的最终得分包括:
根据所述下一个词的词性信息确定各候选项的候选得分的权重;
根据所述候选项的候选得分及其权重计算得到所述候选项的最终得分。
可选地,所述根据所述下一个词的词性信息对所述候选项进行筛选,得到待输出的候选项包括:
选择所述候选项中词性与所述下一个词的词性信息相同的候选项作为待输出的候选项。
可选地,所述方法还包括:
根据历史输入信息对所述词性预测模型进行个性化训练,更新所述词性预测模型。
一种输入装置,所述装置包括:
上文获取模块,用于实时获取上文;
候选项获取模块,用于获得候选项;
词性预测模块,用于根据所述上文确定下一个词的词性信息;
筛选模块,用于根据所述下一个词的词性信息对所述候选项进行筛选,得到待输出的候选项。
可选地,所述上文为以下任意一种或多种:文本、语音、图片。
可选地,所述装置还包括:模型构建模块,用于预先构建词性预测模型;
所述词性预测模块包括:
文本处理单元,用于提取所述上文的文本信息;
预测单元,用于利用所述文本信息及所述词性预测模型,得到下一个词的词性信息。
可选地,所述词性预测模型为深度学习模型,所述文本处理单元具体用于获取所述上文对应的词序列,确定所述词序列中各词的词向量;或者
所述词性预测模型为上下文无关语法模型;所述文本处理单元具体用于获取所述上文对应的词序列,确定所述词序列中各词的ID。
可选地,所述词性预测模块还包括:
辅助信息获取单元,用于获取辅助信息,所述辅助信息包括:当前环境信息和/或位置信息;
所述预测单元,具体用于利用所述文本信息、所述辅助信息及所述词性预测模型,得到下一个词的词性信息。
可选地,所述候选项获取模块,还用于获取各候选项的候选得分;
所述筛选模块包括:
得分调整模块,用于根据所述下一个词的词性信息调整所述候选项的候选得分,得到所述候选项的最终得分;
候选项输出模块,用于根据所述最终得分确定待输出的候选项。
可选地,所述得分调整模块包括:
词性得分确定单元,用于根据所述下一个词的词性信息确定各候选项的词性得分;
第一计算单元,用于将所述候选项的候选得分与所述词性得分进行加权求和,得到所述候选项的最终得分。
可选地,所述得分调整模块包括:
权重确定单元,用于根据所述下一个词的词性信息确定各候选项的候选得分的权重;
第二计算单元,用于根据所述候选项的候选得分及其权重计算得到所述候选项的最终得分。
可选地,所述筛选模块,具体用于选择所述候选项中词性与所述下一个词的词性信息相同的候选项作为待输出的候选项。
可选地,所述装置还包括:
信息记录模块,用于记录历史输入信息;
模型更新模块,用于利用所述历史输入信息对所述词性预测模型进行个性化训练,更新所述词性预测模型。
一种计算机设备,包括:一个或多个处理器、存储器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现前面所述的方法。
一种可读存储介质,其上存储有指令,所述指令被执行以实现前面所述的方法。
本发明实施例提供的输入方法及装置,基于上文信息对下一个词的词性信息进行预测,根据预测得到的词性信息对当前各候选项进行筛选,从而提供给用户更准确的候选项,进而提高用户输入效率,改善用户输入体验。
进一步地,根据历史输入信息对所述词性预测模型进行个性化训练,更新所述词性预测模型,在后续的输入中,利用更新后的词性预测模型可以使预测结果更准确,进而可以使向用户提供的候选项具有与上文更高的匹配度,提升候选项的准确性,提高用户输入效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本发明实施例输入方法的一种流程图;
图2是本发明实施例输入装置的一种结构示意图;
图3是本发明实施例输入装置的一种具体应用结构示意图;
图4是本发明实施例输入装置的另一种结构示意图;
图5是根据一示例性实施例示出的一种用于输入方法的装置的框图;
图6是本发明实施例中服务器的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明实施例作进一步的详细说明。
针对现有的输入法会产生与上文内容不相关的联想候选这一问题,本发明实施例提供一种输入方法及装置,基于上文预测得到下一个词的词性信息,利用该词性信息对当前各候选项进行筛选,得到待输出的候选项。
如图1所示,是本发明实施例输入方法的一种流程图,包括以下步骤:
步骤101,实时获取上文并得到候选项。
针对不同的输入设备及输入方式,所述上文的形式也可以不同,比如,所述上文可以是文本、语音、或者图片等单一形式,也可以是多种形式的组合,如文本加图片的组合形式。另外,根据应用场景不同,所述上文可以是用户输入、已有上文、对端交互的上文等。
所述候选项可以是现有的输入法生成的所有候选项,比如联想候选词、词语,基于用户输入的编码串得到的候选字符、候选词等,对于不同的输入法,其生成候选项的方法及规则等可能会有所不同,此处本发明实施例并不限于采用何种现有技术生成的候选项。不论基于现有何种输入法生成的候选项,通过后续本发明方案对这些候选项做进一步筛选,均能得到与上文更匹配的候选项。
步骤102,根据所述上文确定下一个词的词性信息。
具体地,可以采用基于语法规则的方法,也可以采用基于模型的方法。
由于汉语语法的复杂多变,相同的上文情况下,其后面可能会有多种词性的可能,例如,“开”这个上文后面不仅仅可以跟名词,也会跟时态助词,比如“了”、语气助词“啊”等。因此,在实际应用中,可以优选选用基于模型的预测方法。
可以预先构建词性预测模型,所述词性预测模型可以采用深度学习模型,比如DNN(Deep Neural Networks,深度神经网络)、CNN(Convolutional Neural Network,卷积神经网络)等,或者采用上下文无关语法模型,比如,CFG(Context-Free Grammars,上下文无关语法)模型、PCFG(Probabilistic Context-Free Grammars,概率上下文无关语法)模型等。模型的训练过程可以采用常规技术,在此不再详细描述。
在利用所述词性预测模型对所述上文的下一个词的词性进行预测时,需要先对所述上文进行预处理,提取所述上文的文本信息,然后将所述文本信息输入到所述词性预测模型,根据模型的输出得到下一个词的词性信息。比如,所述预测模型采用深度学习模型时,需要首先获取所述上文的词序列,然后确定所述词序列中各词的词向量,将所述词向量输入所述词性预测模型,根据所述词预测模型的输出即可得到下一个词的词性信息。
在实际应用中,所述上文的词序列可以通过对所述上文进行分词处理得到,比如基于字符串匹配的分词方法、基于理解的分词方法、基于统计的分词方法等。当然,对于其它非文本形式的上文,可以先得到所述上文中的文本信息,然后再对其进行分词处理,得到相应的词序列。比如,对于图像形式的上文,可以利用图像识别技术得到相应的文本;对于语音形式的上文,可以利用语音识别技术得到相应的文本。
在本发明实施例中,所述词性预测模型可以采用回归模型或者分类模型。如果采用回归模型,则其输出可以是下一个词所属词性的概率;如果采用分类模型,则其输出可以是下一个词所属词性,当然,在同样的上文情况下,下一个词可以预测有多种词性。
步骤103,根据所述下一个词的词性信息对所述候选项进行筛选,得到待输出的候选项。
在对所述候选项进行筛选时,可以有多种筛选方式。
比如,可以根据预测得到的下一个词的词性,选择所述候选项中词性与所述下一个词的词性信息相同的候选项作为待输出的候选项。如果所述词性预测模型输出的是下一个词所属词性的概率,可以考虑将概率大于设定值的词性作为下一个词的词性。
再比如,可以获取各候选项的候选得分,根据所述下一个词的词性信息调整所述候选项的候选得分,得到所述候选项的最终得分;然后再根据所述最终得分确定待输出的候选项。
在对所述候选项的候选得分进行调整时,可以有多种调整方式,比如:
一种方式:先根据所述下一个词的词性信息确定各候选项的词性得分,然后将所述候选项的候选得分与所述情感得分进行加权求和,得到所述候选项的最终得分。比如,将预测得到的词性概率的值作为与该词性相同的候选项的词性得分,如果某个候选项的词性没有预测到,则将该候选项的词性得分计为0。考虑到有些词本身会具有多种词性,在没有上下文的情况下,无法确定其实际应用时所属的词性,针对这种情况,可以将对应的词性预测结果中包含的与该候选项的所有词性对应的概率值相加作为该候选项的词性得分。
另一种方式:先根据所述下一个词的词性信息确定各候选项的候选得分的权重;然后根据所述候选项的候选得分及其权重计算得到所述候选项的最终得分。比如,对于预测得到的概率大于设定值的词性,与该词性具有相同词性的候选项的权重设置为1;对于预测得到的概率小于等于设定值的词性,与该词性具有相同词性的候选项的权重设置为0.5;对于没有预测到的词性,将只具有该词性的候选项的权重设置为0。
在计算得到各候选项的最终得分后,可以依照最终得分从高到低的顺序选取设定数量的候选项作为待输出的候选项;或者选取最终得分大于设定阈值的候选项作为待输出的候选项。
本发明实施例提供的输入方法,基于上文信息对下一个词的词性信息进行预测,根据预测得到的词性信息对当前各候选项进行筛选,从而提供给用户更准确的候选项,进而提高用户输入效率,提升用户输入体验。
例如,当用户输入“往银行卡里面”时,按照现有的输入法会生成“的”、“还有”、“有”、“没钱”等候选项。利用本发明实施例的方法,首先预测出下一个词的词性为<动词>,候选项中的动词“打”、“冲”或者以动词开始的词“打钱”、“充钱”等词的最终得分会更高,排序时这些候选项的排序更靠前,从而会向用户输出这些候选项。
再例如,在用户A与用户B通过聊天工具对话的场景,用户A通过语音输入“他给了我5千万”时,按照现有的输入法会生成“不要”、“不能”、“别说”等候选项。利用本发明实施例的方法,首先预测出下一个词的词性为<名词>的概率较大,而其他词性或者词性组合的概率均低于阈值,根据预测得到的各词性的概率确定各候选项的词性得分,则候选项中“人民币”、“美元”、“金币”等的词性得分会高于“不要”、“别说”等的词性得分,将各候选项的候选得分与其词性得分进行加权求和,得到所述候选项的最终得分,从而使“人民币”、“美元”、“金币”这些更合理的候选项排在前面,而“不要”、“别说”等候选项会被过滤掉。
在用户输入时,有时输入环境等因素也会对用户输入产生一定的影响,因此,在本发明方法另一实施例中,在构建词性预测模型及利用该模型进行词性预测时,还可以考虑将一些其它因素作为辅助信息考虑进来,比如,所述辅助信息可以包括:当前环境信息和/或位置信息。所述环境信息比如可以包括:温度、气候等。具体地,获取所述辅助信息,利用所述文本信息、所述辅助信息及所述词性预测模型,得到下一个词的词性信息。所述辅助信息可以通过调用输入应用提供的应用程序接口得到,或者通过第三方APP得到。
由于不同用户可能会有不同的输入习惯,因此,在本发明方法另一实施例中,还可以记录历史输入信息,比如用户每次选择的候选项,利用记录的历史输入信息对所述词性预测模型进行个性化训练,更新所述词性预测模型。具体地,可以将每次记录的历史输入信息作为一个训练样本,在训练样本达到一定数量后,在原有词性预测模型参数的基础上,利用新的样本重新训练,从而得到与该用户更加匹配的个性化的词性预测模型,在后续的输入中,利用更新后的词性预测模型对下一个词进行词性预测,可以使预测结果更准确,进而可以使向用户提供的候选项具有与上文更高的匹配度,进一步提高候选项的准确性,提高用户输入效率。另外,还可以基于用户的输入习惯,比如习惯以标准语法输入,或者是特定的语法习惯,或者是不同的方言习惯,来辅助进行词性的预测。
相应地,本发明实施例还提供一种输入装置,本发明实施例的输入装置,可以集成在用户设备中,所述用户设备可以是笔记本、计算机、PAD、手机等。用户在进行输入操作时,可以使用实体键盘,也可以使用用户设备触摸屏上的虚拟键盘。
如图2所示,是本发明实施例输入装置的一种结构示意图。
在该实施例中,所述装置包括:
上文获取模块201,用于实时获取上文;
候选项获取模块202,用于获得候选项;
词性预测模块203,用于根据所述上文确定下一个词的词性信息;
筛选模块204,用于根据所述下一个词的词性信息对所述候选项进行筛选,得到待输出的候选项。
针对不同的输入设备及输入方式,所述上文的形式也可以不同,比如,所述上文可以是文本、语音、或者图片等形式。另外,根据应用场景不同,所述上文可以是用户输入、已有上文、对端交互的上文等。
所述候选项,可以是基于现有的输入法生成的候选项,对于不同的输入法,其生成候选项的方法及规则等可能会有所不同,此处本发明实施例不做限定。不论基于何种输入法生成的候选项,通过后续本发明方案对这些候选项做进一步筛选,均能得到与上文更匹配的候选项。
上述词性预测模块203具体可以采用基于语法规则的方式或者采用基于模型的方式对下一个词的词性进行预测。所述语法规则和所述模型需要预先构建。
以采用基于模型的方式为例,可以由模型构建模块预先构建词性预测模型。所述模型构建模块可以作为独立的模块,也可以集成于该装置,作为本发明装置的一部分。
在实际应用中,所述词性预测模型可以采用深度学习模型,比如DNN、CNN等,或者采用上下文无关语法模型等,比如,CFG模型、PCFG模型等。模型的训练过程可以采用常规技术,在此不再详细描述。
基于预先构建的词性预测模型,所述词性预测模块203对所述上文的下一个词的词性进行预测时,需要先对所述上文进行预处理,提取所述上文的文本信息,然后将所述文本信息输入到所述词性预测模型,根据模型的输出得到下一个词的词性信息。相应地,所述词性预测模块203的一个具体结构包括:文本处理单元和预测单元。其中:
所述文本处理单元,用于提取所述上文的文本信息;
所述预测单元,用于利用所述文本信息及所述词性预测模型,得到下一个词的词性信息。
对于不同的模型,所述文本处理单元需要得到不同的文本信息,比如,所述词性预测模型为深度学习模型时,所述文本处理单元需要获取所述上文对应的词序列,确定所述词序列中各词的词向量;所述词性预测模型为上下文无关语法模型时,所述文本处理单元需要获取所述上文对应的词序列,确定所述词序列中各词的ID。相应地,所述预测单元需要将所述词序列中各词的词向量输入深度学习模型得到下一个词的词性信息,或者将所述词序列中各词的ID输入上下文无关语法模型得到下一个词的词性信息。
对于文本形式的上文,所述文本处理单元可以通过对所述上文进行分词处理,得到所述上文对应的词序列;对于其它形式的上文,可以先利用相应的识别技术,得到对应的文本,然后再进行分词处理,得到词序列。如果是用户输入的上文,也可以通过记录用户输入的各词,得到所述上文对应的词序列。
进一步地,所述词性预测模块203还可包括:辅助信息获取单元,用于获取辅助信息,所述辅助信息包括:当前环境信息和/或位置信息等。相应地,所述预测单元可以利用所述文本信息、所述辅助信息及所述词性预测模型,得到下一个词的词性信息。需要说明的是,在这种情况下,所述词性预测模型构建时,也需要考虑上述辅助信息。
在实际应用中,所述筛选模块204在对所述候选项进行筛选时,可以有多种筛选方式。
比如,在一个具体实施例中,可以选择所述候选项中词性与所述下一个词的词性信息相同的候选项作为待输出的候选项。
再比如,如图3所示,在另一个具体实施例中,所述候选项获取模块202还用于获取各候选项的候选得分。
相应地,在该实施例中,所述筛选模块204包括:得分调整模块241和候选项输出模块242。其中:
所述得分调整模块241用于根据所述下一个词的词性信息调整所述候选项的候选得分,得到所述候选项的最终得分;
所述候选项输出模块242用于根据所述最终得分确定待输出的候选项。
在实际应用中,所述得分调整模块241也可以采用多种方式对候选项的候选得分进行调整。
比如,所述得分调整模块241的一种具体实现可以包括:词性得分确定单元和第一计算单元。其中:所述词性得分确定单元用于根据所述下一个词的词性信息确定各候选项的词性得分;所述第一计算单元用于将所述候选项的候选得分与所述词性得分进行加权求和,得到所述候选项的最终得分。
再比如,所述得分调整模块241的另一种具体实现可以包括:权重确定单元和第二计算单元。其中:所述权重确定单元用于根据所述下一个词的词性信息确定各候选项的候选得分的权重;所述第二计算单元用于根据所述候选项的候选得分及其权重计算得到所述候选项的最终得分。
上述候选项输出模块242具体可以依照最终得分从高到低的顺序选取设定数量的候选项作为待输出的候选项;或者选取最终得分大于设定阈值的候选项作为待输出的候选项。
本发明实施例提供的输入装置,基于上文信息对下一个词的词性信息进行预测,根据预测得到的词性信息对各候选项进行筛选,从而提供给用户更准确的候选项,进而提高用户输入效率,提升用户输入体验。
如图4所示,是本发明实施例输入装置的另一种结构示意图。
与图2所示实施例不同的是,在该实施例中,所述装置还包括:信息记录模块401和模型更新模块402。其中:
所述信息记录模块401用于记录历史输入信息;
所述模型更新模块402用于利用所述信息记录模块401记录的历史输入信息对所述词性预测模型400进行个性化训练,更新所述词性预测模型400。具体地,可以将每次记录的历史输入信息作为一个训练样本,在训练样本达到一定数量后,在原有词性预测模型参数的基础上,利用新的样本重新训练,从而得到与该用户更加匹配的个性化的词性预测模型。
这样,在后续用户的输入过程中,词性预测模块203可以利用更新后的词性预测模型400对下一个词所属词性进行预测,可以使预测结果更准确,进而可以使向用户提供的候选项具有与上文更高的匹配度,进一步提高候选项的准确性,提高用户输入效率。
需要说明的是,在实际应用中,可以将本发明方法及装置应用于各种不同的输入法中,而且由于本发明方案是基于上文对下文进行词性预测,根据词性预测结果对利用现有输入法得到的候选项进行筛选,因此不论是采用拼音输入、五笔输入、还是其它方式的输入,都能够适用。
图5是根据一示例性实施例示出的一种用于输入方法的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理部件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述按键误触纠错方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本发明还提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行上述本发明方法实施例中的全部或部分步骤。
图6是本发明实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种输入方法,其特征在于,所述方法包括:
实时获取上文并得到候选项;
根据所述上文确定下一个词的词性信息;
根据所述下一个词的词性信息对所述候选项进行筛选,得到待输出的候选项。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:预先构建词性预测模型;
所述根据所述上文确定下一个词的词性信息包括:
提取所述上文的文本信息;
利用所述文本信息及所述词性预测模型,得到下一个词的词性信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述上文确定下一个词的词性信息还包括:
获取辅助信息,所述辅助信息包括:当前环境信息和/或位置信息;
利用所述文本信息、所述辅助信息及所述词性预测模型,得到下一个词的词性信息。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取各候选项的候选得分;
所述根据所述下一个词的词性信息对所述候选项进行筛选,得到待输出的候选项包括:
根据所述下一个词的词性信息调整所述候选项的候选得分,得到所述候选项的最终得分;
根据所述最终得分确定待输出的候选项。
5.根据权利要求4所述的方法,其特征在于,所述根据所述下一个词的词性信息调整所述候选项的候选得分,得到所述候选项的最终得分包括:
根据所述下一个词的词性信息确定各候选项的词性得分;
将所述候选项的候选得分与所述词性得分进行加权求和,得到所述候选项的最终得分。
6.根据权利要求4所述的方法,其特征在于,所述根据所述下一个词的词性信息调整所述候选项的候选得分,得到所述候选项的最终得分包括:
根据所述下一个词的词性信息确定各候选项的候选得分的权重;
根据所述候选项的候选得分及其权重计算得到所述候选项的最终得分。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据历史输入信息对所述词性预测模型进行个性化训练,更新所述词性预测模型。
8.一种输入装置,其特征在于,所述装置包括:
上文获取模块,用于实时获取上文;
候选项获取模块,用于获得候选项;
词性预测模块,用于根据所述上文确定下一个词的词性信息;
筛选模块,用于根据所述下一个词的词性信息对所述候选项进行筛选,得到待输出的候选项。
9.一种计算机设备,其特征在于,包括:一个或多个处理器、存储器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现如权利要求1至7任一项所述的方法。
10.一种可读存储介质,其上存储有指令,所述指令被执行以实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811072268.0A CN110908523B (zh) | 2018-09-14 | 2018-09-14 | 一种输入方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811072268.0A CN110908523B (zh) | 2018-09-14 | 2018-09-14 | 一种输入方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110908523A true CN110908523A (zh) | 2020-03-24 |
CN110908523B CN110908523B (zh) | 2024-08-20 |
Family
ID=69812555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811072268.0A Active CN110908523B (zh) | 2018-09-14 | 2018-09-14 | 一种输入方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110908523B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113589946A (zh) * | 2020-04-30 | 2021-11-02 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和电子设备 |
CN113589949A (zh) * | 2020-04-30 | 2021-11-02 | 北京搜狗科技发展有限公司 | 一种输入方法、装置和电子设备 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1815467A (zh) * | 2005-01-31 | 2006-08-09 | 日电(中国)有限公司 | 字典学习方法以及使用该方法的装置,输入方法以及使用该方法的用户终端装置 |
JP2009289202A (ja) * | 2008-05-30 | 2009-12-10 | Toshiba Corp | キーワード入力支援装置、キーワード入力支援方法及びプログラム |
KR20100013108A (ko) * | 2008-07-30 | 2010-02-09 | 고려대학교 산학협력단 | 휴대용 단말기를 이용하여 한글을 입력하는 방법 및 휴대용단말기 |
DE202007019315U1 (de) * | 2007-08-02 | 2011-10-19 | Neuer Wall Treuhand Gmbh | Kontextsensitive Texteingabevorrichtung, in welcher Kandidatenworte in einer räumlichen Anordnung gemäß jener der Vorrichtungseingabemittel angezeigt werden |
CN106484135A (zh) * | 2016-09-23 | 2017-03-08 | 百度在线网络技术(北京)有限公司 | 一种用于提供输入候选项的方法与装置 |
CN106502994A (zh) * | 2016-11-29 | 2017-03-15 | 上海智臻智能网络科技股份有限公司 | 一种文本的关键词提取的方法和装置 |
CN106873798A (zh) * | 2017-02-16 | 2017-06-20 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN107102993A (zh) * | 2016-02-19 | 2017-08-29 | 阿里巴巴集团控股有限公司 | 一种用户诉求分析方法和装置 |
CN107122413A (zh) * | 2017-03-31 | 2017-09-01 | 北京奇艺世纪科技有限公司 | 一种基于图模型的关键词提取方法及装置 |
CN107291693A (zh) * | 2017-06-15 | 2017-10-24 | 广州赫炎大数据科技有限公司 | 一种改进词向量模型的语义计算方法 |
CN107621891A (zh) * | 2017-09-28 | 2018-01-23 | 北京新美互通科技有限公司 | 一种文本输入方法、装置及电子设备 |
CN108073292A (zh) * | 2016-11-11 | 2018-05-25 | 北京搜狗科技发展有限公司 | 一种智能组词方法和装置、一种用于智能组词的装置 |
-
2018
- 2018-09-14 CN CN201811072268.0A patent/CN110908523B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1815467A (zh) * | 2005-01-31 | 2006-08-09 | 日电(中国)有限公司 | 字典学习方法以及使用该方法的装置,输入方法以及使用该方法的用户终端装置 |
DE202007019315U1 (de) * | 2007-08-02 | 2011-10-19 | Neuer Wall Treuhand Gmbh | Kontextsensitive Texteingabevorrichtung, in welcher Kandidatenworte in einer räumlichen Anordnung gemäß jener der Vorrichtungseingabemittel angezeigt werden |
JP2009289202A (ja) * | 2008-05-30 | 2009-12-10 | Toshiba Corp | キーワード入力支援装置、キーワード入力支援方法及びプログラム |
KR20100013108A (ko) * | 2008-07-30 | 2010-02-09 | 고려대학교 산학협력단 | 휴대용 단말기를 이용하여 한글을 입력하는 방법 및 휴대용단말기 |
CN107102993A (zh) * | 2016-02-19 | 2017-08-29 | 阿里巴巴集团控股有限公司 | 一种用户诉求分析方法和装置 |
CN106484135A (zh) * | 2016-09-23 | 2017-03-08 | 百度在线网络技术(北京)有限公司 | 一种用于提供输入候选项的方法与装置 |
CN108073292A (zh) * | 2016-11-11 | 2018-05-25 | 北京搜狗科技发展有限公司 | 一种智能组词方法和装置、一种用于智能组词的装置 |
CN106502994A (zh) * | 2016-11-29 | 2017-03-15 | 上海智臻智能网络科技股份有限公司 | 一种文本的关键词提取的方法和装置 |
CN106873798A (zh) * | 2017-02-16 | 2017-06-20 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN107122413A (zh) * | 2017-03-31 | 2017-09-01 | 北京奇艺世纪科技有限公司 | 一种基于图模型的关键词提取方法及装置 |
CN107291693A (zh) * | 2017-06-15 | 2017-10-24 | 广州赫炎大数据科技有限公司 | 一种改进词向量模型的语义计算方法 |
CN107621891A (zh) * | 2017-09-28 | 2018-01-23 | 北京新美互通科技有限公司 | 一种文本输入方法、装置及电子设备 |
Non-Patent Citations (4)
Title |
---|
THEERAPAT LAPJATURAPIT等: "Multi-Candidate Word Segmentation using Bi-directional LSTM Neural Networks", 《2018 INTERNATIONAL CONFERENCE ON EMBEDDED SYSTEMS AND INTELLIGENT TECHNOLOGY & INTERNATIONAL CONFERENCE ON INFORMATION AND COMMUNICATION TECHNOLOGY FOR EMBEDDED SYSTEMS(ICESIT-ICICTES)》, 23 August 2018 (2018-08-23), pages 1 - 6 * |
WEN-YU HUANG等: "Enhancement of Automatic Oral Presentation Assessment System using Latent N-Grams Word Representation and Part-of-Speech Information", 《INTERSPEECH 2016》, 12 September 2016 (2016-09-12), pages 1432 - 1436 * |
王勇: "繁体中文拼写检错研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, vol. 2017, no. 2, pages 138 - 4598 * |
陈致鹏: "面向小学生阅读理解题型的智能解题系统研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》, vol. 2017, no. 2, pages 138 - 2038 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113589946A (zh) * | 2020-04-30 | 2021-11-02 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和电子设备 |
CN113589949A (zh) * | 2020-04-30 | 2021-11-02 | 北京搜狗科技发展有限公司 | 一种输入方法、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110908523B (zh) | 2024-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3133532A1 (en) | Method and device for training classifier and recognizing a type of information | |
CN109961791B (zh) | 一种语音信息处理方法、装置及电子设备 | |
CN107291704B (zh) | 处理方法和装置、用于处理的装置 | |
CN107291260B (zh) | 一种信息输入方法和装置、及用于信息输入的装置 | |
CN112562675B (zh) | 语音信息处理方法、装置及存储介质 | |
CN109471919B (zh) | 零代词消解方法及装置 | |
CN107564526B (zh) | 处理方法、装置和机器可读介质 | |
CN107274903B (zh) | 文本处理方法和装置、用于文本处理的装置 | |
EP3644177A1 (en) | Input method, device, apparatus, and storage medium | |
EP3734472A1 (en) | Method and device for text processing | |
CN111210844A (zh) | 语音情感识别模型的确定方法、装置、设备及存储介质 | |
CN110858099B (zh) | 候选词生成方法及装置 | |
CN110968246A (zh) | 中文智能手写输入识别方法及装置 | |
CN110908523B (zh) | 一种输入方法及装置 | |
CN109901726B (zh) | 一种候选词生成方法、装置及用于候选词生成的装置 | |
CN112631435A (zh) | 一种输入方法、装置、设备及存储介质 | |
CN111679746A (zh) | 一种输入方法、装置和电子设备 | |
CN116484828A (zh) | 相似案情确定方法、装置、设备、介质和程序产品 | |
CN113589954B (zh) | 一种数据处理方法、装置和电子设备 | |
CN113807540A (zh) | 一种数据处理方法及装置 | |
CN113589949A (zh) | 一种输入方法、装置和电子设备 | |
CN113946228A (zh) | 语句推荐方法、装置、电子设备和可读存储介质 | |
CN110781270A (zh) | 一种解码网络中非关键词模型的构建方法和装置 | |
CN111722726B (zh) | 一种颜文字的确定方法和装置 | |
US20230196001A1 (en) | Sentence conversion techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |