CN108803890A - 一种输入方法、输入装置和用于输入的装置 - Google Patents
一种输入方法、输入装置和用于输入的装置 Download PDFInfo
- Publication number
- CN108803890A CN108803890A CN201710295616.XA CN201710295616A CN108803890A CN 108803890 A CN108803890 A CN 108803890A CN 201710295616 A CN201710295616 A CN 201710295616A CN 108803890 A CN108803890 A CN 108803890A
- Authority
- CN
- China
- Prior art keywords
- association
- candidate item
- original
- correction
- language model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 123
- 238000012937 correction Methods 0.000 claims abstract description 201
- 230000008569 process Effects 0.000 claims abstract description 43
- 238000004891 communication Methods 0.000 claims abstract description 41
- 230000011218 segmentation Effects 0.000 claims description 34
- 238000013507 mapping Methods 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 22
- 230000015654 memory Effects 0.000 claims description 19
- 239000000463 material Substances 0.000 description 16
- 238000003860 storage Methods 0.000 description 13
- 230000006399 behavior Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 235000013399 edible fruits Nutrition 0.000 description 7
- 238000012549 training Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 235000012054 meals Nutrition 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000712 assembly Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000012092 media component Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
- G06F3/0236—Character input methods using selection techniques to select from displayed items
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明实施例提供了一种输入方法、输入装置和用于输入的装置,其中的方法具体包括:对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文;所述原始上文包括:接收到的通信内容;获取所述纠正上文对应的第一联想候选项;展示所述第一联想候选项。本发明实施例可以提高联想结果的准确率,且可以提高输入效率。
Description
技术领域
本发明涉及输入法技术领域,尤其涉及一种输入方法、输入装置和用于输入的装置。
背景技术
对于例如中文、日文、韩文等语言的用户而言,一般都需要通过输入法程序与计算机进行交互。例如,用户可以通过键盘键入输入串,然后由输入法程序依据其预置的标准映射规则将该输入串转换为相应语言的候选项并展示,进而将用户选择的候选项上屏。
现有的输入法程序可以根据用户已输入的上文,联想得到用户欲输入的下文;例如,若用户已输入的上文为“北京搜狗有限”,则输入法程序联想得到的下文可以为“公司”。由于可以在用户未输入下文对应的输入串的情况下,向用户展现候选项“公司”,因此可以提高用户的输入效率。
然而,在实际应用中,用户很有可能因为按错键或者点错屏幕位置等原因而导致已输入的上文存在错误,此种情况下,输入法程序将仍然按照错误的上文进行联想,将导致联想结果远远偏离用户的输入意图。例如,在用户误将“北京搜狗有限”输入为“北京搜狗悠闲”的情况下,输入法程序针对“北京搜狗悠闲”得到的联想结果可以为“自得”,该联想结果“自得”是明显不符合用户的输入意图的。
发明内容
本发明实施例提供一种输入方法、装置和用于输入的装置,可以提高联想结果的准确率,且能够提高输入效率。
为了解决上述问题,本发明公开了一种输入方法,包括:
对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文;所述原始上文包括:接收到的通信内容;
获取所述纠正上文对应的第一联想候选项;
展示所述第一联想候选项。
可选地,所述获取所述纠正上文对应的第一联想候选项,包括:
对所述纠正上文进行分词,并从所述纠正上文对应的分词结果中获取位于后部的至少一个词汇,作为目标词汇序列;
根据所述目标词汇序列查询N元关系,将与所述目标词汇序列具有连接关系的词汇作为所述纠正上文对应的第一联想候选项。
可选地,所述获取所述纠正上文对应的第一联想候选项,包括:
根据所述纠正上文查询预置映射关系,以得到与所述纠正上文对应的预置联想候选项;其中,所述预置映射关系用于存储预置上文与预置联想候选项之间的映射关系;
将所述预置联想候选项作为所述纠正上文对应的第一联想候选项。
可选地,所述获取所述纠正上文对应的第一联想候选项,包括:
将所述纠正上文输入联想模型,将所述联想模型输出的结果作为所述纠正上文对应的第一联想候选项。
可选地,所述对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文,包括:
对原始上文进行分词处理,以得到所述原始上文对应的分词结果;
若所述分词结果符合预置条件,则确定所述原始上文中存在错误;
对所述原始上文进行纠错处理,得到所述原始上文对应的纠正上文。
可选地,所述方法还包括:
获取所述原始上文对应的第二联想候选项;
对所述第一联想候选项和所述第二联想候选项进行排序并展示。
可选地,所述对所述第一联想候选项和所述第二联想候选项进行排序并展示,包括:
根据所述原始上文的语言模型得分、所述第二联想候选项的词频、以及所述第二联想候选项在所述原始上文条件下的语言模型得分,确定所述第二联想候选项的综合得分;
根据所述纠正上文的语言模型得分、所述第一联想候选项的词频、以及所述第一联想候选项在所述纠正上文条件下的语言模型得分,确定所述第一联想候选项的综合得分;
根据所述第一联想候选项的综合得分和所述第二联想候选项的综合得分,对所述第一联想候选项和所述第二联想候选项进行排序并展示。
可选地,所述方法还包括:
调整所述原始上文的语言模型得分、所述第二联想候选项的词频、以及所述第二联想候选项在所述原始上文条件下的语言模型得分在所述第二联想候选项的综合得分中的权重;和/或
调整所述纠正上文的语言模型得分、所述第一联想候选项的词频、以及所述第一联想候选项在所述纠正上文条件下的语言模型得分在所述第一联想候选项的综合得分中的权重。
另一方面,本发明公开了一种输入装置,包括:
纠错模块,用于对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文;所述原始上文包括:接收到的通信内容;
第一联想获取模块,用于获取所述纠正上文对应的第一联想候选项;以及
第一联想展示模块,用于展示所述第一联想候选项。
可选地,所述第一联想获取模块包括:
第一分词子模块,用于对所述纠正上文进行分词,并从所述纠正上文对应的分词结果中获取位于后部的至少一个词汇,作为目标词汇序列;
第一查询子模块,用于根据所述目标词汇序列查询N元关系,将与所述目标词汇序列具有连接关系的词汇作为所述纠正上文对应的第一联想候选项。
可选地,所述第一联想获取模块包括:
第二查询子模块,用于根据所述纠正上文查询预置映射关系,以得到与所述纠正上文对应的预置联想候选项;其中,所述预置映射关系用于存储预置上文与预置联想候选项之间的映射关系;
确定子模块,用于将所述预置联想候选项作为所述纠正上文对应的第一联想候选项。
可选地,所述第一联想获取模块包括:
模型获取子模块,用于将所述纠正上文输入联想模型,将所述联想模型输出的结果作为所述纠正上文对应的第一联想候选项。
可选地,所述纠错模块包括:
第二分词子模块,用于对原始上文进行分词处理,以得到所述原始上文对应的分词结果;
错误确定子模块,用于若所述分词结果符合预置条件,则确定所述原始上文中存在错误;
纠错子模块,用于对所述原始上文进行纠错处理,得到所述原始上文对应的纠正上文。
可选地,所述装置还包括:
第二联想获取模块,用于获取所述原始上文对应的第二联想候选项;
排序展示模块,用于对所述第一联想候选项和所述第二联想候选项进行排序并展示。
可选地,所述排序展示模块包括:
第一得分确定子模块,用于根据所述原始上文的语言模型得分、所述第二联想候选项的词频、以及所述第二联想候选项在所述原始上文条件下的语言模型得分,确定所述第二联想候选项的综合得分;
第二得分确定子模块,用于根据所述纠正上文的语言模型得分、所述第一联想候选项的词频、以及所述第一联想候选项在所述纠正上文条件下的语言模型得分,确定所述第一联想候选项的综合得分;
排序展示子模块,用于根据所述第一联想候选项的综合得分和所述第二联想候选项的综合得分,对所述第一联想候选项和所述第二联想候选项进行排序并展示。
可选地,所述装置还包括:
第一调整模块,用于调整所述原始上文的语言模型得分、所述第二联想候选项的词频、以及所述第二联想候选项在所述原始上文条件下的语言模型得分在所述第二联想候选项的综合得分中的权重;和/或
第二调整模块,用于调整所述纠正上文的语言模型得分、所述第一联想候选项的词频、以及所述第一联想候选项在所述纠正上文条件下的语言模型得分在所述第一联想候选项的综合得分中的权重。
再一方面,本发明公开了一种用于输入的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文;所述原始上文包括:接收到的通信内容;
获取所述纠正上文对应的第一联想候选项;
展示所述第一联想候选项。
又一方面,本发明公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行前述一个或多个所述的输入方法。
本发明实施例包括以下优点:
本发明实施例可以对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文,获取所述纠正上文对应的第一联想候选项,并展示所述第一联想候选项;本发明实施例可以在原始上文存在错误的情况下,向用户提供纠正上文对应的第一联想候选项,这样,在发生输入错误的情况下,不仅可以节省用户退格删除错误的原始上文并且重新输入的操作成本,而且还可以提供正确的联想结果,因此能够提高输入效率,且能够提升用户的使用体验。
并且,本发明实施例的原始上文可以包括:接收到的通信内容,例如,可以在通讯环境(如短信应用、即时通讯应用等环境)下接收通信对端发送的通信内容,这样,在该通信内容存在错误的情况下,本发明实施例可以对该通信内容进行纠错处理并联想,因此能够提高联想结果的准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一种输入方法实施例一的步骤流程图;
图2是本发明的一种输入方法实施例二的步骤流程图;
图3是本发明的一种输入装置实施例的结构框图;
图4是本发明的一种用于输入的装置800作为终端时的框图;及
图5是本发明的一些实施例中服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种输入方法,该方法可以对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文,获取所述纠正上文对应的第一联想候选项,并展示所述第一联想候选项;本发明实施例可以在原始上文存在错误的情况下,向用户提供纠正上文对应的第一联想候选项,这样,在发生输入错误的情况下,不仅可以节省用户退格删除错误的原始上文并且重新输入的情况,而且还可以提供正确的联想结果,因此能够提高输入效率,且能够提升用户的使用体验。
本发明实施例的原始上文可以包括:接收到的通信内容,例如,可以在通讯环境(如短信应用、即时通讯应用等环境)下接收通信对端发送的通信内容,这样,在该通信内容存在错误的情况下,本发明实施例可以对该通信内容进行纠错处理并联想,因此能够提高联想结果的准确率。
方法实施例一
参照图1,示出了本发明的一种输入方法实施例一的步骤流程图,具体可以包括:
步骤101、对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文;所述原始上文可以包括:接收到的通信内容;
步骤102、获取所述纠正上文对应的第一联想候选项;
步骤103、展示所述第一联想候选项。
本发明实施例可应用于键盘符号输入、语音输入、手写输入等输入方式的输入法程序,为便于描述,本发明实施例将用户在上述输入方式下输入的编码字符串称为输入串。在输入法领域,对于例如中文、日文、韩文、或者其它语言的输入法程序,通常可以将用户输入的输入串转换成相应语言的候选项。以下主要以中文为例对本发明的输入过程进行说明,其它语言相互参照即可。可以理解,所述中文输入法可以包括但不限于全拼、简拼、笔画、五笔等,本发明实施例对于某种语言对应的具体输入法程序不加以限制。
在实际应用中,用户可以通过即时通讯应用、短消息应用、电子邮件应用、甚至网页应用等通讯应用接收通信对端发送的通信内容。
除了接收到的通信内容之外,本发明实施例的原始上文还可以包括:用户输入的上文。例如,所述用户输入的上文具体可以包括:当前光标位置之前已上屏的文本、或者用户拷贝的文本等。可以理解,本发明实施例对于具体的原始上文不加以限制,例如所述原始上文还可以为网页、文档内已经存在的文本等。
在本发明的一种可选实施例中,所述步骤101对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文,具体可以包括:
步骤S11、对原始上文进行分词处理,以得到所述原始上文对应的分词结果;
在本发明的一种应用示例中,假设用户接收到的通信内容为“你结果了吗”,则对该原始上文进行分词,得到对应的分词结果可以为“你/结果/了/吗”,其中,“|”表示分词结果中词汇之间的分割符号。
步骤S12、若所述分词结果符合预置条件,则确定所述原始上文中存在错误;
本发明实施例可以根据所述分词结果判断原始上文中是否存在存在错误。可选地,上述分词结果符号预置条件可以包括:分词结果对应的语言模型得分小于预设阈值。
本发明实施例中,语言模型是根据语言客观事实而进行的语言抽象数学建模,其可以在语言模型与语言客观事实之间建立某种映射关系,本发明实施例主要以统计语言模型为例进行说明,非统计语言模型相互参照即可。
可选地,统计语言模型可以概率分布的形式描述任意词序列S属于某种语言集合的可能性,这里并不要求词序列S在语法上是完备的,该统计语言模型可以对任意的词序列S可以给出一个概率参数值,相应的计算公式可以表示为:
p(S)=p(w1,w2,w3,w4,w5,…,wn)
=p(w1)p(w2|w1)p(w3|w1,w2)...p(wn|w1,w2,...,wn-1) (1)
公式(1)中,S包括n个词汇,公式(1)中wi表示词序列中的第i个词汇。可选地,训练“语言模型”的过程,就是估计模型参数P(wi|wi-n+1,...,wi-1)的过程,其中,P(wi|wi-n+1,...,wi-1)可用于表示前n-1个词为wi-n+1,...,wi-1的情况下、后词为wi的概率。
依据统计语言模型的概念,现有的统计语言模型可以基于统计算法对预置语料进行处理,以给出词序列的概率,或者,在给定上下文数据的情况下,预测下一个最可能出现的单词。
在实际应用中,可以采用任意的统计语言模型来实施本发明实施例的输入方法。例如,上述统计语言模型具体可以包括:上下文无关模型、N元文法模型(N-gram Model)、隐马尔科夫模型(HMM,Hidden Markov Model)、最大熵模型(Maximum Entropy Model)、循环神经网络模型(RNN,Recurrent Neural Networks Model)。其中,上下文无关模型可以不依赖于上下文环境,N元文法模型、HMM模型、最大熵模型、RMM模型等需要依赖于上下文环境,N元文法模型、HMM模型、最大熵模型、RMM模型使用的机器学习方法不同,HMM模型、最大熵模型、RMM模型所使用的机器学习方法不仅考虑了预置语料(也即训练文本)之间的联系,而且使用了训练文本的时序特性;而N元文法模型可以不考虑训练文本之间的联系,其中,N为大于等于2的正整数。
本发明实施例中,统计语言模型所需的预置语料可以来源于已有的语料库,如英文语料库、中文语料库等,或者,统计语言模型所需的预置语料还可以来源于著名书籍、互联网语料、输入法程序记录的至少一个用户的历史输入行为数据等。可以理解,任意的语料均在本发明实施例的预置语料的保护范围之内。
在本发明的一种实施例中,语言模型可以为二元语言模型,可用于描述相邻的两个词汇对应的语言模型得分,进而可以得知相邻词汇之间是否存在二元关系。具体地,可以设置预设阈值为一个较小的数值,如果相邻词汇对应的语言模型得分小于预设阈值,则说明相邻词汇之间不存在二元关系或者存在二元关系的概率非常低。例如,对于上述分词结果“你/结果/了/吗”,通过二元语言模型计算得知分词“你”和分词“结果”对应的语言模型得分(如0.05)小于预设阈值(如0.8),则可以确定原始上文“你结果了吗”中存在错误文本。
可以理解,上述二元语言模型仅作为本发明的一种应用示例,本发明实施例对应具体的语言模型不加以限制,例如三元、四元等多元语言模型可用于描述相邻的三个词汇、或者四个对应的语言模型得分,或者根据用户的输入习惯建立的用户语言模型等。
需要说明的是,在确定所述原始上文中存在错误后,还可以确定上述原始上文中的错误文本。例如,可以采用二元语言模型计算所述原始上文中相邻的两个词汇的语言模型得分,若所述原始上文中相邻的两个词汇的语言模型得分小于预设阈值,可以认为相邻的两个词汇为错误文本。
可以理解,上述分词结果对应的语言模型得分小于预设阈值只是作为分词结果符合预置条件的可选实施例,在本发明的其他实施例中,分词结果符合预置条件还可以包括:分词结果命中纠错用户词库。具体地,可以依据分词结果,查找纠错用户词库,若查找命中,则确定所述原始上文中存在错误。其中,所述纠错用户词库中记录有源词汇和目标词汇的映射关系,所述源词汇具体可以包括:历史纠错行为对应的纠错前词汇及对应的上文和/或下文词汇;所述目标词汇具体可以包括:所述历史纠错行为对应的纠错后词汇及对应的上文和/或下文词汇。
在实际应用中,可以依据用户的历史纠错行为在上述纠错用户词库中建立源词汇和目标词汇的映射关系对应的数据记录,例如,用户的某次历史纠错行为将“结果”纠正为“结婚”,则本发明实施例可以将“结果”及对应的上文和/或下文词汇作为源词汇(如“结果礼物”),以及将“结婚”及对应的上文和/或下文词汇作为目标词汇(如“结婚礼物”);从而,在该用户的后续输入过程中,可以利用上述纠错用户词库识别所述文本内容中的误上屏内容。
例如,对于句子“送你的结果礼物收到了吗”,可以将其中的原始上文与上述纠错用户词库中源词汇进行匹配,其中,“结果礼物”与上述纠错用户词库中源词汇匹配成功,因此,可以确定“结果”为原始上文中存在的错误文本,以及,确定目标词汇为错误文本对应的目标纠错候选。
步骤S13、对所述原始上文进行纠错处理,得到所述原始上文对应的纠正上文。
在实际应用中,可以尝试对原始上文的全部或者部分(如错误文本)包括的词汇进行纠错处理。例如,上述纠错处理可以查找得到与所述错误文本的拼音串相似的输入串对应的词汇、或者与所述错误文本的字形相似的词汇作为纠错候选,并对纠错候选进行语言模型打分,通过比较语言模型得分来确定目标纠错候选,最后将原始上文中的错误文本替换为目标纠错候选,得到原始上文对应的纠正上文。
例如,对于上述原始上文“你/结果/了/吗”,可以确定错误文本为“你/结果”,以分词“结果”为例,“结果”对应的拼音串为“jieguo”,查找得到与拼音串“jieguo”相似的拼音串包括:“lieguo”、“liehuo”、“jiehun”等,则可以得到相似的词汇包括:“列国”、“烈火”、“结婚”等。同样地,对于分词“你”,也可以找到相似的词汇如:“那”、“泥”等。将上述相似的词汇作为纠错候选,并且通过语言模型进行打分,假设最终得到“你/结婚”对应的语言模型得分最高,且高于“你/结果”对应的语言模型得分,则可以将“结婚”作为目标纠错候选,并且将原始上文中的错误文本“结果”替换为目标纠错候选“结婚”,得到原始上文对应的纠正上文“你结婚了吗”。
需要说明的是,上述步骤S12确定所述原始上文中存在错误的方式只是作为可选实施例,实际上,本领域技术人员还可以根据实际应用需求,采用其他确定所述原始上文中存在错误的方式,例如,还可以通过纠错用户词库识别所述文本内容中的误上屏内容,相应的识别过程可以包括:
依据所述原始上文中词汇,在纠错用户词库中进行查找,以得到与所述词汇匹配的目标词汇序列;其中,所述纠错用户词库中记录有源词汇和目标词汇序列的映射关系,所述源词汇具体可以包括:历史纠错行为对应的纠错前词汇及对应的上文和/或下文词汇;所述目标词汇序列具体可以包括:所述历史纠错行为对应的纠错后词汇及对应的上文和/或下文词汇;依据所述词汇和其匹配的目标词汇序列中的上文和/或下文词汇,得到对应的误上屏内容。
在实际应用中,可以依据用户的历史纠错行为在上述纠错用户词库中建立源词汇和目标词汇序列的映射关系对应的数据记录,例如,用户的某次历史纠错行为将“结果”纠正为“结婚”,则本发明实施例可以将“结果”及对应的上文和/或下文词汇作为源词汇(如“结果礼物”),以及将“结婚”及对应的上文和/或下文词汇作为目标词汇序列(如“结婚礼物”);从而,在该用户的后续输入过程中,可以利用上述纠错用户词库识别所述文本内容中的误上屏内容。例如,对于通信内容“送你的结果礼物收到了吗”,可以将其中的词汇与上述纠错用户词库中源词汇进行匹配,其中,“结果礼物”与上述纠错用户词库中源词汇匹配成功,因此,可以确定“结果”为误上屏内容,以及,确定目标词汇序列为该误上屏内容对应的目标纠错候选。
本发明实施例对所述目标纠错候选的数目不加以限制,例如,可以根据语言模型得分确定多个目标纠错候选,并且根据语言模型得分的高低对多个目标纠错候选进行排序并展示,以提示用户从中选择合理的目标纠错候选,对原始上文进行纠错得到对应的纠正上文。
可以理解,在实际应用中,可以利用任意的纠错算法对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文,本发明实施例对于所述原始上文对应的纠正上文的具体获取方式不加以限制。
步骤102、获取所述纠正上文对应的第一联想候选项;
本发明实施例可以提供获取所述纠正上文对应的第一联想候选项的如下方案:
方案一
方案一可以通过查询N元关系中词汇的前缀获取纠正上文对应的第一联想候选项。具体地,所述获取所述纠正上文对应的第一联想候选项,可以包括如下:
步骤S21、根据所述纠正上文在词库中进行查询,以得到前缀与所述纠正上文相匹配的目标词汇;
步骤S22、确定所述目标词汇中去除前缀的部分为所述纠正上文对应的第一联想候选项。
本发明实施例中的词库具体可以包括:本地词库和/或云词库。所述本地词库具体可以包括:本地缓存词库和/或用户词库和/或系统词库和/或细胞词库等。可以理解,所述本地词库可以包括传统技术中的任一种词库或其组合,也可以为由本领域技术人员根据预置规则获取的任一种词库,并且所述本地词库的存储位置可以为客户端所在的智能终端本地,本发明实施例对于所述本地词库的类型以及存储方式均不加以限制。所述云词库可存储于云服务器中,所述云词库可以实时收集不同用户的输入数据,以对本地词库中的词汇进行扩充,满足更多用户的输入需求。
在本发明的一种应用示例中,假设纠正上文为“中华人民”,根据纠正上文“中华人民”查询N元关系,由于词库中存储有词汇“中华人民共和国”,则词汇“中华人民共和国”具有与纠正上文“中华人民”相匹配的前缀“中华人民”,因此,可以将词库中的词汇“中华人民共和国”作为目标词汇,将该目标词汇中除前缀的部分“共和国”作为所述纠正上文“中华人民”对应的第一联想候选项。
方案二
方案二可以通过查询N元关系中词汇之间的连接关系获取纠正上文对应的第一联想候选项。具体地,所述获取所述纠正上文对应的第一联想候选项,可以包括如下步骤:
步骤S31、对所述纠正上文进行分词,并从所述纠正上文对应的分词结果中获取位于后部的至少一个词汇,作为目标词汇序列;
步骤S32、根据所述目标词汇序列查询N元关系,将与所述目标词汇序列具有连接关系的词汇作为所述纠正上文对应的第一联想候选项。
本发明实施例中,所述N元关系可以包括二元和二元以上的关系数据。二元关系,又称2-gram,用于表示两个词汇相继出现的概率;二元以上的关系则用于表示两个以上词汇相继出现的概率。
在本发明的一种应用示例中,二元关系的例子可以包括:“中国|北京”、“中国|上海”、“中国|河北”等,也即,词汇“中国”和词汇“北京”具有二元关系,词汇“中国”和词汇“上海”具有二元关系,词汇“中国”和词汇“河北”具有二元关系等。三元关系的例子可以包括:“海边|抓|螃蟹”等。
在实际应用中,可以从所述纠正上文对应的分词结果中获取位于后部的至少一个词汇,作为目标词汇序列。其中,该目标词汇序列所包含词汇的数量可以小于等于上述纠正上文所包含词汇的数量。
并且,在根据所述目标词汇序列查询N元关系的过程中,可以将所述目标词汇序列所包含的各词汇作为一个元,查询N元关系。可选地,该目标词汇可以包括N-1个词汇,则可以将该N-1个词汇中的每一个作为一个元,查询N元关系。
其中,N=2时,该目标词汇可以作为左元进行二元关系的查询。当纠正上文为“我在中国”时,对该纠正上文“我在中国”进行分词,得到“我/在/中国”,然后根据“中国”查询二元关系,即可得到“北京”“上海”“河北”等第一联想候选项。
其中,N=3时,该目标词汇可以作为左元和中元进行三元关系的查询。当纠正上文为“我在中国”时,对该纠正上文“我在中国”进行分词,得到“我/在/中国”,然后根据“在”和“中国”查询三元关系,即可得到“北京”“上海”“河北”等第一联想候选项。
其中,N=4时,该目标词汇可以作为左元和中元进行四元关系的查询。当纠正上文为“我在中国”时,对该纠正上文“我在中国”进行分词,得到“我/在/中国”,然后根据“我”、“在”和“中国”查询四元关系,即可得到“北京”“上海”“河北”等第一联想候选项。
方案三
方案三可以通过查询预置映射关系获取纠正上文对应的第一联想候选项。具体地,所述获取所述纠正上文对应的第一联想候选项,可以包括如下步骤:
步骤S31、根据所述纠正上文查询预置映射关系,以得到与所述纠正上文对应的预置联想候选项;其中,所述预置映射关系用于存储预置上文与预置联想候选项之间的映射关系;
步骤S32、将所述预置联想候选项作为所述纠正上文对应的第一联想候选项。
在本发明实施例中,所述预置映射关系可以为根据预先收集的语料得到的预置上文与预置联想候选项之间的映射关系。其中,所述预置上文可以包括根据收集的语料统计得到的问题语句,例如,“你吃饭了吗”、“你结婚了吗”等;所述预置联想候选项可以包括与预置上文相匹配的答复语句,例如,“已经吃过了”、“还没吃呢”、“已经结婚了”、“还没结婚呢”等。
在本发明的一种应用示例中,假设用户接收到的通信内容为“你结果了吗”,通过对该原始上文纠错得到纠正上文“你结婚了吗”,根据纠正上文“你结婚了吗”查询预置映射关系,查询得到与预置上文“你结婚了吗”对应的预置联想候选项包括“已经结婚了”、“还没结婚呢”等,则可以将“已经结婚了”、“还没结婚呢”等作为纠正上文“你结婚了吗”的第一联想候选项。
可选地,上述语料可以为输入法程序记录的至少一个用户的历史输入行为数据、或者为互联网语料,可以理解,本发明实施例对于具体的语料不加以限制。
在本发明的一些实施例中,所述预置上文和预置联想候选项还可以为相对应的词汇,例如,预置上文为“去海边”,则预置联想候选项包括“度假”、“游泳”等。本发明实施例对于预置上文和预置联想候选项的具体形式和内容不加以限制。其中,可由用户或者输入法程序预先设置上述预置上文和预置联想候选项,以满足用户对于预置上文和预置联想候选项的个性化需求。
进一步地,还可以将问答对语料作为训练集,基于LSTM(Long Short-TermMemory,时间递归神经网络)等深度学习方法训练得到联想模型,将所述纠正上文输入联想模型,将所述联想模型输出的结果作为所述纠正上文对应的第一联想候选项;其中,所述联想模型可以为根据问答对语料训练得到的学习模型。其中,问答对语料可以包括:问题及问题答案的配对,例如,问答对语料的例子可以包括:问题“你结婚了吗”、以及问题答案“没呢”,或者问题“我们去吃西餐还是中餐”、以及问题答案“中餐”等。上述基于深度学习方法对问答对语料进行训练,可以通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示,这样,可以使训练得到的联想模型具备问题的答复能力(也即问题答案的获取能力)。
步骤103、展示所述第一联想候选项。
在对原始上文进行纠错处理得到对应的纠正上文,并且获取纠正上文对应的第一联想候选项之后,可以向用户展示所述第一联想候选项。例如,用户接收到的原始上文为“你结果了吗”,通过对该原始上文纠错得到纠正上文“你结婚了吗”,并且获取纠正上文“你结婚了吗”对应的第一联想候选项包括“已经结婚了”、“还没结婚呢”等,则可以向用户展示“已经结婚了”、“还没结婚呢”等第一联想候选项。
在本发明的一种可选实施例中,上述展示所述第一联想候选项的过程可以包括:展示所述原始上文到所述纠正上文和所述第一联想候选项的映射;这样,可以使用户明确第一联想候选项是在完成纠错的情况下的联想结果,若用户对第一联想候选项满意,则可以通过上屏操作,将原始上文替换为所述纠正上文和所述第一联想候选项。例如,在用户误将“北京搜狗有限”输入为“北京搜狗悠闲”的情况下,输入法程序针对“北京搜狗悠闲”得到的联想结果可以包括:“悠闲—>有限公司”,可选地,可以将“悠闲”和“有限”进行标记(例如进行字体标红、加粗等),以表明二者之间的纠错关系,其中,“—>”为映射符号。可选地,上述映射中的原始上文可以为原始上文的全部或者部分(例如错误文本),上述映射中的纠正上文可以为纠正上文中的全部或者部分。
综上,本发明实施例的输入方法,可以对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文,获取所述纠正上文对应的第一联想候选项,并展示所述第一联想候选项;本发明实施例可以在原始上文存在错误的情况下,向用户提供纠正上文对应的第一联想候选项,这样,在发生输入错误的情况下,不仅可以节省用户退格删除错误的原始上文并且重新输入的操作成本,而且还可以提供正确的联想结果,因此能够提高输入效率,且能够提升用户的使用体验。
并且,本发明实施例的原始上文可以包括:接收到的通信内容,例如,可以在通讯环境(如短信应用、即时通讯应用等环境)下接收通信对端发送的通信内容,这样,在该通信内容存在错误的情况下,本发明实施例可以对该通信内容进行纠错处理并联想,因此能够提高联想结果的准确率。
方法实施例二
相对于图1所示方法实施例一,本发明实施例还可以获取所述原始上文对应的第二联想候选项,并且对原始上文对应的第二联想候选项以及纠正上文对应的第一联想候选项进行排序展示,以使用户可以从展示的内容中选择正确的联想结果。参照图2,示出了本发明的一种输入方法实施例二的步骤流程图,具体可以包括:
步骤201、对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文;
步骤202、获取所述纠正上文对应的第一联想候选项;
步骤203、获取所述原始上文对应的第二联想候选项;
对于获取原始上文对应的第二联想候选项的过程而言,由于其与获取纠正上文对应的第一联想候选项的过程类似,故在此不作赘述,相互参照即可。例如,可以在将三种方案中的纠正上文替换为原始上文的情况下,采用前述获取纠正上文对应的第一联想候选项的三种方案中的任一,获取所述原始上文对应的第二联想候选项。
需要说明的是,本发明实施例对于获取原始上文对应的第二联想候选项和获取纠正上文对应的第一联想候选项的先后顺序不加以限制,也即,本发明实施例对于步骤201至步骤202与步骤203之间的执行顺序不加以限制。
步骤204、对所述第一联想候选项和所述第二联想候选项进行排序并展示。
在本发明的一种可选实施例中,所述对所述第一联想候选项和所述第二联想候选项进行排序并展示,具体可以包括如下:
步骤S31、根据所述原始上文的语言模型得分、所述第二联想候选项的词频、以及所述第二联想候选项在所述原始上文条件下的语言模型得分,确定所述第二联想候选项的综合得分;
具体地,所述第二联想候选项的综合得分PA可以通过如下公式得到:
PA=x1×PA1+x2×PA2+x3×PA3 (1)
其中,PA1为原始上文的语言模型得分,PA2为第二联想候选项的词频,PA3为第二联想候选项在原始上文条件下的语言模型得分,x1、x2、x3为权重系数,可以分别表示所述原始上文的语言模型得分、所述第二联想候选项的词频、以及所述第二联想候选项在所述原始上文条件下的语言模型得分在所述第二联想候选项的综合得分中的权重,在具体应用中,可设定x1+x2+x3=1。
步骤S32、根据所述纠正上文的语言模型得分、所述第一联想候选项的词频、以及所述第一联想候选项在所述纠正上文条件下的语言模型得分,确定所述第一联想候选项的综合得分;
具体地,所述第一联想候选项的综合得分PB可以通过如下公式得到:
PB=x’1×PB1+x’2×PB2+x’3×PB3 (2)
其中,PB1为纠正上文的语言模型得分,PB2为第一联想候选项的词频,PB3为第一联想候选项在纠正上文条件下的语言模型得分,x’1、x’2、x’3是系数,可以分别表示所述纠正上文的语言模型得分、所述第一联想候选项的词频、以及所述第一联想候选项在所述纠正上文条件下的语言模型得分在所述第一联想候选项的综合得分中的权重,在具体应用中,可设定x1+x2+x3=1。
在本发明的一种可选实施例中,所述方法还可以包括:
调整所述原始上文的语言模型得分、所述第二联想候选项的词频、以及所述第二联想候选项在所述原始上文条件下的语言模型得分在所述第二联想候选项的综合得分中的权重;和/或
调整所述纠正上文的语言模型得分、所述第一联想候选项的词频、以及所述第一联想候选项在所述纠正上文条件下的语言模型得分在所述第一联想候选项的综合得分中的权重。
在本发明实施例中,对于上述公式(1)和公式(2)中的权重系数x1、x2、x3、x’1、x’2、x’3,可以通过用户的反馈行为对上述权重系数进行不断地优化调整,例如,在用户对于第一联想候选项的点击率大于用户对于第二联想候选项的点击率的情况下,可以调高x’1、x’2、x’3,反之,在用户对于第一联想候选项的点击率小于用户对于第二联想候选项的点击率的情况下,可以调低x’1、x’2、x’3等等。或者根据实际需求进行设置,本发明实施例对于x1、x2、x3、x’1、x’2、x’3对应的具体数值不加以限制。
步骤S33、根据所述第一联想候选项的综合得分和所述第二联想候选项的综合得分,对所述第一联想候选项和所述第二联想候选项进行排序并展示。
应用示例一
本应用示例以原始上文为接收到的通信内容为例,假设用户在即时通信应用中接收到对端发送的即时消息为“你结果了吗”,则原始上文为“你结果了吗”,本发明实施例的输入方法具体可以包括:
步骤A1、获取原始上文“你结果了吗”对应的第二联想候选项;
例如,通过查询N元关系中的二元、三元或者多元关系,或者通过联想模型获取原始上文“你结果了吗”对应的第二联想候选项。例如,获取原始上文“你结果了吗”对应的第二联想候选列表L2,L2中的第二联想候选项包括“已经结果了”,“没结果”等。
步骤A2、对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文;
例如,对原始上文“你结果了吗”进行分词处理,得到所述原始上文对应的分词结果“你/结果/了/吗”,对分词结果“你/结果/了/吗”进行语言模型打分,可以得知原始上文“你结果了吗”中存在错误,并且得到纠错后的纠正上文为“你结婚了吗”。
步骤A3、获取所述纠正上文对应的第一联想候选项;
具体地,通过查询N元关系中的二元、三元或者多元关系,或者通过联想模型获取纠正上文“你结婚了吗”对应的第一联想候选项。例如,获取纠正上文对应的第一联想候选列表L1,L1中的第一联想候选项包括“已经结婚了”、“结婚了”、“没结婚呢”等。
步骤A4、分别获取所述第一联想候选项和所述第二联想候选项的综合得分;
具体地,合并第一联想候选列表L1和第二联想候选列表L2,并且对其中的第一联想候选项和第二联想候选项按照上述公式(1)和公式(2)进行打分排序。
例如对第一联想候选项“结婚了”确定的第一综合得分为:
x1×P(你/结婚/了/吗)+x2×P(结婚了)+x3×P(结婚了|你/结婚/了/吗);
其中,P(你/结婚/了/吗)为纠正上文“你结婚了吗”的语言模型得分,具体实现中可以是二元语言模型得分,也可是三元、四元等多元语言模型得分;P(结婚了)为第一联想候选项“结婚了”的词频,P(结婚了|你/结婚/了/吗)为第一联想候选项“结婚了”在纠正上文“你结婚了吗”条件下的语言模型得分,P(C|D)表示在D条件下C的概率。
对于第一联想候选列表L1和第二联想候选列表L2中的所有第一联想候选项和第二联想候选项,可以按照上述方法确定对应的综合得分。
步骤A5、根据各第一联想候选项和第二联想候选项的综合得分进行排序,并且按照综合得分的高低进行展示。
具体地,假设按照综合得分的高低向用户展示“没结婚”、“已经结婚了”、“没结果”、“已经结果了”等候选项供用户进行选择。
应用示例二
应用示例二以原始上文为用户输入的上文为例,假设原始上文为“身体是个毛的”,则本发明实施例的输入方法可以包括:
步骤B1、获取原始上文“身体是个毛的”对应的第二联想候选项;
例如,通过查询N元关系中的二元、三元或者多元关系,或者通过联想模型获取原始上文对应的第二联想候选项。例如,获取原始上文对应的第二联想候选列表L2,L2中的第二联想候选项包括“意思”、“意义”等。
步骤B2、对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文;
例如,对原始上文“身体是个毛的”进行分词处理,得到所述原始上文对应的分词结果“身体/是/个/毛/的”;通过语言模型计算得知分词“个”和分词“毛”对应的语言模型得分小于预设阈值,则可以确定原始上文“身体是个毛的”中存在错误文本。查找得到与所述错误文本“个毛”的拼音串“ge’mao”相似的拼音串包括“ge’ming”,则对应的纠错候选包括“革命”,并且“身体是革命的”的语言模型得分高于“身体是个毛的”的语言模型得分,则可以将“身体是个毛的”中的错误文本“个毛”替换为“革命”,得到纠正上文“身体是革命的”。
步骤B3、获取所述纠正上文对应的第一联想候选项;
例如,通过查询N元关系中的二元、三元或者多元关系,或者通过联想模型获取纠正上文“身体是革命的”对应的第一联想候选项。例如,获取纠正上文对应的第一联想候选列表L1,L1中的第一联想候选项包括“本钱”、“基础”、“前提”等。
步骤B4、分别获取所述第一联想候选项和所述第二联想候选项的综合得分;
例如,合并第一联想候选列表L1和第二联想候选列表L2,并且对其中的第一联想候选项和第二联想候选项按照上述公式(1)和公式(2)进行打分排序。
例如对第一候选项“本钱”确定综合得分为:
x1×P(身体/是/革命/的)+x2×P(本钱)+x3×P(本钱|身体/是/革命/的);
其中,P(身体/是/革命/的)为纠正上文“身体是革命的”的语言模型得分,具体实现中可以是二元语言模型得分,也可是三元、四元等多元语言模型得分;P(本钱)为第一联想候选项“本钱”的词频,P(本钱|身体/是/革命/的)为第一联想候选项“本钱”在纠正上文“身体是革命的”条件下的语言模型得分。
对于第一联想候选列表L1和第二联想候选列表L2中的所有第一联想候选项和第二联想候选项按照上述方法确定对应的综合得分。
步骤B5、根据各第一联想候选项和第二联想候选项的综合得分进行排序,并且按照综合得分的高低进行展示。
综上,本发明实施例在对用户的原始上文进行联想之前,先对原始上文进行纠错处理,以获取纠正文本对应的第一联想候选项,可以解决原始上文出现错误时导致联想结果偏离用户意图的问题。此外,本发明实施例还获取原始上文对应的第二联想候选项,并且对原始上文对应的第二联想候选项以及纠正上文对应的第一联想候选项进行排序展示,可以防止出现对原始上文进行了误纠错的情况,使得用户可以选择正确的联想结果,进一步提高联想的准确率。
装置实施例
参照图3,示出了本发明的一种输入装置实施例的结构框图,具体可以包括:
纠错模块301,用于对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文;所述原始上文可以包括:接收到的通信内容;
第一联想获取模块302,用于获取所述纠正上文对应的第一联想候选项;以及
第一联想展示模块303,用于展示所述第一联想候选项。
可选地,所述第一联想获取模块302可以包括:
第一分词子模块,用于对所述纠正上文进行分词,并从所述纠正上文对应的分词结果中获取位于后部的至少一个词汇,作为目标词汇序列;
第一查询子模块,用于根据所述目标词汇序列查询N元关系,将与所述目标词汇序列具有连接关系的词汇作为所述纠正上文对应的第一联想候选项。
可选地,所述第一联想获取模块302可以包括:
第二查询子模块,用于根据所述纠正上文查询预置映射关系,以得到与所述纠正上文对应的预置联想候选项;其中,所述预置映射关系用于存储预置上文与预置联想候选项之间的映射关系;
确定子模块,用于将所述预置联想候选项作为所述纠正上文对应的第一联想候选项。
可选地,所述第一联想获取模块302可以包括:
模型获取子模块,用于将所述纠正上文输入联想模型,将所述联想模型输出的结果作为所述纠正上文对应的第一联想候选项。
可选地,所述纠错模块301可以包括:
第二分词子模块,用于对原始上文进行分词处理,以得到所述原始上文对应的分词结果;
错误确定子模块,用于若所述分词结果符合预置条件,则确定所述原始上文中存在错误;
纠错子模块,用于对所述原始上文进行纠错处理,得到所述原始上文对应的纠正上文。
可选地,所述装置还可以包括:
第二联想获取模块,用于获取所述原始上文对应的第二联想候选项;
排序展示模块,用于对所述第一联想候选项和所述第二联想候选项进行排序并展示。
可选地,所述排序展示模块可以包括:
第一得分确定子模块,用于根据所述原始上文的语言模型得分、所述第二联想候选项的词频、以及所述第二联想候选项在所述原始上文条件下的语言模型得分,确定所述第二联想候选项的综合得分;
第二得分确定子模块,用于根据所述纠正上文的语言模型得分、所述第一联想候选项的词频、以及所述第一联想候选项在所述纠正上文条件下的语言模型得分,确定所述第一联想候选项的综合得分;
排序展示子模块,用于根据所述第一联想候选项的综合得分和所述第二联想候选项的综合得分,对所述第一联想候选项和所述第二联想候选项进行排序并展示。
可选地,所述装置还可以包括:
第一调整模块,用于调整所述原始上文的语言模型得分、所述第二联想候选项的词频、以及所述第二联想候选项在所述原始上文条件下的语言模型得分在所述第二联想候选项的综合得分中的权重;和/或
第二调整模块,用于调整所述纠正上文的语言模型得分、所述第一联想候选项的词频、以及所述第一联想候选项在所述纠正上文条件下的语言模型得分在所述第一联想候选项的综合得分中的权重。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例还提供了一种用于输入的装置,该装置可以包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文;所述原始上文包括:接收到的通信内容;获取所述纠正上文对应的第一联想候选项;展示所述第一联想候选项。
图4是根据一示例性实施例示出的一种用于输入的装置800作为终端时的框图。例如,装置800可以是智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture Experts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving Picture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备、移动电话、数字广播终端、消息收发设备、游戏控制台、医疗设备、健身设备、个人数字助理等。
参照图4,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图5是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种机器可读介质,例如该机器可读介质可以为非临时性计算机可读存储介质,当所述介质中的指令由装置(终端或者服务器)的处理器执行时,使得装置能够执行一种输入方法,所述方法包括:对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文;所述原始上文包括:接收到的通信内容;获取所述纠正上文对应的第一联想候选项;展示所述第一联想候选项。
可选地,所述获取所述纠正上文对应的第一联想候选项,包括:对所述纠正上文进行分词,并从所述纠正上文对应的分词结果中获取位于后部的至少一个词汇,作为目标词汇序列;根据所述目标词汇序列查询N元关系,将与所述目标词汇序列具有连接关系的词汇作为所述纠正上文对应的第一联想候选项。
可选地,所述获取所述纠正上文对应的第一联想候选项,包括:根据所述纠正上文查询预置映射关系,以得到与所述纠正上文对应的预置联想候选项;其中,所述预置映射关系用于存储预置上文与预置联想候选项之间的映射关系;将所述预置联想候选项作为所述纠正上文对应的第一联想候选项。
可选地,所述获取所述纠正上文对应的第一联想候选项,包括:将所述纠正上文输入联想模型,将所述联想模型输出的结果作为所述纠正上文对应的第一联想候选项。
可选地,所述对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文,包括:对原始上文进行分词处理,以得到所述原始上文对应的分词结果;若所述分词结果符合预置条件,则确定所述原始上文中存在错误;对所述原始上文进行纠错处理,得到所述原始上文对应的纠正上文。
可选地,所述方法还包括:获取所述原始上文对应的第二联想候选项;对所述第一联想候选项和所述第二联想候选项进行排序并展示。
可选地,所述对所述第一联想候选项和所述第二联想候选项进行排序并展示,包括:根据所述原始上文的语言模型得分、所述第二联想候选项的词频、以及所述第二联想候选项在所述原始上文条件下的语言模型得分,确定所述第二联想候选项的综合得分;根据所述纠正上文的语言模型得分、所述第一联想候选项的词频、以及所述第一联想候选项在所述纠正上文条件下的语言模型得分,确定所述第一联想候选项的综合得分;根据所述第一联想候选项的综合得分和所述第二联想候选项的综合得分,对所述第一联想候选项和所述第二联想候选项进行排序并展示。
可选地,所述方法还包括:调整所述原始上文的语言模型得分、所述第二联想候选项的词频、以及所述第二联想候选项在所述原始上文条件下的语言模型得分在所述第二联想候选项的综合得分中的权重;和/或调整所述纠正上文的语言模型得分、所述第一联想候选项的词频、以及所述第一联想候选项在所述纠正上文条件下的语言模型得分在所述第一联想候选项的综合得分中的权重。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种输入方法、一种输入装置和一种用于输入的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (11)
1.一种输入方法,其特征在于,所述方法包括:
对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文;所述原始上文包括:接收到的通信内容;
获取所述纠正上文对应的第一联想候选项;
展示所述第一联想候选项。
2.根据权利要求1所述的方法,其特征在于,所述获取所述纠正上文对应的第一联想候选项,包括:
对所述纠正上文进行分词,并从所述纠正上文对应的分词结果中获取位于后部的至少一个词汇,作为目标词汇序列;
根据所述目标词汇序列查询N元关系,将与所述目标词汇序列具有连接关系的词汇作为所述纠正上文对应的第一联想候选项。
3.根据权利要求1所述的方法,其特征在于,所述获取所述纠正上文对应的第一联想候选项,包括:
根据所述纠正上文查询预置映射关系,以得到与所述纠正上文对应的预置联想候选项;其中,所述预置映射关系用于存储预置上文与预置联想候选项之间的映射关系;
将所述预置联想候选项作为所述纠正上文对应的第一联想候选项。
4.根据权利要求1所述的方法,其特征在于,所述获取所述纠正上文对应的第一联想候选项,包括:
将所述纠正上文输入联想模型,将所述联想模型输出的结果作为所述纠正上文对应的第一联想候选项。
5.根据权利要求1所述的方法,其特征在于,所述对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文,包括:
对原始上文进行分词处理,以得到所述原始上文对应的分词结果;
若所述分词结果符合预置条件,则确定所述原始上文中存在错误;
对所述原始上文进行纠错处理,得到所述原始上文对应的纠正上文。
6.根据权利要求1至5中任一所述的方法,其特征在于,所述方法还包括:
获取所述原始上文对应的第二联想候选项;
对所述第一联想候选项和所述第二联想候选项进行排序并展示。
7.根据权利要求6所述的方法,其特征在于,所述对所述第一联想候选项和所述第二联想候选项进行排序并展示,包括:
根据所述原始上文的语言模型得分、所述第二联想候选项的词频、以及所述第二联想候选项在所述原始上文条件下的语言模型得分,确定所述第二联想候选项的综合得分;
根据所述纠正上文的语言模型得分、所述第一联想候选项的词频、以及所述第一联想候选项在所述纠正上文条件下的语言模型得分,确定所述第一联想候选项的综合得分;
根据所述第一联想候选项的综合得分和所述第二联想候选项的综合得分,对所述第一联想候选项和所述第二联想候选项进行排序并展示。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
调整所述原始上文的语言模型得分、所述第二联想候选项的词频、以及所述第二联想候选项在所述原始上文条件下的语言模型得分在所述第二联想候选项的综合得分中的权重;和/或
调整所述纠正上文的语言模型得分、所述第一联想候选项的词频、以及所述第一联想候选项在所述纠正上文条件下的语言模型得分在所述第一联想候选项的综合得分中的权重。
9.一种输入装置,其特征在于,包括:
纠错模块,用于对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文;所述原始上文包括:接收到的通信内容;
第一联想获取模块,用于获取所述纠正上文对应的第一联想候选项;以及
第一联想展示模块,用于展示所述第一联想候选项。
10.一种用于输入的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
对原始上文进行纠错处理,以得到所述原始上文对应的纠正上文;所述原始上文包括:接收到的通信内容;
获取所述纠正上文对应的第一联想候选项;
展示所述第一联想候选项。
11.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至8中一个或多个所述的输入方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710295616.XA CN108803890B (zh) | 2017-04-28 | 2017-04-28 | 一种输入方法、输入装置和用于输入的装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710295616.XA CN108803890B (zh) | 2017-04-28 | 2017-04-28 | 一种输入方法、输入装置和用于输入的装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108803890A true CN108803890A (zh) | 2018-11-13 |
CN108803890B CN108803890B (zh) | 2024-02-06 |
Family
ID=64070650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710295616.XA Active CN108803890B (zh) | 2017-04-28 | 2017-04-28 | 一种输入方法、输入装置和用于输入的装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108803890B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543022A (zh) * | 2018-12-17 | 2019-03-29 | 北京百度网讯科技有限公司 | 文本纠错方法和装置 |
CN109582768A (zh) * | 2018-11-23 | 2019-04-05 | 北京搜狗科技发展有限公司 | 一种文本输入方法和装置 |
CN110262672A (zh) * | 2019-06-18 | 2019-09-20 | 北京字节跳动网络技术有限公司 | 建议候选列表生成方法及装置 |
CN111522448A (zh) * | 2019-02-02 | 2020-08-11 | 北京搜狗科技发展有限公司 | 一种提供输入候选项的方法、装置和设备 |
CN112306253A (zh) * | 2019-07-30 | 2021-02-02 | 北京搜狗科技发展有限公司 | 一种确定输入对象的方法、装置及设备 |
CN113589950A (zh) * | 2020-04-30 | 2021-11-02 | 北京搜狗科技发展有限公司 | 输入方法、装置和用于输入的装置 |
CN113589945A (zh) * | 2020-04-30 | 2021-11-02 | 北京搜狗科技发展有限公司 | 输入方法、装置和用于输入的装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1387639A (zh) * | 1999-11-05 | 2002-12-25 | 微软公司 | 语言输入用户界面 |
CN1466367A (zh) * | 2002-07-03 | 2004-01-07 | 中国科学院计算技术研究所 | 通用的移动人知交互系统及方法 |
CN101013443A (zh) * | 2007-02-13 | 2007-08-08 | 北京搜狗科技发展有限公司 | 一种智能组词输入的方法和一种输入法系统及其更新方法 |
CN101291302A (zh) * | 2008-05-27 | 2008-10-22 | 北京搜狗科技发展有限公司 | 一种利用输入法进行即时通讯的方法和一种输入法系统 |
CN101634927A (zh) * | 2008-12-04 | 2010-01-27 | 北京搜狗科技发展有限公司 | 一种字符输入过程中展现候选项的方法及装置 |
CN102163234A (zh) * | 2011-04-19 | 2011-08-24 | 北京百度网讯科技有限公司 | 一种基于纠错相关度对查询序列进行纠错的设备和方法 |
CN102231147A (zh) * | 2010-11-08 | 2011-11-02 | 百度在线网络技术(北京)有限公司 | 一种用于实时展现联想词的方法、设备及系统 |
CN102646022A (zh) * | 2012-04-10 | 2012-08-22 | 北京搜狗科技发展有限公司 | 一种获取候选项的方法和装置 |
CN104615591A (zh) * | 2015-03-10 | 2015-05-13 | 上海触乐信息科技有限公司 | 基于上下文的前向输入纠错方法和装置 |
CN104915264A (zh) * | 2015-05-29 | 2015-09-16 | 北京搜狗科技发展有限公司 | 一种输入纠错方法和装置 |
CN106021403A (zh) * | 2016-05-12 | 2016-10-12 | 北京奔影网络科技有限公司 | 客服方法及装置 |
CN106528616A (zh) * | 2016-09-30 | 2017-03-22 | 厦门快商通科技股份有限公司 | 一种人机交互过程中的语言纠错方法及系统 |
-
2017
- 2017-04-28 CN CN201710295616.XA patent/CN108803890B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1387639A (zh) * | 1999-11-05 | 2002-12-25 | 微软公司 | 语言输入用户界面 |
CN1466367A (zh) * | 2002-07-03 | 2004-01-07 | 中国科学院计算技术研究所 | 通用的移动人知交互系统及方法 |
CN101013443A (zh) * | 2007-02-13 | 2007-08-08 | 北京搜狗科技发展有限公司 | 一种智能组词输入的方法和一种输入法系统及其更新方法 |
CN101291302A (zh) * | 2008-05-27 | 2008-10-22 | 北京搜狗科技发展有限公司 | 一种利用输入法进行即时通讯的方法和一种输入法系统 |
CN101634927A (zh) * | 2008-12-04 | 2010-01-27 | 北京搜狗科技发展有限公司 | 一种字符输入过程中展现候选项的方法及装置 |
CN102231147A (zh) * | 2010-11-08 | 2011-11-02 | 百度在线网络技术(北京)有限公司 | 一种用于实时展现联想词的方法、设备及系统 |
CN102163234A (zh) * | 2011-04-19 | 2011-08-24 | 北京百度网讯科技有限公司 | 一种基于纠错相关度对查询序列进行纠错的设备和方法 |
CN102646022A (zh) * | 2012-04-10 | 2012-08-22 | 北京搜狗科技发展有限公司 | 一种获取候选项的方法和装置 |
CN104615591A (zh) * | 2015-03-10 | 2015-05-13 | 上海触乐信息科技有限公司 | 基于上下文的前向输入纠错方法和装置 |
CN104915264A (zh) * | 2015-05-29 | 2015-09-16 | 北京搜狗科技发展有限公司 | 一种输入纠错方法和装置 |
CN106021403A (zh) * | 2016-05-12 | 2016-10-12 | 北京奔影网络科技有限公司 | 客服方法及装置 |
CN106528616A (zh) * | 2016-09-30 | 2017-03-22 | 厦门快商通科技股份有限公司 | 一种人机交互过程中的语言纠错方法及系统 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109582768A (zh) * | 2018-11-23 | 2019-04-05 | 北京搜狗科技发展有限公司 | 一种文本输入方法和装置 |
CN109582768B (zh) * | 2018-11-23 | 2021-08-24 | 北京搜狗科技发展有限公司 | 一种文本输入方法和装置 |
CN109543022A (zh) * | 2018-12-17 | 2019-03-29 | 北京百度网讯科技有限公司 | 文本纠错方法和装置 |
US11080492B2 (en) | 2018-12-17 | 2021-08-03 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and device for correcting error in text |
CN111522448A (zh) * | 2019-02-02 | 2020-08-11 | 北京搜狗科技发展有限公司 | 一种提供输入候选项的方法、装置和设备 |
CN111522448B (zh) * | 2019-02-02 | 2024-04-30 | 北京搜狗科技发展有限公司 | 一种提供输入候选项的方法、装置和设备 |
CN110262672A (zh) * | 2019-06-18 | 2019-09-20 | 北京字节跳动网络技术有限公司 | 建议候选列表生成方法及装置 |
CN110262672B (zh) * | 2019-06-18 | 2023-08-08 | 抖音视界有限公司 | 建议候选列表生成方法及装置 |
CN112306253A (zh) * | 2019-07-30 | 2021-02-02 | 北京搜狗科技发展有限公司 | 一种确定输入对象的方法、装置及设备 |
CN113589950A (zh) * | 2020-04-30 | 2021-11-02 | 北京搜狗科技发展有限公司 | 输入方法、装置和用于输入的装置 |
CN113589945A (zh) * | 2020-04-30 | 2021-11-02 | 北京搜狗科技发展有限公司 | 输入方法、装置和用于输入的装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108803890B (zh) | 2024-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107436691B (zh) | 一种输入法进行纠错的方法、客户端、服务器及装置 | |
CN108803890A (zh) | 一种输入方法、输入装置和用于输入的装置 | |
US20170344224A1 (en) | Suggesting emojis to users for insertion into text-based messages | |
CN107102746B (zh) | 候选词生成方法、装置以及用于候选词生成的装置 | |
WO2021128880A1 (zh) | 一种语音识别方法、装置和用于语音识别的装置 | |
CN109522419B (zh) | 会话信息补全方法及装置 | |
CN107145571B (zh) | 一种搜索方法及装置 | |
CN108008832A (zh) | 一种输入方法和装置、一种用于输入的装置 | |
CN107544684B (zh) | 一种候选词显示方法及装置 | |
CN107844199B (zh) | 一种输入方法、系统和用于输入的装置 | |
CN107291690A (zh) | 标点添加方法和装置、用于标点添加的装置 | |
CN107092424B (zh) | 一种纠错项的显示方法、装置和用于纠错项的显示的装置 | |
CN108121736A (zh) | 一种主题词确定模型的建立方法、装置及电子设备 | |
CN107093423A (zh) | 一种语音输入修正方法、装置及计算机可读存储介质 | |
CN108345612B (zh) | 一种问题处理方法和装置、一种用于问题处理的装置 | |
CN109002183B (zh) | 一种信息输入的方法及装置 | |
US10073828B2 (en) | Updating language databases using crowd-sourced input | |
CN109101505A (zh) | 一种推荐方法、推荐装置和用于推荐的装置 | |
CN107918496A (zh) | 一种输入纠错方法和装置、一种用于输入纠错的装置 | |
CN108073293B (zh) | 一种目标词组的确定方法和装置 | |
CN107424612B (zh) | 处理方法、装置和机器可读介质 | |
CN107797676B (zh) | 一种单字输入方法及装置 | |
CN110110204A (zh) | 一种信息推荐方法、装置和用于信息推荐的装置 | |
CN110858099B (zh) | 候选词生成方法及装置 | |
CN107422872A (zh) | 一种输入方法、装置和用于输入的装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |