CN115437509A - 请求处理方法、装置和介质 - Google Patents
请求处理方法、装置和介质 Download PDFInfo
- Publication number
- CN115437509A CN115437509A CN202110609038.9A CN202110609038A CN115437509A CN 115437509 A CN115437509 A CN 115437509A CN 202110609038 A CN202110609038 A CN 202110609038A CN 115437509 A CN115437509 A CN 115437509A
- Authority
- CN
- China
- Prior art keywords
- candidate
- type
- association
- local
- generalization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 75
- 238000000034 method Methods 0.000 claims abstract description 44
- 230000015654 memory Effects 0.000 claims description 20
- 230000004927 fusion Effects 0.000 claims description 12
- 238000004891 communication Methods 0.000 description 19
- 238000013507 mapping Methods 0.000 description 10
- 241000282320 Panthera leo Species 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 241000252229 Carassius auratus Species 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 230000005291 magnetic effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 229910052573 porcelain Inorganic materials 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
- G06F3/0237—Character input methods using prediction or retrieval techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Probability & Statistics with Applications (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Machine Translation (AREA)
Abstract
本发明实施例提供了一种请求处理方法、装置和介质。其中的方法具体包括:确定输入串对应的字词候选,和/或,确定上文和输入串对应的本地联想候选;根据所述字词候选命中的泛化标签的类型,和/或,根据所述本地联想候选命中的泛化标签的类型,和/或,根据所述本地联想候选的概率信息,判断是否发送云联想请求。本发明实施例可以提升云联想请求处理的准确率。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种请求处理方法、装置和介质。
背景技术
输入法程序可以针对用户输入的上文和输入串,提供对应的候选。该候选不仅包括:针对输入串进行转换得到的字词候选,而且包括:针对字词候选联想得到的联想候选;该联想候选可以包括:本地联想候选和/或云联想候选。
目前,通常认为在输入串对应字词候选的质量较高的情况下,客户端提供的本地联想候选能够满足用户需求。因此,客户端通常在输入串对应字词候选的质量较低的情况下,才会向云端发送云联想请求。
发明人在实施本发明实施例的过程中发现,在输入串对应字词候选的质量较高的情况下,客户端提供的本地候选可能不满足用户需求。例如,用户输入“这是+zhoujielun”,通常为了输入某人的具体作品,但目前的客户端通常仅仅能够提供“周杰伦的歌”等本地候选,该本地候选并不能满足用户对于具体作品的输入需求。
发明内容
本发明实施例提供一种请求处理方法、装置和介质,如何提升云联想请求处理的准确率是本领域技术人员需要解决的技术问题。
为了解决上述问题,本发明实施例公开了一种请求处理方法,包括:
确定输入串对应的字词候选,和/或,确定上文和输入串对应的本地联想候选;
根据所述字词候选命中的泛化标签的类型,和/或,根据所述本地联想候选命中的泛化标签的类型,和/或,根据所述本地联想候选的概率信息,判断是否发送云联想请求。
另一方面,本发明实施例公开了一种请求处理装置,包括:
待定稿后完善。
再一方面,本发明实施例公开了一种用于处理请求的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,所述程序被一个或者一个以上处理器执行时,实现前述方法的步骤。
又一方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的请求处理方法。
本发明实施例包括以下优点:
本发明实施例根据该字词候选命中的泛化标签的类型,判断是否发送云联想请求,可以根据该字词候选是否涉及话题,判断是否发送云联想请求,能够提升云联想请求处理的准确率。例如,在该字词候选涉及话题的情况下,可以借助于服务端对话题的信息进行联想,故此种情况下,可以发送云联想请求。
并且,本发明实施例根据该本地联想候选命中的泛化标签的类型,判断是否发送云联想请求,可以根据该本地联想候选是否涉及话题,判断是否发送云联想请求,能够提升云联想请求处理的准确率。例如,在该本地联想候选涉及话题的情况下,可以借助于服务端对话题的信息进行联想,故此种情况下,可以发送云联想请求。
此外,本发明实施例根据该本地联想候选的概率信息,判断是否发送云联想请求。该本地联想候选的概率信息可以表征本地联想候选的准确程度,根据本地联想候选的准确程度,判断是否发送云联想请求,能够提升云联想请求处理的准确率。例如,在该本地联想候选的概率信息的准确程度较低的情况下,可以借助于服务端对话题的信息进行联想,故此种情况下,可以发送云联想请求。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种请求处理方法的应用环境的示意;
图2是本发明的一种请求处理方法实施例的步骤流程图;
图3是本发明的一种请求处理装置实施例的结构框图;
图4是本发明的一种用于处理请求的装置800的框图;及
图5是本发明的一些实施例中服务端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例可以应用于输入法的应用场景。输入法是指为了将各种文字输入计算机或其他设备(如手机、平板电脑)而采用的编码方法。输入法具体可以包括:传统输入法和云输入法。
其中,传统输入法受限于本地计算机的存储器容量和CPU能力,使用规模较小的词库和语言模型,输入准确率有限。云输入法是依托于云计算技术的输入法,凭借服务器集群强大的存储和运算能力,拥有传统输入法所不可比拟的优势:更大、更新的词库,更高级的语言模型,这些优势使得输入的准确率有了显著的提升。
输入法程序提供的联想候选可以包括:本地联想候选和/或云联想候选;本地联想候选由客户端提供,云联想候选由云端提供。
目前,客户端通常默认不发送云联想请求,在输入串对应字词候选的质量较低的情况下,才会向云端发送云联想请求。然而,在输入串对应字词候选的质量较高的情况下,客户端提供的本地候选可能不满足用户需求。例如,在用户输入“这是+zhoujielun”的情况下,客户端能够提供“周杰伦的歌”等本地候选。但用户很可能想输入“周杰伦”的具体作品,该本地候选并不能满足用户对于具体作品的输入需求。
针对如何提升云联想请求处理的准确率的技术问题,本发明实施例提供了一种请求处理方案,该方案可以包括:确定输入串对应的字词候选,和/或,确定上文和输入串对应的本地联想候选;根据该字词候选命中的泛化标签的类型,和/或,该所述本地联想候选命中的泛化标签的类型,和/或,根据该本地联想候选的概率信息,判断是否发送云联想请求。
字词候选可以表征对输入串进行转换得到的候选。例如,输入串“zhoujielun”对应的字词候选可以包括:“周杰伦”、“周杰轮”、“周结论”、“周杰”、“周姐”等。
本地联想候选可以表征在上文和字词候选的基础上联想得到的候选。例如,可以在上文“这是”和字词候选“周杰伦”的基础上得到本地联想候选“的歌”。又如,可以在上文“这是”和字词候选“周结论”的基础上得到本地联想候选“怎么写”等。本地候选可以包括:字词候选与本地联想候选的组合。
本发明实施例中,泛化可以指将具体的、个别的扩大为一般的。数据中通常包含原始概念层的细节信息,故本发明实施例的泛化标签可以将数据从较低的概念层抽象到较高的概念层,用较高层的概念来表示较低层次的概念。例如,用<地名>表示“西安”,用<人名>表示“姓名”,用<num4>或<年份>来表示“2018”,用“标点”表示“,”用“结束标识”表示文字输入的结束等等。
本发明实施例的泛化标签中可以包含深层次的语义信息。例如,传统的语言模型通常将“2018”理解为量词,而本发明实施例可以将长度为4的数字串理解为泛化标签<年份>,由此可以使泛化标签中包含深层次的语义信息。
有些类型的泛化标签可以表征话题的信息。本发明实施例根据该字词候选命中的泛化标签的类型,判断是否发送云联想请求,可以根据该字词候选是否涉及话题,判断是否发送云联想请求,能够提升云联想请求处理的准确率。例如,在该字词候选涉及话题的情况下,可以借助于服务端对话题的信息进行联想,故此种情况下,可以发送云联想请求。
本发明实施例根据该本地联想候选命中的泛化标签的类型,判断是否发送云联想请求,可以根据该本地联想候选是否涉及话题,判断是否发送云联想请求,能够提升云联想请求处理的准确率。例如,在该本地联想候选涉及话题的情况下,可以借助于服务端对话题的信息进行联想,故此种情况下,可以发送云联想请求。
本发明实施例根据该本地联想候选的概率信息,判断是否发送云联想请求。该本地联想候选的概率信息可以表征本地联想候选的准确程度,根据本地联想候选的准确程度,判断是否发送云联想请求,能够提升云联想请求处理的准确率。例如,在该本地联想候选的概率信息的准确程度较低的情况下,可以借助于服务端对话题的信息进行联想,故此种情况下,可以发送云联想请求。
本发明实施例提供的请求处理方法可应用于图1所示的应用环境中,如图1所示,客户端100与服务端200位于有线或无线网络中,通过该有线或无线网络,客户端100与服务端200进行数据交互。
可选地,客户端100可以运行在终端上,上述终端具体包括但不限于:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture ExpertsGroup Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving PictureExperts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。客户端100可以对应于网站、或者APP(应用程序,Application)。客户端100可以对应有输入法APP等应用程序。
本发明实施例的服务端可以为云服务端(云端)。云端是一种简单高效、安全可靠、处理能力可弹性伸缩的计算服务。云端的资源信息具有动态性,使得其处理能力可弹性伸缩。
本发明实施例中,候选可用于表示输入法程序提供的待被用户选择的一个或多个字符。候选可以为中文字符、英文字符、日文字符等语言的字符,候选也可以为颜文字、图片等形式的符号组合。其中,上述颜文字包括但不限于线条、符号、文字所组成的图画,例如,上述颜文字的例子可以包括:“:P”、“:-o”、“:-)”等。
联想候选可以基于上文联想得到的候选。本地联想候选可以为客户端本地的语言模型提供的联想候选。云联想候选可以为云端的语言模型提供的联想候选。
方法实施例一
本实施例对语言模型进行说明。
语言模型是根据语言客观事实而进行的语言抽象数学建模,其可以在语言模型与语言客观事实之间建立某种对应关系。具体到本发明实施例,语言模型可用于针对泛化处理结果进行预测,以得到泛化处理结果对应的本地联想候选信息。
语言模型对应的词表可以表征语言模型能够识别的字符范围。词表的容量通常是有限的,例如,词表的容量为1万,说明词表有1万个字符。容量有限的词表,通常不能覆盖所有的字符,因此,语言模型往往不能识别不存在于词表中的字符,不存在于词表中的字符可称为未录词。
本发明实施例中,语言模型可以包括:N-gram(N元文法)语言模型,和/或,神经网络语言模型等。
其中,N-gram语言模型基于这样一种假设,即第N个词汇的出现只与前面N-1个词汇相关,而与其它任何词汇都不相关,整句的概率就是各个词汇出现概率的乘积。
相对于N-gram语言模型,神经网络语言模型的一个优势在于:可以真正充分地利用长度可变的上文来预测下一个词汇,故神经网络语言模型可以具备长度可变的词汇序列的处理能力。神经网络语言模型可以进一步包括:RNNLM(循环神经网络,Recurrent neuralNetwork)语言模型、CNNLM(卷积神经网络,Convolutional Neural Networks)语言模型、LSTM(长短期记忆人工神经网络,Long Short-Term Memory)语言模型等。
语言模型可以提供P(任意元素|上文,…),即在上文等条件下,任意元素的概率。元素可以作为联想候选的来源。除了上文之外,上述条件还可以包括:输入串,输入环境特征、语言风格等信息。
在实际应用中,可以对语料进行分词等处理,以得到语言模型对应的词表。进一步,可以根据语料和词表,对语言模型进行训练。上述语料具体可以包括:口语聊天语料、书面语料、网页语料等,可以理解,本发明实施例对于具体的语料不加以限制。
本发明实施例的词表中可以包括:经过泛化处理的字符,经过泛化处理的字符可以称为泛化标签。
在具体实现中,可以根据字符与泛化标签之间的映射关系,对字符进行泛化处理,以得到字符对应的泛化标签。字符与泛化标签之间通常为多对一的关系,因此,将字符转换为泛化标签进行存储,能够减小词表空间。当然,除了泛化标签之外,词表中还可以包括:字符。
本领域技术人员可以根据实际应用需求,确定泛化标签的类型。
例如,泛化标签的类型可以包括:
实体类型,如利用<歌手>表示歌手的姓名,利用<地点>表示地名,利用<歌曲>表示歌曲名等;
标点类型,例如用<标点>表示例如波浪号、逗号的标点符号;
数字类型,利用<num4>来表示“2018”,用<num5>来代表“10086”,利用<num11>表示11位手机号;
结束类型,利用<\s>等结束标识,表示文字输入的结束;
未录类型,利用<unki>表示一个长度为i的未登录词;等等。
在具体实现中,可以对语料进行泛化处理,并根据经过泛化处理的语料,对语言模型进行训练。
对语料进行泛化处理,具体包括:将语料中的至少部分字符转换为对应的泛化标签。例如,将语料“我+早上+去+五道口+上班”中的“五道口”转换为<地点>,这样,经过泛化处理的语料可以为:“我+早上+去+<地点>+上班”。
经过泛化处理的语料中可以包括:泛化标签。在根据经过泛化处理的语料,对语言模型进行训练的过程中,可以训练得到泛化标签的词向量、以及语言模型的参数,由此使语言模型具有泛化标签的识别能力和处理能力。
综上,本发明实施例根据经过泛化处理的语料,对语言模型进行训练。一方面,可以使语言模型根据泛化处理结果中包含的语义信息进行处理;另一方面,在上文中包含未录词的情况下,未录词对应的泛化处理结果可被语言模型识别和处理,因此能够增加语言模型能够识别的字符范围。上述两个方面能够提高语言模型输出的本地联想候选信息的准确度。
并且,本发明实施例还可以将词表中的字符转换为泛化标签进行存储,能够减小词表空间。
方法实施例二
参照图2,示出了本发明的一种请求处理方法实施例的步骤流程图,具体可以包括如下步骤:
步骤201、确定输入串对应的字词候选,和/或,确定上文和输入串对应的本地联想候选;
步骤202、根据该字词候选命中的泛化标签的类型,和/或,根据该本地联想候选命中的泛化标签的类型,和/或,根据该本地联想候选的概率信息,判断是否发送云联想请求。
图2所示方法实施例可由客户端执行,可以理解,本发明实施例对于方法实施例的具体执行主体不加以限制。
步骤201中,上文可以指输入光标之前的部分。根据一种实施例,该上文可以包括:最近一次或者最近多次的上屏内容。根据另一种实施例,该上文可以包括:在通信场景下,通信对端发送的通信内容。例如,在即时通讯场景下,用户A接收到用户B发送的通信内容后,点击输入框进行输入,则输入框中可以出现输入光标,由于通信内容在通讯窗口中位于输入光标之前,故可以将该通信内容作为上文。当然,该上文可以包括:在通信场景下,本端向通信对端发送的通信内容。可以理解,本申请实施例对于具体的上文不加以限制。
输入串可以为用户在键盘符号输入、手写输入、语音输入等输入方式下输入的编码字符串。
步骤202中,可以依据输入串,在词库中进行查找,以得到输入串对应的字词候选。可选地,本发明实施例的词库具体可以包括:系统词库、用户词库、细胞词库等等,本发明实施例对于具体的词库不加以限制。
在实际应用中,可以利用语言模型,确定该上文和该输入串对应的本地联想候选。
根据一种实施方式,语言模型可以提供P(任意元素|上文,输入串,…),即在上文、输入串等条件下,任意元素的概率。元素可以作为本地联想候选的来源。此种情况下,可以将上文和输入串输入语言模型,以得到语言模型输出的本地联想候选。
根据另一种实施方式,语言模型可以提供P(任意元素|上文,…),即在上文等条件下,任意元素的概率。元素可以作为本地联想候选的来源。此种情况下,可以将上文和字词候选作为更新上文输入语言模型,以得到语言模型输出的本地联想候选。
需要说明的是,输入串可以对应多个字词候选,此种情况下,可以将上文与多个字词候选中的单个进行组合,以得到对应的多个更新上文。
在具体实现中,可以从多个字词候选中选取Q个目标字词候选,将Q个目标字词候选应用于后续的处理。选取依据可以为:字词候选的概率。可以按照概率从大到小的顺序,对多个字词候选进行排序,并选取位置靠前的Q个目标字词候选。
在实际应用中,Q可以为正整数。可以根据首屏展现的字词候选的数量,确定Q的值。具体地,若首屏展现的字词候选的数量为5,则Q的值可以为5。当然,Q也可以小于首屏展现的字词候选的数量。
字词候选的概率因子可以包括:字词候选本身的词条概率P1-1、以及上文与字词候选之间的连接概率P1-2。
词条概率P1-1的根据可以包括:词频、词库属性、以及字词候选与输入串之间的匹配信息中的至少一种。连接概率P1-2可根据语言模型确定。词库属性可以表征字词候选命中的词库属性,词库属性可以包括:系统词库属性或用户词库属性等,通常,用户词库属性对应的概率值大于系统词库属性对应的概率值。
在实际应用中,可以对词条概率P1-1和连接概率P1-2进行融合,以得到字词候选的概率。对应的融合方式可以包括:乘积、取对数后加权相加等,可以理解,本发明实施例对于具体的融合方式不加以限制。
在本发明的一种可选实施例中,本地联想候选可以为根据语言模型得到,该语言模型对应的词表中可以包括:经过泛化处理的字符。
本发明实施例中,语言模型对应的词表中可以包括:经过泛化处理的字符,故语言模型具有泛化处理结果的识别能力和处理能力。这样,语言模型的输出可以为:本地联想候选对应的标签。
在本发明的一种可选实施例中,可以向语言模型提供更新上文对应的泛化处理结果,由语言模型对上述泛化处理结果进行处理。一方面,可以使语言模型根据泛化处理结果中包含的语义信息进行处理;另一方面,在更新上文中包含未录词的情况下,未录词对应的泛化处理结果可被语言模型识别和处理,因此能够增加语言模型能够识别的字符范围。上述两个方面能够提高语言模型输出的本地联想候选信息的准确度。
相应地,上述确定上文和输入串对应的本地联想候选,具体可以包括:对所述上文和所述输入串对应字词候选进行泛化处理,以得到对应的泛化处理结果;将所述泛化处理结果输入语言模型,以得到所述语言模型输出的本地联想候选,并确定所述本地联想候选对应的第一泛化标签;或者,将所述泛化处理结果输入语言模型,以得到所述语言模型输出的本地联想候选对应的第二泛化标签,并确定所述第二泛化标签对应的本地联想候选。
本发明实施例可以将上文和字词候选作为更新上文进行泛化处理,对应的泛化处理过程具体包括:将更新上文中的至少部分字符转换为对应的泛化标签。在实际应用中,可以对更新上文进行分词,并根据字符与泛化标签之间的映射关系,对更新上文中的至少部分字符进行转换。
例如,将更新上文A“这是+周杰伦”中的“周杰伦”转换为<歌手>,这样,经过泛化处理后的更新上文A可以为:“这是+<歌手>”。
需要说明的是,若更新上文中的字符未命中映射关系,则可以不对更新上文中的字符进行泛化处理,此种情况下,泛化处理结果可以与更新上文相同。例如,假设更新上文B为“行了,再见”中的字符未命中映射关系,则更新上文B对应的泛化处理结果可以与更新上文B相同。
另外需要说明的是,若更新上文中的字符未命中映射关系、也未命中语言模型对应的词表,则可以将该字符对应的泛化标签确定为:未录标签。例如,语言模型的词表中并不存在“国狮”,映射关系中也不存在“国狮”对应的泛化标签(如<金鱼品种>);此种情况下,可以将“国狮”对应的泛化标签确定为:未录标签。
语言模型的输出可以包括:本地联想候选的概率、和/或、本地联想候选对应泛化标签的信息。
在一种实现方式中,可以将上述泛化处理结果输入语言模型,以得到所述语言模型输出的本地联想候选,并确定所述本地联想候选对应的第一泛化标签。
语言模型输出的本地联想候选,可以是概率符合预设概率条件的本地联想候选。预设概率条件可以是:概率从大到小的前M个本地联想候选,M可以为正整数。进一步,可以根据本地联想候选,在上述映射关系中进行查找,将查找得到的泛化标签作为第一泛化标签。
在另一种实现方式中,可以将所述泛化处理结果输入语言模型,以得到所述语言模型输出的本地联想候选对应的第二泛化标签,并确定所述第二泛化标签对应的本地联想候选。
语言模型输出的第二泛化标签,可以是概率符合预设概率条件的泛化标签。预设概率条件可以是:概率从大到小的前P个泛化标签,P可以为正整数。进一步,可以根据第二泛化标签,在上述映射关系中进行查找,将查找得到的字符作为本地联想候选。
在又一种实现方式中,可以将所述泛化处理结果输入语言模型,以得到所述语言模型输出的本地联想候选及其对应的泛化标签。
由于语言模型输出的本地联想候选信息,能够具有较高的准确度,在此基础上,步骤203根据上述本地联想候选,判断是否发送云联想请求,能够提升云联想请求处理的准确率。
步骤203中,可以提供判断是否发送云联想请求的如下判断方式:
判断方式1、若所述字词候选命中第一类型的泛化标签,则发送云联想请求;和/或
判断方式2、若所述本地联想候选命中第一类型的泛化标签,则发送云联想请求;和/或
判断方式3、若所述本地联想候选命中第二类型的泛化标签,则不发送云联想请求;和/或
判断方式4、若Q个字词候选分别对应的本地联想候选的概率融合值不超过第一阈值,则发送云联想请求。
对于判断方式1,第一类型的泛化标签可以表征话题的信息。在字词候选涉及话题的情况下,可以借助于服务端对话题的信息进行联想,故此种情况下,可以发送云联想请求。
第一类型具体包括:实体类型、或未录类型。实体类型可以对应语言模型能够识别的话题。未录类型可以对应语言模型不能识别的话题。
例如,字词候选“周杰伦”命中了实体类型的<歌手>标签,这说明字词候选涉及<歌手>话题,故可以发送云联想请求,以从云端请求<歌手>话题对应的联想结果。
又如,字词候选为“国狮”,由于语言模型的词表中并不存在“国狮”,映射关系中也不存在“国狮”对应的泛化标签(如<金鱼品种>);此种情况下,可以将“国狮”对应的泛化标签确定为:未录标签。未录类型可以对应语言模型不能识别的话题,此种情况下,可以借助于服务端对话题的信息进行联想,故可以发送云联想请求。
在实际应用中,可以对Q个目标字词候选与上述映射关系中第一泛化类型的泛化标签对应的字符进行匹配,若匹配成功,则可以确定目标字词候选命中第一类型的泛化标签。
对于判断方式2至判断方式4,可以根据本地联想候选的信息,判断本地能否提供准确的联想候选,由此可以判断是否发送云联想请求。通常来说,本地能提供准确的联想候选,则可以不发送云联想请求。反之,本地不能提供准确的联想候选,则可以发送云联想请求。
对于判断方式2,Q个字词候选分别对应的本地联想候选的概率融合值,可以表征根据首屏字词候选得到的本地联想候选的准确程度。通常概率融合值超过第一阈值,则可以说明本地联想候选的准确程度较高,此种情况下,可以不发送云联想请求。否则,概率融合值不超过第一阈值,则可以说明本地联想候选的准确程度较低,此种情况下,可以发送云联想请求,以从云端请求准确程度更高的云联想候选。
在实际应用中,可以针对Q个目标本地联想候选中的单个,获取M个概率最大的本地联想候选。可以根据首屏展现的联想候选的数量,确定M的值。具体地,若首屏展现的联想候选的数量为3,则M的值可以为3。
在具体实现中,所述本地联想候选的概率P2可以为根据所述字词候选对应的概率P1、以及所述字词候选和本地联想候选的连接概率P2-1得到,本地联想候选的概率P2可以表征在字词候选的条件下、本地联想候选的概率。
在实际应用中,可以对概率P1和连接概率P2-1进行融合,以得到字词候选的概率。本地联想候选的概率P2对应的融合方式可以包括:乘积、取对数后加权相加等,可以理解,本发明实施例对于具体的融合方式不加以限制。
在本发明的一种应用示例中,第i个字词候选对应的M个本地联想候选的概率可以表示为:P2[i][1]、P2[i][2]…P2[i][M],则Q个字词候选分别对应的本地联想候选的概率融合值P3可以表示为:
P3=(P2[1][1]+P2[1][2]+…+P2[1][M])+(P2[2][1]+P2[2][2]+…+P2[2][M])+…+(P2[Q][1]+P2[Q][2]+…+P2[Q][M])
对于判断方式3和判断方式4,可以根据本地联想候选对应的泛化标签的类型,判断本地是否有能力提供准确的本地联想候选。判断方式3和判断方式4中的本地联想候选可以为概率超过第二阈值的候选。换言之,可以针对概率超过第二阈值的本地联想候选,判断其是否命中第一类型或第二类型的泛化标签。
对于判断方式3,假设本地联想候选命中了实体类型的泛化标签,如命中了<歌曲>标签,这意味着,本地能够预测下一个应该是个<歌曲>类型的候选,但不知道<歌曲>的具体名称。此种情况下,可以发送云联想请求,以从云端请求<歌曲>的具体名称。
例如,经过泛化处理后的更新上文A可以为:“这是+<歌手>”,用户期待的联想结果,一般会是“某首歌曲”、“某个综艺节目”。本地的语言模型能够基于泛化处理结果的处理,预测得到:能够表征联想结果的类型的泛化标签。例如,语言模型根据经过泛化处理后的更新上文A可以为:“这是+<歌手>”,输出的泛化标签为<歌曲>标签。
未录类型的泛化标签,可以表征不存在于语言模型的词表中的字符。例如,更新上文C为“说到+金鱼+,+他+最+喜欢+”,用户期待的联想结果,一般会是“某个金鱼品种”。但语言模型的词表中并不存在<金鱼品种>对应的泛化标签,也不存在<金鱼品种>对应的具体字符;此种情况下,语言模型输出的泛化标签可以为:未录标签。则本发明实施例可以发送云联想请求,以从云端请求更准确的云联想候选。
判断方式4对应的情况是,本地有能力处理第二类型的泛化标签。具体地,本地有能力预测第二类型的泛化标签对应的具体字符,或者,第二类型的泛化标签对应的具体字符可由用户自行输入,或者,可以不对第二类型的泛化标签对应的具体字符进行预测。
第二类型具体可以包括:数字类型、结束类型或标点类型。
例如,更新上文A为“行了,再见”,此种情况下,下文没什么可说的了,语言模型输出的泛化标签中,概率最高的是:结束类型的泛化标签。由于结束类型的泛化标签,表示文字输入的结束,此种情况下,可以不提供联想候选,以降低不符合用户需求的联想候选对用户的打扰。
又如,语言模型输出有数字类型的泛化标签,可以利用本地的能力,对数字类型的泛化标签进行预测。例如,数字类型的泛化标签为<num11>,由于<num11>表示11位手机号,故可以在本地的通讯录中,查找更新上文对应的手机号,并将查找结果作为本地联想候选进行呈现。
再如,语言模型输出有标点类型的泛化标签,可以利用本地的能力,对标点类型的泛化标签进行预测。例如,标点类型的泛化标签为<波浪线>,则可以将“波浪线符号”作为本地联想候选进行呈现。
以上通过判断方式1至判断方式4对判断是否发送云联想请求的过程进行了详细介绍,可以理解,本领域技术人员可以根据实际应用需求,采用判断方式1至判断方式4中的任一或组合。
例如,可以首先利用判断方式1,判断是否发送云联想请求,若字词候选命中了第一类型的泛化标签,则发送云联想请求;否则,若字词候选未命中第一类型的泛化标签,则采用判断方式2至判断方式4中的任一或组合,判断是否发送云联想请求。
在具体实现中,判断是否发送云联想请求的判断结果具体包括:发送云联想请求,或者不发送云联想请求。
在发送云联想请求的情况下,可以接收服务端返回的云联想候选,并对云联想候选进行展现。可选地,还可以对云联想候选和字词候选进行联合展现。云联想候选和字词候选可以位于不同的候选区域。例如,字词候选位于第一候选区域的Q个候选位置。又如,云联想候选位于第二候选区域的M个候选位置,且云联想候选带有例如云朵标识的预设标识,以提示云联想候选由云端提供。例如,在用户输入“这是+zhoujielun”的情况下,服务端返回的云联想候选可以包括:“周杰伦演唱的青花瓷”、“周杰伦执导的叱咤风云”等。
服务端可以利用服务端的语言模型,确定云联想候选。相对于客户端的语言模型,服务端的语言模型可以采用容量更大、更新的词表、以及更高级的模型结构,因此能够得到质量更高的云联想候选。
在不发送云联想请求的情况下,可以对字词候选进行展现。还可以对字词候选和本地联想候选进行展现。展现的本地联想候选可由语言模型提供,和/或,可根据语言模型输出的泛化标签确定。可以将字词候选和本地联想候选组合为本地候选,并进行展现。例如,在用户输入“这是+zhoujielun”的情况下,根据字词候选“周杰伦”和本地联想候选组合得到的本地候选可以包括:“周杰伦的歌”等。
综上,本发明实施例的请求处理方法,根据该字词候选命中的泛化标签的类型,判断是否发送云联想请求,可以根据该字词候选是否涉及话题,判断是否发送云联想请求,能够提升云联想请求处理的准确率。例如,在该字词候选涉及话题的情况下,可以借助于服务端对话题的信息进行联想,故此种情况下,可以发送云联想请求。
并且,本发明实施例根据该本地联想候选命中的泛化标签的类型,判断是否发送云联想请求,可以根据该本地联想候选是否涉及话题,判断是否发送云联想请求,能够提升云联想请求处理的准确率。例如,在该本地联想候选涉及话题的情况下,可以借助于服务端对话题的信息进行联想,故此种情况下,可以发送云联想请求。
此外,本发明实施例根据该本地联想候选的概率信息,判断是否发送云联想请求。该本地联想候选的概率信息可以表征本地联想候选的准确程度,根据本地联想候选的准确程度,判断是否发送云联想请求,能够提升云联想请求处理的准确率。例如,在该本地联想候选的概率信息的准确程度较低的情况下,可以借助于服务端对话题的信息进行联想,故此种情况下,可以发送云联想请求。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的运动动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的运动动作并不一定是本发明实施例所必须的。
装置实施例
参照图3,示出了本发明的一种请求处理装置实施例的结构框图,具体可以包括:确定模块301和判断模块302。
其中,确定模块301,用于确定输入串对应的字词候选,和/或,确定上文和输入串对应的本地联想候选;
判断模块302,用于根据上述字词候选命中的泛化标签的类型,和/或,根据上述本地联想候选命中的泛化标签的类型,和/或,根据上述本地联想候选的概率信息,判断是否发送云联想请求。
确定模块,用于确定输入串对应的字词候选,和/或,确定上文和输入串对应的本地联想候选;以及
判断模块,用于根据上述字词候选命中的泛化标签的类型,和/或,根据上述本地联想候选命中的泛化标签的类型,和/或,根据上述本地联想候选的概率信息,判断是否发送云联想请求。
可选地,判断模块302可以包括:
第一判断模块,用于若上述字词候选命中第一类型的泛化标签,则发送云联想请求;和/或
第二判断模块,用于若上述本地联想候选命中第一类型的泛化标签,则发送云联想请求;和/或
第三判断模块,用于若上述本地联想候选命中第二类型的泛化标签,则不发送云联想请求;和/或
第四判断模块,用于若Q个字词候选分别对应的本地联想候选的概率融合值不超过第一阈值,则发送云联想请求。
可选地,上述第一类型可以包括:实体类型、或未录类型。
可选地,上述第二类型可以包括:数字类型、结束类型或标点类型。
可选地,上述本地联想候选的概率可以为根据上述字词候选对应的概率、以及上述字词候选和本地联想候选的连接概率得到。
可选地,上述本地联想候选可以为根据语言模型得到,上述语言模型对应的词表中可以包括:经过泛化处理的字符。
可选地,确定模块301可以包括:
泛化处理模块,用于对上述上文和上述输入串对应字词候选进行泛化处理,以得到对应的泛化处理结果;
模型处理模块,用于将上述泛化处理结果输入语言模型,以得到上述语言模型输出的本地联想候选,并确定上述本地联想候选对应的第一泛化标签;或者,将上述泛化处理结果输入语言模型,以得到上述语言模型输出的本地联想候选对应的第二泛化标签,并确定上述第二泛化标签对应的本地联想候选。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例提供了一种用于处理请求的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:确定输入串对应的字词候选,和/或,确定上文和输入串对应的本地联想候选;根据所述字词候选命中的泛化标签的类型,和/或,根据所述本地联想候选命中的泛化标签的类型,和/或,根据所述本地联想候选的概率信息,判断是否发送云联想请求。
图4是根据一示例性实施例示出的一种用于处理请求的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音输入模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID,Radio Frequency Identification)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图5是本发明的一些实施例中服务端的结构示意图。该服务端1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务端中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务端1900上执行存储介质1930中的一系列指令操作。
服务端1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务端或者终端)的处理器执行时,使得装置能够执行图2所示的请求处理方法。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务端或者终端)的处理器执行时,使得装置能够执行一种请求处理方法,所述方法包括:确定输入串对应的字词候选,和/或,确定上文和输入串对应的本地联想候选;根据所述字词候选命中的泛化标签的类型,和/或,根据所述本地联想候选命中的泛化标签的类型,和/或,根据所述本地联想候选的概率信息,判断是否发送云联想请求。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种请求处理方法、一种请求处理装置、一种用于处理请求的装置、以及一种机器可读介质,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (15)
1.一种请求处理方法,其特征在于,应用于客户端,所述方法包括:
确定输入串对应的字词候选,和/或,确定上文和输入串对应的本地联想候选;
根据所述字词候选命中的泛化标签的类型,和/或,根据所述本地联想候选命中的泛化标签的类型,和/或,根据所述本地联想候选的概率信息,判断是否发送云联想请求。
2.根据权利要求1所述的方法,其特征在于,所述判断是否发送云联想请求,包括:
若所述字词候选命中第一类型的泛化标签,则发送云联想请求;和/或
若所述本地联想候选命中第一类型的泛化标签,则发送云联想请求;和/或
若所述本地联想候选命中第二类型的泛化标签,则不发送云联想请求;和/或
若Q个字词候选分别对应的本地联想候选的概率融合值不超过第一阈值,则发送云联想请求。
3.根据权利要求2所述的方法,其特征在于,所述第一类型包括:实体类型、或未录类型。
4.根据权利要求2所述的方法,其特征在于,所述第二类型包括:数字类型、结束类型或标点类型。
5.根据权利要求2所述的方法,其特征在于,所述本地联想候选的概率为根据所述字词候选对应的概率、以及所述字词候选和本地联想候选的连接概率得到。
6.根据权利要求1至5中任一所述的方法,其特征在于,所述本地联想候选为根据语言模型得到,所述语言模型对应的词表中包括:经过泛化处理的字符。
7.根据权利要求1至5中任一所述的方法,其特征在于,所述确定上文和输入串对应的本地联想候选,包括:
对所述上文和所述输入串对应字词候选进行泛化处理,以得到对应的泛化处理结果;
将所述泛化处理结果输入语言模型,以得到所述语言模型输出的本地联想候选,并确定所述本地联想候选对应的第一泛化标签;或者,将所述泛化处理结果输入语言模型,以得到所述语言模型输出的本地联想候选对应的第二泛化标签,并确定所述第二泛化标签对应的本地联想候选。
8.一种请求处理装置,其特征在于,应用于客户端,所述装置包括:
确定模块,用于确定输入串对应的字词候选,和/或,确定上文和输入串对应的本地联想候选;以及
判断模块,用于根据所述字词候选命中的泛化标签的类型,和/或,根据所述本地联想候选命中的泛化标签的类型,和/或,根据所述本地联想候选的概率信息,判断是否发送云联想请求。
9.根据权利要求8所述的装置,其特征在于,所述判断模块包括:
第一判断模块,用于若所述字词候选命中第一类型的泛化标签,则发送云联想请求;和/或
第二判断模块,用于若所述本地联想候选命中第一类型的泛化标签,则发送云联想请求;和/或
第三判断模块,用于若所述本地联想候选命中第二类型的泛化标签,则不发送云联想请求;和/或
第四判断模块,用于若Q个字词候选分别对应的本地联想候选的概率融合值不超过第一阈值,则发送云联想请求。
10.根据权利要求9所述的装置,其特征在于,所述第一类型包括:实体类型、或未录类型。
11.根据权利要求9所述的装置,其特征在于,所述第二类型包括:数字类型、结束类型或标点类型。
12.根据权利要求9所述的装置,其特征在于,所述本地联想候选的概率为根据所述字词候选对应的概率、以及所述字词候选和本地联想候选的连接概率得到。
13.根据权利要求8至12中任一所述的装置,其特征在于,所述本地联想候选为根据语言模型得到,所述语言模型对应的词表中包括:经过泛化处理的字符。
14.一种用于处理请求的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,所述程序被一个或者一个以上处理器执行时,实现权利要求1至7中任一所述方法的步骤。
15.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至7中一个或多个所述的请求处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110609038.9A CN115437509A (zh) | 2021-06-01 | 2021-06-01 | 请求处理方法、装置和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110609038.9A CN115437509A (zh) | 2021-06-01 | 2021-06-01 | 请求处理方法、装置和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115437509A true CN115437509A (zh) | 2022-12-06 |
Family
ID=84240636
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110609038.9A Pending CN115437509A (zh) | 2021-06-01 | 2021-06-01 | 请求处理方法、装置和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115437509A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090125461A1 (en) * | 2007-11-09 | 2009-05-14 | Microsoft Corporation | Multi-Label Active Learning |
CN110019648A (zh) * | 2017-12-05 | 2019-07-16 | 深圳市腾讯计算机系统有限公司 | 一种训练数据的方法、装置及存储介质 |
CN111208910A (zh) * | 2018-11-22 | 2020-05-29 | 北京搜狗科技发展有限公司 | 一种云端联想方法和相关装置 |
CN111708444A (zh) * | 2020-06-15 | 2020-09-25 | 北京搜狗科技发展有限公司 | 输入方法、装置和用于输入的装置 |
CN112015281A (zh) * | 2019-05-29 | 2020-12-01 | 北京搜狗科技发展有限公司 | 一种云端联想方法和相关装置 |
CN112306252A (zh) * | 2019-07-30 | 2021-02-02 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
-
2021
- 2021-06-01 CN CN202110609038.9A patent/CN115437509A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090125461A1 (en) * | 2007-11-09 | 2009-05-14 | Microsoft Corporation | Multi-Label Active Learning |
CN110019648A (zh) * | 2017-12-05 | 2019-07-16 | 深圳市腾讯计算机系统有限公司 | 一种训练数据的方法、装置及存储介质 |
CN111208910A (zh) * | 2018-11-22 | 2020-05-29 | 北京搜狗科技发展有限公司 | 一种云端联想方法和相关装置 |
CN112015281A (zh) * | 2019-05-29 | 2020-12-01 | 北京搜狗科技发展有限公司 | 一种云端联想方法和相关装置 |
CN112306252A (zh) * | 2019-07-30 | 2021-02-02 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN111708444A (zh) * | 2020-06-15 | 2020-09-25 | 北京搜狗科技发展有限公司 | 输入方法、装置和用于输入的装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107564526B (zh) | 处理方法、装置和机器可读介质 | |
CN107291704B (zh) | 处理方法和装置、用于处理的装置 | |
CN108803890B (zh) | 一种输入方法、输入装置和用于输入的装置 | |
CN109521888B (zh) | 一种输入方法、装置和介质 | |
CN107424612B (zh) | 处理方法、装置和机器可读介质 | |
CN109783244B (zh) | 处理方法和装置、用于处理的装置 | |
CN111160047A (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN107422872B (zh) | 一种输入方法、装置和用于输入的装置 | |
CN110633017A (zh) | 一种输入方法、装置和用于输入的装置 | |
CN108241614B (zh) | 信息处理方法和装置、用于信息处理的装置 | |
CN108073294B (zh) | 一种智能组词方法和装置、一种用于智能组词的装置 | |
CN107977089B (zh) | 一种输入方法和装置、一种用于输入的装置 | |
CN106959970B (zh) | 词库、词库的处理方法、装置和用于处理词库的装置 | |
CN112987941B (zh) | 生成候选词的方法及装置 | |
CN115437509A (zh) | 请求处理方法、装置和介质 | |
CN114610163A (zh) | 推荐方法、装置和介质 | |
CN109388252B (zh) | 一种输入方法及装置 | |
CN112181163A (zh) | 一种输入方法、装置和用于输入的装置 | |
CN112306252A (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN115509370A (zh) | 请求处理方法、装置和介质 | |
CN108073566B (zh) | 分词方法和装置、用于分词的装置 | |
CN113407099A (zh) | 输入方法、装置和机器可读介质 | |
CN111103986A (zh) | 用户词库管理方法及装置、输入方法及装置 | |
CN110765338A (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN114089840A (zh) | 请求处理方法、装置和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |