CN110516226A - 搜索语句处理方法、装置及服务器 - Google Patents
搜索语句处理方法、装置及服务器 Download PDFInfo
- Publication number
- CN110516226A CN110516226A CN201810497418.6A CN201810497418A CN110516226A CN 110516226 A CN110516226 A CN 110516226A CN 201810497418 A CN201810497418 A CN 201810497418A CN 110516226 A CN110516226 A CN 110516226A
- Authority
- CN
- China
- Prior art keywords
- semantic vector
- search
- search result
- sentence
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 26
- 238000004590 computer program Methods 0.000 claims description 12
- 238000003062 neural network model Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 235000013399 edible fruits Nutrition 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 5
- 230000003796 beauty Effects 0.000 description 31
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种搜索语句处理方法、装置及服务器。该方法包括:获取用户输入的搜索语句;根据该搜索语句,获取与该搜索语句对应的至少一个搜索结果;对该搜索语句进行语义向量解析得到第一语义向量;对该至少一个搜索结果中的每个搜索结果进行语义向量解析得到该每个搜索结果对应的第二语义向量;根据该第一语义向量和该第二语义向量,确定该搜索语句的类别;根据该搜索语句和该至少一个搜索结果的共性内容,确定该搜索语句中属于该类别的实体。本发明实施例结合该搜索语句对应的至少一个搜索结果对该搜索语句进行实体识别,相比于对该搜索语句中的特征词进行实体识别,提高了对该搜索语句中实体识别的精确度。
Description
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种搜索语句处理方法、装置及服务器。
背景技术
搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供搜索服务,将用户搜索相关的信息展示给用户的系统。通常搜索引擎会对用户输入的搜索语句中的实体进行识别。
现有技术对搜索语句中的实体进行识别的方法具体为:抽取该搜索语句中的特征词,对该特征词进行实体识别。但是,现有技术对实体识别的精确度较低。
发明内容
本发明实施例提供一种搜索语句处理方法、装置及服务器,以提高对该搜索语句中实体识别的精确度。
第一方面,本发明实施例提供一种搜索语句处理方法,包括:
获取用户输入的搜索语句;
根据所述搜索语句,获取与所述搜索语句对应的至少一个搜索结果;
对所述搜索语句进行语义向量解析得到第一语义向量;
对所述至少一个搜索结果中的每个搜索结果进行语义向量解析得到所述每个搜索结果对应的第二语义向量;
根据所述第一语义向量和所述第二语义向量,确定所述搜索语句的类别;
根据所述搜索语句和所述至少一个搜索结果的共性内容,确定所述搜索语句中属于所述类别的实体。
第二方面,本发明实施例提供一种搜索语句处理装置,包括:
获取模块,用于获取用户输入的搜索语句;根据所述搜索语句,获取与所述搜索语句对应的至少一个搜索结果;
语义向量解析模块,用于对所述搜索语句进行语义向量解析得到第一语义向量;对所述至少一个搜索结果中的每个搜索结果进行语义向量解析得到所述每个搜索结果对应的第二语义向量;
确定模块,用于根据所述第一语义向量和所述第二语义向量,确定所述搜索语句的类别;根据所述搜索语句和所述至少一个搜索结果的共性内容,确定所述搜索语句中属于所述类别的实体。
第三方面,本发明实施例提供一种服务器,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现第一方面所述的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现第一方面所述的方法。
本发明实施例提供的搜索语句处理方法、装置及服务器,通过获取用户输入的搜索语句,得到与该搜索语句对应的至少一个搜索结果,根据该至少一个搜索结果和该搜索语句分别对应的语义向量确定出该搜索语句所属的类别,并根据该搜索语句所属的类别确定出该搜索语句中属于该类别的实体,即结合该搜索语句对应的至少一个搜索结果对该搜索语句进行实体识别,由于该搜索语句对应的至少一个搜索结果的信息量比该搜索语句中的特征词的信息量大,因此,相比于对该搜索语句中的特征词进行实体识别,提高了对该搜索语句中实体识别的精确度。
附图说明
图1为本发明实施例提供的一种应用场景的示意图;
图2为本发明实施例提供的搜索语句处理方法流程图;
图3为本发明实施例提供的搜索语句处理装置的结构示意图;
图4为本发明实施例提供的服务器的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
首先对本发明所涉及的名词进行解释:
搜索语句:是指用户在搜索引擎上输入的用户搜索句子,记为query。
实体:是指某类数据对象中的个体。
title:搜索结果展现的标题。
abstract:搜索结果展现的摘要内容。
本发明提供的搜索语句处理方法,可以适用于图1所示的通信系统。如图1所示,该通信系统包括:接入网设备11、终端设备12以及服务器13。需要说明的是,图1所示的通信系统可以适用于不同的网络制式,例如,可以适用于全球移动通讯(Global System ofMobile communication,简称GSM)、码分多址(Code Division Multiple Access,简称CDMA)、宽带码分多址(Wideband Code Division Multiple Access,简称WCDMA)、时分同步码分多址(Time Division-Synchronous Code Division Multiple Access,简称TD-SCDMA)、长期演进(Long Term Evolution,简称LTE)系统及未来的5G等网络制式。可选的,上述通信系统可以为5G通信系统中高可靠低时延通信(Ultra-Reliable and Low LatencyCommunications,简称URLLC)传输的场景中的系统。
故而,可选的,上述接入网设备11可以是GSM或CDMA中的基站(Base TransceiverStation,简称BTS)和/或基站控制器,也可以是WCDMA中的基站(NodeB,简称NB)和/或无线网络控制器(Radio Network Controller,简称RNC),还可以是LTE中的演进型基站(Evolutional Node B,简称eNB或eNodeB),或者中继站或接入点,或者未来5G网络中的基站(gNB)等,本发明在此并不限定。
上述终端设备12可以是无线终端也可以是有线终端。无线终端可以是指向用户提供语音和/或其他业务数据连通性的设备,具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备。无线终端可以经无线接入网(Radio Access Network,简称RAN)与一个或多个核心网设备进行通信,无线终端可以是移动终端,如移动电话(或称为“蜂窝”电话)和具有移动终端的计算机,例如,可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们与无线接入网交换语言和/或数据。再例如,无线终端还可以是个人通信业务(Personal Communication Service,简称PCS)电话、无绳电话、会话发起协议(Session Initiation Protocol,简称SIP)话机、无线本地环路(Wireless LocalLoop,简称WLL)站、个人数字助理(Personal Digital Assistant,简称PDA)等设备。无线终端也可以称为系统、订户单元(Subscriber Unit)、订户站(Subscriber Station),移动站(Mobile Station)、移动台(Mobile)、远程站(Remote Station)、远程终端(RemoteTerminal)、接入终端(Access Terminal)、用户终端(User Terminal)、用户代理(UserAgent)、用户设备(User Device or User Equipment),在此不作限定。可选的,上述终端设备12还可以是智能手表、平板电脑等设备。另外,该通信系统中还可以包括如图1所示的个人计算机(Personal Computer,简称PC)14。
本发明提供的搜索语句处理方法,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
图2为本发明实施例提供的搜索语句处理方法流程图。本发明实施例针对现有技术的如上技术问题,提供了搜索语句处理方法,该搜索语句处理方法具体可以由如图1所示的服务器13执行。该方法具体步骤如下:
步骤201、获取用户输入的搜索语句。
如图1所示,个人计算机14或终端设备12可安装有浏览器,用户可以在该浏览器中的搜索引擎中输入搜索语句,个人计算机14或终端设备12通过接入网设备11将该搜索语句发送给服务器13。例如,用户输入的搜索语句为“柜中美人怎么样”。
步骤202、根据所述搜索语句,获取与所述搜索语句对应的至少一个搜索结果。
当服务器13接收到个人计算机14或终端设备12发送的搜索语句“柜中美人怎么样”之后,对该搜索语句进行分词处理,例如,将“柜中美人怎么样”分解为“柜中美人”和“怎么样”。进一步,服务器13从数据库中搜索与“柜中美人”相关的内容,并将与“柜中美人”相关的内容作为搜索结果反馈给个人计算机14或终端设备12,例如,个人计算机14或终端设备12显示的搜索结果中包括如下4个标题:
标题1:柜中美人_高清视频在线观看
标题2:柜中美人分集剧情(最新13集)
标题3:《柜中美人》首曝10分钟超长片花-片花-高清正版视频
标题4:柜中美人_电视剧
此处只是示意性说明,并不限定个人计算机14或终端设备12显示的搜索结果的个数,另外,在个人计算机14或终端设备12显示的每个标题下还有对应的摘要内容,也就是说,服务器13搜索到的与“柜中美人”相关的内容不仅包括如上所述的4个标题,还包括每个标题下的摘要内容。
步骤203、对所述搜索语句进行语义向量解析得到第一语义向量。
具体的,所述对所述搜索语句进行语义向量解析得到第一语义向量,包括:采用神经网络模型对所述搜索语句进行语义向量解析得到第一语义向量。例如,采用卷积神经网络(Convolutional Neural Network,CCN)模型对搜索语句“柜中美人怎么样”进行语义向量解析得到第一语义向量,该第一语义向量记为query_emb。在其他实施例中,还可以采用机器学习的方法对搜索语句“柜中美人怎么样”进行语义向量解析得到第一语义向量。
步骤204、对所述至少一个搜索结果中的每个搜索结果进行语义向量解析得到所述每个搜索结果对应的第二语义向量。
具体的,所述对所述至少一个搜索结果中的每个搜索结果进行语义向量解析得到所述每个搜索结果对应的第二语义向量,包括:采用神经网络模型对所述至少一个搜索结果中的每个搜索结果进行语义向量解析得到所述每个搜索结果对应的第二语义向量。
例如,采用卷积神经网络模型对如上所述的4个标题和该4个标题下的摘要内容分别进行语义向量解析得到第二语义向量,该第二语义向量记为{title1_emb,title2_emb,title3_emb,title4_emb,abstract1_emb,abstract2_emb,abstract3_emb,abstract4_emb},其中,title1_emb表示对标题1进行语义向量解析后得到的结果,title2_emb表示对标题2进行语义向量解析后得到的结果,title3_emb和title4_emb依此类推。abstract1_emb表示对标题1下的摘要内容进行语义向量解析后得到的结果,abstract2_emb表示对标题2下的摘要内容进行语义向量解析后得到的结果,abstract3_emb和abstract4_emb依此类推。
在其他实施例中,还可以采用机器学习的方法对如上所述的4个标题和该4个标题下的摘要内容分别进行语义向量解析得到第二语义向量。
步骤205、根据所述第一语义向量和所述第二语义向量,确定所述搜索语句的类别。
在得到搜索语句“柜中美人怎么样”对应的第一语义向量query_emb,以及对如上所述的4个标题和该4个标题下的摘要内容对应的第二语义向量{title1_emb,title2_emb,title3_emb,title4_emb,abstract1_emb,abstract2_emb,abstract3_emb,abstract4_emb}之后,根据该第一语义向量和该第二语义向量,确定该搜索语句“柜中美人怎么样”的类别。
具体的,所述根据所述第一语义向量和所述第二语义向量,确定所述搜索语句的类别,包括:对所述第一语义向量和所述第二语义向量进行向量融合得到融合后的语义向量;采用分类预测算法对所述融合后的语义向量进行分类预测得到所述搜索语句的类别。
例如,对第一语义向量query_emb和第二语义向量{title1_emb,title2_emb,title3_emb,title4_emb,abstract1_emb,abstract2_emb,abstract3_emb,abstract4_emb}进行向量融合得到融合后的语义向量,该融合后的语义向量记为last_query_emb,并采用分类预测算法对该融合后的语义向量last_query_emb进行分类预测得到所述搜索语句的类别。
例如,采用卷积神经网络模型对如上所述的4个标题进行语义分析后,可预测出“柜中美人怎么样”属于影视剧类别。
步骤206、根据所述搜索语句和所述至少一个搜索结果的共性内容,确定所述搜索语句中属于所述类别的实体。
进一步,对如上所述的4个标题分别进行分词处理,该4个标题中均包括“柜中美人”这个分词,另外,搜索语句“柜中美人怎么样”也包括“柜中美人”这个分词,因此,“柜中美人”是该搜索语句和该4个标题的共性内容,进一步,根据该搜索语句和该4个标题的共性内容“柜中美人”以及“柜中美人怎么样”所属的影视剧类别,确定出该搜索语句“柜中美人怎么样”中属于影视剧这一类别的实体。
具体的,所述根据所述搜索语句和所述至少一个搜索结果的共性内容,确定所述搜索语句中属于所述类别的实体,包括:采用神经网络模型对所述搜索语句和所述至少一个搜索结果的共性内容进行识别,确定所述共性内容为属于所述类别的实体。
例如,采用卷积神经网络模型对该搜索语句和该4个标题的共性内容“柜中美人”进行识别,以确定“柜中美人”是该搜索语句“柜中美人怎么样”所属的影视剧类别中的实体,该实体为影视剧名称,即“柜中美人”是影视剧名称。
在其他实施例中,还可以采用机器学习的方法对该搜索语句和该4个标题的共性内容“柜中美人”进行识别,以确定“柜中美人”是该搜索语句“柜中美人怎么样”所属的影视剧类别中的实体。
可以理解,在服务器13接收个人计算机14或终端设备12发送的搜索语句“柜中美人怎么样”之前,服务器13可能并不知道“柜中美人怎么样”的类别,也并不知道该搜索语句中的实体,通过上述步骤,服务器13可以确定出“柜中美人”是影视剧名称。
本发明实施例通过获取用户输入的搜索语句,得到与该搜索语句对应的至少一个搜索结果,根据该至少一个搜索结果和该搜索语句分别对应的语义向量确定出该搜索语句所属的类别,并根据该搜索语句所属的类别确定出该搜索语句中属于该类别的实体,即结合该搜索语句对应的至少一个搜索结果对该搜索语句进行实体识别,由于该搜索语句对应的至少一个搜索结果的信息量比该搜索语句中的特征词的信息量大,因此,相比于对该搜索语句中的特征词进行实体识别,提高了对该搜索语句中实体识别的精确度。
图3为本发明实施例提供的搜索语句处理装置的结构示意图。该搜索语句处理装置具体可以是上述实施例所述的服务器13,或者该搜索语句处理装置具体为该服务器13中的模块。本发明实施例提供的搜索语句处理装置可以执行搜索语句处理方法实施例提供的处理流程,如图3所示,搜索语句处理装置30包括:获取模块31、语义向量解析模块32和确定模块33;其中,获取模块31用于获取用户输入的搜索语句;根据所述搜索语句,获取与所述搜索语句对应的至少一个搜索结果;语义向量解析模块32用于对所述搜索语句进行语义向量解析得到第一语义向量;对所述至少一个搜索结果中的每个搜索结果进行语义向量解析得到所述每个搜索结果对应的第二语义向量;确定模块33用于根据所述第一语义向量和所述第二语义向量,确定所述搜索语句的类别;根据所述搜索语句和所述至少一个搜索结果的共性内容,确定所述搜索语句中属于所述类别的实体。
可选的,语义向量解析模块32对所述搜索语句进行语义向量解析得到第一语义向量时,具体用于:采用神经网络模型对所述搜索语句进行语义向量解析得到第一语义向量。
可选的,语义向量解析模块32对所述至少一个搜索结果中的每个搜索结果进行语义向量解析得到所述每个搜索结果对应的第二语义向量时,具体用于:采用神经网络模型对所述至少一个搜索结果中的每个搜索结果进行语义向量解析得到所述每个搜索结果对应的第二语义向量。
可选的,确定模块33根据所述第一语义向量和所述第二语义向量,确定所述搜索语句的类别时,具体用于:对所述第一语义向量和所述第二语义向量进行向量融合得到融合后的语义向量;采用分类预测算法对所述融合后的语义向量进行分类预测得到所述搜索语句的类别。
可选的,确定模块33根据所述搜索语句和所述至少一个搜索结果的共性内容,确定所述搜索语句中属于所述类别的实体时,具体用于:采用神经网络模型对所述搜索语句和所述至少一个搜索结果的共性内容进行识别,确定所述共性内容为属于所述类别的实体。
图3所示实施例的搜索语句处理装置可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图4为本发明实施例提供的服务器的结构示意图。本发明实施例提供的服务器可以执行搜索语句处理方法实施例提供的处理流程,如图4所示,服务器40包括存储器41、处理器42、计算机程序和通讯接口43;其中,计算机程序存储在存储器41中,并被配置为由处理器42执行以上实施例所述的搜索语句处理方法。
图4所示实施例的服务器可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
另外,本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现上述实施例所述的搜索语句处理方法。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (12)
1.一种搜索语句处理方法,其特征在于,包括:
获取用户输入的搜索语句;
根据所述搜索语句,获取与所述搜索语句对应的至少一个搜索结果;
对所述搜索语句进行语义向量解析得到第一语义向量;
对所述至少一个搜索结果中的每个搜索结果进行语义向量解析得到所述每个搜索结果对应的第二语义向量;
根据所述第一语义向量和所述第二语义向量,确定所述搜索语句的类别;
根据所述搜索语句和所述至少一个搜索结果的共性内容,确定所述搜索语句中属于所述类别的实体。
2.根据权利要求1所述的方法,其特征在于,所述对所述搜索语句进行语义向量解析得到第一语义向量,包括:
采用神经网络模型对所述搜索语句进行语义向量解析得到第一语义向量。
3.根据权利要求1所述的方法,其特征在于,所述对所述至少一个搜索结果中的每个搜索结果进行语义向量解析得到所述每个搜索结果对应的第二语义向量,包括:
采用神经网络模型对所述至少一个搜索结果中的每个搜索结果进行语义向量解析得到所述每个搜索结果对应的第二语义向量。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述第一语义向量和所述第二语义向量,确定所述搜索语句的类别,包括:
对所述第一语义向量和所述第二语义向量进行向量融合得到融合后的语义向量;
采用分类预测算法对所述融合后的语义向量进行分类预测得到所述搜索语句的类别。
5.根据权利要求4所述的方法,其特征在于,所述根据所述搜索语句和所述至少一个搜索结果的共性内容,确定所述搜索语句中属于所述类别的实体,包括:
采用神经网络模型对所述搜索语句和所述至少一个搜索结果的共性内容进行识别,确定所述共性内容为属于所述类别的实体。
6.一种搜索语句处理装置,其特征在于,包括:
获取模块,用于获取用户输入的搜索语句;根据所述搜索语句,获取与所述搜索语句对应的至少一个搜索结果;
语义向量解析模块,用于对所述搜索语句进行语义向量解析得到第一语义向量;对所述至少一个搜索结果中的每个搜索结果进行语义向量解析得到所述每个搜索结果对应的第二语义向量;
确定模块,用于根据所述第一语义向量和所述第二语义向量,确定所述搜索语句的类别;根据所述搜索语句和所述至少一个搜索结果的共性内容,确定所述搜索语句中属于所述类别的实体。
7.根据权利要求6所述的搜索语句处理装置,其特征在于,所述语义向量解析模块对所述搜索语句进行语义向量解析得到第一语义向量时,具体用于:
采用神经网络模型对所述搜索语句进行语义向量解析得到第一语义向量。
8.根据权利要求6所述的搜索语句处理装置,其特征在于,所述语义向量解析模块对所述至少一个搜索结果中的每个搜索结果进行语义向量解析得到所述每个搜索结果对应的第二语义向量时,具体用于:
采用神经网络模型对所述至少一个搜索结果中的每个搜索结果进行语义向量解析得到所述每个搜索结果对应的第二语义向量。
9.根据权利要求6-8任一项所述的搜索语句处理装置,其特征在于,所述确定模块根据所述第一语义向量和所述第二语义向量,确定所述搜索语句的类别时,具体用于:
对所述第一语义向量和所述第二语义向量进行向量融合得到融合后的语义向量;
采用分类预测算法对所述融合后的语义向量进行分类预测得到所述搜索语句的类别。
10.根据权利要求9所述的搜索语句处理装置,其特征在于,所述确定模块根据所述搜索语句和所述至少一个搜索结果的共性内容,确定所述搜索语句中属于所述类别的实体时,具体用于:
采用神经网络模型对所述搜索语句和所述至少一个搜索结果的共性内容进行识别,确定所述共性内容为属于所述类别的实体。
11.一种服务器,其特征在于,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-5任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810497418.6A CN110516226A (zh) | 2018-05-22 | 2018-05-22 | 搜索语句处理方法、装置及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810497418.6A CN110516226A (zh) | 2018-05-22 | 2018-05-22 | 搜索语句处理方法、装置及服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110516226A true CN110516226A (zh) | 2019-11-29 |
Family
ID=68622075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810497418.6A Pending CN110516226A (zh) | 2018-05-22 | 2018-05-22 | 搜索语句处理方法、装置及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110516226A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120053253A (ko) * | 2010-11-17 | 2012-05-25 | 주식회사 케이티 | 하이브리드 시맨틱 검색 시스템 및 방법 |
CN103186556A (zh) * | 2011-12-28 | 2013-07-03 | 北京百度网讯科技有限公司 | 得到和搜索结构化语义知识的方法及对应装置 |
CN105677931A (zh) * | 2016-04-07 | 2016-06-15 | 北京百度网讯科技有限公司 | 信息搜索方法和装置 |
CN107832468A (zh) * | 2017-11-29 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 需求识别方法和装置 |
-
2018
- 2018-05-22 CN CN201810497418.6A patent/CN110516226A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120053253A (ko) * | 2010-11-17 | 2012-05-25 | 주식회사 케이티 | 하이브리드 시맨틱 검색 시스템 및 방법 |
CN103186556A (zh) * | 2011-12-28 | 2013-07-03 | 北京百度网讯科技有限公司 | 得到和搜索结构化语义知识的方法及对应装置 |
CN105677931A (zh) * | 2016-04-07 | 2016-06-15 | 北京百度网讯科技有限公司 | 信息搜索方法和装置 |
CN107832468A (zh) * | 2017-11-29 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 需求识别方法和装置 |
Non-Patent Citations (1)
Title |
---|
徐学文: "科技信息工作自动化概论", 国防工业出版社, pages: 0083 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105654950B (zh) | 自适应语音反馈方法和装置 | |
CN104735468B (zh) | 一种基于语义分析将图像合成新视频的方法及系统 | |
CN108052639A (zh) | 基于运营商数据的行业用户推荐方法及装置 | |
CN110413875A (zh) | 一种文本信息推送的方法以及相关装置 | |
CN105763420B (zh) | 一种自动回复信息的方法及装置 | |
CN106407361A (zh) | 基于人工智能的推送信息的方法和装置 | |
CN101350870A (zh) | 一种图文转换的方法、移动终端和ocr服务器 | |
CN102073704B (zh) | 文本分类处理方法和系统以及设备 | |
CN108536414A (zh) | 语音处理方法、装置和系统、移动终端 | |
CN108173915A (zh) | 调用链处理方法及装置 | |
CN103037091A (zh) | 短消息处理方法、装置及终端设备 | |
CN107862071A (zh) | 生成会议记录的方法和装置 | |
CN110166811A (zh) | 弹幕信息的处理方法、装置及设备 | |
CN102236639A (zh) | 更新语言模型的系统和方法 | |
CN110457596A (zh) | 一种资源推荐处理方法及装置 | |
CN105929979A (zh) | 长句输入方法和装置 | |
CN108846708A (zh) | 用户购买行为预测方法、装置、设备及存储介质 | |
CN109829073A (zh) | 一种图像搜索的方法及装置 | |
CN108984071A (zh) | 文本重组方法、装置、终端设备及计算机可读存储介质 | |
KR101351264B1 (ko) | 음성인식 기반의 메시징 통역서비스 제공 시스템 및 그 방법 | |
CN106356056A (zh) | 语音识别方法和装置 | |
CN109446417A (zh) | 一种智能化检索方法和装置 | |
CN107193922B (zh) | 一种信息处理的方法及装置 | |
CN108712271A (zh) | 翻译方法和翻译装置 | |
KR20220152453A (ko) | 일기 컨텐츠 시스템 및 제공 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200424 Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province Applicant after: Alibaba (China) Co.,Ltd. Address before: 510627 Guangdong city of Guangzhou province Whampoa Tianhe District Road No. 163 Xiping Yun Lu Yun Ping square B radio tower 13 layer self unit 01 Applicant before: Guangdong Shenma Search Technology Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191129 |