CN110083688A - 搜索结果召回方法、装置、服务器及存储介质 - Google Patents

搜索结果召回方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN110083688A
CN110083688A CN201910389174.4A CN201910389174A CN110083688A CN 110083688 A CN110083688 A CN 110083688A CN 201910389174 A CN201910389174 A CN 201910389174A CN 110083688 A CN110083688 A CN 110083688A
Authority
CN
China
Prior art keywords
list
query statement
recalls
recall
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910389174.4A
Other languages
English (en)
Other versions
CN110083688B (zh
Inventor
刘昊骋
方灵鹏
刘玉忠
傅星雅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910389174.4A priority Critical patent/CN110083688B/zh
Publication of CN110083688A publication Critical patent/CN110083688A/zh
Application granted granted Critical
Publication of CN110083688B publication Critical patent/CN110083688B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Abstract

本发明实施例公开了一种搜索结果召回方法、装置、服务器及存储介质。该方法包括:从全网数据中召回与查询语句符合文本相似度规则的第一召回列表;从预先确定的召回结果数据库中召回查询语句的第二召回列表,召回结果数据库中存储基于用户行为确定的历史查询语句及对应的召回列表,并且历史查询语句及对应的召回列表不符合文本相似度规则;融合第一召回列表和第二召回列表作为召回结果。通过上述方案能够准确召回与查询语句符合文本相似度规则的结果,并且能够召回与查询语句不符合文本相似度规则但符合用户历史行为的结果,经合并后得到的召回结果更加全面且符合用户特征,使搜索结果的个性化展示成为可能。

Description

搜索结果召回方法、装置、服务器及存储介质
技术领域
本发明实施例涉及互联网技术领域,尤其涉及一种搜索结果召回方法、装置、服务器及存储介质。
背景技术
随着互联网的快速发展,搜索引擎技术逐渐成熟,成为人们寻找信息的主要入口。通常,搜索引擎根据用户输入的查询语句,在互联网上进行召回,然后对召回的相关查询结果进行排序,最终将排序靠前的查询结果展示给用户。
然而,现有搜索引擎展示的搜索结果仍然不全面,或者检索结果并非用户所需,无法满足用户个性化的需要。
发明内容
本发明实施例提供一种搜索结果召回方法、装置、服务器及存储介质,以解决现有技术中搜索结果不全面,无法满足用户个性化需要的问题。
第一方面,本发明实施例提供了一种搜索结果召回方法,该方法包括:
获取目标用户的查询语句;
从全网数据中召回与所述查询语句符合文本相似度规则的第一召回列表;
从预先确定的召回结果数据库中,召回所述查询语句的第二召回列表,其中,所述召回结果数据库中存储有基于用户行为确定的历史查询语句及其对应的召回列表,并且所述历史查询语句及其对应的召回列表不符合所述文本相似度规则;
融合所述第一召回列表和第二召回列表,作为所述查询语句的召回结果。
第二方面,本发明实施例提供了一种搜索结果召回装置,该装置包括:
查询获取模块,用于获取目标用户的查询语句;
第一召回模块,用于从全网数据中召回与所述查询语句符合文本相似度规则的第一召回列表;
第二召回模块,用于从预先确定的召回结果数据库中,召回所述查询语句的第二召回列表,其中,所述召回结果数据库中存储有基于用户行为确定的历史查询语句及其对应的召回列表,并且所述历史查询语句及其对应的召回列表不符合所述文本相似度规则;
融合模块,用于融合所述第一召回列表和第二召回列表,作为所述查询语句的召回结果。
第三方面,本发明实施例还提供了一种服务器,该服务器包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的搜索结果召回方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的搜索结果召回方法。
本发明实施例通过从全网数据中召回与所述查询语句符合文本相似度规则的第一召回列表,能够准确召回与查询语句符合文本相似度规则的结果,通过从预先确定的召回结果数据库中,召回所述查询语句的第二召回列表,能够召回与查询语句不符合文本相似度规则但符合用户历史行为的结果,经合并后得到的召回结果更加全面且符合用户特征,使搜索结果的个性化展示成为可能。
附图说明
图1是本发明实施例一中的一种搜索结果召回方法的流程图;
图2是本发明实施例一中的一种搜索结果召回方法的具体实现流程示意图;
图3是本发明实施例二中的一种搜索结果召回方法的流程图;
图4是本发明实施例三中的一种搜索结果召回装置结构示意图;
图5是本发明实施例四中的一种服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一中的一种搜索结果召回方法的流程图。本实施例提供的搜索结果召回方法可适用于根据用户的查询语句召回并展示搜索结果的情况,该方法具体可以由搜索结果召回装置来执行,该装置可以由软件和/或硬件的方式实现,该装置可以集成在服务器中,参见图1,本发明实施例的方法具体包括:
S110、获取目标用户的查询语句。
其中,所述查询语句为目标用户向查询输入框中输入的查询文本,可以为词语、短语或句子等。服务器获取目标用户输入的查询语句,从而根据查询语句得到搜索结果。
S120、从全网数据中召回与所述查询语句符合文本相似度规则的第一召回列表。
其中,所述文本相似度规则用于计算两个文本之间的相关性,例如,对于查询语句中的每个词,计算其与搜索结果的相关性,并进行加权求和得到查询语句与搜索结果的相关性得分。相关性得分越高,则说明查询语句与搜索结果的相关性越高,即搜索结果越符合查询语句的查询条件。在本发明实施例中,服务器从全网数据中召回与查询语句符合文本相似度规则的搜索结果,示例性的,服务器获取查询语句后经过分解得到分词,再对各分词进行向量扩词,得到各分词的扩词,检索器通过网页链接池于数据库中获取与查询语句中的分词以及分词扩词符合文本相似度规则的搜索结果,根据搜索结果确定第一召回列表,从而准确得到与查询语句语义相符的网页搜索结果,以保证搜索结果的准确性。
可选的,从全网数据中召回与所述查询语句符合文本相似度规则的第一召回列表,包括:结合目标用户的用户特征,从全网数据中召回符合所述用户特征,并且与所述查询语句符合文本相似度规则的第一召回列表。具体的,为了使搜索结果具备准确性的同时实现个性化展示,满足不同目标用户的需求,因此在本发明实施例中,服务器结合目标用户的用户特征,例如用户画像、用户行为等,搜索与查询语句符合文本相似度规则的第一召回列表。
S130、从预先确定的召回结果数据库中,召回所述查询语句的第二召回列表。
其中,所述召回结果数据库中存储有基于用户行为确定的历史查询语句及其对应的召回列表,并且所述历史查询语句及其对应的召回列表不符合所述文本相似度规则。
具体的,在根据查询语句获得搜索结果时,若只召回与查询语句符合文本相似度规则的搜索结果,则会导致最终的结果中遗漏虽然与查询语句不符合文本相似度规则,但是却符合用户历史行为的搜索结果,例如被用户多次选中为搜索结果的部分列表。另外,不同的用户输入相同的查询语句时,根据文本相似度规则得到的搜索结果相同,不能实现根据不同用户的特征的实际需求进行个性化的搜索结果展示。因此,在本发明实施例中,预先基于不同用户的用户行为确定历史查询语句及其对应的召回列表,并存储于召回结果数据库中。服务器获取到目标用户的查询语句后,于召回结果数据库中召回查询语句相对应的召回列表作为第二召回列表。其中,历史查询语句与其对应的召回列表不符合文本相似度规则,即第二召回列表中的搜索结果为与查询语句不符合文本相似度规则,但是符合用户历史行为的搜索结果,例如为该用户历史查询期间所选中查看的搜索结果。因此,通过召回第二召回列表,对第一召回列表进行补充,从而使搜索结果更具全面性,并且能够根据用户的行为实现搜索结果的个性化召回和展示。
S140、融合所述第一召回列表和第二召回列表,作为所述查询语句的召回结果。
如图2所示,具体的,为了向用户展示完整的搜索结果,因此将第一召回列表与第二召回列表进行融合,作为查询语句的召回结果,以使召回结果满足用户的个性化需求且便于用户查看。可选的,融合方式可以为将第一召回列表排于第二召回列表前面,也可以为将第二召回列表排于第一召回列表前面,也可以将第一召回列表和第二召回列表中的各搜索结果分数汇总后排序,按照排序排列后得到召回结果。
本实施例的技术方案,从全网数据中召回与所述查询语句符合文本相似度规则的第一召回列表;从预先确定的召回结果数据库中,召回所述查询语句的第二召回列表,其中,所述召回结果数据库中存储有基于用户行为确定的历史查询语句及其对应的召回列表,并且所述历史查询语句及其对应的召回列表不符合所述文本相似度规则;融合所述第一召回列表和第二召回列表,作为所述查询语句的召回结果。通过上述方案能够准确召回与查询语句符合文本相似度规则的结果,并且能够召回与查询语句不符合文本相似度规则但符合用户历史行为的结果,经合并得到的召回结果更加全面且符合用户特征,使得搜索结果的个性化展示成为可能。
实施例二
图3是本发明实施例二中的一种搜索结果召回方法的流程图。本实施例在上述实施例的基础上进行了优化,未在本实施例中详细描述的细节详见上述实施例。参见图3,本实施例提供的搜索结果召回方法可以包括:
S210、获取目标用户的查询语句。
S220、从全网数据中召回与所述查询语句符合文本相似度规则的第一召回列表。
可选的,该方法还包括:将第一召回列表写入缓存;响应于其他用户的搜索请求,根据该其他用户输入的查询语句和该其他用户的用户特征,与缓存中第一召回列表对应的查询语句和用户特征的相似度,判断是否命中缓存;如果命中缓存,则从缓存中召回该其他用户输入的查询语句的第一召回列表。
具体的,当召回的第一召回列表内容较多时,会导致检索时耗费的时间较长,若用户每次查询时,服务器均从新进行召回,则会降低召回效率,影响搜索结果展示的及时性。因此,在本发明实施例中,服务器召回第一召回列表后,将其写入缓存,并自定义设置失效时长。当接收到其他用户的搜索请求时,根据其他用户的查询语句和用户特征,以及缓存中第一召回列表对应的查询语句和用户特征的相似度,判断缓存中是否存储有与其他用户输入的查询语句相对应的第一召回列表,如果缓存中存储有与其他用户的查询语句相对应的第一召回列表,则服务器直接从缓存中进行召回,不需要再次根据检索器进行检索召回,从而提高了召回效率,节省了搜索时间。
S230、从预先确定的召回结果数据库中,召回所述查询语句的第二召回列表。
其中,所述召回结果数据库中存储有基于用户行为确定的历史查询语句及其对应的召回列表,并且所述历史查询语句及其对应的召回列表不符合所述文本相似度规则。
可选的,所述召回结果数据库的创建过程包括:利用预先训练的召回模型,通过分析用户对搜索结果的历史行为数据,挖掘出满足如下条件的搜索结果,并将该搜索结果及其对应的查询语句存储在所述召回结果数据库中:与对应的查询语句不符合所述文本相似度规则;并且作为至少两个文本不相似的查询语句所对应的搜索结果出现;并且针对所述至少两个文本不相似的查询语句的搜索请求,预设数量的用户对该搜索结果进行预设触发操作。
具体的,可能会存在搜索结果与查询语句不符合文本相似度规则,但是该搜索结果曾被大量用户选中查看,属于目标用户所需要的个性化搜索结果,若只召回与目标用户的查询语句符合相似度规则的查询语句,则会遗漏掉该搜索结果,因此,在本发明实施例中,预先训练召回模型,挖掘出第一召回列表中遗漏的搜索结果。可选的,所述召回模型是按照如下算法中的至少之一进行训练得到:CTR(Click Through Rate,点击通过率)预估、矩阵分解机、协同过滤或集成算法。
具体的,挖掘的搜索结果满足条件:与对应的查询语句不符合所述文本相似度规则;并且作为至少两个文本不相似的查询语句所对应的搜索结果出现;并且针对所述至少两个文本不相似的查询语句的搜索请求,预设数量的用户对该搜索结果进行预设触发操作。例如,查询语句a与搜索结果B不符合文本相似度规则,但是搜索结果B作为查询语句a的搜索结果出现,且综合排名较低,因此在进行列表召回的过程中,很可能会遗漏搜索结果B。查询语句a与查询语句b为不相似的文本,搜索结果B作为查询语句b的搜索结果出现,在用户的历史查询中,有预设数量的用户对该搜索结果B进行了预设触发操作,其中,预设数量和预设触发操作可以由技术人员根据实际情况进行设定。例如,有80%以上的用户均点击过搜索结果B进行查看,说明搜索结果B为用户感兴趣的搜索结果,因此将该搜索结果召回,并与查询语句对应存储于召回结果数据库中,以便在目标用户进行查询过程中进行召回。通过召回模型挖掘易被遗漏的搜索结果,从而使根据查询语句召回的结果列表更加全面、准确,符合用户的历史查看兴趣,从而进行个性化展示搜索结果。
S240、融合所述第一召回列表和第二召回列表,作为所述查询语句的召回结果。
S250、利用排序模型,结合目标用户的用户特征,对所述召回结果进行排序,得到符合用户特征的搜索结果网页列表。
其中,所述排序模型是依据用户画像和用户行为的历史数据进行训练得到。
具体的,服务器确定召回结果后,为了使用户更感兴趣的搜索结果展示于列表的前面,以便用户优先查看,因此对召回结果利用排序模型并结合目标用户的用户特征进行排序,从而得到符合用户特征的搜索结果列表展示给用户,实现搜索结果的个性化展示。
S260、向目标用户展示所述搜索结果网页列表。
本发明实施例的技术方案,通过召回模型挖掘易被遗漏的搜索结果,从而使根据查询语句召回的结果列表更加全面、准确,符合用户的历史查看兴趣,从而进行个性化展示搜索结果。通过依据排序模型结合而用户特征对召回结果进行排序,从而使搜索结果网页列表更符合用户的行为特征和兴趣特征,从而实现搜索结果的个性化展示。
实施例三
图4为本发明实施例三提供的一种搜索结果召回装置结构示意图。该装置适用于根据用户的查询语句召回并展示搜索结果的情况,该装置可以由软件和/或硬件实现,并具体可集成在服务器中。参见图4,该装置具体包括:
查询获取模块310,用于获取目标用户的查询语句;
第一召回模块320,用于从全网数据中召回与所述查询语句符合文本相似度规则的第一召回列表;
第二召回模块330,用于从预先确定的召回结果数据库中,召回所述查询语句的第二召回列表,其中,所述召回结果数据库中存储有基于用户行为确定的历史查询语句及其对应的召回列表,并且所述历史查询语句及其对应的召回列表不符合所述文本相似度规则;
融合模块340,用于融合所述第一召回列表和第二召回列表,作为所述查询语句的召回结果。
可选的,所述第一召回模块320,具体用于:
结合目标用户的用户特征,从全网数据中召回符合所述用户特征,并且与所述查询语句符合文本相似度规则的第一召回列表。
可选的,所述召回结果数据库的创建过程包括:
挖掘模块,用于利用预先训练的召回模型,通过分析用户对搜索结果的历史行为数据,挖掘出满足如下条件的搜索结果,并将该搜索结果及其对应的查询语句存储在所述召回结果数据库中:
与对应的查询语句不符合所述文本相似度规则;并且
作为至少两个文本不相似的查询语句所对应的搜索结果出现;并且
针对所述至少两个文本不相似的查询语句的搜索请求,预设数量的用户对该搜索结果进行预设触发操作。
可选的,所述召回模型是按照如下算法中的至少之一进行训练得到:CTR预估、矩阵分解机、协同过滤或集成算法。
可选的,还包括:
缓存写入模块,用于将第一召回列表写入缓存。
判断模块,用于响应于其他用户的搜索请求,根据该其他用户输入的查询语句和该其他用户的用户特征,与缓存中第一召回列表对应的查询语句和用户特征的相似度,判断是否命中缓存。
缓存召回模块,用于如果命中缓存,则从缓存中召回该其他用户输入的查询语句的第一召回列表。
可选的,还包括:
排序模块,用于利用排序模型,结合目标用户的用户特征,对所述召回结果进行排序,得到符合用户特征的搜索结果网页列表,其中,所述排序模型是依据用户画像和用户行为的历史数据进行训练得到;
展示模块,用于向目标用户展示所述搜索结果网页列表。
本发明实施例的技术方案,查询有获取模块获取目标用户的查询语句;第一召回模块从全网数据中召回与所述查询语句符合文本相似度规则的第一召回列表;第二召回模块从预先确定的召回结果数据库中,召回所述查询语句的第二召回列表,其中,所述召回结果数据库中存储有基于用户行为确定的历史查询语句及其对应的召回列表,并且所述历史查询语句及其对应的召回列表不符合所述文本相似度规则;融合模块融合所述第一召回列表和第二召回列表,作为所述查询语句的召回结果。通过上述方案能够准确召回与查询语句符合文本相似度规则的结果,并且能够召回与查询语句不符合文本相似度规则但符合用户历史行为的结果,经合并得到的召回结果更加全面且符合用户特征,使得搜索结果的个性化展示成为可能。
实施例四
图5是本发明实施例四提供的一种服务器的结构示意图。图5示出了适于用来实现本发明实施例的示例性服务器412的框图。图5显示的服务器412仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,服务器412包括:一个或多个处理器416;存储器428,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器416执行,使得所述一个或多个处理器416实现本发明实施例所提供的搜索结果召回方法,包括:
获取目标用户的查询语句;
从全网数据中召回与所述查询语句符合文本相似度规则的第一召回列表;
从预先确定的召回结果数据库中,召回所述查询语句的第二召回列表,其中,所述召回结果数据库中存储有基于用户行为确定的历史查询语句及其对应的召回列表,并且所述历史查询语句及其对应的召回列表不符合所述文本相似度规则;
融合所述第一召回列表和第二召回列表,作为所述查询语句的召回结果。
以通用服务器的形式表现。服务器412的组件可以包括但不限于:一个或者多个处理器或者处理器416,系统存储器428,连接不同系统组件(包括系统存储器428和处理器416)的总线418。
总线418表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
服务器412典型地包括多种计算机系统可读存储介质。这些存储介质可以是任何能够被服务器412访问的可用存储介质,包括易失性和非易失性存储介质,可移动的和不可移动的存储介质。
系统存储器428可以包括易失性存储器形式的计算机系统可读存储介质,例如随机存取存储器(RAM)430和/或高速缓存存储器432。服务器412可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统434可以用于读写不可移动的、非易失性磁存储介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光存储介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据存储介质接口与总线418相连。存储器428可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块442的程序/实用工具440,可以存储在例如存储器428中,这样的程序模块462包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块462通常执行本发明所描述的实施例中的功能和/或方法。
服务器412也可以与一个或多个外部服务器414(例如键盘、指向服务器、显示器426等)通信,还可与一个或者多个使得用户能与该服务器412交互的服务器通信,和/或与使得该服务器412能与一个或多个其它计算服务器进行通信的任何服务器(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口422进行。并且,服务器412还可以通过网络适配器420与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器420通过总线418与服务器412的其它模块通信。应当明白,尽管图中未示出,可以结合服务器412使用其它硬件和/或软件模块,包括但不限于:微代码、服务器驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器416通过运行存储在系统存储器428中的多个程序中其他程序的至少一个,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的一种搜索结果召回方法,包括:
获取目标用户的查询语句;
从全网数据中召回与所述查询语句符合文本相似度规则的第一召回列表;
从预先确定的召回结果数据库中,召回所述查询语句的第二召回列表,其中,所述召回结果数据库中存储有基于用户行为确定的历史查询语句及其对应的召回列表,并且所述历史查询语句及其对应的召回列表不符合所述文本相似度规则;
融合所述第一召回列表和第二召回列表,作为所述查询语句的召回结果。
实施例五
本发明实施例五还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种搜索结果召回方法:
获取目标用户的查询语句;
从全网数据中召回与所述查询语句符合文本相似度规则的第一召回列表;
从预先确定的召回结果数据库中,召回所述查询语句的第二召回列表,其中,所述召回结果数据库中存储有基于用户行为确定的历史查询语句及其对应的召回列表,并且所述历史查询语句及其对应的召回列表不符合所述文本相似度规则;
融合所述第一召回列表和第二召回列表,作为所述查询语句的召回结果。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的存储介质的任意组合。计算机可读存储介质可以是计算机可读信号存储介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明实施例中,计算机可读存储介质可以是任何包含或存储程序的有形存储介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号存储介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读存储介质上包含的程序代码可以用任何适当的存储介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种搜索结果召回方法,其特征在于,所述方法包括:
获取目标用户的查询语句;
从全网数据中召回与所述查询语句符合文本相似度规则的第一召回列表;
从预先确定的召回结果数据库中,召回所述查询语句的第二召回列表,其中,所述召回结果数据库中存储有基于用户行为确定的历史查询语句及其对应的召回列表,并且所述历史查询语句及其对应的召回列表不符合所述文本相似度规则;
融合所述第一召回列表和第二召回列表,作为所述查询语句的召回结果。
2.根据权利要求1所述的方法,其特征在于,从全网数据中召回与所述查询语句符合文本相似度规则的第一召回列表,包括:
结合目标用户的用户特征,从全网数据中召回符合所述用户特征,并且与所述查询语句符合文本相似度规则的第一召回列表。
3.根据权利要求1或2所述的方法,其特征在于,所述召回结果数据库的创建过程包括:
利用预先训练的召回模型,通过分析用户对搜索结果的历史行为数据,挖掘出满足如下条件的搜索结果,并将该搜索结果及其对应的查询语句存储在所述召回结果数据库中:
与对应的查询语句不符合所述文本相似度规则;并且
作为至少两个文本不相似的查询语句所对应的搜索结果出现;并且
针对所述至少两个文本不相似的查询语句的搜索请求,预设数量的用户对该搜索结果进行预设触发操作。
4.根据权利要求3所述的方法,其特征在于,所述召回模型是按照如下算法中的至少之一进行训练得到:CTR预估、矩阵分解机、协同过滤或集成算法。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
将第一召回列表写入缓存;
响应于其他用户的搜索请求,根据该其他用户输入的查询语句和该其他用户的用户特征,与缓存中第一召回列表对应的查询语句和用户特征的相似度,判断是否命中缓存;
如果命中缓存,则从缓存中召回该其他用户输入的查询语句的第一召回列表。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
利用排序模型,结合目标用户的用户特征,对所述召回结果进行排序,得到符合用户特征的搜索结果网页列表,其中,所述排序模型是依据用户画像和用户行为的历史数据进行训练得到;
向目标用户展示所述搜索结果网页列表。
7.一种搜索结果召回装置,其特征在于,所述装置包括:
查询获取模块,用于获取目标用户的查询语句;
第一召回模块,用于从全网数据中召回与所述查询语句符合文本相似度规则的第一召回列表;
第二召回模块,用于从预先确定的召回结果数据库中,召回所述查询语句的第二召回列表,其中,所述召回结果数据库中存储有基于用户行为确定的历史查询语句及其对应的召回列表,并且所述历史查询语句及其对应的召回列表不符合所述文本相似度规则;
融合模块,用于融合所述第一召回列表和第二召回列表,作为所述查询语句的召回结果。
8.根据权利要求7所述的装置,其特征在于,所述第一召回模块,具体用于:
结合目标用户的用户特征,从全网数据中召回符合所述用户特征,并且与所述查询语句符合文本相似度规则的第一召回列表。
9.一种服务器,其特征在于,所述服务器包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的一种搜索结果召回方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的一种搜索结果召回方法。
CN201910389174.4A 2019-05-10 2019-05-10 搜索结果召回方法、装置、服务器及存储介质 Active CN110083688B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910389174.4A CN110083688B (zh) 2019-05-10 2019-05-10 搜索结果召回方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910389174.4A CN110083688B (zh) 2019-05-10 2019-05-10 搜索结果召回方法、装置、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN110083688A true CN110083688A (zh) 2019-08-02
CN110083688B CN110083688B (zh) 2022-03-25

Family

ID=67419633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910389174.4A Active CN110083688B (zh) 2019-05-10 2019-05-10 搜索结果召回方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN110083688B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442718A (zh) * 2019-08-08 2019-11-12 腾讯科技(深圳)有限公司 语句处理方法、装置及服务器和存储介质
CN111241388A (zh) * 2019-12-13 2020-06-05 北京三快在线科技有限公司 多策略召回方法、装置、电子设备及可读存储介质
CN111475409A (zh) * 2020-03-30 2020-07-31 深圳追一科技有限公司 系统测试方法、装置、电子设备以及存储介质
CN111625706A (zh) * 2020-05-22 2020-09-04 北京百度网讯科技有限公司 信息检索方法、装置、设备及存储介质
CN111694929A (zh) * 2020-05-29 2020-09-22 平安科技(深圳)有限公司 基于数据图谱的搜索方法、智能终端和可读存储介质
CN111708949A (zh) * 2020-06-19 2020-09-25 微医云(杭州)控股有限公司 医疗资源的推荐方法及装置、电子设备、存储介质
CN111782748A (zh) * 2020-06-28 2020-10-16 北京百度网讯科技有限公司 地图检索方法、信息点poi语义向量的计算方法和装置
CN113094604A (zh) * 2021-04-15 2021-07-09 支付宝(杭州)信息技术有限公司 搜索结果排序方法、搜索方法及装置
CN113641721A (zh) * 2021-10-13 2021-11-12 中航信移动科技有限公司 一种机票展示方法、装置、电子设备及存储介质
CN113763081A (zh) * 2020-08-26 2021-12-07 北京沃东天骏信息技术有限公司 一种物品的召回方法和装置
CN114443989A (zh) * 2022-01-30 2022-05-06 北京百度网讯科技有限公司 排序方法、排序模型的训练方法、装置、电子设备及介质
CN115357691A (zh) * 2022-10-21 2022-11-18 成都数之联科技股份有限公司 一种语义检索方法及系统、设备和计算机可读存储介质
CN115563394A (zh) * 2022-11-24 2023-01-03 腾讯科技(深圳)有限公司 搜索召回方法、召回模型训练方法、装置和计算机设备

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103023931A (zh) * 2011-09-20 2013-04-03 希姆通信息技术(上海)有限公司 用户终端的内容共享方法、系统及用户终端、共享服务器
US20130138696A1 (en) * 2011-11-30 2013-05-30 The Institute for System Programming of the Russian Academy of Sciences Method to build a document semantic model
CN105069106A (zh) * 2015-08-07 2015-11-18 小米科技有限责任公司 应用群组推荐方法和装置
CN105117383A (zh) * 2015-08-14 2015-12-02 百度在线网络技术(北京)有限公司 一种提供搜索结果的方法与装置
CN106407346A (zh) * 2016-09-06 2017-02-15 百度在线网络技术(北京)有限公司 基于人工智能的检索处理方法和装置
CN107491518A (zh) * 2017-08-15 2017-12-19 北京百度网讯科技有限公司 一种搜索召回方法和装置、服务器、存储介质
CN108038541A (zh) * 2017-12-07 2018-05-15 百度在线网络技术(北京)有限公司 Ctr预估的方法、装置、设备及计算机可读介质
CN108183902A (zh) * 2017-12-28 2018-06-19 北京奇虎科技有限公司 一种恶意网站的识别方法和装置
CN108733848A (zh) * 2018-06-11 2018-11-02 百应科技(北京)有限公司 一种搜索知识的方法及系统
CN108763502A (zh) * 2018-05-30 2018-11-06 腾讯科技(深圳)有限公司 信息推荐方法和系统
CN108921221A (zh) * 2018-07-04 2018-11-30 腾讯科技(深圳)有限公司 用户特征的生成方法、装置、设备及存储介质
CN109034941A (zh) * 2018-06-13 2018-12-18 平安科技(深圳)有限公司 产品推荐方法、装置、计算机设备和存储介质
CN109241455A (zh) * 2018-08-28 2019-01-18 北京三快在线科技有限公司 一种推荐对象的展示方法及装置
US20190034792A1 (en) * 2017-07-25 2019-01-31 Linkedin Corporation Semantic similarity for machine learned job posting result ranking model
CN109658206A (zh) * 2019-01-14 2019-04-19 京东方科技集团股份有限公司 信息推荐方法和装置

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103023931A (zh) * 2011-09-20 2013-04-03 希姆通信息技术(上海)有限公司 用户终端的内容共享方法、系统及用户终端、共享服务器
US20130138696A1 (en) * 2011-11-30 2013-05-30 The Institute for System Programming of the Russian Academy of Sciences Method to build a document semantic model
CN105069106A (zh) * 2015-08-07 2015-11-18 小米科技有限责任公司 应用群组推荐方法和装置
CN105117383A (zh) * 2015-08-14 2015-12-02 百度在线网络技术(北京)有限公司 一种提供搜索结果的方法与装置
CN106407346A (zh) * 2016-09-06 2017-02-15 百度在线网络技术(北京)有限公司 基于人工智能的检索处理方法和装置
US20190034792A1 (en) * 2017-07-25 2019-01-31 Linkedin Corporation Semantic similarity for machine learned job posting result ranking model
CN107491518A (zh) * 2017-08-15 2017-12-19 北京百度网讯科技有限公司 一种搜索召回方法和装置、服务器、存储介质
CN108038541A (zh) * 2017-12-07 2018-05-15 百度在线网络技术(北京)有限公司 Ctr预估的方法、装置、设备及计算机可读介质
CN108183902A (zh) * 2017-12-28 2018-06-19 北京奇虎科技有限公司 一种恶意网站的识别方法和装置
CN108763502A (zh) * 2018-05-30 2018-11-06 腾讯科技(深圳)有限公司 信息推荐方法和系统
CN108733848A (zh) * 2018-06-11 2018-11-02 百应科技(北京)有限公司 一种搜索知识的方法及系统
CN109034941A (zh) * 2018-06-13 2018-12-18 平安科技(深圳)有限公司 产品推荐方法、装置、计算机设备和存储介质
CN108921221A (zh) * 2018-07-04 2018-11-30 腾讯科技(深圳)有限公司 用户特征的生成方法、装置、设备及存储介质
CN109241455A (zh) * 2018-08-28 2019-01-18 北京三快在线科技有限公司 一种推荐对象的展示方法及装置
CN109658206A (zh) * 2019-01-14 2019-04-19 京东方科技集团股份有限公司 信息推荐方法和装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442718B (zh) * 2019-08-08 2023-12-08 腾讯科技(深圳)有限公司 语句处理方法、装置及服务器和存储介质
CN110442718A (zh) * 2019-08-08 2019-11-12 腾讯科技(深圳)有限公司 语句处理方法、装置及服务器和存储介质
CN111241388A (zh) * 2019-12-13 2020-06-05 北京三快在线科技有限公司 多策略召回方法、装置、电子设备及可读存储介质
CN111475409A (zh) * 2020-03-30 2020-07-31 深圳追一科技有限公司 系统测试方法、装置、电子设备以及存储介质
CN111475409B (zh) * 2020-03-30 2023-06-30 深圳追一科技有限公司 系统测试方法、装置、电子设备以及存储介质
CN111625706A (zh) * 2020-05-22 2020-09-04 北京百度网讯科技有限公司 信息检索方法、装置、设备及存储介质
CN111694929A (zh) * 2020-05-29 2020-09-22 平安科技(深圳)有限公司 基于数据图谱的搜索方法、智能终端和可读存储介质
CN111694929B (zh) * 2020-05-29 2023-04-07 平安科技(深圳)有限公司 基于数据图谱的搜索方法、智能终端和可读存储介质
CN111708949A (zh) * 2020-06-19 2020-09-25 微医云(杭州)控股有限公司 医疗资源的推荐方法及装置、电子设备、存储介质
CN111708949B (zh) * 2020-06-19 2023-07-25 微医云(杭州)控股有限公司 医疗资源的推荐方法及装置、电子设备、存储介质
CN111782748A (zh) * 2020-06-28 2020-10-16 北京百度网讯科技有限公司 地图检索方法、信息点poi语义向量的计算方法和装置
CN111782748B (zh) * 2020-06-28 2024-01-12 北京百度网讯科技有限公司 地图检索方法、信息点poi语义向量的计算方法和装置
CN113763081A (zh) * 2020-08-26 2021-12-07 北京沃东天骏信息技术有限公司 一种物品的召回方法和装置
CN113094604A (zh) * 2021-04-15 2021-07-09 支付宝(杭州)信息技术有限公司 搜索结果排序方法、搜索方法及装置
CN113641721A (zh) * 2021-10-13 2021-11-12 中航信移动科技有限公司 一种机票展示方法、装置、电子设备及存储介质
CN113641721B (zh) * 2021-10-13 2022-03-04 中航信移动科技有限公司 一种机票展示方法、装置、电子设备及存储介质
CN114443989A (zh) * 2022-01-30 2022-05-06 北京百度网讯科技有限公司 排序方法、排序模型的训练方法、装置、电子设备及介质
CN115357691A (zh) * 2022-10-21 2022-11-18 成都数之联科技股份有限公司 一种语义检索方法及系统、设备和计算机可读存储介质
CN115563394A (zh) * 2022-11-24 2023-01-03 腾讯科技(深圳)有限公司 搜索召回方法、召回模型训练方法、装置和计算机设备

Also Published As

Publication number Publication date
CN110083688B (zh) 2022-03-25

Similar Documents

Publication Publication Date Title
CN110083688A (zh) 搜索结果召回方法、装置、服务器及存储介质
US11625406B2 (en) Website scoring system
CN111177569B (zh) 基于人工智能的推荐处理方法、装置及设备
CN109087135B (zh) 用户意图的挖掘方法及装置、计算机设备及可读介质
US10902077B2 (en) Search result aggregation method and apparatus based on artificial intelligence and search engine
US9569541B2 (en) Evaluating preferences of content on a webpage
US7702611B2 (en) Method for automatically performing conceptual highlighting in electronic text
US10977317B2 (en) Search result displaying method and apparatus
CN102239491A (zh) 用于建议的改进词语和纵向搜索的预览搜索结果技术
WO2020123689A1 (en) Suggesting text in an electronic document
CN113544689A (zh) 为文档的来源观点生成并提供附加内容
CN109214417A (zh) 用户意图的挖掘方法及装置、计算机设备及可读介质
AU2018250372A1 (en) Method to construct content based on a content repository
CN111309215A (zh) Unity中滑动列表的处理方法、装置、设备和存储介质
CN112307365A (zh) 信息显示方法、装置、电子设备及存储介质
US20210271637A1 (en) Creating descriptors for business analytics applications
CN110677482A (zh) 一种推送信息的方法、设备和计算机存储介质
CN112883218A (zh) 一种图文联合表征的搜索方法、系统、服务器和存储介质
CN116975359A (zh) 资源处理方法、资源推荐方法、装置和计算机设备
CN111222918B (zh) 关键词挖掘方法、装置、电子设备及存储介质
CN112802454A (zh) 一种唤醒词的推荐方法、装置、终端设备及存储介质
KR102256903B1 (ko) 중요 뉴스를 선별하여 화면 상에 표시할 수 있는 홈 로봇 장치 및 그 동작 방법
KR102624046B1 (ko) 사용자 맞춤형 강의 매칭 서비스 제공 장치 및 방법
CN112417310B (zh) 建立智能服务索引以及推荐智能服务的方法
CN110516024B (zh) 地图搜索结果展现方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant