CN113806519A - 一种搜索召回方法、装置及介质 - Google Patents

一种搜索召回方法、装置及介质 Download PDF

Info

Publication number
CN113806519A
CN113806519A CN202111124486.6A CN202111124486A CN113806519A CN 113806519 A CN113806519 A CN 113806519A CN 202111124486 A CN202111124486 A CN 202111124486A CN 113806519 A CN113806519 A CN 113806519A
Authority
CN
China
Prior art keywords
recall
search
result
query
results
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111124486.6A
Other languages
English (en)
Inventor
张炜
何洋
胡鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kingdee Software China Co Ltd
Original Assignee
Kingdee Software China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kingdee Software China Co Ltd filed Critical Kingdee Software China Co Ltd
Priority to CN202111124486.6A priority Critical patent/CN113806519A/zh
Publication of CN113806519A publication Critical patent/CN113806519A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种搜索召回方法、装置及介质,包括:获取用户需要搜索的查询词,并通过基于词匹配的召回方式对查询词进行召回得到召回结果,若获得的召回结果满足预先设定的准确率条件,则在搜索条件中增加影响召回结果的影响因子并展开新的召回,其中,影响因子为与查询词相对应的标签和/或类别。由此可见,本发明所提供的技术方案,通过基于词匹配的召回方式对查询词进行召回以保证召回结果的查准率,当召回结果是否满足预设的准确率条件时,在查询条件中增加影响召回结果的影响因子并展开新的召回以保证召回结果的查全率,由此既保证了召回结果的准确性同时兼顾了召回结果的丰富性,提升用户的搜索体验感。

Description

一种搜索召回方法、装置及介质
技术领域
本发明涉及互联网技术领域,特别是涉及一种搜索召回方法、装置及介质。
背景技术
搜索场景在互联网技术中是非常重要的组成部分,搜索召回的结果的准确性和丰富性直接影响着用户的搜索体验感,当前,最常用的搜索方式为基于词的搜索召回方式,在查询过程中,直接采用用于信息检索与数据挖掘的常用加权技术(term frequency–inverse document frequency,简称TF-IDF)对查询词和文档的关联度进行匹配计算,获取到查准率高的结果,此时结果往往不够丰富,即查全率低。或者可以采用TF-IDF算法,利用搜索词的标签和文档的标签进行匹配,获取到查全率足够高的结果,但是此时查准率的部分正确性会被标签掩盖导致查准率低。
因此,目前常用的基于词的搜索召回手段,无法同时满足查准率和查全率,准确度高的情况下,结果往往不够丰富,满足丰富度的情况下,又会导致准确性低。
由此可见,在搜索过程中如何保证查准率的情况下兼顾查全率,是本领域技术人员亟待解决的问题。
发明内容
本发明的目的是提供一种搜索召回方法、装置及介质,保证用户在搜索召回时,得到的召回结果满足查准率的同时也可以兼顾查全率,提升用户搜索体验感。
为解决上述技术问题,本发明提供一种搜索召回方法,包括:
获取查询词;
通过基于词匹配的召回方式对所述查询词进行召回得到召回结果;
若所述召回结果满足准确率条件,则在查询条件中增加影响所述召回结果的影响因子展开新的召回,其中,所述影响因子为与所述查询词对应的标签和/或类别。
优选地,所述准确率条件为召回结果为空。
优选地,所述增加影响所述召回结果的影响因子包括:
从预先设定的关联库中,获取与所述查询词相对应的全部所述影响因子。
优选地,所述关联库的设定包括:
依据各所述查询词预先要求的查全率,预先设定所述关联库。
优选地,所述搜索召回方法还包括:
每隔预设周期,对所述关联库进行更新。
优选地,所述通过基于词匹配的召回方式对所述查询词进行召回得到召回结果包括:
建立基于查准率的排序模型,并对所述查询词进行召回得到所述召回结果;
依据所述排序模型,对所述召回结果进行排序。
优选地,在所述建立基于查准率的排序模型之前还包括:
根据不同的业务需求,对搜索引擎中的文档结果配置对应的业务字段以便于提升所述召回结果的排名。
为了解决上述技术问题,本发明还提供了一种搜索召回装置,包括:
获取模块,用于获取查询词;
召回模块,用于通过基于词匹配的召回方式对所述查询词进行召回得到召回结果;
增加模块,用于若所述召回结果满足准确率条件,则在查询条件中增加影响所述召回结果的影响因子展开新的召回,其中,所述影响因子为与所述查询词对应的标签和/或类别。
为了解决上述技术问题,本发明还提供了一种搜索召回装置,包括存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如所述的搜索召回方法的步骤。
为了解决上述技术问题,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如所述的搜索召回方法的步骤。
本发明所提供的一种搜索召回方法,包括:获取用户需要搜索的查询词,并通过基于词匹配的召回方式对查询词进行召回得到召回结果,若获得的召回结果满足预先设定的准确率条件,则在搜索条件中增加影响召回结果的影响因子并展开新的召回,其中,影响因子为与查询词相对应的标签和/或类别。由此可见,本发明所提供的技术方案,通过基于词匹配的召回方式对查询词进行召回以保证召回结果的查准率,当召回结果是否满足预设的准确率条件时,在查询条件中增加影响召回结果的影响因子并展开新的召回以保证召回结果的查全率,由此既保证了召回结果的准确性同时兼顾了召回结果的丰富性,提升用户的搜索体验感。
此外,本发明所提供的搜索召回装置及介质与上述搜索召回方法对应,效果同上。
附图说明
为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的搜索召回方法的流程图;
图2为本发明实施例所提供的搜索召回装置的结构图;
图3为本发明另一实施例提供的一种搜索召回装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
本发明的核心是提供一种搜索召回方法、装置及介质,在用户搜索召回的过程中,保证召回结果满足查全率的同时又可以兼顾查准率,即召回结果满足准确率的同时兼顾丰富性,提高用户的搜索体验感。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
随着互联网的快速发展,搜索引擎的功能越来越强大,搜索场景在互联网技术中占据非常重要的地位,搜索召回的结果是否准确且丰富直接影响着用户的搜索体验感。目前,最常使用的搜索召回手段为基于词匹配的召回方式,该召回方式直接通过TF-IDF算法对查询词和结果文档的关联度进行匹配计算,从而获得准确率高的召回结果,但是在保证准确率的情况下召回结果往往不够丰富,即查全率低。当采用TF-IDF算法,利用搜索词的标签和结果文档的标签进行匹配,获取到查全率足够高的召回结果时,召回结果的部分正确性又会被标签掩盖导致查准率低。由此可见,目前通过基于词匹配的召回方式对查询词进行召回获得的召回结果无法同时满足查准率和查全率。
为了解决搜索过程中无法满足查准率的同时兼顾查全率的问题,本发明提出了一种搜索召回方法,首先,通过基于词匹配的召回方式对查询词进行召回以保证召回结果的查准率,当召回结果的满足准确率条件时,则在查询条件中增加影响召回结果的影响因子并展开新的召回以保证召回结果的丰富性,其中,影响因子为与查询词相对应的标签和/或类别。从而,既保证了搜索召回结果的准确性又保证了结果的丰富性,提高了用户的搜索体验感。
图1为本发明实施例所提供的搜索召回方法的流程图,如图1所示,该方法包括:
S10:获取查询词。
S11:通过基于词匹配的召回方式对查询词进行召回得到召回结果。
S12:若召回结果满足准确率条件,则在查询条件中增加影响召回结果的影响因子展开新的召回。
在具体实施例中,当用户有搜索召回的需求时,首先获取到用户需要搜索的查询词,并通过基于词匹配的召回方式,采用TF-IDF算法对该查询词和结果文档的关联度进行匹配计算,从而获得准确率高的召回结果,当召回结果满足准确率条件时,在查询条件中增加影响召回结果的影响因子并展开新的召回,从而保证召回结果的丰富性。需要说明的是,满足准确率的条件为召回结果为空,即当未获得召回结果时保证召回结果的准确率。
在实施例中,优先保证查准率后,表示召回结果足够准确,在召回结果足够准确的条件下,需要扩充结果的丰富性,则在查询条件中通过增加影响因子并展开新的召回以保证查全率,进而同时保证召回结果的准确性和丰富性。需要说明的是,影响召回结果的影响因子为与查询词对应的标签和/或类别,而影响因子从关联库中获得,其中,关联库为人工手动维护的关于查询词与各查询词相对应的标签或类别。关联库可以是定期进行更新,也可以是出现新的查询词与其对应的标签和类别,或者查询词对应的标签和类别有新的产生时就对关联库进行更新,对于关联库的更新方式,本发明对此不作限定,优选定期更新。
本发明提供的搜索召回方法,优先保证查准率后,在查询条件中通过增加影响因子并展开新的召回进而保证查全率,因此影响因子直接关系到召回结果的丰富性,所以在维护关联库时,就要依旧每个查询词需要的丰富度设置其对应的标签和类别数量。
当然,为了进一步保证查询词的准确性,利用TF-IDF算法对查询词和结果文档的关联度进行匹配计算的同时,建立基于查准率的排序模型,在查询词与结果文档进行匹配的过程中,根据不同业务的不同业务字段对召回结果增加得分,影响召回结果的最终得分,获得各召回结果的得分后,对各召回结果进行排序,以便于获得准确率高的召回结果。值得注意的是,业务字段为根据不同的业务需求,对搜索引擎中的文档结果设定对应的字段标志,通过判断查询词对应的业务字段是否满足要求来影响该业务字段对应的文档结果的打分及排名。
本发明所提供的一种搜索召回方法,包括:获取用户需要搜索的查询词,并通过基于词匹配的召回方式对查询词进行召回得到召回结果,若获得的召回结果满足预先设定的准确率条件,则在搜索条件中增加影响召回结果的影响因子并展开新的召回,其中,影响因子为与查询词相对应的标签和/或类别。由此可见,本发明所提供的技术方案,通过基于词匹配的召回方式对查询词进行召回以保证召回结果的查准率,当召回结果是否满足预设的准确率条件时,在查询条件中增加影响召回结果的影响因子并展开新的召回以保证召回结果的查全率,由此既保证了召回结果的准确性同时兼顾了召回结果的丰富性,提升用户的搜索体验感。
在具体实施例中,为了保证用户的搜索结果满足查准率的同时又满足查全率,首先采用基于词匹配的召回方式对查询词进行召回保证召回结果的准确性,若召回结果满足准确率条件,则在查询条件中增加影响召回结果的影响因子并展开新的召回以保证召回结果的丰富性,其中,召回结果满足的准确率条件为召回结果为空。当召回结果为空时,表示查询词的召回结果准确率很高,此时,在查询条件中再增加影响因子展开新的召回,在高准确率的情况下扩充召回结果的丰富性,由此满足召回结果的查准率和查全率。
本发明实施例所提供的搜索召回方法,将准确率条件设置为召回结果为空,由此保证采用基于词匹配的召回方式进行召回的召回结果的准确性,以便于在查询条件中增加影响因子展开新的召回以保证查询的丰富性,进而既保证了召回结果的准确性也保证了丰富性,提高了用户的搜索体验感。
在上述实施例的基础上,为了能快速获取与查询词相对应的影响因子,则预先设定由各查询词以及与各查询词相对应的标签和类别组成的关联库,各查询词对应的标签和类别均称为影响召回结果的影响因子。例如,当查询词为“孙俪”时,对应的影响因子可以为影视、演员、明星、中国人等,再例如,当查询词为“清华”,对应的影响因子有教育、高等学府、世界排名等。当保证了召回结果的查准率后,从关联库中获取与查询词对应的影响因子并展开新的召回以提升召回结果的查全率。需要说明的是,为了保证召回结果足够丰富,因此增加影响召回结果的影响因子时,应当获取关联库中与查询词对应的全部影响因子。
本发明实施例所提供的搜索召回方法,通过从预先设定的关联库中获取与各查询词相对应的全部影响因子并展开新的召回来保证召回结果的丰富性,既可以快速获取到准确的影响因子,同时可以通过调整关联库中各查询词对应的影响因子的个数来改变召回结果的丰富性,该方法既容易实现且能快速获得丰富性高的召回结果,进而提升用户的搜索体验感。
在具体实施例中,扩充召回结果的丰富性主要通过在查询条件中增加影响结果的全部影响因子以影响召回结果的丰富性,影响因子为关联库中与查询词相对应的标签和类别,因此,若要改变各查询词召回结果的丰富性,可以通过改变关联库中各查询词对应的标签和类别数量以改变召回结果的查全率。需要说明的是,在预先设定关联库时,对于不同的查询词可以根据预先要求的查全率,通过设定不同数量的与各查询词对应的影响因子以实现相应的丰富性。当然,也可以根据实际的业务需求,改变关联库中的影响因子数量来改变各查询词的丰富性。
本发明实施例所提供的搜索召回方法,可以根据预先设定的查全率来维护关联库中各查询词对应的影响因子的数量,以实现不同查询词的不同查全率,进而既保证召回结果的准确性的同时还可以保证预设的查全率,提升用户体验感。
在上述实施例中,考虑到时代的不断变化,会出现很多新的查询词以及与新查询词相对应的影响因子,因此,需要对关联库进行更新。需要说明的是,对于关联库的更新,可以是每隔预设周期进行一次更新,例如,每隔一周或一个月对关联库进行一次更新。也可以在关联库新增查询词以及与新增查询词对应的影响因子,或新增已有查询词对应的影响因子时,就对关联库进行一次更新,对此本发明不作限定。
本发明实施例所提供的搜索召回方法,通过不断更新关联库以保证各查询词随着时代的变化依旧能保证丰富性,同时还可以避免出现新的词汇时,无法保证召回结果的丰富性,进一步提升用户的搜索体验感。
在具体实施例中,为了进一步保证搜索召回的召回结果的准确性,通过基于词匹配的召回方式进行召回的同时,建立基于查准率的排序模型。当获取到用户的查询词后,对搜索引擎中每个待检索文档构建倒排索引,并对查询词进行分词,利用TF-IDF算法对查询词的分词结果与待检索文的倒排索引进行关联性匹配计算得到召回结果,然后依据基于查准率的排序模型,影响召回结果的得分并对召回结果进行排序,从而获得准确性高的召回结果。
本发明实施例所提供的搜索召回方法,通过建立基于查准率的排序模型,对召回结果进行增加得分并排序以便获得准确率高的召回结果,进一步保证了召回结果的查准率,以便于后续对召回结果丰富性的扩充,提升用户体验感。
在上述实施例的基础上,考虑到能快速判别各召回结果是否可以增加得分,则根据不同的业务需求,对搜素引擎中的文档配置对应的业务字段以便于提升召回结果的排名,进而保证召回结果的准确率。为了便于理解,下面将举例说明。
例如,在一系列的企业文档中,有的是通过工商认证,有些是三无企业,当对搜索引擎的文档标志为是否为工商认证时,若是工商认证则得分加一,若不是工商认证则不改变得分,对于是否为工商认证的标志,可以是数字、中文或英文等,对此本发明不作限定,例如,1标志为工商认证,0标志为非工商认证,当基于查准率的排序模型对召回结果进行处理,识别到数字1时,确定召回结果为工商认证,则对于工商认证的召回结果进行加分以便于在排序过程中提升排名。因此,在基于词匹配的召回方式中,标志为工商认证的字段增加最终打分,并在排序过程中影响排序结果,进而保证搜索结果的准确性。
本发明实施例所提供的搜索召回方法,通过对搜素引擎中的文档配置对应的业务字段,进而可以根据召回结果的字段标志快速判别各召回结果是否增加得分,并对增加得分后的各召回结果进行排序以获取准确率高的召回结果。
在上述实施例中,对于一种搜索召回方法进行了详细描述,本发明还提供一种搜索召回装置对应的实施例。需要说明的是,本发明从两个角度对装置部分的实施例进行描述,一种是基于功能模块的角度,另一种是基于硬件结构的角度。
图2为本发明实施例所提供的搜索召回装置的结构图,如图2所示,该装置包括:
获取模块10,用于获取查询词。
召回模块11,用于通过基于词匹配的召回方式对查询词进行召回得到召回结果。
增加模块12,用于若召回结果满足准确率条件,则在查询条件中增加影响召回结果的影响因子展开新的召回,其中,影响因子为与查询词对应的标签和/或类别。
作为优选的实施方式,该装置还包括更新模块和配置模块,更新模块用于每隔预设周期,对关联库进行更新,配置模块用于根据不同的业务需求,对搜索引擎中的文档结果配置对应的业务字段以便于提升召回结果的排名。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本发明所提供的一种搜索召回装置,包括:获取用户需要搜索的查询词,并通过基于词匹配的召回方式对查询词进行召回得到召回结果,若获得的召回结果满足预先设定的准确率条件,则在搜索条件中增加影响召回结果的影响因子并展开新的召回,其中,影响因子为与查询词相对应的标签和/或类别。由此可见,本发明所提供的技术方案,通过基于词匹配的召回方式对查询词进行召回以保证召回结果的查准率,当召回结果是否满足预设的准确率条件时,在查询条件中增加影响召回结果的影响因子并展开新的召回以保证召回结果的查全率,由此既保证了召回结果的准确性同时兼顾了召回结果的丰富性,提升用户的搜索体验感。
图3为本发明另一实施例提供的一种搜索召回装置的结构图,如图3所示,搜索召回装置包括:存储器20,用于存储计算机程序;
处理器21,用于执行计算机程序时实现如上述实施例所提到的一种搜索召回装置的步骤。
本实施例提供的搜索召回装置可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。
其中,处理器21可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器21可以采用数字信号处理(Digital Signal Processing,简称DSP)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)、可编程逻辑阵列(ProgrammableLogic Array,简称PLA)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(Central Processing Unit,简称CPU);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以在集成有图像处理器(GraphicsProcessing Unit,简称GPU),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器21还可以包括人工智能(Artificial Intelligence,简称AI)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器20可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器20还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器20至少用于存储以下计算机程序201,其中,该计算机程序被处理器21加载并执行之后,能够实现前述任一实施例公开的搜索召回方法的相关步骤。另外,存储器20所存储的资源还可以包括操作系统202和数据203等,存储方式可以是短暂存储或者永久存储。其中,操作系统202可以包括Windows、Unix、Linux等。数据203可以包括但不限于在搜索召回中涉及的相关数据等。
在一些实施例中,搜索召回装置还可包括有显示屏22、输入输出接口23、通信接口24、电源25以及通信总线26。
本领域技术人员可以理解,图3中示出的结构并不构成对搜索召回装置的限定,可以包括比图示更多或更少的组件。
本发明实施例提供的搜索召回装置,包括存储器和处理器,处理器在执行存储器存储的程序时,能够实现如下方法:搜索召回方法。
本发明实施例提供的搜索召回装置,在用户搜索召回过程中,既保证了召回结果的准确性又兼顾了召回结果的丰富性,提高了用户的搜索体验感。
最后,本发明还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。
可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本发明所提供的一种搜索召回方法、装置及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种搜索召回方法,其特征在于,包括:
获取查询词;
通过基于词匹配的召回方式对所述查询词进行召回得到召回结果;
若所述召回结果满足准确率条件,则在查询条件中增加影响所述召回结果的影响因子展开新的召回,其中,所述影响因子为与所述查询词对应的标签和/或类别。
2.根据权利要求1所述的搜索召回方法,其特征在于,所述准确率条件为召回结果为空。
3.根据权利要求1所述的搜索召回方法,其特征在于,所述增加影响所述召回结果的影响因子包括:
从预先设定的关联库中,获取与所述查询词相对应的全部所述影响因子。
4.根据权利要求3所述的搜索召回方法,其特征在于,所述关联库的设定包括:
依据各所述查询词预先要求的查全率,预先设定所述关联库。
5.根据权利要求4所述的搜索召回方法,其特征在于,还包括:
每隔预设周期,对所述关联库进行更新。
6.根据权利要求1所述的搜索召回方法,其特征在于,所述通过基于词匹配的召回方式对所述查询词进行召回得到召回结果包括:
建立基于查准率的排序模型,并对所述查询词进行召回得到所述召回结果;
依据所述排序模型,对所述召回结果进行排序。
7.根据权利要求6所述的搜索召回方法,其特征在于,在所述建立基于查准率的排序模型之前还包括:
根据不同的业务需求,对搜索引擎中的文档结果配置对应的业务字段以便于提升所述召回结果的排名。
8.一种搜索召回装置,其特征在于,包括:
获取模块,用于获取查询词;
召回模块,用于通过基于词匹配的召回方式对所述查询词进行召回得到召回结果;
增加模块,用于若所述召回结果满足准确率条件,则在查询条件中增加影响所述召回结果的影响因子展开新的召回,其中,所述影响因子为与所述查询词对应的标签和/或类别。
9.一种搜索召回装置,其特征在于,包括存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的搜索召回方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的搜索召回方法的步骤。
CN202111124486.6A 2021-09-24 2021-09-24 一种搜索召回方法、装置及介质 Pending CN113806519A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111124486.6A CN113806519A (zh) 2021-09-24 2021-09-24 一种搜索召回方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111124486.6A CN113806519A (zh) 2021-09-24 2021-09-24 一种搜索召回方法、装置及介质

Publications (1)

Publication Number Publication Date
CN113806519A true CN113806519A (zh) 2021-12-17

Family

ID=78896726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111124486.6A Pending CN113806519A (zh) 2021-09-24 2021-09-24 一种搜索召回方法、装置及介质

Country Status (1)

Country Link
CN (1) CN113806519A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114282965A (zh) * 2021-12-21 2022-04-05 唯品会(广州)软件有限公司 召回方案评估方法、装置及计算机设备

Citations (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010056359A1 (en) * 2000-02-11 2001-12-27 Abreu Marcio Marc System and method for communicating product recall information, product warnings or other product-related information to users of products
US20090287674A1 (en) * 2008-05-15 2009-11-19 International Business Machines Corporation Method for Enhancing Search and Browsing in Collaborative Tagging Systems Through Learned Tag Hierachies
GB201002575D0 (en) * 2009-02-18 2010-03-31 Avaya Inc A system and method for generating queries
CA2999672A1 (en) * 2009-01-30 2010-08-05 Lexisnexis Methods and systems for creating and using an adaptive thesaurus
CN103853771A (zh) * 2012-12-03 2014-06-11 百度在线网络技术(北京)有限公司 一种搜索结果的推送方法及系统
CN106202127A (zh) * 2015-05-08 2016-12-07 深圳市腾讯计算机系统有限公司 一种垂直搜索引擎对检索请求的处理方法及装置
CN106326259A (zh) * 2015-06-26 2017-01-11 苏宁云商集团股份有限公司 搜索引擎中商品标签的构建方法、系统及搜索方法和系统
CN107491518A (zh) * 2017-08-15 2017-12-19 北京百度网讯科技有限公司 一种搜索召回方法和装置、服务器、存储介质
US20180089325A1 (en) * 2016-09-26 2018-03-29 Alibaba Group Holding Limited Method, Apparatus and Client of Processing Information Recommendation
US20180137195A1 (en) * 2015-08-03 2018-05-17 Baidu Online Network Technology (Beijing) Co. Ltd. Search method and apparatus
CN110020094A (zh) * 2017-07-14 2019-07-16 阿里巴巴集团控股有限公司 一种搜索结果的展示方法和相关装置
CN110222709A (zh) * 2019-04-29 2019-09-10 上海暖哇科技有限公司 一种多标签智能打标方法及系统
CN110929125A (zh) * 2019-11-15 2020-03-27 腾讯科技(深圳)有限公司 搜索召回方法、装置、设备及其存储介质
CN111241400A (zh) * 2020-01-14 2020-06-05 北京字节跳动网络技术有限公司 一种信息搜索方法及装置
CN111400546A (zh) * 2020-03-18 2020-07-10 腾讯科技(深圳)有限公司 一种视频召回方法、视频推荐方法及装置
CA3168294A1 (en) * 2019-01-16 2020-07-23 10353744 Canada Ltd. Method of and device for enlarging commodity search recall
CN111667056A (zh) * 2020-06-05 2020-09-15 北京百度网讯科技有限公司 用于搜索模型结构的方法和装置
CN111708890A (zh) * 2020-07-09 2020-09-25 腾讯科技(深圳)有限公司 一种搜索词确定方法和相关装置
CN111881666A (zh) * 2020-07-09 2020-11-03 腾讯科技(深圳)有限公司 一种信息处理方法、装置、设备及存储介质
CN112232915A (zh) * 2019-12-23 2021-01-15 北京来也网络科技有限公司 结合rpa与ai的商品推荐方法和装置
CN112559763A (zh) * 2020-12-09 2021-03-26 用友网络科技股份有限公司 搜索结果召回方法、装置和可读存储介质
CN112685650A (zh) * 2021-01-26 2021-04-20 政采云有限公司 一种商品搜索的方法、系统、设备及可读存储介质
CN112711717A (zh) * 2021-03-26 2021-04-27 北京三快在线科技有限公司 房间产品搜索方法、装置、电子设备
CN112925883A (zh) * 2021-02-19 2021-06-08 北京百度网讯科技有限公司 搜索请求处理方法、装置、电子设备及可读存储介质
CN113157727A (zh) * 2021-05-24 2021-07-23 腾讯音乐娱乐科技(深圳)有限公司 提供召回结果的方法、设备和存储介质
CN113312476A (zh) * 2021-02-03 2021-08-27 珠海卓邦科技有限公司 一种文本自动打标签方法及其装置和终端

Patent Citations (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010056359A1 (en) * 2000-02-11 2001-12-27 Abreu Marcio Marc System and method for communicating product recall information, product warnings or other product-related information to users of products
US20090287674A1 (en) * 2008-05-15 2009-11-19 International Business Machines Corporation Method for Enhancing Search and Browsing in Collaborative Tagging Systems Through Learned Tag Hierachies
CA2999672A1 (en) * 2009-01-30 2010-08-05 Lexisnexis Methods and systems for creating and using an adaptive thesaurus
GB201002575D0 (en) * 2009-02-18 2010-03-31 Avaya Inc A system and method for generating queries
CN103853771A (zh) * 2012-12-03 2014-06-11 百度在线网络技术(北京)有限公司 一种搜索结果的推送方法及系统
CN106202127A (zh) * 2015-05-08 2016-12-07 深圳市腾讯计算机系统有限公司 一种垂直搜索引擎对检索请求的处理方法及装置
CN106326259A (zh) * 2015-06-26 2017-01-11 苏宁云商集团股份有限公司 搜索引擎中商品标签的构建方法、系统及搜索方法和系统
US20180137195A1 (en) * 2015-08-03 2018-05-17 Baidu Online Network Technology (Beijing) Co. Ltd. Search method and apparatus
US20180089325A1 (en) * 2016-09-26 2018-03-29 Alibaba Group Holding Limited Method, Apparatus and Client of Processing Information Recommendation
CN110020094A (zh) * 2017-07-14 2019-07-16 阿里巴巴集团控股有限公司 一种搜索结果的展示方法和相关装置
CN107491518A (zh) * 2017-08-15 2017-12-19 北京百度网讯科技有限公司 一种搜索召回方法和装置、服务器、存储介质
CA3168294A1 (en) * 2019-01-16 2020-07-23 10353744 Canada Ltd. Method of and device for enlarging commodity search recall
CN110222709A (zh) * 2019-04-29 2019-09-10 上海暖哇科技有限公司 一种多标签智能打标方法及系统
CN110929125A (zh) * 2019-11-15 2020-03-27 腾讯科技(深圳)有限公司 搜索召回方法、装置、设备及其存储介质
CN112232915A (zh) * 2019-12-23 2021-01-15 北京来也网络科技有限公司 结合rpa与ai的商品推荐方法和装置
CN111241400A (zh) * 2020-01-14 2020-06-05 北京字节跳动网络技术有限公司 一种信息搜索方法及装置
CN111400546A (zh) * 2020-03-18 2020-07-10 腾讯科技(深圳)有限公司 一种视频召回方法、视频推荐方法及装置
CN111667056A (zh) * 2020-06-05 2020-09-15 北京百度网讯科技有限公司 用于搜索模型结构的方法和装置
CN111708890A (zh) * 2020-07-09 2020-09-25 腾讯科技(深圳)有限公司 一种搜索词确定方法和相关装置
CN111881666A (zh) * 2020-07-09 2020-11-03 腾讯科技(深圳)有限公司 一种信息处理方法、装置、设备及存储介质
CN112559763A (zh) * 2020-12-09 2021-03-26 用友网络科技股份有限公司 搜索结果召回方法、装置和可读存储介质
CN112685650A (zh) * 2021-01-26 2021-04-20 政采云有限公司 一种商品搜索的方法、系统、设备及可读存储介质
CN113312476A (zh) * 2021-02-03 2021-08-27 珠海卓邦科技有限公司 一种文本自动打标签方法及其装置和终端
CN112925883A (zh) * 2021-02-19 2021-06-08 北京百度网讯科技有限公司 搜索请求处理方法、装置、电子设备及可读存储介质
CN112711717A (zh) * 2021-03-26 2021-04-27 北京三快在线科技有限公司 房间产品搜索方法、装置、电子设备
CN113157727A (zh) * 2021-05-24 2021-07-23 腾讯音乐娱乐科技(深圳)有限公司 提供召回结果的方法、设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MARIN BERTIER: "Toward personalized query expansion", 《PROCEEDINGS OF THE SECOND ACM EUROSYS WORKSHOP ON SOCIAL NETWORK SYSTEMS MARCH 2009》, pages 7 - 12 *
丁发梅: "一种改进Best-First 算法的主题爬虫搜索算法", 《信息通信》, no. 148, pages 64 - 66 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114282965A (zh) * 2021-12-21 2022-04-05 唯品会(广州)软件有限公司 召回方案评估方法、装置及计算机设备

Similar Documents

Publication Publication Date Title
CN111881307B (zh) 一种演示文稿生成方法、装置、计算机设备及存储介质
CN109190049B (zh) 关键词推荐方法、系统、电子设备和计算机可读介质
US9767183B2 (en) Method and system for enhanced query term suggestion
JP2024516666A (ja) 検索結果表示方法、装置、機器及び媒体
US9934293B2 (en) Generating search results
US20180081880A1 (en) Method And Apparatus For Ranking Electronic Information By Similarity Association
US20130339001A1 (en) Spelling candidate generation
US20140379719A1 (en) System and method for tagging and searching documents
WO2014206151A1 (en) System and method for tagging and searching documents
US10268655B2 (en) Method, device, server and storage medium of searching a group based on social network
CN114610845B (zh) 基于多系统的智能问答方法、装置和设备
CN113326420B (zh) 问题检索方法、装置、电子设备和介质
CN113407814B (zh) 文本搜索方法、装置、可读介质及电子设备
US20230087460A1 (en) Preventing the distribution of forbidden network content using automatic variant detection
CN112740202A (zh) 使用内容标签执行图像搜索
CN114595686A (zh) 知识抽取方法、知识抽取模型的训练方法及装置
CN114330329A (zh) 一种业务内容搜索方法、装置、电子设备及存储介质
CN113806519A (zh) 一种搜索召回方法、装置及介质
CN114297143A (zh) 一种搜索文件的方法、显示文件的方法、装置及移动终端
CN111858581A (zh) 一种分页查询的方法、装置、存储介质和电子设备
CN111159408A (zh) 一种文本数据标注方法、装置、计算机装置及计算机可读存储介质
CN112685540A (zh) 搜索方法、装置、存储介质以及终端
CN113157964A (zh) 一种语音搜索数据集的方法、装置及电子设备
CN109978645B (zh) 一种数据推荐方法和装置
CN113763005A (zh) 图片广告推送方法、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination