CN112597396A - 搜索召回排序方法、系统及计算机可读存储介质 - Google Patents

搜索召回排序方法、系统及计算机可读存储介质 Download PDF

Info

Publication number
CN112597396A
CN112597396A CN202011611479.4A CN202011611479A CN112597396A CN 112597396 A CN112597396 A CN 112597396A CN 202011611479 A CN202011611479 A CN 202011611479A CN 112597396 A CN112597396 A CN 112597396A
Authority
CN
China
Prior art keywords
search
sorting
ranking
score
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011611479.4A
Other languages
English (en)
Inventor
高阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen TCL New Technology Co Ltd
Original Assignee
Shenzhen TCL New Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen TCL New Technology Co Ltd filed Critical Shenzhen TCL New Technology Co Ltd
Priority to CN202011611479.4A priority Critical patent/CN112597396A/zh
Publication of CN112597396A publication Critical patent/CN112597396A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种搜索召回排序方法、系统及计算机可读存储介质,所述方法包括:根据用户终端发送的搜索请求生成搜索关键词;对所述搜索关键词进行分析,并根据分析结果生成排序规则;根据所述搜索关键词获取搜索结果,并通过排序规则计算每个搜索结果的最终评分;根据每个搜索结果的最终评分对搜索结果进行排序,并将排序后的搜索结果返回至用户终端。本发明能够通过分析用户的搜索请求,生成更为合适的排序规则,并通过该排序规则对搜索结果进行排序,从而使得排序后的搜索结果更为符合用户的需求。

Description

搜索召回排序方法、系统及计算机可读存储介质
技术领域
本发明涉及搜索技术领域,尤其涉及一种搜索召回排序方法、系统及计算机可读存储介质。
背景技术
搜索场景作为互联网业务场景中的重要组成部分,用户在搜索时所召回的搜索结果的好坏将会直接影响到用户的互联网使用体验。在显示搜索召回结果时,召回的结果能否直接满足用户的需求或者给用户带来意外惊喜是召回结果排序方式的重要衡量标准。
在现有的召回排序方式中,以影视资源搜索为例,用户所搜索到的影视资源仅通过几个简单的属性进行叠加排列。虽然在屏幕显示中各个影视资源按照顺序排列显示,但往往排在前列的影视资源无法满足用户的需求,使得用户需要翻阅更多搜索结果以寻找所需求的影视资源。
发明内容
本发明的主要目的在于提供一种搜索召回排序方法、系统及计算机可读存储介质,旨在解决现有的搜索召回排序无法满足用户需求的问题。
为实现上述目的,本发明提供一种搜索召回排序方法,包括以下步骤:
根据用户终端发送的搜索请求生成搜索关键词;
对所述搜索关键词进行分析,并根据分析结果生成排序规则;
根据所述搜索关键词获取搜索结果,并通过排序规则计算每个搜索结果的最终评分;
根据每个搜索结果的最终评分对搜索结果进行排序,并将排序后的搜索结果返回至用户终端。
可选地,所述对所述搜索关键词进行分析,并根据分析结果生成排序规则的步骤包括:
对所述搜索关键词进行分析,以获取排序调整信息,所述排序调整信息用于调整预设的通用排序逻辑;
根据所述排序调整信息与预设的通用排序逻辑生成排序规则。
可选地,所述通用排序逻辑包括多个预设排序维度以及每个预设排序维度对应的评分权重;所述根据所述排序调整信息与预设的通用排序逻辑生成排序规则的步骤包括:
判断所述排序调整信息是否与所述通用排序逻辑中的排序维度匹配;
若所述排序调整信息与所述通用排序逻辑中的排序维度匹配,则根据所述排序调整信息对所述通用排序逻辑中每个排序维度对应的评分权重进行调整,以生成排序规则;
若所述排序调整信息与所述通用排序逻辑中的排序维度不匹配,则根据所述排序调整信息生成对应的评分权重,并根据所述排序调整信息及其对应的评分权重以及所述通用排序逻辑生成排序规则,其中,排序规则包括多个排序维度以及每个排序维度对应的评分权重。
可选地,所述通过排序规则计算每个搜索结果的最终评分的步骤包括:
根据所述排序规则的每个排序维度,从每个搜索结果的参数信息中得到每个搜索结果对应到每个排序维度的得分信息;
根据每个搜索结果对应到每个排序维度的得分信息和每个排序维度对应的评分权重计算得到每个搜索结果的最终评分。
可选地,所述根据每个搜索结果对应到每个排序维度的得分信息和每个排序维度对应的评分权重计算得到每个搜索结果的最终评分的步骤包括:
获取每个搜索结果对应的相关度评分;
根据每个搜索结果对应到每个排序维度的得分信息和每个排序维度对应的评分权重计算得到每个搜索结果的非相关度评分;
根据每个搜索结果的非相关度评分和相关度评分生成最终评分。
可选地,所述根据每个搜索结果的最终评分对搜索结果进行排序的步骤包括:
从所有搜索结果中确定名称相关度相同的多个搜索结果,其中,名称相关度相同的多个搜索结果为同一资源在多个资源平台中对应的搜索结果;
获取用户终端在每个资源平台的附加服务属性;
根据每个搜索结果对应的最终评分对搜索结果进行初步排序;
根据所述附加服务属性对初步排序中名称相关度相同的多个搜索结果进行排序调整。
可选地,所述根据每个搜索结果的最终评分对搜索结果进行排序的步骤之后,还包括:
获取预设的二次排序规则;
根据所述二次排序规则从所有搜索结果中确定待调整结果,并对所述待调整结果进行排序调整。
可选地,所述根据用户终端发送的搜索请求生成搜索关键词的步骤之前,还包括:
接收用户终端发送的规则编辑指令,根据所述规则编辑指令编辑所述通用排序逻辑和/或所述二次排序规则。
此外,为实现上述目的,本发明还提供一种搜索召回排序系统,所述搜索召回排序系统包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的搜索召回排序程序,其中:所述搜索召回排序程序被所述处理器执行时实现如上所述的搜索召回排序方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有搜索召回排序程序,所述搜索召回排序程序被处理器执行时实现如上所述的搜索召回排序方法的步骤。
本发明实施例提出的一种搜索召回排序方法、系统及计算机可读存储介质,通过接收用户终端发送的搜索请求,能够通过对搜索请求进行自然语言处理得到对应的搜索关键词。根据搜索关键词不仅能够通过搜索引擎获取到搜索结果,还能够对搜索关键词进行分析以生成适用于此次搜索过程的排序规则。通过该排序规则能够对每个搜索结果进行评分的计算,以得到每个搜索结果的最终评分,并按照最终评分对搜索结果进行排序。通过分析用户的搜索请求,能够生成更为合适的排序规则,并通过该排序规则对搜索结果进行排序,从而使得排序后的搜索结果更为符合用户的需求。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图;
图2为本发明搜索召回排序方法第一实施例的流程示意图;
图3为本发明搜索召回排序方法第二实施例的流程示意图;
图4为本发明搜索召回排序方法第三实施例的流程示意图;
图5为本发明搜索召回排序方法第四实施例中步骤S30的细化流程示意图;
图6为本发明搜索召回排序方法第五实施例中步骤S30的细化流程示意图;
图7为本发明搜索召回排序方法第六实施例中步骤S40的细化流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图。
本发明实施例终端可以是搜索召回排序系统,该搜索召回排序系统可以包括设置于云端的搜索服务器,例如基于Elasticsearch分布集群的搜索服务器。
如图1所示,该搜索召回排序系统可以包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选的用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的搜索召回排序系统的结构并不构成对搜索召回排序系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及搜索召回排序程序。
在图1所示的搜索召回排序系统中,网络接口1004主要用于连接数据库,与数据库进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的搜索召回排序程序,并执行以下操作:
根据用户终端发送的搜索请求生成搜索关键词;
对所述搜索关键词进行分析,并根据分析结果生成排序规则;
根据所述搜索关键词获取搜索结果,并通过排序规则计算每个搜索结果的最终评分;
根据每个搜索结果的最终评分对搜索结果进行排序,并将排序后的搜索结果返回至用户终端。
进一步地,处理器1001可以调用存储器1005中存储的搜索召回排序程序,还执行以下操作:
对所述搜索关键词进行分析,以获取排序调整信息,所述排序调整信息用于调整预设的通用排序逻辑;
根据所述排序调整信息与预设的通用排序逻辑生成排序规则。
进一步地,处理器1001可以调用存储器1005中存储的搜索召回排序程序,还执行以下操作:
判断所述排序调整信息是否与所述通用排序逻辑中的排序维度匹配;
若所述排序调整信息与所述通用排序逻辑中的排序维度匹配,则根据所述排序调整信息对所述通用排序逻辑中每个排序维度对应的评分权重进行调整,以生成排序规则;
若所述排序调整信息与所述通用排序逻辑中的排序维度不匹配,则根据所述排序调整信息生成对应的评分权重,并根据所述排序调整信息及其对应的评分权重以及所述通用排序逻辑生成排序规则,其中,排序规则包括多个排序维度以及每个排序维度对应的评分权重。
进一步地,处理器1001可以调用存储器1005中存储的搜索召回排序程序,还执行以下操作:
根据所述排序规则的每个排序维度,从每个搜索结果的参数信息中得到每个搜索结果对应到每个排序维度的得分信息;
根据每个搜索结果对应到每个排序维度的得分信息和每个排序维度对应的评分权重计算得到每个搜索结果的最终评分。
进一步地,处理器1001可以调用存储器1005中存储的搜索召回排序程序,还执行以下操作:
获取每个搜索结果对应的相关度评分;
根据每个搜索结果对应到每个排序维度的得分信息和每个排序维度对应的评分权重计算得到每个搜索结果的非相关度评分;
根据每个搜索结果的非相关度评分和相关度评分生成最终评分。
进一步地,处理器1001可以调用存储器1005中存储的搜索召回排序程序,还执行以下操作:
从所有搜索结果中确定名称相关度相同的多个搜索结果,其中,名称相关度相同的多个搜索结果为同一资源在多个资源平台中对应的搜索结果;
获取用户终端在每个资源平台的附加服务属性;
根据每个搜索结果对应的最终评分对搜索结果进行初步排序;
根据所述附加服务属性对初步排序中名称相关度相同的多个搜索结果进行排序调整。
进一步地,处理器1001可以调用存储器1005中存储的搜索召回排序程序,还执行以下操作:
获取预设的二次排序规则;
根据所述二次排序规则从所有搜索结果中确定待调整结果,并对所述待调整结果进行排序调整。
进一步地,处理器1001可以调用存储器1005中存储的搜索召回排序程序,还执行以下操作:
接收用户终端发送的规则编辑指令,根据所述规则编辑指令编辑所述通用排序逻辑和/或所述二次排序规则。
本发明应用于搜索召回排序系统的具体实施例与下述应用于搜索召回排序方法的各实施例基本相同,在此不作赘述。
请参照图2,图2为本发明搜索召回排序方法第一实施例的流程示意图,其中,所述搜索召回排序方法包括如下步骤:
步骤S10,根据用户终端发送的搜索请求生成搜索关键词;
在本实施例中,搜索召回排序系统中设置有搜索服务器。该搜索服务器可以为基于Elasticsearch的分布式搜索引擎。用户可以通过触发用户终端生成相应的搜索请求,并通过用户终端将该搜索请求发送给搜索服务器。用户的搜索请求可以是文字信息或语音信息。在搜索服务器获取到用户的搜索请求后,可以对该搜索请求进行自然语言处理,通过自然语言处理可以对语音信息进行语音识别以得到对应的文字内容,并对文字内容进行观点提取和语义识别,以提取出搜索请求中的搜索关键词。
步骤S20,对所述搜索关键词进行分析,并根据分析结果生成排序规则;
在获取到用户此次搜索请求所对应的搜索关键词后,可以对搜索关键词进行分析,并根据分析结果生成此次搜索结果对应的排序规则。搜索关键词的数量可以为一个或多个,对于不同的搜索关键词,进行分析后所生成的排序规则并不相同。即,通过对用户发出的搜索请求进行识别分析后,能够根据生成的搜索关键词生成一个适用于此次搜索过程的排序规则。即,在根据搜索请求生成不同的搜索关键词时,能够从搜索关键词的分析结果生成合适的排序规则,满足用户的搜索需求,避免搜索结果的随意排序影响用户的搜索使用体验。
步骤S30,根据所述搜索关键词获取搜索结果,并通过排序规则计算每个搜索结果的最终评分;
在根据用户发出的搜索请求确定搜索关键词后,可以通过搜索服务器中的搜索引擎对搜索关键词进行检索,以从数据库中获取到符合搜索关键词的搜索结果。在确定搜索结果后,可以根据搜索关键词生成的适用于此次搜索过程的排序规则对此次获得的每个搜索结果进行排序评分的计算,以得到每个搜索结果对应的最终评分。
可以理解的是,在生成排序规则后,可以通过ScriptScore方法按照排序规则获取每个搜索结果的相关参数,并根据相关参数计算得到每个搜索结果的最终评分。
步骤S40,根据每个搜索结果的最终评分对搜索结果进行排序,并将排序后的搜索结果返回至用户终端。
在根据搜索关键词获得搜索结果并通过生成的排序规则计算出每个搜索结果的最终评分后,可以通过最终评分对搜索结果进行排序。排序方式可以为按照最终评分的大小顺序对最终评分对应的搜索结果进行排序;也可以是设置最终评分的阈值,将最终评分大于该阈值的搜索结果按照最终评分的大小进行排序。
在根据每个搜索结果的最终评分对搜索结果进行排序后,可以将排序后的搜索结果返回给用户终端,用户终端可以通过返回的排序结果对搜索结果进行排序后显示给用户,从而实现此次搜索召回结果的排序。
在本实施例中,通过接收用户终端发送的搜索请求,能够通过对搜索请求进行自然语言处理得到对应的搜索关键词。根据搜索关键词不仅能够通过搜索引擎获取到搜索结果,还能够对搜索关键词进行分析以生成适用于此次搜索过程的排序规则。通过该排序规则能够对每个搜索结果进行评分的计算,以得到每个搜索结果的最终评分,并按照最终评分对搜索结果进行排序。通过分析用户的搜索请求,能够生成更为合适的排序规则,并通过该排序规则对搜索结果进行排序,从而使得排序后的搜索结果更为符合用户的需求。
进一步的,参照图3,图3为本发明搜索召回排序方法第二实施例的流程示意图,基于上述图2所示的实施例,所述步骤S20,对所述搜索关键词进行分析,并根据分析结果生成排序规则的步骤包括:
步骤S21,对所述搜索关键词进行分析,以获取排序调整信息,所述排序调整信息用于调整预设的通用排序逻辑;
步骤S22,根据所述排序调整信息与预设的通用排序逻辑生成排序规则。
在本实施例中,搜索服务器中预先设置有通用的排序逻辑,在获取到搜索关键词后,可以对搜索关键词进行分析,以生成排序调整信息。通过该排序调整信息能够对通用排序逻辑进行调整,以生成适用于此次搜索过程的排序规则。可以理解的是,在用户发出其他搜索请求时,若生成的搜索关键词与此次搜索请求不同,则生成的排序调整信息也与此次的排序调整信息不同。对于相同的通用排序逻辑,通过不同的排序调整信息进行调整后所生成的特定排序规则也不相同。即,对于不同的搜索请求,所产生的排序规则并不相同。根据搜索关键词所生成的排序规则更为符合此次搜索请求,使得最终生成的排序结果更为符合用户需求。搜索结果的排序方式与用户的搜索请求密切相关,避免了不同的搜索请求采用相同的规则进行排序而导致排序的针对性不足,提升了用户的搜索体验。
进一步的,参照图4,图4为本发明搜索召回排序方法第三实施例的流程示意图,基于上述图3所示的实施例,所述通用排序逻辑包括多个预设排序维度以及每个预设排序维度对应的评分权重;所述步骤S22,根据所述排序调整信息与预设的通用排序逻辑生成排序规则的步骤包括:
步骤S221,判断所述排序调整信息是否与所述通用排序逻辑中的排序维度匹配;
步骤S222,若所述排序调整信息与所述通用排序逻辑中的排序维度匹配,则根据所述排序调整信息对所述通用排序逻辑中每个排序维度对应的评分权重进行调整,以生成排序规则;
步骤S223,若所述排序调整信息与所述通用排序逻辑中的排序维度不匹配,则根据所述排序调整信息生成对应的评分权重,并根据所述排序调整信息及其对应的评分权重以及所述通用排序逻辑生成排序规则,其中,排序规则包括多个排序维度以及每个排序维度对应的评分权重。
在本实施例中,预设的通用排序逻辑中包括多个预设排序维度以及每个预设排序维度对应的评分权重。排序维度可以包括资源日期、资源评分、资源热度、资源集数/季数、资源平台编号、播放时长、更新频率等,还可以是其他用户自定义的维度参数。
在通过对搜索关键词进行分析,并获取到排序调整信息后,可以将排序调整信息与通用排序逻辑中的排序维度进行匹配。若该排序调整信息与通用排序逻辑中的一个或多个排序维度相同,则表示用户在此次搜索请求中希望侧重于该排序调整信息对应的排序维度进行搜索结果的排序。则对于通用排序逻辑中的排序维度,可以将该排序调整信息对应的一个或多个排序维度的评分权重进行调整,以使原有的通用排序逻辑调整为新的排序规则。可以理解的是,根据该新的排序规则,在每个搜索结果的最终评分中,排序调整信息对应的排序维度所占的权重增大,从而使得符合用户需求的搜索结果在这种排序规则下相比于通用排序逻辑的排序规则的序号更为靠前。
在上述实施例中,根据排序调整信息对评分权重的调整方式可以为上调或下调。例如,在分析搜索关键词得到的排序调整信息为热门时,可以对通用排序逻辑中的资源热度的评分权重进行上调,以使排序后的搜索结果中显示更多的热门作品;而在分析搜索关键词得到的排序调整信息为2019年的影片时,则由于搜索得到的影片已经处于2019年范围内,不同的影片在资源日期上的差异较小,则此时需要对通用排序逻辑中的资源日期的评分权重进行下调,以使排序方式更为侧重其他的排序维度。
若该排序调整信息与通用排序逻辑中的排序维度均不相同,则表示用户在此次搜索请求中希望对搜索结果进行排序时能够考虑到该排序调整信息所对应的新的排序维度。服务器可以根据该排序调整信息所对应的排序维度生成其对应的评分权重,并在原有的通用排序逻辑中增加该新的排序维度及其对应的评分权重,从而得到本次搜索中区别于通用排序逻辑的新的排序规则。
可以理解的是,在用户每次进行搜索时,通过每次的搜索请求在通用排序逻辑上进行调整。调整方式可以是不改变原有排序维度,仅改变每个排序维度的评分权重,也可以是在原有的排序维度上新增或删减排序维度,新增的排序维度可以设置其对应的评分权重。此外,调整方式还可以是上述两种方式的结合,即排序调整信息中对应的排序维度既包括原有的通用排序逻辑中的排序维度,也包括新的排序维度时,可以同时对原有排序维度进行调整,并新增或删减排序维度。例如,对于原有的排序维度,可以调整其对应的评分权重;而对于新增的排序维度,可以设置其对应的评分权重后加入排序规则中。
进一步的,参照图5,图5为本发明搜索召回排序方法第四实施例中步骤S30的细化流程示意图,基于上述图4所示的实施例,所述步骤S30,根据所述搜索关键词获取搜索结果,并通过排序规则计算每个搜索结果的最终评分的步骤包括:
步骤S31,根据所述搜索关键词获取搜索结果;
步骤S32,根据所述排序规则的每个排序维度,从每个搜索结果的参数信息中得到每个搜索结果对应到每个排序维度的得分信息;
步骤S33,根据每个搜索结果对应到每个排序维度的得分信息和每个排序维度对应的评分权重计算得到每个搜索结果的最终评分。
在本实施例中,搜索服务器根据用户发送的搜索请求生成搜索关键词后,可以通过搜索关键词进行搜索,以得到相应的搜索结果。每个搜索结果中包含有相应的参数信息。对于排序规则中的每个排序维度,可以从搜索结果中的参数信息中确定对应的得分信息。例如,在用户搜索影视资源时,根据搜索关键词得到的搜索结果为符合搜索关键词的各个影视资源。每个影视资源中包含的参数信息可以为该影视资源的更新日期、评分、点击量(热度)、集数/季数、资源平台方、播放时长、资源码率、字幕属性等。而通用排序逻辑中,可以预先设置有三个排序维度,分别为资源日期、资源评分和资源热度。则对于资源日期,通过搜索结果中的更新日期与当前日期进行得分计算后即可得到资源日期这一排序维度对应的得分信息;对于资源评分,可以直接将搜索结果中的媒体评分作为对应的得分信息;而对于资源热度,通过统计搜索结果中一段时间区间内的点击量即可得到资源热度对应的得分信息。即,通过每个搜索结果中的参数信息即可得到每个搜索结果下不同排序维度分别对应的得分信息。
对于一个搜索结果,在获取到排序规则中每个排序维度对应的得分信息和评分权重后,将每个排序维度的得分信息和评分权重相乘即可得到每个排序维度的评分,将所有排序维度的评分相加后即可得到该搜索结果的最终评分。搜索服务器在根据搜索关键词获取到搜索结果后,即可计算得到每个搜索结果的最终评分,并按照最终评分对获取到的搜索结果进行排序。
进一步的,参照图6,图6为本发明搜索召回排序方法第五实施例中步骤S30的细化流程示意图,基于上述图5所示的实施例,所述步骤S33,根据每个搜索结果对应到每个排序维度的得分信息和每个排序维度对应的评分权重计算得到每个搜索结果的最终评分的步骤包括:
步骤S331,获取每个搜索结果对应的相关度评分;
步骤S332,根据每个搜索结果对应到每个排序维度的得分信息和每个排序维度对应的评分权重计算得到每个搜索结果的非相关度评分;
步骤S333,根据每个搜索结果的非相关度评分和相关度评分生成最终评分。
在本实施例中,每个搜索结果中根据排序规则对每个排序维度的得分信息和评分权重进行乘积运算后,所有排序维度的评分之和即为每个搜索结果的非相关度评分。搜索服务器还可以从搜索结果中获取到该搜索结果对应的相关度评分。搜索结果的最终评分即为其相关度评分和非相关度评分之和。
可以理解的是,每个搜索结果同样可以包括有多个维度的相关度,如名称维度、作者维度、地区维度、标签维度和简介维度等。在获取到多个维度的相关度后,不同维度可以对应不同的评分权重,将每个维度的相关度与评分权重的乘积进行累加后,即可得到该搜索结果最终的相关度评分。
进一步的,参照图7,图7为本发明搜索召回排序方法第六实施例中步骤S40的细化流程示意图,基于上述图6所示的实施例,所述步骤S40,根据每个搜索结果的最终评分对搜索结果进行排序,并将排序后的搜索结果返回至用户终端的步骤包括:
步骤S41,从所有搜索结果中确定名称相关度相同的多个搜索结果,其中,名称相关度相同的多个搜索结果为同一资源在多个资源平台中对应的搜索结果;
步骤S42,获取用户终端在每个资源平台的附加服务属性;
步骤S43,根据每个搜索结果对应的最终评分对搜索结果进行初步排序;
步骤S44,根据所述附加服务属性对初步排序中名称相关度相同的多个搜索结果进行排序调整,并将排序后的搜索结果返回至用户终端。
在本实施例中,用户可以通过搜索请求搜索到多个不同的资源平台下的搜索结果。以影视资源为例,用户可以搜索到同一影视资源在多个不同的资源平台下的搜索结果。每个搜索结果中对应有多个维度的相关度,可以理解的是,对于不同的资源平台下的同一影视资源,其每个搜索结果中,片名或名称的相关度是相同的。即,当多个搜索结果对应的名称相关度相同时,表示该多个搜索结果为同一影视资源在不同资源平台下的搜索结果。
可以理解的是,搜索服务器中预先设置有不同资源平台分别对应的优先度。在搜索到同一影视资源的多个搜索结果时,根据每个搜索结果对应的不同资源平台,可以确定每个搜索结果分别对应的平台优先度。在对搜索结果进行排序时,该同一影视资源下的多个搜索结果之间可以按照其对应的平台优先度进行排序。例如,若搜索到同一影视资源在腾讯、爱奇艺、小米、优酷和芒果等资源平台下的多个搜索结果,则根据每个资源平台对应的优先度对该多个搜索结果进行排序。
搜索服务器在接收到用户的搜索请求时,还可以获取到用户在每个资源平台对应的附加服务属性。其中,该附加服务属性可以为资源平台的平台会员。即,搜索服务器根据用户在不同资源平台所对应的附加服务属性,可以确定用户是否为该资源平台的会员。在确定用户具有其中一个或多个资源平台的会员时,则在搜索服务器根据每个搜索结果对应的最终评分对搜索结果进行初步排序后,还可以对初步排序中名称相关度相同的多个搜索结果进行排序调整。即,在同一影视资源下的多个搜索结果中,若用户具有某个资源平台的会员,则该资源平台的搜索结果调整为多个搜索结果中的最前排序,以使用户能够优先获取到该资源平台下的搜索结果。
进一步的,在本发明搜索召回排序方法第七实施例中,基于上述图3所示的实施例,所述步骤S40,根据每个搜索结果的最终评分对搜索结果进行排序,并将排序后的搜索结果返回至用户终端的步骤包括:
步骤S45,根据每个搜索结果的最终评分对搜索结果进行排序;
步骤S46,获取预设的二次排序规则;
步骤S47,根据所述二次排序规则从所有搜索结果中确定待调整结果,对所述待调整结果进行排序调整,并将排序后的搜索结果返回至用户终端。
在本实施例中,搜索服务器中还可以预先设置二次排序规则,在搜索服务器根据每个搜索结果对应的最终评分对搜索结果进行排序后,还可以通过二次排序规则确定搜索结果中需要进行排序位置调整的搜索结果作为待调整结果,并对这些待调整结果的序号进行调整。例如,通过在搜索服务器中设置一个二次排序规则,可以在用户搜索机器人类型的影视资源时,将“变形金刚”等广泛知名的影视资源调整至排序中靠前的位置进行显示。
可以理解的是,二次排序规则并非对所有搜索结果进行重新排序,而是将满足二次排序规则的搜索结果在根据最终评分进行排序后进行排序调整。并且,二次排序规则可以由用户或搜索服务器提供商进行编辑和修改,通过增加二次排序规则,能够在按照最终评分对搜索结果进行排序后,通过对搜索结果的排序进行调整,为用户显示更为具有针对性的排序结果。
进一步的,在本发明搜索召回排序方法第八实施例中,基于上述第七实施例,所述步骤S10,根据用户终端发送的搜索请求生成搜索关键词的步骤之前,还包括:
步骤S50,接收用户终端发送的规则编辑指令,根据所述规则编辑指令编辑所述通用排序逻辑和/或所述二次排序规则。
在本实施例中,用户可以通过用户终端向搜索服务器发送规则编辑指令,搜索服务器在接收到该规则编辑指令后,可以根据改规则编辑指令编辑通用排序逻辑或二次排序规则。可以理解的是,在规则编辑指令中包含有用户ID,搜索服务器在从规则编辑指令中获取到用户ID时,可以根据用户ID建立与用户对应的排序规则。即搜索服务器仅对用户ID所对应的通用排序逻辑或二次排序规则进行编辑修改,而不影响其他用户的通用排序逻辑或二次排序规则。
在一实施例中,以影视资源搜索为例,通用排序逻辑中包括的排序维度包括资源日期、资源评分和资源热度,则根据排序规则计算每个搜索结果的最终评分的计算公式为:
score=μ*(α*Iy+β*Is+γ*Ih)+boost*Iu;
其中,Iy,Is,Ih,Iu分别为资源日期、资源评分和资源热度的得分信息,Iu为每个搜索结果对应的相关度;α、β、γ分别为资源日期、资源评分和资源热度的评分权重;μ为非相关度评分的评分权重,boost为相关度评分的评分权重。即μ*(α*Iy+β*Is+γ*Ih)为搜索结果的非相关度评分,boost*Iu则为搜索结果的相关度评分。非相关度评分与相关度评分之和即为最终评分。
可以理解的是,每个搜索结果中的参数信息与得分信息并非完全一致。例如,在资源日期的排序维度中,搜索结果中的参数信息为资源的更新日期,而最终得到的得分信息为当前日期与资源的更新日期之差;而在资源评分的排序维度中,搜索结果中的参数信息为媒资评分,该媒资评分即可直接作为资源评分的得分信息。
在搜索结果中的参数信息为空时,可以通过预设的平均参数信息代替该参数信息。例如,当搜索结果的更新日期或媒资评分为空字段时,可以设置平均日期为2016-06-30、平均评分为7.4,以通过平均参数信息生成相应的得分信息。
需要说明的是,在用户发出搜索请求时,用户终端还可以为用户直接提供常用的排序方式,如最新/热门/最好/差评的排序方式。在用户选定某一种排序方式时,可以根据该用户选定的排序方式对通用排序逻辑中的排序维度的评分权重进行调整。例如,在用户选择热门排序方式时,则可以对通用排序逻辑中的资源热度对应的评分权重进行上调,以使热度较高的搜索结果排序更为靠前。
此外,本发明还提出一种计算机可读存储介质,其上存储有搜索召回排序程序。所述计算机可读存储介质可以是图1的搜索召回排序系统中的存储器,也可以是如ROM(Read-Only Memory,只读存储器)/RAM(Random Access Memory,随机存取存储器)、磁碟、光盘中的至少一种,所述计算机可读存储介质包括若干指令用以使得具有处理器的搜索召回排序系统执行本发明各个实施例所述的搜索召回排序方法。
可以理解的是,在本说明书的描述中,参考术语“一实施例”、“另一实施例”、“其他实施例”、或“第一实施例~第N实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种搜索召回排序方法,其特征在于,包括以下步骤:
根据用户终端发送的搜索请求生成搜索关键词;
对所述搜索关键词进行分析,并根据分析结果生成排序规则;
根据所述搜索关键词获取搜索结果,并通过排序规则计算每个搜索结果的最终评分;
根据每个搜索结果的最终评分对搜索结果进行排序,并将排序后的搜索结果返回至用户终端。
2.如权利要求1所述的搜索召回排序方法,其特征在于,所述对所述搜索关键词进行分析,并根据分析结果生成排序规则的步骤包括:
对所述搜索关键词进行分析,以获取排序调整信息,所述排序调整信息用于调整预设的通用排序逻辑;
根据所述排序调整信息与预设的通用排序逻辑生成排序规则。
3.如权利要求2所述的搜索召回排序方法,其特征在于,所述通用排序逻辑包括多个预设排序维度以及每个预设排序维度对应的评分权重;所述根据所述排序调整信息与预设的通用排序逻辑生成排序规则的步骤包括:
判断所述排序调整信息是否与所述通用排序逻辑中的排序维度匹配;
若所述排序调整信息与所述通用排序逻辑中的排序维度匹配,则根据所述排序调整信息对所述通用排序逻辑中每个排序维度对应的评分权重进行调整,以生成排序规则;
若所述排序调整信息与所述通用排序逻辑中的排序维度不匹配,则根据所述排序调整信息生成对应的评分权重,并根据所述排序调整信息及其对应的评分权重以及所述通用排序逻辑生成排序规则,其中,排序规则包括多个排序维度以及每个排序维度对应的评分权重。
4.如权利要求3所述的搜索召回排序方法,其特征在于,所述通过排序规则计算每个搜索结果的最终评分的步骤包括:
根据所述排序规则的每个排序维度,从每个搜索结果的参数信息中得到每个搜索结果对应到每个排序维度的得分信息;
根据每个搜索结果对应到每个排序维度的得分信息和每个排序维度对应的评分权重计算得到每个搜索结果的最终评分。
5.如权利要求4所述的搜索召回排序方法,其特征在于,所述根据每个搜索结果对应到每个排序维度的得分信息和每个排序维度对应的评分权重计算得到每个搜索结果的最终评分的步骤包括:
获取每个搜索结果对应的相关度评分;
根据每个搜索结果对应到每个排序维度的得分信息和每个排序维度对应的评分权重计算得到每个搜索结果的非相关度评分;
根据每个搜索结果的非相关度评分和相关度评分生成最终评分。
6.如权利要求5所述的搜索召回排序方法,其特征在于,所述根据每个搜索结果的最终评分对搜索结果进行排序的步骤包括:
从所有搜索结果中确定名称相关度相同的多个搜索结果,其中,名称相关度相同的多个搜索结果为同一资源在多个资源平台中对应的搜索结果;
获取用户终端在每个资源平台的附加服务属性;
根据每个搜索结果对应的最终评分对搜索结果进行初步排序;
根据所述附加服务属性对初步排序中名称相关度相同的多个搜索结果进行排序调整。
7.如权利要求2所述的搜索召回排序方法,其特征在于,所述根据每个搜索结果的最终评分对搜索结果进行排序的步骤之后,还包括:
获取预设的二次排序规则;
根据所述二次排序规则从所有搜索结果中确定待调整结果,并对所述待调整结果进行排序调整。
8.如权利要求7所述的搜索召回排序方法,其特征在于,所述根据用户终端发送的搜索请求生成搜索关键词的步骤之前,还包括:
接收用户终端发送的规则编辑指令,根据所述规则编辑指令编辑所述通用排序逻辑和/或所述二次排序规则。
9.一种搜索召回排序系统,其特征在于,所述搜索召回排序系统包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的搜索召回排序程序,其中:所述搜索召回排序程序被所述处理器执行时实现如权利要求1至8中任一项所述的搜索召回排序方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有搜索召回排序程序,所述搜索召回排序程序被处理器执行时实现如权利要求1至8中任一项所述的搜索召回排序方法的步骤。
CN202011611479.4A 2020-12-29 2020-12-29 搜索召回排序方法、系统及计算机可读存储介质 Pending CN112597396A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011611479.4A CN112597396A (zh) 2020-12-29 2020-12-29 搜索召回排序方法、系统及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011611479.4A CN112597396A (zh) 2020-12-29 2020-12-29 搜索召回排序方法、系统及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN112597396A true CN112597396A (zh) 2021-04-02

Family

ID=75206509

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011611479.4A Pending CN112597396A (zh) 2020-12-29 2020-12-29 搜索召回排序方法、系统及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112597396A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113343046A (zh) * 2021-05-20 2021-09-03 成都美尔贝科技股份有限公司 一种智能搜索排序系统
CN113407856A (zh) * 2021-08-19 2021-09-17 北京金堤征信服务有限公司 搜索结果排序方法、装置及电子设备
CN113407767A (zh) * 2021-06-29 2021-09-17 北京字节跳动网络技术有限公司 确定文本相关性的方法、装置、可读介质及电子设备
CN113793193A (zh) * 2021-08-13 2021-12-14 唯品会(广州)软件有限公司 数据搜索准确性验证方法、装置、设备及计算机可读介质
CN113886685A (zh) * 2021-09-23 2022-01-04 北京三快在线科技有限公司 一种搜索方法、装置、存储介质及电子设备
CN114154046A (zh) * 2022-02-07 2022-03-08 深圳华强电子交易网络有限公司 一种网站搜索排名方法及系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113343046A (zh) * 2021-05-20 2021-09-03 成都美尔贝科技股份有限公司 一种智能搜索排序系统
CN113343046B (zh) * 2021-05-20 2023-08-25 成都美尔贝科技股份有限公司 一种智能搜索排序系统
CN113407767A (zh) * 2021-06-29 2021-09-17 北京字节跳动网络技术有限公司 确定文本相关性的方法、装置、可读介质及电子设备
CN113793193A (zh) * 2021-08-13 2021-12-14 唯品会(广州)软件有限公司 数据搜索准确性验证方法、装置、设备及计算机可读介质
CN113793193B (zh) * 2021-08-13 2024-02-02 唯品会(广州)软件有限公司 数据搜索准确性验证方法、装置、设备及计算机可读介质
CN113407856A (zh) * 2021-08-19 2021-09-17 北京金堤征信服务有限公司 搜索结果排序方法、装置及电子设备
CN113407856B (zh) * 2021-08-19 2022-04-29 北京金堤征信服务有限公司 搜索结果排序方法、装置及电子设备
CN113886685A (zh) * 2021-09-23 2022-01-04 北京三快在线科技有限公司 一种搜索方法、装置、存储介质及电子设备
CN113886685B (zh) * 2021-09-23 2023-01-06 北京三快在线科技有限公司 一种搜索方法、装置、存储介质及电子设备
CN114154046A (zh) * 2022-02-07 2022-03-08 深圳华强电子交易网络有限公司 一种网站搜索排名方法及系统

Similar Documents

Publication Publication Date Title
CN112597396A (zh) 搜索召回排序方法、系统及计算机可读存储介质
JP6708717B2 (ja) ニュース推薦方法及び装置
KR101532054B1 (ko) 모바일 검색 결과 혼합
US9947025B2 (en) Method and apparatus for providing search capability and targeted advertising for audio, image, and video content over the internet
US8656266B2 (en) Identifying comments to show in connection with a document
US8396879B1 (en) Ranking authors and their content in the same framework
US8463785B2 (en) Method and system for generating search collection of query
US8374975B1 (en) Clustering to spread comments to other documents
CN109168047B (zh) 视频推荐方法、装置、服务器及存储介质
CN105653572A (zh) 一种资源的处理方法及装置
US20070297643A1 (en) Information processing system, information processing method, and program product therefor
JP2006040266A (ja) 情報提供装置、情報提供方法および情報提供用プログラム
CN102855256A (zh) 用于确定网站评价信息的方法、装置及设备
US20170287041A1 (en) Information processing apparatus, information processing method, and information processing program
JP2011008420A (ja) カテゴリを対応付けする装置、方法、およびプログラム
CN109063200B (zh) 资源搜索方法及其装置、电子设备、计算机可读介质
JP5228584B2 (ja) 興味情報特定システム、興味情報特定方法、および興味情報特定用プログラム
US8838616B2 (en) Server device for creating list of general words to be excluded from search result
CN103425767B (zh) 一种提示数据的确定方法和系统
JP2008146147A (ja) 情報提示装置、情報提示方法及び情報提示用プログラム
JP2006139470A (ja) 情報提供装置および情報提供方法ならびにそのプログラム
US20060007477A1 (en) Storage medium storing computer program for presenting document registrant, document registrant presenting method, and document management apparatus
CN106570003B (zh) 数据推送方法及装置
CN109474832B (zh) 一种信息搜索排序方法、智能终端及存储介质
KR102170535B1 (ko) 감성 분석을 통한 사용자 선호 기반의 검색 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination