CN112434183A - 一种搜索结果的排序方法、装置、设备和存储介质 - Google Patents

一种搜索结果的排序方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN112434183A
CN112434183A CN202011374973.3A CN202011374973A CN112434183A CN 112434183 A CN112434183 A CN 112434183A CN 202011374973 A CN202011374973 A CN 202011374973A CN 112434183 A CN112434183 A CN 112434183A
Authority
CN
China
Prior art keywords
search
search result
feature data
behavior
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011374973.3A
Other languages
English (en)
Other versions
CN112434183B (zh
Inventor
张志伟
林靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202011374973.3A priority Critical patent/CN112434183B/zh
Publication of CN112434183A publication Critical patent/CN112434183A/zh
Application granted granted Critical
Publication of CN112434183B publication Critical patent/CN112434183B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开关于一种搜索结果的排序方法、装置、设备和存储介质,所述方法包括分别获取新增搜索结果对应的行为特征数据中与当前搜索词相关的第二行为特征数据和历史搜索结果对应的行为特征数据中与当前搜索词相关的第一行为特征数据。获取与当前搜索词相似的目标搜索词以及与新增搜索结果相似的目标搜索结果。根据目标搜索词和/或目标搜索结果,确定新增搜索结果的关联行为特征数据。根据第二行为特征数据、关联行为特征数据和第一行为特征数据,确定搜索结果序列。该方法提高了关联行为特征数据的置信度,并根据关联行为特征数据补充了新增搜索结果对应的行为特征数据,提高了搜索结果排序的合理性和精准性。

Description

一种搜索结果的排序方法、装置、设备和存储介质
技术领域
本公开涉及搜索技术领域,尤其涉及一种搜索结果的排序方法、装置、设备和存储介质。
背景技术
在进行视频搜索时,用户输入搜索词,服务器根据搜索词得到一系列搜索结果,并将搜索结果根据用户的消费行为数据,形成一定的推荐顺序,发送到用户终端。相关技术中,一般在对搜索结果进行排序的时候,会有若干的特征刻画,其中与消费行为对应的典型特征包括:点击数、点击率、点赞数、点赞率等。对于一个发布了一段时间的视频而言,消费行为数据较为充分且准确,但是对于一个新发布的视频而言,消费行为数据可能较少或者不存在,因此在基于消费行为特征数据对搜索结果进行排序时,新发布的视频会因为缺少对应的消费行为数据被往后排,使得搜索结果的排序不合理,也导致了新发布的视频曝光率不佳,用户在搜索结果中看到的都是已经发布了一段时间的视频,这会让用户容易对搜索到的视频感到审美疲劳,使得用户体验不佳。
发明内容
本公开提供一种搜索结果的排序方法、装置、设备和存储介质,以至少解决相关技术中新发布的视频缺少对应的行为特征数据,使得搜索结果的排序的合理性和精准性降低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种搜索结果的排序方法,所述方法包括:
获取当前搜索词;
获取与所述当前搜索词对应的搜索结果;
根据所述搜索结果的发布时间,将所述搜索结果划分为历史搜索结果和新增搜索结果;
获取与所述新增搜索结果相似的目标搜索结果;
获取与所述当前搜索词相似的目标搜索词;
根据所述目标搜索结果和/或所述目标搜索词,确定所述新增搜索结果的关联行为特征数据;
获取所述历史搜索结果对应的行为特征数据中,与所述当前搜索词关联的第一行为特征数据;
获取所述新增搜索结果对应的行为特征数据中,与所述当前搜索词关联的第二行为特征数据;
根据所述第一行为特征数据、所述第二行为特征数据和所述关联行为特征数据,确定所述搜索结果的排序指示信息;
根据所述搜索结果的排序指示信息,对所述搜索结果进行排序,得到搜索结果序列。
作为一个可选的实施例,所述根据所述目标搜索结果和/或所述目标搜索词,确定所述新增搜索结果的关联行为特征数据包括:
获取所述目标搜索结果对应的行为特征数据中,与所述当前搜索词关联的第一关联行为特征数据;
获取所述新增搜索结果对应的行为特征数据中,与所述目标搜索词关联的第二关联行为特征数据;
获取所述目标搜索结果对应的行为特征数据中,与所述目标搜索词关联的第三关联行为特征数据;
将所述第一关联行为特征数据、所述第二关联行为特征数据和所述第三关联行为特征数据中的至少一个作为所述新增搜索结果的关联行为特征数据。
作为一个可选的实施例,所述获取与所述新增搜索结果相似的目标搜索结果包括:
确定所述当前搜索词对应的每个历史搜索结果与所述新增搜索结果间的相似度;
根据所述每个历史搜索结果与所述新增搜索结果间的相似度,确定所述目标搜索结果;
或;
获取所述新增搜索结果对应的标签信息;
根据所述标签信息,确定所述新增搜索结果对应的发布内容类别;
获取所述发布内容类别中的发布内容;
根据所述发布内容,获取所述发布内容类别的类中心发布内容;
将所述类中心发布内容作为所述目标搜索结果。
作为一个可选的实施例,所述获取与所述当前搜索词相似的目标搜索词包括:
识别所述当前搜索词的语义信息;
确定与所述当前搜索词的语义信息对应的历史搜索词集;
确定所述历史搜索词集中每个历史搜索词与所述当前搜索词间的相似度;
根据所述每个历史搜索词与所述当前搜索词间的相似度,确定所述目标搜索词。
作为一个可选的实施例,所述获取所述历史搜索结果对应的行为特征数据中,与所述当前搜索词关联的第一行为特征数据包括:
若所述当前搜索词为非新增搜索词,获取所述历史搜索结果对应的行为特征数据中,与所述当前搜索词关联的行为特征数据;
将所述与所述当前搜索词关联的行为特征数据作为所述第一行为特征数据;
若所述当前搜索词为新增搜索词,获取所述历史搜索结果对应的行为特征数据中,与所述目标搜索词关联的行为特征数据;
将所述与所述目标搜索词关联的行为特征数据作为所述第一行为特征数据。
作为一个可选的实施例,所述根据所述第一行为特征数据、所述第二行为特征数据和所述关联行为特征数据,确定所述搜索结果的排序指示信息包括:
根据预设权重,对所述第二行为特征数据和所述关联行为特征数据进行加权融合,得到所述新增搜索结果对应的融合特征数据;
基于预设的排序算法,对所述融合特征数据和所述第一行为特征数据进行排序分析,确定所述搜索结果的排序指示信息。
作为一个可选的实施例,所述基于预设的排序算法,对所述融合特征数据和所述第一行为特征数据进行排序分析,确定所述搜索结果的排序指示信息包括:
将所述当前搜索词对应的搜索结果候选集中任意两个搜索结果组成搜索结果对;
根据所述融合特征数据和所述第一行为特征数据,获取所述搜索结果对中的两个搜索结果对应的特征数据差值;
将所述搜索结果对中的两个搜索结果对应的特征数据差值中满足预设差值条件的搜索结果对作为初始搜索结果对;
确定所述初始搜索结果对中的两个搜索结果的相对顺序数据;
将所述初始搜索结果对中的两个搜索结果的相对顺序数据中满足预设相对顺序数据条件的初始搜索结果对作为目标搜索结果对;
根据所述目标搜索结果对中的两个搜索结果的相对顺序数据,确定所述搜索结果的排序指示信息。
根据本公开实施例的第二方面,提供一种搜索结果的排序装置,所述装置包括:
搜索词获取模块,被配置为执行获取当前搜索词;
搜索结果获取模块,被配置为执行获取与所述当前搜索词对应的搜索结果;
搜索结果划分模块,被配置为根据所述搜索结果的发布时间,将所述搜索结果划分为历史搜索结果和新增搜索结果;
目标搜索结果获取模块,被配置为执行获取与所述新增搜索结果相似的目标搜索结果;
目标搜索词获取模块,被配置为执行获取与所述当前搜索词相似的目标搜索词;
关联行为特征数据获取模块,被配置为执行根据所述目标搜索结果和/或与所述目标搜索词,确定所述新增搜索结果对应的关联行为特征数据;
第一行为特征获取模块,被配置为执行获取所述历史搜索结果对应的行为特征数据中,与所述当前搜索词关联的第一行为特征数据;
第二行为特征获取模块,被配置为执行获取所述新增搜索结果对应的行为特征数据中,与所述当前搜索词关联的第二行为特征数据;
排序指示信息获取模块,被配置为执行根据所述第一行为特征数据、所述第二行为特征数据和所述关联行为特征数据,确定所述搜索结果的排序指示信息;
搜索结果序列获取模块,被配置为执行根据所述搜索结果的排序指示信息,对所述搜索结果进行排序,得到搜索结果序列。
作为一个可选的实施例,所述关联行为特征数据获取模块包括:
第一关联行为特征数据获取单元,被配置为执行获取所述目标搜索结果对应的行为特征数据中,与所述当前搜索词关联的第一关联行为特征数据;
第二关联行为特征数据获取单元,被配置为执行获取所述新增搜索结果对应的行为特征数据中,与所述目标搜索词关联的第二关联行为特征数据;
第三关联行为特征数据获取单元,被配置为执行获取所述目标搜索结果对应的行为特征数据中,与所述目标搜索词关联的第三关联行为特征数据;
关联行为特征数据获取单元,被配置为执行将所述第一关联行为特征数据、所述第二关联行为特征数据和所述第三关联行为特征数据中的至少一个作为所述新增搜索结果的关联行为特征数据。
作为一个可选的实施例,所述目标搜索结果获取模块包括:
相似度确定单元,被配置为执行确定所述当前搜索词对应的每个历史搜索结果与所述新增搜索结果间的相似度;
目标搜索结果确定单元,根据所述每个历史搜索结果与所述新增搜索结果间的相似度,确定所述目标搜索结果。
或;
标签信息获取单元,被配置为执行获取所述新增搜索结果对应的标签信息;
发布内容类别确定单元,被配置为执行根据所述标签信息,确定所述新增搜索结果对应的发布内容类别;
发布内容获取单元,被配置为执行获取所述发布内容类别中的发布内容;
类中心获取单元,被配置为执行根据所述发布内容,获取所述发布内容类别的类中心发布内容,将所述类中心发布内容作为所述目标搜索结果。
作为一个可选的实施例,所述目标搜索词获取模块包括:
语义信息识别单元,被配置为执行识别所述当前搜索词的语义信息;
历史搜索词集确定单元,被配置为执行确定与所述当前搜索词的语义信息对应的历史搜索词集;
搜索词相似度确定单元,被配置为执行确定所述历史搜索词集中每个历史搜索词与所述当前搜索词间的相似度;
目标搜索词确定单元,被配置为执行根据所述每个历史搜索词与所述当前搜索词间的相似度,确定所述目标搜索词。
作为一个可选的实施例,所述第一行为特征获取模块包括:
第一数据获取单元,被配置为执行若所述当前搜索词为非新增搜索词,获取所述历史搜索结果对应的行为特征数据中,与所述当前搜索词关联的行为特征数据;将所述与所述当前搜索词关联的行为特征数据作为所述第一行为特征数据;
第二数据获取单元,被配置为执行若所述当前搜索词为新增搜索词,获取所述历史搜索结果对应的行为特征数据中,与所述目标搜索词关联的行为特征数据;将所述与所述目标搜索词关联的行为特征数据作为所述第一行为特征数据。
作为一个可选的实施例,所述排序指示信息获取模块包括:
融合特征数据获取单元,被配置为执行根据预设权重,对所述第二行为特征数据和所述关联行为特征数据进行加权融合,得到所述新增搜索结果对应的融合特征数据;
排序分析单元,被配置为执行基于预设的排序算法,对所述融合特征数据和所述第一行为特征数据进行排序分析,确定所述搜索结果的排序指示信息。
作为一个可选的实施例,所述排序分析单元包括:
搜索结果对组合单元,被配置为执行将所述当前搜索词对应的搜索结果候选集中任意两个搜索结果组成搜索结果对;
特征数据差值获取单元,被配置为执行根据所述融合特征数据和所述第一行为特征数据,获取所述搜索结果对中的两个搜索结果对应的特征数据差值;
初始搜索结果对确定单元,被配置为执行将所述搜索结果对中的两个搜索结果对应的特征数据差值中满足预设差值条件的搜索结果对作为初始搜索结果对;
相对顺序数据确定单元,被配置为执行确定所述初始搜索结果对中的两个搜索结果的相对顺序数据;
目标搜索结果对确定单元,被配置为执行将所述初始搜索结果对中的两个搜索结果的相对顺序数据中满足预设相对顺序数据条件的初始搜索结果对作为目标搜索结果对;
排序指示信息确定单元,被配置为执行根据所述目标搜索结果对中的两个搜索结果的相对顺序数据,确定所述搜索结果的排序指示信息。
根据本公开实施例的第三方面,提供一种搜索结果的排序设备,所述设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现上述所述的一种搜索结果的排序方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述存储介质中的指令由搜索结果的排序设备的处理器执行时,使得所述搜索结果的排序设备能够执行如上述所述的一种搜索结果的排序方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,所述计算机程序产品存储在存储介质中,使得计算机设备的处理器能够从存储介质中读取该计算机程序产品,并执行如上述所述的一种搜索结果的排序方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
获取当前搜索词对应的新增搜索结果和历史搜索结果。分别获取新增搜索结果对应的行为特征数据中与当前搜索词相关的第二行为特征数据和历史搜索结果对应的行为特征数据中与当前搜索词相关的第一行为特征数据,获取与当前搜索词相似的目标搜索词,获取与新增搜索结果相似的目标搜索结果。根据目标搜索词和目标搜索结果,确定新增搜索结果的关联行为特征数据。根据第二行为特征数据、关联行为特征数据和第一行为特征数据,得到搜索结果的排序指示信息,根据排序指示信息进行排序,得到搜索结果序列。该方法实现了对新增搜索结果的第二行为特征数据的泛化,提高了关联行为特征数据的置信度,且该方法通过关联行为特征数据,补充了新增搜索结果对应的行为特征数据,提高了搜索结果排序的合理性和精准性,从而提高了用户体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种搜索结果的排序方法的应用场景示意图。
图2是根据一示例性实施例示出的一种搜索结果的排序方法的流程图。
图3是根据一示例性实施例示出的一种搜索结果的排序方法中进行特征关联的流程图。
图4是根据一示例性实施例示出的一种搜索结果的排序方法中根据特征关联的结果得到关联行为特征数据的流程图。
图5是根据一示例性实施例示出的一种搜索结果的排序方法中通过最近邻算法得到目标搜索结果的流程图。
图6是根据一示例性实施例示出的一种搜索结果的排序方法中通过类中心得到目标搜索结果的流程图。
图7是根据一示例性实施例示出的一种搜索结果的排序方法中通过最近邻算法得到目标搜索词的流程图。
图8是根据一示例性实施例示出的一种搜索结果的排序方法中当前搜索词为新增搜索词时的方法流程图。
图9是根据一示例性实施例示出的一种搜索结果的排序方法中得到排序指示信息的流程图。
图10是根据一示例性实施例示出的一种搜索结果的排序方法中进行排序的流程图。
图11是根据一示例性实施例示出的一种搜索结果的排序方法中视频搜索的场景对当前搜索词和新增搜索结果对应的行为特征数据进行特征泛化的示意图。
图12是根据一示例性实施例示出的一种搜索结果的排序方法中当前搜索词、目标搜索词、目标搜索结果和新增搜索结果间的关系的示意图。
图13是根据一示例性实施例示出的一种搜索结果的排序装置的框图。
图14是根据一示例性实施例示出的一种搜索结果的排序设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种搜索结果的排序方法的应用场景示意图,如图1所示,该应用场景包括客户端110和服务器120。客户端110响应于用户的输入指令,获取当前搜索词,服务器120接收客户端110发送的当前搜索词后,得到与当前搜索词对应的搜索结果,服务器120根据搜索结果的发布时间,将搜索结果划分为历史搜索结果和新增搜索结果,服务器120获取与新增搜索结果相似的目标搜索结果,并获取与当前搜索词相似的目标搜索词。服务器120根据目标搜索结果和/或目标搜索词,确定新增搜索结果的关联行为特征数据,服务器120获取历史搜索结果对应的行为特征数据中与当前搜索词关联的第一行为特征数据和新增搜索结果对应的行为特征数据中与当前搜索词关联的第二行为特征数据。服务器120根据历史搜索结果的第一行为特征数据、新增搜索结果的第二行为特征数据和新增搜索结果的关联行为特征数据,得到各个搜索结果的排序指示信息,并根据排序指示信息对搜索结果进行排序,得到搜索结果序列。服务器120将搜索结果序列发送到客户端110,客户端110将搜索结果序列显示给用户。
在本公开的实施例中,该客户端110包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、智能可穿戴设备等类型的实体设备,也可以包括运行于实体设备中的软体,例如应用程序等。本申请实施例中实体设备上运行的操作系统可以包括但不限于安卓系统、IOS系统、linux、Unix、windows等。客户端110包括UI(User Interface,用户界面)层,该客户端110通过UI层对外提供搜索结果序列的显示以及当前搜索词的显示,另外,基于API(Application Programming Interface,应用程序接口)将当前搜索词发送给服务器120。
在本公开实施例中,该服务器120可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群。服务器120可以包括网络通信单元、处理器和存储器等等。具体的,该服务器120可以用于对搜索结果中的新增搜索结果的第二行为特征数据进行特征泛化,得到新增搜索结果的关联行为特征数据,根据历史搜索结果的第一行为特征数据、新增搜索结果的第二行为特征数据和新增搜索结果的关联行为特征数据,得到各个搜索结果的排序指示信息,并根据排序指示信息对搜索结果进行排序,得到搜索结果序列。
图2是根据一示例性实施例示出的一种搜索结果的排序方法的流程图,如图2所示,该搜索结果的排序方法用于服务器侧,包括以下步骤。
S200.获取当前搜索词;
S210.获取与当前搜索词对应的搜索结果;
S220.根据搜索结果的发布时间,将搜索结果划分为历史搜索结果和新增搜索结果;
作为一个可选的实施例,根据当前搜索词与发布内容的标签、标题或发布者等信息的匹配程度,将匹配程度较高的发布内容作为当前搜索词对应的搜索结果,作为一个可选的实施例,搜索结果可以为视频信息。在将搜索结果划分为历史搜索结果和新增搜索结果时,可以根据搜索结果的发布时间进行划分。新增搜索结果可以为发布时间与当前时间较近的搜索结果,没有充足的行为特征数据。历史搜索结果可以为发布时间与当前时间较远的搜索结果,具有充足的行为特征数据。其中,行为特征数据可以包括用户对某一搜索词对应的搜索结果进行交互行为的数据,交互行为可以包括点击、点赞、收藏等交互行为。
S230.获取与新增搜索结果相似的目标搜索结果;
S240.获取与当前搜索词相似的目标搜索词;
作为一个可选的实施例,通过与新增搜索结果相似的目标搜索结果,以及与当前搜索词相似的目标搜索词,可以实现对新增搜索结果的行为特征数据的泛化。
S250.根据目标搜索结果和/或目标搜索词,确定新增搜索结果的关联行为特征数据;
作为一种可选的实施例,请参见图3,根据目标搜索结果和/或目标搜索词,得到新增搜索结果的关联行为特征数据包括:
S310.获取目标搜索结果对应的行为特征数据中,与当前搜索词关联的第一关联行为特征数据;
S320.获取新增搜索结果对应的行为特征数据中,与目标搜索词关联的第二关联行为特征数据;
S330.获取目标搜索结果对应的行为特征数据中,与目标搜索词关联的第三关联行为特征数据;
S340.将第一关联行为特征数据、第二关联行为特征数据和第三关联行为特征数据中的至少一个作为新增搜索结果对应的关联行为特征数据。
作为一个可选的实施例,第一关联行为特征数据可以包括用户对当前搜索词对应的目标搜索结果进行交互行为的数据,第二关联行为特征数据可以包括用户对目标搜索词对应的新增搜索结果进行交互行为的数据,第三关联行为特征数据可以包括用户对目标搜索词对应的目标搜索结果进行交互行为的数据。
若目标搜索结果或目标搜索词不存在,则目标搜索结果对应的行为特征数据或与目标搜索词关联的行为特征数据为空,不存在相应的关联行为特征数据。在进行关联行为特征数据的计算时,若当前搜索词未召回目标搜索结果,目标搜索词未召回新增搜索结果或目标搜索词未召回目标搜索结果,则对应的第一关联行为特征数据、第二关联行为特征数据或第三关联行为特征数据同样也不存在。
作为一个可选的实施例,当前搜索词为q,新增搜索结果为p,若确定p’为第一目标搜索结果,确定游戏q’为目标搜索词,服务器根据历史数据中用户在输入当前搜索词q后对新增搜索结果p的点击数据,确定在当前搜索词为q时用户对新增搜索结果p的点击率,作为新增搜索结果p对应的行为特征数据中与当前搜索词q关联的第二行为特征数据。同样的,确定当前搜索词为q时对目标搜索结果p’的点击率,确定目标搜索词为q’时对新增搜索结果p的点击率,确定目标搜索词为q’时对目标搜索结果p’的点击率。在后续步骤中,可以选择上述三个点击率中的至少一个点击率作为关联行为特征数据,或者将三个点击率进行加权融合得到关联行为特征数据。
根据目标搜索结果和/或目标搜索词,确定新增搜索结果的关联行为特征数据,可以补充新增搜索结果对应的关联行为特征数据,从而根据关联行为特征数据,提高新增搜索结果在后续进行排序时的位置,提高了搜索结果排序的合理性和精准性。
作为一种可选的实施例,请参见图4,获取与新增搜索结果相似的目标搜索结果包括:
S410.确定当前搜索词对应的搜索结果候选集中每个历史搜索结果与新增搜索结果间的相似度;
S420.根据每个历史搜索结果与新增搜索结果间的相似度,确定目标搜索结果。
作为一个可选的实施例,目标搜索结果可以为当前搜索词对应的搜索结果候选集中与新增搜索结果的相似度超过预设阈值的某一历史搜索结果或某几个历史搜索结果。可以通过最近邻算法(K-Nearest Neighbor,KNN)得到与新增搜索结果相似的一个或多个历史搜索结果。获取当前搜索词对应的搜索结果候选集中的每个历史搜索结果,将每个历史搜索结果和新增搜索结果均用特征向量进行表示,计算新增搜索结果对应的特征向量与各个历史搜索结果对应的特征向量间的距离,该特征向量间的距离可以用欧式距离或者曼哈顿距离表示。
根据特征向量间的距离的远近,确定新增搜索结果与各个历史搜索结果间的相似度,特征向量间的距离越近则相似度越大。获取与新增搜索结果距离最近的特征向量对应的历史搜索结果。
其中,与新增搜索结果距离最近的特征向量可以有一个或多个,因此对应的历史搜索结果也有一个或多个。当为一个历史搜索结果时,将该历史搜索结果作为目标搜索结果,并将与当前搜索词相关的历史搜索结果对应的行为特征数据作为关联行为特征数据。当为多个历史搜索结果时,将多个历史搜索结果均作为目标搜索结果,并将与当前搜索词相关的多个历史搜索结果对应的行为特征数据的平均值作为关联行为特征数据。
通过最近邻算法,获取与新增搜索结果最相似的目标搜索结果,将与目标搜索结果的行为特征数据迁移到新增搜索结果的行为特征数据中,可以提高新增搜索结果的关联行为特征数据的置信度。
作为一种可选的实施例,请参见图5,获取与新增搜索结果相似的目标搜索结果包括:
S510.获取新增搜索结果对应的标签信息;
S520.根据标签信息,确定新增搜索结果对应的发布内容类别;
S530.获取发布内容类别中的发布内容;
S540.根据发布内容,获取发布内容类别的类中心发布内容;
S550.将类中心发布内容作为目标搜索结果。
作为一个可选的实施例,目标搜索结果还可以是新增搜索结果所属的类别的类中心发布内容。获取新增搜索结果对应的标签信息,该标签信息可以是用户发布时增加的标签信息,或者是服务器进行自动或人工审核后确定的标签信息,例如游戏、音乐等,根据标签信息确定新增搜索结果对应的发布内容类别。作为一个可选的实施例,该标签信息可以有多个层级,例如游戏——塔防游戏——具体的游戏名称,逐层缩小发布内容所属类别的范围。在一种可选的实施例中,在标签信息有多个层级时,可以选取发布内容所属类别的范围最小的标签信息,以确定新增搜索结果对应的发布内容类别。获取发布内容类别中的发布内容,将发布内容类别中的发布内容均用特征向量表示,获取发布内容类别中所有发布内容的特征向量的均值,得到发布内容类的类中心发布内容的特征向量,根据类中心发布内容的特征向量,确定发布内容类别的类中心发布内容。将类中心发布内容作为目标搜索结果。
作为一个可选的实施例,还可以通过模型预测的方式得到目标搜索结果。基于样本标注信息对预设的卷积神经网络进行训练,得到搜索结果匹配模型。例如对视频搜索结果进行匹配的匹配模型。将新增搜索结果和历史搜索结果输入到搜索结果匹配模型中,在特征编码层对新增搜索结果和历史搜索结果进行特征提取,得到新增搜索结果特征信息和历史搜索结果特征信息,将新增搜索结果特征信息和历史搜索结果特征信息进行比对,得到与新增搜索结果特征信息匹配的历史搜索结果特征信息,将该历史搜索结果特征信息对应的历史搜索结果输出为目标搜索结果。
除了近邻算法、确定发布内容类别的类中心以及模型预测的方法获取目标搜索结果以外,还可以用方法获取目标搜索结果,本公开对此不做限制。
通过确定发布内容类别的类中心或模型预测,获取与新增搜索结果最相似的目标搜索结果,将目标搜索结果对应的行为特征数据迁移到新增搜索结果的行为特征数据中,可以提高关联行为特征数据的置信度。
作为一种可选的实施例,请参见图6,获取与当前搜索词相似的目标搜索词包括:
S610.识别当前搜索词的语义信息;
S620.确定与当前搜索词的语义信息对应的历史搜索词集;
S630.确定历史搜索词集中每个历史搜索词与当前搜索词间的相似度;
S640.根据每个历史搜索词与当前搜索词间的相似度,确定目标搜索词。
作为一个可选的实施例,历史搜索词集包括与当前搜索词的语义信息同义或者近义的搜索词,目标搜索词的语义信息与当前搜索词的语义信息同义或与当前搜索词的语义信息近义。可以通过最近邻算法对当前搜索词和当前搜索词对应的历史搜索词集进行分类,得到与当前搜索词最相似的历史搜索词。识别当前搜索词的语义信息,根据当前搜索词的语义信息,确定与当前搜索词的语义信息相同或相近的历史搜索词,将这些历史搜索词作为与当前搜索词的语义信息对应的历史搜索词集。将当前搜索词和历史搜索词集中的历史搜索词均用特征向量表示,计算当前搜索词与每个历史搜索词间特征向量的距离。该特征向量间的距离可以用欧式距离或者曼哈顿距离表示。根据特征向量间的距离,确定当前搜索词与各个历史搜索词间的相似度,特征向量间的距离越近则相似度越大,则按照特征向量间的距离的递增关系进行排序,获取与当前搜索词距离最近的特征向量对应的历史搜索词。将最近的特征向量间的距离对应的历史搜索词,也就是相似度最大值对应的历史搜索词作为目标搜索词。目标搜索词优先选择与当前搜索词同义的历史搜索词,例如当前搜索词为“无毛猫”,则可以将同义的历史搜索词“斯芬克斯猫”作为目标搜索词,在无法获取到同义的历史搜索词的情况下,也可以选择近义的历史搜索词作为目标搜索词,例如当前搜索词为“边境牧羊犬”,假设不存在同义的历史搜索词,则可以用近义的历史搜索词“牧羊犬”作为目标搜索词。
作为一个可选的实施例,还可以通过模型预测的方式得到目标搜索词。基于样本标注信息对预设的卷积神经网络进行训练,得到搜索词匹配模型。例如语义匹配模型。将当前搜索词输入到搜索词匹配模型中,在特征编码层对当前搜索词进行特征提取,得到当前搜索词的语义特征信息,对当前搜索词的语义特征信息进行识别。根据识别结果确定与当前搜索词匹配的历史搜索词,将与当前搜索词匹配的历史搜索词输出为目标搜索词。
除了近邻算法和模型预测的方法获取目标搜索词以外,还可以用其他方法获取目标搜索词,本公开对此不做限制。
通过最近邻算法,获取与当前搜索词最相似的目标搜索词,将目标搜索词下的搜索结果对应的行为特征数据迁移到当前搜索词对应的新增搜索结果的行为特征数据中,可以提高关联行为特征数据的置信度。
S260.获取历史搜索结果对应的行为特征数据中,与当前搜索词关联的第一行为特征数据;
S270.获取新增搜索结果对应的行为特征数据中,与当前搜索词关联的第二行为特征数据;
作为一个可选的实施例,第一行为特征数据和第二行为特征数据为历史统计值,第一行为特征数据可以包括用户对当前搜索词对应的历史搜索结果进行交互行为的数据,第二行为特征数据可以包括用户对当前搜索词对应的新增搜索结果进行交互行为的数据。输入了当前搜索词的用户可以对该当前搜索词召回的新增搜索结果或历史搜索结果进行点击、点赞、收藏等交互行为,因此第一行为特征数据和第二行为特征数据可以包括点击数量、点击率、点赞数量、点赞率、收藏数量、收藏率等等。
作为一个可选的实施例,第一行为特征数据可以指在搜索词为游戏A的时候,所有使用游戏A为搜索词的用户对历史搜索结果进行点击的统计值。
作为一个可选的实施例,请参见图7,获取历史搜索结果对应的行为特征数据中,与当前搜索词关联的第一行为特征数据包括:
S710.若当前搜索词为非新增搜索词,获取历史搜索结果对应的行为特征数据中,与当前搜索词关联的行为特征数据,将与当前搜索词关联的行为特征数据作为第一行为特征数据;
S720.若当前搜索词为新增搜索词,获取历史搜索结果对应的行为特征数据中,与目标搜索词关联的行为特征数据,将与目标搜索词关联的行为特征数据作为第一行为特征数据。
作为一种可选的实施例,若当前搜索词为非新增搜索词,历史搜索结果对应的新增特征数据中存在与当前搜索词关联的行为特征数据,则将与当前搜索词关联的行为特征数据作为第一行为特征数据。若当前搜索词为新增搜索词,由于不存在输入为新增搜索词时用户对该新增搜索词召回的搜索结果进行点击、点赞等交互行为的历史数据,因此历史搜索结果对应的行为特征数据中不存在与新增搜索词关联的行为特征数据。目标搜索词是与新增搜索词同义或近义的搜索词,获取历史搜索结果对应的行为特征数据中,与目标搜索词关联的行为特征数据,将与目标搜索词关联的行为特征数据作为第一行为特征数据,从而确定历史搜索结果对应的行为特征数据中与新增搜索词关联的行为特征数据。
对新增搜索词对应的搜索结果进行行为特征数据的补充,使得新增搜索词对应的搜索结果的排序更为合理和精准。
作为一种可选的实施例,请参见图8,当当前搜索词为新增搜索词时,该方法还包括:
S800.获取与新增搜索词对应的搜索结果;
S810.根据搜索结果的发布时间,将搜索结果划分为历史搜索结果和新增搜索结果;
S820.获取与新增搜索词相似的目标搜索词;
S830.获取新增搜索结果对应的行为特征数据中,与目标搜索词关联的行为特征数据;
S840.获取与新增搜索结果相似的目标搜索结果;
S850.获取目标搜索结果对应的行为特征数据中,与目标搜索词相关的行为特征数据;
S860.将新增搜索结果对应的行为特征数据中与目标搜索词相关的行为特征数据和与目标搜索结果对应的行为特征数据中与目标搜索词相关的行为特征数据中的至少一个作为新增搜索结果的关联行为特征数据;
S870.获取历史搜索结果对应的行为特征数据中,与目标搜索词相关的第一行为特征数据;
S880.根据第一行为特征数据和关联行为特征数据,确定搜索结果的排序指示信息;
S890.根据搜索结果的排序指示信息,对搜索结果候选集中的搜索结果进行排序,得到搜索结果序列。
作为一个可选的实施例,根据搜索结果的发布时间,将搜索结果划分为历史搜索结果和新增搜索结果。获取与新增搜索词相似的目标搜索词,获取与新增搜索结果相似的目标搜索结果。获取目标搜索结果对应的行为特征数据中与目标搜索词关联的行为特征数据,获取新增搜索结果对应的行为特征数据中与目标搜索词关联的行为特征数据。
根据目标搜索结果对应的行为特征数据中与目标搜索词关联的行为特征数据和新增搜索结果对应的行为特征数据中与目标搜索词关联的行为特征数据,确定新增搜索结果的关联行为特征数据。获取历史搜索结果对应的行为特征数据中与目标搜索词关联的行为特征数据,将与目标搜索词关联的行为特征数据作为第一行为特征数据。根据关联行为特征数据和第一行为特征数据,得到搜索结果的排序指示信息。根据搜索结果的排序指示信息,对搜索结果候选集中的搜索结果进行排序,得到搜索结果序列。
在搜索词是新增搜索词时,获取历史搜索结果对应的行为特征数据中与目标搜索词关联的行为特征数据,可以补充输入为新增搜索词时检索到的搜索结果对应的行为特征数据,从而提高了输入新增搜索词时的搜索结果排序的合理性和精准性。
S280.根据第一行为特征数据、第二行为特征数据和关联行为特征数据,确定搜索结果的排序指示信息;
S290.根据搜索结果的排序指示信息,对搜索结果进行排序,得到搜索结果序列。
作为一种可选的实施例,请参见图9,根据第一行为特征数据、第二行为特征数据和关联行为特征数据,确定搜索结果的排序指示信息包括:
S910.根据预设权重,对第二行为特征数据和关联行为特征数据进行加权融合,得到新增搜索结果对应的融合特征数据;
S920.基于预设的排序算法,对融合特征数据和第一行为特征数据进行排序分析,确定搜索结果的排序指示信息。
作为一个可选的实施例,根据新增搜索结果对应的行为特征数据和关联行为特征数据的预设权重,对于新增搜索结果对应的行为特征数据和关联行为特征数据进行加权融合,得到融合特征数据,如下述公式所示:
featureq,p=α×fq,p+β×fq,p′+γ×fq′,p+δ×fq′,p′
其中,featureq,p为融合特征数据,fq,p为新增搜索结果对应的行为特征数据,fq,p′为与当前搜索词相关的目标搜索结果对应的行为特征数据,fq′,p为与目标搜索词相关的新增搜索结果对应的行为特征数据,fq′,p′为与目标搜索词相关的目标搜索结果对应的行为特征数据,α,β,γ,δ为超参数,在应用时需要提前设置,超参数可以直接作为预设权重。且可以通过下述等式,使得融合特征数据与第一行为特征数据在一个量纲上。
α+β+γ+δ=1
作为一个可选的实施例,可以对超参数进行动态归一化,得到预设权重。作为一个可选的实施例,动态归一化可以用softmax函数进行,将进行softmax之后的超参数作为预设权重,若某个超参数对应的特征数据不存在,则将该超参数设置为负无穷,此时的预设权重为0。将如下式所示:
Figure BDA0002807958500000161
Figure BDA0002807958500000162
Figure BDA0002807958500000163
Figure BDA0002807958500000164
其中,softmaxα、softmaxβ、softmaxγ、softmaxδ为对α,β,γ,δ进行softmax之后的参数,将进行softmax之后的参数作为预设权重,基于预设权重对新增搜索结果对应的行为特征数据和关联行为特征数据进行加权融合。可以用同样的方法对新增搜索结果对应的行为特征数据和关联行为特征数据进行加权融合
第一行为特征数据与历史搜索结果相对应,融合特征数据与新增搜索结果相对应,对第一行为特征数据和融合特征数据进行排序分析,可以得到每个搜索结果的排序指示信息。排序指示信息可以表征每个搜索结果与当前搜索词的匹配程度,该匹配程度与搜索结果在排序时的先后顺序呈正相关。在一个可选的实施例中,排序指示信息可以通过数值进行表示。
根据预设权重,对第二行为特征数据和关联行为特征数据进行加权融合,可以使得新增搜索结果对应的行为特征数据和历史搜索结果对应的行为特征数据具有相同的量纲,便于后续进行搜索结果的排序。
作为一种可选的实施例,请参见图10,基于预设的排序算法,对融合特征数据和第一行为特征数据进行排序分析,确定搜索结果的排序指示信息包括:
S1010.将当前搜索词对应的搜索结果候选集中任意两个搜索结果组成搜索结果对;
S1020.根据融合特征数据和第一行为特征数据,获取搜索结果对中的两个搜索结果对应的特征数据差值;
S1030.将搜索结果对中的两个搜索结果对应的特征数据差值中满足预设差值条件的搜索结果对作为初始搜索结果对;
S1040.确定初始搜索结果对中的两个搜索结果的相对顺序数据;
S1050.将初始搜索结果对中的两个搜索结果的相对顺序数据中满足预设相对顺序数据条件的初始搜索结果对作为目标搜索结果对;
S1060.根据目标搜索结果对中的两个搜索结果的相对顺序数据,确定搜索结果的排序指示信息。
作为一个可选的实施例,对新增搜索结果的融合特征数据和第一行为特征数据进行排序分析时,将新增搜索结果的融合特征数据和第一行为特征数据输入到预先训练好的排序模型中,输出搜索结果的分数值,即搜索结果的排序指示信息。
可以使用排序学习算法(Learning to rank,LTR),选择任意两个搜索结果,对这两个搜索结果进行相对关系的排序,确定哪一个搜索结果应该排在前面,从而可以对所有搜索结果进行排序。将新增搜索结果的融合特征数据和第一行为特征数据输入到预先训练好的排序模型中,将搜索结果候选集中任意两个搜索结果组成搜索结果对,计算搜索结果对中的两个搜索结果的特征数据差值。特征数据差值为搜索结果对中两个搜索结果对应的特征数据的差值,若搜索结果为历史搜索结果,则特征数据为第一行为特征数据,若搜索结果为新增搜索结果,则特征数据为新增搜索结果对应的融合特征数据。
当特征数据差值为正值时,说明搜索结果对中的两个搜索结果中排序在前的搜索结果的评分高于排序在后的搜索结果的评分,即搜索结果对中的两个搜索结果为正向顺序。当特征数据差值为负值时,说明搜索结果对中的两个搜索结果中排序在前的搜索结果的评分要低于排序在后的搜索结果的评分,即搜索结果对中的两个搜索结果为反向顺序。将特征数据差值为正值的特征数据差值对应的搜索结果对作为初始搜索结果对。
确定初始搜索结果对中两个搜索结果间的偏序概率,从而确定初始搜索结果对中的两个搜索结果的相对顺序。偏序概率可以描述任意两个搜索结果的相关性关系,在搜索结果可能存在的排序中,最有可能的排序对应的偏序概率的和值最大,也就是最有可能的排序中两两搜索结果的相关性的分数的和值是最大的,则将偏序概率的和值最大的初始搜索结果对的组合作为目标搜索结果对的组合,此时初始搜索结果对中的两个搜索结果的相对顺序数据满足预设相对顺序条件。例如,存在A、B、C、D四个搜索结果,在开始进行排序时计算搜索结果对AB、AC、AD、BC、BD、CD、BA、CA、DA、CB、DB和DC间的特征数据差值,确定搜索结果对AB、AC、AD、BC、BD、CD间的特征数据差值为正值,则说明搜索结果对AB、AC、AD、BC、BD、CD间的顺序均为正向顺序。计算搜索结果对AB、AC、AD、BC、BD、CD的偏序概率,得到A、B、C、D四个搜索结果的相关性分数,则根据A、B、C、D四个搜索结果的相关性分数,计算可能存在的排序中概率最大的排序,确定A的排序指示信息大于B、C和D,B的排序指示信息大于C和D,C的排序指示信息大于D,则分别输出A、B、C和D的排序指示信息,得到搜索结果序列为A、B、C、D。
在对排序模型进行训练时,人工对训练搜索结果进行排序,将人工排序作为排序模型的目标函数,在得到训练搜索结果中的目标搜索结果对时,根据目标搜索结果对的排序计算损失函数,对损失函数进行梯度下降,使得计算得到的目标搜索结果对的排序能够接近目标函数。
根据搜索结果中两两搜索结果间的相关性进行排序,可以考虑到两个搜索结果间的相对顺序,提高了搜索结果排序的精准性。
作为一个可选的实施例,在用户输入当前搜索词A后,服务器得到了10个搜索结果,分别为搜索结果1、搜索结果2、搜索结果3、搜索结果4、搜索结果5、搜索结果6、搜索结果7、搜索结果8、搜索结果9和搜索结果10,其中,搜索结果7为新增搜索结果,其余9个搜索结果为历史搜索结果。获取9个历史搜索结果对应的行为特征数据中与当前搜索词关联的第一行为特征数据,获取搜索结果7对应的行为特征数据中与当前搜索词关联的第二行为特征数据。由于搜索结果7为新增搜索结果,第二行为特征数据较少,因此获取与搜索结果7相似的目标搜索结果和与当前搜索词A相似的目标搜索词,根据目标搜索结果和目标搜索词,得到搜索结果7的关联行为特征数据。请参见图11,如图11所示为在视频搜索的场景下,获取目标搜索结果和目标搜索词的示意图。此时可以计算搜索结果7与其余9个历史搜索结果间的相似度,得到相似度最大的搜索结果8,将搜索结果8作为目标搜索结果。获取当前搜索词A对应的目标搜索词A’。如图12所示,图12为当前搜索词、目标搜索词、目标搜索结果和新增搜索结果间的关系的示意图,获取搜索结果8对应的行为特征数据中与当前搜索词A关联的第一关联行为特征数据。获取搜索结果7对应的行为特征数据中与目标搜索词A’关联的第二关联行为特征数据。获取搜索结果8对应的行为特征数据中与目标搜索词A’关联的第三关联行为特征数据。根据预设权重,第一关联行为特征数据、第二关联行为特征数据、第三关联行为特征数据和第二行为特征数据进行加权融合,得到融合特征数据,将搜索结果7对应的融合特征数据作为搜索结果7对应的行为特征数据,与其余9个搜索结果对应的第一行为特征数据输入到排序模型中进行排序,得到搜索结果序列。
本公开实施例提出了一种搜索结果的排序方法,该方法包括:获取当前搜索词对应的新增搜索结果和历史搜索结果。分别获取新增搜索结果对应的行为特征数据中与当前搜索词相关的第二行为特征数据和历史搜索结果对应的行为特征数据中与当前搜索词相关的第一行为特征数据,获取与当前搜索词相似的目标搜索词,获取与新增搜索结果相似的目标搜索结果。根据目标搜索词和目标搜索结果,确定新增搜索结果的关联行为特征数据。根据第二行为特征数据、关联行为特征数据和第一行为特征数据,得到搜索结果的排序指示信息,根据排序指示信息进行排序,得到搜索结果序列。该方法实现了对新增搜索结果的第二行为特征数据的泛化提高了关联行为特征数据的置信度,且该方法通过获取新增搜索结果对应的关联行为特征数据,补充了新增搜索结果对应的行为特征数据,提高了搜索结果排序的合理性和精准性,从而提高了用户体验。
图13是根据一示例性实施例示出的一种搜索结果的排序装置框图。参照图13,该装置包括:
搜索词获取模块1300,被配置为执行获取当前搜索词;
搜索结果获取模块1310,被配置为执行获取与当前搜索词对应的搜索结果;
搜索结果划分模块1320,被配置为根据搜索结果的发布时间,将搜索结果划分为历史搜索结果和新增搜索结果;
目标搜索结果获取模块1330,被配置为执行获取与新增搜索结果相似的目标搜索结果;
目标搜索词获取模块1340,被配置为执行获取与当前搜索词相似的目标搜索词;
关联行为特征数据获取模块1350,被配置为执行根据目标搜索结果和/或目标搜索词,确定新增搜索结果的关联行为特征数据;
第一行为特征获取模块1360,被配置为执行获取历史搜索结果对应的行为特征数据中,与当前搜索词关联的第一行为特征数据;
第二行为特征获取模块1370,被配置为执行获取新增搜索结果对应的行为特征数据中,与当前搜索词关联的第二行为特征数据;
排序指示信息获取模块1380,被配置为执行根据第一行为特征数据、第二行为特征数据和关联行为特征数据,确定搜索结果的排序指示信息;
搜索结果序列获取模块1390,被配置为执行根据搜索结果的排序指示信息,对搜索结果进行排序,得到搜索结果序列。
作为一个可选的实施例,关联行为特征数据获取模块1350包括:
第一关联行为特征数据获取单元,被配置为执行获取目标搜索结果对应的行为特征数据中,与当前搜索词关联的第一关联行为特征数据;
第二关联行为特征数据获取单元,被配置为执行获取新增搜索结果对应的行为特征数据中,与目标搜索词关联的第二关联行为特征数据;
第三关联行为特征数据获取单元,被配置为执行获取目标搜索结果对应的行为特征数据中,与目标搜索词关联的第三关联行为特征数据;
关联行为特征数据获取单元,被配置为执行将第一关联行为特征数据、第二关联行为特征数据和第三关联行为特征数据中的至少一个作为新增搜索结果的关联行为特征数据。
作为一个可选的实施例,目标搜索结果获取模块1330包括:
相似度确定单元,被配置为执行确定当前搜索词对应的每个历史搜索结果与新增搜索结果间的相似度;
目标搜索结果确定单元,根据每个历史搜索结果与新增搜索结果间的相似度,确定目标搜索结果。
或;
标签信息获取单元,被配置为执行获取新增搜索结果对应的标签信息;
发布内容类别确定单元,被配置为执行根据标签信息,确定新增搜索结果对应的发布内容类别;
发布内容获取单元,被配置为执行获取发布内容类别中的发布内容;
类中心获取单元,被配置为执行根据发布内容,获取发布内容类别的类中心发布内容,将类中心发布内容作为目标搜索结果。
作为一个可选的实施例,目标搜索词获取模块1340包括:
语义信息识别单元,被配置为执行识别当前搜索词的语义信息;
历史搜索词集确定单元,被配置为执行确定与当前搜索词的语义信息对应的历史搜索词集;
搜索词相似度确定单元,被配置为执行确定历史搜索词集中每个历史搜索词与当前搜索词间的相似度;
目标搜索词确定单元,被配置为执行根据每个历史搜索词与当前搜索词间的相似度,确定目标搜索词。
作为一个可选的实施例,第一行为特征获取模块1360包括:
第一数据获取单元,被配置为执行若当前搜索词为非新增搜索词,获取历史搜索结果对应的行为特征数据中,与当前搜索词关联的行为特征数据;将与当前搜索词关联的行为特征数据作为第一行为特征数据;
第二数据获取单元,被配置为执行若当前搜索词为新增搜索词,获取历史搜索结果对应的行为特征数据中,与目标搜索词关联的行为特征数据;将与目标搜索词关联的行为特征数据作为第一行为特征数据。
作为一个可选的实施例,排序指示信息获取模块1380包括:
融合特征数据获取单元,被配置为执行根据预设权重,对第二行为特征数据和关联行为特征数据进行加权融合,得到新增搜索结果对应的融合特征数据;
排序分析单元,被配置为执行基于预设的排序算法,对融合特征数据和第一行为特征数据进行排序分析,确定搜索结果的排序指示信息。
作为一个可选的实施例,排序分析单元包括:
搜索结果对组合单元,被配置为执行将当前搜索词对应的搜索结果候选集中任意两个搜索结果组成搜索结果对;
特征数据差值获取单元,被配置为执行根据融合特征数据和第一行为特征数据,获取搜索结果对中的两个搜索结果对应的特征数据差值;
初始搜索结果对确定单元,被配置为执行将搜索结果对中的两个搜索结果对应的特征数据差值中满足预设差值条件的搜索结果对作为初始搜索结果对;
相对顺序数据确定单元,被配置为执行确定初始搜索结果对中的两个搜索结果的相对顺序数据;
目标搜索结果对确定单元,被配置为执行将初始搜索结果对中的两个搜索结果的相对顺序数据中满足预设相对顺序数据条件的初始搜索结果对作为目标搜索结果对;
排序指示信息确定单元,被配置为执行根据目标搜索结果对中的两个搜索结果的相对顺序数据,确定搜索结果的排序指示信息。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图14是根据一示例性实施例示出的一种用于进行搜索结果排序的电子设备的框图,该电子设备可以是服务器,其内部结构图可以如图14所示。该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种搜索结果的排序方法。
本领域技术人员可以理解,图14中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在示例性实施例中,还提供了一种电子设备,该电子设备包括:处理器;用于存储该处理器可执行指令的存储器;其中,该处理器被配置为执行该指令,以实现如本公开实施例中搜索结果的排序方法。
在示例性实施例中,还提供了一种计算机可读存储介质,当该存储介质中的指令由搜索结果的排序设备的处理器执行时,使得搜索结果的排序设备能够执行本公开实施例中搜索结果的排序方法。
在示例性实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行本公开实施例中的一种搜索结果的排序方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种搜索结果的排序方法,其特征在于,所述方法包括:
获取当前搜索词;
获取与所述当前搜索词对应的搜索结果;
根据所述搜索结果的发布时间,将所述搜索结果划分为历史搜索结果和新增搜索结果;
获取与所述新增搜索结果相似的目标搜索结果;
获取与所述当前搜索词相似的目标搜索词;
根据所述目标搜索结果和/或所述目标搜索词,确定所述新增搜索结果的关联行为特征数据;
获取所述历史搜索结果对应的行为特征数据中,与所述当前搜索词关联的第一行为特征数据;
获取所述新增搜索结果对应的行为特征数据中,与所述当前搜索词关联的第二行为特征数据;
根据所述第一行为特征数据、所述第二行为特征数据和所述关联行为特征数据,确定所述搜索结果的排序指示信息;
根据所述搜索结果的排序指示信息,对所述搜索结果进行排序,得到搜索结果序列。
2.根据权利要求1所述的一种搜索结果的排序方法,其特征在于,所述根据所述目标搜索结果和/或所述目标搜索词,确定所述新增搜索结果的关联行为特征数据包括:
获取所述目标搜索结果对应的行为特征数据中,与所述当前搜索词关联的第一关联行为特征数据;
获取所述新增搜索结果对应的行为特征数据中,与所述目标搜索词关联的第二关联行为特征数据;
获取所述目标搜索结果对应的行为特征数据中,与所述目标搜索词关联的第三关联行为特征数据;
将所述第一关联行为特征数据、所述第二关联行为特征数据和所述第三关联行为特征数据中的至少一个作为所述新增搜索结果的关联行为特征数据。
3.根据权利要求1所述的一种搜索结果的排序方法,其特征在于,所述获取与所述新增搜索结果相似的目标搜索结果包括:
确定所述当前搜索词对应的每个历史搜索结果与所述新增搜索结果间的相似度;
根据所述每个历史搜索结果与所述新增搜索结果间的相似度,确定所述目标搜索结果;
或;
获取所述新增搜索结果对应的标签信息;
根据所述标签信息,确定所述新增搜索结果对应的发布内容类别;
获取所述发布内容类别中的发布内容;
根据所述发布内容,获取所述发布内容类别的类中心发布内容;
将所述类中心发布内容作为所述目标搜索结果。
4.根据权利要求1所述的一种搜索结果的排序方法,其特征在于,所述获取与所述当前搜索词相似的目标搜索词包括:
识别所述当前搜索词的语义信息;
确定与所述当前搜索词的语义信息对应的历史搜索词集;
确定所述历史搜索词集中每个历史搜索词与所述当前搜索词间的相似度;
根据所述每个历史搜索词与所述当前搜索词间的相似度,确定所述目标搜索词。
5.根据权利要求1所述的一种搜索结果的排序方法,其特征在于,所述获取所述历史搜索结果对应的行为特征数据中,与所述当前搜索词关联的第一行为特征数据包括:
若所述当前搜索词为非新增搜索词,获取所述历史搜索结果对应的行为特征数据中,与所述当前搜索词关联的行为特征数据;
将所述与所述当前搜索词关联的行为特征数据作为所述第一行为特征数据;
若所述当前搜索词为新增搜索词,获取所述历史搜索结果对应的行为特征数据中,与所述目标搜索词关联的行为特征数据;
将所述与所述目标搜索词关联的行为特征数据作为所述第一行为特征数据。
6.根据权利要求1所述的一种搜索结果的排序方法,其特征在于,所述根据所述第一行为特征数据、所述第二行为特征数据和所述关联行为特征数据,确定所述搜索结果的排序指示信息包括:
根据预设权重,对所述第二行为特征数据和所述关联行为特征数据进行加权融合,得到所述新增搜索结果对应的融合特征数据;
基于预设的排序算法,对所述融合特征数据和所述第一行为特征数据进行排序分析,确定所述搜索结果的排序指示信息。
7.根据权利要求6所述的一种搜索结果的排序方法,其特征在于,所述基于预设的排序算法,对所述融合特征数据和所述第一行为特征数据进行排序分析,确定所述搜索结果的排序指示信息包括:
将所述当前搜索词对应的搜索结果候选集中任意两个搜索结果组成搜索结果对;
根据所述融合特征数据和所述第一行为特征数据,获取所述搜索结果对中的两个搜索结果对应的特征数据差值;
将所述搜索结果对中的两个搜索结果对应的特征数据差值中满足预设差值条件的搜索结果对作为初始搜索结果对;
确定所述初始搜索结果对中的两个搜索结果的相对顺序数据;
将所述初始搜索结果对中的两个搜索结果的相对顺序数据中满足预设相对顺序数据条件的初始搜索结果对作为目标搜索结果对;
根据所述目标搜索结果对中的两个搜索结果的相对顺序数据,确定所述搜索结果的排序指示信息。
8.一种搜索结果的排序装置,其特征在于,所述装置包括:
搜索词获取模块,被配置为执行获取当前搜索词;
搜索结果获取模块,被配置为执行获取与所述当前搜索词对应的搜索结果;
搜索结果划分模块,被配置为根据所述搜索结果的发布时间,将所述搜索结果划分为历史搜索结果和新增搜索结果;
目标搜索结果获取模块,被配置为执行获取与所述新增搜索结果相似的目标搜索结果;
目标搜索词获取模块,被配置为执行获取与所述当前搜索词相似的目标搜索词;
关联行为特征数据获取模块,被配置为执行根据所述目标搜索结果和/或与所述目标搜索词,确定所述新增搜索结果对应的关联行为特征数据;
第一行为特征获取模块,被配置为执行获取所述历史搜索结果对应的行为特征数据中,与所述当前搜索词关联的第一行为特征数据;
第二行为特征获取模块,被配置为执行获取所述新增搜索结果对应的行为特征数据中,与所述当前搜索词关联的第二行为特征数据;
排序指示信息获取模块,被配置为执行根据所述第一行为特征数据、所述第二行为特征数据和所述关联行为特征数据,确定所述搜索结果的排序指示信息;
搜索结果序列获取模块,被配置为执行根据所述搜索结果的排序指示信息,对所述搜索结果进行排序,得到搜索结果序列。
9.一种电子设备,其特征在于,所述设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7中任一项所述的一种搜索结果的排序方法。
10.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至7中任一项所述的一种搜索结果的排序方法。
CN202011374973.3A 2020-11-30 2020-11-30 一种搜索结果的排序方法、装置、设备和存储介质 Active CN112434183B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011374973.3A CN112434183B (zh) 2020-11-30 2020-11-30 一种搜索结果的排序方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011374973.3A CN112434183B (zh) 2020-11-30 2020-11-30 一种搜索结果的排序方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN112434183A true CN112434183A (zh) 2021-03-02
CN112434183B CN112434183B (zh) 2024-05-17

Family

ID=74698729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011374973.3A Active CN112434183B (zh) 2020-11-30 2020-11-30 一种搜索结果的排序方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN112434183B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254734A (zh) * 2021-05-21 2021-08-13 北京达佳互联信息技术有限公司 点击模型确定方法、搜索方法、装置、服务器及介质
CN113254770A (zh) * 2021-05-27 2021-08-13 北京达佳互联信息技术有限公司 内容排序方法、装置、服务器及存储介质
CN113297511A (zh) * 2021-05-24 2021-08-24 北京三快在线科技有限公司 商户排序模型的构建方法、装置、服务器及存储介质
CN113468235A (zh) * 2021-05-31 2021-10-01 北京达佳互联信息技术有限公司 信息获取方法、装置、服务器及存储介质

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104142999A (zh) * 2014-08-01 2014-11-12 百度在线网络技术(北京)有限公司 搜索结果展示方法及装置
CN104778266A (zh) * 2015-04-22 2015-07-15 无锡天脉聚源传媒科技有限公司 一种多数据源搜索的方法及装置
CN105630836A (zh) * 2014-11-05 2016-06-01 阿里巴巴集团控股有限公司 搜索结果的排序方法和装置
WO2017214329A1 (en) * 2016-06-10 2017-12-14 Apple Inc. Client-side search result re-ranking
CN107491534A (zh) * 2017-08-22 2017-12-19 北京百度网讯科技有限公司 信息处理方法和装置
CN109086394A (zh) * 2018-07-27 2018-12-25 天津字节跳动科技有限公司 搜索排序方法、装置、计算机设备和存储介质
CN110019650A (zh) * 2018-09-04 2019-07-16 北京京东尚科信息技术有限公司 提供搜索联想词的方法、装置、存储介质及电子设备
CN110162593A (zh) * 2018-11-29 2019-08-23 腾讯科技(深圳)有限公司 一种搜索结果处理、相似度模型训练方法及装置
CN110598102A (zh) * 2019-09-05 2019-12-20 北京字节跳动网络技术有限公司 确定搜索项目的顺序的方法、装置、电子设备和计算机可读存储介质
CN110866491A (zh) * 2019-11-13 2020-03-06 腾讯科技(深圳)有限公司 目标检索方法、装置、计算机可读存储介质和计算机设备
CN111291069A (zh) * 2018-12-07 2020-06-16 北京搜狗科技发展有限公司 一种数据处理方法、装置和电子设备
CN111428007A (zh) * 2020-06-08 2020-07-17 北京每日优鲜电子商务有限公司 基于跨平台的同步推送反馈方法
CN111444380A (zh) * 2020-03-26 2020-07-24 腾讯音乐娱乐科技(深圳)有限公司 音乐搜索排序方法、装置、设备和存储介质
CN111611289A (zh) * 2019-02-22 2020-09-01 北京京东尚科信息技术有限公司 物品信息的搜索排序方法、装置、存储介质和电子设备
CN111881316A (zh) * 2020-07-28 2020-11-03 腾讯音乐娱乐科技(深圳)有限公司 搜索方法、装置及服务器和计算机可读存储介质

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104142999A (zh) * 2014-08-01 2014-11-12 百度在线网络技术(北京)有限公司 搜索结果展示方法及装置
CN105630836A (zh) * 2014-11-05 2016-06-01 阿里巴巴集团控股有限公司 搜索结果的排序方法和装置
CN104778266A (zh) * 2015-04-22 2015-07-15 无锡天脉聚源传媒科技有限公司 一种多数据源搜索的方法及装置
WO2017214329A1 (en) * 2016-06-10 2017-12-14 Apple Inc. Client-side search result re-ranking
CN107491534A (zh) * 2017-08-22 2017-12-19 北京百度网讯科技有限公司 信息处理方法和装置
US20190065507A1 (en) * 2017-08-22 2019-02-28 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for information processing
CN109086394A (zh) * 2018-07-27 2018-12-25 天津字节跳动科技有限公司 搜索排序方法、装置、计算机设备和存储介质
CN110019650A (zh) * 2018-09-04 2019-07-16 北京京东尚科信息技术有限公司 提供搜索联想词的方法、装置、存储介质及电子设备
CN110162593A (zh) * 2018-11-29 2019-08-23 腾讯科技(深圳)有限公司 一种搜索结果处理、相似度模型训练方法及装置
CN111291069A (zh) * 2018-12-07 2020-06-16 北京搜狗科技发展有限公司 一种数据处理方法、装置和电子设备
CN111611289A (zh) * 2019-02-22 2020-09-01 北京京东尚科信息技术有限公司 物品信息的搜索排序方法、装置、存储介质和电子设备
CN110598102A (zh) * 2019-09-05 2019-12-20 北京字节跳动网络技术有限公司 确定搜索项目的顺序的方法、装置、电子设备和计算机可读存储介质
CN110866491A (zh) * 2019-11-13 2020-03-06 腾讯科技(深圳)有限公司 目标检索方法、装置、计算机可读存储介质和计算机设备
CN111444380A (zh) * 2020-03-26 2020-07-24 腾讯音乐娱乐科技(深圳)有限公司 音乐搜索排序方法、装置、设备和存储介质
CN111428007A (zh) * 2020-06-08 2020-07-17 北京每日优鲜电子商务有限公司 基于跨平台的同步推送反馈方法
CN111881316A (zh) * 2020-07-28 2020-11-03 腾讯音乐娱乐科技(深圳)有限公司 搜索方法、装置及服务器和计算机可读存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254734A (zh) * 2021-05-21 2021-08-13 北京达佳互联信息技术有限公司 点击模型确定方法、搜索方法、装置、服务器及介质
CN113254734B (zh) * 2021-05-21 2024-01-09 北京达佳互联信息技术有限公司 点击模型确定方法、搜索方法、装置、服务器及介质
CN113297511A (zh) * 2021-05-24 2021-08-24 北京三快在线科技有限公司 商户排序模型的构建方法、装置、服务器及存储介质
CN113254770A (zh) * 2021-05-27 2021-08-13 北京达佳互联信息技术有限公司 内容排序方法、装置、服务器及存储介质
CN113254770B (zh) * 2021-05-27 2024-01-12 北京达佳互联信息技术有限公司 内容排序方法、装置、服务器及存储介质
CN113468235A (zh) * 2021-05-31 2021-10-01 北京达佳互联信息技术有限公司 信息获取方法、装置、服务器及存储介质

Also Published As

Publication number Publication date
CN112434183B (zh) 2024-05-17

Similar Documents

Publication Publication Date Title
CN112434183B (zh) 一种搜索结果的排序方法、装置、设备和存储介质
CN108829822B (zh) 媒体内容的推荐方法和装置、存储介质、电子装置
CN111008332B (zh) 内容项推荐方法、装置、服务器以及存储介质
US10949000B2 (en) Sticker recommendation method and apparatus
CN110717099B (zh) 一种推荐影片的方法及终端
CN109816483B (zh) 信息推荐方法及装置、可读存储介质
CN112241626A (zh) 一种语义匹配、语义相似度模型训练方法及装置
CN111324713B (zh) 对话自动回复方法、装置、存储介质和计算机设备
CN111914176B (zh) 题目的推荐方法及装置
CN110909145A (zh) 针对多任务模型的训练方法及装置
JP7564326B2 (ja) 検索クエリについての解釈の評価
CN113112282A (zh) 基于客户画像处理咨诉问题的方法、装置、设备及介质
CN112163149B (zh) 推荐消息的方法及装置
US20230308360A1 (en) Methods and systems for dynamic re-clustering of nodes in computer networks using machine learning models
CN116089567A (zh) 一种搜索关键词的推荐方法、装置、设备和存储介质
CN111858969A (zh) 多媒体数据推荐方法、装置、计算机设备和存储介质
CN116204714A (zh) 推荐方法、装置、电子设备及存储介质
CN110598126B (zh) 基于行为习惯的跨社交网络用户身份识别方法
CN117194772B (zh) 一种基于用户标签的内容推送方法及装置
CN115827990A (zh) 搜索方法及装置
CN116955788A (zh) 一种内容处理的方法、装置、设备、存储介质及程序产品
CN113312523B (zh) 字典生成、搜索关键字推荐方法、装置和服务器
CN112231546B (zh) 异构文档的排序方法、异构文档排序模型训练方法及装置
CN113986989A (zh) 表单项推荐方法、装置、计算机设备和存储介质
CN113761349A (zh) 一种推荐信息的挖掘方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant