CN114329055A - 搜索推荐方法及推荐装置、电子设备、存储介质 - Google Patents
搜索推荐方法及推荐装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN114329055A CN114329055A CN202111620978.4A CN202111620978A CN114329055A CN 114329055 A CN114329055 A CN 114329055A CN 202111620978 A CN202111620978 A CN 202111620978A CN 114329055 A CN114329055 A CN 114329055A
- Authority
- CN
- China
- Prior art keywords
- search
- search result
- result
- behavior
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开关于一种搜索推荐方法及推荐装置、电子设备、存储介质,其中,搜索推荐方法包括:基于搜索词得到候选搜索结果;从候选搜索结果中获取第一搜索结果和第二搜索结果;对第一搜索结果的特征进行泛化处理,得到第一搜索结果的泛化特征;将第一搜索结果的泛化特征输入至行为预估模型,得到行为预估参数,其中,行为预估参数用于评估第一搜索结果被目标账户执行预设操作行为的概率;基于行为预估参数以及第二搜索结果的历史行为评分概率值,确定候选搜索结果的推荐排序结果。能够对所有的输出搜索结果进行合理排序,减少马太效应的出现,能够将新搜索结果的推荐排序位置设置在靠前,让用户能够不断查看到新的搜索结果,提升搜索推荐的准确性。
Description
技术领域
本公开涉及数据处理技术领域,尤其涉及搜索推荐方法及推荐装置、电子设备、存储介质。
背景技术
相关技术中,在视频搜索的场景,经常会出现一种情景:一个用户新上传的视频或者是新添加到索引系统的视频,虽然用户可能会给这个视频“定义”一些标签或者文本信息,但是由于是“新作品”缺少用户与这个视频的交互数据,造成在对其进行排序的时候会相较于“老”(用户与该视频交互行为次数多,例如,转发数多、点赞数高、观看时长足够长等)视频出现推荐“吃亏”的情况,导致新视频推荐排序位置靠后。
举例来说:在同一个搜索词下,索引到10个视频,9个视频属于“老”视频,1个视频属于“新”视频。一般在对视频进行排序的时候,会有若干的特征刻画,其中与消费行为对应的典型特征包括:点击数、点击率、点赞数、点赞率等。对于“老”视频而言,这些视频由于行为数据充分,这些行为特征也相对而言比较准确,但是对于“新”视频而言,由于交互行为较少,没有相应的置信度,导致在排序的模型中,新搜索结果会容易排序在最后面,不容易被使用者查收到,这样会导致使用者/视频应用消费者查看到的总是已出现的老视频,无法查看到新的视频,从而导致搜索推荐的准确性不高。
发明内容
本公开提供一种搜索推荐方法及推荐装置、电子设备、存储介质,以至少解决相关技术中视频搜索结果容易将新搜索结果排序在最后面,从而导致搜索推荐的准确性不高的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种搜索推荐方法,包括:基于搜索词得到候选搜索结果;从所述候选搜索结果中获取第一搜索结果和第二搜索结果,所述第一搜索结果是所述候选搜索结果中历史展示次数小于预设次数阈值的搜索结果,所述第二搜索结果是所述候选搜索结果中除所述第一搜索结果外的其他搜索结果;对所述第一搜索结果的特征进行泛化处理,得到所述第一搜索结果的泛化特征;将所述第一搜索结果的泛化特征输入至行为预估模型,得到行为预估参数,其中,所述行为预估参数用于评估所述第一搜索结果被目标账户执行预设操作行为的概率;基于所述行为预估参数以及所述第二搜索结果的历史行为评分概率值,确定所述候选搜索结果的推荐排序结果。
根据本公开实施例的另一方面,提供一种搜索推荐装置,包括:第一获取单元,被配置为基于搜索词得到候选搜索结果;第二获取单元,被配置为从所述候选搜索结果中获取第一搜索结果和第二搜索结果,所述第一搜索结果是所述候选搜索结果中历史展示次数小于预设次数阈值的搜索结果,所述第二搜索结果是所述候选搜索结果中除所述第一搜索结果外的其他搜索结果;泛化处理单元,被配置为对所述第一搜索结果的特征进行泛化处理,得到所述第一搜索结果的泛化特征;输入单元,被配置为将所述第一搜索结果的泛化特征输入至行为预估模型,得到行为预估参数,其中,所述行为预估参数用于评估所述第一搜索结果被目标账户执行预设操作行为的概率;推荐单元,被配置为基于所述行为预估参数以及所述第二搜索结果的历史行为评分概率值,确定所述候选搜索结果的推荐排序结果。
根据本公开实施例的另一方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如上述所述的搜索推荐方法。
根据本公开实施例的另一方面,还提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如上述任一项所述的搜索推荐方法。
根据本公开实施例的另一方面,还提供一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现上述所述的搜索推荐方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
在搜索推荐场景/视图搜索场景/视图搜索系统中,通过对候选搜索结果中第一搜索结果的特征进行泛化处理,结合第二搜索结果的历史行为评分概率值和第一搜索结果的行为预估参数,调整新出现的搜索结果的排序位置,让消费者能够不断看到新的搜索内容,即通过特征泛化排序方式,能够将部分新搜索结果排序位置靠前,让消费者能够看到新的内容,以解决搜索场景下的“新”搜索结果排序问题。
结合混合输出模型,能够将新老搜索结果进行分开评估,对新的搜索结果进行先验处理,对老视图进行后验处理,结合深度神经网络得到的加权值,能够对所有的输出搜索结果进行合理排序,减少马太效应的出现,能够将新搜索结果的推荐排序位置设置在靠前,让用户能够不断查看到新的搜索结果,解决相关技术中视频搜索结果容易将新搜索结果排序在最后面,从而导致搜索推荐的准确性不高的问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种搜索推荐方法的实施环境的示意图。
图2是根据一示例性实施例示出的一种可选的搜索推荐方法的流程图。
图3是根据一示例性实施例示出的一种使用混合输出模型的示意图。
图4是根据本发明实施例的一种可选的对搜索结果进行泛化处理的示意图。
图5是根据一示例性实施例示出的一种可选的搜索推荐装置的装置框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
为便于本领域技术人员理解本发明,下面对本发明各实施例中涉及的部分术语或者名词做出解释:
MMoE,混合输出模型/多任务学习模型,在本申请中,能够对新老搜索结果分别进行先验处理和后验处理,结合搜索词-搜索结果(例如,视频)之间的关联度,得到所有搜索结果的推荐排序结果。
本申请可以应用于各种搜索引擎、结果推荐应用、视图应用/视图推荐系统中,本申请的视图应用涉及到视频应用以及图像应用,以视频应用进行示意说明,例如,短视频推荐系统。针对现有技术中,在基于搜索词推荐搜索结果或者自动推荐搜索结果时,容易出现搜索结果的马太效应(即新搜索结果总是排序在后面,消费者无法查看到新的搜索结果)的情况,本申请下述各实施例,可以对新搜索结果的结果特征进行泛化处理(提高新搜索结果的行为特征刻画,让推荐系统知道新搜索结果的结果特征),提高新搜索结果的排序位置,“新”的搜索结果可以排在前面,让消费者能够看到新的内容。
下面结合本申请的各个实施例来详细说明本申请。
图1是根据一示例性实施例示出的一种搜索推荐方法的实施环境的示意图。参见图1,该实施环境:
包括电子终端101和服务器102。
电子终端101可以是智能手机、平板电脑、笔记本电脑、台式电脑或者其他具有显示功能的电子设备。电子终端101具有渲染任一视图应用/视图工具对应的前端页面的功能(例如,显示推荐的搜索结果,按照服务器102提供的推荐排序结果,依次将待推荐搜索结果显示在前端页面上)。在一些实施例中,电子终端101上安装有浏览器客户端/本地客户端,电子终端101通过运行该浏览器客户端,渲染任一应用/工具对应的前端页面。
需要说明的是,电子终端101泛指多个终端中的一个,本实施例仅以电子终端101来举例说明。本领域技术人员可以知晓,上述终端的数量可以更多或更少。例如上述终端可以仅为几个,或者上述终端为几十个或几百个,或者更多数量,本公开实施例对终端的数量和设备类型均不加以限定。
服务器102可以是一台服务器、多台服务器、云服务器、云计算平台或者虚拟化中心。在一些实施例中,服务器102是任一应用或者任意多个应用的后台服务器,服务器102存储有用于渲染属于该任一应用或者该任意多个应用的页面的资源,服务器102基于所存储的资源,为该任一应用或者该任意多个应用的页面渲染提供后台服务。
电子终端101与服务器102通过无线网络或者有线网络进行通信。电子终端101运行浏览器客户端,响应于页面渲染指令,且该页面渲染指令对应的网址属于服务器102对应的应用,通过与服务器102进行通信来获取用于渲染该网址对应的页面的资源,基于获取到的资源,渲染该网址对应的页面。需要说明的是,服务器102泛指多个服务器中的一个,其中每个服务器分别为不同应用的后台服务器,电子终端101通过与不同应用的后台服务器进行通信,对不同应用的页面进行渲染。
图2是根据一示例性实施例示出的一种可选的搜索推荐方法的流程图,如图2所示,搜索推荐方法包括以下步骤。
在步骤S201中,基于搜索词得到候选搜索结果。
本实施例中,候选搜索结果可以是基于目标账户输入的搜索词对搜索结果库进行检索得到的,目标账户输入的搜索词多种多样,类型在本实施例中并不做限定,例如,目标账户输入的搜索词为:“椅子”、“游泳”、“台灯”等,基于目标账户输入的搜索词可以在搜索结果库(以视频作为搜索结果时,可以理解为视频库)中进行关键词检索,得到候选搜索结果;当然,本实施例中的候选搜索结果也可以是自动推荐得到的,在目标账户通过持有的终端设备(例如,手机、平板等)点击浏览器、应用APP后,进入结果推荐应用的前端页面后,若是用户不输入搜索词,处于随意浏览阶段,可以在结果推荐应用的推荐页面进行自动推荐,该自动推荐的内容可以是多样化,推荐内容可以基于目标用户历史使用数据推荐,也可以是随机推荐。
本实施例涉及到的候选搜索结果的数量,可以基于目标账户使用的终端设备的屏幕大小和可使用的前端页面大小自行确定,例如,设置一次性推荐10个搜索结果、20个搜索结果。
本实施例提及的输出搜索结果,其类型包括但不限于:网页、电商推荐结果(输出用户想要购买的产品的类型,例如,衣物、水果、电器等)、视频推荐结果(短视频、长视频、推荐图像等),本实施例以候选搜索结果为待推荐视频为例进行示意性说明。
每个输出搜索结果的历史展示次数可以预先统计得到,该历史展示次数可以是指候选搜索结果(例如,短视频)历史过程中在各个账户的设备前端页面上的展示次数或者候选搜索结果(例如,图像、虚拟按钮)在各个账户的设备前端页面上点击显示次数。
在基于搜索词得到候选搜索结果时,需要提前确定统计时间段,例如,设定统计时间段为统计历史过程中30天内每个输出搜索结果的历史展示次数。通过统计一段时间内,某个搜索词下每个输出搜索结果的历史展示次数(本实施例中可以设置为showqp),对于某个搜索词,同样可以统计其搜索次数(本实施例中可记为pvq)。
在步骤S202中,从候选搜索结果中获取第一搜索结果和第二搜索结果,第一搜索结果是候选搜索结果中历史展示次数小于预设次数阈值的搜索结果,第二搜索结果是候选搜索结果中除第一搜索结果外的其他搜索结果。
考虑到不同类型的输出搜索结果的历史行为特征不相同,需要对候选搜索结果进行分类处理,由于视图应用是使用账户消费行为对应的行为特征数据(包括但不限于:点击数、点击率、点赞数、点赞率等)进行推荐排序的,对于老视频而言,其历史展示时长较长且历史展示次数较多,其行为特征数据较为丰富,在推荐时,排序结果会更靠前;而对于新搜索结果而言,行为特征数据较少,排序会更靠后,因此,需要将输出搜索结果进行分类,对新搜索结果进行泛化处理,本实施例中,将历史展示次数小于预设次数阈值(可以自行设置,例如,设置5次,即展示次数小于5次的待推荐视频为新搜索结果,划分为第一搜索结果)的目标输出搜索结果划分为第一搜索结果,将历史展示次数大于等于预设次数阈值的目标输出搜索结果划分为第二搜索结果。本实施例主要对第一搜索结果中的输出搜索结果,基于相似度的高频搜索词低频视图泛化处理。例如,选取一个展示次数阈值thres,将统计的历史展示次数分类为两部分,然后将showqp<thres的搜索词-输出搜索结果对应的搜索结果特征featureqp泛化到showqp>thres的搜索词-输出搜索结果对应的搜索结果特征featureqp。
在步骤S203中,对第一搜索结果的特征进行泛化处理,得到第一搜索结果的泛化特征。
本实施例中的泛化处理,是指将新的搜索结果的搜索结果的特征泛化到老搜索结果的搜索结果特征,使得新搜索结果的搜索结果特征与老搜索结果的搜索结果特征相类似(例如,有相同搜索词时,能够具备相似/相同的搜索结果特征),这样,能够让搜索推荐系统能够了解到新搜索结果的搜索结果特征,提高搜索推荐系统预测新的搜索结果的任务预估结果(例如,对点赞率、点击率、转发率、完播率等任务的预估结果),这样能够提高新搜索结果的推荐排序位置,让目标账户能够看到新推荐的搜索结果(例如,查看到新出现的短视频、衣物、新上市水果、新上线的电器)。
可选的,本实施例中指示的搜索结果的泛化特征,可以是指与消费用户的消费行为对应的行为特征,包括但不限于:观看时长、点击数、点击率、点赞数、点赞率、完播率、转发数、转发率、收藏数、收藏率等。
作为本实施例可选的实施方式,在对第一搜索结果中的各搜索结果的特征进行泛化处理之前,需要获取候选搜索结果中所有的搜索抽象向量Embedding(搜索结果的抽象向量表示,表示为连续向量)表示(用新搜索结果继承老搜索结果的特征),该抽象向量表示可以是基于先验模型,例如图像分类、视频分类等模型输出的中间结果。例如,对于第一搜索结果中一个搜索结果p∈{showqp<thres},以及第二搜索结果结合中的一个搜索结果o∈showqp>thres,计算p与所有第二搜索结果中的搜索结果o的抽象向量(Embedding向量)的相似度simliaritypo,综合所有的搜索结果相似度,相似度集合记为simliarityset。其中,该相似度可以为余弦cosine相似度,simliaritypo=cosine(embeddingo,embeddingp);或者欧式距离计算的相似度。
在得到候选搜索结果中所有的搜索抽象向量后,可以对搜索结果的特征进行泛化处理时。本实施例中,在对搜索结果的特征进行泛化处理时,对第一搜索结果的特征进行泛化处理,得到第一搜索结果的泛化特征的步骤,包括:获取候选搜索结果中每个输出搜索结果的搜索抽象向量,其中,搜索抽象向量表征继承历史搜索结果的特征;计算第一搜索结果中的输出搜索结果的搜索抽象向量与第二搜索结果中的输出搜索结果之间的搜索抽象向量之间的相似度;基于相似度,对第一搜索结果的特征进行泛化处理,得到第一搜索结果的泛化特征。
可选的,基于相似度,对第一搜索结果的特征进行泛化处理,得到第一搜索结果的泛化特征的步骤,包括:对相似度进行归一化处理;采用归一化处理结果,对第一搜索结果的特征进行泛化处理,得到第一搜索结果的泛化特征。例如,对相似度进行softmax归一化,对于一个是p相对于o的赋权值为:weightpo=softmax(simliaritypo)。然后,采用softmax归一化得到的赋权值,对p进行泛化,得到泛化后的搜索结果特征,例如,对p进行泛化,得到泛化特征,对于featureqp中的某一个特征i,
本实施例中,在对第一搜索结果的特征进行泛化处理后,可以通过行为预估模型分析各个搜索结果对应的行为预估参数。
在步骤S204中,将第一搜索结果的泛化特征输入至行为预估模型,得到行为预估参数,其中,行为预估参数用于评估第一搜索结果被目标账户执行预设操作行为的概率。
本实施例中,行为预估模型是用于对搜索结果被各个应用的账户执行各种预设操作行为的概率进行分析,该预设操作行为包括但不限于:点赞、收藏、转发、截图、点击、完播等等。通过对账户执行各种操作行为的概率进行分析,可以确定该推荐哪些搜索结果。
行为预估模型可以是预先训练得到的,通过多组参数对模型进行不断训练和调整,每组参数包括:搜索结果、操作行为的预估执行概率以及实际执行概率。
可选的,将第一搜索结果的泛化特征输入至行为预估模型,得到行为预估参数的步骤,包括:将泛化后的搜索结果特征输入至行为预估模型进行分析,并采用行为预估模型预估第一搜索结果中的输出搜索结果的点击率和完播率;计算点击率与完播率之间的乘积值,得到行为预估参数。
本实施例中,可使用泛化的特征featureqp在模型中做预测,本实施例中主要分析各行为预估参数,通过对点击率*完播率进行评估,得到点击率*完播率的评估结果,计算两者的乘积。
在步骤S205中,基于行为预估参数以及第二搜索结果的历史行为评分概率值,确定候选搜索结果的推荐排序结果。
通过上述步骤,本实施例在基于搜索词得到候选搜索结果后,将候选搜索结果分类为第一搜索结果和第二搜索结果,对第一搜索结果的特征进行泛化处理,得到第一搜索结果的泛化特征,然后将第一搜索结果的泛化特征输入至行为预估模型,得到行为预估参数,使用行为预估参数用于评估目标输出搜索结果被目标账户执行预设操作行为的概率值,最后综合第一搜索结果中的输出搜索结果的行为预估参数以及第二搜索结果中输出搜索结果的历史行为评分概率值,确定候选搜索结果的推荐排序结果。在该实施例中,对待推荐的新的搜索结果(候选搜索结果中的第一搜索结果)的特征进行泛化处理,提高新的搜索结果的排序位置,新的搜索结果能够排在前面,让消费者能够看到新的内容,从而解决了相关技术中视频搜索结果容易将新搜索结果排序在最后面,从而导致搜索推荐的准确性不高的问题。
在应用本实施例时,会预先准备三个模型/系统。
1、基于相关性的搜索词-结果匹配模型,这个模型可以是基于语义的,也可以是基于文本的,一般情况具有相似度特征(搜索词与候选搜索结果之间的相关性特征)记为relqp。
2、基于高频统计的搜索词-搜索结果(即第二搜索结果)的打分公式特征(采用结果打分模型),记为posterqp,(后验特征)一般情况下具有吸引度、满意度、吸引度置信度、满意度置信度等特征。
3、基于行为训练的一个搜索词-搜索结果点击率、完播率预估模型(即上述的行为预估模型),针对低频搜索结果(即第一搜索结果),提供搜索结果相似度的高频搜索词低频搜索结果泛化排序方式,一般情况下会输出点击率、完播率等特征记为modelqp,其模型的输入特征记为featureqp。
作为本实施例一种可选的实施方式,基于行为预估参数以及第二搜索结果的历史行为评分概率值,确定候选搜索结果的推荐排序结果的步骤,包括:获取目标账户输入的搜索词与每个输出搜索结果之间的关联度;采用预设神经网络,确定与关联度对应的第一权值、与历史行为评分概率值对应的第二权值、与行为预估参数对应的第三权值;将关联度以及对应的第一权值、历史行为评分概率值以及对应的第二权值、行为预估参数以及对应的第三权值输入至预先训练的混合输出模型,以采用混合输出模型输出候选搜索结果的推荐排序结果。
例如,对于搜索词-搜索结果展示次数与搜索词搜索次数,通过深度神经网络得到3个加权值然后进行softmax归一化之后得到第一权值weightrel、第二权值weightposter、第三权值weightmodel。
最后,确定每个输出搜索结果的特征评估分值为:
MMoE=weightrel*relqp+weightposter*posterqp+weightmodel*modelqp。基于
MMoE的计算数值,确定每个输出搜索结果的排序位置,能够将新的搜索结果通过搜索结果特征泛化为老搜索结果的搜索结果特征,提高新的搜索结果的推荐排序位置。
可选的,获取目标账户输入的搜索词与每个输出搜索结果之间的关联度,推荐方法还包括:将目标账户输入的搜索词与候选搜索结果输入至结果匹配模型,以采用结果匹配模型计算搜索词与每个输出搜索结果之间的关联度。
通过计算搜索词与搜索结果之间的关联度/相似度特征,便于后续对低频搜索结果进行泛化处理。
可选的,在基于行为预估参数以及第二搜索结果的历史行为评分概率值,确定候选搜索结果的推荐排序结果之前,推荐方法还包括:采集第二搜索结果中每个输出搜索结果的历史打分参数以及与每个历史打分参数对应的打分结果;将输出搜索结果、历史打分参数以及打分结果输入至结果打分模型,以采用结果打分模型输出第二搜索结果中的每个输出搜索结果的历史行为评分概率值。
本实施例中的历史打分参数,包括但不限于:吸引参数、满意参数、吸引度置信参数、满意度置信参数。
可选的,预先训练的混合输出模型的生成方式,包括:若目标账户输入的搜索词在历史过程中被输入的次数低于预设输入阈值,采用搜索词与推荐搜索结果之间的结果匹配模型对混合输出模型进行训练;若目标账户输入的搜索词在历史过程中被输入的次数大于等于预设输入阈值,采用行为数据对混合输出模型进行训练,其中,行为数据为多个账户在历史过程中对输出搜索结果的操作行为数据。
对于混合输出模型的模型训练,需要使用两部分数据:
第一部分数据,在pvq<pvthres,使用相关性模型(与relqp使用的结果匹配模型一致)训练;
第二部分数据,在pvq≥pvthres,使用行为数据进行训练。
通过上述混合输出模型,能够将新老搜索结果进行分开评估,对新的搜索结果进行先验处理,对老搜索结果进行后验处理,结合深度神经网络得到的加权值,能够对所有的输出搜索结果进行合理排序,减少马太效应的出现,能够将新搜索结果的推荐排序位置靠前处理,让用户能够不断查看到新的搜索结果,提高用户的使用兴趣。
下面结合一种具体地实施方式来说明本发明,该实施方式以推荐视频进行示意说明。
图3是根据一示例性实施例示出的一种使用混合输出模型的示意图,如图3所示,为了得到混合输出模型MMoE,需要分为三部分处理(对搜索词-视频展示次数、搜索词搜索次数进行深度神经网络处理;对新搜索结果,需要模型预估分数;对老视频,需要通过后验公式进行处理),得到加权特征,结合相关性分数,得到MMoE。
在应用本发明时,需要有三个准备好的模型/系统。
1、基于相关性的搜索词-结果匹配模型,这个模型可以是基于语义的,也可以是基于文本的,一般情况具有相似度特征(搜索词与候选搜索结果(例如,多个待推荐视频)之间的相关性特征)记为relqp。
2、基于高频统计的搜索词-结果的打分公式特征(采用结果打分模型),记为posterqp,一般情况下具有吸引度、满意度、吸引度置信度、满意度置信度等后验特征。
3、基于行为训练的一个搜索词-结果点击率、完播率预估模型,针对低频搜索结果(例如,候选搜索结果中历史展示次数小于预设次数阈值的视频,),提供结果相似度的高频搜索词低频结果泛化排序方式,一提供输出点击率、完播率等特征记为modelqp,其模型的输入特征记为featureqp。
本实施例中,在进行泛化处理之前,需要先确定候选搜索结果中哪些是需要进行泛化处理的搜索结果。
本实施例中,可以通过搜索词进行搜索,然后确定搜索结果中的候选搜索集合P中(即得到候选搜索结果,例如,得到汇集多个待推荐视频的视频搜索集合/视频搜索结果)所有的Embedding(搜索结果的抽象向量表示,表示为连续向量)表示,该Embedding表示可以是基于先验模型,例如图像分类、视频分类等模型输出的中间结果。
在本实施例中,需要确定统计一段时间内,某个搜索词下某个搜索结果的对应的展示次数showqp。对于某个搜索词,同样可以统计其搜索次数,记为pvq。本实施例中,对于统计的时间段不做具体限定,例如,时间段可选取30天。
可选的,本实施例中还需要选取一个展示次数阈值thres,以确定候选搜索结果中哪些是需要进行泛化处理的搜索结果。通过展示次数阈值将统计的展示次数分成2部分,需要将showqp<thres的搜索词-搜索结果对应的featureqp泛化到showqp>thres的搜索词-搜索结果对应的featureqp。泛化处理是指用新搜索结果继承老搜索结果的特征,例如,对于视频推荐而言,可以将老视频的特征泛化到新视频中,使得新视频继承了老视频的视频特征,这样能够提高新视频的执行各行为时的分析概率,提高新视频的推荐位置。
对于新搜索结果,提供基于结果相似度的高频搜索词低频结果泛化方式。图4是根据本发明实施例的一种可选的对搜索结果进行泛化处理的示意图,如图4所示,具体泛化方式如下步骤:
步骤401、在获取候选搜索结果中每个输出搜索结果的搜索抽象向量后,计算第一搜索结果中的输出搜索结果的搜索抽象向量与第二搜索结果中的输出搜索结果之间的搜索抽象向量之间的相似度。例如,对于第一搜索结果p∈{showqp<thres},第二搜索结果o∈showqp>thres,计算p与所有第二搜索结果o的Embedding向量的cosine相似度集合simliaritypo可选的,本实施例将这个集合记为simliarityset;其中,simliaritypo=cosine(embeddingo,embeddingp)。
步骤402、对相似度进行归一化处理,并采用归一化处理结果,对第一搜索结果的特征进行泛化处理。
例如,对相似度进行softmax归一化处理,可选的,本实施例中对于一个是p相对于o的赋权值为:weightpo=softmax(simliaritypo)。在完成归一化处理之后,可以使用softmax归一化权重,对p进行泛化,作为泛化特征。对于featureqp中的某一个特征i,
步骤403、将第一搜索结果的泛化特征输入至行为预估模型,得到行为预估参数。例如,将最后使用泛化的featureqp在行为预估模型中做预测,得到行为预估参数(本实施例中,以预测点击率以及完播率为例进行示意说明,通过搜索词-结果点击率、完播率预估模型计算点击率与完播率的乘积结果值,确定行为预估概率)。
可选的,对于小于展示次数阈值thres的第一搜索结果,需要对该第一搜索结果进行泛化处理,如图3所示,需要泛化模型特征,而对于大于等于展示次数阈值thres的第二搜索结果,可以直接通过模型预估分数(预估如点击数、点击率、完播数、完播率等任务预估的分数/执行概率)。
在完成低频率的第一搜索结果特征泛化处理后,提供基于混合输出模型的建模方案,构建如图3所示的混合输出模型,其中,特征加权表示为:
搜索词-搜索结果展示次数与搜索词搜索次数,通过深度神经网络得到3个加权值然后进行softmax归一化之后得到weightrel、weightposter、weightmodel。
最后计算MMoE=weightrel*relqp+weightposter*posterqp+weightmodel*modelqp。
本实施方式中,模型训练使用两部分数据:
(1),在pvq<pvthres,使用相关性模型训练,(2),在pvq≥pvthres时,使用行为数据进行训练。
通过上述实施方式,能够将新搜索结果进行的结果特征泛化为老搜索结果的特征(主要是泛化处理为消费者的行为特征,如观看时长、点击数、点击率、点赞数、点赞率等),这样能够提高新搜索结果的排序位置,将新搜索结果的位置朝前排序,提高新搜索结果的置信率,解决搜索场景下的“新”搜索结果排序问题。
图5是根据一示例性实施例示出的一种可选的搜索推荐装置的装置框图。参照图5,该装置包括第一获取单元501,第二获取单元502、泛化处理单元503、输入单元504和推荐单元505。
该第一获取单元501被配置为基于搜索词得到候选搜索结果。
该第二获取单元502被配置为从候选搜索结果中获取第一搜索结果和第二搜索结果,第一搜索结果是候选搜索结果中历史展示次数小于预设次数阈值的搜索结果,第二搜索结果是候选搜索结果中除第一搜索结果外的其他搜索结果。
泛化处理单元503被配置为对第一搜索结果的特征进行泛化处理,得到第一搜索结果的泛化特征。
输入单元504被配置为将第一搜索结果的泛化特征输入至行为预估模型,得到行为预估参数,其中,行为预估参数用于评估第一搜索结果被目标账户执行预设操作行为的概率。
推荐单元505被配置为基于行为预估参数以及第二搜索结果的历史行为评分概率值,确定候选搜索结果的推荐排序结果。
上述搜索推荐装置,通过第一获取单元501基于搜索词得到候选搜索结果后,通过第二获取单元502将候选搜索结果分类为第一搜索结果和第二搜索结果,通过泛化处理单元503对第一搜索结果的特征进行泛化处理,得到第一搜索结果的泛化特征,然后通过输入单元504将第一搜索结果的泛化特征输入至行为预估模型,得到行为预估参数,使用行为预估参数用于评估目标输出搜索结果被目标账户执行预设操作行为的概率值,最后通过推荐单元505综合第一搜索结果中的输出搜索结果的行为预估参数以及第二搜索结果中输出搜索结果的历史行为评分概率值,确定候选搜索结果的推荐排序结果。在该实施例中,对待推荐的新的搜索结果(第一搜索结果中的目标输出搜索结果)的搜索结果特征进行泛化处理,提高新的搜索结果的排序位置,新的搜索结果能够排在前面,让消费者能够看到新的内容,从而解决了相关技术中视频搜索结果容易将新搜索结果排序在最后面,从而导致搜索推荐的准确性不高的问题。
可选的,泛化处理单元503包括:第一获取模块,被配置为获取候选搜索结果中每个输出搜索结果的搜索抽象向量,其中,搜索抽象向量表征继承历史搜索结果的特征;第一计算模块,被配置为计算第一搜索结果中的输出搜索结果的搜索抽象向量与第二搜索结果中的输出搜索结果之间的搜索抽象向量之间的相似度;泛化模块,被配置为基于相似度,对第一搜索结果的特征进行泛化处理,得到第一搜索结果的泛化特征。
可选的,泛化模块包括:归一化模块,被配置为对相似度进行归一化处理,第一搜索结果中的输出搜索结果相对于第二搜索结果中的输出搜索结果的赋权值;泛化子模块,被配置为采用赋权值,对第一搜索结果的特征进行泛化处理,得到第一搜索结果的泛化特征。
可选的,泛化子模块包括:分析子模块,被配置为将泛化后的搜索结果特征输入至行为预估模型进行分析,并采用行为预估模型预估第一搜索结果中的输出搜索结果的点击率和完播率;第二计算模块,被配置为计算点击率与完播率之间的乘积值,得到行为预估参数。
可选的,搜索推荐装置还包括:第一输入模块,被配置为在基于行为预估参数以及第二搜索结果的历史行为评分概率值,确定候选搜索结果的推荐排序结果之前,将目标账户输入的搜索词与候选搜索结果输入至结果匹配模型,以采用结果匹配模型计算搜索词与每个输出搜索结果之间的关联度。
可选的,推荐单元包括:第二获取模块,被配置为获取目标账户输入的搜索词与每个输出搜索结果之间的关联度;第一确定模块,被配置为采用预设神经网络确定与关联度对应的第一权值、与历史行为评分概率值对应的第二权值、与行为预估参数对应的第三权值;输出模块,被配置为将关联度以及对应的第一权值、历史行为评分概率值以及对应的第二权值、行为预估参数以及对应的第三权值输入至混合输出模型,以采用混合输出模型输出候选搜索结果的推荐排序结果。
可选的,搜索推荐装置还包括:采集模块,被配置为在基于行为预估参数以及第二搜索结果的历史行为评分概率值,确定候选搜索结果的推荐排序结果之前,采集第二搜索结果中每个输出搜索结果的历史打分参数以及与每个历史打分参数对应的打分结果;第二输入模块,被配置为将输出搜索结果、历史打分参数以及打分结果输入至结果打分模型,以采用结果打分模型输出第二搜索结果中的每个输出搜索结果的历史行为评分概率值。
可选的,历史打分参数包括下述至少之一:吸引参数、满意参数、吸引度置信参数、满意度置信参数。
可选的,搜索推荐装置还包括:第一训练模块,被配置为,若目标账户输入的搜索词在历史过程中被输入的次数低于预设输入阈值,采用搜索词与推荐搜索结果之间的结果匹配模型对混合输出模型进行训练;第二训练模块,被配置为若目标账户输入的搜索词在历史过程中被输入的次数大于等于预设输入阈值,采用行为数据对混合输出模型进行训练,其中,行为数据为多个账户在历史过程中对输出搜索结果的操作行为数据。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
根据本公开实施例的另一方面,提供一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行指令,以实现如上述的搜索推荐方法。
本申请中的电子设备的类型,可以包括终端,也可以包括服务器。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如上述任一项的搜索推荐方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,包括计算机程序/指令,其特征在于,计算机程序/指令被处理器执行时实现上述的搜索推荐方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种搜索推荐方法,其特征在于,包括:
基于搜索词得到候选搜索结果;
从所述候选搜索结果中获取第一搜索结果和第二搜索结果,所述第一搜索结果是所述候选搜索结果中历史展示次数小于预设次数阈值的搜索结果,所述第二搜索结果是所述候选搜索结果中除所述第一搜索结果外的其他搜索结果;
对所述第一搜索结果的特征进行泛化处理,得到所述第一搜索结果的泛化特征;
将所述第一搜索结果的泛化特征输入至行为预估模型,得到行为预估参数,其中,所述行为预估参数用于评估所述第一搜索结果被目标账户执行预设操作行为的概率;
基于所述行为预估参数以及所述第二搜索结果的历史行为评分概率值,确定所述候选搜索结果的推荐排序结果。
2.根据权利要求1所述的搜索推荐方法,其特征在于,所述对所述第一搜索结果的特征进行泛化处理,得到所述第一搜索结果的泛化特征,包括:
获取所述候选搜索结果中每个输出搜索结果的搜索抽象向量,其中,所述搜索抽象向量表征继承历史搜索结果的特征;
计算所述第一搜索结果中的输出搜索结果的搜索抽象向量,与所述第二搜索结果中的输出搜索结果之间的搜索抽象向量之间的相似度;
基于所述相似度,对所述第一搜索结果的特征进行泛化处理,得到所述第一搜索结果的泛化特征。
3.根据权利要求2所述的搜索推荐方法,其特征在于,所述基于所述相似度,对所述第一搜索结果的特征进行泛化处理,得到所述第一搜索结果的泛化特征的步骤,包括:
对所述相似度进行归一化处理;
采用归一化处理结果,对所述第一搜索结果的特征进行泛化处理,得到所述第一搜索结果的泛化特征。
4.根据权利要求1所述的搜索推荐方法,其特征在于,所述将所述第一搜索结果的泛化特征输入至行为预估模型,得到行为预估参数,包括:
将泛化后的所述搜索结果特征输入至行为预估模型进行分析,并采用所述行为预估模型预估所述第一搜索结果中的输出搜索结果的点击率和完播率;
计算所述点击率与所述完播率之间的乘积值,得到所述行为预估参数。
5.根据权利要求1所述的搜索推荐方法,其特征在于,所述基于所述行为预估参数以及所述第二搜索结果的历史行为评分概率值,确定所述候选搜索结果的推荐排序结果,包括:
获取所述目标账户输入的搜索词与每个输出搜索结果之间的关联度;
采用预设神经网络,确定与所述关联度对应的第一权值、与所述历史行为评分概率值对应的第二权值、与所述行为预估参数对应的第三权值;
将所述关联度以及对应的第一权值、所述历史行为评分概率值以及对应的第二权值、所述行为预估参数以及对应的第三权值输入至预先训练的混合输出模型,以采用所述混合输出模型输出所述候选搜索结果的推荐排序结果。
6.根据权利要求5所述的搜索推荐方法,其特征在于,所述预先训练的混合输出模型的生成方式,包括:
若所述目标账户输入的搜索词在历史过程中被输入的次数低于预设输入阈值,采用搜索词与推荐搜索结果之间的结果匹配模型对混合输出模型进行训练;
若所述目标账户输入的搜索词在历史过程中被输入的次数大于等于预设输入阈值,采用行为数据对所述混合输出模型进行训练,其中,所述行为数据为多个账户在历史过程中对输出搜索结果的操作行为数据。
7.一种搜索推荐装置,其特征在于,包括:
第一获取单元,被配置为基于搜索词得到候选搜索结果;
第二获取单元,被配置为从所述候选搜索结果中获取第一搜索结果和第二搜索结果,所述第一搜索结果是所述候选搜索结果中历史展示次数小于预设次数阈值的搜索结果,所述第二搜索结果是所述候选搜索结果中除所述第一搜索结果外的其他搜索结果;
泛化处理单元,被配置为对所述第一搜索结果的特征进行泛化处理,得到所述第一搜索结果的泛化特征;
输入单元,被配置为将所述第一搜索结果的泛化特征输入至行为预估模型,得到行为预估参数,其中,所述行为预估参数用于评估所述第一搜索结果被目标账户执行预设操作行为的概率;
推荐单元,被配置为基于所述行为预估参数以及所述第二搜索结果的历史行为评分概率值,确定所述候选搜索结果的推荐排序结果。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的搜索推荐方法。
9.一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至6中任一项所述的搜索推荐方法。
10.一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1至6中任一项所述的搜索推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111620978.4A CN114329055A (zh) | 2021-12-27 | 2021-12-27 | 搜索推荐方法及推荐装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111620978.4A CN114329055A (zh) | 2021-12-27 | 2021-12-27 | 搜索推荐方法及推荐装置、电子设备、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114329055A true CN114329055A (zh) | 2022-04-12 |
Family
ID=81014047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111620978.4A Pending CN114329055A (zh) | 2021-12-27 | 2021-12-27 | 搜索推荐方法及推荐装置、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114329055A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116204688A (zh) * | 2023-05-04 | 2023-06-02 | 量子数科科技有限公司 | 一种基于键入搜索词推荐用户搜索词的方法 |
-
2021
- 2021-12-27 CN CN202111620978.4A patent/CN114329055A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116204688A (zh) * | 2023-05-04 | 2023-06-02 | 量子数科科技有限公司 | 一种基于键入搜索词推荐用户搜索词的方法 |
CN116204688B (zh) * | 2023-05-04 | 2023-06-30 | 量子数科科技有限公司 | 一种基于键入搜索词推荐用户搜索词的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110442790B (zh) | 推荐多媒体数据的方法、装置、服务器和存储介质 | |
CN109902708B (zh) | 一种推荐模型训练方法及相关装置 | |
CN110019896B (zh) | 一种图像检索方法、装置及电子设备 | |
CN110019943B (zh) | 视频推荐方法、装置、电子设备和存储介质 | |
CN106126582A (zh) | 推荐方法及装置 | |
CN107404656A (zh) | 直播视频推荐方法、装置及服务器 | |
KR101827345B1 (ko) | 다중 알고리즘 및 자기학습기능을 적용한 개인화 추천 시스템 및 추천 방법 | |
CN105160545B (zh) | 投放信息样式确定方法及装置 | |
CN110737783A (zh) | 一种推荐多媒体内容的方法、装置及计算设备 | |
CN110008397B (zh) | 一种推荐模型训练方法及装置 | |
CN109168047B (zh) | 视频推荐方法、装置、服务器及存储介质 | |
CN111597446B (zh) | 基于人工智能的内容推送方法、装置、服务器和存储介质 | |
CN111858969B (zh) | 多媒体数据推荐方法、装置、计算机设备和存储介质 | |
CN111400586A (zh) | 群组展示方法、终端、服务器、系统及存储介质 | |
CN112749330B (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN114186130A (zh) | 一种基于大数据的体育资讯推荐方法 | |
CN114245185B (zh) | 视频推荐方法、模型训练方法、装置、电子设备及介质 | |
CN112883265A (zh) | 信息推荐方法、装置、服务器及计算机可读存储介质 | |
CN114329055A (zh) | 搜索推荐方法及推荐装置、电子设备、存储介质 | |
CN112749333B (zh) | 资源搜索方法、装置、计算机设备和存储介质 | |
CN113204699B (zh) | 信息推荐方法、装置、电子设备及存储介质 | |
CN113220974A (zh) | 点击率预测模型训练、搜索召回方法、装置、设备及介质 | |
CN111581435A (zh) | 一种视频封面图像生成方法、装置、电子设备及存储介质 | |
CN112115354A (zh) | 信息处理方法、装置、服务器及存储介质 | |
CN112269943A (zh) | 一种信息推荐系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |