CN113254734A - 点击模型确定方法、搜索方法、装置、服务器及介质 - Google Patents

点击模型确定方法、搜索方法、装置、服务器及介质 Download PDF

Info

Publication number
CN113254734A
CN113254734A CN202110559194.9A CN202110559194A CN113254734A CN 113254734 A CN113254734 A CN 113254734A CN 202110559194 A CN202110559194 A CN 202110559194A CN 113254734 A CN113254734 A CN 113254734A
Authority
CN
China
Prior art keywords
search
click model
search result
evaluation information
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110559194.9A
Other languages
English (en)
Other versions
CN113254734B (zh
Inventor
张志伟
李岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202110559194.9A priority Critical patent/CN113254734B/zh
Publication of CN113254734A publication Critical patent/CN113254734A/zh
Application granted granted Critical
Publication of CN113254734B publication Critical patent/CN113254734B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开关于一种点击模型确定方法、搜索方法、装置、服务器及计算机可读存储介质。点击模型确定方法,包括:通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定样本搜索词的第二搜索结果;确定第一搜索结果对应的第一评价信息,以及确定第二搜索结果对应的第二评价信息;根据第一评价信息和所述第二评价信息,确定样本搜索词的有效点击模型。本公开实现了针对不同搜索词可以采用不同的点击模型进行搜索,从而可以提高搜索结果的搜索质量。

Description

点击模型确定方法、搜索方法、装置、服务器及介质
技术领域
本公开涉及信息搜索技术领域,尤其涉及一种点击模型确定方法、搜索方法、装置、服务器及计算机可读存储介质。
背景技术
随着信息搜索技术的发展,出现了一种利用用户的后验数据调整信息搜索结果的技术,该技术可以根据用户针对于搜索结果反馈的后验数据,例如用户对显示的搜索结果中各结果的点击率,点赞率或者用户评论的数量等等,对用于进行搜索的点击模型进行更新,以使得优质的搜索结果具有更突出的排列位置。
相关技术中,目前对信息搜索结果的调整主要是通过对使用的点击模型的模型参数进行调整,通过改变点击模型的模型参数使得模型输出的搜索结果的排列位置也发生相应改变。然而,对点击模型的模型参数进行调整,虽然总体上可以提高搜索结果的质量,但对于某些特定的搜索信息,其搜索结果的质量反而会下降,点击模型输出的搜索结果质量较低。
发明内容
本公开提供一种点击模型确定方法、搜索方法、装置、服务器及计算机可读存储介质,以至少解决相关技术中点击模型输出的搜索结果质量低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种点击模型确定方法,包括:
通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定所述样本搜索词的第二搜索结果;
确定所述第一搜索结果对应的第一评价信息,以及确定所述第二搜索结果对应的第二评价信息;
根据所述第一评价信息和所述第二评价信息,确定所述样本搜索词的有效点击模型。
在一示例性实施例中,所述确定所述第一搜索结果对应的第一评价信息,包括:获取针对于所述第一搜索结果的后验数据;根据所述后验数据确定所述第一搜索结果对应的第一评价信息。
在一示例性实施例中,所述第一搜索结果的数量为多个,每个第一搜索结果对应多个不同参数类型的后验参数;所述根据所述后验数据确定所述第一搜索结果对应的第一评价信息,包括:获取所述每个第一搜索结果对应的各个后验参数的参数权值;根据所述参数权值,对所述每个第一搜索结果的各个后验参数进行加权求和处理,得到所述每个第一搜索结果的评价系数;将所述每个第一搜索结果的评价系数的平均值,作为所述第一搜索结果对应的第一评价信息。
在一示例性实施例中,所述根据所述第一评价信息和所述第二评价信息,确定所述样本搜索词的有效点击模型,包括:若所述第二评价信息大于所述第一评价信息,则将所述新增点击模型作为所述样本搜索词的有效点击模型;所述第一评价信息用于表征针对于所述第一搜索结果的用户满意程度;所述第二评价信息用于表征针对于所述第二搜索结果的用户满意程度。
在一示例性实施例中,所述确定所述样本搜索词的有效点击模型之后,还包括:获取当前点击模型的当前搜索词个数;所述当前点击模型为所述有效点击模型中的任一点击模型;若所述当前搜索词个数满足删除条件,将所述当前点击模型进行删除处理。
在一示例性实施例中,所述若所述当前搜索词个数满足删除条件,将所述当前点击模型进行删除处理,包括:获取所述当前点击模型对应的初始搜索词个数;确定所述当前搜索词个数与所述初始搜索词个数的比例;若所述比例小于预设的比例阈值,将所述当前点击模型进行删除处理。
在一示例性实施例中,所述若所述当前搜索词个数满足删除条件,将所述当前点击模型进行删除处理,包括:若所述当前搜索词个数小于预设的搜索词个数阈值,将所述当前点击模型进行删除处理。
根据本公开实施例的第二方面,提供一种搜索方法,包括:
获取搜索词信息,以及获取与所述搜索词信息匹配的有效点击模型;所述有效点击模型由第一方面中任一项实施例所述的点击模型确定方法所确定;
将所述搜索词信息输入所述有效点击模型,通过所述有效点击模型输出所述搜索词信息对应的搜索结果。
根据本公开实施例的第三方面,提供一种点击模型确定装置,包括:
搜索结果获取单元,被配置为执行通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定所述样本搜索词的第二搜索结果;
评价信息确定单元,被配置为执行确定所述第一搜索结果对应的第一评价信息,以及确定所述第二搜索结果对应的第二评价信息;
点击模型确定单元,被配置为执行根据所述第一评价信息和所述第二评价信息,确定所述样本搜索词的有效点击模型。
在一示例性实施例中,评价信息确定单元,进一步被配置为执行获取针对于所述第一搜索结果的后验数据;根据所述后验数据确定所述第一搜索结果对应的第一评价信息。
在一示例性实施例中,所述第一搜索结果的数量为多个,每个第一搜索结果对应多个不同参数类型的后验参数;评价信息确定单元,进一步被配置为执行获取所述每个第一搜索结果对应的各个后验参数的参数权值;根据所述参数权值,对所述每个第一搜索结果的各个后验参数进行加权求和处理,得到所述每个第一搜索结果的评价系数;将所述每个第一搜索结果的评价系数的平均值,作为所述第一搜索结果对应的第一评价信息。
在一示例性实施例中,点击模型确定单元,进一步被配置为执行若所述第二评价信息大于所述第一评价信息,则将所述新增点击模型作为所述样本搜索词的有效点击模型;所述第一评价信息用于表征针对于所述第一搜索结果的用户满意程度;所述第二评价信息用于表征针对于所述第二搜索结果的用户满意程度。
在一示例性实施例中,点击模型确定装置,还包括:点击模型删除单元,被配置为执行获取当前点击模型的当前搜索词个数;所述当前点击模型为所述有效点击模型中的任一点击模型;若所述当前搜索词个数满足删除条件,将所述当前点击模型进行删除处理。
在一示例性实施例中,所述点击模型删除单元,进一步被配置为执行获取所述当前点击模型对应的初始搜索词个数;确定所述当前搜索词个数与所述初始搜索词个数的比例;若所述比例小于预设的比例阈值,将所述当前点击模型进行删除处理。
在一示例性实施例中,所述点击模型删除单元,进一步被配置为执行若所述当前搜索词个数小于预设的搜索词个数阈值,将所述当前点击模型进行删除处理。
根据本公开实施例的第四方面,提供一种搜索装置,包括:
点击模型获取单元,被配置为执行获取搜索词信息,以及获取与所述搜索词信息匹配的有效点击模型;所述有效点击模型由第一方面中任一项实施例所述的点击模型确定方法所确定;
搜索结果输出单元,被配置为执行将所述搜索词信息输入所述有效点击模型,通过所述有效点击模型输出所述搜索词信息对应的搜索结果。
根据本公开实施例的第五方面,提供一种服务器,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如第一方面中任一项实施例所述的点击模型确定方法,或者实现如第二方面中任一项实施例所述的搜索方法。
根据本公开实施例的第六方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如第一方面中任一项实施例所述的点击模型确定方法,或者执行如第二方面中任一项实施例所述的搜索方法。
根据本公开实施例的第七方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现第一方面中任一项实施例所述的点击模型确定方法,或者实现第二方面中任一项实施例所述的搜索方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定样本搜索词的第二搜索结果;确定第一搜索结果对应的第一评价信息,以及确定第二搜索结果对应的第二评价信息;根据第一评价信息和所述第二评价信息,确定样本搜索词的有效点击模型。本公开可以通过得到确定新增点击模型与历史点击模型针对每一个搜索词的搜索结果的评价信息,并根据评价信息确定该样本搜索词的有效点击模型,实现了针对不同搜索词可以采用不同的点击模型进行搜索,从而可以提高搜索结果的搜索质量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种点击模型确定方法的流程图。
图2是根据一示例性实施例示出的获取第一评价系数的流程图。
图3是根据一示例性实施例示出的根据后验数据确定第一评价系数的流程图。
图4是根据一示例性实施例示出的显示第一搜索结果的界面示意图。
图5是根据一示例性实施例示出的删除点击模型的流程图。
图6是根据一示例性实施例示出的将当前点击模型进行删除处理的流程图。
图7是根据一示例性实施例示出的一种搜索方法的流程图。
图8是根据一示例性实施例示出的一种点击模型确定装置的框图。
图9是根据一示例性实施例示出的一种搜索装置的框图。
图10是根据一示例性实施例示出的一种服务器的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种点击模型确定方法的流程图,如图1所示,点击模型确定方法用于服务器中,包括以下步骤。
在步骤S101中,服务器通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定样本搜索词的第二搜索结果。
其中,服务器可以是用于实现搜索功能的搜索系统,该服务器中可以预先存储有多种点击模型,分别对应于不同的搜索策略,该服务器接收到需要进行搜索的搜索词时,可以通过调用预先存储的点击模型,利用点击模型得到搜索词对应的搜索结果,并将搜索结果按照点击模型对应的搜索策略进行排序,从而输出与搜索词对应的排序后的搜索结果,该服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。新增点击模型则是新加入该服务器中的点击模型,当开发出新的搜索策略对应的点击模型后,可以将该点击模型存入服务器中,作为新增点击模型,而历史点击模型则是预先存储在服务器中的点击模型,并且预先建立有与不同搜索词的对应关系。而第一搜索结果是利用历史点击模型得到的样本搜索词的搜索结果,而第二搜索结果则是利用新增点击模型得到的样本搜索词的搜索结果。
具体来说,当服务器得到新增点击模型后,可以获取用于测试新增点击模型的搜索性能的样本搜索词,样本搜索词可以是在新增点击模型加入服务器后,测试阶段中用户通过服务器进行搜索输入的任意搜索词,之后服务器可以根据上述预先建立的对应关系确定出每一个样本搜索词对应的历史点击模型。之后,服务器则可以分别利用历史点击模型以及新增点击模型分别对样本搜索词进行搜索,从而分别得到针对该样本搜索词的第一搜索结果以及第二搜索结果。
在步骤S102中,服务器确定第一搜索结果对应的第一评价信息,以及确定第二搜索结果对应的第二评价信息。
服务器分别得到样本搜索词的第一搜索结果以及第二搜索结果后,则可以分别得到用户针对得到的第一搜索结果的第一评价信息,可以是用户针对得到的第一搜索结果的用户评价,以及用户针对得到的第二搜索结果的第二评价信息,即用户针对得到的第二搜索结果的用户评价。
例如,对于样本搜索词A,在服务器中预先存储有与样本搜索词A对应的历史点击模型A,在新增点击模型B加入服务器时,如果用户需要对样本搜索词A进行搜索时,则可以将用户随机分为两类,分别利用历史点击模型A以及新增点击模型B输出针对样本搜索词A的第一搜索结果以及第二搜索结果,并分别获取第一搜索结果对应的第一评价信息,以及第二搜索结果的第二评价信息。
在步骤S103中,服务器根据第一评价信息和所述第二评价信息,确定样本搜索词的有效点击模型。
有效点击模型则指的是最终用于对样本搜索词进行搜索的点击模型,有效点击模型可以是该样本搜索词的历史点击模型,和新加入服务器的新增点击模型中的任意一个。服务器在得到第一评价信息以及第二评价信息后,由于第一评价信息和第二评价信息可以反映用户的评价,因此服务器可以通过第一评价信息以及第二评价信息找出针对样本搜索词具有更高的用户评价的点击模型,作为最终的该样本搜索词的有效点击模型。
上述点击模型确定方法中,服务器通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定样本搜索词的第二搜索结果;确定第一搜索结果对应的第一评价信息,以及确定第二搜索结果对应的第二评价信息;根据第一评价信息和所述第二评价信息,确定样本搜索词的有效点击模型。本公开服务器可以通过得到确定新增点击模型与历史点击模型针对每一个搜索词的搜索结果的评价信息,并根据评价信息确定该样本搜索词的有效点击模型,实现了针对不同搜索词可以采用不同的点击模型进行搜索,从而可以提高搜索结果的搜索质量。
在一示例性实施例中,如图2所示,步骤S102可以进一步包括:
在步骤S201中,服务器获取针对于第一搜索结果的后验数据;
在步骤S202中,服务器根据后验数据确定第一搜索结果对应的第一评价信息。
第一搜索结果的后验数据指的是用户针对第一搜索结果的反馈数据,例如可以是用户针对第一搜索结果的点击率,或者针对第一搜索结果的收藏率等等。服务器可以采集用户针对于第一搜索结果的后验数据,并利用得到的后验数据确定用户针对第一搜索结果的第一评价信息。
同理,服务器也可以将样本搜索词输入新增点击模型中,通过新增点击模型输出该样本搜索词的第二搜索结果,并获取用户针对第二搜索结果的后验数据,以及利用第二搜索结果的后验数据确定用户针对第二搜索结果的第二评价信息。
本实施例中,服务器可以根据得到的搜索结果的后验数据来得到其对应的评价信息,可以使得评价信息更符合用户的实际需要,相比根据类似视频相关度等先验数据得到评价系数,利用后验数据得到评价系数可以使搜索结果更加符合用户需要,进一步提高点击模型得到搜索结果的质量。
进一步地,第一搜索结果的数量为多个,每个第一搜索结果对应多个不同参数类型的后验参数;如图3所示,步骤S203可以进一步包括:
在步骤S301中,服务器获取每个第一搜索结果对应的各个后验参数的参数权值。
其中,第一搜索结果的数量可以是多个,如图4所示,在对某一个搜索词A进行搜索时,其得到的搜索结果可以包括搜索结果A、搜索结果B、搜索结果C以及搜索结果D,用户可以分别对不同的搜索结果进行相应的反馈,因此,服务器得到的每一个搜索结果都可以有与其对应的后验数据。同时,用户的反馈信息也可以是多种多样,例如对于某一个搜索结果的收藏率以及向其他用户推荐的推荐率等等,因此每一个搜索结果对应的后验数据也可以由不同的参数类型的后验参数组成,而参数权值则指的是每一个后验参数对评价系数的影响量,如果某一个后验参数对评价系数的影响量较大,则可以有更大的参数权值。
例如:不同数据类型的后验参数可以包括用户针对某个第一搜索结果的收藏率、关注率以及向其他用户进行推荐的推荐率,而得到的第一搜索结果可以包括搜索结果A以及搜索结果B,那么服务器则可以分别得到用户针对搜索结果A的收藏率A、关注率A以及推荐率A,以及用户针对搜索结果B的收藏率B、关注率B以及推荐率B。
具体来说,服务器可以采集每一个第一搜索结果对应的多个不同类型的后验参数,并确定每一个后验参数对应的参数权值,参数权值的确定可以是用户预先输入至服务器中,在得到每一个第一搜索结果的评价信息的过程中保持不变。
在步骤S302中,服务器根据参数权值,对每个第一搜索结果的各个后验参数进行加权求和处理,得到每个第一搜索结果的评价系数。
在步骤S301服务器得到每一个后验参数对应的参数权值后,则可以利用得到的参数权值,对通过历史点击模型得到的每个第一搜索结果的各个后验参数进行加权求和处理,从而得到每一个搜索结果的评价系数。例如,本实施例针对的第一搜索结果可以是针对某一类由同样搜索词得到的视频的搜索结果,其采用的后验参数可以是用户针对搜索得到的视频的点击率、点赞率、关注率以及某个视频的播放时长,因此,其搜索得到的每一个视频的评价系数可以通过如下关系模型进行计算:
ue=α×ctr+β×ltr+γ×ftr+δ×avg_play_time
其中,ctr表示针对搜索得到的某个视频的点击率,ltr代表针对该视频的点赞率,ftr即是该视频的关注率,而avg_play_time则表示多个用户对该视频的平均播放时长,α、β、γ、δ则分别表示点击率、点赞率、关注率以及平均播放时长对应的参数权值,ue即表示某一个搜索得到的视频的评价系数。
在步骤S303中,服务器将每个第一搜索结果的评价系数的平均值,作为第一搜索结果对应的第一评价信息。
最后,服务器可以将步骤S302中计算得到的每一个第一搜索结果的评价系数进行求平均处理,将得到的平均值作为通过历史点击模型得到的样本搜索词的搜索结果的第一评价信息。
在上述例子中,在得到每一个搜索得到的视频的评价系数ue后,可以采用如下关系模型计算第一评价信息:
Figure BDA0003078283480000081
其中,ueq表示搜索词q的第一评价信息,N表示搜索词q具有N个搜索得到的视频的评价系数,uei则表示每一个搜索得到的视频的评价系数。
同理,服务器也可以采集由新增点击模型得到的第二搜索结果的后验数据,每一个后验数据也可以采集与第一搜索结果对应的后验参数,并设置与第一搜索结果相同的参数权值,再通过参数权值对每个第二搜索结果的后验参数进行加权求和,并求平均,从而可以得到通过新增点击模型得到的样本搜索词的搜索结果的第二评价信息。
本实施例通过对多个搜索结果对应的不同参数类型的后验参数设置相应的参数权值,并利用参数权值得到每一个搜索结果的评价系数,并将多个搜索结果的评价系数的平均值作为最终的评价信息,可以提高得到的最终的评价信息的准确性。
在一示例性实施例中,步骤S103可以进一步包括:若第二评价信息大于第一评价信息,服务器则将新增点击模型作为样本搜索词的有效点击模型;第一评价信息用于表征针对于第一搜索结果的用户满意程度;第二评价信息用于表征针对于第二搜索结果的用户满意程度。
本实施例中,针对于搜索结果的评价信息可以用于表征用户针对于搜索结果的满意程度,由于上述评价信息时通过用户的后验数据得到,一般而言,后验数据越大,则表明用户的满意程度越高,因此,如果通过新增点击模型得到的第二搜索结果的第二评价信息,大于通过历史点击模型得到的第一搜索结果的第一评价信息,即可表明用户对新增点击模型得到的第二搜索结果的满意程度更高,因此服务器可以将新增点击模型作为该样本搜索词的有效点击模型。同理,如果得到的针对于第一搜索结果的第一评价信息大于第二评价信息,则表明用户对历史点击模型得到的第一搜索结果的满意程度更高,那么服务器则可以将历史点击模型仍然作为该样本搜索词的有效点击模型。
本实施例中,服务器可通过比对第一评价信息以及第二评价信息的大小关系,确定样本搜索词的有效点击模型,可以保证有效点击模型可以是用户满意程度最高的点击模型,从而提高用户针对点击模型输出的搜索结果的满意程度。
在一示例性实施例中,如图5所示,步骤S103之后,还可以包括:
在步骤S501中,服务器获取当前点击模型的当前搜索词个数;当前点击模型为有效点击模型中的任一点击模型。
由于随着新的点击模型不断加入服务器,对于服务器中存储的旧的点击模型所对应的搜索词会不断减少,例如某个点击模型A加入服务器时其对应的搜索词包括搜索词A,搜索词B以及搜索词C,而在新的点击模型B加入服务器后,由于新的点击模型针对搜索词B以及搜索词C具有更好的搜索质量,因此点击模型A对应的搜索词则会只剩下搜索词A,同时随着新的点击模型不断加入,为了避免服务器的容量不断扩大,需要对服务器中的点击模型进行删除。
具体来说,当服务器确定每一个样本搜索词分别对应的有效点击模型后,服务器可以从其存储的有效点击模型中,提取出任意一个有效点击模型,作为当前点击模型,而当前搜索词个数则指的是当前点击模型中仍然生效的搜索词个数,服务器在得到当前点击模型后可以同时获取该当前点击模型仍然生效的搜索词,作为当前搜索词,并对当前搜索词的个数进行统计,从而得到当前点击模型对应的当前搜索词个数。
在步骤S502中,若当前搜索词个数满足删除条件,服务器将当前点击模型进行删除处理。
之后,服务器可以判断当前点击模型还生效的当前搜索词的个数是否达到了预先设定的对点击模型进行删除的删除条件,如果已经满足了删除条件,那么服务器则会将当前点击模型进行删除。
本实施例中,服务器可以统计历史点击模型和新增点击模型中的任一当前点击模型对应的当前搜索词个数,如果当前搜索词个数满足删除条件,则可以将当前点击模型从服务器中删除,从而可以减少点击模型占用的服务器容量,可以保证服务器的简约。
进一步地,如图6所示,步骤S502可以进一步包括:
在步骤S601中,服务器获取当前点击模型对应的初始搜索词个数。
其中,初始搜索词个数指的是当前点击模型加入服务器时生效的搜索词个数。例如:由于某个点击模型A加入服务器时其对应的搜索词包括搜索词A,搜索词B以及搜索词C,因此点击模型A对应的初始搜索词个数即为3个。具体来说,服务器在将点击模型新加入时,在确定新加入的点击模型对应的搜索词的同时,还可以统计其对应的搜索词的搜索词个数,作为初始搜索词个数。
在步骤S602中,服务器确定当前搜索词个数与初始搜索词个数的比例;
在步骤S603中,若比例小于预设的比例阈值,服务器将当前点击模型进行删除处理。
当前搜索词个数则指的是当前点击模型在当前时刻生效的搜索词个数,在上述例子中,由于点击模型A对应的搜索词则最后只剩下搜索词A,因此点击模型A对应的当前搜索词个数即为1个,服务器则可以确定点击模型A的当前搜索词个数与初始搜索词个数的比例为1/3。服务器确定该比例后,则可以将得到的比例与预先设定的比例阈值进行比较,该比例阈值可以是用户预先设定,例如可以是10%,即当前搜索词个数降低至初始搜索词个数的10%时,服务器即可将当前点击模型进行删除处理。
本实施例中,当前点击模型的删除条件是根据当前搜索词个数与初始搜索词个数的比例决定,可以保证不同的点击模型可以具有统一的删除条件,从而保证对当前点击模型进行删除处理的泛用性。
另外,步骤S502还可以包括:若当前搜索词个数小于预设的搜索词个数阈值,服务器将当前点击模型进行删除处理。
而如果某个当前点击模型在加入服务器时生效的初始搜索词个数本来就较少时,例如点击模型B生效的初始搜索词只有一个时,这个点击模型B实际发挥的作用较小,并且还会占用服务器的容量,因此对于服务器中的点击模型,用户还可以对其设置搜索词个数阈值,例如设置为10,在点击模型的当前搜索词个数小于10时,即可对其进行删除处理,从而可进一步减少服务器消耗的存储容量。
而对于本身生效搜索词个数较少的点击模型,本实施例也可以不采取将比例作为删除条件,而直接采取将当前生效的搜索词个数作为删除条件,对于生效搜索词个数较少的点击模型可以直接进行删除,从而进一步减少点击模型占用的服务器容量。
图7是根据一示例性实施例示出的一种搜索方法的流程图,如图7所示,搜索方法用于服务器中,包括以下步骤。
在步骤S701中,服务器获取搜索词信息,以及获取与搜索词信息匹配的有效点击模型;有效点击模型由如上任一项实施例所述的点击模型确定方法所确定。
其中,搜索词信息指的是用户需要通过服务器进行搜索时输入的搜索词条信息,由于在点击模型确定方法中,每次在新增点击模型加入服务器时,都建立有与其对应的样本搜索词,因此服务器中已经预先建立有多种搜索词与点击模型之间的对应关系。当服务器接收到搜索词信息时,则可以根据上述搜索词与点击模型之间的对应关系,找到与搜索词信息对应的有效点击模型。
在步骤S702中,服务器将搜索词信息输入有效点击模型,通过有效点击模型输出搜索词信息对应的搜索结果。
在步骤S701服务器得到搜索词信息对应的有效点击模型后,即可将搜索词信息输入有效点击模型,由有效点击模型输出搜索词信息对应的搜索结果,并将各个搜索结果按照点击模型对应的搜索策略进行排序,并将排序后的搜索结果返回至用户进行展示。
上述搜索方法中,服务器获取搜索词信息,以及获取与搜索词信息匹配的有效点击模型;有效点击模型由如上任一项实施例所述的点击模型确定方法所确定;将搜索词信息输入有效点击模型,通过有效点击模型输出搜索词信息对应的搜索结果。本公开通过预先建立搜索词与点击模型之间的对应关系,在用户需要进行搜索录入搜索词时,即可得到与录入的搜索词信息匹配的有效点击模型,得到搜索结果。由于服务器中预先存储有多种点击模型,并且有效点击模型是基于该搜索词信息的搜索结果对应的评价信息得到,因此本公开提供的搜索方法实现了针对不同搜索词可以采用不同的点击模型进行搜索,并且可以利用评价系数最大的点击模型执行搜索,从而提高了得到的搜索结果的搜索质量。
在一示例性实施例中,还提供了一种搜索场景下后验数据的点击调权方法,该方法可以应用于视频搜索系统,通过采集用户针对搜索系统得到的每一个视频的点击率ctr、长播率lvtr、关注率ftr以及点赞率ltr等后验数据,选择最佳的点击模型实现搜索,该方案具体可以包括如下步骤:
(1)搜索系统预先由多个点击模型组成,不同的点击模型对应于不同的搜索策略,不同的搜索策略用于对需要得到的搜索结果进行不同方式的重新排序,并且将此时的搜索系统的系统状态设置为statust
(2)在一个新的点击模型加入搜索系统时,需要对该点击模型输出的搜索结果进行测试,其中测试使用的搜索词可以是所有的搜索词,此时加入新的点击模型后搜索系统的系统状态可以设置为statust+1
(3)比对statust与statust+1中后验数据的差异
(4)使用用户满意度模型,计算statust与statust+1两个状态下,每个搜索词下的视频的平均的满意度
Figure BDA0003078283480000121
以及
Figure BDA0003078283480000122
具体来说
Figure BDA0003078283480000123
以及
Figure BDA0003078283480000124
可以通过以下步骤计算:
步骤1:用户满意度模型可以设置为若干后验数据的组合,例如:
ue=α×ctr+β×ltr+γ×ftr+δ×avg_play_time
其中ctr为点击率,ltr为点赞率、ftr为关注率,avg_play_time为平均播放时间。
步骤2:一个搜索词下会有N个视频的消费行为,因此可以对这个N个视频的满意度求平均:
Figure BDA0003078283480000125
(5)通过
Figure BDA0003078283480000131
以及
Figure BDA0003078283480000132
筛选
Figure BDA0003078283480000133
即用户满意度提高的搜索词集合setq
Figure BDA0003078283480000134
(6)将setq中的搜索词作为新的点击模型的生效搜索词。
另外,随着时间的推移,靠前的点击模型的搜索策略对应的搜索词会逐渐减少,为了保证系统的简约,还提供了一个点击模型的退场机制。
(1)在任意时刻t,搜索系统的状态为statust,可以统计出每个搜索词所属的点击模型,其中属于点击模型策略k的搜索词记为
Figure BDA0003078283480000135
另外可以知道每个点击模型策略k刚生效的
Figure BDA0003078283480000136
(2)统计当前还在生效的搜索词比例
Figure BDA0003078283480000137
(3)如果ratio小于一定比例θ,例如10%,则将点击模型策略k下掉。
Figure BDA0003078283480000138
上述实施例,通过多种点击模型的策略的组合,达到仅改善搜索词的后验效果变好的部分,并去除掉后验效果变坏部分的影响,实现了对点击模型进行局部精确改善。并且,还可以通过点击模型的退场,保证搜索系统的简约。
图8是根据一示例性实施例示出的一种点击模型确定装置的框图。参照图8,该装置包括搜索结果获取单元801,评价信息确定单元802和点击模型确定单元803。
搜索结果获取单元801,被配置为执行通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定样本搜索词的第二搜索结果;
评价信息确定单元802,被配置为执行确定第一搜索结果对应的第一评价信息,以及确定第二搜索结果对应的第二评价信息;
点击模型确定单元803,被配置为执行根据第一评价信息和第二评价信息,确定样本搜索词的有效点击模型。
在一示例性实施例中,评价信息确定单元802,进一步被配置为执行获取针对于第一搜索结果的后验数据;根据后验数据确定第一搜索结果对应的第一评价信息。
在一示例性实施例中,第一搜索结果的数量为多个,每个第一搜索结果对应多个不同参数类型的后验参数;评价信息确定单元802,进一步被配置为执行获取每个第一搜索结果对应的各个后验参数的参数权值;根据参数权值,对每个第一搜索结果的各个后验参数进行加权求和处理,得到每个第一搜索结果的评价系数;将每个第一搜索结果的评价系数的平均值,作为第一搜索结果对应的第一评价信息。
在一示例性实施例中,点击模型确定单元803,进一步被配置为执行若第二评价信息大于第一评价信息,则将新增点击模型作为样本搜索词的有效点击模型;第一评价信息用于表征针对于第一搜索结果的用户满意程度;第二评价信息用于表征针对于第二搜索结果的用户满意程度。
在一示例性实施例中,点击模型确定装置,还包括:点击模型删除单元,被配置为执行获取当前点击模型的当前搜索词个数;当前点击模型为有效点击模型中的任一点击模型;若当前搜索词个数满足删除条件,将当前点击模型进行删除处理。
在一示例性实施例中,点击模型删除单元,进一步被配置为执行获取当前点击模型对应的初始搜索词个数;确定当前搜索词个数与初始搜索词个数的比例;若比例小于预设的比例阈值,将当前点击模型进行删除处理。
在一示例性实施例中,点击模型删除单元,进一步被配置为执行若当前搜索词个数小于预设的搜索词个数阈值,将当前点击模型进行删除处理。
图9是根据一示例性实施例示出的一种搜索装置的框图。参照图9,该装置包括点击模型获取单元901和搜索结果输出单元902。
点击模型获取单元901,被配置为执行获取搜索词信息,以及获取与搜索词信息匹配的有效点击模型;有效点击模型由如上任一项实施例所述的点击模型确定方法所确定;
搜索结果输出单元902,被配置为执行将搜索词信息输入有效点击模型,通过有效点击模型输出搜索词信息对应的搜索结果。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图10是根据一示例性实施例示出的一种用于点击模型确定或者用于搜索的设备1000的框图。例如,设备1000可以为一服务器。参照图10,设备1000包括处理组件1020,其进一步包括一个或多个处理器,以及由存储器1022所代表的存储器资源,用于存储可由处理组件1020的执行的指令,例如应用程序。存储器1022中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1020被配置为执行指令,以执行上述点击模型确定或者搜索的方法。
设备1000还可以包括一个电源组件1024被配置为执行设备1000的电源管理,一个有线或无线网络接口1026被配置为将设备1000连接到网络,和一个输入输出(I/O)接口1028。设备1000可以操作基于存储在存储器1022的操作系统,例如Windows Server,Mac OSX,Unix,Linux,FreeBSD或类似。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器1022,上述指令可由设备1000的处理器执行以完成上述方法。存储介质可以是计算机可读存储介质,例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现如上任一项实施例所述的点击模型确定方法或者如上任一项实施例所述的搜索方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种点击模型确定方法,其特征在于,包括:
通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定所述样本搜索词的第二搜索结果;
确定所述第一搜索结果对应的第一评价信息,以及确定所述第二搜索结果对应的第二评价信息;
根据所述第一评价信息和所述第二评价信息,确定所述样本搜索词的有效点击模型。
2.根据权利要求1所述的方法,其特征在于,所述确定所述第一搜索结果对应的第一评价信息,包括:
获取针对于所述第一搜索结果的后验数据;
根据所述后验数据确定所述第一搜索结果对应的第一评价信息。
3.根据权利要求2所述的方法,其特征在于,所述第一搜索结果的数量为多个,每个第一搜索结果对应多个不同参数类型的后验参数;
所述根据所述后验数据确定所述第一搜索结果对应的第一评价信息,包括:
获取所述每个第一搜索结果对应的各个后验参数的参数权值;
根据所述参数权值,对所述每个第一搜索结果的各个后验参数进行加权求和处理,得到所述每个第一搜索结果的评价系数;
将所述每个第一搜索结果的评价系数的平均值,作为所述第一搜索结果对应的第一评价信息。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一评价信息和所述第二评价信息,确定所述样本搜索词的有效点击模型,包括:
若所述第二评价信息大于所述第一评价信息,则将所述新增点击模型作为所述样本搜索词的有效点击模型;所述第一评价信息用于表征针对于所述第一搜索结果的用户满意程度;所述第二评价信息用于表征针对于所述第二搜索结果的用户满意程度。
5.一种搜索方法,其特征在于,包括:
获取搜索词信息,以及获取与所述搜索词信息匹配的有效点击模型;所述有效点击模型由权利要求1至4中任一项所述的点击模型确定方法所确定;
将所述搜索词信息输入所述有效点击模型,通过所述有效点击模型输出所述搜索词信息对应的搜索结果。
6.一种点击模型确定装置,其特征在于,包括:
搜索结果获取单元,被配置为执行通过历史点击模型确定样本搜索词的第一搜索结果,以及通过新增点击模型确定所述样本搜索词的第二搜索结果;
评价信息确定单元,被配置为执行确定所述第一搜索结果对应的第一评价信息,以及确定所述第二搜索结果对应的第二评价信息;
点击模型确定单元,被配置为执行根据所述第一评价信息和所述第二评价信息,确定所述样本搜索词的有效点击模型。
7.一种搜索装置,其特征在于,包括:
点击模型获取单元,被配置为执行获取搜索词信息,以及获取与所述搜索词信息匹配的有效点击模型;所述有效点击模型由权利要求1至4中任一项所述的点击模型确定方法所确定;
搜索结果输出单元,被配置为执行将所述搜索词信息输入所述有效点击模型,通过所述有效点击模型输出所述搜索词信息对应的搜索结果。
8.一种服务器,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至4中任一项所述的点击模型确定方法,或者实现如权利要求5所述的搜索方法。
9.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如权利要求1至4中任一项所述的点击模型确定方法,或者执行如权利要求5所述的搜索方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4任一项所述的点击模型确定方法,或者实现权利要求5所述的搜索方法。
CN202110559194.9A 2021-05-21 2021-05-21 点击模型确定方法、搜索方法、装置、服务器及介质 Active CN113254734B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110559194.9A CN113254734B (zh) 2021-05-21 2021-05-21 点击模型确定方法、搜索方法、装置、服务器及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110559194.9A CN113254734B (zh) 2021-05-21 2021-05-21 点击模型确定方法、搜索方法、装置、服务器及介质

Publications (2)

Publication Number Publication Date
CN113254734A true CN113254734A (zh) 2021-08-13
CN113254734B CN113254734B (zh) 2024-01-09

Family

ID=77183668

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110559194.9A Active CN113254734B (zh) 2021-05-21 2021-05-21 点击模型确定方法、搜索方法、装置、服务器及介质

Country Status (1)

Country Link
CN (1) CN113254734B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844744A (zh) * 2017-02-15 2017-06-13 腾讯科技(深圳)有限公司 点击模型应用方法、装置及搜索系统
CN112084307A (zh) * 2020-09-14 2020-12-15 腾讯科技(深圳)有限公司 一种数据处理方法、装置、服务器及计算机可读存储介质
CN112434183A (zh) * 2020-11-30 2021-03-02 北京达佳互联信息技术有限公司 一种搜索结果的排序方法、装置、设备和存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844744A (zh) * 2017-02-15 2017-06-13 腾讯科技(深圳)有限公司 点击模型应用方法、装置及搜索系统
CN112084307A (zh) * 2020-09-14 2020-12-15 腾讯科技(深圳)有限公司 一种数据处理方法、装置、服务器及计算机可读存储介质
CN112434183A (zh) * 2020-11-30 2021-03-02 北京达佳互联信息技术有限公司 一种搜索结果的排序方法、装置、设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨彬;康慕宁;: "基于用户反馈的搜索引擎选择及结果归并", 《计算机工程》, vol. 33, no. 24 *

Also Published As

Publication number Publication date
CN113254734B (zh) 2024-01-09

Similar Documents

Publication Publication Date Title
CN109768888B (zh) 一种网络服务质量评价方法、装置、设备及可读存储介质
CN111222553B (zh) 机器学习模型的训练数据处理方法、装置和计算机设备
CN108390775B (zh) 一种基于spice的用户体验质量评价方法及系统
US9009083B1 (en) Mechanism for automatic quantification of multimedia production quality
WO2015021850A1 (en) Multidimensional data process method and device thereof
KR20170036874A (ko) 사용자 성향을 고려한 소셜 이벤트 추천 방법 및 장치
CN112328865B (zh) 信息处理和推荐方法、装置、设备及存储介质
KR101169170B1 (ko) 시간에 따라 변화하는 사용자 선호도를 고려한 컨텐츠 추천 방법
CN109688217B (zh) 一种消息推送方法、装置及电子设备
US9594756B2 (en) Automated ranking of contributors to a knowledge base
US20240037108A1 (en) Adaptive search result re-ranking
CN113254734B (zh) 点击模型确定方法、搜索方法、装置、服务器及介质
US20220114472A1 (en) Systems and methods for generating machine learning-driven telecast forecasts
CN110096311B (zh) 流式计算中聚合时间的评估方法、装置、设备及存储介质
CN111598390B (zh) 服务器高可用性评估方法、装置、设备和可读存储介质
CN110134575B (zh) 一种服务器集群的服务能力计算方法及装置
CN110245070B (zh) 测试用户筛选方法、装置、计算机设备及存储介质
CN113298115A (zh) 基于聚类的用户分组方法、装置、设备和存储介质
Wang et al. A trust-based prediction approach for recommendation system
CN112100441A (zh) 视频推荐方法、电子设备和计算机可读存储介质
US12034525B2 (en) Method for identifying new audiences for content of a content provider
JP3832720B2 (ja) 協調的フィルタリングにおけるデフォルト値設定方法及びシステム
CN117851266B (zh) 安全关键软件可靠性贝叶斯验证方法及装置
US20230020043A1 (en) Method for identifying new audiences for content of a content provider
CN116842399A (zh) 模型上线方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant