CN105760400B - 一种基于搜索行为的推送消息排序方法及装置 - Google Patents
一种基于搜索行为的推送消息排序方法及装置 Download PDFInfo
- Publication number
- CN105760400B CN105760400B CN201410803186.4A CN201410803186A CN105760400B CN 105760400 B CN105760400 B CN 105760400B CN 201410803186 A CN201410803186 A CN 201410803186A CN 105760400 B CN105760400 B CN 105760400B
- Authority
- CN
- China
- Prior art keywords
- user
- push message
- classification
- queried
- push
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000006243 chemical reaction Methods 0.000 claims abstract description 133
- 238000012163 sequencing technique Methods 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 19
- 238000012216 screening Methods 0.000 claims description 15
- 230000009466 transformation Effects 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 6
- 239000002699 waste material Substances 0.000 abstract description 7
- 230000006399 behavior Effects 0.000 description 19
- 230000009471 action Effects 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请提供了一种基于搜索行为的推送消息排序方法及装置,所述方法包括:获取与待查询搜索词相关的多个推送消息;获取各个所述推送消息在历史推送过程中所展示的至少一个历史用户;获取各个所述推送消息被所述历史用户执行转化操作的情况、与所述历史用户的分类特征的对应关系;至少基于所述对应关系和待查询用户的分类特征,分别计算各个所述推送消息的预估转化率;至少基于所述预估转化率,获取对各个所述推送消息的排序结果。可见,本申请计算出的预估转化率实际上是待查询用户对各个推送消息执行转化操作的可能性,能够更好的反映出待查询用户的实际需求,提高了排序后的推送消息被用户执行转化操作的可能性,从而减少系统资源浪费。
Description
技术领域
本申请涉及互联网信息技术,尤其是一种基于搜索行为的推送消息排序方法及装置。
背景技术
目前,在用户执行搜索行为时,比如用户输入了搜索词后,除了向用户显示搜索结果之外,还会向用户展示与搜索词相关的推送消息,从而帮助用户高效率地发掘有价值的信息。
在对与搜索词相关的推送消息进行展示时,为了使得推送消息能够更加符合用户的实际需求,即被用户执行点击等进一步转化操作的可能性更大,通常都会对推送消息进行排序,从而根据排序结果对推送消息进行相应展示。其中,针对推送消息一般都会设计相应的展示信息以用于展示,展示信息能够较大程度地反映推送消息的业务属性,从而吸引感兴趣的用户执行进一步的转化操作。
一种常用的排序方式是,在用户输入搜索词后,根据推送消息被执行转化操作的情况,预估与搜索词相关的各个推送消息的转化率,根据预估的转化率对各个推送消息进行排序。然而这种方式对于不同的用户,其排序结果均一致,因此不能较好地反映用户的实际需求,排序后的推送消息被用户执行转化操作的可能性依然较低,从而使得用户进一步的搜索等操作较多因此造成了系统资源的浪费。
发明内容
本申请解决的技术问题在于提供一种基于搜索行为的推送消息排序方法及装置,以实现提高排序后的推送消息被用户执行转化操作的可能性,从而减少用户进一步的搜索等操作以减少系统资源的浪费。
为此,本申请解决技术问题的技术方案是:
本申请提供了一种基于搜索行为的推送消息排序方法,包括:
获取与待查询搜索词相关的多个推送消息;
获取各个所述推送消息在历史推送过程中所展示的至少一个历史用户;
获取各个所述推送消息被所述历史用户执行转化操作的情况、与所述历史用户的分类特征的对应关系;
至少基于所述对应关系和待查询用户的分类特征,分别计算各个所述推送消息的预估转化率;所述待查询用户为输入所述待查询搜索词的用户或者对所述历史用户分类后获得的一类用户;
至少基于所述预估转化率,获取对各个所述推送消息的排序结果。
可选的,所述获取各个所述推送消息被所述历史用户执行转化操作的情况、与所述历史用户的分类特征的对应关系,包括:
获取多个样本;其中任一所述样本为任一所述推送消息在历史推送过程中的一次展示;
获取各个所述样本分别对应展示的历史用户的各个分类特征;
根据各个所述样本被所述分别对应展示的历史用户执行转化操作的情况,获取各个分类特征与所述推送消息的匹配关系对转化操作的贡献值;
将所述贡献值作为所述对应关系。
可选的,任一所述分类特征与所述推送消息的匹配关系包括以下匹配关系中的至少一种:
该分类特征与所述推送消息的匹配度;
该分类特征与所述推送消息中的各个属性特征构成的组合特征。
可选的,所述根据各个所述样本被所述分别对应展示的历史用户执行转化操作的情况,获取所述各个分类特征与推送消息的匹配关系对转化操作的贡献值,包括:
通过以下公式建立特征模型:
其中,n2为所述样本的总个数,n1为被执行转化操作的样本的总个数;yk=1表示任一样本k在展示时被执行转化操作;yk=0表示任一样本k在展示时未被执行转化操作;feak包括所述任一样本k对应展示的历史用户的各个分类特征与任一样本k的匹配关系;w为feak中的每一项对转化操作的贡献值;p(yk=1|w,feak)表示所述样本k在w和feak的前提下,被执行转化操作的概率,p(yk=0|w,feak)表示所述样本k在w和feak的前提下,未被执行转化操作的概率;
获取所述特征模型的值最大时的w。
可选的,所述至少基于所述对应关系和待查询用户的分类特征,分别计算各个所述推送消息的预估转化率,包括:
至少通过分别计算各个所述推送消息的预估转化率;其中,m为所述待查询用户的分类特征的总个数,feas,i为所述待查询用户的任一分类特征与该推送消息的匹配关系,wi为所述feas,i中的每一项对转化操作的贡献值。
可选的,所述feak还包括以下参数中的至少一种:所述任一样本k对应的推送消息的属性特征、以及所述待查询搜索词的属性特征。
可选的,所述方法还包括:
获取各个所述推送消息的匹配特征值;任一所述推送消息的匹配特征值包括:所述待查询用户的分类特征与该推送消息的匹配度;
至少基于各个所述推送消息的匹配特征值,对各个所述推送消息进行筛选;
所述获取对各个所述推送消息的排序结果,包括:
获取对筛选后的各个所述推送消息的排序结果。
可选的,任一所述推送消息的匹配特征值还包括以下参数中的至少一种:
所述待查询搜索词与该推送消息的匹配度、以及所述待查询搜索词与所述待查询用户的分类特征的匹配度。
可选的,各个所述推送消息具有分别对应的展示信息;各个所述推送消息分别通过所述对应的展示信息进行展示。
可选的,所述方法还包括:
获取任一所述推送消息所要推荐的人群属性分类;
获取所述人群属性分类包括的用户所产生的相关数据;
从所述相关数据中分析出所述人群属性分类对应的分类特征;
返回所述对应的分类特征;该推送消息对应的展示信息基于所述对应的分类特征生成。
可选的,所述待查询用户为对所述历史用户分类后获得的一类用户;
所述获取对各个所述推送消息的排序结果之后,还包括:
建立所述待查询搜索词、所述待查询用户与所述排序结果的索引关系;
接收当前用户输入的当前搜索词;
若所述当前搜索词与所述待查询搜索词匹配,并且所述当前用户与所述待查询用户匹配,基于所述索引关系获取所述排序结果。
可选的,所述待查询用户为输入所述待查询搜索词的用户;
所述获取与待查询搜索词相关的多个推送消息之前,还包括:
接收当前用户输入的当前搜索词,将所述当前搜索词作为所述待查询搜索词,将所述当前用户作为所述待查询用户。
本申请还提供了一种基于搜索行为的推送消息排序装置,包括:
第一获取单元,用于获取与待查询搜索词相关的多个推送消息;
第二获取单元,用于获取各个所述推送消息在历史推送过程中所展示的至少一个历史用户;
第三获取单元,用于获取各个所述推送消息被所述历史用户执行转化操作的情况、与所述历史用户的分类特征的对应关系;
计算单元,用于至少基于所述对应关系和待查询用户的分类特征,分别计算各个所述推送消息的预估转化率;所述待查询用户为输入所述待查询搜索词的用户或者对所述历史用户分类后获得的一类用户;
第四获取单元,用于至少基于所述预估转化率,获取对各个所述推送消息的排序结果。
可选的,所述第三获取单元包括:
第一获取子单元,用于获取多个样本;其中任一所述样本为任一所述推送消息在历史推送过程中的一次展示;
第二获取子单元,用于获取各个所述样本分别对应展示的历史用户的各个分类特征;
第三获取子单元,用于根据各个所述样本被所述分别对应展示的历史用户执行转化操作的情况,获取各个分类特征与所述推送消息的匹配关系对转化操作的贡献值;
第一确定单元,用于将所述贡献值作为所述对应关系。
可选的,任一所述分类特征与所述推送消息的匹配关系包括以下匹配关系中的至少一种:
该分类特征与所述推送消息的匹配度;
该分类特征与所述推送消息中的各个属性特征构成的组合特征。
可选的,所述第三获取子单元,包括:
建立单元,用于通过以下公式建立特征模型:
其中,n2为所述样本的总个数,n1为被执行转化操作的样本的总个数;yk=1表示任一样本k在展示时被执行转化操作;yk=0表示任一样本k在展示时未被执行转化操作;feak包括所述任一样本k对应展示的历史用户的各个分类特征与任一样本k的匹配关系;w为feak中的每一项对转化操作的贡献值;p(yk=1|w,feak)表示所述样本k在w和feak的前提下,被执行转化操作的概率,p(yk=0|w,feak)表示所述样本k在w和feak的前提下,未被执行转化操作的概率;
第四获取子单元,用于获取所述特征模型的值最大时的w。
可选的,所述计算单元用于至少基于所述对应关系和待查询用户的分类特征,分别计算各个所述推送消息的预估转化率,包括:
所述计算单元用于至少通过分别计算各个所述推送消息的预估转化率;其中,m为所述待查询用户的分类特征的总个数,feas,i为所述待查询用户的任一分类特征与该推送消息的匹配关系,wi为所述feas,i中的每一项对转化操作的贡献值。
可选的,所述feak还包括以下参数中的至少一种:所述任一样本k对应的推送消息的属性特征、以及所述待查询搜索词的属性特征。
可选的,所述装置还包括:
第五获取单元,用于获取各个所述推送消息的匹配特征值;任一所述推送消息的匹配特征值包括:所述待查询用户的分类特征与该推送消息的匹配度;
筛选单元,用于至少基于各个所述推送消息的匹配特征值,对各个所述推送消息进行筛选;
所述第四获取单元用于获取对各个所述推送消息的排序结果,包括:
所述第四获取单元用于获取对筛选后的各个所述推送消息的排序结果。
可选的,任一所述推送消息的匹配特征值还包括以下参数中的至少一种:
所述待查询搜索词与该推送消息的匹配度、以及所述待查询搜索词与所述待查询用户的分类特征的匹配度。
可选的,各个所述推送消息具有分别对应的展示信息;各个所述推送消息分别通过所述对应的展示信息进行展示。
可选的,所述装置还包括:
第六获取单元,用于获取任一所述推送消息所要推荐的人群属性分类;
第七获取单元,用于获取所述人群属性分类包括的用户所产生的相关数据;
分析单元,用于从所述相关数据中分析出所述人群属性分类对应的分类特征;
返回单元,用于返回所述对应的分类特征;该推送消息对应的展示信息基于所述对应的分类特征生成。
可选的,所述待查询用户为对所述历史用户分类后获得的一类用户;所述装置还包括:
建立单元,用于建立所述待查询搜索词、所述待查询用户与所述排序结果的索引关系;
接收单元,用于接收当前用户输入的当前搜索词;
第八获取单元,用于若所述当前搜索词与所述待查询搜索词匹配,并且所述当前用户与所述待查询用户匹配,基于所述索引关系获取所述排序结果。
可选的,所述待查询用户为输入所述待查询搜索词的用户;所述装置还包括:
接收单元,用于接收当前用户输入的当前搜索词;
第二确定单元,用于将所述当前搜索词作为所述待查询搜索词,将所述当前用户作为所述待查询用户。
通过上述技术方案可知,本申请实施例中在计算与待查询搜索词相关的各个推送消息的预估转化率时,考虑了各个推送消息被历史用户执行转化操作的情况与历史用户的相关属性特征的对应关系,以及待查询用户的相关属性特征,从而计算出的预估转化率实际上是待查询用户对各个推送消息执行转化操作的可能性,因此能够更好的反映出待查询用户的实际需求,提高了排序后的推送消息被用户执行转化操作的可能性,从而减少用户进一步的搜索等操作以减少系统资源的浪费。
附图说明
图1为本申请实施例提供的排序方法的一种实施例的流程示意图;
图2为本申请实施例提供的定向设计展示信息的流程示意图;
图3为本申请实施例提供的排序方法的另一种实施例的流程示意图;
图4为本申请实施例提供的排序装置的一种实施例的结构示意图。
具体实施方式
目前,在用户执行搜索行为时,例如用户在搜索系统中输入了搜索词后,除了向用户显示搜索结果之外,还会向用户展示相关的推送消息(比如向用户展示相关的广告等),从而帮助用户高效率地发掘有价值的信息。比如,用户在搜索引擎中输入了搜索词“mp3”后,不仅在显示页面上向用户展示mp3的搜索结果,而且在显示页面的边界等处,还可以同时向用户展示与mp3相关的广告。其中对于一条推送消息来说,通常具有对应的若干搜索词,例如可以是拥有该推送消息的用户所购买的搜索词。只有当某一用户搜索其对应的搜索词时,该推送消息才有可能向该用户展示。
在对与搜索词相关的广告等推送消息进行展示时,为了使得推送消息能够更加符合用户的实际需求,即被用户执行点击等进一步转化操作的可能性更大,通常都会对推送消息进行排序,从而根据排序结果对推送消息进行相应展示。其中,针对推送消息一般都会设计相应的展示信息以用于展示,比如展示信息具体可以为广告的图片、标题等信息等,该展示信息能够较大程度地反映推送消息的业务属性,从而吸引感兴趣的用户执行进一步的转化操作。
目前一种常用的对广告等推送消息的排序方式是,在用户输入搜索词后,根据推送消息被执行转化操作的情况,预估与搜索词相关的各个推送消息的转化率,根据预估的转化率对各个推送消息进行排序。然而这种方式对于不同的用户,其排序结果均一致,因此不能较好地反映用户的实际需求,排序后的推送消息被用户执行转化操作的可能性依然较低,从而使得用户进一步的搜索等操作较多因此造成了系统资源的浪费。
此外,由于这种排序方式不区分用户,因此推送消息的展示信息也没有针对性,因此对于某一推送消息的展示信息来说,一般罗列有其对应的所有的搜索词。举例来说,对于一个mp3的广告,其所对应的搜索词有“mp3”、“fashion mp3”、“8G mp3”,因此该广告的展示信息通常为“mp3、fashion mp3、8G mp3”,显然这种将所有搜索词罗列组成展示信息的方式,不仅很大程度地影响用户体验,也会使得推送消息被用户执行转化操作可能性较低。
在本申请实施例中,提供了一种基于搜索行为的推送消息排序方法及装置,以实现提高排序后的推送消息被用户执行转化操作的可能性,从而减少用户进一步的搜索等操作以减少系统资源的浪费。此外,本申请实施例还能对于同一推送消息,针对不同的用户展示不同的展示信息,从而提高用户体验并且进一步提高推送消息被用户执行转化操作的可能性。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,本申请提供了基于搜索行为的推送消息排序方法的一种实施例,本实施例的方法包括:
S101:获取与待查询搜索词相关的多个推送消息。
在本申请实施例中,待查询搜索词可以是当前用户输入的当前搜索词,比如某一用户在搜索引擎中输入了“mp3”,则将“mp3”作为待查询搜索词,此时本实施例实际上是接收到用户输入的搜索词,即进行在线实时排序的方式。待查询搜索词还可以是在用户搜索之前即预先设置好的,也就是预先计算出待查询搜索词的排序结果,在相关用户输入与待查询搜索词匹配的搜索词时,直接调取已经预先计算好的排序结果,此时本实施例实际上是在用户搜索之前预先进行排序的方式。在本申请实施例中,推送消息指的是用于向用户推送的各种类型的消息,可以包括广告等。
在本申请实施例中,获取的是与待查询搜索词相关的多个推送消息,其中,各个搜索词与推送消息之间可以预先设置有对应关系,例如推送消息为广告时,拥有某一广告的用户购买了某一搜索词之后,该搜索词即与该广告建立起对应关系。
S102:获取各个推送消息在历史推送过程中所展示的至少一个历史用户。
例如对于任一推送消息来说,在历史推送过程中曾经被展示给用户A和用户B,此时对于该推送消息来说的至少一个历史用户可以包括用户A和用户B。
S103:获取各个推送消息被所述历史用户执行转化操作的情况、与所述历史用户的分类特征的对应关系。
其中,任一推送消息被所述历史用户执行转化操作的情况,可以是任一推送消息被执行转化操作的转化率,也可以是任一推送消息在一次展示中是否被执行转化操作的情况,本申请实施例对此不做限定。转化操作指的是用户在浏览了推送消息后,对推送消息执行的进一步操作,比如点击、收藏、购买等操作,在本申请实施例中,用户对某一消息执行了转化操作,即表示该推送消息符合用户的实际需求,对用户来说是一次有效的推送。
在本申请实施例中,为了在用户执行搜索行为时,能够对于不同的用户进行针对性地推送。因此会获取各个推送消息被所述历史用户执行转化的情况与历史用户的分类特征的对应关系,该对应关系实际上能够反映出,各个分类特征与推送消息的匹配关系,对转化操作的贡献度。其中任一分类特征与推送消息的匹配关系,可以是该分类特征与推送消息的匹配度、也可以是该分类特征与推送消息中的各个属性特征构成的组合特征。
在本申请实施例中,用户的分类特征可以用来表征在不同方面对用户的分类结果,具体可以为用户的人群属性的相关特征,比如包括地域、性别、年龄、职业、收入情况等,也可以包括用户的偏好等其他分类特征。其中,用户的分类特征可以是通过对用户行为所产生的相关数据分析后获得。例如,分类特征可以通过用户填写的个人资料、或者用户的搜索、点击、收藏、购买等历史行为分析获得。
S104:至少基于所述对应关系和待查询用户的分类特征,分别计算各个推送消息的预估转化率。
在本申请实施例中,所述待查询用户为输入所述待查询搜索词的用户或者对所述历史用户分类后获得的一类用户。其中,若所述待查询用户为输入所述待查询搜索词的用户,则本实施例是接收到当前用户输入的当前搜索词,即进行在线实时排序的方式。若所述待查询用户为对所述历史用户分类后获得的一类用户,则待查询搜索词是在用户搜索之前预先设置好的,待查询用户是一类分类用户,本实施例是在用户搜索之前预先进行排序的方式。本实施例的所述对应关系,即为各个推送消息被所述历史用户执行转化操作的情况、与所述历史用户的分类特征的对应关系,实际上能够反映出,对于任一推送消息来说,该推送消息分别被具有各个分类特征的用户执行转化操作的概率,因此根据该对应关系和待查询用户的分类特征,能够计算出各个推送消息被待查询用户执行转化操作的转化率,也即被转化的概率。
S105:至少基于步骤S104获取的预估转化率,获取对各个所述推送消息的排序结果。
一般情况下预估转化率越高,其排序结果越靠前,即向用户推送的优选级也就越高。
在获取排序结果时,除了预估转化率之外,还可以基于各个推送消息的消耗值,比如各个广告导致其拥有者所花费的价值。
通过上述技术方案可知,本申请实施例中在计算与待查询搜索词相关的各个推送消息的预估转化率时,考虑了各个推送消息被历史用户执行转化操作的情况与历史用户的分类特征的对应关系,以及待查询用户的分类特征,从而计算出的预估转化率实际上是待查询用户对各个推送消息执行转化操作的可能性,因此能够更好的反映出待查询用户的实际需求,提高了排序后的推送消息被用户执行转化操作的可能性,从而减少用户进一步的搜索等操作以减少系统资源的浪费。
在本申请实施例中,关键就在于获取各个所述推送消息被所述历史用户执行转化操作的情况、与所述历史用户的分类特征的对应关系,根据该对应关系实现针对于不同用户计算推送消息的预估点击率。其中,可以通过多种方式获取上述对应关系,下面对一种优选的实现方式进行示例性地说明。
本实施例的步骤S103,可以包括以下子步骤S1031至S1034。
S1031:获取多个样本;其中任一所述样本为任一所述推送消息在历史推送过程中的一次展示,即一次曝光。
S1032:获取各个所述样本分别对应展示的历史用户的各个分类特征。
例如推送消息A在某一展示时,对应展示的历史用户包括用户A和用户B,因此对于该样本,获取用户A的各个分类特征和用户B的各个分类特征。
S1033:根据各个所述样本被所述分别对应展示的历史用户执行转化操作的情况,获取各个分类特征与所述推送消息的匹配关系对转化操作的贡献值。
其中,任一所述分类特征与所述推送消息的匹配关系包括以下匹配关系中的至少一种:该分类特征与所述推送消息的匹配度;该分类特征与所述推送消息中的各个属性特征构成的组合特征。下面举例说明。
假设步骤S1032中获取到的一个分类特征为:青少年。该分类特征与推送消息的匹配度,可以为该分类特征与推送消息的展示信息的匹配度,例如推送消息A的展示信息为“mp3、青少年、低价”,则两者的匹配度为100%。该分类特征与推送消息A的展示信息中的各个属性特征可以构成组合特征:[青少年,mp3]以及[青少年,低价]。此时在步骤S1033中,能够获取到100%的匹配度、组合特征:[青少年,低价]以及[青少年,mp3]对转化操作的贡献值。
S1034:将步骤S1033中获取的所述贡献值,作为所述对应关系。
在获取到了所述对应关系,即各个分类特征与所述推送消息的匹配关系对转化操作的贡献值之后,就可以根据待查询用户的分类特征与各个推送消息的匹配关系,计算各个推送消息的预估点击率。
下面具体说明一种通过建立特征模型,获取所述贡献值的方式。
上述步骤S1033包括:
通过以下公式建立特征模型:
其中,n2为所述样本的总个数,n1为被执行转化操作的样本的总个数;yk=1表示任一样本k在展示时被执行转化操作;yk=0表示任一样本k在展示时未被执行转化操作;feak包括所述任一样本k对应展示的历史用户的各个分类特征与任一样本k的匹配关系;w为feak中的每一项对转化操作的贡献值,即权重。p(yk=1|w,feak)表示的是,所述样本k在w和feak的前提下,被执行转化操作的概率。p(yk=0|w,feak)表示的是,所述样本k在w和feak的前提下,未被执行转化操作的概率。
下面对上述特征模型中的各个参数进行详细介绍。
上述特征模型中,任一样本为任一推送消息在历史推送过程中的一次展示。yk表示样本k的标准目标,yk=1表示任一样本k在展示时被执行转化操作,而yk=0表示任一样本k在展示时没有被执行转化操作。
feak包括所述任一样本k对应展示的历史用户的各个分类特征与任一样本k的匹配关系。任一分类特征与任一样本k的匹配关系包括以下匹配关系中的至少一种:该分类特征与样本k对应的推送消息的匹配度、以及该分类特征与该对应的推送消息中的各个属性特征构成的组合特征。例如,样本k对应展示给历史用户A,其中历史用户的各个分类特征包括:青少年、和学生。样本k对应的推送消息的展示信息为“mp3、青少年、低价”,则所述匹配关系可以包括:各个分类特征:青少年、和学生分别与展示信息为“mp3、青少年、低价”的匹配度,以及构成的组合特征[青少年,mp3]以及[青少年,低价]。
w为所述feak中的每一项对转化操作的贡献值。需要说明的是,样本k可能存在许多缺省的特征项,比如样本1可能包括组合特征[青少年,mp3],样本2可能包括组合特征[青少年,低价],实际上样本1也包括组合特征[青少年,低价],只是该值为0。因此,w也可以说是fea中的所有特征项的贡献值,fea指的是fea1、fea2、fea3、…、fean1、…、fean2组成的集合,该集合中所有项的下标等差递增。
在建立了特征模型之后,需要对w进一步求解。由于特征模型实际上表征的是样本按照实际转化情况时的概率,因此通过使得概率最大化,可以最接近于实际转化情况。因此,可以通过最大似然法等方式获取特征模型的值最大时的w,作为最终得出的w。
下面进行举例说明,对于一个展示100次、点击10的推送消息(真实点击率为0.1),建立的特征模型可以为:
通过最大化概率求解的w应该使得该样本正好有10个被点击,90个未被点击,从而能够使得预估点击率接近于真实点击率0.1。
在上述特征模型中,feak除了包括上述匹配关系之外,还可以包括以下参数中的至少一种:所述任一样本k对应的推送消息的属性特征、以及所述待查询搜索词的属性特征。其中,推送消息的属性特征,可以包括从推送消息的展示信息中提取出的属性特征,比如包括推送消息的标识信息、展示信息的中心词、以及展示信息中出现频率大于预设阈值的词(即高频词)等等,还可以包括从推送消息的历史转化情况提取出的属性信息,例如推送消息的历史平均点击率,即该推送消息在所有搜索词对应的历史搜索过程中的平均点击率。待查询搜索词的属性信息,可以包括待查询搜索词的标识信息、待查询搜索词的中心词、以及待查询搜索词的历史平均点击率等等。其中待查询搜索词的历史平均点击率指的是该待查询搜索词在历史一段时间内发生转化的次数除以该待查询被搜索词搜索的次数,用于表征该待查询搜索词转化率的高低。例如,搜索词mp3被搜索了100次,被点击了1次,那么其历史平均点击率为0.01;搜索词mp3被搜索了100次,被点击了30次,那么其历史平均点击率为0.3。
在获取到上述特征模型中的w之后,可以根据w和待查询用户的分类特征,计算出预估点击率。下面介绍一种预估点击率的计算方式。本实施例中的步骤S104可以包括:
至少通过分别计算各个所述推送消息的预估转化率;其中,m为所述待查询用户的分类特征的总个数,feas,i为所述待查询用户的任一分类特征与该推送消息(即待计算的推送消息)的匹配关系,wi为所述feas,i对转化操作的贡献值,wi从特征模型的w中获取到。例如,在通过计算推送消息A的预估转化率时,待查询用户的分类特征包括:青少年、学生,feas,1为待查询用户的分类特征:青少年与推送消息A的匹配关系,feas,2为待查询用户的分类特征:学生与推送消息A的匹配关系,w1是feas,1对转化操作的贡献值,w2是feas,2对转化操作的贡献值。其中,预估转化率具体可以通过逻辑回归(Logisticregression,LR)模型、决策树(gradient boost decision tree,GBDT)模型等计算得到,例如利用逻辑回归模型,根据以下公式计算出预估转化率:其中
在对各个推送消息通过预估点击率进行排序之前,实际上还可以先根据推送消息与分类特征的匹配度进行筛选,对筛选后的各个推送消息进行排序即可。下面详细说明这种方式。
本实施例的方法还可以包括:获取各个推送消息的匹配特征值;任一推送消息的匹配特征值包括:待查询用户的分类特征与该推送消息的匹配度;至少基于各个所述推送消息的匹配特征值,对各个所述推送消息进行筛选。并且,本实施例步骤S105中的获取对各个所述推送消息的排序结果,包括:获取对筛选后的各个所述推送消息的排序结果。
其中,任一推送消息的匹配特征值除了上述待查询用户的分类特征与该推送消息的匹配度之外,还可以包括以下匹配度中的至少一种:待查询搜索词与该推送消息的匹配度、以及待查询搜索词与所述待查询用户的分类特征的匹配度。其中,待查询搜索词与该推送消息的匹配度包括以下匹配度中的至少一种:待查询搜索词与该推送消息对应的展示信息的匹配度、分词后的待查询搜索词与分词后的该展示信息的匹配度、待查询搜索词的中心词与该展示信息的中心词的匹配度、以及待查询搜索词的类目预测结果与该推送消息所属的类目的匹配度。需要说明的是,可以直接用计算出的任一推送消息的匹配特征值,表示该推送消息与分类特征的匹配度,用于获取该推送消息与分类特征的匹配关系。
需要说明的是,本申请实施例中可以是接收到用户输入的搜索词,即进行在线实时筛选。也可以是在用户搜索之前即预先计算好筛选结果,在用户输入与待查询搜索词匹配的搜索词时,直接调取已经预先计算好的筛选结果。
目前在对各个推送消息进行展示时,通常利用的是各个推送消息分别对应的展示信息,也就是说各个推送消息分别通过对应的展示信息进行展示。其中展示信息可以包括图片、文字、标题等。由于现有技术的排序方式不区分用户,因此推送消息的展示信息也没有针对性,因此对于某一推送消息的展示信息来说,一般罗列有其对应的所有的搜索词。不仅很大程度地影响用户体验,也会使得推送消息被用户执行转化操作可能性较低。
因此,本申请实施例在针对不同用户进行定向推送时,还能够针对不同用户的分类特征,定向设计展示信息,因此能够实现对于同一推送消息,针对不同的用户展示不同的展示信息,从而提高用户体验并且进一步提高推送消息被用户执行转化操作的可能性。下面进行具体说明。
如图2所示,本实施例的所述方法还包括:
S201:获取任一推送消息所要推荐的人群属性分类。
以推送消息为广告为例,拥有该广告的卖家可以选取该广告主要针对的人群属性分类,比如青少年、低端消费者等等。
S202:获取所述人群属性分类对应的用户所产生的相关数据。
其中所述对应的用户所产生的相关数据,指的是用户行为产生的历史数据,例如可以包括用户填写的个人资料、或者用户在搜索、点击、收藏、购买等历史行为中所产生的数据。其中一种较优选的方式是,将人群属性分类对应的用户的搜索词集合、执行点击、收藏、购买的推送消息所对应的展示信息的集合,组成所述相关数据。
S203:从所述相关数据中分析所述人群属性分类对应的分类特征。
该步骤具体实现时,可以从步骤S202中获取到的相关数据中,通过LDA(LatentDirechlet Allocation)模型、TF-IDF(term frequency–inverse document frequency)方法、PLSA(Probability Latent Semantic Analysis)方法等提取出中心词或者主题作为对应的分类特征。下面介绍通过LDA模型提取主题的方式。
首先通过以下公式建立LDA模型:
其中,步骤S202中获取到的相关数据作为多个文档,上述公式用于从其中任一个文档提取主题。r表示当前文档中单词的总个数,zn表示提取出的主题,dn表示当前文档中任一单词,α和β为该模型的先验分布参数,θ为主题的分布参数。
通过求解LDA模型,即可实现从文档中提取出的主题,这些主题就构成了对应的分类特征。举例而言,一个用户搜索了大量类似“免费”、“免邮费”、“折扣”、“8折”等搜索词,并且点击、收藏和购买的产品中也存在这些词,那么基于LDA训练该用户产生的文档获得的主题则为“低价正品”,将“低价正品”作为该用户的分类特征。
S204:返回所述对应的分类特征;各个所述推送消息分别对应的所述展示信息基于所述对应的分类特征生成。
其中,所述对应的分类特征,反映了所要推荐的人群属性分类的用户所具有的属性信息,因此通过返回分类特征,使得拥有推送消息的用户,能够根据该分类特征生成推送消息的展示信息,从而实现了针对不同用户的分类特征,定向设计展示信息,因此能够实现对于同一产品,针对不同的用户展示不同的展示信息,从而提高用户体验并且进一步提高推送消息被用户执行转化操作的可能性。
在本申请实施例中,若所述待查询用户为对所述历史用户分类后获得的一类用户,则在步骤S105的所述获取对各个所述推送消息的排序结果之后,还可以包括:建立待查询搜索词、所述待查询用户与所述排序结果的索引关系;接收当前用户输入的当前搜索词;若所述当前搜索词与所述待查询搜索词匹配,并且所述当前用户与所述待查询用户匹配,基于所述索引关系获取所述排序结果。从而能够基于所述排序结果,向所述当前用户展示各个所述推送消息分别对应的展示信息。其中,待查询用户为对历史用户分类后获得的一类用户,因此判断当前用户是否与待查询用户匹配,实际上是判断当前用户是否属于待查询用户所表示的一类用户,例如,待查询用户为青少年用户,根据当前用户所产生的历史数据,比如填写的个人资料以及历史行为数据分析,该当前用户是否属于青少年用户,如果属于,并且当前用户输入的当前搜索词与待查询搜索词相同,直接根据索引关系获取排序结果。
在本申请实施例中,若所述待查询用户为输入所述待查询搜索词的用户;则在步骤S101的所述获取与待查询搜索词相关的多个推送消息之前,还可以包括:接收当前用户输入的当前搜索词,将所述当前搜索词作为所述待查询搜索词,将当前用户作为所述待查询用户。并且在步骤S105的所述获取对各个所述推送消息的排序结果之后,还可以包括:基于所述排序结果,向所述当前用户展示各个所述推送消息分别对应的展示信息。
下面将以推送消息为广告为例,介绍本申请的一种优选实施例。
请参阅图3,本申请提供了基于搜索行为的推送消息排序方法的另一种实施例,在本实施例中,以推送消息为广告为例加以说明。
本实施例的方法包括:
S301:获取广告A所要推荐的人群属性分类。
比如,拥有该广告A的卖家选择了“青少年”这一人群属性分类。
S302:获取所述人群属性分类对应的用户所产生的相关数据,从所述相关数据中分析所述人群属性分类对应的分类特征。
本实施例还可以进一步对相关数据进行预处理,其具体的预处理操作可以包括:反欺诈、反爬虫数据过滤、虚曝光数据过滤,即根据广告的展示时间判断其是否真正被曝光(即展示)。
该步骤中,可以将人群属性分类对应的用户的搜索词集合、执行点击、收藏、购买的广告所对应的展示信息的集合,组成用户的行为数据文档,从中提取出行为数据文档的主题,作为对应的分类特征。举例而言,一个用户搜索了大量类似“免费”、“免邮费”、“折扣”、“8折”等搜索词,并且点击、收藏和购买的产品中也存在这些词,那么基于该用户产生的文档获得的主题则为“低价正品”,将“低价正品”作为该用户的分类特征。
S303:返回所述对应的分类特征。
S304:接收广告A的展示信息。其中,该展示信息基于上述对应的分类特征生成。
将分析出的分类特征返回给卖家后,卖家即可以根据其设计针对于人群属性分类的展示信息。
S305:计算待查询搜索词与广告A的展示信息的匹配特征值。
其中待查询搜索词指的是卖家为广告A所购买的一个搜索词。
待查询搜索词与广告A的匹配特征值包括:所述对应的分类特征与该展示信息的匹配度、所述对应的分类特征与待查询搜索词的匹配度、待查询搜索词与该展示信息的匹配度(比如待查询搜索词是否完全出现在展示信息中)、分词后的待查询搜索词与分词后的该展示信息的匹配度、待查询搜索词的中心词与该展示信息的中心词的匹配度、以及待查询搜索词的类目预测结果与该广告所属的类目的匹配度。
S306:接收返回的确认消息,将待查询搜索词与广告A的展示信息的对应关系,比如将其构成keyword-product绑定对存入数据库中。
广告A的卖家可以根据计算出的匹配特征值,确认是否需要修改广告A的展示信息,如果无需修改,则返回确认消息。
S307:计算待查询搜索词与其对应的各个广告的匹配特征值,以及预估点击率,从而根据匹配特征值和预估点击率、以及各个广告为了展示用户而导致其拥有者花费的价值、获取到与待查询搜索词对应的各个广告的排序结果,对该结果建立索引。
其中,本步骤可以采用本申请实施例提供的任一种匹配特征值和预估点击率的计算方式,具体请见相关实施例,这里不再赘述。
S308:接收当前用户输入的当前搜索词。
在本实施例中,假设当前搜索词与待查询搜索词相同,并且当前用户属于待查询用户。
S309:判断当前处于精确匹配模式还是扩展匹配模式,若是精确匹配模式,则执行S310,若是扩展匹配模式,执行S311。
其中,精确匹配模式指的是根据搜索词精确获取各个相关的广告,扩展匹配模式指的是根据搜索词及搜索词的扩展词,获取各个相关的广告。
S310:此时为精确扩展模式,由于本实施例中当前搜索词与待查询搜索词相同,并且当前用户属于待查询用户,直接根据预先建立的索引中,获取排序结果,并且执行S312。
S311:此时为扩展匹配模式,因此则需要重新计算与当前搜索词和当前搜索词的扩展词相关的各个广告的排序结果,并且执行S312。
其中可以采用本申请实施例提供的任一种排序方法获取对本步骤的各个广告的排序结果,这里不再赘述。
其中需要格外说明的是,假设数据库有keyword-product绑定对100万,传统的方式支持每个广告设计一个展示信息,因此只需计算搜索词与100万个展示信息的预估点击率。而在本申请中,由于支持为每个广告设计x(x>=1)个创意,那么就需要计算搜索词与x*100万个展示信息的预估点击率,计算量有所增加。
因此为了减少计算量以提高实时性,,本申请中在实时进行排序时,针对每一个广告,可以只计算该广告的一个展示信息与搜索词的预估点击率,其中优选地方式是,根据该广告的多个展示信息在步骤S307中对排序结果的计算结果,选择预估点击率最大的展示信息进行计算。比如在步骤S307中,对于某一搜索词,预先计算出广告A的展示信息A的预估点击率是0.2,广告A的展示信息B的预估点击率是0.3。因此若当前用户输入的当前搜索词为该搜索词,或者该搜索词的扩展词时,优选方式是仅仅计算展示信息B与当前搜索词的预估点击率,而无需再计算展示信息A与当前搜索词的预估点击率,从而减少计算量。
S312:基于获取的排序结果,向当前用户展示各个广告分别对应的展示信息。
如图4所示,对应图1所示的方法实施例,本申请还提供了基于搜索行为的推送消息排序装置的一种实施例。本实施例的装置包括:第一获取单元401、第二获取单元402、第三获取单元403、计算单元404和第四获取单元405。
第一获取单元401,用于获取与待查询搜索词相关的多个推送消息。
在本申请实施例中,待查询搜索词可以是当前用户输入的当前搜索词,比如某一用户在搜索引擎中输入了“mp3”,则将“mp3”作为待查询搜索词,此时本实施例实际上是接收到用户输入的搜索词,即进行在线实时排序的方式。待查询搜索词还可以是在用户搜索之前即预先设置好的,也就是预先计算出待查询搜索词的排序结果,在相关用户输入与待查询搜索词匹配的搜索词时,直接调取已经预先计算好的排序结果,此时本实施例实际上是在用户搜索之前预先进行排序的方式。在本申请实施例中,推送消息指的是用于向用户推送的各种类型的消息,可以包括广告等。
在本申请实施例中,获取的是与待查询搜索词相关的多个推送消息,其中,各个搜索词与推送消息之间可以预先设置有对应关系,例如推送消息为广告时,拥有某一广告的用户购买了某一搜索词之后,该搜索词即与该广告建立起对应关系。
第二获取单元402,用于获取各个所述推送消息在历史推送过程中所展示的至少一个历史用户。
例如对于任一推送消息来说,在历史推送过程中曾经被展示给用户A和用户B,此时对于该推送消息来说的至少一个历史用户可以包括用户A和用户B。
第三获取单元403,用于获取各个所述推送消息被所述历史用户执行转化操作的情况、与所述历史用户的分类特征的对应关系。
其中,任一推送消息被所述历史用户执行转化操作的情况,可以是任一推送消息被执行转化操作的转化率,也可以是任一推送消息在一次展示中是否被执行转化操作的情况,本申请实施例对此不做限定。转化操作指的是用户在浏览了推送消息后,对推送消息执行的进一步操作,比如点击、收藏、购买等操作,在本申请实施例中,用户对某一消息执行了转化操作,即表示该推送消息符合用户的实际需求,对用户来说是一次有效的推送。
在本申请实施例中,为了在用户执行搜索行为时,能够对于不同的用户进行针对性地推送。因此会获取各个推送消息被所述历史用户执行转化的情况与历史用户的分类特征的对应关系,该对应关系实际上能够反映出,各个分类特征与推送消息的匹配关系,对转化操作的贡献度。其中任一分类特征与推送消息的匹配关系,可以是该分类特征与推送消息的匹配度、也可以是该分类特征与推送消息中的各个属性特征构成的组合特征。
在本申请实施例中,用户的分类特征可以用来表征在不同方面对用户的分类结果,具体可以为用户的人群属性的相关特征,比如包括地域、性别、年龄、职业、收入情况等,也可以包括用户的偏好等其他分类特征。其中,用户的分类特征可以是通过对用户行为所产生的相关数据分析后获得。例如,分类特征可以通过用户填写的个人资料、或者用户的搜索、点击、收藏、购买等历史行为分析获得。
计算单元404,用于至少基于所述对应关系和待查询用户的分类特征,分别计算各个所述推送消息的预估转化率。
在本申请实施例中,所述待查询用户为输入所述待查询搜索词的用户或者对所述历史用户分类后获得的一类用户。其中,若所述待查询用户为输入所述待查询搜索词的用户,则本实施例是接收到当前用户输入的当前搜索词,即进行在线实时排序的方式。若所述待查询用户为对所述历史用户分类后获得的一类用户,则待查询搜索词是在用户搜索之前预先设置好的,待查询用户是一类分类用户,本实施例是在用户搜索之前预先进行排序的方式。本实施例的所述对应关系,即为各个推送消息被所述历史用户执行转化操作的情况、与所述历史用户的分类特征的对应关系,实际上能够反映出,对于任一推送消息来说,该推送消息分别被具有各个分类特征的用户执行转化操作的概率,因此根据该对应关系和待查询用户的分类特征,能够计算出各个推送消息被待查询用户执行转化操作的转化率,也即被转化的概率。
第四获取单元405,用于至少基于所述预估转化率,获取对各个所述推送消息的排序结果。
一般情况下预估转化率越高,其排序结果越靠前,即向用户推送的优选级也就越高。
在获取排序结果时,除了预估转化率之外,还可以基于各个推送消息的消耗值,比如各个广告导致其拥有者所花费的价值。
在本申请实施例中,关键就在于第三获取单元403获取各个所述推送消息被所述历史用户执行转化操作的情况、与所述历史用户的分类特征的对应关系,根据该对应关系实现针对于不同用户计算推送消息的预估点击率。其中,第三获取单元的具体实现方式可以有多种,下面对一种优选的实现方式进行示例性地说明。
本实施例的第三获取单元403可以包括:第一获取子单元、第二获取子单元、第三获取子单元和第一确定单元。
第一获取子单元,用于获取多个样本;其中任一所述样本为任一所述推送消息在历史推送过程中的一次展示,即一次曝光。
第二获取子单元,用于获取各个所述样本分别对应展示的历史用户的各个分类特征。
例如推送消息A在某一展示时,对应展示的历史用户包括用户A和用户B,因此对于该样本,第二获取子单元获取用户A的各个分类特征和用户B的各个分类特征。
第三获取子单元,用于根据各个所述样本被所述分别对应展示的历史用户执行转化操作的情况,获取各个分类特征与所述推送消息的匹配关系对转化操作的贡献值。
其中,任一所述分类特征与所述推送消息的匹配关系包括以下匹配关系中的至少一种:该分类特征与所述推送消息的匹配度、以及该分类特征与所述推送消息中的各个属性特征构成的组合特征。下面举例说明。
假设第二获取子单元中获取到的一个分类特征为:青少年。该分类特征与推送消息的匹配度,可以为该分类特征与推送消息的展示信息的匹配度,例如推送消息A的展示信息为“mp3、青少年、低价”,则两者的匹配度为100%。该分类特征与推送消息A的展示信息中的各个属性特征可以构成组合特征:[青少年,mp3]以及[青少年,低价]。此时第三获取子单元,能够获取到100%的匹配度、组合特征:[青少年,低价]以及[青少年,mp3]对转化操作的贡献值。
第一确定单元,用于将第三获取子单元获取的贡献值作为所述对应关系。
在获取到了所述对应关系,即各个分类特征与所述推送消息的匹配关系对转化操作的贡献值之后,计算单元就可以根据待查询用户的分类特征与各个推送消息的匹配关系,计算各个推送消息的预估点击率。
下面具体说明一种第三获取子单元的优选实现方式。
第三获取子单元,包括:建立单元和第四获取子单元。
建立单元,用于通过以下公式建立特征模型:
其中,n2为所述样本的总个数,n1为被执行转化操作的样本的总个数;yk=1表示任一样本k在展示时被执行转化操作;yk=0表示任一样本k在展示时未被执行转化操作;feak包括所述任一样本k对应展示的历史用户的各个分类特征与任一样本k的匹配关系;w为feak中的每一项对转化操作的贡献值;p(yk=1|w,feak)表示所述样本k在w和feak的前提下,被执行转化操作的概率,p(yk=0|w,feak)表示所述样本k在w和feak的前提下,未被执行转化操作的概率;
第四获取子单元,用于获取所述特征模型的值最大时的w。
在建立了特征模型之后,需要对w进一步求解。由于特征模型实际上表征的是样本按照实际转化情况时的概率,因此通过使得概率最大化,可以最接近于实际转化情况。因此,可以通过最大似然法等方式获取特征模型的值最大时的w,作为最终得出的w。
在上述特征模型中,feak除了包括上述匹配关系之外,还可以包括以下参数中的至少一种:所述任一样本k对应的推送消息的属性特征;所述待查询搜索词的属性特征。其中,推送消息的属性特征,可以包括从推送消息的展示信息中提取出的属性特征,比如包括推送消息的标识信息、展示信息的中心词、以及展示信息中出现频率大于预设阈值的词(即高频词)等等,还可以包括从推送消息的历史转化情况提取出的属性信息,例如推送消息的历史平均点击率,即该推送消息在所有搜索词对应的历史搜索过程中的平均点击率。待查询搜索词的属性信息,可以包括待查询搜索词的标识信息、待查询搜索词的中心词、以及待查询搜索词的历史平均点击率等等。其中待查询搜索词的历史平均点击率指的是该待查询搜索词在历史一段时间内发生转化的次数除以该待查询被搜索词搜索的次数,用于表征该待查询搜索词转化率的高低。
在获取到上述特征模型中的w之后,可以根据w和待查询用户的分类特征,计算出预估点击率。下面介绍一种计算单元404的具体实现方式。
本实施例的计算单元404用于至少基于所述对应关系和待查询用户的分类特征,分别计算各个所述推送消息的预估转化率,可以包括:
计算单元404用于至少通过分别计算各个所述推送消息的预估转化率;其中,m为所述待查询用户的分类特征的总个数,feas,i为所述待查询用户的任一分类特征与该推送消息的匹配关系,wi为所述feas,i中的每一项对转化操作的贡献值。
在对各个推送消息通过预估点击率进行排序之前,实际上还可以先根据推送消息与分类特征的匹配度进行筛选,对筛选后的各个推送消息进行排序即可。下面详细说明这种方式。
本实施例的装置还可以包括:第五获取单元和筛选单元。第五获取单元,用于获取各个所述推送消息的匹配特征值;任一所述推送消息的匹配特征值包括:所述待查询用户的分类特征与该推送消息的匹配度;筛选单元,用于至少基于各个所述推送消息的匹配特征值,对各个所述推送消息进行筛选。第四获取单元405用于获取对各个所述推送消息的排序结果,包括:第四获取单元405用于获取对筛选后的各个所述推送消息的排序结果。
其中,任一推送消息的匹配特征值除了上述待查询用户的分类特征与该推送消息的匹配度之外,还可以包括以下匹配度中的至少一种:待查询搜索词与该推送消息的匹配度、以及待查询搜索词与所述待查询用户的分类特征的匹配度。其中,待查询搜索词与该推送消息的匹配度包括以下匹配度中的至少一种:待查询搜索词与该推送消息对应的展示信息的匹配度、分词后的待查询搜索词与分词后的该展示信息的匹配度、待查询搜索词的中心词与该展示信息的中心词的匹配度、以及待查询搜索词的类目预测结果与该推送消息所属的类目的匹配度。需要说明的是,可以直接用计算出的任一推送消息的匹配特征值,表示该推送消息与分类特征的匹配度,用于获取该推送消息与分类特征的匹配关系。
目前在对各个推送消息进行展示时,通常利用的是各个推送消息分别对应的展示信息,也就是说各个推送消息分别通过对应的展示信息进行展示。其中展示信息可以包括图片、文字、标题等。由于现有技术的排序方式不区分用户,因此推送消息的展示信息也没有针对性,因此对于某一推送消息的展示信息来说,一般罗列有其对应的所有的搜索词。不仅很大程度地影响用户体验,也会使得推送消息被用户执行转化操作可能性较低。
因此,本申请实施例在针对不同用户进行定向推送时,还能够针对不同用户的分类特征,定向设计展示信息,因此能够实现对于同一推送消息,针对不同的用户展示不同的展示信息,从而提高用户体验并且进一步提高推送消息被用户执行转化操作的可能性。具体实现时,本实施例的装置还可以包括第六获取单元、第七获取单元、分析单元和返回单元。其中第六获取单元用于获取任一所述推送消息所要推荐的人群属性分类;第七获取单元用于获取所述人群属性分类包括的用户所产生的相关数据;分析单元用于从所述相关数据中分析出所述人群属性分类对应的分类特征;返回单元用于返回所述对应的分类特征;该推送消息对应的展示信息基于所述对应的分类特征生成。
在本申请实施例中,若所述待查询用户为对所述历史用户分类后获得的一类用户,此时本实施例的装置还可以包括建立单元、接收单元和第八获取单元。其中建立单元用于建立所述待查询搜索词、所述待查询用户与所述排序结果的索引关系;接收单元用于接收当前用户输入的当前搜索词;第八获取单元用于若所述当前搜索词与所述待查询搜索词匹配,并且所述当前用户与所述待查询用户匹配,基于所述索引关系获取所述排序结果。其中,待查询用户为对历史用户分类后获得的一类用户,因此判断当前用户是否与待查询用户匹配,实际上是判断当前用户是否属于待查询用户所表示的一类用户,例如,待查询用户为青少年用户,根据当前用户所产生的历史数据,比如填写的个人资料以及历史行为数据分析,该当前用户是否属于青少年用户,如果属于,并且当前用户输入的当前搜索词与待查询搜索词相同,直接根据索引关系获取排序结果。
在本申请实施例中,若所述待查询用户为输入所述待查询搜索词的用户;此时本实施例的装置还可以包括接收单元和第二确定单元。其中接收单元用于接收当前用户输入的当前搜索词;第二确定单元用于将所述当前搜索词作为所述待查询搜索词,将所述当前用户作为所述待查询用户。并且还可以通过展示单元基于所述排序结果,向所述当前用户展示各个所述推送消息分别对应的展示信息。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (24)
1.一种基于搜索行为的推送消息排序方法,其特征在于,包括:
获取与待查询搜索词相关的多个推送消息;
获取各个所述推送消息在历史推送过程中所展示的至少一个历史用户;
获取各个所述推送消息被所述历史用户执行转化操作的情况、与所述历史用户的分类特征的对应关系;
至少基于所述对应关系和待查询用户的分类特征,分别计算各个所述推送消息的预估转化率;所述待查询用户为输入所述待查询搜索词的用户或者对所述历史用户分类后获得的一类用户;
至少基于所述预估转化率,获取对各个所述推送消息的排序结果。
2.根据权利要求1所述的方法,其特征在于,所述获取各个所述推送消息被所述历史用户执行转化操作的情况、与所述历史用户的分类特征的对应关系,包括:
获取多个样本;其中任一所述样本为任一所述推送消息在历史推送过程中的一次展示;
获取各个所述样本分别对应展示的历史用户的各个分类特征;
根据各个所述样本被所述分别对应展示的历史用户执行转化操作的情况,获取各个分类特征与所述推送消息的匹配关系对转化操作的贡献值;
将所述贡献值作为所述对应关系。
3.根据权利要求2所述的方法,其特征在于,任一所述分类特征与所述推送消息的匹配关系包括以下匹配关系中的至少一种:
该分类特征与所述推送消息的匹配度;
该分类特征与所述推送消息中的各个属性特征构成的组合特征。
4.根据权利要求2所述的方法,其特征在于,所述根据各个所述样本被所述分别对应展示的历史用户执行转化操作的情况,获取所述各个分类特征与推送消息的匹配关系对转化操作的贡献值,包括:
通过以下公式建立特征模型:
其中,n2为所述样本的总个数,n1为被执行转化操作的样本的总个数;yk=1表示任一样本k在展示时被执行转化操作;yk=0表示任一样本k在展示时未被执行转化操作;feak包括所述任一样本k对应展示的历史用户的各个分类特征与任一样本k的匹配关系;w为feak中的每一项对转化操作的贡献值;p(yk=1|w,feak)表示所述样本k在w和feak的前提下,被执行转化操作的概率,p(yk=0|w,feak)表示所述样本k在w和feak的前提下,未被执行转化操作的概率;
获取所述特征模型的值最大时的w。
5.根据权利要求4所述的方法,其特征在于,所述至少基于所述对应关系和待查询用户的分类特征,分别计算各个所述推送消息的预估转化率,包括:
至少通过分别计算各个所述推送消息的预估转化率;其中,m为所述待查询用户的分类特征的总个数,feas,i为所述待查询用户的任一分类特征与该推送消息的匹配关系,wi为所述feas,i中的每一项对转化操作的贡献值。
6.根据权利要求4所述的方法,其特征在于,所述feak还包括以下参数中的至少一种:所述任一样本k对应的推送消息的属性特征、以及所述待查询搜索词的属性特征。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取各个所述推送消息的匹配特征值;任一所述推送消息的匹配特征值包括:所述待查询用户的分类特征与该推送消息的匹配度;
至少基于各个所述推送消息的匹配特征值,对各个所述推送消息进行筛选;
所述获取对各个所述推送消息的排序结果,包括:
获取对筛选后的各个所述推送消息的排序结果。
8.根据权利要求7所述的方法,其特征在于,任一所述推送消息的匹配特征值还包括以下参数中的至少一种:
所述待查询搜索词与该推送消息的匹配度、以及所述待查询搜索词与所述待查询用户的分类特征的匹配度。
9.根据权利要求1所述的方法,其特征在于,各个所述推送消息具有分别对应的展示信息;各个所述推送消息分别通过所述对应的展示信息进行展示。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
获取任一所述推送消息所要推荐的人群属性分类;
获取所述人群属性分类包括的用户所产生的相关数据;
从所述相关数据中分析出所述人群属性分类对应的分类特征;
返回所述对应的分类特征;该推送消息对应的展示信息基于所述对应的分类特征生成。
11.根据权利要求1所述的方法,其特征在于,所述待查询用户为对所述历史用户分类后获得的一类用户;
所述获取对各个所述推送消息的排序结果之后,还包括:
建立所述待查询搜索词、所述待查询用户与所述排序结果的索引关系;
接收当前用户输入的当前搜索词;
若所述当前搜索词与所述待查询搜索词匹配,并且所述当前用户与所述待查询用户匹配,基于所述索引关系获取所述排序结果。
12.根据权利要求1所述的方法,其特征在于,所述待查询用户为输入所述待查询搜索词的用户;
所述获取与待查询搜索词相关的多个推送消息之前,还包括:
接收当前用户输入的当前搜索词,将所述当前搜索词作为所述待查询搜索词,将所述当前用户作为所述待查询用户。
13.一种基于搜索行为的推送消息排序装置,其特征在于,包括:
第一获取单元,用于获取与待查询搜索词相关的多个推送消息;
第二获取单元,用于获取各个所述推送消息在历史推送过程中所展示的至少一个历史用户;
第三获取单元,用于获取各个所述推送消息被所述历史用户执行转化操作的情况、与所述历史用户的分类特征的对应关系;
计算单元,用于至少基于所述对应关系和待查询用户的分类特征,分别计算各个所述推送消息的预估转化率;所述待查询用户为输入所述待查询搜索词的用户或者对所述历史用户分类后获得的一类用户;
第四获取单元,用于至少基于所述预估转化率,获取对各个所述推送消息的排序结果。
14.根据权利要求13所述的装置,其特征在于,所述第三获取单元包括:
第一获取子单元,用于获取多个样本;其中任一所述样本为任一所述推送消息在历史推送过程中的一次展示;
第二获取子单元,用于获取各个所述样本分别对应展示的历史用户的各个分类特征;
第三获取子单元,用于根据各个所述样本被所述分别对应展示的历史用户执行转化操作的情况,获取各个分类特征与所述推送消息的匹配关系对转化操作的贡献值;
第一确定单元,用于将所述贡献值作为所述对应关系。
15.根据权利要求14所述的装置,其特征在于,任一所述分类特征与所述推送消息的匹配关系包括以下匹配关系中的至少一种:
该分类特征与所述推送消息的匹配度;
该分类特征与所述推送消息中的各个属性特征构成的组合特征。
16.根据权利要求14所述的装置,其特征在于,所述第三获取子单元,包括:
建立单元,用于通过以下公式建立特征模型:
其中,n2为所述样本的总个数,n1为被执行转化操作的样本的总个数;yk=1表示任一样本k在展示时被执行转化操作;yk=0表示任一样本k在展示时未被执行转化操作;feak包括所述任一样本k对应展示的历史用户的各个分类特征与任一样本k的匹配关系;w为feak中的每一项对转化操作的贡献值;p(yk=1|w,feak)表示所述样本k在w和feak的前提下,被执行转化操作的概率,p(yk=0|w,feak)表示所述样本k在w和feak的前提下,未被执行转化操作的概率;
第四获取子单元,用于获取所述特征模型的值最大时的w。
17.根据权利要求16所述的装置,其特征在于,所述计算单元用于至少基于所述对应关系和待查询用户的分类特征,分别计算各个所述推送消息的预估转化率,包括:
所述计算单元用于至少通过分别计算各个所述推送消息的预估转化率;其中,m为所述待查询用户的分类特征的总个数,feas,i为所述待查询用户的任一分类特征与该推送消息的匹配关系,wi为所述feas,i中的每一项对转化操作的贡献值。
18.根据权利要求16所述的装置,其特征在于,所述feak还包括以下参数中的至少一种:所述任一样本k对应的推送消息的属性特征、以及所述待查询搜索词的属性特征。
19.根据权利要求13所述的装置,其特征在于,所述装置还包括:
第五获取单元,用于获取各个所述推送消息的匹配特征值;任一所述推送消息的匹配特征值包括:所述待查询用户的分类特征与该推送消息的匹配度;
筛选单元,用于至少基于各个所述推送消息的匹配特征值,对各个所述推送消息进行筛选;
所述第四获取单元用于获取对各个所述推送消息的排序结果,包括:
所述第四获取单元用于获取对筛选后的各个所述推送消息的排序结果。
20.根据权利要求19所述的装置,其特征在于,任一所述推送消息的匹配特征值还包括以下参数中的至少一种:
所述待查询搜索词与该推送消息的匹配度、以及所述待查询搜索词与所述待查询用户的分类特征的匹配度。
21.根据权利要求13所述的装置,其特征在于,各个所述推送消息具有分别对应的展示信息;各个所述推送消息分别通过所述对应的展示信息进行展示。
22.根据权利要求21所述的装置,其特征在于,所述装置还包括:
第六获取单元,用于获取任一所述推送消息所要推荐的人群属性分类;
第七获取单元,用于获取所述人群属性分类包括的用户所产生的相关数据;
分析单元,用于从所述相关数据中分析出所述人群属性分类对应的分类特征;
返回单元,用于返回所述对应的分类特征;该推送消息对应的展示信息基于所述对应的分类特征生成。
23.根据权利要求13所述的装置,其特征在于,所述待查询用户为对所述历史用户分类后获得的一类用户;所述装置还包括:
建立单元,用于建立所述待查询搜索词、所述待查询用户与所述排序结果的索引关系;
接收单元,用于接收当前用户输入的当前搜索词;
第八获取单元,用于若所述当前搜索词与所述待查询搜索词匹配,并且所述当前用户与所述待查询用户匹配,基于所述索引关系获取所述排序结果。
24.根据权利要求13所述的装置,其特征在于,所述待查询用户为输入所述待查询搜索词的用户;所述装置还包括:
接收单元,用于接收当前用户输入的当前搜索词;
第二确定单元,用于将所述当前搜索词作为所述待查询搜索词,将所述当前用户作为所述待查询用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410803186.4A CN105760400B (zh) | 2014-12-19 | 2014-12-19 | 一种基于搜索行为的推送消息排序方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410803186.4A CN105760400B (zh) | 2014-12-19 | 2014-12-19 | 一种基于搜索行为的推送消息排序方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105760400A CN105760400A (zh) | 2016-07-13 |
CN105760400B true CN105760400B (zh) | 2019-06-21 |
Family
ID=56341215
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410803186.4A Active CN105760400B (zh) | 2014-12-19 | 2014-12-19 | 一种基于搜索行为的推送消息排序方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105760400B (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106326353A (zh) * | 2016-08-09 | 2017-01-11 | 百度在线网络技术(北京)有限公司 | 一种用于提供呈现信息的方法与设备 |
CN106909642B (zh) * | 2017-02-20 | 2020-06-12 | 中国银行股份有限公司 | 数据库索引方法及系统 |
CN106919692B (zh) * | 2017-03-07 | 2021-02-19 | 阿里巴巴(中国)有限公司 | 一种推送消息的方法和装置 |
CN108737479B (zh) * | 2017-04-24 | 2021-01-15 | 北京小熊博望科技有限公司 | 用于推送信息的方法和装置 |
CN107222526B (zh) * | 2017-05-16 | 2020-09-29 | 百度在线网络技术(北京)有限公司 | 推送推广信息的方法、装置、设备和计算机存储介质 |
CN109214842B (zh) * | 2017-06-30 | 2020-07-28 | 北京金山安全软件有限公司 | 信息推广方法、装置以及设备 |
CN107463704B (zh) * | 2017-08-16 | 2021-05-07 | 北京百度网讯科技有限公司 | 基于人工智能的搜索方法和装置 |
CN107967256B (zh) * | 2017-11-14 | 2021-12-21 | 北京拉勾科技有限公司 | 词语权重预测模型生成方法、职位推荐方法及计算设备 |
CN110020172B (zh) * | 2017-12-29 | 2021-07-09 | 中国电信股份有限公司 | 搜索结果生成方法和装置 |
CN108335137B (zh) * | 2018-01-31 | 2021-07-30 | 北京三快在线科技有限公司 | 排序方法及装置、电子设备、计算机可读介质 |
CN109241455B (zh) * | 2018-08-28 | 2021-08-20 | 北京三快在线科技有限公司 | 一种推荐对象的展示方法及装置 |
CN111125502B (zh) * | 2018-10-31 | 2024-02-20 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
CN110599295B (zh) * | 2019-08-22 | 2022-04-08 | 创新先进技术有限公司 | 物品的推送方法、装置及设备 |
CN112541145B (zh) * | 2019-09-20 | 2023-10-17 | 百度在线网络技术(北京)有限公司 | 一种页面展现方法、装置、设备及存储介质 |
CN111191133B (zh) * | 2019-12-31 | 2023-12-01 | 口口相传(北京)网络技术有限公司 | 业务搜索处理方法、装置及设备 |
CN111737405B (zh) * | 2020-07-03 | 2021-02-02 | 和宇健康科技股份有限公司 | 一种图文素材存档管理方法及系统 |
CN112084406B (zh) * | 2020-09-07 | 2024-09-24 | 维沃移动通信有限公司 | 短信处理方法、装置、电子设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942603A (zh) * | 2013-01-17 | 2014-07-23 | 腾讯科技(深圳)有限公司 | 一种广告点击率的预估方法和装置 |
CN104052714A (zh) * | 2013-03-12 | 2014-09-17 | 腾讯科技(深圳)有限公司 | 多媒体信息的推送方法及服务器 |
CN104090919A (zh) * | 2014-06-16 | 2014-10-08 | 华为技术有限公司 | 推荐广告的方法及广告推荐服务器 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8229873B1 (en) * | 2009-09-18 | 2012-07-24 | Google Inc. | News topic-interest-based recommendations twiddling |
JP5932035B2 (ja) * | 2011-08-04 | 2016-06-08 | グーグル インコーポレイテッド | 検索結果を伴う知識パネルを提供すること |
-
2014
- 2014-12-19 CN CN201410803186.4A patent/CN105760400B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942603A (zh) * | 2013-01-17 | 2014-07-23 | 腾讯科技(深圳)有限公司 | 一种广告点击率的预估方法和装置 |
CN104052714A (zh) * | 2013-03-12 | 2014-09-17 | 腾讯科技(深圳)有限公司 | 多媒体信息的推送方法及服务器 |
CN104090919A (zh) * | 2014-06-16 | 2014-10-08 | 华为技术有限公司 | 推荐广告的方法及广告推荐服务器 |
Also Published As
Publication number | Publication date |
---|---|
CN105760400A (zh) | 2016-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105760400B (zh) | 一种基于搜索行为的推送消息排序方法及装置 | |
CN107424043B (zh) | 一种产品推荐方法及装置,电子设备 | |
CN104281622B (zh) | 一种社交媒体中的信息推荐方法和装置 | |
CN109299994B (zh) | 推荐方法、装置、设备及可读存储介质 | |
CN108885624B (zh) | 信息推荐系统及方法 | |
CN107862022B (zh) | 文化资源推荐系统 | |
CN109165975B (zh) | 标签推荐方法、装置、计算机设备及存储介质 | |
CN108363821A (zh) | 一种信息推送方法、装置、终端设备及存储介质 | |
CN108805598B (zh) | 相似度信息确定方法、服务器及计算机可读存储介质 | |
US9946775B2 (en) | System and methods thereof for detection of user demographic information | |
WO2015188699A1 (zh) | 推荐项目的方法和装置 | |
JP5615857B2 (ja) | 分析装置、分析方法及び分析プログラム | |
US20130332385A1 (en) | Methods and systems for detecting and extracting product reviews | |
CN104239338A (zh) | 信息推荐方法及装置 | |
TWI662495B (zh) | 推廣資訊的處理方法、裝置及系統 | |
CN103365904B (zh) | 一种广告信息搜索方法和系统 | |
CN107730346A (zh) | 物品聚类的方法和装置 | |
CN109241451B (zh) | 一种内容组合推荐方法、装置及可读存储介质 | |
CN110163703B (zh) | 一种分类模型建立方法、文案推送方法和服务器 | |
CN105468649B (zh) | 一种待展示对象匹配的判断方法及其装置 | |
CN109446402B (zh) | 一种搜索方法及装置 | |
CN111899047A (zh) | 资源推荐方法、装置、计算机设备及计算机可读存储介质 | |
US20150154685A1 (en) | Automated detection of new item features by analysis of item attribute data | |
CN108153792A (zh) | 一种数据处理方法和相关装置 | |
CN112149003B (zh) | 商品社群推荐方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240226 Address after: # 01-21, Lai Zan Da Building 1, 51 Belarusian Road, Singapore Patentee after: Alibaba Singapore Holdings Ltd. Country or region after: Singapore Address before: Cayman Islands Grand Cayman capital building, a four storey No. 847 mailbox Patentee before: ALIBABA GROUP HOLDING Ltd. Country or region before: Cayman Islands |
|
TR01 | Transfer of patent right |