CN115701102A - 一种内容推送方法、装置、设备及存储介质 - Google Patents

一种内容推送方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115701102A
CN115701102A CN202110827615.1A CN202110827615A CN115701102A CN 115701102 A CN115701102 A CN 115701102A CN 202110827615 A CN202110827615 A CN 202110827615A CN 115701102 A CN115701102 A CN 115701102A
Authority
CN
China
Prior art keywords
conversion
visiting
sample
visit
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110827615.1A
Other languages
English (en)
Inventor
陈亮
翁运鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110827615.1A priority Critical patent/CN115701102A/zh
Publication of CN115701102A publication Critical patent/CN115701102A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供了一种内容推送方法,装置、设备及介质,该内容推送方法包括:获取目标对象的特征集合;利用来访转化预测模型对所述特征集合进行处理,得到所述目标对象的来访转化预测值;若根据所述来访转化预测值确定所述目标对象为待推送对象,则向所述目标对象推送推荐内容;其中,所述来访转化预测模型是利用转化样本集和来访样本集训练得到的,所述转化样本集包括未转化样本子集和已转化样本子集,所述来访样本集包括未来访样本子集和已来访样本子集。采用本申请实施例,可以筛选出待推送对象进行推送,使得推送的对象更加精准,从而提高推荐内容的点击率和转化率。

Description

一种内容推送方法、装置、设备及存储介质
技术领域
本申请涉及计算机技术,具体涉及一种内容推送方法、一种内容推送装置、一种终端设备以及一种计算机可读存储介质。
背景技术
随着信息技术的发展,推荐广告已经成为各个商家提高知名度、推广产品的主要渠道之一。商家投放推荐广告的效果主要由点击率(Click Through Rate,CTR)和转化率(Conversion Rate,CVR)来衡量。所谓点击率,是指在浏览到推荐广告时,点击推荐广告的次数与推荐广告被展现的次数之比;所谓转化率,是指在进入商家店铺后,进而有成交记录的比率。
目前,为了提高推荐广告的点击率和转化率,最常用的方法是通过计算某一对象的对象标签以及商品标签的匹配度,将匹配度较高的商品的推荐广告推荐给该对象。虽然,将对象标签与商品标签进行匹配而获得的匹配度可以表现对象兴趣与商品之间的关联性,但是存在对象标签和商品标签是依赖人工手动打标签,容易受到个人主观的影响,不能保证标签的准确性,从而推荐效果差,转化率低。
发明内容
本申请实施例提供了一种推荐方法、装置、终端设备及存储介质,可以筛选出待推送对象进行推送,使得推送的对象更加精准,从而提高推荐内容的点击率和转化率。
第一方面,本申请实施例提供了一种内容推送方法,上述方法包括:
获取目标对象的特征集合;
利用来访转化预测模型对上述特征集合进行处理,得到上述目标对象的来访转化预测值;
若根据上述来访转化预测值确定上述目标对象为待推送对象,则向上述目标对象推送推荐内容;
其中,上述来访转化预测模型是利用转化样本集和来访样本集训练得到的,上述转化样本集包括未转化样本子集和已转化样本子集,上述来访样本集包括未来访样本子集和已来访样本子集。
第二方面,本申请实施例提供了一种内容推送装置,上述装置包括:
获取单元,用于获取目标对象的特征集合;
处理单元,用于利用来访转化预测模型对上述特征集合进行处理,得到上述目标对象的来访转化预测值;
推送单元,用于若根据上述来访转化预测值确定上述目标对象为待推送对象,则向上述目标对象推送推荐内容;
其中,上述来访转化预测模型是利用转化样本集和来访样本集训练得到的,上述转化样本集包括未转化样本子集和已转化样本子集,上述来访样本集包括未来访样本子集和已来访样本子集。
在一种实现方式中,上述来访转化预测模型包括来访预测模块和转化预测模块,上述处理单元,具体用于:
利用上述来访预测模块对上述特征集合进行处理,得到上述目标对象的来访预测值;
利用上述转化预测模块对上述特征集合进行处理,得到上述目标对象的转化预测值;
根据上述来访预测值和上述转化预测值,确定上述目标对象的来访转化预测值。
在一种实现方式中,上述装置还包括:
上述获取单元,还用于获取上述转化样本集和上述来访样本集,上述转化样本集中的各个转化样本包括第一参考对象的特征集合和转化标签,上述来访样本集中的各个来访样本包括第二参考对象的特征集合和来访标签;
确定单元,用于利用上述转化样本集和上述来访样本集对初始来访转化预测模型进行训练,确定目标损失信息;
调整单元,用于当根据上述目标损失信息确定不满足训练停止条件时,根据上述目标损失信息调整上述初始来访转化预测模型的模型参数,并利用上述转化样本集和上述来访样本集对调整后的来访转化预测模型进行训练,得到训练后的来访转化预测模型。
在一种实现方式中,上述确定单元,具体用于:
利用上述转化样本集对初始来访转化预测模型进行训练,确定第一损失信息;
利用上述来访样本集对上述初始来访转化预测模型进行训练,确定第二损失信息;
根据上述第一损失信息和上述第二损失信息,确定目标损失信息。
在一种实现方式中,若转化样本属于已转化样本子集,则上述转化样本的转化标签包括转化时间,上述确定单元,具体用于:
针对第一转化样本,确定上述第一转化样本在上述第一转化样本所对应转化时间发生转化的转化概率,上述第一转化样本为上述已转化样本子集中的任一转化样本;
针对第二转化样本,确定上述第二转化样本在当前训练时间未发生转化的转化参考概率,上述第二转化样本为上述未转化样本子集中的任一转化样本;
根据各个第一转化样本的转化概率以及各个第二转化样本的参考概率,确定第一损失信息。
在一种实现方式中,上述确定单元,具体用于:
确定上述第二转化样本不会发生转化的概率,以及确定上述第二转化样本在当前训练时间之后发生转化的概率;
根据上述第二转化样本不会发生转化的概率以及上述第二转化样本在当前训练时间之后发生转化的概率,确定上述第二转化样本在上述当前训练时间未发生转化的参考概率。
在一种实现方式中,若来访样本属于已来访样本子集,则上述来访样本的来访标签包括来访时间,上述确定单元,具体用于:
针对第一来访样本,确定上述第一来访样本在上述第一来访样本所对应来访时间发生来访的来访概率,上述第一来访样本为上述已来访样本子集中的任一来访样本;
针对第二来访样本,确定上述第二来访样本在当前训练时间未发生来访的参考概率,上述第二来访样本为上述未来访样本子集中的任一来访样本;
根据各个第一来访样本的来访概率以及各个第二来访样本的参考概率,确定第二损失信息。
在一种实现方式中,上述确定单元,具体用于:
确定上述第二来访样本不会发生来访的概率,以及确定上述第二来访样本在当前训练时间之后发生来访的概率;
根据上述第二来访样本不会发生来访的概率以及上述第二来访样本在当前训练时间之后发生来访的概率,确定上述第二来访样本在上述当前训练时间未发生来访的参考概率。
在一种实现方式中,上述装置还包括:
上述获取单元,还用于获取可推送对象集合中各个对象的来访转化预测值,上述目标对象为上述可推送对象集合中的对象;
排序单元,用于按照来访转化预测值从大到小的顺序对上述各个对象的来访转化预测值进行排序;
上述确定单元,还用于若上述目标对象的来访转化预测值处于排序结果中的前M位,则确定上述目标对象为待推送对象。
第三方面,本申请实施例提供了一种内容推送设备,包括:处理器、通信接口和存储器,上述处理器、上述通信接口和上述存储器相互连接,其中,上述存储器存储有可执行程序代码,上述处理器用于调用上述可执行程序代码,执行上述第一方面上述的内容推送方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,上述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面上述的内容推送方法。
第五方面,本申请实施例还提供了一种计算机程序产品或计算机程序,上述计算机程序产品或计算机程序包括计算机指令,上述计算机指令存储在计算机可读存储介质中。终端设备的处理器从上述计算机可读存储介质读取上述计算机指令,处理器执行上述计算机指令,使得上述终端设备执行上述第一方面上述的内容推送方法。
在本申请实施例中,通过获取目标对象的特征集合;利用来访转化预测模型对特征集合进行处理,得到目标对象的来访转化预测值;进而若根据来访转化预测值确定上述目标对象为待推送对象,则向目标对象推送推荐内容。可见,可以根据目标对象的多个对象特征进行预测对象来访并转化的概率,得到来访转化预测值。该来访转化预测模型不仅考虑了来访和转化,还考虑了对象在接收到推荐内容后,并不会当下立刻来访或者来访后立刻转化的行为,即考虑了对象延迟来访以及延迟转化的行为,从而可以使预测出的来访转化预测值更加准确,进而根据来访转化预测值对对象进行筛选,能够筛选出来访并转化概率更大的对象推送推荐内容,使得推送的对象更加精准,从而提高推荐内容的点击率和转化率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种内容推送系统的架构示意图;
图2是本申请实施例提供的一种内容推送方法的流程示意图;
图3是本申请实施例提供的一种来访转化预测模型的结构示意图;
图4是本申请实施例提供的一种筛选待推送对象的示意图;
图5是本申请实施例提供的一种内容推送方法的另一流程示意图;
图6是本申请实施例提供的一种内容推送方法的时序示意图;
图7是本申请实施例提供的一种内容推送装置的结构示意图;
图8是本申请实施例提供的一种电子设备的结构示意图。
具体实施
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提出一种内容推送方案,该内容推送方案可以应用于各种推送应用或者推送系统中,所谓推送应用或者推送系统是指具有向对象推送推荐内容功能的应用或系统,其中,对象可以是用户,用户为使用上述推送应用或者推送系统的使用者;对象也可以指用户在上述推送应用或者推送系统所使用的账号、标识等,本申请对此不做限定。为了描述方便,下文以对象为用户为例进行描述。具体的,推送应用或者推送系统可以通过用户的行为特征,确定用户的来访转化预测值,进而可以根据从所有用户中筛选出部分用户作为待推送用户,进而将推荐内容推送至待推送用户。可见,筛选出的部分用户可以是发生来访行为(如用户接收到推荐内容后,点击该推荐内容)和发生转化行为(如用户进入推荐内容的页面进行成交转化)的概率均较大的用户,即筛选出较为精准的用户进行推送推荐内容,能够具有更好的投放效果,从而达到提高推荐内容的点击率和转化率的目的。
本申请实施例提出的内容推送方案涉及人工智能、机器学习等技术,其中:
所谓人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作(交互)系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习(深度学习)等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习(Deep Learnin g,DL)通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
基于上述描述,请参阅图1,图1是本申请实施例提供的一种内容推送系统的架构示意图,该内容推送系统包括多个终端设备(例如第一终端设备101、第二终端设备102、第三终端设备103)、两个电子设备。其中,两个电子设备可以包括内容推送设备104和模型训练设备105。内容推送设备104与多个终端设备可以通过有线或者无线的方式进行直接或间接的连接,模型训练设备105与内容推送设备104可以通过有线或无线的方式进行直接或间接的连接。可选地,内容推送设备104以及模型训练设备105可以是同一个电子设备,也可以是不同的两个电子设备,本申请对此不做限定。需要说明的是,图1所示的设备数量和形态用于举例,并不构成对本申请实施例的限定,实际应用中该内容推送系统可以包括三个以上的终端设备,仅包括一个电子设备。本申请实施例以三个终端设备(第一终端设备101、第二终端设备102、第三终端设备103)和一个电子设备(即内容推送设备104和模型训练设备105为同一个电子设备)进行讲解。
如图1所示,第一终端设备101、第二终端设备102以及第三终端设备103可以为三个不同用户的终端设备,第一终端设备101、第二终端设备102以及第三终端设备103可以用于接收推送的推荐内容,进而,用户可以通过对应的终端设备点击推送的推荐内容,进入推荐内容的页面,即发生来访,发生来访也指发生来访行为。进而,也可以在来访发生后,通过终端设备在推送内容的页面进行成交转化,即发生转化。上述多个终端设备中的任一终端设备(如第一终端设备101、第二终端设备102以及第三终端设备103)可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等等,但不局限于此。
上述内容推送设备104可以用于获取对象(如目标用户)的特征集合,并通过来访转化预测模型对获取到的特征集合进行处理,得到各个用户的来访转化预测值,从而根据来访转化预测值确定待推送的用户,并向待推送用户推送推荐内容。上述模型训练设备105可以用于构建并训练上述来访转化预测模型。上述内容推送设备104和上述模型训练设备105可以是也可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等等;上述内容推送设备104和上述模型训练设备105还可以是服务器,例如可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
在具体实现中,例如在购物的场景,目标对象(如目标用户)可以通过第一终端设备101安装并运行具有推送功能的购物类应用程序,进而目标用户可以浏览应用程序中的内容,第一终端设备101通过收集该目标用户的用户特征得到特征集合。内容推送设备104可以收集该目标用户的特征集合,通过来访转化预测模型对该特征集合进行处理,得到该目标用户的来访转化预测值,在该目标用户的来访转化预测值满足待推送用户的条件,则把该目标用户确定为待推送用户,进而将推荐内容推送至目标用户的第一终端设备101。进一步地,用户通过第一终端设备101接收到推动的推荐内容,可以通过点击该推送内容或者该推荐内容的页面发生来访,进而可以通过在该推荐内容的页面进行成交转化,发生转化。
在一个实现方式中,上述目标对象的特征集合和推送的推荐内容均可保存在区块链中,可以防止目标对象的特征集合和推送的推荐内容被篡改。其中,区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式,其本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。
通过上述内容推送系统,获取目标对象的特征集合;利用来访转化预测模型对特征集合进行处理,得到目标对象的来访转化预测值;进而若根据来访转化预测值确定上述目标对象为待推送对象,则向目标对象推送推荐内容。可见,可以根据目标对象的多个对象特征进行预测对象来访并转化的概率,得到来访转化预测值。该来访转化预测模型不仅考虑了来访和转化,还考虑了对象在接收到推荐内容后,并不会当下立刻来访或者来访后立刻转化的行为,即考虑了对象延迟来访以及延迟转化的行为,从而可以使预测出的来访转化预测值更加准确,进而根据来访转化预测值对对象进行筛选,能够筛选出来访并转化概率更大的对象推送推荐内容,使得推送的对象更加精准,从而提高推荐内容的点击率和转化率。
可以理解的是,本申请实施例描述的内容推送系统是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着系统架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
基于上述内容推送方案和内容推送系统,本申请实施例提供了一种内容推送方法,本申请实施例上述的内容推送方法可由电子设备来执行,该电子设备可以是图1所示的内容推送系统中的内容推送设备104,若该内容推送设备104为服务器时,可以是专用的服务器,也可以是某些互联网应用服务器,通过该互联网应用服务器不仅可以执行本申请实施例的相关步骤,还可以提供其他服务。请参阅图2,图2是本申请实施例所提供的一种内容推送方法的流程示意图,该内容推送方法包括以下步骤201-步骤203:
步骤201、获取目标对象的特征集合。
具体的,以目标对象为目标用户为例,目标用户为使用上述推送应用或者推送系统的任一用户。特征集合可以包括用户的画像特征、用户的行为特征、用户的物品特征以及场景特征。其中,用户的画像特征可以是用户的年龄、性别、年龄、用户所处的地域等特征;用户的行为特征可以是用户与站内内容的交互行为,例如,在购物场景中,用户浏览商品、收藏商品、加购物车、分享、复购等行为;用户的物品特征可以是用户与站内内容交互的物品特征,例如上述购物场景中,用户浏览的商品特征、用户收藏的商品特征、加购物车的商品特征、分享的商品特征以及复购的商品特征等等;场景特征可以理解为当前用户所处的场景的特征,例如在购物场景中,场景特征可以是当前流行的趋势,再例如在购买理财产品的场景中,该场景特征可以是大盘行情等。
在一种可能的实现方式中,目标用户为可以接收到推送的推荐内容的,以及与当前推送内容相关的用户。示例性的,用户可以通过终端设备中安装的应用程序浏览内容,发生来访,若该应用程序具有购买商品的功能,则用户还可以通过该应用程序购买商品,发生成交转化。为了描述方便,下文以购物场景为例进行讲解,目标用户可以通过该应用程序接收推送的推荐信息,例如,目标用户开启了该应用程序的接收推送通知的功能。并且,在推送推荐内容之前,业务方,即推荐内容的投放方可以确定推荐内容以及可投放的白名单用户。其中,可投放的白名单中用户可以为特征集合中包括某一项或者某几项特征的用户,包括的特征可以与业务方想推送的推荐内容有关。内容推送设备可以从使用该应用程序的全量用户,即所有用户中筛选出目标用户作为可推送用户,得到可推送用户集合。
上述过程中,目标对象(如目标用户)的特征集合能够表征目标对象的喜好、兴趣特征,通过获取目标对象的特征集合,为后续对目标对象的来访行为和转化行为进行预测提供了有效且精准的数据支撑。
步骤202、利用来访转化预测模型对上述特征集合进行处理,得到上述目标对象的来访转化预测值。
在一种可能的实现方式中,来访转化预测模型可以用于处理目标对象的特征集合,得到该目标对象的来访转化预测值,上述来访转化预测模型可以是基于历史推送结果训练好的模型,可以用于预测目标对象在接收到推送的推荐内容后,发生来访和发生转化的预测值。其中,来访转化预测值可以用于表示目标对象(如目标用户)接收到推送的推荐内容后,发生来访后发生转化的概率。示例性的,用户在接收到推送的推荐内容后,可以通过点击推荐内容进入推荐内容的页面进行浏览,该进入推荐内容的页面的行为即为发生来访,用户还可以通过其他方式进入推荐内容的页面发生来访行为,本申请对此不做限定。进一步的,用户可以在该推荐内容的页面购买了商品,则表示用户发生转化。
在购物、广告推送等场景下,用户在接收到推送的推荐内容后,可能当下并不会点击推荐内容,即当下不会发生来访;或者用户在接收到推荐内容后,可能会立刻点击推送内容进行查看,也不一定会在查看后立刻发生转化行为;或者用户在推送推荐内容后的一段时间才会发生来访和转化。即用户可能存在延迟来访以及延迟转化。在本申请中,为了考虑用户的延迟反馈,即用户的延迟来访和延迟转化,在训练来访转化预测模型时,训练集可以包括转化样本集和来访样本集,其中,转化样本集可以包括未转化样本子集和已转化样本子集,来访样本集包括未来访样本子集和已来访样本子集。
对于发生来访和发生转化来说,可以将用户接收到推送的推荐内容至训练模型的这段时间(即等待窗口)发生来访的样本作为已来访样本子集中的样本,将用户接收到推送的推荐内容至训练模型的这段时间发生转化作为样本作为已转化样本子集中的样本,并且该已来访样本子集中的样本来访标签还包括来访时间,该已转化样本子集中的样本来访标签还包括转化时间。对于未发生来访和未发生转化而言,可以将用户在接收到推送的推荐内容至训练模型的这段时间未发生来访的未发生转化的样本分为两种情况:一种情况是用户对推荐内容不感兴趣,最终也不会来访;另一种情况是用户对推荐内容感兴趣,但是来访时间大于等待窗口的时间,即在训练该来访转化预测模型时并未发生来访和转化。从而可以更准确的构建出来访转化预测模型,更准确的在全样本空间中刻画样本。
其中,为了同时考虑来访和转化,可以将来访转化预测模型构建为全样本空间多目标延迟反馈模型(Entire Space Delayed Feedback Model,ESDFM),所谓多任务模型是指模型中可以包括至少两个目标,每个目标分别对应多任务模型中的一个子网络,各个子网络分别对输入数据进行处理,输出各个目标的学习任务的处理结果,进而多任务模型可以根据各个子网络的处理结果进行进一步的处理,得到该多任务模型的输出结果。在本申请实施例中,来访转化预测模型可以包括两个目标,可以将发生来访作为一个目标,将发生转化作为另一个目标,构建包括两个目标的多目标延迟反馈模型,从而在针对用户转化的链路进行了多目标的拆分,可以考虑到在更多场景中用户转化链路更长的可能性。在本申请中,多目标延迟反馈模型还可以使用多任务学习模型(Modeling Task Relations hipsin Multi-task Learning with Multi-gate Mixture-of-Experts,MMOE)、共享底层(Share bottom)网络等其他多目标学习模型的模型结构,多目标延迟反馈模型还可以增加其他目标,例如,可以考虑其他延迟发生转化的情况。示例性的,可以增加从用户来访到用户添加自选的延迟反馈任务,从而能够筛选出精准的待推送用户。本申请以ESDFM为例进行描述,本申请不限定多目标延迟反馈模型的结构。
具体的,请一并参阅图3,图3是本申请实施例提供的一种来访转化预测模型的结构示意图。如图3所示,来访转化预测模型中包括来访预测模块和转化预测模块,该来访预测模块用于对对象(如用户)最终是否会发生来访行为进行预测,进一步的,该来访预测模块还需要学习延迟来访的分布参数,用于预估用户在未来的某一来访时间(例如第n天)发生来访行为的概率。同理,转化预测模块用于对对象(如用户)最终是否会发生转化行为进行预测,进一步的,该来访预测模块还需要学习延迟转化的分布参数,预估用户在未来的某一转化时间(例如第m天)发生转化行为的概率。
在一种可能的实现方式中,如图3所示,左下角的用户图标以及用户图标旁的数据表示为模型的输入,即目标对象(如目标用户)的特征集合。进而将特征集合输入至嵌入层(embedding layer),通过嵌入层可以将高维稀疏特征映射到低维语义空间。需要知道的是,目标对象的特征集合中包括的用户的画像特征、用户的行为特征以及场景特征可能均是几千维的数据集,用户的物品特征可能是几百维的数据集。为了便于计算以及提取有效信息,可以对数据进行降维,即将特征集合输入至嵌入层(如图3所示的虚线方框中的方格)中进行降维处理,得到降维后的特征集合,例如可以将数据集降维到几百维后进行处理。可选地,来访预测模块和转化预测模块可以共用嵌入层,即将降维后的特征集合输入至来访预测模块中的多层神经网络中进行处理,并且将降维后的特征集合输入至转化预测模块中的多层神经网络中进行处理。可选地,来访预测模块和转化预测模块可以有先后处理顺序,也可以并行处理,本申请对此不做限定。
在一种可能的实现方式中,在延迟反馈场景,可以选取指数函数作为延迟来访分布参数和延迟转化分布参数,这是由于该函数必须始终为正,且通常随着推送的推荐信息触达用户的时间增加,对于所有已推送的用户而言,来访人数和转化人数呈现指数衰减趋势。
具体的,延迟来访的分布参数可以如公式1所示:
Figure BDA0003174243420000121
其中,λv(x)表示对象(如用户)对应延迟来访的参数估计,该参数估计服从指数分布。wvd为与来访预测模块相关的模型参数,x表示特征集合,wvd×x表示指数分布的参数估计。
在一种可能的实现方式中,对于延迟来访的预测来说,通过来访预测模块根据对象(如用户)的特征集合进行处理,得到来访预测模块预测出的来访预测值,用pctr(xi)表示,该pctr(xi)的值可以用于表示该用户最终会发生来访行为的概率。需要说明的是,本申请以天为计时单位进行讲解,还可以选取其他计时单位,本申请对此不做限定。为了描述方便,在后文均以推送推荐内容的时间为第1天,对象为用户为例进行描述。
进一步地,用户在最终发生来访的条件下,来访时间发生在第vdi天的概率如公式2所示,
Figure BDA0003174243420000122
其中,Pr表示条件概率,VD表示标记事件(如推送推荐内容)的发生和用户发生来访之间的时间间隔,示例性的,在第1天推送推荐内容,用户在第vdi天发生来访,则VD=vdi。V表示用户最终是否会发生来访,V∈{0,1},若用户最终会发生来访,则V=1;反之V=0,表示用户最终不会发生来访。X表示特征集合,xi表示用户i的特征集合。则该式子Pr(VD=di|V=1,X=xi)表示V=1且X=xi的条件下,发生VD=vdi的概率,即在用户i最终会发生来访,且用户i的特征集合为xi的条件下,用户i在第vdi天发生来访的概率。
因此,用户发生来访的时间在第vdi天的概率可以如公式3所示:
Figure BDA0003174243420000131
其中,YV表示当前观测标签,即用户是否已经发生来访,YV∈{0,1},若用户已经发生来访,则YV=1;反之YV=0。VE表示标记时间已经过去的时间,例如推送推荐内容已经过去的天数为vei,则VE=vei。需要说明的是,需要重点区分VD和VE的概念,示例性的,假设在第一天推送推荐内容,在第5天发生来访,则VD=5;VE可用于表示训练模型的时间,与用户是否发生来访无关,若第6天训练上述来访转化预测模型,则VE=6。其中,由于当前已过去时间VE与最终是否会来访无关,于是可以在简化时去除。即用户发生来访的时间在第vdi天的概率为用户在最终发生来访的条件下,来访时间发生在第vdi天的概率与用于表示该用户最终会发生来访行为的概率pctr(xi)的积。
进一步地,来访预测模型预测用户在n天内用户发生来访的概率可以如公式4所示:
Figure BDA0003174243420000132
其中,积分的目的是在于求累计概率,即n天内来访的概率,可以是从推送推荐内容的时间至第n天内每一天用户发生来访的概率之和。
同理,延迟转化的分布参数可以如公式5所示:
Figure BDA0003174243420000133
其中,λ(x)表示用户对应延迟转化的参数估计,该参数估计也服从指数分布。wd为与转化预测模块相关的模型参数,x表示特征集合,wd×x表示指数分布的参数估计。
进一步地,用户在最终发生转化的条件下,转化时间发生在第di天的概率如公式6所示,
Figure BDA0003174243420000134
其中,D表示标记事件(如推送推荐内容)的发生和用户发生转化之间的时间间隔,示例性的,在第1天推送推荐内容,用户在第di天发生转化,则D=di。C表示用户最终是否会发生转化,C∈{0,1},若用户最终会发生转化,则C=1;反之C=0,表示用户最终不会发生转化。X表示特征集合,xi表示用户i的特征集合。则该式子Pr(D=di|C=1,X=xi)表示C=1且X=xi的条件下,发生D=di的概率,即在用户i最终会发生转化,且用户i的特征集合为xi的条件下,发生用户i在第di天发生转化的概率。
对于延迟转化的预测来说,通过转化预测模块根据用户的特征集合进行处理,得到转化预测模块预测出的转化预测值,用pcvr(xi)表示,该pcvr(xi)的值可以用于表示该用户来访后最终会发生转化的概率。
在得到来访预测值pctr(xi)和转化预测值pcvr(xi)后,可以得到用户来访后转化的联合概率,即用户的来访转化预测值。其中,用户来访后转化的联合概率可以如公式7所示:
pctcvr(xi)=pctr(xi)×pcvr(xi) 公式7
其中,pctcvr(xi)为用户来访后转化的联合概率为来访预测值pctr(xi)和转化预测值pcvr(xi)的积。
进一步地,转化预测模型预测用户在n天内用户发生来访并发生转化的概率可以如公式8所示:
Figure BDA0003174243420000141
同理,积分的目的是在于求累计概率,即n天内来并转化的概率,可以是从推送推荐内容的时间至第n天内每一天用户发生来访后转化的概率之和。
可选地,来访转化预测模型可以根据用户发生来访并发生转化的概率,即来访转化预测值确定该用户的预测分数,也可以直接将来访转化预测值作为预测分数,可以理解的是,用户的来访转化预测值与用户的预测分数成正比。进而可以根据各个用户的预测分数筛选待推送用户进行推送推荐内容。
步骤203、若根据上述来访转化预测值确定上述目标对象为待推送对象,则向上述目标对象推送推荐内容。
在一种可能的实现方式中,若对象(如用户)通过安装在终端设备中的应用程序接收推送的推荐内容,该推送的推荐内容可以是显示在下拉状态栏后的通知栏界面的推送信息,也可以在应用程序的图标上以高亮的方式标识出来,例如在应用程序的图标显示红色圆点。
在另一种可能的实现方式中,若对象(如用户)通过集成在应用程序中的小程序接收推送的推荐内容,则该推送的推荐内容可以显示在应用程序中,也可以在应用程序中的该小程序的图标以高亮的方式标识出来。示例性的,例如该购物小程序集成在即时通信应用程序中,则该推送的推荐内容可以显示在即时通信应用程序的推送内容中,并可以在显示该购物小程序的图标上以红点的方式高亮标识出来。
在一种可能的实现方式中,请一并参阅图4,图4为本申请实施例提供的一种筛选待推送对象的示意图。如图4所示,以使用应用程序的所有对象为全量对象为例,全量对象为最大的一个浅色椭圆,可推送对象为从全量对象筛选出来的可推送推荐内容的对象,筛选方式可以是筛选全量对象中可以接收到推送的推荐内容的,以及与当前推送内容相关的对象,如图4所示,可推送对象为在全量对象中的较小的椭圆。进而,根据上述来访转化预测值筛选出待推送对象,向筛选出的待推送对象推送推荐内容。其中,待推送对象可以是在每一个投放时期之前筛选出的高潜对象。如图4所示,待推送对象为在可推送对象的椭圆中的深色填充的椭圆。可以理解的是,在图4中的三个椭圆的大小分别可以用于表示对象的数量。
在一种可能的实现方式中,内容推送设备分别获取可推送对象集合中各个对象的来访转化预测值,其中,可推送对象集合中可以包括多个可推送对象,其中上述目标对象为可推送对象集合中的对象。内容推送设备可以根据来访转化预测值从大到小的顺序对可推送对象集合中的各个对象的来访转化预测值进行排序,筛选出排序结果中的前M位可推送对象作为待推送对象。例如,目标对象的来访转化预测值处于排序结果中的前M位,则内容推送设备可以确定目标对象为待推送对象。其中,M为大于1的整数。
可选地,内容推送设备可以将可推荐集合中各个对象的来访转化预测值中大于预设阈值的来访转化预测值对应的对象作为待推送对象。示例性的,若目标对象的来访转化预测值大于上述预设阈值,则可以将该目标对象作为可推送对象,反之,则将目标对象作为不推送对象。
在另一种可能的实现方式中,内容推送设备分别获取可推送对象集合中各个对象的来访转化预测值对应的预测分数。对预测分数从大到小对可推送对象集合中的各个对象的预测分数进行排序,筛选出排序结果中的前M位可推送对象作为待推送对象。例如,目标对象的来访转化预测值处于排序结果中的前M位,则内容推送设备可以确定目标对象为待推送对象。其中,M为大于1的整数。
可选地,内容推送设备可以筛选出可推送对象集合中各个对象的预测分数中大于预设阈值的预测分数,将筛选出大于预设阈值的预测分数所对应的对象作为待推送对象。
可选地,内容推送设备推送推荐内容的方式还可以是通过短信发送至各个待推送对象的终端设备。
示例性的,在理财类购物场景中,内容推送设备通过使用不同的预测模型筛选出的待推送对象,以对象为用户为例,内容推送设备分别向筛选出的待推送用户推送推荐内容,并且推送方式可以是通过应用程序的推送推荐内容的方式和通过短信的方式,得到的向新用户推送内容的推送效果可以如表1所示:
表1
模型 应用程序的推送 短信推送
深度神经网络 5.42 1.33
极端梯度提升树 5.29 1.37
延迟反馈模型 5.41 1.36
ESDFM 5.69 1.38
其中,新用户可以表示特征集合中,没有用户行为特征的用户。表1所示的数字为千次推送推荐内容后转化人数,如表1中使用深度神经网络(Deep Neu ral Networks,DNN)模型通过应用程序推送的方式推送1000次的效果为转化人数为5.42人,通过短信推送的方式推送1000次的效果为转化人数为1.33人;同理,使用极端梯度提升树(eXtreme GradientBoosting,XGBoost)模型通过应用程序推送的方式推送1000次的效果为转化人数为5.29人,通过短信推送的方式推送1000次的效果为转化人数为1.37人;延迟反馈模型(DelayedFeedba ck Model,DFM)通过应用程序推送的方式推送1000次的效果为转化人数为5.41人,通过短信推送的方式推送1000次的效果为转化人数为1.36人;以及本申请所使用的多目标延迟反馈模型ESDFM通过应用程序推送的方式推送1000次的效果为转化人数为5.69人,通过短信推送的方式推送1000次的效果为转化人数为1.38人。可见,本申请所使用的多目标延迟反馈模型的效果优于其他几种模型。
再一示例性的,在理财类购物场景中,内容推送设备通过使用不同的预测模型筛选出的待推送对象,以对象为用户为例,内容推送设备分别向筛选出的待推送用户推送推荐内容,并且推送方式可以是通过应用程序的推送推荐内容的方式和通过短信的方式,得到的向老用户推送内容的推送效果可以如表2所示:
表2
模型 应用程序的推送 短信推送
DNN 16.873 0.9579
XGBoost 16.852 0.8822
DFM 16.857 0.9616
全空间多目标学习模型 16.929 0.9571
ESDFM 16.954 0.9651
其中,老用户可以表示特征集合中,包括用户行为特征的用户。表2所示的数字为千次推送推荐内容后转化金额大于1000元的人数,如表2中使用DNN模型通过应用程序推送的方式推送1000次的效果为转化金额大于1000元的转化人数为16.873人,通过短信推送的方式推送1000次的效果为转化金额大于1000元的转化人数为0.9579人;使用XGBoost模型通过应用程序推送的方式推送1000次的效果为转化金额大于1000元的转化人数为16.852人,通过短信推送的方式推送1000次的效果为转化金额大于1000元的转化人数为0.8822人;使用DFM通过应用程序推送的方式推送1000次的效果为转化金额大于1000元的转化人数为16.857人,通过短信推送的方式推送1000次的效果为转化金额大于1000元的转化人数为0.9616人;使用全空间多目标学习模型(Entire Space Multi-Task Model,ESMM)通过应用程序推送的方式推送1000次的效果为转化金额大于1000元的转化人数为16.929人,通估计短信推送的方式推送1000次的效果为转化金额大于1000元的转化人数为0.9571人;以及本申请所使用的ESDFM通过应用程序推送的方式推送1000次的效果为转化金额大于1000元的转化人数为16.954人,通过短信推送的方式推送1000次的效果为转化人数为0.9651人。可见,本申请所使用的ESDFM的效果不仅在新用户(全量用户)中筛选出待推送用户(即高潜)进行推送较好,在老用户中进行筛选出待推送用户(即高潜)进行推送也优于其他几种模型。
在本申请实施例中,通过获取目标对象的特征集合;利用来访转化预测模型对特征集合进行处理,得到目标对象的来访转化预测值;进而若根据来访转化预测值确定上述目标对象为待推送对象,则向目标对象推送推荐内容。可见,可以根据目标对象的多个对象特征进行预测对象来访并转化的概率,得到来访转化预测值。该来访转化预测模型不仅考虑了来访和转化,还考虑了对象在接收到推荐内容后,并不会当下立刻来访或者来访后立刻转化的行为,即考虑了对象延迟来访以及延迟转化的行为,从而可以使预测出的来访转化预测值更加准确,进而根据来访转化预测值对对象进行筛选,能够筛选出来访并转化概率更大的对象推送推荐内容,使得推送的对象更加精准,从而提高推荐内容的点击率和转化率。
请参阅图5,图5是本申请实施例提供的一种内容推送方法的另一流程示意图,该内容推送方法可以由可由电子设备来执行,该电子设备可以是图1所示的内容推送系统中的内容推送设备104,也可以是图1所示的内容推送系统中的模型训练设备105,其中,内容推送设备104和模型训练设备105可以为同一电子设备。该内容推送方法包括步骤501-步骤503:
501、获取转化样本集和来访样本集。
在一种可能的实现方式中,以内容推送设备和模型训练设备为同一电子设备的执行主体进行讲解,上述内容推送设备可以构建初始来访转化预测模型,并获取训练样本集。进而通过有监督训练法对初始来访转化预测模型进行训练。其中,训练样本集包括转化样本集和来访样本集。上述转化样本集包括未转化样本子集和已转化样本子集,上述来访样本集包括未来访样本子集和已来访样本子集。
具体的,转化样本子集中的各个转化样本为第一参考用户发生转化的样本,可以理解为训练来访转化预测模型的正样本,该转化样本子集中包括第一参考对象的特征集合以及转化标签,第一参考对象为转化样本集中某一转化样本对应的对象。转化标签用于指示该第一参考对象是否发生转化,若发生转化,则该转化标签还用于指示该第一参考对象发生转化的时间。
其中,上述转化样本集包括的未转化样本子集中各个未转化样本为各个第一参考对象未发生转化的样本,各个未转化样本中的转化标签用于指示各个未转化样本对应的对象未发生转化,但是不能理解为训练来访转化预测模型的负样本。这是由于对于未发生转化的样本的对象来说,有两种可能存在的情况:(1)第一参考对象对推荐内容不感兴趣,即无论等待多久都不会发生转化;(2)第一参考对象当前未发生转化,但是对象最终会发生转化,对象发生转化的时间在当前训练时间之后。例如,第一天向第一参考对象推送推荐内容,在第5天构建初始来访转化预测模型并对该初始来访转化预测模型进行训练,但是第一参考对象在第10天才发生转化。
同理,来访样本集的各个来访样本包括第二参考对象的特征集合和来访标签,该来访样本子集中包括第二参考对象的特征集合以及来访标签,第二参考对象为来访样本集中某一来访样本对应的对象。来访标签用于指示该第二参考对象是否发生来访,并且在用于指示发生来访时,该来访标签还用于指示该第二参考对象发生来访的时间。
上述来访样本集包括的未来访样本子集中各个未来访样本为第二参考对象未发生来访的样本,各个未来访样本中的来访标签用于指示该第二参考对象未发生来访,但是也不能理解为训练来访转化预测模型的负样本。
需要说明的是,上述来访样本集中的样本可能与上述转化样本集中的样本相同,也可能与上述来访样本集中的样本不同。在一种可能的实现方式中,上述来访样本集可以包括上述转化样本集中的样本。
502、利用上述转化样本集和上述来访样本集对初始来访转化预测模型进行训练,确定目标损失信息。
在一种可能的实现方式中,利用转化样本集对初始来访转化预测模型进行训练,确定第一损失信息;利用上述来访样本集对初始来访转化预测模型进行训练,确定第二损失信息;根据上述第一损失信息和上述第二损失信息,确定目标损失信息。其中,可以利用来访样本集训练来访转化预测模型,得到第一损失信息;利用转化样本集训练来访转化预测模型,得到第二损失信息。进而,可以将第一损失信息和第二损失信息的和作为来访转化预测模型的目标损失信息。
示例性的,对于第一来访样本(即属于已来访样本子集中的样本)来说,第二参考对象(如用户)在第vdi天发生来访的来访概率可参见上述公式3;对于第二来访样本(即属于未来访样本子集中的样本)来说,第二参考对象未发生来访的参考概率可以如公式9所示:
Figure BDA0003174243420000201
其中,Pr(Yv=0|V=0,X=xi,E=ei)Pr(V=0|X=xi)表示对象不会发生来访的概率,Pr(Yv=0|V=1,X=xi,E=ei)Pr(V=1|X=xi)表示对象发生转化的时间在当前训练时间(即VE=vei)之后的概率。转化预测值pctr(xi)表示最终会发生来访的概率,所以1-pctr(xi)表示对象不会发生转化的概率。
进一步的,可以根据各个第一来访样本的来访概率和各个第二来访样本上述参考概率确定来访预测模块的第二损失信息,其中,第二损失信息可以包括来访预测模块的损失函数,该来访预测模块的损失函数可以如公式10所示:
Figure BDA0003174243420000202
其中,wv表示与来访预测相关的模型参数,wvd表示与延迟来访时间相关的模型参数,L(wv,wvd)表示来访预测模块的损失函数。具体的,该来访预测模块的损失函数可以通过极大似然估计,对连乘形式的似然函数求负对数,将最大化似然函数的优化来访预测的目标(即公式3和公式9)转换为最小化负对数似然函数,即得到上述公式10。
再一示例性的,对于第一转化样本(即属于已转化样本子集中的样本)来说,可以确定第一转化样本在上述第一转化样本所对应转化时间发生转化的转化概率,即pctcvr(xi)。pctcvr(xi)的得来可参见上述公式7。对于第二转化样本(即属于未转化样本子集中的样本)来说,可以确定第二转化样本未发生转化的转化参考概率可以包括两个部分,一个部分是第二转化样本不会发生转化的概率,第二部分是第二转化样本在当前训练时间之后发生转化的概率。其中,第二转化样本在当前训练时间未发生转化的概率可以如公式11所示:
Figure BDA0003174243420000211
其中,Pr(Y=0|C=0,X=xi,E=ei)Pr(C=0|X=xi)表示对象不会发生转化的概率,Pr(Y=0|C=1,x=xi,E=ei)Pr(C=1|X=xi)表示对象发生转化的时间在当前训练时间(即E=ei)之后的概率。转化预测值pcvr(xi)表示最终会发生转化的概率,所以1-pctcvr(xi)示对象不会发生转化的概率。
由于对象在最终发生转化的条件下,转化时间发生在第di天的概率可如公式6所示,则对象是在第di天发生转化,所对应的概率可以如公式12所示:
Figure BDA0003174243420000212
进而根据各个第一转化样本的转化概率和各个第二转化样本的转化参考概率确定第一损失信息。其中,第一损失信息可以包括转化预测模块的损失函数,该转化预测模块的损失函数可以如公式13所示:
Figure BDA0003174243420000213
其中,wc表示与来访转化预测值pctcvr(xi)相关的模型参数,wd表示与转化预测模块相关的模型参数。具体的,该转化预测模块的损失函数也可以通过极大似然估计,对连乘形式的似然函数求负对数,将最大化似然函数的优化来访后转化预测的目标(即上述公式11和公式12)转换为最小化负对数似然函数,即得到上述公式13。
进一步地,可以根据第一损失信息和上述第二损失信息,确定目标损失信息。目标损失信息可以包括该来访转化预测模型(即ESDFM)的损失函数,该ESD FM的损失函数可以如公式14所示:
L=L(wv,wvd)+L(wc,wd) 公式14
其中,L表示来访转化预测模型(即ESDFM)的损失函数。该ESDFM的损失函数可以是上述来访预测模块的损失函数与转化预测模块的损失函数的和。
需要说明的是,在本申请的来访转化预测模型中,将对象来访后的转化预测值pcvr(xi)作为隐变量进行学习。其中,所谓隐变量为不能被直接观测到,但是对系统和能观察到的输出存在影响的变量。将对象来访后的转化预测值pcvr(xi)作为隐变量进行学习,可能会简化观测的变量,使得建模的问题简单化。并且,在对来访转化预测模型的训练样本集中对当前未转化的样本有合理的区分,避免将有转化意愿的样本和不转化的样本混淆,从而对样本的刻画更加精细。
503、当根据上述目标损失信息确定不满足训练停止条件时,根据上述目标损失信息调整上述初始来访转化预测模型的模型参数,并利用上述转化样本集和上述来访样本集对调整后的来访转化预测模型进行训练,得到训练后的来访转化预测模型。
在一种可能的实现方式中,当确定该目标损失信息不满足训练结束条件时,其中,训练结束条件可以是目标损失信息中的损失函数的值在预设阈值范围内,训练结束条件也可以是连续N次迭代训练得到的损失函数的值中,相邻两次得到的损失函数的值的差值小于预设差值阈值的次数大于或等于预设次数阈值。本申请不做限定,具体可根据使用场景确定。
可选地,训练结束条件还可以是迭代训练的次数达到预设次数阈值。并进一步通过利用上述转化样本集和上述来访样本集对调整模型参数后的来访转化预测模型再次进行训练,直至满足训练结束条件,得到训练后的来访转化预测模型,即得到上述ESDFM。其中,在每一次迭代训练的过程中,初始来访转化模型可以指上一次训练后,调整模型参数后的来访转化模型。
可选地,可以通过梯度下降法(gradient descent)来对初始来访转化预测模型的模型参数进行调整。在使用梯度下降法更新模型参数时,计算损失函数的梯度,根据该梯度来对模型参数进行迭代更新,以将该初始来访转化预测模型进行逐渐收敛来提高模型的预测的准确率。
请一并参阅图6,图6是本申请实施例提供的一种内容推送方法的时序示意图,如图6所示,该内容推送方法的时序为:内容推送设备收集历史推送中转化样本集和来访样本集;进而内容推送设备根据转化样本集和来访样本集训练初始来访转化预测模型,然后内容推送设备对可推送对象进行预测,得到待推荐用户,并向待推送对象推送推荐内容。
在本申请实施例中,通过获取目标对象的特征集合;利用来访转化预测模型对特征集合进行处理,得到目标对象的来访转化预测值;进而若根据来访转化预测值确定上述目标对象为待推送对象,则向目标对象推送推荐内容。可见,可以根据目标对象的多个对象特征进行预测对象来访并转化的概率,得到来访转化预测值。该来访转化预测模型不仅考虑了来访和转化,还考虑了对象在接收到推荐内容后,并不会当下立刻来访或者来访后立刻转化的行为,即考虑了对象延迟来访以及延迟转化的行为,从而可以使预测出的来访转化预测值更加准确,进而根据来访转化预测值对对象进行筛选,能够筛选出来访并转化概率更大的对象推送推荐内容,使得推送的对象更加精准,从而提高推荐内容的点击率和转化率。
请参见图7,图7是本申请实施例的一种内容推送装置的结构示意图,本申请实施例的内容推送装置70可以设置在电子设备上,该电子设备可以是上述图1中的内容推送设备。上述内容推送装置70包括如下单元:
获取单元701,用于获取目标对象的特征集合;
处理单元702,用于利用来访转化预测模型对上述特征集合进行处理,得到上述目标对象的来访转化预测值;
推送单元703,用于若根据上述来访转化预测值确定上述目标对象为待推送对象,则向上述目标对象推送推荐内容;
其中,上述来访转化预测模型是利用转化样本集和来访样本集训练得到的,上述转化样本集包括未转化样本子集和已转化样本子集,上述来访样本集包括未来访样本子集和已来访样本子集。
在一种实现方式中,上述来访转化预测模型包括来访预测模块和转化预测模块,上述处理单元702,具体用于:
利用上述来访预测模块对上述特征集合进行处理,得到上述目标对象的来访预测值;
利用上述转化预测模块对上述特征集合进行处理,得到上述目标对象的转化预测值;
根据上述来访预测值和上述转化预测值,确定上述目标对象的来访转化预测值。
在一种实现方式中,上述装置70还包括:
上述获取单元701,还用于获取上述转化样本集和上述来访样本集,上述转化样本集中的各个转化样本包括第一参考对象的特征集合和转化标签,上述来访样本集中的各个来访样本包括第二参考对象的特征集合和来访标签;
确定单元704,用于利用上述转化样本集和上述来访样本集对初始来访转化预测模型进行训练,确定目标损失信息;
调整单元705,用于当根据上述目标损失信息确定不满足训练停止条件时,根据上述目标损失信息调整上述初始来访转化预测模型的模型参数,并利用上述转化样本集和上述来访样本集对调整后的来访转化预测模型进行训练,得到训练后的来访转化预测模型。
在一种实现方式中,上述确定单元704,具体用于:
利用上述转化样本集对初始来访转化预测模型进行训练,确定第一损失信息;
利用上述来访样本集对上述初始来访转化预测模型进行训练,确定第二损失信息;
根据上述第一损失信息和上述第二损失信息,确定目标损失信息。
在一种实现方式中,若转化样本属于已转化样本子集,则上述转化样本的转化标签包括转化时间,上述确定单元704,具体用于:
针对第一转化样本,确定上述第一转化样本在上述第一转化样本所对应转化时间发生转化的转化概率,上述第一转化样本为上述已转化样本子集中的任一转化样本;
针对第二转化样本,确定上述第二转化样本在当前训练时间未发生转化的转化参考概率,上述第二转化样本为上述未转化样本子集中的任一转化样本;
根据各个第一转化样本的转化概率以及各个第二转化样本的参考概率,确定第一损失信息。
在一种实现方式中,上述确定单元704,具体用于:
确定上述第二转化样本不会发生转化的概率,以及确定上述第二转化样本在当前训练时间之后发生转化的概率;
根据上述第二转化样本不会发生转化的概率以及上述第二转化样本在当前训练时间之后发生转化的概率,确定上述第二转化样本在上述当前训练时间未发生转化的参考概率。
在一种实现方式中,若来访样本属于已来访样本子集,则上述来访样本的来访标签包括来访时间,上述确定单元704,具体用于:
针对第一来访样本,确定上述第一来访样本在上述第一来访样本所对应来访时间发生来访的来访概率,上述第一来访样本为上述已来访样本子集中的任一来访样本;
针对第二来访样本,确定上述第二来访样本在当前训练时间未发生来访的参考概率,上述第二来访样本为上述未来访样本子集中的任一来访样本;
根据各个第一来访样本的来访概率以及各个第二来访样本的参考概率,确定第二损失信息。
在一种实现方式中,上述确定单元704,具体用于:
确定上述第二来访样本不会发生来访的概率,以及确定上述第二来访样本在当前训练时间之后发生来访的概率;
根据上述第二来访样本不会发生来访的概率以及上述第二来访样本在当前训练时间之后发生来访的概率,确定上述第二来访样本在上述当前训练时间未发生来访的参考概率。
在一种实现方式中,上述装置70还包括:
上述获取单元701,还用于获取可推送对象集合中各个对象的来访转化预测值,上述目标对象为上述可推送对象集合中的对象;
排序单元706,用于按照来访转化预测值从大到小的顺序对上述各个对象的来访转化预测值进行排序;
上述确定单元704,还用于若上述目标对象的来访转化预测值处于排序结果中的前M位,则确定上述目标对象为待推送对象。
根据本申请的一个实施例,图2或图5所示的方法所涉及的各个步骤均可以是由图7所示的内容推送装置中的各个单元执行的。例如,图2所示的步骤S201由图8中所示的获取单元701来执行,步骤S202由图8中所示的处理单元702来执行,步骤S203由图7中所示的推送单元703来执行;又如,图5所示的步骤S501由图7中所示的获取单元701来执行,步骤S502由图7中所示的确定单元704来执行,步骤S503由图7中所示的调整单元705来执行。
根据本申请的另一个实施例,图7所示的内容推送装置中的各个单元可以分别或者全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本申请实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以是由多个单元来实现,或者多个单元的功能由一个单元实现。在本申请的其他实施例中,基于内容推送装置也可以包括其他单元,在实际应用中,这些功能也可以由其他单元协助实现,并且可以由多个单元协作实现。
在本申请实施例中,通过获取目标对象的特征集合;利用来访转化预测模型对特征集合进行处理,得到目标对象的来访转化预测值;进而若根据来访转化预测值确定上述目标对象为待推送对象,则向目标对象推送推荐内容。可见,可以根据目标对象的多个对象特征进行预测对象来访并转化的概率,得到来访转化预测值。该来访转化预测模型不仅考虑了来访和转化,还考虑了对象在接收到推荐内容后,并不会当下立刻来访或者来访后立刻转化的行为,即考虑了对象延迟来访以及延迟转化的行为,从而可以使预测出的来访转化预测值更加准确,进而根据来访转化预测值对对象进行筛选,能够筛选出来访并转化概率更大的对象推送推荐内容,使得推送的对象更加精准,从而提高推荐内容的点击率和转化率。
基于上述内容推送方法实施例的描述,本申请实施例还公开了一种电子设备,请参见图8,该电子设备至少可包括处理器801、通信接口802以及计算机存储介质803。其中,电子设备内的处理器801、输入接口802以及计算机存储介质803可通过总线或其他方式连接。
上述计算机存储介质803是电子设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机存储介质803既可以包括电子设备的内置存储介质,当然也可以包括电子设备支持的扩展存储介质。计算机存储介质803提供存储空间,该存储空间存储了电子设备的操作系统。并且,在该存储空间中还存放了适于被处理器801加载并执行的一条或多条指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机存储介质可以是高速RAM存储器;可选的,还可以是至少一个远离前述处理器的计算机存储介质、上述处理器可以称为中央处理单元(Central Processing Unit,CP U),是电子设备的核心以及控制中心,适于被实现一条或多条指令,具体加载并执行一条或多条指令从而实现相应的方法流程或功能。
在一种实施方式中,可由处理器801加载并执行计算机存储介质中存放的一条或多条第一指令,以实现上述有关内容推送方法实施例中的方法的相应步骤;具体实现中,计算机存储介质中的一条或多条第一指令由处理器801加载并执行如下操作:
获取目标对象的特征集合;
利用来访转化预测模型对上述特征集合进行处理,得到上述目标对象的来访转化预测值;
若根据上述来访转化预测值确定上述目标对象为待推送对象,则向上述目标对象推送推荐内容;
其中,上述来访转化预测模型是利用转化样本集和来访样本集训练得到的,上述转化样本集包括未转化样本子集和已转化样本子集,上述来访样本集包括未来访样本子集和已来访样本子集。
在一个实现方式中,上述来访转化预测模型包括来访预测模块和转化预测模块,上述利用来访转化预测模型对上述特征集合进行处理,得到上述目标对象的来访转化预测值,包括:
利用上述来访预测模块对上述特征集合进行处理,得到上述目标对象的来访预测值;
利用上述转化预测模块对上述特征集合进行处理,得到上述目标对象的转化预测值;
根据上述来访预测值和上述转化预测值,确定上述目标对象的来访转化预测值。
在一个实现方式中,上述计算机存储介质中的一条或多条计算机程序由处理器801加载并执行如下步骤:
获取上述转化样本集和上述来访样本集,上述转化样本集中的各个转化样本包括第一参考对象的特征集合和转化标签,上述来访样本集中的各个来访样本包括第二参考对象的特征集合和来访标签;
利用上述转化样本集和上述来访样本集对初始来访转化预测模型进行训练,确定目标损失信息;
当根据上述损失信息确定不满足训练停止条件时,根据上述损失信息调整上述初始来访转化预测模型的模型参数,并利用上述转化样本集和上述来访样本集对调整后的来访转化预测模型进行训练,得到训练后的来访转化预测模型。
在一个实现方式中,上述利用上述转化样本集和上述来访样本集对初始来访转化预测模型进行训练,确定目标损失信息,包括:
利用上述转化样本集对初始来访转化预测模型进行训练,确定第一损失信息;
利用上述来访样本集对上述初始来访转化预测模型进行训练,确定第二损失信息;
根据上述第一损失信息和上述第二损失信息,确定目标损失信息。
在一个实现方式中,若转化样本属于已转化样本子集,则上述转化样本的转化标签包括转化时间,上述利用上述转化样本集对初始来访转化预测模型进行训练,确定第一损失信息,包括:
针对第一转化样本,确定上述第一转化样本在上述第一转化样本所对应转化时间发生转化的转化概率,上述第一转化样本为上述已转化样本子集中的任一转化样本;
针对第二转化样本,确定上述第二转化样本在当前训练时间未发生转化的转化参考概率,上述第二转化样本为上述未转化样本子集中的任一转化样本;
根据各个第一转化样本的转化概率以及各个第二转化样本的参考概率,确定第一损失信息。
在一个实现方式中,上述确定上述第二转化样本在当前训练时间未发生转化的参考概率,包括:
确定上述第二转化样本不会发生转化的概率,以及确定上述第二转化样本在当前训练时间之后发生转化的概率;
根据上述第二转化样本不会发生转化的概率以及上述第二转化样本在当前训练时间之后发生转化的概率,确定上述第二转化样本在上述当前训练时间未发生转化的参考概率。
在一个实现方式中,若来访样本属于已来访样本子集,则上述来访样本的来访标签包括来访时间,上述利用上述来访样本集对初始来访转化预测模型进行训练,确定第二损失信息,包括:
针对第一来访样本,确定上述第一来访样本在上述第一来访样本所对应来访时间发生来访的来访概率,上述第一来访样本为上述已来访样本子集中的任一来访样本;
针对第二来访样本,确定上述第二来访样本在当前训练时间未发生来访的参考概率,上述第二来访样本为上述未来访样本子集中的任一来访样本;
根据各个第一来访样本的来访概率以及各个第二来访样本的参考概率,确定第二损失信息。
在一个实现方式中,上述确定上述第二来访样本在当前训练时间未发生来访的参考概率,包括:
确定上述第二来访样本不会发生来访的概率,以及确定上述第二来访样本在当前训练时间之后发生来访的概率;
根据上述第二来访样本不会发生来访的概率以及上述第二来访样本在当前训练时间之后发生来访的概率,确定上述第二来访样本在上述当前训练时间未发生来访的参考概率。
在一个实现方式中,上述计算机存储介质中的一条或多条计算机程序由处理器801加载并执行如下步骤:
获取可推送对象集合中各个对象的来访转化预测值,上述目标对象为上述可推送对象集合中的对象;
按照来访转化预测值从大到小的顺序对上述各个对象的来访转化预测值进行排序;
若上述目标对象的来访转化预测值处于排序结果中的前M位,则确定上述目标对象为待推送对象。
本申请实施例的上述处理器801所执行的各个步骤的具体实现可参考前述实施例中相关内容的描述,亦可达到相同的技术效果,在此不再赘述。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,处理器运行该计算机程序,使得该电子设备执行前述实施例提供的方法。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行前述实施例提供的方法。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所揭露的仅为本申请一种较佳实施例而已,当然不能以此来限定本申请之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本申请权利要求所作的等同变化,仍属于发明所涵盖的范围。

Claims (12)

1.一种内容推送方法,其特征在于,所述方法包括:
获取目标对象的特征集合;
利用来访转化预测模型对所述特征集合进行处理,得到所述目标对象的来访转化预测值;
若根据所述来访转化预测值确定所述目标对象为待推送对象,则向所述目标对象推送推荐内容;
其中,所述来访转化预测模型是利用转化样本集和来访样本集训练得到的,所述转化样本集包括未转化样本子集和已转化样本子集,所述来访样本集包括未来访样本子集和已来访样本子集。
2.根据权利要求1所述的方法,其特征在于,所述来访转化预测模型包括来访预测模块和转化预测模块,所述利用来访转化预测模型对所述特征集合进行处理,得到所述目标对象的来访转化预测值,包括:
利用所述来访预测模块对所述特征集合进行处理,得到所述目标对象的来访预测值;
利用所述转化预测模块对所述特征集合进行处理,得到所述目标对象的转化预测值;
根据所述来访预测值和所述转化预测值,确定所述目标对象的来访转化预测值。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
获取所述转化样本集和所述来访样本集,所述转化样本集中的各个转化样本包括第一参考对象的特征集合和转化标签,所述来访样本集中的各个来访样本包括第二参考对象的特征集合和来访标签;
利用所述转化样本集和所述来访样本集对初始来访转化预测模型进行训练,确定目标损失信息;
当根据所述目标损失信息确定不满足训练停止条件时,根据所述目标损失信息调整所述初始来访转化预测模型的模型参数,并利用所述转化样本集和所述来访样本集对调整后的来访转化预测模型进行训练,得到训练后的来访转化预测模型。
4.根据权利要求3所述的方法,其特征在于,所述利用所述转化样本集和所述来访样本集对初始来访转化预测模型进行训练,确定目标损失信息,包括:
利用所述转化样本集对初始来访转化预测模型进行训练,确定第一损失信息;
利用所述来访样本集对所述初始来访转化预测模型进行训练,确定第二损失信息;
根据所述第一损失信息和所述第二损失信息,确定目标损失信息。
5.根据权利要求4所述的方法,其特征在于,若转化样本属于已转化样本子集,则所述转化样本的转化标签包括转化时间,所述利用所述转化样本集对初始来访转化预测模型进行训练,确定第一损失信息,包括:
针对第一转化样本,确定所述第一转化样本在所述第一转化样本所对应转化时间发生转化的转化概率,所述第一转化样本为所述已转化样本子集中的任一转化样本;
针对第二转化样本,确定所述第二转化样本在当前训练时间未发生转化的转化参考概率,所述第二转化样本为所述未转化样本子集中的任一转化样本;
根据各个第一转化样本的转化概率以及各个第二转化样本的参考概率,确定第一损失信息。
6.根据权利要求5所述的方法,其特征在于,所述确定所述第二转化样本在当前训练时间未发生转化的参考概率,包括:
确定所述第二转化样本不会发生转化的概率,以及确定所述第二转化样本在当前训练时间之后发生转化的概率;
根据所述第二转化样本不会发生转化的概率以及所述第二转化样本在当前训练时间之后发生转化的概率,确定所述第二转化样本在所述当前训练时间未发生转化的参考概率。
7.根据权利要求4所述的方法,其特征在于,若来访样本属于已来访样本子集,则所述来访样本的来访标签包括来访时间,所述利用所述来访样本集对初始来访转化预测模型进行训练,确定第二损失信息,包括:
针对第一来访样本,确定所述第一来访样本在所述第一来访样本所对应来访时间发生来访的来访概率,所述第一来访样本为所述已来访样本子集中的任一来访样本;
针对第二来访样本,确定所述第二来访样本在当前训练时间未发生来访的参考概率,所述第二来访样本为所述未来访样本子集中的任一来访样本;
根据各个第一来访样本的来访概率以及各个第二来访样本的参考概率,确定第二损失信息。
8.根据权利要求7所述的方法,其特征在于,所述确定所述第二来访样本在当前训练时间未发生来访的参考概率,包括:
确定所述第二来访样本不会发生来访的概率,以及确定所述第二来访样本在当前训练时间之后发生来访的概率;
根据所述第二来访样本不会发生来访的概率以及所述第二来访样本在当前训练时间之后发生来访的概率,确定所述第二来访样本在所述当前训练时间未发生来访的参考概率。
9.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
获取可推送对象集合中各个对象的来访转化预测值,所述目标对象为所述可推送对象集合中的对象;
按照来访转化预测值从大到小的顺序对所述各个对象的来访转化预测值进行排序;
若所述目标对象的来访转化预测值处于排序结果中的前M位,则确定所述目标对象为待推送对象。
10.一种内容推送装置,其特征在于,所述装置包括:
获取单元,用于获取目标对象的特征集合;
处理单元,用于利用来访转化预测模型对所述特征集合进行处理,得到所述目标对象的来访转化预测值;
推送单元,用于若根据所述来访转化预测值确定所述目标对象为待推送对象,则向所述目标对象推送推荐内容;
其中,所述来访转化预测模型是利用转化样本集和来访样本集训练得到的,所述转化样本集包括未转化样本子集和已转化样本子集,所述来访样本集包括未来访样本子集和已来访样本子集。
11.一种内容推送设备,其特征在于,包括处理器、通信接口和存储器,所述处理器、所述通信接口和所述存储器相互连接,其中,所述存储器存储有可执行程序代码,所述处理器用于调用所述可执行程序代码,执行如权利要求1-9中任一项所述的内容推送方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,执行权利要求1-9中任一项所述的内容推送方法。
CN202110827615.1A 2021-07-21 2021-07-21 一种内容推送方法、装置、设备及存储介质 Pending CN115701102A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110827615.1A CN115701102A (zh) 2021-07-21 2021-07-21 一种内容推送方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110827615.1A CN115701102A (zh) 2021-07-21 2021-07-21 一种内容推送方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115701102A true CN115701102A (zh) 2023-02-07

Family

ID=85120696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110827615.1A Pending CN115701102A (zh) 2021-07-21 2021-07-21 一种内容推送方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115701102A (zh)

Similar Documents

Publication Publication Date Title
CN109492772B (zh) 生成信息的方法和装置
US20190295114A1 (en) Digital banking platform and architecture
CN111626832B (zh) 产品推荐方法、装置及计算机设备
WO2017190610A1 (zh) 目标用户定向方法、装置和计算机存储介质
CN110751286A (zh) 神经网络模型的训练方法和训练系统
EP4242955A1 (en) User profile-based object recommendation method and device
CN113283948B (zh) 预测模型的生成方法、装置、设备和可读介质
US20210012359A1 (en) Device, method and computer-readable medium for making recommendations on the basis of customer attribute information
CN112288554B (zh) 商品推荐方法和装置、存储介质及电子装置
CN112348592A (zh) 广告推荐方法、装置、电子设备及介质
CN110717597A (zh) 利用机器学习模型获取时序特征的方法和装置
CN111104590A (zh) 信息推荐方法、装置、介质及电子设备
CN111429161B (zh) 特征提取方法、特征提取装置、存储介质及电子设备
CN113705698B (zh) 基于点击行为预测的信息推送方法及装置
CN115730125A (zh) 对象识别方法、装置、计算机设备和存储介质
CN112395499B (zh) 信息推荐方法及装置、电子设备、存储介质
CN115222433A (zh) 一种信息推荐方法、装置及存储介质
CN112989182A (zh) 信息处理方法、装置、信息处理设备及存储介质
CN112801685A (zh) 信息推送方法、装置、计算机设备及存储介质
CN115701102A (zh) 一种内容推送方法、装置、设备及存储介质
CN114463085A (zh) 自动化营销的通用沟通互动方法、装置、电子设备及存储介质
CN112446738A (zh) 广告数据处理方法、装置、介质以及电子设备
CN115392943A (zh) 发送展示信息的方法、装置、设备和存储介质
CN115329183A (zh) 数据处理方法、装置、存储介质及设备
CN113822734A (zh) 用于生成信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40081518

Country of ref document: HK