CN113065066B - 预测方法、装置、服务器及存储介质 - Google Patents

预测方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN113065066B
CN113065066B CN202110349893.0A CN202110349893A CN113065066B CN 113065066 B CN113065066 B CN 113065066B CN 202110349893 A CN202110349893 A CN 202110349893A CN 113065066 B CN113065066 B CN 113065066B
Authority
CN
China
Prior art keywords
activation
activation rate
data
determining
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110349893.0A
Other languages
English (en)
Other versions
CN113065066A (zh
Inventor
刘懿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202110349893.0A priority Critical patent/CN113065066B/zh
Publication of CN113065066A publication Critical patent/CN113065066A/zh
Application granted granted Critical
Publication of CN113065066B publication Critical patent/CN113065066B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开关于一种预测方法、装置、服务器及存储介质,属于互联网技术领域,该方法包括:确定第一展示数据和第一样本激活率,基于第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定发布者的目标参数,再对激活率预测模型进行训练。本公开实施例中,考虑到了推荐数据所属发布者的目标参数,根据该目标参数,能够获知发布者的推荐数据在展示后第一时长内的激活次数、与第二时长内的激活次数之间的关系,这样,对于激活率预测模型来说,增加了所参考的激活情况,能够提升训练激活率预测模型的准确性。

Description

预测方法、装置、服务器及存储介质
技术领域
本公开涉及互联网技术领域,尤其涉及一种预测方法、装置、服务器及存储介质。
背景技术
随着数据推荐技术的蓬勃发展,很多应用程序的开发者会在互联网中发布包括该应用程序的推荐数据,如某应用程序的广告视频等,使得用户能够对该推荐数据中的应用程序执行展示、点击、下载、注册的操作,在注册完成后就相当于激活了该推荐数据一次。
在每次展示某一推荐数据时,通常会利用激活率预测模型对该推荐数据的激活率进行预测,而在激活率预测模型的训练阶段,通常会获取展示数据,该展示数据用于指示对推荐数据的一次展示事件,根据推荐数据在展示事件之后的激活情况,来对激活率预测模型进行训练。
然而,由于推荐数据激活情况的不确定性,使得所训练的激活率预测模型的准确性较低。
发明内容
本公开提供一种预测方法、装置、服务器及存储介质,能够提高训练激活率预测模型的准确性。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种预测方法,该方法包括:
确定第一展示数据和第一样本激活率,该第一展示数据用于指示对第一推荐数据的一次展示事件,该第一样本激活率表示该第一推荐数据在该展示事件之后的第一时长内被激活;
基于该第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定该发布者的目标参数,该第一激活次数为由该发布者发布的推荐数据在展示后的该第一时长内被激活的次数,该第二激活次数为由该发布者发布的推荐数据在展示后的第二时长内被激活的次数,该第二时长大于该第一时长;
基于该第一展示数据、该第一样本激活率和该目标参数,对激活率预测模型进行训练;
基于训练得到的激活率预测模型,进行激活率的预测。
本公开实施例中,考虑到了推荐数据所属发布者的目标参数,根据该目标参数,能够获知发布者的推荐数据在展示后第一时长内的激活次数、与第二时长内的激活次数之间的关系,这样,对于激活率预测模型来说,增加了所参考的激活情况,能够提升训练激活率预测模型的准确性。
在一些实施例中,基于该第一展示数据、该第一样本激活率和该目标参数,对激活率预测模型进行训练包括:
将该第一展示数据输入该激活率预测模型,通过该激活率预测模型,对该第一展示数据进行预测,得到第一预测激活率;
基于该第一样本激活率、该第一预测激活率以及该目标参数,确定该激活率预测模型的损失值;
基于该损失值,对该激活率预测模型的模型参数进行更新。
本公开实施例中,在进行模型训练的过程中,根据目标参数以及第一样本激活率、第一预测激活率,来确定损失值,参考了目标参数,也即是参考了第一推荐数据所属发布者的推荐数据在展示后第一时长与第二时长的激活次数之间的关系,提升了确定损失值的准确性,进而提升了训练激活率预测模型的准确性。
在一些实施例中,基于该第一样本激活率、该第一预测激活率以及该目标参数,确定该激活率预测模型的损失值包括:
基于该第一样本激活率和该第一预测激活率,确定该第一展示数据对应的第一交叉熵;
基于该目标参数,确定交叉熵系数;
基于该交叉熵系数,对该第一交叉熵进行调整,得到第二交叉熵;
基于该第二交叉熵,确定该激活率预测模型的损失值。
本公开实施例中,通过基于目标参数所确定的交叉熵系数,来对第一展示数据对应的第一交叉熵进行调整,由于目标参数能够表示展示后第一时长与第二时长的激活次数之间的关系,且第一展示数据对应展示后第一时长内被激活的第一推荐数据,因此通过上述调整的过程,能够确定出同属发布者的推荐数据中,在展示后第二时长内可能被激活的次数,这样,对于激活率预测模型来说,还参考了第二时长内的激活情况,增加了所参考的激活情况,能够提升训练激活率预测模型的准确性。
在一些实施例中,第一展示数据包括多个,该基于该第二交叉熵,确定该激活率预测模型的损失值包括:
基于该多个第一展示数据对应的该目标参数,确定损失值系数;
基于该损失值系数,对该多个第一展示数据对应的该第二交叉熵进行调整,得到该激活率预测模型的损失值。
本公开实施例中,通过基于目标参数所确定的损失值系数,来对多个第二交叉熵进行调整,如此,在多个第一展示数据的情况下,考虑到了每个第一展示数据对应的第一推荐数据在展示后第二时长内、可能被激活的次数,提升了确定损失值的准确性。
在一些实施例中,该方法还包括:
确定第二展示数据和第二样本激活率,该第二展示数据用于指示对第二推荐数据的一次展示事件,该第二样本激活率表示该第二推荐数据在该展示事件之后的该第一时长内未被激活;
该基于该第一样本激活率、该第一展示数据的预测激活率以及该目标参数,确定该激活率预测模型的损失值之前,该方法还包括:
将该第二展示数据输入该激活率预测模型,通过该激活率预测模型,对该第二展示数据进行预测,得到第二预测激活率;
该基于该第一样本激活率、该第一预测激活率以及该目标参数,确定该激活率预测模型的损失值包括:
基于该第二样本激活率和该第二预测激活率,确定该第二展示数据对应的第三交叉熵;
基于该第二交叉熵与该第三交叉熵,确定该激活率预测模型的损失值。
本公开实施例中,在激活率预测模型的输入既包括第一展示数据,又包括第二展示数据的情况下,根据第一展示数据对应的第二交叉熵以及第二展示数据对应的第三交叉熵,来确定该激活率预测模型的损失值,在该过程中,确定了第一展示数据的目标参数,且基于该目标参数对第一展示数据的第一交叉熵进行了调整,能够保证确定损失值的准确性。
在一些实施例中,该第二展示数据包括一个或多个,基于该第二交叉熵与该第三交叉熵,确定该激活率预测模型的损失值包括:
基于该目标参数与该第二展示数据的数量,确定损失值系数;
基于该损失值系数,对该第二交叉熵与该第三交叉熵进行调整,得到该激活率预测模型的损失值。
本公开实施例中,通过基于目标参数和展示数据的数量所确定的损失值系数,来对多个交叉熵进行调整,在多个展示数据的情况下,考虑到其中第一展示数据所对应的目标参数,进而能够考虑到在展示后第二时长内的激活情况,提升了确定损失值的准确性。
在一些实施例中,基于该第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定该发布者的目标参数包括:
获取由该发布者发布且在当前周期对应的历史周期内展示的推荐数据的激活记录,该历史周期与该当前周期间隔该第二时长;
基于该激活记录,确定该发布者的第一激活次数和第二激活次数;
基于该发布者的第一激活次数和第二激活次数,确定该发布者的目标参数。
本公开实施例中,根据发布者在历史周期内展示的推荐数据的激活记录,能够确定出该发布者的第一激活次数和第二激活次数,进而能够快速确定出发布者的目标参数,提高了确定目标参数的效率,以便于后续模型的训练过程。
在一些实施例中,基于该第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定该发布者的目标参数包括:
获取由该发布者发布且在当前周期对应的历史周期内展示的推荐数据的激活记录,该历史周期与该当前周期间隔该第二时长;
在该历史周期内展示的推荐数据中,选取一个推荐数据作为目标推荐数据;
确定该目标推荐数据对应的第一激活次数和第二激活次数;
基于该目标推荐数据对应的第一激活次数和第二激活次数,确定该发布者的目标参数。
本公开实施例中,通过选取目标推荐数据,进而基于该目标推荐数据对应的激活次数来确定发布者的目标参数,服务器无需确定多个推荐数据的激活次数,极大地减少了服务器的运算内容,提高了服务器确定目标参数的效率。
在一些实施例中,基于该第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定该发布者的目标参数包括:
获取由该发布者发布且在当前周期对应的历史周期内展示的多个推荐数据的激活记录,该历史周期与该当前周期间隔该第二时长;
基于该历史周期内展示的多个推荐数据,确定该多个推荐数据对应的第一激活次数和第二激活次数;
基于该多个推荐数据对应的第一激活次数和第二激活次数,确定该发布者的目标参数。
本公开实施例中,考虑到多个推荐数据的激活次数,进而基于多个推荐数据的激活次数来确定发布者的目标参数,提高了确定目标参数的准确性。
在一些实施例中,基于该第一展示数据、该第一样本激活率和该目标参数,对激活率预测模型进行训练之后,该方法还包括:
若该激活率预测模型的损失值满足收敛条件,则将当前训练的激活率预测模型确定为训练完毕的激活率预测模型。
本公开实施例中,在损失值满足收敛条件时,所训练得到的模型准确性较高,进而能够预测得到较准确的激活率。
根据本公开实施例的第二方面,提供一种预测装置,该装置包括:
第一确定单元,被配置为执行确定第一展示数据和第一样本激活率,该第一展示数据用于指示对第一推荐数据的一次展示事件,该第一样本激活率表示该第一推荐数据在该展示事件之后的第一时长内被激活;
第二确定单元,被配置为执行基于该第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定该发布者的目标参数,该第一激活次数为由该发布者发布的推荐数据在展示后的该第一时长内被激活的次数,该第二激活次数为由该发布者发布的推荐数据在展示后的第二时长内被激活的次数,该第二时长大于该第一时长;
训练单元,被配置为执行基于该第一展示数据、该第一样本激活率和该目标参数,对激活率预测模型进行训练;
预测单元,被配置为执行基于训练得到的激活率预测模型,进行激活率的预测。
在一些实施例中,该训练单元,包括:
预测子单元,被配置为执行将该第一展示数据输入该激活率预测模型,通过该激活率预测模型,对该第一展示数据进行预测,得到第一预测激活率;
确定子单元,被配置为执行基于该第一样本激活率、该第一预测激活率以及该目标参数,确定该激活率预测模型的损失值;
更新子单元,被配置为执行基于该损失值,对该激活率预测模型的模型参数进行更新。
在一些实施例中,该确定子单元,包括:
第一交叉熵确定子单元,被配置为执行基于该第一样本激活率和该第一预测激活率,确定该第一展示数据对应的第一交叉熵;
交叉熵系数确定子单元,被配置为执行基于该目标参数,确定交叉熵系数;
调整子单元,被配置为执行基于该交叉熵系数,对该第一交叉熵进行调整,得到第二交叉熵;
损失值确定子单元,被配置为执行基于该第二交叉熵,确定该激活率预测模型的损失值。
在一些实施例中,该第一展示数据包括多个,该损失值确定子单元,被配置为执行:
基于该多个第一展示数据对应的该目标参数,确定损失值系数;
基于该损失值系数,对该多个第一展示数据对应的该第二交叉熵进行调整,得到该激活率预测模型的损失值。
在一些实施例中,该装置还包括第三确定单元,被配置为执行:
确定第二展示数据和第二样本激活率,该第二展示数据用于指示对第二推荐数据的一次展示事件,该第二样本激活率表示该第二推荐数据在该展示事件之后的该第一时长内未被激活;
该预测子单元,还被配置为执行将该第二展示数据输入该激活率预测模型,通过该激活率预测模型,对该第二展示数据进行预测,得到第二预测激活率;
该确定子单元,包括:
第三交叉熵确定子单元,被配置为执行基于该第二样本激活率和该第二预测激活率,确定该第二展示数据对应的第三交叉熵;
该损失值确定子单元,还被配置为执行基于该第二交叉熵与该第三交叉熵,确定该激活率预测模型的损失值。
在一些实施例中,该损失值确定子单元,还被配置为执行:
基于该目标参数与该第二展示数据的数量,确定损失值系数;
基于该损失值系数,对该第二交叉熵与该第三交叉熵进行调整,得到该激活率预测模型的损失值。
在一些实施例中,该第二确定单元,包括:
获取子单元,被配置为执行获取由该发布者发布且在当前周期对应的历史周期内展示的推荐数据的激活记录,该历史周期与该当前周期间隔该第二时长;
激活次数确定子单元,被配置为执行基于该激活记录,确定该发布者的第一激活次数和第二激活次数;
目标参数确定子单元,被配置为执行基于该发布者的第一激活次数和第二激活次数,确定该发布者的目标参数。
在一些实施例中,该第二确定单元,包括:
获取子单元,被配置为执行获取由该发布者发布且在当前周期对应的历史周期内展示的推荐数据的激活记录,该历史周期与该当前周期间隔该第二时长;
选取子单元,被配置为执行在该历史周期内展示的推荐数据中,选取一个推荐数据作为目标推荐数据;
激活次数确定子单元,被配置为执行确定该目标推荐数据对应的第一激活次数和第二激活次数;
目标参数确定子单元,被配置为执行基于该目标推荐数据对应的第一激活次数和第二激活次数,确定该发布者的目标参数。
在一些实施例中,该第二确定单元,包括:
获取子单元,被配置为执行获取由该发布者发布且在当前周期对应的历史周期内展示的多个推荐数据的激活记录,该历史周期与该当前周期间隔该第二时长;
激活次数确定子单元,被配置为执行基于该历史周期内展示的多个推荐数据,确定该多个推荐数据对应的第一激活次数和第二激活次数;
目标参数确定子单元,被配置为执行基于该多个推荐数据对应的第一激活次数和第二激活次数,确定该发布者的目标参数。
在一些实施例中,该基于该第一展示数据、该第一样本激活率和该目标参数,对激活率预测模型进行训练之后,该装置还包括:
若该激活率预测模型的损失值满足收敛条件,则将当前训练的激活率预测模型确定为训练完毕的激活率预测模型。
根据本公开实施例的第三方面,提供一种服务器,该服务器包括:
一个或多个处理器;
用于存储该处理器可执行程序代码的存储器;
其中,该处理器被配置为执行该程序代码,以实现上述的预测方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,该计算机可读存储介质包括:当该计算机可读存储介质中的程序代码由服务器的处理器执行时,使得服务器能够执行上述的预测方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的预测方法。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种预测方法的实施环境示意图;
图2是根据一示例性实施例示出的一种预测方法的流程图;
图3是根据一示例性实施例示出的一种预测方法的流程图;
图4是根据一示例性实施例示出的一种预测方法的流程图;
图5是根据一示例性实施例示出的一种预测装置的框图;
图6是根据一示例性实施例示出的一种服务器的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开所涉及的数据(如:训练数据、展示数据等)均为经用户授权或者经过各方充分授权的数据。
图1是本公开实施例提供的一种预测方法的实施环境示意图,参见图1,该实施环境中包括:终端101和服务器102。
终端101可以为智能手机、智能手表、台式电脑、手提电脑、虚拟现实终端、增强现实终端、无线终端和膝上型便携计算机等设备中的至少一种。终端101具有通信功能,可以接入有线网络或无线网络。终端101可以泛指多个终端中的一个,本实施例仅以终端101来举例说明。本领域技术人员可以知晓,上述终端的数量可以更多或更少。
在一些实施例中,用户在使用终端101的过程中,服务器102可以向终端101推荐包括应用程序的媒体资源,如某应用程序的广告视频。终端101接收并展示服务器102所推荐的媒体资源,若用户想要使用该应用程序,可以对该媒体资源中的应用程序执行点击、下载、注册的操作,再使用该应用程序。在另一些实施例中,用户还能够基于该媒体资源中的应用程序进行消费或者购买的操作,再使用该应用程序。
服务器102可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式文件系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。本公开实施例中,服务器102用于确定第一展示数据、第一样本激活率以及第一推荐数据所属发布者的目标参数,基于该第一展示数据、该第一样本激活率和该目标参数,对激活率预测模型进行训练,进而基于训练得到的激活率预测模型,进行激活率的预测。服务器102与终端101可以通过有线或无线通信方式进行直接或间接的连接,本公开实施例对此不作限定。可选地,上述服务器102的数量可以更多或更少,本公开实施例对此不加以限定。当然,服务器102还可以包括其他功能服务器,以便提供更全面且多样化的服务。
图2是根据一示例性实施例示出的一种预测方法的流程图,如图2所示,该方法用于服务器中,包括以下步骤:
在步骤201中,服务器确定第一展示数据和第一样本激活率,该第一展示数据用于指示对第一推荐数据的一次展示事件,该第一样本激活率表示该第一推荐数据在该展示事件之后的第一时长内被激活。
在步骤202中,服务器基于该第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定该发布者的目标参数,该第一激活次数为由该发布者发布的推荐数据在展示后的该第一时长内被激活的次数,该第二激活次数为由该发布者发布的推荐数据在展示后的第二时长内被激活的次数,该第二时长大于该第一时长。
在步骤203中,服务器基于该第一展示数据、该第一样本激活率和该目标参数,对激活率预测模型进行训练。
在步骤204中,服务器基于训练得到的激活率预测模型,进行激活率的预测。
本公开实施例中,考虑到了推荐数据所属发布者的目标参数,根据该目标参数,能够获知发布者的推荐数据在展示后第一时长内的激活次数、与第二时长内的激活次数之间的关系,这样,对于激活率预测模型来说,增加了所参考的激活情况,能够提升训练激活率预测模型的准确性。
在一些实施例中,基于该第一展示数据、该第一样本激活率和该目标参数,对激活率预测模型进行训练包括:
将该第一展示数据输入该激活率预测模型,通过该激活率预测模型,对该第一展示数据进行预测,得到第一预测激活率;
基于该第一样本激活率、该第一预测激活率以及该目标参数,确定该激活率预测模型的损失值;
基于该损失值,对该激活率预测模型的模型参数进行更新。
在一些实施例中,基于该第一样本激活率、该第一预测激活率以及该目标参数,确定该激活率预测模型的损失值包括:
基于该第一样本激活率和该第一预测激活率,确定该第一展示数据对应的第一交叉熵;
基于该目标参数,确定交叉熵系数;
基于该交叉熵系数,对该第一交叉熵进行调整,得到第二交叉熵;
基于该第二交叉熵,确定该激活率预测模型的损失值。
在一些实施例中,第一展示数据包括多个,该基于该第二交叉熵,确定该激活率预测模型的损失值包括:
基于该多个第一展示数据对应的该目标参数,确定损失值系数;
基于该损失值系数,对该多个第一展示数据对应的该第二交叉熵进行调整,得到该激活率预测模型的损失值。
在一些实施例中,该方法还包括:
确定第二展示数据和第二样本激活率,该第二展示数据用于指示对第二推荐数据的一次展示事件,该第二样本激活率表示该第二推荐数据在该展示事件之后的该第一时长内未被激活;
该基于该第一样本激活率、该第一展示数据的预测激活率以及该目标参数,确定该激活率预测模型的损失值之前,该方法还包括:
将该第二展示数据输入该激活率预测模型,通过该激活率预测模型,对该第二展示数据进行预测,得到第二预测激活率;
该基于该第一样本激活率、该第一预测激活率以及该目标参数,确定该激活率预测模型的损失值包括:
基于该第二样本激活率和该第二预测激活率,确定该第二展示数据对应的第三交叉熵;
基于该第二交叉熵与该第三交叉熵,确定该激活率预测模型的损失值。
在一些实施例中,该第二展示数据包括一个或多个,基于该第二交叉熵与该第三交叉熵,确定该激活率预测模型的损失值包括:
基于该目标参数与该第二展示数据的数量,确定损失值系数;
基于该损失值系数,对该第二交叉熵与该第三交叉熵进行调整,得到该激活率预测模型的损失值。
在一些实施例中,基于该第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定该发布者的目标参数包括:
获取由该发布者发布且在当前周期对应的历史周期内展示的推荐数据的激活记录,该历史周期与该当前周期间隔该第二时长;
基于该激活记录,确定该发布者的第一激活次数和第二激活次数;
基于该发布者的第一激活次数和第二激活次数,确定该发布者的目标参数。
在一些实施例中,基于该第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定该发布者的目标参数包括:
获取由该发布者发布且在当前周期对应的历史周期内展示的推荐数据的激活记录,该历史周期与该当前周期间隔该第二时长;
在该历史周期内展示的推荐数据中,选取一个推荐数据作为目标推荐数据;
确定该目标推荐数据对应的第一激活次数和第二激活次数;
基于该目标推荐数据对应的第一激活次数和第二激活次数,确定该发布者的目标参数。
在一些实施例中,基于该第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定该发布者的目标参数包括:
获取由该发布者发布且在当前周期对应的历史周期内展示的多个推荐数据的激活记录,该历史周期与该当前周期间隔该第二时长;
基于该历史周期内展示的多个推荐数据,确定该多个推荐数据对应的第一激活次数和第二激活次数;
基于该多个推荐数据对应的第一激活次数和第二激活次数,确定该发布者的目标参数。
在一些实施例中,基于该第一展示数据、该第一样本激活率和该目标参数,对激活率预测模型进行训练之后,该方法还包括:
若该激活率预测模型的损失值满足收敛条件,则将当前训练的激活率预测模型确定为训练完毕的激活率预测模型。
首先需要说明的是,本公开实施例后续采用展示数据和样本激活率,作为激活率预测模型的训练数据。其中,激活率预测模型用于对推荐数据在一次展示事件中被激活的概率进行预测。展示数据为激活率预测模型的输入,样本激活率为展示数据对应的标签。本公开实施例中,样本激活率是在线训练数据,在线训练数据是指基于终端的点击、下载、注册操作所获得的训练数据。
上述图2所示仅为本公开的基本流程,下面基于一种具体实施方式,来对本公开提供的方案进行进一步阐述,图3是根据一示例性实施例示出的一种预测方法的流程图,参见图3,该方法包括:
在步骤301中,服务器确定第一展示数据和第一样本激活率,该第一展示数据用于指示对第一推荐数据的一次展示事件,该第一样本激活率表示该第一推荐数据在该展示事件之后的第一时长内被激活。
其中,第一展示数据用于指示对第一推荐数据的一次展示事件。第一推荐数据是指服务器向终端推荐的包括应用程序的媒体资源,如某应用程序的广告视频。一次展示事件是指在被推荐终端中对该第一推荐数据进行一次展示,一次展示事件可理解为一次曝光事件,相应地,展示数据也可理解为曝光数据。
第一样本激活率表示该第一推荐数据在该展示事件之后的第一时长内被激活,也即是该第一样本激活率的取值为1。可选地,第一样本激活率的表现形式为激活标签。第一时长可以是预先设定的固定时长,如3天。
在一些实施例中,服务器确定第一展示数据的过程包括:服务器响应于终端对第一推荐数据进行展示,获取本次展示事件的展示相关数据和用户相关数据,将本次展示事件的展示相关数据和用户相关数据,确定为第一展示数据。其中,展示相关数据可以包括展示位置、展示时间、展示的媒体形式、展示尺寸等数据,用户相关数据可以包括用户基础属性(如性别、年龄)、用户兴趣属性(如游戏、旅游)、历史浏览、历史点击行为等数据。
在一些实施例中,服务器确定第一样本激活率的过程包括:服务器在该第一推荐数据的展示事件之后的第一时长内,若接收到该第一推荐数据的激活信息,该激活信息用于指示第一推荐数据在本次展示事件中被激活,则响应于第一推荐数据被激活,将该第一展示数据的样本激活率,确定为第一样本激活率。
可选地,服务器接收激活信息的过程为:终端接收并展示服务器所推荐的第一推荐数据,响应于对该第一推荐数据中的应用程序执行点击、下载、注册的操作,向该应用程序的后台服务器发送该应用程序的注册消息,则该后台服务器接收该注册消息后,生成激活信息,向服务器发送激活信息,则服务器接收该激活消息。
在步骤302中,服务器基于该第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定该发布者的目标参数,该第一激活次数为由该发布者发布的推荐数据在展示后的该第一时长内被激活的次数,该第二激活次数为由该发布者发布的推荐数据在展示后的第二时长内被激活的次数,该第二时长大于该第一时长。
其中,发布者可以是对该第一推荐数据进行发布的账号,可理解为广告主的账号。第二时长可以是预先设定的固定时长,如7天。本公开实施例后续假设在展示后7天内能够得到全部的激活次数为例。
在一些实施例中,服务器确定第一展示数据和第一样本激活率之后,确定第一推荐数据所属发布者,基于第一推荐数据所属发布者和目标对应关系,确定第一推荐数据所属发布者的目标参数,该目标对应关系用于指示发布者和目标参数之间的对应关系。
在另一些实施例中,服务器基于目标对应关系确定该发布者的目标参数,若该目标对应关系中不存在该发布者对应的目标参数,则将该发布者对应的目标参数设置为1。
在一些实施例中,目标参数为第一激活次数与第二激活次数的比例。例如,若第二时长为3天,第二时长为7天,则第一激活次数为发布者发布的推荐数据在展示后3天内被激活的次数,第二激活次数为发布者发布的推荐数据在展示后7天内被激活的次数,则目标参数为3天内被激活的次数与7天内被激活的次数的比例。需要说明的是,服务器可以在实施本方案之前,获取该发布者的目标参数,下面对获取该发布者的目标参数的过程进行说明:
(1)在一些实施例中,服务器获取由该发布者发布且在当前周期对应的历史周期内展示的推荐数据的激活记录,基于该激活记录,确定该发布者的第一激活次数和第二激活次数,基于该发布者的第一激活次数和第二激活次数,确定该发布者的目标参数。
可选地,服务器确定该发布者的第一激活次数和第二激活次数后,将该第一激活次数与该第二激活次数的比例,确定为该发布者的目标参数。
其中,历史周期与当前周期间隔该第二时长。当前周期可以是当前天数,历史周期可以是7天前的天数。例如,当前周期为周一,则历史周期是上周一,相应地,历史周期内展示的推荐数据也即是上周一所展示的推荐数据。需要说明的是,一个发布者可能对应多个推荐数据,一个推荐数据可能对应多个展示事件,如一个广告主可能会发布多个广告,一个广告可能会被多次曝光。激活记录用于记录推荐数据在任一展示事件中被激活的情况,如激活时间。
例如,以第一时长为3天、第二时长为7天为例,假设当前天数为ti,则获取该发布者在(ti-7)天前展示的推荐数据的激活记录,分别统计(ti-7)~(ti-4)天内的激活次数和(ti-7)~(ti-1)天内的激活次数,能够得到在展示后3天内的激活次数和7天内的激活次数,则基于展示后3天内的激活次数、展示后7天内的激活次数和下述公式(1),能够确定出目标参数。
式中,rate为目标参数,sample为推荐数据在展示后3天内的激活次数,all为推荐数据在展示后7天内的激活次数。
在该实施例中,根据发布者在历史周期内展示的推荐数据的激活记录,能够确定出该发布者的第一激活次数和第二激活次数,进而能够快速确定出发布者的目标参数,提高了确定目标参数的效率,以便于后续模型的训练过程。
(2)在又一种实施例中,服务器获取由该发布者发布且在当前周期对应的历史周期内展示的推荐数据的激活记录,在该历史周期内展示的推荐数据中,选取一个推荐数据作为目标推荐数据,确定该目标推荐数据对应的第一激活次数和第二激活次数,基于该目标推荐数据对应的第一激活次数和第二激活次数,确定该发布者的目标参数。
可选地,服务器确定该目标推荐数据对应的第一激活次数和第二激活次数后,将该第一激活次数与该第二激活次数的比例,确定为该发布者的目标参数。
在该实施例中,通过选取目标推荐数据,进而将该目标推荐数据对应的激活次数比例作为发布者的目标参数,服务器无需确定多个推荐数据的激活次数比例,极大地减少了服务器的运算内容,提高了服务器确定目标参数的效率。
(3)在另一种实施例中,服务器获取由该发布者发布且在当前周期对应的历史周期内展示的多个推荐数据的激活记录,基于该历史周期内展示的多个推荐数据,确定该多个推荐数据对应的第一激活次数和第二激活次数,基于该多个推荐数据对应的第一激活次数和第二激活次数,确定该发布者的目标参数。
可选地,服务器确定该多个推荐数据对应的第一激活次数和第二激活次数后,分别确定每个推荐数据的第一激活次数与第二激活次数的比例,将多个比例的平均值,确定为该发布者的目标参数。
在该实施例中,考虑到多个推荐数据的激活次数比例,将多个比例的平均值作为发布者的目标参数,提高了确定目标参数的准确性。
上述过程(1)至(3)是获取第一推荐数据所属发布者的目标参数的过程,应理解地,在实施本方案之前,可以获取多个发布者的目标参数,进而生成目标对应关系,以便后续确定目标参数时,能够基于该目标对应关系快速确定出发布者对应的目标参数,提高确定目标参数的效率。
服务器根据上述步骤确定出该第一展示数据、该第一样本激活率和该目标参数后,将第一展示数据作为激活率预测模型的输入,将第一样本激活率作为第一展示数据对应的标签,基于该第一展示数据、该第一样本激活率和该目标参数,对激活率预测模型进行训练。训练过程参见步骤303至步骤306。
在步骤303中,服务器将该第一展示数据输入该激活率预测模型,通过该激活率预测模型,对该第一展示数据进行预测,得到第一预测激活率。
其中,第一预测激活率是指激活率预测模型对第一展示数据进行预测得到的激活率。
在一些实施例中,服务器将第一展示数据输入该激活率预测模型,通过该激活率预测模型的特征提取层,对该第一展示数据进行特征提取,得到该第一展示数据的多个样本特征,再对该多个样本特征进行拼接,得到目标样本特征,将该目标样本特征输入该激活率预测模型的全连接层,由该全连接层对该目标样本特征进行分析,进而输出第一预测激活率。
在步骤304中,服务器基于该第一样本激活率、该第一预测激活率以及该目标参数,确定该激活率预测模型的损失值。
在一些实施例中,服务器得到第一预测激活率后,基于该第一样本激活率和该第一预测激活率,确定该第一展示数据对应的第一交叉熵,基于该目标参数,确定交叉熵系数,进而基于该交叉熵系数,对该第一交叉熵进行调整,得到第二交叉熵,基于该第二交叉熵,确定该激活率预测模型的损失值。在该实施例中,通过基于目标参数所确定的交叉熵系数,来对第一展示数据对应的第一交叉熵进行调整,由于目标参数能够表示展示后第一时长与第二时长的激活次数之间的关系,且第一展示数据对应展示后第一时长内被激活的第一推荐数据,因此通过上述调整的过程,能够确定出同属发布者的推荐数据中,在展示后第二时长内可能被激活的次数,这样,对于激活率预测模型来说,还参考了第二时长内的激活情况,增加了所参考的激活情况,能够提升训练激活率预测模型的准确性。
可选地,服务器基于该第一样本激活率、该第一预测激活率和下述公式(2),确定该第一展示数据对应的第一交叉熵;
m1=t1 log(p1)+(1-t1)log(1-p1) (2)
式中,m1为第一展示数据对应的第一交叉熵,t1为第一样本激活率,p1为第一预测激活率;
将该目标参数的倒数确定为交叉熵系数,基于该交叉熵系数以及下述公式(3),确定交叉熵系数和第一交叉熵的乘积,得到第二交叉熵,进而基于该第二交叉熵,确定该激活率预测模型的损失值;
式中,n1为第一展示数据对应的第二交叉熵,t1为第一样本激活率,p1为第一预测激活率,rate1为第一推荐数据所属发布者的目标参数,1/rate1为交叉熵系数。
在上述实施例中,基于目标参数的倒数,来对第一展示数据对应的第一交叉熵进行调整,这样,根据该倒数,也就能够确定出同属发布者的推荐数据中,在展示后第二时长内可能被激活的次数,增加了所参考的激活情况,从而提升训练激活率预测模型的准确性。
可选地,在一次训练过程中,该第一展示数据包括多个。相应地,服务器基于第二交叉熵,确定损失值的过程包括:服务器基于该多个第一展示数据对应的该目标参数,确定损失值系数,进而基于该损失值系数,对该多个第一展示数据对应的该第二交叉熵进行调整,得到该激活率预测模型的损失值。可选地,服务器基于该多个第一展示数据对应的该目标参数,确定目标数量,再基于该目标数量,确定损失值系数。具体地,服务器确定损失值系数后,基于该损失值系数,对该多个第一展示数据对应的该第二交叉熵的和值进行调整。在该实施例中,通过基于目标参数所确定的损失值系数,来对多个第二交叉熵进行调整,如此,在多个第一展示数据的情况下,考虑到了每个第一展示数据对应的第一推荐数据在展示后第二时长内、可能被激活的次数,提升了确定损失值的准确性。
可选地,参见如下公式(4),服务器将该多个第一推荐数据对应的该目标参数的倒数的和值,确定为目标数量,将该目标数量的倒数确定为损失值系数,确定该损失值系数和该多个第一推荐数据对应的该第二交叉熵的和值的乘积,得到该激活率预测模型的损失值;
式中,loss为激活率预测模型的损失值,N为激活率预测模型所输入的第一展示数据的数量,i为激活率预测模型所输入的第i个第一展示数据,ratei为第i个第一展示数据对应的目标参数,ti为第i个第一展示数据对应的第一样本激活率(其中第一样本激活率为1),pi为第i个第一展示数据的预测激活率。
其中,目标数量用于表示激活率预测模型所输入的推荐数据、在多次展示事件之后的第二时长内被激活的次数,也可理解为,激活率预测模型所输入的多个展示数据中、在展示事件之后的第二时长内被激活的个数。例如,若一次训练过程中,在该推荐数据的多次展示事件中、在展示后的第一时长内被激活的次数为3,而目标参数为3/10,则3与3/10的倒数相乘(实际运算过程为:目标数量=1*10/3+1*10/3+1*10/3),能够得到第二时长内被激活的次数10,这样,能够确定出推荐数据在第二时长可能发生的激活次数。
在步骤305中,服务器基于该损失值,对该激活率预测模型的模型参数进行更新。
在一些实施例中,服务器确定该激活率预测模型的损失值后,利用该损失值和梯度反向传播算法来更新激活率预测模型中的模型参数。其中,梯度反向传播算法是一种以最小化损失函数为原则的模型参数更新算法。
在上述实施例中,在进行模型训练的过程中,根据目标参数以及第一样本激活率、第一预测激活率,来确定损失值,参考了目标参数,也即是参考了第一推荐数据所属发布者的推荐数据在展示后第一时长与第二时长的激活次数之间的关系(如比例关系),提升了确定损失值的准确性,进而提升了训练激活率预测模型的准确性。
在步骤306中,若该激活率预测模型的损失值满足收敛条件,则服务器将当前训练的激活率预测模型确定为训练完毕的激活率预测模型。
在一些实施例中,若该激活率预测模型的损失值小于目标阈值,则服务器将当前训练的激活率预测模型确定为训练完毕的激活率预测模型。在该实施例中,在损失值满足收敛条件时,所训练得到的模型准确性较高,进而能够预测得到较准确的激活率。
在步骤307中,服务器基于训练得到的激活率预测模型,进行激活率的预测。
在一些实施例中,服务器响应于激活率预测请求,根据该激活率预测请求携带的展示事件标识,获取该展示事件标识对应的展示数据,将该展示数据输入该激活率预测模型,通过该激活率预测模型对该展示数据进行预测,得到该展示数据对应的推荐数据在本次展示事件中被激活的概率。通过上述训练过程得到的激活率预测模型,来进行激活率的预测,能够预测得到较准确的激活率。
本公开实施例中,考虑到了推荐数据所属发布者的目标参数,由于该目标参数为发布者的推荐数据在展示后第一时长内被激活的次数、占第二时长内被激活的次数的比例,因此,根据该目标参数,能够获知发布者的推荐数据在展示后第一时长内的激活次数、与第二时长内的激活次数之间的关系,这样,对于激活率预测模型来说,增加了所参考的激活情况,能够提升训练激活率预测模型的准确性。
图3是基于第一展示数据和第一样本激活率(已被激活),训练激活率预测模型的过程。应理解地,在一次训练过程中,还可能包括推荐数据在展示事件之后未被激活的展示数据,下面基于图4对相应过程进行说明。图4是根据一示例性实施例示出的一种预测方法的流程图,参见图4,图4以激活率预测模型的输入包括被激活的展示数据和未被激活的展示数据为例,对方案进行说明,该方法包括:
在步骤401中,服务器确定第一展示数据和第一样本激活率,该第一展示数据用于指示对第一推荐数据的一次展示事件,该第一样本激活率表示该第一推荐数据在该展示事件之后的第一时长内被激活。
步骤401与步骤301内容相同,不再赘述。
在步骤402中,服务器确定第二展示数据和第二样本激活率,该第二展示数据用于指示对第二推荐数据的一次展示事件,该第二样本激活率表示该第二推荐数据在该展示事件之后的该第一时长内未被激活。
其中,第二展示数据用于指示对第二推荐数据的一次展示事件。第二推荐数据可以是与第一推荐数据相同的推荐数据,也可以是与第一推荐数据不同的推荐数据。例如,第一推荐数据可以是某广告主的广告视频,第二推荐数据可以是另一广告主的广告视频。第二样本激活率表示该第二推荐数据在该展示事件之后的该第一时长内未被激活,也即是该第二样本激活率的取值为0。可选地,第二样本激活率的表现形式为未激活标签。
服务器确定第二展示数据的过程与步骤301中确定第一展示数据的过程相同,不再赘述。
在一些实施例中,服务器确定第二样本激活率的过程包括:服务器在该第二推荐数据的展示事件之后的第一时长内,若未接收到该第二推荐数据的激活信息,则将该第二展示数据的样本激活率,确定为第二样本激活率。
在步骤403中,服务器基于该第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定该发布者的目标参数,该第一激活次数为由该发布者发布的推荐数据在展示后的该第一时长内被激活的次数,该第二激活次数为由该发布者发布的推荐数据在展示后的第二时长内被激活的次数,该第二时长大于该第一时长。
在步骤404中,服务器将该第一展示数据输入该激活率预测模型,通过该激活率预测模型,对该第一展示数据进行预测,得到第一预测激活率。
步骤403至步骤404的内容与步骤302至步骤303的内容相同,不再赘述。
在步骤405中,服务器将该第二展示数据输入该激活率预测模型,通过该激活率预测模型,对该第二展示数据进行预测,得到第二预测激活率。
其中,第二预测激活率是指激活率预测模型对第二展示数据进行预测得到的激活率。
服务器确定第二预测激活率的过程与步骤303中确定第一预测激活率的过程相同,不再赘述。
在步骤406中,服务器基于该第一样本激活率、该第一预测激活率、该目标参数、第二样本激活率和该第二预测激活率,确定该激活率预测模型的损失值。
在一些实施例中,服务器得到第二预测激活率后,基于该第二样本激活率和该第二预测激活率,确定该第二展示数据对应的第三交叉熵,基于该第二交叉熵与该第三交叉熵,确定该激活率预测模型的损失值。具体地,服务器确定第二交叉熵和第三交叉熵后,基于该第二交叉熵与该第三交叉熵的和值,确定该激活率预测模型的损失值。
可选地,服务器确定第三交叉熵的过程为:基于该第二样本激活率、该第二预测激活率和下述公式(5),确定该第二展示数据对应的第三交叉熵;
m2=t2 log(p2)+(1-t2)log(1-p2) (5)
式中,m2为第二展示数据对应的第三交叉熵,t2为第二样本激活率,p2为第二预测激活率。
在上述实施例中,在激活率预测模型的输入既包括第一展示数据,又包括第二展示数据的情况下,根据第一展示数据对应的第二交叉熵以及第二展示数据对应的第三交叉熵,来确定该激活率预测模型的损失值,在该过程中,确定了第一展示数据的目标参数,且基于该目标参数对第一展示数据的第一交叉熵进行了调整,能够保证确定损失值的准确性。
可选地,该第二展示数据包括一个或多个。相应地,服务器基于该第二交叉熵与该第三交叉熵,确定该激活率预测模型的损失值的过程包括:服务器确定出该第二展示数据对应的第三交叉熵后,基于该目标参数与该第二展示数据的数量,确定损失值系数,进而基于该损失值系数,对该第二交叉熵与该第三交叉熵进行调整,得到该激活率预测模型的损失值。可选地,服务器基于目标参数与该第二展示数据的数量,确定目标数量,再基于目标数量,来确定损失值系数。具体地,服务器确定损失值系数的过程包括:将该目标参数的倒数与该第二展示数据的数量的和值,确定为目标数量,将该目标数量的倒数确定为损失值系数。具体地,服务器确定损失值系数后,基于该损失值系数,对该第二交叉熵与该第三交叉熵的和值进行调整。
在一些实施例中,步骤406的过程包括:基于该第一样本激活率、该第一预测激活率、该目标参数、第二样本激活率、该第二预测激活率以及下述损失函数(6),确定该激活率预测模型的损失值。
式中,loss为激活率预测模型的损失值,N为激活率预测模型所输入的展示数据的个数,i为激活率预测模型所输入的第i个展示数据,ti为第i个展示数据的样本激活率(其中第一样本激活率为1,第二样本激活率为0),si为第i个展示数据的损失值参数(其中第一展示数据对应的损失值参数为目标参数,第二展示数据对应的损失值参数为1),pi为第i个展示数据的预测激活率。
在上述实施例中,通过基于目标参数和展示数据的数量所确定的损失值系数,来对多个交叉熵的和值进行调整,在多个展示数据的情况下,考虑到其中第一展示数据所对应的目标参数,进而能够考虑到展示后第二时长内的激活情况,提升了确定损失值的准确性。
在步骤407中,服务器基于该损失值,对该激活率预测模型的模型参数进行更新。
在步骤408中,若该激活率预测模型的损失值满足收敛条件,则服务器将当前训练的激活率预测模型确定为训练完毕的激活率预测模型。
在步骤409中,服务器基于训练得到的激活率预测模型,进行激活率的预测。
步骤407至步骤409的内容与上述步骤305至步骤307的内容相同,不再赘述。
本公开实施例中,考虑到了推荐数据所属发布者的目标参数,由于该目标参数为发布者的推荐数据在展示后第一时长内被激活的次数、占第二时长内被激活的次数的比例,因此,根据该目标参数,能够获知发布者的推荐数据在展示后第一时长内的激活次数、与第二时长内的激活次数之间的关系,这样,对于激活率预测模型来说,增加了所参考的激活情况,能够提升训练激活率预测模型的准确性。
图3和图4均以一次训练过程为例,对激活率预测模型的训练过程进行了说明。在一些实施例中,服务器获取到多个展示数据后,确定该多个展示数据对应的样本激活率,对于样本激活率为第一样本激活率的展示数据,确定其推荐数据所属发布者的目标参数,在一次迭代过程中,将该多个展示数据分别输入该激活率预测模型,得到本次迭代过程中每个展示数据对应的预测激活率,基于本次迭代过程中多个展示数据的预测激活率、样本激活率和目标参数,确定该激活率预测模型的损失值,再基于该损失值对该激活率预测模型的模型参数进行更新,得到该激活率模型在本次迭代结束后的模型参数,进而基于本次迭代结束后的模型参数,进行下一次迭代过程,直至该激活率预测模型的损失值满足收敛条件,则结束该迭代训练。
图5是根据一示例性实施例示出的一种预测装置的框图。参照图5,该装置包括第一确定单元501,第二确定单元502、训练单元503和预测单元504。
第一确定单元501,被配置为执行确定第一展示数据和第一样本激活率,该第一展示数据用于指示对第一推荐数据的一次展示事件,该第一样本激活率表示该第一推荐数据在该展示事件之后的第一时长内被激活;
第二确定单元502,被配置为执行基于该第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定该发布者的目标参数,该第一激活次数为由该发布者发布的推荐数据在展示后的该第一时长内被激活的次数,该第二激活次数为由该发布者发布的推荐数据在展示后的第二时长内被激活的次数,该第二时长大于该第一时长;
训练单元503,被配置为执行基于该第一展示数据、该第一样本激活率和该目标参数,对激活率预测模型进行训练;
预测单元504,被配置为执行基于训练得到的激活率预测模型,进行激活率的预测。
本公开实施例中,考虑到了推荐数据所属发布者的目标参数,根据该目标参数,能够获知发布者的推荐数据在展示后第一时长内的激活次数、与第二时长内的激活次数之间的关系,这样,对于激活率预测模型来说,增加了所参考的激活情况,能够提升训练激活率预测模型的准确性。
在一些实施例中,该训练单元503,包括:
预测子单元,被配置为执行将该第一展示数据输入该激活率预测模型,通过该激活率预测模型,对该第一展示数据进行预测,得到第一预测激活率;
确定子单元,被配置为执行基于该第一样本激活率、该第一预测激活率以及该目标参数,确定该激活率预测模型的损失值;
更新子单元,被配置为执行基于该损失值,对该激活率预测模型的模型参数进行更新。
在一些实施例中,该确定子单元,包括:
第一交叉熵确定子单元,被配置为执行基于该第一样本激活率和该第一预测激活率,确定该第一展示数据对应的第一交叉熵;
交叉熵系数确定子单元,被配置为执行基于该目标参数,确定交叉熵系数;
调整子单元,被配置为执行基于该交叉熵系数,对该第一交叉熵进行调整,得到第二交叉熵;
损失值确定子单元,被配置为执行基于该第二交叉熵,确定该激活率预测模型的损失值。
在一些实施例中,该第一展示数据包括多个,该损失值确定子单元,被配置为执行:
基于该多个第一展示数据对应的该目标参数,确定损失值系数;
基于该损失值系数,对该多个第一展示数据对应的该第二交叉熵进行调整,得到该激活率预测模型的损失值。
在一些实施例中,该装置还包括第三确定单元,被配置为执行:
确定第二展示数据和第二样本激活率,该第二展示数据用于指示对第二推荐数据的一次展示事件,该第二样本激活率表示该第二推荐数据在该展示事件之后的该第一时长内未被激活;
该预测子单元,还被配置为执行将该第二展示数据输入该激活率预测模型,通过该激活率预测模型,对该第二展示数据进行预测,得到第二预测激活率;
该确定子单元,包括:
第三交叉熵确定子单元,被配置为执行基于该第二样本激活率和该第二预测激活率,确定该第二展示数据对应的第三交叉熵;
该损失值确定子单元,还被配置为执行基于该第二交叉熵与该第三交叉熵,确定该激活率预测模型的损失值。
在一些实施例中,该损失值确定子单元,还被配置为执行:
基于该目标参数与该第二展示数据的数量,确定损失值系数;
基于该损失值系数,对该第二交叉熵与该第三交叉熵进行调整,得到该激活率预测模型的损失值。
在一些实施例中,该第二确定单元502,包括:
获取子单元,被配置为执行获取由该发布者发布且在当前周期对应的历史周期内展示的推荐数据的激活记录,该历史周期与该当前周期间隔该第二时长;
激活次数确定子单元,被配置为执行基于该激活记录,确定该发布者的第一激活次数和第二激活次数;
目标参数确定子单元,被配置为执行基于该发布者的第一激活次数和第二激活次数,确定该发布者的目标参数。
在一些实施例中,该第二确定单元502,包括:
获取子单元,被配置为执行获取由该发布者发布且在当前周期对应的历史周期内展示的推荐数据的激活记录,该历史周期与该当前周期间隔该第二时长;
选取子单元,被配置为执行在该历史周期内展示的推荐数据中,选取一个推荐数据作为目标推荐数据;
激活次数确定子单元,被配置为执行确定该目标推荐数据对应的第一激活次数和第二激活次数;
目标参数确定子单元,被配置为执行基于该目标推荐数据对应的第一激活次数和第二激活次数,确定该发布者的目标参数。
在一些实施例中,该第二确定单元502,包括:
获取子单元,被配置为执行获取由该发布者发布且在当前周期对应的历史周期内展示的多个推荐数据的激活记录,该历史周期与该当前周期间隔该第二时长;
激活次数确定子单元,被配置为执行基于该历史周期内展示的多个推荐数据,确定该多个推荐数据对应的第一激活次数和第二激活次数;
目标参数确定子单元,被配置为执行基于该多个推荐数据对应的第一激活次数和第二激活次数,确定该发布者的目标参数。
在一些实施例中,该基于该第一展示数据、该第一样本激活率和该目标参数,对激活率预测模型进行训练之后,该装置还包括:
若该激活率预测模型的损失值满足收敛条件,则将当前训练的激活率预测模型确定为训练完毕的激活率预测模型。
需要说明的是:上述实施例提供的预测装置在进行预测时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的预测装置与预测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图6是根据一示例性实施例示出的一种服务器的框图,该服务器600可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(Central Processing Units,CPU)601和一个或多个的存储器602,其中,该一个或多个存储器602中存储有至少一条程序代码,该至少一条程序代码由该一个或多个处理器601加载并执行以实现上述各个方法实施例提供的预测方法。当然,该服务器600还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器600还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种包括程序代码的计算机可读存储介质,例如包括程序代码的存储器602,上述程序代码可由服务器600的处理器601执行以完成上述预测方法。可选地,计算机可读存储介质可以是只读内存(read-only memory,ROM)、随机存取存储器(random access memory),RAM)、只读光盘(compact-disc read-only memory,CD-ROM)、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的预测方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (15)

1.一种预测方法,其特征在于,所述方法包括:
确定第一展示数据和第一样本激活率,所述第一展示数据用于指示对第一推荐数据的一次展示事件,所述第一样本激活率表示所述第一推荐数据在所述展示事件之后的第一时长内被激活;
基于所述第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定所述发布者的目标参数,所述第一激活次数为由所述发布者发布的推荐数据在展示后的所述第一时长内被激活的次数,所述第二激活次数为由所述发布者发布的推荐数据在展示后的第二时长内被激活的次数,所述第二时长大于所述第一时长;
将所述第一展示数据输入激活率预测模型,通过所述激活率预测模型,对所述第一展示数据进行预测,得到第一预测激活率;
基于所述第一样本激活率、所述第一预测激活率以及所述目标参数,确定所述激活率预测模型的损失值;
基于所述损失值,对所述激活率预测模型的模型参数进行更新;
基于训练得到的激活率预测模型,进行激活率的预测;
其中,所述基于所述第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定所述发布者的目标参数的方式为下述任一种:
获取由所述发布者发布且在当前周期对应的历史周期内展示的推荐数据的激活记录,所述历史周期与所述当前周期间隔所述第二时长;基于所述激活记录,确定所述发布者的第一激活次数和第二激活次数;基于所述发布者的第一激活次数和第二激活次数,确定所述发布者的目标参数;或者,
获取由所述发布者发布且在当前周期对应的历史周期内展示的推荐数据的激活记录,所述历史周期与所述当前周期间隔所述第二时长;在所述历史周期内展示的推荐数据中,选取一个推荐数据作为目标推荐数据;确定所述目标推荐数据对应的第一激活次数和第二激活次数;基于所述目标推荐数据对应的第一激活次数和第二激活次数,确定所述发布者的目标参数;或者,
获取由所述发布者发布且在当前周期对应的历史周期内展示的多个推荐数据的激活记录,所述历史周期与所述当前周期间隔所述第二时长;基于所述历史周期内展示的多个推荐数据,确定所述多个推荐数据对应的第一激活次数和第二激活次数;基于所述多个推荐数据对应的第一激活次数和第二激活次数,确定所述发布者的目标参数。
2.根据权利要求1所述的预测方法,其特征在于,所述基于所述第一样本激活率、所述第一预测激活率以及所述目标参数,确定所述激活率预测模型的损失值包括:
基于所述第一样本激活率和所述第一预测激活率,确定所述第一展示数据对应的第一交叉熵;
基于所述目标参数,确定交叉熵系数;
基于所述交叉熵系数,对所述第一交叉熵进行调整,得到第二交叉熵;
基于所述第二交叉熵,确定所述激活率预测模型的损失值。
3.根据权利要求2所述的预测方法,其特征在于,所述第一展示数据包括多个,所述基于所述第二交叉熵,确定所述激活率预测模型的损失值包括:
基于多个所述第一展示数据对应的所述目标参数,确定损失值系数;
基于所述损失值系数,对多个所述第一展示数据对应的所述第二交叉熵进行调整,得到所述激活率预测模型的损失值。
4.根据权利要求2所述的预测方法,其特征在于,所述方法还包括:
确定第二展示数据和第二样本激活率,所述第二展示数据用于指示对第二推荐数据的一次展示事件,所述第二样本激活率表示所述第二推荐数据在所述展示事件之后的所述第一时长内未被激活;
所述基于所述第一样本激活率、所述第一展示数据的预测激活率以及所述目标参数,确定所述激活率预测模型的损失值之前,所述方法还包括:
将所述第二展示数据输入所述激活率预测模型,通过所述激活率预测模型,对所述第二展示数据进行预测,得到第二预测激活率;
所述基于所述第一样本激活率、所述第一预测激活率以及所述目标参数,确定所述激活率预测模型的损失值包括:
基于所述第二样本激活率和所述第二预测激活率,确定所述第二展示数据对应的第三交叉熵;
基于所述第二交叉熵与所述第三交叉熵,确定所述激活率预测模型的损失值。
5.根据权利要求4所述的预测方法,其特征在于,所述第二展示数据包括一个或多个,所述基于所述第二交叉熵与所述第三交叉熵,确定所述激活率预测模型的损失值包括:
基于所述目标参数与所述第二展示数据的数量,确定损失值系数;
基于所述损失值系数,对所述第二交叉熵与所述第三交叉熵进行调整,得到所述激活率预测模型的损失值。
6.根据权利要求1所述的预测方法,其特征在于,所述基于所述第一展示数据、所述第一样本激活率和所述目标参数,对激活率预测模型进行训练之后,所述方法还包括:
若所述激活率预测模型的损失值满足收敛条件,则将当前训练的激活率预测模型确定为训练完毕的激活率预测模型。
7.一种预测装置,其特征在于,所述装置包括:
第一确定单元,被配置为执行确定第一展示数据和第一样本激活率,所述第一展示数据用于指示对第一推荐数据的一次展示事件,所述第一样本激活率表示所述第一推荐数据在所述展示事件之后的第一时长内被激活;
第二确定单元,被配置为执行基于所述第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定所述发布者的目标参数,所述第一激活次数为由所述发布者发布的推荐数据在展示后的所述第一时长内被激活的次数,所述第二激活次数为由所述发布者发布的推荐数据在展示后的第二时长内被激活的次数,所述第二时长大于所述第一时长;
训练单元,被配置为执行将所述第一展示数据输入激活率预测模型,通过所述激活率预测模型,对所述第一展示数据进行预测,得到第一预测激活率;基于所述第一样本激活率、所述第一预测激活率以及所述目标参数,确定所述激活率预测模型的损失值;基于所述损失值,对所述激活率预测模型的模型参数进行更新;
预测单元,被配置为执行基于训练得到的激活率预测模型,进行激活率的预测;
其中,所述第二确定单元,被配置为执行下述任一项:
获取由所述发布者发布且在当前周期对应的历史周期内展示的推荐数据的激活记录,所述历史周期与所述当前周期间隔所述第二时长;基于所述激活记录,确定所述发布者的第一激活次数和第二激活次数;基于所述发布者的第一激活次数和第二激活次数,确定所述发布者的目标参数;或者,
获取由所述发布者发布且在当前周期对应的历史周期内展示的推荐数据的激活记录,所述历史周期与所述当前周期间隔所述第二时长;在所述历史周期内展示的推荐数据中,选取一个推荐数据作为目标推荐数据;确定所述目标推荐数据对应的第一激活次数和第二激活次数;基于所述目标推荐数据对应的第一激活次数和第二激活次数,确定所述发布者的目标参数;或者,
获取由所述发布者发布且在当前周期对应的历史周期内展示的多个推荐数据的激活记录,所述历史周期与所述当前周期间隔所述第二时长;基于所述历史周期内展示的多个推荐数据,确定所述多个推荐数据对应的第一激活次数和第二激活次数;基于所述多个推荐数据对应的第一激活次数和第二激活次数,确定所述发布者的目标参数。
8.根据权利要求7所述的预测装置,其特征在于,所述确定子单元,包括:
第一交叉熵确定子单元,被配置为执行基于所述第一样本激活率和所述第一预测激活率,确定所述第一展示数据对应的第一交叉熵;
交叉熵系数确定子单元,被配置为执行基于所述目标参数,确定交叉熵系数;
调整子单元,被配置为执行基于所述交叉熵系数,对所述第一交叉熵进行调整,得到第二交叉熵;
损失值确定子单元,被配置为执行基于所述第二交叉熵,确定所述激活率预测模型的损失值。
9.根据权利要求8所述的预测装置,其特征在于,所述第一展示数据包括多个,所述损失值确定子单元,被配置为执行:
基于多个所述第一展示数据对应的所述目标参数,确定损失值系数;
基于所述损失值系数,对多个所述第一展示数据对应的所述第二交叉熵进行调整,得到所述激活率预测模型的损失值。
10.根据权利要求8所述的预测装置,其特征在于,所述装置还包括第三确定单元,被配置为执行:
确定第二展示数据和第二样本激活率,所述第二展示数据用于指示对第二推荐数据的一次展示事件,所述第二样本激活率表示所述第二推荐数据在所述展示事件之后的所述第一时长内未被激活;
所述预测子单元,还被配置为执行将所述第二展示数据输入所述激活率预测模型,通过所述激活率预测模型,对所述第二展示数据进行预测,得到第二预测激活率;
所述确定子单元,包括:
第三交叉熵确定子单元,被配置为执行基于所述第二样本激活率和所述第二预测激活率,确定所述第二展示数据对应的第三交叉熵;
所述损失值确定子单元,还被配置为执行基于所述第二交叉熵与所述第三交叉熵,确定所述激活率预测模型的损失值。
11.根据权利要求10所述的预测装置,其特征在于,所述第二展示数据包括一个或多个,所述损失值确定子单元,还被配置为执行:
基于所述目标参数与所述第二展示数据的数量,确定损失值系数;
基于所述损失值系数,对所述第二交叉熵与所述第三交叉熵进行调整,得到所述激活率预测模型的损失值。
12.根据权利要求7所述的预测装置,其特征在于,所述基于所述第一展示数据、所述第一样本激活率和所述目标参数,对激活率预测模型进行训练之后,所述装置还包括:
若所述激活率预测模型的损失值满足收敛条件,则将当前训练的激活率预测模型确定为训练完毕的激活率预测模型。
13.一种服务器,其特征在于,所述服务器包括:
一个或多个处理器;
用于存储所述处理器可执行程序代码的存储器;
其中,所述处理器被配置为执行所述程序代码,以实现如权利要求1至6中任一项所述的预测方法。
14.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的程序代码由服务器的处理器执行时,使得服务器能够执行如权利要求1至6中任一项所述的预测方法。
15.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的预测方法。
CN202110349893.0A 2021-03-31 2021-03-31 预测方法、装置、服务器及存储介质 Active CN113065066B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110349893.0A CN113065066B (zh) 2021-03-31 2021-03-31 预测方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110349893.0A CN113065066B (zh) 2021-03-31 2021-03-31 预测方法、装置、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN113065066A CN113065066A (zh) 2021-07-02
CN113065066B true CN113065066B (zh) 2024-05-07

Family

ID=76564926

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110349893.0A Active CN113065066B (zh) 2021-03-31 2021-03-31 预测方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN113065066B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109460513A (zh) * 2018-10-31 2019-03-12 北京字节跳动网络技术有限公司 用于生成点击率预测模型的方法和装置
CN110378434A (zh) * 2019-07-24 2019-10-25 腾讯科技(深圳)有限公司 点击率预测模型的训练方法、推荐方法、装置及电子设备
CN110473000A (zh) * 2019-07-17 2019-11-19 深圳市元征科技股份有限公司 一种信息推荐方法、服务器及存储介质
CN110490389A (zh) * 2019-08-27 2019-11-22 腾讯科技(深圳)有限公司 点击率预测方法、装置、设备及介质
CN110569427A (zh) * 2019-08-07 2019-12-13 智者四海(北京)技术有限公司 一种多目标排序模型训练、用户行为预测方法及装置
WO2020073951A1 (zh) * 2018-10-10 2020-04-16 腾讯科技(深圳)有限公司 用于图像识别的模型的训练方法、装置、网络设备和存储介质
CN111027714A (zh) * 2019-12-11 2020-04-17 腾讯科技(深圳)有限公司 基于人工智能的对象推荐模型训练方法、推荐方法及装置
CN111274473A (zh) * 2020-01-13 2020-06-12 腾讯科技(深圳)有限公司 基于人工智能的推荐模型的训练方法、装置及存储介质
WO2020143304A1 (zh) * 2019-01-07 2020-07-16 平安科技(深圳)有限公司 损失函数优化方法、装置、计算机设备及存储介质
CN111460191A (zh) * 2020-02-25 2020-07-28 北京三快在线科技有限公司 推荐方法、装置、电子设备及可读存储介质
CN111966914A (zh) * 2020-10-26 2020-11-20 腾讯科技(深圳)有限公司 基于人工智能的内容推荐方法、装置和计算机设备
CN111967921A (zh) * 2020-09-24 2020-11-20 北京字节跳动网络技术有限公司 信息投放成本的确定方法、装置、设备和存储介质
CN112258285A (zh) * 2020-10-26 2021-01-22 北京沃东天骏信息技术有限公司 一种内容推荐方法及装置、设备、存储介质
CN112270348A (zh) * 2020-10-21 2021-01-26 中国银联股份有限公司 用户激活方法、模型训练方法、装置、设备及存储介质
CN112508613A (zh) * 2020-12-09 2021-03-16 天津狮拓信息技术有限公司 一种商品推荐方法、装置、电子设备和可读存储介质

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020073951A1 (zh) * 2018-10-10 2020-04-16 腾讯科技(深圳)有限公司 用于图像识别的模型的训练方法、装置、网络设备和存储介质
CN109460513A (zh) * 2018-10-31 2019-03-12 北京字节跳动网络技术有限公司 用于生成点击率预测模型的方法和装置
WO2020143304A1 (zh) * 2019-01-07 2020-07-16 平安科技(深圳)有限公司 损失函数优化方法、装置、计算机设备及存储介质
CN110473000A (zh) * 2019-07-17 2019-11-19 深圳市元征科技股份有限公司 一种信息推荐方法、服务器及存储介质
CN110378434A (zh) * 2019-07-24 2019-10-25 腾讯科技(深圳)有限公司 点击率预测模型的训练方法、推荐方法、装置及电子设备
CN110569427A (zh) * 2019-08-07 2019-12-13 智者四海(北京)技术有限公司 一种多目标排序模型训练、用户行为预测方法及装置
CN110490389A (zh) * 2019-08-27 2019-11-22 腾讯科技(深圳)有限公司 点击率预测方法、装置、设备及介质
CN111027714A (zh) * 2019-12-11 2020-04-17 腾讯科技(深圳)有限公司 基于人工智能的对象推荐模型训练方法、推荐方法及装置
CN111274473A (zh) * 2020-01-13 2020-06-12 腾讯科技(深圳)有限公司 基于人工智能的推荐模型的训练方法、装置及存储介质
CN111460191A (zh) * 2020-02-25 2020-07-28 北京三快在线科技有限公司 推荐方法、装置、电子设备及可读存储介质
CN111967921A (zh) * 2020-09-24 2020-11-20 北京字节跳动网络技术有限公司 信息投放成本的确定方法、装置、设备和存储介质
CN112270348A (zh) * 2020-10-21 2021-01-26 中国银联股份有限公司 用户激活方法、模型训练方法、装置、设备及存储介质
CN111966914A (zh) * 2020-10-26 2020-11-20 腾讯科技(深圳)有限公司 基于人工智能的内容推荐方法、装置和计算机设备
CN112258285A (zh) * 2020-10-26 2021-01-22 北京沃东天骏信息技术有限公司 一种内容推荐方法及装置、设备、存储介质
CN112508613A (zh) * 2020-12-09 2021-03-16 天津狮拓信息技术有限公司 一种商品推荐方法、装置、电子设备和可读存储介质

Also Published As

Publication number Publication date
CN113065066A (zh) 2021-07-02

Similar Documents

Publication Publication Date Title
CN107463580B (zh) 训练点击率预估模型方法和装置、点击率预估方法和装置
CN111798280B (zh) 多媒体信息推荐方法、装置和设备及存储介质
CN111008335B (zh) 一种信息处理方法、装置、设备及存储介质
CN109493138B (zh) 信息推荐方法、装置、服务器及存储介质
CN109903095A (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
CN110889725B (zh) 在线广告ctr预估方法、装置、设备及存储介质
CN112307344A (zh) 对象推荐模型、对象推荐方法、装置及电子设备
CN114461871B (zh) 推荐模型训练方法、对象推荐方法、装置及存储介质
US20210192549A1 (en) Generating analytics tools using a personalized market share
CN111738766B (zh) 用于多媒体信息的数据处理方法、装置以及服务器
CN113034168A (zh) 内容项投放方法、装置、计算机设备及存储介质
CN111552835A (zh) 文件推荐方法、装置及服务器
CN113011911B (zh) 基于人工智能的数据预测方法、装置、介质及电子设备
CN113836388A (zh) 信息推荐方法、装置、服务器及存储介质
CN113065066B (zh) 预测方法、装置、服务器及存储介质
CN111311015A (zh) 个性化点击率预测方法、设备及可读存储介质
CN113742600B (zh) 资源推荐方法、装置、计算机设备及介质
CN111507471B (zh) 一种模型训练方法、装置、设备及存储介质
CN115345635A (zh) 推荐内容的处理方法、装置、计算机设备和存储介质
CN111784091A (zh) 用于处理信息的方法和装置
CN111767099A (zh) 用于刷新目标界面的系统、方法及装置
CN117291670B (zh) 基于人群数据的视频广告播放方法及装置
CN113538030B (zh) 一种内容推送方法、装置及计算机存储介质
CN114004368A (zh) 性别预测模型训练方法和性别预测方法
CN117196726A (zh) 对象展示控制方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant