CN112818241A - 一种内容推广方法、装置、计算机设备和存储介质 - Google Patents
一种内容推广方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112818241A CN112818241A CN202110194505.6A CN202110194505A CN112818241A CN 112818241 A CN112818241 A CN 112818241A CN 202110194505 A CN202110194505 A CN 202110194505A CN 112818241 A CN112818241 A CN 112818241A
- Authority
- CN
- China
- Prior art keywords
- user set
- candidate
- user
- model
- positive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
- G06Q30/0271—Personalized advertisement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Abstract
本申请实施例公开了一种内容推广方法、装置、计算机设备和存储介质;通过获取用户集合,用户集合包括候选正类用户集合、负类用户集合以及参考用户集合;基于候选正类用户集合和参考用户集合对初始分类模型进行训练,得到训练后分类模型通过训练后分类模型候选正类用户集合进行优化,得到正类用户集合;基于正类用户集合和负类用户集合对初始推广模型进行训练,得到训练后推广模型;最后,通过训练后推广模型对用户集合进行筛选,得到目标用户,向目标用户对应的终端推广内容。通过对获取的候选正类用户集合进行优化,得到正类用户集合,根据优化后的正类用户集合训练得到的训练后推广模型可以准确找到对推广内容感兴趣的用户,提高内容推广效果。
Description
技术领域
本申请涉及通信技术领域,具体涉及一种内容推广方法、装置、计算机设备和存储介质。
背景技术
在推广内容过程中,为了提高内容的推广效果,以及降低推广成本,需要寻找到对推广的内容感兴趣的用户,并向寻找到的用户推广内容,实现有效推广。通常采用根据内容推广方提供的,或者从历史内容推广记录中获取的种子用户,查找到相似用户,以实现定向地推广内容,其中,种子用户可以代表对推广的内容感兴趣的用户。
在对现有技术的研究和实践过程中,本申请的发明人发现如果种子用户不够优质,即不能够很好地反映对推广内容感兴趣的用户的特征,根据种子用户寻找到的相似用户对推广的内容的兴趣较低,内容推广效果差。
发明内容
本申请实施例提供一种内容推广方法、装置、计算机设备和存储介质,可以准确找到对推广内容感兴趣的用户,提高内容推广效果。
本申请实施例提供的一种内容推广方法,包括:
获取用户集合,所述用户集合包括候选正类用户集合、负类用户集合以及参考用户集合;
基于所述候选正类用户集合和所述参考用户集合对初始分类模型进行训练,得到训练后分类模型;
通过所述训练后分类模型对所述候选正类用户集合进行优化,得到正类用户集合;
基于所述正类用户集合和所述负类用户集合对初始推广模型进行训练,得到训练后推广模型;
通过所述训练后推广模型对所述用户集合进行筛选,得到目标用户,向所述目标用户对应的终端推广内容。
相应的,本申请实施例还提供的一种内容推广装置,包括:
获取单元:用于获取用户集合,所述用户集合包括候选正类用户集合、负类用户集合以及参考用户集合;
第一训练单元:用于基于所述候选正类用户集合和所述参考用户集合对初始分类模型进行训练,得到训练后分类模型;
优化单元:用于通过所述训练后分类模型所述候选正类用户集合进行优化,得到正类用户集合;
第二训练单元:用于基于所述正类用户集合和所述负类用户集合对初始推广模型进行训练,得到训练后推广模型;
筛选单元:用于通过所述训练后推广模型对所述用户集合进行筛选,得到目标用户,向所述目标用户对应的终端推广内容。
相应的,本申请实施例还提供的一种计算机设备,包括存储器和处理器;所述存储器存储有计算机程序,所述处理器用于运行所述存储器内的计算机程序,以执行本申请实施例提供的任一种内容推广方法。
相应的,本申请实施例还提供一种存储介质,所述存储介质用于存储计算机程序,所述计算机程序被处理器加载以执行本申请实施例提供的任一种内容推广方法。
本申请实施例采用获取用户集合,用户集合包括候选正类用户集合、负类用户集合以及参考用户集合;然后,基于候选正类用户集合和参考用户集合对初始分类模型进行训练,得到训练后分类模型通过训练后分类模型候选正类用户集合进行优化,得到正类用户集合;基于正类用户集合和负类用户集合对初始推广模型进行训练,得到训练后推广模型;最后,通过训练后推广模型对用户集合进行筛选,得到目标用户,向目标用户对应的终端推广内容。该方案通过对获取的候选正类用户集合进行优化,得到正类用户集合,根据优化后的正类用户集合训练得到的训练后推广模型可以准确找到对推广内容感兴趣的用户,提高内容推广效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的内容推广方法的场景示意图;
图2是本申请实施例提供的内容推广方法的流程图;
图3是本申请实施例提供的优化候选正类用户集合的流程图;
图4是本申请实施例提供的内容推广方法的阶段示意图;
图5是本申请实施例提供的内容推广方法的另一流程图;
图6本申请实施例提供的服务器采集的用户数据的示意图;
图7是本申请实施例提供的获取用户集合的流程图;
图8是本申请实施例提供的优化候选正类用户集合的另一流程图;
图9是本申请实施例提供的推广模型的结构示意图;
图10是本申请实施例提供的另一推广模型的结构示意图;
图11是本申请实施例提供的内容推广装置示意图;
图12是本申请实施例提供的服务器的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种内容推广方法、装置、计算机设备和存储介质。该内容推广装置可以集成在计算机设备中,该计算机设备可以是服务器等设备,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
云计算(cloud computing)指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需资源;广义云计算指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需服务。这种服务可以是IT和软件、互联网相关,也可是其他服务。云计算是网格计算(Grid Computing)、分布式计算(Distributed Computing)、并行计算(Parallel Computing)、效用计算(Utility Computing)、网络存储(Network StorageTechnologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机和网络技术发展融合的产物。
随着互联网、实时数据流、连接设备多样化的发展,以及搜索服务、社会网络、移动商务和开放协作等需求的推动,云计算迅速发展起来。不同于以往的并行分布式计算,云计算的产生从理念上将推动整个互联网模式、企业管理模式发生革命性的变革。
云存储(cloud storage)是在云计算概念上延伸和发展出来的一个新的概念,分布式云存储系统(以下简称存储系统)是指通过集群应用、网格技术以及分布存储文件系统等功能,将网络中大量各种不同类型的存储设备(存储设备也称之为存储节点)通过应用软件或应用接口集合起来协同工作,共同对外提供数据存储和业务访问功能的一个存储系统。
目前,存储系统的存储方法为:创建逻辑卷,在创建逻辑卷时,就为每个逻辑卷分配物理存储空间,该物理存储空间可能是某个存储设备或者某几个存储设备的磁盘组成。客户端在某一逻辑卷上存储数据,也就是将数据存储在文件系统上,文件系统将数据分成许多部分,每一部分是一个对象,对象不仅包含数据而且还包含数据标识(ID,ID entity)等额外的信息,文件系统将每个对象分别写入该逻辑卷的物理存储空间,且文件系统会记录每个对象的存储位置信息,从而当客户端请求访问数据时,文件系统能够根据每个对象的存储位置信息让客户端对数据进行访问。
存储系统为逻辑卷分配物理存储空间的过程,具体为:按照对存储于逻辑卷的对象的容量估量(该估量往往相对于实际要存储的对象的容量有很大余量)和独立冗余磁盘阵列(RAID,Redundant Array of Independent Disk)的组别,预先将物理存储空间划分成分条,一个逻辑卷可以理解为一个分条,从而为逻辑卷分配了物理存储空间。
例如,如图1所示,服务器获取用户集合,用户集合包括候选正类用户集合、负类用户集合以及参考用户集合;然后,基于候选正类用户集合和参考用户集合对初始分类模型进行训练,得到训练后分类模型通过训练后分类模型候选正类用户集合进行优化,得到正类用户集合;基于正类用户集合和负类用户集合对初始推广模型进行训练,得到训练后推广模型;最后,通过训练后推广模型对用户集合进行筛选,得到目标用户,向目标用户对应的终端推广内容。实现了通过对获取的候选正类用户集合进行优化,得到正类用户集合,根据优化后的正类用户集合训练得到的训练后推广模型可以准确找到对推广内容感兴趣的用户,提高内容推广效果。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本实施例将从内容推广装置的角度进行描述,该内容推广装置具体可以集成在计算机设备中,该计算机设备可以是服务器。
如图2所示,提供了一种内容推广方法,该内容推广方法可以由服务器执行,具体流程可以如下:
101、获取用户集合,用户集合包括候选正类用户集合、负类用户集合以及参考用户集合。
其中,用户集合可以包括至少一个用户,需要说明的是用户可以是用户身份标识(Identity document,ID)或者用户昵称等,即用户可以是在一个应用软件或者多个应用软件内进行注册得到的用户ID,或者是注册时设置的昵称。
其中,用户集合的用户数量可以远大于正类用户集合的用户数量,也可以远大于负类用户集合的用户数量。
理论上,候选正类用户集合可以包括至少一个对推广内容感兴趣的可能性较高的用户,比如,具体可以根据用户的行为进行判断用户是否对推广内容感兴趣和用户对推广内容的感兴趣的可能性;负类用户集合可以包括至少一个对推广内容感兴趣的可能性低于候选正类用户的用户;参考用户集合可以包括至少一个对推广内容感兴趣的可能性高于候选正类用户的用户;即不同的用户对推广内容感兴趣的可能性为:参考用户>正类用户>负类用户。
比如,具体可以是按照预设筛选条件从用户集合中进行筛选,获得候选正类用户集合、负类用户集合、以及参考用户集合,也可以从终端获取,即由需要进行内容推广的内容推广方提供。即步骤“获取用户集合”具体可以是:
获取内容推广请求,内容推广请求携带标识信息和预设参数;
若标识信息为目标标识,则获取终端发送的用户集合;
若标识信息不为目标标识,则根据预设参数从数据库中获取用户集合。
其中,内容推广请求可以通过对终端上应用软件的相关控件进行操作,比如点击触发,内容推广请求可以携带用户集合,相关控件的形式可以有多种,比如按钮、图标等。
其中,标识信息可以用于标识内容推广请求是否携带用户集合。
其中,预设参数可以用于从数据库中筛选得到用户集合。
比如,具体可以是获取内容推广请求,若内容推广请求携带用户集合,则获取终端发送用户集合,包括获取正类用户集合、负类用户集合和指导用户集合;若内容推广请求没有携带用户集合,则根据预设参数从数据库中获取用户集合,比如,可以是从数据库中获取连续登录应用软件天数大于m,且在应用软件付费超过n元的用户作为候选正类用户集合,从用户集合中选择k名用户作为负类用户集合,或者是从用户集合中除了候选正类用户集合的用户中随机选择一定数量的用户作为负类用户集合,比如随机选择k个用户形成负类用户集合。
其中,预设参数的数量、数值以及形式可以根据应用场景进行灵活设置,可以是内容推广方在终端上的相关位置进行设置,也可以是提供内容推广服务方(也可以称为提供商)的运营人员在终端上根据应用需要进行设置,还可以是提供商的开发人员在计算机程序中预先进行设置。
102、基于候选正类用户集合和参考用户集合对初始分类模型进行训练,得到训练后分类模型。
其中,初始分类模型可以是基于机器学习的分类器,初始分类模型可以用于从候选正类集合中筛选出正类用户集合。
比如,具体可以是,将候选正类用户集合作为负样本,将参考用户集合作为正样本,即候选正类用户集合和参考用户集合可以携带目标分类预测结果,对初始分类模型在监督下进行迭代训练,直到初始分类模型输出的分类预测结果和目标分类预测结果之间的误差小于第一设定值,或者迭代训练次数达到第二设定值。
迭代训练可以是通过初始分类模型对输入的用户(候选正类用户或者参考用户)进行预测,得到分类预测结果,分类预测结果可以是该用户为正样本的概率;利用损失函数计算分类预测结果和目标分类预测结果之间的误差,对分类预测结果和目标分类预测结果进行收敛,通过反向传播不断对初始分类模型的权重参数进行调整,使得下一次模型输出的分类预测结果和目标分类预测结果之间的误差减少。
其中,第一设定值和第二设定值均可以根据实际应用需要进行灵活设置。
在一实施例中,若候选正类用户集合足够优质,即对推广内容感兴趣的可能性比较高,则不需要通过训练后分类模型对候选正类用户集合进行筛选,相当于不需要对初始分类模型进行训练。因此,可以计算候选正类用户的匹配值,根据匹配值确定是否要对候选正类用户集合进行优化,即步骤“基于候选正类用户集合和参考用户集合对初始分类模型进行训练,得到训练后分类模型”,包括:
获取候选正类用户的行为信息,根据行为信息确定候选正类用户集合的匹配值;
若匹配值小于预设阈值,则基于候选正类用户集合和参考用户集合对初始分类模型进行训练,得到训练后分类模型。
其中,行为信息可以是用户在预设时间段内登录应用软件的天数在应用软件内付费的金额在应用软件停留的时长(使用应用软件的时长)、和/或对历史同类推广内容的操作行为(点击或者点击以及有后续操作)等可以反映用户对推广内容感兴趣的可能性的行为。
其中,匹配值可以用于衡量候选正类用户集合与用户集合对推广内容感兴趣的可能性的差距。
比如,具体可以是获取候选正类用户集合中每个候选正类用户在一个月内登录应用软件的天数、付费金额、以及停留时长,计算候选正类用户集合平均每个候选正类用户在一个月内登录应用软件的天数、付费金额、以及停留时长。
获取用户集合中每个用户在一个月内登录应用软件的天数、付费金额、以及停留时长,计算用户集合平均每个用户在一个月内登录应用软件的天数、付费金额、以及停留时长。
分别计算候选正类用户集合与用户集合天数、付费金额以及停留时长的比值,然后计算三个比值的平均值,并将该平均值作为匹配值。
若匹配值小于预设阈值,比如1,证明候选正类用户集合在活跃能力、付费能力、以及对应用软件的喜爱程度上不如整个用户集合,即候选正类用户集合对推广内容感兴趣的可能性低于用户集合,从用户集合中筛选得到的与候选正类用户相似的用户对推广内容感兴趣的可能性并不高,并不能达到预期的推广效果。因此,需要对候选正类用户集合进行优化,即需要对初始分类模型进行训练。
若匹配值大于预设阈值,比如1,证明候选正类用户集合在活跃能力、付费能力、以及对应用软件的喜爱程度上优于整个用户集合,因此,可以不对候选正类用户集合进行优化,将候选正类用户集合作为正类用户集合。
其中,预设阈值可以根据实际内容推广的目标和所要达到的效果进行灵活设置,可以是大于1或者小于1的任何数值。
其中,活跃能力可以是指用户登录应用软件并进行相关操作的频率。
可选的,为提高了对初始分类模型的训练速度和训练效果,可以将参考用户集合中的部分参考用户和候选正类用户集合作为初始分类模型训练的负样本,增加模型训练的干扰因素,以提高模型训练的准确度,即步骤“基于候选正类用户集合和参考用户集合对初始分类模型进行训练,得到训练后分类模型”,包括:
将参考用户集合分为第一参考用户集合和第二参考用户集合;
将第一参考用户集合作为正样本,第二参考用户集合和候选正类用户集合作为负样本对初始分类模型进行训练,得到训练后分类模型。
其中,可以根据一定比例将参考用户集合分为第一参考用户集合和第二参考用户集合。
比如,具体可以是按照比例9:1将参考用户集合中的参考用户分为第一参考用户集合和第二参考用户集合,即第一参考用户集合中的参考用户数量和第二参考用户集合中的参考用户数量的比值为9。
将第一参考用户集合作为正样本,将第二参考用户集合和候选正类用户集合作为负样本,对分类模型进行训练,迭代训练过程同上,在此不做赘述。
103、通过训练后分类模型对候选正类用户集合进行优化,得到正类用户集合。
比如,具体可以是通过训练后分类模型计算候选正类用户集合中每个候选正类用户的为正样本的概率值,从候选正类用户集合中筛选出概率值大于预设值的候选正类用户,形成正类用户集合。
在一实施例中,可以对从候选正类用户集合中筛选出的候选正类用户再次进行筛选,以得到更加优质的正类用户集合,即循环执行步骤102:对初始分类模型进行训练,以及步骤103:通过训练后分类模型对候选正类用户进行优化,即步骤“通过训练后分类模型候选正类用户集合进行优化,得到正类用户集合”,包括:
通过训练后分类模型计算候选正类用户集合中每个候选正类用户为目标正类用户的概率值;
从候选正类用户集合中筛选出概率值大于预设概率阈值的候选正类用户,得到目标候选正类用户集合;
将目标候选正类用户集合作为候选正类用户集合,返回执行基于候选正类用户集合和参考用户集合对初始分类模型进行训练,得到训练后分类模型,通过训练后分类模型计算候选正类用户集合中每个候选正类用户为目标正类用户的概率值,从候选正类用户集合中筛选出概率值大于预设概率阈值的候选正类用户的操作,直至训练迭代次数或筛选得到的目标候选正类用户集合符合预设条件,得到正类用户集合。
其中,目标正类用户可以是与初始分类模型训练时作为正样本的参考用户集合相似的用户。
比如,具体可以是如图3所示,通过训练后分类模型计算候选正类用户集合中每个候选正类用户为目标正类用户的概率值,将候选正类用户集合中概率值大于预设阈值的候选正类用户筛选出来,得到目标候选正类用户集合,将得到目标候选正类用户集合作为候选正类用户集合,并继续对新得到的候选正类用户集合进行优化,直到该过程的迭代次数满足预设次数。或者当筛选得到的目标候选正类用户集合的数量小于预设数量时,结束循环过程,得到正类用户集合。
104、基于正类用户集合和负类用户集合对初始推广模型进行训练,得到训练后推广模型。
其中,初始推广模型可以通过训练得到训练后推广模型,训练后推广模型可以用于从用户集合中找到与正类用户集合中的正类用户相似的用户,即找到目标用户。
比如,具体可以是正类用户集合作为正样本,负类用户集合作为负样本,通过初始推广模型对输入的用户(正类用户或者负类用户)进行预测,并根据输出的结果对初始推广模型进行收敛,得到训练后推广模型,即步骤“基于正类用户集合和负类用户集合对初始推广模型进行训练,得到训练后推广模型”,包括:
通过初始推广模型对正类用户集合和负类用户集合进行预测,得到预测结果;
基于损失函数将预测结果和目标预测结果进行收敛,以得到训练后推广模型。
其中,损失函数可以用于计算预测结果与目标预测结果的差距,损失函数可以是均方误差函数、均方根误差函数、平均绝对误差函数、或者是交叉熵损失函数,也可以是其他在此没有列举的损失函数。
比如,具体可以是通过初始推广模型对输入的用户(正类用户或者负类用户)进行预测,得到预测结果,预测结果可以是该用户为正样本的概率值;利用损失函数计算预测结果和目标预测结果之间的误差,对预测结果和目标预测结果进行收敛,并通过反向传播不断对初始推广模型的权重进行调整,使得下一次模型输出的预测结果和目标预测结果之间的误差减少。
可以理解的是,可以根据需要选择损失函数,在此不做限制。
在一实施例中,初始推广模型可以包括多个初始推广模型,可以根据内容推广场景选择合适的初始推广模型找到目标用户。即步骤“基于正类用户集合和负类用户集合对初始推广模型进行训练,得到训练后推广模型”,包括:
从多个初始推广模型中选择与模型参数匹配的初始推广模型,得到目标初始推广模型;
基于正类用户集合和负类用户集合对目标初始推广模型进行训练,得到训练后推广模型。
其中,模型参数可以由终端发送的内容推广请求携带,模型参数与初始推广模型之间有对应关系,即服务器可以根据模型参数确定目标初始推广模型。
其中,初始模型可以包括嵌入向量模型(也可以称为embedding模型)、行为序列模型(Behavior Sequence Transformer,BST)、梯度提升决策树模型(Gradient BoostingDecision Tree,GBDT)、以及XGboost模型等,以上列举的模型可以通过用户集合中的用户对应的行为特征,比如消费、登录等行为特征,和/或用户的用户画像,比如用户的年龄、性别和所在城市等,找到与正类用户集合相似的目标用户。
需要说明的是,初始推广模型除了以上列举的模型之外,还可以包括其他同样可以从用户集合中筛选出目标用户的模型,在此不做限制。
比如,具体可以是内容推广方在终端上的相应位置选择合适的模型,并触发内容推广请求,服务器接收到该内容推广请求后,根据内容推广请求携带的模型参数选择与模型参数匹配的初始推广模型,得到目标初始推广模型。
105、通过训练后推广模型对用户集合进行筛选,得到目标用户,向目标用户对应的终端推广内容。
其中,目标用户为与正类用户集合的正类用户相似的用户,即对推广内容感兴趣的可能性较高的用户。
其中,内容可以是广告、文章和图片等形式。
比如,具体可以是通过训练后推广模型预测用户集合中的用户为正类用户的概率,根据概率从用户集合中筛选得到目标用户,比如可以是通过训练后推广模型得到用户集合中的用户的用户特征向量,计算该用户特征向量与正类用户的用户特征向量之间的距离,根据距离得到用户为正类用户的概率,基于概率对用户集合进行筛选,得到目标用户。
筛选得到目标用户后,向目标用户所属终端推广内容。
可选的,将得到的目标用户进行保存,当广告商在终端上对内容推广进行确认操作时,将内容向保存的目标用户进行推广。
本申请实施例采用获取用户集合,用户集合包括候选正类用户集合、负类用户集合以及参考用户集合;然后,基于候选正类用户集合和参考用户集合对初始分类模型进行训练,得到训练后分类模型;通过训练后分类模型对候选正类用户集合进行优化,得到正类用户集合;基于正类用户集合和负类用户集合对初始推广模型进行训练,得到训练后推广模型;最后,通过训练后推广模型对用户集合进行筛选,得到目标用户,向目标用户对应的终端推广内容。本申请实施例通过对获取的候选正类用户集合进行优化,得到正类用户集合,根据优化后的正类用户集合训练得到的训练后推广模型可以准确找到对推广内容感兴趣的用户,提高内容推广效果。
在上述实施例的基础上,下面将以推广游戏广告举例做进一步详细说明。
本实施例将从内容推广装置的角度,该内容推广装置具体可以集成在计算机设备中,该计算机设备可以是服务器等设备。
在本申请实施例中,如图4所示,内容推广方法可以包括四个阶段:数据采集阶段、选取以及优化候选正类用户集合阶段、游戏广告推广阶段、以及效果统计阶段。
本申请实施例提供的一种内容推广方法,该方法可以由服务器执行,如图5所示,该内容推广方法的具体流程可以如下:
阶段1:数据采集阶段。
服务器收集用户的游戏行为,比如可以通过游戏平台收集不同用户在不同游戏应用的注册和登录行为,收集不同用户在不同游戏应用中的付费行为,比如付费金额,并如图6(a)和图6(b)所示,将收集到的注册和登录行为、付费行为分别进行整理,并存储至数据库中。
其中,游戏平台可以为在平台上进行注册游戏应用分配一个唯一标识该游戏的游戏标识,也可称为游戏ID,并为游戏应用提供公共组件和服务库。
其中,数据库还可以存储用户画像(比如年龄、性别和地域等)、游戏ID和品类,还可以是包括通过embedding模型得到的用户特征向量和游戏特征向量。
阶段2:选取和优化候选正类用户集合阶段。
201、服务器获取终端发送的内容推广请求。
其中,内容推广请求可以是广告主,即上一个实施例中提到的内容推广方在其所属的终端上通过相关控件触发,内容推广请求可以携带用户集合,即终端发送的内容推广请求有指定用户集合。
比如,具体可以是如图5所示,以游戏广告推广的目的为吸引未注册该游戏应用软件的用户进行注册(即图5中的拉新),和吸引已注册,但有一段时间没有登录游戏应用的用户,回归游戏(即图5中的拉回流)为例,进行详细说明。
其中,排除用户集合为不符合游戏广告推广目的的用户,比如,推广目的为吸引为注册用户进行注册,已注册用户即为不符合游戏广告推广目的的用户;候选用户集合可以是训练后推广模型从中找到目标用户的集合。
如果游戏广告推广的目的是拉新,即图5流程的左分支,若有指定候选正类用户集合,则服务器获取终端发送的对应的候选正类用户集合;若没有指定候选正类用户集合,则根据预设参数获取候选正类用户集合,比如广告主可以在终端上进行设置从数据库中筛选出用户集合的预设参数k和参数p,或者由提供商的开发人员在计算机程序中预先设置参数k和参数p,服务器根据预设参数从数据库中获取候选正类用户集合,比如从数据库中获取新注册、以及登录天数>k以及付费>p元的用户作为候选正类用户结合。
若有指定排除用户集合,则服务器获取终端发送的对应的排除用户集合;若没有指定排除用户集合,则从数据库中筛选出已进行注册的用户,生成排除用户集合。
若有指定负类用户集合,则服务器获取终端发送的对应的负类用户集合;若没有指定负类用户集合,则从数据库中去除候选正类用户集合和排除用户集合的用户中选出一定数量的用户,作为负类用户集合。负类用户集合的数量可以实际需要进行灵活设置,或者根据候选正类用户集合的数量进行设置。
若有指定候选用户集合,则服务器获取终端发送的对应的候选用户集合;若没有指定候选用户集合,则获取数据库中去除候选正类用户集合的所有用户,从而得到候选用户集合。
最后,输出候选正类用户集合、负类用户集合和候选用户集合。
内容推广的目的为拉回流,即图5的右分支,具体步骤可以参考拉新的流程,在此不做赘述,最后输出候选正类用户集合、负类用户集合和候选用户集合。
其中,用户可以指定多个候选正类用户集合。
可选的,还可以利用正样本无标签学习(Positive-unlabeled learning,PULearning)从数据库中去除候选正类用户集合和排除用户集合的用户中抽取出一定数量无偏负的用户,作为负类用户集合。
202、服务器对候选正类用户集合进行优化,得到正类用户集合。
比如,具体可以是如图5所示,服务器对候选正类用户集合进行打分,即计算候选正类用户集合的匹配值,比如可以获取候选正类用户的行为信息:过去3个月内的付费的金额,过去3个月活跃过的游戏款数,过去3个月登录过游戏且有操作行为的天数,计算候选正类用户集合的人均过去3个月内的付费的金额,过去3个月活跃过的游戏款数,过去3个月登录过游戏且有操作行为的天数;计算用户集合的人均过去3个月内的付费的金额,过去3个月活跃过的游戏款数,过去3个月登录过游戏且有操作行为的天数;分别计算候选正类用户集合和用户集合人均过去3个月内的付费的金额、人均过去3个月活跃过的游戏款数和人均过去3个月登录过游戏且有操作行为的天数的比值,再计算三个比值的平均值,以该平均值为候选正类用户集合的匹配值。
其中,活跃可以是指用户登录游戏应用并进行至少一局游戏,活跃可以根据实际应用场景需要进行定义。
其中匹配值可以用于衡量候选正类用户集合与用户集合在付费能力、活跃能力和对新游戏的好奇程度上的差距,即候选正类用户能被广告游戏吸引的可能性与用户集合能被游戏广告吸引的可能性的差距,预设阈值可以为1,如果匹配值等于1,则相当于游戏广告吸引二者的可能性相当,候选正类用户集合不足以代表能被游戏广告吸引的用户,需要对其进行优化。
可选的,可以将三个比值的平均值减去1,作为匹配值,预设阈值可以是0,匹配值等于0,表示游戏广告吸引二者的可能性相当;匹配值大于0,表示候选正类用户集合被游戏广告吸引的可能性大于用户集合;匹配值小于0,表示游戏广告吸引用户集合的可能性大于候选正类用户集合。
可选的,预设阈值可以根据游戏广告推广的成本和/或所要推广的范围进行灵活设置。
如果分数大于预设阈值,则不需要对候选正类用户集合进行优化,服务器将候选正类用户集合作为正类用户集合输出。
如果分数小于预设阈值,则获取参考用户集合,可以是获取终端发送的参考用户集合,也可以是从用户集合中获取参考用户集合。
在一实施例中,若候选正类用户集合的匹配值小于预设阈值,则服务器向终端发送获取参考用户集合请求,并接收终端针对该获取参考用户集合请求返回的信息,服务器根据该信息获取参考用户集合。比如,该信息携带参考用户集合,即有指定参考用户集合;如果没有指定参考用户集合,则按照预设规则从用户集合中获取参考用户集合,预设规则可以根据游戏广告的推广目的进行灵活设置,比如筛选出活跃天数>m,且付费金额>n的用户作为参考用户集合。
可选的,服务器获取参考用户集合可以是在获取广告主在终端上触发内容推广请求,若内容推广请求写携带参考用户集合,即有指定参考用户集合,则不需要再获取参考用户集合;若没有携带参考用户集合,则按照预设规则从用户集合中获取参考用户集合
需要说明的是相比候选正类用户集合,参考用户集合被游戏广告吸引的可能性更大。
服务器将获取的参考用户集合B按一定比例分为第一参考用户集合B1和第二参考用户集合B2;将第一参考用户集合B1作为正样本,第二参考用户集合B2和候选正类用户集合A作为负样本对初始分类模型进行迭代训练,得到训练后分类模型。
通过训练后分类模型计算候选正类用户集合中每个候选正类用户为目标正类用户的概率值,将候选正类用户集合中概率值大于预设阈值的候选正类用户筛选出来,得到目标候选正类用户集合,将得到目标候选正类用户集合作为候选正类用户集合,并继续对获得的候选正类用户集合进行优化,直到该过程的迭代次数满足预设次数,将得到的目标候选正类用户集合,即候选正类用户集合作为正类用户集合输出。
可选的,可以计算第二参考用户集合的平均概率值,将该平均概率值作为预设阈值对候选正类用户集合进行筛选,得到目标候选正类用户集合。
在一实施例中,如图7所示的步骤“迭代次数达到预设次数”可以替换为“候选正类用户集合匹配值是否大于预设阈值”;步骤“选取概率值大于预设值的候选正类用户,得到目标候选正类用户”之后,可以增加步骤“计算目标候选正类用户集合的匹配值”。
若匹配值小于预设阈值,则执行步骤“将B分为B1和B2,B1为正样本,B2与A为负样本”,以及之后的其他步骤;若匹配值大于预设阈值,则执行步骤“将候选正类用户集合候选正类用户集合作为正类用户集合输出”,然后结束该循环过程。
阶段3:游戏广告推广阶段。
203、服务器根据模型参数选择目标初始推广模型。
比如,具体可以是广告主在提供商提供的平台上选择目标初始推广模型,终端根据广告主的操作向服务器发送相应的模型参数,服务器根据终端发送的模型参数从多个初始推广模型中选择与模型参数匹配的初始推广模型,得到目标初始推广模型。
204、服务器基于正类用户集合和负类用户集合对目标初始推广模型进行训练,得到训练后推广模型。
若目标初始推广模型为embedding模型,如图9所示,将用户特征和游戏特征作为输入,用户特征可以从数据库中获取正类用户集合和负类用户集合的特征从而得到用户特征,游戏特征可以从预先存储的各个游戏的特征的数据库中获取。
用户特征可以包括用户在一段预设时间内每款游戏的付费行为、活跃行为以及注册行为、用户画像(比如年龄、性别和地域等)等;游戏特征可以包括游戏ID和品类等。
其中,品类为游戏类型,游戏可以分为多种类型,品类表示该游戏属于多种类型中的某一种,可以用品类ID来表示该类型。
由于embedding模型输出为预测用户是否注册、是否活跃、是否付费以及是否流失,因此需将用户特征中和输入的游戏特征有关的特征删除,即图8中的“剪枝”,否则初始推广模型可以根据用户特征中关于该游戏的特征直接输出预测结果,剪枝后的用户特征和游戏特征通过嵌入层得到用户特征向量和游戏特征向量,并将用户特征向量和游戏特征向量进行拼接(concat),得到拼接用户游戏特征向量。
将拼接用户游戏特征向量输入多任务学习层(Multi-gate Mixture-of-Experts,MMoE),MMoE层用于构建单个模型来同时学习多个目标和任务,每个expert网络可以认为是一个神经网络,将Expert网络的输出传入Gating网络对Expert网络的输出进行组合,然后输出组合结果,具体来说gating网络产生n个expert网路的概率分布,最终的输出是所有expert网络的加权和。
将gate输出的结果输入到任务层中各自的任务网络中,由于任务(注册、活跃、付费以及流失)之间的依赖关系,比如注册才有活跃的可能性,注册才能流失,任务网络之间存在级联结构。
最后在输出层中输出结果为用户在目标游戏上是否注册、是否活跃、是否付费以及是否流失。
在损失层通过损失函数对embedding模型进行收敛,损失函数可以是注册、注册且活跃、注册且付费以及注册且流失的对数损失之和,基于损失函数调整输入层中得到用户特征过程中赋予每个特征的权重,以得到进行预测时可以得到更加准确的预测结果的用户特征。
若目标推广初始模型为行为序列模型(Behavior Sequence Transformer,BST),如图10所示,通过嵌入层对输入用户画像(比如年龄、性别和地域等)进行处理,得到多个特征向量,并对特征向量进行拼接,得到用户画像向量。
获取用户过去活跃100次的游戏序列、过去付费20次的游戏序列、和过去注册20次的游戏序列。具体方法可以是获取用户过去活跃100次的游戏的游戏特征,以及位置编码,即得到图10中的活跃行为序列(100)。
其中,游戏特征可以包括游戏ID和品类ID,位置编码表示该游戏出现在游戏序列中的位置,游戏特征和位置编码可以是向量形式。
对游戏特征和位置编码进行拼接,得到拼接游戏向量,通过变换层(transform)得到该游戏的游戏变换特征向量,游戏变换特征向量可以表示该游戏的游戏ID、品类ID和位置编码,但不同于对两个向量的简单拼接。将得到的活跃行为序列中每个游戏的游戏变换特征向量通过池化层(sum pooling)进行降维处理,得到一个活跃行为向量。
付费行为序列(20)和注册行为序列(20)的获取方法跟活跃行为序列(100)一样,在此不做赘述。
分别通过对付费行为序列(20)和注册行为序列(20)的游戏特征和位置编码进行拼接、变换和池化处理,可以得到付费行为向量和注册行为向量。
将活跃行为向量、付费行为向量、注册行为向量、用户画像向量和历史数值特征进行拼接,得到用户行为向量,将用户行为向量输入深度神经网络模型进行训练,预测用户为正类用户的概率,并基于损失函数对预测结果和实际结果进行收敛,根据收敛得到的结果通过反向传播调整深度神经网络模型的权重。基于以上过程,对BST模型进行迭代训练,得到训练后推广模型。
其中,位置编码为该游戏在游戏序列所在位置的识别信息。
其中,历史数值特征可以是数据库中存储的用户在过去90天内活跃的天数、付费的金额等。
205、服务器通过训练后推广模型对候选用户集合进行筛选,得到目标用户,向目标用户推广内容。
比如,具体可以是根据选择的目标初始推广模型获取候选用户相应的特征,比如选择的是embedding模型,获取用户特征,并通过嵌入层得到用户特征向量,根据该特征向量判断该候选用户是否为目标用户。若选择的是BST模型,获取用户画像、活跃行为序列(100)、付费行为序列(20)和注册行为序列(20),并将获取的数据输入训练后BST模型进行预测,得到预测结果,根据预测结果确定候选用户是否为目标用户。
其中,预测结果可以是候选用户为正类用户的概率值,从候选用户集合中筛选概率值大于设定值的用户,作为目标用户,并向目标用户所属终端推广游戏广告。
在一实施例中,可以预先根据投放广告的需求,比如拉新、拉回流或者拉活跃,从数据库中依据预设规则获取候选正类用户集合(可作为正类用户集合),负类用户集合和候选用户集合,将正类用户集合和负类用户集合输入初始推广模型进行训练,得到训练后推广模型。通过该训练后推广模型对候选用户集合进行筛选,得到目标用户,并将目标用户进行保存。
当服务器获取到终端发送的推广请求时,根据推广请求的推广目的,从数据库中保存的目标用户中获取与推广目的对应的目标用户,向目标用户推广内容。
具体过程参考实施例中的说明,在此不做赘述。
阶段4:效果统计阶段。
在游戏广告的推广过程中,通过终端记录用户对推广的游戏广告的操作行为,比如点击以及后续的转化信息,比如注册和登录等,并进行整理分析,得到游戏广告的推广效果。
本申请实施例通过服务器获取终端发送的内容推广请求,对候选正类用户集合进行优化,得到正类用户集合,服务器根据模型参数选择目标初始推广模型,基于正类用户集合和负类用户集合对目标初始推广模型进行训练,得到训练后推广模型,通过训练后推广模型对候选用户集合进行筛选,得到目标用户,向目标用户推广内容。本申请实施例通过对获取的候选正类用户集合进行优化,得到正类用户集合,根据优化后的正类用户集合训练得到的训练后推广模型可以准确找到对推广内容感兴趣的用户,提高内容推广效果。
为了更好地实施以上方法,本申请实施例还提供一种内容推广装置,其中名词的含义与上述内容推广方法中相同,具体实现细节可以参考方法实施例中的说明。如图11所示,该内容推广装置可以包括获取单元301、第一训练单元302、优化单元303、第二训练单元304、以及筛选单元305,具体如下:
(1)获取单元301,用于获取用户集合,用户集合包括候选正类用户集合、负类用户集合以及参考用户集合。
比如,具体可以是按照预设筛选条件从用户集合中进行筛选,获得候选正类用户集合、负类用户集合、以及参考用户集合,也可以从终端获取,即由需要进行内容推广的内容推广方提供。
在一实施例中,获取单元301可以包括标识子单元,标识子单元可以用户根据标识信息获取用户集合,具体地,标识子单元可以用于:
获取内容推广请求,内容推广请求携带标识信息和预设参数,
若标识信息为目标标识,则获取终端发送的用户集合;
若标识信息不为目标标识,则根据预设参数从数据库中获取用户集合。
比如,具体可以是获取内容推广请求,若内容推广请求携带用户集合,则获取终端发送正类用户集合、负类用户集合和指导用户集合;若内容推广请求没有携带用户集合,则根据预设参数从数据库中获取用户集合,比如,可以是从数据库中的用户集合中获取连续登录应用软件天数大于m,且在应用软件付费超过n元的用户作为正类用户集合,从用户集合中选择k名用户作为负类用户集合,或者是从用户集合中除了候选用户集合的用户中随机选择一定数量的用户作为负类用户集合,比如随机选择k个用户形成负类用户集合。
(2)第一训练单元302,用于基于候选正类用户集合和参考用户集合对初始分类模型进行训练,得到训练后分类模型。
比如,具体可以是,将候选正类用户集合作为负样本,将参考用户集合作为正样本,即候选正类用户集合和参考用户集合可以携带目标预测结果,对初始分类模型在监督下进行迭代训练,直到初始分类模型输出的预测结果和目标预测结果之间的误差小于第一设定值,或者迭代训练次数达到第二设定值。
可选的,第一训练单元302可以包括行为子单元,行为子单元用于根据候选正类用户的行为信息,对候选正类用户集合进行优化,具体地,行为子单元可以用于:
获取候选正类用户的行为信息,根据行为信息确定候选正类用户集合的匹配值;
若匹配值小于预设阈值,则基于候选正类用户集合和参考用户集合对初始分类模型进行训练,得到训练后分类模型。
比如,具体可以是获取候选正类用户集合中每个候选正类用户在一个月内登录应用软件的天数、付费金额、以及停留时长,计算候选正类用户集合平均每个候选正类用户在一个月内登录应用软件的天数、付费金额、以及停留时长。
获取用户集合中每个用户在一个月内登录应用软件的天数、付费金额、以及停留时长,计算用户集合平均每个用户在一个月内登录应用软件的天数、付费金额、以及停留时长。
分别计算候选正类用户集合与用户集合天数、付费金额以及停留时长的比值,然后计算三个比值的平均值,并将该平均值作为匹配值。
若匹配值小于预设阈值,比如1,证明候选正类用户集合在活跃能力(可以通过登录天数反应)、付费能力、以及对应用软件的喜爱程度上不如整个用户集合,因此,需要对候选正类用户集合进行优化,即需要对初始分类模型进行训练。
若匹配值大于预设阈值,比如1,证明候选正类用户集合在活跃能力(可以通过登录天数反应)、付费能力、以及对应用软件的喜爱程度上优于整个用户集合,因此,可以不对候选正类用户集合进行优化,将候选正类用户集合作为正类用户集合。
可选的,第一训练单元302可以包括参考子单元,用于将参考用户集合中的部分参考用户和候选正类用户集合作为初始分类模型训练的负样本,以提高模型训练的准确度,具体地,参考子单元可以用于:
将参考用户集合分为第一参考用户集合和第二参考用户集合;
将第一参考用户集合作为正样本,第二参考用户集合和候选正类用户集合作为负样本对初始分类模型进行训练,得到训练后分类模型。
(3)优化单元303,用于通过训练后分类模型候选正类用户集合进行优化,得到正类用户集合。
比如,具体可以是通过训练后分类模型计算候选正类用户集合中每个候选正类用户的为正样本的概率值,从候选正类用户集合中筛选出概率值大于预设值的候选正类用户,形成正类用户集合。
在一实施例中,优化单元303可以包括循环子单元,循环子单元用于循环执行步骤:基于候选正类用户集合和参考用户集合对初始分类模型进行训练,得到训练后分类模型,以及步骤:通过训练后分类模型候选正类用户集合进行优化,得到正类用户集合。具体地,循环子单元用于:
通过训练后分类模型计算候选正类用户集合中每个候选正类用户为目标正类用户的概率值;
从候选正类用户集合中筛选出概率值大于预设概率阈值的候选正类用户,得到目标候选正类用户集合;
将目标候选正类用户集合作为候选正类用户集合,返回执行基于候选正类用户集合和参考用户集合对初始分类模型进行训练,得到训练后分类模型,通过训练后分类模型计算候选正类用户集合中每个候选正类用户为目标正类用户的概率值,从候选正类用户集合中筛选出概率值大于预设概率阈值的候选正类用户的操作,直至训练迭代次数或筛选得到的目标候选正类用户集合符合预设条件,得到正类用户集合。
(4)第二训练单元304,用于基于正类用户集合和负类用户集合对初始推广模型进行训练,得到训练后推广模型。
比如,具体可以是正类用户集合作为正样本,负类用户集合作为负样本,通过初始推广模型对输入的用户(正类用户或者负类用户)进行预测,并根据输出的结果对初始推广模型进行收敛,得到训练后推广模型。
可选的,第二训练单元304可以包括收敛子单元,收敛子单元可以用于对预测结果和目标预测结果进行收敛,具体地,收敛子单元可以用于:
通过所述初始推广模型对所述正类用户集合和所述负类用户集合进行预测,得到预测结果;
基于损失函数将所述预测结果和所述目标预测结果进行收敛,以得到训练后推广模型。
比如,具体可以是通过初始推广模型对输入的用户(正类用户或者负类用户)进行预测,得到预测结果,预测结果可以是该用户为正样本的概率值;利用损失函数计算预测结果和目标预测结果之间的误差,对预测结果和目标预测结果进行收敛,通过反向传播不断对初始推广模型的权重进行调整,使得下一次模型输出的预测结果和目标预测结果之间误差减少。
可以理解的是,可以根据需要选择损失函数,在此不做限制。
在一实施例中,第二训练单元304可以包括模型选择子单元,模型选择子单元用于根据模型参数选择目标初始推广模型,具体地,模型选择子单元可以用于:
从多个初始推广模型中选择与模型参数匹配的初始推广模型,得到目标初始推广模型;
基于正类用户集合和负类用户集合对目标初始推广模型进行训练,得到训练后推广模型。
比如,具体可以是内容推广方在终端上的相应位置选择合适的模型,并触发内容推广请求,服务器接收到该内容推广请求后,根据内容推广请求携带的模型参数选择与模型参数匹配的初始推广模型,得到目标初始推广模型。
(5)筛选单元305,用于通过训练后推广模型对用户集合进行筛选,得到目标用户,向目标用户对应的终端推广内容。
比如,具体可以是通过训练后推广模型预测用户集合中的用户为正类用户的概率,根据概率从用户集合中筛选得到目标用户,也可以是通过训练后推广模型得到用户集合中的用户的用户特征向量,计算该用户特征向量与正类用户的用户特征向量之间的距离,根据距离对用户集合进行筛选,得到目标用户。
筛选得到目标用户后,向目标用户所属终端推广内容。
本申请实施例通过获取单元301获取用户集合,用户集合包括候选正类用户集合、负类用户集合以及参考用户集合;然后,由第一训练单元302基于候选正类用户集合和参考用户集合对初始分类模型进行训练,得到训练后分类模型,再由优化单元303通过训练后分类模型对候选正类用户集合进行优化,得到正类用户集合;再通过第二训练单元304基于正类用户集合和负类用户集合对初始推广模型进行训练,得到训练后推广模型;最后,由预测单元305通过训练后推广模型对用户集合进行筛选,得到目标用户,向目标用户对应的终端推广内容。本申请实施例通过对获取的候选正类用户集合进行优化,得到正类用户集合,根据优化后的正类用户集合训练得到的训练后推广模型可以准确找到对推广内容感兴趣的用户,提高内容推广效果。
本申请实施例还提供一种计算机设备,本申请实施例还提供一种计算机设备,该计算机设备可以是服务器,如图12所示,其示出了本申请实施例所涉及的服务器的结构示意图,具体来讲:
该服务器可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图12中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
服务器还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该服务器还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,服务器还可以包括显示单元等,在此不再赘述。具体在本实施例中,服务器中的处理器401会按照如下的指令,将一个或一个以上的计算机程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的计算机程序,从而实现各种功能,如下:
获取用户集合,用户集合包括候选正类用户集合、负类用户集合以及参考用户集合;基于候选正类用户集合和参考用户集合对初始分类模型进行训练,得到训练后分类模型;通过训练后分类模型对候选正类用户集合进行优化,得到正类用户集合;基于正类用户集合和负类用户集合对初始推广模型进行训练,得到训练后推广模型;通过训练后推广模型对用户集合进行筛选,得到目标用户,向目标用户对应的终端推广内容。
以上各个操作的具体实施可参见前面的实施例,在此不作赘述。
由上可知,本实施例的服务器通过获取用户集合,用户集合包括候选正类用户集合、负类用户集合以及参考用户集合;然后,基于候选正类用户集合和参考用户集合对初始分类模型进行训练,得到训练后分类模型通过训练后分类模型候选正类用户集合进行优化,得到正类用户集合;基于正类用户集合和负类用户集合对初始推广模型进行训练,得到训练后推广模型;最后,通过训练后推广模型对用户集合进行筛选,得到目标用户,向目标用户对应的终端推广内容。本申请实施例通过对获取的候选正类用户集合进行优化,得到正类用户集合,根据优化后的正类用户集合训练得到的训练后推广模型可以准确找到对推广内容感兴趣的用户,提高内容推广效果。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过计算机程序来完成,或通过计算机程序控制相关的硬件来完成,该计算机程序可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中各种可选实现方式中提供的方法。
为此,本申请实施例提供一种存储介质,其中存储有计算机程序,该计算机程序被处理器进行加载,以执行本申请实施例所提供的任一种内容推广方法。
以上内容推广方法的各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的计算机程序,可以执行本申请实施例所提供的任一种内容推广方法中的步骤,因此,可以实现本申请实施例所提供的任一种内容推广方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种内容推广方法、装置、计算机设备和存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上该,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种内容推广方法,其特征在于,包括:
获取用户集合,所述用户集合包括候选正类用户集合、负类用户集合以及参考用户集合;
基于所述候选正类用户集合和所述参考用户集合对初始分类模型进行训练,得到训练后分类模型;
通过所述训练后分类模型对所述候选正类用户集合进行优化,得到正类用户集合;
基于所述正类用户集合和所述负类用户集合对初始推广模型进行训练,得到训练后推广模型;
通过所述训练后推广模型对所述用户集合进行筛选,得到目标用户,向所述目标用户对应的终端推广内容。
2.根据权利要求1所述的方法,其特征在于,所述基于所述候选正类用户集合和所述参考用户集合对初始分类模型进行训练,得到训练后分类模型,包括:
获取候选正类用户的行为信息,根据所述行为信息确定所述候选正类用户集合的匹配值;
若所述匹配值小于预设阈值,则基于所述候选正类用户集合和所述参考用户集合对初始分类模型进行训练,得到训练后分类模型。
3.根据权利要求2所述的方法,其特征在于,所述基于所述候选正类用户集合和所述参考用户集合对初始分类模型进行训练,得到训练后分类模型,包括:
将所述参考用户集合分为第一参考用户集合和第二参考用户集合;
将所述第一参考用户集合作为正样本,所述第二参考用户集合和所述候选正类用户集合作为负样本对所述初始分类模型进行训练,得到训练后分类模型。
4.根据权利要求1所述的方法,其特征在于,所述通过所述训练后分类模型所述候选正类用户集合进行优化,得到正类用户集合,包括:
通过所述训练后分类模型计算所述候选正类用户集合中每个候选正类用户为目标正类用户的概率值;
从所述候选正类用户集合中筛选出概率值大于预设概率阈值的候选正类用户,得到目标候选正类用户集合;
将所述目标候选正类用户集合作为所述候选正类用户集合,返回执行基于所述候选正类用户集合和所述参考用户集合对分类模型进行训练,得到训练后分类模型,通过所述训练后分类模型计算所述候选正类用户集合中每个候选正类用户为目标正类用户的概率值,从所述候选正类用户集合中筛选出概率值大于预设概率阈值的候选正类用户的操作,直至训练迭代次数或筛选得到的目标候选正类用户集合符合预设条件,得到正类用户集合。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述获取用户集合,包括:
获取内容推广请求,所述内容推广请求携带标识信息和预设参数;
若所述标识信息为目标标识,则获取终端发送的所述用户集合;
若所述标识信息不为目标标识,则根据所述预设参数从数据库中获取所述用户集合。
6.根据权利要求5所述的方法,其特征在于,所述用户扩散请求携带模型参数,所述初始推广模型包括多个初始推广模型,所述基于所述正类用户集合和所述负类用户集合对初始推广模型进行训练,得到训练后推广模型,包括:
从所述多个初始推广模型中选择与所述模型参数匹配的初始推广模型,得到目标初始推广模型;
基于所述正类用户集合和所述负类用户集合对所述目标初始推广模型进行训练,得到所述训练后推广模型。
7.根据权利要求6所述的方法,其特征在于,所述正类用户集合和所述负类用户集合携带目标预测结果,所述基于所述正类用户集合和所述负类用户集合对初始推广模型进行训练,得到训练后推广模型,包括:
通过所述初始推广模型对所述正类用户集合和所述负类用户集合进行预测,得到预测结果;
基于损失函数将所述预测结果和所述目标预测结果进行收敛,以得到训练后推广模型。
8.一种内容推广装置,其特征在于,包括:
获取单元:用于获取用户集合,所述用户集合包括候选正类用户集合、负类用户集合以及参考用户集合;
第一训练单元:用于基于所述候选正类用户集合和所述参考用户集合对初始分类模型进行训练,得到训练后分类模型;
优化单元:用于通过所述训练后分类模型对所述候选正类用户集合进行优化,得到正类用户集合;
第二训练单元:用于基于所述正类用户集合和所述负类用户集合对初始推广模型进行训练,得到训练后推广模型;
筛选单元:用于通过所述训练后推广模型对所述用户集合进行筛选,得到目标用户,向所述目标用户对应的终端推广内容。
9.一种计算机设备,其特征在于,包括存储器和处理器;所述存储器存储有计算机程序,所述处理器用于运行所述存储器内的计算机程序,以执行权利要求1至7任一项所述的内容推广方法。
10.一种存储介质,其特征在于,所述存储介质用于存储计算机程序,所述计算机程序被处理器加载以执行权利要求1至7任一项所述的内容推广方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110194505.6A CN112818241B (zh) | 2021-02-20 | 2021-02-20 | 一种内容推广方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110194505.6A CN112818241B (zh) | 2021-02-20 | 2021-02-20 | 一种内容推广方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112818241A true CN112818241A (zh) | 2021-05-18 |
CN112818241B CN112818241B (zh) | 2023-09-26 |
Family
ID=75864423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110194505.6A Active CN112818241B (zh) | 2021-02-20 | 2021-02-20 | 一种内容推广方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112818241B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106095916A (zh) * | 2016-06-08 | 2016-11-09 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
CN111973996A (zh) * | 2020-08-20 | 2020-11-24 | 腾讯科技(上海)有限公司 | 一种游戏资源投放方法和装置 |
-
2021
- 2021-02-20 CN CN202110194505.6A patent/CN112818241B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106095916A (zh) * | 2016-06-08 | 2016-11-09 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
CN111973996A (zh) * | 2020-08-20 | 2020-11-24 | 腾讯科技(上海)有限公司 | 一种游戏资源投放方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112818241B (zh) | 2023-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10943171B2 (en) | Sparse neural network training optimization | |
US11132604B2 (en) | Nested machine learning architecture | |
US11144812B2 (en) | Mixed machine learning architecture | |
CN110266745B (zh) | 基于深度网络的信息流推荐方法、装置、设备及存储介质 | |
CN102300012B (zh) | 呼叫中心中的一对一匹配 | |
US20200034701A1 (en) | Dynamic, automated fulfillment of computer-based resource request provisioning using deep reinforcement learning | |
CN105069534A (zh) | 客户流失预测方法以及装置 | |
US10678594B2 (en) | System and method for optimizing resource allocation using GPU | |
CN108549909B (zh) | 基于众包的对象分类方法及对象分类系统 | |
CN110147882A (zh) | 神经网络模型的训练方法、人群扩散方法、装置及设备 | |
US11887013B2 (en) | System and method for facilitating model-based classification of transactions | |
CN114332984B (zh) | 训练数据处理方法、装置和存储介质 | |
CN112380453B (zh) | 物品推荐方法、装置、存储介质及设备 | |
CN113343089A (zh) | 用户召回方法及装置、设备 | |
EP3975075A1 (en) | Runtime estimation for machine learning data processing pipeline | |
CN113010737A (zh) | 一种视频标签的分类方法、装置及存储介质 | |
CN115131052A (zh) | 一种数据处理方法、计算机设备和存储介质 | |
CN112819499A (zh) | 信息发送方法、装置、服务器及存储介质 | |
CN112818241B (zh) | 一种内容推广方法、装置、计算机设备和存储介质 | |
Plastria et al. | Aggregation without loss of optimality in competitive location models | |
WO2021051920A1 (zh) | 模型优化方法、装置、存储介质及设备 | |
Liu et al. | Towards dynamic reconfiguration of composite services via failure estimation of general and domain quality of services | |
CN113469611B (zh) | 一种快递众包配送任务调度方法、系统及设备 | |
US11748063B2 (en) | Intelligent user centric design platform | |
CN114820085B (zh) | 用户筛选方法、相关装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40043493 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |