CN116150471A - 内容的投放控制方法及相关设备 - Google Patents

内容的投放控制方法及相关设备 Download PDF

Info

Publication number
CN116150471A
CN116150471A CN202111402518.4A CN202111402518A CN116150471A CN 116150471 A CN116150471 A CN 116150471A CN 202111402518 A CN202111402518 A CN 202111402518A CN 116150471 A CN116150471 A CN 116150471A
Authority
CN
China
Prior art keywords
content
target
interaction
label
target content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111402518.4A
Other languages
English (en)
Inventor
李少波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202111402518.4A priority Critical patent/CN116150471A/zh
Publication of CN116150471A publication Critical patent/CN116150471A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种内容的投放控制方法及相关设备,包括:获取目标内容的投放反馈数据和投放消耗数据;根据在目标内容的各内容标签下的投放反馈记录和在目标内容的各内容标签下的投放消耗记录,确定目标内容的各内容标签对应的标签质量等级;根据各内容标签对应的标签质量等级,对各内容标签的级别进行调整,得到各内容标签的调整后级别;根据目标内容的全部内容标签的调整后级别,确定过滤阈值;根据过滤阈值和目标内容的质量分数,对目标内容进行投放控制,其中,若目标内容的内容质量分数不低于过滤阈值,则投放目标内容,若目标内容的内容质量分数低于过滤阈值,则将目标内容过滤掉;本方案可以实现灵活调整目标内容的曝光概率。

Description

内容的投放控制方法及相关设备
技术领域
本申请涉及计算机技术领域,更具体地,涉及一种内容的投放控制方法、及相关设备。
背景技术
为了提高用户获取内容的效率,采用面向用户投放与用户所需要的内容相关度较高的内容,从而减少用户进行内容筛选和过滤的时间。相关技术中,内容投放过程存在灵活性低的问题。
发明内容
鉴于上述问题,本申请实施例提出了一种内容的投放控制方法及相关设备,以改善上述问题。
根据本申请实施例的一个方面,提供了一种内容的投放控制方法,包括:获取目标内容的投放反馈数据和投放消耗数据;所述投放反馈数据包括在所述目标内容的各内容标签下的投放反馈记录;所述投放消耗数据包括在所述目标内容的各内容标签下的投放消耗记录;根据在所述目标内容的各内容标签下的投放反馈记录和在所述目标内容的各内容标签下的投放消耗记录,确定所述目标内容的各内容标签对应的标签质量等级;根据各内容标签对应的标签质量等级,对各所述内容标签的级别进行调整,得到各所述内容标签的调整后级别;根据所述目标内容的全部内容标签的调整后级别,确定过滤阈值;根据所述过滤阈值和所述目标内容的质量分数,对所述目标内容进行投放控制,其中,若所述目标内容的内容质量分数不低于所述过滤阈值,则投放所述目标内容,若所述目标内容的内容质量分数低于所述过滤阈值,则将所述目标内容过滤掉。
根据本申请实施例的一个方面,提供了一种内容的投放控制装置,包括:获取模块,用于获取目标内容的投放反馈数据和投放消耗数据;所述投放反馈数据包括在所述目标内容的各内容标签下的投放反馈记录;所述投放消耗数据包括在所述目标内容的各内容标签下的投放消耗记录;标签质量等级确定模块,用于根据在所述目标内容的各内容标签下的投放反馈记录和在所述目标内容的各内容标签下的投放消耗记录,确定所述目标内容的各内容标签对应的标签质量等级;级别调整模块,用于根据各内容标签对应的标签质量等级,对各所述内容标签的级别进行调整,得到各所述内容标签的调整后级别;过滤阈值确定模块,用于根据所述目标内容的全部内容标签的调整后级别,确定过滤阈值;投放控制模块,用于根据所述过滤阈值和所述目标内容的质量分数,对所述目标内容进行投放控制,其中,若所述目标内容的内容质量分数不低于所述过滤阈值,则投放所述目标内容,若所述目标内容的内容质量分数低于所述过滤阈值,则将所述目标内容过滤掉。
在本申请的一些实施例中,标签质量等级确定模块,包括:反馈参数计算单元,用于根据在所述目标内容的各内容标签下的投放反馈记录,计算在所述目标内容的各内容标签下的反馈参数;消耗参数计算单元,用于根据在所述目标内容的各内容标签下的投放消耗记录,计算在所述目标内容的各内容标签下的消耗参数;标签质量等级确定单元,用于根据标签质量等级与反馈参数和与消耗参数之间的对应关系,以及在所述目标内容的各内容标签下的反馈参数和在所述目标内容的各内容标签下的消耗参数,确定所述目标内容的各内容标签对应的标签质量等级。
在本申请的一些实施例中,所述标签质量等级包括优质标签和劣质标签;级别调整模块进一步被配置为:若所述内容标签对应的标签质量等级为优质标签,则降低所述内容标签的级别,得到所述内容标签的调整后级别;若所述内容标签对应的标签质量等级为劣质,则提高所述内容标签的级别,得到所述内容标签的调整后级别。
在本申请的一些实施例中,过滤阈值确定模块,包括:质量分数确定单元,用于根据级别与质量分数之间的对应关系,确定各所述内容标签的调整后级别所对应的质量分数;过滤阈值确定单元,用于在各所述内容标签的调整后级别所对应的质量分数中,确定最小质量分数,将所述最小质量分数确定为所述过滤阈值。
在本申请的一些实施例中,所述目标内容的质量分数包括所述目标内容相对于每一候选用户的质量分数;投放控制模块,包括:互动概率获取单元,用于获取目标候选用户与所述目标内容进行互动的互动概率;质量分数确定单元,用于根据所述互动概率确定所述目标内容相对于所述目标候选用户的质量分数;添加单元,用于若所述目标内容相对于所述目标候选用户的质量分数不低于所述过滤阈值,则若接收到所述目标候选用户发起的内容请求,将所述目标内容发送到所述目标候选用户;过滤单元,用于若所述目标内容相对于所述目标候选用户的质量分数低于所述过滤阈值,则将所述目标内容过滤掉。
在本申请的一些实施例中,内容的投放控制装置,还包括:标签匹配度计算单元,用于计算所述目标内容的内容标签与用户集合中各用户的用户标签之间的标签匹配度;候选用户确定单元,用于将所述标签匹配度超过匹配度阈值的用户确定为所述目标内容的候选用户。
在本申请的一些实施例中,互动概率获取单元,包括:获取单元,用于获取所述目标候选用户的用户信息和所述目标内容的内容信息;互动概率确定单元,用于由互动概率预测模型根据所述目标候选用户的用户信息和所述目标内容的内容信息,输出所述目标候选用户对所述目标内容触发互动行为的互动概率。
在本申请的一些实施例中,所述互动行为包括按照时序由先到后的第一互动行为和第二互动行为;所述互动概率包括第一互动概率和第二互动概率,其中,所述第一互动概率是指触发所述第一互动行为的概率,所述第二互动概率是指触发所述第二互动行为的概率;所述互动概率预测模型包括共享嵌入层、第一子神经网络和第二子神经网络;所述互动概率确定单元,包括:嵌入特征确定单元,用于由所述共享嵌入层根据所述目标候选用户的用户信息和所述目标内容的内容信息,对应生成所述目标候选用户的用户嵌入特征和所述目标内容的内容嵌入特征;第一预测单元,用于由所述第一子神经网络根据所述目标候选用户的用户嵌入特征和所述目标内容的内容嵌入特征进行概率预测,得到第一互动概率;第二预测单元,用于由所述第二子神经网络根据所述目标候选用户的用户嵌入特征、所述目标内容的内容嵌入特征和所述第一互动概率进行概率预测,得到所述第二互动概率。
在本申请的另一些实施例中,所述互动行为还包括第三互动行为,其中,在时序上所述第三互动行为晚于所述第二互动行为;所述互动概率还包括第三互动概率,所述第三互动概率是指触发所述第三互动行为的概率;所述互动概率预测模型还包括第三子神经网络;互动概率确定单元,还包括:第三预测单元,用于由所述第三子神经网络根据所述目标候选用户的用户嵌入特征、所述目标内容的内容嵌入特征和所述第二互动概率进行概率预测,得到所述第三互动概率。
在本申请的一些实施例中,内容的投放控制装置,还包括:训练数据获取模块,用于获取训练数据,所述训练数据包括多个训练样本,所述训练样本包括样本用户的用户信息、样本内容的内容信息和互动标签,所述互动标签包括第一互动标签、第二互动标签和第三互动标签,所述第一互动标签用于指示所述样本用户是否对所述样本内容触发第一互动行为,所述第二互动标签用于指示所述样本用户是否对所述样本内容触发第二互动行为,所述第三互动标签用于指示所述样本用户是否对所述样本内容触发第三互动行为;嵌入特征生成模块,用于由所述共享嵌入层根据所述样本用户的用户信息和所述样本内容的内容信息,对应生成所述样本用户的用户嵌入特征和所述样本内容的内容嵌入特征;第一预测互动概率确定模块,用于由所述第一子神经网络根据所述样本用户的用户嵌入特征和所述样本内容的内容嵌入特征进行概率预测,得到所述训练样本对应的第一预测互动概率;第二预测互动概率确定模块,用于由所述第二子神经网络根据所述样本用户的用户嵌入特征、所述样本内容的内容嵌入特征和所述第一预测互动概率进行概率预测,得到所述训练样本对应的第二预测互动概率;第三预测互动概率确定模块,用于由所述第三子神经网络根据所述样本用户的用户嵌入特征、所述样本内容的内容嵌入特征和所述第二预测互动概率进行概率预测,得到所述训练样本对应的第三预测互动概率;第一损失计算模块,用于根据所述第一预测互动概率和所述第一互动标签,计算第一损失;第二损失计算模块,用于根据所述第二预测互动概率和所述第二互动标签,计算第二损失;第三损失计算模块,用于根据所述第三预测互动概率和所述第三互动标签,计算第三损失;目标损失确定模块,用于根据所述第一损失、所述第二损失和所述第三损失,确定目标损失;反向调整模块,用于根据所述目标损失反向调整所述互动概率预测模型的参数,直至达到训练结束条件。
根据本申请实施例的一个方面,提供了一种电子设备,包括:处理器;存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如上所述内容的投放控制方法。
根据本申请实施例的一个方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被处理器执行时,实现如上所述内容的投放控制方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品,包括计算机指令,所述计算机指令被处理器执行时实现如上所述内容的投放控制方法。
在本申请中,结合目标内容在各内容标签下的投放反馈记录和投放消耗记录来对确定各内容标签的标签质量等级,并进而确定用于控制目标内容投放的过滤阈值,以使在目标内容的内容质量分数不低于过滤阈值时,投放所述目标内容,在目标内容的内容质量分数低于过滤阈值,则将目标内容过滤掉;确定投放目标内容或者过滤目标内容直接导致目标内容的曝光概率的变化;因此,本方案实现了结合内容标签的标签质量等级来灵活动态调整目标内容的曝光概率,灵活地控制目标内容的投放;而且,在本申请中,采用概率平滑的方式来调整目标内容的曝光概率,可以避免出现内容的曝光概率的剧烈波动。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请一实施例示出的内容的投放控制方法的应用场景的示意图。
图2是根据本申请的一个实施例示出的内容的投放控制方法的流程图。
图3是根据一实施例示出的将用户标签与广告的内容标签进行匹配的示意图。
图4是根据本申请一实施例示出的步骤250的流程图。
图5是根据本申请一实施例示出的步骤410的流程图。
图6是根据本申请一实施例示出的步骤520的流程图。
图7是根据本申请另一实施例示出的步骤520的流程图。
图8A是根据本申请一实施例示出的互动概率预测模型的示意图。
图8B是根据本申请一实施例示出的双塔模型的示意图。
图9是根据本申请另一实施例示出的内容的投放控制方法的流程图。
图10是根据本申请一实施例示出的内容的投放控制装置的框图。
图11示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
需要说明的是:在本文中提及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
图1是根据本申请一实施例示出的内容的投放控制方法的应用场景的示意图。如图1所示,该应用场景包括终端111和服务端112,终端111与服务端112通过有线或者无线网络建立通信连接。
终端111可以是智能手机、平板电脑、笔记本电脑、台式电脑、智能音响、车载终端、智能电视以及其他可以进行交互的电子设备,在此不进行具体限定。
服务端112可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
服务端112可以用于执行本申请的方法,来对内容进行投放控制,以将内容投放到用户所在的终端111。在本方案中,对目标内容进行投放控制即确定是否将目标内容投放到用户所在的终端。
在一些实施例中,服务端112可以按照本申请的方法,确定需要投放到用户所在终端的目标内容,并将用户的用户标识与确定需要投放的目标内容的内容标识进行关联存储,从而,在用户所在终端111发起内容请求后,将所确定需要投放到用户的目标内容发送到终端111。
在一些实施例中,服务端112可以在接收到终端111发送的内容请求后,按照本申请的方法来确定是否将目标内容发送到终端111,即在确定目标内容的质量分数不低于过滤阈值时,将目标内容发送到终端111;反之,若确定目标内容的质量分数低于过滤阈值时,则将目标内容进行过滤,即不将目标内容发送到终端111。
在一些实施例中,服务端112中还可以设置内容数据库123,该内容数据库用于存储待投放的内容。当然,在其他实施例中,内容数据库123还可以独立于服务端112设置。
在一些实施例中,服务端112可以按照设定的统计周期来获取在一个统计周期中目标内容的投放反馈数据和投放消耗数据,并对应按照本申请的方法来控制目标内容在下一个统计周期内的投放,从而实现根据目标内容的投放效果灵活控制目标内容的投放。
以下对本申请实施例的技术方案的实现细节进行详细阐述:
图2示出了根据本申请的一个实施例示出的内容的投放控制方法的流程图,该方法可以由具备处理能力的计算机设备执行,例如服务器等,在此不进行具体限定。参照图2所示,该方法至少包括步骤210至250,详细介绍如下:
步骤210,获取目标内容的投放反馈数据和投放消耗数据;投放反馈数据包括在目标内容的各内容标签下的投放反馈记录;投放消耗数据包括在目标内容的各内容标签下的投放消耗记录。
目标内容可以是指任一待进行投放控制的内容。目标内容可以是新闻、视频(长视频、短视频等)、音频(音乐)、博客文章、公众号文章、商品链接、商家链接、广告、电子书等,在此不进行具体限定。
投放反馈记录是指将目标内容发送到用户后,根据用户触发的互动行为所生成的记录。该投放反馈记录指示了用户对目标内容触发的互动行为。互动行为可以是点击目标内容的点击行为、收藏行为、下单行为(购买行为)、回购行为、评论行为、分享行为、点赞行为、观看(阅读、或者在目标内容的页面上停留)时长达到设定时长的行为、发弹幕的行为等,在此进行具体限定。例如,若目标内容为商家的广告,当用户对该广告触发了点击行为,则对应生成点击记录,当用户点击该商家的广告进入商家页面后,购买了商品,则对应生成购买记录。
可以理解的是,在不同的应用场景下,针对目标内容可触发的互动行为是存在差异的。进一步的,投放反馈记录还可以指示触发互动行为的用户所对应用户标识。
投放消耗记录用于指示将目标内容进行投放所带来的成本消耗。在一些实施例中,一般是通过媒体平台进行内容投放,则目标内容的所属方需要向媒体平台的管理方支付一定的费用,目标内容的所属方向媒体平台所支付的费用可以视为将目标内容进行投放所带来的成本消耗。
目标内容的内容标签是指为将目标内容与用户进行匹配而为目标内容所标注的标签,内容标签又可以称为TAG标签,内容标签是对目标内容的某个侧面的概要描述,以突出内容的某个特点。内容标签可以是目标内容的风格标签、领域标签、受众用户标签、属性标签、类别标签、目标内容的关键词等,在此不进行具体限定,例如若目标内容为某一商品的广告,则该商品的广告的内容标签可以是商品所属的商品类目(例如高跟鞋)、商品的关键词(例如棕色、尖头鞋等)、商品的受众用户标签(例如女性,18-30岁)、商品的风格标签(例如英伦风)等。
由上可以看出,目标内容的内容标签可能为多个,在本申请中,针对目标内容按内容标签来将目标内容的投放反馈记录和投放消耗记录来进行分类,得到对应于目标内容的每一内容标签的投放反馈记录和对应于目标内容的每一内容标签的投放消耗记录。
在本申请的方案中,投放反馈记录和投放消耗记录是与目标内容的至少一内容标签相关联的,从而,可以基于所关联的内容标签,将投放反馈记录和投放消耗记录来按内容标签进行分类。
在一些实施例中,可以将投放反馈记录所指示用户对应的内容标签作为投放反馈记录所关联的内容标签。用户对应的内容标签是指所确定与用户的用户标签相匹配的内容标签。举例来说,若将用户P的用户标签与内容Q的内容标签进行标签匹配,确定用户P的用户标签A1与内容Q的内容标签B1相匹配,则内容标签B1为根据用户P的互动行为所生成投放反馈记录所关联的内容标签。
在一些实施例中,媒体平台一般是按照曝光量、点击量、或者转化量来进行收费,所以,内容投放所产生的消耗是在目标内容投放到用户之后所确定的,投放消耗记录是与目标内容的投放记录或者与目标内容的投放反馈记录相关的,则可以将投放记录所指示用户对应的内容标签或者将投放反馈记录所指示用户对应的内容标签作为该投放消耗记录所关联的内容标签。投放记录所指示用户对应的内容标签是指与投放记录所指示用户的用户标签相匹配的内容标签。
在本申请的一些实施例中,可能设定多种路径来将用户的用户标签与内容的内容标签进行标签匹配,即在每一路径下对应设定了用户的用户标签,而不同路径下所设定的用户标签可能存在相同的用户标签,在该种情况下,可以将目标内容的内容标签在多个路径下所匹配到用户相关的投放反馈记录(或者投放消耗记录)记录进行聚合,从而,保证所得到在各个内容标签下的投放反馈记录(或者投放消耗记录)的准确性。
图3是根据一实施例示出的将用户标签与广告的内容标签进行匹配的示意图。如图3所示,在行为定向路径、兴趣定向路径、意向定向路径、APP(Application,应用程序)安装定向路径、自定义人群路径这五个路径下分别设定了用户的用户标签(如图3中类目、关键词、已安装列表、DMP(Data Management Platform,数据管理平台)人群包列表),则在进行标签匹配是将各路径下的用户标签均与用户标签进行匹配。例如,若某个广告的内容标签(又可以称为广告标签)包括“武侠游戏爱好者”这个标签,某次发起请求的用户所对应用户标签也包括该标签,则可以确定该用户与该广告相匹配。
其中,行为定向路径、兴趣定向路径是指基于用户已有的一套用户的行为定向标签体系和兴趣定向标签体系,也按照该行为定向标签体系和兴趣定向标签体系来对内容进行标签标注,从而在请求时能够召回直接匹配的内容。
APP安装定向路径是指为某个APP(假设为目标APP)寻找类似的其他APP,如果某个用户安装了目标APP,则当这个用户请求时,召回其安装的与目标APP类似的其他APP对应的内容(例如其他APP对应的广告)。
意向定向路径,是指自动绑定已转化人群中高TGI(Target Group Index,目标群体指数)的定向标签。其中,高TGI定向标签是指在已转化人群中此定向标签的占比较大。自定义人群路径是指自动绑定自定义的人群定向标签。
在设定多种路径来将用户的用户标签与内容的内容标签进行标签匹配的情况下,将通过各种路径召回的内容(即通过内容标签所确定与用户标签相匹配的内容),合并到一起,其中,召回的每一内容都标记是由哪些内容标签起作用召回的,因此,在该种情况下,可以对应来按内容标签进行投放反馈记录和投放消耗记录的统计。
例如,当目标内容为广告时,可以按内容标签统计得到各广告的投放反馈记录(其中,Tagij是指在第j个路径下对内容召回起作用的内容标签为第i个内容标签):
Ad1(广告1):Tag11 Tag12 Tag13…
Ad2(广告2):Tag21 Tag22 Tag23…
Ad3(广告3):Tag31 Tag32 Tag33…
步骤220,根据在目标内容的各内容标签下的投放反馈记录和在目标内容的各内容标签下的投放消耗记录,确定目标内容的各内容标签对应的标签质量等级。
标签质量等级用于反映内容标签的质量的高低,由于是根据投放反馈记录和投放消耗记录来确定内容标签的标签质量等级,可以看出,在本方案中是从内容投放效果和投放的消耗两个角度来反映内容标签的质量。
在本申请的一些实施例中,步骤220,包括:根据在目标内容的各内容标签下的投放反馈记录,计算在目标内容的各内容标签下的反馈参数;根据在目标内容的各内容标签下的投放消耗记录,计算在目标内容的各内容标签下的消耗参数;根据标签质量等级与反馈参数和与消耗参数之间的对应关系,以及在目标内容的各内容标签下的反馈参数和在目标内容的各内容标签下的消耗参数,确定目标内容的各内容标签对应的标签质量等级。
在一些实施例中,反馈参数可以是在单位时间(例如一个统计周期内)内触发互动行为的次数,例如,反馈参数可以是一天的点击次数、一天内的转化数等。在一些实施例中,若所统计的投放反馈记录是来源于多种互动行为,反馈参数可以是针对目标内容所触发全部种类的互动行为的次数的线性加权。
在一些实施例中,消耗参数可以是在单位时间(一个统计周期)内的消耗的成本或者成本偏差、或者成本偏差比例。其中,成本偏差等于投放目标内容所带来的收益与投放目标内容所用成本的差值;成本偏差比例等于投放目标内容所用成本与投放目标内容所用成本的比值。举例来说,若目标内容为商品的广告,则投放目标内容所带来的收益可以是基于商品的广告购买商品的成交总额(Gross Merchandise Volume,GMV)。
在一些实施例中,标签质量等级包括优质标签和劣质标签;在另一些实施例中,标签质量等级还可以包括中性标签;当然,在其他实施例中,还可以将标签质量等级进行更细粒度的划分,在此不进行具体限定。
在确定在目标内容的各内容标签下的反馈参数和在目标内容的各内容标签下的消耗参数后,可以根据预先设定标签质量等级与反馈参数和与消耗参数之间的对应关系,来确定目标内容的各内容标签的标签质量等级。
在一些实施例中,在标签质量等级与反馈参数和与消耗参数之间的对应关系中,可以设定与每一标签质量等级相对应的反馈参数范围和消耗参数范围,从而,可以确定一内容标签的消耗参数所在设定消耗参数范围和一内容标签的反馈参数所在的反馈参数范围,将与内容标签的消耗参数所在的消耗参数范围和内容标签的反馈参数所在的反馈参数范围相对应的标签质量等级,确定为该内容标签对应的标签质量等级。
下表1是根据一具体实施例示出的各消耗参数范围和反馈参数范围所对应的质量标签等级。在下表中,反馈参数为转化数,消耗参数为成本偏差比例,即cost(成本)/GMV。
转化数 成本偏差比例(cost/GMV) 标签质量等级
≥6 ≥1.2 劣质标签
≥6 ≥1.1&&<1.2 中性标签
≥6 <1.1 优质标签
<6 ≥1.1 劣质标签
<6 >1&&<1.1 中性标签
<6 ≤1 优质标签
表1
可以理解的是,对于确定为优质标签的内容标签,表明该内容标签能很好的描述出内容的特点;从效果上来讲,内容添加该内容标签后,能够在合适的场合下被召回,召回之后用户也对该内容感兴趣,表明召回之后该内容的曝光效果好。对于确定为劣质标签的内容标签,表明这个内容标签不能很好的描述内容的特点,在突出内容特性上存在欠缺,从效果上来讲,为该内容添加该内容标签后,召回效果一般。
步骤230,根据各内容标签对应的标签质量等级,对各内容标签的级别进行调整,得到各内容标签的调整后级别。
在本申请的一些实施例中,可以设定标签质量等级与级别调整策略之间的映射关系,从而,按照内容标签所对应的标签质量等级所映射的级别调整策略来对各内容标签的级别进行调整。内容标签的调整后级别是指调整后内容标签的级别。
在本申请的一些实施例中,标签质量等级包括优质标签和劣质标签;步骤230,包括:若内容标签对应的标签质量等级为优质标签,则降低内容标签的级别,得到内容标签的调整后级别;若内容标签对应的标签质量等级为劣质,则提高内容标签的级别,得到内容标签的调整后级别。
可以看出,在本实施例中,当内容标签的标签质量等级为优质标签时,则将内容标签的级别调低,反之,当内容标签的标签质量等级指示内容标签为劣质标签时,则将内容标签的级别调高。
在一些实施例中,标签质量等级还包括中性标签,下述表2示出了所设定各个标签质量等级相对应的调整策略,其中,在表2中调整策略中的数值表示进行级别调整的幅度调整系数。
标签质量等级 调整策略D
劣质标签 1
中性标签 0
优质标签 -1
表2
举例来说,若设定级别调整公式为:
tresholdt=tresoldt-1+D*3;(公式1)
tresoldt-1是内容标签在上一周期对应的级别;D是有3种可能的取值,分别是-1,0,1,分别对应着不同标签质量的调整策略,即当内容标签为劣质标签时,D为正,则提高内容标签对应的级别,当内容标签为中性标签时,保持内容标签的级别不变;当内容标签为优质标签时,降低内容标签对应的级别。
可以理解的是,以上仅仅是对根据标签质量等级对级别进行调整的示例性举例,不能认为是对本申请使用范围,在其他实施例中,幅度调整系数还可以是其他数值,以及还可以按照其他非线性(例如按照指数函数等)的方式来进行级别调整。
步骤240,根据目标内容的全部内容标签的调整后级别,确定过滤阈值。
在本申请的一些实施例中,步骤240,包括:根据级别与质量分数之间的对应关系,确定各内容标签的调整后级别所对应的质量分数;在各内容标签的调整后级别所对应的质量分数中,确定最小质量分数,将最小质量分数确定为过滤阈值。
在一些实例中,级别与质量分数可以是呈正相关关系。可以理解的是,当内容标签为优质标签时,降低内容标签的级别,则对应的,内容标签的级别所对应的质量分数对应降低。
下述表3是根据一具体实施例示出的级别与质量分数之间的对应关系。在
表3中,可以看出来质量分数与级别呈正相关关系。
质量分数 级别
0.02 1
0.035 2
0.52 100
表3
在一些实施例中,可以根据历史投放的内容的质量分数来进行级别划分,并将所划分确定的级别确定为内容标签的可选级别。例如,采样100万个用户,针对<内容,标签>这样的组合,统计一段时间内的内容的质量分数,然后将这些质量分数按照从小到大排序,分成100等份,这样,可以将每一等份视为一个级别,例如表2中,包括等级1、2、…、100。在具体实施例中,进行采样所面向的用户数量可根据实际需要进行设定,当然,在具体实施例中,可以综合等级划分效果和效率的两个因素来综合确定采样的用户数量。可以理解的是,采样的用户数量越大,则等级划分和质量分数分级准确度越高,但是对应的数据处理量也对应增大。
在具体实施例中,在确定一内容标签在当前周期对应的级别th resh oldt,后,可以按照如下公式来确定在当前周期该内容标签所对应级别相对应的质量分数qualityTresoldt
qualityTresoldt=f(tresoldt);(公式2)
上式中,f(x)这个函数即表示级别与质量分数之间的映射关系,例如上述表3所呈现的映射关系。
目标内容的质量分数用于反映用户对目标内容触发互动行为的概率的大小,用户对目标内容触发互动行为的概率越大,则目标内容的质量分数越高。
在一些实施例中,可以通过互动概率预测模型来根据目标内容的内容信息和用户的用户信息预测用户对目标内容触发互动行为的互动概率,进而根据所预测到的互动概率来确定目标内容的质量分数。互动概率预测模型可以是用于预测用户对目标内容触发一种互动行为的概率(例如预测触发点击行为的概率),也可以是对目标内容触发两种及以上数量的互动行为的概率(例如触发点击行为的概率和触发下单行为的概率等)。
该互动概率预测模型可以是由全连接网络、循环神经网络、前馈神经网络、卷积神经网络等中的一种或者多种神经网络构建的,之后经训练之后用于进行互动概率预测,在其他实施例中,该互动概率预测模型还可以是对已有的神经网络模型进行训练后来作为互动概率预测模型进行概率预测。
在一些实施例中,当互动概率预测模型用于预测对目标内容触发两种及以上数量的互动行为的互动概率的情况下,则可以综合所预测到每一种互动行为的互动概率来确定目标内容的质量分数,例如将所预测到全部互动行为的互动概率进行加权,将加权结果作为目标内容的质量分数。
步骤250,根据过滤阈值和目标内容的质量分数,对目标内容进行投放控制,其中,若目标内容的内容质量分数不低于过滤阈值,则投放目标内容,若目标内容的内容质量分数低于过滤阈值,则将目标内容过滤掉。
在本申请中,目标内容的内容质量分数低于过滤阈值,则将目标内容过滤掉,即不将目标内容投放到用户,对应的,目标内容也不向用户进行曝光。
若是将全部内容标签的调整后级别所对应质量分数中的最小质量分数确定为过滤阈值,在确定内容标签的标签质量等级指示该内容标签为劣质标签的情况下,内容标签的级别被降低,对应的,内容标签所对应的质量分数对应降低,则所确定的过滤阈值对应降低,在该种情况下,由于目标内容的质量分数基本不变,则由于过滤阈值降低,目标内容进行投放的概率增加,从而,相当于增加了目标内容的曝光概率;反之,若确定目标内容的一内容标签为优质标签,该内容标签对应的级别提高,则内容标签所对应的质量分数对应增加,所确定的过滤阈值增大,在该种情况下,目标内容被过滤掉的概率增加,从而,相当于降低了目标内容的曝光概率。
在一些实施中,可以按周期来执行如上的步骤210-240,其中,该周期可以根据实际需要进行设定,例如周期为1小时、2小时、6小时、一天等。在该种情况下,根据上一周期中目标内容的投放反馈数据和投放消耗数据来确定过滤阈值,并将该过滤阈值作用于本周期内目标内容的投放控制,从而,实现按周期进行内内容标签的标签质量等级的更新,并基于更新后的标签质量等级灵活调整目标内容的曝光概率,实现了目标内容的曝光概率的平滑处理。
在一些实施例中,首个周期中,可以初始化设定内容标签的级别,并以此为基础,在各个周期内,根据上一周期的投放反馈数据和投放消耗数据所确定内容标签的标签质量等级对内容标签所对应的级别进行调整。
在本申请中,结合目标内容在各内容标签下的投放反馈记录和投放消耗记录来对确定各内容标签的标签质量等级,并进而确定用于控制目标内容投放的过滤阈值,以使在目标内容的内容质量分数不低于过滤阈值时,投放目标内容,在目标内容的内容质量分数低于过滤阈值,则将目标内容过滤掉;确定投放目标内容或者过滤目标内容直接导致目标内容的曝光概率的变化。因此,本方案实现了结合内容标签的标签质量等级来灵活动态调整目标内容的曝光概率,实现灵活地控制目标内容的投放。而且,在本申请中,采用概率平滑的方式来调整目标内容的曝光概率,可以避免出现内容曝光的剧烈波动。
进一步的,在目标内容在各内容标签下的投放反馈记录和投放消耗记录来对确定各内容标签的标签质量等级,投放反馈记录反映了内容标签下的投放效果,投放消耗记录反映了内容标签下的投放消耗情况,从而,结合反映投放效果的投放反馈记录和反映投放消耗情况的投放消耗记录来确定标签质量等级,可以保证全面反映内容标签的综合质量,保证所确定标签质量等级的准确性和合理性。
在本申请的一些实施例中,目标内容的质量分数包括目标内容相对于每一候选用户的质量分数;如图4所示,步骤250,包括:
步骤410,获取目标候选用户与目标内容进行互动的互动概率。
目标候选用户可以是为目标内容所确定的任一候选用户。在一些实施例中,为了保证向用户所投放的内容对于用户而言更具有针对性,可以预先基于用户的用户标签和目标内容的内容标签进行用户筛选,确定目标内容的候选用户。
在本申请的一些实施例中,该方法还包括:计算目标内容的内容标签与用户集合中各用户的用户标签之间的标签匹配度;将标签匹配度超过匹配度阈值的用户确定为目标内容的候选用户。
在一些实施例中,可以计算目标内容的内容标签与用户的各用户标签的语义相似度,若语义相似度超过设定的语义相似度阈值,则确定目标内容的该内容标签与用户的用户标签相匹配;其中,标签匹配度可以是确定与目标内容的内容标签相匹配的用户标签的数量来表征,对应的,匹配度阈值也可以是设定与目标内容的内容标签向匹配的用户标签的数量阈值。
将标签匹配度超过匹配度阈值的用户确定为目标内容的候选用户,相当于,当标签匹配度超过匹配度阈值时,将目标内容确定为待向该用户投放的内容,从而,对于该用户而言,相当于是召回了该目标内容。因此,从这个角度讲,上述根据用户的用户标签与目标内容的内容标签进行匹配的过程即为目标内容的召回过程。
通过如上的过程为目标内容确定候选用户,从而,在后续的投放控制过程中,可以仅面向目标内容的候选用户进行投放控制,而不需要面向全部用户进行投放控制,减少了数据处理量,而且,由于预先基于用户标签和内容标签进行用户筛选,可以保证内容与用户之间的匹配性。
进一步的,为了便于后续按内容标签进行投放反馈记录和投放消耗记录的统计,可以在该目标内容的召回过程中标记起作用的内容标签,将该标记为起作用的内容标签作为投放反馈记录(和投放消耗记录)所关联的内容标签。其中,在该目标内容的召回过程中标记起作用的内容标签是指在内容召回过程中所确定与用户的用户标签相匹配的内容标签。
步骤420,根据互动概率确定目标内容相对于目标候选用户的质量分数。
在一些实施例中,可以预先设定互动概率与质量分数之间的映射关系,从而,根据所得到的互动概率,可以对应确定目标内容相对于目标候选用户的质量分数。
可以理解的是,由于互动概率是相对于某一用户而言的,而不同的用户由于对所需要的内容或者偏好等的差异,不同的用户对于用户内容触发互动行为的概率也是存在差异的,因此,用户不同时,所确定目标内容相对于用户的质量分数也是对应存在差异的,因此,在本实施例中,基于互动概率所计算得到目标内容的质量分数是相对于用户而言的。
步骤430,若目标内容相对于目标候选用户的质量分数不低于过滤阈值,则若接收到目标候选用户发起的内容请求,将目标内容发送到目标候选用户。
步骤440,若目标内容相对于目标候选用户的质量分数低于过滤阈值,则将目标内容过滤掉。
若将目标内容发送到目标候选用户,实现目标内容在目标候选用户处的曝光,反之,若将目标内容过滤掉,则未将目标内容向目标候选用户进行曝光。从而,通过如上的过程,基于所确定的过滤阈值和目标内容相对于目标候选用户的质量分数,实现了目标内容面向目标候选用户的投放控制,实现根据目标内容的内容标签来调节目标内容的曝光概率。
在本申请的一些实施例中,如图5所示,步骤410,包括:
步骤510,获取目标候选用户的用户信息和目标内容的内容信息。
用户信息可以是年龄、性别、所在地、星座、偏好标签等,在此不进行具体限定。内容信息可以是内容主题、内容所属领域、内容标题、内容分类标签等,在一些实施例中,若目标内容为广告,内容信息还可以包括广告主设定的广告定向人群类别等。
步骤520,由互动概率预测模型根据目标候选用户的用户信息和目标内容的内容信息,输出目标候选用户对目标内容触发互动行为的互动概率。
互动概率预测模型可以是通过全连接网络、循环神经网络等神经网络构建的模型。可以理解的是,为了保证互动概率预测模型所预测到互动概率的准确性,可以先对该互动概率预测模型进行线下训练,然后将训练后的互动概率预测模型应用于线上来预测互动概率。
在本实施例中,通过互动概率预测模型来进行互动概率预测,实现将人工智能技术应用到内容的投放控制过程中。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
可以理解的是,在本申请的具体实施方式中,涉及到用户信息(例如年龄、性别、所在地、偏好标签等)等相关的数据,当本申请实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
在本申请的一些实施例中,互动行为包括按照时序由先到后的第一互动行为和第二互动行为;互动概率包括第一互动概率和第二互动概率,其中,第一互动概率是指触发第一互动行为的概率,第二互动概率是指触发第二互动行为的概率;互动概率预测模型包括共享嵌入层、第一子神经网络和第二子神经网络;在本实施例中,如图6所示,步骤520,包括:
步骤610,由共享嵌入层根据目标候选用户的用户信息和目标内容的内容信息,对应生成目标候选用户的用户嵌入特征和目标内容的内容嵌入特征。
步骤620,由第一子神经网络根据目标候选用户的用户嵌入特征和目标内容的内容嵌入特征进行概率预测,得到第一互动概率。
步骤630,由第二子神经网络根据目标候选用户的用户嵌入特征、目标内容的内容嵌入特征和第一互动概率进行概率预测,得到第二互动概率。
第二互动行为在时序上晚于第一互动行为,也可以理解为,若一用户对内容触发了第二互动行为,表明该用户对该内容必然触发了第一互动行为,换言之,第一互动行为是触发第二互动行为的必要条件。
举例来说,若目标内容为商品广告,第一互动行为可以是点击行为,第二互动行为可以是下单行为;若目标内容为视频,第一互动行为可以是点击行为,第二互动行为可以是视频播放时长达到第一时长的行为、对视频进行评论的行为、发弹幕的行为、收藏视频的行为、对视频进行分享的行为等。
共享嵌入层用于对将目标用户的用户信息和目标内容的内容信息转换到同一嵌入空间中,从而得到目标用户的用户信息在嵌入空间中的特征表示(即为目标用户的用户嵌入特征),以及得到目标内容的内容信息在该嵌入空间中的特征表示(即为目标内容的内容嵌入特征)。
在一些实施例中,第一子神经网络和第二子神经网络可以是通过一种或者多个神经网络构建的,神经网络例如全连接网络、循环神经网络、前馈神经网络等,在此不进行具体限定。
在本实施例中,由于第一互动行为是触发第二互动行为的必要条件,因此,将触发第一互动行为的第一互动概率作为第二子神经网络的输入之一,以使第二子神经网络参考第一互动概率来预测第二互动概率。
在本实施例中,预测目标候选用户对目标内容触发第一互动行为的第一互动概率和触发第二互动行为的第二互动概率,对应的,在确定目标内容相对于目标候选用户的质量分数时,也是对应参考该第一互动概率和第二互动概率来确定质量分数,结合目标候选用户对目标内容触发两种互动行为的概率来确定目标内容相对于候选用户的质量分数,提高了所确定质量分数的准确性。
在本申请的另一些实施例中,互动行为还包括第三互动行为,其中,在时序上第三互动行为晚于第二互动行为;互动概率还包括第三互动概率,第三互动概率是指触发第三互动行为的概率;互动概率预测模型还包括第三子神经网络;如图7所示,相较于图6所示的实施例,步骤520还包括:
步骤640,由第三子神经网络根据目标候选用户的用户嵌入特征、目标内容的内容嵌入特征和第二互动概率进行概率预测,得到第三互动概率。
在时序上第三互动行为晚于第二互动行为,表明第二互动行为是触发第三互动行为的必要条件,若用户针对一内容触发了第三互动行为,则表明该用户必然对该内容触发了第二互动行为。
举例来说,若目标内容为商品的广告链接,第一互动行为为点击行为,第二互动行为为购买行为,第三互动行为可以是回购行为。
又例如,若目标内容为博客文章,第一互动行为可以是点击行为,第二互动行为可以是阅读时长达到第一时长的行为,第三互动行为可以是阅读时长达到第二时长的行为,其中,第二时长大于第一时长。
又例如,若目标内容为音乐,第一互动行为可以是点击行为,第二互动行为可以是播放时长达到第三时长的行为,第三互动行为可以是播放时长达到第四时长的行为,其中,第四时长大于第三时长。
如上所描述,由于第二互动行为是触发第三互动行为的必要条件,因此,第三子神经网络结合目标用户的用户嵌入特征、目标内容的内容嵌入特征和第二互动概率来进行概率预测,得到目标用户对目标内容触发第三互动行为的第三互动概率。
可以理解的是,在互动概率包括第一互动概率、第二互动概率和第三互动概率的情况下,步骤420对应是综合目标候选用户与目标内容进行互动的第一互动概率、第二互动概率和第三互动概率来确定目标内容相对于目标候选用户的质量分数。
在一些实施例中,可以预先为第一互动概率、第二互动概率和第三互动概率设定加权系数,然后将目标候选用户相对于目标内容的第一互动概率、第二互动概率和第三互动概率进行加权,得到目标内容相对于目标候选用户的质量分数。
在一些实施例中,可以采用乘法融合的方式,将第一互动概率、第二互动概率和第三互动概率相乘,将相乘结果作为目标内容相对于目标候选用户的质量分数。
在一些实施例中,还可以预先为第一互动概率、第二互动概率和第三互动概率分别进行指数运算,然后将指数运算结果相乘,将相乘结果作为目标内容相对于目标候选用户的质量分数。
图8A是根据本申请一具体例示出的互动概率预测模型的框架图。该互动概率预测模型可以用于预测用户对广告触发互动行为的互动概率。如图8A所示,该互动概率预测模型包括CTR(Click-Through-Rate,点击率)双塔模型、浅层CTCVR(Click-Through&Conversion Rate,点击且转化的概率)双塔模型、和深层CTCVR双塔模型。
其中,CTR双塔模型可以视为上文中用于预测触发第一互动行为的第一互动概率的第一子神经网络,具体在广告的应用场景下,第一互动行为可以是点击行为。
浅层CTCVR双塔模型可以视为上文中用于预测触发第二互动行为的第二互动概率的第二子神经网络,具体在广告的应用场景下,第二互动行为可以是转化行为(例如下单行为、购买行为)等。在该种场景下,存在如下关系:
P(CTCVR)=P(CTR)*P(CVR);(公式4)
其中,P(CTCVR)表示广告从被曝光到转化的概率;P(CTR)表示从曝光到被点击的概率;P(CVR)表示广告从被点击到转化的概率。
深层CTCVR双塔模型可以视为上文中用于预测触发第三互动行为的第三互动概率的第三子神经网络,具体在广告的应用场景下,第三互动行为可以是回购行为。
如图8A所示,共享嵌入层用于将用户信息和广告信息转换到同一嵌入空间,得到用户的用户嵌入特征和广告的广告嵌入特征。在图8A所示中,该互动概率预测模型中还包括SE(Sequeze and Excitation,压缩和激励)模块,该SE模块用于计算注意力。
在计算注意力后,通过多个专家网络(Expert)来进行深度特征提取,具体的,包括用于对用户嵌入特征进行深度特征提取的用户专家网络0、用户专家网络1、用户专家网络2和共享专家网络1;用于对广告嵌入特征进行深度特征提取的广告专家网络0、广告专家网络1、广告专家网络2和共享专家网络2。在一些实施例中,专家网络可以是XNN(ExplainableNeural Networks,可解释神经网络)。
进一步的,在图8A所示的互动概率预测模型中,为每个预测任务(即预测点击概率、预测触发转化行为的概率、预测触发回购行为的概率的任务)分别设置了一个门控单元(gate),使不同的任务和不同的数据可以更多样化地使用专家网络提取到的深层特征。
之后,由CTR双塔模型根据用户专家网络所输出的用户特征和广告专家网络输出的广告特征进行点击概率(第一互动概率)预测;由浅层CTCVR双塔模型根据用户专家网络所输出的用户特征和广告专家网络输出的广告特征进行触发转化行为的第二互动概率;由深层CTCVR双塔模型根据用户专家网络所输出的用户特征和广告专家网络输出的广告特征进行触发回购行为的第三互动概率。
在对图8A所示的互动概率预测模型继续训练的过程中,目标损失可以是根据CTR双塔模型的输出结果所计算到的第一损失、根据浅层CTCVR双塔模型的输出结果所计算到的第二损失和根据深层CTCVR双塔模型的输出结果所计算到的第三损失的加权和。
图8A所示的互动概率预测模型中,CTR双塔模型、浅层CTCVR双塔模型和深层CTCVR双塔模型均为双塔模型。图8B是根据本申请一实施例示出的双塔模型的示意图,如图8A所示,双塔模型中设有对用户特征进行非线性变化的神经网络和对广告特征进行非线性变换的神经网络,之后将两个神经网络的输出进行融合,得到融合特征,进而可以基于融合特征进行分类,输出对应的互动概率。图8A所示的互动概率预测模型可以采用多任务学习的方式进行训练,该互动概率预测模型可以称为Complete Conversion Chain Multi-taskModel(全链转化多任务模型,C3MM)。
在图8B所示的双塔模型中,可以通过全连接网络来对用户特征进行变换(例如图8B中的Fc_1_1、Fc_1_2、…、Fc_1_m),通过全连接网络来对广告特征进行变换(例如图8B中的Fc_2_1、Fc_2_2、…、Fc_2_n)。可以理解的是,图8B仅仅是对双塔模型的示例性举例,不能认为是对本申请使用方案的限制。
在本申请的一些实施例中,如图9所示,该方法还包括:
步骤911,获取训练数据,训练数据包括多个训练样本,训练样本包括样本用户的用户信息、样本内容的内容信息和互动标签,互动标签包括第一互动标签、第二互动标签和第三互动标签,第一互动标签用于指示样本用户是否对样本内容触发第一互动行为,第二互动标签用于指示样本用户是否对样本内容触发第二互动行为,第三互动标签用于指示样本用户是否对样本内容触发第三互动行为;
在一些实施例中,若样本用户对样本内容触发了第一互动行为,则将第一互动标签设为1,反之,若样本用户未对样本内容触发第一互动行为,将第一互动标签设为0;同理,第二互动标签也可以设为0(表明用户未触发第二互动行为)和1(表明用户未触发第二互动行为);第三互动标签也可以设为0(表明用户未触发第三互动行为)和1(表明用户未触发第三互动行为)。
步骤912,由共享嵌入层根据样本用户的用户信息和样本内容的内容信息,对应生成样本用户的用户嵌入特征和样本内容的内容嵌入特征。
步骤913,由第一子神经网络根据样本用户的用户嵌入特征和样本内容的内容嵌入特征进行概率预测,得到训练样本对应的第一预测互动概率。
步骤914,由第二子神经网络根据样本用户的用户嵌入特征、样本内容的内容嵌入特征和第一预测互动概率进行概率预测,得到训练样本对应的第二预测互动概率。
步骤915,由第三子神经网络根据样本用户的用户嵌入特征、样本内容的内容嵌入特征和第二预测互动概率进行概率预测,得到训练样本对应的第三预测互动概率。
通过如上步骤912-915可以分别计算得到每一训练样本对应的第一预测互动概率、第二预测互动概率和第三预测互动概率。
步骤916,根据第一预测互动概率和第一互动标签,计算第一损失。
在一些实施例中,将第一预测互动概率和第一互动标签代入设定的损失函数中,计算得到第一损失。其中设定的损失函数可以是绝对值损失函数,平方损失函数、交叉熵损失函数等,在此不进行具体限定。
在一些实施例中,所设定的损失函数可以是交叉熵损失函数,则可以按照如下公式计算得到第一损失。
Figure BDA0003365167410000181
其中,N为训练样本的总数,yi表示第i个训练样本xi对应的第一互动标签;p1(xi)表示为第i个训练样本xi预测到的第一预测互动概率。
步骤917,根据第二预测互动概率和第二互动标签,计算第二损失。
步骤918,根据第三预测互动概率和第三互动标签,计算第三损失。其中,计算第二损失和第三损失的过程与计算第一损失的过程类似,在此不再赘述。
步骤919,根据第一损失、第二损失和第三损失,确定目标损失。
在一些实施例中,可以将第一损失、第二损失和第三损失按照如下公式5进行加权求和,得到目标损失。
Loss=w1·loss1+w2·loss2+w3·loss3;(公式6)
其中,Loss为目标损失,w1、w2、w3为加权系数,可以根据实际需要预先设定,loss1为第一损失,loss2为第二损失,loss3为第三损失。
步骤920,根据目标损失反向调整互动概率预测模型的参数,直至达到训练结束条件。
在一些实施例中,可以根据第一预测损失,采用梯度下降(Gradient Descent)算法,反向调整互动概率预测模型的模型参数,并在梯度小于阈值时停止反向训练。根据目标损失反向调整互动概率预测模型的参数的过程即为对互动概率预测模型的反向训练过程。
训练结束条件可以是互动概率预测模型的迭代次数达到设定的次数阈值,或者互动概率预测模型的损失函数收敛。
通过图9所示的训练过程,可以使互动概率预测模型学习到基于用户的用户信息、内容的内容信息准确预测互动概率(第一互动概率、第二互动概率和第三互动概率)的能力,从而保证互动概率预测模型在线上应用过程中所预测到互动概率的准确性。
在一些实施例中,若互动概率预测模型不包括第三子神经网络模型的情况下,互动概率预测模型的训练过程与图9所示的过程类似,在此不再赘述。
以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的方法。对于本申请装置实施例中未披露的细节,请参照本申请上述方法实施例。
图10是根据一实施例示出的内容的投放控制装置的框图,如图10所示,该内容的投放控制装置包括:获取模块1010,用于获取目标内容的投放反馈数据和投放消耗数据;投放反馈数据包括在目标内容的各内容标签下的投放反馈记录;投放消耗数据包括在目标内容的各内容标签下的投放消耗记录;标签质量等级确定模块1020,用于根据在目标内容的各内容标签下的投放反馈记录和在目标内容的各内容标签下的投放消耗记录,确定目标内容的各内容标签对应的标签质量等级;级别调整模块1030,用于根据各内容标签对应的标签质量等级,对各内容标签的级别进行调整,得到各内容标签的调整后级别;过滤阈值确定模块1040,用于根据目标内容的全部内容标签的调整后级别,确定过滤阈值;投放控制模块1050,用于根据过滤阈值和目标内容的质量分数,对目标内容进行投放控制,其中,若目标内容的内容质量分数不低于过滤阈值,则投放目标内容,若目标内容的内容质量分数低于过滤阈值,则将目标内容过滤掉。
在本申请的一些实施例中,标签质量等级确定模块1020,包括:反馈参数计算单元,用于根据在目标内容的各内容标签下的投放反馈记录,计算在目标内容的各内容标签下的反馈参数;消耗参数计算单元,用于根据在目标内容的各内容标签下的投放消耗记录,计算在目标内容的各内容标签下的消耗参数;标签质量等级确定单元,用于根据标签质量等级与反馈参数和与消耗参数之间的对应关系,以及在目标内容的各内容标签下的反馈参数和在目标内容的各内容标签下的消耗参数,确定目标内容的各内容标签对应的标签质量等级。
在本申请的一些实施例中,标签质量等级包括优质标签和劣质标签;级别调整模块1030进一步被配置为:若内容标签对应的标签质量等级为优质标签,则降低内容标签的级别,得到内容标签的调整后级别;若内容标签对应的标签质量等级为劣质,则提高内容标签的级别,得到内容标签的调整后级别。
在本申请的一些实施例中,过滤阈值确定模块1040,包括:质量分数确定单元,用于根据级别与质量分数之间的对应关系,确定各内容标签的调整后级别所对应的质量分数;过滤阈值确定单元,用于在各内容标签的调整后级别所对应的质量分数中,确定最小质量分数,将最小质量分数确定为过滤阈值。
在本申请的一些实施例中,目标内容的质量分数包括目标内容相对于每一候选用户的质量分数;投放控制模块1050,包括:互动概率获取单元,用于获取目标候选用户与目标内容进行互动的互动概率;质量分数确定单元,用于根据互动概率确定目标内容相对于目标候选用户的质量分数;添加单元,用于若目标内容相对于目标候选用户的质量分数不低于过滤阈值,则若接收到目标候选用户发起的内容请求,将目标内容发送到目标候选用户;过滤单元,用于若目标内容相对于目标候选用户的质量分数低于过滤阈值,则将目标内容过滤掉。
在本申请的一些实施例中,内容的投放控制装置,还包括:标签匹配度计算单元,用于计算目标内容的内容标签与用户集合中各用户的用户标签之间的标签匹配度;候选用户确定单元,用于将标签匹配度超过匹配度阈值的用户确定为目标内容的候选用户。
在本申请的一些实施例中,互动概率获取单元,包括:获取单元,用于获取目标候选用户的用户信息和目标内容的内容信息;互动概率确定单元,用于由互动概率预测模型根据目标候选用户的用户信息和目标内容的内容信息,输出目标候选用户对目标内容触发互动行为的互动概率。
在本申请的一些实施例中,互动行为包括按照时序由先到后的第一互动行为和第二互动行为;互动概率包括第一互动概率和第二互动概率,其中,第一互动概率是指触发第一互动行为的概率,第二互动概率是指触发第二互动行为的概率;互动概率预测模型包括共享嵌入层、第一子神经网络和第二子神经网络;互动概率确定单元,包括:嵌入特征确定单元,用于由共享嵌入层根据目标候选用户的用户信息和目标内容的内容信息,对应生成目标候选用户的用户嵌入特征和目标内容的内容嵌入特征;第一预测单元,用于由第一子神经网络根据目标候选用户的用户嵌入特征和目标内容的内容嵌入特征进行概率预测,得到第一互动概率;第二预测单元,用于由第二子神经网络根据目标候选用户的用户嵌入特征、目标内容的内容嵌入特征和第一互动概率进行概率预测,得到第二互动概率。
在本申请的另一些实施例中,互动行为还包括第三互动行为,其中,在时序上第三互动行为晚于第二互动行为;互动概率还包括第三互动概率,第三互动概率是指触发第三互动行为的概率;互动概率预测模型还包括第三子神经网络;互动概率确定单元,还包括:第三预测单元,用于由第三子神经网络根据目标候选用户的用户嵌入特征、目标内容的内容嵌入特征和第二互动概率进行概率预测,得到第三互动概率。
在本申请的一些实施例中,内容的投放控制装置,还包括:训练数据获取模块,用于获取训练数据,训练数据包括多个训练样本,训练样本包括样本用户的用户信息、样本内容的内容信息和互动标签,互动标签包括第一互动标签、第二互动标签和第三互动标签,第一互动标签用于指示样本用户是否对样本内容触发第一互动行为,第二互动标签用于指示样本用户是否对样本内容触发第二互动行为,第三互动标签用于指示样本用户是否对样本内容触发第三互动行为;嵌入特征生成模块,用于由共享嵌入层根据样本用户的用户信息和样本内容的内容信息,对应生成样本用户的用户嵌入特征和样本内容的内容嵌入特征;第一预测互动概率确定模块,用于由第一子神经网络根据样本用户的用户嵌入特征和样本内容的内容嵌入特征进行概率预测,得到训练样本对应的第一预测互动概率;第二预测互动概率确定模块,用于由第二子神经网络根据样本用户的用户嵌入特征、样本内容的内容嵌入特征和第一预测互动概率进行概率预测,得到训练样本对应的第二预测互动概率;第三预测互动概率确定模块,用于由第三子神经网络根据样本用户的用户嵌入特征、样本内容的内容嵌入特征和第二预测互动概率进行概率预测,得到训练样本对应的第三预测互动概率;第一损失计算模块,用于根据第一预测互动概率和第一互动标签,计算第一损失;第二损失计算模块,用于根据第二预测互动概率和第二互动标签,计算第二损失;第三损失计算模块,用于根据第三预测互动概率和第三互动标签,计算第三损失;目标损失确定模块,用于根据第一损失、第二损失和第三损失,确定目标损失;反向调整模块,用于根据目标损失反向调整互动概率预测模型的参数,直至达到训练结束条件。
图11示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。需要说明的是,图11示出的电子设备的计算机系统1100仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图11所示,计算机系统1100包括中央处理单元(Central Processing Unit,CPU)1101,其可以根据存储在只读存储器(Read-Only Memory,ROM)1102中的程序或者从存储部分1108加载到随机访问存储器(Random Access Memory,RAM)1103中的程序而执行各种适当的动作和处理,例如执行上述实施例中的方法。在RAM 1103中,还存储有系统操作所需的各种程序和数据。CPU1101、ROM1102以及RAM 1103通过总线1104彼此相连。输入/输出(Input/Output,I/O)接口1105也连接至总线1104。
以下部件连接至I/O接口1105:包括键盘、鼠标等的输入部分1106;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1107;包括硬盘等的存储部分1108;以及包括诸如LAN(Local AreaNetwork,局域网)卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至I/O接口1105。可拆卸介质1111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1110上,以便于从其上读出的计算机程序根据需要被安装入存储部分1108。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1109从网络上被下载和安装,和/或从可拆卸介质1111被安装。在该计算机程序被中央处理单元(CPU)1101执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读存储介质承载计算机可读指令,当该计算机可读存储指令被处理器执行时,实现上述任一实施例中的方法。
根据本申请的一个方面,还提供了一种电子设备,其包括:处理器;存储器,存储器上存储有计算机可读指令,计算机可读指令被处理器执行时,实现上述任一实施例中的方法。
根据本申请实施例的一个方面,提供了计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一实施例中的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (14)

1.一种内容的投放控制方法,其特征在于,包括:
获取目标内容的投放反馈数据和投放消耗数据;所述投放反馈数据包括在所述目标内容的各内容标签下的投放反馈记录;所述投放消耗数据包括在所述目标内容的各内容标签下的投放消耗记录;
根据在所述目标内容的各内容标签下的投放反馈记录和在所述目标内容的各内容标签下的投放消耗记录,确定所述目标内容的各内容标签对应的标签质量等级;
根据各内容标签对应的标签质量等级,对各所述内容标签的级别进行调整,得到各所述内容标签的调整后级别;
根据所述目标内容的全部内容标签的调整后级别,确定过滤阈值;
根据所述过滤阈值和所述目标内容的质量分数,对所述目标内容进行投放控制,其中,若所述目标内容的内容质量分数不低于所述过滤阈值,则投放所述目标内容,若所述目标内容的内容质量分数低于所述过滤阈值,则将所述目标内容过滤掉。
2.根据权利要求1所述的方法,其特征在于,所述根据在所述目标内容的各内容标签下的投放反馈记录和在所述目标内容的各内容标签下的投放消耗记录,确定所述目标内容的各内容标签对应的标签质量等级,包括:
根据在所述目标内容的各内容标签下的投放反馈记录,计算在所述目标内容的各内容标签下的反馈参数;
根据在所述目标内容的各内容标签下的投放消耗记录,计算在所述目标内容的各内容标签下的消耗参数;
根据标签质量等级与反馈参数和与消耗参数之间的对应关系,以及在所述目标内容的各内容标签下的反馈参数和在所述目标内容的各内容标签下的消耗参数,确定所述目标内容的各内容标签对应的标签质量等级。
3.根据权利要求1所述的方法,其特征在于,所述标签质量等级包括优质标签和劣质标签;
所述根据各内容标签对应的标签质量等级,对各所述内容标签的级别进行调整,得到各所述内容标签的调整后级别,包括:
若所述内容标签对应的标签质量等级为优质标签,则降低所述内容标签的级别,得到所述内容标签的调整后级别;
若所述内容标签对应的标签质量等级为劣质,则提高所述内容标签的级别,得到所述内容标签的调整后级别。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标内容的全部内容标签的调整后级别,确定过滤阈值,包括:
根据级别与质量分数之间的对应关系,确定各所述内容标签的调整后级别所对应的质量分数;
在各所述内容标签的调整后级别所对应的质量分数中,确定最小质量分数,将所述最小质量分数确定为所述过滤阈值。
5.根据权利要求1所述的方法,其特征在于,所述目标内容的质量分数包括所述目标内容相对于每一候选用户的质量分数;
所述根据所述过滤阈值和所述目标内容的质量分数,对所述目标内容进行投放控制,包括:
获取目标候选用户与所述目标内容进行互动的互动概率;
根据所述互动概率确定所述目标内容相对于所述目标候选用户的质量分数;
若所述目标内容相对于所述目标候选用户的质量分数不低于所述过滤阈值,则若接收到所述目标候选用户发起的内容请求,将所述目标内容发送到所述目标候选用户;
若所述目标内容相对于所述目标候选用户的质量分数低于所述过滤阈值,则将所述目标内容过滤掉。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
计算所述目标内容的内容标签与用户集合中各用户的用户标签之间的标签匹配度;
将所述标签匹配度超过匹配度阈值的用户确定为所述目标内容的候选用户。
7.根据权利要求5所述的方法,其特征在于,所述获取目标候选用户与所述目标内容进行互动的互动概率,包括:
获取所述目标候选用户的用户信息和所述目标内容的内容信息;
由互动概率预测模型根据所述目标候选用户的用户信息和所述目标内容的内容信息,输出所述目标候选用户对所述目标内容触发互动行为的互动概率。
8.根据权利要求7所述的方法,其特征在于,所述互动行为包括按照时序由先到后的第一互动行为和第二互动行为;所述互动概率包括第一互动概率和第二互动概率,其中,所述第一互动概率是指触发所述第一互动行为的概率,所述第二互动概率是指触发所述第二互动行为的概率;
所述互动概率预测模型包括共享嵌入层、第一子神经网络和第二子神经网络;
所述由互动概率预测模型根据所述目标候选用户的用户信息和所述目标内容的内容信息,输出所述目标候选用户对所述目标内容触发互动行为的互动概率,包括:
由所述共享嵌入层根据所述目标候选用户的用户信息和所述目标内容的内容信息,对应生成所述目标候选用户的用户嵌入特征和所述目标内容的内容嵌入特征;
由所述第一子神经网络根据所述目标候选用户的用户嵌入特征和所述目标内容的内容嵌入特征进行概率预测,得到第一互动概率;
由所述第二子神经网络根据所述目标候选用户的用户嵌入特征、所述目标内容的内容嵌入特征和所述第一互动概率进行概率预测,得到所述第二互动概率。
9.根据权利要求8所述的方法,其特征在于,所述互动行为还包括第三互动行为,其中,在时序上所述第三互动行为晚于所述第二互动行为;所述互动概率还包括第三互动概率,所述第三互动概率是指触发所述第三互动行为的概率;所述互动概率预测模型还包括第三子神经网络;
所述由互动概率预测模型根据所述目标候选用户的用户信息和所述目标内容的内容信息,输出所述目标候选用户对所述目标内容触发互动行为的互动概率,还包括:
由所述第三子神经网络根据所述目标候选用户的用户嵌入特征、所述目标内容的内容嵌入特征和所述第二互动概率进行概率预测,得到所述第三互动概率。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
获取训练数据,所述训练数据包括多个训练样本,所述训练样本包括样本用户的用户信息、样本内容的内容信息和互动标签,所述互动标签包括第一互动标签、第二互动标签和第三互动标签,所述第一互动标签用于指示所述样本用户是否对所述样本内容触发第一互动行为,所述第二互动标签用于指示所述样本用户是否对所述样本内容触发第二互动行为,所述第三互动标签用于指示所述样本用户是否对所述样本内容触发第三互动行为;
由所述共享嵌入层根据所述样本用户的用户信息和所述样本内容的内容信息,对应生成所述样本用户的用户嵌入特征和所述样本内容的内容嵌入特征;
由所述第一子神经网络根据所述样本用户的用户嵌入特征和所述样本内容的内容嵌入特征进行概率预测,得到所述训练样本对应的第一预测互动概率;
由所述第二子神经网络根据所述样本用户的用户嵌入特征、所述样本内容的内容嵌入特征和所述第一预测互动概率进行概率预测,得到所述训练样本对应的第二预测互动概率;
由所述第三子神经网络根据所述样本用户的用户嵌入特征、所述样本内容的内容嵌入特征和所述第二预测互动概率进行概率预测,得到所述训练样本对应的第三预测互动概率;
根据所述第一预测互动概率和所述第一互动标签,计算第一损失;
根据所述第二预测互动概率和所述第二互动标签,计算第二损失;
根据所述第三预测互动概率和所述第三互动标签,计算第三损失;
根据所述第一损失、所述第二损失和所述第三损失,确定目标损失;
根据所述目标损失反向调整所述互动概率预测模型的参数,直至达到训练结束条件。
11.一种内容的投放控制装置,其特征在于,包括:
获取模块,用于获取目标内容的投放反馈数据和投放消耗数据;所述投放反馈数据包括在所述目标内容的各内容标签下的投放反馈记录;所述投放消耗数据包括在所述目标内容的各内容标签下的投放消耗记录;
标签质量等级确定模块,用于根据在所述目标内容的各内容标签下的投放反馈记录和在所述目标内容的各内容标签下的投放消耗记录,确定所述目标内容的各内容标签对应的标签质量等级;
级别调整模块,用于根据各内容标签对应的标签质量等级,对各所述内容标签的级别进行调整,得到各所述内容标签的调整后级别;
过滤阈值确定模块,用于根据所述目标内容的全部内容标签的调整后级别,确定过滤阈值;
投放控制模块,用于根据所述过滤阈值和所述目标内容的质量分数,对所述目标内容进行投放控制,其中,若所述目标内容的内容质量分数不低于所述过滤阈值,则投放所述目标内容,若所述目标内容的内容质量分数低于所述过滤阈值,则将所述目标内容过滤掉。
12.一种电子设备,其特征在于,包括:
处理器;
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如权利要求1-10中任一项所述的方法。
13.一种计算机可读存储介质,其上存储有计算机可读指令,其特征在于,当所述计算机可读指令被处理器执行时,实现如权利要求1-10中任一项所述的方法。
14.一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1-10中任一项所述的方法。
CN202111402518.4A 2021-11-19 2021-11-19 内容的投放控制方法及相关设备 Pending CN116150471A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111402518.4A CN116150471A (zh) 2021-11-19 2021-11-19 内容的投放控制方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111402518.4A CN116150471A (zh) 2021-11-19 2021-11-19 内容的投放控制方法及相关设备

Publications (1)

Publication Number Publication Date
CN116150471A true CN116150471A (zh) 2023-05-23

Family

ID=86356998

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111402518.4A Pending CN116150471A (zh) 2021-11-19 2021-11-19 内容的投放控制方法及相关设备

Country Status (1)

Country Link
CN (1) CN116150471A (zh)

Similar Documents

Publication Publication Date Title
US10958748B2 (en) Resource push method and apparatus
CN110458220B (zh) 人群定向方法、装置、服务器及存储介质
US20170178199A1 (en) Method and system for adaptively providing personalized marketing experiences to potential customers and users of a tax return preparation system
CN111178970B (zh) 广告投放的方法及装置、电子设备和计算机可读存储介质
US20190303980A1 (en) Training and utilizing multi-phase learning models to provide digital content to client devices in a real-time digital bidding environment
CN111125574A (zh) 用于生成信息的方法和装置
CN112819528A (zh) 人群包的上线方法、装置及电子设备
CN112633690A (zh) 服务人员信息分配方法、装置、计算机设备和存储介质
CN113761348A (zh) 一种信息推荐方法、装置、电子设备和存储介质
US11811708B2 (en) Systems and methods for generating dynamic conversational responses using cluster-level collaborative filtering matrices
CN111179030A (zh) 广告出价方法、装置及电子设备
CN116739665A (zh) 信息投放方法、装置、电子设备及存储介质
US20230316106A1 (en) Method and apparatus for training content recommendation model, device, and storage medium
CN113204699B (zh) 信息推荐方法、装置、电子设备及存储介质
CN114595323B (zh) 画像构建、推荐、模型训练方法、装置、设备及存储介质
US20220383125A1 (en) Machine learning aided automatic taxonomy for marketing automation and customer relationship management systems
CN116150471A (zh) 内容的投放控制方法及相关设备
CN115345635A (zh) 推荐内容的处理方法、装置、计算机设备和存储介质
CN113850416A (zh) 广告推广合作对象确定方法和装置
CN113378043A (zh) 用户筛选的方法和装置
CN112070564A (zh) 广告拉取方法、装置、系统与电子设备
CN114581114A (zh) 推广资源配置方法、系统、装置和存储介质
CN113822734A (zh) 用于生成信息的方法和装置
CN112785328A (zh) 一种内容推送方法、装置及计算机存储介质
CN113450127A (zh) 信息展示方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40086074

Country of ref document: HK