CN116248903A - 一种直播推荐方法、装置、电子设备及存储介质 - Google Patents
一种直播推荐方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116248903A CN116248903A CN202211733795.8A CN202211733795A CN116248903A CN 116248903 A CN116248903 A CN 116248903A CN 202211733795 A CN202211733795 A CN 202211733795A CN 116248903 A CN116248903 A CN 116248903A
- Authority
- CN
- China
- Prior art keywords
- sample
- data
- sample data
- live
- streaming
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000004927 fusion Effects 0.000 claims abstract description 53
- 238000012545 processing Methods 0.000 claims abstract description 40
- 230000006399 behavior Effects 0.000 claims description 56
- 238000006243 chemical reaction Methods 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 7
- 230000000875 corresponding effect Effects 0.000 description 19
- 230000009471 action Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 230000002596 correlated effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/2187—Live feed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4667—Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4668—Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
Abstract
本公开关于一种直播推荐方法、装置、电子设备及存储介质,包括:获取用户特征数据及行为数据;将所述用户特征数据与所述行为数据进行关联,得到流式样本数据;确定所述流式样本数据的时间窗口;将所述时间窗口内的流式样本数据输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率;根据所述预估推荐率确定待推荐样本。这样,提出一种基于MMoE多目标融合的直播实时推荐系统,用于解决优化直播场景中用户点击、观看、送礼和评论等存在用户体验不佳,用户只看不买、用户观看时间不长等直播营销困难问题。
Description
技术领域
本公开涉及互联网技术领域,尤其涉及一种直播推荐方法、装置、电子设备及存储介质。
背景技术
直播是一种高即时,强互动的内容展现形式,主播在直播过程中,可以在向观众传达内容的同时与观众进行互动,从而满足用户寻求陪伴、娱乐消遣、打发时间以及获取关注度等业务需求。各大平台通过对直播进行推荐,可以吸引更广泛的用户群体,获得更高的直播点击率。
其中,直播推荐是一个典型的多目标场景,在一个用户的行为路径中,可能会经过点击、观看、关注和点赞等行为过程,而且不同行为的发生有先后顺序和依赖关系,每一种行为都可以成为多目标模型里的一个目标。比如,当用户在歌曲播放页的时候,如果点击右上角的直播入口,这时产生点击行为,点击之后会进入到直播间,这时会产生观看行为,观看一段时间后会有一定概率发生各种互动行为,等等。
现有技术中,可以采用ESMM模型、ESMM+FM模型、基于GradNorm的Loss融合模型等模型进行直播推荐,但是,上述直播推荐模型的实现过程都较为复杂,而且所确定的待推荐直播能够带来的直播点击率和有效观看率有限,因此直播推荐的效果不佳。
发明内容
本公开提供一种直播推荐系统、方法、装置、电子设备及存储介质,以至少解决相关技术中直播推荐模型的实现过程都较为复杂,而且所确定的待推荐直播能够带来的直播点击率和有效观看率有限,因此直播推荐的效果不佳的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种直播推荐方法,包括:
获取每个直播流的用户特征数据及行为数据;
将所述用户特征数据与所述行为数据进行关联,得到流式样本数据;
对任意两个流式样本数据进行关联运算,确定所述流式样本数据之间的时间窗口;
按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率;
根据所述预估推荐率,从所述流式样本数据中确定待推荐样本,对所述待推荐样本对应的直播流进行推荐。
可选地,所述将所述用户特征数据与所述行为数据进行关联,得到流式样本数据,包括:
获取每个直播流的用户特征数据及行为数据,将所述用户特征数据及所述行为数据存储至键值对数据库;
基于预设埋点,获取埋点样本,将所述埋点样本与所述键值对数据库进行关联;
从特征集群获取兜底样本,将所述兜底样本与所述键值对数据库进行关联;
在获取到曝光样本后,查询所述曝光样本是否具有对应的转化行为;若具有,则丢弃所述曝光样本,若不具有,则将所述曝光样本标记为负样本;
将获取到的转化样本标记为正样本;所述流式样本数据中包括所述正样本及所述负样本。
可选地,所述对任意两个流式样本数据进行关联运算,确定所述流式样本数据之间的时间窗口,包括:
通过离线的方式对任意两个流式样本数据在不同的时间范围内进行关联运算;
在关联比例大于预设阈值的情况下,将所述时间范围的最小值作为所述流式样本数据之间的时间窗口。
可选地,所述按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率之前,包括:
对于分钟级的流式样本数据,按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行增量训练,对所述目标融合模型进行更新。
可选地,所述按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率,包括:
基于预设准入规则,对按照所述时间窗口截取的流式样本数据进行筛选;
将筛选结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率。
可选地,所述多目标融合模型中包括多个专家网络,每个专家网络包括一个前馈神经网络和一个可训练的门控网络,每个专家网络对应于一种用户行为。
根据本公开实施例的第二方面,提供一种直播推荐装置,包括:
获取模块,用于获取每个直播流的用户特征数据及行为数据;
关联模块,用于将所述用户特征数据与所述行为数据进行关联,得到流式样本数据;
确定模块,用于对任意两个流式样本数据进行关联运算,确定所述流式样本数据之间的时间窗口;
处理模块,用于按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率;
推荐模块,用于根据所述预估推荐率,从所述流式样本数据中确定待推荐样本,对所述待推荐样本对应的直播流进行推荐。
可选地,所述获取模块,用于:
获取每个直播流的用户特征数据及行为数据,将所述用户特征数据及所述行为数据存储至键值对数据库;
基于预设埋点,获取埋点样本,将所述埋点样本与所述键值对数据库进行关联;
从特征集群获取兜底样本,将所述兜底样本与所述键值对数据库进行关联;
在获取到曝光样本后,查询所述曝光样本是否具有对应的转化行为;若具有,则丢弃所述曝光样本,若不具有,则将所述曝光样本标记为负样本;
将获取到的转化样本标记为正样本;所述流式样本数据中包括所述正样本及所述负样本。
可选地,所述确定模块,用于:
通过离线的方式对任意两个流式样本数据在不同的时间范围内进行关联运算;
在关联比例大于预设阈值的情况下,将所述时间范围的最小值作为所述流式样本数据之间的时间窗口。
可选地,所述确定模块,用于:
对于分钟级的流式样本数据,按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行增量训练,对所述目标融合模型进行更新。
可选地,所述处理模块,用于:
基于预设准入规则,对按照所述时间窗口截取的流式样本数据进行筛选;
将筛选结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率。
可选地,所述多目标融合模型中包括多个专家网络,每个专家网络包括一个前馈神经网络和一个可训练的门控网络,每个专家网络对应于一种用户行为。
根据本公开实施例的第三方面,提供一种直播推荐电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现所述任一项所述的直播推荐方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由直播推荐电子设备的处理器执行时,使得直播推荐电子设备能够执行所述任一项所述的直播推荐方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现所述任一项所述的直播推荐方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
获取每个直播流的用户特征数据及行为数据;将用户特征数据与行为数据进行关联,得到流式样本数据;对任意两个流式样本数据进行关联运算,确定流式样本数据之间的时间窗口;按照时间窗口截取流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定流式样本数据的预估推荐率;根据预估推荐率,从流式样本数据中确定待推荐样本,对待推荐样本对应的直播流进行推荐。
这样,提出一种基于MMoE多目标融合的直播实时推荐系统,用于解决优化直播场景中用户点击、观看、送礼和评论等存在用户体验不佳,用户只看不买、用户观看时间不长等直播营销困难问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种直播推荐方法的流程图。
图2是本发明实施例基于Flink+Kafka的实时推荐系统架构图。
图3是根据一示例性实施例示出的一种直播推荐装置的框图。
图4是根据一示例性实施例示出的一种用于直播推荐的电子设备的框图。
图5是根据一示例性实施例示出的一种用于直播推荐的装置的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及所述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种直播推荐方法的流程图,如图1所示,该直播推荐方法包括:
在步骤S11中,获取每个直播流的用户特征数据及行为数据。
直播是一种高即时,强互动的内容展现形式,主播在直播过程中,可以在向观众传达内容的同时与观众进行互动,从而满足用户寻求陪伴、娱乐消遣、打发时间以及获取关注度等业务需求。各大平台通过对直播进行推荐,可以吸引更广泛的用户群体,获得更高的直播点击率。
其中,直播推荐是一个典型的多目标场景,在一个用户的行为路径中,可能会经过点击、观看、关注和点赞等行为过程,而且不同行为的发生有先后顺序和依赖关系,每一种行为都可以成为多目标模型里的一个目标。比如,当用户在歌曲播放页的时候,如果点击右上角的直播入口,这时产生点击行为,点击之后会进入到直播间,这时会产生观看行为,观看一段时间后会有一定概率发生各种互动行为,等等。
在本申请中,可以可以根据时效性把用户特征数据及行为数据分为三个粒度:
(a)毫秒级特征:依靠客户端在请求的过程中填入时间、地点、场景等上下文特征;
(b)秒/分钟级特征:依靠流式计算,做一些简单的统计类特征的计算和聚合用户行为反馈数据等,比如统计主播在某个时间窗口的点击次数等;
(c)小时级特征:依靠离线计算,可以进行更高阶的特征组合的工作,比如统计用户在某个时间窗口对主播标签的转化率分布情况等。
在步骤S12中,将用户特征数据与行为数据进行关联,得到流式样本数据。
一种实现方式中,将用户特征数据与行为数据进行关联,得到流式样本数据,包括:
获取每个直播流的用户特征数据及行为数据,将用户特征数据及行为数据存储至键值对数据库;基于预设埋点,获取埋点样本,将埋点样本与键值对数据库进行关联;从特征集群获取兜底样本,将兜底样本与键值对数据库进行关联;在获取到曝光样本后,查询曝光样本是否具有对应的转化行为;若具有,则丢弃曝光样本,若不具有,则将曝光样本标记为负样本;将获取到的转化样本标记为正样本;流式样本数据中包括正样本及负样本。
具体来说,在本步骤中,可以基于Flink+Kafka的实时推荐系统架构图,用于整个直播实时推荐系统生产流式样本。整体业务流程如下:
(1)线上预估请求所用到的原始特征在旁路环境dump存储到Kafka,经过Flink解析,按照一个格式写入KV(Key-value数据库,是一种以键值对存储数据的数据库)。
(2)Flink任务1:将埋点与snapshot(数据库表快照)进行拼接,将traceid,userid,itemid和曝光转化(曝光为0,转化为1)拼成一个key写入Redis,供后面的正负样本标记使用,用曝光、转化去关联KV中的snapshot,将能关联上的结果写入拼接成功的Kafka,关联不上的结果写入拼接失败的Kafka。
其中,数据库表快照功能可以在某些时间点为数据表创建快照,保护快照时间点的数据不被修改,并可根据需要快速恢复快照点数据,从而达到高效、可靠的数据备份恢复能力。
(3)Flink任务2:进行兜底样本拼接。消费拼接snapshot失败的Kafka,去特征tair集群拿相应特征生成snapshot,并将结果写入拼接成功的Kafka。
(4)Flink任务3:进行正负样本拼接。消费拼接成功的Kafka,数据延迟M分钟处理。这里的M是通过样本归因设置的,目前调优的结果为M=20。当来了一条曝光样本,可以在Redis中查找是否有对应的转化行为,如果能查到,就丢弃当前曝光样本,否则标记当前曝光样本为负样本(label=0)。当来了一条转化样本,则直接标记为正样本(label=1)。
此外,为了解决埋点重复上报的问题,可以采用如下方式:
当来了一条曝光样本,通过traceid_userid_itemid_0去Redis查找该key,判断对应的value是否为1,如果是则过滤掉该样本,否则修改其value为1;转化样本同理。最后,将上述拼接后的数据写入Kafka。
(5)Flink任务4:消费Kafka的样本数据,进行特征抽取、格式处理,并写到HDFS。
在步骤S13中,对任意两个流式样本数据进行关联运算,确定流式样本数据之间的时间窗口。
在本申请中,为解决在流式样本归因过程中产生的实时性和准确性的问题,即延迟反馈。比如,可以采用Flink进行延迟处理,首先要确定两个数据流关联的时间窗口,通过离线的方式对两份数据在不同的时间范围内做join,以此判断在线需要的时间窗口。
举例而言,如果业务接受的最低关联比例是95%,并且通过离线测试确认20分钟内两个数据流可以关联95%的数据,那么就可以用20分钟作为时间窗口,这里的关联比例和窗口时间就是在准确性和实时性之间做一个权衡。
一种实现方式中,对任意两个流式样本数据进行关联运算,确定流式样本数据之间的时间窗口,包括:
通过离线的方式对任意两个流式样本数据在不同的时间范围内进行关联运算;在关联比例大于预设阈值的情况下,将时间范围的最小值作为流式样本数据之间的时间窗口。
在步骤S14中,按照时间窗口截取流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定流式样本数据的预估推荐率。
一种实现方式中,按照时间窗口截取流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定流式样本数据的预估推荐率之前,包括:
对于分钟级的流式样本数据,按照时间窗口截取流式样本数据,将截取结果输入至多目标融合模型中进行增量训练,对目标融合模型进行更新。
其中,增量训练并非一直增量,而是配合全量训练,因为如果一直使用增量模型,时间长了会产生一定的偏差,偏差累积效应会影响线上效果,因此,通过定期的全量更新进行矫正是必须的。
对于分钟级的流式样本,可以通过训练增量地对模型进行更新;或者,也可以通过全量样本对模型进行全量更新。此外,在低频的特征进入模型训练会导致模型预估结果不置信,这种情况需要对特征设置准入规则,设置特征频次过滤低频特征,或者对低频特征施加比较大的正则项。特征规模一直增长也会给线上预估性能和机器内存带来压力,为此可通过对特征进行淘汰来解决,淘汰长时间未更新的特征。
一种实现方式中,按照时间窗口截取流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定流式样本数据的预估推荐率,包括:
基于预设准入规则,对按照时间窗口截取的流式样本数据进行筛选;将筛选结果输入至多目标融合模型中进行处理,确定流式样本数据的预估推荐率。
一种实现方式中,多目标融合模型中包括多个专家网络,每个专家网络包括一个前馈神经网络和一个可训练的门控网络,每个专家网络对应于一种用户行为。
在步骤S15中,根据预估推荐率,从流式样本数据中确定待推荐样本,对待推荐样本对应的直播流进行推荐。
在本申请中,直播推荐是一个典型的多目标场景,在一个用户的行为路径中,会经过点击、观看、关注和打赏等过程,而且不同行为的发生有先后顺序和依赖关系,用户的每一种行为都可以成为多目标模型里的一个目标,因而本专利实施例采用联合建模,即通过一个模型同时训练多个目标,线上进行多目标融合。
由以上可见,本公开的实施例提供的技术方案,提出一种基于MMoE多目标融合的直播实时推荐系统,用于解决优化直播场景中用户点击、观看、送礼和评论等存在用户体验不佳,用户只看不买、用户观看时间不长等直播营销困难问题。
下面以一个具体实施例,对本发明实施例中的方法进行说明,该实施例中,基于MMoE多目标融合的直播实时推荐系统,主要由实时推荐系统和多目标融合两大部分组成,其中多目标融合在推荐系统的推荐排序阶段执行,采用多个模型方式用于对比多目标融合对整个推荐系统的影响,并用CTR(预估点击率)和CTCVR(预估转化率)来判定模型的鲁棒性。主要步骤如下:
步骤一:流式样本。图2是本发明实施例基于Flink+Kafka的实时推荐系统架构图,用于整个直播实时推荐系统生产流式样本。如图2所示,整体业务流程如下:
(1)线上预估请求所用到的原始特征在旁路环境dump存储到Kafka,经过Flink解析,按照一个格式写入KV(Key-value数据库,是一种以键值对存储数据的数据库)。
(2)Flink任务1:将埋点与snapshot进行拼接,将traceid,userid,itemid和曝光转化(曝光为0,转化为1)拼成一个key写入Redis,供后面的正负样本标记使用。用曝光、转化去关联KV中的snapshot,将能关联上的结果写入拼接成功的Kafka,关联不上的结果写入拼接失败的Kafka。
(3)Flink任务2:进行兜底样本拼接。消费拼接snapshot失败的Kafka,去特征tair集群拿相应特征生成snapshot,并将结果写入拼接成功的Kafka。
(4)Flink任务3:进行正负样本拼接。消费拼接成功的Kafka,数据延迟M分钟处理。这里的M是通过样本归因设置的,目前调优的结果为M=20。当来了一条曝光样本,我们去Redis查找是否有对应的转化行为,如果能查到,就丢弃当前曝光样本,否则标记当前曝光样本为负样本(label=0)。当来了一条转化样本,则直接标记为正样本(label=1)。
此外,为了解决埋点重复上报的问题,本专利采用如下方式:当来了一条曝光样本,通过traceid_userid_itemid_0去Redis查找该key,判断对应的value是否为1,如果是则过滤掉该样本,否则修改其value为1;转化样本同理。最后,将上述拼接后的数据写入Kafka。
(5)Flink任务4:消费Kafka的样本数据,进行特征抽取、格式处理,并写到HDFS。
步骤二:样本归因。本发明实施例中使用Flink进行延迟处理。首先要确定两个数据流关联的时间窗口,通过离线的方式对两份数据在不同的时间范围内做join,以此判断在线需要的时间窗口。比如业务接受的最低关联比例是95%,并且通过离线测试确认20分钟内两个数据流可以关联95%的数据,那么就可以用20分钟作为时间窗口。这里的关联比例和窗口时间就是在准确性和实时性之间做一个权衡。
步骤三:增量训练。增量训练并非一直增量,而是配合全量训练,因为如果一直使用增量模型,时间长了会产生一定的偏差,偏差累积效应会影响线上效果,因此,通过定期的全量更新进行矫正是必须的。
此外,在低频的特征进入模型训练会导致模型预估结果不置信,这种情况需要对特征设置准入规则,设置特征频次过滤低频特征,或者对低频特征施加比较大的正则项。特征规模一直增长也会给线上预估性能和机器内存带来压力,为此可通过对特征进行淘汰来解决,淘汰长时间未更新的特征。
步骤四:多目标融合。直播推荐是一个典型的多目标场景,在一个用户的行为路径中,会经过点击、观看、关注和打赏等过程,而且不同行为的发生有先后顺序和依赖关系,用户的每一种行为都可以成为多目标模型里的一个目标,因而本专利实施例采用联合建模,即通过一个模型同时训练多个目标,线上进行多目标融合。
MoE神经网络结构:
MoE由许多“专家”组成,每个“专家”都有一个简单的前馈神经网络和一个可训练的门控网络(gating network),该门控网络选择“专家”的一个稀疏组合来处理每个输入,它可以实现自动分配参数以捕获多个任务可共享的信息或是特定于某个任务的信息,而无需为每个任务添加很多新参数,而且网络的所有部分都可以通过反向传播一起训练。
MTL的Shared-Bottom DNN网络结构:
Shared-Bottom网络位于底部,表示为函数f,多个任务共用这一层。K个子任务分别对应一个tower network,表示为hk,每个子任务的输出yk=hk(f(x))。
用一组专家网络(expert network)组成的神经网络结构来替换Shared-Bottom部分函数f,这里的每一个“专家”都是一个前馈神经网络,再加上一个门控网络,就构成了MoE结构的MTL模型,也称之为OMoE结构。
MoE模型可以形式化表示为
其中,fi(i=1,...,n)是n个专家(export)网络,g是组合exports结果的门控网络(gating network)。
MMOE网络结构则在OMoE基础上,采用多个门控网络。
MMoE可以形式化表达为
yk=hk(fk(x))
其中,gk(x)=softmax(Wgkx),输入是input feature,输出为Experts上的权重。
由以上可见,本公开的实施例提供的技术方案,提出一种基于MMoE多目标融合的直播实时推荐系统,用于解决优化直播场景中用户点击、观看、送礼和评论等存在用户体验不佳,用户只看不买、用户观看时间不长等直播营销困难问题。
图3是根据一示例性实施例示出的一种直播推荐装置框图,包括:
获取模块201,用于获取每个直播流的用户特征数据及行为数据;
关联模块202,用于将所述用户特征数据与所述行为数据进行关联,得到流式样本数据;
确定模块203,用于对任意两个流式样本数据进行关联运算,确定所述流式样本数据之间的时间窗口;
处理模块204,用于按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率;
推荐模块205,用于根据所述预估推荐率,从所述流式样本数据中确定待推荐样本,对所述待推荐样本对应的直播流进行推荐。
可选地,所述获取模块201,用于:
获取每个直播流的用户特征数据及行为数据,将所述用户特征数据及所述行为数据存储至键值对数据库;
基于预设埋点,获取埋点样本,将所述埋点样本与所述键值对数据库进行关联;
从特征集群获取兜底样本,将所述兜底样本与所述键值对数据库进行关联;
在获取到曝光样本后,查询所述曝光样本是否具有对应的转化行为;若具有,则丢弃所述曝光样本,若不具有,则将所述曝光样本标记为负样本;
将获取到的转化样本标记为正样本;所述流式样本数据中包括所述正样本及所述负样本。
可选地,所述确定模块203,用于:
通过离线的方式对任意两个流式样本数据在不同的时间范围内进行关联运算;
在关联比例大于预设阈值的情况下,将所述时间范围的最小值作为所述流式样本数据之间的时间窗口。
可选地,所述确定模块203,用于:
对于分钟级的流式样本数据,按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行增量训练,对所述目标融合模型进行更新。
可选地,所述处理模块204,用于:
基于预设准入规则,对按照所述时间窗口截取的流式样本数据进行筛选;
将筛选结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率。
可选地,所述多目标融合模型中包括多个专家网络,每个专家网络包括一个前馈神经网络和一个可训练的门控网络,每个专家网络对应于一种用户行为。
由以上可见,本公开的实施例提供的技术方案,提出一种基于MMoE多目标融合的直播实时推荐系统,用于解决优化直播场景中用户点击、观看、送礼和评论等存在用户体验不佳,用户只看不买、用户观看时间不长等直播营销困难问题。
图4是根据一示例性实施例示出的一种用于直播推荐的电子设备的框图。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器,所述指令可由电子设备的处理器执行以完成所述方法。可选地,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,当其在计算机上运行时,使得计算机实现所述直播推荐的方法。
由以上可见,本公开的实施例提供的技术方案,提出一种基于MMoE多目标融合的直播实时推荐系统,用于解决优化直播场景中用户点击、观看、送礼和评论等存在用户体验不佳,用户只看不买、用户观看时间不长等直播营销困难问题。
图5是根据一示例性实施例示出的一种用于直播推荐的装置800的框图。
例如,装置800可以是移动电话,计算机,数字广播电子设备,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电力组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成所述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件807为装置800的各种组件提供电力。电源组件807可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和账户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自账户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,所述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,账户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行第一方面和第二方面所述的方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,所述指令可由装置800的处理器820执行以完成所述方法。可选地,例如,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性非临时性计算机可读存储介质计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行所述实施例中任一所述的直播推荐方法。
由以上可见,本公开的实施例提供的技术方案,提出一种基于MMoE多目标融合的直播实时推荐系统,用于解决优化直播场景中用户点击、观看、送礼和评论等存在用户体验不佳,用户只看不买、用户观看时间不长等直播营销困难问题。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (15)
1.一种直播推荐方法,其特征在于,包括:
获取每个直播流的用户特征数据及行为数据;
将所述用户特征数据与所述行为数据进行关联,得到流式样本数据;
对任意两个流式样本数据进行关联运算,确定所述流式样本数据之间的时间窗口;
按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率;
根据所述预估推荐率,从所述流式样本数据中确定待推荐样本,对所述待推荐样本对应的直播流进行推荐。
2.根据权利要求1所述的直播推荐方法,其特征在于,所述将所述用户特征数据与所述行为数据进行关联,得到流式样本数据,包括:
获取每个直播流的用户特征数据及行为数据,将所述用户特征数据及所述行为数据存储至键值对数据库;
基于预设埋点,获取埋点样本,将所述埋点样本与所述键值对数据库进行关联;
从特征集群获取兜底样本,将所述兜底样本与所述键值对数据库进行关联;
在获取到曝光样本后,查询所述曝光样本是否具有对应的转化行为;若具有,则丢弃所述曝光样本,若不具有,则将所述曝光样本标记为负样本;
将获取到的转化样本标记为正样本;所述流式样本数据中包括所述正样本及所述负样本。
3.根据权利要求1所述的直播推荐方法,其特征在于,所述对任意两个流式样本数据进行关联运算,确定所述流式样本数据之间的时间窗口,包括:
通过离线的方式对任意两个流式样本数据在不同的时间范围内进行关联运算;
在关联比例大于预设阈值的情况下,将所述时间范围的最小值作为所述流式样本数据之间的时间窗口。
4.根据权利要求3所述的直播推荐方法,其特征在于,所述按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率之前,包括:
对于分钟级的流式样本数据,按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行增量训练,对所述目标融合模型进行更新。
5.根据权利要求1所述的直播推荐方法,其特征在于,所述按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率,包括:
基于预设准入规则,对按照所述时间窗口截取的流式样本数据进行筛选;
将筛选结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率。
6.根据权利要求1所述的直播推荐方法,其特征在于,所述多目标融合模型中包括多个专家网络,每个专家网络包括一个前馈神经网络和一个可训练的门控网络,每个专家网络对应于一种用户行为。
7.一种直播推荐装置,其特征在于,包括:
获取模块,用于获取每个直播流的用户特征数据及行为数据;
关联模块,用于将所述用户特征数据与所述行为数据进行关联,得到流式样本数据;
确定模块,用于对任意两个流式样本数据进行关联运算,确定所述流式样本数据之间的时间窗口;
处理模块,用于按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率;
推荐模块,用于根据所述预估推荐率,从所述流式样本数据中确定待推荐样本,对所述待推荐样本对应的直播流进行推荐。
8.根据权利要求7所述的直播推荐装置,其特征在于,所述获取模块,用于:
获取每个直播流的用户特征数据及行为数据,将所述用户特征数据及所述行为数据存储至键值对数据库;
基于预设埋点,获取埋点样本,将所述埋点样本与所述键值对数据库进行关联;
从特征集群获取兜底样本,将所述兜底样本与所述键值对数据库进行关联;
在获取到曝光样本后,查询所述曝光样本是否具有对应的转化行为;若具有,则丢弃所述曝光样本,若不具有,则将所述曝光样本标记为负样本;
将获取到的转化样本标记为正样本;所述流式样本数据中包括所述正样本及所述负样本。
9.根据权利要求7所述的直播推荐装置,其特征在于,所述确定模块,用于:
通过离线的方式对任意两个流式样本数据在不同的时间范围内进行关联运算;
在关联比例大于预设阈值的情况下,将所述时间范围的最小值作为所述流式样本数据之间的时间窗口。
10.根据权利要求9所述的直播推荐装置,其特征在于,所述确定模块,用于:
对于分钟级的流式样本数据,按照所述时间窗口截取所述流式样本数据,将截取结果输入至多目标融合模型中进行增量训练,对所述目标融合模型进行更新。
11.根据权利要求7所述的直播推荐装置,其特征在于,所述处理模块,用于:
基于预设准入规则,对按照所述时间窗口截取的流式样本数据进行筛选;
将筛选结果输入至多目标融合模型中进行处理,确定所述流式样本数据的预估推荐率。
12.根据权利要求7所述的直播推荐装置,其特征在于,所述多目标融合模型中包括多个专家网络,每个专家网络包括一个前馈神经网络和一个可训练的门控网络,每个专家网络对应于一种用户行为。
13.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的直播推荐方法。
14.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由直播推荐电子设备的处理器执行时,使得直播推荐电子设备能够执行如权利要求1至6中任一项所述的直播推荐方法。
15.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6任一项所述的直播推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211733795.8A CN116248903A (zh) | 2022-12-30 | 2022-12-30 | 一种直播推荐方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211733795.8A CN116248903A (zh) | 2022-12-30 | 2022-12-30 | 一种直播推荐方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116248903A true CN116248903A (zh) | 2023-06-09 |
Family
ID=86625268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211733795.8A Pending CN116248903A (zh) | 2022-12-30 | 2022-12-30 | 一种直播推荐方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116248903A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100211439A1 (en) * | 2006-09-05 | 2010-08-19 | Innerscope Research, Llc | Method and System for Predicting Audience Viewing Behavior |
CN110008399A (zh) * | 2019-01-30 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种推荐模型的训练方法及装置、一种推荐方法及装置 |
US10701409B1 (en) * | 2018-10-08 | 2020-06-30 | Alphonso Inc. | System and method for selectively replacing commercials that are in a video data stream with alternative commercials |
CN113610582A (zh) * | 2021-08-16 | 2021-11-05 | 脸萌有限公司 | 广告推荐方法、装置、存储介质及电子设备 |
CN114117216A (zh) * | 2021-11-23 | 2022-03-01 | 广州博冠信息科技有限公司 | 推荐概率预测方法及装置、计算机存储介质和电子设备 |
-
2022
- 2022-12-30 CN CN202211733795.8A patent/CN116248903A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100211439A1 (en) * | 2006-09-05 | 2010-08-19 | Innerscope Research, Llc | Method and System for Predicting Audience Viewing Behavior |
US10701409B1 (en) * | 2018-10-08 | 2020-06-30 | Alphonso Inc. | System and method for selectively replacing commercials that are in a video data stream with alternative commercials |
CN110008399A (zh) * | 2019-01-30 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种推荐模型的训练方法及装置、一种推荐方法及装置 |
CN113610582A (zh) * | 2021-08-16 | 2021-11-05 | 脸萌有限公司 | 广告推荐方法、装置、存储介质及电子设备 |
CN114117216A (zh) * | 2021-11-23 | 2022-03-01 | 广州博冠信息科技有限公司 | 推荐概率预测方法及装置、计算机存储介质和电子设备 |
Non-Patent Citations (1)
Title |
---|
黄斌;彭志平;: "基于级联过滤的多模型融合的推荐方法", 小型微型计算机系统, no. 01, 15 January 2016 (2016-01-15) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2640632C2 (ru) | Способ и устройство для доставки информации | |
CN109858614B (zh) | 神经网络训练方法及装置、电子设备和存储介质 | |
CN111160448B (zh) | 一种图像分类模型的训练方法及装置 | |
CN109714643B (zh) | 视频数据的推荐方法、系统及服务器和存储介质 | |
CN113449773A (zh) | 模型更新方法、装置、存储介质及电子设备 | |
CN112148923A (zh) | 搜索结果的排序方法、排序模型的生成方法、装置及设备 | |
CN114049529A (zh) | 用户行为预测方法、模型训练方法、电子设备及存储介质 | |
CN110941727B (zh) | 一种资源推荐方法、装置、电子设备及存储介质 | |
CN111859097B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN116248903A (zh) | 一种直播推荐方法、装置、电子设备及存储介质 | |
CN111143608A (zh) | 一种信息推送方法、装置、电子设备及存储介质 | |
CN115994266A (zh) | 资源推荐方法、装置、电子设备和存储介质 | |
CN115373718A (zh) | 线上模型的更新方法、装置及电子设备 | |
CN115409094A (zh) | 设备故障的预测方法、装置及存储介质 | |
CN111984864B (zh) | 对象推荐方法、装置、电子设备和存储介质 | |
CN114036917A (zh) | 报告生成方法、装置、计算机设备及存储介质 | |
CN110929771A (zh) | 图像样本分类方法及装置、电子设备、可读存储介质 | |
CN114785852B (zh) | 一种推送内容确定方法、装置、电子设备及存储介质 | |
CN113704315B (zh) | 一种用户推荐方法、装置、电子设备及存储介质 | |
CN112989172B (zh) | 内容推荐方法、装置、计算机设备及存储介质 | |
CN111754251B (zh) | 广告投放方法、装置、服务器及存储介质 | |
CN113742566B (zh) | 多媒体信息的推荐方法、装置、电子设备和存储介质 | |
CN115484471B (zh) | 主播推荐方法及装置 | |
CN113495966A (zh) | 交互操作信息的确定方法、装置及视频的推荐系统 | |
CN115409604A (zh) | 对象意图信息的预测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 100007 room 205-32, floor 2, building 2, No. 1 and No. 3, qinglonghutong a, Dongcheng District, Beijing Applicant after: Tianyiyun Technology Co.,Ltd. Address before: 100093 Floor 4, Block E, Xishan Yingfu Business Center, Haidian District, Beijing Applicant before: Tianyiyun Technology Co.,Ltd. |
|
CB02 | Change of applicant information |