一种基于优先级的内容推荐方法、装置、设备及介质
技术领域
本发明涉及推荐领域,尤其涉及一种基于优先级的内容推荐方法、装置、设备及介质。
背景技术
Feeds是将用户主动订阅的若干消息源组合在一起形成内容聚合器,帮助用户持续地获取最新的订阅源内容。Feeds流可以持续从不同内容源获取最新的订阅源内容,并有针对性地呈现给用户。现有技术中为了确保呈现给用户的内容的质量和合法性,通常要在呈现给用户之前对于Feeds流中的源内容进行人工审核,并将审核通过的源内容推送给客户。
在人工审核环节,现有技术中将Feeds流中的源内容存入内容数据库,审核人员按照源内容入库的时间顺序进行领单并审核。但是由于大部分源内容质量较低,且Feeds具有时效性,从而导致人工审核环节中大量优质内容无法及时进行审核,影响了基于Feeds流推荐的内容的时效性。
发明内容
为了解决现有技术中按照Feeds流中源内容入库时间领单审核,导致基于Feeds流进行内容推荐的实时性和质量均较差的技术问题。本发明实施例提供一种基于优先级的内容推荐方法、装置、设备及介质。
一方面,本发明提供了一种基于优先级的内容推荐方法,所述方法包括:
获取内容信息流,调用内容切分服务将所述内容信息流中的源内容发送至审核桶集中的至少一个审核桶中;其中,每个所述审核桶用于根据所述审核桶对应的优先级排序策略为所述审核桶中的源内容生成优先级,对所述审核桶中的源内容按照优先级进行降序排列以得到源内容优先级排序结果;
调用流量切分服务对所述审核桶集中至少一个审核桶中的源内容优先级排序结果进行流量切分以得到领单数据,所述领单数据包括多个源内容;
获取对所述领单数据的审核结果,根据所述审核结果获取目标内容;
推荐所述目标内容。
另一方面,本发明提供一种基于优先级的内容推荐装置,所述装置包括:
内容信息流获取模块,用于获取内容信息流,调用内容切分服务将所述内容信息流中的源内容发送至审核桶集中的至少一个审核桶中;其中,每个所述审核桶用于根据所述审核桶对应的优先级排序策略为所述审核桶中的源内容生成优先级,对所述审核桶中的源内容按照优先级进行降序排列以得到源内容优先级排序结果;
领单数据提取模块,用于调用流量切分服务对所述审核桶集中至少一个审核桶中的源内容优先级排序结果进行流量切分以得到领单数据,所述领单数据包括多个源内容;
审核模块,用于获取对所述领单数据的审核结果,根据所述审核结果获取目标内容;
推荐模块,用于推荐所述目标内容。
另一方面,本发明提供了一种基于优先级的内容推荐设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现一种基于优先级的内容推荐方法。
另一方面,本发明提供了一种计算机存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行一种基于优先级的内容推荐方法。
本发明提供了一种基于优先级的内容推荐方法、装置、设备及介质。本发明中领单数据是根据各个审核桶中的源内容优先级排序结果所确定的,这就使得审核人员可以对优先级排序较高的源数据优先审核,通过设计优先级排序领单替代原有的时间排序领单,屏蔽了时间对源内容的影响,保证了实时内容能够及时出库,避免了后入库内容一直被积压得不到审核的情况,借此使用有限的审核人力找出更多的优质内容,从而提高整体内容审核效率,有效识别出入库内容中更加优质的内容,提高源内容启用量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本发明提供的一种基于优先级的内容推荐方法的实施环境示意图;
图2是本发明提供的区块链系统的一个可选的结构示意图;
图3是本发明提供的区块结构(Block Structure)一个可选的示意图;
图4是本发明提供的一种基于优先级的内容推荐方法的流程图;
图5是本发明提供的调用内容切分服务将所述内容信息流中的源内容发送至审核桶集中的至少一个审核桶中的流程图;
图6是本发明提供的对所述审核桶中的源内容按照优先级进行降序排列以得到源内容优先级排序结果流程图;
图7是本发明提供的多模型融合调度模型的示意图;
图8是本发明提供的调用流量切分服务对所述审核桶集中至少一个审核桶中的源内容优先级排序结果进行流量切分以得到领单数据流程图;
图9是本发明提供的设置对照桶集,基于所述对照桶集对内容切分服务和流量切分服务进行反馈调整流程图;
图10是本发明提供的基于AB测试的内容推荐方法的实施示意图;
图11是本发明提供的一种基于优先级的内容推荐装置框图;
图12是本发明提供的一种用于实现本发明实施例所提供的方法的设备的硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了使本发明实施例公开的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明实施例进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本发明实施例,并不用于限定本发明实施例。
以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。为了便于理解本发明实施例所述的技术方案及其产生的技术效果,本发明实施例首先对于相关专业名词进行解释:
Feeds流:Feeds是将用户主动订阅的若干消息源组合在一起形成内容聚合器,帮助用户持续地获取最新的订阅源内容。Feeds流即持续更新并呈现给用户内容的内容信息流。
PV(Page View):即页面浏览量,或点击量,反应了页面的所有用户点击量,通常是衡量一个网络新闻频道或网站甚至一条网络新闻的主要指标。
VV(Video View):即视频播放量,PV通常用于衡量图文内容页面,VV反应了视频的所有用户播放量,VV的出现显示出用户对视频内容的接受程度。
AB测试(ABTest):是一套实时分流服务方案,可以把用户流量科学地分配到不同的实验分组中,先验、并行、科学地验证不同实验方案,具有数据共享、实验隔离、风险可控、指标聚合、可扩展等优势。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
循环神经网络:循环神经网络(Recurrent Neural Network,RNN)是一类以序列(sequence)数据为输入,在序列的演进方向进行递归(recursion)且所有节点(循环单元)按链式连接的递归神经网络(recursive neural network)。其中双向循环神经网络(Bidirectional RNN,Bi-RNN)和长短期记忆网络(Long Short-Term Memory networks,LSTM)是常见的循环神经网络。
卷积神经网络:卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deep learning)的代表算法之一。卷积神经网络具有表征学习(representationlearning)能力,能够按其阶层结构对输入信息进行平移不变分类(shift-invariantclassification),因此也被称为“平移不变人工神经网络(Shift-Invariant ArtificialNeural Networks,SIANN)”。
决策树:决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,代表的是对象属性与对象值之间的一种映射关系。决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。基于决策树的机器学习就被称之为监督学习。
随机树:随机树是指随机过程建立的树或者树状图。
随机森林:在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。
随着Feeds流中信息量的快速增加,源内容的量级正在快速增长,但是审核人员的处理能力无法跟上源内容的增长速度,从而导致了内容积压问题日益严重。现有技术中按照Feeds流中源内容入库时间领单审核,而源内容入库的速度大于审核人员的处理速度,这会导致后入库的大量内容一直不能被审核,从而影响基于Feeds流进行内容推荐的实时性。由于审核人员的审核能力有限,因此按照源内容入库时间进行审核的审核策略只能按时间顺序审核位于内容数据库头部的源内容,无法使用有限的人力找出最大量的优质源内容;并且受限于整体源内容的质量较低,审核位于内容数据库头部的源内容得到的推荐内容与全局最优质的内容差别较大,这将进一步影响基于Feeds流进行内容推荐的质量。
为了提升基于Feeds流进行内容推荐的实时性和提升基于Feeds流推荐的内容的质量,本发明实施例公开一种基于优先级的内容推荐方法。
首先,本发明实施例公开了在一个可行的实施例中所述一种基于优先级的内容推荐方法的实施环境。
参见图1,该实施环境包括:至少一个客户端01和服务器03。
客户端01可以包括:智能手机、平板电脑、笔记本电脑、数字助理、智能可穿戴设备、车载终端等类型的实体设备,也可以包括运行于实体设备中的软体,例如具有内容推荐功能的应用程序等。所述具有内容推荐功能的应用程序可以是新闻类应用程序、视频类应用程序、音频类应用程序、社交类应用程序、图文类应用程序。所述客户端01可以基于浏览器/服务器模式(Browser/Server,B/S)或客户端/服务器模式(Client/Server,C/S)与所述服务器03通信连接。
服务器03可以从分布式系统中的各个节点获取源内容从而得到Feeds流。将Feeds流中的源内容存储至内容数据库,调用内容切分服务对内容数据库中的存储的源内容进行内容切分以便于将所述源内容发送至预设的审核桶集中的至少一个审核桶中,不同的审核桶使用不同的优先级排序策略对所述审核桶中的源数据按照优先级降序顺序进行排序;调用流量切分服务对所述审核桶集中各个审核桶中的源内容排序结果进行流量切分以得到领单数据,根据对所述领单数据的审核结果进行内容推荐。推荐的内容可以被发送并呈现在客户端01中。
所述服务器03可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群。
所述分布式系统具体可以为区块链结构,所述区块链结构中的任意一个节点都可以为服务器03提供源内容。所述内容数据库也可以为区块链结构。
在一个优选的实施例中,所述源内容存储于区块链系统之中。参见图2,图2是本发明实施例提供的区块链系统的一个可选的结构示意图,多个节点之间形成组成的点对点(P2P,Peer To Peer)网络,P2P协议是一个运行在传输控制协议(TCP,TransmissionControl Protocol)协议之上的应用层协议。在区块链系统中,任何机器如服务器、终端都可以加入而成为节点,节点包括硬件层、中间层、操作系统层和应用层。
参见图2示出的区块链系统中各节点的功能,涉及的功能包括:
1)路由,节点具有的基本功能,用于支持节点之间的通信。
节点除具有路由功能外,还可以具有以下功能:
2)应用,用于部署在区块链中,根据实际业务需求而实现特定业务,记录实现功能相关的数据形成记录数据,在记录数据中携带数字签名以表示任务数据的来源,将记录数据发送到区块链系统中的其他节点,供其他节点在验证记录数据来源以及完整性成功时,将记录数据添加到临时区块中。
3)区块链,包括一系列按照产生的先后时间顺序相互接续的区块(Block),新区块一旦加入到区块链中就不会再被移除,区块中记录了区块链系统中节点提交的记录数据。
参见图3,图3是本发明实施例提供的区块结构(Block Structure)一个可选的示意图,每个区块中包括本区块存储交易记录的哈希值(本区块的哈希值)、以及前一区块的哈希值,各区块通过哈希值连接形成区块链。另外,区块中还可以包括有区块生成时的时间戳等信息。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了相关的信息,用于验证其信息的有效性(防伪)和生成下一个区块。
请参考图4,其示出了一种基于优先级的内容推荐方法的流程图,所述方法可以以图1所述的实施环境中的服务器为执行主体实施,所述方法可以包括:
S101.获取内容信息流,调用内容切分服务将所述内容信息流中的源内容发送至审核桶集中的至少一个审核桶中;其中,每个所述审核桶用于根据所述审核桶对应的优先级排序策略为所述审核桶中的源内容生成优先级,对所述审核桶中的源内容按照优先级进行降序排列以得到源内容优先级排序结果。
具体地,实时产生的内容信息流(Feeds流)中的源内容可以被存储于内容数据库,所述内容数据库中的源内容可以基于所述内容切分服务被发送至审核桶集中的至少一个审核桶中。所述审核桶可以为预设的数据容器,其可以是堆栈、队列、图、数据库等各种数据容器,本发明实施例不限定其具体的结构。
在一个可行的实施例中,所述内容切分服务记录有所述审核桶中当前可以接收源内容的第一可用审核桶集,所述第一可用审核桶集为所述审核桶集的子集,所述第一可用审核桶集中的各个第一可用审核桶均可以接收所述内容信息流中的源内容。
在一个可行的实施例中,所述内容切分服务还记录有所述第一可用审核桶集中各个第一可用审核桶的内容切分占比值,各个所述第一可用审核桶对应的内容切分占比值的总和值为100%,所述调用内容切分服务将所述内容信息流中的源内容发送至审核桶集中的至少一个审核桶中,如图5所示,包括:
S1011.根据所述内容信息流获取源内容集。
具体地,若所述内容信息流按照入库时间顺序被存储于内容数据库中,也可以从所述内容数据库中按照入库时间顺序或随机提取源内容集。
S1013.按照第一可用审核桶集中各个第一可用审核桶的内容切分占比值将所述源内容集中的内容分配至所述第一可用审核桶集中的各个第一可用审核桶中。
在一个具体的实施方式中,若所述第一可用审核桶集中包括三个第一可用审核桶001,002,003,其内容切分占比值分别为:30%,30%,40%,源内容集中包括100条源内容,则第一可用审核桶001中被分配30条源内容,第一可用审核桶002中被分配30条源内容,第一可用审核桶003中被分配40条源内容。具体地,可以将源内容集中的内容顺序或随机分配至所述第一可用审核桶集中的各个第一可用审核桶中,本发明实施例不限定源内容集的分配策略。
在一个可行的实施例中,不同审核桶对应不同的优先级排序策略,每个优先级排序策略指向一种多模型融合调度模型,所述每个所述审核桶根据所述审核桶对应的优先级排序策略为所述审核桶中的源内容生成优先级,对所述审核桶中的源内容按照优先级进行降序排列以得到源内容优先级排序结果,如图6所示,包括:
S1012.将所述审核桶中的源内容输入所述审核桶对应的多模型融合调度模型以得到优先级评分。
本发明实施例中所述多模型融合调度模型可以包括一个融合模型和至少一个机器学习模型,各个机器学习模型均与所述融合模型连接,所述机器学习模型以所述源内容为输入,所述融合模型以各个所述机器学习模型的输出为输入,所述融合模型输出所述源内容对应的优先级评分。
具体地,每个机器学习模型可以用于根据所述源内容得到一种优先级关联指标,不同机器学习模型得到不同的优先级关联指标,本发明实施例通过对Feeds流进行多维度的特征分析,提取了优先级关联指标。所述优先级关联指标可以包括但不限于下述内容:源内容为宣发文案的概率,源内容为活动文案的概率,源内容为广告的概率,源内容指向低质量账号的概率,源内容指向优质账号的概率,源内容获得的口水文分数、源内容获得的无营养分数、源内容指向的账号的审核拒绝指数、源内容指向的账号的审核通过指数。相应的,所述机器学习模型可以为宣发文案模型、活动文案模型、广告文案模型、低值账号分模型、优质账号分模型,口水文模型、无营养分数模型、审核拒绝指数模型、审核通过指数模型。
本发明实施例中所述融合模型和各个所述机器学习模型可以基于相同或不同的机器学习算法得到。所述机器学习算法包括但不限于循环神经网络、卷积神经网络、决策树和随机森林。
如图7所示,其示出了多模型融合调度模型的示意图,通过各个机器学习模型学习得到各种特征,并将各种特征输入融合模型进行权重学习,最终输出源内容的优先级评分。
S1014.根据所述审核桶中各个源内容的优先级评分降序的顺序对源内容进行排序以得到审核桶中源内容优先级排序结果。
在一个可行的实施例中,若存在优先级评分相同的源内容,可以按照其对应的入库时间顺序对所述优先级评分相同的源内容进行排序。
S103.调用流量切分服务对所述审核桶集中至少一个审核桶中的源内容优先级排序结果进行流量切分以得到领单数据,所述领单数据包括多个源内容。
在一个可行的实施例中,所述流量切分服务记录有所述审核桶中当前可以输出源内容的第二可用审核桶集,所述第二可用审核桶集为所述审核桶集的子集,所述第二可用审核桶集中的各个第二可用审核桶均可以输出其对应的源内容优先级排序结果。具体地,所述第二可用审核桶与第一可用审核桶可以为相同或不同的审核桶。
在一个可行的实施例中,所述流量切分服务还记录有所述第二可用审核桶集中各个第二可用审核桶的流量分占比值,各个所述第二可用审核桶对应的流量切分占比值的总和值为100%。所述调用流量切分服务对所述审核桶集中至少一个审核桶中的源内容优先级排序结果进行流量切分以得到领单数据,如图8所示,包括:
S1031.调用所述流量切分服务获取第二可用审核桶集以及所述第二可用审核桶集中每个第二可用审核桶的流量切分占比值。
S1033.按照第二可用审核桶集中各个第二可用审核桶的流量切分占比值从第二可用审核桶集的各个第二可用审核桶中对应的源内容优先级排序结果中依次提取源内容以构成领单数据。
在一个具体的实施方式中,所述流量切分服务和内容切分服务可以具备对应关系,即内容切分服务中的第一可用审核桶集构成了流量切分服务中的第二可用审核桶集,内容切分服务中的第一可用审核桶中各个第一可用审核桶的内容切分占比值与流量切分服务中的第二可用审核桶集相应的第二可用审核桶的流量切分占比值相同。
在一个具体的实施方式中,若所述第一可用审核桶集中包括三个第一可用审核桶001,002,003,其内容切分占比值分别为:30%,30%,40%,源内容集中包括100条源内容,则第一可用审核桶001中被分配30条源内容,第一可用审核桶002中被分配30条源内容,第一可用审核桶003中被分配40条源内容。相应的,所述第二可用审核桶集中包括三个第二可用审核桶001,002,003,其流量切分占比值也分别为:30%,30%,40%,在领单数据中第二可用审核桶001贡献了其源内容优先级排序结果中排在最前的30条源内容,第二可用审核桶002中贡献了其源内容优先级排序结果中排在最前的30条源内容,第二可用审核桶003中贡献了其源内容优先级排序结果中排在最前的40条源内容。
S105.获取对所述领单数据的审核结果,根据所述审核结果获取目标内容。
具体地,所述领单数据可以被传输至审核人员对应的客户端或审核平台,由审核人员对所述领单数据中的多个源内容进行审核以得到审核结果,并将领单数据中审核通过的源内容确定为目标内容。
S107.推荐所述目标内容。
本发明实施例中公开的一种基于优先级的内容推荐方法中领单数据是根据各个审核桶中的源内容优先级排序结果所确定的,这就使得审核人员可以对优先级排序较高的源数据优先审核,通过设计优先级排序领单替代原有的时间排序领单,屏蔽了时间维度对源内容的影响,保证了实时内容能够及时出库,避免了后入库内容一直被积压得不到审核的情况,借此使用有限的审核人力找出更多的优质内容,从而提高整体内容审核效率,有效识别出入库内容中更加优质的内容,提高源内容启用量。进一步地,为了得到更为精准的优先级排序结果,本发明实施例中设计了多种机器学习模型,从而可以从各方各面对源内容进行评估以得到更为准确的优先级排序结果。
在一个优选的实施例中,还可以对内容切分服务和流量切分服务进行调整以便于增强优先级排序策略表现优异的审核桶在获取源内容以及为领单数据贡献源内容环节的权重。具体地,为了实现对于内容切分服务和流量切分服务的实时调整,本发明实施例还包括设置对照桶集,基于所述对照桶集对内容切分服务和流量切分服务进行反馈调整的步骤,所述设置对照桶集,基于所述对照桶集对内容切分服务和流量切分服务进行反馈调整,如图9所示,包括:
S201.为每个审核桶设置对照桶以得到对照桶集,将分配至审核桶中的源内容发送至所述审核桶对应的对照桶中,以使得所述审核桶与所述对照桶具备相同的源内容,其中,每个所述对照桶中的源内容按照时间顺序存储。
S203.调用所述流量切分服务从对照桶集中提取源内容以得到对照领单数据,所述对照领单数据与所述领单数据包括相同数量的源内容。
本发明实施例中通过设置对照桶集对审核桶集中各个审核桶进行AB测试。通过调用相同的内容切分服务和流量切分服务使得对照桶集中与审核桶相对应的对照桶可以与所述审核桶获取相同的源内容,并且在对照领单数据中贡献相同数量的源内容。唯一不同的是,审核桶是基于源内容优先级排序结果为领单数据贡献源内容,而对照桶是基于入库时间排序结果为对照领单数据贡献源内容,现有技术的内容推荐流程中审核人员按照入库时间对Feeds流的内容进行审核,因此,对照桶参与的内容推荐流程模拟了现有技术的审核流程。
S205.获取对所述对照领单数据的审核结果,根据所述审核结果获取对照内容,推荐所述对照内容。
S207.获取目标内容的第一性能指标,所述第一性能指标包括至少一个审核桶及其对应的性能表现指标;获取对照内容的第二性能指标,所述第二性能指标包括至少一个对照桶及其对应的性能表现指标。
具体地,所述性能表现指标可以为审核通过率、PV和VV中的至少一个。
S209.根据所述第一性能指标和所述第二性能指标对所述内容切分服务和流量切分服务进行调整。
仍然以内容切分服务的内容切分占比值为30%,30%,40%,流量切分服务的流量切分占比值为30%,30%,40%为例。
审核桶集中参与内容推荐的审核桶001,002,003,对照桶集中其对应的对照桶001,002,003。审核桶001,002,003推荐的目标内容的PV分别为70%,80%,40%;相应的,对照桶001,002,003推荐的目标内容的PV分别为40%,75%,60%。则可以判定,审核桶001对应的优先级排序策略(多模型融合调度模型)具有优异的表现,审核桶002对应的优先级排序策略(多模型融合调度模型)具有普通的表现,审核桶003对应的优先级排序策略(多模型融合调度模型)具有较差的表现,因此,可以提升内容切分服务和流量切分服务中审核桶001的占比,降低审核桶003的占比,从而实现了基于ABtest的内容切分服务和流量切分服务的反馈调节。
本发明实施例通过为每个审核桶配置对照桶,实现了对于审核桶中的优先级排序策略的AB测试,从而可以根据测试结果对流量切分服务和内容切分服务进行反馈调节,以便于指导优先级策略的迭代开发。
如图10所示,其示出了基于AB测试的内容推荐方法的实施示意图。将来自Feeds流的内容入库后经由内容切分服务传输至审核桶中,相应的,根据传输结果将相同内容发送至所述审核桶对应的对照桶中,审核桶中基于优先级排序策略生成源内容优先级排序结果,对照桶中基于入库时间顺序依次存储源内容。由流量切分服务从审核桶提取领单数据,并从对照桶中提取对照领单数据。对领单数据和对照领单数据分别进行审核,并基于审核结果调整内容切分服务和流量切分服务以便于增强性能表现优异的审核桶在内容推荐过程中的重要程度。
本发明实施例还提供了一种基于优先级的内容推荐装置,如图11所示,所述装置包括:
内容信息流获取模块301,用于获取内容信息流,调用内容切分服务将所述内容信息流中的源内容发送至审核桶集中的至少一个审核桶中;其中,每个所述审核桶用于根据所述审核桶对应的优先级排序策略为所述审核桶中的源内容生成优先级,对所述审核桶中的源内容按照优先级进行降序排列以得到源内容优先级排序结果;
领单数据提取模块303,用于调用流量切分服务对所述审核桶集中至少一个审核桶中的源内容优先级排序结果进行流量切分以得到领单数据,所述领单数据包括多个源内容;
审核模块305,用于获取对所述领单数据的审核结果,根据所述审核结果获取目标内容;
推荐模块307,用于推荐所述目标内容。
具体地,本发明实施例所述一种基于优先级的内容推荐装置与方法实施例均基于相同发明构思。详情请参见方法实施例,在此不再赘述。
本发明实施例还提供了一种计算机存储介质,所述计算机存储介质可以存储有多条指令。所述指令可以适于由处理器加载并执行本发明实施例所述的一种基于优先级的内容推荐方法,所述方法至少包括下述步骤:
一种基于优先级的内容推荐方法,所述方法包括:
获取内容信息流,调用内容切分服务将所述内容信息流中的源内容发送至审核桶集中的至少一个审核桶中;其中,每个所述审核桶用于根据所述审核桶对应的优先级排序策略为所述审核桶中的源内容生成优先级,对所述审核桶中的源内容按照优先级进行降序排列以得到源内容优先级排序结果;
调用流量切分服务对所述审核桶集中至少一个审核桶中的源内容优先级排序结果进行流量切分以得到领单数据,所述领单数据包括多个源内容;
获取对所述领单数据的审核结果,根据所述审核结果获取目标内容;
推荐所述目标内容。
在一个优选的实施例中,所述内容切分服务记录有所述审核桶中当前接收源内容的第一可用审核桶集,以及所述第一可用审核桶集中各个第一可用审核桶的内容切分占比值,所述调用内容切分服务将所述内容信息流中的源内容发送至审核桶集中的至少一个审核桶中包括:
根据所述内容信息流获取源内容集;
按照第一可用审核桶集中各个第一可用审核桶的内容切分占比值将所述源内容集中的内容分配至所述第一可用审核桶集中的各个第一可用审核桶中。
在一个优选的实施例中,所述每个所述审核桶根据所述审核桶对应的优先级排序策略为所述审核桶中的源内容生成优先级,对所述审核桶中的源内容按照优先级进行降序排列以得到源内容优先级排序结果,包括:
将所述审核桶中的源内容输入所述审核桶对应的多模型融合调度模型以得到优先级评分;
根据所述审核桶中各个源内容的优先级评分降序的顺序对源内容进行排序以得到审核桶中源内容优先级排序结果。
一个优选的实施例中,所述流量切分服务记录有所述审核桶中当前输出源内容的第二可用审核桶集,以及所述第二可用审核桶集中各个第二可用审核桶的流量分占比值,所述调用流量切分服务对所述审核桶集中至少一个审核桶中的源内容优先级排序结果进行流量切分以得到领单数据,包括:
调用所述流量切分服务获取第二可用审核桶集以及所述第二可用审核桶集中每个第二可用审核桶的流量切分占比值;
按照第二可用审核桶集中各个第二可用审核桶的流量切分占比值从第二可用审核桶集的各个第二可用审核桶中对应的源内容优先级排序结果中依次提取源内容以构成领单数据。
一个优选的实施例中,设置对照桶集,基于所述对照桶集对内容切分服务和流量切分服务进行反馈调整,包括:
为每个审核桶设置对照桶以得到对照桶集,将分配至审核桶中的源内容发送至所述审核桶对应的对照桶中,以使得所述审核桶与所述对照桶具备相同的源内容,其中,每个所述对照桶中的源内容按照时间顺序存储;
调用所述流量切分服务从对照桶集中提取源内容以得到对照领单数据,所述对照领单数据与所述领单数据包括相同数量的源内容;
获取对所述对照领单数据的审核结果,根据所述审核结果获取对照内容,推荐所述对照内容;
获取目标内容的第一性能指标,所述第一性能指标包括至少一个审核桶及其对应的性能表现指标;获取对照内容的第二性能指标,所述第二性能指标包括至少一个对照桶及其对应的性能表现指标;
根据所述第一性能指标和所述第二性能指标对所述内容切分服务和流量切分服务进行调整。
进一步地,图12示出了一种用于实现本发明实施例所提供的方法的设备的硬件结构示意图,所述设备可以参与构成或包含本发明实施例所提供的装置或系统。如图12所示,设备10可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图12所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,设备10还可包括比图12中所示更多或者更少的组件,或者具有与图12所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到设备10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中所述的方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的一种基于优先级的内容推荐方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至设备10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括设备10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(NetworkInterfaceController,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(RadioFrequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与设备10(或移动设备)的用户界面进行交互。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置和服务器实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。