CN117112640B

CN117112640B - 一种内容排序方法以及相关设备

Info

Publication number: CN117112640B
Application number: CN202311369689.0A
Authority: CN
Inventors: 陈煜钊
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2023-10-23
Filing date: 2023-10-23
Publication date: 2024-02-27
Anticipated expiration: 2043-10-23
Also published as: CN117112640A

Abstract

本申请公开了一种内容排序方法以及相关设备，本申请实施例可以应用于内容推荐领域。获取历史内容数据流以及待评估的候选参数；将历史内容样本序列以及候选参数分配到多个并发运行的执行器上，各执行器包含内容样本子集和候选参数子集；从候选参数子集中选取多组候选参数组合，基于执行器并行计算各候选参数组合对应的候选融合分数；根据点击标签和候选融合分数，计算候选参数组合对应的奖励值；从候选参数组合中选取奖励值最大的参数组合作为优选参数组合，根据优选参数组合对待排序的内容数据进行排序。本申请可以提高内容排序的效率。

Description

一种内容排序方法以及相关设备

技术领域

本申请涉及计算机技术领域，具体涉及一种内容排序方法以及相关设备。

背景技术

内容推荐领域涉及到内容排序的问题，比如，在订阅号信息流场景中，一条消息有多个价值分数进行描述。如，由点击率预估模型给出的点击分数(pctr)，代表被点击的概率；由阅读时长预估模型给出的时长分数(preadtime)，代表被长时间阅读的概率；由消息群发时间、曝光时间和消息类目计算得到的时效分数，代表时效性(ptimebonus)。消息的最终排序分数，由这些不同的价值分数，通过特定的融合公式进行组合而得到，该公式称为价值公式。例如，score=w1*pctr+w2*preadtime+w3*ptimebonus，其中w1，w2，w3为组合参数。

上述价值公式的组合参数，需要基于搜索算法确定具体的取值。目前，在订阅号信息流场景中，通常采用的搜索算法主要包括随机搜索算法和进化搜索算法。

其中，随机搜索算法（Random Search）是最直观而易用的搜索算法。随机搜索算法对于给定的搜索空间，遍历其中每个组合参数，评估其各项指标，最后通过人工设定的规则选出其中的最优点。随机搜索算法依赖人工的挑选（或人工设计的规则），选出坐标系右上方红色的点，认定为最优的组合参数。

其中，进化搜索算法是一种组合优化算法。相比于随机搜索算法穷举式地评估所有组合参数的效果，进化搜索算法从初始参数出发，根据定义的奖赏值确定参数的扰动方向，迭代式地收敛到一个较好的组合参数，能够避免在效果较差的组合参数空间中进行探索，减少较多无效的计算。

无论随机搜索还是进化搜索，搜索算法的核心环节都是对指定的数据集D和给定的参数组合W，作出评估和挑选。当需要搜索的数据集和参数组合数据量较大的话，需要进行多次搜索，每次搜索都需要耗费大量时间，在进行订阅号信息流等内容的排序时，效率较低。

发明内容

本申请实施例提供一种内容排序方法以及相关设备，相关设备可以包括内容排序装置、电子设备、计算机可读存储介质和计算机程序产品，可以提高内容排序的效率。

本申请实施例提供一种内容排序方法，包括：

获取历史内容数据流以及待评估的候选参数，所述历史内容数据流包括多个历史内容样本序列，所述历史内容样本序列包括多个内容样本，所述内容样本携带多种价值分数，以及用于表示所述内容样本是否被点击的点击标签；

将所述历史内容样本序列以及所述候选参数分配到多个并发运行的执行器上，各所述执行器包含内容样本子集和候选参数子集；

从所述候选参数子集中选取多组候选参数组合，基于所述执行器并行计算各所述候选参数组合对应的候选融合分数；根据所述点击标签和所述候选融合分数，计算候选参数组合对应的奖励值；

从所述候选参数组合中选取奖励值最大的参数组合作为优选参数组合，根据所述优选参数组合对待排序的内容数据进行排序。

相应的，本申请实施例提供一种内容排序装置，包括：

获取单元，用于获取历史内容数据流以及待评估的候选参数，所述历史内容数据流包括多个历史内容样本序列，所述历史内容样本序列包括多个内容样本，所述内容样本携带多种价值分数，以及用于表示所述内容样本是否被点击的点击标签；

分配单元，用于将所述历史内容样本序列以及所述候选参数分配到多个并发运行的执行器上，各所述执行器包含内容样本子集和候选参数子集；

分数计算单元，用于从所述候选参数子集中选取多组候选参数组合，基于所述执行器并行计算各所述候选参数组合对应的候选融合分数；奖励计算单元，用于根据所述点击标签和所述候选融合分数，计算候选参数组合对应的奖励值；

排序单元，用于从所述候选参数组合中选取奖励值最大的参数组合作为优选参数组合，根据所述优选参数组合对待排序的内容数据进行排序。

可选的，在本申请的一些实施例中，所述分配单元可以包括第一分配子单元和第二分配子单元，如下：

第一分配子单元，用于确定第一并发度，并基于所述第一并发度将各所述候选参数映射到执行器上，所述执行器包含候选参数子集；

第二分配子单元，用于确定第二并发度，并基于所述第二并发度将各所述历史内容样本序列映射到执行器上，所述执行器包含内容样本子集。

可选的，在本申请的一些实施例中，所述分数计算单元还可以包括遍历子单元、第一选取子单元、第二选取子单元和分数计算子单元，如下：

遍历子单元，用于遍历所述候选参数子集中的候选参数，并遍历所述内容样本子集中的内容样本；

第一选取子单元，用于根据所述内容样本的属性信息，从所述点击分数、所述时长分数和所述时效分数中选取目标价值分数；

第二选取子单元，用于从所述候选参数子集中选取与所述目标价值分数数量对应的候选参数进行组合，得到多组候选参数组合；

分数计算子单元，用于基于预设融合公式、所述目标价值分数和候选参数组合，计算所述内容样本对应的候选融合分数。

可选的，在本申请的一些实施例中，奖励计算单元包括子指标计算子单元、总指标计算子单元和奖励计算子单元，如下：

子指标计算子单元，用于根据各执行器对应的所述候选融合分数与点击标签，计算所述内容样本子集的子消费指标；

总指标计算子单元，用于根据各执行器对应的子消费指标以及各执行器包含的历史内容样本序列的数量，确定所述历史内容数据流的总消费指标；

奖励计算子单元，用于根据所述总消费指标相较于预设指标基线的提升幅度，确定候选参数组合对应的奖励值。

本申请实施例提供的一种电子设备，包括处理器和存储器，所述存储器存储有多条指令，所述处理器加载所述指令，以执行本申请实施例提供的内容排序方法中的步骤。

本申请实施例还提供一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现本申请实施例提供的内容排序方法中的步骤。

此外，本申请实施例还提供一种计算机程序产品，包括计算机程序或指令，该计算机程序或指令被处理器执行时实现本申请实施例提供的内容排序方法中的步骤。

本申请实施例提供了一种内容排序方法以及相关设备，可以获取历史内容数据流以及待评估的候选参数，所述历史内容数据流包括多个历史内容样本序列，所述历史内容样本序列包括多个内容样本，所述内容样本携带多种价值分数，以及用于表示所述内容样本是否被点击的点击标签；将所述历史内容样本序列以及所述候选参数分配到多个并发运行的执行器上，各所述执行器包含内容样本子集和候选参数子集；从所述候选参数子集中选取多组候选参数组合，基于所述执行器并行计算各所述候选参数组合对应的候选融合分数；根据所述点击标签和所述候选融合分数，计算候选参数组合对应的奖励值；从所述候选参数组合中选取奖励值最大的参数组合作为优选参数组合，根据所述优选参数组合对待排序的内容数据进行排序。本申请采用并发运行的执行器，对每一个执行器分配一组候选参数子集和一组内容样本子集，从而可以使执行器同时对多组内容样本子集搜索优选参数组合，降低了搜索过程的耗时，提高了在单位时间内搜索到更好效果的公式的机会。应用在订阅流消息排序场景中时，可以提升用户的消费时长，提高用户的点击率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的内容排序方法的场景示意图；

图2是本申请实施例提供的内容排序方法的第一流程图；

图3是本申请实施例提供的内容排序方法的第二流程图；

图4是本申请实施例提供的内容排序装置的结构示意图；

图5是本申请实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供一种内容排序方法以及相关设备，相关设备可以包括内容排序装置、电子设备、计算机可读存储介质和计算机程序产品。该内容排序装置具体可以集成在电子设备中，该电子设备可以是终端或服务器等设备。

可以理解的是，本实施例的内容排序方法可以是在终端上执行的，也可以是在服务器上执行，还可以由终端和服务器共同执行的。以上举例不应理解为对本申请的限制。

如图1所示，以终端和服务器共同执行内容排序方法为例。本申请实施例提供的内容排序系统包括终端10和服务器11等；终端10与服务器11之间通过网络连接，比如，通过有线或无线网络连接等，其中，内容排序装置可以集成在服务器中。

其中，服务器11，可以用于：获取历史内容数据流以及待评估的候选参数；将所述历史内容样本序列以及所述候选参数分配到多个并发运行的执行器上，各所述执行器包含内容样本子集和候选参数子集；从所述候选参数子集中选取多组候选参数组合，基于所述执行器并行计算各所述候选参数组合对应的候选融合分数；根据所述点击标签和所述候选融合分数，计算候选参数组合对应的奖励值；从所述候选参数组合中选取奖励值最大的参数组合作为优选参数组合。其中，服务器11可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。本申请所公开的内容排序方法或装置，其中多个服务器可组成为一区块链，而服务器为区块链上的节点。

其中，终端10，可以用于：根据所述优选参数组合对待排序的内容数据进行排序。其中，终端10可以包括手机、智能语音交互设备、智能家电、车载终端、飞行器、平板电脑、笔记本电脑、或个人计算机（PC，Personal Computer）等。终端10上还可以设置客户端，该客户端可以是应用程序客户端或浏览器客户端等等。

以下分别进行详细说明。需说明的是，以下实施例的描述顺序不作为对实施例优选顺序的限定。

本实施例将从内容排序装置的角度进行描述，该内容排序装置具体可以集成在电子设备中，该电子设备可以是服务器或终端等设备。本实施例可应用于订阅号消息排序，内容推荐等各种场景。如图2所示，该内容排序方法的具体流程可以如下：

101、获取历史内容数据流以及待评估的候选参数。

其中，内容数据流指的是按照一定的标准进行排序，并按照顺序显示的内容数据。

本申请获取的历史内容数据流包括多个历史内容样本序列，每个历史内容样本序列包括多个内容样本，在订阅好消息排序的场景中，内容样本序列指的是用户在单次进入订阅号盒子之后，产生的最长显示消息列表。比如，从排序第一位到排序第五位的内容样本被显示给了用户，之后用户退出订阅号盒子，第六位的内容样本没有被显示，则该内容样本序列的长度为五。

在本申请中，服务器可以获取之前显示给用户的历史内容数据流，并获取每一个内容数据对应的点击标签和价值分数，将内容数据和对应点击标签、价值分数组合作为一个内容样本。

其中，内容数据包括多种不同的形态，比如文章、图片、视频等。内容数据还可以包括多种来源，比如用户订阅的内容、平台根据用户喜好或者站内热度主动推荐的内容。

其中，点击标签用于表示在内容数据推荐给用户之后，用户是否点击浏览过该内容消息。

其中，价值分数是用于表示内容数据的推荐价值的指标，具体可以包括多种形式，比如，点击分数、时长分数、时效分数等。

订阅号信息流场景中，一个内容数据（比如，一条消息）有多个价值分数进行描述。如，由点击率预估模型给出的点击分数(pctr)，代表被点击的概率；由阅读时长预估模型给出的时长分数(preadtime)，代表被长时间阅读的概率；由消息群发时间、曝光时间和消息类目计算得到的时效分数，代表时效性(ptimebonus)。一条消息的最终排序分数，由这些不同的价值分数，通过特定的融合公式进行组合而得到（称为价值公式）。例如，score（排序分数）=w1*pctr（点击分数）+w2*preadtime（时长分数）+w3*ptimebonus（时效分数），其中w1,w2,w3用于表示不同的价值分数对于内容数据的排序结果的影响程度。

而候选参数则是由生成模型预先生成或者由开发人员预先设定的，可以用于计算内容数据的排序分数的参数。

在本申请中，需要对候选参数进行评估，从候选参数中挑选优选的参数组合，从而计算内容数据的排序分数，根据排序分数对内容数据进行排序。

102、将所述历史内容样本序列以及所述候选参数分配到多个并发运行的执行器上，各所述执行器包含内容样本子集和候选参数子集。

对于价值公式的组合参数，需要经过搜索算法确定其具体的取值。本申请采用多个并发运行的执行器，对于给定的历史内容数据流，对给定的候选参数进行并行加速的搜索，找到优选的参数组合。

在一些实施例中，所述将所述历史内容样本序列以及所述候选参数分配到多个并发运行的执行器上，包括如下步骤：

确定第一并发度，并基于所述第一并发度将各所述候选参数映射到执行器上，所述执行器包含候选参数子集；

确定第二并发度，并基于所述第二并发度将各所述历史内容样本序列映射到执行器上，所述执行器包含内容样本子集。

其中，第一并发度K1指的是候选参数的并发度，第二并发度为K2为内容样本的并发度，将所有的候选参数和内容样本分配给K1*K2=H个执行器。

经过哈希映射后，每个执行器分配到一个特定样本哈希id的内容样本子集和一个特定参数哈希id的候选参数子集。

每个历史内容样本序列的id为sid，为了保证同一个序列的内容样本被分配到同一个执行器中，可以根据历史内容样本序列的id来区分路由，记各个候选参数的id为pid，哈希映射为：h(sid, pid)=(sid%K2)+K1*(pid%K1)，其中h(sid, pid)∈[0,K1*K2]，%为取模运算。sid%K2称为样本哈希id，pid%K1为参数哈希id。

在计算机中的取余(%)操作除了判断奇偶数等常规用途外，还可以把目标映射在一个区间范围内，比如对5取余，相当于把目标映射在[0，5)开闭区间内。

103、从所述候选参数子集中选取多组候选参数组合，基于所述执行器并行计算各所述候选参数组合对应的候选融合分数。

在一些实施例中，所述从所述候选参数子集中选取多组候选参数组合，基于所述执行器并行计算各所述候选参数组合对应的候选融合分数，具体可以包括如下步骤：

遍历所述候选参数子集中的候选参数，并遍历所述内容样本子集中的内容样本；

根据所述内容样本的属性信息，从所述价值分数中选取目标价值分数；

从所述候选参数子集中选取与所述目标价值分数数量对应的候选参数进行组合，得到多组候选参数组合；

基于预设融合公式、所述目标价值分数和候选参数组合，计算所述内容样本对应的候选融合分数。

在一些实施例中，价值分数包括多种形，比如时长分数、时效分数、点击分数等。融合分数由点击、时长、时效三个分数以乘法形式组合而成，其中各个价值分数分别经过了恒等变换、指数和仿射变换、线性变换，如下：

在一些实施例中，可以根据内容样本的属性信息，从价值分数中选取目标价值分数，比如，如果内容样本的属性为视频，则需要选择与视频相关的点击分数、时长分数、时效分数，作为目标价值分数，而如果内容样本的属性为图片，则需要选择与文字相关的点击分数、时效分数，作为目标价值分数。

104、根据所述点击标签和所述候选融合分数，计算候选参数组合对应的奖励值。

在进化搜索算法中，奖励值是用于确定参数的扰动方向的指标。进化搜索算法是一种组合优化算法，相比于随机搜索算法穷举式地评估所有参数组合的效果，进化搜索算法从初始参数出发，根据定义的奖励值确定参数的扰动方向，迭代式地收敛到一个较好的参数组合，能够避免在效果较差的参数组合空间中进行探索，减少较多无效的计算。

在一些实施例中，根据所述点击标签和所述候选融合分数，计算候选参数组合对应的奖励值，具体包括如下步骤：

根据各执行器对应的所述候选融合分数与点击标签，计算所述内容样本子集的子消费指标；

根据各执行器对应的子消费指标以及各执行器包含的历史内容样本序列的数量，确定所述历史内容数据流的总消费指标；

根据所述总消费指标相较于预设指标基线的提升幅度，确定候选参数组合对应的奖励值。

在一些实施例中，根据所述总消费指标相较于预设指标基线的提升幅度，确定候选参数组合对应的奖励值，包括如下步骤：

当所述总消费指标相较于预设指标基线的提升幅度低于预设阈值时，取加权系数为负值；

当所述总消费指标相较于预设指标基线的提升幅度低于预设阈值时，取所述加权系数正值；

获取所述总消费指标相较于预设指标基线的提升幅度与对应的加权系数的加权和，作为所述候选参数组合对应的奖励值。

奖励值Reward由消费指标相对基线值（mi’）的提升幅度的加权和得到；当相对提升RelImpr低于-0.01时，即融合分数该项指标值低于基线值的99%，加权系数αi取负值，作为惩罚系数；否则为正值，作为奖励系数，具体可以采用如下公式计算奖励值。

在一些实施例中，所述根据各执行器对应的所述候选融合分数与点击标签，计算所述内容样本子集的子消费指标，包括如下步骤：

将所述历史内容样本序列内的内容样本根据所述候选融合分数进行排序，根据排序结果和点击标签，汇总各所述历史内容样本序列得到GAUC指标；

根据所有内容样本对应的GAUC指标与点击标签，计算得到综合内容消费指标；

根据单形态内容样本对应的GAUC指标与点击标签，计算得到单形态内容消费指标；

计算所述历史内容样本序列中排序前列的平均消费时长，汇总各所述历史内容样本序列的平均消费时长，得到时长指标。

其中，可以采用子消费指标对内容数据进行评估，在订阅流场景中，子消费指标包括综合内容消费指标、单形态内容消费指标、时长指标，综合消费指标指的是所有内容样本融合分数与点击标签的GAUC（记为m0），单形态内容消费指标指的是单形态内容融合分与该形态内容点击标签的GAUC，如图文GAUC和短视频GAUC（记为m1和m2），总时长指标指的是所有session内排序Top 4的消息平均阅读时长（或播放时长）（记为m3）。

其中，GAUC是AUC的改进版本，由一个内容样本序列下的样本数对该内容样本序列的AUC进行加权求和得到。AUC是一种用于评估点击率预估模型性能表现的指标，数值越高模型表现越好。

GAUC指标的计算，包括如下步骤：1）对内容样本根据历史内容样本序列进行分组；2）对组内的内容样本根据融合分数进行排序；3）计算排序分数与点击标签的auc；4）汇总所有组的auc ，计算gauc。

时长指标的计算，包括如下步骤：1）对内容样本根据历史内容样本序列进行分组；2）对组内的内容样本根据融合分数进行排序，第3）步为：计算排序前4位的平均时长；第4）步为：汇总所有组的平均时长，计算整体平均时长。

在一些实施例中，所述根据各执行器对应的子消费指标以及各执行器包含的历史内容样本序列的数量，确定所述历史内容数据流的总消费指标，包括如下步骤：

汇总各根据各执行器对应的子消费指标；

根据各执行器包含的历史内容样本序列的数量，计算每个内容样本子集的消费指标；

将所述内容样本子集的消费指标作为所述所述历史内容数据流的总消费指标。

由于GAUC指标和时长指标都是汇总各session的auc或平均时长，通过如下公式得到属于同一个样本哈希id的样本集上的指标。

当历史内容数据流包含的内容数据规模很大时，基于每个历史内容样本序列的id随机哈希采样的内容样本子集之间独立同分布，于是：

105、从所述候选参数组合中选取奖励值最大的参数组合作为优选参数组合，根据所述优选参数组合对待排序的内容数据进行排序。

由上可知，本实施例可以获取历史内容数据流以及待评估的候选参数，所述历史内容数据流包括多个历史内容样本序列，所述历史内容样本序列包括多个内容样本，所述内容样本携带多种价值分数，以及用于表示所述内容样本是否被点击的点击标签；将所述历史内容样本序列以及所述候选参数分配到多个并发运行的执行器上，各所述执行器包含内容样本子集和候选参数子集；从所述候选参数子集中选取多组候选参数组合，基于所述执行器并行计算各所述候选参数组合对应的候选融合分数；根据所述点击标签和所述候选融合分数，计算候选参数组合对应的奖励值；从所述候选参数组合中选取奖励值最大的参数组合作为优选参数组合，根据所述优选参数组合对待排序的内容数据进行排序。本申请采用并发运行的执行器，对每一个执行器分配一组候选参数子集和一组内容样本子集，从而可以使执行器同时对多组内容样本子集搜索优选参数组合，降低了搜索过程的耗时，提高了在单位时间内搜索到更好效果的公式的机会。应用在订阅流消息排序场景中时，可以提升用户的消费时长，提高用户的点击率。

根据前面实施例所描述的方法，以下将以该内容排序装置具体集成在终端等电子设备举例作进一步详细说明。本申请实施例提供一种内容排序方法，如图3所示，该内容排序方法的具体流程可以如下：

201、终端获取待排序的内容数据。

其中，待排序的内容数据包括多种不同的形态，比如文章、图片、视频等。待排序的内容数据还可以包括多种来源，比如用户订阅的内容、平台根据用户喜好或者站内热度主动推荐的内容数据。

202、终端获取服务根据历史内容数据流，从候选参数中搜索得到的优选参数组合。

服务器可以获取历史内容数据流和候选参数，然后根据历史内容数据流从候选参数中搜索得到优选参数组合，该过程参考步骤101~105，此处不再赘述。

203、终端根据优选参数组合计算所述待排序的内容数据的融合分数。

终端可以将优选参数组合和目标价值分数带入融合公式中，计算得到待排序的内容数据的融合分数。

204、根据融合分数对所述待排序的内容数据进行排序，并将排序后的内容数据推送给用户。

由于本申请可以使执行器同时对多组内容样本子集搜索优选参数组合，降低了搜索过程的耗时，提高了在单位时间内搜索到更好效果的公式的机会。应用在订阅流消息排序场景中时，可以提升用户的消费时长，提高用户的点击率。

为了更好地实施以上方法，本申请实施例还提供一种内容排序装置，如图4所示，该内容排序装置可以包括获取单元301、分配单元302、分数计算单元303、奖励计算单元304，以及排序单元305，如下：

获取单元301，用于获取历史内容数据流以及待评估的候选参数，所述历史内容数据流包括多个历史内容样本序列，所述历史内容样本序列包括多个内容样本，所述内容样本携带多种价值分数，以及用于表示所述内容样本是否被点击的点击标签；

分配单元302，用于将所述历史内容样本序列以及所述候选参数分配到多个并发运行的执行器上，各所述执行器包含内容样本子集和候选参数子集；

分数计算单元303，用于从所述候选参数子集中选取多组候选参数组合，基于所述执行器并行计算各所述候选参数组合对应的候选融合分数；奖励计算单元304，用于根据所述点击标签和所述候选融合分数，计算候选参数组合对应的奖励值；

排序单元305，用于从所述候选参数组合中选取奖励值最大的参数组合作为优选参数组合，根据所述优选参数组合对待排序的内容数据进行排序。

由上可知，本实施例可以通过获取单元301获取历史内容数据流以及待评估的候选参数，所述历史内容数据流包括多个历史内容样本序列，所述历史内容样本序列包括多个内容样本，所述内容样本携带多种价值分数，以及用于表示所述内容样本是否被点击的点击标签；通过分配单元302将所述历史内容样本序列以及所述候选参数分配到多个并发运行的执行器上，各所述执行器包含内容样本子集和候选参数子集；通过分数计算单元303从所述候选参数子集中选取多组候选参数组合，基于所述执行器并行计算各所述候选参数组合对应的候选融合分数；通过奖励计算单元304根据所述点击标签和所述候选融合分数，计算候选参数组合对应的奖励值；通过排序单元305从所述候选参数组合中选取奖励值最大的参数组合作为优选参数组合，根据所述优选参数组合对待排序的内容数据进行排序。本申请采用并发运行的执行器，对每一个执行器分配一组候选参数子集和一组内容样本子集，从而可以使执行器同时对多组内容样本子集搜索优选参数组合，降低了搜索过程的耗时，提高了在单位时间内搜索到更好效果的公式的机会。应用在订阅流消息排序场景中时，可以提升用户的消费时长，提高用户的点击率。

本申请实施例还提供一种电子设备，如图5所示，其示出了本申请实施例所涉及的电子设备的结构示意图，该电子设备可以是终端或者服务器等，具体来讲：

该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解，图5中示出的电子设备结构并不构成对电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器401是该电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器402内的软件程序和/或模块，以及调用存储在存储器402内的数据，执行电子设备的各种功能和处理数据。可选的，处理器401可包括一个或多个处理核心；优选的，处理器401可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器401中。

存储器402可用于存储软件程序以及模块，处理器401通过运行存储在存储器402的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如声音播放功能、图像播放功能等）等；存储数据区可存储根据电子设备的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器402还可以包括存储器控制器，以提供处理器401对存储器402的访问。

电子设备还包括给各个部件供电的电源403，优选的，电源403可以通过电源管理系统与处理器401逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该电子设备还可包括输入单元404，该输入单元404可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，该电子设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，电子设备中的处理器401会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中，并由处理器401来运行存储在存储器402中的应用程序，从而实现各种功能，如下：

本申请实施例提供了一种内容排序方法以及相关设备，可以获取历史内容数据流以及待评估的候选参数，所述历史内容数据流包括多个历史内容样本序列，所述历史内容样本序列包括多个内容样本，所述内容样本携带多种价值分数，以及用于表示所述内容样本是否被点击的点击标签；将所述历史内容样本序列以及所述候选参数分配到多个并发运行的执行器上，各所述执行器包含内容样本子集和候选参数子集；从所述候选参数子集中选取多组候选参数组合，基于所述执行器并行计算各所述候选参数组合对应的候选融合分数；根据所述点击标签和所述候选融合分数，计算候选参数组合对应的奖励值；从所述候选参数组合中选取奖励值最大的参数组合作为优选参数组合，根据所述优选参数组合对待排序的内容数据进行排序。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

由上可知，本实施例可以可以获取历史内容数据流以及待评估的候选参数，所述历史内容数据流包括多个历史内容样本序列，所述历史内容样本序列包括多个内容样本，所述内容样本携带多种价值分数，以及用于表示所述内容样本是否被点击的点击标签；将所述历史内容样本序列以及所述候选参数分配到多个并发运行的执行器上，各所述执行器包含内容样本子集和候选参数子集；从所述候选参数子集中选取多组候选参数组合，基于所述执行器并行计算各所述候选参数组合对应的候选融合分数；根据所述点击标签和所述候选融合分数，计算候选参数组合对应的奖励值；从所述候选参数组合中选取奖励值最大的参数组合作为优选参数组合，根据所述优选参数组合对待排序的内容数据进行排序。本申请采用并发运行的执行器，对每一个执行器分配一组候选参数子集和一组内容样本子集，从而可以使执行器同时对多组内容样本子集搜索优选参数组合，降低了搜索过程的耗时，提高了在单位时间内搜索到更好效果的公式的机会。应用在订阅流消息排序场景中时，可以提升用户的消费时长，提高用户的点击率。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本申请实施例提供一种计算机可读存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本申请实施例所提供的任一种内容排序方法中的步骤。例如，该指令可以执行如下步骤：

其中，该计算机可读存储介质可以包括：只读存储器（ROM，Read Only Memory）、随机存取记忆体（RAM，Random Access Memory）、磁盘或光盘等。

由于该计算机可读存储介质中所存储的指令，可以执行本申请实施例所提供的任一种内容排序方法中的步骤，因此，可以实现本申请实施例所提供的任一种内容排序方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述内容排序方面的各种可选实现方式中提供的方法。

以上对本申请实施例所提供的一种内容排序方法以及相关设备进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种内容排序方法，其特征在于，包括：

从所述候选参数组合中选取奖励值最大的参数组合作为优选参数组合，根据所述优选参数组合对待排序的内容数据进行排序；

所述将所述历史内容样本序列以及所述候选参数分配到多个并发运行的执行器上，包括：

确定第二并发度，并基于所述第二并发度将各所述历史内容样本序列映射到执行器上，所述执行器包含内容样本子集；

其中，所述执行器的数量为所述第一并发度与第二并发度的乘积，在分配到所述执行器上时，用所述历史内容样本序列的标识对所述第二并发度取模得到所述历史内容样本的哈希值，用所述候选参数的标识对所述第一并发度取模得到所述候选参数的哈希值，基于所述历史内容样本的哈希值与所述第一并发度和所述候选参数的哈希值乘积的和值，分配对应的执行器。

2.根据权利要求1所述的内容排序方法，其特征在于，所述价值分数包括点击分数、时长分数和时效分数，所述从所述候选参数子集中选取多组候选参数组合，基于所述执行器并行计算各所述候选参数组合对应的候选融合分数，包括：

根据所述内容样本的属性信息，从所述点击分数、所述时长分数和所述时效分数中选取目标价值分数；

3.根据权利要求1所述的内容排序方法，其特征在于，根据所述点击标签和所述候选融合分数，计算候选参数组合对应的奖励值，包括：

4.根据权利要求1所述的内容排序方法，其特征在于，所述根据各执行器对应的所述候选融合分数与点击标签，计算所述内容样本子集的子消费指标，包括：

5.根据权利要求1所述的内容排序方法，其特征在于，所述根据各执行器对应的子消费指标以及各执行器包含的历史内容样本序列的数量，确定所述历史内容数据流的总消费指标，包括：

汇总各根据各执行器对应的子消费指标；

将所述内容样本子集的消费指标作为所述历史内容数据流的总消费指标。

6.根据权利要求3所述的内容排序方法，其特征在于，所述根据所述总消费指标相较于预设指标基线的提升幅度，确定候选参数组合对应的奖励值，包括：

7.一种内容排序装置，其特征在于，包括：

所述分配单元，具体用于确定第一并发度，并基于所述第一并发度将各所述候选参数映射到执行器上，所述执行器包含候选参数子集；确定第二并发度，并基于所述第二并发度将各所述历史内容样本序列映射到执行器上，所述执行器包含内容样本子集；其中，所述执行器的数量为所述第一并发度与第二并发度的乘积，在分配到所述执行器上时，用所述历史内容样本序列的标识对所述第二并发度取模得到所述历史内容样本的哈希值，用所述候选参数的标识对所述第一并发度取模得到所述候选参数的哈希值，基于所述历史内容样本的哈希值与所述第一并发度和所述候选参数的哈希值乘积的和值，分配对应的执行器；

8.一种电子设备，其特征在于，包括存储器和处理器；所述存储器存储有应用程序，所述处理器用于运行所述存储器内的应用程序，以执行权利要求1至6任一项所述的内容排序方法中的操作。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至6任一项所述的内容排序方法中的步骤。

10.一种计算机程序产品，包括计算机程序或指令，其特征在于，该计算机程序或指令被处理器执行时实现权利要求1至6任一项所述的内容排序方法中的步骤。