CN116467527A

CN116467527A - 数据处理方法及装置

Info

Publication number: CN116467527A
Application number: CN202310464555.0A
Authority: CN
Inventors: 汪润中; 严骏驰; 杨小康; 徐武将; 高艳涛; 陈林勋; 赵云安; 郭晓波
Original assignee: Zhejiang eCommerce Bank Co Ltd
Current assignee: Zhejiang eCommerce Bank Co Ltd
Priority date: 2023-04-24
Filing date: 2023-04-24
Publication date: 2023-07-21

Abstract

本说明书实施例提供数据处理方法及装置，其中所述数据处理方法包括：接收至少两个项目推荐对象的推荐行为数据；将所述推荐行为数据输入至分配预测模型，确定所述至少两个项目推荐对象的预测收益数据以及预测执行状态数据；根据所述预测收益数据和所述预测执行状态数据，获得为所述至少两个项目推荐对象进行资源分配的资源分配数据。从而后续能够基于该资源分配数据对该至少两个项目推荐对象对应的资源进行分配，达到统筹分配资源的目的，避免了由于资源分配不均导致进行项目推荐的效率较低的问题，同时也避免了推广资源的浪费。

Description

数据处理方法及装置

技术领域

本说明书实施例涉及计算机技术领域，特别涉及一种数据处理方法。

背景技术

随着互联网技术的不断发展，许多互联网机构为了提高自己的服务水平，会通过各种渠道将各种类型的项目或活动推荐给用户，例如，互联网金融机构通过短信渠道对用户进行营销推广，从而达到刺激用户活跃度等目的。

在实际应用中，对用户进行推广的渠道多种多样且需要推广的项目也包含很多种类，但是，进行推广的资源是相对有限的，因此在面对多渠道、多活动的现状时，各渠道之间针对推广资源的分配缺乏统筹，从而导致项目推荐的效率较低，以及推广资源的浪费。

发明内容

有鉴于此，本说明书实施例提供了一种数据处理方法。本说明书一个或者多个实施例同时涉及一种数据处理装置，一种计算设备，一种计算机可读存储介质，一种计算机程序，以解决现有技术中存在的技术缺陷。

根据本说明书实施例的第一方面，提供了一种数据处理方法，包括：接收至少两个项目推荐对象的推荐行为数据；将所述推荐行为数据输入至分配预测模型，确定所述至少两个项目推荐对象的预测收益数据以及预测执行状态数据；根据所述预测收益数据和所述预测执行状态数据，获得为所述至少两个项目推荐对象进行资源分配的资源分配数据。

根据本说明书实施例的第二方面，提供了一种数据处理装置，包括：

数据接收模块，被配置为接收至少两个项目推荐对象的推荐行为数据；

数据预测模块，被配置为将所述推荐行为数据输入至分配预测模型，确定所述至少两个项目推荐对象的预测收益数据以及预测执行状态数据；

数据获取模块，被配置为根据所述预测收益数据和所述预测执行状态数据，获得为所述至少两个项目推荐对象进行资源分配的资源分配数据。

根据本说明书实施例的第三方面，提供了一种计算设备，包括：

存储器和处理器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，该计算机可执行指令被处理器执行时实现所述数据处理方法的步骤。

根据本说明书实施例的第四方面，提供了一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现所述数据处理方法的步骤。

根据本说明书实施例的第五方面，提供了一种计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行所述数据处理方法的步骤。

本说明书提供的数据处理方法，包括：接收至少两个项目推荐对象的推荐行为数据；将所述推荐行为数据输入至分配预测模型，确定所述至少两个项目推荐对象的预测收益数据以及预测执行状态数据；根据所述预测收益数据和所述预测执行状态数据，获得为所述至少两个项目推荐对象进行资源分配的资源分配数据。

具体地，本说明书提供的数据处理方法，通过将至少两个项目推荐对象的推荐行为数据输入至分配预测模型，利用该分配预测模型对该推荐行为数据进行处理，获得至少两个项目推荐对象的预测收益数据以及预测执行状态数据，并根据预测收益数据和预测执行状态数据，获得资源分配数据，从而使得后续能够基于该资源分配数据对该至少两个项目推荐对象对应的资源进行分配，达到统筹分配资源的目的，避免了由于资源分配不均导致进行项目推荐的效率较低的问题，同时也避免了推广资源的浪费。

附图说明

图1是本说明书一个实施例提供的一种数据处理方法的应用场景示意图；

图2是本说明书一个实施例提供的一种数据处理方法的流程图；

图3是本说明书一个实施例提供的一种数据处理方法中的模型结构示意图；

图4是本说明书一个实施例提供的一种数据处理方法的处理过程流程图；

图5是本说明书一个实施例提供的一种数据处理方法的一种效果示意图；

图6是本说明书一个实施例提供的一种数据处理方法的另一种效果示意图；

图7是本说明书一个实施例提供的一种数据处理装置的结构示意图；

图8是本说明书一个实施例提供的一种计算设备的结构框图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本说明书内涵的情况下做类似推广，因此本说明书不受下面公开的具体实施的限制。

在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书一个或多个实施例范围的情况下，第一也可以被称为第二，类似地，第二也可以被称为第一。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

首先，对本说明书一个或多个实施例涉及的名词术语进行解释。

均值/收益：在一定时间内，投放某个渠道/投资某个资产获得收益率的期望值，由向量μ表示，其中μ_i代表第i个渠道/资产的期望收益率。

方差/风险：在一定时间内，收益的波动幅度，由矩阵Σ表示。若i≠j，Σ_i,j代表第i个渠道/资产与第j个渠道/资产波动的协方差；若i＝j，Σ_i,j或代表第i个渠道/资产本身的波动。

LSTM：一般指长短期记忆人工神经网络(LSTM，Long Short-Term Memory)。

Push：是指APP PUSH，是指为在手机终端锁屏状态下通知栏展示或在操作前台顶端弹出的消息通知,点击后可唤起对应的APP,并在APP内跳转到指定页面。

智电：是指智能电话营销。

cvxpy：是一个求解凸优化的python库，python是一种计算机编程语言。

Gumbel-Sinkhorn：是一种计算机算法，首先对输入向量添加Gumbel噪声，随后采用Sinkhorn算法将向量归一化。

Gumbel噪声：采样自Gumbel分布的随机噪声。

Gumbel分布：是指耿贝尔分布，也称为I型广义极值分布，是一种极值型分布，用于对各种分布的多个样本的最大值(或最小值)的分布进行建模。

随着互联网技术的不断发展，许多互联网机构为了提高自己的服务水平，会通过各种渠道将各种类型的营销活动推荐给用户；例如，在互联网金融机构提出的一种全渠道运筹项目中，该项目面对着流量管理中多项目、多渠道、多活动的营销现状，其中，项目*渠道*活动*投放单元所组成的触达决策空间巨大。但是在渠道营销中，各渠道之间缺乏统筹，使得流量分发和使用低效，

例如，push的投放、短信的投放、智电的投放等各自配置执行，这种情况使得流量分发效率低进而带来成本的浪费。具体包括，针对项目层面的新客户拉新、转化需求，需要针对目标用户开展短信、智电、金融软件推送等渠道上的营销触达，吸引用户来访和转化支用。以某互联网金融机构的实际情况为例，该互联网金融机构有一系列各项目场景基于自身特性拓展的独特的触客渠道，目前已有4大类、32个通用渠道以及约十个项目独有渠道。在实际情况下，用户行为具有高度不确定性，对单用户、单渠道的行为进行准确预测难度较高，在渠道纬度更容易量化地建模用户的平均来访(收益)以及随机波动(风险)。因此，不同渠道的投放效果可以建模为均值-方差的优化问题。

针对该均值-方差的优化问题，在金融投资领域也有广泛应用，特别是为投资组合决策提供充足的科学依据。具体内容可以是，基于资产价格变化的历史数据，可以量化计算所有可投资资产的风险、收益信息。因此在实际中，通过求解该数学优化问题，即可得到预设风险、收益偏好对应的投资组合。在本说明书提供的一实施例中，针对该均值-方差优化的问题提供了下例进行解释，具体为，假设决策者已经获知了收益向量μ和风险矩阵Σ。均值-方差优化问题通过求解如下问题，决策者可以得到预设风险、收益偏好对应的行动组合：

其中，公式(1)中的J(w,μ,Σ)代表一种用户期望的风险、收益偏好，w代表分配给每个资产的权重。代表选取一个较好的w使J最大化。其中，本说明书提供的数据处理方法考虑最大化决策的夏普比率/>其中r_f为“无风险收益率”，T代表转置，例如金融投资中的国债收益率。而在该均值-方差优化问题中，如何准确预测收益向量μ和风险矩阵Σ是最大的挑战。

针对上述问题，本说明书提供的数据处理方法，提出了两种预测收益向量和风险矩阵的方案，第一种方案是基于历史数据的均值-方差优化的方案，该方案是一种常见的假设将历史数据中的风险、收益直接应用于未来，即通过历史数据计算收益向量μ和风险矩阵Σ。但是，该方法没有预测未来的走势，因此在实际使用中效果不佳。第二种方案是“先预测、后决策”的均值-方差优化的方案，该方案仅在预测阶段引入机器学习模型，通过机器学习模型预测未来趋势，进而得到未来的收益向量μ和风险矩阵Σ。但是，由于用户行为、金融市场的高度不确定性，机器学习的预测总是存在误差。但是，此类方法的决策优化模型并没有考虑这一误差，导致预测误差误导决策模型，进而导致获得低质量的决策。

也即是说，使用的“先预测、后决策”均值-方差优化方法未考虑预测误差对决策的影响，导致决策质量较低。并且，相关技术方案在真实市场数据上仅能够处理小规模问题(仅考虑了24个金融资产)，或引入了不必要的计算开销(例如，预测了每日的资产价格，但预测的精度低、无实际意义)等。

基于此，在本说明书中，提供了一种数据处理方法，本说明书同时涉及一种数据处理装置，一种计算设备，一种计算机可读存储介质以及一种计算机程序，在下面的实施例中逐一进行详细说明。

图1示出了根据本说明书一个实施例提供的一种数据处理方法的应用场景示意图，参见图1可知，该客户端会向服务器发送各种营销推广渠道的历史数据，该服务端是本方案所运行的服务器，该服务器接收到历史数据之后，会将各营销推广渠道的历史信息输入至模型，通过模型中的网络层(包括但不限于LSTM编码器、全连接层、Gumbe l-Sinkhorn层等)对历史数据进行预测，获得各营销推广渠道未来的营销收益、营销风险以及渠道被选中执行营销推广的概率，基于营销收益、营销风险以及概率计算获得每个渠道的权重；服务器获取模型输出的权重之后，将该权重返回给客户端；而该客户端会根据每个营销推广渠道对应的权重，为其分配对应的营销推广资金，从而避免各渠道之间由于缺乏资金统筹管理，使得流量分发和使用低效，进而避免带来成本的浪费。

图2示出了根据本说明书一个实施例提供的一种数据处理方法的流程图，具体包括以下步骤。

步骤202：接收至少两个项目推荐对象的推荐行为数据。

其中，该项目可以理解为需要推荐给用户的营销推广活动，例如，拉新活动、促活活动等等。该项目推荐对象可以理解为将项目推荐给用户的对象，例如，将营销推广活动推荐给用户的渠道。或者项目推荐对象可以理解为金融领域对用户进行营销推广的资产，包括但不限于智电、短信、弹窗等。

该推荐行为数据可以理解为该项目推荐对象进行项目推荐的历史数据，例如，营销推广渠道的收益，包括但不限于该渠道的平均来访。

具体的，本说明书提供的数据处理方法，能够直接接收到该至少两个项目推荐对象的推荐行为数据；而在本说明书提供的一实施例中，所述接收至少两个项目推荐对象的推荐行为数据，包括：

接收针对至少两个项目推荐对象的推荐行为数据的数据获取请求，其中，所述数据获取请求中携带有所述至少两个项目推荐对象的对象标识；

从数据存储单元中获取与所述对象标识对应的所述推荐行为数据，其中，所述数据存储单元中存储所述至少两个项目推荐对象的所述推荐行为数据。

其中，本说明书提供的数据处理方法可以应用于服务器或者客户端，该数据获取请求可以理解为指示该数据处理方法所应用的服务器或者客户端获得该推荐行为数据的请求。该对象标识可以理解为唯一标识一个项目推荐对象的标识，例如，名称、编号等。

该数据存储单元可以理解为数据库、或者数据处理方法所应用的服务器/客户端上配置的本地磁盘、缓存等设备。其中，该数据存储单元中存储有多个营销推广渠道的历史收益数据。

具体的，在本说明书提供的数据处理方法，在接收到针对该至少两个项目推荐对象的推荐行为数据的数据获取请求之后，能够根据该数据获取请求中携带的至少两个项目推荐对象的对象标识等信息，从数据存储单元中查询与上述对象标识对应的推荐行为数据，并获取该推荐行为数据，从而达到快速获取该推荐行为数据的目的，降低了与用户之间的网络带宽压力。

下面以本说明书提供的数据处理方法应用在预测性均值-方差优化场景下为例，对根据接收到的数据获取请求从数据存储单元中获取该推荐行为数据进行说明，其中，该至少两个项目推荐对象包括智电、短信、弹窗等营销推广投放渠道。该推荐行为数据为渠道的历史收益，该对象标识可以为渠道标识，该渠道标识以候选列表的形式存在，该列表中包含多个营销渠道标识。

具体的，用户可以通过请求的方式向数据处理方法所应用的服务器发送候选列表，该服务器接收到该候选列表之后，能够从而存储各渠道的历史收益数据的数据库中获取候选列表中各渠道的历史收益，后续能够基于该历史收益数据对各渠道的权重进行预测。

需要说明的是，该用户还可以请求的方式向数据处理方法所应用的服务器输入需要预测收益时间区间，也称为预测窗口宽度，例如，未来半年时间区间内的收益。后续能够根据该历史收益对预测收益时间区间内的收益数据进行预测。

步骤204：将所述推荐行为数据输入至分配预测模型，确定所述至少两个项目推荐对象的预测收益数据以及预测执行状态数据。

该分配预测模型可以理解为一个能够对目标推荐对象的未来收益以及执行状态进行预测的模型，同时，该模型也可以根据该预测收益数据以及预测执行状态数据为至少两个项目推荐对象确定对应的资源分配数据。该机器学习模型可以通过学习历史信息预测每个行为在未来的收益与风险；而决策者基于未来的收益和风险，套用均值-方差优化模型进行决策。例如，该分配预测模型的模型结构可以参见图3，图3是本说明书一个实施例提供的一种数据处理方法中的模型结构示意图，基于图3可知，该模型的结构包括LSTM编码器、全连接层、Gumbe l-Sinkhorn层；该历史数据为推荐行为数据，历史数据1、历史数据2至历史数据N用于表示该历史数据属于不同的渠道，通过将该历史数据分别输入至对应的LSTM编码器获得编码器隐向量，通过将该隐向量输入至全连接层，获得未来收益(即预测收益μ)以及未来风险(例如，风险指标Σ)。此外，该全连接层还会输出每个渠道被选中对用户进行推广的概率，并将该概率输入至Gumbe l-Sinkhorn层，从而获得更加准确的、每个渠道被选中进行推广的候选概率。

该预测收益数据可以理解为项目推荐对象被预测的未来收益数据，该预测收益数据包括预测收益参数以及预测风险参数，该预测收益参数为上述未来收益，该预测风险参数为上述未来风险；需要说明的是，在采样均值-方差优化模型预测收益与风险的过程中，该预测收益参数为均值、预测风险参数为方差。

该预测执行状态数据是指该至少两个项目推荐对象，被选中对用户执行项目推荐的概率。在实际运行中，考虑到营销推广存在资金限制，因此为了最大效率的提高推广效率并且提高资金的利用率，因此，需要确定每个渠道被选中对用户进行推广的概率，后续基于该概率能够更准确的确定每个渠道的权重，从而获得更加优秀的资源分配组合。

具体的，在本说明书提供的一实施例中，所述将所述推荐行为数据输入至分配预测模型，确定所述至少两个项目推荐对象的预测收益数据以及预测执行状态数据，包括：

将所述推荐行为数据输入至分配预测模型，根据所述分配预测模型中的向量获取单元，获得所述推荐行为数据对应的推荐行为向量；

根据所述分配预测模型中的数据预测单元对所述推荐行为向量进行处理，获得所述至少两个项目推荐对象的预测收益数据以及预测执行状态数据。

其中，该向量获取单元可以理解为该分配预测模型中包含的，能够对推荐行为数据进行处理获得对应向量的单元，例如，该向量获取单元可以为LSTM层。推荐行为向量可以为隐向量。

该数据预测单元可以理解为该分配预测模型中包含的，能够基于该推荐行为向量获得预测收益数据以及预测执行状态数据的网络层。

具体的，本说明书提供的数据处理方法，在将该推荐行为数据输入至该分配预测模型中之后，会利用该分配预测模型中的向量获取单元对该推荐行为数据进行处理，从而获得该推荐行为数据对应的推荐行为数据，之后，再利用该分配预测模型中的数据预测单元对该推荐行为向量进行处理，从而获得该至少两个项目推荐对象的预测收益数据以及预测执行状态数据，从而快速且准确的获得预测收益数据以及预测执行状态数据。

沿用上例，本说明书提供的数据处理方法，将历史数据以时间序列的形式输入模型。使用长短时记忆(LSTM)模型构造一个编码器，接受历史数据输入。遍历完历史数据后，输出长短时记忆模型的隐向量。最后基于编码器的隐向量，利用模型中的其他进行收益、风险以及候选概率计算的网络层对该隐向量进行处理，从而获得预测收益和风险指标μ,Σ以及候选概率X。

在本说明书提供的一实施例中，考虑到目前进行预测回报和风险过程存在效率较低的问题，因此本方案通过模型直接对该回报和风险进行预测，具体过程为，所述根据所述分配预测模型中的数据预测单元对所述推荐行为向量进行处理，获得所述至少两个项目推荐对象的预测收益数据以及预测执行状态数据，包括：

将所述推荐行为向量输入至所述分配预测模型中的第一数据预测单元，获得所述至少两个项目推荐对象的预测收益数据；

将所述推荐行为向量输入至所述分配预测模型中的第二数据预测单元，获得所述至少两个项目推荐对象的预测执行状态数据。

其中，第一数据预测单元可以为确定预测收益数据的网络层，例如，全连接层，该第二数据预测单元可以为确定预测执行状态数据的网络层。

沿用上例，在获得该历史数据的隐向量之后，将该隐向量输入至分配预测模型中的全连接层，利用该全连接层确定预测收益和风险指标μ,Σ。同时，还需要将该隐向量输入至分配预测模型中进行候选概率预测的网络层中，获得该网络层输出的候选概率X，从而采用网络直接预测回报和风险，降低了计算开销、提升了运算效率。

在本说明书提供的一实施例中，本说明书提供的数据处理方法中，提供了一种机器学习预测方法，通过使用LSTM编码器处理历史数据序列，使用全连接层和Gumbe l-Sinkhorn层预测未来的风险、收益和候选概率，从而提升了运算效率，具体的，所述将所述推荐行为向量输入至所述分配预测模型中的第二数据预测单元，获得所述至少两个项目推荐对象的预测执行状态数据，包括：

将所述推荐行为向量输入至所述分配预测模型中的待处理数据预测单元，获得所述至少两个项目推荐对象的待处理执行状态数据；

将所述待处理执行状态数据输入至所述分配预测模型中的状态数据预测单元，获得所述至少两个项目推荐对象的预测执行状态数据。

其中，所述待处理数据预测单元可以理解为全连接层；需要说明的是，该待处理数据预测单元与该第一数据预测单元可以为同一个的全连接层，也可以为不同。该状态数据预测单元可以为Gumbe l-Sinkhorn层。

沿用上例，若均值-方差优化问题中限制了可同时选择的渠道/资产数目，则基于编码器的隐向量，使用全连接网络输出选择某一个渠道/资产的概率(待处理执行状态数据)，随后使用Gumbe l-Sinkhorn层让网络，输出选择每个渠道/资产的候选概率x(预测执行状态数据)。

步骤206：根据所述预测收益数据和所述预测执行状态数据，获得为所述至少两个项目推荐对象进行资源分配的资源分配数据。

沿用上例，在基于历史数据计算获得均值(收益)、方差(风险)以及候选概率之后，基于该均值、方差以及候选概率计算每个渠道或资产的权重w，后续根据每个渠道/资产的权重w确定资源分配组合。

具体的，在本说明书提供的一实施例中，该资源分配数据的计算可以通过分配预测模型中的单元实现，从而快速的输入该渠道对应的权重，具体方式为，所述根据所述预测收益数据和所述预测执行状态数据，获得为所述至少两个项目推荐对象进行资源分配的资源分配数据，包括：

将所述预测收益数据和所述预测执行状态数据输入所述分配预测模型中的分配数据获取单元，获得为所述至少两个项目推荐对象进行资源分配的资源分配数据。

该分配数据获取单元可以理解为该分配预测模型中用于计算该资源分配数据的网络层。

具体地，在获得该预测收益数据和预测执行状态数据之后，将其输入至分配预测模型中的分配数据获取单元进行计算处理，从而获得该资源分配数据。

在本说明书提供的一实施例中，该资源分配数据的计算过程具体可以为，所述预测收益数据包括预测收益参数以及预测风险参数，所述资源分配数据为资源分配权重；

相应的，所述将所述预测收益数据和所述预测执行状态数据输入所述分配预测模型中的分配数据获取单元，获得为所述至少两个项目推荐对象进行资源分配的资源分配数据，包括：

基于所述分配预测模型中的分配数据获取单元，对输入的所述预测收益参数以及所述预测风险参数进行处理，确定第一资源分配权重；

对所述第一资源分配权重以及输入的所述预测执行状态数据进行处理，获得为所述至少两个项目推荐对象进行资源分配的资源分配权重。

沿用上例，在确定该收益向量μ、风险矩阵Σ以及候选概率x之后，利用模型中的网络层对三个参数进行处理，从而计算获得道/资产组合权重w，该计算渠道/资产组合权重w的步骤包括，首先是基于收益向量μ和风险矩阵Σ计算出第一种权重w(即第一资源分配权重)，其次，通过激活函数对第一种权重w与候选概率x之间的同或运算结果进行处理，获得第二种权重w。最后用第二种权重与第二种权重w的求和结果相除，获得渠道/资产组合的最终权重w(即上述资源分配权重)。具体可以参见下述公式(2)、公式(3)、公式(4)。其中，

w＝Σ^-1(μ-r_f) 公式(2)

其中，该公式(2)用于计算上述第一种权重w，其中r_f为“无风险收益率”。

w＝relu(w⊙x) 公式(3)

其中，⊙表示同或运算，relu()为一种激活函数；通过该公式(3)能够计算获得上述第二种权重w。

w＝w/sum(w) 公式(4)

其中，sum()表示求和运算。通过该公式(4)能够获得上述最终权重w。

在本说明书提供的一实施例中，在确定资源分配数据之后，需要基于该资源分配数据为项目推荐对象进行资源分配，从而达到统筹分配资源的目的，避免了由于资源分配不均导致进行项目推荐的效率较低的问题，同时也避免了推广资源的浪费，具体过程为，所述的数据处理方法，所述根据所述预测收益数据和所述预测执行状态数据，获得为所述至少两个项目推荐对象进行资源分配的资源分配数据之后，还包括：

确定所述至少两个项目推荐对象对应的对象运行资源；

基于所述资源分配数据，将所述对象运行资源分配至所述至少两个项目推荐对象。

其中，所述对象运行资源可以理解为项目推荐对象在进行推荐过程中所需要的资源，包括但不限于资金、带宽、流量等。

具体的，在确定资源分配数据之后，确定该至少两个项目推荐对象所对应的对象运行资源，基于该资源分配数据从该对象运行资源中为每个项目推荐对象确定对应的对象运行资源，并将其分配给对应的项目推荐对象。

沿用上例，该对象运行资源为1000元资金，项目推荐对象为短信渠道、智电渠道、弹窗渠道等；其对应的权重分别为0.2,0.3,0.5。基于此，通过不同渠道的权重将1000元资金中的500元分配给弹窗渠道、300元分配给智电渠道、200分配给短信渠道，从而实现最大效率的资源利用率，节约了成本。

在本说明书提供的一实施例中，该数据处理方法提出了一种预测性均值-方差优化方案，该方案基于机器学习模型实现，而在机器学习模型的训练过程中同时考虑优化步骤。基于此，本方案改进了相关技术方案，采用了长短时记忆网络，可以处理500渠道/资产及以上的大规模均值-方差优化问题；采用网络直接预测回报和风险，降低了计算开销、提升了运算效率。因此，本方案扩展了在均值-方差优化方法在金融投资领域的应用，建模并考虑了互联网金融带宽等多渠道营销场景。具体的模型的训练过程为，所述将所述推荐行为数据输入至分配预测模型，确定所述至少两个项目推荐对象的预测收益数据以及预测执行状态数据之前，还包括：

接收至少两个样本项目推荐对象的样本推荐行为数据，以及所述样本推荐行为数据对应的样本标签；

将所述样本推荐行为数据输入至待训练的分配预测模型，确定所述至少两个样本项目推荐对象的样本预测收益数据以及样本预测执行状态数据；

根据所述样本预测收益数据和所述样本预测执行状态数据，获得为所述至少两个样本项目推荐对象进行资源分配的样本资源分配数据；

基于所述样本资源分配数据以及所述样本标签对所述待训练的分配预测模型进行训练，获得分配预测模型。

其中，该样本项目推荐对象可以理解为作为样本的渠道、资产等，该样本推荐行为数据可以理解为样本渠道或资产的历史数据，该样本标签可以理解为预先设置的、渠道的未来收益。

沿用上例，用户输入预测窗口宽度(例如未来半年的收益)、候选列表，获取候选列表中所有渠道/资产价格的历史数据作为训练样本(即样本推荐行为数据)，并将预测窗口宽度作为样本标签，也即是对未来预测的真值。

在训练过程中，将资产价格的历史数据划分为训练数据集、验证数据集和测试数据集。基于训练数据集对机器学习预测模型进行有监督训练，具体包括：每个样本包含一段“输入样本”代表历史价格，以及“预测窗口”代表对未来预测的真值。其中，为了获得足够数目的训练样本，训练集、验证集和测试集的输入样本可以在时间上重合；而为了测试集分布的独立性和公平性，训练集、验证集和测试集的预测窗口不能在时间上重合。

然后构造机器学习预测模型，将历史数据以时间序列的形式输入模型。使用长短时记忆(LSTM)模型构造一个编码器，接受输入。遍历完历史数据后，输出长短时记忆模型的隐向量。基于编码器的隐向量，预测收益和风险指标μ,Σ(即样本预测收益数据)。若均值-方差优化问题中限制了可同时选择的渠道/资产数目，则基于编码器的隐向量，使用全连接网络输出选择某一个渠道/资产的概率，随后使用Gumbe l-Sinkhorn层让网络，输出选择每个渠道/资产的概率x(即样本预测执行状态数据)。

最后通过上述公式(2)、公式(3)、公式(4)步骤，输出渠道/资产组合w(样本资源分配数据)。

在确定模型的输出结果之后，基于训练数据“预测窗口”的真值，计算实际的收益和风险指标基于模型预测的组合w和真值/>计算目标函数/>学习的目标即为通过梯度反传，最大化该目标函数。若添加了多个Gumbe l噪声进而计算得到多个目标函数，则将所有目标函数求平均作为监督信号。

需要说明的是，训练过程中遍历所有的训练集数据，使模型收敛。根据验证集的模型性能调整超参数。在测试集上评估模型的性能。

在本说明书提供的一实施例中，在完成模型训练之后，需要基于验证集以及测试集对模型进行推理验证，通过利用机器学习模型进行推理，评估模型性能。具体过程包括：加载训练中较优的模型权重，输入历史数据和预测窗口长度，基于上述步骤预测获得μ,Σ,x。

其次，使用数学求解软件(例如cvxpy)，基于μ,Σ,x得到资产组合w。若采用Gumbel-Sinkhorn方案，模型同时预测了多个渠道/资产组合，则选择对应J(w,μ,Σ)值最大的权重输出(μ,Σ由预测得到)。

最后，基于验证集/测试集数据“预测窗口”的真值，计算实际的收益和风险指标根据模型预测的组合w和真值/>计算目标函数/>作为评估模型性能好坏的指标。此外，还可以单独计算真实的收益与风险值，作为性能评估指标。

本说明书实施例提供的数据处理方法，通过将至少两个项目推荐对象的推荐行为数据输入至分配预测模型，利用该分配预测模型对该推荐行为数据进行处理，获得至少两个项目推荐对象的预测收益数据以及预测执行状态数据，并根据预测收益数据和预测执行状态数据，获得资源分配数据，从而使得后续能够基于该资源分配数据对该至少两个项目推荐对象对应的资源进行分配，从而达到统筹分配资源的目的，避免了由于资源分配不均导致进行项目推荐的效率较低的问题，同时也避免了推广资源的浪费。

下述结合附图4，以本说明书提供的数据处理方法在针对预测性均值-方差优化场景下的应用为例，对所述数据处理方法进行进一步说明。其中，图4示出了本说明书一个实施例提供的一种数据处理方法的处理过程流程图，该图4的A部分表示对模型的训练过程，图4中的B部分表示对模型的测试过程，在测试通过之后能够基于该模型实现各渠道权重的技术，具体包括步骤。

步骤402：将历史数据序列输入LSTM编码器。

其中，渠道的历史数据为训练样本，对应的样本标签为预测窗口宽度，代表对未来特定时间范围内预测的真值，例如(某渠道未来半年的预估收益)。

步骤404：预测渠道或资产在未来的回报和风险。

具体地，将历史数据以时间序列的形式输入模型。使用长短时记忆(LSTM)模型构造一个编码器，接受该历史数据输入。遍历完历史数据后，输出长短时记忆模型的隐向量，之后，将该隐向量输入全连接层，获得渠道的预测收益和风险指标μ,Σ。

步骤406：使用Gumbe l-Sinkhorn网络预测选中每项渠道/资产的概率。

具体的，若均值-方差优化问题中限制了可同时选择的渠道/资产数目，则将隐向量输入全连接层，使用全连接网络输出选择某一个渠道/资产的概率；

之后，为了提高概率的准确性，将概率输入至Gumbe l-Sinkhorn层，使用Gumbe l-Sinkhorn层让该网络输出选择每个渠道/资产的概率x，从而获取从全局角度考虑的概率x。

步骤408：使用回报、风险以及概率根据求得组合权重。

具体的，在确定预测收益μ、风险指标Σ以及概率x之后，基于三种计算获得渠道/资产的组合权重x，具体计算过程可以参见上述公式(2)、公式(3)以及公式(4)。

步骤410：根据组合权重和样本标签计算目标函数，在训练集上训练模型。

具体的，基于训练数据“预测窗口”的真值，计算实际的收益和风险指标基于模型预测的组合w和真值/>计算目标函数/>

学习的目标即为通过梯度反传，最大化该目标函数。若添加了多个Gumbe l噪声进而计算得到多个目标函数，则将所有目标函数求平均作为监督信号。最后，训练过程中遍历所有的训练集数据，使模型收敛。

上述步骤为模型的训练过程，在训练完成之后，根据验证集的模型性能调整超参数，在测试集上评估模型的性能。具体步骤如下。

步骤412：将历史数据序列输入LSTM编码器。

其中，该历史数据为验证集或测试集中的数据。

步骤414：预测渠道或资产在未来的回报和风险。

具体的，加载训练中较优的模型权重，输入历史数据和预测窗口宽度，基于上述步骤404的相同方式，预测μ,Σ。

步骤416：使用Gumbe l-Sinkhorn网络预测选中每项渠道/资产的概率。

基于上述步骤406的相同方式，预测概率x。

步骤418：使用二次规划求解算法，根据回报、风险以及概率求得组合权重。

具体的，使用数学求解软件，基于μ,Σ,x得到资产组合w。

若采用Gumbe l-Sinkhorn方案，模型同时预测了多个渠道/资产组合，则选择对应J(w,μ,Σ)值最大的权重输出(μ,Σ由预测得到)。

步骤420：根据组合权重和样本标签计算目标函数，在测试集上评估模型性能。

具体的，基于验证集/测试集数据“预测窗口”的真值，计算实际的收益和风险指标根据模型预测的组合w和真值/>计算目标函数/>作为评估模型性能好坏的指标。此外，还可以单独计算真实的收益与风险值，作为性能评估指标。

在模型训练、测试通过之后，即可基于训练后的模型实现上述实施例中通过向模型中输入渠道/资产的历史数据，即可获得输入的渠道/资产的组合权重的步骤，在此不重复赘述。

本说明书提供的数据处理方法，可以理解为一种预测性均值-方差优化方法，考虑到实际场景下，由于决策者更关心未来的收益和风险。因此所产生的基于机器学习预测技术的均值-方差优化方法存在的问题，例如，如何充分利用历史信息，训练预测、决策一体化的机器学习模型，达到提升未来收益的目的等等。本方案在智能营销和投资组合优化项目中，提供了一种联合预测和优化的学习方法。相比将预测步骤和优化步骤分别单独考虑，联合学习方法受误差影响更小、性能更好。并且在本方法中，通过提供一种异构的训练、推理方法：训练阶段使用可导的公式求得资产组合，推理阶段使用精度更高的数学求解软件进行求解。

为了充分对本方法所达到的技术效果进行说明，下述实施例中通过两个数据示意图展示本方案在实际应用中所达到的效果，参见图5，图5是本说明书一个实施例提供的一种数据处理方法的一种效果示意图，基于图5的回测结果可知，本说明书提供的数据处理方法，即预测决策一体化(本方案)的平均收益为40.0％，而其他方法，例如先预测后决策的平均收益为24.1％，历史投资组合的平均收益为13.9％，因此，本方案预测的平均收益优于其他现有的均值-方差优化方法。

参见图6，基于图6的回测结果可知，本说明书提供的数据处理方法，即预测决策一体化(本方案)的平均风险为18.8％，而其他方法，例如先预测后决策的平均风险为19.5％，历史投资组合的平均风险为16.2％，因此，本方案其预测的平均风险与其他现有均值-方差优化方法持平。

与上述方法实施例相对应，本说明书还提供了数据处理装置实施例，图7示出了本说明书一个实施例提供的一种数据处理装置的结构示意图。如图7所示，该装置包括：

数据接收模块702，被配置为接收至少两个项目推荐对象的推荐行为数据；

数据预测模块704，被配置为将所述推荐行为数据输入至分配预测模型，确定所述至少两个项目推荐对象的预测收益数据以及预测执行状态数据；

数据获取模块706，被配置为根据所述预测收益数据和所述预测执行状态数据，获得为所述至少两个项目推荐对象进行资源分配的资源分配数据。

可选地，所述数据预测模块704，还被配置为：

可选地，所述数据获取模块706，还被配置为：

可选地，所述预测收益数据包括预测收益参数以及预测风险参数，所述资源分配数据为资源分配权重；

相应的，所述数据获取模块706，还被配置为：

可选地，所述数据处理装置，还包括资源分配模块，被配置为：

确定所述至少两个项目推荐对象对应的对象运行资源；

可选地，所述数据接收模块702，还被配置为：

可选地，所述数据处理装置，还包括模型训练模块，被配置为：

本说明书实施例提供的数据处理装置，通过将至少两个项目推荐对象的推荐行为数据输入至分配预测模型，利用该分配预测模型对该推荐行为数据进行处理，获得至少两个项目推荐对象的预测收益数据以及预测执行状态数据，并根据预测收益数据和预测执行状态数据，获得资源分配数据，从而使得后续能够基于该资源分配数据对该至少两个项目推荐对象对应的资源进行分配，从而达到统筹分配资源的目的，避免了由于资源分配不均导致进行项目推荐的效率较低的问题，同时也避免了推广资源的浪费。

上述为本实施例的一种数据处理装置的示意性方案。需要说明的是，该数据处理装置的技术方案与上述的数据处理方法的技术方案属于同一构思，数据处理装置的技术方案未详细描述的细节内容，均可以参见上述数据处理方法的技术方案的描述。

图8示出了根据本说明书一个实施例提供的一种计算设备800的结构框图。该计算设备800的部件包括但不限于存储器810和处理器820。处理器820与存储器810通过总线830相连接，数据库850用于保存数据。

计算设备800还包括接入设备840，接入设备840使得计算设备800能够经由一个或多个网络860通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备840可以包括有线或无线的任何类型的网络接口(例如，网络接口卡(NIC))中的一个或多个，诸如I EEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口，等等。

在本说明书的一个实施例中，计算设备800的上述部件以及图8中未示出的其他部件也可以彼此相连接，例如通过总线。应当理解，图8所示的计算设备结构框图仅仅是出于示例的目的，而不是对本说明书范围的限制。本领域技术人员可以根据需要，增添或替换其他部件。

计算设备800可以是任何类型的静止或移动计算设备，包括移动计算机或移动计算设备(例如，平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如，智能手机)、可佩戴的计算设备(例如，智能手表、智能眼镜等)或其他类型的移动设备，或者诸如台式计算机或PC的静止计算设备。计算设备800还可以是移动式或静止式的服务器。

其中，处理器820用于执行如下计算机可执行指令，该计算机可执行指令被处理器820执行时实现上述数据处理方法的步骤。

上述为本实施例的一种计算设备的示意性方案。需要说明的是，该计算设备的技术方案与上述的数据处理方法的技术方案属于同一构思，计算设备的技术方案未详细描述的细节内容，均可以参见上述数据处理方法的技术方案的描述。

本说明书一实施例还提供一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现上述数据处理方法的步骤。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是，该存储介质的技术方案与上述的数据处理方法的技术方案属于同一构思，存储介质的技术方案未详细描述的细节内容，均可以参见上述数据处理方法的技术方案的描述。

本说明书一实施例还提供一种计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行上述数据处理方法的步骤。

上述为本实施例的一种计算机程序的示意性方案。需要说明的是，该计算机程序的技术方案与上述的数据处理方法的技术方案属于同一构思，计算机程序的技术方案未详细描述的细节内容，均可以参见上述数据处理方法的技术方案的描述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-On ly Memory)、随机存取存储器(RAM，Random AccessMemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

需要说明的是，对于前述的各方法实施例，为了简便描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本说明书实施例并不受所描述的动作顺序的限制，因为依据本说明书实施例，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定都是本说明书实施例所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本说明书实施例的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本说明书实施例的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种数据处理方法，包括：

接收至少两个项目推荐对象的推荐行为数据；

将所述推荐行为数据输入至分配预测模型，确定所述至少两个项目推荐对象的预测收益数据以及预测执行状态数据；

根据所述预测收益数据和所述预测执行状态数据，获得为所述至少两个项目推荐对象进行资源分配的资源分配数据。

2.根据权利要求1所述的数据处理方法，所述将所述推荐行为数据输入至分配预测模型，确定所述至少两个项目推荐对象的预测收益数据以及预测执行状态数据，包括：

3.根据权利要求2所述的数据处理方法，所述根据所述分配预测模型中的数据预测单元对所述推荐行为向量进行处理，获得所述至少两个项目推荐对象的预测收益数据以及预测执行状态数据，包括：

4.根据权利要求3所述的数据处理方法，所述将所述推荐行为向量输入至所述分配预测模型中的第二数据预测单元，获得所述至少两个项目推荐对象的预测执行状态数据，包括：

5.根据权利要求1所述的数据处理方法，所述根据所述预测收益数据和所述预测执行状态数据，获得为所述至少两个项目推荐对象进行资源分配的资源分配数据，包括：

6.根据权利要求5所述的数据处理方法，所述预测收益数据包括预测收益参数以及预测风险参数，所述资源分配数据为资源分配权重；

7.根据权利要求1所述的数据处理方法，所述根据所述预测收益数据和所述预测执行状态数据，获得为所述至少两个项目推荐对象进行资源分配的资源分配数据之后，还包括：

确定所述至少两个项目推荐对象对应的对象运行资源；

8.根据权利要求1所述的数据处理方法，所述接收至少两个项目推荐对象的推荐行为数据，包括：

9.根据权利要求1所述的数据处理方法，所述将所述推荐行为数据输入至分配预测模型，确定所述至少两个项目推荐对象的预测收益数据以及预测执行状态数据之前，还包括：

10.一种数据处理装置，包括：

11.一种计算设备，包括：

存储器和处理器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，该计算机可执行指令被处理器执行时实现权利要求1至9任意一项所述数据处理方法的步骤。

12.一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现权利要求1至9任意一项所述数据处理方法的步骤。