CN117237009A

CN117237009A - 权益推送风险预警方法、装置、计算机设备及存储介质

Info

Publication number: CN117237009A
Application number: CN202311144317.8A
Authority: CN
Inventors: 敖琦
Original assignee: Ping An Property and Casualty Insurance Company of China Ltd
Current assignee: Ping An Property and Casualty Insurance Company of China Ltd
Priority date: 2023-09-06
Filing date: 2023-09-06
Publication date: 2023-12-15

Abstract

本申请属于人工智能及金融科技领域，涉及一种权益推送风险预警方法，包括确定时间序列数据的全部数据字段中的特征字段和预测字段；筛选与权益相关的特征字段作为输入特征，确定输出特征；基于输入特征构建多维特征数据集；将多维特征数据集分为训练集和测试集；将训练集输入LSTM神经网络模型，得到训练的LSTM神经网络模型；测试集输入训练的LSTM神经网络模型，输出权益推送预测模型；将目标活动权益数据输入模型得到预测推送数量；根据预测推送数量确定触发预警，定位风险。本申请还提供一种权益推送风险预警装置、计算机设备及存储介质。此外，本申请还涉及区块链技术，时间序列数据可存储于区块链中。本申请能够提高模型的识别精度，实现风险定位。

Description

权益推送风险预警方法、装置、计算机设备及存储介质

技术领域

本申请涉及人工智能及金融科技技术领域，尤其涉及一种权益推送风险预警方法、装置、计算机设备及存储介质。

背景技术

随着互联网技术与移动通信网络的快速发展，各应用平台通过信息推送的方式将活动权益下发至各个用户端，从而使用户获取不同提供方提供的权益资源。但是，会存在一些非正常用户从中牟利，通过违规或非法的手段，不正当的刷取这些形式的权益服务和优惠，冲击了正常的客户服务体系。因此，需要对活动权益的发放进行风控预警。

目前，预警触发方式，多以超出当前预测值置信范围来发出预警，而预测结果的准确性直接影响预警监控的有效性。基于预警规则的方法，依靠专家经验设定阈值，且以环比、同比增长或平均值大于指定阈值来触发预警。这种方法的弊端，未考虑到当前的活动因素影响，如新增发放量、节假日、推广拉新等因素。基于线性回归的预测，依据提取的特征的线性组合来预测，该方法的检测精确度低，不相关的特征影响预测结果，且未考虑到时间序列的因素。基于时序预测的ARMA模型(Auto-Regressive Moving Average Model，自回归滑动平均模型)，要求数据是稳定的，现实数据是很难满足上述条件的；ARMA模型，通过周期性分析进行模型建立，但需要的参数多，计算成本高。以上预测方法，均通过预警相关人员，进行熔断等操作，但是未能有效进行风险定位。

发明内容

本申请实施例的目的在于提出一种权益推送风险预警方法、装置、计算机设备及存储介质，以解决现有技术中风险预警方法预测不准确、计算成本高以及无法进行风险定位的技术问题。

为了解决上述技术问题，本申请实施例提供一种权益推送风险预警方法，采用了如下所述的技术方案：

按照预设时间间隔获取历史活动的时间序列数据，提取所述时间序列数据中的全部数据字段，并确定全部所述数据字段中的特征字段和预测字段；

筛选出与权益相关的所述特征字段作为输入特征，将所述输入特征对应的预测字段作为输出特征；

从所述时间序列数据中分别提取所述输入特征和所述输出特征对应的输入数据和输出数据，基于所述输入数据构建多维特征数据集，所述输出数据作为所述多维特征数据的真值标签；

按照预设比例将所述多维特征数据集分为训练集和测试集；

根据所述输入特征和所述输出特征构建LSTM神经网络模型，并将所述训练集输入所述LSTM神经网络模型中进行训练，得到训练的LSTM神经网络模型；

使用所述测试集对所述训练的LSTM神经网络模型进行验证，输出符合预设条件的权益推送预测模型；

获取目标活动权益数据，将所述目标活动权益数据输入所述权益推送预测模型，得到预测推送数量；

根据所述预测推送数量确定是否触发预警；

在触发预警时，对预警风险进行风险定位，将所述风险定位发送给用户。

进一步的，所述筛选出与权益相关的所述特征字段作为输入特征的步骤包括：

计算每个所述特征字段与所述预测字段之间的相关系数；

筛选出所述相关系数大于预设相关阈值的所述特征字段作为输入特征。

进一步的，所述LSTM神经网络模型包括前向LSTM层、后向LSTM层、dropout层、全连接层以及输出层；所述将所述训练集输入所述LSTM神经网络模型中进行训练，得到训练的LSTM神经网络模型的步骤包括：

将所述训练集输入所述前向LSTM层中进行计算，输出前向隐藏层状态序列；

将所述训练集输入所述后向LSTM层中进行计算，得到后向隐藏层状态序列；

拼接所述前向隐藏层状态序列和所述后向隐藏层状态序列，得到隐藏层特征状态序列，并将所述隐藏层特征状态序列输入至所述dropout层，得到增强隐藏层特征；

通过所述全连接层对所述增强隐藏层特征进行计算，得到预测特征向量；

将所述预测特征向量输入所述输出层，计算得到预测结果；

按照预设损失函数计算所述预测结果和所述真值标签之间的损失值；

根据所述损失值调整所述LSTM神经网络模型的网络参数，继续进行训练，直至收敛，输出训练的LSTM神经网络模型。

进一步的，所述前向LSTM层包括遗忘门、输入门、输出门和记忆单元；所述将所述训练集输入所述前向LSTM层中进行计算，输出前向隐藏层状态序列的步骤包括：

将所述训练集输入所述前向LSTM层，根据上一时刻隐藏层状态、当前输入特征、遗忘门权重矩阵和遗忘门偏置向量，计算得到所述遗忘门的值；

根据所述上一时刻隐藏层状态、所述当前输入特征、输入门权重矩阵和输入门偏置向量，计算得到所述输入门的值；

根据所述上一时刻隐藏层状态、所述当前输入特征、记忆单元权重矩阵和记忆单元偏置向量，计算得到所述记忆单元的临时状态；

根据所述遗忘门的值、所述输入门的值、所述临时状态以及上一时刻记忆单元状态，计算得到当前时刻记忆单元状态；

根据所述上一时刻隐藏层状态、所述当前输入特征、输出门权重矩阵和输出门偏置向量，计算得到所述输出门的值；

根据所述当前时刻记忆单元状态和所述输出门的值，计算得到当前时刻前向隐藏层状态；

将所有时刻的前向隐藏层状态进行拼接，得到所述前向隐藏层状态序列。

进一步的，所述使用所述测试集对所述训练的LSTM神经网络模型进行验证，输出符合预设条件的权益推送预测模型的步骤包括：

将所述测试集输入所述训练的LSTM神经网络模型中，输出测试预测值；

根据所述测试预测值和所述真值标签，分别计算均方根误差和平均绝对误差；

在所述均方根误差小于等于第一预设阈值，且所述平均绝对误差小于等于第二预设阈值时，输出所述训练的LSTM神经网络模型作为权益推送预测模型，并将所述均方根误差和所述平均绝对误差分别作为模型均方根误差和模型平均绝对误差。

进一步的，所述根据所述预测推送数量确定是否触发预警的步骤包括：

根据所述目标活动权益数据中获取到实际推送数量；

计算所述预测推送数量与所述实际推送数量之间的均方根误差和平均绝对误差，得到预测均方根误差和预测平均绝对误差；

分别比较所述预测均方根误差与所述模型均方根误差以及所述预测平均绝对误差和所述模型平均绝对误差；

在所述预测均方根误差大于模型均方根误差，且所述预测平均绝对误差大于所述模型平均绝对误差时，触发预警；否则，不触发预警。

进一步的，所述对预警风险进行风险定位的步骤包括：

获取预设时间的风控拦截占比，判断所述风控拦截占比是否突增；

在所述风控拦截占比突增时，确定全部预设风控策略模型是否存在变更记录；

在存在变更记录时，定位变更的风控策略模型，并根据变更的所述风控策略模型的策略特征生成风险提示。

为了解决上述技术问题，本申请实施例还提供一种权益推送风险预警装置，采用了如下所述的技术方案：

提取模块，用于按照预设时间间隔获取历史活动的时间序列数据，提取所述时间序列数据中的全部数据字段，并确定全部所述数据字段中的特征字段和预测字段；

筛选模块，用于筛选出与权益相关的所述特征字段作为输入特征，将所述输入特征对应的预测字段作为输出特征；

构建模块，用于从所述时间序列数据中分别提取所述输入特征和所述输出特征对应的输入数据和输出数据，基于所述输入数据构建多维特征数据集，所述输出数据作为所述多维特征数据的真值标签；

划分模块，用于按照预设比例将所述多维特征数据集分为训练集和测试集；

训练模块，用于根据所述输入特征和所述输出特征构建LSTM神经网络模型，并将所述训练集输入所述LSTM神经网络模型中进行训练，得到训练的LSTM神经网络模型；

测试模块，用于使用所述测试集对所述训练的LSTM神经网络模型进行验证，输出符合预设条件的权益推送预测模型；

预测模块，用于获取目标活动权益数据，将所述目标活动权益数据输入所述权益推送预测模型，得到预测推送数量；

预警模块，用于根据所述预测推送数量确定是否触发预警；

定位模块，用于在触发预警时，对预警风险进行风险定位，将所述风险定位发送给用户。

为了解决上述技术问题，本申请实施例还提供一种计算机设备，采用了如下所述的技术方案：

该计算机设备包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如上所述的权益推送风险预警方法的步骤。

为了解决上述技术问题，本申请实施例还提供一种计算机可读存储介质，采用了如下所述的技术方案：

所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如上所述的权益推送风险预警方法的步骤。

与现有技术相比，本申请主要有以下有益效果：

本申请通过获取历史活动权益的时间序列数据，并筛选出与权益相关的输入特征，根据输入特征对应的输入数据构建多维特征数据用于训练LSTM神经网络模型，可以提高模型的训练效率，提高模型拟合精度；通过对训练的LSTM神经网络模型进行验证，得到符合预设条件的权益推送预测模型，可以提高模型的识别精度；使用权益推送预测模型进行权益推送数量预测，可以提高计算效率，降低计算成本；根据预测推送数量确定是否触发预警，触发预警后对风险进行定位，能够实现风险定位，进而实现快速风险快速响应，有效解决出现的问题，维护用户权益。

附图说明

为了更清楚地说明本申请中的方案，下面将对本申请实施例描述中所需要使用的附图作一个简单介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请可以应用于其中的示例性系统架构图；

图2是根据本申请的权益推送风险预警方法的一个实施例的流程图；

图3是图2中步骤S205的一种具体实施方式的流程图；

图4是根据本申请的权益推送风险预警装置的一个实施例的结构示意图；

图5是根据本申请的计算机设备的一个实施例的结构示意图。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案，下面将结合附图，对本申请实施例中的技术方案进行清楚、完整地描述。

本申请提供了一种权益推送风险预警方法，涉及人工智能，可以应用于如图1所示的系统架构100中，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上显示的页面提供支持的后台服务器。

需要说明的是，本申请实施例所提供的权益推送风险预警方法一般由服务器/终端设备执行，相应地，权益推送风险预警装置一般设置于服务器/终端设备中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，示出了根据本申请的权益推送风险预警方法的一个实施例的流程图，包括以下步骤：

步骤S201，按照预设时间间隔获取历史活动权益的时间序列数据，提取时间序列数据中的全部数据字段，并确定全部数据字段中的特征字段和预测字段。

在本实施例中，时间序列数据可以通过有线连接方式或者无线连接方式获取。需要指出的是，上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。

活动为应用程序线上长期运营的活动，例如，购物优惠、缴费优惠以及充值优惠等，针对这些活动，为用户推送合适的权益，例如，红包奖励、随机减免、消费积分等。

在本实施例中，获取一定时间内的活动数据，例如，当前时刻至前三年的活动数据，按照预设时间间隔进行数据获取，假设当前时刻为2023-01-01 00：30，预设时间间隔为30min，则时间序号为2020-01-01 00：30，2020-01-01 01：00，…，2020-01-01 23:30，2020-01-01 24:00，…，2022-12-31 23:30,2022-12-3124：00，即每隔30分钟记录一个时间片段，共52,608条时间序列，组成时间序列数据，每个时间片段记录当前时间前半小时内的累计数据，这些数据组成时间序列数据。

提取时间序列数据中的全部数据字段，例如，上述每条时间序列的数据字段包括注册用户数、APP活跃用户数量、请求指定活动用户数量、指定活动拦截用户数量、是否为节假日、是否为大型活动节点以及指定活动发放权益数量等数据字段，将这些数据字段全部提取出来，提取的方式可以是按照正则表达式提取，也可以是按照关键字进行提取，在此不做限制。其中，请求指定活动用户数量为去重后的数量。

从提取出的全部数据字段中筛选出特征字段和预测字段，特征字段为预测时需要输入的候选字段，预测字段为预测时得到的结果。示例的，将注册用户数、APP活跃用户数量、请求指定活动用户数量、指定活动拦截用户数量、是否为节假日和是否为大型活动节点作为特征字段，指定活动发放权益数量作为预测字段。

需要强调的是，为进一步保证时间序列数据的私密和安全性，上述时间序列数据信息还可以存储于一区块链的节点中。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

步骤S202，筛选出与权益相关的特征字段作为输入特征，将输入特征对应的预测字段作为输出特征。

在本实施例中，从全部特征字段中筛选出权益相关的特征字段作为输入特征，每条时间序列中特征字段对应的预测字段即为输出特征，通过筛选出的输入特征和输出特征来进行模型训练，能够降低模型的复杂度，同时避免过拟合，提高模型训练效率。

在一些可选的实现方式中，上述筛选出与权益相关的特征字段作为输入特征的步骤包括：

计算每个特征字段与预测字段之间的相关系数；

筛选出相关系数大于预设相关阈值的特征字段作为输入特征。

其中，使用皮尔逊相关系数进行特征筛选，依次计算每个特征字段与预测字段之间的皮尔逊相关系数，计算公式如下：

其中，X为特征字段，Y为预测字段；n表示时间序列数量，i表示第i个时间序列，j表示第j个时间序列。

示例的，X为特征字段，包括注册用户数、APP活跃用户数量、请求指定活动用户数量、指定活动拦截用户数量、是否为节假日和是否为大型活动节点，分别用X_1i、X_2i、X_3i、X_4i、X_5i和X_6i表示，Y为指定活动发放权益数量；n＝52,608，i＝0,1,2,…,52607，j＝0,1,2,…,52607。

皮尔逊相关系数计算结果的值在[-1,1]之间；[0，0.1]内，表示该特征字段与预测字段无关；[0.1,0.3]内，表示该特征字段与预测字段弱相关；[0.3，0.6]内，表示该特征字段与预测字段存在相关关系；[0.6,0.9]内，表示该特征字段与预测字段存在强相关关系；大于0.9，表示该特征字段与预测字段几乎线性相关。

计算出每个特征字段与预测字段之间的皮尔逊相关系数，筛选出皮尔逊相关系数大于预设相关阈值的特征字段作为输入特征，其中，预设相关阈值为0.3，大于0.3，这说明特征字段与预测字段相关。

在一些可选的实现方式中，采用corr函数筛选出相关系数大于预设相关阈值的特征字段，corr函数是python的pandas库中的函数，具体的，导入python的pandas库，导入特征字段对应的字段数据，对导入的数据使用corr(method＝‘pearson’)函数，corr函数默认的相关系数为皮尔逊，method参数不设置也可以；data.corr()获取到皮尔逊相关系数矩阵。通过data.corr()[Y]获取到Y与其他变量的皮尔逊系数，筛选出大于预设相关阈值的特征字段。

通过对特征字段和预测字段进行皮尔逊相关系数分析，能够得到特征字段对预测字段的影响程度，在模型预测分析中至关重要。

步骤S203，从时间序列数据中分别提取输入特征和输出特征对应的输入数据和输出数据，基于输入数据构建多维特征数据集，输出数据作为多维特征数据的真值标签。

在本实施例中，每一个输入特征对应一个特征维度，多维特征数据集中多维特征数据的数量即时间序列的数量。示例的，多维特征数据的特征维度包括注册用户数、APP活跃用户数量、请求指定活动用户数量、指定活动拦截用户数量、是否为节假日以及是否为大型活动节点。

步骤S204，按照预设比例将多维特征数据集分为训练集和测试集。

在本实施例中，按照预设比例从多维特征数据集中随机抽取出相应数量的多维特征数据，分别组成训练集和测试集，其中，训练集的数据量要大于测试集的数据量，示例的，预设比例可以为7:3，即训练集占比为70％，测试集占比为30％。

预设比例可以根据实际需要进行设置，在此不作限制。

步骤S205，根据输入特征和输出特征构建LSTM神经网络模型，并将训练集输入LSTM神经网络模型中进行训练，得到训练的LSTM神经网络模型。

LSTM神经网络模型为Bi-LSTM网络(Bi-directional Long Short-Term Memory，双向长短期记忆神经网络)结构，Bi-LSTM网络结构包括两层LSTM层，第一层为前向LSTM层，第二层为后向LSTM层，在后向LSTM层之后设置dropout层，增强网络的泛化能力，加快模型收敛速度，防止模型训练过拟合；全连接层的作用是将dropout层输出的特征全部进行结合，提高模型训练的鲁棒性。

在本实施例中，以输入特征组成的多维特征数据序列作为输入，输出特征作为输出，构建包含多个神经网络单元的LSTM神经网络模型，每个神经网络单元可以看做LSTM神经网络在不同时间跨度上的状态，初始状态下，通过随机生成0到1之间的小数，为网络中的权重矩阵W和偏置矩阵b进行赋值。

在本实施例中，构建LSTM神经网络模型包括以下步骤：

网络超参数初始化：设置的超参数包括：输入节点数m，隐藏单元数k，输出单元数n，学习率η，误差阈值σ，LSTM记忆单元数w。

权重偏置初始化：初始状态下通过随机生成0到1之间的小数，为网络中的权重矩阵W和偏置矩阵b进行赋值。

根据初始设定的参数，使用训练集对LSTM神经网络模型进行训练，训练过程中，不断更新网络参数(包括超参数和权重偏置)，迭代训练，直至模型收敛，得到训练后的LSTM神经网络模型。

示例的，构建的LSTM神经网络模型如下：

第一层前向LSTM层，神经元个数为128；

第二层后向LSTM层，神经元个数为128；

第三层dropout层，设置参数为0.2，控制输入线性变换的神经元断开比例；

第四层全连接层，维度设置为64；

第五层全连接层，维度设置为32；

第六层全连接输出层，维度设置为1。

其中，第一层前向LSTM层，输入数据向量维度为[48，4]，48为步长，4为筛选的输入特征数量，神经元个数设置为128，即该层输出为向量维度[48,128]，128为特征向量的维度；

第二层输入数据向量为第一层的输出，即[48,128]输入向量维度，神经元个数设置为128，，并指定输出最后一个时间序列，即该层输出为[1,128]；

第三层输入数据向量为第二层的输出，但是该层为Dropout层，参数设置为0.2，即每次迭代训练中，每个神经元以20％的概率被丢弃掉，即将神经元的输出值置0，主要防止过拟合，减少神经网络的参数量；

第四层全链接层，输入为第三层输出，即第三层输入的神经元，以20％的概率丢弃后，进行权重计算和偏置累加，该层神经元个数设置为64，激活函数设置为relu(relu(x)＝max(x,0))，输出向量维度为[1,64]；

第五层全连接层，神经元个数为32，激活函数为relu，输出向量维度为[1,32]；

第六层为全连接输出层，神经元个数为1，激活函数为relu，输出向量维度为[1,1]。

LSTM层包括4个门，输入门、遗忘门、输出门、记忆单元；输入门中的权重矩阵为Wi、偏置向量bi；遗忘门中的权重矩阵为Wf、偏置向量bf；输出门中的权重矩阵Wo、偏置向量bo；记忆单元中的权重矩阵Wc、偏置向量bc。

步骤S206，使用测试集对训练的LSTM神经网络模型进行验证，输出符合预设条件的权益推送预测模型。

在本实施例中，利用平均绝对误差(Mean Absolute Error，MAE)和均方根误差(Root Mean Squared Error，RMSE)评价函数来检验模型的性能并对预测结果进行误差分析。

将测试集输入训练的LSTM神经网络模型中，输出测试预测值；根据测试预测值和真值标签，分别计算均方根误差和平均绝对误差；在均方根误差小于等于第一预设阈值，且平均绝对误差小于等于第二预设阈值时，输出训练的LSTM神经网络模型作为权益推送预测模型，并将均方根误差和平均绝对误差分别作为模型均方根误差(模型RMSE)和模型平均绝对误差(模型MAE)。

其中，均方根误差的计算公式如下：

平均绝对误差的计算公式如下：

其中，m为测试集中样本数据数量；表示第i个样本的真值标签；表示第i个样本的测试预测值。

在RMSE小于等于第一预设阈值且MAE小于等于第二预设阈值时，训练的LSTM神经网络模型的预测精度满足要求，将该训练的LSTM神经网络模型作为最终的权益推送预测模型；在均方根误差和平均绝对误差不满足预设条件，即均方根误差大于第一预设阈值或平均绝对误差大于第二预设阈值时，可以重新训练LSTM神经网络模型。

第一预设阈值和第二预设阈值可以是相同值也可以是不同值，可以根据实际需要进行设置。

通过RMSE和MAE来验证模型，可以更好地评估模型拟合效果，提高模型预测准确性。

步骤S207，获取目标活动权益数据，将目标活动权益数据输入权益推送预测模型，得到预测推送数量。

目标活动权益数据为指定活动在目标时间段的目标时间序列数据，从目标时间序列数据中抽取出输入特征对应的数据，输入权益推送预测模型，预测出该指定活动发放的权益数量，即预测推送数量。

通过权益推送预测模型进行预测，可以避免无关参数因素对预测结果的影响，降低计算成本，提高预测准确度。

步骤S208，根据预测推送数量确定是否触发预警。

在本实施例中，根据目标活动权益数据中获取到实际推送数量；计算预测推送数量与实际推送数量之间的均方根误差和平均绝对误差，得到预测均方根误差和预测平均绝对误差；分别比较预测均方根误差与模型均方根误差以及预测平均绝对误差和模型平均绝对误差；在预测均方根误差大于模型均方根误差，且预测平均绝对误差大于模型平均绝对误差时，触发预警；否则，不触发预警。

其中，实际推送数量的获取方式为：根据输出特征从目标时间序列数据中获取到对应的数据，即为权益实际推送数量。计算预测推送数量与实际推送数量之间的均方根误差和平均绝对误差，在均方根误差和平均绝对误差均大于模型RMSE和模型MAE时，触发预警，反之，则不进行预警。均方根误差和平均绝对误差的计算公式同步骤S206，在此不再赘述。

通过计算的均方根误差和平均绝对误差来衡量预测推送数量和实际推送数量之间的误差，根据误差确定是否触发预警，可以提高计算效率。

步骤S209，在触发预警时，对预警风险进行风险定位，将所述风险定位发送给用户。

具体的，获取预设时间的风控拦截占比，判断风控拦截占比是否突增；在风控拦截占比突增时，确定全部预设风控策略模型是否存在变更记录；在存在变更记录时，定位变更的风控策略模型，并根据变更的风控策略模型的策略特征生成风险提示。

其中，风控拦截占比，是自建风控系统中的业务指标，指活动中风控拦截用户数和活动中请求用户数之比。风控系统中根据业务场景设置对应的风控策略模型，风控策略模型用于管控用户的权益发放。

预设时间可以是一周，获取一周时间内的风控拦截占比，判断风控拦截占比的增加比例是否大于一定值，若是，则说明风控拦截占比突增，获取全部预设风控策略模型的变更记录，确定是否有风控策略模型变更记录，若有，则统计各风控策略模型拦截占比，若除新增策略模型外，其他风控策略模型拦截占比有提升，表示有大量黑灰产用户进入，则预警风险提示，风险提示内容可以是“有大量风险用户领取活动权益，请尽快调整活动权益”；若仅新增风控策略模型有拦截，则评估策略是否准确，若无误，则预警风险提示，风险提示内容可以是“存在大量具备策略特征用户领取权益，请尽快调整活动权益”。

若风险拦截占比正常，在实际推送数量小于预测推送数量时，忽略不提示；在实际推送数量大于等于预测推送数量时，核查权益池发放量是否增加，若无，则预警风险提示：权益超期发放，请尽快调整活动权益；若有，则忽略。

在本实施例中，评估策略是否准确的方式是：

分析拦截的用户是否符合策略的命中条件；若符合命中策略，则查看用户历史记录是否被历史策略预标识风险，若有，则该新增策略能准确定位到高风险用户。

通过在触发预警后对风险进行定位，能够实现风险定位，能够实现快速风险快速响应，有效解决出现的问题，维护用户权益。

本申请通过获取历史活动权益的时间序列数据，并筛选出与权益相关的输入特征，根据输入特征对应的输入数据构建多维特征数据用于训练LSTM神经网络模型，可以提高模型的训练效率；通过对训练的LSTM神经网络模型进行验证，得到符合预设条件的权益推送预测模型，可以提高模型的识别精度；使用权益推送预测模型进行权益推送数量预测，可以提高计算效率，降低计算成本；根据预测推送数量确定是否触发预警，触发预警后对风险进行定位，能够实现风险定位，能够实现快速风险快速响应，有效解决出现的问题，维护用户权益。

在一些可选的实现方式中，上述将训练集输入所述LSTM神经网络模型中进行训练，得到训练的LSTM神经网络模型的步骤包括：

步骤S301，将训练集输入前向LSTM层中进行计算，输出前向隐藏层状态序列。

假设训练集的输入特征向量X为(x₁，x₂，…，x_t-1，x_t，x_t+1，…，x_n)，其中，x_t表示t时刻的多维特征数据，t时刻输入的维度为输入特征的数量，输出的前向隐藏层状态序列

其中，前向LSTM层包括遗忘门、输入门、输出门和记忆单元。

根据上一时刻隐藏层状态当前输入特征x_t、遗忘门权重矩阵W_f和遗忘门偏置向量b_f，计算得到遗忘门的值f_t，f_t值用于决定是否让上一时刻学到的信息C_t-1通过或部分通过，计算公式如下：

其中，f_t∈[0,1]，表示t时刻的节点对t-1时刻记忆单元的选择权重；σ为非线性函数σ(x)＝1/(1+e^-x)，x表示激活函数的输入。

通过输入门计算决定向记忆单元添加何种新信息：根据上一时刻隐藏层状态当前输入特征x_t、输入门权重矩阵W_i和输入门偏置向量b_i，计算得到输入门的值i_t，计算公式如下：

其中，i_t∈[0,1]，表示t时刻的节点对当前节点信息的选择权重，即更新信息的权重系数。

通过激活函数tanh，使用上一时刻隐藏层状态和当前输入特征x_t生成记忆单元的临时状态计算公式如下：

其中，W_C表示记忆单元权重矩阵，b_C表示记忆单元偏置向量。

根据遗忘门的值f_t和输入门的值i_t对旧的记忆单元状态进行更新，以添加新信息，则当前时刻记忆单元状态如下：

记忆单元的输出也需要根据和x_t来判断，首先计算出判断条件，即输出门的值，计算公式如下：

其中，o_t表示t时刻的记忆单元记忆信息的选择权重，W_o表示输出门权重矩阵，b_o表示输出门偏置向量。

最后根据当前时刻记忆单元状态和输出门的值，计算得到当前时刻前向隐藏层状态，计算公式如下：

上述式中，表示向量x_t和拼接后的向量。

在本实施例中，将所有时刻的前向隐藏层状态进行拼接，即可得到前向LSTM层输出

本实施例通过LSTM层对训练集进行计算，能够全面捕捉各个时序的特征，提高模型的拟合精度。

步骤S302，将训练集输入后向LSTM层中进行计算，得到后向隐藏层状态序列。

在本实施例中，后向LSTM层也包括遗忘门、输入门、输出门和记忆单元，其计算过程同步骤S301，在此不再赘述。

将训练集的输入特征向量X为(x₁，x₂，…，x_t-1，x_t，x_t+1，…，x_n)输入后向LSTM层，通过后向LSTM层计算后，得到后向隐藏层状态序列

步骤S303，拼接前向隐藏层状态序列和后向隐藏层状态序列，得到隐藏层特征状态序列，并将隐藏层特征状态序列输入至dropout层，得到增强隐藏层特征。

在本实施例中，将前向隐藏层状态序列和后向隐藏层状态序列进行拼接，得到即H＝(h₁，h₂，…，h_t-1，h_t，h_t+1，…，h_m)。

将将隐藏层特征状态序列H＝(h₁，h₂，…，h_t-1，h_t，h_t+1，…，h_m)输入至dropout层，得到增强隐藏层特征。

步骤S304，通过全连接层对增强隐藏层特征进行计算，得到预测特征向量。

在本实施例中，全连接层将dropout层输出的增强隐藏层特征进行全连接，可以设置两层全连接层，每层全连接层的神经元数量不同，输出的向量维度不同，示例的，第一层全链接层神经元数量为64，则输出向量维度为[1,64]；第二层全连接层的神经元个数为32，输出向量维度为[1,32]。

步骤S305，将预测特征向量输入输出层，计算得到预测结果。

在本实施例中，输出层可以采用softmax层，通过softmax层对预测特征向量进行计算，输出预测结果。

步骤S306，按照预设损失函数计算预测结果和真值标签之间的损失值。

在本实施例中，预设损失函数的计算公式如下：

其中，n为训练集的样本数量，为预测结果，y_i为真值标签。

步骤S307，根据损失值调整LSTM神经网络模型的网络参数，继续进行训练，直至收敛，输出训练的LSTM神经网络模型。

在本实施例中，设置训练的优化器为ADAM，通过ADAM根据损失值调整LSTM神经网络模型的网络参数，继续进行迭代训练，直到模型收敛。判断的收敛的方式包括：

1)训练次数达到预设训练迭代次数则可视为模型收敛；

2)当前得到的损失值相比于上一次得到的损失值，没有明显变化，说明模型收敛，训练结束。

本申请通过对LSTM神经网络模型进行训练，能够提高模型的预测精度。

本申请可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，该计算机可读指令可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

进一步参考图4，作为对上述图2所示方法的实现，本申请提供了一种权益推送风险预警装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图4所示，本实施例所述的权益推送风险预警装置400包括：提取模块401、筛选模块402、构建模块403、划分模块404、训练模块405、测试模块406、预测模块407、预警模块408以及定位模块409。其中：

提取模块401用于按照预设时间间隔获取历史活动的时间序列数据，提取所述时间序列数据中的全部数据字段，并确定全部所述数据字段中的特征字段和预测字段；

筛选模块402用于筛选出与权益相关的所述特征字段作为输入特征，将所述输入特征对应的预测字段作为输出特征；

构建模块403用于从所述时间序列数据中分别提取所述输入特征和所述输出特征对应的输入数据和输出数据，基于所述输入数据构建多维特征数据集，所述输出数据作为所述多维特征数据的真值标签；

划分模块404用于按照预设比例将所述多维特征数据集分为训练集和测试集；

训练模块405用于根据所述输入特征和所述输出特征构建LSTM神经网络模型，并将所述训练集输入所述LSTM神经网络模型中进行训练，得到训练的LSTM神经网络模型；

测试模块406用于使用所述测试集对所述训练的LSTM神经网络模型进行验证，输出符合预设条件的权益推送预测模型；

预测模块407用于获取目标活动权益数据，将所述目标活动权益数据输入所述权益推送预测模型，得到预测推送数量；

预警模块408用于根据所述预测推送数量确定是否触发预警；

定位模块409用于在触发预警时，对预警风险进行风险定位，将所述风险定位发送给用户。

基于上述权益推送风险预警装置400，通过获取历史活动权益的时间序列数据，并筛选出与权益相关的输入特征，根据输入特征对应的输入数据构建多维特征数据用于训练LSTM神经网络模型，可以提高模型的训练效率，提高模型拟合精度；通过对训练的LSTM神经网络模型进行验证，得到符合预设条件的权益推送预测模型，可以提高模型的识别精度；使用权益推送预测模型进行权益推送数量预测，可以提高计算效率，降低计算成本；根据预测推送数量确定是否触发预警，触发预警后对风险进行定位，能够实现风险定位，能够实现快速风险快速响应，有效解决出现的问题，维护用户权益。

在本实施例的一些可选的实现方式中，筛选模块402包括：

相关系数计算子模块，用于计算每个所述特征字段与所述预测字段之间的相关系数；

筛选子模块，用于筛选出所述相关系数大于预设相关阈值的所述特征字段作为输入特征。

在一些可选的实现方式中，所述LSTM神经网络模型包括前向LSTM层、后向LSTM层、dropout层、全连接层以及输出层，训练模块405包括：

前向计算子模块，用于将所述训练集输入所述前向LSTM层中进行计算，输出前向隐藏层状态序列；

后向计算子模块，用于将所述训练集输入所述后向LSTM层中进行计算，得到后向隐藏层状态序列；

随机失活子模块，用于拼接所述前向隐藏层状态序列和所述后向隐藏层状态序列，得到隐藏层特征状态序列，并将所述隐藏层特征状态序列输入至所述dropout层，得到增强隐藏层特征；

全连接子模块，用于通过所述全连接层对所述增强隐藏层特征进行计算，得到预测特征向量；

输出子模块，用于将所述预测特征向量输入所述输出层，计算得到预测结果；

损失计算子模块，用于按照预设损失函数计算所述预测结果和所述真值标签之间的损失值；

调整子模块，用于根据所述损失值调整所述LSTM神经网络模型的网络参数，继续进行训练，直至收敛，输出训练的LSTM神经网络模型。

通过对LSTM神经网络模型进行训练，能够提高模型的预测精度。

在本实施例中，所述前向LSTM层包括遗忘门、输入门、输出门和记忆单元，前向计算子模块包括：

遗忘值计算单元，用于将所述训练集输入所述前向LSTM层，根据上一时刻隐藏层状态、当前输入特征、遗忘门权重矩阵和遗忘门偏置向量，计算得到所述遗忘门的值；

输入值计算单元，用于根据所述上一时刻隐藏层状态、所述当前输入特征、输入门权重矩阵和输入门偏置向量，计算得到所述输入门的值；

临时状态计算单元，用于根据所述上一时刻隐藏层状态、所述当前输入特征、记忆单元权重矩阵和记忆单元偏置向量，计算得到所述记忆单元的临时状态；

当前记忆状态计算单元，用于根据所述遗忘门的值、所述输入门的值、所述临时状态以及上一时刻记忆单元状态，计算得到当前时刻记忆单元状态；

输出计算单元，用于根据所述上一时刻隐藏层状态、所述当前输入特征、输出门权重矩阵和输出门偏置向量，计算得到所述输出门的值；

当前隐藏计算单元，用于根据所述当前时刻记忆单元状态和所述输出门的值，计算得到当前时刻前向隐藏层状态；

拼接单元，用于将所有时刻的前向隐藏层状态进行拼接，得到所述前向隐藏层状态序列。

通过LSTM层对训练集进行计算，能够全面捕捉各个时序的特征，提高模型的拟合精度。

在一些可选的实现方式中，测试模块406包括：

测试预测子模块，用于将所述测试集输入所述训练的LSTM神经网络模型中，输出测试预测值；

误差计算子模块，用于根据所述测试预测值和所述真值标签，分别计算均方根误差和平均绝对误差；

获得子模块，用于在所述均方根误差小于等于第一预设阈值，且所述平均绝对误差小于等于第二预设阈值时，输出所述训练的LSTM神经网络模型作为权益推送预测模型，并将所述均方根误差和所述平均绝对误差分别作为模型均方根误差和模型平均绝对误差。

通过利用RMSE和MAE来验证模型，可以更好地评估模型拟合效果，提高模型预测准确性。

在本实施例的一些可选的实现方式中，预警模块408包括：

获取子模块，用于根据所述目标活动权益数据中获取到实际推送数量；

误差子模块，用于计算所述预测推送数量与所述实际推送数量之间的均方根误差和平均绝对误差，得到预测均方根误差和预测平均绝对误差；

比较子模块，用于分别比较所述预测均方根误差与所述模型均方根误差以及所述预测平均绝对误差和所述模型平均绝对误差；

判断子模块，用于在所述预测均方根误差大于模型均方根误差，且所述预测平均绝对误差大于所述模型平均绝对误差时，触发预警；否则，不触发预警。

在一些可选的实现方式中，定位模块409包括：

风控判断子模块，用于获取预设时间的风控拦截占比，判断所述风控拦截占比是否突增；

变更判断子模块，用于在所述风控拦截占比突增时，确定全部预设风控策略模型是否存在变更记录；

定位提示子模块，用于在存在变更记录时，定位变更的风控策略模型，并根据变更的所述风控策略模型的策略特征生成风险提示。

为解决上述技术问题，本申请实施例还提供计算机设备。具体请参阅图5，图5为本实施例计算机设备基本结构框图。

所述计算机设备5包括通过系统总线相互通信连接存储器51、处理器52、网络接口53。需要指出的是，图中仅示出了具有组件51-53的计算机设备5，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable GateArray，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器51至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器51可以是所述计算机设备5的内部存储单元，例如该计算机设备5的硬盘或内存。在另一些实施例中，所述存储器51也可以是所述计算机设备5的外部存储设备，例如该计算机设备5上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(FlashCard)等。当然，所述存储器51还可以既包括所述计算机设备5的内部存储单元也包括其外部存储设备。本实施例中，所述存储器51通常用于存储安装于所述计算机设备5的操作系统和各类应用软件，例如权益推送风险预警方法的计算机可读指令等。此外，所述存储器51还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器52在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器52通常用于控制所述计算机设备5的总体操作。本实施例中，所述处理器52用于运行所述存储器51中存储的计算机可读指令或者处理数据，例如运行所述权益推送风险预警方法的计算机可读指令。

所述网络接口53可包括无线网络接口或有线网络接口，该网络接口53通常用于在所述计算机设备5与其他电子设备之间建立通信连接。

本实施例通过处理器执行存储在存储器的计算机可读指令时实现如上述实施例权益推送风险预警方法的步骤，获取历史活动权益的时间序列数据，并筛选出与权益相关的输入特征，根据输入特征对应的输入数据构建多维特征数据用于训练LSTM神经网络模型，可以提高模型的训练效率，提高模型拟合精度；通过对训练的LSTM神经网络模型进行验证，得到符合预设条件的权益推送预测模型，可以提高模型的识别精度；使用权益推送预测模型进行权益推送数量预测，可以提高计算效率，降低计算成本；根据预测推送数量确定是否触发预警，触发预警后对风险进行定位，能够实现风险定位，能够实现快速风险快速响应，有效解决出现的问题，维护用户权益。

本申请还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令可被至少一个处理器执行，以使所述至少一个处理器执行如上述的权益推送风险预警方法的步骤，获取历史活动权益的时间序列数据，并筛选出与权益相关的输入特征，根据输入特征对应的输入数据构建多维特征数据用于训练LSTM神经网络模型，可以提高模型的训练效率，提高模型拟合精度；通过对训练的LSTM神经网络模型进行验证，得到符合预设条件的权益推送预测模型，可以提高模型的识别精度；使用权益推送预测模型进行权益推送数量预测，可以提高计算效率，降低计算成本；根据预测推送数量确定是否触发预警，触发预警后对风险进行定位，能够实现风险定位，能够实现快速风险快速响应，有效解决出现的问题，维护用户权益。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

显然，以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

Claims

1.一种权益推送风险预警方法，其特征在于，包括下述步骤：

按照预设比例将所述多维特征数据集分为训练集和测试集；

根据所述预测推送数量确定是否触发预警；

2.根据权利要求1所述的权益推送风险预警方法，其特征在于，所述筛选出与权益相关的所述特征字段作为输入特征的步骤包括：

计算每个所述特征字段与所述预测字段之间的相关系数；

3.根据权利要求1所述的权益推送风险预警方法，其特征在于，所述LSTM神经网络模型包括前向LSTM层、后向LSTM层、dropout层、全连接层以及输出层；所述将所述训练集输入所述LSTM神经网络模型中进行训练，得到训练的LSTM神经网络模型的步骤包括：

将所述预测特征向量输入所述输出层，计算得到预测结果；

4.根据权利要求3所述的权益推送风险预警方法，其特征在于，所述前向LSTM层包括遗忘门、输入门、输出门和记忆单元；所述将所述训练集输入所述前向LSTM层中进行计算，输出前向隐藏层状态序列的步骤包括：

5.根据权利要求1所述的权益推送风险预警方法，其特征在于，所述使用所述测试集对所述训练的LSTM神经网络模型进行验证，输出符合预设条件的权益推送预测模型的步骤包括：

6.根据权利要求5所述的权益推送风险预警方法，其特征在于，所述根据所述预测推送数量确定是否触发预警的步骤包括：

根据所述目标活动权益数据中获取到实际推送数量；

7.根据权利要求1至6中任一项所述的权益推送风险预警方法，其特征在于，所述对预警风险进行风险定位的步骤包括：

8.一种权益推送风险预警装置，其特征在于，包括：

预警模块，用于根据所述预测推送数量确定是否触发预警；

9.一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的权益推送风险预警方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的权益推送风险预警方法的步骤。