WO2021073152A1

WO2021073152A1 - 基于神经网络的数据标签生成方法、装置、终端及介质

Info

Publication number: WO2021073152A1
Application number: PCT/CN2020/098885
Authority: WO
Inventors: 陆彬; 杨琳琳
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-10-14
Filing date: 2020-06-29
Publication date: 2021-04-22
Also published as: CN110888857B; CN110888857A

Abstract

一种基于神经网络的数据标签生成方法、装置、终端及介质，包括：获取历史数据（S11）；初始化预设神经网络的输入参数（S12）；输入所述历史数据至所述预设神经网络中进行训练（S13）；当训练结束后，提取所述预设神经网络的指定层的输出作为候选数据标签（S14）；计算所述候选数据标签的评分结果（S15）；根据所述评分结果重新初始化所述预设神经网络的输入参数并基于新的输入参数进行新一轮的训练直至达到预设探索周期（S16）；保存每一轮训练得到的神经网络模型及从每一轮神经网络模型中提取出的所述候选数据标签（S17）；根据预设筛选条件从所保存的候选数据标签中筛选出目标数据标签（S18）。该方法能够快速有效的生成大量的数据标签。

Description

基于神经网络的数据标签生成方法、装置、终端及介质

本申请要求于2019年10月14日提交中国专利局，申请号为201910974647.7发明名称为“基于神经网络的数据标签生成方法、装置、终端及介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及数据处理技术领域，具体涉及一种基于神经网络的数据标签生成方法、装置、终端及介质。

背景技术

金融资产的估值与未来收益的预测一直是投资领域的一项重要课题。由于金融资产有很强的实效性，而金融资产标签的分布往往随着时间不断改变，若要对金融资产进行预测且获得较高的预测准确度，必须要有足够的金融资产标签。

发明人意识到传统的金融资产标签一般是由研究员通过对已知的金融资产基础数据进行逻辑关系组合生成的。这种方式存在以下缺点1)生成标签的效率低下；2)生成的标签数量有限；3)生成的标签覆盖范围有限。

因此，有必要提出一种新的金融资产标签生成方案，解决金融资产标签生成数量少及效率低下的技术问题，从而提高金融资产的预测准确度。

发明内容

鉴于以上内容，有必要提出一种基于神经网络的数据标签生成方法、装置、终端及介质，能够快速有效的生成大量的数据标签。

本申请的第一方面提供一种基于神经网络的数据标签生成方法，所述方法包括：

获取历史数据；

初始化预设神经网络的输入参数；

输入所述历史数据至所述预设神经网络中进行训练；

当训练结束后，提取所述预设神经网络的指定层的输出作为候选数据标签；

计算所述候选数据标签的评分结果；

根据所述评分结果重新初始化所述预设神经网络的输入参数并基于新的输入参数进行新一轮的训练直至达到预设探索周期；

保存每一轮训练得到的神经网络模型及从每一轮神经网络模型中提取出的所述候选数据标签；

根据预设筛选条件从所保存的候选数据标签中筛选出目标数据标签。

本申请的第二方面提供一种基于神经网络的数据标签生成装置，所述装置包括：

数据获取模块，用于获取历史数据；

参数初始模块，用于初始化预设神经网络的输入参数；

模型训练模块，用于输入所述历史数据至所述预设神经网络中进行训练；

标签提取模块，用于当训练结束后，提取所述预设神经网络的指定层的输出作为候选数据标签；

评分计算模块，用于计算所述候选数据标签的评分结果；

重新训练模块，用于根据所述评分结果重新初始化所述预设神经网络的输入参数并基于新的输入参数进行新一轮的训练直至达到预设探索周期；

标签保存模块，用于保存每一轮训练得到的神经网络模型及从每一轮神经网络模型中提取出的所述候选数据标签；

标签确定模块，用于根据预设筛选条件从所保存的候选数据标签中筛选出目标数据标签。

本申请的第三方面提供一种终端，所述终端包括处理器，所述处理器用于执行存储器中存储的计算机可读指令时实现以下步骤：

获取历史数据；

初始化预设神经网络的输入参数；

输入所述历史数据至所述预设神经网络中进行训练；

计算所述候选数据标签的评分结果；

本申请的第四方面提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现以下步骤：

获取历史数据；

初始化预设神经网络的输入参数；

输入所述历史数据至所述预设神经网络中进行训练；

计算所述候选数据标签的评分结果；

综上所述，本申请所述的基于神经网络的数据标签生成方法、装置、终端及介质，属于金融科技技术领域，可应用于智慧政务、智慧生活等场景中，从而推动智慧城市的发展。本申请通过初始化预设神经网络的输入参数，输入所述历史数据至所述预设神经网络中进行训练，当训练结束后，提取所述预设神经网络指定层的输出作为候选数据标签；计算所述候选数据标签的评分结果；根据评分结果重新初始化所述预设神经网络的输入参数并基于新的输入参数进行新一轮的训练；保存每一轮训练得到的神经网络模型及从所述神经网络模型中提取出的候选数据标签，最后从候选数据标签中筛选出目标数据标签。利用神经网络的高维非线性变换特性，以及通过随机化初始训练参数对历史数据进行训练以获得不同局部最优解的方法，相较于传统方法，本申请能在短时间内获得大量的数据标签，数据标签的生成效率远超传统的处理方法，解决了传统生成数据标签数量少、效率低的技术问题；此外，由于神经网络的非线性特性，获得的数据标签更具多样性；由于训练神经网络模型的动态特性，生成的数据标签有效性强，具有较强的实用性。

附图说明

图1是本申请实施例一提供的基于神经网络的数据标签生成方法的流程图。

图2是本申请实施例二提供的基于神经网络的数据标签生成装置的结构图。

图3是本申请实施例三提供的终端的结构示意图。

具体实施方式

为了能够更清楚地理解本申请的上述目的、特征和优点，下面结合附图和具体实施例对本申请进行详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本申请，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请。

实施例一

如图1所示，所述基于神经网络的数据标签生成方法具体包括以下步骤，根据不同的需求，该流程图中步骤的顺序可以改变，某些可以省略。

S11，获取历史数据。

本实施例中，所述历史数据可以包括：历史金融资产数据、历史人脸图像数据、历史面部表情数据、历史车损图像数据等，上述数据仅为举例，现在或今后出现的任何需要进行预测的数据都可以适用于此，本申请在此不做任何限制。

通常而言，若要根据所述历史数据进行某种预测，需要先对历史数据进行加工与处理，从中提取出具有预测能力的数据因子或数据特征，再基于所提取得到的数据因子或数据特征进行预测得到预测结果。即，数据因子或数据特征是历史数据与预测结果之间的中间量，将数据因子或数据特征统称为数据标签。

实际生活中，历史数据的数量不足，导致基于少量的历史数据进行的某种预测准确率较低，而神经网络具有较多的网络层次，尤其是中间的网络层的神经元远多于输入层，通过这种较多层的网络结构对输入至输入层的历史数据进行处理，可以得到大于历史数据的数量的中间数据，这种中间数据对输出层的预测结果有一定的影响，因而可以将这种处于中间层的中间数据作为数据标签提取出来，再将数据标签结合在一起作为研究的对象，大量的数据标签有助于提高数据的预测准确率。

为便于理解本申请的发明思想，可以以历史金融资产数据为例进行说明。若要对目标金融公司的未来收益进行预测，可以获取目标金融公司的历史金融资产数据，例如每日开盘价，每日收盘价、每日最高价、每日最低价、每月财务数据等，基于所获取的历史金融资产数据训练神经网络模型，并在神经网络模型达到局部收敛时，提取出指定层输出的数据作为数据标签。指定层输出的数据是具有预测目标金融公司的未来收益的技术指标(例如，随机指标KDJ、布林指标BOLL、BRAR指标、ASI指标等)。

在一个可选的实施例中，在所述获取历史数据之后，所述方法还包括：

对所述历史数据进行预处理。

所述预处理可以包括，但不限于：删除空数据、去除极值数据、数据标准化。

示例性的，所述空数据可以是指股票停牌时的数据。所述删除空数据包括：对所述历史数据中的不完整数据填充0或者不存在的数据填充为0。

所述去除极值数据包括：去除所述历史数据中位于前K1行和后K2行的数据；对所述历史数据进行平均计算得到平均数据，将所述历史数据中大于所述平均数据的预设第一倍数的数据降低为所述平均数据，将所述历史数据中小于所述平均数据的预设第二倍数的数据提高为所述平均数据。

所述数据标准化包括min-max标准化(Min-max normalization)，log函数转换，z-score标准化(zero-mean normalization)等，为现有技术，本申请在此不再详细阐述。

在该可选的实施例中，经过预处理之后的历史数据具有较高的质量，便于后续训练神经网络模型时，得到的数据标签更可靠，且能加快训练神经网络模型的收敛速度。

S12，初始化预设神经网络的输入参数。

所述输入参数可以包括：所述神经网络总层数、训练批次、dropout比例和神经网络权重分布等。

本实施例中，可以预先设置神经网络为有监督的学习网络，或者为无监督的学习网络，或者为半监督的学习网络。其中，所述有监督的学习网络包括：多层感知器(Multi-Layer Perception，MLP)、长短期记忆网络(Long Short-Term Memory，LSTM)、卷积神经网络(Convolutional Neural Networks，CNN)等，无监督的学习网络包括：自编码器等。

神经网络的选择可以依据实际需要和个性化需求自行确定。

示例性的，本实例预先设置自编码器作为神经网络的原型结构，所述自编码器包括如下3个部分：

(1)编码器

编码器的目标是最大限度的压缩，使用神经网络进行线性和非线性变换，从原始输入特征中提取出隐含信息。给定股票数据X＝{x ¹,x ²,…,x ⁿ},x ⁱ∈R ^d，其中d表示股票因子的维度，编码器首先使用神经网络将X映射到隐含层，

其中d _i表示第i个隐藏层的神经元的个数，F _i表示第i个隐藏层的输出。F _i的表达式如下：

F _i＝s(W _iF _i-1+b _i)

其中，s为激活函数，W _i和b _i分别为第i层的权重和偏置。

(2)解码器

解码器的目标是根据编码器的输出，使用神经网络最大程度的还原原始的输入特征。给定编码器的输出

解码器表示为

其中d _j表示第j层解码层的维度，F _j表示解码器第j层的输出。其中F _l为输出层，d _l＝d。

(3)损失函数

自编码器通过最小化重构误差进行训练，定义损失函数如下：

通过梯度下降，找出使重构误差最小的W和b，得到最优的自编码器。

优选的，初始化预设神经网络的输入参数包括：

初始化所述神经网络总层数为2；

初始化所述训练批次为100；

初始化所述dropout比例为0.2；

初始化所述神经网络权重分布为均匀分布。

本实施例中，对预设神经网络的输入参数进行初始化之后，可以将2，100，0.2及均匀分布作为一组参数同时输入预设神经网络中，例如，输入自编码器中。

需要说明的是，训练批次是固定的。

S13，输入所述历史数据至所述预设神经网络中进行训练。

本实施例中，预设神经网络的输入参数被初始化之后，即可将所述历史数据输入预设神经网络中进行训练。

在一个可选的实施例中，在所述输入所述历史数据至所述预设神经网络中进行训练之前，所述方法还包括：

划分所述历史数据为第一份数据和第二份数据，其中，所述第二份数据的数量小于所述第一份数据的数量；

打乱所述第一份数据并均分为N份数据；

轮流选择所述N份数据中的N-1份数据作为训练集，剩余一份数据作为验证集。

所述第二份数据作为测试集。

所述训练集用于训练神经网络模型和确定神经网络模型参数，所述验证集用于优化神经网络模型的参数，所述测试集用于测试所训练好的神经网络模型的推广能力。轮流选择N份数据中的N-1份数据训练，剩余的一份做验证，计算预测误差平方和，最后把N次的预测误差平方和再做平均作为选择最优模型结构的依据。

由于将所述历史数据划分为了训练集、验证集及测试集，则输入所述历史数据至所述预设神经网络中进行训练为输入所述训练集至所述预设神经网络中进行训练。

S14，当训练结束后，提取所述预设神经网络的指定层的输出作为候选数据标签。

本实施例中，若在基于所述历史数据训练预设神经网络的过程中，得到的神经网络模型达到了局部最优解，即可认为训练过程结束。此时，将指定层的输出提取出来，作为新生成的数据标签。

在一个可选的实施例中，所述提取所述预设神经网络的指定层的输出作为候选数据标签包括：

获取所述预设神经网络的类型；

当所述预设神经网络的类型为有监督的学习网络时，提取最后一层的输出作为候选数据标签；

当所述预设神经网络的类型为无监督的学习网络时，提取最中间层的输出作为候选数据标签。

在事先确定神经网络时，即可对应设置所确定的神经网络的类型。

本实施例中，将神经网络的类型分为两大类，一类是有监督的学习网络，一类是无监督的学习网络。若选择有监督的学习网络作为神经网络原型，则以历史数据作为输入，以资产收益率、风险等为训练目标，指定最后一层输出层输出的结果作为候选数据标签。若选择无监督的学习网络作为神经网络原型，则以历史数据作为输入，以输入和输出尽可能相似为训练目标，指定最中间层输出的结果作为候选数据标签。

S15，计算所述候选数据标签的评分结果。

本实施例中，提取出指定层的输出之后，需要对所提取出的候选数据标签进行评分，通过评分结果调整所述预设神经网络的输入参数。

在一个可选的实施例中，所述计算所述候选数据标签的评分结果包括：

1)计算所述候选数据标签与目标指标的皮尔逊相关系数；

将候选数据标签按时间序列进行排序，得到序列P＝{p1,p2,……,pt}，目标指标序列为Q＝{q1,q2,……,qt}，计算P与Q的皮尔逊相关系数，得到score1。

两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商。计算所述皮尔逊相关系数为现有技术，本申请不做具体阐述。

2)对所述候选数据标签进行净值回测得到夏普比率；

具体的，从所述候选数据标签中选取部分数据进行回归预测，计算回测净值的夏普比率，作为score2。关于回归预测为现有技术，本申请在此不做详细介绍。

夏普比率(Sharpe Ratio)可以同时对收益与风险进行考虑，夏普比率越大，说明基金单位风险所获得的风险回报越高。

3)计算训练结束后得到的神经网络模型的准确率；

当预先设置的神经网络对历史数据进行训练结束后，使用测试集来测试训练结束时的神经网络模型的测试通过率，所述测试通过率作为神经网络模型的准确度，记为score3。

4)计算ROC曲线下与坐标轴围成的AUC值；

当预先设置的神经网络对历史数据进行训练结束后，构建ROC曲线，计算ROC曲线与XY坐标轴所围成的AUC值，记为score4。

AUC(Area Under Curve)被定义为ROC曲线下与坐标轴围成的面积，取值范围在0.5和1之间。AUC值越大，表明预设神经网络训练结束时得到的模型的分类效果更好。关于ROC曲线的构建过程为现有技术，由于本申请的重点不在于此，在此不再详细阐述。

5)根据所述皮尔逊相关系数、夏普比率、准确率及AUC值得到评分结果。

如果选择的是有监督的学习网络作为预设神经网络，则根据如下公式计算所述候选数据标签的评分结果：

scoreu＝w1*score1+w2*score2+w3*score3+w4*score4，其中权重w1、w2、w3、w4为预先设定的值，且w1+w2+w3+w4＝1。

如果选择的是无监督的学习网络作为预设神经网络，则根据如下公式计算所述候选数据标签的评分结果：

scoreu＝w1*score1+w2*score2，其中，权重w1、w2为预先设定的值，且w1+w2＝1。

S16，根据所述评分结果重新初始化所述预设神经网络的输入参数并基于新的输入参数进行新一轮的训练直至达到预设探索周期。

本实施例中，每一轮训练得到的神经网络模型都会对应计算出一个评分结果，根据上一轮的评分结果对下一轮预设神经网络的输入参数重新进行初始化。神经网络基于新初始化的输入参数进行下一轮的神经网络模型的训练时，使神经网络向更好的方向进行优化，寻找出新的局部最优点，学习出历史数据中的不同数据标签，进而从训练好的神经网络模型中提取出候选数据标签。

在一个可选的实施例中，所述根据所述评分结果重新初始化所述预设神经网络的输入参数包括：

为下一轮随机生成一组探索参数；

根据所述探索参数计算下一轮的初始输入参数；

基于所述初始输入参数训练下一轮神经网络模型并计算出下一轮的评分结果；

判断下一轮的评分结果是否大于上一轮的评分结果；

如果下一轮的评分结果大于上一轮的评分结果，则保留所述初始输入参数；

如果下一轮的评分结果小于或等于上一轮的评分结果，则所述初始输入参数为上一轮的初始输入参数。

在一个可选的实施例中，采用如下公式计算每一轮的初始输入参数：

θ _t＝αθ _t’+(1-αt)θ _tt1，1＜t＜T，

其中，θ _t’为下一轮随机生成的一组探索参数，t代表轮次，T为所述预设探索周期，α为衰减系数。

示例性的，假设第一轮初始化输入参数θ ₁，训练结束时计算得到的第一轮评分结果O ₁，接下来每一轮迭代时的输入参数基于上一轮的评分结果重新进行初始化，从而生成该轮的最终初始输入参数用于训练神经网络模型并提取出新生成的候选数据标签。

若当前轮次为t，随机生成一组探索参数θ _t’，计算t轮的初始输入参数为θ _t＝αθ _t’+(1-αt)θ _t-1。用θ _t重新训练预设神经网络，并在训练结束时计算对应的评分结果O _t，如果O _t＞O _t-1，则保留θ _t；如果O _t＜O _t-1，则θ _t＝θ _t-1。

所述探索周期是指从探索新的初始化输入参数开始，然后训练至神经网络模型收敛为止的时间。通过改变初始化输入参数来迭代训练神经网络模型，根据上一次参数探索结果生成下一次迭代探索参数，直到达到设定的探索周期T。

优选的，所述衰减系数α＝0.2，所述探索周期T＝50。

本实施例中，所述每轮的一组探索参数包括：神经网络总层数、dropout比例及神经网络权重分布。其中，所述神经网络总层数是从神经网络总层数集合中随机选取的，所述dropout比例是从dropout比例集合中随机选取的，所述神经网络权重分布是从神经网络权重分布集合中随机选取的。

示例性的，神经网络的层数m，输入层的数据维度为R ^1×N，输出层的数据维度为R ^1×M，m最大不超过N-M+1，m的集合为{m|m∈[2,51]}，从m＝2开始，依次递增，直到m＝51。为了能够融合多个特征标签的输入信息，从输入层逐层递减，构建一个神经元数为等差序列的网络。每层神经元维度为{R ^1×N，R ^1×(N-ski)，R ^1×(N-2skip)，…，R ^1×M}，其中skip＝(N-M)/(m-1)。

示例性的，dropout比例集合为{0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9}，通过dropout比例可进一步提高网络的多样性，dropout取值方式为等间隔采样，如{0.3,0.5,0.7,0.9}。

示例性的，神经网络权重分布集合为{常量，均匀分布，高斯分布，截断高斯分布}。

通过上述集合，从每一个集合任意选取一个参数，进行笛卡尔积，可以得到1600种超参组合，将其作为迭代器，可以训练得到1600个神经网络模型。

S17，保存每一轮训练得到的神经网络模型及从每一轮神经网络模型中提取出的所述候选数据标签。

本实施例中，通过不断的探索新的初始输入参数，并基于新的初始化输入参数训练神经网络模型，直到达到探索周期。将每一轮迭代时训练得到的神经网络模型对应的初始化输入参数进行保存，以便后续可以采用初始化输入参数及训练得到的神经网络模型重新所得到的训练数据标签进行收益或风险预测等。

在每一轮训练神经网络模型结束时，提取出指定层的输出作为生成的候选数据标签并保存在预设数据库中。当探索周期达到时，可以将所有提取出的候选数据标签集合在一起。

S18，根据预设筛选条件从所保存的候选数据标签中筛选出目标数据标签。

所述预设筛选条件是预先设置的筛选标准，可以根据实际需求自行设置或调整。

示例性的，若要预测目标金融公司的未来收益，则所述筛选条件可以为：计算每个所述候选数据标签与目标金融公司的收益的相关性；剔除相关性小于预设相关性阈值的候选数据标签。

在其他实施例中，所述筛选条件还可以包括：剔除评分结果小于预设评分结果的一轮候选数据标签。

剔除后的候选数据标签即为目标数据标签，所述目标数据标签可以用于预测目标金融公司未来股价、未来营收能力、风险识别、资产定价等。

优选的，为了提高候选数据标签的生成效率，可以预先设置神经网络集合，并同步开启多个子线程，通过多个子线程并行训练多个神经网络模型。其中，每一个子线程执行基于所述历史数据的神经网络模型的训练，不同的子线程可以预设设置相同的神经网络，也可以预设设置不同的神经网络，主线程控制所有子线程的初始输入参数。示例性的，同步开启4个子线程，其中，第1个子线程用于基于所述历史数据训练出多层感知器网络模型，第2个子线程用于基于所述历史数据训练出长短期记忆网络模型，第3个子线程用于基于所述历史数据训练出卷积神经网络模型，第4个子线程用于基于所述历史数据训练出自编码器网络模型，主线程用于初始化每个神经网络模型的输入参数。由于同步开启多个子线程并行执行多个神经网络模型的训练，能够增加提取候选数据标签的数量，提高提取候选数据标签的效率，从而增加目标数据标签的数量和提高生成目标数据标签的效率。

综上，本申请所述的基于神经网络的数据标签生成方法，初始化预设神经网络的输入参数，输入所述历史数据至所述预设神经网络中进行训练，当训练结束后，提取所述预设神经网络指定层的输出作为候选数据标签；计算所述候选数据标签的评分结果；根据评分结果重新初始化所述预设神经网络的输入参数并基于新的输入参数进行新一轮的训练；保存每一轮训练得到的神经网络模型及从所述神经网络模型中提取出的候选数据标签，最后从候选数据标签中筛选出目标数据标签。利用神经网络的高维非线性变换特性，以及通过随机化初始训练参数对历史数据进行训练以获得不同局部最优解的方法，相较于传统方法，本申请能在短时间内获得大量的数据标签，数据标签的生成效率远超传统的处理方法，解决了传统生成数据标签数量少、效率低的技术问题；此外，由于神经网络的非线性特性，获得的数据标签更具多样性；由于训练神经网络模型的动态特性，生成的数据标签有效性强，具有较强的实用性。

本申请所述的基于神经网络的数据标签生成方法，属于金融科技技术领域，可应用于智慧政务、智慧生活等场景中，从而推动智慧城市的发展。

实施例二

图2是本申请所述的基于神经网络的数据标签生成装置的结构图。

在一些实施例中，所述基于神经网络的数据标签生成装置20可以包括多个由计算机可读指令段所组成的功能模块。所述基于神经网络的数据标签生成装置20中的各个程序段的计算机可读指令可以存储于终端的存储器中，并由所述至少一个处理器所执行，以执行(详见图1描述)基于神经网络的数据标签生成的功能。

本实施例中，所述基于神经网络的数据标签生成装置20根据其所执行的功能，可以被划分为多个功能模块。所述功能模块可以包括：数据获取模块201、数据处理模块202、参数初始模块203、模型训练模块204、数据划分模块205、标签提取模块206、评分计算模块207、重新训练模块208、标签保存模块209及标签确定模块210。本申请所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机可读指令段，其存储在存储器中。在本实施例中，关于各模块的功能将在后续的实施例中详述。

数据获取模块201，用于获取历史数据。

在一个可选的实施例中，在所述获取历史数据之后，所述装置还包括：

数据处理模块202，用于对所述历史数据进行预处理。

参数初始模块203，用于初始化预设神经网络的输入参数。

神经网络的选择可以依据实际需要和个性化需求自行确定。

(1)编码器

F _i＝s(W _iF _i-1+b _i)

其中，s为激活函数，W _i和b _i分别为第i层的权重和偏置。

(2)解码器

解码器表示为

(3)损失函数

优选的，初始化预设神经网络的输入参数包括：

初始化所述神经网络总层数为2；

初始化所述训练批次为100；

初始化所述dropout比例为0.2；

初始化所述神经网络权重分布为均匀分布。

需要说明的是，训练批次是固定的。

模型训练模块204，用于输入所述历史数据至所述预设神经网络中进行训练。

在一个可选的实施例中，在所述输入所述历史数据至所述预设神经网络中进行训练之前，所述装置还包括：

数据划分模块205，用于划分所述历史数据为第一份数据和第二份数据，其中，所述第二份数据的数量小于所述第一份数据的数量；

打乱所述第一份数据并均分为N份数据；

所述第二份数据作为测试集。

标签提取模块206，用于当训练结束后，提取所述预设神经网络的指定层的输出作为候选数据标签。

在一个可选的实施例中，所述标签提取模块206提取所述预设神经网络的指定层的输出作为候选数据标签包括：

获取所述预设神经网络的类型；

评分计算模块207，用于计算所述候选数据标签的评分结果。

在一个可选的实施例中，所述评分计算模块207计算所述候选数据标签的评分结果包括：

1)计算所述候选数据标签与目标指标的皮尔逊相关系数；

2)对所述候选数据标签进行净值回测得到夏普比率；

3)计算训练结束后得到的神经网络模型的准确率；

4)计算ROC曲线下与坐标轴围成的AUC值；

重新训练模块208，用于根据所述评分结果重新初始化所述预设神经网络的输入参数并基于新的输入参数进行新一轮的训练直至达到预设探索周期。

在一个可选的实施例中，所述重新训练模块208根据所述评分结果重新初始化所述预设神经网络的输入参数包括：

为下一轮随机生成一组探索参数；

根据所述探索参数计算下一轮的初始输入参数；

判断下一轮的评分结果是否大于上一轮的评分结果；

θ _t＝αθ _t’+(1-αt)θ _t-1，1＜t＜T，

优选的，所述衰减系数α＝0.2，所述探索周期T＝50。

示例性的，神经网络的层数m，输入层的数据维度为R ^1×N，输出层的数据维度为R ^1×M，m最大不超过N-M+1，m的集合为{m|m∈[2,51]}，从m＝2开始，依次递增，直到m＝51。为了能够融合多个特征标签的输入信息，从输入层逐层递减，构建一个神经元数为等差序列的网络。每层神经元维度为{R ^1×N，R ^1×(N-ski)，R ^1×(N-2sk)，…，R ^1×M}，其中skip＝(N-M)/(m-1)。

标签保存模块209，用于保存每一轮训练得到的神经网络模型及从每一轮神经网络模型中提取出的所述候选数据标签。

标签确定模块210，用于根据预设筛选条件从所保存的候选数据标签中筛选出目标数据标签。

综上，本申请所述的基于神经网络的数据标签生成装置，初始化预设神经网络的输入参数，输入所述历史数据至所述预设神经网络中进行训练，当训练结束后，提取所述预设神经网络指定层的输出作为候选数据标签；计算所述候选数据标签的评分结果；根据评分结果重新初始化所述预设神经网络的输入参数并基于新的输入参数进行新一轮的训练；保存每一轮训练得到的神经网络模型及从所述神经网络模型中提取出的候选数据标签，最后从候选数据标签中筛选出目标数据标签。利用神经网络的高维非线性变换特性，以及通过随机化初始训练参数对历史数据进行训练以获得不同局部最优解的方法，相较于传统方法，本申请能在短时间内获得大量的数据标签，数据标签的生成效率远超传统的处理方法，解决了传统生成数据标签数量少、效率低的技术问题；此外，由于神经网络的非线性特性，获得的数据标签更具多样性；由于训练神经网络模型的动态特性，生成的数据标签有效性强，具有较强的实用性。

本申请所述的基于神经网络的数据标签生成装置，属于金融科技技术领域，可应用于智慧政务、智慧生活等场景中，从而推动智慧城市的发展。

实施例三

参阅图3所示，为本申请实施例三提供的终端的结构示意图。在本申请较佳实施例中，所述终端3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。

本领域技术人员应该了解，图3示出的终端的结构并不构成本申请实施例的限定，既可以是总线型结构，也可以是星形结构，所述终端3还可以包括比图示更多或更少的其他硬件或者软件，或者不同的部件布置。

在一些实施例中，所述终端3是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述终端3还可包括客户设备，所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、数码相机等。

需要说明的是，所述终端3仅为举例，其他现有的或今后可能出现的电子产品如可适应于本申请，也应包含在本申请的保护范围以内，并以引用方式包含于此。

在一些实施例中，所述存储器31用于存储计算机可读指令和各种数据，例如安装在所述终端3中的装置，并在终端3的运行过程中实现高速、自动地完成程序或数据的存取。所述存储器31包括易失性和非易失性存储器，例如随机存取存储器(Random Access Memory，RAM)、只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable Read-Only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory，OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或其他计算机可读存储介质。所述计算机可读存储介质可以是非易失性，也可以是易失性的。

在一些实施例中，所述至少一个处理器32可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(Central Processing unit，CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述至少一个处理器32是所述终端3的控制核心(Control Unit)，利用各种接口和线路连接整个终端3的各个部件，通过运行或执行存储在存储器31内的程序或者模块，以及调用存储在所述存储器31内的数据，以执行终端3的各种功能和处理数据。

在一些实施例中，所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。

尽管未示出，所述终端3还可以包括给各个部件供电的电源(比如电池)，优选的，电源可以通过电源管理装置与所述至少一个处理器32逻辑相连，从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述终端3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等，在此不再赘述。

应了解，所述实施例仅为说明之用，在专利申请范围上并不受此结构的限制。

上述以软件功能模块的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，终端，或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分。

在进一步的实施例中，结合图2，所述至少一个处理器32可执行所述终端3的操作装置以及安装的各类应用程序、计算机可读指令等，例如，上述的各个模块。

所述存储器31中存储有计算机可读指令，且所述至少一个处理器32可调用所述存储器31中存储的计算机可读指令以执行相关的功能。例如，图2中所述的各个模块是存储在所述存储器31中的计算机可读指令，并由所述至少一个处理器32所执行，从而实现所述各个模块的功能。

在本申请的一个实施例中，所述存储器31存储多个指令，所述多个指令被所述至少一个处理器32所执行以实现本申请所述的方法中的全部或者部分步骤。

具体地，所述至少一个处理器32对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述，在此不赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其他的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或，单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本申请的技术方案而非限制，尽管参照较佳实施例对本申请进行了详细说明，本领域的普通技术人员应当理解，可以对本申请的技术方案进行修改或等同替换，而不脱离本申请技术方案的精神和范围。

Claims

一种基于神经网络的数据标签生成方法，其中，所述方法包括：

获取历史数据；

初始化预设神经网络的输入参数；

输入所述历史数据至所述预设神经网络中进行训练；

当训练结束后，提取所述预设神经网络的指定层的输出作为候选数据标签；

计算所述候选数据标签的评分结果；

根据所述评分结果重新初始化所述预设神经网络的输入参数并基于新的输入参数进行新一轮的训练直至达到预设探索周期；

保存每一轮训练得到的神经网络模型及从每一轮神经网络模型中提取出的所述候选数据标签；

根据预设筛选条件从所保存的候选数据标签中筛选出目标数据标签。
如权利要求1所述的基于神经网络的数据标签生成方法，其中，所述提取所述预设神经网络的指定层的输出作为候选数据标签包括：

获取所述预设神经网络的类型；

当所述预设神经网络的类型为有监督的学习网络时，提取最后一层的输出作为候选数据标签；

当所述预设神经网络的类型为无监督的学习网络时，提取最中间层的输出作为候选数据标签。
如权利要求1所述的基于神经网络的数据标签生成方法，其中，所述根据所述评分结果重新初始化所述预设神经网络的输入参数包括：

为下一轮随机生成一组探索参数；

根据所述探索参数计算下一轮的初始输入参数；

基于所述初始输入参数训练下一轮神经网络模型并计算出下一轮的评分结果；

判断下一轮的评分结果是否大于上一轮的评分结果；

如果下一轮的评分结果大于上一轮的评分结果，则保留所述初始输入参数；

如果下一轮的评分结果小于或等于上一轮的评分结果，则所述初始输入参数为上一轮的初始输入参数。
如权利要求3所述的基于神经网络的数据标签生成方法，其中，采用如下公式计算每一轮的初始输入参数：

θ _t＝αθ _t’+(1-αt)θ _t-1，1<t<T，

其中，θ _t’为下一轮随机生成的一组探索参数，t代表轮次，T为所述预设探索周期，α为衰减系数。
如权利要求1至4中任意一项所述的基于神经网络的数据标签生成方法，其中，所述计算所述候选数据标签的评分结果包括：

计算所述候选数据标签与目标指标的皮尔逊相关系数；

对所述候选数据标签进行净值回测得到夏普比率；

计算训练结束后得到的神经网络模型的准确率；

计算ROC曲线下与坐标轴围成的AUC值；

根据所述皮尔逊相关系数、夏普比率、准确率及AUC值得到评分结果。
如权利要求1至4中任意一项所述的基于神经网络的数据标签生成方法，其中，在所述输入所述历史数据至所述预设神经网络中进行训练之前，所述方法还包括：

划分所述历史数据为第一份数据和第二份数据，其中，所述第二份数据的数量小于所述第一份数据的数量；

打乱所述第一份数据并均分为N份数据；

轮流选择所述N份数据中的N-1份数据作为训练集，剩余一份数据作为验证集。
如权利要求1至4中任意一项所述的基于神经网络的数据标签生成方法，其中，在所述获取历史数据之后，所述方法还包括：

对所述历史数据进行预处理，所述预处理包括：删除空数据、去除极值数据、数据标准化，其中，

所述删除空数据包括：对所述历史数据中的不完整数据填充0或者不存在的数据填充为0；

所述去除极值数据包括：去除所述历史数据中位于前K1行和后K2行的数据；对所述历史数据进行平均计算得到平均数据，将所述历史数据中大于所述平均数据的预设第一倍数的数据降低为所述平均数据，将所述历史数据中小于所述平均数据的预设第二倍数的数据提高为所述平均数据。
一种基于神经网络的数据标签生成装置，其中，所述装置包括：

数据获取模块，用于获取历史数据；

参数初始模块，用于初始化预设神经网络的输入参数；

模型训练模块，用于输入所述历史数据至所述预设神经网络中进行训练；

标签提取模块，用于当训练结束后，提取所述预设神经网络的指定层的输出作为候选数据标签；

评分计算模块，用于计算所述候选数据标签的评分结果；

重新训练模块，用于根据所述评分结果重新初始化所述预设神经网络的输入参数并基于新的输入参数进行新一轮的训练直至达到预设探索周期；

标签保存模块，用于保存每一轮训练得到的神经网络模型及从每一轮神经网络模型中提取出的所述候选数据标签；

标签确定模块，用于根据预设筛选条件从所保存的候选数据标签中筛选出目标数据标签。
一种终端，其中，所述终端包括处理器，所述处理器用于执行存储器中存储的计算机可读指令时实现以下步骤：

获取历史数据；

初始化预设神经网络的输入参数；

输入所述历史数据至所述预设神经网络中进行训练；

当训练结束后，提取所述预设神经网络的指定层的输出作为候选数据标签；

计算所述候选数据标签的评分结果；

根据所述评分结果重新初始化所述预设神经网络的输入参数并基于新的输入参数进行新一轮的训练直至达到预设探索周期；

保存每一轮训练得到的神经网络模型及从每一轮神经网络模型中提取出的所述候选数据标签；

根据预设筛选条件从所保存的候选数据标签中筛选出目标数据标签。
如权利要求9所述的终端，其中，所述处理器执行所述计算机可读指令以实现提取所述预设神经网络的指定层的输出作为候选数据标签时，具体包括：

获取所述预设神经网络的类型；

当所述预设神经网络的类型为有监督的学习网络时，提取最后一层的输出作为候选数据标签；

当所述预设神经网络的类型为无监督的学习网络时，提取最中间层的输出作为候选数据标签。
如权利要求9所述的终端，其中，所述处理器执行所述计算机可读指令以实现根据所述评分结果重新初始化所述预设神经网络的输入参数时，具体包括：

为下一轮随机生成一组探索参数；

根据所述探索参数计算下一轮的初始输入参数；

基于所述初始输入参数训练下一轮神经网络模型并计算出下一轮的评分结果；

判断下一轮的评分结果是否大于上一轮的评分结果；

如果下一轮的评分结果大于上一轮的评分结果，则保留所述初始输入参数；

如果下一轮的评分结果小于或等于上一轮的评分结果，则所述初始输入参数为上一轮的初始输入参数。
如权利要求11所述的终端，其中，采用如下公式计算每一轮的初始输入参数：

θ _t＝αθ _t’+(1-αt)θ _t-1，1<t<T，

其中，θ _t’为下一轮随机生成的一组探索参数，t代表轮次，T为所述预设探索周期，α为衰减系数。
如权利要求9至12中任意一项所述的终端，其中，所述处理器执行所述计算机可读指令以实现计算所述候选数据标签的评分结果时，具体包括：

计算所述候选数据标签与目标指标的皮尔逊相关系数；

对所述候选数据标签进行净值回测得到夏普比率；

计算训练结束后得到的神经网络模型的准确率；

计算ROC曲线下与坐标轴围成的AUC值；

根据所述皮尔逊相关系数、夏普比率、准确率及AUC值得到评分结果。
如权利要求9至12中任意一项所述的终端，其中，在所述输入所述历史数据至所述预设神经网络中进行训练之前，所述处理器执行所述计算机可读指令时还用以实现以下步骤：

划分所述历史数据为第一份数据和第二份数据，其中，所述第二份数据的数量小于所述第一份数据的数量；

打乱所述第一份数据并均分为N份数据；

轮流选择所述N份数据中的N-1份数据作为训练集，剩余一份数据作为验证集。
如权利要求9至12中任意一项所述的终端，其中，在所述获取历史数据之后，所述处理器执行所述计算机可读指令时还用以实现以下步骤：

对所述历史数据进行预处理，所述预处理包括：删除空数据、去除极值数据、数据标准化，其中，

所述删除空数据包括：对所述历史数据中的不完整数据填充0或者不存在的数据填充为0；

所述去除极值数据包括：去除所述历史数据中位于前K1行和后K2行的数据；对所述历史数据进行平均计算得到平均数据，将所述历史数据中大于所述平均数据的预设第一倍数的数据降低为所述平均数据，将所述历史数据中小于所述平均数据的预设第二倍数的数据提高为所述平均数据。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，其中，所述计算机可读指令被处理器执行时实现以下步骤：

获取历史数据；

初始化预设神经网络的输入参数；

输入所述历史数据至所述预设神经网络中进行训练；

当训练结束后，提取所述预设神经网络的指定层的输出作为候选数据标签；

计算所述候选数据标签的评分结果；

根据所述评分结果重新初始化所述预设神经网络的输入参数并基于新的输入参数进行新一轮的训练直至达到预设探索周期；

保存每一轮训练得到的神经网络模型及从每一轮神经网络模型中提取出的所述候选数据标签；

根据预设筛选条件从所保存的候选数据标签中筛选出目标数据标签。
如权利要求16所述的计算机可读存储介质，其中，所述计算机可读指令被所述处理器执行以实现提取所述预设神经网络的指定层的输出作为候选数据标签时，具体包括：

获取所述预设神经网络的类型；

当所述预设神经网络的类型为有监督的学习网络时，提取最后一层的输出作为候选数据标签；

当所述预设神经网络的类型为无监督的学习网络时，提取最中间层的输出作为候选数据标签。
如权利要求16所述的计算机可读存储介质，其中，所述计算机可读指令被所述处理器执行以实现根据所述评分结果重新初始化所述预设神经网络的输入参数时，具体包括：

为下一轮随机生成一组探索参数；

根据所述探索参数计算下一轮的初始输入参数；

基于所述初始输入参数训练下一轮神经网络模型并计算出下一轮的评分结果；

判断下一轮的评分结果是否大于上一轮的评分结果；

如果下一轮的评分结果大于上一轮的评分结果，则保留所述初始输入参数；

如果下一轮的评分结果小于或等于上一轮的评分结果，则所述初始输入参数为上一轮的初始输入参数。
如权利要求18所述的计算机可读存储介质，其中，采用如下公式计算每一轮的初始输入参数：

θ _t＝αθ _t’+(1-αt)θ _t-1，1<t<T，

其中，θ _t’为下一轮随机生成的一组探索参数，t代表轮次，T为所述预设探索周期，α为衰减系数。
如权利要求16至19中任意一项所述的计算机可读存储介质，其中，所述计算机可读指令被所述处理器执行以实现计算所述候选数据标签的评分结果时，具体包括：

计算所述候选数据标签与目标指标的皮尔逊相关系数；

对所述候选数据标签进行净值回测得到夏普比率；

计算训练结束后得到的神经网络模型的准确率；

计算ROC曲线下与坐标轴围成的AUC值；

根据所述皮尔逊相关系数、夏普比率、准确率及AUC值得到评分结果。
如权利要求16至19中任意一项所述的计算机可读存储介质，其中，在所述输入所述历史数据至所述预设神经网络中进行训练之前，所述计算机可读指令被所述处理器执行时还用以实现：

划分所述历史数据为第一份数据和第二份数据，其中，所述第二份数据的数量小于所述第一份数据的数量；

打乱所述第一份数据并均分为N份数据；

轮流选择所述N份数据中的N-1份数据作为训练集，剩余一份数据作为验证集。
如权利要求16至19中任意一项所述的计算机可读存储介质，其中，在所述获取历史数据之后，所述计算机可读指令被所述处理器执行时还用以实现：

对所述历史数据进行预处理，所述预处理包括：删除空数据、去除极值数据、数据标准化，其中，

所述删除空数据包括：对所述历史数据中的不完整数据填充0或者不存在的数据填充为0；

所述去除极值数据包括：去除所述历史数据中位于前K1行和后K2行的数据；对所述历史数据进行平均计算得到平均数据，将所述历史数据中大于所述平均数据的预设第一倍数的数据降低为所述平均数据，将所述历史数据中小于所述平均数据的预设第二倍数的数据提高为所述平均数据。