CN115439206A

CN115439206A - 一种申报数据预测方法、装置、设备及介质

Info

Publication number: CN115439206A
Application number: CN202211388928.2A
Authority: CN
Inventors: 陈泓; 刘子星; 徐煌; 丁乐
Original assignee: Shuiyou Information Technology Co ltd
Current assignee: Zhejiang Yiqi Zhaorui Digital Technology Co.,Ltd.
Priority date: 2022-11-08
Filing date: 2022-11-08
Publication date: 2022-12-06
Anticipated expiration: 2042-11-08
Also published as: CN115439206B

Abstract

本申请公开了一种申报数据预测方法、装置、设备及介质，涉及人工智能领域，该方法包括：按照业务逻辑确定目标申报数据中的目标标签，并生成第一目标特征；将目标申报数据划分为第一训练集、第二训练集和测试集；基于第一训练集中各项数据对应的目标标签和第一目标特征，对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练；将第二训练集中各项数据对应的目标标签作为标签，并将训练后两模型对第二训练集的预测结果作为第二目标特征，对第二预设XGBregressor模型进行训练；第二预设XGBregressor模型为训练后两模型进行模型融合得到的模型；利用训练后第二预设XGBregressor模型基于测试集对申报数据进行预测。本发明能够将LSTM和XGBRegressor进行高质量融合，对申报数据进行准确预测。

Description

一种申报数据预测方法、装置、设备及介质

技术领域

本发明涉及人工智能领域，特别涉及一种申报数据预测方法、装置、设备及介质。

背景技术

在税务申报的场景下，通常会根据往期申报人数预测未来的申报高峰期的“户次”数量，以便及时协调相关人力资源。但是当前的预测水平非常不理想，所以需要对算法进行优化。

现在的解决方案仅为XGBRegressor（即xgboost回归模型），但这种方案完全没有对时间“趋势”进行捕捉的效果，完全忽视了“趋势”的影响。并且模型整体精度不足，预测数据不准确，无法满足实际使用需求，需要进一步优化。

由上可见，在税务数据预测过程中，如何避免出现由于现有的使用XGBRegressor进行数据预测的方法导致预测数据不准确，无法满足实际使用需求的情况是本领域有待解决的问题。

发明内容

有鉴于此，本发明的目的在于提供一种申报数据预测方法、装置、设备及介质，能够将LSTM（即Long Short Term Memory networks，长短期记忆网络）和XGBRegressor进行高效高质量融合，以保证数据预测的准确性。其具体方案如下：

第一方面，本申请公开了一种申报数据预测方法，包括：

按照业务逻辑确定目标申报数据中的目标标签，并生成第一目标特征；

按照预设分类方法将所述目标申报数据划分为第一训练集、第二训练集以及测试集；

基于所述第一训练集中各项数据对应的目标标签和第一目标特征，对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练，以获取训练后长短期记忆网络模型和训练后第一XGBregressor模型；

将所述第二训练集中各项数据对应的目标标签作为标签，并将所述训练后长短期记忆网络模型和所述训练后第一XGBregressor模型对所述第二训练集的预测结果作为第二目标特征，对第二预设XGBregressor模型进行训练，以获取训练后第二预设XGBregressor模型；所述第二预设XGBregressor模型为利用训练后长短期记忆网络模型和训练后第一XGBregressor模型进行模型融合得到的模型；

利用所述训练后第二预设XGBregressor模型基于所述测试集对申报数据进行预测。

可选的，所述基于所述第一训练集中各项数据对应的目标标签和第一目标特征，对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练，包括：

将所述第一训练集中各项数据对应的目标标签输入预设长短期记忆网络模型中，并将所述第一训练集中各项数据对应的第一目标特征输入第一预设XGBregressor模型进行训练。

可选的，所述按照业务逻辑确定目标申报数据中的目标标签，并生成第一目标特征之前，还包括：

收集原始申报数据，并对所述原始申报数据中的缺失数据进行填充，以生成填充后申报数据；

将所述填充后申报数据进行数据缩放，以生成目标申报数据。

可选的，所述对所述原始申报数据中的缺失数据进行填充，包括：

确定所述原始申报数据中的缺失数据项；

确定所述缺失数据项对应的缺失时刻，基于预先生成的时间码表，以预设时间为跨度确定所述缺失时刻对应的参考时刻；

将所述参考时刻对应的申报数据作为所述缺失时刻对应的申报数据，对所述缺失数据项进行填充。

可选的，所述对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练，以获取训练后长短期记忆网络模型和训练后第一XGBregressor模型，包括：

对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练，并利用所述第二训练集作为验证集对所述预设长短期记忆网络模型和第一预设XGBregressor模型进行验证，以确定训练后长短期记忆网络模型和训练后第一XGBregressor模型。

可选的，所述利用所述第二训练集作为验证集对所述预设长短期记忆网络模型和第一预设XGBregressor模型进行验证，以确定训练后长短期记忆网络模型和训练后第一XGBregressor模型，包括：

利用所述第二训练集作为验证集对所述预设长短期记忆网络模型和第一预设XGBregressor模型进行验证，并确定平均绝对值误差；

基于所述平均绝对值误差对所述预设长短期记忆网络模型和第一预设XGBregressor模型进行参数调整，以将参数调整后的所述预设长短期记忆网络模型和第一预设XGBregressor模型作为训练后长短期记忆网络模型和训练后第一XGBregressor模型。

可选的，所述基于所述平均绝对值误差对所述预设长短期记忆网络模型和第一预设XGBregressor模型进行参数调整，以将参数调整后的所述预设长短期记忆网络模型和第一预设XGBregressor模型作为训练后长短期记忆网络模型和训练后第一XGBregressor模型，包括：

利用预设迭代次数对所述预设长短期记忆网络模型进行迭代，并基于所述平均绝对值误差对所述预设长短期记忆网络模型和第一预设XGBregressor模型进行参数调整，以将最优的预设长短期记忆网络模型作为训练后长短期记忆网络模型；

基于所述平均绝对值误差，并利用穷举搜索的方式对所述第一预设XGBregressor模型的学习率、最大深度、L1正则化参数、L2正则化参数以及基本分类器的数量进行参数选择，以将最优的第一XGBregressor模型作为训练后第一XGBregressor模型。

第二方面，本申请公开了一种申报数据预测装置，包括：

标签确定与特征生成模块，用于按照业务逻辑确定目标申报数据中的目标标签，并生成第一目标特征；

数据集划分模块，用于按照预设分类方法将所述目标申报数据划分为第一训练集、第二训练集以及测试集；

第一训练模块，用于基于所述第一训练集中各项数据对应的目标标签和第一目标特征，对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练，以获取训练后长短期记忆网络模型和训练后第一XGBregressor模型；

第二训练模块，用于将所述第二训练集中各项数据对应的目标标签作为标签，并将所述训练后长短期记忆网络模型和所述训练后第一XGBregressor模型对所述第二训练集的预测结果作为第二目标特征，对第二预设XGBregressor模型进行训练，以获取训练后第二预设XGBregressor模型；所述第二预设XGBregressor模型为利用训练后长短期记忆网络模型和训练后第一XGBregressor模型进行模型融合得到的模型；

数据预测模块，用于利用所述训练后第二预设XGBregressor模型基于所述测试集对申报数据进行预测。

第三方面，本申请公开了一种电子设备，包括：

存储器，用于保存计算机程序；

处理器，用于执行所述计算机程序，以实现前述的申报数据预测方法。

第四方面，本申请公开了一种计算机存储介质，用于保存计算机程序；其中，所述计算机程序被处理器执行时实现前述公开的申报数据预测方法的步骤。

本申请按照业务逻辑确定目标申报数据中的目标标签，并生成第一目标特征；按照预设分类方法将所述目标申报数据划分为第一训练集、第二训练集以及测试集；基于所述第一训练集中各项数据对应的目标标签和第一目标特征，对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练，以获取训练后长短期记忆网络模型和训练后第一XGBregressor模型；将所述第二训练集中各项数据对应的目标标签作为标签，并将所述训练后长短期记忆网络模型和所述训练后第一XGBregressor模型对所述第二训练集的预测结果作为第二目标特征，对第二预设XGBregressor模型进行训练，以获取训练后第二预设XGBregressor模型；所述第二预设XGBregressor模型为利用训练后长短期记忆网络模型和训练后第一XGBregressor模型进行模型融合得到的模型；利用所述训练后第二预设XGBregressor模型基于所述测试集对申报数据进行预测。这样一来，本发明有效融合LSTM对于时间趋势的学习能力强和XGBRegressor-A能够有效地对近期的突变进行调整的优点，我们采用了另一个XGBRegressor模型来学习他们的融合策略，以此模型作为最终模型在测试集上做出最终的预测，实现了LSTM与XGBRegressor的完美互补，提升了数据预测的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请提供的一种申报数据预测方法流程图；

图2为本申请提供的一种方案整体流程图；

图3为本申请提供的一种具体的申报数据预测方法流程图；

图4为本申请提供的单一LSTM进行申报数据预测的效果图；

图5为本申请提供的单一XGBRegressor进行申报数据预测的效果图；

图6为本申请提供的通过模型融合进行申报数据预测的效果图；

图7为本申请提供的一种申报数据预测装置结构示意图；

图8为本申请提供的一种电子设备结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

现有技术中，现有的使用XGBRegressor进行数据预测的方法会导致预测数据不准确，无法满足实际使用需求的情况。在本申请中，能够将LSTM和XGBRegressor进行高效高质量融合，保证数据预测的准确性。

本发明实施例公开了一种申报数据预测方法，参见图1所述，该方法包括：

步骤S11：按照业务逻辑确定目标申报数据中的目标标签，并生成第一目标特征。

本实施例中按照实际业务的业务逻辑确定目标申报数据中的目标标签，在具体实施方式中，可以将目标申报数据中的“户次”作为目标标签，生成的第一目标特征可以是：is_workday（是否为工作日），is_weekend（是否为周末），special_holiday（是否为特殊节假日），is_lieu（是否为调休），dayOfWeek（星期一~星期日），dayOfYear（1~365），weekOfYear（一年中的第几周），year（年），quarter（季度），month（月），hour（小时），lag1（前一小时的数据，后面以此类推），lag2，lag3，lag4，lag5，lag6，lag12，lag24，lag48这20个特征。

在现有技术中，XGBRegressor因为没有加入“Lag Time（延迟时间）”特征，导致完全没有对时间“趋势”进行捕捉。本实施例中提出的特征中增加了“Lag Time（延迟时间）”特征，在实际实施中，可以准确捕捉“趋势”特征，保证数据预测的准确性。

本实施例中，所述按照业务逻辑确定目标申报数据中的目标标签，并生成第一目标特征之前，还可以包括：收集原始申报数据，并对所述原始申报数据中的缺失数据进行填充，以生成填充后申报数据；将所述填充后申报数据进行数据缩放，以生成目标申报数据。

在具体的实施方式中，我们要求输入模型的训练数据的时间序列是完整的且必须保证数据质量，因此在确定目标标签和特征生成之前，本实施例会进行缺失数据填充和数据缩放。也即，本实施例中，所述目标申报数据是原始申报数据经过缺失数据填充和数据缩放后得到的。在优选的实施方式中，可以使用Minmax-scaler函数进行数据缩放。

本实施例中，所述对所述原始申报数据中的缺失数据进行填充，可以包括：确定所述原始申报数据中的缺失数据项；确定所述缺失数据项对应的缺失时刻，基于预先生成的时间码表，以预设时间为跨度确定所述缺失时刻对应的参考时刻；将所述参考时刻对应的申报数据作为所述缺失时刻对应的申报数据，对所述缺失数据项进行填充。

本实施例中，在实际操作中会出现因为系统宕机或维护，导致全天数据没有录入的情况。对于这种情况下的数据缺失，我们可以利用预先生成的时间码表对原始样本进行填充操作。具体实施时，可以以24小时为时间跨度，使用上一个时间跨度的值（昨天相同时间点的数据）填充，例如今天9点的数据缺失，我们会用昨天9点的数据进行填充，以此类推解决方案。

在实际操作中还有可能会出现个别小时申报数为0，导致该小时的数据没有录入的情况，这种情况下，可以直接以0填充。

需要指出的是，由于后续模型训练时会使用LSTM，过大的数值会导致梯度跃迁或梯度震荡，导致模型无法收敛，所以本实施例中提出模型训练之前对缺失数据进行填充后会对数据进行缩放。对于XGBRegressor而言，虽然理论上不需要做数据缩放，但是实践结果表明，做数据缩放能对模型质量有不小的提升。

步骤S12：按照预设分类方法将所述目标申报数据划分为第一训练集、第二训练集以及测试集。

在本实施例的具体实施方式中，可以基于前第一时间段的数据作为第一训练集，基于前第二时间段的数据作为第二训练集，基于前第三时间段的数据作为测试集；其中，所述前第一时间段先于所述前第二时间段，且所述前第二时间段先于所述前第三时间段。在优选的实施方式中，可以将前六个月到前五年的数据作为第一训练集，将前六个月的数据作为第二训练集，将当月数据作为测试集。

步骤S13：基于所述第一训练集中各项数据对应的目标标签和第一目标特征，对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练，以获取训练后长短期记忆网络模型和训练后第一XGBregressor模型。

本实施例中，所述基于所述第一训练集中各项数据对应的目标标签和第一目标特征，对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练，可以包括：将所述第一训练集中各项数据对应的目标标签输入预设长短期记忆网络模型中，并将所述第一训练集中各项数据对应的第一目标特征输入第一预设XGBregressor模型进行训练。

本实施例中可以将所述第一预设XGBregressor模型记为XGBRegressor-A，将第二预设XGBregressor模型记为XGBRegressor-B。

在本实施例中会在第一训练集上训练LSTM和XGBRegressor-A两个模型。在具体实施方式中，可以将“户次”作为目标标签输入LSTM中，将上述的20个特征输入XGBRegressor-A中进行训练，最终获取训练后的LSTM和XGBRegressor-A。

本实施例中，所述对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练，以获取训练后长短期记忆网络模型和训练后第一XGBregressor模型，可以包括：对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练，并利用所述第二训练集作为验证集对所述预设长短期记忆网络模型和第一预设XGBregressor模型进行验证，以确定训练后长短期记忆网络模型和训练后第一XGBregressor模型。

本实施例中，会在第一训练集上训练LSTM和XGBRegressor-A两个模型时，还可以利用所述第二训练集验证集来验证两个模型的效果，以确保两模型在测试集上的准确率。

步骤S14：将所述第二训练集中各项数据对应的目标标签作为标签，并将所述训练后长短期记忆网络模型和所述训练后第一XGBregressor模型对所述第二训练集的预测结果作为第二目标特征，对第二预设XGBregressor模型进行训练，以获取训练后第二预设XGBregressor模型；所述第二预设XGBregressor模型为利用训练后长短期记忆网络模型和训练后第一XGBregressor模型进行模型融合得到的模型。

本实施例中得到训练后的LSTM和XGBRegressor-A后，会将两个模型进行Stacking模型融合，以获取第二预设XGBregressor模型，即XGBRegressor-B，并以此模型作为最终模型在测试集上做出最终的预测。

本实施例中对XGBRegressor-B进行训练时，使用训练后的LSTM和XGBRegressor-A在第二训练集上的预测结果作为新的特征，并使用第二训练集中各项数据对应的目标标签作为标签，输入XGBRegressor-B中进行训练，并最终得到训练后的XGBRegressor-B。

需要指出的是，本发明中所述第二训练集既作为对LSTM和XGBRegressor-A进行训练时的验证集，也作为XGBRegressor-B进行训练时的训练集，在具体的实施方式中，也可以将所述第二训练集称作验证集。

步骤S15：利用所述训练后第二预设XGBregressor模型基于所述测试集对申报数据进行预测。

LSTM对于时间趋势的学习能力是三个模型当中最为强大的，本实施例中它的主要作用就是为了捕捉“趋势”。但是LSTM有一个致命的缺点：它无法对近期的一些突发情况做出及时的反应调整，例如：昨天24小时的申报人数明显偏离正常大趋势，那么当天的预测应把昨天数据的异常表现纳入重点考虑范围，并做出正面响应，但是LSTM缺乏这种能力。对于XGBRegressor，虽然XGBRegressor对于时间趋势的提取能力不如LSTM，但是它能够有效地对近期的突变进行调整，这个特点刚好能和LSTM进行互补，因此我们会对他们两个模型进行stacking以融合各自的优点。本实施例中XGBRegressor的主要作用是捕捉“趋势”以外的其它所有重要特征，也是“特征生成”的主要面向对象。

图2为本申请提出的一种方案整体流程图，图中对原始申报数据进行缺失值填充，数据缩放以及特征生成后，得到了预处理数据（即上述目标申报数据），接着将前六个月到前五年的数据作为训练数据（即第一训练集），将前六个月的数据作为验证数据（即第二训练集），将当月数据作为测试数据（即测试集），使用训练数据对LSTM和XGBRegressor-A进行训练，并使用验证数据对LSTM和XGBRegressor-A进行验证，将训练后LSTM和XGBRegressor-A进行模型融合后得到XGBRegressor-B，并使用验证数据对XGBRegressor-B进行训练，然后XGBRegressor-B将对测试数据的预测结果作为预测数据。

本实施例中按照业务逻辑确定目标申报数据中的目标标签，并生成第一目标特征；按照预设分类方法将所述目标申报数据划分为第一训练集、第二训练集以及测试集；基于所述第一训练集中各项数据对应的目标标签和第一目标特征，对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练，以获取训练后长短期记忆网络模型和训练后第一XGBregressor模型；将所述第二训练集中各项数据对应的目标标签作为标签，并将所述训练后长短期记忆网络模型和所述训练后第一XGBregressor模型对所述第二训练集的预测结果作为第二目标特征，对第二预设XGBregressor模型进行训练，以获取训练后第二预设XGBregressor模型；所述第二预设XGBregressor模型为利用训练后长短期记忆网络模型和训练后第一XGBregressor模型进行模型融合得到的模型；利用所述训练后第二预设XGBregressor模型基于所述测试集对申报数据进行预测。这样一来，本发明有效融合LSTM对于时间趋势的学习能力强和XGBRegressor-A能够有效地对近期的突变进行调整的优点，我们采用了另一个XGBRegressor模型来学习他们的融合策略，以此模型作为最终模型在测试集上做出最终的预测，实现了LSTM与XGBRegressor的完美互补。另外，本实施例中提出在生成的特征中增加了“Lag Time（延迟时间）”特征，在实际实施中，可以准确捕捉“趋势”特征，保证数据预测的准确性。

图3为本申请实施例提供的一种具体的申报数据预测方法流程图。参见图3所示，该方法包括：

步骤S21：按照业务逻辑确定目标申报数据中的目标标签，并生成第一目标特征。

其中，关于步骤S21的更加具体的处理过程可以参考前述实施例中公开的相应内容，在此不再进行赘述。

步骤S22：按照预设分类方法将所述目标申报数据划分为第一训练集、第二训练集以及测试集。

其中，关于步骤S22的更加具体的处理过程可以参考前述实施例中公开的相应内容，在此不再进行赘述。

步骤S23：基于所述第一训练集中各项数据对应的目标标签和第一目标特征，对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练，并利用所述第二训练集作为验证集对所述预设长短期记忆网络模型和第一预设XGBregressor模型进行验证，并确定平均绝对值误差（即MAE，Mean Absolute Error）。

步骤S24：基于所述平均绝对值误差对所述预设长短期记忆网络模型和第一预设XGBregressor模型进行参数调整，以将参数调整后的所述预设长短期记忆网络模型和第一预设XGBregressor模型作为训练后长短期记忆网络模型和训练后第一XGBregressor模型。

本实施例中，所述基于所述平均绝对值误差对所述预设长短期记忆网络模型和第一预设XGBregressor模型进行参数调整，以将参数调整后的所述预设长短期记忆网络模型和第一预设XGBregressor模型作为训练后长短期记忆网络模型和训练后第一XGBregressor模型，可以包括：利用预设迭代次数对所述预设长短期记忆网络模型进行迭代，并基于所述平均绝对值误差对所述预设长短期记忆网络模型和第一预设XGBregressor模型进行参数调整，以将最优的预设长短期记忆网络模型作为训练后长短期记忆网络模型；基于所述平均绝对值误差，并利用穷举搜索的方式对所述第一预设XGBregressor模型的学习率、最大深度、L1正则化参数、L2正则化参数以及基本分类器的数量进行参数选择，以将最优的第一XGBregressor模型作为训练后第一XGBregressor模型。

本实施例中，可以使用第二训练集（即验证集）上的MAE对LSTM和XGBRegressor-A训练时的超参数进行调整。在具体实施方式中，对于LSTM，因参数的随机初始化和训练迭代次数对最终的模型效果有着显著影响，所以我们可以先在[50,100,150]当中确认最佳的迭代次数，再跑十次训练，取最佳的LSTM模型作为我们的最终模型。对于XGBRegressor-A，我们直接使用GridSearch（即穷举搜索）的方式对learning_rate（即学习率），max_depth（即最大深度），reg_alpha（即L1正则化参数），reg_lambda（即L2正则化参数）和n_estimator（即基本分类器的数量）进行参数选择，最终将最优的第一XGBregressor模型作为训练后第一XGBregressor模型。

步骤S25：将所述第二训练集中各项数据对应的目标标签作为标签，并将所述训练后长短期记忆网络模型和所述训练后第一XGBregressor模型对所述第二训练集的预测结果作为第二目标特征，对第二预设XGBregressor模型进行训练，以获取训练后第二预设XGBregressor模型；所述第二预设XGBregressor模型为利用训练后长短期记忆网络模型和训练后第一XGBregressor模型进行模型融合得到的模型。

其中，关于步骤S25的更加具体的处理过程可以参考前述实施例中公开的相应内容，在此不再进行赘述

步骤S26：利用所述训练后第二预设XGBregressor模型基于所述测试集对申报数据进行预测。

其中，关于步骤S26的更加具体的处理过程可以参考前述实施例中公开的相应内容，在此不再进行赘述

图4为本发明提供的一种单一LSTM进行申报数据预测的效果图，过程中验证集的MAE为136.25733481732507，图5为本发明提供的一种单一XGBRegressor进行申报数据预测的效果图，过程中验证集的MAE为377.2359260963069。图6为本发明提供的LSTM+XGBRegressor-A+XGBRegressor-B进行申报数据预测的效果图，过程中验证集的MAE为10.14453846692211。由此可见，本发明提出的方法大大减少了误差。

在传统的机器学习建模当中，验证集只是被用来进行超参数的选择。但是在本发明当中，因为模型Stacking的需要，和时间序列模型的本身特点，共同导致了验证集和第二训练集的必然重叠，实现了时间序列模型和传统的回归模型的高效高质量融合，提升了数据预测的准确性。

参见图7所示，本申请实施例公开了一种申报数据预测装置，具体可以包括：

标签确定与特征生成模块11，用于按照业务逻辑确定目标申报数据中的目标标签，并生成第一目标特征；

数据集划分模块12，用于按照预设分类方法将所述目标申报数据划分为第一训练集、第二训练集以及测试集；

第一训练模块13，用于基于所述第一训练集中各项数据对应的目标标签和第一目标特征，对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练，以获取训练后长短期记忆网络模型和训练后第一XGBregressor模型；

第二训练模块14，用于将所述第二训练集中各项数据对应的目标标签作为标签，并将所述训练后长短期记忆网络模型和所述训练后第一XGBregressor模型对所述第二训练集的预测结果作为第二目标特征，对第二预设XGBregressor模型进行训练，以获取训练后第二预设XGBregressor模型；所述第二预设XGBregressor模型为利用训练后长短期记忆网络模型和训练后第一XGBregressor模型进行模型融合得到的模型；

数据预测模块15，用于利用所述训练后第二预设XGBregressor模型基于所述测试集对申报数据进行预测。

本实施例中按照业务逻辑确定目标申报数据中的目标标签，并生成第一目标特征；按照预设分类方法将所述目标申报数据划分为第一训练集、第二训练集以及测试集；基于所述第一训练集中各项数据对应的目标标签和第一目标特征，对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练，以获取训练后长短期记忆网络模型和训练后第一XGBregressor模型；将所述第二训练集中各项数据对应的目标标签作为标签，并将所述训练后长短期记忆网络模型和所述训练后第一XGBregressor模型对所述第二训练集的预测结果作为第二目标特征，对第二预设XGBregressor模型进行训练，以获取训练后第二预设XGBregressor模型；所述第二预设XGBregressor模型为利用训练后长短期记忆网络模型和训练后第一XGBregressor模型进行模型融合得到的模型；利用所述训练后第二预设XGBregressor模型基于所述测试集对申报数据进行预测。这样一来，本发明有效融合LSTM对于时间趋势的学习能力强和XGBRegressor-A能够有效地对近期的突变进行调整的优点，我们采用了另一个XGBRegressor模型来学习他们的融合策略，以此模型作为最终模型在测试集上做出最终的预测，实现了LSTM与XGBRegressor的完美互补，提升了数据预测的准确性。

进一步的，本申请实施例还公开了一种电子设备，图8是根据示例性实施例示出的电子设备20结构图，图中的内容不能认为是对本申请的使用范围的任何限制。

图8为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20，具体可以包括：至少一个处理器21、至少一个存储器22、电源23、显示屏24、输入输出接口25、通信接口26和通信总线27。其中，所述存储器22用于存储计算机程序，所述计算机程序由所述处理器21加载并执行，以实现前述任一实施例公开的申报数据预测方法中的相关步骤。另外，本实施例中的电子设备20具体可以为电子计算机。

本实施例中，电源23用于为电子设备20上的各硬件设备提供工作电压；通信接口26能够为电子设备20创建与外界设备之间的数据传输通道，其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议，在此不对其进行具体限定；输入输出接口25，用于获取外界输入数据或向外界输出数据，其具体的接口类型可以根据具体应用需要进行选取，在此不进行具体限定。

另外，存储器22作为资源存储的载体，可以是只读存储器、随机存储器、磁盘或者光盘等，其上所存储的资源可以包括操作系统221、计算机程序222及虚拟机数据223等，虚拟机数据223可以包括各种各样的数据。存储方式可以是短暂存储或者永久存储。

其中，操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222，其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的申报数据预测方法的计算机程序之外，还可以进一步包括能够用于完成其他特定工作的计算机程序。

进一步的，本申请还公开了一种计算机可读存储介质，这里所说的计算机可读存储介质包括随机存取存储器(Random Access Memory，RAM)、内存、只读存储器(Read-OnlyMemory，ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、磁碟或者光盘或技术领域内所公知的任意其他形式的存储介质。其中，所述计算机程序被处理器执行时实现前述公开的申报数据预测方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容，在此不再进行赘述。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器（RAM）、内存、只读存储器（ROM）、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明所提供的申报数据预测方法、装置、设备、存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种申报数据预测方法，其特征在于，包括：

2.根据权利要求1所述的申报数据预测方法，其特征在于，所述基于所述第一训练集中各项数据对应的目标标签和第一目标特征，对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练，包括：

3.根据权利要求1所述的申报数据预测方法，其特征在于，所述按照业务逻辑确定目标申报数据中的目标标签，并生成第一目标特征之前，还包括：

4.根据权利要求3所述的申报数据预测方法，其特征在于，所述对所述原始申报数据中的缺失数据进行填充，包括：

确定所述原始申报数据中的缺失数据项；

5.根据权利要求1至4任一项所述的申报数据预测方法，其特征在于，所述对预设长短期记忆网络模型和第一预设XGBregressor模型进行训练，以获取训练后长短期记忆网络模型和训练后第一XGBregressor模型，包括：

6.根据权利要求5所述的申报数据预测方法，其特征在于，所述利用所述第二训练集作为验证集对所述预设长短期记忆网络模型和第一预设XGBregressor模型进行验证，以确定训练后长短期记忆网络模型和训练后第一XGBregressor模型，包括：

7.根据权利要求6所述的申报数据预测方法，其特征在于，所述基于所述平均绝对值误差对所述预设长短期记忆网络模型和第一预设XGBregressor模型进行参数调整，以将参数调整后的所述预设长短期记忆网络模型和第一预设XGBregressor模型作为训练后长短期记忆网络模型和训练后第一XGBregressor模型，包括：

8.一种申报数据预测装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括处理器和存储器；其中，所述处理器执行所述存储器中保存的计算机程序时实现如权利要求1至7任一项所述的申报数据预测方法。

10.一种计算机可读存储介质，其特征在于，用于存储计算机程序；其中，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的申报数据预测方法。