CN111861032A

CN111861032A - 基于深度学习的大宗资源类矿产品放行风险预测方法

Info

Publication number: CN111861032A
Application number: CN202010748118.8A
Authority: CN
Inventors: 徐国江; 张彦彬; 苏杨; 刘阳丽; 吕朋
Original assignee: Guangdong Source Of Wisdom Information Technology Co ltd; Guangzhou Customs Technology Center
Current assignee: Guangdong Source Of Wisdom Information Technology Co ltd; Guangzhou Customs Technology Center
Priority date: 2020-07-29
Filing date: 2020-07-29
Publication date: 2020-10-30

Abstract

本发明公开了一种基于深度学习的大宗资源类矿产品放行风险预测方法，所述方法包括：根据统计学方法筛选对放行风险具有显著影响的变量；根据历史数据训练预测模型；其中，所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列；获取待测货物报检号，并查询所述待测货物所有相关特征数据；将所述待测货物所有相关特征数据通过所述预测模型，得到放行安全指数值。本发明能够避免人为考量不同因素时产生的片面性，寻找引起风险的潜在因素，相比人工审单具有更全面、更强大的分析评估能力。

Description

基于深度学习的大宗资源类矿产品放行风险预测方法

技术领域

本发明涉及物品检测与识别技术领域，特别是涉及一种基于深度学习的大宗资源类矿产品放行风险预测方法及系统。

背景技术

目前，对海关放行风险进行预测分析，通常依靠业务一线人员的主观评估分析，然而，随着海关业务信息化的飞速发展，海关业务数据库收集存储了海量的通关管理数据。这些业务数据涵盖了海关管理的各个领域，呈现出数据量大、增长迅速、关系复杂等特点，加上国际经济形势巨变，海关所面临的各种风险也大量增加。人工处理机制已然出现明显疲态。

为了满足监管业务量不断增长的需要，若只凭借业务人员的人工审单，需要增加大量的人力投入，成本耗损巨大，并且人为主观评估分析，缺少辅助决策的信息，存在随意性大、难以发觉潜在风险的问题。

发明内容

本发明的目的是：提供一种基于深度学习的大宗资源类矿产品放行风险预测方法、系统和存储介质，能够避免人为考量不同因素时产生的片面性，寻找引起风险的潜在因素，相比人工审单具有更全面、更强大的分析评估能力。

为了实现上述目的，本发明提供了一种基于深度学习的大宗资源类矿产品放行风险预测方法，所述方法包括：

根据统计学方法筛选对放行风险具有显著影响的变量；

根据历史数据训练预测模型；其中，所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列；

获取待测货物报检号，并查询所述待测货物所有相关特征数据；

将所述待测货物所有相关特征数据通过所述预测模型，得到放行安全指数值。

进一步地，所述根据统计学方法筛选对放行风险具有显著影响的变量，具体为：采用相关系数分析、方差分析、Kruskal-Wallis检验和logistic回归方法来筛选对放行风险具有显著影响的变量。

进一步地，，所述根据历史数据训练预测模型，具体为：根据各个企业历史筛选所述变量和所述检验检疫结果的时间序列确定训练输入向量以及与训练输入向量对应的标签值；将所述训练输入向量输入预设的LSTM模型结构，得到训练值；按预设规则确定训练值与标签值的误差最小值。

进一步地，所述预测模型包括：长短期记忆网络LSTM模型；具体算法公式如下：

f_t＝σ(W_fxXt+W_fhh_t-1+b_f)

i_t＝σ(W_ixXt+W_ihh_t-1+b_i)

g_t＝Φ(W_gxXt+W_ghh_t-1+b_g)

o_t＝σ(W_oxXt+W_ohh_t-1+b_o)

s_t＝g_t⊙i_t+s_t-₁⊙f_t

h_t＝Φ(s_t⊙o_t)

其中，f_t表示遗忘门；i_t表示输入门；o_t表示输出门；g_t表示记忆单元；s_t为传给下一个LSTM block的输出结果；h_t为传给下一层神经元的输出结果；σ表示激活函数sigmoid；Φ表示激活函数tanh；W_x(包括W_fx、W_ix、W_gx、W_ox)为输入层的参数；W_h(包括W_fh、W_ih、W_gh、W_oh)为隐含层输入的参数；x_t为输入层输入值；h_t-1为上一时刻隐含层输入值；b(包括b_f、b_i、b_g、b_o)为常数。

进一步地，所述历史数据用于确定训练输入向量以及与训练输入向量对应的标签值；其中，训练输入向量包括训练周期参数和特征参数，设置批尺寸batch_size为32，设置所述长短期记忆网络LSTM的层数设为2层，设置隐含层latent_size为64，设置训练周期参数epoch为30。

本发明实施例还提供一种基于深度学习的大宗资源类矿产品放行风险预测系统，所述系统包括：筛选变量单元、预测模型训练单元、特征数据获取单元和数据处理单元；

其中，所述筛选变量单元，用于根据统计学方法筛选对放行风险具有显著影响的变量；

所述预测模型训练单元，用于根据历史数据训练预测模型；其中，所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列；

所述特征数据获取单元，用于获取待测货物报检号，并查询所述待测货物所有相关特征数据；

所述数据处理单元，用于将所述待测货物所有相关特征数据通过所述预测模型，得到放行安全指数值。

进一步地，所述根据统计学方法筛选对放行风险具有显著影响的变量，具体为：采用相关系数分析、方差分析、Kruskal－Wallis检验和logistic回归方法来筛选对放行风险具有显著影响的变量。

f_t＝σ(W_fxXt+W_fhh_t-1+b_f)

i_t＝σ(W_ixXt+W_ihh_t-1+b_i)

g_t＝Φ(W_gxXt+W_ghh_t-1+b_g)

o_t＝σ(W_oxXt+W_ohh_t-1+b_o)

s_t＝g_t⊙i_t+s_t-1⊙f_t

h_t＝Φ(s_t⊙o_t)

本发明实施例还提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的基于深度学习的大宗资源类矿产品放行风险预测方法。

相对于现有技术，本发明实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法，至少具备如下有益效果：

附图说明

图1为本发明第一实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法的流程示意图；

图2为本发明第一实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法中筛选变量流程示意图；

图3为本发明第一实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法中LSTM模型结构示意图；

图4为本发明第一实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法中根据历史数据训练预测模型流程示意图；

图5为本发明第一实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法中LSTM模型参数示意图；

图6为本发明第一实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法中Adam梯度下降法的优化算法示意图；

图7为本发明第一实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法中数据滑动窗口方法示意图；

图8为本发明第二实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测系统结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，文中所使用的步骤编号仅是为了方便描述，不对作为对步骤执行先后顺序的限定。

应当理解，在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

本发明第一实施例：

请参阅图1－图7，本发明实施例的一种基于深度学习的大宗资源类矿产品放行风险预测方法，至少包括如下步骤：

S101、根据统计学方法筛选对放行风险具有显著影响的变量；

S102、根据历史数据训练预测模型；其中，所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列；

S103、获取待测货物报检号，并查询所述待测货物所有相关特征数据；

S104、将所述待测货物所有相关特征数据通过所述预测模型，得到放行安全指数值。

需要说明的是，本发明采用深度学习领域的LSTM神经网络模型来构建预测模型，对海量数据进行挖掘分析。LSTM模型处理具有时序性的数据具有良好效果，实现对海关历史通关数据纵向溯源。另外LSTM模型以神经网络为基础，对数据的内联关系挖掘具有良好效应，实现对海关通关流程数据进行横向关系梳理。因此通过LSTM模型，能够理清海量海关数据的复杂关系，更加全面地进行考量与管理。

在本发明的某一个实施例中，所述根据统计学方法筛选对放行风险具有显著影响的变量，具体为：采用相关系数分析、方差分析、Kruskal-Wallis检验和logistic回归方法来筛选对放行风险具有显著影响的变量。

在本发明的某一个实施例中，，所述根据历史数据训练预测模型，具体为：

S21、根据各个企业历史筛选所述变量和所述检验检疫结果的时间序列确定训练输入向量以及与训练输入向量对应的标签值；

S22、将所述训练输入向量输入预设的LSTM模型结构，得到训练值；

S23、按预设规则确定训练值与标签值的误差最小值。

在本发明的某一个实施例中，所述预测模型包括：长短期记忆网络LSTM模型；具体算法公式如下：

f_t＝σ(W_fxXt+W_fhh_t-1+b_f)

i_t＝σ(W_ixXt+W_ihh_t-1+b_i)

g_t＝Φ(W_gxXt+W_ghh_t-1+b_g)

o_t＝σ(W_oxXt+W_ohh_t-1+b_o)

s_t＝g_t⊙i_t+s_t-1⊙f_t

h_t＝Φ(s_t⊙o_t)

其中，f_t表示遗忘门；i_t表示输入门；o_t表示输出门；g_t表示记忆单元；s_t为传给下一个LSTM block的输出结果；h_t为传给下一层神经元的输出结果；σ表示激活函数sigmoid；Φ表示激活函数tanh；W_x(包括W_fx、W_ix、W_gx、Wo_x)为输入层的参数；W_h(包括W_fh、W_ih、W_gh、W_oh)为隐含层输入的参数；x_t为输入层输入值；h_t-1为上一时刻隐含层输入值；b(包括b_f、b_i、b_g、b_o)为常数。

需要说明的是，所述长短期记忆网络LSTM是循环神经网络RNN的一种。循环神经网络RNN对序列前面的信息记忆并应用于当前输出的计算中，即序列的输出与前一状态的输出相关。而长短期记忆网络LSTM有能力向单元状态中移除或添加信息，通过门结构来管理，包括遗忘门，输入门，输出门，其结构如图3所示。其中，X为输入，t为当前时刻，h为隐含层状态，当前信息g通过融合当前输入X和上一时刻隐藏层ht－1信息来计算。

需要说明的是，对于步骤S102、具体步骤如下所示：

根据各个企业历史筛选变量和检验检疫结果的时间序列确定训练输入向量以及与训练输入向量对应的标签值。

其中，训练输入向量包括训练周期参数和特征参数，设置批尺寸batch_size为32，长短期记忆网络LSTM的层数设为2层，隐含层latent_size为64，训练周期参数epoch为30。

在训练预测模型时，训练输入向量可以为三维向量的形式。如输入一个三维向量(batch_size，t，feature_num)，其中，参数t表示训练的时间，参数feature_num表示特征个数(筛选变量个数)，包含了报检日期、收货人名称、启运口岸代码、申报货物名称、经停口岸、入境口岸、货物总值、重量、原产国、开检日期、检毕日期、施检机构代码、验结果评定、检疫结果评定、集装箱检疫结果、货物评定、索赔截止日期、是否二次检验、特殊检验检疫要求、现场情况描述、检验时间间隔等特征。对应的标签值为当次的检验检疫结果代码(batch_size，1)。

将训练输入向量输入预设的LSTM模型结构，得到训练值。

按预设规则确定训练值与标签值的误差最小值。确定训练值与标签值的误差最小值，需要先确定训练值与标签值的误差的负梯度方向，以根据负梯度方向确定误差最小值。可以应用Adam梯度下降法计算训练值与标签值的负梯度方向，也可以应用SGD随机梯度下降法计算训练值与标签值的负梯度方向。然后依据误差最小值调整所述LSTM模型结构的模型参数，得到预测模型。

另外，在执行根据各个企业历史筛选变量和检验检疫结果的时间序列确定训练输入向量以及与训练输入向量对应的标签值时，应用滑动窗口方法处理输入数据。长短期记忆网络LSTM对于相对较短的序列(100－300项以内)具有非常好的记忆效果，但是当想要训练更长的时间序列时，就无法引入同一个预测模型中。因此当历史时间序列的长度大于预设的阈值时，可以使用滑动窗口对数据进行处理。

所述滑动窗口方法具体如下所示：

数据形如“企业”－“报验时间”－“报验企业货物特征”，并按企业分类，按报验时间排序。对每个企业范围的数据进行固定次数t＝3的滑窗，每个窗口序列伴随一个标签特征(取值0/1，表示是否检验检疫合格)，该标签特征表示根据前2次报验情况与本次报验情况推断本次报验检验检疫及格的概率。

在本发明的某一个实施例中，所述历史数据用于确定训练输入向量以及与训练输入向量对应的标签值；其中，训练输入向量包括训练周期参数和特征参数，设置批尺寸batch_size为32，设置所述长短期记忆网络LSTM的层数设为2层，设置隐含层latent_size为64，设置训练周期参数epoch为30。

本发明实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法，所述方法包括：根据统计学方法筛选对放行风险具有显著影响的变量；根据历史数据训练预测模型；其中，所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列；获取待测货物报检号，并查询所述待测货物所有相关特征数据；将所述待测货物所有相关特征数据通过所述预测模型，得到放行安全指数值。本发明能够避免人为考量不同因素时产生的片面性，寻找引起风险的潜在因素，相比人工审单具有更全面、更强大的分析评估能力。

本发明第二实施例：

请参阅图8，本发明实施例还提供一种基于深度学习的大宗资源类矿产品放行风险预测系统200，包括：筛选变量单元201、预测模型训练单元202、特征数据获取单元203和数据处理单元204；

其中，所述筛选变量单元201，用于根据统计学方法筛选对放行风险具有显著影响的变量；

所述预测模型训练单元202，用于根据历史数据训练预测模型；其中，所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列；

所述特征数据获取单元203，用于获取待测货物报检号，并查询所述待测货物所有相关特征数据；

所述数据处理单元204，用于将所述待测货物所有相关特征数据通过所述预测模型，得到放行安全指数值。

在本发明的某一个实施例中，，所述根据历史数据训练预测模型，具体为：根据各个企业历史筛选所述变量和所述检验检疫结果的时间序列确定训练输入向量以及与训练输入向量对应的标签值；将所述训练输入向量输入预设的LSTM模型结构，得到训练值；按预设规则确定训练值与标签值的误差最小值。

在本发明的某一个实施中，所述预测模型包括：长短期记忆网络LSTM模型；具体算法公式如下：

f_t＝σ(W_fxXt+W_fhh_t-1+b_f)

i_t＝σ(W_ixXt+W_ihh_t-1+b_i)

g_t＝Φ(W_gxXt+W_ghh_t-1+b_g)

o_t＝σ(W_oxXt+W_ohh_t-1+b_o)

s_t＝g_t⊙i_t+s_t-1⊙f_t

h_t＝Φ(s_t⊙o_t)

本发明实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测系统200，包括：筛选变量单元201、预测模型训练单元202、特征数据获取单元203和数据处理单元204；其中，所述筛选变量单元201，用于根据统计学方法筛选对放行风险具有显著影响的变量；所述预测模型训练单元202，用于根据历史数据训练预测模型；其中，所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列；所述特征数据获取单元203，用于获取待测货物报检号，并查询所述待测货物所有相关特征数据；所述数据处理单元204，用于将所述待测货物所有相关特征数据通过所述预测模型，得到放行安全指数值。本系统能够避免人为考量不同因素时产生的片面性，寻找引起风险的潜在因素，相比人工审单具有更全面、更强大的分析评估能力。

本发明第三实施例：

本发明实施例还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的一种基于深度学习的大宗资源类矿产品放行风险预测方法。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和替换，这些改进和替换也应视为本发明的保护范围。

Claims

1.一种基于深度学习的大宗资源类矿产品放行风险预测方法，其特征在于，包括：

根据统计学方法筛选对放行风险具有显著影响的变量；

2.根据权利要求1所述的基于深度学习的大宗资源类矿产品放行风险预测方法，其特征在于，所述根据统计学方法筛选对放行风险具有显著影响的变量，具体为：采用相关系数分析、方差分析、Kruskal－Wallis检验和logistic回归方法来筛选对放行风险具有显著影响的变量。

3.根据权利要求1所述的基于深度学习的大宗资源类矿产品放行风险预测方法，其特征在于，所述根据历史数据训练预测模型，具体为：根据各个企业历史筛选所述变量和所述检验检疫结果的时间序列确定训练输入向量以及与训练输入向量对应的标签值；将所述训练输入向量输入预设的LSTM模型结构，得到训练值；按预设规则确定训练值与标签值的误差最小值。

4.根据权利要求1所述的基于深度学习的大宗资源类矿产品放行风险预测方法，其特征在于，所述预测模型包括：长短期记忆网络LSTM模型；具体算法公式如下：

f_t＝σ(W_fxXt+W_fhh_t-1+b_f)

i_t＝σ(W_ixXt+W_ihh_t-1+b_i)

g_t＝Φ(W_gxXt+W_ghh_t-1+b_g)

o_t＝σ(W_oxXt+W_ohh_t-1+b_o)

s_t＝g_t⊙i_t+s_t-1⊙f_t

h_t＝Φ(s_t⊙o_t)

5.根据权利要求1所述的基于深度学习的大宗资源类矿产品放行风险预测方法，其特征在于，所述历史数据用于确定训练输入向量以及与训练输入向量对应的标签值；其中，训练输入向量包括训练周期参数和特征参数，设置批尺寸batch_size为32，设置所述长短期记忆网络LSTM的层数设为2层，设置隐含层latent_size为64，设置训练周期参数epoch为30。

6.一种基于深度学习的大宗资源类矿产品放行风险预测系统，其特征在于，包括：筛选变量单元、预测模型训练单元、特征数据获取单元和数据处理单元；

7.根据权利要求6所述的基于深度学习的大宗资源类矿产品放行风险预测系统，其特征在于，所述根据统计学方法筛选对放行风险具有显著影响的变量，具体为：采用相关系数分析、方差分析、Kruskal－Wallis检验和logistic回归方法来筛选对放行风险具有显著影响的变量。

8.根据权利要求6所述的基于深度学习的大宗资源类矿产品放行风险预测系统，其特征在于，所述根据历史数据训练预测模型，具体为：根据各个企业历史筛选所述变量和所述检验检疫结果的时间序列确定训练输入向量以及与训练输入向量对应的标签值；将所述训练输入向量输入预设的LSTM模型结构，得到训练值；按预设规则确定训练值与标签值的误差最小值。

9.根据权利要求6所述的基于深度学习的大宗资源类矿产品放行风险预测系统，其特征在于，所述预测模型包括：长短期记忆网络LSTM模型；具体算法公式如下：

f_t＝σ(W_fxXt+W_fhh_t-1+b_f)

i_t＝σ(W_ixXt+W_ihh_t-1+b_i)

g_t＝Φ(W_gxXt+W_ghh_t-1+b_g)

o_t＝σ(W_oxXt+W_ohh_t-1+b_o)

s_t＝g_t⊙i_t+s_t-1⊙f_t

h_t＝Φ(s_t⊙o_t)

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的基于深度学习的大宗资源类矿产品放行风险预测方法。