CN111861032A - 基于深度学习的大宗资源类矿产品放行风险预测方法 - Google Patents
基于深度学习的大宗资源类矿产品放行风险预测方法 Download PDFInfo
- Publication number
- CN111861032A CN111861032A CN202010748118.8A CN202010748118A CN111861032A CN 111861032 A CN111861032 A CN 111861032A CN 202010748118 A CN202010748118 A CN 202010748118A CN 111861032 A CN111861032 A CN 111861032A
- Authority
- CN
- China
- Prior art keywords
- training
- deep learning
- variables
- value
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000013135 deep learning Methods 0.000 title claims abstract description 34
- 229910052500 inorganic mineral Inorganic materials 0.000 title claims abstract description 33
- 239000011707 mineral Substances 0.000 title claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 92
- 238000007689 inspection Methods 0.000 claims abstract description 32
- 238000012216 screening Methods 0.000 claims abstract description 31
- 238000007619 statistical method Methods 0.000 claims abstract description 16
- 238000004458 analytical method Methods 0.000 claims abstract description 14
- 239000013598 vector Substances 0.000 claims description 42
- 230000006403 short-term memory Effects 0.000 claims description 14
- 230000007787 long-term memory Effects 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 210000004027 cell Anatomy 0.000 claims description 7
- 230000015654 memory Effects 0.000 claims description 7
- 238000012313 Kruskal-Wallis test Methods 0.000 claims description 6
- 238000000540 analysis of variance Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- RXKJFZQQPQGTFL-UHFFFAOYSA-N dihydroxyacetone Chemical compound OCC(=O)CO RXKJFZQQPQGTFL-UHFFFAOYSA-N 0.000 claims description 6
- 238000007477 logistic regression Methods 0.000 claims description 6
- 210000002569 neuron Anatomy 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 abstract description 9
- 230000000875 corresponding effect Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000011478 gradient descent method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000009960 carding Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003446 memory effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/80—Management or planning
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于深度学习的大宗资源类矿产品放行风险预测方法,所述方法包括:根据统计学方法筛选对放行风险具有显著影响的变量;根据历史数据训练预测模型;其中,所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列;获取待测货物报检号,并查询所述待测货物所有相关特征数据;将所述待测货物所有相关特征数据通过所述预测模型,得到放行安全指数值。本发明能够避免人为考量不同因素时产生的片面性,寻找引起风险的潜在因素,相比人工审单具有更全面、更强大的分析评估能力。
Description
技术领域
本发明涉及物品检测与识别技术领域,特别是涉及一种基于深度学习的大宗资源类矿产品放行风险预测方法及系统。
背景技术
目前,对海关放行风险进行预测分析,通常依靠业务一线人员的主观评估分析,然而,随着海关业务信息化的飞速发展,海关业务数据库收集存储了海量的通关管理数据。这些业务数据涵盖了海关管理的各个领域,呈现出数据量大、增长迅速、关系复杂等特点,加上国际经济形势巨变,海关所面临的各种风险也大量增加。人工处理机制已然出现明显疲态。
为了满足监管业务量不断增长的需要,若只凭借业务人员的人工审单,需要增加大量的人力投入,成本耗损巨大,并且人为主观评估分析,缺少辅助决策的信息,存在随意性大、难以发觉潜在风险的问题。
发明内容
本发明的目的是:提供一种基于深度学习的大宗资源类矿产品放行风险预测方法、系统和存储介质,能够避免人为考量不同因素时产生的片面性,寻找引起风险的潜在因素,相比人工审单具有更全面、更强大的分析评估能力。
为了实现上述目的,本发明提供了一种基于深度学习的大宗资源类矿产品放行风险预测方法,所述方法包括:
根据统计学方法筛选对放行风险具有显著影响的变量;
根据历史数据训练预测模型;其中,所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列;
获取待测货物报检号,并查询所述待测货物所有相关特征数据;
将所述待测货物所有相关特征数据通过所述预测模型,得到放行安全指数值。
进一步地,所述根据统计学方法筛选对放行风险具有显著影响的变量,具体为:采用相关系数分析、方差分析、Kruskal-Wallis检验和logistic回归方法来筛选对放行风险具有显著影响的变量。
进一步地,,所述根据历史数据训练预测模型,具体为:根据各个企业历史筛选所述变量和所述检验检疫结果的时间序列确定训练输入向量以及与训练输入向量对应的标签值;将所述训练输入向量输入预设的LSTM模型结构,得到训练值;按预设规则确定训练值与标签值的误差最小值。
进一步地,所述预测模型包括:长短期记忆网络LSTM模型;具体算法公式如下:
ft=σ(WfxXt+Wfhht-1+bf)
it=σ(WixXt+Wihht-1+bi)
gt=Φ(WgxXt+Wghht-1+bg)
ot=σ(WoxXt+Wohht-1+bo)
st=gt⊙it+st-1⊙ft
ht=Φ(st⊙ot)
其中,ft表示遗忘门;it表示输入门;ot表示输出门;gt表示记忆单元;st为传给下一个LSTM block的输出结果;ht为传给下一层神经元的输出结果;σ表示激活函数sigmoid;Φ表示激活函数tanh;Wx(包括Wfx、Wix、Wgx、Wox)为输入层的参数;Wh(包括Wfh、Wih、Wgh、Woh)为隐含层输入的参数;xt为输入层输入值;ht-1为上一时刻隐含层输入值;b(包括bf、bi、bg、bo)为常数。
进一步地,所述历史数据用于确定训练输入向量以及与训练输入向量对应的标签值;其中,训练输入向量包括训练周期参数和特征参数,设置批尺寸batch_size为32,设置所述长短期记忆网络LSTM的层数设为2层,设置隐含层latent_size为64,设置训练周期参数epoch为30。
本发明实施例还提供一种基于深度学习的大宗资源类矿产品放行风险预测系统,所述系统包括:筛选变量单元、预测模型训练单元、特征数据获取单元和数据处理单元;
其中,所述筛选变量单元,用于根据统计学方法筛选对放行风险具有显著影响的变量;
所述预测模型训练单元,用于根据历史数据训练预测模型;其中,所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列;
所述特征数据获取单元,用于获取待测货物报检号,并查询所述待测货物所有相关特征数据;
所述数据处理单元,用于将所述待测货物所有相关特征数据通过所述预测模型,得到放行安全指数值。
进一步地,所述根据统计学方法筛选对放行风险具有显著影响的变量,具体为:采用相关系数分析、方差分析、Kruskal-Wallis检验和logistic回归方法来筛选对放行风险具有显著影响的变量。
进一步地,,所述根据历史数据训练预测模型,具体为:根据各个企业历史筛选所述变量和所述检验检疫结果的时间序列确定训练输入向量以及与训练输入向量对应的标签值;将所述训练输入向量输入预设的LSTM模型结构,得到训练值;按预设规则确定训练值与标签值的误差最小值。
进一步地,所述预测模型包括:长短期记忆网络LSTM模型;具体算法公式如下:
ft=σ(WfxXt+Wfhht-1+bf)
it=σ(WixXt+Wihht-1+bi)
gt=Φ(WgxXt+Wghht-1+bg)
ot=σ(WoxXt+Wohht-1+bo)
st=gt⊙it+st-1⊙ft
ht=Φ(st⊙ot)
其中,ft表示遗忘门;it表示输入门;ot表示输出门;gt表示记忆单元;st为传给下一个LSTM block的输出结果;ht为传给下一层神经元的输出结果;σ表示激活函数sigmoid;Φ表示激活函数tanh;Wx(包括Wfx、Wix、Wgx、Wox)为输入层的参数;Wh(包括Wfh、Wih、Wgh、Woh)为隐含层输入的参数;xt为输入层输入值;ht-1为上一时刻隐含层输入值;b(包括bf、bi、bg、bo)为常数。
进一步地,所述历史数据用于确定训练输入向量以及与训练输入向量对应的标签值;其中,训练输入向量包括训练周期参数和特征参数,设置批尺寸batch_size为32,设置所述长短期记忆网络LSTM的层数设为2层,设置隐含层latent_size为64,设置训练周期参数epoch为30。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的基于深度学习的大宗资源类矿产品放行风险预测方法。
相对于现有技术,本发明实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法,至少具备如下有益效果:
本发明公开了一种基于深度学习的大宗资源类矿产品放行风险预测方法,所述方法包括:根据统计学方法筛选对放行风险具有显著影响的变量;根据历史数据训练预测模型;其中,所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列;获取待测货物报检号,并查询所述待测货物所有相关特征数据;将所述待测货物所有相关特征数据通过所述预测模型,得到放行安全指数值。本发明能够避免人为考量不同因素时产生的片面性,寻找引起风险的潜在因素,相比人工审单具有更全面、更强大的分析评估能力。
附图说明
图1为本发明第一实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法的流程示意图;
图2为本发明第一实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法中筛选变量流程示意图;
图3为本发明第一实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法中LSTM模型结构示意图;
图4为本发明第一实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法中根据历史数据训练预测模型流程示意图;
图5为本发明第一实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法中LSTM模型参数示意图;
图6为本发明第一实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法中Adam梯度下降法的优化算法示意图;
图7为本发明第一实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法中数据滑动窗口方法示意图;
图8为本发明第二实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执行先后顺序的限定。
应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本发明第一实施例:
请参阅图1-图7,本发明实施例的一种基于深度学习的大宗资源类矿产品放行风险预测方法,至少包括如下步骤:
S101、根据统计学方法筛选对放行风险具有显著影响的变量;
S102、根据历史数据训练预测模型;其中,所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列;
S103、获取待测货物报检号,并查询所述待测货物所有相关特征数据;
S104、将所述待测货物所有相关特征数据通过所述预测模型,得到放行安全指数值。
需要说明的是,本发明采用深度学习领域的LSTM神经网络模型来构建预测模型,对海量数据进行挖掘分析。LSTM模型处理具有时序性的数据具有良好效果,实现对海关历史通关数据纵向溯源。另外LSTM模型以神经网络为基础,对数据的内联关系挖掘具有良好效应,实现对海关通关流程数据进行横向关系梳理。因此通过LSTM模型,能够理清海量海关数据的复杂关系,更加全面地进行考量与管理。
在本发明的某一个实施例中,所述根据统计学方法筛选对放行风险具有显著影响的变量,具体为:采用相关系数分析、方差分析、Kruskal-Wallis检验和logistic回归方法来筛选对放行风险具有显著影响的变量。
在本发明的某一个实施例中,,所述根据历史数据训练预测模型,具体为:
S21、根据各个企业历史筛选所述变量和所述检验检疫结果的时间序列确定训练输入向量以及与训练输入向量对应的标签值;
S22、将所述训练输入向量输入预设的LSTM模型结构,得到训练值;
S23、按预设规则确定训练值与标签值的误差最小值。
在本发明的某一个实施例中,所述预测模型包括:长短期记忆网络LSTM模型;具体算法公式如下:
ft=σ(WfxXt+Wfhht-1+bf)
it=σ(WixXt+Wihht-1+bi)
gt=Φ(WgxXt+Wghht-1+bg)
ot=σ(WoxXt+Wohht-1+bo)
st=gt⊙it+st-1⊙ft
ht=Φ(st⊙ot)
其中,ft表示遗忘门;it表示输入门;ot表示输出门;gt表示记忆单元;st为传给下一个LSTM block的输出结果;ht为传给下一层神经元的输出结果;σ表示激活函数sigmoid;Φ表示激活函数tanh;Wx(包括Wfx、Wix、Wgx、Wox)为输入层的参数;Wh(包括Wfh、Wih、Wgh、Woh)为隐含层输入的参数;xt为输入层输入值;ht-1为上一时刻隐含层输入值;b(包括bf、bi、bg、bo)为常数。
需要说明的是,所述长短期记忆网络LSTM是循环神经网络RNN的一种。循环神经网络RNN对序列前面的信息记忆并应用于当前输出的计算中,即序列的输出与前一状态的输出相关。而长短期记忆网络LSTM有能力向单元状态中移除或添加信息,通过门结构来管理,包括遗忘门,输入门,输出门,其结构如图3所示。其中,X为输入,t为当前时刻,h为隐含层状态,当前信息g通过融合当前输入X和上一时刻隐藏层ht-1信息来计算。
需要说明的是,对于步骤S102、具体步骤如下所示:
根据各个企业历史筛选变量和检验检疫结果的时间序列确定训练输入向量以及与训练输入向量对应的标签值。
其中,训练输入向量包括训练周期参数和特征参数,设置批尺寸batch_size为32,长短期记忆网络LSTM的层数设为2层,隐含层latent_size为64,训练周期参数epoch为30。
在训练预测模型时,训练输入向量可以为三维向量的形式。如输入一个三维向量(batch_size,t,feature_num),其中,参数t表示训练的时间,参数feature_num表示特征个数(筛选变量个数),包含了报检日期、收货人名称、启运口岸代码、申报货物名称、经停口岸、入境口岸、货物总值、重量、原产国、开检日期、检毕日期、施检机构代码、验结果评定、检疫结果评定、集装箱检疫结果、货物评定、索赔截止日期、是否二次检验、特殊检验检疫要求、现场情况描述、检验时间间隔等特征。对应的标签值为当次的检验检疫结果代码(batch_size,1)。
将训练输入向量输入预设的LSTM模型结构,得到训练值。
按预设规则确定训练值与标签值的误差最小值。确定训练值与标签值的误差最小值,需要先确定训练值与标签值的误差的负梯度方向,以根据负梯度方向确定误差最小值。可以应用Adam梯度下降法计算训练值与标签值的负梯度方向,也可以应用SGD随机梯度下降法计算训练值与标签值的负梯度方向。然后依据误差最小值调整所述LSTM模型结构的模型参数,得到预测模型。
另外,在执行根据各个企业历史筛选变量和检验检疫结果的时间序列确定训练输入向量以及与训练输入向量对应的标签值时,应用滑动窗口方法处理输入数据。长短期记忆网络LSTM对于相对较短的序列(100-300项以内)具有非常好的记忆效果,但是当想要训练更长的时间序列时,就无法引入同一个预测模型中。因此当历史时间序列的长度大于预设的阈值时,可以使用滑动窗口对数据进行处理。
所述滑动窗口方法具体如下所示:
数据形如“企业”-“报验时间”-“报验企业货物特征”,并按企业分类,按报验时间排序。对每个企业范围的数据进行固定次数t=3的滑窗,每个窗口序列伴随一个标签特征(取值0/1,表示是否检验检疫合格),该标签特征表示根据前2次报验情况与本次报验情况推断本次报验检验检疫及格的概率。
在本发明的某一个实施例中,所述历史数据用于确定训练输入向量以及与训练输入向量对应的标签值;其中,训练输入向量包括训练周期参数和特征参数,设置批尺寸batch_size为32,设置所述长短期记忆网络LSTM的层数设为2层,设置隐含层latent_size为64,设置训练周期参数epoch为30。
本发明实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测方法,所述方法包括:根据统计学方法筛选对放行风险具有显著影响的变量;根据历史数据训练预测模型;其中,所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列;获取待测货物报检号,并查询所述待测货物所有相关特征数据;将所述待测货物所有相关特征数据通过所述预测模型,得到放行安全指数值。本发明能够避免人为考量不同因素时产生的片面性,寻找引起风险的潜在因素,相比人工审单具有更全面、更强大的分析评估能力。
本发明第二实施例:
请参阅图8,本发明实施例还提供一种基于深度学习的大宗资源类矿产品放行风险预测系统200,包括:筛选变量单元201、预测模型训练单元202、特征数据获取单元203和数据处理单元204;
其中,所述筛选变量单元201,用于根据统计学方法筛选对放行风险具有显著影响的变量;
所述预测模型训练单元202,用于根据历史数据训练预测模型;其中,所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列;
所述特征数据获取单元203,用于获取待测货物报检号,并查询所述待测货物所有相关特征数据;
所述数据处理单元204,用于将所述待测货物所有相关特征数据通过所述预测模型,得到放行安全指数值。
在本发明的某一个实施例中,所述根据统计学方法筛选对放行风险具有显著影响的变量,具体为:采用相关系数分析、方差分析、Kruskal-Wallis检验和logistic回归方法来筛选对放行风险具有显著影响的变量。
在本发明的某一个实施例中,,所述根据历史数据训练预测模型,具体为:根据各个企业历史筛选所述变量和所述检验检疫结果的时间序列确定训练输入向量以及与训练输入向量对应的标签值;将所述训练输入向量输入预设的LSTM模型结构,得到训练值;按预设规则确定训练值与标签值的误差最小值。
在本发明的某一个实施中,所述预测模型包括:长短期记忆网络LSTM模型;具体算法公式如下:
ft=σ(WfxXt+Wfhht-1+bf)
it=σ(WixXt+Wihht-1+bi)
gt=Φ(WgxXt+Wghht-1+bg)
ot=σ(WoxXt+Wohht-1+bo)
st=gt⊙it+st-1⊙ft
ht=Φ(st⊙ot)
其中,ft表示遗忘门;it表示输入门;ot表示输出门;gt表示记忆单元;st为传给下一个LSTM block的输出结果;ht为传给下一层神经元的输出结果;σ表示激活函数sigmoid;Φ表示激活函数tanh;Wx(包括Wfx、Wix、Wgx、Wox)为输入层的参数;Wh(包括Wfh、Wih、Wgh、Woh)为隐含层输入的参数;xt为输入层输入值;ht-1为上一时刻隐含层输入值;b(包括bf、bi、bg、bo)为常数。
在本发明的某一个实施例中,所述历史数据用于确定训练输入向量以及与训练输入向量对应的标签值;其中,训练输入向量包括训练周期参数和特征参数,设置批尺寸batch_size为32,设置所述长短期记忆网络LSTM的层数设为2层,设置隐含层latent_size为64,设置训练周期参数epoch为30。
本发明实施例提供的一种基于深度学习的大宗资源类矿产品放行风险预测系统200,包括:筛选变量单元201、预测模型训练单元202、特征数据获取单元203和数据处理单元204;其中,所述筛选变量单元201,用于根据统计学方法筛选对放行风险具有显著影响的变量;所述预测模型训练单元202,用于根据历史数据训练预测模型;其中,所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列;所述特征数据获取单元203,用于获取待测货物报检号,并查询所述待测货物所有相关特征数据;所述数据处理单元204,用于将所述待测货物所有相关特征数据通过所述预测模型,得到放行安全指数值。本系统能够避免人为考量不同因素时产生的片面性,寻找引起风险的潜在因素,相比人工审单具有更全面、更强大的分析评估能力。
本发明第三实施例:
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的一种基于深度学习的大宗资源类矿产品放行风险预测方法。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。
Claims (10)
1.一种基于深度学习的大宗资源类矿产品放行风险预测方法,其特征在于,包括:
根据统计学方法筛选对放行风险具有显著影响的变量;
根据历史数据训练预测模型;其中,所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列;
获取待测货物报检号,并查询所述待测货物所有相关特征数据;
将所述待测货物所有相关特征数据通过所述预测模型,得到放行安全指数值。
2.根据权利要求1所述的基于深度学习的大宗资源类矿产品放行风险预测方法,其特征在于,所述根据统计学方法筛选对放行风险具有显著影响的变量,具体为:采用相关系数分析、方差分析、Kruskal-Wallis检验和logistic回归方法来筛选对放行风险具有显著影响的变量。
3.根据权利要求1所述的基于深度学习的大宗资源类矿产品放行风险预测方法,其特征在于,所述根据历史数据训练预测模型,具体为:根据各个企业历史筛选所述变量和所述检验检疫结果的时间序列确定训练输入向量以及与训练输入向量对应的标签值;将所述训练输入向量输入预设的LSTM模型结构,得到训练值;按预设规则确定训练值与标签值的误差最小值。
4.根据权利要求1所述的基于深度学习的大宗资源类矿产品放行风险预测方法,其特征在于,所述预测模型包括:长短期记忆网络LSTM模型;具体算法公式如下:
ft=σ(WfxXt+Wfhht-1+bf)
it=σ(WixXt+Wihht-1+bi)
gt=Φ(WgxXt+Wghht-1+bg)
ot=σ(WoxXt+Wohht-1+bo)
st=gt⊙it+st-1⊙ft
ht=Φ(st⊙ot)
其中,ft表示遗忘门;it表示输入门;ot表示输出门;gt表示记忆单元;st为传给下一个LSTM block的输出结果;ht为传给下一层神经元的输出结果;σ表示激活函数sigmoid;Φ表示激活函数tanh;Wx(包括Wfx、Wix、Wgx、Wox)为输入层的参数;Wh(包括Wfh、Wih、Wgh、Woh)为隐含层输入的参数;xt为输入层输入值;ht-1为上一时刻隐含层输入值;b(包括bf、bi、bg、bo)为常数。
5.根据权利要求1所述的基于深度学习的大宗资源类矿产品放行风险预测方法,其特征在于,所述历史数据用于确定训练输入向量以及与训练输入向量对应的标签值;其中,训练输入向量包括训练周期参数和特征参数,设置批尺寸batch_size为32,设置所述长短期记忆网络LSTM的层数设为2层,设置隐含层latent_size为64,设置训练周期参数epoch为30。
6.一种基于深度学习的大宗资源类矿产品放行风险预测系统,其特征在于,包括:筛选变量单元、预测模型训练单元、特征数据获取单元和数据处理单元;
其中,所述筛选变量单元,用于根据统计学方法筛选对放行风险具有显著影响的变量;
所述预测模型训练单元,用于根据历史数据训练预测模型;其中,所述历史数据包括各个企业历史检验检疫结果和所述变量的时间序列;
所述特征数据获取单元,用于获取待测货物报检号,并查询所述待测货物所有相关特征数据;
所述数据处理单元,用于将所述待测货物所有相关特征数据通过所述预测模型,得到放行安全指数值。
7.根据权利要求6所述的基于深度学习的大宗资源类矿产品放行风险预测系统,其特征在于,所述根据统计学方法筛选对放行风险具有显著影响的变量,具体为:采用相关系数分析、方差分析、Kruskal-Wallis检验和logistic回归方法来筛选对放行风险具有显著影响的变量。
8.根据权利要求6所述的基于深度学习的大宗资源类矿产品放行风险预测系统,其特征在于,所述根据历史数据训练预测模型,具体为:根据各个企业历史筛选所述变量和所述检验检疫结果的时间序列确定训练输入向量以及与训练输入向量对应的标签值;将所述训练输入向量输入预设的LSTM模型结构,得到训练值;按预设规则确定训练值与标签值的误差最小值。
9.根据权利要求6所述的基于深度学习的大宗资源类矿产品放行风险预测系统,其特征在于,所述预测模型包括:长短期记忆网络LSTM模型;具体算法公式如下:
ft=σ(WfxXt+Wfhht-1+bf)
it=σ(WixXt+Wihht-1+bi)
gt=Φ(WgxXt+Wghht-1+bg)
ot=σ(WoxXt+Wohht-1+bo)
st=gt⊙it+st-1⊙ft
ht=Φ(st⊙ot)
其中,ft表示遗忘门;it表示输入门;ot表示输出门;gt表示记忆单元;st为传给下一个LSTM block的输出结果;ht为传给下一层神经元的输出结果;σ表示激活函数sigmoid;Φ表示激活函数tanh;Wx(包括Wfx、Wix、Wgx、Wox)为输入层的参数;Wh(包括Wfh、Wih、Wgh、Woh)为隐含层输入的参数;xt为输入层输入值;ht-1为上一时刻隐含层输入值;b(包括bf、bi、bg、bo)为常数。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的基于深度学习的大宗资源类矿产品放行风险预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010748118.8A CN111861032A (zh) | 2020-07-29 | 2020-07-29 | 基于深度学习的大宗资源类矿产品放行风险预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010748118.8A CN111861032A (zh) | 2020-07-29 | 2020-07-29 | 基于深度学习的大宗资源类矿产品放行风险预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111861032A true CN111861032A (zh) | 2020-10-30 |
Family
ID=72946131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010748118.8A Pending CN111861032A (zh) | 2020-07-29 | 2020-07-29 | 基于深度学习的大宗资源类矿产品放行风险预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111861032A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112581181A (zh) * | 2020-12-25 | 2021-03-30 | 同方威视科技江苏有限公司 | 申报价格的异常挖掘方法、装置、电子设备及可读介质 |
CN113762716A (zh) * | 2021-07-30 | 2021-12-07 | 国网山东省电力公司营销服务中心(计量中心) | 基于深度学习和注意力的台区运行状态评估方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109685290A (zh) * | 2019-02-11 | 2019-04-26 | 南方电网科学研究院有限责任公司 | 一种基于深度学习的用电量预测方法、装置及设备 |
CN111179070A (zh) * | 2020-02-18 | 2020-05-19 | 电子科技大学 | 一种基于lstm的借贷风险时效性预测系统及方法 |
-
2020
- 2020-07-29 CN CN202010748118.8A patent/CN111861032A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109685290A (zh) * | 2019-02-11 | 2019-04-26 | 南方电网科学研究院有限责任公司 | 一种基于深度学习的用电量预测方法、装置及设备 |
CN111179070A (zh) * | 2020-02-18 | 2020-05-19 | 电子科技大学 | 一种基于lstm的借贷风险时效性预测系统及方法 |
Non-Patent Citations (1)
Title |
---|
张彦彬等: "基于LSTM神经网络模型对大宗矿产资源放行风险预测研究", 《中国口岸科学技术》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112581181A (zh) * | 2020-12-25 | 2021-03-30 | 同方威视科技江苏有限公司 | 申报价格的异常挖掘方法、装置、电子设备及可读介质 |
CN113762716A (zh) * | 2021-07-30 | 2021-12-07 | 国网山东省电力公司营销服务中心(计量中心) | 基于深度学习和注意力的台区运行状态评估方法及系统 |
CN113762716B (zh) * | 2021-07-30 | 2023-07-25 | 国网山东省电力公司营销服务中心(计量中心) | 基于深度学习和注意力的台区运行状态评估方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3629246A1 (en) | Systems and methods for neural architecture search | |
Orchard et al. | Advances in uncertainty representation and management for particle filtering applied to prognostics | |
Zhang et al. | Comparison of econometric models and artificial neural networks algorithms for the prediction of baltic dry index | |
CN113011796B (zh) | 一种基于“层次分析-神经网络”的食用油安全预警方法 | |
CN115018348B (zh) | 基于人工智能的环境分析方法、系统、设备及存储介质 | |
CN111861032A (zh) | 基于深度学习的大宗资源类矿产品放行风险预测方法 | |
Wawrzyniak et al. | Data-driven models in machine learning for crime prediction | |
CN112257914B (zh) | 一种基于随机森林的航空安全因果预测方法 | |
Vigier et al. | An application of OWA operators in fuzzy business diagnosis | |
Wambura et al. | Fast memory-efficient extreme events prediction in complex time series | |
Erlangga et al. | Electronic Nose Dataset for Classifying Rice Quality using Neural Network | |
Nagy et al. | Mixture estimation with state-space components and Markov model of switching | |
Barros et al. | Predicting weighing deviations in the dispatch workflow process: A case study in a cement industry | |
Talašová et al. | Fuzzy probability spaces and their applications in decision making | |
Abdellatief et al. | Egyptian Case Study-Sales forecasting model for automotive section | |
Kuhi et al. | Using probabilistic models for missing data prediction in network industries performance measurement systems | |
Kotenko et al. | Formation of Indicators for Assessing Technical Reliability of Information Security Systems | |
Raza et al. | Application of extreme learning machine algorithm for drought forecasting | |
Ramadhani et al. | Airline Passenger Forecasting using ARIMA and Artificial Neural Networks Approaches | |
Malhotra et al. | A neuro-fuzzy classifier for website quality prediction | |
Rishi | Early Size Estimation using Machine Learning | |
Pombo et al. | Contribution of temporal sequence activities to predict bug fixing time | |
Ginters et al. | The use of Bayesian acyclic network to assess the impact of digital technology attributes on sustainability pillars | |
Bandyopadhyay et al. | Prediction of air flight cancellation during COVID-19 using deep learning methods | |
Fourie et al. | Implementation of machine learning techniques for prognostics for railway wheel flange wear |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201030 |