CN112465045A - 一种基于孪生神经网络的供应链例外事件检测方法 - Google Patents
一种基于孪生神经网络的供应链例外事件检测方法 Download PDFInfo
- Publication number
- CN112465045A CN112465045A CN202011394686.9A CN202011394686A CN112465045A CN 112465045 A CN112465045 A CN 112465045A CN 202011394686 A CN202011394686 A CN 202011394686A CN 112465045 A CN112465045 A CN 112465045A
- Authority
- CN
- China
- Prior art keywords
- supply chain
- layer
- neural network
- samples
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 47
- 238000001514 detection method Methods 0.000 title claims abstract description 36
- 230000002159 abnormal effect Effects 0.000 claims abstract description 56
- 238000012549 training Methods 0.000 claims abstract description 18
- 230000005856 abnormality Effects 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 41
- 230000001364 causal effect Effects 0.000 claims description 24
- 238000011176 pooling Methods 0.000 claims description 24
- 230000004913 activation Effects 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 21
- 230000001427 coherent effect Effects 0.000 claims description 12
- 238000012795 verification Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 238000003745 diagnosis Methods 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013068 supply chain management Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于孪生神经网络的供应链例外事件检测方法,包括以下步骤:S1:获取供应链事件数据,所述供应链事件数据包括正常样本和异常样本,基于正常样本和异常样本构建数据集;S2:构建用于供应链例外事件检测的小样本学习模型,所述小样本学习模型为基于具有卷积网络的孪生神经网络;S3:利用步骤S1中的数据集中数据对所述孪生神经网络进行训练,得到训练好的孪生神经网络;S4:实时获取待测供应链事件数据,利用训练好的孪生神经网络检测该待测供应链事件数据,判断是否存在异常并判断异常类别,得到检测结果。本发明通过孪生神经网络在样本缺乏情况下实现在不同的工作条件之间、具有很大差异的同类异常事件/信号的准确识别。
Description
技术领域
本发明涉及供应链检测领域,更具体地,涉及一种基于孪生神经网络的供应链例外事件检测方法。
背景技术
随着供应链的全球化发展和工业互联网技术的应用,供应链在各个供应链节点的感知能力得到了极大的提升。从供应链系统的业务流程出发,分析其中的例外事件控制点(即流程中可能产生例外事件的关键控制节点),并设定一组关键性能指标(KeyPerformance Indicator,KPI),KPI包括但不限于每种商品的5天平均库存量、每种商品的5天平均销售量、每种商品未来5天的预测销量、每种商品的每天库存操作次数等,并利用供应链节点强大的感知能力,可以得到供应链节点KPI的序列值。通过对KPI序列值的监控,把供应链管理的聚焦到对一组业务流程关键节点的例外控制上,当系统的运行与预期不符时,可以迅速作出反应,协同处理例外事件,以保证整个供应链系统的正常运作,也正是例外事件管理的意义所在。通过所监测的事件或者信号发现系统异常,已广泛应用于制造,航空航天,汽车,供应链等各个领域。近年来,具有深度学习功能的例外检测技术由于避免了对耗时且不可靠的人工分析的依赖以及例外检测效率的提高而备受关注。卷积神经网络、长短时记忆网络(LSTM)、生成对抗网络(GAN)等深度学习方法,从丰富的数据集中学习低级和高级特征,并已在例外检测中得到广泛利用。
公开日为2018年07月27日,公开号为CN108334907A的中国专利公开了一种一种基于深度学习的复杂装备点异常检测方法及系统,其中方法包括:训练样本处理步骤、选取复杂装备的监控性能参数,并获取监控性能参数的正常样本和异常样本,构成训练样本集;特征提取步骤、构建基于SDAE的特征提取模型,输入所述训练样本集进行模型训练;检测模型训练步骤、根据经特征提取模型训练得到的特征构建基于GSM的异常检测模型,得到异常检测模型的特征均值和特征标准差;异常检测步骤、将待测样本输入到基于SDAE的特征提取模型,得到的特征输入到基于GSM的异常检测模型中,进行点异常检测。
但是,大多数上述技术都需要大量的训练数据。而在现实世界中的例外检测中,相同例外的事件/信号通常在不同的工作条件之间会有很大的差异,即在所有工作条件下都无法为每种例外类型获得足够的训练样本。因此,通常不可能获得足够的样本以使分类器对每种例外类型都具有鲁棒性。
发明内容
本发明提供一种基于孪生神经网络的供应链例外事件检测方法,利用采集到的少数一种或多种例外类型的例外样本,实现有限数据的供应链事件例外检测。
为解决上述技术问题,本发明的技术方案如下:
一种基于孪生神经网络的供应链例外事件检测方法,包括以下步骤:
S1:获取供应链事件数据,所述供应链事件数据包括正常样本和异常样本,基于正常样本和异常样本构建数据集;
S2:构建用于供应链例外事件检测的小样本学习模型,所述小样本学习模型为基于具有卷积网络的孪生神经网络;
S3:利用步骤S1中的数据集中数据对所述孪生神经网络进行训练,得到训练好的孪生神经网络;
S4:实时获取待测供应链事件数据,利用训练好的孪生神经网络检测该待测供应链事件数据,判断是否存在异常并判断异常类别,得到检测结果。
优选地,所述供应链事件数据为供应链节点KPI的序列值,所述KPI为关键性能指标。
优选地,步骤S1中获取供应链事件数据,所述供应链事件数据包括正常样本和异常样本,具体为:
采集一种类别以上异常的供应链节点的KPI序列数据,形成异常KPI序列数据,采集实际的正常的KPI序列数据,形成正常KPI序列数据;
对异常KPI序列数据和正常KPI序列数据进行预处理后,得到正常样本和异常样本。
优选地,所述对异常KPI序列数据和正常KPI序列数据进行预处理,具体为:
若采集的KPI数据序列中存在部分值缺失,把该KPI数据序列中缺失的时间点的数据用同一类别的序列数据最近10个值的平均值进行填充;
对填充后的KPI数据序列采用滑动窗口方法,以1024个数据为一个周期、以步长为200进行滑窗,以窗口内的序列数据为样本,对得到每个样本根据样本的实际情况,加上正常或异常类别的标签;
基于正常KPI序列数据得到的样本为正常样本,基于异常KPI序列数据得到的样本为异常样本。
优选地,将数据集划分为训练数据集、测试数据集和验证数据集,训练数据集的正常样本和异常样本分别是数据集正常样本和异常样本的70%,测试数据集的正常样本和异常样本分别是数据集正常样本和异常样本的20%,验证数据集的正常样本和异常样本分别是数据集正常样本和异常样本的10%。
优选地,步骤S2中所述孪生神经网络由具有相同网络体系结构和共享权重设置的两个相同的卷积网络组成,所述孪生神经网络的输入为相同或不同类别的样本对,通过卷积网络分别提取特征向量,然后通过损失函数判断输入样本对的关系。
优选地,所述卷积网络具体包括十三层,具体为:
第一层为第一因果卷积层,其卷积核尺寸为61*1,步长为16*1,卷积核数量为16,填充方式为same,激活函数为ReLU;
第二层为第一池化层,其卷积核尺寸为2*1,步长为2*1,卷积核数量为16,填充方式为valid;
第三层为第二因果卷积层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为32,填充方式为same,激活函数为ReLU;
第四层为第二因果池化层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为32,填充方式为valid;
第五层为第三因果卷积层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为64,填充方式为same,激活函数为ReLU;
第六层为第三池化层,其卷积核尺寸为2*1,步长为2*1,卷积核数量为64,填充方式为valid;
第七层为第四因果卷积层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为64,填充方式为same,激活函数为ReLU;
第八层为第四池化层,其卷积核尺寸为2*1,步长为2*1,卷积核数量为64,填充方式为valid;
第九层为第五因果卷积层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为64,填充方式为same,激活函数为ReLU;
第十层为第五池化层,其卷积核尺寸为2*1,步长为2*1,卷积核数量为64,填充方式为valid;
第十一层为第六因果卷积层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为64,填充方式为same,激活函数为ReLU;
第十二层为第六池化层,其卷积核尺寸为2*1,步长为2*1,卷积核数量为64,填充方式为valid;
第十三层为全连接层,其卷积核尺寸为128,卷积核数量为1,激活函数为ReLU。
优选地,所述孪生卷积网络采用的损失函数为contrastive loss。
优选地,所述损失函数contrastive loss的表达式如下:
其中:
DW(X1,X2)代表两个样本特征X1和X1的欧氏距离,P表示样本的特征维数,Y为两个样本是否匹配的标签,Y=1代表两个样本相似或者匹配,Y=0则代表不匹配,m为人为设定的阈值,N为样本个数。
优选地,步骤S3中利用步骤S1中的数据集中数据对孪生神经网络进行训练时,利用contrastive loss损失函数评估样本对之间的差异,其中函数值越小说明样本对越接近,越有可能属于同一类别;卷积网络的参数更新过程使用Adagrad优化器和contrastiveloss损失函数,初始学习率为0.001,迭代10000回合,每隔1000回合,学习率变为原来的0.1倍,得到已训练的检测模型,根据验证集的准确率的高低选取最合适的模型作为设备故障诊断模型,作为训练好的孪生神经网络。
与现有技术相比,本发明技术方案的有益效果是:
本发明通过孪生神经网络在样本缺乏情况下实现在不同的工作条件之间、具有很大差异的同类异常事件/信号的准确识别,解决了在数据驱动的例外事件中难以获得足够数量的样本的问题,从而造成的已有基于深度学习的例外事件检测方法对每一种例外类型缺乏鲁棒性的困难。
附图说明
图1为本发明的方法流程示意图。
图2为孪生神经网络模型示意图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
本实施例提供一种基于孪生神经网络的供应链例外事件检测方法,如图1,包括以下步骤:
S1:获取供应链事件数据,所述供应链事件数据包括正常样本和异常样本,基于正常样本和异常样本构建数据集;
S2:构建用于供应链例外事件检测的小样本学习模型,所述小样本学习模型为基于具有卷积网络的孪生神经网络;
S3:利用步骤S1中的数据集中数据对所述孪生神经网络进行训练,得到训练好的孪生神经网络;
S4:实时获取待测供应链事件数据,利用训练好的孪生神经网络检测该待测供应链事件数据,判断是否存在异常并判断异常类别,得到检测结果。
所述供应链事件数据为供应链节点KPI的序列值,所述KPI为关键性能指标。
步骤S1中获取供应链事件数据,所述供应链事件数据包括正常样本和异常样本,具体为:
采集一种类别以上异常的供应链节点的KPI序列数据,形成异常KPI序列数据,采集实际的正常的KPI序列数据,形成正常KPI序列数据;
对异常KPI序列数据和正常KPI序列数据进行预处理后,得到正常样本和异常样本。
所述对异常KPI序列数据和正常KPI序列数据进行预处理,具体为:
若采集的KPI数据序列中存在部分值缺失,把该KPI数据序列中缺失的时间点的数据用同一类别的序列数据最近10个值的平均值进行填充;
对填充后的KPI数据序列采用滑动窗口方法,以1024个数据为一个周期、以步长为200进行滑窗,以窗口内的序列数据为样本,对得到每个样本根据样本的实际情况,加上正常或异常类别的标签;
基于正常KPI序列数据得到的样本为正常样本,基于异常KPI序列数据得到的样本为异常样本。
将数据集划分为训练数据集、测试数据集和验证数据集,训练数据集的正常样本和异常样本分别是数据集正常样本和异常样本的70%,测试数据集的正常样本和异常样本分别是数据集正常样本和异常样本的20%,验证数据集的正常样本和异常样本分别是数据集正常样本和异常样本的10%。
优选地,步骤S2中所述孪生神经网络如图2所示,由具有相同网络体系结构和共享权重设置的两个相同的卷积网络组成,所述孪生神经网络的输入为相同或不同类别的样本对,通过卷积网络分别提取特征向量,然后通过损失函数判断输入样本对的关系。
所述卷积网络具体包括十三层,具体结构如表1所示:
层数 | 类型 | 卷积核尺寸/步长 | 卷积核数量 | 填充方式 | 激活函数 |
1 | 因果卷积层1 | 64*1/16*1 | 16 | same | ReLU |
2 | 池化层1 | 2*1/2*1 | 16 | valid | |
3 | 因果卷积层2 | 3*1/2*1 | 32 | same | ReLU |
4 | 因果池化层2 | 2*1/2*1 | 32 | valid | |
5 | 因果卷积层3 | 3*1/2*1 | 64 | same | ReLU |
6 | 池化层3 | 2*1/2*1 | 64 | valid | |
7 | 因果卷积层4 | 3*1/2*1 | 64 | same | ReLU |
8 | 池化层4 | 2*1/2*1 | 64 | valid | |
9 | 因果卷积层5 | 3*1/2*1 | 64 | same | ReLU |
10 | 池化层5 | 2*1/2*1 | 64 | valid | |
11 | 因果卷积层6 | 3*1/2*1 | 64 | same | ReLU |
12 | 池化层6 | 2*1/2*1 | 64 | valid | |
13 | 全连接层 | 128 | 1 | ReLU |
具体为:
第一层为第一因果卷积层,其卷积核尺寸为61*1,步长为16*1,卷积核数量为16,填充方式为same,激活函数为ReLU;
第二层为第一池化层,其卷积核尺寸为2*1,步长为2*1,卷积核数量为16,填充方式为valid;
第三层为第二因果卷积层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为32,填充方式为same,激活函数为ReLU;
第四层为第二因果池化层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为32,填充方式为valid;
第五层为第三因果卷积层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为64,填充方式为same,激活函数为ReLU;
第六层为第三池化层,其卷积核尺寸为2*1,步长为2*1,卷积核数量为64,填充方式为valid;
第七层为第四因果卷积层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为64,填充方式为same,激活函数为ReLU;
第八层为第四池化层,其卷积核尺寸为2*1,步长为2*1,卷积核数量为64,填充方式为valid;
第九层为第五因果卷积层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为64,填充方式为same,激活函数为ReLU;
第十层为第五池化层,其卷积核尺寸为2*1,步长为2*1,卷积核数量为64,填充方式为valid;
第十一层为第六因果卷积层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为64,填充方式为same,激活函数为ReLU;
第十二层为第六池化层,其卷积核尺寸为2*1,步长为2*1,卷积核数量为64,填充方式为valid;
第十三层为全连接层,其卷积核尺寸为128,卷积核数量为1,激活函数为ReLU。
所述孪生卷积网络采用的损失函数为contrastive loss。
所述损失函数contrastive loss的表达式如下:
其中:
DW(X1,X2)代表两个样本特征X1和X1的欧氏距离,P表示样本的特征维数,Y为两个样本是否匹配的标签,Y=1代表两个样本相似或者匹配,Y=0则代表不匹配,m为人为设定的阈值,N为样本个数。
步骤S3中利用步骤S1中的数据集中数据对孪生神经网络进行训练时,利用contrastive loss损失函数评估样本对之间的差异,其中函数值越小说明样本对越接近,越有可能属于同一类别;卷积网络的参数更新过程使用Adagrad优化器和contrastiveloss损失函数,初始学习率为0.001,迭代10000回合,每隔1000回合,学习率变为原来的0.1倍,得到已训练的检测模型,根据验证集的准确率的高低选取最合适的模型作为设备故障诊断模型,作为训练好的孪生神经网络。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (10)
1.一种基于孪生神经网络的供应链例外事件检测方法,其特征在于,包括以下步骤:
S1:获取供应链事件数据,所述供应链事件数据包括正常样本和异常样本,基于正常样本和异常样本构建数据集;
S2:构建用于供应链例外事件检测的小样本学习模型,所述小样本学习模型为基于具有卷积网络的孪生神经网络;
S3:利用步骤S1中的数据集中数据对所述孪生神经网络进行训练,得到训练好的孪生神经网络;
S4:实时获取待测供应链事件数据,利用训练好的孪生神经网络检测该待测供应链事件数据,判断是否存在异常并判断异常类别,得到检测结果。
2.根据权利要求1所述的基于孪生神经网络的供应链例外事件检测方法,其特征在于,所述供应链事件数据为供应链节点KPI的序列值,所述KPI为关键性能指标。
3.根据权利要求2所述的基于孪生神经网络的供应链例外事件检测方法,其特征在于,步骤S1中获取供应链事件数据,所述供应链事件数据包括正常样本和异常样本,具体为:
采集一种类别以上异常的供应链节点的KPI序列数据,形成异常KPI序列数据,采集实际的正常的KPI序列数据,形成正常KPI序列数据;
对异常KPI序列数据和正常KPI序列数据进行预处理后,得到正常样本和异常样本。
4.根据权利要求3所述的基于孪生神经网络的供应链例外事件检测方法,其特征在于,所述对异常KPI序列数据和正常KPI序列数据进行预处理,具体为:
若采集的KPI数据序列中存在部分值缺失,把该KPI数据序列中缺失的时间点的数据用同一类别的序列数据最近10个值的平均值进行填充;
对填充后的KPI数据序列采用滑动窗口方法,以1024个数据为一个周期、以步长为200进行滑窗,以窗口内的序列数据为样本,对得到每个样本根据样本的实际情况,加上正常或异常类别的标签;
基于正常KPI序列数据得到的样本为正常样本,基于异常KPI序列数据得到的样本为异常样本。
5.根据权利要求3或4所述的基于孪生神经网络的供应链例外事件检测方法,其特征在于,将数据集划分为训练数据集、测试数据集和验证数据集,训练数据集的正常样本和异常样本分别是数据集正常样本和异常样本的70%,测试数据集的正常样本和异常样本分别是数据集正常样本和异常样本的20%,验证数据集的正常样本和异常样本分别是数据集正常样本和异常样本的10%。
6.根据权利要求5所述的基于孪生神经网络的供应链例外事件检测方法,其特征在于,步骤S2中所述孪生神经网络由具有相同网络体系结构和共享权重设置的两个相同的卷积网络组成,所述孪生神经网络的输入为相同或不同类别的样本对,通过卷积网络分别提取特征向量,然后通过损失函数判断输入样本对的关系。
7.根据权利要求6所述的基于孪生神经网络的供应链例外事件检测方法,其特征在于,所述卷积网络具体包括十三层,具体为:
第一层为第一因果卷积层,其卷积核尺寸为61*1,步长为16*1,卷积核数量为16,填充方式为same,激活函数为ReLU;
第二层为第一池化层,其卷积核尺寸为2*1,步长为2*1,卷积核数量为16,填充方式为valid;
第三层为第二因果卷积层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为32,填充方式为same,激活函数为ReLU;
第四层为第二因果池化层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为32,填充方式为valid;
第五层为第三因果卷积层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为64,填充方式为same,激活函数为ReLU;
第六层为第三池化层,其卷积核尺寸为2*1,步长为2*1,卷积核数量为64,填充方式为valid;
第七层为第四因果卷积层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为64,填充方式为same,激活函数为ReLU;
第八层为第四池化层,其卷积核尺寸为2*1,步长为2*1,卷积核数量为64,填充方式为valid;
第九层为第五因果卷积层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为64,填充方式为same,激活函数为ReLU;
第十层为第五池化层,其卷积核尺寸为2*1,步长为2*1,卷积核数量为64,填充方式为valid;
第十一层为第六因果卷积层,其卷积核尺寸为3*1,步长为2*1,卷积核数量为64,填充方式为same,激活函数为ReLU;
第十二层为第六池化层,其卷积核尺寸为2*1,步长为2*1,卷积核数量为64,填充方式为valid;
第十三层为全连接层,其卷积核尺寸为128,卷积核数量为1,激活函数为ReLU。
8.根据权利要求7所述的基于孪生神经网络的供应链例外事件检测方法,其特征在于,所述孪生卷积网络采用的损失函数为contrastive loss。
10.根据权利要求9所述的基于孪生神经网络的供应链例外事件检测方法,其特征在于,步骤S3中利用步骤S1中的数据集中数据对孪生神经网络进行训练时,利用contrastiveloss损失函数评估样本对之间的差异,其中函数值越小说明样本对越接近,越有可能属于同一类别;卷积网络的参数更新过程使用Adagrad优化器和contrastive loss损失函数,初始学习率为0.001,迭代10000回合,每隔1000回合,学习率变为原来的0.1倍,得到已训练的检测模型,根据验证集的准确率的高低选取最合适的模型作为设备故障诊断模型,作为训练好的孪生神经网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011394686.9A CN112465045A (zh) | 2020-12-02 | 2020-12-02 | 一种基于孪生神经网络的供应链例外事件检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011394686.9A CN112465045A (zh) | 2020-12-02 | 2020-12-02 | 一种基于孪生神经网络的供应链例外事件检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112465045A true CN112465045A (zh) | 2021-03-09 |
Family
ID=74805739
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011394686.9A Pending CN112465045A (zh) | 2020-12-02 | 2020-12-02 | 一种基于孪生神经网络的供应链例外事件检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112465045A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113612733A (zh) * | 2021-07-07 | 2021-11-05 | 浙江工业大学 | 一种基于孪生网络的少样本虚假数据注入攻击检测方法 |
CN113838058A (zh) * | 2021-10-11 | 2021-12-24 | 重庆邮电大学 | 一种基于小样本分割的医学图像自动标注方法及系统 |
CN114115152A (zh) * | 2021-11-25 | 2022-03-01 | 武汉智能装备工业技术研究院有限公司 | 基于嵌入式和深度学习的制造边缘实时事件洞察方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109508655A (zh) * | 2018-10-28 | 2019-03-22 | 北京化工大学 | 基于孪生网络的不完备训练集的sar目标识别方法 |
CN110222792A (zh) * | 2019-06-20 | 2019-09-10 | 杭州电子科技大学 | 一种基于孪生网络的标签缺陷检测算法 |
-
2020
- 2020-12-02 CN CN202011394686.9A patent/CN112465045A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109508655A (zh) * | 2018-10-28 | 2019-03-22 | 北京化工大学 | 基于孪生网络的不完备训练集的sar目标识别方法 |
CN110222792A (zh) * | 2019-06-20 | 2019-09-10 | 杭州电子科技大学 | 一种基于孪生网络的标签缺陷检测算法 |
Non-Patent Citations (1)
Title |
---|
沈雁;王环;戴瑜兴;: "基于改进深度孪生网络的分类器及其应用", 计算机工程与应用, no. 10 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113612733A (zh) * | 2021-07-07 | 2021-11-05 | 浙江工业大学 | 一种基于孪生网络的少样本虚假数据注入攻击检测方法 |
CN113612733B (zh) * | 2021-07-07 | 2023-04-07 | 浙江工业大学 | 一种基于孪生网络的少样本虚假数据注入攻击检测方法 |
CN113838058A (zh) * | 2021-10-11 | 2021-12-24 | 重庆邮电大学 | 一种基于小样本分割的医学图像自动标注方法及系统 |
CN113838058B (zh) * | 2021-10-11 | 2024-03-19 | 重庆邮电大学 | 一种基于小样本分割的医学图像自动标注方法及系统 |
CN114115152A (zh) * | 2021-11-25 | 2022-03-01 | 武汉智能装备工业技术研究院有限公司 | 基于嵌入式和深度学习的制造边缘实时事件洞察方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112465045A (zh) | 一种基于孪生神经网络的供应链例外事件检测方法 | |
Li et al. | Data-driven bearing fault identification using improved hidden Markov model and self-organizing map | |
CN111460728B (zh) | 一种工业设备剩余寿命预测方法、装置、存储介质及设备 | |
CN111639430A (zh) | 一种数字孪生驱动的天然气管道泄漏识别系统 | |
CN112766301B (zh) | 一种采油机示功图相似性判断方法 | |
CN109871002B (zh) | 基于张量标签学习的并发异常状态识别与定位系统 | |
CN110757510A (zh) | 一种机器人剩余寿命预测方法及系统 | |
CN114266342A (zh) | 一种基于孪生网络的内部威胁的检测方法及系统 | |
CN110580213A (zh) | 一种基于循环标记时间点过程的数据库异常检测方法 | |
CN110766100B (zh) | 轴承故障诊断模型构建方法、诊断方法及电子设备 | |
CN114266289A (zh) | 一种复杂装备健康状态评估方法 | |
CN115510950A (zh) | 基于时间卷积网络的飞行器遥测数据异常检测方法及系统 | |
CN111126477A (zh) | 一种混合贝叶斯网络的学习与推理方法 | |
CN117156442B (zh) | 基于5g网络的云数据安全保护方法及系统 | |
CN114416423A (zh) | 一种基于机器学习的根因定位方法和系统 | |
CN116893924B (zh) | 设备故障处理方法、装置、电子设备和存储介质 | |
CN116485020B (zh) | 一种基于大数据的供应链风险识别预警方法、系统及介质 | |
CN112418460A (zh) | 工程车辆的故障诊断方法和故障诊断装置 | |
CN115184054B (zh) | 机械设备半监督故障检测分析方法、装置、终端及介质 | |
CN115734274A (zh) | 一种基于深度学习和知识图谱的蜂窝网络故障诊断方法 | |
Pattnaik et al. | A survey on machine learning techniques used for software quality prediction | |
Ragab et al. | Remaining useful life prognostics using pattern-based machine learning | |
CN114757495A (zh) | 一种基于逻辑回归的会员价值量化评估方法 | |
CN114115152A (zh) | 基于嵌入式和深度学习的制造边缘实时事件洞察方法 | |
Burmeister et al. | Exploration of production data for predictive maintenance of industrial equipment: A case study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |