CN112685504A

CN112685504A - 一种面向生产过程的分布式迁移图学习方法

Info

Publication number: CN112685504A
Application number: CN202110010986.0A
Authority: CN
Inventors: 冷杰武; 阮国磊; 刘强; 张虎; 苏倩怡; 周满; 王德文
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2021-01-06
Filing date: 2021-01-06
Publication date: 2021-04-20
Anticipated expiration: 2041-01-06
Also published as: CN112685504B; US20220215246A1; US11367002B1

Abstract

本发明公开了一种面向生产过程的分布式迁移图学习方法，首先确定总节点、分布式节点和各个分布式节点的节点粒度，并搭建区块链网络；接着搭建并训练图神经网络模型；设置参数更新阈值、总训练次数、计数变量和训练次数，当图神经网络模型的计数变量等于参数更新阈值或者为参数更新阈值的整数倍时，则将图神经网络模型的网络权重参数和生产过程参数上传至区块链网络，总节点对网络权重参数取加权平均值，并将加权平均值发布至区块链网络，分布式节点分别从区块链网络上获取平均值，并将平均值加载至图神经网络模型中进行更新。本发明将各个分布式节点的网络权重参数进行加权融合，并以此对各个图神经网络模型进行更新，因此具有较佳的泛化能力。

Description

一种面向生产过程的分布式迁移图学习方法

技术领域

本发明涉及信息技术领域，尤其涉及一种面向生产过程的分布式迁移图学习方法。

背景技术

近年来，深度卷积神经网络快速发展，并借由其强大的建模能力引起广泛关注。相比传统方法，深度卷积神经网络的引入给图像处理和自然语言处理等领域带来了很大的提升，如机器翻译，图像识别，语音识别等。

但是对于数据量较大的复杂工业生产环境，深度卷积神经网络模型训练对算力提出了较高的要求，花费的训练时间较多，模型的训练效率较低。而且工业生产环境中生产状况多变，对于特定生产状况下的生产数据所训练出来的深度卷积神经网络算法模型，用在其他生产状况所获得的效果比较差，训练所得到的算法模型泛化能力和迁移能力较差。对于生产状况多变得工业生产环境中，采用深度卷积神经网络并不能取得很好得效果。

发明内容

本发明的目的在于提出一种面向生产过程的分布式迁移图学习方法，以解决上述问题。

为达此目的，本发明采用以下技术方案：

一种面向生产过程的分布式迁移图学习方法，包括以下步骤：

步骤A、根据生产过程确定分布式迁移图学习的需求，然后根据分布式迁移图学习的需求确定总节点、分布式节点和各个所述分布式节点的节点粒度；

步骤B、确定区块链网络的分布式节点的个数，并搭建区块链网络；

步骤C、根据所述节点粒度收集各分布式节点的生产过程参数，然后根据所述生产过程参数搭建图神经网络模型，并将所述图神经网络模型部署到区块链网络的总节点和各个分布式节点；

步骤D、设置参数更新阈值update和总训练次数epoch,所述参数更新阈值update和总训练次数epoch分别为常数；

设置计数变量和训练次数，所述计数变量和所述训练次数的初始值均为0；所述步骤D包括以下步骤：

步骤D1、判断所述训练次数是否不小于所述总训练次数epoch，若是，则进入步骤D2，否则模型训练结束；

步骤D2、判断所述计数变量是否等于所述参数更新阈值或者为所述参数更新阈值的整数倍，若是，则进入步骤D5，否则进入步骤D4；

步骤D4、对部署于所述分布式节点的图神经网络模型进行一次模型训练；所述计数变量和所述训练次数分别加1；然后返回所述步骤D2；

步骤D5、所述计数变量归零；然后分别导出部署于各所述分布式节点的所述图神经网络模型的网络权重参数p_i，然后将所述网络权重参数p_i和所述生产过程参数上传至所述区块链网络，接着进入步骤D6；

步骤D6、所述总节点从所述区块链网络上获取各个所述分布式节点的网络权重参数p_i和所述生产过程参数，然后对所述网络权重参数取加权平均值

其中，n为所述分布式节点的个数，w_i为第i个节点的权重；然后将所述加权平均值p_a加载到所述总节点的图神经网络模型中，并将所述加权平均值p_a发布至所述区块链网络；然后进入步骤D7；

步骤D7、各个所述分布式节点分别从所述区块链网络上获取所述加权平均值p_a，然后将所述加权平均值p_a加载至所述分布式节点的图神经网络模型中，并对所述图神经网络模型进行更新；然后进入步骤D8；

步骤D8、所述训练次数加1，并返回所述步骤D1。

优选地，将所述生产过程作为一个有向图结构G，所述步骤C包括：

生产过程参数收集阶段，收集与所述分布式节点对应的图神经网络模型的训练数据，其中：

所述有向图结构G中的每一个生产工序分别作为一个节点v，所述节点v中包含的若干加工特征属性用高维张量表示；

所述有向图结构G中的各个生产工序之间的流转关系作为边e，所述边e中包含的若干运输特征属性用高维张量表示；

所有的所述节点v构成所述有向图结构的节点集V，所有的所述边e构成所述有向图结构的边集E，则所述有向图结构G＝(V,E)；

图神经网络模型搭建阶段，其中；

设定一个维度为N×F⁰的特征矩阵X来表示所述有向图结构G的各个所述节点v，其中，N表示有向图结构中的节点v的数量，F⁰表示每个节点v的加工特征属性；

设定一个维度为N×N的邻接矩阵A来表示所述有向图结构G的各个所述节点v之间的连接关系；

则所述图神经网络模型的输入为所述特征矩阵X和所述邻接矩阵A，根据所述特征矩阵X和所述邻接矩阵A搭建图神经网络模型；

图神经网络模型部署阶段，将所述图神经网络模型部署到区块链网络的总节点和各个分布式节点。

优选地，在所述步骤C中，设定所述图神经网络模型的前向传播方式为：

其中，σ为激活函数ReLU，H^(l)为所述有向图结构在第l层卷积的表示状态，H⁽⁰⁾＝X，W^(l)为第l层卷积的权重矩阵，D是一个对角矩阵对角线上每个元素表示所述有向图结构G中的节点的度。

优选地，在所述步骤C中，获取历史生产数据，然后在所述历史生产数据中选择多个原始数据，并对各个所述原始数据分别打上分类标签，并对所述原始数据按照训练集：验证集：测试集＝7：2：1的比例随机切分。

优选地，在所述步骤C中，所述图神经网络在前向训练过程后，对所述图神经网络模型的问题性质进行判断，然后根据所述问题性质选择交叉熵损失函数：

若所述问题性质为二分类性质，则所述交叉熵损失函数为：

其中，

是所述图神经网络预测数据样本是正例的概率，y是数据样本的分类标签，如果数据样本的分类标签为正例，则y＝1；若数据样本的分类标签为负例，则y＝0；

若所述问题性质为多分类性质，则所述交叉熵损失函数为：

其中，J是数据样本的个数，j是数据样本中的第j个数据样本，

是所述图神经网络模型的预测样本是第j个数据样本的概率，y_j是第j个数据样本的分类标签。

本发明的有益效果是：引用迁移模式算法，通过将不同的分布式节点的不同数据分别对图神经网络模型进行训练，然后将各个分布式节点所训练得到的图神经网络模型的不同网络权重参数进行加权融合，最后由总节点生成一个总的图神经网络模型的网络权重参数，这样使得最终总的图神经网络模型对每个分布式节点的数据适应都很好，从而能够有效地提高图神经网络模型的泛化能力，实现了广义上的迁移，从而使得人工智能得以规模化应用。

附图说明

附图对本发明做进一步说明，但附图中的内容不构成对本发明的任何限制。

图1是本发明其中一个实施例的训练过程的流程示意图；

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。

本实施例的一种面向生产过程的分布式迁移图学习方法，包括以下步骤：

步骤D8、所述训练次数加1，并返回所述步骤D1。

目前的人工智能算法模型训练方式多是将数据集中到一起进行训练，这种集中式数据存储训练模式对硬件的计算能力要求较高且降低了算法模型训练效率。不同于数据集中处理的集中训练模式，本发明通过引入区块链技术，将数据分布式存储到区块链的每个分布式节点中，并在各自的分布式节点中用本地数据对图神经网络模型进行训练，提高了图神经网络模型的训练效率。此外，在人工智能落地的过程中，数据的匮乏(数据量级小/标签少)、算法人对业务认知的匮乏、“一事一模型”的难泛化算法都困扰着人工智能的规模化应用。一个模型只适用于某种特定情况，放到其他情况下，模型效果就大打折扣，算法的可迁移能力亟待提升。这背后的核心原因是，仅靠局部数据驱动的模型很难具备较好的全局泛化能力，各个系统记录的数据存在一定的差异互补性。针对这一缺点，本发明引用迁移模式算法，通过将不同的分布式节点的不同数据分别对图神经网络模型进行训练，然后将各个分布式节点所训练得到的图神经网络模型的不同网络权重参数进行加权融合，最后由总节点生成一个总的图神经网络模型的网络权重参数，这样使得最终总的图神经网络模型对每个分布式节点的数据适应都很好，从而能够有效地提高图神经网络模型的泛化能力，实现了广义上的迁移，从而使得人工智能得以规模化应用。

根据实际生产过程的需求，可以对本申请的分布式迁移图学习方法分成两类，第一类是通过图回归或者节点回归来解决的生产过程中相关指标预测类；第二类是通过矩阵补全或者连接预测来提供的生产过程相关辅助决策类。而根据参加图神经网络模型训练的数据的范围，可以将参加训练的分布式节点分为基于大粒度节点的分布式迁移图学习方法和基于小粒度节点的分布式迁移图学习方法，其中，第一类以整个加工车间为节点的基于大粒度节点的分布式迁移图学习方法；第二类以将生产车间里的加工过程拆分为制造单元以每个制造单元为节点的基于小粒度的分布式迁移图学习方法；其具体的分类过程是：先根据分布式迁移图学习方法具体的需求，包括指标预测类和决策改进类，去分析采集原始数据的范围，再根据数据范围去确定分布式节点的粒度，例如要以整个集团收益最大化为目标而进行生产决策，这样就需要获集团下每个分公司的生产数据，这样使用到的就是以每一个分公司为一个节点的基于大粒度分布式迁移图学习方法；如果要对某条产线上的某一道工序的生产故障进行预测，而为了使模型有更好的泛化效果需要将其他相似产品生产线上对应的相似工序的生产数据用来一起去训练网络模型，这样用到的就是以某到工序为制造单元的基于小粒度的分布式迁移图学习方法。

确定分布式节点的粒度之后，可以去选定具体的分布式节点。每个提供训练数据的计算机或者云服务都作为一个分布式节点，假设这种类型分布式节点个数为n；确定好所有分布式图学习的各个分布式节点之后再加一个总节点来训练总的图神经网络模型，总节点的数量为1，所以训练参与图神经网络模型训练的节点总数为n+1。

进一步地，将所述生产过程作为一个有向图结构G，所述步骤C包括：

图神经网络模型搭建阶段，其中；

设定一个维度为N×F⁰的特征矩阵X来表示所述有向图结构G的各个所述节点v，其中，N表示有向图结构中的节点v的数量，F⁰表示每个所述节点v的加工特征属性；

生产过程中的工序流程图可以看成一个有向图结构，可以根据生产过程的工序流程图来设计对应图神经网络模型的训练数据。以手机组装工艺主流程为例，手机组装的每一个过程可以看成有向图结构中的节点v，节点v里面包含的若干个加工特征属性可以用高维张量来表示；手机组装工序之间的流转可以看成有向图结构中的边e，边e中包含的若干个运输特征属性可以用高维张量来表示。

其中节点v的加工特征属性就是该工序加工过程中的一些参数，如：加工时间、加工方式等，根据节点v的不同，加工特征属性的数量和类型有所区别；边e表示零件在两道工序之间运输过程中的一些参数，如：产品从上一道工序到下一道工序的运输方式、时间、空间距离等可以影响最终预测影响预测结果的运输特征属性，具体的数据根据最后的需求来确定。所有的节点v构成该有向图结构的节点集V，所有的边e构成该有向图结构的边集E，因此可以用G＝(V,E)来表示手机组装工艺主流程的有向图结构的数据。

进一步地，在所述步骤C中，设定所述图神经网络模型的前向传播方式为：

采用图卷积神经网络对车间生产状态进行特征提取，相比于普通的卷积神经网络，车间生产状态更适合用图结构数据(拓扑网络结构)描述，而图卷积神经网络是针对有向图结构数据设计的特征提取网络，可以更好的提取到车间生产状态之间的隐含联系，为后续的分类或其他任务提供更好的支持。

进一步地，在所述步骤C中，获取历史生产数据，然后在所述历史生产数据中选择多个原始数据，并对各个所述原始数据分别打上分类标签，并对所述原始数据按照训练集：验证集：测试集＝7：2：1的比例随机切分。

由于在生产的过程中，并非全部的历史生产数据都可用于对图神经网络模型进行训练，因此需要对数据进行筛选，并挑选出所需要的多个原始数据；然后对原始数据打上分类标签，如果原始数据为二分类问题的数据，则打上正例或负例的标签，例如，正例为1，负例为0；如原始数据为多分类问题的数据，则可以根据需要，分别对数据相应的标签，这样能够方便使用原始数据对图神经网络模型的训练；此外，为了使图神经网络模型能够得到更好的训练效果，因此在对原始数据进行切分时，训练集所占的比例最大，而验证集和测试集则用于对完成训练的图神经网络进行验证和测试，因此验证集和测试集所点的比例较小。

进一步地，所述图神经网络在前向训练过程后，对所述图神经网络模型的问题性质进行判断，然后根据所述问题性质选择熵损失函数：

若所述问题性质为二分类性质，则所述熵损失函数为：

其中，

是所述图神经网络预测数据样本是正例的概率，y是数据样本的分类标签，如果数据样本的分类标签为正例，则y＝1；若数据样本的分类标签为负例，则y＝0；在二分类问题上，交叉熵损失函数可以为图神经网络模型的迭代过程提供依据。

若所述问题性质为多分类性质，则所述交叉熵损失函数为：

根据不同的问题性质选择不同的交叉熵损失函数，这样能够使得图神经网络模型能够更加贴近生产过程，从而使得图神经网络模型的预判结构更加准确。

以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理，而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释，本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式，这些等同的变型或替换均包含在本申请权利要求所限定的范围内。

Claims

1.一种面向生产过程的分布式迁移图学习方法，其特征在于：包括以下步骤：

步骤D8、所述训练次数加1，并返回所述步骤D1。

2.根据权利要求1所述的一种面向生产过程的分布式迁移图学习方法，其特征在于：将所述生产过程作为一个有向图结构G，所述步骤C包括：

所述有向图结构G中的每一个生产工序分别作为一节点v，所述节点v中包含的若干加工特征属性用高维张量表示；

图神经网络模型搭建阶段，其中；

3.根据权利要求2所述的一种面向生产过程的分布式迁移图学习方法，其特征在于：在所述步骤C中，设定所述图神经网络模型的前向传播方式为：

其中，σ为激活函数ReLU，H^(l)为所述有向图结构在第l层卷积的表示状态，H⁽⁰⁾＝X，W^(l)为第l层卷积的权重矩阵，D是一个对角矩阵，对角线上每个元素分别表示所述有向图结构G中的节点的度。

4.根据权利要求3所述的一种面向生产过程的分布式迁移图学习方法，其特征在于：在所述步骤C中，获取历史生产数据，然后在所述历史生产数据中选择多个原始数据，并对各个所述原始数据分别打上分类标签，并对所述原始数据按照训练集：验证集：测试集＝7：2：1的比例随机切分。

5.根据权利要求4所述的一种面向生产过程的分布式迁移图学习方法，其特征在于：在所述步骤C中，所述图神经网络在前向训练过程后，对所述图神经网络模型的问题性质进行判断，然后根据所述问题性质选择熵损失函数：

若所述问题性质为二分类性质，则所述熵损失函数为：

其中，

若所述问题性质为多分类性质，则所述交叉熵损失函数为：