WO2024114121A1

WO2024114121A1 - 一种基于知识自演化的人工智能跨平台模型智能计算引擎构建方法

Info

Publication number: WO2024114121A1
Application number: PCT/CN2023/124030
Authority: WO
Inventors: 杨海根; 林东煌; 王聪; 曾凡玉; 戴尔晗; 刘佶鑫; 葛艳
Original assignee: 南京邮电大学
Priority date: 2022-11-30
Filing date: 2023-10-11
Publication date: 2024-06-06
Also published as: CN115964934A

Abstract

本发明公开了一种基于知识自演化的人工智能跨平台模型智能计算引擎构建方法，包括如下步骤：确认源时刻和目标时刻，基于人工经验，按照划分规则将某一时刻的离散制造系统数据集划分为多个数据集；初始化动态离散制造系统模型；对数据进行预处理，构建任务池；构建元学习框架，分为训练元学习模型和快速调整目标神经网络，实现多任务之间的快速迁移；更换目标时刻，利用元学习框架将训练好的神经网络快速迁移到新的任务；迭代上一步骤直到动态离散制造系统模型收敛，收敛后保存模型参数；将动态离散制造系统模型用于新环境任务，测试其性能。本发明能够减少模型参数的收敛时间，对于实际生产中随时间扰动的动态离散制造模型的训练具有重大的意义。

Description

一种基于知识自演化的人工智能跨平台模型智能计算引擎构建方法

技术领域

本发明涉及计算机数据科学技术领域，尤其是一种基于知识自演化的人工智能跨平台模型智能计算引擎构建方法。

背景技术

在经济全球化的背景下，随着科学技术的进步和人民需求的提高，离散制造业的发生了翻天覆地的变化，插单销单、个性化定制、设备故障、物料统筹等突发事件使得生产过程复杂多变。而目前的离散制造系统在复杂动态场景中难以运用，往往需要人工干预。这些在特定静态场景下训练的系统模型难以应对实际生产过程中制造信息的频繁变动。由于车间实际运行工况和内外部条件的改变，导致车间系统动态参数或系统模型结构经常发生变化。所以迫切需要一种知识自演化的技术，能使离散制造模型随时间自行演化，适应目前的动态场景，实现真正的智能化动态离散制造系统。

发明内容

本发明所要解决的技术问题在于，提供一种基于知识自演化的人工智能跨平台模型智能计算引擎构建方法，能够减少模型参数的收敛时间，对于实际生产中随时间扰动的动态离散制造模型的训练具有重大的应用价值。

为解决上述技术问题，本发明提供一种基于知识自演化的人工智能跨平台模型智能计算引擎构建方法，包括如下步骤：

步骤1、确认源时刻和目标时刻；基于人工经验，按照一定的划分规则对这两个不同时间段的离散制造系统数据集进行划分；

步骤2、初始化动态离散制造系统模型；

步骤3、对数据进行预处理，构建任务池；一部分数据用于训练源模型，另一部分用于训练目标神经网络；

步骤4、构建一个元学习框架，分为训练元学习模型和快速调整目标神经网络，实现多任务之间的快速迁移；

步骤5、更换目标时刻，利用元学习框架将训练好的神经网络快速迁移到新的任务；

步骤6、迭代步骤5直到动态离散制造系统模型收敛，收敛后保存模型参数；

步骤7、将动态离散制造系统模型用于新环境任务，测试其性能。

优选的，步骤1中，确认源时刻和目标时刻；基于人工经验，按照一定的划分规则对这两个不同时间段的离散制造系统数据集进行划分具体为：

步骤11、选择源时刻s和目标时刻t，输入这两个时间段的离散制造数据；

步骤12、按照等分、生产成本或产品数量等规则，基于人工经验，分别将这两个时间段的数据集划分为最优的N_s和N_t个静态离散制造数据集。

优选的，步骤2中，初始化动态离散制造系统模型具体为：

步骤21、基于深度强化学习算法，选择合适的深度强化学习神经网络Q，对动态离散制造系统模型的参数θ进行初始化；

步骤22、定义元学习算法的两个超参数α和β，具体取值需多次实验。

优选的，步骤3中，对数据进行预处理，构建任务池；一部分数据用于训练源模型，另一部分用于训练目标神经网络具体包括如下步骤：

步骤31、依据步骤12划分的数据，源时刻具有的N_s个类别称为meta-train classes，用于训练元学习模型Q_s，表示适用于当前时刻和工况的静态模型；目标时刻具有的N_t个类别称为meta-test classes，用于训练目标模型Q_t，其表示动态参数调整后适用于新时刻新工况的离散制造系统模型；

步骤32、Task抽取方法设置为M way-K shot，构建用于训练元学习模型的数据集；从meta-train cla es中随机选取M_s个类别，每个类别随机选取L_s个样本(L_s>K_s)，组成一个Task T_s，其中每个类别中随机选取K_s个样本作为当前Task的训练集，称为支持集support set，剩余M_s*(L_s-K_s)个样本作为当前Task的测试集，称为查询集query set，从meta-train classes中如此反复随机抽取Task，构成由若干个T构成的Task池，其分布定义为p(T_s)；

步骤33、构建用于训练目标模型的数据集，从meta-test classes中随机选取M_t个类别，每个类别随机选取L_t个样本(L_t>K_t)，组成一个Task T_t，其中每个类别中随机选取K_t个样本作为当前Task的训练集，称为support set，剩余M_t*(L_t-K_t)个样本作为当前Task的测试集，称为query set，从meta-test classes中反复随机抽取Task，构成由若干个T构成的Task池，其分布定义为p(T_t)。

优选的，步骤4中，构建一个元学习框架，分为训练元学习模型和快速调整目标神经网络，实现多任务之间的快速迁移具体包括如下步骤：

步骤41、训练元学习模型Q_s，具体包括如下步骤：

(a)随机初始化Q_s的模型参数θ_s；

(b)随机从Task池中采样n_s个Task T，形成一个batch，其中每一个Task T_i(i＝1,2,3…,n_s)满足分布T_i～p(T_s)；

(c)利用batch中的某一个Task T_i中的support set，计算模型参数θ_s的梯度模型参数θ_s的更新公式如下：

上式中，θ′_si为基于T_i更新后的模型Q_s的参数，为基于T_i计算出θ_s的损失梯度函数；

(d)基于batch中的每一个Task重复步骤(c)，执行次数为n_a，如此完成第一次梯度的更新，获得更新后的参数θ_s；

(e)第二次梯度的更新：利用batch中的每一个Task T_i中的query set，计算θ_s的损失梯度，进而计算batch的损失总和，利用该损失总和对梯度进行更新，其更新公式如下：

如此便完成第二次梯度的更新，结束模型在该batch上的训练；

(f)返回步骤(b)，重新采样下一个batch；

步骤42、训练结束后获得神经网络Q_s的初始化参数θ_s，根据目标时刻的数据集动态调整模型参数使其适应新的内外部生产环境，训练目标模型Q_t具体包括如下步骤：

(g)初始化Q_t的模型参数，将Q_s的模型参数赋值Q_t，即θ_t＝θ_s；

(h)随机从Task池中采样n_t个Task T，其中每一个Task T_i(i＝1,2,3…,n)满足分布T_i～p(T_t)；

(i)利用随机抽取的某一个Task T_i中的support set，更新模型参数θ_t的梯度模型参数θ_t的更新公式如下：

上式中，θ′_ti为基于T_i更新后的模型Q_t的参数；

(j)基于步(h)中随机抽取的每一个Task，分别对步骤(g)中初始化的参数θ_b运用步骤(i)的更新算法，获得n_t个更新后的参数θ′_ti，对其取平均获得最终的模型参数，其公式如下：

以上便是目标模型Q_t的训练过程，最终获得适用于目标时刻t的神经网络模型Q_t，实现参数的动态调整和系统模型的快速迁移。

优选的，步骤5中，更换目标时刻，利用元学习框架将训练好的神经网络快速迁移到新的任务具体包括如下步骤：

步骤51、将训练好的目标神经网络模型Q_t作为源模型，下一时刻t+1作为新的目标时刻，接下来的任务是将神经网络模型从时刻t快速迁移到时刻t+1；

步骤52、根据步骤3进行数据预处理，构建任务池；

步骤53、根据步骤4，获得新的目标神经网络Q_t+1的参数θ_t+1。

优选的，步骤6中，迭代步骤5直到动态离散制造系统模型收敛，收敛后保存模型参数具体包括如下步骤：

步骤61、迭代步骤5，不断获取下一时刻的神经网络模型Q_t、Q_t+1、Q_t+2…，直到模型参数收敛，表示该系统模型已经能很好的适应于不同时间段不同工况的生产环境，无论内外部条件如何变化，都能稳定的输出最优决策；

步骤62、模型收敛后，保存模型参数，获得最终的动态离散制造系统模型。

优选的，步骤7中，将动态离散制造系统模型用于新环境任务，测试其性能具体为：如果系统模型在新环境下能很好的输出调度策略，比原系统具有更高的效率，则结果符合预期，训练完成；如果结果不符合预期，则重新回到步骤1，重新训练。

本发明的有益效果为：本发明计算量小，泛化性能好，通过少量不同类型的样本组成的训练集，利用元学习框架实现对多个类别共同特征的学习，提高动态离散制造模型的泛化性能；模型参数收敛速度快，可迁移性强，通过在新任务中加载元学习训练的优化参数作为初始化参数，仅仅需训练几步即可完成离散制造模型在新时刻的模型参数，快速完成任务迁移，与原任务越相似的新任务所需的时间越少，相比随机初始化参数或加载已有的网络模型参数，通过这种算法能实现对神经网络的快速微调，减少模型参数的收敛时间，对于实际生产中随时间扰动的动态离散制造模型的训练具有重大的应用价值。

附图说明

图1为本发明的方法流程示意图。

图2为本发明的元学习框架结构示意图。

具体实施方式

如图1和2所示，一种基于知识自演化的人工智能跨平台模型智能计算引擎构建方法，包括如下步骤：

步骤1、确认源时刻和目标时刻；基于人工经验，按照一定的划分规则对这两个不同时间段的离散制造系统数据集进行划分；从动态离散制造生产数据中选择两个不同时间段的数据集，这两个时间段的数据集代表了不同的车间运行工况和内外部条件，车间系统的动态参数由此发生变化，因此需要车间系统实现自演化，自行调整动态参数，适应复杂多变的车间生产工况。这两个数据集分别称为源时刻和目标时刻的数据集，源时刻的数据集代表用于训练静态离散制造生产模型的数据，目标时刻的数据集代表车间运行工况和内外部条件发生改变后的数据，表示动态参数调整后适用于新时刻的系统模型，达成动态模型的自适应调整。接下来基于人工经验，按照一定的划分规则(完全等分数据集、按照生产成本分割数据集成若干个对应成本相同的数据集或者按照生产的产品数量划分数据集)将源时刻的离散制造系统数据集划分为多个数据集。具体为：

步骤2、初始化动态离散制造系统模型；具体为：

步骤3、对数据进行预处理，构建任务池；一部分数据用于训练源模型，另一部分用于训练目标神经网络；具体包括如下步骤：

步骤32、Task抽取方法设置为M way-K shot，构建用于训练元学习模型的数据集；从meta-train classes中随机选取M_s个类别，每个类别随机选取L_s个样本(L_s>K_s)，组成一个Task T_s，其中每个类别中随机选取K_s个样本作为当前Task的训练集，称为支持集support set，剩余M_s*(L_s-K_s)个样本作为当前Task的测试集，称为查询集query set，从meta-train classes中如此反复随机抽取Task，构成由若干个T构成的Task池，其分布定义为p(T_s)；

步骤4、构建一个元学习框架，分为训练元学习模型和快速调整目标神经网络，实现多任务之间的快速迁移；具体包括如下步骤：

步骤41、训练元学习模型Q_s，具体包括如下步骤：

(a)随机初始化Q_s的模型参数θ_s；

(f)返回步骤(b)，重新采样下一个batch；

上式中，θ′_ti为基于T_i更新后的模型Q_t的参数；

步骤5、更换目标时刻，利用元学习框架将训练好的神经网络快速迁移到新的任务；具体包括如下步骤：

步骤51、将训练好的目标神经网络模型Q_t作为源模型，下一时刻t+1作为新的目标时刻，根据步骤12划分这两个时间段的数据集。接下来的任务是将神经网络模型从时刻t快速迁移到时刻t+1；

步骤52、根据步骤3进行数据预处理，构建任务池；

步骤6、迭代步骤5直到动态离散制造系统模型收敛，收敛后保存模型参数；具体包括如下步骤：

步骤7、将动态离散制造系统模型用于新环境任务，测试其性能；具体为：如果系统模型在新环境下能很好的输出调度策略，比原系统具有更高的效率，则结果符合预期，训练完成；如果结果不符合预期，则重新回到步骤1，重新训练。

Claims

一种基于知识自演化的人工智能跨平台模型智能计算引擎构建方法，其特征在于，包括如下步骤：

步骤1、确认源时刻和目标时刻；基于人工经验，按照一定的划分规则对这两个不同时间段的离散制造系统数据集进行划分；

步骤2、初始化动态离散制造系统模型；

步骤3、对数据进行预处理，构建任务池；一部分数据用于训练源模型，另一部分用于训练目标神经网络；

步骤4、构建一个元学习框架，分为训练元学习模型和快速调整目标神经网络，实现多任务之间的快速迁移；

步骤5、更换目标时刻，利用元学习框架将训练好的神经网络快速迁移到新的任务；

步骤6、迭代步骤5直到动态离散制造系统模型收敛，收敛后保存模型参数；

步骤7、将动态离散制造系统模型用于新环境任务，测试其性能。
如权利要求1所述的基于知识自演化的人工智能跨平台模型智能计算引擎构建方法，其特征在于，步骤1中，基于人工经验，按照一定的划分规则将某一时刻的离散制造系统数据集划分为多个数据集具体为：

步骤11、选择源时刻s和目标时刻t，输入这两个时间段的离散制造数据；

步骤12、按照等分、生产成本或产品数量规则，基于人工经验，分别将这两个时间段的数据集划分为最优的N_s和N_t个静态离散制造数据集。
如权利要求1所述的基于知识自演化的人工智能跨平台模型智能计算引擎构建方法，其特征在于，步骤2中，初始化动态离散制造系统模型具体为：

步骤21、基于深度强化学习算法，选择合适的深度强化学习神经网络Q，对动态离散制造系统模型的参数θ进行初始化；

步骤22、定义元学习算法的两个超参数α和β，具体取值需多次实验。
如权利要求1所述的基于知识自演化的人工智能跨平台模型智能计算引擎构建方法，其特征在于，步骤3中，对数据进行预处理，构建任务池；一部分数据用于训练源模型，另一部分用于训练目标神经网络具体包括如下步骤：

步骤31、依据步骤12划分的数据，源时刻具有的N_s个类别称为meta-train classes，用于训练元学习模型Q_s，表示适用于当前时刻和工况的静态模型；目标时刻具有的N_t个类别称为meta-test classes，用于训练目标模型Q_t，其表示动态参数调整后适用于新时刻新工况的离散制造系统模型；

步骤32、Task抽取方法设置为M way-K shot，构建用于训练元学习模型的数据集；从meta-train classes中随机选取M_s个类别，每个类别随机选取L_s个样本(L_s>K_s)，组成一个Task T_s，其中每个类别中随机选取K_s个样本作为当前Task的训练集，称为支持集support set，剩余M_s*(L_s-K_s)个样本作为当前Task的测试集，称为查询集query set，从meta-train classes中如此反复随机抽取Task，构成由若干个T构成的Task池，其分布定义为p(T_s)；

步骤33、构建用于训练目标模型的数据集，从meta-test classes中随机选取M_t个类别，每个类别随机选取L_t个样本(L_t>K_t)，组成一个Task T_t，其中每个类别中随机选取K_t个样本作为当前Task的训练集，称为support set，剩余M_t*(L_t-K_t)个样本作为当前Task的测试集，称为query set，从meta-test classes中反复随机抽取Task，构成由若干个T构成的Task池，其分布定义为p(T_t)。
如权利要求1所述的基于知识自演化的人工智能跨平台模型智能计算引擎构建方法，其特征在于，步骤4中，构建一个元学习框架，分为训练元学习模型和快速调整目标神经网络，实现多任务之间的快速迁移具体包括如下步骤：

步骤41、训练元学习模型Q_s，具体包括如下步骤：

(a)随机初始化Q_s的模型参数θ_s；

(b)随机从Task池中采样n_s个Task T，形成一个batch，其中每一个Task T_i(i＝1,2,3…,n_s)满足分布T_i～p(T_s)；

(c)利用batch中的某一个Task T_i中的support set，计算模型参数θ_s的梯度模型参数θ_s的更新公式如下：

上式中，θ′_si为基于T_i更新后的模型Q_s的参数，为基于T_i计算出θ_s的损失梯度函数；

(d)基于batch中的每一个Task重复步骤(c)，执行次数为n_a，如此完成第一次梯度的更新，获得更新后的参数θ_s；

(e)第二次梯度的更新：利用batch中的每一个Task T_i中的query set，计算θ_s的损失梯度，进而计算batch的损失总和，利用该损失总和对梯度进行更新，其更新公式如下：

如此便完成第二次梯度的更新，结束模型在该batch上的训练；

(f)返回步骤(b)，重新采样下一个batch；

步骤42、训练结束后获得神经网络Q_s的初始化参数θ_s，根据目标时刻的数据集动态调整模型参数使其适应新的内外部生产环境，训练目标模型Q_t具体包括如下步骤：

(g)初始化Q_t的模型参数，将Q_s的模型参数赋值Q_t，即θ_t＝θ_s；

(h)随机从Task池中采样n_t个Task T，其中每一个Task T_i(i＝1,2,3…,n)满足分布T_i～p(T_t)；

(i)利用随机抽取的某一个Task T_i中的support set，更新模型参数θ_t的梯度模型参数θ_t的更新公式如下：

上式中，θ′_ti为基于T_i更新后的模型Q_t的参数；

(j)基于步(h)中随机抽取的每一个Task，分别对步骤(g)中初始化的参数θ_b运用步骤(i)的更新算法，获得n_t个更新后的参数θ′_ti，对其取平均获得最终的模型参数，其公式如下：

以上便是目标模型Q_t的训练过程，最终获得适用于目标时刻t的神经网络模型Q_t，实现参数的动态调整和系统模型的快速迁移。
如权利要求1所述的基于知识自演化的人工智能跨平台模型智能计算引擎构建方法，其特征在于，步骤5中，更换目标时刻，利用元学习框架将训练好的神经网络快速迁移到新的任务具体包括如下步骤：

步骤51、将训练好的目标神经网络模型Q_t作为源模型，下一时刻t+1作为新的目标时刻，接下来的任务是将神经网络模型从时刻t快速迁移到时刻t+1；

步骤52、根据步骤3进行数据预处理，构建任务池；

步骤53、根据步骤4，获得新的目标神经网络Q_t+1的参数θ_t+1。
如权利要求1所述的基于知识自演化的人工智能跨平台模型智能计算引擎构建方法，其特征在于，步骤6中，迭代步骤5直到动态离散制造系统模型收敛，收敛后保存模型参数具体包括如下步骤：

步骤61、迭代步骤5，不断获取下一时刻的神经网络模型Q_t、Q_t+1、Q_t+2…，直到模型参数收敛，表示该系统模型已经能很好的适应于不同时间段不同工况的生产环境，无论内外部条件如何变化，都能稳定的输出最优决策；

步骤62、模型收敛后，保存模型参数，获得最终的动态离散制造系统模型。
如权利要求1所述的基于知识自演化的人工智能跨平台模型智能计算引擎构建方法，其特征在于，步骤7中，将动态离散制造系统模型用于新环境任务，测试其性能具体为：如果系统模型在新环境下能很好的输出调度策略，比原系统具有更高的效率，则结果符合预期，训练完成；如果结果不符合预期，则重新回到步骤1，重新训练。