CN116107279A

CN116107279A - 基于注意力深度神经网络的流程工业能耗多目标优化方法

Info

Publication number: CN116107279A
Application number: CN202310137422.2A
Authority: CN
Inventors: 李晓洁; 谢贻富; 高学贵; 沈亚; 邱峰; 刘胜军; 范武松
Original assignee: Hefei City Cloud Data Center Co ltd
Current assignee: Hefei City Cloud Data Center Co ltd
Priority date: 2023-02-20
Filing date: 2023-02-20
Publication date: 2023-05-12

Abstract

本发明涉及一种基于注意力深度神经网络的流程工业能耗多目标优化方法，包括：获得流程工业数据集，构建基于注意力深度神经网络的预测模型，使用流程工业数据集进行训练，得到电力消耗模型E、水能消耗模型W、燃气消耗模型G和产品质量模型Q，将电力消耗模型E、水能消耗模型W和燃气消耗模型G线性组合得到能耗预测模型EC；采用多目标优化算法对能耗预测模型EC和产品质量模型Q进行优化，得到优化结果。本发明利用多目标优化算法对能耗组合及能耗指标进行优化，在不降低质量的同时实现降低企业的综合能耗成本；多目标优化能通过综合寻优的方式缓解目标函数之间的冲突，得出更多可选方案，根据决策得到的均衡解反映用户需求。

Description

基于注意力深度神经网络的流程工业能耗多目标优化方法

技术领域

本发明涉及流程工业生产能耗优化技术领域，尤其是一种基于注意力深度神经网络的流程工业能耗多目标优化方法。

背景技术

流程工业的生产过程有着不中断、连续性的典型特征，又被称之为连续型工业，流程工业的生产过程可视为一个多参量的函数。自变量是原材料、能源等生产要素，因变量是产品质量等输出结果。流程工业的代表行业有石油、化工、焦化、钢铁、水泥、玻璃等行业。中国在这些领域的年产值均占有近似全球一半的比重，其中能源就是主要的工业生产要素，是流程工业企业的主要生产成本项。故而研究工业生产过程中能源的消耗预测、能耗的优化问题非常重要，不仅可以帮助企业降本增效，也可以优化全社会的能源要素配置。

工业的生产线冗长、生产过程是个复杂的系统工程。现有的能耗预测工作，其训练模型前的特征选择工作往往依赖于生产专家的人工经验，无法做到自适应选择。此外，特征向量的选择往往影响着模型效果的天花板，不同专家认知下的特征向量的选择结果会出现不同，故而造成模型在行业内的泛化性差，影响研究成果的推广与落地。

同时，在实际的工业生产场景下，某一个工艺段会存在使用多种能源的情况，例如焦化生产过程就会同时使用水、电、燃气。现有的节能降耗研究工作大多着眼于单品种的能耗优化问题，然而企业的能耗优化问题是着眼于综合能耗生产要素基础之上的一个组合优化问题。

发明内容

为解决流程工业能耗预测中特征工程的复杂性问题以及能耗优化的单目标问题，本发明的目的在于提供一种利用多目标优化算法对能耗组合及能耗指标进行优化，在不降低质量的同时实现降低企业的综合能耗成本的基于注意力深度神经网络的流程工业能耗多目标优化方法。

为实现上述目的，本发明采用了以下技术方案：一种基于注意力深度神经网络的流程工业能耗多目标优化方法，该方法包括下列顺序的步骤：

(1)获得流程工业数据集，构建基于注意力深度神经网络的预测模型，使用流程工业数据集对基于注意力深度神经网络的预测模型进行训练，得到四个模型分别为：电力消耗模型E、水能消耗模型W、燃气消耗模型G和产品质量模型Q，将电力消耗模型E、水能消耗模型W和燃气消耗模型G线性组合得到能耗预测模型EC；

(2)采用多目标优化算法对能耗预测模型EC和产品质量模型Q进行优化，得到优化结果。

所述步骤(1)具体包括以下步骤：

(1a)采集流程工业数据，进行数据清洗，得到流程工业数据集，将流程工业数据集按比例划分为训练集和测试集；

(1b)进行数据标准化处理；

(1c)构建基于注意力深度神经网络的预测模型，将训练集输入基于注意力深度神经网络的预测模型进行训练，得到能耗预测模型EC和产品质量模型Q；

(1d)将测试集输入能耗预测模型EC和产品质量模型Q，计算测试集上预测值和实测值的误差，达到误差允许范围则视为训练结束，否则返回步骤(1c)调整网络结构重新训练。

所述步骤(2)具体包括以下步骤：

(2a)确定能耗优化过程中的决策变量个数与每个决策变量的范围；

(2b)确定能耗优化过程中的两个目标函数即能耗预测模型EC和产品质量模型Q；

(2c)使用多目标优化算法即NSGA-Ⅱ算法对这两个目标函数进行优化；

(2d)当NSGA-Ⅱ算法满足最终迭代次数时输出优化结果；

(2e)将得到的优化结果进行仿真验证。

所述步骤(1b)具体是指：对流程工业数据集的数据进行标准化处理，使得X～N(0,1)，即均值为0，方差为1的标准正态分布；标准正态化针对所有样本的任一维度数据x_t进行，计算公式如下：

其中，

为第t维数据的均值，σ_t为第t维数据的标准差，t∈[1,n]。

所述步骤(1c)具体包括以下步骤：

(1c1)确定注意力深度神经网络ADNN的网络结构，注意力深度神经网络ADNN分为注意力部分和深度神经网络DNN部分，标准化输入向量X＝(x′₁，x′₂，...，x′_n)^T；

根据输入向量X，计算注意力向量V＝σ(g(X))；

其中，g为一维卷积，卷积核长度k根据输入维度自适应调整，k的计算公式为：

其中，s和b均是量纲为1的参数，s＝2，b＝1，n为输入向量X的维度，通过一维卷积得到中间向量Z＝(z₁，z₂，…，z_n)^T，再通过激活函数Softmax将其值域缩放至(0，1)，转化为注意力向量V，其中，σ为激活函数Softmax，计算公式如下：

最后将注意力向量V和输入向量X进行哈达玛积运算，得到重构后的输入向量

深度神经网络DNN的层数根据整体样本的大小和特征维度来确定，选取3至5层；

深度神经网络DNN各层输出公式如下：

其中，深度神经网络DNN部分中选择Relu函数作为激活函数，其表达式为f(x)＝max(0，x)；X^(l-1)表示l-1层的输入，W^(l-1)表示l-1层的权重，b^(l-1)表示l-1层的偏置；

表示l层的输出预测值；

其次，注意力深度神经网络ADNN的初始化阶段随机分配算法的权值与偏置，同时设置最大迭代次数epoch和学习率η；

(1c2)从训练集中选择小批量m个样本输入至注意力深度神经网络ADNN的输入层，然后通过注意力深度神经网络ADNN前向计算得到m个样本的电力消耗预测值E_hat；根据E_hat与实测值E_tr计算损失值，对于回归类型连续值，损失函数选用均方误差，公式如下：

(1c3)计算梯度并进行反向传递来调整权值和偏置；

整个注意力深度神经网络ADNN中，权值和偏置是网络学习的核心，采用梯度下降法来更新，其公式如下：

其中，W′为调整后的权值，b′为调整后的偏置，η为学习率；

表示权值的梯度；

表示偏置的梯度；

(1c4)从训练集中选取新的未被训练的m个样本返回步骤(1c2)，直至训练集中所有样本训练完毕；

(1c5)记录整体样本损失，若全局损失不再下降或达到最大学习次数即完成训练；判断能耗预测模型EC的预测要求是否达到了指定的预测误差要求，当均方损失不再下降或者达到迭代轮次上限，结束训练；

(1c6)根据余弦退火方法动态更新学习率，并返回步骤(1c2)，开始下一轮训练，余弦退火公式如下：

其中，η_t为调整过后的学习率，η_max，η_min分别为最大和最小学习率；T_cur表示当前执行了多少轮次，T_i为总的训练轮次。

所述步骤(1d)具体包括以下步骤：

(1d1)输入验证集数据，然后通过基于注意力深度神经网络的能耗预测模型前向计算出电力消耗预测值E_hat；

(1d2)计算电力消耗预测值E_hat与实测值E_tr的损失，达到误差允许范围则视为结束，否则返回步骤(1c)调整网络结构重新训练。

所述步骤(2a)具体是指：通过分析流程工业数据集的历史生产数据，提取出生产过程中的决策变量个数N和每个决策变量的取值范围[1b，ub]，其中，1b是一组N维的向量，表示N个决策变量的取值下界；ub是一个N维向量，表示N个决策变量的取值上界；通过确定1b和ub确定多目标优化过程中问题搜索空间的范围；在流程工业中把注意力深度神经网络ADNN输入的特征数作为决策变量的个数，1b和ub则是所有特征的最大值和最小值所形成的两个数组。

所述步骤(2b)具体是指：能耗预测模型EC即能耗优化目标函数的公式为：

EC＝α×E+β×W+γ×G

其中，α，β和γ的和为1，如果α的值越大，则能耗优化过程中更看重对电力能耗的优化，同理β和γ；产品质量目标函数就是产品质量模型Q。

所述步骤(2c)具体是指：设置NSGA-II算法的种群规模P为30，迭代次数T为100；并确定问题的决策变量N，每个决策变量的取值范围[lb，ub]，能耗优化目标函数和产品质量目标函数输入NSGA-II算法；在多目标优化过程中，NSGA-II算法找到一组解集使得能耗变低即让总能耗目标函数的值变低，并提高产品的质量即使产品质量目标函数的值变高。

所述步骤(2d)具体是指：当NSGA-Ⅱ算法满足达到最大迭代次数后输出多目标优化的最优解集，最优解集的个数与种群规模一致，设置种群规模为30，则最后输出一个包含30个解的优化结果。

由上述技术方案可知，本发明的有益效果为：第一，本发明利用注意力机制实现自适应特征选择，一方面可以帮助企业克服因业务专家人为定义特征变量带来的主观性问题，另一方面可以有自适应机制，可应对流程工业能耗预测中特征工程的复杂性问题，对提高模型的预测准确性有帮助；第二，本发明利用多目标优化算法对能耗组合及能耗指标进行优化，在不降低质量的同时实现降低企业的综合能耗成本；与单目标方法相比，多目标优化能通过综合寻优的方式缓解目标函数之间的冲突，得出更多可选方案，根据决策得到的均衡解反映用户需求，因此多目标优化相较单目标优化更具有优势。

附图说明

图1为本发明中能耗预测模型的示意图；

图2为本发明的能耗预测方法流程图；

图3为基于NSGA-Ⅱ的多目标能耗优化流程图。

具体实施方式

一种基于注意力深度神经网络的流程工业能耗多目标优化方法，该方法包括下列顺序的步骤：

如图2所示，所述步骤(1)具体包括以下步骤：

(1b)进行数据标准化处理；

如图3所示，所述步骤(2)具体包括以下步骤：

(2c)使用多目标优化算法即NSGA-II算法对这两个目标函数进行优化；

(2d)当NSGA-II算法满足最终迭代次数时输出优化结果；

(2e)将得到的优化结果进行仿真验证，将多个优化结果在仿真平台上进行验证去选择出合适的一个或几个解，将验证的结果提供给工厂进行生产部署，去降低能源消耗。

所述步骤(1b)具体是指：对流程工业数据集的数据进行标准化处理，使得X～N(0，1)，即均值为0，方差为1的标准正态分布；标准正态化针对所有样本的任一维度数据x_t进行，计算公式如下：

其中，

为第t维数据的均值，σ_t为第t维数据的标准差，t∈[1，n]。

如图1所示，所述步骤(1c)具体包括以下步骤：

(1c1)确定注意力深度神经网络ADNN的网络结构，注意力深度神经网络ADNN分为注意力部分和深度神经网络DNN部分，标准化输入向量X＝(x′₁，x′₂，...，x′_n)^T

根据输入向量X，计算注意力向量V＝σ(g(X))；

深度神经网络DNN各层输出公式如下：

表示l层的输出预测值；

(1c3)计算梯度并进行反向传递来调整权值和偏置；

表示权值的梯度；

表示偏置的梯度；

所述步骤(1d)具体包括以下步骤：

所述步骤(2a)具体是指：通过分析流程工业数据集的历史生产数据，提取出生产过程中的决策变量个数N和每个决策变量的取值范围[1b，ub]，其中，lb是一组N维的向量，表示N个决策变量的取值下界；ub是一个N维向量，表示N个决策变量的取值上界；通过确定lb和ub确定多目标优化过程中问题搜索空间的范围；在流程工业中把注意力深度神经网络ADNN输入的特征数作为决策变量的个数，1b和ub则是所有特征的最大值和最小值所形成的两个数组。

EC＝α×E+β×W+γ×G

所述步骤(2c)具体是指：设置NSGA-II算法的种群规模P为30，迭代次数T为100；并确定问题的决策变量N，每个决策变量的取值范围[1b，ub]，能耗优化目标函数和产品质量目标函数输入NSGA-II算法；在多目标优化过程中，NSGA-II算法找到一组解集使得能耗变低即让总能耗目标函数的值变低，并提高产品的质量即使产品质量目标函数的值变高。

所述步骤(2d)具体是指：当NSGA-II算法满足达到最大迭代次数后输出多目标优化的最优解集，最优解集的个数与种群规模一致，设置种群规模为30，则最后输出一个包含30个解的优化结果。

注意力深度神经网络(Attention Deep Neural Network，ADNN)是一种将注意力机制融入深度神经网络的架构，通过注意力机制自适应的调整输入向量权重，降低特征工程中人工选择特征带来的主观性和误差。之后将重构后的输入向量输入深度神经网络得到预测结果。

整个ADNN网络的步骤为：输入层接收输入向量(x₁，x₂，x₃，…，x_n)，记为X，通过一维卷积和softmax激活函数得到相同长度的注意力向量V，X和V进行哈达玛积(相应位置点乘)得到重构后的特征

将重构后的特征

经过多层隐藏层前向计算，输出最终的结果。

在整个过程中，一维卷积学习的是卷积核的共享权值，多层隐藏层学习的是权重和偏置。整个ADNN网络通过反向传播调整权值和偏置，它实现了自适应的特征选择功能。

流程工业实际生产过程中的数据不同于公开数据集，往往伴随着大量脏数据和缺省值，因此要对其进行数据清洗工作。其中，脏数据中重复和明显错误的两类数据，可以经过人工选择直接删除，因为在构建流程工业数据集时会采用大量历史运行数据，删除其中少量的重复和错误数据并不会影响数据集的丰富程度，同时还能提升数据集的质量。

而对于缺省值的处理，可以选择常用的中值填充、均值填充和按比例填充等方法，这个可以分析数据集的特性来进行选择。

此外，本模型的输入向量应规范为连续数值型，对于数据中的哑变量，如：机器运行时间为白天或夜晚，应采取独热编码(一位有效编码，其方法是使用N位状态寄存器来对N个状态进行编码，每个状态都有它独立的寄存器位，并且在任意时候，其中只有一位有效)的方式转化为0,1数值型，将离散特征的取值扩展到欧式空间，原始数据的维度也会相应的扩增。

综上所述，本发明利用注意力机制实现自适应特征选择，一方面可以帮助企业克服因业务专家人为定义特征变量带来的主观性问题，另一方面可以有自适应机制，可应对流程工业能耗预测中特征工程的复杂性问题，对提高模型的预测准确性有帮助；本发明利用多目标优化算法对能耗组合及能耗指标进行优化，在不降低质量的同时实现降低企业的综合能耗成本；与单目标方法相比，多目标优化能通过综合寻优的方式缓解目标函数之间的冲突，得出更多可选方案，根据决策得到的均衡解反映用户需求，因此多目标优化相较单目标优化更具有优势。

Claims

1.一种基于注意力深度神经网络的流程工业能耗多目标优化方法，其特征在于：该方法包括下列顺序的步骤：

2.根据权利要求1所述的基于注意力深度神经网络的流程工业能耗多目标优化方法，其特征在于：所述步骤(1)具体包括以下步骤：

(1b)进行数据标准化处理；

3.根据权利要求1所述的基于注意力深度神经网络的流程工业能耗多目标优化方法，其特征在于：所述步骤(2)具体包括以下步骤：

(2d)当NSGA-Ⅱ算法满足最终迭代次数时输出优化结果；

(2e)将得到的优化结果进行仿真验证。

4.根据权利要求2所述的基于注意力深度神经网络的流程工业能耗多目标优化方法，其特征在于：所述步骤(1b)具体是指：对流程工业数据集的数据进行标准化处理，使得X～N(0,1)，即均值为0，方差为1的标准正态分布；标准正态化针对所有样本的任一维度数据x_t进行，计算公式如下：

其中，

为第t维数据的均值，σ_t为第t维数据的标准差，t∈[1,n]。

5.根据权利要求2所述的基于注意力深度神经网络的流程工业能耗多目标优化方法，其特征在于：所述步骤(1c)具体包括以下步骤：

(1c1)确定注意力深度神经网络ADNN的网络结构，注意力深度神经网络ADNN分为注意力部分和深度神经网络DNN部分,标准化输入向量X＝(x′₁,x′₂,…,x′_n)^T；

根据输入向量X，计算注意力向量V＝σ(g(X))；

其中，s和b均是量纲为1的参数，s＝2,b＝1,n为输入向量X的维度，通过一维卷积得到中间向量Z＝(z₁,z₂,…,z_n)^T,再通过激活函数Softmax将其值域缩放至(0,1)，转化为注意力向量V，其中，σ为激活函数Softmax,计算公式如下：

深度神经网络DNN各层输出公式如下：

其中，深度神经网络DNN部分中选择Relu函数作为激活函数，其表达式为f(x)＝max(0,x)；X^(l-1)表示l-1层的输入，W^(l-¹⁾表示l-1层的权重，b^(l-1)表示l-1层的偏置；

表示l层的输出预测值；

(1c3)计算梯度并进行反向传递来调整权值和偏置；

其中，W'为调整后的权值，b'为调整后的偏置，η为学习率；

表示权值的梯度；

表示偏置的梯度；

6.根据权利要求2所述的基于注意力深度神经网络的流程工业能耗多目标优化方法，其特征在于：所述步骤(1d)具体包括以下步骤：

7.根据权利要求3所述的基于注意力深度神经网络的流程工业能耗多目标优化方法，其特征在于：所述步骤(2a)具体是指：通过分析流程工业数据集的历史生产数据，提取出生产过程中的决策变量个数N和每个决策变量的取值范围[lb,ub]，其中，lb是一组N维的向量，表示N个决策变量的取值下界；ub是一个N维向量，表示N个决策变量的取值上界；通过确定lb和ub确定多目标优化过程中问题搜索空间的范围；在流程工业中把注意力深度神经网络ADNN输入的特征数作为决策变量的个数，lb和ub则是所有特征的最大值和最小值所形成的两个数组。

8.根据权利要求3所述的基于注意力深度神经网络的流程工业能耗多目标优化方法，其特征在于：所述步骤(2b)具体是指：能耗预测模型EC即能耗优化目标函数的公式为：

EC＝α×E+β×W+γ×G

9.根据权利要求3所述的基于注意力深度神经网络的流程工业能耗多目标优化方法，其特征在于：所述步骤(2c)具体是指：设置NSGA-Ⅱ算法的种群规模P为30，迭代次数T为100；并确定问题的决策变量N，每个决策变量的取值范围[lb,ub],能耗优化目标函数和产品质量目标函数输入NSGA-Ⅱ算法；在多目标优化过程中，NSGA-Ⅱ算法找到一组解集使得能耗变低即让总能耗目标函数的值变低，并提高产品的质量即使产品质量目标函数的值变高。

10.根据权利要求3所述的基于注意力深度神经网络的流程工业能耗多目标优化方法，其特征在于：所述步骤(2d)具体是指：当NSGA-Ⅱ算法满足达到最大迭代次数后输出多目标优化的最优解集，最优解集的个数与种群规模一致，设置种群规模为30，则最后输出一个包含30个解的优化结果。