CN114787837A

CN114787837A - 采用机器学习方法预测工业老化过程

Info

Publication number: CN114787837A
Application number: CN202080081945.4A
Authority: CN
Inventors: N·雅库特; S·索尔; M·博戈耶斯基; F·霍恩; K-R·穆勒
Original assignee: BASF SE; Technische Universitaet Berlin
Current assignee: BASF SE; Technische Universitaet Berlin
Priority date: 2019-11-26
Filing date: 2020-11-25
Publication date: 2022-07-22
Also published as: WO2021105246A1; EP4066182A1; US20230028276A1; US11860617B2

Abstract

通过准确预测工业老化过程(IAP)，诸如化学工厂中催化剂的缓慢失活，可以进一步提前安排维护事件，从而确保工厂的成本效益和可靠操作。到目前为止，这些劣化进展通常由机械模型或简单的经验预测模型来描述。为了准确预测IAP，提出了数据驱动模型，将一些传统的无状态模型(线性和核岭回归，以及前馈神经网络)与更复杂的状态递归神经网络(回声状态网络和长短期记忆网络)进行比较。此外，还讨论了有状态模型的变体。特别是使用关于劣化动态的机械预知识的有状态模型(混合模型)。有状态模型及其变体在足够大的数据集上训练时可能更适合生成近乎完美的预测，而混合模型可能更适合在不断变化的条件的较小数据集下的情况下更好地泛化。

Description

采用机器学习方法预测工业老化过程

技术领域

本发明涉及用于预测化学生产工厂的劣化进展的计算机实现的方法和装置。本发明进一步涉及一种计算机程序单元和一种计算机可读介质。

背景技术

关键资产的老化在任何生产环境中都是普遍存在的现象，导致大量维护支出或导致生产损失。因此，无论是在分立制造还是在加工工业中，对潜在劣化进展的理解和预测对于可靠且经济的工厂操作都非常重要。

以化学工业为重点，众所周知的老化现象包括：由于焦化、烧结或中毒而导致的非均相催化剂的失活；由于焦炭层形成或聚合而导致在过程侧的过程装备(诸如热交换器或管道)的堵塞；由于微生物或结晶沉积物而导致的在水侧的热交换器的污垢；流化床反应器中所安装的装备(诸如喷嘴或管道)的腐蚀；等等。

对于化学工程中几乎任何重要的老化现象，相应的科学界都对其微观和宏观驱动力有了详细的理解。该理解通常被浓缩成复杂的数学模型。此类机械劣化模型的示例涉及蒸汽裂解炉的焦化、非均相催化剂的烧结或焦化，或热交换器的结晶污垢。

虽然这些模型对实验不可访问量的动态提供了有价值的见解，并且可能有助于验证或证伪关于一般劣化机制的假设，但它们可能无法或仅通过大量的建模工作才能转移到真实世界的装置中的特定环境：广义上讲，这些模型通常可以描述实验室环境中劣化进展的“清洁”观察结果，并且可能无法反映生产中的“肮脏”现实，其中难以或不可能产生附加的影响机械地建模。仅举一个示例，即使在平坦表面上的Wulff形颗粒的“清洁”系统中，负载型金属催化剂的烧结动态也难以定量建模——而在真正的非均相催化剂中，表面形态和颗粒形状可能与此假设有很大偏差。因此，在生产环境中很少使用机械模型来预测关键资产的劣化动态。

发明内容

可能需要对化学生产工厂的工业老化过程(IAP)的预期进展提供合理的预测。

本发明的目的通过独立权利要求的主题来解决，其中进一步的实施例并入从属权利要求中。应当注意，本发明的以下描述的方面也适用于计算机实现的方法、装置、计算机程序单元、以及计算机可读介质。

本发明的第一方面涉及一种用于预测化学生产工厂的劣化进展的计算机实现的方法。该方法包括：

a)经由输入通道接收当前测量的过程数据，该当前测量的过程数据指示用于化学生产工厂的至少一个化学过程装备的当前操作的当前过程条件，其中，至少一个化学过程装备具有用于量化至少一个化学过程装备的劣化进展的一个或多个劣化关键性能指标KPI；

b)经由输入通道接收一个或多个预期操作参数，该预期操作参数指示在预测范围内至少一个化学过程装备的计划操作条件；

c)由处理器将数据驱动模型应用到包括当前测量的过程数据和一个或多个预期操作参数的输入数据集，以估计预测范围内的一个或多个劣化KPI的未来值，其中，根据训练数据集对数据驱动模型进行参数化或训练，其中，训练数据集是基于包括过程数据和一个或多个劣化KPI的历史数据集；以及

d)经由输出通道提供预测范围内的一个或多个劣化KPI的未来值，该未来值可用于监视和/或控制。

换句话说，提供了一种用于根据化学生产工厂的当前过程条件和计划操作条件来预测化学生产工厂的一个或多个装备的短期劣化进展和/或预测长期劣化进展的方法。在较短的时间尺度内，所选择的参数可表现出波动，该波动并非由劣化进展本身驱动，而是由变化的过程条件或背景变量(诸如环境温度)驱动。换句话说，一个或多个劣化KPI在很大程度上由过程条件确定，而不是不受控制的外部因素，诸如有缺陷的管道爆裂。在比典型生产时间尺度更长的时间尺度上，例如不连续过程的批处理时间或连续过程的设定点变化之间的典型时间，所选择的参数基本单调地变化为更高或更低的值，从而指示不可逆劣化现象的发生。

在一些示例中，该方法可以进一步包括将一个或多个KPI的未来值与阈值进行比较并确定满足阈值的未来时间的步骤。该时间信息然后可以经由输出通道提供或用于预测维护事件。

该方法使用数据驱动模型，例如数据驱动机器学习(ML)模型，其不涉及化学生产工厂的一个或多个化学过程装备的先验物理化学过程。数据驱动模型能够使用一个或多个关键性能指标(KPI)来预测化学生产工厂的短期和长期劣化进展，作为输入参数的函数，该输入参数包括指示至少一个化学过程装备的计划操作条件的一个或多个预期操作参数，以及从生产工厂中可用的传感器导出的过程数据。还提供了一种用于执行该方法的软件产品。作为应用示例，该方法可用于预测和预报化学生产工厂中的以下劣化进展中的至少一种：由于焦化、烧结和/或中毒导致的非均相催化剂的失活；由于焦炭层形成和/或聚合而在过程侧的化学过程装备的堵塞；由于微生物和/或结晶沉积物而导致在水侧的热交换器的污垢；以及流化床反应器中所安装的装备的腐蚀。

数据驱动模型是指训练的数学模型，该训练的数学模型根据训练数据集进行参数化，以反映化学生产工厂中真实劣化进展的动态。在一些示例中，数据驱动模型可包括数据驱动机器学习模型。如在此所使用的，术语“机器学习”可以指使机器能够从数据中“学习”任务而无需显式编程的统计方法。机器学习技术可包括“传统机器学习”——人工选择特征并且然后训练模型的工作流程。传统机器学习技术的示例可包括决策树、支持向量机、和集成方法。在一些示例中，数据驱动模型可包括数据驱动深度学习模型。深度学习是以人脑的神经通路松散地建模的机器学习的子集。深度是指输入层和输出层之间的多层。在深度学习中，算法自动学习哪些特征是有用的。深度学习技术的示例可包括卷积神经网络(CNN)、递归神经网络(诸如长短期记忆或LSTM)和深度Q网络。机器学习和对应软件框架的一般介绍在“Machine Learning and Deep Learning frameworks and libraries for large-scale data mining:a survey”；Artificial Intelligence Review；Giang Nguyen etal.,June 2019,Volume 52,Issue 1,pp 77-124中描述。如将在下面并且特别关于图5至图9中所示的示例性实施例所解释的，数据驱动模型可包括有状态模型，该有状态模型是具有隐藏状态的机器学习模型，该隐藏状态随着新的时间步长而不断更新并且包含关于整个过去时间序列的信息。可替代地，数据驱动模型可包括无状态模型，该无状态模型是机器学习模型，其预测仅基于当前操作之前的固定时间窗口内的输入。换句话说，无状态模型还依赖于劣化KPI的过去值和输入侧的操作参数。可替代地，数据驱动模型可包括混合模型，即有状态模型和无状态模型的组合。

该至少一个化学过程装备可以是化学生产工厂的关键组件之一，因为关键组件的健康状态对化学生产工厂的维护活动具有显著的影响。有关关键组件的选择的信息的来源可以是不良行为者分析或一般操作经验。此类化学过程装备的劣化进展的示例可包括但不限于：由于焦化、烧结和/或中毒而导致的非均相催化剂的失活；由于焦炭层形成和/或聚合而在过程侧的化学过程装备的堵塞；由于微生物和/或结晶沉积物而导致在水侧的热交换器的污垢；以及流化床反应器中所安装的装备的腐蚀。

该至少一个化学过程装备可以具有用于量化其劣化进展的一个或多个KPI。一个或多个劣化KPI可选自包括以下的参数：包含在一组经测量的过程数据中的参数和/或表示包含在一组经测量的过程数据中的一个或多个参数的函数的导出参数。换句话说，一个或多个劣化KPI可包括使用传感器(例如，温度传感器或压力传感器)直接测量的参数。一个或多个劣化KPI可替代地或另外地包括通过代理变量间接获得的参数。例如，虽然催化剂活性不直接在过程数据中测量，但它本身表现为过程的降低产率和/或转换率。一个或多个劣化KPI可以由以下来定义：用户(例如过程操作员)或由统计模型(例如在相关过程数据的多变量空间中测量到装备的“健康”状态的距离的异常分数，诸如Hotelling T²分数或从主成分分析(PCA)导出的DModX距离)。这里，健康状态可以指在历史过程数据的时段期间通常观察到的大部分状态，该状态被生产过程的专家标记为“正常”/“无问题”/“良好”。

过程数据可以指指示化学生产工厂的操作状态的量。例如，此类量可与在化学生产工厂的生产运行期间所收集的测量数据有关，并且可以直接或间接地从此类测量数据导出。例如，过程数据可包括通过安装在化学生产工厂中的传感器所测量的传感器数据、直接或间接从此类传感器数据导出的量。传感器数据可包括借助于安装的传感器(例如温度传感器、压力传感器、流量传感器等)在化学生产工厂中可用的测量量。

该组过程数据可包括原始数据，该原始数据是指基本的、未处理的传感器数据。可替代地或另外地，该组过程数据可包括直接或间接地从原始数据导出的处理或导出的参数。例如，虽然催化剂活性不直接在过程数据中测量，但它本身表现为过程的降低产率和/或转换率。用于催化剂活性的导出数据的示例可包括但不限于：从相应温度传感器导出的多个催化反应器的平均入口温度、从蒸汽流量和反应物流量的原始数据导出的蒸汽-油比率，以及任何类型的标准化数据，例如通过催化剂体积或催化剂质量归一化的生产值。

在当前生产运行的情况下，过程数据可包括关于当前操作条件的信息，如操作参数组所反映的，例如反应器的进料速率，其可以由工厂人员选择和/或控制。如在此所使用的，术语“当前”是指最近的测量，因为某些装备的测量可能不实时执行。

用于装备劣化的有用预测范围可能在数小时和数月之间。应用的预测范围可以由两个因素确定。首先，预测必须足够准确，才能用作决策的基础。为了达到准确性，未来生产计划的输入数据必须可用，其仅可用于有限的预测范围。此外，预测模型本身可能由于潜在的预测模型结构或由于不明确定义的模型参数而缺乏准确性，这可能是用于模型识别的历史数据集的噪声和有限性质的结果。其次，预测范围必须足够长，以解决相关的操作问题，诸如采取维护行动、制定计划决策。

计划操作条件可以指化学生产工厂在预测范围内未来可能运行的操作条件。计划的操作条件由一个或多个预期操作参数反映，该操作参数在预测范围内可能是已知的和/或可控的，而不是不受控制的外部因素。不受控制的外部因素的示例可包括灾难性事件，诸如有缺陷的管道破裂。不受控制的外部因素的其它示例可包括灾难性较小但更频繁的外部干扰，诸如变化的外部温度或变化的原材料质量。换句话说，可以在预测范围内计划或预期一个或多个预期操作参数。

采用一个或多个预期操作参数，它可以用于模拟“假设(what-if)”场景，例如过程条件的变化，诸如在预测范围内减少进料负载、进料组合物和反应器温度。需要注意的是，所提出的数据驱动模型不从过去和/或当前操作状态推断未来操作状态，而是需要用于一个或多个预期操作参数的用户输入，以便解释未来工厂的变化操作条件。预期操作参数的使用可解释工厂操作的未来变化。关键性能指标是输入参数的函数，包括指示至少一个化学过程装备的计划操作条件的一个或多个预期操作参数和从生产工厂中可用的传感器导出的过程数据。通过使用预期操作参数，可以将例如未来负载包括在系统上以进行预测。允许未来操作参数的值基于工厂中的规划而变化可以提供附加自由度，这可以提高预测模型的质量并且可以使预测更加稳健。

用于数据驱动模型的输入数据集可包括当前操作参数。当前操作参数可包括原始数据，该原始数据是指基本的、未处理的传感器数据。例如，反应器中的温度和/或压力、进入反应器的进料速率，其可以由工厂人员选择和/或控制。可替代地或另外地，该组过程数据可包括处理的或导出的参数，该参数直接或间接地从原始数据导出，例如从蒸汽流量和反应物流量的原始数据导出的蒸汽-油比率，以及任何类型的归一化数据。

根据本发明的实施例，该至少一个化学过程装备以包括多次运行(run)的循环方式运行。每次运行包括一个生产阶段，并接着再生阶段。输入数据集包括来自上次运行的至少一个过程信息。

换句话说，在资产循环操作的情况下，输入数据集可进一步包括来自上次运行的至少一个过程信息。上次运行可以是“当前运行”之前的运行，其中使用当前操作。来自上次运行的示例性过程信息可包括但不限于自上次再生以来的运行时间(time on stream)、自上次交换以来的运行时间、上次运行结束时的过程条件、上次运行的再生持续时间、以及上次运行的持续时间。出于预测目的，输入数据集可以另外包括关于预测范围的计划操作条件的信息。

根据本发明的实施例，该一个或多个劣化KPI选自包括以下的参数：包含在一组经测量的过程数据中的参数和/或表示包含在一组经测量的过程数据中的一个或多个参数的函数的导出参数。

根据本发明的实施例，所选择的参数具有以下特征中的至少一种：在比典型生产时间尺度更长的时间尺度上以基本单调的方式趋向更高或更低的值，从而指示不可逆劣化现象的发生，并在再生阶段之后恢复到基线。

再生阶段是过程中非常重要的特定部分，因为即使不更换过程装备，再生过程之后也可能导致KPI恢复到其基线。再生阶段的存在导致复杂的劣化行为。在该情况下，过程装备或催化剂可在不同的时间尺度上经历劣化。我们在一个循环内具有劣化行为，在循环结束时有再生阶段，并且同时我们观察到过程装备或催化剂装料的整个生命周期内的劣化。这将在下面并且特别关于图2中所示的示例解释。

再生阶段的存在可对数据驱动模型的输入参数的定义具有影响。在该情况下，附加输入参数可有利于提高预测的准确性。

尽管化学生产工厂中受影响的资产类型种类繁多，以及它们背后的物理或化学劣化进展完全不同，但表示一个或多个劣化KPI的所选择的参数可具有以下特征中的至少一种：

在比典型生产时间尺度更长的时间尺度上，例如不连续过程的批处理时间或连续过程的设定点变化之间的典型时间，所选择的参数基本单调地变化为更高或更低的值，从而指示不可逆劣化现象的发生。术语“单调的”或“单调地”是指表示劣化KPI的所选择的参数在较长时间尺度(例如劣化周期的时间尺度)上的增加或减少，而在较短时间尺度上的波动不影响该趋势。在较短的时间尺度上，所选择的参数可表现出波动，该波动并非由劣化进展本身驱动，而是由变化的过程条件或背景变量(诸如环境温度)驱动。换句话说，一个或多个劣化KPI在很大程度上由过程条件确定，而不是不受控制的外部因素，诸如有缺陷的管道爆裂、外部温度变化或原材料质量的变化。

在再生阶段之后，所选择的参数可返回到它们的基线。如在此所使用的，术语“再生”可指逆转劣化的任何事件/程序，包括过程装备或催化剂的更换、过程装备的清洁、催化剂的原位再活化、焦炭层的烧掉等。

在实例中，劣化包括以下中的至少一种：由于焦化、烧结和/或中毒导致的非均相催化剂的失活；由于焦炭层形成和/或聚合而在过程侧的化学过程装备的堵塞；由于微生物和/或结晶沉积物而导致在水侧的热交换器的污垢；以及流化床反应器中所安装的装备的腐蚀。

根据本发明的实施例，数据驱动模型包括有状态模型，该有状态模型是具有隐藏状态的机器学习模型，该隐藏状态随着新的时间步长不断更新并且包含关于整个过去时间序列的信息。可替代地或另外地，数据驱动模型包括无状态模型，该无状态模型是机器学习模型，该机器学习模型的预测仅基于当前操作之前的固定时间窗口内的输入。

无状态模型是机器学习模型，该机器学习模型的预测仅基于过去固定时间窗口内的输入。无状态模型的示例可包括但不限于线性岭回归(LRR)、核岭回归(KRR)、和前馈/前向神经网络(FFNN)。LRR是普通的线性回归模型，添加了正则化项，其可防止权重因训练集中的异常值而取极值。KRR是非线性回归模型，其可以使用所谓的“内核技巧”从LRR推导出来。与LRR类似，FFNN学习一些输入参数和一些输出值之间的直接映射。无状态模型(例如LRR、KRR和FRNN)可以准确地捕获由于变化的过程条件而导致的劣化KPI的瞬时变化。此外，训练无状态模型只需要少量训练数据。

与无状态模型相比，有状态模型仅显式使用输入x(t)，而不是过去的输入x(t-1),...,x(t-k)，来预测某个时间点t的输出y(t)。相反，它们维护系统的隐藏状态h(t)，该隐藏状态h(t)随着每个新的时间步长不断更新，并且因此包含有关整个过去时间序列的信息。然后可以利用当前输入条件以及模型的隐藏状态二者来预测输出。有状态模型可包括递归神经网络(RNN)，诸如回声状态网络(ESN)和长/短期记忆网络(LSTM)。有状态模型可有利于正确预测长期变化。

根据本发明的实施例，有状态模型包括递归神经网络(RNN)。

RNN具有隐藏状态或“记忆”，允许它们记住输入信号的重要特征，该特征只在以后影响输出。这可以被视为对“无记忆”机器学习方法的改进，因为劣化现象可表现出明显的记忆效应。

根据本发明的实施例，RNN包括以下中的至少一种：回声状态网络(ESN)和长短期记忆(LSTM)网络。

RNN是一种强大的时间序列建模方法。然而，它们可能难以训练，因为它们的深度随着时间序列的长度而增加。这可导致误差反向传播训练过程期间的梯度分叉，如果优化完全收敛，这可导致非常缓慢的收敛(“梯度消失问题”)。

ESN是一种替代的RNN架构，其通过完全不使用误差反向传播进行训练，从而绕过了上述RNN的训练相关问题。相反，ESN使用非常大的随机初始化权重矩阵，其结合过去输入的循环(recurrent)映射而本质上充当输入的随机特征扩展；统称为“存储库”。由于唯一学习的参数是用于最终预测的线性模型的权重，因此可以在较小的数据集上训练ESN，而不会冒太多过拟合的风险。

处理RNN中梯度消失问题的另一个示例性架构是长短期记忆(LSTM)架构。LSTM像往常一样使用误差反向传播进行训练，但通过使用称为“单元状态”的附加状态向量以及通常的隐藏状态来避免梯度消失的问题。由于对调节单元状态的门进行建模需要多个层，LSTM可能需要大量的训练数据以避免过拟合。尽管它很复杂，但LSTM梯度的稳定性使其非常适合具有长期依赖性的时间序列问题。

根据本发明的实施例，状态模型包括反馈状态模型，该反馈状态模型包括关于来自前一时间步长的到用于当前时间步长的输入数据集中的预测输出或真实输出的信息。预测输出是前一时间步长处的一个或多个预测KPI。真实输出是前一时间步长处的一个或多个测量的KPI。

尽管可以仅使用操作参数来预测过程的关键性能指标(KPI)，但将过去的KPI作为输入可成为强大的新信息来源，特别是因为在同一循环内KPI随时间的高度自相关性。将过去的KPI合并到有状态模型(例如LSTM)中的一种方法可能是将前一时间步长的预测输出或真实输出(如果可用)包含到当前时间步长的输入向量中。

根据本发明的实施例，输入数据集进一步包括指标变量，其指示来自前一时间步长的数据驱动模型的输出是预测输出还是真实输出。

包括预测输出(或真实输出)可导致较大的预测误差。原因是预测输出只是真实输出的近似值，并且因此不如真实输出可靠。由于先前的预测输出将用于下一个预测，因此预测输出值中的任何小误差都将传播到下一个输出的预测中。在较长的时间段内，这些小误差将累积，并可导致预测与真实输出时间序列大不相同，从而导致非常大的误差。因此，将可靠的真实输出与网络的不可靠预测输出区分开来至关重要，使得网络可以独立地估计这两个变量的可靠性。

实现这一点的一种方法可以在每个反馈输出值旁边包括指标变量，这将指示该输出值是否是真实输出，即来自过程的实际测量KPI，还是预测KPI，即来自上一时间步长处的有状态模型的输出。换句话说，因此，反馈状态模型可以简单地通过在每个时间步长处向输入向量附加两个值来实现：前一时间步长的输出值，以及指标变量，如果反馈值是真实测量的KPI，则为0，或者如果反馈值由前一步长处的有状态模型预测，则为1。

根据本发明的实施例，步骤a)进一步包括接收先前测量的过程数据，该过程数据指示在当前操作之前的预定时段内，化学生产工厂的至少一个化学过程装备的过去操作的过去过程条件。步骤b)进一步包括接收一个或多个过去操作参数，该过去操作参数指示在当前操作之前的预定时段内的至少一个化学过程装备的过去过程条件。在步骤c)中，输入数据集进一步包括先前测量的过程数据和一个或多个过去操作参数。

先前测量的过程数据也可以称为滞后数据。因此，无状态模型更加稳健。相比之下，没有滞后变量的无状态模型表示专门响应当前事件的系统。模型开发者可以例如根据装备的类型来选择滞后数据的当前操作之前的预定义时段。例如，预定义时段可以是装备的两次维护动作之间的典型时间段的5％、10％或15％。

根据本发明的实施例，无状态模型包括以下中的至少一种：线性岭回归(LRR)、核岭回归(KRR)和前馈神经网络(FFNN)。

根据本发明的实施例，数据驱动模型是混合模型，该混合模型包括用于预测一个或多个劣化KPI的劣化趋势的有状态模型和用于预测操作参数对一个或多个劣化KPI的附加瞬时影响的无状态模型。劣化趋势表示在比典型生产时间尺度更长的时间尺度上化学过程装备的性能的单调变化。操作参数的附加瞬时影响不包含模型输入对一个或多个劣化KPI的效应的时间延迟。

以该方式，有状态模型(例如RNN)通过提供关于过程的机械预信息(mechanistical pre-information)来提高数据效率。为了使有状态模型的学习问题更简单，将问题分为预测劣化KPI的短期或瞬时效应和长期行为。

在预测工业老化过程(IAP)的基本问题设置中，所有考虑的过程都受到一些潜在的劣化进展影响，其随着时间推移会降低过程效率。由于该劣化是长期的，并且在整个周期中发生，因此很难预测，因为它会受到周期早期条件影响，但该相关性在很大程度上是未知的，并且由于大的时间滞差而难以学习。然而，由于工程师通常了解劣化进展的基本动态，因此可以使用一些参数化原型函数对KPI的劣化进行参数化，其参数可以拟合以完美匹配给定周期的劣化曲线。为了使有状态模型的学习问题更简单，将问题分为预测输入对KPI的瞬时效应和长期效应。

隔离瞬时效应的一种方法可以是在没有任何时间信息的情况下训练线性模型。例如，当劣化的效应仍然很小，并且不使用时间变量作为输入，可以仅在周期的初始时间段上训练LRR模型，因此模型不会尝试从时间上下文而仅是输入对KPI的瞬时效应来学习。例如，周期的初始时间段可以是整个周期的初始1％-10％，优选1％-5％，其中可以预期劣化效应可以忽略不计。虽然该方法只会学习线性瞬时效应，但通常这足以从周期中去除大部分瞬时伪影，使得残差反映劣化曲线。如前所述，然后可以使用参数化原型函数对残差进行建模，该函数的参数将拟合每个劣化曲线。这样，无需预测劣化趋势的每个时间点的个体值，这通常是高度非平稳的，只需使用有状态模型来预测每周期的一组参数，该参数在原型函数中用于对整个劣化曲线建模。这反过来又使学习问题受到更多约束，因为只能使用原型给出的形式的函数对劣化进行建模。

根据本发明的实施例，有状态模型包括关于由具有预定义结构的函数表示的过程的机械预信息和估计该函数的参数的有状态模型的组合。

其中机械预信息由基于物理的模型表示，包括常微分方程或偏微分方程(ODE/PDE)以及线性或非线性代数方程，例如热量或质量平衡方程。

根据本发明的实施例，无状态模型包括线性模型。

线性模型可用于捕获瞬时线性相关性，而有状态模型可用于捕获长期劣化趋势。在示例中，线性模型可包括LRR。

在一些示例中，混合模型进一步包括非线性模型。通常，线性模型仅捕获瞬时线性相关性，而有状态模型将理想地捕获长期劣化趋势。然而，由于原型函数可能并不总是完美地适应劣化，并且仍然会有非线性或瞬时的一些伪影，并且因而无法被线性模型捕获，因此我们需要非线性模型，例如LSTM，其将尝试在每个时间点分别对这些附加的短期伪影进行建模。换句话说，可以将一个线性模型和两个有状态模型组合在混合模型中，例如，一个LSTM用于长期劣化，并且一个LSTM用于短期伪影，我们将此模型命名为双速(two-speed)模型，

根据本发明的实施例，输入数据集进一步包括至少一个经变换的过程数据，其表示当前测量的过程数据和/或先前测量的过程数据的一个或多个参数的函数。

换句话说，从过程数据构建的工程特征可以用作附加输入。这些工程特征可包括自上次再生(例如催化剂或热交换器)以来的运行时间、自上次交换(例如催化剂或热交换器)以来的运行时间、上次运行结束时的过程条件、上次运行的再生持续时间、上次运行的持续时间等。

在一些示例中，历史数据可包括一个或多个经变换的过程数据，其编码关于对至少一个化学过程装备的劣化的长期效应的信息。该方法可进一步包括在多次运行的预测范围内估计至少一个关键性能指标的未来值。换句话说，这些工程特征可能特别相关，因为它们可能编码有关系统中长期效应的信息，诸如在几个月和几年的时间尺度上累积的焦炭残留物。通过将这些长期效应包括在历史数据中，可以训练数据驱动模型以预测当前运行周期中的劣化，以及劣化对多个运行周期的长期效应。

本发明的第二方面涉及一种用于预测化学生产工厂的劣化进展的装置。该装置包括输入单元和处理单元。输入单元被配置为接收当前测量的过程数据，该过程数据指示化学生产工厂的至少一个化学过程装备的当前操作的当前过程条件，其中至少一个化学过程装备具有用于量化至少一个化学过程装备的劣化进展的一个或多个劣化关键性能指标KPI。输入单元进一步被配置为接收一个或多个预期操作参数，该预期操作参数指示预测范围内至少一个化学过程装备的计划过程条件。处理单元被配置为执行如上面和下面所述的方法步骤。

本发明的第三方面涉及一种用于指示如上面和下面所述的装置的计算机程序单元，该计算机程序单元在由处理单元执行时适于执行如上面和下面所述的方法步骤。

本发明的第四方面涉及一种存储有所述程序单元的计算机可读介质。

如在此所使用的，术语“老化”可指组件经受某种形式的材料劣化和损坏(通常但不一定与使用时间相关联)的效应，在使用期限内失效的可能性增加。老化装备是指有证据或有可能自新的以来发生显著劣化和损坏的装备，或者没有足够的信息和知识来了解该可能性存在的程度的装备。老化和损坏的重要性与对装备功能、可用性、可靠性和安全性的潜在效应有关。仅仅因为一件装备是旧的并不一定意味着它显著劣化和损坏。所有类型的装备都可能容易受到老化机制影响。总体上，老化工厂是由于其完整性或功能性能劣化或过时而被认为或可能不再被认为完全适合用途的工厂。“老化”与实际年限没有直接关系。

如在此所使用的，术语“劣化”可指工厂和装备由于诸如焦化、烧结、中毒、污垢和腐蚀的老化相关机制而可能劣化。

如在此所使用的，术语“算法”可以指将训练模型执行您希望它执行的操作的一组规则或指令。

如在此所使用的，术语“模型”可以指给定一组输入预测输出的训练过程。

附图说明

本发明的这些和其它方面将从以下描述中通过示例描述的实施例并参考附图将变得明显并进一步阐明，在附图中

图1示出说明用于预测化学生产工厂的装备中的劣化进展的计算机实现的方法的流程图。

图2示出在存在再生阶段时过程装备的示例性劣化行为。

图3示出工业老化过程(IAP)预测问题的示例。

图4示出一个月合成数据集的示例，示出固定床反应器中催化活性的损失。

图5示出真实世界数据集的一个月历史数据的示例，示出反应器上的压力损失Δp。

图6示出用于时间序列预测的无状态和有状态模型的比较。

图7示出ESN架构的示例。

图8示出LSTM架构的示例。

图9示出反馈状态模型的示例。

图10示出混合模型的示例。

图11示出五个模型(LRR、KRR、FFNN、ESN和LSTM)中的每一个在不同训练集大小的训练集和测试集上的均方误差(MSE)。

图12A-12D示出模型LRR、KRR、FFNN、ESN和LSTM对于从训练和测试集中随机选择的周期的真实和预测转换率的曲线图。

图13A-13B示出对于从两个数据集随机选择训练和测试样本的反馈LSTM的预测和真实KPI的曲线图。

图14A-14B示出从两个数据集随机选择训练和测试样本的混合模型的示例的预测和真实KPI的曲线图。

图15示出一些模型在训练集和测试集上的均方误差。

图16示意性地示出用于预测化学生产工厂的装备中的劣化进展的装置。

图17示意性地示出用于预测化学生产工厂的装备中的劣化进展的系统。

应当注意，这些图纯粹是示意性的而不是按比例绘制的。在附图中，与已经描述的元件对应的元件可以具有相同的附图标记。示例、实施例或可选特征，无论是否指示为非限制性的，都不应被理解为限制所要求保护的本发明。

具体实施方式

图1示出说明用于预测化学生产工厂的劣化进展的计算机实现的方法100的流程图。

在步骤110，即步骤a)中，经由输入通道接收当前测量的过程数据。当前测量的过程数据指示化学生产工厂的至少一个化学过程装备的当前操作的当前过程条件。

在一些示例中，可以以包括多次运行的循环方式操作至少一个化学过程装备。每次运行包括一个生产阶段并接着再生阶段。

图2示出在存在再生阶段时过程装备的示例性劣化行为。实线10表示一个周期内的劣化行为，而虚线12表示过程装备在过程装备的整个生命周期内(例如在一个催化剂装料内)的劣化。在图2的示例中，过程装备以循环方式操作，包括在过程装备的整个生命周期中的11个周期。每个周期具有生产阶段14，并接着再生阶段16。再生阶段16是该过程中非常重要的特定部分，因为这可能导致KPI在再生过程之后返回到其基线(用虚线12指示)，即使无需更换过程装备。再生阶段的存在可导致复杂的劣化行为。在该情况下，过程装备或催化剂可在不同的时间尺度上经历劣化。如图2中所示，在一个周期内观察到劣化行为，在循环结束时具有再生阶段，并且同时在过程装备或催化剂装料的整个生命周期内观察到劣化。

再生阶段的存在也对数据驱动模型的输入参数的定义具有影响。在该情况下，可能需要附加输入参数来提高预测的准确性。例如，来自上次运行的过程信息可以作为附加输入参数提供。来自上次运行的过程信息可以进一步包括以下中的至少一种：自上次再生(例如催化剂或热交换器)以来的运行时间、自上次交换(例如催化剂或热交换器)以来的运行时间、上次运行结束时的过程条件、上次运行的再生持续时间、上次运行的持续时间等。

在示例中，过程数据可包括可从化学生产工厂获得的传感器数据。传感器数据的示例可包括但不限于温度、压力、流量、水平和组合物。对于装备，可以选择适当的传感器来提供有关所考虑装备的健康状态的信息。可替代地或另外地，过程数据可包括直接或间接从此类传感器数据导出的量，即，表示包含在一组经测量的过程数据中的一个或多个参数的函数的一个或多个导出参数。

回到图1，在步骤120，即步骤b)中，经由输入通道接收指示预测范围内的至少一个化学过程装备的计划操作条件的一个或多个预期操作参数。该一个或多个预期参数可以在预测范围内是已知的和/或可控的。换句话说，可以在预测范围内计划或预期一个或多个预期操作参数。步骤110和步骤120可以顺序或并行执行。

在步骤130，即步骤c)中，数据驱动模型由处理器应用到包括当前测量的过程数据和一个或多个预期操作参数的输入数据集，以估计预测范围内的一个或多个劣化KPI的未来值。根据训练数据集对数据驱动模型进行参数化或训练。训练数据集基于包括一个或多个化学过程装备的一个或多个劣化KPI和过程数据的历史数据集，其中一个或多个化学过程装备以包括多次运行的循环方式操作，其中每次运行包括一个生产阶段，并接着再生阶段。该历史数据集可包括来自多次运行和/或多个工厂的数据。

该一个或多个劣化KPI可以选自包括包含在一组经测量的过程数据中的参数的参数。可替代地或另外地，该一个或多个劣化KPI选自包括导出参数的参数，该导出参数表示包含在一组经测量的过程数据中的一个或多个参数的函数。

尽管受影响的资产类型种类繁多，以及它们背后的物理或化学劣化进展完全不同，但所有这些现象可共享一些以下基本特征：

1.所考虑的关键资产具有一个或多个关键性能指标(KPI)，用于量化劣化进展。

2.在比典型生产时间尺度长得多的时间尺度上(即不连续过程的批处理时间；连续过程的设定点更改之间的典型时间)，KPI或多或少单调地漂移到更高或更低的值，指示不可逆劣化现象的发生。(在较短的时间尺度上，KPI可表现出波动，该波动不由劣化进展本身驱动，而是由变化的过程条件或背景变量(诸如例如环境温度)驱动。)例如，用实线10指示的图2中所示的劣化KPI单调地漂移到较低的值，指示不可逆劣化现象的发生。

3.KPI在维护事件(诸如污垢的热交换器的清洁、非活性催化剂的更换或再生等)之后恢复到基线。例如，图2中所示的劣化KPI在再生过程之后恢复到其基线(用虚线12指示)，即使没有更换过程装备。

4.劣化不是“意外事件(bolt from the blue)”——诸如例如有缺陷的管道爆裂——而是由过程装备的蠕变、不可避免的磨损和撕裂驱动。

本公开解决了具有这些一般特性的任何老化现象。资产可以以包括多次运行的循环方式操作，其中每次运行包括一个生产阶段，并接着再生阶段。

特性(4)表明，劣化KPI的演变在很大程度上由过程条件确定，而不是不受控制的外部因素。这定义了本公开解决的中心问题：给定该时间范围内的计划过程条件，开发准确的模型来预测劣化KPI在特定时间范围内的演变。

使用预先训练的数据驱动模型确定化学过程组件(即诸如热交换器或反应器的单个资产)在预期操作条件下的预期劣化行为。基于预定义的运行结束标准，预测运行结束(例如，从生产阶段切换到再生阶段、催化剂更换)。

在步骤140，即步骤d)中，预测范围内的一个或多个劣化KPI的未来值经由输出通道提供，这可用于监视和/或控制。

基于该信息，可以实现必要的控制措施，以防止由于过程装备的劣化或故障导致的计划外生产损失。例如，可以将一个或多个KPI的未来值与阈值进行比较以确定满足阈值的未来时间。该时间信息然后可以经由输出通道提供或用于预测维护事件。以该方式，例如通过避免两个或更多个化学装备的并行停机时间，可以改进不同化学过程装备之间停机时间的规划和调整。通常在该上下文中用于预测模型的数据由工厂中的传感器在生产过程附近创建。

在下面，我们公开了一些用于IAP预测任务的数据驱动模型的示例，将一些传统的无状态模型(包括LRR、KRR和FFNN)与更复杂的有状态递归神经网络ESN和LSTM进行了比较。此外，我们还评估了反馈状态模型，例如反馈LSTM和混合模型。为了检查训练模型中每个模型需要多少历史数据，我们首先检查它们在具有已知动态的合成数据集上的性能。然后，在第二步骤中，模型在大型化学工厂的真实数据上进行测试。

1.问题定义

一般工业老化过程(IAP)预测问题如图3中所示：目的是在作为该周期中的计划过程条件

的函数的两个维护事件之间即将到来的时间窗口t∈[0，T_i](称为第i个劣化周期)内对一个或多个劣化

的演变进行建模：

其中∈_i(t)表示干扰x_i和y_i之间确定性关系的随机噪声。

图3示出工业老化过程(IAP)预测问题。劣化KPI(例如固定床中的压力降Δp)随着时间推移(例如由于焦化)而增加，受(手动控制的)过程条件I和II(例如反应温度T和流量F)影响。虽然该示例示出了两个过程参数，但要求保护的方法也适用于一个过程参数或大于两个的多个过程参数。KPI在维护事件之后恢复，该维护事件将时间轴划分为不同的劣化周期。IAP预测任务是给定即将到来的过程条件，即输入(自)变量x_i(t)，预测KPI的演变，即在当前周期i中的目标(因)变量y_i(t)。

劣化现象可表现出明显的记忆效应，这意味着某个输入模式x(t)可能仅在更晚的时间t′＞t时才影响输出y(t′)。此外，这些记忆效应也可能发生在多个时间尺度上，这使得这些过程非常难以建模。作为示例，考虑内管壁结焦的热交换器。观察到的传热系数作为KPI y_i(t)，并且过程条件x_i(t)包括被处理流体的质量流量、化学组合物和温度。时间范围是两个清洁程序(例如烧掉)之间的一个周期。如果在周期的早期时间t₁，出现低质量流量、高焦炭前体含量和高温的不利组合，则第一焦炭斑可在壁处形成，其还不足以显著影响传热。然而，它们作为在周期中后期进一步焦炭形成的核心，使得与过程条件在t₁附近并非不利但在整个周期的其余部分中具有非常相似的过程条件相比，y_i(t)在t＞t₁时下降得更快。

另一个复杂因素可能是在实际应用案例中，劣化KPI y、过程条件x和不受控制的影响因素之间的区别并不总是很明确。例如，考虑非均相催化剂失活的情况，其中催化活性的损失导致降低的转换率。在该情况下，转换率可以作为目标劣化KPI y，而由工厂操作员手动控制的过程条件(诸如温度)将被视为模型的输入变量x。然而，工厂操作员可能尝试将转换率保持在某个设定点，这可以通过提高温度来抵消催化剂劣化的效应来实现。这在转换率和温度之间引入了反馈回路，这意味着温度不再被视为自变量，因为它的实际值可能取决于或部分取决于目标。因此，可能必须小心，因为在模型中包括此类因变量作为输入x可导致报告过于乐观的预测误差，当模型稍后在现实中使用时，这将无法成立。

2.数据集

为了深入了解和评估IAP预测问题的不同机器学习模型，我们考虑了两个数据集：一个是我们使用机械模型自己生成的合成数据集，并且一个包含来自巴斯夫一家大型工厂的真实数据。下面将更详细地描述这两个数据集。

采用合成数据的原因是，这使我们能够控制问题的两个重要方面：数据量和数据质量。数据量例如通过数据集中催化剂生命周期的数量来测量，可以选择任意大的合成数据，以测试最需要数据的机器学习方法。数据质量是指数据集中的噪声水平，或者换句话说，劣化KPI y(t)由数据集中提供的过程条件x(t)唯一确定的程度。在基于确定性劣化模型的合成数据集中，我们知道x和y之间存在函数映射，即，不存在可以阻止机器学习模型学习该关系并消除预测误差的根本原因。相反，对于真实数据，坏的预测误差可能是方法的问题，和/或数据集的问题，它可能在输入侧x上不包含足够的信息来准确预测输出量y。

2.1合成数据集

在以下示例中，合成数据集用于模拟来自经历催化剂失活和周期性再生的反应器的过程数据。对于合成数据集，我们对在连续运行的固定床反应器中缓慢但稳定地失去催化活性的广泛现象进行建模。最终，催化剂失活导致过程中不可接受的转换率或选择性率，需要催化剂再生或更换，这标志着一个周期的结束。

所考虑的反应器中的化学过程是烯烃的气相氧化。为了生成所有变量的时间序列，我们使用了具有以下成分的机械过程模型：

■反应器中所有五种相关化学物质(烯烃反应物、氧气、氧化产物、CO₂、水)的质量平衡方程，为简单起见，在假设理想气体定律的情况下，将其建模为等温活塞流反应器。反应网络由主反应(烯烃+O₂→产物)和一个副反应(烯烃燃烧生成CO₂)组成。

■催化剂活性的高度非线性失活定律，其取决于反应温度、流量和流入的氧气，以及活性本身。

■反应速率的动力学定律。

■确定过程条件(温度、流量等)的随机过程。

基于系统的当前过程条件和隐藏状态，机械模型生成大约2000个劣化周期的多变量时间序列[x(t)，y(t)]。最终数据集包括对于每个时间点t作为输入x(t)的五个操作参数(质量流量、反应器压力、温度和两种反应物烯烃和O₂的质量分数)和两个劣化KPI y(t)(转换和选择性)。

为了给模拟时间序列一个印象，图4中示出一个月的数据，其示出一个月的合成数据集，示出固定床反应器中催化活性的损失。在每个时间点t，过程条件向量x(t)包括反应器温度T、质量流量F、反应器压力p、和反应器入口处反应物的质量分数μ_z。劣化KPI y(t)是过程的转换率和选择性。失活周期的持续时间约为8-10天。催化剂活性A(t)是隐藏状态，并且因此不是数据集的一部分，但仅用于示出问题的动态：系统输出y(t)(选择性和转换率)不仅受当前操作参数x(t)影响，而且受在每个周期中非线性降低的当前催化剂活性A(t)影响。

除了操作参数之外，当前周期中烯烃的累积进料也作为潜在输入量添加到数据集。该变量通常被视为催化剂活性的粗略预测指标。因此，通常在工厂中进行计算和监视。在机器学习的语言中，该变量表示原始输入时间序列的工程特征。以该方式，关于催化剂失活的一些基本领域知识被添加到数据集。

2.2真实世界数据集

第二数据集包含巴斯夫世界级连续生产工厂中有机物质的生产的过程数据。该过程是多管式固定床反应器中的气相氧化。

反应器中的催化剂颗粒遭受劣化，在该示例中是焦化，即石墨形式的元素碳的表面沉积。这导致降低的催化活性和增加的流体阻力。后者是更严重的后果，并导致反应器上增加的压力降，如通过反应器前后气体压力的差Δp所测量的。在该示例中，KPI是压力降。

当Δp超过预定义阈值时，达到所谓的运行结束(EOR)标准。然后，通过在升高的温度下将空气和附加的氮气注入反应器中达不同的小时数，焦炭层在专门的再生过程中被烧掉。操作原因可能导致Δp超过EOR阈值的延迟烧掉，反之亦然，当Δp尚未达到EOR阈值时过早烧掉。图5中示出Δp的一些示例性周期，该图5示出真实世界数据集的一个月的历史数据，示出反应器上的压力损失Δp，这是该IAP预测问题中的劣化KPI y(t)。当Δp达到70mbar的EOR阈值数量级时，焦炭沉积物被烧掉，这标志着周期的结束。

由于焦炭没有通过该烧掉过程完全去除，焦炭残留物在再生过程中不断累积，使压力降问题变得更加严重。因此，整个催化剂床必须每6-24个月更换一次。

作为一种选择，历史数据可包括一个或多个经变换的过程数据，该过程数据编码关于对至少一个化学过程装备的劣化的长期效应的信息。该方法可进一步包括在多次运行的预测范围内估计至少一个关键性能指标的未来值。因此，这些工程特征可能特别相关，因为它们可以编码有关系统中长期效应的信息，诸如在几个月和几年的时间尺度上累积的焦炭残留物。通过将这些长期效应包括在历史数据中，可以训练数据驱动模型以预测当前运行周期中的劣化，以及劣化对多个运行周期的长期效应。

可能影响焦化率的因素是：

1.通过反应器的质量流量F(“进料负载”)

2.进料中有机反应物与氧气的比率

3.先前再生过程的强度

4.前一劣化周期的长度

该数据集包含从工厂的工厂信息管理系统(PIMS)中提取的来自四个最相关传感器的7年过程数据，如表1中所列。假设两个烧掉过程之间4到7天的时间尺度，这对应于属于三个不同催化剂批次(batch)的375个劣化周期。所有变量的采样率为1/小时，对该时间网格进行线性插值。

变量名称	单位	描述	类型
				PD	mbar	反应器上的压力差Δp	y
T	℃	反应温度	x
				F_R	kg/h	有机反应物到反应器中的流入	x
F_AIR	kg/h	到反应器中的质量流量空气	x

表1

任务是在劣化周期的中间时刻t_k预测周期的整个剩余持续时间内焦化引起的压力降Δp。特别关注的是对达到EOR阈值Δp^max＝70mbar的时间点t_EOR的预测。

如上所述，几个相关的操作参数可以作为模型的输入变量x(t)(见表1)。此外，根据这些操作参数或先前周期中的劣化KPIΔp构建的工程特征可以用作附加输入。下表2中列出了这些附加输入的示例：

表2

3.输入量

对于资产，需要与劣化状态直接或间接相关的关键性能指标。对于每个预测，都需要针对化学过程元素测量的过程数据。此类过程数据可包括当前过程条件。该至少一个化学过程装备可以以包括多次运行的循环方式操作。每次运行包括一个生产阶段，并接着再生阶段。数据驱动模型的输入数据集可进一步包括来自上次运行的至少一个过程信息，诸如自上次再生(例如催化剂或热交换器)以来的运行时间、自上次交换(例如催化剂或热交换器)以来的运行时间、上次运行结束时的过程条件、上次运行的再生持续时间、上次运行的持续时间等。关键性能指标是作为过程数据提供或从提供的过程数据导出的参数。需要预测化学过程元素的当前生产运行的预期操作条件(诸如流速、受控反应温度)。

4.模型架构

我们现在将在机器学习环境中构建IAP预测问题。为此，方程(1)中定义的映射表达为具体函数f，该具体函数f基于此时以及可能在t之前最多k小时的过程条件x_i：返回

即在第i个劣化周期中的时间点t的KPI估计值，

任务是预测整个周期(即直到T_i)的y_i(t)，通常从结束前一周期的最后一次维护事件之后约24小时开始。

在方程(2)中，预测函数f定义为当前和过去输入变量x_i的函数。由于通常劣化KPIy_i的值至少在每个周期的前24小时内是已知的，原则上f的输入变量集可以扩展为还包括y_i(t′)，其中t′＜t。然而，虽然这可能改善周期开始时的预测，因为我们的目标是预测从前24小时开始的完整周期，但对于大多数时间点的预测，而不是实际值y_i(t′)可以用作输入，但必须使用它们的预测值

由于这些预测值通常至少包含一个小误差，因此对未来时间点的预测将基于噪声越来越大的输入数据，因为输入变量

中的预测误差会迅速累积。因此，模型的唯一显式输入是预定义过程条件x_i。然而，第4.3节(“反馈状态模型”)中讨论的模型变体克服了该限制。

因此，函数f的确切形式取决于为预测任务选择的机器学习方法的种类。然而，虽然选择的机器学习模型确定了函数的形式，但它的确切参数需要调整以拟合手头的数据集，以便产生准确的预测。为此，首先将可用数据拆分为所谓的“训练”和“测试”集，其中两个集合中的每一个集合都包含来自原始数据集的几个互斥劣化周期的整个多元时间序列，即由给定过程的计划条件x和劣化KPI y组成的多个输入-输出对

然后，使用训练集中的数据，机器学习算法通过最小化预测KPI

和真实KPI y_i(t)之间的预期误差来学习f的最优参数。在已经训练机器学习模型之后，即当f在训练集上尽可能准确地预测y_i(t)时，应在新数据上评估模型，以指示其在以后实际使用时的性能。为此，使用了测试集。如果在训练集上的性能比在测试集上好很多，则模型就不能很好地泛化到新数据，并且被认为在训练数据上“过拟合”。

除了f的正则参数外，许多机器学习模型还需要设置一些超参数，例如确定正则化程度(即训练集中可能的异常值对模型参数的影响程度)。为了找到足够的超参数，可以使用交叉验证：在这里，在多次迭代中，训练集被进一步拆分成验证和训练部分，并且具有特定超参数设置的模型在训练部分上训练并在验证部分上评估。然后在整个训练集上训练最终模型时，使用在验证拆分上产生最优结果的那些超参数设置，然后如上所述在预留测试集上对其进行评估。

用于时间序列预测的机器学习模型可以分为两个主要子组：无状态模型和有状态模型。

图6示出时间序列转换(casting)的无状态和有状态模型的比较。图6(a)示出无状态模型，该无状态模型基于对过去固定时间窗口中包含的信息的预测，而图6(b)示出有状态模型，其中使用隐藏状态维护和传播关于过去的信息。

无状态模型在给定当前输入的情况下直接预测输出，而与前一时间点的预测无关。另一方面，有状态模型维护系统的内部隐藏状态，该内部隐藏状态对关于过去的信息进行编码，并且在进行预测时还可以除了当前的过程条件外使用。

无状态模型包括范围从线性回归模型到多种类型的神经网络的最典型的机器学习回归模型。我们将在本文中探讨的无状态回归模型是线性岭回归(LRR)、核岭回归(KRR)和前馈神经网络(FFNN)，即一个线性和两个非线性预测模型。用于序列数据建模的最常用的有状态模型是递归神经网络(RNN)。虽然RNN是一些最强大的神经网络，能够逼近任何函数或算法，但它们也更多地参与训练。因此，在本文中，我们选择使用两种不同的RNN架构对IAP进行建模，该架构专门设计用于处理训练常规RNN时出现的问题：回声状态网络(ESN)和长短期记忆(LSTM)网络。

此外，还引入了基本有状态模型的两个主要变体，以提高真实世界数据集的性能：包括反馈循环，其将过去的预测输出包含作为附加输入；并将模型分成两个或更多个不同的模型，该模型将预测输出动态的不同方面(例如瞬时效应与长期趋势)。

以下段落中介绍了七种机器学习模型。为简单起见，在许多情况下我们只写x和y，省略了对所讨论的当前周期i和时间点t的引用，而x可能包括过去固定时间窗口中多个时间点的过程条件(即直到t-k)。

4.1无状态模型

无状态模型是机器学习模型，其预测仅基于过去固定时间窗口内的输入，即完全如方程(2)中所述。

线性岭回归(LRR)

LRR是普通的线性回归模型，添加了正则化项，其可防止权重因训练集中的异常值而取极值。目标变量y被预测为输入变量x的线性组合，即

其中

是权重矩阵，即从训练数据中学习到的f的模型参数。LRR的简单模型架构、全局最优解和正则化都有助于减少模型的过拟合。此外，训练和评估模型在计算上并不昂贵，这也使其成为处理大量数据的可行模型。尽管它们相对简单，但线性模型在许多应用场景中被广泛使用，并且通常可以用于以相当高的精度来近似真实世界的过程，特别是如果附加(非线性)手工设计的特征可用的话。此外，考虑到通常可用于真实世界IAP问题的有限量的训练数据，需要非常小心地可靠地估计更复杂的非线性预测模型(诸如深度神经网络)的参数，而线性模型提供了更稳健的解决方案，因为它们提供了全局最优解决方案，并且考虑到它们的线性性质，不太可能过拟合。有关LRR模型的详细讨论，请参考以下出版物：Draper NR,Smith H.Applied regression analysis,vol.326.John Wiley&Sons；2014,以及Bishop CM,Nasrabadi NM.Pattern Recognition and MachineLearning.Journal of Electronic Imaging 2007；16(4)。

核岭回归(KRR)

KRR是一种非线性回归模型，其可以使用所谓的“内核技巧”从LRR推导出。不是使用常规输入特征x，而是使用与某个核函数k对应的特征映射φ将特征映射到高(并且可能是无限)维空间，使得φ(x)^Tφ(x′)＝k(x，x′)。通过计算新数据点x和训练样本x_j之间的非线性相似度k，其中j＝1，...，N，目标y可以预测为

其中α_j是学习的模型参数。

与LRR相比，非线性KRR模型可以适应更复杂的数据，并且可以解析地获得全局最优解的事实使得KRR成为最常用的非线性回归算法之一。然而，模型的性能对超参数的选择也比较敏感，因此需要仔细选择和优化超参数。此外，计算核矩阵与训练示例数N成二次方比例的事实使得将KRR应用于大型训练集的问题变得困难。有关KRR模型的详细讨论，请参考以下出版物：Draper NR,Smith H.Applied regression analysis,vol.326.JohnWiley&Sons；2014,Bishop CM,Nasrabadi NM.Pattern Recognition以及MachineLearning.Journal of Electronic Imaging 2007；16(4),and Scholkopf B,SmolaAJ.Learning with kernels:support vector machines,regularization,optimization,and beyond.MIT press；2001。

前馈神经网络(FFNN)

FFNN是第一种也是最直接的神经网络类型，但由于其灵活性，它们仍然成功地应用于范围从分类和回归任务到数据生成、无监督学习等的许多不同类型的机器学习问题。与LRR类似，FFNN学习一些输入参数x和一些输出值y之间的直接映射f。然而，与线性模型不同，FFNN也可以近似输入和输出之间的高度非线性相关性。这是通过使用一系列“层”变换输入来实现的，其中每一层通常由线性变换之后是非线性操作σ组成：

在一些情况下，FFNN可能难以训练，因为误差函数是高度非凸的，并且与由LRR和KRR找到的全局最优解相比，优化过程通常只能找到局部最小值。然而，这些局部最小值中的损失通常与全局最优值相似，因此该特性不会显著影响适当训练的神经网络的性能。此外，由于FFNN的大量参数(W₁，...，W_l)和高灵活性，如果不当训练，它可能会过拟合，特别是在使用较小的训练集时。有关KRR模型的详细讨论，请参考以下出版物：Draper NR,SmithH.Applied regression analysis,vol.326.John Wiley&Sons；2014,Bishop CM,Nasrabadi NM.Pattern Recognition以及Machine Learning.Journal of ElectronicImaging 2007；16(4),and Jaeger H.The “echo state”approach to analysing andtraining recurrent neural networks-with an erratum note.Bonn,Germany:GermanNational Research Center for Information Technology GMD Technical Report2001；148(34):13。

4.2有状态模型

与无状态模型相比，有状态模型仅显式使用输入x(t)，而不是过去的输入x(t-1)，...，x(t-k)，来预测某个时间点t的输出y(t)。相反，它们维护系统的隐藏状态h(t)，该隐藏状态h(t)随着每个新的时间步长不断更新，并且因此包含关于整个过去时间序列的信息。然后可以利用当前输入条件以及模型的隐藏状态来预测输出：

这两个有状态模型都属于递归神经网络(RNN)类。RNN是用于时间序列建模的一种强大的方法，然而它们可能难以训练，因为它们的深度随着时间序列的长度而增加。如果训练没有仔细执行，这可导致误差反向传播训练过程期间的梯度分叉，如果优化完全收敛，这可能会导致非常缓慢的收敛(“梯度消失问题”)。

回声状态网络(ESN)

图7示出ESN的示例性结构。ESN是一种替代的RNN架构，该RNN架构可以通过完全不使用误差反向传播进行训练来缓解上述RNN的一些与训练相关的问题。相反，ESN使用非常大的随机初始化权重矩阵，该随机初始化权重矩阵结合过去输入的递归映射，本质上充当输入的随机特征扩展(类似于KRR中使用的隐式特征映射φ)；统称为“存储库”。这样，ESN可以通过在每个时间步长更新h(t)以包含先前隐藏状态h(t-1)的加权和以及随机扩展的输入特征x(t)和随机循环映射的h(t-1)的组合，跟踪系统的隐藏状态h(t)∈R^m其中m＞＞d_x)。然后使用LRR对输入和隐藏状态计算输出的最终预测，即

其中

通常，回声状态网络是一种非常强大的RNN类型，其在动态系统预测方面的性能通常与其它更流行和更复杂的RNN模型(LSTM、GRU等)相当或甚至更好。由于唯一学习的参数是用于最终预测的线性模型的权重W_out，因此ESN也可以在较小的数据集上进行训练，而不会冒太多过拟合的风险。

LSTM网络

另一个非常流行的用于处理RNN中梯度消失问题的架构是长短期记忆(LSTM)架构，它是专门为此目的而开发的。图8示出LSTM网络的示例性结构。LSTM像往常一样使用误差反向传播进行训练，但通过使用称为“单元状态”的附加状态向量以及通常的隐藏状态来避免梯度消失的问题。该单元状态是LSTM的核心组件，并且贯穿整个递归链，同时仅使用线性更新在每个时间步长缓慢更新，使其能够保持数据中的长期相关性并在长序列上保持稳定的梯度。单元状态中包含新信息或删除旧信息是由称为门的特殊神经网络层仔细调节的。虽然与ESN相比，LSTM网络的隐藏状态h(t)的更新要复杂得多，但最终的预测仍然只是网络内部隐藏状态的线性变换：

其中

然而，在该情况下，W_o的参数值与LSTM网络的其它参数一起优化，而不是使用单独的LRR模型。

由于对调节单元状态的门进行建模需要多个层，LSTM通常需要大量的训练数据以避免过拟合。尽管它很复杂，但LSTM梯度的稳定性使其非常适合具有长期相关性的时间序列问题。

4.3有状态模型的变体

反馈状态模型

到目前为止，我们只使用操作参数来预测过程的关键性能指标(KPI)，但是将过去的KPI作为输入可以作为强大的新信息来源，特别是因为在同一周期内KPI随时间的高度自相关性。

这里的主要挑战是前一时间步长的KPI不容易获得，事实上，在真实世界的场景中，我们可以预期在周期开始时最多只有几个KPI值可用，而我们需要预测周期剩余持续时间的KPI。由于自相关会随时间推移而迅速减弱，因此仅在周期开始时使用这些KPI值对于任何长期预测都不是非常有益的。然而，假设我们的预测足够准确，我们可以使用前一时间步长的预测KPI作为真实KPI的合理近似值。这将使我们能够利用输出之间的高时间自相关来提高我们的预测准确性。

将其合并到有状态模型中的一种方法是将前一时间步长的预测输出(或真实输出，如果可用)包括到当前时间步长的输入向量中。例如，图9示出反馈状态模型的示例，示出前一时间步长的输出与下一步长的输入的级联。在图9中所示的示例性实施例中：

然而，此类实现方式很容易导致较大的预测误差。这一点的原因是预测输出只是真实输出的近似值，并且因此不如真实输出可靠。由于先前的预测输出将用于下一个预测，因此预测输出值中的任何小误差都将传播到下一个输出的预测中。在较长的时间段内，这些小误差会累积，并可能导致预测与真实输出时间序列大不相同，从而导致非常大的误差。因此，将可靠的真实输出与网络的不可靠预测输出区分开来至关重要，使得网络就可以独立地估计这两个变量的可靠性。

实现此目的的一种方式是在每个反馈输出值旁边包括指标变量，这将指示该输出值是否是真实输出，即来自过程的实际测量KPI，还是预测KPI，即来自前一时间步长处的有状态模型的输出。因此，示例性反馈状态模型只需通过在每个时间步长处将两个值附加到输入向量来实现：前一时间步长处的输出值和指标变量，如果反馈值是真实测量的KPI，则为0，或者如果反馈值由前一步长处的有状态模型预测，则为1。图6中给出了该模型的图示，其示出反馈LSTM的示例，作为反馈状态模型的示例，该反馈状态模型示出前一时间步长的输出与下一步长的输入的级联。优选地，网络将学习这两个变量之间的联系，并且从而学习区分可靠的真实反馈值和不太可靠的过去LSTM预测。

混合模型

在预测工业老化过程(IAP)的基本问题设置中，所有考虑的过程都受到一些潜在的劣化进展影响，随着时间推移会降低过程效率。由于该劣化是长期的，并且发生在整个周期中，因此很难预测，因为它受到周期早期条件影响，该相关性在很大程度上是未知的，并且由于大的时间滞差而难以学习。然而，由于工程师经常意识到劣化进展背后的基本动态，因此可以使用一些参数化原型函数对KPI的劣化进行参数化，该原型函数的参数可以完美拟合以匹配给定周期的劣化曲线。我们尝试利用该知识，以便通过将问题分为预测输入对KPI的瞬时效应和长期效应，使LSTM作为有状态模型的示例的学习问题更简单。

隔离瞬时效应的一种方式是训练没有任何时间信息的线性模型。在我们的实验中，当劣化的效应仍然很小，并且不使用时间变量作为输入时，我们仅在周期的初始时间段(例如，周期的所有观察值的前1％-10％，优选是1％-5％)训练LRR模型作为线性模型的示例，因此模型不会尝试从时间上下文学习，而只会尝试输入对KPI的瞬时效应。虽然该方法只会学习线性瞬时效应，但通常这足以从周期中去除大部分瞬时伪影，使得残差反映劣化曲线。

如前所述，然后可以使用参数化原型函数对残差进行建模，该原型函数的参数将拟合到每个劣化曲线。这样，无需预测劣化趋势的每个时间点处的个体值，这通常是高度非平稳的，只需使用LSTM预测每个周期的一组参数，该参数用于原型函数以对整个劣化曲线进行建模。这反过来又使学习问题受到更多约束，因为只能使用由原型给出的形式的函数对劣化进行建模。我们期望该特性对真实世界的数据集特别有用，其中由原型函数强制执行的约束应该减少对较小训练集的过拟合。

作为最后步骤，由于LRR仅捕获瞬时线性相关性，而LSTM将理想地捕获长期劣化趋势。

双速混合模型

在一些情况下，由于原型函数可能并不总是完美地适应劣化，并且仍然会有不是线性或瞬时的一些伪影，并且因此不会被线性模型(例如LRR)捕获，我们需要另一个有状态模型，例如LSTM，其会尝试在每个时间点分别对这些附加短期伪影进行建模。由于两种有状态模型的该组合，一种用于长期劣化，并且另一种用于短期伪影，我们将该模型命名为双速模型，其完整方案如图10上所示，其示出双速混合模型的概述，示出三个不同的模型组件(例如，一个LRR和两个LSTM)以及它们学习的周期分解。

5.训练过程

数据驱动模型根据训练数据集进行参数化，其中训练数据集基于包括操作数据、催化剂老化指标和至少一个目标操作参数的历史数据集。

例如，对于ESN模型，存储库矩阵的参数不是被训练而是随机生成的，并且训练发生在训练数据集中每个时间点的隐藏状态特征被生成之后。在此之后，使用线性岭回归对最终输出矩阵进行参数化/训练，产生全局最优线性映射，该映射最小化目标和预测之间的差异。

对于基于LSTM的模型，使用随机梯度下降执行训练，其中模型参数使用训练样本的随机子集的梯度缓慢更新，以便最小化一些误差函数(在该情况下，预测和目标之间的差异)。该过程在多次迭代中反复重复，直到优化收敛于误差函数的某个(最有可能的)局部最小值。

机器学习模型还具有无法训练的一组超参数。为了选择好的一组超参数，我们使用与训练集不相交的验证集。该模型是用不同组的超参数实例化并在训练集上进行训练，然后在验证集上测量性能。随后，对于每种模型类型，我们选择在验证集上为该特定模型带来最优性能的超参数。

最后，为了评估模型在新的未知样本上的泛化性能，我们使用与训练集和验证集不同的测试集。

损失计算为所有测试周期的均方根误差(RMSE)的平均值。ESN和LSTM模型的预测在不同的周期中是独立的，因为隐藏状态在每个新周期的预测之前被重新初始化。

6.结果

在本节中，我们使用第2节中描述的合成和真实数据集报告了我们对第3节中介绍的七种不同机器学习模型的评估。为了测量机器学习模型的预测误差，我们使用均方误差(MSE)，由于我们的数据集被细分为周期，我们与通常略有不同地定义：令数据集D由N个周期组成，并且令y_i(t)表示在第i个周期内时间点t∈0，...，T_i的KPI，其中T_i是第i个周期的长度。然后，给定对应的模型预测

整个数据集的模型的MSE计算为

由于合成数据集和真实世界的数据集非常不同，因此它们被用于检查模型的不同方面。合成数据集用于检查模型在几乎理想的场景中的表现，其中数据是免费可用的，并且噪声非常低甚至不存在。另一方面，真实世界的数据集用于测试模型的鲁棒性，因为它只包含有限数量的训练样本和相对较高的噪声水平。

6.1合成数据集

为了系统地评估不同方法在受控环境中的性能，如第2节中所述生成了合成数据集。生成了总共50年的历史数据，包括总共435917个时间点的2153个周期。随机选择数据集约10％的周期作为样本外测试集，得到由1938个周期(391876个时间点)组成的训练集和由215个周期(44041个时间点)组成的测试集。仅讨论作为劣化KPI的转换的结果；选择性的结果是相似的。

LRR、KRR和ESN模型的超参数使用训练集中的10倍交叉验证进行选择。FFNN和LSTM模型使用随机梯度下降进行训练，使用Nesterov动量进行参数更新。神经网络模型的超参数基于验证集的性能确定，该验证集由训练集中随机选择15％的周期组成。使用提前停止选择训练时期的数量，如果在最后6个时期中验证集误差没有改善，则停止训练。

对于无状态模型，例如LRR、KRR和FFNN，时间点t的输入向量由过去24小时的操作参数组成，为模型提供了过去的时间窗口，即x_24h(t)＝[x(t)；x(t-1)；...；x(t-24)]。进一步增加该时间窗口并没有对任一模型的性能产生任何明显的改进。由于有状态模型能够将过去编码在其隐藏状态，因此ESN和LSTM在任何时间点t的输入仅包含当前时间点的操作参数，即x(t)。反馈状态模型，例如反馈LSTM，在每个时间步长处将两个值附加到输入向量：前一时间步长的输出值和指标变量，如果反馈值是真实测量的KPI，则为0，或者如果反馈值由LSTM在前一步长预测，则为1。混合模型的输入可以是无状态模型和有状态模型的输入的组合。

LRR、KRR、FFNN、ESN和LSTM

图11示出五个模型中每个模型在不同训练集大小的训练集和测试集上的均方误差(MSE)。对于大多数模型，误差收敛得相对较早，这意味着即使只有一小部分完整数据集，只要相应的模型复杂性允许，模型也能设法学习合成数据集动态的准确近似。这也指示模型中存在的误差很大程度上是由于模型本身灵活性的限制，而不是由于训练集不够大。这在LRR中很明显，它基本上使用总数据集大小的5％来实现其最大性能。由于LRR是线性模型，它只能学习输入和输出之间的线性关系。尽管无论训练集大小如何，该高偏差都会阻止模型学习大部分非线性动态，但这也意味着模型具有低方差，即它不趋于过拟合训练数据。对于FFNN，误差随着样本数量增加而缓慢下降，尽管速率越来越慢，使用完整训练数据集的误差显著低于LRR。至于ESN和LSTM，从训练和测试误差之间的差异来看，这两种方法似乎都对较小的训练集大小有些过拟合，然而，即使如此，与三种无状态模型相比，测试误差也要低得多。两个模型的误差收敛在整个数据集的50％左右，之后几乎没有过拟合，并且也没有显著提高更大数据集大小的性能。过拟合的普遍缺乏可以解释为训练和测试集是使用完全相同的模型生成的，即它们取自相同的分布，这是任何机器学习问题的最优设置。此外，合成数据集中缺乏噪声也有助于解释缺乏过拟合，因为过拟合通常涉及模型拟合噪声而不是实际信号/模式。在所有数据集大小中，LSTM模型显然是表现最好的，使用完整数据集时的误差比ESN模型的误差小5倍。

鉴于ESN并且特别是LSTM模型的出色性能，这些实验清楚地表明，即使采用少量的高质量数据，原则上也可以以非常高的准确度预测整个劣化周期。

图12A-12D示出对于从训练和测试集中随机选择的一些周期的不同模型的真实和预测转换率的曲线图。这些示出所有模型都能够准确预测输入参数对输出的瞬时效应，因为该关系在很大程度上是线性的，而不是时间相关的。然而，模型差异最大的地方在于非线性长期劣化，其中无状态模型仅预测大致线性趋势，FFNN由于其非线性而略微接近实际劣化趋势，而ESN模型更好地预测了劣化，但未能捕获到每个周期结束时的快速下降。另一方面，LSTM模型几乎完美地捕获到了短期和长期效应，由于周期的长度不同，在数据量较少的周期的结束只有很小的误差。

反馈状态模型

反馈模型的测试场景是每个周期的前12小时输出值都是已知的，并且因此可以用作真实反馈，之后必须从LSTM对前一时间点的预测中获取反馈。因此，反馈模型报告的所有均方误差都是通过评估测试集获得的，其中每个周期的前12小时作为真实反馈给出。

图13A-13B示出用于从两个数据集(即工厂C中的合成数据集和真实世界数据集)中随机选择的训练和测试样本的反馈状态模型的示例的预测和真实KPI的曲线图。

对于合成数据集，使用逐阶段训练过程后，反馈模型的误差显著高于常规LSTM的误差。更准确地，常规LSTM具有0.08的MSE，而反馈模型的MSE大了近4倍，为0.31(0.32训练误差)。

虽然目前尚不清楚为什么在该情况下性能会受到影响，但我们的假设是，预测的整体高精度导致网络学习反馈值在预测时也是可靠的，从而导致模型开始强烈依赖预测的反馈值来进行未来预测。如前所述，这导致反馈值中小误差的累积，这可以是反馈LSTM相对于常规LSTM的劣化性能的原因。

此外，这两个附加输入参数可使学习问题更加复杂，因此不允许反馈LSTM快速收敛到非常低的局部最小值，这在该情况下实际上很有用，因为它减少了过拟合，这可以再次导致在测试集上的更好表现。

混合模型

对于合成数据集和真实数据集二者，我们使用了以下形式的指数函数

f_deg(t)＝g(p₁(t)，p₂(t)，...，p_n(t))

其中参数p₁(t)由一个LSTM预测，作为有状态模型的示例，因为短期伪影和参数p₂(t)，...，p_n(t)由长期LSTM预测。

图14A-14B示出混合模型示例的预测和真实KPI的曲线图，用于从两个数据集(即工厂C中的合成数据集和真实世界数据集)中随机选择训练和测试样本。

对于合成数据集，双速模型的MSE略高于常规LSTM的误差，双速LSTM具有0.13的MSE(0.137训练误差)，而LSTM的MSE为0.08。这在某种程度上是意料之中的，因为由原型函数引起的约束使LSTM灵活性稍差，这对于存在大量数据的合成数据集是不利的，因此过拟合不是问题。

6.2真实世界数据集

真实世界的数据集比合成的要小得多，总共包含375个周期。在去除一些异常周期(小于50小时)后，数据集的最终大小是总共36058个时间点的327个周期，即它比完整的合成数据集小10倍以上。由于真实世界的数据集在反应器中使用不同的催化剂装料跨越3个时间段，我们通过选择第三催化剂装料作为测试集以现实的方式测试性能，这使得可以看到模型在多大程度上能够推断由催化剂交换引起的不同条件。这导致训练集由256个周期(28503个时间点)组成，而测试集由71个周期(7555个时间点)组成。

真实世界数据集的超参数以与合成数据集类似的方式选择，只是由于数据集的较小大小，并且因此较短的时期，当验证误差在过去30个时期中没有改善时触发提前停止。

对于该数据集，时间点t的有状态和无状态模型二者的输入仅包含该时间点x(t)的过程条件。将时间窗口延长到过去几个小时只会降低性能，因为它减少训练集的大小(如果取过去的k小时，则每个周期的输入必须在小时后开始，导致每周期k个样本的损失)并增加输入特征的数量，使所有模型更容易过拟合。

LRR、KRR、FFNN、ESN、LSTM

图15示出五个模型中的每个模型在训练和测试集上的均方误差。由于较大的噪声和较少的数据量，这里的结果与合成数据集的结果相比不同：越复杂的模型示出越过拟合，因为测试误差显著大于对应的训练误差，特别是对于KRR，它也是所有模型中最大的测试误差。另一方面，LRR几乎没有示出过拟合，并且它在测试集上的性能更接近于其它模型的性能。再一次，ESN和LSTM的性能优于无状态模型，但是这一次，差距要小得多，并且两个模型都示出非常相似的性能。考虑到更大的噪声水平和更少的样本数量，这可能是由于这里的LSTM模型过拟合的可能性更大。

反馈状态模型

对于真实世界的数据集，即图10(c)和9(d)中的工厂C数据集，反馈模型的误差为25.58(18.67训练误差)，其显著低于具有33.35的MSE的常规LSTM。与合成数据集相比，我们得到了相反的结果，我们假设是这种情况，因为工厂C数据的预测具有更高的噪声水平和整体更差的准确性。这意味着前一预测输出和下一个真实输出之间的相关性并没有那么高，因此反馈模型在预测下一个输出时不会过多依赖这些值，但由于逐阶段训练过程仍然会学习依赖真实反馈，这可能是导致性能提高的原因。

混合模型

对于真实世界数据集，即图10(c)和9(d)中的工厂C数据集，即真实世界数据集，双速模型的MSE为21.9(26.22训练误差)，即显著低于常规LSTM的MSE，即33.35。正如预期的那样，其原因是原型函数的约束，它很好地拟合了劣化进展的形状并减少了过拟合，这特别有用，因为工厂C数据集具有小得多的可用训练集。

7.用例

化学工厂中众所周知的劣化现象可以通过上述方法进行预测，包括但不限于：

■由于焦化、烧结或中毒而导致的非均相催化剂的失活；

■由于焦炭层形成或聚合而导致在过程侧的过程装备(诸如热交换器或管道)的堵塞；

■由于微生物或结晶沉积物而导致在水侧的热交换器的污垢；

■流化床反应器中所安装的装备(诸如喷嘴或管道)的腐蚀。

8.总结

制定准确的工业老化过程(IAP)数学模型对于预测何时需要更换或恢复关键资产至关重要。在世界规模的化学工厂中，此类预测具有巨大的经济价值，因为它们提高了工厂的可靠性和效率。虽然机械模型对于阐明实验室条件下劣化进展的影响因素很有用，但众所周知，要使它们适应个别工厂的特定环境是非常困难的。另一方面，数据驱动的机器学习方法能够学习模型并基于特定工厂的历史数据进行预测，并且因此只要有足够的数据可用，就能够毫不费力地适应多种条件。虽然之前已经在预测性维护的背景下研究了更简单的，特别是线性预测模型，但到目前为止还没有对更近期和更复杂的机器学习模型(诸如递归神经网络)进行详细检查。

在本公开中，我们解决了仅基于初始过程条件以及该过程将如何在该时段中操作的预测KPI的任务，该KPI指示关键装备在整个劣化周期的时间范围内的缓慢劣化。为此，我们一共比较了七种不同的预测模型：三种无状态模型，即线性岭回归(LRR)、非线性核岭回归(KRR)和前馈神经网络(FFNN)，两个基于递归神经网络(RNN)的状态模型，回声状态网络(ESN)和LSTM，以及有状态模型的变体，即反馈状态模型和混合模型。为了评估可用历史数据量对模型预测的重要性，我们首先在合成数据集上对其进行了测试，该数据集基本上包含无限的无噪声的数据点。在第二步骤中，我们检查了这些结果如何转化为来自巴斯夫大型化学工厂的真实数据。

虽然无状态模型(LRR、KRR和FFNN)准确地捕获到了由变化过程条件导致的KPI的瞬时变化，但它们可能无法准确地捕获到由较慢的劣化效应引起的潜在趋势。另一方面，ESN和LSTM能够另外正确地预测长期变化，然而代价是需要大量的训练数据才能做到这一点。由于要调整的更多参数，非线性模型通常会过拟合在训练数据中观察到的特定模式，并且因此在新的测试样本上犯的错误相对较多。此外，基本LSTM模型的两个主要变体有望提高真实世界数据集的性能：包括反馈循环，其将过去的预测输出作为附加输入，并将模型分成两个或更多个不同的模型，该模型预测输出动态的不同方面(例如瞬时效应与长期趋势)。

通常，所有模型都可以产生非常有希望的预测，该预测足够准确，可以改进生产工厂维护事件的调度决策。在特定情况下最优模型的选择取决于可用数据的数量。对于非常大的数据集，我们发现LSTM可以在长期范围内产生几乎完美的预测。然而，如果只有几个周期可用于训练或数据非常嘈杂，则应用混合模型可能是有利的，该混合模型可以通过减少特别是在小数据集上的过拟合来显著提高LSTM模型的性能。

虽然IAP的准确预测将通过允许更长的规划期限来改进生产过程，确保工厂经济可靠地运行，但最终目标当然是更好地了解并随后最小化劣化效应本身。虽然机械和线性模型相当简单地解释，但神经网络模型长期以来因其不透明的预测而被回避。然而，由于诸如逐层相关传播(LRP)的新颖解释技术，这种情况正在发生变化，这使得可视化各个输入维度对最终预测的贡献成为可能。通过此类方法，可以使诸如LSTM的RNN的预测更加透明，从而揭示导致正在研究的老化过程的影响因素和生产条件，进而可用于帮助改进基础过程工程。

图16示意性地示出用于预测化学生产工厂的劣化进展的装置200。装置200包括输入单元210和处理单元220。

输入单元210被配置为接收当前测量的过程数据，该当前测量的过程数据指示用于化学生产工厂的至少一个化学过程装备的当前操作的当前过程条件。至少一个化学过程装备以包括多次运行的循环方式操作。至少一个化学过程装备具有用于量化至少一个化学过程装备的劣化进展的一个或多个劣化关键性能指标KPI。输入单元210进一步被配置为接收一个或多个预期操作参数，该预期操作参数指示预测范围内的至少一个化学过程装备的计划过程条件。

因此，在示例中，输入单元210可以被实现为以太网接口、USB(TM)接口、诸如WiFi(TM)或蓝牙(TM)的无线接口或能够在输入外围设备和处理单元220之间进行数据传输的任何可比较的数据传输接口。

处理单元220被配置为执行上述任一方法步骤。

因此，处理单元220可以执行计算机程序指令来执行各种处理和方法。处理单元220可以指代以下、是以下的一部分或包括以下：专用集成电路(ASIC)、电子电路、处理器(共享、专用或组)、和/或存储器(共享、专用或组)，其执行一个或多个软件或固件程序、组合逻辑电路和/或提供所述功能的其它合适组件。此外，此类处理单元220可以被连接到本领域技术人员已知的易失性或非易失性存储器、显示接口、通信接口等。

装置200包括输出单元230，用于提供预测范围内的一个或多个劣化KPI的未来值，该未来值可用于监视和/或控制。

因此，在示例中，输出单元230可以实现为以太网接口、USB(TM)接口、诸如WiFi(TM)或蓝牙(TM)的无线接口、或能够在输出外围设备和处理单元230之间进行数据传输的任何可比较的数据传输接口。

图17示意性地示出用于预测化学生产工厂的劣化进展的系统300的示例。所示示例的系统300包括传感器系统310，该传感器系统310包括安装在化学生产工厂中的一个或多个传感器(未示出)、数据存储库320、包括用于预测如上面和下面所述的化学生产工厂的劣化进展的装置200的网络服务器330、多个电子通信设备340a、340b，以及网络350。

传感器系统310可包括安装在化学生产工厂中(例如安装在一个或多个化学过程装备中)的一个或多个传感器，用于感测温度、压力、流量等。传感器的示例可包括但不限于温度传感器、压力传感器、流量传感器等。

数据存储库320可以是接收由传感器系统310的一个或多个传感器在生产环境中产生的数据和指示过程条件的操作参数的数据库。例如，数据存储库320可以从不同的化学过程装备或从不同的化学生产工厂收集传感器数据和操作参数。这些化学生产工厂可能位于相同的物理位置或不同的城市、州和/或国家，它们通过网络互连。在另一个示例中，数据存储库可以从不同的生产地点收集传感器数据和操作参数，该生产地点或者在相同的物理位置，或者分散在不同的物理地点。所示示例的数据存储库320可以是任何类型的数据库，包括服务器、数据库、文件等。

所示示例的网络服务器330可以是提供网络服务以促进对多个数据存储库中的传感器数据和操作参数的管理的服务器。网络服务器330可包括用于预测如上面和下面所述的化学生产工厂的劣化进展的装置200。在一些实施例中，网络服务器330可以例如经由网页、桌面应用、移动应用与用户交互，来促进传感器数据、操作参数的管理，以及使用该装置来预测化学生产工厂的劣化进展。可替代地，所示示例的网络服务器330可以用提供任何类型的界面(例如命令行界面、图形用户界面)的另一个设备(例如另一个电子通信设备)代替。这些界面(诸如网页、桌面应用、移动应用)可以允许用户经由网络350使用电子通信设备340a、340b来管理数据。网络服务器330还可包括用户可以通过其认证(通过提供用户名和密码)的界面。例如，用户帐户可用于认证特定化学生产工厂的系统用户以利用网络服务器330访问一些数据存储库以取得该特定化学工厂的传感器数据和操作参数以允许该装置200来预测该特定化学工厂的劣化进展。

所示示例的电子通信设备340a、340b可以是台式机、笔记本计算机、膝上型计算机、移动电话、智能电话和/或PDA。在一些实施例中，电子通信设备340a、340b也可以称为客户端。每个电子通信设备340a、340b可包括用户界面，该用户界面被配置为便于一个或多个用户提交对网络服务器的访问。用户界面12可以是交互界面，包括但不限于GUI、角色用户界面和触摸屏界面。可选地，所示示例的电子通信设备340a、340b可包括用于存储例如传感器数据和操作参数的存储器。

所示示例的网络350以通信方式耦合传感器系统310、数据存储库320、网络服务器330和多个电子通信设备340a、340b。在一些实施例中，网络可以是互联网。可替代地，网络350可以是任何其它类型和数量的网络。例如，网络350可以由连接到广域网的几个局域网来实现。当然，可以使用任何其它配置和拓扑来实现网络350，包括有线网络、无线网络、广域网、局域网等的任何组合。

本发明的该示例性实施例涵盖从一开始就使用本发明的计算机程序和借助于更新将现有程序变成使用本发明的程序的计算机程序。

此外，计算机程序单元可能能够提供所有必要的步骤来完成上述方法的示例性实施例的过程。

根据本发明的另一示例性实施例，提供了一种计算机可读介质，诸如CD-ROM，其中该计算机可读介质具有存储在其上的计算机程序单元，该计算机程序单元由前面部分描述。

计算机程序可以存储和/或分发在合适的介质上，诸如与其它硬件一起提供或作为其一部分提供的光学存储介质或固态介质，但也可以以其它形式分发，诸如经由互联网或其它有线或无线电信系统。

然而，计算机程序也可以通过像万维网这样的网络呈现并且可以从此类网络下载到数据处理器的工作存储器中。根据本发明的另一示例性实施例，提供了一种用于使计算机程序单元可用于下载的介质，该计算机程序单元被布置为执行根据本发明的前述实施例之一的方法。

根据本发明的实施例，本申请进一步提供以下实施例：

实施例1：一种用于预测化学生产工厂的劣化进展的计算机实现的方法，包括：

a)经由输入通道接收当前测量的过程数据，过程数据指示用于化学生产工厂的至少一个化学过程装备的当前操作的当前过程条件，其中，至少一个化学过程装备以包括多次运行的循环方式操作，其中，每次运行包括一个生产阶段并接着再生阶段，其中，至少一个化学过程装备具有用于量化至少一个化学过程装备的劣化进展的一个或多个劣化关键性能指标KPI；

b)经由输入通道接收一个或多个预期操作参数，预期操作参数指示在预测范围内的至少一个化学过程装备的计划操作条件；

c)由处理器将数据驱动模型应用到包括当前测量的过程数据和一个或多个预期操作参数的输入数据集，以估计在预测范围内的一个或多个劣化KPI的未来值，其中，根据训练数据集对数据驱动模型进行参数化或训练，其中，训练数据集是基于包括过程数据和一个或多个劣化KPI的历史数据集；以及

d)经由输出通道提供在预测范围内的一个或多个劣化KPI的未来值，未来值可用于监视和/或控制。

实施例2：根据实施例1的方法，

其中，一个或多个劣化KPI选自包括以下的参数：

-被包含在一组经测量的过程数据中的参数；和/或

-导出参数，其表示被包含在一组经测量的过程数据中的一个或多个参数的函数。

实施例3：根据实施例2的方法，其中，所选择的参数具有以下特征中的至少一个：

-在比典型生产时间尺度更长的时间尺度上以基本单调的方式趋向更高或更低的值，从而指示不可逆劣化现象的发生；以及

-在再生阶段之后返回到基线。

实施例4：根据前述实施例中任一项的方法，其中，劣化包括以下中的至少一个：

-由于焦化、烧结、和/或中毒而导致的多相催化剂的失活；

-由于焦炭层形成和/或聚合而导致的在过程侧的化学过程装备的堵塞；

-由于微生物和/或结晶沉积物而导致的在水侧的热交换器的污垢；以及

-在流化床反应器中所安装的装备的腐蚀。

实施例5：根据前述实施例中任一项的方法，其中，数据驱动模型包括：

-有状态模型，其是具有隐藏状态的机器学习模型，隐藏状态随着新的时间步长而不断被更新并包含关于整个过去时间序列的信息；和/或

-无状态模型，其是机器学习模型，机器学习模型的预测仅基于在当前操作之前的固定时间窗口内的输入。

实施例6：根据实施例5的方法，其中，有状态模型包括递归神经网络RNN。

实施例7：根据实施例6的方法，其中，RNN包括以下中的至少一个：

-回声状态网络ESN；以及

-长短期记忆LSTM网络。

实施例8：根据实施例5至7中任一项的方法，

其中，有状态模型包括反馈状态模型，反馈状态模型包括关于来自前一时间步长的到用于当前时间步长的输入数据集中的预测输出或真实输出的信息；

其中，预测输出是在前一时间步长处的一个或多个预测KPI；以及

其中，真实输出是在前一时间步长处的一个或多个测量KPI。

实施例9：根据实施例8的方法，

其中，输入数据集还包括指标变量，指标变量指示来自前一时间步长的数据驱动模型的输出是预测输出还是真实输出。

实施例10：根据实施例5至9中任一项的方法，

其中，步骤a)还包括接收先前测量的过程数据，先前测量的过程数据指示在当前操作之前的预定时段内的化学生产工厂的至少一个化学过程装备的过去操作的过去过程条件；

其中，步骤b)还包括接收一个或多个过去操作参数，过去操作参数指示在当前操作之前的预定义时段内的至少一个化学过程装备的过去过程条件；以及

其中，在步骤c)中，输入数据集还包括先前测量的过程数据和一个或多个过去操作参数。

实施例11：根据实施例5的方法，其中，无状态模型包括以下中的至少一个：

-线性岭回归LRR；

-核岭回归KRR；以及

-前馈神经网络FFNN。

实施例12：根据实施例5至11中任一项的方法，

其中，数据驱动模型是混合模型，混合模型包括用于预测一个或多个劣化KPI的劣化趋势的有状态模型和用于预测操作参数对一个或多个劣化KPI的附加瞬时影响的无状态模型；

其中，劣化趋势表示在比典型生产时间尺度更长的时间尺度上化学过程装备的性能的单调变化；以及

其中，操作参数的附加瞬时影响不包含模型输入对一个或多个劣化KPI的效应的时间延迟。

实施例13：根据实施例12的方法，其中，有状态模型包括关于由具有预定义结构的函数所表示的过程的机械预信息和估计该函数的参数的有状态模型的组合。

实施例14：根据实施例12或13的方法，其中，无状态模型包括线性模型。

实施例15：根据前述实施例中任一项的方法，其中，输入数据集还包括至少一个经变换的过程数据，至少一个经变换的过程数据表示当前测量的过程数据和/或先前测量的过程数据的一个或多个参数的函数。

实施例16：一种用于预测化学生产工厂的劣化进展的装置，包括：

-输入单元；

-处理单元；以及

-输出单元；

其中，输入单元被配置为：

-接收当前测量的过程数据，当前测量的过程数据指示化学生产工厂的至少一个化学过程装备的当前操作的当前过程条件，其中，至少一个化学过程装备以包括多次运行的循环方式操作，其中，每次运行包括一个生产阶段并接着是再生阶段，其中，至少一个化学过程装备具有用于量化至少一个化学过程装备的劣化进展的一个或多个劣化关键性能指标KPI；

-接收一个或多个预期操作参数，预期操作参数指示在预测范围内的至少一个化学过程装备的计划过程条件；

其中，处理单元被配置为执行根据权利要求1至15中任一项的方法步骤；以及

其中，输出单元被配置为提供在预测范围内的一个或多个劣化KPI的未来值，未来值可用于监视和/或控制。

实施例17：一种用于指示根据实施例16的装置的计算机程序单元，计算机程序单元在由处理单元执行时适于执行实施例1至15中任一项的方法步骤。

实施例18：一种计算机可读介质，存储有实施例17的程序单元。

必须注意，本发明的实施例是参考不同的主题来描述的。特别地，参考方法类型权利要求描述了一些实施例，而参考设备类型权利要求描述了其它实施例。然而，本领域技术人员将从以上和以下描述中得知，除非另有说明，除了属于一种主题的特征的任何组合之外，还认为与不同主题相关的特征之间的任何组合与本申请一起公开。然而，所有特征都可以组合起来，提供不仅仅是特征的简单总和的协同效应。

虽然本发明已在附图和前述说明中详细说明和描述，但这种说明和描述应被认为是说明性或示例性的而不是限制性的。本发明不限于所公开的实施例。通过研究附图、公开内容和从属权利要求，本领域技术人员在实践要求保护的发明时可以理解和实现对所公开实施例的其它变化。在权利要求中，“包括”一词不排除其它元件或步骤，不定冠词“一”或“一个”不排除多个。单个处理器或其它单元可以实现权利要求中引用的若干项的功能。在相互不同的从属权利要求中引用了某些措施这一事实并不指示这些措施的组合不能有利地使用。权利要求中的任何参考符号不应被解释为限制范围。

Claims

1.一种用于预测化学生产工厂的劣化进展的计算机实现的方法(100)，包括：

a)经由输入通道接收(110)当前测量的过程数据，所述过程数据指示用于所述化学生产工厂的至少一个化学过程装备的当前操作的当前过程条件，其中，所述至少一个化学过程装备具有用于量化所述至少一个化学过程装备的所述劣化进展的一个或多个劣化关键性能指标KPI；

b)经由所述输入通道接收(120)一个或多个预期操作参数，所述预期操作参数指示在预测范围内的所述至少一个化学过程装备的计划操作条件；

c)由处理器将数据驱动模型应用(130)到包括所述当前测量的过程数据和所述一个或多个预期操作参数的输入数据集，以估计在所述预测范围内的所述一个或多个劣化KPI的未来值，其中，根据训练数据集对所述数据驱动模型进行参数化或训练，其中，所述训练数据集是基于包括过程数据和所述一个或多个劣化KPI的历史数据集；以及

d)经由输出通道提供(140)在所述预测范围内的所述一个或多个劣化KPI的所述未来值，所述未来值可用于监视和/或控制。

2.根据权利要求1所述的方法，

其中，所述至少一个化学过程装备以包括多次运行的循环方式操作，其中，每次运行包括一个生产阶段并接着是再生阶段；以及

其中，所述输入数据集包括来自上次运行的至少一个过程信息。

3.根据权利要求1或2所述的方法，

其中，所述一个或多个劣化KPI选自包括以下的参数：

-被包含在一组经测量的过程数据中的参数；和/或

4.根据前述权利要求中任一项所述的方法，

其中，所选择的参数具有以下特征中的至少一个：

-在再生阶段之后返回到基线。

5.根据前述权利要求中任一项所述的方法，

其中，所述劣化包括以下中的至少一个：

-由于焦化、烧结、和/或中毒而导致的多相催化剂的失活；

-在流化床反应器中所安装的装备的腐蚀。

6.根据前述权利要求中任一项所述的方法，

其中，所述数据驱动模型包括：

-有状态模型，其是具有隐藏状态的机器学习模型，所述隐藏状态随着新的时间步长而不断被更新并包含关于整个过去时间序列的信息；和/或

-无状态模型，其是机器学习模型，所述机器学习模型的预测仅基于在所述当前操作之前的固定时间窗口内的所述输入。

7.根据权利要求6所述的方法，

其中，所述有状态模型包括递归神经网络RNN。

8.根据权利要求7所述的方法，

其中，所述RNN包括以下中的至少一个：

-回声状态网络ESN；以及

-长短期记忆LSTM网络。

9.根据权利要求6至8中任一项所述的方法，

其中，所述有状态模型包括反馈状态模型，所述反馈状态模型包括关于来自前一时间步长的到用于当前时间步长的所述输入数据集中的预测输出或真实输出的信息；

其中，所述预测输出是在所述前一时间步长处的一个或多个预测KPI；以及

其中，所述真实输出是在所述前一时间步长处的一个或多个测量KPI。

10.根据权利要求9所述的方法，

其中，所述输入数据集还包括指标变量，所述指标变量指示来自所述前一时间步长的所述数据驱动模型的输出是预测输出还是真实输出。

11.根据权利要求6至10中任一项所述的方法，

其中，步骤a)还包括接收先前测量的过程数据，所述先前测量的过程数据指示在所述当前操作之前的预定时段内的所述化学生产工厂的所述至少一个化学过程装备的过去操作的过去过程条件；

其中，步骤b)还包括接收一个或多个过去操作参数，所述过去操作参数指示在所述当前操作之前的所述预定义时段内的所述至少一个化学过程装备的所述过去过程条件；以及

其中，在步骤c)中，所述输入数据集还包括所述先前测量的过程数据和所述一个或多个过去操作参数。

12.根据权利要求6所述的方法，

其中，所述无状态模型包括以下中的至少一个：

-线性岭回归LRR；

-核岭回归KRR；以及

-前馈神经网络FFNN。

13.根据权利要求6至12中任一项所述的方法，

其中，所述数据驱动模型是混合模型，所述混合模型包括用于预测所述一个或多个劣化KPI的劣化趋势的有状态模型和用于预测操作参数对所述一个或多个劣化KPI的附加瞬时影响的无状态模型；

其中，所述劣化趋势表示在比典型生产时间尺度更长的时间尺度上所述化学过程装备的性能的单调变化；以及

其中，所述操作参数的附加瞬时影响不包含模型输入对所述一个或多个劣化KPI的效应的时间延迟。

14.根据权利要求13所述的方法，

其中，所述有状态模型包括关于由具有预定义结构的函数所表示的所述过程的机械预信息和估计该函数的参数的有状态模型的组合。

15.根据权利要求13或14所述的方法，

其中，所述无状态模型包括线性模型。

16.根据前述权利要求中任一项所述的方法，

其中，所述输入数据集还包括至少一个经变换的过程数据，所述至少一个经变换的过程数据表示所述当前测量的过程数据和/或所述先前测量的过程数据的一个或多个参数的函数。

17.一种用于预测化学生产工厂的劣化进展的装置(200)，包括：

-输入单元(210)；

-处理单元(220)；以及

-输出单元(230)；

其中，所述输入单元被配置为：

-接收当前测量的过程数据，所述当前测量的过程数据指示所述化学生产工厂的至少一个化学过程装备的当前操作的当前过程条件，其中，所述至少一个化学过程装备以包括多次运行的循环方式操作，其中，每次运行包括一个生产阶段并接着是再生阶段，其中，所述至少一个化学过程装备具有用于量化所述至少一个化学过程装备的所述劣化进展的一个或多个劣化关键性能指标KPI；

-接收一个或多个预期操作参数，所述预期操作参数指示在预测范围内的所述至少一个化学过程装备的计划过程条件；

其中，所述处理单元被配置为执行根据权利要求1至16中任一项所述的方法步骤；以及

其中，所述输出单元被配置为提供在所述预测范围内的所述一个或多个劣化KPI的所述未来值，所述未来值可用于监视和/或控制。

18.一种用于指示根据权利要求16的装置的计算机程序单元，所述计算机程序单元在由处理单元执行时适于执行权利要求1至16中任一项所述的方法步骤。

19.一种计算机可读介质，存储有权利要求18的程序单元。