CN116324634A

CN116324634A - 用于操作过程工程设备的方法、过程工程设备以及用于改装过程工程设备的方法

Info

Publication number: CN116324634A
Application number: CN202180068492.6A
Authority: CN
Inventors: G·扎普; S·伦茨; N·布卢姆
Original assignee: Linde LLC
Current assignee: Messer LLC
Priority date: 2020-10-14
Filing date: 2021-09-29
Publication date: 2023-06-23
Also published as: TW202215179A; US20230375987A1; EP4229486A1; KR20230087524A; WO2022078623A1

Abstract

提出了一种用于操作过程工程设备(100)的方法，其中使用通过控制过程指定的一个或多个控制值来调节过程工程设备(100)中的一个或多个执行器，由此影响过程工程设备(100)的一个或多个操作参数。该控制过程是自优化控制过程，其包括使用基于模型的深度强化学习和考虑成本函数，其中借助于神经网络将过程工程设备(100)的一个或多个部件映射在模型中，该神经网络被使用在基于模型的深度强化学习中。对应的过程工程设备(100)和用于改装过程工程设备(100)的方法也是本发明的主题。

Description

用于操作过程工程设备的方法、过程工程设备以及用于改装过程工程设备的方法

本发明涉及根据独立权利要求的各前序部分的一种用于操作过程工程设备(特别是空气分离设备)的方法、一种过程工程设备以及一种用于改装过程工程设备的方法。

发明背景

在下文中，主要参考用于低温分离空气的方法和设备来对本发明进行说明，因此，在此应首先简要探讨此类方法和设备。但是，正如下文中解释的，本发明也可以在其他过程工程设备中使用，特别是、但不仅限于进行组分混合物的低温分离的设备，例如用于处理天然气或处理由合成或转化工艺(例如重整、裂化等)制成的产品混合物的设备。此类设备通常也被称为气体设备。

通过在空气分离设备中低温分离空气来制备液态或气态空气产物是已知的并且例如在Wiley-VCH出版公司2006年由H.-W.

编辑出版的“Industrial GasesProcessing”一书中，特别地在章节2.2.5“Cryogenic Rectification”中进行了描述。若在下文中谈及“空气分离设备”，将其理解为低温-空气分离设备。

传统型空气分离设备具有精馏塔系统，这些精馏塔系统例如可被设计为两个塔的系统，特别地为双塔系统，但也可被设计为三塔或多塔系统。除了用于提取液态和/或气态的氮和/或氧的精馏塔，即用于氮氧分离的精馏塔外，还可设置用于提取其他空气组分，特别是稀有气体的精馏塔。

使得所述精馏塔系统的精馏塔以不同的压力水平运行。已知的双塔系统具有所谓的高压塔(压力塔、中压塔、下塔)和所谓的低压塔(上塔)。在这些塔中，特别是通过借助于控制装置指定的液体回流进料来维持分离。

无论是在设备类型方面，还是在对负载变化能力和收益优化的要求方面，空气分离设备都对更高级别的过程控制提出了很高的要求。这些空气分离设备的特征在于通过热平衡和物料平衡将精馏塔与其他仪器紧密耦合，从控制工程的角度来看，它们代表了高度耦合的多变量系统。此外，要控制的变量(分析、温度等)的设定值取决于负载情况。另一方面，例如用于生产气态产品的空气分离设备必须快速满足生产需求，同时必须确保尽可能高的产品收益(特别是氧气和/或氩气)。在此，所谓的基础控制器可以将过程参数调节到设定值。这样的过程参数由影响空气分离过程的物理变量形成，例如在空气分离设备的特定位置处或在特定的方法步骤中的压力、温度或流量。

在更传统的空气分离设备中，基础控制器可以特别是被设计为P控制器(比例控制器，英语为Proportional Controller)、PI控制器(比例积分控制器，英语为ProportionalIntegrative Controller)、PD控制器(比例微分控制器，英语为Proportional DerivativeController)或PID控制器(比例积分微分控制器，英语为Proportional IntegrativeDerivative Controller)。替代地，两个或多个控制器可以互连为级联控制器并用作基础控制器。基础控制器全体连同必要的互锁和逻辑在所谓的管理系统(Leitsystem)上实现。

所谓的ALC开环控制器(自动变负荷，英语为Automatic Load Change)在更高一级工作，并为一个或多个基础控制器、优选为整个系统(即为所有基础控制器)指定设定值。由此可以在空气分离设备的不同负载情况之间自动切换。该技术通常基于在试运行中调节和记录的多个负载情况之间的插值。为了接近新的负载情况，管理系统的基础控制器的目标设定值被预先计算，然后以同步斜坡接近，即在指定的时间段内以小的时间步长进行调整。

因此，ALC开环控制器为基础控制器提供了一条通往要实现的负载情况的经过检验的路径。由此实现了非常高的调整速度。在任何情况下，控制都在基础控制装置中进行，例如通过级联控制器。在管理系统上特别使用所谓的微调控制器，其中由ALC开环控制器预先计算的基础控制器设定值(平均值)通过级联电路进行校正。级联控制器的设定值也可以由ALC开环控制器指定。

ALC开环控制器的替代方案是所谓的模型预测闭环控制器或MPC闭环控制器(英语为Model Predictive Control)。MPC闭环控制器特别是可以用于控制复杂且耦合的多变量被控对象。因此，它们特别适用于空气分离设备，其基础是将被控变量(英语为ControlledVariable，CV)的时间行为映射到操纵变量(英语为Manipulated Variable，MV)的变化的数学模型。在控制工程中，通常使用简单的一阶线性模型，特别是具有死区时间(在所谓的线性MPC闭环控制器LMPC中)。替代地，也可以使用更复杂的模型，例如非线性模型(在所谓的非线性MPC闭环控制器NMPC中)。整个过程由许多这样的模型以矩阵表示来描述。通过模拟设备的未来行为并最终以最小化控制偏差和满足约束条件(英语为Limit Variables，LV)的方式计算操纵变量的时间曲线，将由此产生的整体过程模型用于控制。MPC闭环控制器允许考虑交叉关系，从而实现了特别稳定的操作。

换句话说，MPC闭环控制的基本思想是预测受控系统在有限时域内的未来行为并计算最优控制输入，该最优控制输入在确保满足给定的系统约束的同时，最小化先验定义的成本函数。更准确地说，在MPC闭环控制中，通过在每个采样时间求解具有有限时域的开环最优控制问题来计算控制输入。然后，将生成的最佳输入轨迹的第一部分应用于系统，直到下一个采样时间，此时时域发生偏移，并再次重复整个过程。基于其性能，MPC尤其有利于在控制器设计中明确包括硬状态条件和输入条件以及适当的性能标准。

MPC闭环控制器可以很好地控制稳态运行下的低温空气分离设备。对于MPC闭环控制器来说，负载变化意味着为可测量的生产数量指定新的目标值，并且MPC闭环控制器在此基础上调节整个过程以适应新的负载情况。然而，负载变化的过程和持续时间是不可预测的，通常比ALC开环控制器慢得多，而且经常十分不稳定。基本上不存在根据负载指定设定值的机制。

相反，ALC开环控制器允许快速的负载变化，并通过同时(同步)调整所有相关的从属基础控制器使过程比MPC闭环控制器稳定得多。另一方面却没有多变量控制的优点。

MPC闭环控制和ALC开环控制都是高级过程控制技术，它们作用于从属基础控制器的设定值以调整生产和控制测量值(分析、温度)。到目前为止，它们更多地被视为彼此的替代品。

然而，WO 2015/158431 A1中提出了ALC开环控制器和MPC闭环控制器的组合，其中ALC开环控制器和MPC闭环控制器针对空气分离设备的至少一个过程参数协同工作。其中，至少一个由ALC开环控制器确定的设定值或目标值并不像通常那样直接传输到第一过程参数的基础控制器，而是额外地受到MPC闭环控制器的影响，然后才被传递到基础控制器。

在第一变体中，ALC开环控制器可以将第一目标值输出到MPC闭环控制器，MPC闭环控制器从该第一目标值计算第一过程参数的设定值并将其传递到基础控制器。由MPC闭环控制器计算进一步的过程参数以最小化第一过程参数对过程的干扰。相同的原理可以应用于进一步的过程参数。在第二变体中，ALC开环控制器可以输出过程参数的第一目标值和初级设定值。从第一目标值开始，MPC闭环控制器计算ALC开环控制器输出的初级设定值的设定值变化，并将改变(微调)的设定值(即次级设定值)传递给第一过程参数的基础控制器。相同的原理可以应用于进一步的过程参数。

不言而喻，LMPC闭环控制器、NMPC闭环控制器或MPC闭环控制器的任何变体在此都可以用作MPC闭环控制器。因此，ALC开环控制器和MPC闭环控制器的组合不限于特定类型的MPC闭环控制器(例如LMPC闭环控制器)，而是根据需要并由本领域技术人员自行选择MPC闭环控制器，例如LMPC闭环控制器或NMPC闭环控制器。

已经发现，空气分离设备和其他过程工程设备中的常规控制方法不能始终确保最佳运行。因此，本发明的目的在于改进过程工程设备、特别是空气分离设备的控制。

发明内容

该目的通过具有独立专利权利要求的相应特征的一种用于操作过程工程设备、特别是空气分离设备的方法、一种过程工程设备和一种用于改装过程工程设备的方法来实现。本发明的实施方案是各自从属权利要求以及以下说明的主题。

本发明的优点

本发明基于以下发现：以基于模型的(深度)强化学习为基础的控制概念特别适用于控制过程工程设备(例如空气分离设备)，其中所使用的模型映射设备或设备的至少一部分并且基于神经网络。在这种情况下，控制以自我优化的方式运作，即不断改进所使用的控制策略，特别是基于对利用先前使用的控制策略和/或先前在控制中使用的参数和变量获得的结果的评估。这尤其是通过以下面详细解释的方式再训练神经网络来实现的。

总的来说，本发明提出了一种用于操作过程工程设备、特别是空气分离设备的方法，其中使用一个或多个控制值来调节过程工程设备中的一个或多个执行器，由此影响过程工程设备的一个或多个操作参数。

在本发明的范围内被调节的执行器尤其可以是阀或者用于影响一种或多种物质流的流速的其他配件或配件组。例如，用于调节压缩机功率或涡轮机的执行装置以及加热元件等也可以是相应的执行器。在此，相应执行器的调节对这里称为操作参数的特征参数、测量值或实际值(例如塔压力、塔温度、塔中的温度分布、材料收益、产品纯度、特定物质流的组成等)有直接或间接的影响。过程工程设备的操作参数受到影响的陈述在此应被理解为相应操作参数的有针对性的改变(例如温度、压力或流速的升高或降低)或对材料纯度或混合物成分的有针对性的影响、以及有针对性地保持这些操作参数(例如塔中的温度分布)恒定。

本发明使用成本函数，在本发明的范围内，该成本函数特别是设计成考虑消耗参数(如能量消耗)或所使用的进料流(例如进料空气)的量，并且将它们与相应的指定目标(例如产品数量或产品纯度)相权衡。特别是，在本发明的范围内，在使用空气分离设备时，本方法包括具有特别可变权重的针对所用的进料空气量的惩罚项(Penalty)。因此，控制的重点在于节省进料空气量，根据要使用的压缩机功率，这对能源需求有特殊影响。此外，所谓的软边界条件(Soft Constraints)，特别是公式a·exp(b·(x–c)^d)，被集成到成本函数中。这些软边界条件涉及其他操作参数，这些操作参数也对控制有影响，但影响程度小于进料空气量。特别是不使用拉格朗日乘数，从而避免了通常与之相关的缺点，即出现难以求解的非线性方程组。特别是防止出现无法解决的优化问题。

根据本发明，至少在一个方法阶段中使用自优化控制过程进行一个或多个执行器的调节，其中该自优化控制过程包括使用基于模型的(深度)强化学习以及考虑已经提到的成本函数，并且其中借助于神经网络将过程工程设备的一个或多个部件映射在模型中，该神经网络被使用在基于模型的深度强化学习中。

作为神经网络(映射设备行为)的输入值，除了与操作参数有关的历史操纵变量和被控变量外，还特别是使用其他过程参数。

在涉及空气分离设备的本发明的一个实施方案中，被控变量或操作参数包括空气分离设备的塔系统中的一个或多个温度和一种或多种氧气分析，特别是两个温度和三种氧气分析。操纵变量特别是一种或多种质量流量和一种或多种阀位置，在示例中特别是两种物质流量和一种阀位置。此外，特别是所用双塔的水槽液位和压力也被提供给神经网络。在此，例如为每个过程值考虑指定的分钟数。由此，在每分钟指定数量的过程参数采样值的情况下，乘以分钟数得出输入数量，以映射设备的当前状态(State)。

除了状态之外，对操纵变量的未来轨迹的建议也被传递给神经网络。在提到的示例中涉及三个操纵变量，因此，在包含固定分钟数的时间段内，在每分钟采样值数量固定的情况下，再次乘以分钟数得出输入数量。

由此，在本发明中，借助于神经网络在指定的时域内预测受控系统(即过程工程设备)的未来行为。通过这种方式，可以比模型预测控制更好地计算最优控制输入，该最优控制输入在确保满足给定的系统约束的同时，最小化定义的成本函数。然而，基本上也如针对MPC所描述的那样，所产生的最优输入轨迹的第一部分可以在下一个采样时间点之前应用于系统、即过程工程设备，在下一个采样时间点，时域发生偏移并再次重复整个过程。在此，与从MPC中已知的方法相比，神经网络的使用由于其可训练性，能够更好地以自优化的方式找到最优控制策略。

换句话说，神经网络的输出对应于对被控变量或操作参数将如何变化的预测。在示例中有五个被控变量的情况下，在以分钟数表示的时间段内，在每分钟具有固定数量的值的情况下，值的数量乘以分钟数得出输出数量。

在本发明的范围内，神经网络本身特别是包括“内部”模型，该模型在循环中被重复使用以映射给定数量的时间步长。在此，示例中的每个内部模型都给出对五个被控变量的预测。该模型也可以实现或理解为展开的递归神经网络。这种展开结构的优点是模型预测控制中的优化不需要积分器，并且可以直接计算与相应的操纵变量建议相关的输出梯度。

此外，与单步预测模型(即具有纯前馈结构)相比，其优势在于神经网络的训练不仅很好地调整第一预测步骤，而且使得所有预测步骤都达成了折衷。由此也显著提高了后续步骤的预测质量。

由于数据历史非常大，在本发明的一个实施方案中有利地设置为，对可用于训练神经网络的数据点执行相关性检查。为此，可以执行数据点的相关性评估，例如包括数据的二维聚类和相关性评估的分析结果(例如主成分分析)。然后从聚类中“抽出”训练数据，即确定具有足够相关性的训练数据，直到达到数据集的特定大小。

通过所提出的方法，本发明涉及机器学习领域(英语为Machine Learning)。在机器学习中使用算法和统计模型，利用这些算法和统计模型，系统(在当前情况下是控制装置)可以在没有明确的指令的情况下执行特定任务(在此为控制任务)，而是依据所使用的模型和从中得出的结论。例如，在用于机器学习的控制装置中，代替基于特定规则的控制策略，可以使用从对历史数据和/或训练数据的分析中导出的控制策略，其中使用所用模型执行该分析，并且在此可以体验用于优化的灵活的调整。

通过使用大量训练数据和有关训练内容的信息来训练机器学习中使用的模型，该模型的行为至少近似地越来越像模拟的真实系统，从而可以将根据模型而识别为有利的行为(当前情况下为控制策略)用于真实的系统。

正如原理上已知且在此未详细解释的那样，机器学习可以以所谓的监督学习、所谓的部分监督学习或无监督学习的形式进行。这些术语特别是与模型的训练方式有关。关于这方面的进一步细节，参考相关技术文献。

强化学习(Reinforcement Learning)涉及另一组机器学习算法。在强化学习中，一个或多个所谓的代理人被训练以在定义的环境中执行特定行动。根据采取的行动计算奖励，该奖励也可以是负数。在强化学习中，代理人被训练来选择多个相互一致的行动，从而从整体上提高从这些行动获得的累积奖励，这使得软件代理人更好地执行分配给它们的任务。在本发明中，无模型强化学习中的奖励对应于前面提到的成本函数。

深度学习(多层学习，Deep Learning)是机器学习的一种变体，其中在输入层与输出层之间使用具有许多中间层(隐藏层，英语为Hidden Layers)的(人工)神经网络(英语为Artificial Neural Networks，ANN)，从而形成大规模的内部结构。深度强化学习结合了强化学习和深度学习的方面。

人工神经网络(以下简称神经网络)是受生物神经网络启发的系统。它们包括大量互连的节点和节点之间的大量连接，即所谓的边。除了在提到的输入层中提供的节点、接收输入值的输入节点、以及在提到的输出层中提供的节点、提供输出值的输出节点之外，还存在(只)与其他节点连接的隐藏节点。每个节点代表一个人工神经元。信息可以通过每条边从一个节点传输到另一个节点。节点的输出可以定义为其输入(例如其输入的总和)的(非线性)函数。节点的输入或者提供输入的边或节点可以在函数中加权。节点和/或边的权重可以在学习过程中调整。

本发明的基本思想基于深度强化学习与(可能是附加的)神经网络的结合，该神经网络映射根据本发明运行的设备。如下文中还将阐述的，本发明的有利方面特别是包括：模型中使用的神经网络的基本训练，即在设备运行过程中对神经网络进行再训练或持续训练，从而实现控制的持续改进；生成训练数据的特定方式及其对训练过程的选择；以及在运行中对模型质量和控制质量的持续检查，如果质量不足，则自动回退到基本控制。

通过本发明，可以实现明显更好的控制器调整和总体上更好的能量效率，特别是在负载变化的情况下。本发明特别使用提到的成本函数，如上所述，该成本函数有利地基于过程工程设备的产品标准(纯度、组成、数量)或消耗标准(能量、反应物)定义。例如在相应设备中传统使用的MPC闭环控制中，情况并非如此。

特别是，本发明可以包括：首先手动操作和/或使用另一控制过程(例如使用级联控制或线性MPC闭环控制或其他MPC闭环控制)操作设备；并且使用由此获得的训练数据来训练根据本发明提供的自优化控制过程或其中使用的映射设备的神经网络。以这种方式，即通过使用历史数据或借助于另一控制过程获得的真实数据进行训练，可以训练该神经网络针对特定控制值预测设备的各个特定操作参数。使用神经网络实现并相应地进行了(基本)训练的模型可以以这种方式在本发明的范围内与在根据本发明设置的控制装置的范围内的成本函数一起使用。如前所述，训练数据尤其可以是受一个或多个控制值的调节影响的一个或多个提到的设备参数。

换句话说，所提出的方法有利地包括：在第二方法阶段中使用自优化控制过程进行一个或多个控制值的调节；在第二操作阶段之前的第一操作阶段中，手动操作和/或使用另外的、特别是非自优化的控制过程操作设备；以及首先借助于在第一操作阶段中获得的训练数据来训练(使用在自优化控制过程中的)神经网络。

接着可以借助于在第二操作阶段中获得的训练数据来训练神经网络，即，利用从自优化控制过程的使用中得出的训练数据，在该控制过程中已经使用了先前进行了(基本)训练的神经网络。正如下面还将更详细地解释的那样，由此可以实现控制器行为的持续改进。

在第二操作阶段的第一循环中(其中神经网络仍仅利用在第一操作阶段中获得的训练数据进行训练)，由于有限的外推行为，模型通常只会使用与之前使用的那些相似的控制策略，相应地可以预期控制质量也相似。此时，一旦来自第二操作阶段的训练数据可用，即使用了自优化控制过程，就可以在训练数据的相应数据集中将新获得的训练数据添加到目前可用的训练数据中。然后利用先前确定以及新确定的训练数据对神经网络进行再训练，并将其集成到控制过程中。即使控制策略总是与之前的相似，随着时间的推移，通过不断重复相应的模型更新，并通过与过去策略的细微差异，也会发现不断改进的控制策略。

最终，该模型与成本函数一起表示超维空间中的标量场，在该标量场中可以通过优化器在所用控制过程中搜索最小值。然而，标量场只在那些之前存在过训练数据的区域有效。在此，在周围区域中例如会发现局部最小值。根据针对相应区域进行了再训练的模型中得出的评估结果(更正面或更负面)，控制过程将更倾向于或不倾向于相应的方向。

在根据本发明提出的方法中，有利地记录一个或多个过去时间点的一个或多个操作参数的一个或多个实际值。通过使用以这种方式记录的一个或多个实际值，有利地为一个或多个未来时间点确定一个或多个操作参数的一个或多个预测值，并且有利地借助于模型、使用一个或多个操作参数的一个或多个设定值和使用一个或多个预测值来指定一个或多个控制值。通过使用所提出的方法可以逐步改进控制，特别是改进预测值的可靠性，据此确定相应的调节值。

总之，在本发明的范围内，可以借助于神经网络在重复的探索循环中探索新的控制策略。如前所述，在其中有利地使用来源于对过程工程设备进行的借助于另外的控制方法执行的初始操作或者手动操作的训练值，并且将该训练值连续替换为使用自优化控制过程本身所获得的后来值，这使得控制不断优化。

如前所述，一个或多个执行器特别可以是或包括一个或多个阀门，一个或多个控制值可以是或包括一个或多个阀门的控制值，并且一个或多个操作参数可以是或包括一个或多个质量流量或温度。这尤其适用于在空气分离设备中使用所提出的方法的情况。在具体示例中，调节回流阀、进料空气量和氩气转化率。

在根据本发明的方法的一个特别优选的实施方案中，在将一个或多个控制值用于调节一个或多个执行器之前，检查该一个或多个控制值的适用性。特别是，这可以包括合理性检查或与先前值的比较，以消除不合理或不合适的值。

在本发明的一个实施方案中，还可以将对一个或多个未来时间点的一个或多个操作参数的一个或多个预测值与稍后在这些时间点获得的实际值进行比较，其中基于该比较确定预测质量。这特别是可以用于持续监测预测质量，以便能够在恶化超过允许水平的情况下启动措施。

换言之，特别是，如果所确定的预测质量低于指定的最低质量，则可以调整自优化控制过程或者可以由另一控制过程代替该自优化控制过程。在这种情况下，例如可以使用(可能在能量或收益或成本函数方面较差，但更可靠的)回退(Fallback)控制过程，并且可以由此开始特别是以前述方式启动再优化。可选地，还可以使用先前使用的优化状态，为此目的，该优化状态可以被暂时存储。如前所述，相应的质量评估还可以包括将特定的历史值识别为有利的训练数据。

在本发明的范围内，自优化控制过程也可以以在序言中已经描述的方式与ALC开环控制结合使用。

本发明还涉及一种过程工程设备，特别是空气分离设备，其被适配成使用一个或多个控制值来调节过程工程设备中的一个或多个执行器，并由此影响过程工程设备的一个或多个操作参数。

根据本发明，该设备的特征在于提供了一种控制装置，该控制装置被适配成使用自优化控制过程至少在一个方法阶段中调节一个或多个控制值，并且使用基于模型的深度强化学习并考虑成本函数来执行自优化控制过程，其中借助于神经网络将过程工程设备的一个或多个部件映射到在基于模型的深度强化学习中使用的模型中。

本发明的主题还是一种用于改装过程工程设备的方法，该过程工程设备被适配成使用一个或多个控制值来调节过程工程设备中的一个或多个执行器，并由此影响过程工程设备的一个或多个操作参数。

根据本发明，该方法的特征在于，在设备改装时，由自优化控制过程取代现有的用于调节一个或多个控制值的控制过程，其中该自优化控制过程包括使用基于模型的深度强化学习和考虑成本函数，并且其中借助于神经网络将过程工程设备的一个或多个部件映射到在基于模型的深度强化学习中使用的模型中。由自优化控制过程取代现有的控制过程包括将现有的控制过程的控制函数逐步转移到自优化控制过程。换句话说，即现有的控制过程的控制函数越来越多地、特别是一个接一个地或成组地不再借助于现有的控制过程、而是借助于自优化控制过程来执行。

对于根据本发明设置的过程工程设备或通过用于改装的方法改装的过程工程设备及其进一步的实施方案的进一步特征，明确参考关于根据本发明的方法及其实施方案的上述阐述。相应的设备特别地适配用于执行如之前在不同的实施方案中所阐述的方法。

参考附图对本发明的其他方面进行阐述。

附图说明

图1示出了可根据本发明的实施方案来操作的空气分离设备。

图2示意性地示出了根据本发明的实施方案的方法的流程。

图3示意性地示出了根据本发明的实施方案的方法的方面。

图4示出了根据本发明的实施方式和非根据本发明的实施方式获得的消耗直方图。

具体实施方式

在图中，结构上或功能上彼此对应的元件以相同的附图标记给出并且为了清楚起见不再重复解释。如果下文中提到方法步骤，则相应的解释以相同的方式涉及执行这些方法步骤的设备部件，反之亦然。

图1示例性地示出了本身已知类型的空气分离设备100，其可以根据本发明的实施方案、特别是通过使用示意性示出的控制装置50来运行。正如之前多次提到的，本发明也适用于操作其他过程工程设备，并不局限于空气分离设备。

所示类型的分离空气设备已在其他地方反复描述，例如在Wiley-VCH出版公司2006年由H.-W.

编辑出版的Industrial Gases Processing一书中，特别是在章节2.2.5“Cryogenic Rectification”中。因此，关于构造和操作方式的详细阐述，参考对应的技术文献。使用本发明的空气分离设备可以极为不同的方式设计而成。

图1中所示的空气分离设备主要具有主空气压缩机1、预冷装置2、清洁系统3、再压缩组件4、主换热器5、膨胀涡轮机6、节流装置7、泵8和精馏塔系统10。精馏塔系统10包括由高压塔11和低压塔12组成的双塔组件、以及粗氩塔13和纯氩塔14。根据本发明的实施方案提出的控制在此可以例如影响回流比、进料空气量和氩气转化率，其他变量可以是膨胀机的操作参数以及塔或塔的一部分中的水位。

正如本发明不限于与诸如空气分离设备100的空气分离设备一起使用，本发明也可以与不同于所示设计的空气分离设备一起使用，这些空气分离设备可以具有以相同或不同方式彼此连接的更少或更多数量的精馏塔。

在所示的空气分离设备100中，借助主空气压缩机1经由未标记的过滤器抽吸和压缩进气流。将经过压缩的进气流供给通过冷却水运行的预冷装置2。在净化系统3中净化预冷却的进气流。在典型地包括一对交替使用的吸附器容器的净化系统3中，使预冷却的进气流基本上摆脱水和二氧化碳。

在净化系统3的下游将进气流划分为两个分流。将分流中的一个分流在主热交换器5中在进气流的压力水平上完全冷却。将另一个分流在再压缩组件4中再压缩并且同样地在主热交换器5中冷却，然而仅冷却到中间温度水平。在冷却到中间温度水平后，将所谓的涡轮流借助膨胀涡轮机6膨胀到完全冷却的分流的压力水平，与该分流结合并输送到高压塔11中。

在高压塔11中形成富氧的液态底部馏分和富氮的气态顶部馏分。将富氧的液态底部馏分从高压塔11中抽出，部分地用作纯氩塔14的底部蒸发器中的加热介质并且各自按份额输送到纯氩塔14的顶部冷凝器、粗氩塔13的顶部冷凝器以及低压塔12中。同样地，将在粗氩塔13和纯氩塔14的顶部冷凝器的蒸发腔中蒸发的流体运送到低压塔12中。

将气态的富氮顶部产物从高压塔11的顶部中抽出，在主冷凝器中液化，该主冷凝器在高压塔11与低压塔12之间形成换热连接，并且按份额作为回流交给高压塔11和膨胀到低压塔12中。

在低压塔12中形成富氧的液态底部馏分以及富氮的气态顶部馏分。将前者部分地在泵8中液态地加压，在主热交换器5中加热，并作为产物提供。将富氮的液态流从低压塔12的顶部处的液体保持装置中抽出并作为液氮产物从空气分离设备100中运出。将从低压塔12顶部中抽出的气态富氮流引导通过主热交换器5并在低压塔12的压力下作为氮产物提供。另外，将来自上部区域中的流从低压塔12中抽出，并且在主热交换器5中加热后作为所谓的不纯氮在预冷装置2中使用，或者在借助电加热器加热后在净化系统3中使用。

特别地，所示类型的传统空气分离设备可以使用级联控制器或(线性)MPC进行控制。在此，控制目标例如是调节高压塔11中的特定的温度分布。在这种情况下，控制装置50例如可以控制在主冷凝器9中冷凝的顶部气体向高压塔11的回流R。借助于相应的温度传感器检测的高压塔11中的一个或多个温度例如用作被控变量。相应的控制通常也作用于大量其他执行器，以实现另外的控制目标。

如果在此使用根据本发明的实施方案的方法，则可以在控制装置50中执行所阐述的自优化控制过程。在第一步骤中，对高压塔11中的温度分布的控制可以由自优化控制过程接管，此时该控制过程通过用于回流R的回流阀执行控制。在此，特别是可以确定，在负载变化的情况下，控制质量得到明显改善。在可比较的负载变化场景中，LMPC的压力塔内的温度的均方根误差(RMSE)为283mK，而在根据本发明的实施方案的控制中能够达到的对应值为93mK。

在下一步骤中，可以将所有(在示例中是三个)主控制回路(在示例中涉及回流量、进料空气量和氩气转换率)委托给自优化控制过程，并且之前为此使用的控制过程可以停用。整个空气分离设备100就可以只通过简单的级联控制器和自优化控制过程来操作。在此，可以确定使用的空气量减少了2％，如图4所示。在此，高压塔11和低压塔12中的温度分布以及从低压塔11转移到粗氩塔13的传输流T的组成可以用作(主要)过程变量，这些过程变量可以用适当的传感器来确定。使用的空气量、控制向高压塔的回流R的回流阀和氩气转化率(对应于物质流T的质量流量)可以作为操纵变量。由此得到5x3控制问题。自优化控制过程可以利用作为输入的其他过程变量工作，这些过程变量例如是纯氩转化率(对应于从粗氩塔13的塔顶进入纯氩塔14的物质流P)、液氧冲洗信号(为了使碳氢化合物不积聚在低压塔12的底部，必须定期进行冲洗，例如通过内部压缩泵8)等。除了稳定三个主要过程变量外，还可以借助于自优化控制过程来稳定气态氧和氮气的产品纯度。在此，还可以对来自自优化控制过程的值进行合理性检查。为了仅用主控制回路加载自优化控制过程，其他控制回路可以通过线性方程同时运行，例如用于调节精馏塔11至14中的液位。

在图2中示意性地示出了采用一种优选的实施方式的根据本发明的方法的流程，其在控制技术方面示出了空气分离设备100。为此示出了在空气分离设备100中发生或进行的两个过程110、120。这样的过程可以由不同的参数来定义或预先确定，并且特别是也可以受到特定的相互作用的影响。

在这些过程110、120期间(并且因此在空气分离设备100的运行期间)执行各种行动并且可以测量各种变量以获得相应的数据130。例如，过程可以包括特定的气体流，其根据阀位置(作为操纵变量)达到或应该达到特定的质量流量(作为被控变量)，如以图1为例所解释的。

如前所述，所提出的方法实际上能够用于任何工业设备(空气分离设备、石化设备、天然气设备等)。在此，有利地列入考虑作为要控制的过程的是难以用经典控制方法控制的复杂的子系统，例如多相管线、蒸馏塔等的控制。即使是小的子系统有时也很难用经典方法进行控制，例如在不仅当前的测量变量(压力、液位等)影响控制策略，而且还应该或必须考虑到这些测量变量的历史记录(例如因为系统中存在死区时间)时。利用神经网络可以很好地映射相应的设备。如上所述，在此使用了前馈网络与循环网络之间的特殊变型。由于神经网络是用正常的操作数据训练的，这种组合确保只学习设备行为，而不是学习整个系统行为(包括设备和控制器)。

由于此类过程通常受到控制，因此存在相应的控制回路，其中还会记录相应被控变量的实际值。在获得的数据130的范围内，这些实际值随后被馈送到模型预测控制或模型预测控制器140，该控制器例如在合适的计算单元(例如上文所示的控制装置50)上执行。

模型预测控制器140现在包含过程工程设备的模型142，该模型至少映射应被控制的相关过程110、120或相应的参数。模型142在此被映射或表示为神经网络。

现在，参照实际值和/或关于过程的其他数据，可以(在模型预测控制的范围内)获得对这些数据的未来走向或未来行为的预测。在优化的范围内，为控制回路或过程寻找操纵变量，利用这些操作变量可以同时很好地达到(例如由外部或操作员指定或根据给定的流程图指定的)被控变量的在143中被使用的设定值175。

以这种方式找到的操纵变量的值170由附加的高级过程控制系统(APCS)进行合理性检查，然后馈送到相关过程110、120或在那里调节操纵变量。此外，APCS还经由简单的前馈和级联控制器控制低优先级控制回路，以限定模型预测控制器所需的计算能力及其模型复杂性。

此外，如141所示，比较和检查已经有实际值的过去的时间段内的预测质量。在预测质量检查141的范围内，如果确定预测质量在指定范围之外，因此质量不足，则可以切换到设备100的基本控制，以确保安全运行。这由虚线箭头指示。在本发明的一个实施方案中，在优化过程中也特别确保了优化器对操纵变量的建议在对神经网络有效的范围内。160旨在展示神经网络的训练。

神经网络本身会定期(例如每天)利用新获取的历史数据进行训练。其中，模型定期收到有关实际使用的操纵变量轨迹对控制问题的解决的贡献程度的反馈。这样，无需例如操作员或控制工程师的外部帮助即可进一步改进控制器。在此训练期间，利用迄今为止使用的神经网络操作过程工程设备。

这种训练特别是还基于在过程30 110、120中或在过程工程设备的一般运行期间获得的数据130进行。由于随着时间的推移，数据集包括越来越多从使用映射为神经网络的模型142的操作中获得的数据，对于神经网络而言，学习高质量地映射设备行为就变得越来越容易。

训练特别是可以在单独的、也是外部的或远程的计算单元185上进行，以节省计算单元180上的资源。而在这种情况下，计算单元180和185一起形成用于过程工程设备100的开环控制系统和闭环控制系统，以便利用所提出的方法操作该设备。

图3示意性地示出了根据本发明的实施方案的方法的方面，其中示出了控制过程的细节并总体上由200表示。

控制过程200作用于设备或方法，例如上述空气分离设备100。优化步骤21和预测步骤22是控制过程200的一部分。如箭头A所示，期望的设备参数(例如塔温)被提供给优化步骤21。优化步骤21据此计算针对当前循环的流速的控制值B，该控制值应用在方法，例如空气分离设备100中。可以将获得的例如20个先前循环的实际值C提供给预测步骤22，该预测步骤基于此并在控制值B的基础上，为未来的温度做出温度预测。该温度预测用于优化步骤21。在这里所示的实施方案中，预测步骤22使用基于神经网络的模型工作。

换言之，使用一个或多个控制值B在过程工程设备100中调节执行器(例如阀门)，由此影响过程工程设备100的一个或多个操作参数。这通过使用此处所示的自优化控制过程200来进行，其中该自优化控制过程包括使用基于模型的深度强化学习和在143中考虑成本函数。借助于神经网络将过程工程设备100的一个或多个部件映射到模型中，该模型被用在预测步骤22中并且因此用在控制过程200中的基于模型的深度强化学习中。

如图3所示，为一个或多个先前时间点记录一个或多个操作参数的一个或多个实际值C，并且借助于该一个或多个实际值C，使用自优化控制过程为一个或多个未来时间点确定一个或多个操作参数的一个或多个预测值D。使用一个或多个操作参数的一个或多个设定值A并且使用借助于自优化控制过程获得的一个或多个预测值B来指定一个或多个控制值B。

图4示出了根据本发明的实施方式和非根据本发明的实施方式获得的消耗直方图。这些消耗直方图分别表示空气分离设备的不同运行状态下进料空气的消耗量，其中横轴表示进料空气量，纵轴表示对应于不同运行时间点的相应采样值的数量。根据本发明的实施方案获得的消耗直方图由401表示，非根据本发明的实施方式获得的消耗直方图由402表示。从中可以看出，当使用根据本发明设置的方法时进料空气的消耗在大多数情况下低于非根据本发明的实施方式。

Claims

1.一种用于操作过程工程设备(100)的方法，其中使用一个或多个控制值来调节所述过程工程设备(100)中的一个或多个执行器，由此影响所述过程工程设备(100)的一个或多个操作参数，其特征在于，至少在一个方法阶段中使用自优化控制过程进行所述一个或多个控制值的调节，其中所述自优化控制过程包括使用基于模型的深度强化学习和考虑成本函数，并且其中借助于神经网络将所述过程工程设备(100)的一个或多个部件映射在模型中，其中所述神经网络映射所述过程工程设备(100)的行为并且被使用在所述基于模型的深度强化学习中。

2.根据权利要求1所述的方法，其中借助于所述神经网络在指定的时域内预测所述过程工程设备的未来行为，特别是在对所述过程工程设备(100)的一个或多个操作参数的控制的范围内。

3.根据权利要求1或2所述的方法，其中在第二方法阶段中使用所述自优化控制过程进行所述一个或多个控制值的调节，其中在所述第二操作阶段之前的第一操作阶段中，手动操作和/或使用另外的控制过程操作所述设备，并且其中首先借助于在所述第一操作阶段中获得的训练数据来训练所述神经网络。

4.根据权利要求3所述的方法，其中接着借助于在所述第二操作阶段中获得的训练数据来训练所述神经网络，和/或其中所述训练数据包括分别对应于特定控制值的操作参数。

5.根据前述权利要求中任一项所述的方法，其中借助于所述成本函数考虑消耗参数并将其与各自的指定目标相权衡。

6.根据前述权利要求中任一项所述的方法，其中记录一个或多个过去时间点的所述一个或多个操作参数的一个或多个实际值，其中借助于所述自优化控制过程、使用所述一个或多个实际值为一个或多个未来时间点确定所述一个或多个操作参数的一个或多个预测值，并且其中借助于所述自优化控制过程、使用所述一个或多个操作参数的一个或多个设定值和使用所述一个或多个预测值来指定所述一个或多个控制值。

7.根据前述权利要求中任一项所述的方法，其中借助于所述神经网络在重复的探索循环中探索新的控制策略。

8.根据前述权利要求中任一项所述的方法，其中所述一个或多个执行器是或包括一个或多个质量流量和/或阀门，所述一个或多个控制值是或包括所述一个或多个质量流量和/或阀门的控制值，并且所述一个或多个操作参数是或包括一个或多个质量流量和/或物质浓度和/或温度。

9.根据前述权利要求中任一项所述的方法，其中在将所述一个或多个控制值用于调节所述一个或多个执行器之前，检查所述一个或多个控制值的适用性。

10.根据前述权利要求中任一项所述的方法，其中将对所述一个或多个未来时间点的一个或多个操作参数的一个或多个预测值与稍后在所述时间点获得的实际值进行比较，其中基于所述比较确定预测质量。

11.根据权利要求8所述的方法，其中如果所确定的所述预测质量低于指定的最低质量，则调整所述自优化控制过程或者由另外的控制过程代替所述自优化控制过程。

12.根据前述权利要求中任一项所述的方法，其中操作进行组分混合物的低温分离的过程工程设备(100)，其中特别是将空气分离设备作为所述过程工程设备(100)操作。

13.一种过程工程设备(100)，其被适配成使用一个或多个控制值来调节所述过程工程设备(100)中的一个或多个执行器，并且由此影响所述过程工程设备(100)的一个或多个操作参数，其特征在于，提供一种控制装置(50)，其被适配成至少在一个方法阶段中使用自优化控制过程进行所述一个或多个控制值的调节，并且通过使用基于模型的深度强化学习和通过考虑成本函数执行所述自优化控制过程，其中借助于神经网络将所述过程工程设备(100)的一个或多个部件映射在模型中，其中所述神经网络映射所述过程工程设备(100)的行为并且被使用在所述基于模型的深度强化学习中。

14.根据权利要求113所述的设备(100)，其被设计成在其中进行组分混合物的低温分离，并且所述设备特别是被设计为空气分离设备。

15.一种用于改装过程工程设备(100)的方法，所述过程工程设备被适配成使用一个或多个控制值来调节所述过程工程设备(100)中的一个或多个执行器，并且由此影响所述设备(100)的一个或多个操作参数，其特征在于：在改装所述设备时，由自优化控制过程取代现有的用于调节所述一个或多个控制值的控制过程，其中所述自优化控制过程包括使用基于模型的深度强化学习和考虑成本函数，并且其中借助于神经网络将所述过程工程设备(100)的一个或多个部件映射在模型中，其中所述神经网络映射所述过程工程设备(100)的行为并且被使用在所述基于模型的深度强化学习中；由所述自优化控制过程取代所述现有的控制过程包括将所述现有的控制过程的控制函数逐步转移到所述自优化控制过程。