CN117461000A

CN117461000A - 经由机器学习回归器监测和/或控制设施

Info

Publication number: CN117461000A
Application number: CN202280040601.8A
Authority: CN
Inventors: P·吕尔; A·巴丁斯基; G·海德尔
Original assignee: BASF SE
Current assignee: BASF SE
Priority date: 2021-06-07
Filing date: 2022-05-27
Publication date: 2024-01-26
Also published as: EP4352575A1; WO2022258395A1; KR20240017901A

Abstract

公开了一种用于模拟、监测和/或控制分批设施(1)的计算机实现的回归器(7)的各方面。分批设施(1)被实现为接收具有相关联的离析物质量参数(x1，x2)的一个或多个离析物(3，5)，以处理所述离析物(3，5)，其中，处理具有相关联的处理参数(yj)，并且输出具有相关联的产品质量参数(Q1，Q2)的产品(4，5)。回归器(7)包括基于机器学习原理的至少两个回归器单元(9，10)，每个回归器单元(9，10)具有用于接收输入数据的输入和用于输出输出数据的输出。第一回归器单元(9)被实现为接收所述离析物质量参数(xi)并输出至少一个离析物影响参数(R1)。并且，第二回归器单元(10)被实现为接收所述离析物影响参数(R1)和所述处理参数(yj)并输出至少一个产品质量参数(Qj)。

Description

经由机器学习回归器监测和/或控制设施

技术领域

本公开涉及用于模拟、监测和/或控制设施的方法、回归器，特别涉及人工神经网络系统和控制设备。进一步地，提供了用于训练人工神经网络系统的方法。特别地，描绘了基于人工神经网络(ANN)的模型，该模型适合于模拟其中通过分批(batch)处理单元将离析物转化为产品的分批处理，并且其适合于监测和/或控制分批设施。

背景技术

在分批处理或分批设施中，多个产品的生产利用同一套设备或处理单元，例如化学或生物反应器。一方面，希望优化涉及被加工成期望产品的某些离析物的特定处理。另一方面，如果对处理进行准确建模和模拟，则可以改进使用单个处理单元调度分批操作。

在常规方法中，对分批处理中发生的化学反应的模拟使用基于严格模型或第一原理的所谓的白盒模型。由于待建模的复杂物理化学系统涉及非线性方程，因此白盒模型通常要求大量的计算能力和资源。

另一种方法是过去开发的所谓的黑盒模型，并且依赖于机器学习概念。例如，神经网络可用于基于包括处理特性和离析物特性的输入数据来预测产品的具体特性或其质量。这样的神经网络需要利用有时不可用的多个数据集来训练。进一步地，如果待建模的分批设施中的条件、期望的产品质量和/或离析物特性改变，则需要对基于人工神经网络的常规黑盒模型进行重新训练，从而致使常规方法不灵活。

进一步的方法是作为白盒模型和黑盒模型的组合的混合模型。文档WO 2020/227383 A1公开了基于计算机的处理建模和模拟方法和系统，其将第一原理模型和机器学习模型组合，以在缺乏任一模型的情况下受益。在一个示例中，通过第一原理技术来调整测量的输入值。在调整的值上训练感兴趣的化学处理的机器学习模型。在另一示例中，机器学习模型表示第一原理模型预测与经验数据之间的残差。残差机器学习模型校正化学处理的第一原理模型中的物理现象预测。在另一示例中，第一原理模拟模型使用处理输入数据和机器学习模型的预测来生成化学处理的模拟结果。

文档WO 2020/058237 A2公开了一种能够预测作为多步骤生产过程的结果的化合物或其制剂的产品质量属性的值的方法和系统，其中，整个处理或处理步骤由处理参数表征。它是通过在质量预测模型中执行处理数据的多变量数据分析来实现的，其指定或表示生产过程或其子过程的质量属性和处理参数之间的数学关系。质量预测模型是通过历史处理数据的数学建模获得的，最优选使用神经网络模型组合随着时间的推移获得的经验处理知识。

发明内容

本公开的目的是提供用于监测和/或控制设施的改进的方法和系统。

独立权利要求的方面解决了该问题。

本公开提供了一种用于模拟、监测和/或控制设施的计算机实现的回归器。设施可以被实现为接收具有相关联的离析物质量参数的一个或多个离析物，处理所述(一个或多个)离析物，其中，处理具有相关联的处理参数，并且输出具有相关联的产品质量参数的产品。回归器包括至少两个回归器单元，每个回归器单元包括用于接收输入数据的输入和用于输出输出数据的输出。在回归器内，第一回归器单元被实现为接收所述离析物质量参数并输出至少一个离析物影响参数；并且第二回归器单元被实现为接收所述离析物影响参数和所述处理参数并输出至少一个产品质量参数。回归器和/或回归器单元是基于机器学习原理。

在实施例中，公开了一种用于模拟、监测和/或控制分批设施的人工神经网络(ANN)系统。分批设施被实现为接收具有相关联的离析物质量参数的一个或多个离析物，以处理所述离析物，其中，处理具有相关联的处理参数，并且输出具有相关联的产品质量参数的产品。ANN系统包括至少两个ANN，每个ANN包括具有用于接收输入数据的输入节点的输入层和具有用于输出输出数据的输出节点的输出层。第一ANN被实现为接收所述离析物质量参数并输出至少一个离析物影响参数。第二ANN被实现为接收所述离析物影响参数和所述处理参数并输出至少一个产品质量参数。

申请人发现嵌套或级联的ANN是用于解决由分批设施提出的可分离问题的适合的回归器。因此，所公开的回归器可以被实现为涉及ANN的ANN系统。

在所提出的ANN系统中，与离析物有关的数据(即离析物质量参数)和与在分批设施中执行的实际处理有关的处理数据(即处理参数)被分别考虑。第一ANN根据离析物质量参数建模/模拟离析物特性的影响，并且第二ANN建模/模拟例如化学或生物处理，该处理至少部分地由在分批设施的操作期间可以观察或设置的处理参数驱动。第二ANN还接收来自第一ANN的输入，使得可以可靠地预测产品质量参数。

应当理解，相应的ANN包括具有用于接收输入数据的输入节点的输入层和具有用于输出输出数据的输出节点的输出层。ANN还可以包括输入层与输出层之间的隐藏层。通常，相应ANN由配置数据来表征，该配置数据至少包括用于ANN内的每个节点的偏置值和权重值。该配置数据是通过训练相应ANN来获得的。

人们也可以将经训练的ANN称为用于分批设施的处理单元中发生的化学反应的模型。经训练的ANN也被认为是用于潜在问题的回归器，以将输入数据(例如离析物和处理特性)映射到输出或目标数据(例如产品特性)上。

所提出的将各种离析物质量参数和处理参数映射到产品质量参数的复杂问题分离的方法允许分别在训练ANN或模型时有效地使用稀疏数据集。ANN系统的实施例允许共享用于由相同或类似的分批设施产生的不同产品的训练数据集。特别地，处理模型或第二ANN可以受益于在不同的分批设施处理中使用的类似或相同的离析物的离析物模型或经训练的第一ANN。例如，如果离析物被改变，但是由第二ANN建模的总体分批处理基本上未改变，则ANN系统允许通过更新用于第一ANN的配置数据来改变离析物模型。因此，分批设施处理中的未改变的组件的训练的部分ANN保持不变。这样做，相对于常规人工神经网络，减少了所要求的训练数据量，该人工神经网络需要用一组离析物质量参数和处理参数来完全训练，以针对或建模产品质量参数。

发生的是，根据申请人的调查，产生的用于模拟分批设施的模型或神经网络系统对训练数据中的噪声是鲁棒的。在实施例中，根据第一ANN或离析物模型的部分黑盒模型描述了离析物的影响，其独立于设施或化学处理设置。因此，第一ANN可以用于结合由替代第二ANN建模的分批设施单元或者替代分批设施。因此，特别地，训练的第一ANN可以被再循环，并且仅需要使用用于建立第二ANN的稀疏训练数据或用于替代分批设施的处理模型。

在实施例中，输出产品质量参数以计算机可读的形式生成、显示和/或用于控制、调度或适配分批设施，特别是通过控制设备。

在实施例中，第二ANN是基于训练数据集，该训练数据集包括处理参数和对应于与相应产品相关联的产品质量参数的产品目标变量。例如，处理参数可包括在化学反应期间测量的可观测值、温度值、最大温度值、时间跨度、反应跨度、催化剂的存储时间、游离异氰酸酯基团的数量、或时间序列的其他特性。人们可以考虑影响分批反应器中的化学反应的其他处理参数。

产品质量参数可以包括产品的粘度值、硬度值、粗糙度值、药物相互作用效应、pH值或溶解度。人们可以考虑表征所获得的产品或在分批设施中的化学处理或反应期间的产品的其他产品质量参数。

在ANN系统的实施例中，基于训练数据集来训练第一ANN，该训练数据集包括作为用于离析物影响参数的目标变量的训练的第二ANN的残差和离析物质量参数，离析物质量参数和残差二者对应于相应的产品。第二ANN的残差或预测误差可能归因于训练数据集的稀疏可用性，并且用于训练对离析物质量建模的第一ANN。离析物质量参数可包括粘度值、羟基值、浓度值、颜色参数等。人们可以考虑其他离析物质量参数。

ANN系统可以看作第一和第二ANN的级联系统。在ANN系统的实施例中，一种系统包括：

多个第一ANN，其中，第一ANN中的每个ANN对应于离析物，并且被实现为接收对应的离析物质量参数，并且被实现为输出至少一个对应的离析物影响参数；以及

多个第二ANN，其中，第二ANN中的每个ANN对应于用于产生产品的处理，并且被实现为从第一ANN接收对应的处理参数和离析物影响参数的组合，并且被实现为输出对应的产品质量参数。

人们可以考虑将第一ANN与不同的离析物相关联，并且将第二ANN与具有特定相关联的处理参数的分批处理相关联。来自第一ANN的输出可以被组合、加权并馈送到第二ANN中。例如，每个第二ANN可以从第一ANN接收离析物影响参数的线性组合。因此，ANN系统允许通过组合离析物中的一个或多个来预测用于分批处理中产生的产品的产品质量参数，其中，离析物由离析物质量参数表征。

应当理解，“对应于动作的ANN”被解释为对动作建模的ANN。因此，“对应于特定产品的第二ANN”是被训练并设置为响应于与用于给定产品的生产过程相关联的处理参数来输出近似的产品质量参数的ANN。

在ANN系统的实施例中，ANN中的至少一个是前馈ANN。在实施例中，贝叶斯神经网络可以用作ANN。人们可以考虑，至少一个ANN还包括输入节点与输出节点之间的隐藏节点。

根据本公开的方面，提出了一种用于控制分批设施的控制设备。分批设施被实现为接收具有相关联的离析物质量参数的一个或多个离析物，以处理所述离析物，其中，处理具有相关联的处理参数，并且输出具有一个或多个相关联的产品质量参数的产品。控制设备包括如上文或下文关于实施例所公开的ANN系统，其中，控制设备被实现为根据从第二ANN输出的产品质量参数来适配处理，产品质量参数是响应于适配的处理参数。例如，基于ANN系统对分批设施内的处理的模拟，处理以及因此相关联的处理参数由控制设备改变以获得期望的产品质量。

在控制设备的实施例中，控制设备包括计算机处理设备，该计算机处理设备被实现为执行实现ANN系统的操作，并且执行用于适配处理参数的优化算法，使得从第二ANN输出的产品质量参数对应于预定的产品质量。

本公开的其他方面提供了一种用于训练回归器的方法，例如根据上文或下文关于某些实施例公开的ANN系统。训练方法包括以下步骤中的至少一个：

为第一产品和至少一个第二产品提供多个训练数据集，每个训练数据集包括离析物质量参数、处理参数和对应于与产品相关联的产品质量参数的产品目标变量；

基于训练数据子集来训练第二ANN，该训练数据子集包括处理参数和对应于第一产品的产品目标变量，从而获得用于每个训练数据子集的第一残差；

基于训练数据子集来训练第二ANN，该训练数据子集包括处理参数和对应于至少一个其他产品的产品目标变量，从而获得用于每个训练数据子集的第二残差；以及

基于训练数据子集和其他训练数据子集来训练第一ANN，该训练数据子集包括离析物质量参数和作为用于离析物影响参数的目标变量的残差，二者对应于第一产品，该其他训练数据子集包括离析物质量参数和作为用于离析物影响参数的目标变量的残差，二者对应于至少一个其他产品。

训练方法可包括基于包含特定离析物的所有产品的训练数据集来训练第一ANN，其包括用于该离析物的质量参数和来自先前(训练)步骤的残差作为目标。这优选针对每个离析物进行。

根据上述训练方法的各方面，第一ANN被训练为提供第二ANN的残差，从而减少了对大量训练数据子集或集合的需要。

在训练方法的实施例中，对于每个产品，执行基于训练数据子集来训练第二ANN的步骤，该训练数据子集包括处理参数、响应于与用于生产相应产品的离析物相关联的离析物质量参数的从训练的第一ANN输出的离析物影响参数、和对应于与相应产品相关联的产品质量参数的产品目标变量。因此，第二ANN从训练的第一ANN接收附加输入。

在训练方法的实施例中，重复执行基于训练数据子集训练第一ANN的步骤和训练第二ANN的步骤，该训练数据子集包括处理参数、响应于与用于生产相应产品的离析物相关联的离析物质量参数从训练的第一ANN输出的离析物影响参数、和对应于与相应产品相关联的产品质量参数的产品目标变量。

在实施例中，训练方法还包括：

通过操作分批设施并测量处理参数和/或产品质量参数来生成所述训练数据集；和/或

通过部署用于基于离析物质量参数模拟分批设施处理的白盒数值模型并生成处理参数和产品质量参数，生成所述训练数据集。

根据本公开的方面，一种用于模拟、监测和/或控制分批设施的方法，其中，分批设施被实现为接收具有相关联的离析物质量参数的一个或多个离析物，以处理所述离析物，其中，处理具有相关联的处理参数，并且输出具有相关联的产品质量参数的产品，方法包括使用上文或下文关于某些实施例所描述的ANN系统的步骤，其中，ANN系统是根据如上文或下文关于实施例所公开的训练方法来训练的。

应当理解，回归器单元不必被实现为ANN，并且本公开还涵盖其他回归器单元的适合配置。因此，在整个本公开中，表达“ANN”可以由“回归器单元”替换，以充分理解本发明的范围。回归器单元可以实现为计算机实现的回归方法，例如在软件功能或服务方面。

根据另一方面，本公开涉及一种包括计算机可读指令的计算机程序产品，该计算机可读指令使得包括一个或多个处理设备的计算系统响应于执行机器可读指令来执行用于模拟、监测和/或控制分批设施的上文所描述的方法和功能。

在实施例中，计算机程序产品包括程序代码，该程序代码用于当在至少一个控制计算机上运行时由计算机化的控制设备执行上文所描述的方法和功能。诸如计算机程序装置的计算机程序产品可以实现为存储卡、USB棒、CD-ROM、DVD或可以从网络中的服务器下载的文件。例如，可以通过从无线通信网络传送包括计算机程序产品的文件来提供这样的文件。

本发明的进一步可能的实施方式或替代解决方案还涵盖上文或下文关于实施例所描述的特征的组合(本文中未明确提及)。本领域技术人员还可以将单独的或孤立的方面和特征添加到本发明的最基本形式中。

附图说明

本发明的进一步的实施例、特征和优点将结合附图从后续描述和从属权利要求中变得明显，其中：

图1示出了用于分批设施的实施例的示意图。

图2示出了ANN系统的第一实施例的示意图。

图3示出了ANN系统的第二实施例的示意图。

图4示出了涉及用于训练ANN系统的实施例的方法步骤的流程图。

图5示出了ANN系统的第三实施例的示意图。

图6示出了用于训练ANN系统的实施例的算法。

图7示出了用于分批设施的控制系统的实施例的示意图。

具体实施方式

图1示出了用于分批设施的实施例的示意图。分批设施1包括处理单元2，其例如是连续搅拌的罐式反应器。罐式反应器2可用于在特定处理参数下处理各种离析物以产生产品。产品可以是例如预聚合物合成、多元醇、涂料或其他化学、药物或生物组合物的中间产品。

在图1的示例中，指示了单个输入离析物3，其在反应器2中经历处理并且产生产品4。人们可以将特定的离析物质量参数归因于由标签x₁指示的离析物3。离析物质量参数可包括离析物3的特定性质，例如反应性、羟基数或特定异构体。在反应器2中，发生化学反应处理，该化学反应处理可以由处理参数y表征，例如处理参数可以是在反应器2内可观察到的温度轮廓或时间序列。在反应器2中的反应处理完成或停止之后，可以检索具有指示为Q₁的特定质量参数的产品4。例如，质量参数Q₁可以是指产品4内的物质的纯度或浓度。

分批处理单元2可用于其他产品。例如，在虚线中，描绘了具有离析物质量参数x2的替代离析物5。分批处理然后导致具有产品质量参数Q₂的替代产品6。期望预测离析物3、5和应用的处理参数y对产品4、6的影响，并且特别是它们的产品质量参数。该问题可以写作：

其中，j代表本公开中的所有潜在产品{1,2,…p}的第j个产品。分批处理的模型或模拟需要将离析物质量参数x和处理参数y_j的组合映射到用于每个产品j的产品质量参数Q_j上。输入向量x描述了离析物的质量测量，例如物质浓度、粘度测量、颜色参数等。输入向量y_j是指可以在反应器2中的产品的生产期间测量的处理参数。人们可以考虑时间序列特征，诸如最大值、最小值或平均值，或者物理可观察性，例如温度或压力值作为处理参数。输出产品质量参数Q_j是标量并且描述产品j的期望质量。

图2示出了实现为建模或模拟分批处理的ANN系统的第一实施例的示意图，例如在图1的反应器2中实现。ANN系统7包括第一ANN 9和第二ANN 10。潜在的ANN模型或回归器被标记为ANN1和ANN2₁。ANN9、10例如是浅层ANN，其具有具有用于接收输入数据的输入节点的输入层和具有用于输出输出数据的输出节点的输出层。ANN 9、10的配置由配置数据定义，该配置数据包括用于相应ANN(未示出)中的每个节点的偏置值和权重值。

第一ANN9接收用于生产具有预定产品质量参数Q_j的期望产品所涉及的离析物的离析物质量参数x_i。第一ANN 9将离析物影响参数R_i输出到第二ANN 10的输入节点。第二ANN10进一步接收用于反应器2中的产品j的处理参数y_j。第二ANN 10输出预测的质量参数Q_j。因此，ANN系统7的实施例将离析物质量参数x_i和处理参数y_j映射到产品质量参数Q_j上。假设等式1中描绘的问题可以写作：

等式2假设用于产品质量参数Q_j的映射或函数是可分离的，其中，函数f取决于离析物质量参数x_i，并且函数g取决于处理参数y_j。如果根据反应器中的处理，离析物质量参数x_i以类似的方式影响反应动力学是有利的。图2中的ANN系统7解决了一个回归问题，该问题可以写作：

其中，是指用于真实值Q_j的回归器。回归器/>是指由训练的ANN9、10实现的模型，其中，w是指在神经网络9、10内使用的权重，并且b是指用于实现ANN 9、10内的节点的偏置值。X包括离析物质量和处理参数。

通常，图2中所示的ANN系统7能够分别模拟分批处理或反应器2。根据第一和第二ANN 9、10的ANN系统7的配置，一方面专用于对离析物质量参数x_i的影响进行建模(ANN1)，并且另一方面专用于对处理参数y_j的影响进行建模(ANN2₁)，允许对用于ANN 9、10的配置数据进行有效的训练和设置。

图3示出了ANN系统8的第二实施例的示意图。ANN系统8包括第一ANN 9和标记为ANN2₁和ANN2₂的两个第二ANN 10、11。标签是指通过ANN配置数据实现的模型，即偏差和权重和节点数量及其拓扑。第一第二ANN 10接收来自第一ANN 9的离析物影响参数R_i和描述或表征导致具有产品质量参数Q₁的产品j＝1的分批处理的处理参数y₁。另一个第二ANN 11接收表征导致具有产品质量参数Q₂的替代产品j＝2的处理的替代处理参数y₂。模型ANN1、ANN2₁和ANN2₂被实现为浅层神经网络，例如贝叶斯型神经网络，其在训练时不需要验证数据集。

图4示出了涉及用于训练图2或图3所示的ANN系统7、8的步骤的流程图。在第一步骤S1中，ANN2₁和ANN2₂模型彼此独立地进行训练，例如部署贝叶斯训练方法。用于ANN2₁的相应训练数据集包括处理参数y₁和作为目标变量的预定产品质量参数Q_i。多个训练数据集可用于每个产品j。在步骤S1中，对于模型ANN2₂发生相同的训练处理，其中，处理参数y₂被包括为目标变量，部署设计或测量的产品质量参数Q₂。例如，由于有限的训练数据量和缺少的离析物影响输入，模型ANN2₁和ANN2₂将在其质量预测中产生残差或误差。

在下一步骤S2中，计算目标变量(即Q₁和Q₂)的残差。

接下来，在步骤S3中，基于训练数据集来训练ANN模型ANN1，该训练数据集包括离析物质量参数x_i，并且作为在步骤S2中获得的残差的训练的目标变量。步骤S3中的ANN1的训练针对所有可用的产品j发生。因此，在ANN模型架构中分离了离析物质量参数的影响和各种处理参数的影响。优点在于，可以通过源自沿着y₁的第一产品和沿着y₂的第二产品的处理的较大数据集来训练对离析物参数的影响进行ANN建模或预测。人们可以考虑考虑用于离析物模型ANN1的训练数据集，用于导致进一步产品的进一步的分批处理。

在下一步骤S4中，实现模型ANN 2₁和ANN 2₂的第二ANN被重新训练。步骤S3中的附加训练使用从第一模型ANN1获得的预测残差的附加输入。因此，进一步改进了产品质量参数Q₁和Q₂的预测精度。

在实施例中，重复执行步骤S3和S4。由于ANN系统7、8的架构，可以处理稀疏训练数据集，并且仍然允许用于控制分批设施的鲁棒黑盒模型。特别是，在多个产品分批设施中，如果部署了共享或经常使用的离析物，则可以重新使用或再循环ANN配置数据。

图7示出了用于使用ANN系统7、8或其改进的分批设施的控制系统的实施例的示意图。图7示出了耦接到分批设施的控制设备13，如例如图1所示。使用相同或相似的参考数字，并且不再明确解释。控制设备13接收离析物质量参数x_i和预定的产品质量参数Q’_p，其中预定的产品质量参数是指由反应器2生产的产品的期望质量。反应器2由用于特定产品p的处理参数y_p操作和/或表征。控制设备16例如是计算机实现的设备，该设备执行实现如先前或以下公开的ANN系统的操作。控制设备13还执行优化算法，使得根据产品质量参数Q’_p，针对产品的观察到的产品质量参数Q_p与预定的产品质量相匹配。接下来，详细阐述了图7所示的模拟/控制设施的各种方面。

图5示出了能够模拟各种产品的ANN系统或设置或架构，这些产品具有基于多个离析物及其相关联的离析物质量参数X_1,2,3,4的产品质量参数Q₁、Q₂和Q₃。f_1,2,3,4是指对应于第一ANN(例如在图3中，ANN1)的ANN离析物模型，并且g_1,2,3是指由第二ANN(例如图3中的ANN2₁和ANN2₂)实现的处理模型。h_1,2,3是指对涉及离析物样本的化学反应进行建模的线性回归器。例如，回归器h₁接收来自离析物模型f₁和f₂的输出。人们可以一般化图5所示的架构，该架构具有多个第一ANN而不是仅由f₁、f₂、f₃和f₄指示的四个，并且对应于分别由离析物质量参数X₁、X₂、X₃和X₄表征的离析物。然后，多个第二ANN(其中三个由g₁、g₂和g₃标记)接收加权离析物影响参数R₁、R₂、R₃和R₄以及对应于导致具有相关联的产品质量参数Q₁、Q₂、Q₃的相应产品1、2、3的分批处理的特定处理参数y₁、y₂、y₃的组合。通常，人们可以考虑j＝1…p产品和i＝1…m离析物。

图6示出了使用基于ANN的回归模型的通用算法的表示。图6所示的算法1特别提供了一种基于ANN系统7、8和12的广义ANN架构的训练方法。假设存在用于产品j的生产处理的n_j个样本或数据集。用于模型的输入参数被标记为等式4：

导致对应的目标变量：

作为训练算法的结果,获得回归器或ANN模型

代表用于模拟特定分批处理的单独ANN的权重和偏置方面的配置数据。

在图6所示的算法1的第1行至第6行中，获得了ANN模型的训练基于处理参数训练集y和产品质量参数作为目标变量。这导致在算法1的第4行中指示的残差。因此，源自处理参数的/>的模型残差被组合在单个数据集中，用于训练涉及离析物的ANN模型。在第7行中进行离析物训练，获取用于训练的离析物质量参数数据以及从第4行获得的残差。

接下来，对于算法1的第8行至第10行中的所有乘积p，获得根据等式4的回归模型

申请人的调查表明，用于第一和第二ANN模型的适合的ANN架构是通过贝叶斯调节训练的单个隐藏层神经网络。因此，获得了一种有效的基于神经网络的分批设施的模拟方法和控制能力。用于实现所公开的ANN模型及其训练的软件库以计算机实现的方式可用。例如，人们可以参考用于配置和操作本文所公开的ANN的MATLAB深度学习工具箱。

所公开的方法和系统的优点在于，即使仅稀疏数据集可用，产品质量的预测也是可用的。申请人的调查表明，基于所公开的方法的分批设施的模拟达到了与从白盒模型获得的精度相似或更好的精度(如果它们可用的话)。因此，提供了一种用于模拟、预测和控制化学处理的灵活而有效的工具，例如部署在分批处理中。

尽管在ANN系统中使用ANN公开了分批设施操作的模拟，但是本发明不限于这样的回归器。人们可以考虑回归系统的替代配置来执行回归，例如涉及高斯处理、线性回归、弹性网正则化模型等。例如，本公开中的任何ANN可以由适合的回归器单元来替换。应当理解，回归器可以实现为软件服务、硬件单元或分布式计算机网络。

使用的参考标记

1 分批设施

2 反应器

3、5 离析物

4、6 产品

7、8、12 ANN系统

9、10、11 ANN

13 控制设备

S1 训练第二ANN

S2 计算残差

S3 训练第一ANN

S4 重新训练第二ANN

Claims

1.一种用于模拟、监测和/或控制设施(1)的计算机实现的回归器(7)，其中，所述设施(1)被实现为：

接收具有相关联的离析物质量参数(x₁，x₂)的一个或多个离析物(3，5)，

处理所述离析物(3，5)，其中，所述处理具有相关联的处理参数(y)，以及

输出具有相关联的产品质量参数(Q₁，Q₂)的产品(4，5)；以及

所述回归器(7)包括：

至少两个回归器单元(9，10)，每个回归器单元(9，10)包括：

用于接收输入数据的输入，以及

用于输出输出数据的输出，

其中：

第一回归器单元(9)被实现为接收所述离析物质量参数(x_i)，并输出至少一个离析物影响参数(R₁)；以及

第二回归器单元(10)被实现为接收所述离析物影响参数(R₁)和所述处理参数(y_j)，并输出至少一个产品质量参数(Q_j)；以及

所述第一和第二回归器单元(9，10)是基于机器学习原理。

2.根据权利要求1所述的回归器，其中，所述第一和第二回归器单元(9，10)是人工神经网络ANN(9，10)，每个人工神经网络包括具有用于接收输入数据的输入节点的输入层和具有用于输出输出数据的输出节点的输出层，其中，

基于训练数据集来训练所述第二ANN(10)，所述训练数据集包括处理参数和对应于与相应的产品相关联的产品质量参数的产品目标变量。

3.根据权利要求2所述的回归器，其中，基于训练数据集来训练所述第一ANN(9)，所述训练数据集包括所述离析物质量参数和作为用于所述离析物影响参数的目标变量的经训练的第二ANN(10)的残差，所述离析物质量参数和所述残差二者对应于所述相应的产品。

4.根据权利要求1至3中的任一项所述的回归器，包括：

多个第一ANN，其中，所述第一ANN中的每个ANN对应于离析物，并且被实现为接收对应的离析物质量参数(X_i＝1…4)，以及输出至少一个对应的离析物影响参数(R_i＝1…4)；以及

多个第二ANN，其中，所述第二ANN中的每个ANN对应于用于产生产品的过程，并且被实现为接收对应的处理参数(Y_j＝1…3)以及来自所述第一ANN的离析物影响参数(R_i＝1…4)的组合，以及输出对应的产品质量参数(Q_j＝1…3)。

5.根据权利要求2至4中的任一项所述的回归器，其中，所述ANN中的至少一个ANN是前馈ANN、贝叶斯神经网络，和/或所述ANN中的至少一个ANN还包括隐藏节点。

6.根据权利要求1至5中的任一项所述的回归器，其中，所述离析物质量参数包括以下中的至少一个：粘度值、羟基值、浓度值、以及颜色参数。

7.根据权利要求1至6中的任一项所述的回归器，其中，所述处理参数(y_j)包括以下中的至少一个：所测量的可观测值、温度值、最大温度值、时间跨度、反应时间、催化剂的存储时间、游离异氰酸酯(NCO)基团的数量、以及时间序列的特性。

8.根据权利要求1至7中的任一项所述的回归器，其中，所述产品质量参数(Q_j)包括以下中的至少一个：粘度值、硬度值、粗糙度值、药物相互作用、pH值、以及溶解度。

9.一种用于控制设施(2)的控制设备(13)，其中，所述设施(2)被实现为：

接收具有相关联的离析物质量参数(x_i)的一个或多个离析物，

处理所述一个或多个离析物，其中，所述处理具有相关联的处理参数(y_j)，以及

输出具有相关联的产品质量参数(Q_j)的产品；

其中，所述控制设备(13)包括根据权利要求1至8中的任一项所述的回归器(1，7，8，12)，其中，所述控制设备(13)被实现为根据从所述回归器单元(10)输出的所述产品质量参数(Q_j)来适配所述处理，所述产品质量参数是响应于所适配的处理参数。

10.根据权利要求9所述的控制设备，其中，所述控制设备(13)包括计算机处理设备，所述计算机处理设备被实现为执行实现所述回归器(1，7，8，12)的操作，并且执行用于适配处理参数的优化算法，以使得从所述回归器单元(10)输出的所述产品质量参数(Q_j)对应于预定的产品质量。

11.一种用于训练根据权利要求1至10中的任一项所述的回归器的方法，其中，所述回归器单元(9，10)是机器学习单元，所述方法包括：

针对第一产品和至少一个第二产品(j＝1…p)提供多个n_p训练数据集，每个训练数据集包括离析物质量参数(x)、处理参数(y)和对应于与所述产品(j)相关联的产品质量参数的产品目标变量(Q)；

基于训练数据子集来训练所述第二回归器单元(10)和/或第三回归器单元，所述训练数据子集包括所述处理参数(y)和对应于第一产品(j＝1)的所述产品目标变量(Q)，从而获得每个训练数据子集的第一残差(R)；

基于训练数据子集来训练所述回归器单元(10)，所述训练数据子集包括所述处理参数(y)和对应于至少一个其他产品(j≠1)的所述产品目标变量(Q)，从而获得每个训练数据子集的第二残差(R)；以及

基于训练数据子集和其他训练数据子集来训练所述第一回归器单元(9)，所述训练数据子集包括所述离析物质量参数(x)和作为用于所述离析物影响参数的目标变量的所述残差(R)，二者对应于所述第一产品(j＝1)，所述其他训练数据子集包括所述离析物质量参数(x)和作为用于所述离析物影响参数的目标变量的所述残差(R)，二者对应于所述至少一个其他产品(j≠1)。

12.根据权利要求11所述的方法，还包括：

对于每个产品(j)，基于训练数据子集来训练所述第二回归器单元(10)，所述训练数据子集包括所述处理参数(y)、响应于与用于产生相应的产品的离析物相关联的所述离析物质量参数(x)而从经训练的第一ANN(9)输出的离析物影响参数、以及对应于与所述相应的产品相关联的产品质量参数的产品目标变量(Q)。

13.根据权利要求12所述的方法，其中，重复执行根据权利要求12所述的训练所述第一回归器单元(9)的步骤和训练所述第二回归器单元(10)的步骤。

14.根据权利要求11至13中的任一项所述的方法，还包括：

通过操作所述设施(1)并测量处理参数和产品质量参数来生成所述训练数据集；和/或

通过部署用于基于离析物质量参数模拟设施处理的白盒数值模型并生成处理参数和产品质量参数来生成所述训练数据集。

15.一种用于模拟、监测和/或控制设施(1)的方法，其中，所述设施(1)被实现为：

接收具有相关联的离析物质量参数(x_i)的一个或多个离析物(3，5)，

处理一个或多个所述离析物，其中，所述处理具有相关联的处理参数(y_j)，以及

输出具有相关联的产品质量参数(Q_j)的产品(4，5)；以及所述方法包括：

使用根据权利要求1至10中的任一项所述的回归器(7，8，12)，其中，根据权利要求11至14中的任一项所述的方法来训练所述回归器(7，8，12)。