CN117321511A

CN117321511A - 用于高维物理系统的建模、预测和控制的鲁棒自适应动态模式分解

Info

Publication number: CN117321511A
Application number: CN202280034826.2A
Authority: CN
Inventors: M·本诺斯曼; S·纳比
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2021-05-20
Filing date: 2022-03-01
Publication date: 2023-12-29
Also published as: EP4341755A1; US11790247B2; WO2022244389A1; US20220374725A1; JP2024520177A

Abstract

提供了一种计算机实现方法。该计算机实现方法包括被存储在存储器中的数据驱动模型和鲁棒闭包模型，通过使用处理器来控制系统。该计算机实现方法包括以下步骤：经由接口从系统的至少一个传感器获取传感器信号；基于传感器信号来计算系统的状态；基于系统的所述状态来确定鲁棒闭包模型的增益；基于所确定的增益来再现系统的状态；通过组合数据驱动模型和鲁棒闭包模型来估计系统的基于物理学的模型；以及通过使用所估计的基于物理学的模型对系统的状态进行映射来生成控制命令。

Description

用于高维物理系统的建模、预测和控制的鲁棒自适应动态模式分解

技术领域

本发明总体上涉及系统建模、预测以及控制。更特别地，本发明涉及利用动态模式分解进行鲁棒数据驱动模型自适应以控制机器的方法和设备。

背景技术

控制系统工程方面的控制理论是涉及对工程过程和机器中的连续操作的动力学系统(dynamical system)的控制的数学子域。目的是开发一种控制策略，以用于在没有延迟或过冲的情况下，以最优方式使用控制动作来控制这种系统并确保控制稳定性。

例如，诸如模型预测控制(MPC)之类的基于优化的控制和估计技术允许其中可以直接考虑系统动力学和约束的基于模型的设计框架。MPC在许多应用中被用于控制各种复杂性的动力学系统。这种系统的示例包括生产线、汽车发动机、机器人、数控机床、电动机、卫星以及发电机。如本文所使用的，系统的动力学模型或者系统的模型使用微分方程来描述系统的动力学。

然而，在许多情形中，受控系统的模型是非线性的，并且可能难以设计、难以实时使用，或者可能只是不准确的。这种情况的示例在机器人技术、建筑控制(HVAC)、智能电网、工厂自动化、运输、自校正机器、以及交通网络中很普遍。

在缺少动力学系统的准确模型的情况下，一些控制方法利用由这些系统生成的可操作数据，以便构建有助于例如响应于控制动作而对系统在给定时间范围内的行为进行预测的模型。使用数据来设计预测模型和控制策略被称为数据驱动建模和控制。

被用于设计用于估计和控制的模型的现有数据驱动方法的缺点是对于系统中的不确定性缺乏鲁棒性。实际上，这些不确定性可以源自多个因素；例如，系统可能引入未被所收集的数据捕获的不确定性来构建模型。而且，有噪声测量也可以在数据驱动模型中引入不确定性。

需要克服这个重要的问题，我们在本发明中提出了基于动态模式分解(DMD)来使数据驱动模型变鲁棒的算法，其中数据是通过直接测量来从系统收集的。所获得的鲁棒自适应DMD(RA-DMD)模型然后被用于估计以及对系统的控制。

发明内容

一些实施方式的目的是提供一种用于系统的动力学模型的数据驱动设计的系统和方法，以生成对于系统的不确定性是鲁棒的系统的动力学模型。以这样的方式，实施方式简化了模型设计过程，同时保留了在设计控制应用中具有系统的模型的优点。然而，当前的数据驱动方法不适合估计对系统的物理动力学的不确定性进行捕获的系统模型。

例如，需要重复模拟具有大量参数的偏微分方程(PDE)的物理学和工程方面的问题是普遍存在的。这些问题出现在控制、优化、以及不确定性量化领域中，其中对PDE模型进行求解通常太耗时。在控制和优化中使用降阶模型(reduced-order model，ROM)(即，将PDE模型降阶(reducing)至有限维常微分方程(ODE)的系统)已经导致了针对极具挑战性的系统的实际解决方案，诸如热流体系统(例如，HVAC系统)和风电场等等的控制。

来自实验或模拟的越来越大的数据集的存在使得能够使用像动态模式分解(DMD)的方法来设计ROM，该方法可以在给定的系统参数集下从所述数据中提取易处理的且物理相关的信息。然而，一个主要挑战是ROM可能引入稳定性损失和预测降级。这些降级主要是由于高阶模式截断(truncation of higher mode)和参数不确定性。更具体地，在给定的一个参数集下从数据快照获得的基函数(空间模式)在被应用以表示针对不同参数范围的解时，可能示出ROM预测的准确度的劣化甚或变得不稳定。

因此，本发明可以针对具有参数不确定性的偏微分方程(PDE)提供稳定的降阶模型(ROM)的设计。更具体地，一些实施方式在此集中于使用动态模式分解(DMD)来将PDE降阶成DMD-ROM，然后在非线性鲁棒控制框架下推出ROM稳定化或闭包(closure)问题。利用这种鲁棒控制框架，我们设计了对于参数不确定性和模式截断是鲁棒的两种DMD-ROM闭包模型。我们最后向我们的框架添加了自适应层，其中，我们利用数据驱动极值搜索控制器来实时调整闭包模型。

本发明解决了这种问题，并且涉及使用数据测量来构建用于大规模系统的鲁棒自适应模型，例如，具有数百万状态的气流模型。

一些实施方式描述了如何使用动态模式分解(DMD)来构建系统的大规模模型的最优近似。更具体地，一些实施方式描述了如何使DMD方法变鲁棒以设计鲁棒自适应DMD方法(RA-DMD)，即使在所观察的系统中存在不确定性的情况下，该RA-DMD也导致大规模模型的鲁棒最优模型近似。

根据本发明的一些实施方式，提供了一种计算机实现方法。所述计算机实现方法可以包括被存储在存储器中的数据驱动模型和鲁棒闭包模型，所述计算机实现方法使用处理器来控制系统，所述计算机实现方法包括以下步骤：经由接口从系统的至少一个传感器获取传感器信号；基于传感器信号来计算系统的状态；基于系统的状态来确定鲁棒闭包模型的增益；基于所确定的增益来再现系统的状态；通过组合数据驱动模型和鲁棒闭包模型来估计系统的基于物理学的模型；以及通过使用所估计的基于物理学的模型对系统的状态进行映射来生成控制命令。

此外，本发明的一些实施方式可以提供用于控制系统的操作的控制器。在这种情况下，该控制器可以包括输入接口，该输入接口被配置成经由网络接收系统的状态轨迹；存储器，该存储器被配置成存储系统的动力学模型，该动力学模型包括至少一个基于动态模式分解的数据驱动模型和鲁棒闭包模型的组合；以及处理器，该处理器被配置成：使用具有值函数的优化算法来对鲁棒闭包模型进行更新，该值函数减小所接收的状态轨迹的形状与使用具有经更新的鲁棒闭包模型的模型估计的状态轨迹的形状之间的差；基于具有经更新的鲁棒闭包模型的数据驱动模型来确定控制命令；以及输出接口，该输出接口被配置成向系统的致动器发送控制命令以对该系统的操作进行控制。

附图包括进来以提供对本发明的进一步理解，附图例示了本发明的实施方式并与本说明书一起用于解释本发明的原理。

附图说明

图1A示出了由相关技术使用的用于控制系统的操作的原理的示意性概图。

图1B示出了根据本发明的另一实施方式的用于控制系统的操作的新颖原理的示意性概图。

图1C示出了根据一些实施方式的用于控制系统的操作的设备的框图。

图1D是本发明的实施方式中的高维系统与鲁棒模型降阶之间关系的示意图。

图2是本发明的实施方式中的以闭包模型和基于DMD的模型为基础的鲁棒模型降阶算法的示意图。

图3A是本发明的实施方式中的以基于鲁棒控制的闭包模型和基于DMD的模型为基础的鲁棒模型降阶算法的示意图。

图3B是根据本发明的实施方式的基于Lyapunov函数的鲁棒模型降阶算法的示意图。

图4是根据本发明的实施方式的鲁棒闭包模型调整的示意图。

图5是根据本发明的实施方式的鲁棒闭包模型自适应算法的示意图。

图6是根据本发明的实施方式的基于最优极值搜索的鲁棒模型降阶的示意图。

图7A是根据本发明的实施方式的基于最优高斯过程的鲁棒模型降阶的示意图。

图7B是根据本发明的实施方式的基于深度神经网络学习过程的鲁棒模型降阶的示意图。

图7C是根据本发明的实施方式的基于强化学习过程的鲁棒模型降阶的示意图。

图8是根据本发明的一些实施方式的简化ES的流程图。

图9是根据本发明的一些实施方式的简化ES的详细流程图。

图10示出了根据本发明的一些实施方式的针对一个变量的实时极值搜索。

图11示出了根据本发明的一些实施方式的针对多个变量的实时极值搜索。

图12A示出了根据本发明的一些实施方式的用于控制空调系统的设备的示例性实时实现。

图12B示出了根据本发明的一些实施方式的用于控制空调系统的设备的示例性实时实现。

图13示出了根据本发明的一些实施方式的用于控制车辆的设备的示例性实时实现。

图14示出了根据本发明的一些实施方式的用于控制感应电动机(系统)的设备的示例性实时实现。

具体实施方式

虽然上述附图阐述了目前公开的实施方式，但是如讨论中提到的，也可设想其它实施方式。本公开通过代表性而非限制性的方式来呈现示例实施方式。本领域技术人员可以设计出落入本公开的实施方式的原理的范围和精神内的许多其它修改和实施方式。

在下面的描述中，出于解释的目的，阐述了许多具体细节，以便提供对本公开的详尽理解。然而，本领域技术人员应当明白，本公开可以在不需要这些具体细节的情况下来实践。在其它情况下，设备和方法仅以框图形式示出，以避免使本公开不清楚。

下面的描述仅提供了示例性实施方式，而非旨在对本公开的范围、适用性或配置进行限制。相反，示例性实施方式的以下描述将向本领域技术人员提供用于能够实现一个或更多个示例性实施方式的描述。在不脱离所附权利要求中阐述的所公开主题的精神和范围的情况下，设想可以对要素的功能和布置进行的各种改变。

在以下描述中给出具体细节，以提供对实施方式的透彻理解。然而，本领域普通技术人员应当明白，可以在没有这些具体细节的情况下实践这些实施方式。例如，所公开主题中的系统、处理以及其它要素可以以框图形式示出为组件，以免不必要的细节模糊这些实施方式。在其它情况下，公知的处理、结构以及技术可以在没有不必要的细节的情况下被示出，以避免模糊这些实施方式。此外，各个附图中的相同标号和标记表示相同要素。

如在本说明书和权利要求中所使用的，当术语“举例来说”、“例如”和“诸如”以及动词“包括”、“具有”、“包含”和它们的其它动词形式与一个或更多个组件或其它项目的列表结合使用时，其皆被解释为开放式的，意味着该列表不被认为排除其它附加的组件或项目。术语“基于”意指至少部分基于。此外，要理解，本文所采用的用语和术语是出于描述的目的，而不应被视为进行限制。在该说明书中利用的任何标题仅仅是为了方便，而没有法律或限制性作用。

在描述本发明的实施方式方面，以下定义贯穿本公开是可适用的。

“控制系统”或“控制器”可以指的是用于管理、命令、引导或调节其它装置或系统的行为的装置或一组装置。控制系统可以由软件或者硬件来实现，并且可以包括一个或多个模块。包括反馈回路的控制系统可以使用微处理器来实现。控制系统可以是嵌入式系统。

“空调系统”或者加热、通风和开启调节(HVAC)系统可以指的是这样的系统，即，基于热力学、流体力学、和/或热传递的原理来使用蒸气压缩循环，以使制冷剂移动通过该系统的组件。空调系统跨越非常广泛的系统集合，范围从仅向建筑物的居住者供应室外空气的系统到仅控制建筑物的温度的系统、到控制温度和湿度的系统。

“中央处理单元(CPU)”或“处理器”可以指的是读取和执行软件指令的计算机或计算机的组件。此外，处理器可以是“至少一个处理器”或者“一个或一个以上处理器”。

“模块”或“单元”可以被称为执行任务或任务的部分的计算机中的基本组件。该模块或单元可以通过软件或者硬件来实现。

图1A示出了由用于控制系统的操作的一些实施方式使用的原理的示意性概图。一些实施方式提供了被配置成控制系统1020的控制设备1000。例如，设备1000可以被配置成在工程过程和机器中控制连续操作的动力学系统1020。在下文中，“控制设备”和“设备”可以互换使用并且含义相同。在下文中，“连续操作的动力学系统”和“系统”可以互换使用并且含义相同。系统1020的示例是HVAC系统、LIDAR系统、冷凝单元、生产线、自校机器、智能电网、汽车发动机、机器人、数控机床、电动机、卫星、发电机、交通网络等。一些实施方式基于这样的实现，即，设备1000开发这样的控制命令1060，即，该控制命令用于在没有延迟或过冲的情况下，以最优方式使用控制动作来控制系统1020并确保控制稳定性。

控制设备1000使用基于模型的控制和预测技术(诸如模型预测控制(MPC))，来开发用于系统1020的控制命令1060。基于模型的技术可以有利于动力学系统的控制。例如，MPC允许基于模型的设计框架，在该设计框架中可以直接考虑系统1020的动力学和约束。MPC基于系统的模型1040来开发控制命令1060。系统1020的模型1040指的是使用动力学系统方程(例如，偏微分方程(PDE)或常微分方程(ODE))描述的系统1020的动力学。在一些实施方式中，模型1040是非线性高维的并且可能难以实时使用。例如，即使非线性模型是精确可用的，估计最优控制命令1060本质上也是有挑战性的任务，这是由于需要求解描述系统1020的动力学的偏微分方程(PDE)(被称为哈密顿-雅可比-贝尔曼(Hamilton-Jacobi-Bellman，HJB)方程)，这在计算上是有挑战性的。

图1A所例示的方法使用物理学原理来设计模型1040。与这种基于物理学的建模方法相比，本发明的一些实施方式可以使用从系统1020的传感器测量的可操作数据来设计控制系统的模型(例如，模型1080a)，然后使用该数据驱动模型1080a，利用各种基于模型的控制方法对系统进行控制。

应注意，一些实施方式的目的是，根据数据来确定系统的实际模型，即，可以被用于估计系统的行为的模型。例如，一些实施方式的目的是，使用微分方程从捕获系统的动力学的数据来确定系统的模型。另外，一些实施方式的目的是，从数据中学习具有与基于物理学的模型类似的准确度的鲁棒模型。

为了简化计算，一些实施方式将常微分方程(ODE)1080a公式化，以描述系统1020的动力学。可以将常微分方程(ODE)1080a称为系统的数据驱动模型1080a。在一些实施方式中，可以使用动态模式分解(DMD)技术来对ODE 1080a进行公式化。然而，在一些情况下，针对不确定性条件的情况，ODE 1080a无法再现系统1020的实际动力学(即，由PDE描述的动力学)。不确定性条件的示例可以是PDE的边界条件随时间变化的情况，或者PDE中涉及的系数之一随时间变化的情况，即，系统的磨损和开裂。

为此，一些实施方式通过涵盖不确定性条件的情况来公式化使DMD数据驱动模型1080a变鲁棒的闭包模型1080b。在一些实施方式中，闭包模型1080b可以是系统1020的状态的非线性函数，该非线性函数根据ODE来捕获系统1020的行为(例如，动力学)的差异。闭包模型1080b可以使用鲁棒非线性控制来进行公式化。换句话说，系统1020的基于物理学的模型由ODE 1080a和鲁棒闭包模型1080b的组合来近似(估计)，并且该鲁棒闭包模型1080b使用非线性鲁棒控制方法来进行设计。以这样的方式，接近基于物理学的模型的准确度的模型从采用DMD模型1080a的形式的数据中学习，该DMD模型是由闭包模型1080b来鲁棒化的。

为此，一些实施方式确定增益并且将该增益包括在鲁棒闭包模型1080b中，以最优地再现系统1020的动力学。在一些实施方式中，可以使用优化算法来适配增益。包括ODE1080a、具有经适配增益的闭包模型1080b的降阶模型1080再现了系统1020的动力学。因此，模型1080最优地再现系统1020的动力学。一些实施方式基于这样的实现，即，模型1080比基于物理学的高维模型包括更少数量的参数。为此，与描述系统1020的物理模型的模型1040相比，降阶模型1080在计算上不太复杂。可以使用模型1080来确定控制策略(命令)1060。控制策略1060直接映射系统1020的状态以控制(生成)命令用于控制系统1020的操作。因此，降阶模型1080被用于以高效方式设计系统1020的控制。

图1C示出了根据一些实施方式的用于控制系统1020的操作的控制设备1200的框图。设备1200包括用于将设备1200与其它系统和装置连接的输入接口1202和输出接口1218。在一些实施方式中，设备1200可以包括多个输入接口和多个输出接口。输入接口1202被配置成接收系统1020的状态轨迹1216。输入接口1202包括适于通过总线210将设备1200连接至网络1214的网络接口控制器(NIC)1212。通过网络1214，无线地或者有线地，设备1200接收系统1020的状态轨迹1216。

状态轨迹1216可以是定义系统1020的动力学的实际行为的系统1020的多个状态。例如，状态轨迹1216充当用于控制系统1020的参考连续状态空间。在一些实施方式中，可以从系统1020的状态的部分的实时测量来接收状态轨迹1216。

控制设备1200还包括处理器1204和存储可由处理器1204执行的指令的存储器1206。处理器1204可以是单核处理器、多核处理器、计算集群、或者任何数量的其它配置。存储器1206可以包括随机存取存储器(RAM)、只读存储器(ROM)、闪速存储器、或者任何其它合适的存储器系统。处理器1204通过总线210连接至一个或更多个输入和输出装置。所存储的指令实现用于控制系统1020的操作的方法。

存储器1206还可以扩展成包括存储装置1208。存储装置1208可以被配置成存储模型1208a、控制器1208b、更新模块1208c、以及控制命令模块1208d。在一些实施方式中，模型1208a可以是描述系统1020的动力学的模型，该模型包括至少一个微分方程和一个鲁棒闭包模型的组合。模型的微分方程可以是常微分方程(ODE)1080a。模型1208a的闭包模型可以是系统1020的状态的线性函数或非线性函数。可以基于非线性鲁棒控制来设计鲁棒闭包模型，以模仿系统1020的行为。如应当理解，一旦学习了鲁棒闭包模型，该闭包模型就可以是如图1A所例示的闭包1080b。

控制器1208b可以被配置成存储指令，该指令在由处理器1204执行时执行存储装置1208中的一个或更多个模块。一些实施方式基于这样的实现，即，控制器1208b管理存储装置1208中的各个模块以控制系统1020。

此外，在一些实施方式中，更新模块1208c可以被配置成对针对经更新的鲁棒闭包模型的增益进行更新。为此，一些实施方式确定增益，该增益减小利用模型1208a(该模型具有利用经更新的增益更新的闭包模型)估计的系统1020的状态与系统的实际状态之间的误差。在一些实施方式中，系统的实际状态可以是所测得的状态。在一些实施方式中，更新模块1208c可以使用极值搜索来对增益进行更新。在一些其它实施方式中，更新模块1208c可以使用基于高斯过程的优化来对增益进行更新。

控制命令模块1208d可以被配置成基于具有经更新的鲁棒闭包模型的模型1208a来确定控制命令。控制命令可以控制系统的操作。在一些实施方式中，系统的操作可能经受约束。为此，控制命令模块1208d在实施约束的同时，使用基于预测模型的控制来确定控制命令。该约束包括：系统1020的连续状态空间中的状态约束以及系统1020的连续控制输入空间中的控制输入约束。

输出接口1218被配置成向系统1020的致动器1220发送控制命令以对系统的操作进行控制。输出接口1218的一些示例可以包括提交控制命令以控制系统1020的控制接口。

例如，在图1D所表示的本发明的一些实施方式中，我们考虑具有高维的系统150(例如，具有百万状态的空调系统)，以表示完全分布在一个房间中的气流和温度值。然后，我们在系统上放置多个传感器以收集数据160，然后将该数据用于生成鲁棒数据驱动降阶模型(ROM)165。然后，将该鲁棒数据驱动ROM用于对实际系统的预测和控制170。

在图2所表示的本发明的一些实施方式中，数据驱动ROM 165是通过使用动态模式分解(DMD)模型150来获得的，向该DMD模型添加了鲁棒闭包模型250，以生成鲁棒的基于DMD的降阶模型165。

在图3A所表示的本发明的一些实施方式中，基于鲁棒控制方法350来设计鲁棒闭包模型250。例如，在如图3B的一些实施方式中，使用Lyapunov函数340来使不确定的基于DMD的数据驱动模型150变鲁棒350，该Lyapunov函数被用于估计不确定的模型的能量320，并且根据该能量评估，来获得采用闭包模型的形式的校正项325。最后，将不确定的基于DMD的模型与鲁棒闭包模型加在一起产生鲁棒降阶模型165。

图4是根据本发明的实施方式的鲁棒闭包模型调整的示意图。图5、图6、图7A、图7B以及图7C还示出了其它实施方式。图5是鲁棒闭包模型自适应算法的示意图。

图6是基于最优极值搜索的鲁棒模型降阶的示意图；图7A是基于最优高斯过程的鲁棒模型降阶的示意图；图7B是基于深度神经网络学习过程的鲁棒模型降阶的示意图；图7C是基于强化学习过程的鲁棒模型降阶的示意图。

基于来自物理系统的测量450与来自鲁棒降阶模型的预测440之间的差异460，进一步调整430鲁棒闭包模型325。这种调整可以通过调整闭包模型的一些参数来实现，例如，调整基函数的系数，或者调整闭包模型中出现的一些物理系数，这可以使用自适应算法530(图5)来实现，其中，这种自适应算法可以采用极值搜索优化算法630(图6)、来自基于高斯过程的优化系列的贝叶斯优化算法730(图7A)、深度神经网络830(图7B)、或者强化学习方法930(图7C)的形式。

图8示出了根据一些实施方式的用于对增益进行更新的极值搜索(ES)算法8900的流程图。一些实施方式基于这样的认识，即，ES算法8900是允许设备1200调整最优闭包模型的增益的无模型学习算法。一些实施方式基于这样的实现，即，ES算法8900利用扰动信号迭代地对最优闭包模块的增益进行扰动，直到满足终止条件。在一些实施方式中，扰动信号可以是具有预定频率的周期性信号。最优鲁棒闭包模型的增益可以是控制参数。

在步骤8902a，ES算法8900可以对最优闭包模型的控制参数进行扰动。例如，ES算法8900可以使用扰动信号来对控制参数进行扰动。在一些实施方式中，扰动信号可以是先前更新的扰动信号。在步骤8904a，ES算法8900可以响应于对控制参数进行扰动而确定针对闭包模型性能的成本函数Q。在步骤8906a，ES可以通过利用扰动信号修改成本函数，来确定该成本函数的梯度。例如，成本函数的梯度被确定为成本函数、扰动信号以及ES算法8900的增益的乘积。在步骤8908a，ES算法8900可以对扰动信号和所确定的梯度进行积分，以对下一次迭代的扰动信号进行更新。可以重复ES 9800的迭代，直到满足终止条件。

图9示出了根据一些实施方式的使用性能成本函数来对增益进行更新的极值搜索(ES)算法8900的流程图。在步骤8904b，ES 8900可以确定针对闭包模型性能的成本函数。在一些实施方式中，ES算法8900在步骤8904b确定如图8的步骤8904a中示例性地例示的成本函数。在一些实施方式中，所确定的成本函数可以是性能成本函数8904b-0。根据一些示例实施方式，性能成本函数8904b-0可以是表示差距(gap)460的行为的二次方程。

在步骤8906b，ES算法8900可以将所确定的成本函数与时间的第一周期性信号8906b-0相乘，以生成受扰成本函数8906b-1。在步骤8908b，ES算法8900可以从受扰成本函数8906b-1中减去第二周期性信号8908b-0(该第二周期性信号相对于第一周期性信号8906b-0的相位具有90度正交相移)，以生成成本函数的导数8908b-1。在步骤8910b，ES算法8900可以随时间对成本函数的导数8908b-1进行积分，以将控制参数值8910b-0生成为时间的函数。

图10示出了根据一些实施方式的用于单参数调整的极值搜索(ES)控制器1000的示意图。ES控制器1000注入正弦扰动信号asin(ωt)1002以对控制参数θ1004进行扰动。ES控制器1000响应于对控制参数θ1004进行扰动而确定针对闭包模型性能的成本函数Q(θ)1006。ES控制器1000使用乘法器1008，将所确定的成本函数Q(θ)1006与正弦扰动信号asin(ωt)1002相乘。此外，ES控制器将从乘法器1008获得的结果信号与ES的增益l 1010相乘，以形成对成本函数Q(θ)1006的梯度1012的估计。ES控制器1000将所估计的梯度/>1012传递通过积分器1/s 1014以生成参数ξ1016。使用加法器1018将参数ξ1016加至正弦扰动信号asin(ωt)1002，以调制用于下一次迭代的正弦扰动信号asin(ωt)1002。可以重复ES控制器1000的迭代，直到满足终止条件。

图11示出了根据一些实施方式的用于多参数调整的极值搜索(ES)控制器1100的示意图。一些实施方式基于这样的实现，即，从单参数ES1000推导多参数ES控制器1100。例如，单参数ES控制器1000可以被复制n次，以获得n-参数ES控制器1100。一些实施方式基于这样的认识，即，n-参数ES控制器1100利用具有n个不同频率的对应n个扰动信号1104-1至1104-n来对一组n个控制参数θ_i 1102进行扰动，以对最优闭包模型进行更新。在一些实施方式中，n个不同频率中的各个频率皆大于系统1020的频率响应。另外，n个扰动信号1104-1至1104-n的n个不同频率满足收敛条件，使得该组中的第一扰动信号1104-1的第一频率和第二扰动信号1104-2的第二频率之和不等于第三扰动信号1104-3的第三频率。

此外，n个控制参数θ_i 1102中的各个控制参数皆可以如图11的详细描述中所解释的那样进行更新。为此，n-参数ES控制器1100包括：n个控制参数θ_i 1102、n个扰动信号1104-1至1104-n、n个估计梯度n个参数ξ_i 1110以及一个公共成本函数Q(θ)1106，该公共成本函数是所有估计控制参数θ＝(θ₁,…,θ_n)1102的函数。在一些实施方式中，多参数ES1100可以在数学上定义为：

θ_i＝ξ_i+a_isin(ω_it)

其中扰动频率ω_i使得ω_i≠ω_j,ω_i+ω_i≠ω_k,i,j,k∈{1,…,n}，并且ω_i>ω^*，ω^*足够大以确保收敛。在一些实施方式中，当适当地选择参数a_i、ω_i、以及l时，成本函数Q(theta)1106收敛到最优成本函数Q(θ^*)的邻域。

如应当理解，一旦使用ES算法或者基于高斯过程的优化在最优闭包模型中对控制参数θ(即，正增益)进行更新，与基于DMD的ODE模型150相组合的最优闭包模型就模仿了系统1020的实际行为12602。例如，所估计的行为12604可以定性地和定量地类似于实际行为12602而没有差距12606。

为此，可以将包括ODE 1080a和具有经更新的增益的最优闭包模型1080b的最优降阶模型1080用于确定控制命令1060。在一些实施方式中，包括ODE、具有经更新的增益的最优闭包模型的最优降阶模型1080可以开发针对系统1020的控制策略1060。控制策略1060可以直接映射系统1020的状态(系统1020的(多个)状态)以生成控制命令以用于对系统1020的操作进行控制。在系统1020是HAVC系统1306的情况下，控制命令的示例包括阀位置(position valve)、压缩机速度、蒸发器的参数等。在电动机系统1500是转子的情况下，控制命令的示例包括转子的速度、电动机的温度等。此外，控制命令可以经由输出接口1218发送至系统1020的致动器以对系统1020进行控制。

图12B示出了用于控制系统的设备200的示例性实时实现，其中所述系统是空调系统1200。在该示例中，控制设备200被配置成控制被设置在房间1300外部的空调系统1200，该房间1300具有门1302以及至少一个窗户1304。系统的状态可以是房间1300的温度和气流速度，该温度和气流速度是由设备200经由空调系统1200通过通风单元1306来控制的。将一组传感器1308设置在房间1300中，一组传感器是诸如用于测量房间1300中的给定点处的气流的速度的至少一个气流传感器1308a，以及用于测量房间温度的至少一个温度传感器1308b。在这种情况下，成本函数Q可以由从温度传感器和气流传感器的所测得的信号与从降阶模型1080获得的温度值和气流速度值的估计信号之间的差的平方给出。可以考虑其它类型的设定，例如，具有多个HVAC单元的房间，或者具有多个房间的房屋。

一些实施方式基于这样的认识，即，空调系统1200可以由被称为Boussinesq方程的基于物理学的模型来描述，如图3A和图3B中示例性例示的。然而，Boussinesq方程包含无限维来解决用于控制空调系统102的该Boussinesq方程。为此，对包括ODE 402和具有经更新的增益的经更新的闭包模型的模型进行公式化，如图1A至图11的详细说明中所解释的。该模型以最优方式来再现空调系统1200的动力学(例如，气流动力学)。此外，在一些实施方式中，在空调系统1200的操作期间，气流动力学的模型将气流的值(例如，气流的速度)与空调房间1300的温度联系起来。为此，控制设备200最优地控制空调系统1200以按经调节的方式生成气流。

图13示出了用于控制车辆的系统的设备200的示例性实时实现，其中该系统是车辆(车辆操作系统)1400。车辆1400可以是诸如客车、公共汽车或越野车之类的任何类型的轮式车辆。而且，车辆1400可以是自主或半自主车辆。例如，一些实施方式控制车辆1400的运动。表示运动的系统状态的示例包括由车辆1400的转向系统1404控制的车辆的横向运动。在一个实施方式中，转向系统1404是由控制器1402控制的。另外或者另选地，转向系统1404可以由车辆1400的驾驶员控制。

在一些实施方式中，车辆可以包括发动机1410，该发动机可以由控制器1402或者车辆1400的其它组件来控制。在一些实施方式中，车辆1400可以包括代替发动机1410的电动机，并且可以由控制器1402或由车辆1400的其它组件来控制。车辆还可以包括用于感测周围环境的状态的一个或更多个传感器1406。传感器1406的示例包括诸如雷达之类的距离测距仪。在一些实施方式中，车辆1400包括用于感测其当前运动参数和内部状态的一个或更多个传感器1408。所述一个或更多个传感器1408的示例包括全球定位系统(GPS)、加速度计、惯性测量单元、陀螺仪、轴旋转传感器、转矩传感器、偏转传感器、压力传感器、以及流量传感器。该传感器向控制器1402提供信息。车辆可以配备有收发器1412，该收发器1412使得能够实现控制器1402通过有线或无线通信信道与一些实施方式的设备200进行通信的能力。例如，通过收发器1412，控制器1402从设备200接收控制命令。此外，控制器1402将所接收到的控制命令输出至车辆1400的诸如车辆的方向盘和/或制动器的一个或更多个致动器，以便控制车辆的运动。此外，控制设备200被配置成经由所述一个或更多个传感器1408来获得/测量系统(车辆1400)的状态，所述一个或更多个传感器被布置至车辆1400的包括转向系统1404、控制器1402、以及发动机1410的部件。在这种情况下，成本函数Q可以通过由传感器测得的汽车的位置和速度与从系统1080的降阶模型获得的汽车的位置和速度之间的差距的平方来获得。

图14示出了用于控制系统1020的设备200的示例性实时实现，其中，系统1020是感应电动机(感应电动机系统)1500。在该示例中，将感应电动机1500与设备200集成在一起。将该设备配置成控制感应电动机1500的操作，如在图1A至图11的详细说明中所解释的。在一些实施方式中，感应电动机1500的操作可能受到约束。该约束包括：感应电动机1500的连续状态空间中的状态约束，以及感应电动机1500的连续控制输入空间中的控制输入约束。在一些实施方式中，电动机1500的状态包括定子通量、线电流以及转子速度中的一个或组合。状态约束包括对定子通量、线电流、以及转子速度中的一个或组合的值的约束。在一些实施方式中，控制输入包括激励电压(excitation voltage)的值。控制输入约束包括对激励电压的约束。在这种情况下，成本函数Q可以通过由传感器测得的电动机的线电流和转子速度与从系统的降阶模型1080获得的线电流和转子速度之间的差距的平方来获得。

使用动态模式分解的鲁棒数据驱动建模的示例

现在，让我们将上述步骤置于更数学的设定中。实际上，我们考虑由该形式的精确高维非线性PDE 210系统所描述的物理系统的状态估计问题。

动态模式分解(DMD)是一种从数据中揭示系统的基础动力学的数据驱动方法。

在本文中，我们通常考虑从以下形式的动力学系统收集的数据：

其中，Z是无限维希尔伯特(Hilbert)空间，并且其中，ν表示由(1)建模的系统的物理粘性(vanishing viscosity)。我们对(1)的解来公式化以下有界性假设。

假设1原始PDE模型(1)的解被假设为处于L²([0,∞)；Z)，

PDE模型(1)的解可以通过昂贵的数值离散化在有限维子空间中近似，这对于诸如预测和控制的实时应用可能是不切实际的。在包括流体流动的许多系统中，PDE的解可以仅使用几个基函数来很好地近似。在本文中，我们利用DMD来构建这些模型降阶基函数。

DMD是一种数据驱动技术，其已被广泛用于流体动力学领域，以从复杂且动态演化的数据集中提取时空模态。因此，DMD可以被认为是POD与傅立叶变换在时间上的组合。DMD对经验快照数据进行操作以提取丰富的动力学信息，该动力学信息可以被用于从数据中提取底层动力学。我们考虑在不同时间实例收集的时间系列数据，其中，时间由t_k来表示，其中，k是时间索引。在t_k和t_k+1时间实例的数据由向量x_k∈Rⁿ和x_k+1∈Rⁿ给出，这两个向量都是Zⁿ的子集。

一旦我们从系统收集到测量数据，就将该时间系列数据存储在快照矩阵X＝[x₁ x₂… x_m-1]∈R^n×m和时移快照矩阵Y＝[x₂ x₃ … x_m]∈R^n×m中。根据线性动力学系统理论，我们知道线性矩阵A_orig∈R^n×n映射状态x_k至x_k+1，从而满足矩阵方程Y＝A_origX。DMD确定利用X的经济奇异值分解(singular value decomposition，SVD)的线性动力学映射(map)A。具体地，如果X＝UΣV^*，则可以形成低维代理系统A＝U^*A_origU，其中，U包含X的前导r个左奇异向量，并且降秩线性算子由下式给出：

A＝U^*YVΣ^-1, (2)

其中，A∈R^r×r是A_orig的降秩算子。应注意，针对k＝1,…,m，在所有快照上，DMD使以下近似误差最小化：

Px_k+1-A_origx_kP。 (3)

闭包模型和基于极值搜索的调整的示例

如前面的章节所解释的，由DMD获得的降阶模型可以表示为：

其中，A∈R^r×r是不确定状态矩阵。而且，为了保持这里所研究的扩散PDE模型的物理性质，我们将扩散项明确地添加至ROM(4)，如：

其中，D>0表示恒定粘性阻尼矩阵，并且ν₁>0表示粘性增益，该粘性增益将在稍后被用于自动调整降阶模型跟踪性能。ROM中的扩散项的这种明确添加在ROM文献中是常见的。

在这项工作中，为了解决现实应用中经常出现的物理模型参数不确定性，例如，风电场应用中的雷诺数(Reynolds number)不匹配、HVAC应用中的理查森数(Richardsonnumber)不确定性、以及由模态或基函数截断而引起的不确定性，我们将DMD-ROM结构公式化为鲁棒控制问题，如下：

其中，D_n>0,ΔD>0、A_n以及不确定性项ΔA、ΔD满足以下假设。

假设2标称状态矩阵A_n是稳定的，即，λ(A_n)<0。

假设3状态矩阵不确定性项ΔA是有界的，使得

假设4粘性阻尼矩阵不确定项ΔD是有界的，使得

虚拟控制项u在这里被添加以表示一般的闭包模型项，其被添加以使DMD-ROM模型稳定。与现有的基于物理学的闭包模型相关文献的区别在于，我们在DMD-ROM的背景下将闭包模型问题公式化为鲁棒的稳定化问题。

我们提出了两种闭包模型，我们分别称为鲁棒校正和具有消失粘性的鲁棒校正。我们引入这些闭包模型，在下面的章节中利用Lyapunov理论来分析其稳定性和鲁棒性。

DMD-ROM的闭包模型

闭包模型1-鲁棒校正的示例

首先，我们考虑非线性闭包模型使得：

其中，

闭包模型2-具有消失粘性的鲁棒校正的示例。除了上面所示的闭包项之外，我们还添加了时变指数衰减项，以确保更快的收敛。时变闭包模型给出为：

其中，

基于极值搜索的闭包模型自适应调整的示例。多参数极值搜索(MES)是一种无模型控制算法，其常被用于优化给定的性能成本而不需要有关成本的闭型信息。然而，MES控制也可以被用于开环模型参数标识和反馈增益调整。我们在此遵循类似的想法，并且提出使用MES，以通过从来自系统的在线测量连续地对参数权重ν₁和ν₂进行更新，来自动调整方程(7)和方程(9)中描述的闭包模型。

在本节中，我们将简要描述被用于在在线设定下对闭包模型参数ν₁和ν₂进行更新的MES算法。我们首先为MES算法定义合适的学习成本函数。该学习成本函数是在全阶模型(FOM)(实际系统)的所测得的输出与来自分别具有方程(7)、方程(9)中的校正的DMD-ROM的输出之间的误差范数的正定函数。给定输出y(t)＝Cx(t)，其中，C是输出矩阵，并且x(t)是系统在时间t的状态。成本函数(J)被给定为：

这里，t_f>0表示学习时间范围，y_ROM对应于具有闭包模型的DMD-ROM的输出。在这项工作中，使用来自PDE的精确解的测量来在线计算误差，然而，在实际应用中可以通过系统的直接测量来计算相同的误差。

我们列出了关于学习成本函数的一些经典假设，这些假设是确保某些MES收敛保证所需要的。

假设5成本函数J在具有局部最小值。

假设6成本函数J是解析的，并且其相对于参数ν＝[ν₁,ν₂]的变化被限制在局部最小值ν^opt的邻域中。

为了简化表示，我们考虑简单的基于抖动的MES算法，由下式给出：

/>

以上单独实施方式可以被描述为处理，该处理被描绘为流程图、程序框图、数据流图、结构图或框图。尽管流程图将操作示出为顺序处理，但是许多操作可以并行或同时执行。另外，操作的次序可以重新排列。处理可以在其操作完成时终止，但可以具有图中未讨论或未包括的附加步骤。而且，并非任何特别描述的处理中的所有操作都可能发生在所有实施方式中。处理可以对应于方法、函数、过程、子例程、子程序等。当一个处理对应一个函数时，该函数的终止可以对应于该函数返回至调用函数或主函数。

而且，所公开主题的实施方式可以至少部分地、人工地或者自动地实现。可以通过使用机器、硬件、软件、固件、中间件、微代码、硬件描述语言，或其任何组合来执行或至少辅助手动或自动实现。当以软件、固件、中间件或微代码实现时，用于执行必要任务的程序代码或代码段可以被存储在机器可读介质中。处理器可以执行必要的任务。

Claims

1.一种通过使用处理器来控制系统的、包括存储在存储器中的数据驱动模型和鲁棒闭包模型的计算机实现方法，所述计算机实现方法包括以下步骤：

经由接口从所述系统的至少一个传感器获取传感器信号；

基于所述传感器信号来计算所述系统的状态；

基于所述系统的所述状态来确定所述鲁棒闭包模型的增益；

基于所述确定的增益来再现所述系统的状态；

通过组合所述数据驱动模型和所述鲁棒闭包模型来估计所述系统的基于物理学的模型；以及

通过使用所估计的基于物理学的模型对所述系统的所述状态进行映射来生成控制命令。

2.根据权利要求1所述的计算机实现方法，其中，网络是有线网络或无线网络。

3.根据权利要求1所述的计算机实现方法，其中，所述至少一个传感器被配置成测量所述系统的状态。

4.根据权利要求1所述的计算机实现方法，其中，在所述数据驱动模型模块和所述鲁棒闭包模型中使用的参数的数量小于在基于物理学的高维模型中使用的参数的数量。

5.根据权利要求1所述的计算机实现方法，其中，所述鲁棒闭包模型是基于非线性鲁棒控制方法设计的。

6.根据权利要求1所述的计算机实现方法，其中，所述闭包模型是基于偏微分方程(PDE)的边界条件来公式化的，其中，所述边界条件是随时间改变的。

7.根据权利要求1所述的计算机实现方法，其中，所述鲁棒闭包模型是由所述系统的所述状态的线性函数或者所述系统的所述状态的非线性函数来表示的。

8.根据权利要求1所述的计算机实现方法，其中，所述系统是空调系统。

9.根据权利要求1所述的计算机实现方法，其中，所述系统是车辆操作系统。

10.根据权利要求1所述的计算机实现方法，其中，所述系统是感应电动机系统。

11.一种用于控制系统的操作的控制器，所述控制器包括：

输入接口，所述输入接口被配置成经由网络接收所述系统的状态轨迹；

存储器，所述存储器被配置成存储所述系统的动力学模型，所述动力学模型包括至少一个基于动态模式分解的数据驱动模型和鲁棒闭包模型的组合；

处理器，所述处理器被配置成：

使用具有值函数的优化算法来对所述鲁棒闭包模型进行更新，所述值函数减小所接收的状态轨迹的形状与使用具有经更新的鲁棒闭包模型的所述模型估计的状态轨迹的形状之间的差异；

基于具有所述经更新的鲁棒闭包模型的所述数据驱动模型来确定控制命令；以及

输出接口，所述输出接口被配置成向所述系统的致动器发送所述控制命令以控制所述系统的操作。

12.根据权利要求11所述的控制器，其中，所述网络是有线网络或无线网络。

13.根据权利要求11所述的控制器，其中，至少一个传感器被配置成测量所述系统的所述状态轨迹。

14.根据权利要求11所述的控制器，其中，在所述至少一个基于动态模式分解的数据驱动模型和所述鲁棒闭包模型中使用的参数的数量小于在基于物理学的高维模型中使用的参数的数量。

15.根据权利要求11所述的控制器，其中，所述鲁棒闭包模型是基于非线性鲁棒控制方法来设计的。

16.根据权利要求11所述的控制器，其中，所述鲁棒闭包模型是基于偏微分方程(PDE)的边界条件来公式化的，其中，所述边界条件是随时间改变的。

17.根据权利要求11所述的控制器，其中，所述鲁棒闭包模型是由所述系统的所述状态的线性函数或者所述系统的所述状态的非线性函数来表示的。

18.根据权利要求11所述的控制器，其中，所述系统是空调系统。

19.根据权利要求11所述的控制器，其中，所述系统是车辆操作系统。

20.根据权利要求11所述的控制器，其中，所述系统是感应电动机系统。