CN110462531A

CN110462531A - 用于控制机器操作的模型预测控制系统和方法

Info

Publication number: CN110462531A
Application number: CN201880019199.9A
Authority: CN
Inventors: A·克尼亚瑟夫; A·马雷舍夫
Original assignee: Mitsubishi Corp
Current assignee: Mitsubishi Corp
Priority date: 2017-03-24
Filing date: 2018-02-08
Publication date: 2019-11-15
Anticipated expiration: 2038-02-08
Also published as: EP3602209B1; JP2020503614A; CN110462531B; EP3602209A1; JP6727744B2; WO2018173569A1; US20180275621A1

Abstract

一种用于根据机器动力学模型来控制机器操作的模型预测控制(MPC)系统在约束的情况下在时间范围上优化成本函数，以产生控制机器在时间范围上的状态的控制输入的序列。机器使用序列中的第一控制输入来控制。成本函数包括由MPC的目的限定的第一项和对机器的状态与满足机器的动力学方程的值的偏差进行惩罚的第二项。

Description

用于控制机器操作的模型预测控制系统和方法

技术领域

本发明总体涉及控制机器的操作，更具体地涉及在后退范围上使用模型预测控制(MPC)来控制操作。

背景技术

在机器控制中，可以使用软件或硬件中的一个或组合实现的控制器基于例如从传感器和/或估计器、从机器的输出获得的测量生成用于到机器的输入的命令值。控制器选择输入，使得机器根据期望操作，比如，操作遵循期望的参考配置文件或者将输出调整到特定值。在若干情况下，控制器对机器的输入和输出实施约束，比如，这确保对应的变量在一些预定范围上，以确保来自物理规范的安全机器操作。为了实施这种约束，控制器经常使用机器的模型来预测机器在应用命令(即，控制输入)时产生什么行为。能够在对机器输入和输出实施约束的同时实现机器的控制的控制器中的过程的一个示例是模型预测控制(MPC)。

MPC基于机器动力学模型的范围优化，并且具有预期将来事件以采取适当控制动作的能力。这通过在约束的情况下在将来时间范围上优化机器的操作并仅对当前时隙实现控制来实现。例如，约束可以表示机器的物理限制、对机器的操作的安全性限制以及对轨迹的性能限制。用于机器的控制策略在对于这种控制策略由机器生成的运动满足所有约束时可容许。例如，在时间t时，对机器的当前状态采样，并且确定在将来的较短时间范围T的可容许成本最小化控制策略。具体地，在线或实时计算确定到时间t+T为止的成本最小化控制策略。在实现控制步骤之后，再次对状态采样，并且从现在的当前状态开始重复计算，这产生新控制和新预测的状态路径。预测范围向前移位，并且为此，MPC还被称为后退范围控制(receding horizon control)。

MPC可以用于通过在系统的各种物理和规范约束的情况下在将来时间内求解最佳控制问题来基于系统的模型和期望的参考轨迹生成机器的运动的实际轨迹。MPC的目的在于优化(例如，最小化或最大化)机器的运动的性能指数，诸如机器的参考运动与实际运动之间的误差、机器能耗以及所诱发的系统振动。

因为MPC是基于模型的框架，所以MPC的性能不可避免地取决于在最佳控制计算中使用的预测模型的质量。然而，在大部分情况下，因为一些参数未精确测量，所以未先验地已知机器动力学模型。由此，控制器可能需要在机器的已知操作期间估计机器的模型的未知参数，由此，还在估计参数的同时实施约束。处理这种问题的方法包括自适应或基于学习的MPC，其中，为了学习未知机器参数，用闭环识别方案增强MPC控制问题。通过学习未知参数，改善由控制器实现的机器的操作。

然而，由于多个原因，限制自适应和基于学习的MPC的当前方法。例如，在估计未知参数的同时，可能违反约束，或者可能为了保守地实施约束而过度降低控制性能。实际上，几个现有方法，诸如在US2011/0022193中描述的方法，简单地忽略约束，由此，不能在约束的情况下产生用于机器的可容许的控制策略。US2016/0147203中描述的方法解决约束的问题，但估计机器动力学模型的未知参数仍然是难题。

因此，需要一种用于适于控制经受约束的机器的操作的、包括不确定性的MPC来控制机器操作的方法。

发明内容

一些实施方式基于机器的动力学模型的参数很少确切已知的认识。不同的识别和学习方法的目的在于更新模型的参数，以降低与这些参数的真值有关的不确定性，但很难消除该不确定性。进一步地，除了由于缺乏精确模型产生的不确定性之外，控制的不确定性还可能由测量的不准确性、由于模型降阶引起的误差以及状态特征的不确定性引起。

一些实施方式基于以下惊人认识：各种模型预测控制(MPC)方法将机器的动力学模型用作对控制优化的硬约束，即使在未精确已知模型的参数时。即使这些MPC方法尝试随着时间的过去提高模型的准确性，但甚至在简短时间段内的模型的不准确性也可能导致机器处于不期望状态。

一些实施方式基于以下认识：MPC中的机器的动力学模型应当用作软约束，而不是硬约束。这样，可以阻止偏离满足动力学模型的值的机器的状态，但该状态在这种状态在精确已知模型的参数时可以满足动力学模型的应答中可以允许。

例如，通常，机器的动力学模型由机器的动力学方程来表示。这种方程充当强制MPC产生控制机器操作的控制输入的、MPC优化中的硬约束，该操作使机器移入使得机器的动力学方程为真的状态。

一些实施方式通过将机器的动力学方程移入被用来优化机器的性能的MPC的成本函数来去除对MPC的这种硬约束。例如，在一个实施方式中，成本函数包括对机器的状态与MPC的目的的偏差进行惩罚的、机器的状态的第一项和对机器的状态与满足机器的动力学方程的值的偏差进行惩罚的、机器的状态的第二项。

这些项的组合允许平衡系统的操作的性能与模型的参数的不确定性程度。例如，模型的不确定性的更小值可以证明成本函数中的第二项的权重的增大合理。不确定性的更大值激励减小权重。例如，在一个实施方式中，成本函数在使用加权最小二乘法查找控制输入的序列中平衡第一项和第二项的权重。

在一些实现中，第二项包括机器的动力学方程的成分，该成分被确定为使得由处理器执行的成本函数的优化促进确定使得机器的动力学方程为真的机器的动力学方程的成分。

例如，机器的动力学方程描述了空间(例如，几何空间、控制空间等)中的状态的时间依赖。机器的动力学方程是包含机器的状态作为变量的等式的陈述。等式的成分可以放置在同一侧上，以允许最小或最大优化。

例如，如果机器的动力学方程是x`＝v(x)，则这种方程可以被重写为magnitude(x`-v(x))＝0，其中，自变量“magnitude”是确定自变量与零的偏差的非负数。这样，在大小项magnitude(x`-v(x))是成本函数的一部分时，成本函数的最小化还使差x`-v(x)与零的偏差最小化，由此促进使得机器的动力学方程为真。相反，如果MPC优化使成本函数最大化，则机器的动力学方程可以被重写为-magnitude(x`-v(x))＝0。在该示例中，方程的成分magnitude(x`-v(x))或-magnitude(x`-v(x))允许将动力学方程当做软约束，而不是形成硬约束的等式。magnitude(x`-v(x))的示例可以是(x`-v(x))的绝对值的积分(平方)。

一些实施方式基于以下认识：当机器的动力学方程用作软约束时，可以使用对机器的状态的另外软约束来在存在不确定性时进一步提高控制的准确性。例如，一些实施方式包括MPC的成本函数中的状态的第三项，该第三项对状态与软约束(诸如对状态结构的约束和对状态行为的约束)的偏差进行惩罚。这种软约束的示例包括对状态的稀疏性的约束、对状态的对称性的约束、对状态的稳定性的约束、对状态的平滑性的约束、对状态在时间上的变化率的约束。

一些实施方式基于以下认识：当机器的动力学方程用作软约束时，可以使用各种数据同化方法来进一步提高控制的准确性。数据同化可以用于估计具有动力学和观测这两者的不确定性的系统的状态，其中，实际系统的观测被并入到该系统的数字模型的模型状态中。数据同化的应用发生在地球科学的许多领域中，例如，天气预报和水文学。

一些实施方式基于以下认识：可以使用数据同化来估计在MPC将来范围优化外部的机器的当前状态。然而，一些实施方式基于以下认识：在机器的动力学方程用作软约束时，可以使用从MPC将来范围上部的数据同化借用的方法。MPC内的数据同化的使用可以帮助解决不确定性以及与系统有关的不完全信息，这与在数据同化的顶上建立的传统MPC相比引起更准确且鲁棒的控制确定。

例如，在一个实施方式中，成本函数包括执行在时间范围上的状态的数据同化的第三项，使得处理器根据同化后的状态产生使机器的状态移动的控制输入的序列。因为数据同化用于MPC时间范围内部，所以实施方式使用适于数据同化的卡尔曼滤波器的变体来优化成本函数。卡尔曼滤波器的变体的示例包括经典卡尔曼滤波器(KF)、扩展卡尔曼滤波器(EKF)、无香型卡尔曼滤波器(UKF)、集合卡尔曼滤波器(EnKF)、集合卡尔曼平滑器(EnKS)、4D变分模型(4DVAR)中的一个或组合。

一些实施方式基于以下另一个认识：当机器的动力学方程用作软约束时，该方程不必是确切的且可以简化。例如，在一个实施方式中，机器的动力学方程近似机器的动力学的确切方程。

因此，一个实施方式公开了一种用于根据机器动力学模型来控制机器操作的模型预测控制(MPC)系统，该系统包括：存储器，该存储器存储成本函数，该成本函数包括由MPC的目的限定的第一项和对机器的状态与满足机器的动力学方程的值的偏差进行惩罚的第二项；处理器，该处理器在约束的情况下在时间范围上优化成本函数，以产生控制机器在时间范围上的状态的控制输入的序列；以及控制器，该控制器根据序列中的第一控制输入控制机器。

另一个实施方式公开了一种用于根据机器动力学模型使用模型预测控制(MPC)来控制机器操作的方法，其中，方法使用与实现方法的所存储指令耦合的处理器，其中，指令在由处理器执行时，进行方法的至少一些步骤。该方法包括以下步骤：从存储器取得成本函数，该成本函数包括由MPC的目的限定的第一项和对机器的状态与满足机器的动力学方程的值的偏差进行惩罚的第二项；在硬约束的情况下在时间范围上优化成本函数，以产生控制机器在时间范围上的状态的控制输入的序列；以及根据序列中的第一控制输入控制机器。

又一个实施方式公开了一种非暂时计算机可读存储介质，该非暂时计算机可读存储介质上实施程序，该程序可由处理器执行以执行方法。该方法包括以下步骤：从存储器取得成本函数，该成本函数包括由MPC的目的限定的第一项和对机器的状态与满足机器的动力学方程的值的偏差进行惩罚的第二项；在硬约束的情况下在时间范围上优化成本函数，以产生控制机器在时间范围上的状态的控制输入的序列；以及根据序列中的第一控制输入控制机器。

附图说明

[图1]图1示出了根据一些实施方式的用于控制机器操作的控制系统的框图。

[图2]图2示出了根据一些实施方式的用于控制机器操作的模型预测控制(MPC)系统的框图。

[图3]图3示出了一些实施方式所用的成本函数的示意图。

[图4]图4示出了根据一些实施方式的由图1和/或图2的控制系统的模块执行的、用于控制机器操作的方法的框图。

[图5]图5示出了另一个实施方式所用的成本函数的示意图。

[图6]图6示出了根据一些实施方式的用于在MPC将来范围内部使用数据同化的方法的框图。

[图7]图7示出了根据一个实施方式的用于实现用数据同化修改的MPC的方法的框图。

[图8]图8示出了由一个实施方式控制的示例激光加工机的等距视图。

具体实施方式

图1示出了根据一些实施方式的用于控制机器102的操作的控制系统101的框图。控制系统101通过根据模型预测控制(MPC)的原理使用在时间范围上的机器的动力学模型优化成本函数来确定到机器102的控制输入。为此，控制系统101在这里被称为MPC系统。

机器102是操作响应于命令改变量(诸如位置、速度、电流、温度、数值)的装置。如这里使用的，机器的操作确定改变这种量的机器的运动。控制系统接收机器的期望运动103，诸如用于量中的一些的期望轨迹或目标点，并且经由控制输入104控制机器。控制输入可以包括改变机器的操作的参数的命令，或者可以包括影响机器的运动(这导致生成机器的量105)的参数(诸如电压、压力、转矩、力)的实际值。

控制系统101从直接或远程连接到机器的传感器、硬件或软件接收与机器运动有关的信息106。信息106包括机器的状态。机器将状态用于选择控制输入104。信息106可以包括运动量105中的一些或全部，而且可以包括与机器有关的另外信息。量105、控制输入104或其组合可以根据对机器的操作的约束114来请求保持在一些预定范围上。

图2示出了根据一些实施方式的用于控制机器操作的模型预测控制(MPC)系统的框图。MPC系统包括存储成本函数212和约束214的存储器220。MPC系统还包括：处理器230，该处理器在约束214的情况下在时间范围上优化成本函数212，以产生控制机器102在时间范围上的状态的控制输入的序列；和控制器210，该控制器根据序列中的第一控制输入104控制机器。

一些实施方式基于以下惊人观测：各种模型预测控制(MPC)方法将机器的动力学模型用作对控制优化的硬约束，即使在未精确已知模型的参数时。即使这些MPC方法尝试随着时间的过去提高模型的准确性，但在实际上最佳控制仍然可能存在的同时，模型的不准确性会导致机器处于不期望状态，或者使得范围内的MPC优化问题自相矛盾(不可实行)。

例如，通常，机器的动力学模型由机器的动力学方程来表示。动力学方程充当强制MPC产生控制机器操作的控制输入的、MPC优化中的硬约束，该操作使机器移入使得机器的动力学方程为真的状态。一些实施方式通过将机器的动力学方程移入被用来优化机器的性能的MPC的成本函数来去除对MPC的这种硬约束。

图3示出了一些实施方式所用的成本函数212的示意图。成本函数包括由MPC的目的限定的第一项310和对机器的状态与满足机器的动力学方程的值的偏差进行惩罚的第二项320。由第一项310表示的MPC目的的示例包括对在控制时间内的机器的状态与由参考轨迹限定的值的偏差进行惩罚的项、以及使机器的操作的成本最小化的项，诸如操作时间和执行操作所需的能量。

例如，第一项310可以包括控制输入u(τ)和性能度量p的函数J(u,p)，使得优化(例如，第一项的最小化)优化(例如，最小化)性能度量。

第二项320基于MPC或机器的模型包括不确定性的至少一个参数的理解。例如，机器人臂的模型可能包括与搬运物体的壁的质量有关的不确定性。用于列车的移动的模型可能包括与车轮在当前天气条件下与铁轨的摩擦有关的不确定性。为此，在一些实施方式中，第二项包括机器的动力学方程的成分，该成分被确定为使得由处理器执行的成本函数的优化促进确定使得机器的动力学方程为真的机器的状态。这样，机器的模型充当软约束，该软约束在模型包括不确定性时比硬约束更适当。

在一些实施方式中，机器的动力学方程描述了空间(例如，几何空间、控制空间等)中的状态的时间依赖。机器的动力学方程是包含机器的状态作为变量的等式的陈述。等式的成分可以放置在同一侧上，以允许最小或最大优化。

例如，如果机器的动力学方程是x`＝v(x)，则这种方程可以被重写为x`-v(x)＝0。如果差x`-v(x)出现在成本函数中，则成本函数的最小化促进使得机器的动力学方程为真。然而，成本函数值是实数，而x`-v(x)通常是向量函数。确定magnitude(x`-v(x))将向量函数自变量x`-v(x)转换成描述自变量(x`-v(x)与原点0的偏差的特征的非负数magnitude(x`-v(x))。例如，向量的大小可以被确定为向量的长度，而函数的大小可以被确定为函数的绝对值的积分。

因此，项magnitude(x`-v(x))例如可以简单地加到要最小化的成本函数。相反，如果MPC优化使成本函数最大化，则机器的动力学方程可以被重写为-magnitude(x`-v(x))＝0，并且可以从要最大化的成本函数减去项magnitude(x`-v(x))。

在该示例中，成本函数中的附加项是magnitude(x`-v(x))或-magnitude(x`-v(x))，该项允许将动力学方程当做软约束，而不是形成硬约束的等式。

遵循上面提及的示例，成本函数212F可以包括

F(J(u,p)+magnitude(x`-v(x))。

图4示出了根据一些实施方式的、由控制系统101的模块执行的、用于控制机器操作的方法的框图。方法基于成本函数的优化用使用机器动力学模型确定的控制输入来控制机器的操作，该成本函数包括机器动力学的该模型，作为软约束。方法用对于之前迭代确定的之前控制输入确定410由控制产生的机器的当前状态。方法从存储器取得420指定对控制的目的的软约束和对遵循机器动力学模型的软约束的成本函数的软约束，并且从存储器取得430对成本函数的优化的硬约束。

接着，方法通过优化成本函数确定480用于当前迭代处的控制的当前控制输入。例如，方法从当前时刻确定在将来的固定时间量内的将来输入的序列，该固定时间量至少长至获得新机器状态测量，使得预测的将来机器状态和输入满足硬约束。将在等于获得机器状态的新测量所需的时间量的持续时间内的输入序列的第一部分作为到机器的当前控制输入应用450。基于机器的当前状态、机器的当前模型以及到机器的当前控制输入，确定460机器的下一状态，并且控制器等待470，直到接收新状态测量为止。

图5示出了另一个实施方式所用的成本函数的示意图。该实施方式基于以下认识：当机器的动力学方程用作软约束时，可以使用对机器的状态的另外软约束510来在存在不确定性时进一步提高控制的准确性。例如，一些实施方式包括MPC的成本函数中的状态的第三项，该第三项对状态与软约束(诸如对状态结构的约束和对状态行为的约束)的偏差进行惩罚。这种软约束的示例包括对状态的稀疏性的约束、对状态的对称性的约束、对状态的稳定性的约束、对状态的平滑性的约束、对状态在时间上的变化率的约束。

图6示出了根据一些实施方式的用于在MPC将来范围内部使用数据同化610的方法的框图。MPC内的数据同化的使用可以帮助解决不确定性以及与系统有关的不完全信息，这与在数据同化的顶上建立的传统MPC相比引起更准确且鲁棒的控制确定。例如，在一些实施方式中，数据同化610基于状态的之前值，调节在时间范围上根据模型112使用机器的动力学方程确定的状态的值。

一些实施方式基于以下认识：数据同化可以应用于例如从过去观测(历史匹配)估计受控系统的当前状态。然而，因为该范围在将来，所以明确没有在时间范围上的MPC内部的状态观测。因此，在MPC将来范围优化内部使用数据同化方法看起来不可能且由此无意义。

然而，一些实施方式基于以下认识：在用另外特征代替将来状态观测的情况下，数据同化为了确定控制在MPC内部可以是有益的。另外特征可以包括状态的结构，例如，状态的期望对称性，其中，状态的对称性离线确定，并且对称性的类型和参数存储在控制器的存储器中。为此，在一些实现中，数据同化610可以通过强加对状态的结构和/或状态的行为的软约束620来调节状态的值。

例如，状态的对称性的类型在时间上可以是定期的，其中，这种情况下的对称性的参数是时段的长度。状态还可以在空间上展示其对称性，例如，状态的向量可以在任意时间内对称，例如，对于具有20个分量的状态向量，可以已知前10个分量与后10个分量相同。可以周知状态属于对称表面，例如，球面，因为它在时间上变化，其中，这种情况下的对称性的参数(球面的中心和半径)先验地已知并且存储在控制器的存储器中。

一些实施方式基于以下另一个认识：在数据同化中可以使用状态的已知稀疏性，以替代未知的将来状态测量。稀疏性离线确定，并且稀疏性的模式和参数存储在控制器的存储器中。例如，状态的向量可以是稀疏的，即，用向量消没中的特定指数具有分量，其中，指数表示稀疏性的模式，而指数的总数被视为稀疏性的参数。

另外或另选地，若干实施方式用状态的特性替代数据同化中的将来状态观测，这些特性由以下内容中的一个或组合描述期望状态行为：状态满足守恒定律、状态在时间上平滑、状态与状态估计器的已知模型一致、遵循给定配置文件的状态跟踪、状态稳定性、状态有界性。守恒定律例如可以是MPC的一些应用中的状态的质量保存。例如需要时间和空间中的状态的导数中的一个或组合的状态平滑性以按照平滑性的给定容差的绝对值为界，其中，导数的阶和第一容差的值存储在控制器存储器中。

一些实施方式基于以下另一个认识：状态的稳定性和有界性中的一个或组合还可以在MPC内的数据同化中充当将来范围内的状态的不可用测量的替代。状态的稳定性可以使用稳定性的参数来限定，该参数存储在控制器的存储器中，为状态相对于模型的变化的变化的界限。

另选或另外地，一些实施方式使用控制的以下特性中的一个或组合离线地确定期望状态行为的函数，其中，控制跟踪控制的给定配置文件，是平滑的，在时间上是稳定的且在时间上是有界的。使用控制的特性确定的、状态的特性的函数的系数存储在控制器的存储器中。

根据本发明的一些实施方式，用系统状态的数据同化的函数修改系统的MPC的成本函数，其中，数据同化的函数对状态与状态的动力学的偏差进行惩罚，由此，松弛系统模型中的状态的动力学方程。另外，用状态结构和状态行为中的一个或组合的函数修改系统的MPC的成本函数，该前一函数被给予到通常仅包括状态动力学方程和各种约束的系统的模型的添加。修改对MPC控制解的影响可以被说明为充当成本函数中的软约束，使得例如对于状态与状态结构和/或状态行为的偏差惩罚将受控系统移动至状态的各控制输入。这样，在时间范围上的所有控制输入共同执行状态同化，以处理系统模型中的不确定性。

图7示出了根据一个实施方式的用于实现用数据同化修改的MPC的方法701的框图。修改MPC的成本函数，使得用包括用于与模型系统动力学的偏差的惩罚和用于状态与其结构和行为的偏差的惩罚这两者的数据同化的项代替系统动力学的项。由惩罚项确定的数据同化问题的最优解给出将来时间范围上的预测状态，该预测状态转而用于产生控制输入的序列。来自该序列的第一控制输入用作当前系统状态处的控制输入。

方法701执行生成控制信号711的在线控制步骤，该控制信号用于基于当前状态703的测量和/或估计值以及控制的之前时间步的范围时间内的状态、控制以及数据的值710来控制系统。方法通过同化对状态的软(不确定)约束705容许不确定性，来根据系统的模型确定720将来范围时间中的预测状态725，然后根据必要的最优性条件确定750范围时间中的解向量755。在确定解向量之后，方法生成760控制信号711，并且更新范围时间内的状态、控制以及数据的值。方法在控制的下一时间步处使用更新后的值。

例如，在一个实施方式中，成本函数包括执行在时间范围上的状态的数据同化的第三项，使得处理器根据同化后的状态产生使机器的状态移动的控制输入的序列。因为数据同化用于MPC时间范围上部，所以实施方式使用适于数据同化的卡尔曼滤波器的变体来优化成本函数。卡尔曼滤波器的变体的示例包括经典卡尔曼滤波器(KF)、扩展卡尔曼滤波器(EKF)、无香型卡尔曼滤波器(UKF)、集合卡尔曼滤波器(EnKF)、集合卡尔曼平滑器(EnKS)、4D变分模型(4DVAR)中的一个或组合。

一些实施方式基于以下另一个认识：当机器的动力学方程用作软约束时，该方程不必是确切的且可以简化。例如，在一个实施方式中，机器的动力学方程近似机器的动力学的确切方程。例如，一个实施方式使用用系统的状态的动力学的近似方程修改的MPC的成本函数，其中，近似方程由应用于系统状态的动力学的确切方程的模型降阶来确定。

示例性实施方式

在一个示例性实施方式中，MPC通过对范围[t,t+T]求解预测模型来确定当前控制输入u(t)。作为总体框架的起始点，该实施方式考虑预测模型的修改变体，其中，控制u(τ)和参数向量p使性能指数J(u,p)最小化：

其中，

在不确定模型动力学

对状态的不确定约束

g(τ,x(τ),u(τ),p)+η_g＝0,τ∈[t,t+T], (2)

以及确定约束

x(τ)|_τ＝t＝x(t), (3)

C(τ,x(τ),u(τ),p)|_τ∈[t,t+T]＝0, (4)

ψ(x(τ),p)|_τ＝t+T＝0. (5)的情况下。

用于时间依赖微分方程(1)的初始值x(τ)|_τ＝t是动力学系统的当前状态向量x(t)。求解预测问题的控制向量u＝u(τ)用作在时间t控制动力学系统的输入。向量p(t)的分量是系统的参数。非线性方程(1)描述了用于预测的模型系统动力学。当时变干扰η_f和η_g具有随机性质时，协方差矩阵C_f和C_g可变。

作为使原始成本函数(性能指数J(u,p))最小化的补充，根据使用通过选择范围内的合适解x(τ)进行的4DVar/MHE最小化项的本发明的一些实施方式使干扰向量η_f和η_g最小化：

其中，是具有权重矩阵C^-1的L₂范数。贯穿剩余部分，我们将非传统符号用于范数，例如，PfP实际意指通常由表示的f的范数。在我们的测试示例中，我们使用形式C_f＝α^-1I和C_g＝β^-1I的协方差矩阵，α＝1且合适的标量β>0，I为单位矩阵。

根据本发明的实施方式，我们通过将4DVar/MHE最小化项加到原始成本函数(性能指数J(u,p))来松弛动力学方程。根据本发明的实施方式，修改成本函数的最小化可以由交替方向乘子法(ADMM)或交替最小化算法(AMA)来执行，其中，有人重复交替控制和干扰的最小化。我们注意，范围内的解与4DVar/MHE模型中的自由选择对照，具有固定初始值x(t)。

上面陈述的范围预测问题的连续算式化可以在范围[t,t+T]内的均匀时间网格上离散化，该范围被分成尺寸Δτ的N个相等时间步，并且在网格点τ_i(i＝0,1,...,N)处对时间连续向量函数x(τ)和u(τ)采样，并且分别由编索引值x_i和u_i表示这些向量函数。借助于矩形正交规则近似范围内的性能成本J的积分。由向前差分算式近似状态向量的时间微分。

在得到用于NMPC算式化的欧拉方程之前，该实施方式用固定x₀离散化4DVar模型：

为了进一步方便，实施方式引入块对角矩阵

和向量

在该符号中，离散化的4DVar问题采用以下形式：

相对于向量G和R的x的梯度等于

因此，4DVar的解x_i(i＝1,...N)满足方程

然后将离散化的最优控制问题NMPC算式化为如下：

在x_i的系统(6)和等式约束

C(τ_i,x_i,u_i,p)＝0,i＝0,1,...,N-1, (7)

ψ(x_N,p)＝0.(8)的情况下。

可以借助于离散拉格朗日函数得到离散化范围问题的必要最优性条件

其中，变量在两个更大向量X＝[x_iλ_i]^T(i＝0,1,...,N)和U＝[u_iμ_iνp]^T(i＝0,1,...,N-1)中。这里，是共态向量，μ与约束(7)关联的拉格朗日乘子向量。由拉格朗日乘子ν的帮助松弛终端约束(8)。

计算拉格朗日L的导数获得必要的最优性条件、卡瑞施-库恩-塔克(Karush-Kuhn-Tucker(KKT))静止条件：

例如，一个实现还将KKT条件转换成非线性方程F[U,x,t]＝0，其中，向量U将控制输入u、拉格朗日乘子μ、拉格朗日乘子ν以及乘子p全部组合在一个向量中。

F[U,x,t]中的向量自变量x表示当前测量或估计的状态向量，该状态向量在以下过程中充当初始向量x₀，这消除状态变量x_i和共态变量λ_i。

具有被测量或估计的当前状态x₀的一个实施方式通过代替向前欧拉方法x_i+1＝x_i+f(τ_i,x_i,u_i,p)Δτ求解方程(6)来计算x_i，i＝1,2...,N。然后，从以下线性方程组计算共态λ_i(i＝N,N-1,...,1)

值λ_N由相对于x的项ν^Tψ(x_N,p)的微分来限定。

接着，实施方式使用刚刚获得的x_i和λ_i将F[U,x,t]计算为

相对于未知向量U(t)的方程

F[U(t),x(t),t]＝0 (9)

给出所需的必要的最优性条件。

一些实施方式使用在均匀时间网格t_j＝jΔt(j＝0,1,...)上用MPC控制的动力学系统，并且表示x_j＝x(t_j)。在这些实施方式中，需要在控制器板上在各时间步t_j在线求解方程(9)，这是NMPC实现的有挑战性部分。

相对于未知变量U_j＝U(t_j)的非线性方程F[U_j,x_j,t_j]＝0等效于以下方程

F[U_j,x_j,t]-F[U_j-1,x_j,t_j]＝b_j,

其中，

b_j＝-F[U_j-1,x_j,t_j]. (11)

使用通常与时间步Δt和Δτ不同的小标量h>0，我们引入向前微分运算符

a_j(V)＝(F[U_j-1+hV,x_j,t_j]-F[U_j-1,x_j,t_j])/h (12)

该运算符沿着方向V近似导数F_U[U_j-1,x_j,t_j](V)。方程F[U_j,x_j,t_j]＝0等效于运算符方程a_j(ΔU_j/h)＝b_j/h，其中，ΔU_j＝U_j-U_j-1。

让我们引入具有由算式A_je_k＝a_j(e_k)限定的列A_je_k(k＝1,...,m)的m×m矩阵A_j，其中，m是向量U的维数，并且e_k表示m×m单位矩阵的第k列。矩阵A_j是雅可比矩阵F_U[U_j-1,x_j,t_j]的O(h)近似。雅可比矩阵F_U是对称的，即，雅可比矩阵F_U[U,x,t]对于所有U、x以及t对称。

假设方程F[U₀,x₀,t₀]＝0的近似解U₀可用。找到足够准确的近似U₀对于牛顿型方法以及搜索的成功是关键的，因为它通常是具有挑战性的运算。

U₀的第一块入口在状态x₀当做输入控制u₀。下一状态x₁＝x(t₁)是传感器估计的或由算式x₁＝x₀+f(t₀,x₀,u₀)Δt计算；参考(1)。在时间t_j，j>1，我们具有状态x_j和来自之前时间t_j-1的向量U_j-1。我们的目标是相对于V求解以下方程：

a_j(V)＝b_j/h. (13)

然后，设置ΔU_j＝hV，U_j＝U_j-1+ΔU_j，并且将U_j的第一块分量选择为控制u_j。下一系统状态x_j+1＝x(t_j+1)是传感器估计的或由算式x_j+1＝x_j+f(t_j,x_j,u_j)Δt计算。

求解算符方程(13)的直接方式是明确形成矩阵A_j并然后例如由高斯(Gaussian)消去求解线性方程组A_jΔU_j＝b_j。更快的另选方案是由GMRES迭代法求解(13)，其中，在没有矩阵A_j的明确构建的情况下使用算符a_j(V)。

一个实施方式数字地计算从R³中的单位二维球面上的初始状态x₀到终端状态x_f的最小时间运动：系统动力学由以下普通微分方程组来管理

其中，控制输入u受到不等式约束|u-c|≤r，我们用以下等式约束来松弛该不等式约束

变量u_d是假想的且受下面引入的标量w_d控制。成本函数是其中，p＝t_f-t是到目的地的时间，并且w_d是小正常数。

该实施方式选择与间隔[t,t_f]一致的后退范围。借助于线性映射τ→t+τp由无维时间τ∈[0,1]参数化范围。将正规化间隔[0,1]均匀地分成具有步长Δτ＝1/N的网格τ_i＝iΔτ，i＝0,1,...,N。离散化变量包括状态x_i和共态λ_i、控制输入u_i和松弛变量u_d,i、拉普拉斯算子μ_i和ν、参数p。

对后退范围的动力学系统的不确定预测模型是向前欧拉方法

其中，

欧拉方法的截断误差是是(1)中的干扰η_f。显著地，η_f在这里不是随机的，并且与状态函数x(τ)高度相关。直接验证连续系统动力学满足对状态的等式约束因此，约束(4)具有和η_g＝0。4DVar近似被设计为“柔软地”满足约束(4)。注意，对于该问题，可以通过在欧拉方法的每一个步骤之后将x_i+1投影到单位球面上来确切满足状态约束

满足等式约束的又一种方式是使用保存范数Px_jP₂的所谓的指数积分器x_j+1＝exp(A(u_j)x_j)。对于测试示例，我们将该指数积分器用于测试系统动力学的数值模拟。

离散化成本函数是

一个实现在固定初始值x₀和标量参数β≥0的情况下选择状态x_i的4DVar近似，

参数β确定满足等式约束的力：常数β越大，强制越强。

根据一些实施方式，4DVar等效于非线性方程组

其中，

对应的离散拉格朗日函数具有以下形式：

共态λ满足以下算式：

其中，C是具有块的块对角矩阵：

函数F(U,x₀,t)，其中，

U＝[u₀,...,u_N-1,u_d,0,...,u_d,N-1,

μ₀,...,μ_N-1,ν,p]^T,

从上到下具有以下行：

x_N-x_f；

一些实施方式考虑具有源于系统动力学的状态约束的问题。实施方式将终端约束的数量减少至由对状态的等式约束确定的平滑流形的维数。例如，在一种情况下，球面的维数等于2，因此，拉格朗日乘子ν仅包含2个分量，而不是3个。如果未满足终端约束的上述减少，那么随后计算导致牛顿型迭代中的奇异雅克比。

激光加工机

一些实施方式提供了用于控制冗余激光加工机的操作的系统和方法。一些实施方式在约束的情况下使用基于优化的后退范围控制来控制机器，这些约束保证用由跟踪误差的边界限定的误差跟踪参考轨迹的可行性。后退范围控制的非限制性示例是模型预测控制(MPC)。

图8示出了根据本发明的一个实施方式的示例激光加工机的等距视图。激光加工机为了例示的目的而示出，并且该机器的设计不旨在限制本发明的范围。激光加工机包括慢致动器和快致动器，下面提供它们的示例。

工件800支撑在台架820下方的束集堆810上。台架沿着第一方向(例如，沿着Y轴)在轨道825和826上移动。台架820由第一私服马达和第一螺钉823沿着第一方向移动。平台830设置在台架820上，并且沿着第一方向与台架一起移动。而且，平台830由第二私服马达和第二螺钉835沿着第二方向(例如，沿着X轴)移动。在该实施方式中，台架820、第一私服马达和第一螺钉823以及第二私服马达和第一螺钉835形成用于使平台沿着第一和第二方向在于工件平行的平面中移动的运动系统。然而，本发明的其他实施方式使用不同类型的棱柱形关节来移动平台。例如，第一棱柱形关节可以包括第一方向线性驱动马达，并且第二棱柱形关节可以包括第二方向线性驱动马达。

流电组件，例如，具有两个正交流电驱动器(即，第一驱动器840和第二驱动器845)、第一镜841和第二镜846的两轴流电扫描头，设置在平台830上。由第一驱动器840引起的第一镜841的第三运动沿着第三方向定位激光束，并且由第二驱动器845引起的第二镜846的第四运动沿着第四方向定位激光束。

在本描述的背景下，台架820是具有大操作范围的第一致动器或慢致动器，并且流电组件是具有更小操作范围的第二致动器或快致动器。然而，这种使用不旨在限制权利要求的范围。例如，在一些变型例中，第一致动器是快致动器，并且第二致动器是慢致动器。

在各种实施方式中，流电组件设置在平台上，使得第三方向相对于第一方向固定，并且第四方向相对于第二方向固定。例如，在一个实施方式中，第一方向与第三方向一致，并且第二方向与第四方向一致。在另一个实施方式中，第一方向与第三方向形成45度角，并且第二方向与第四方向形成45度角。

流电组件可以贴附到平台，以便固定运动方向。另选地，流电组件可以旋转地设置在平台上，使得可以在激光加工机的操作之前或期间固定第一、第二、第三以及第四方向的人工定向。在本发明的背景下，流电组件是具有小操作范围的第二级或快级。

激光加工机可以包括激光器850，该激光器用于经由光纤870和准直器875将切割激光束860引导到流电组件的第一镜841和第二镜846。在另选实施方式中，激光束经由沿着Y台架和X轴平台移动的对角镜引导到流电组件。然而，其他变型例也是可以的。

准直后的切割激光束860由镜引导穿过用于将激光束聚焦在工件上的聚焦模块880，这在工件800上产生组合的X轴和Y轴流电组件扫描区域865，并且切割工件800。聚焦模块880的示例是场平坦Fθ透镜或非远心Fθ透镜。工件800的尺寸可以由于平台的运动而大于流电扫描区域865。

在一些实施方式中，控制模块包括计算机数控(CNC)控制器895。其他实施方式可以使用不同类型的控制器。控制模块可以根据限定激光束的位置的轨迹的预计算G代码890控制运动系统和流电组件，或者可以执行决定如何控制机器的计算。例如，计算可以限定用于X轴平台830、Y轴台架X运动流电组件和镜841、以及Y运动流电组件和镜846的连续位置。

通常，机器用具有不同动力学行为的致动器建立。例如，由于位移质量差，第一致动器通常显著慢于第二致动器。根据该差，得到缓慢和快致动器的所指示名称。

一个实施方式将慢致动器的动力学建模为

p(k+1)＝p(k)+T_sv(k)

其中，p是慢致动器的位置，v是慢致动器的速度，τ是慢致动器的转矩，T_s是执行控制循环的机器的控制时段，k是控制循环的指数，J是慢致动器的惯性，L是将纵向运动转换成线性运动的滚珠螺杆的节距长度，并且τ是慢致动器的转矩，β是对于慢致动器的给定角速度确定慢致动器上的摩擦转矩的摩擦系数。

根据本发明的实施方式，可以通过将对应差的大小加到原始成本函数来松弛动力学方程中的一个或两个。例如，第一方程

p(k+1)＝p(k)+Tsν(k)

首先被重写为p(k+1)-p(k)-Tsν(k)＝0，

然后被重写为magnitude(p(k+1)-p(k)-Tsν(k))＝0，

其中，“magnitude”可以是向量(诸如2-)范数，可以平方。然后使动力学的第一原始方程p(k+1)＝p(k)+T_sν(k)下降，并且向原始成本函数加附加项magnitude(p(k+1)-p(k)-T_sν(k))。因此，动力学的第一原始方程p(k+1)＝p(k)+Tsν(k)在修改成本函数的MPC最小化中可能被违反，虽然被促进为真。如果动力学的第一原始方程p(k+1)＝p(k)+Tsν(k)中的参数Ts不确定，则可以是有益的。

通常，参数p、v、t是具有x和y坐标的二维向量，并且经受以下约束：

p_min≤p(k)≤p_max

v_min≤v(k)≤v_max

a_min≤a(k)≤a_max

τ_min≤τ(k)≤τ_max，

这些约束限定对位置p、速度v、加速度a以及转矩τ的下界和上界，并且根据本发明的一些实施方式，可以保持为硬约束。

一个实施方式将慢致动器的模型表达为线性微分方程

x(k+1)＝Ax(k)+Bu(k)

y(k)＝Cx(k)，

其中，k是对信号采样的时刻，即，控制循环的指数，u是机器输入，y是机器输出，x是机器的状态，并且A、B、C是模型的参数。例如，x＝[p,v]’，y＝p，u＝τ，并且A、B、C是适当维数的度量，并且慢致动器的操作经受以下线性约束：

其中，X、U是多面集。

根据本发明的其他实施方式，可以通过将对应差的大小加到原始成本函数来松弛动力学方程中的一个或两个。例如，第一方程

x(k+1)＝Ax(k)+Bu(k)

首先被重写为x(k+1)-Ax(k)-Bu(k)＝0，

然后被重写为

magnitude(x(k+1)-Ax(k)-Bu(k))＝0，

其中，“magnitude”可以是向量(诸如2-)范数，可以平方，即，magnitude(x(k+1)-Ax(k)-Bu(k))＝||x(k+1)-Ax(k)-Bu(k)||²。然后使动力学的第一原始方程x(k+1)＝Ax(k)+Bu(k)下降，并且对于所有k向原始成本函数加附加项magnitude(x(k+1)-Ax(k)-Bu(k))。因此，动力学的第一原始方程x(k+1)＝Ax(k)+Bu(k)在修改成本函数的MPC最小化中可能被违反，虽然被促进为真。如果动力学的第一原始方程x(k+1)＝Ax(k)+Bu(k)中的矩阵A和B中的至少一个不确定，则可以是有益的。另外或另选地，如果已知动力学的第一原始方程x(k+1)＝Ax(k)+Bu(k)例如因为它近似更准确的动力学的非线性方程x(k+1)＝F(x(k),u(k))而仅近似保持，则松弛可以是有益的，该更准确的非线性方程由于实时非线性最小化的不实用计算成本而无法直接用于MPC中。

动力学的第二方程y(k)＝Cx(k)可以类似另外或另选地松弛，用将附加项magnitude(y(k)-Cx(k))加到要在范围内的实时MPC优化中最小化的原始成本函数来代替。

本发明的一些实施方式基于以下认识：仅松弛动力学的方程可能导致以下情况：对不确切满足动力学的原始方程的状态，保持MPC优化问题的最优控制解，即使原始方程被松弛。这种琐碎的场景可能是不期望的，并且在本发明的一些实施方式中，可以通过在成本函数中包括另外项来避免，该成本函数描述了控制和状态中的一个或组合的期望行为和结构中的一个或组合。在激光切割机示例中，另外项例如可以对慢致动器的加速度进行惩罚，其中，成本函数中的另外项将是加速度a的大小|a|²，尽管加速度已经难受其给定上界约束。

本发明的一些实施方式提出使用交替方向乘子法(ADMM)或交替最小化算法(AMA)来使用另外项修改的成本函数最小化，其中，有人重复交替控制和状态的最小化。例如，使原始成本函数为J(u,x,y)，第一另外项为α||y-Cx||²，这对于所有k促进y(k)＝Cx(k)，并且使第二另外项为β||x||²，这促进小x。然后，修改后的最小二乘成本函数为J(u，x，y)+α||y-Cx||²+β||x||².

不是相对于所有变量一起最小化，而是有人可以重复地交替控制u和状态以及观测x和y的最小化，这可能在计算上是有利的。

本发明的上述实施方式可以以大量方式中的任一个来实现。例如，实施方式可以使用硬件、软件或其组合来实现。当在软件中实现时，可以在任意合适的处理器或处理器的集合上执行软件代码，而不管处理器是设置在单个计算机中还是分布在多个计算机之间。这种处理器可以被实现为集成电路，一个或多个处理器在集成电路部件中。但处理器可以使用任意合适格式的电路来实现。

进一步地，应当理解，计算机可以以若干形式中的任一个来具体实施，诸如机架安装计算机、台式计算机、膝上型计算机、微型计算机或平板计算机。这种计算机可以由任意合适形式的一个或更多个网络互联，这些网络包括作为局域网或广域网(诸如企业网络或因特网)。这种网络可以基于任意合适的技术，并且可以根据任意合适的协议来操作，并且可以包括无线网络、有线网络或光纤网络。

而且，这里所概述的各种方法或处理可以被编码为可在采用各种操作系统或平台中的任一个的一个或更多个处理器上执行的软件。另外，这种软件可以使用若干合适编程语言和/或编程或脚本工具中的任一个来编写。

而且，本发明的实施方式可以被具体实施为示例已经被提供的方法。作为方法的一部分执行的步骤可以以任意合适的方式来排序。因此，可以构造以下实施方式，其中，虽然动作在例示性实施方式中被示出为顺序动作，但动作以与所例示的不同顺序来执行，这可以包括同时执行一些动作。

Claims

1.一种用于根据机器动力学模型来控制机器操作的模型预测控制(MPC)系统，该系统包括：

存储器，该存储器存储成本函数，该成本函数包括由所述MPC的目的限定的第一项和对所述机器的状态与满足所述机器的动力学方程的值的偏差进行惩罚的第二项；

处理器，该处理器在约束的情况下在时间范围上优化所述成本函数，以产生控制所述机器在所述时间范围上的所述状态的控制输入的序列；以及

控制器，该控制器根据所述序列中的第一控制输入控制所述机器。

2.根据权利要求1所述的系统，其中，所述第二项包括所述机器的所述动力学方程的成分，该成分被确定为使得由所述处理器执行的所述成本函数的所述优化促进确定使得所述机器的所述动力学方程为真的所述机器的所述状态。

3.根据权利要求1所述的系统，其中，所述成本函数包括对所述状态与软约束的偏差进行惩罚的所述状态的第三项。

4.根据权利要求3所述的系统，其中，所述软约束包括对所述状态的结构的约束和对所述状态的行为的约束中的一个或组合。

5.根据权利要求3所述的系统，其中，所述软约束包括对所述状态的稀疏性的约束、对所述状态的对称性的约束、对所述状态的稳定性的约束、对所述状态的平滑性的约束、对所述状态在时间上的变化率的约束中的一个或组合。

6.根据权利要求1所述的系统，其中，所述成本函数包括执行在所述时间范围上的所述状态的数据同化的第三项，使得所述处理器根据所述同化后的状态产生使所述机器的所述状态移动的控制输入的所述序列。

7.根据权利要求6所述的系统，其中，所述数据同化基于所述状态的之前值，调节使用所述机器在所述时间范围上的所述动力学的所述方程确定的所述状态的值。

8.根据权利要求6所述的系统，其中，所述处理器使用卡尔曼滤波器的变体优化所述成本函数。

9.根据权利要求8所述的系统，其中，卡尔曼滤波器的所述变体包括经典卡尔曼滤波器(KF)、扩展卡尔曼滤波器(EKF)、无香型卡尔曼滤波器(UKF)、集合卡尔曼滤波器(EnKF)、集合卡尔曼平滑器(EnKS)、4D变分模型(4DVAR)中的一个或组合。

10.根据权利要求1所述的系统，其中，所述成本函数在使用加权最小二乘法寻找控制输入的所述序列中平衡所述第一项和所述第二项的权重，并且其中，所述权重存储在所述MPC系统的所述存储器中。

11.根据权利要求1所述的系统，其中，所述处理器由用于所述控制输入和所述状态的重复交替优化来优化所述成本函数。

12.根据权利要求1所述的系统，其中，所述机器是冗余激光加工机。

13.一种用于根据机器动力学模型使用模型预测控制(MPC)来控制机器操作的方法，其中，所述方法使用与实现所述方法的所存储指令耦合的处理器，其中，所述指令在由所述处理器执行时，进行所述方法的至少一些步骤，该方法包括以下步骤：

从存储器取得成本函数，该成本函数包括由所述MPC的目的限定的第一项和对所述机器的状态与满足所述机器的动力学方程的值的偏差进行惩罚的第二项；

在硬约束的情况下在时间范围上优化所述成本函数，以产生控制所述机器在所述时间范围上的所述状态的控制输入的序列；以及

根据所述序列中的第一控制输入控制所述机器。

14.根据权利要求13所述的方法，其中，所述第二项包括所述机器的所述动力学方程的成分，该成分被确定为使得由所述处理器执行的所述成本函数的所述优化促进确定使得所述机器的所述动力学方程为真的所述机器的所述状态。

15.根据权利要求13所述的方法，其中，所述成本函数包括对所述状态与软约束的偏差进行惩罚的状态的第三项，其中，所述软约束包括对所述状态的结构的约束和对所述状态的行为的约束中的一个或组合。

16.根据权利要求13所述的方法，其中，所述成本函数包括执行在所述时间范围上的所述状态的数据同化的第三项，使得所述处理器根据所述同化后的状态产生使所述机器的所述状态移动的控制输入的所述序列。

17.根据权利要求16所述的方法，其中，所述数据同化基于所述状态的之前值，调节使用所述机器在所述时间范围上的所述动力学的所述方程确定的所述状态的值。

18.根据权利要求16所述的方法，其中，所述处理器使用卡尔曼滤波器的变体优化所述成本函数。

19.根据权利要求13所述的方法，其中，所述机器是冗余激光加工机。

20.一种非暂时计算机可读存储介质，该非暂时计算机可读存储介质上实施程序，该程序能够由处理器执行以执行方法，所述方法包括以下步骤：

根据所述序列中的第一控制输入控制所述机器。