CN111699443B - 用于控制系统的操作的控制系统和方法及存储介质 - Google Patents

用于控制系统的操作的控制系统和方法及存储介质 Download PDF

Info

Publication number
CN111699443B
CN111699443B CN201880088832.XA CN201880088832A CN111699443B CN 111699443 B CN111699443 B CN 111699443B CN 201880088832 A CN201880088832 A CN 201880088832A CN 111699443 B CN111699443 B CN 111699443B
Authority
CN
China
Prior art keywords
approximation
matrix
control
constrained
dynamics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880088832.XA
Other languages
English (en)
Other versions
CN111699443A (zh
Inventor
R·奎因
P·赫斯帕霍尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN111699443A publication Critical patent/CN111699443A/zh
Application granted granted Critical
Publication of CN111699443B publication Critical patent/CN111699443B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/048Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Automation & Control Theory (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Feedback Control In General (AREA)

Abstract

一种用于控制系统的操作的控制系统,所述系统具有受制于包括对所述系统的状态变量和控制变量的等式约束和不等式约束的约束的连续时间非线性动力学,所述控制系统包括:估计器,其使用系统的操作的测量来估计系统的当前状态;以及控制器,其在各个控制时间步迭代地求解约束非线性优化问题的近似以生成控制解,其中,该近似包括系统的非线性动力学的通过控制范围中的时间间隔离散化并针对控制范围的各个时间间隔使用约束雅可比矩阵的近似表示的线性化。迭代求解过程基于使用系统的离散化动力学和系统的离散化动力学的至少一个方向导数中的一个或组合的评估用于中间压缩矩阵和约束雅可比矩阵的近似的分块更新公式。中间压缩矩阵和约束雅可比矩阵中的各个块表示预测范围中的一个时间间隔,并且可基于分块秩一更新公式独立地更新,而没有任何迭代求解过程,也没有任何矩阵‑矩阵乘法或矩阵因式分解。

Description

用于控制系统的操作的控制系统和方法及存储介质
技术领域
本发明总体上涉及非线性动力学系统的预测控制,更具体地,涉及一种用于拟牛顿型优化算法中的块结构低秩雅可比更新以进行非线性系统的实时预测控制的方法和设备。
背景技术
诸如模型预测控制(MPC)的预测控制器用于许多应用以控制由一组非线性微分方程(即,常微分方程(ODE)或微分代数方程(DAE)组)描述的复杂动力学系统。这些系统的示例包括生产线、车辆、卫星、引擎、机器人、发电机和其它数控机器。
直接最优控制方法依赖于基于控制范围的离散化和预测范围上的控制动作的对应参数化的连续时间微分方程的离散化。所得非线性优化问题或非线性规划(NLP)可通过任何非线性优化求解器来求解。然而,在实时应用非线性系统的预测控制的情况下,需要在严格的定时约束下求解该非线性优化问题。
由非线性微分方程描述的系统的预测控制需要在各个控制步求解非线性最优控制问题。代替精确地求解各个问题,可执行序列二次规划(SQP)方法的一次实时迭代,以便从一个时间点到下一时间点更新解猜测。这种牛顿型SQP方法需要该方法的每次迭代的离散非线性动力学的线性化。当使用显式积分方法时该线性化可昂贵并且需要雅可比评估,在隐式积分方法的情况下其可另外需要矩阵因式分解、矩阵-矩阵乘法和/或迭代过程以求解非线性方程系统。
因此,需要在非线性动力学系统的实时预测控制应用中降低SQP求解器的计算成本。
发明内容
一些实施方式的目的在于提供一种用于通过求解不等式约束非线性动态优化问题(包括描述系统的动态模型的非线性微分方程的离散化)来控制系统的控制系统和方法。
一些实施方式使用实时迭代方法通过在预测控制器中在各个控制步执行序列二次规划(SQP)方法的一次迭代来求解非线性最优控制问题(OCP)。这意味着在各个控制步,实施方式需要准备并求解非线性优化问题的二次规划(QP)近似。QP准备包括强加于离散化非线性系统动力学的非线性约束的线性化。基于该线性化,求解所得QP以便生成用于在预测控制器的各步控制系统的控制解。
当系统的动态模型由一组连续时间微分方程描述时,一些实施方式利用数值积分方法将系统动力学离散化,并且线性化需要对应雅可比评估。一些实施方式基于这样的认识:在动力学为高维的情况下,在其涉及冗长的非线性表达式的情况下,或者如果其由一组刚性或隐含定义的微分方程描述,准备非线性优化问题的QP近似所需的该线性化步骤形成计算上昂贵的步骤。
由于其可取的数值稳定性及其应对隐式代数方程的能力,一些实施方式使用隐式积分方案来将非线性系统动力学离散化(例如,在直接配点中)。这种隐式积分方案需要隐含地定义中间变量的非线性方程系统的解以表示离散化系统动力学。一些实施方式基于这样的认识:在SQP方法中,可从各个QP近似数值上消除这些中间变量以便得到可更高效地求解的较小维度QP。该数值消除过程可被称为压缩,并且基于多个中间压缩矩阵的计算来计算压缩QP中的约束雅可比矩阵。
离散化系统动力学的各个线性化可受益于这些压缩矩阵的重新计算,以便在非线性OCP的压缩QP近似中生成精确约束雅可比矩阵。代替在各个控制步将精确雅可比矩阵用于离散化系统动力学,一些实施方式使用雅可比近似与基于伴随(adjoint)的非精确SQP迭代的组合。一些实施方式基于这样的认识:然后可使用基于拟牛顿和/或Broyden型方法的秩一更新从一个时间点到下一时间点更新这些雅可比近似。这种方法仅基于离散化系统动力学的评估和/或基于计算上远比完整雅可比评估更便宜的伴随微分技术。
一些实施方式基于这样的认识:更新雅可比矩阵可降低计算复杂度,但是也可能不足以实现适合于实时控制应用的计算复杂度。一些实施方式基于这种缺点的两个原因的理解。首先,雅可比矩阵的更新可能破坏其稀疏性。一些实施方式基于这样的认识:当对离散化系统动力学应用经典拟牛顿或Broyden型方法时,获得密集雅可比近似,因此破坏了块结构稀疏性结构。在那些情况下,利用非稀疏雅可比矩阵求解QP近似在计算上要求高。
然而由于在控制范围中从一个时间间隔到下一时间间隔具有线性耦合的OCP的多级结构,认识到精确雅可比相反表现出特定块稀疏性结构。因此,一些实施方式另选地按照保留雅可比的该块稀疏性结构的方式应用拟牛顿或Broyden型更新公式,从而得到雅可比的分块秩一更新。该分块秩一更新具有与标准秩一更新相同的计算成本,其显著低于完整雅可比评估,但保留了问题的块结构稀疏性,这有益于非线性优化问题的QP近似的高效求解。
更新雅可比近似的高计算成本的第二个原因在于在使用隐式积分方法将连续时间系统动力学离散化的情况下执行雅可比矩阵的更新的计算复杂度。一些实施方式基于这样的认识:在约束雅可比矩阵的每次更新中需要迭代求解过程来计算隐式积分方法的中间变量。具体地,一些实施方式相反使用分块秩一更新公式来生成包括离散化系统动力学和定义中间变量的非线性方程系统的组合系统的雅可比近似。
一些实施方式基于这样的认识:通过使用表明矩阵的秩一更新如何得到该矩阵的逆的秩一更新的Sherman-Morrison公式,组合方程系统的雅可比的该分块秩一更新得到中间压缩矩阵的秩一更新公式。中间压缩矩阵的分块秩一更新然后得到块结构QP近似中的压缩约束雅可比矩阵的秩一更新。这些实施方式基于该分块秩一更新公式来执行隐含定义的中间变量的数值消除或压缩,而没有任何迭代求解过程,也没有任何矩阵-矩阵乘法或矩阵因式分解。相反,这些实施方式仅需要矩阵向量运算以及非线性方程的一次评估和伴随方向导数的一次评估。
一些实施方式基于压缩海森矩阵的因式分解以便在各个控制步求解非线性OCP的QP近似,这是成本高的计算步骤。一些实施方式基于这样的认识:该矩阵因式分解可基于约束雅可比矩阵的秩一更新从一个控制步到下一控制步更新。具体地,一些实施方式使用秩二对称更新公式基于约束雅可比矩阵的秩一更新来更新压缩海森矩阵的因式分解。一些其它实施方式使用秩三对称更新公式基于对约束雅可比矩阵的秩一更新和海森近似的拟牛顿型秩一更新公式来更新压缩海森矩阵的因式分解。
因此,一个实施方式公开了一种用于控制系统的操作的控制系统,所述系统具有受制于包括对所述系统的状态变量和控制变量的等式约束和不等式约束的约束的连续时间非线性动力学。该控制系统包括:估计器,其使用系统的操作的测量来估计系统的当前状态;存储器,其存储针对控制范围中的各个时间间隔确定的约束雅可比矩阵的近似和中间压缩矩阵,使得中间压缩矩阵和约束雅可比矩阵的近似具有块双对角结构;处理器,其在各个控制步迭代地求解约束非线性优化问题的近似以生成控制解,其中,该近似包括系统的非线性动力学的通过控制范围中的时间间隔离散化并针对控制范围的各个时间间隔使用约束雅可比矩阵的近似表示的线性化,其中,在各个控制步,处理器被配置为从存储器检索针对各个时间间隔确定的约束雅可比矩阵的近似和中间压缩矩阵;使用系统的离散化动力学和系统的离散化动力学的方向导数中的一个或组合的评估来分块更新约束雅可比矩阵的近似和中间压缩矩阵,其中,中间压缩矩阵和约束雅可比矩阵中的各个块表示控制范围中的一个时间间隔;使用所更新的所述约束雅可比矩阵的近似来求解所述非线性优化问题的所述近似;并且利用所更新的约束雅可比矩阵的近似和所更新的中间压缩矩阵来更新所述存储器;以及控制器,其使用控制解来控制系统。
另一实施方式公开了一种用于控制系统的操作的方法,所述系统具有受制于包括对所述系统的状态变量和控制变量的等式约束和不等式约束的约束的连续时间非线性动力学,其中,所述方法使用联接到存储器的处理器,该存储器存储针对控制范围中的各个时间间隔确定的约束雅可比矩阵的近似和中间压缩矩阵,使得中间压缩矩阵和约束雅可比矩阵的近似具有块双对角结构,其中,处理器与所存储的实现所述方法的指令联接,其中,所述指令在由处理器执行时执行所述方法的至少一些步骤,包括:使用系统的操作的测量来估计系统的当前状态;在各个控制步迭代地求解约束非线性优化问题的近似以生成控制解,其中,该近似包括系统的非线性动力学的通过控制范围中的时间间隔离散化并针对控制范围的各个时间间隔使用约束雅可比矩阵的近似表示的线性化,其中,所述求解步骤的迭代包括从存储器检索针对各个时间间隔确定的约束雅可比矩阵的近似和中间压缩矩阵;使用系统的离散化动力学和系统的离散化动力学的方向导数中的一个或组合的评估来分块更新约束雅可比矩阵的近似和中间压缩矩阵,其中,中间压缩矩阵和约束雅可比矩阵中的各个块表示控制范围中的一个时间间隔;使用所更新的约束雅可比矩阵的近似来求解非线性优化问题的近似;以及利用所更新的约束雅可比矩阵的近似和所更新的中间压缩矩阵来更新存储器;以及使用控制解来控制系统。
另一实施方式公开了一种具体实现有程序的非暂时性计算机可读存储介质,所述程序可由处理器执行以用于执行一种方法,该方法包括以下步骤:使用系统的操作的测量来估计系统的当前状态;在各个控制步迭代地求解约束非线性优化问题的近似以生成控制解,其中,该近似包括系统的非线性动力学的通过控制范围中的时间间隔离散化并针对控制范围的各个时间间隔使用约束雅可比矩阵的近似表示的线性化,其中,所述求解步骤的迭代包括检索针对控制范围中的各个时间间隔确定的约束雅可比矩阵的近似和中间压缩矩阵,使得中间压缩矩阵和约束雅可比矩阵的近似具有块双对角结构;使用系统的离散化动力学和系统的离散化动力学的方向导数中的一个或组合的评估来分块更新约束雅可比矩阵的近似和中间压缩矩阵,其中,中间压缩矩阵和约束雅可比矩阵中的各个块表示控制范围中的一个时间间隔;以及使用所更新的所述约束雅可比矩阵的近似来求解非线性优化问题的近似;以及使用控制解来控制系统。
附图说明
[图1]
图1是根据一些实施方式的控制器和反馈系统的框图。
[图2]
图2是根据本发明的一些实施方式的使用CPU处理器和存储器实现的控制器以及反馈系统的框图。
[图3A]
图3A是根据一些实施方式的实现控制器的非线性模型预测控制(MPC)方法的框图。
[图3B]
图3B是根据一些实施方式的基于离散时间系统动力学的显式公式化来求解最优控制结构非线性规划(NLP)的MPC方法的框图。
[图3C]
图3C是根据一些实施方式的基于离散时间系统动力学的隐式公式化来求解最优控制结构非线性规划(NLP)的MPC方法的框图。
[图4A]
图4A是经由使用连续局部近似在各个控制时间步求解约束NLP的迭代过程的框图。
[图4B]
图4B是对于时间范围的各个间隔,经由使用从一个迭代到下一迭代更新的雅可比矩阵近似在各个控制时间步求解约束NLP的迭代过程的框图。
[图4C]
图4C是对于时间范围的各个间隔,经由使用从一个迭代到下一迭代更新的雅可比和海森矩阵近似在各个时间步求解约束NLP的迭代过程的框图。
[图5A]
图5A是对于显式非线性微分方程系统基于显式积分方案的系统动力学的时间离散化、控制参数化和局部线性化的框图。
[图5B]
图5B是对于隐式非线性微分方程系统基于隐式积分方案的系统动力学的时间离散化、控制参数化和局部线性化的框图。
[图6A]
图6A是基于离散时间系统动力学的显式公式化经由局部二次规划(QP)近似的最优控制结构NLP的局部近似的框图。
[图6B]
图6B是基于离散时间系统动力学的隐式公式化经由局部二次规划(QP)近似的最优控制结构NLP的局部近似的框图。
[图6C]
图6C是基于离散时间系统动力学的隐式公式化在NLP的局部QP近似中数值消除中间变量的压缩过程的框图。
[图7A]
图7A是基于离散时间系统动力学的显式公式化经由连续局部QP近似和约束雅可比矩阵的块结构拟牛顿型更新方案来求解约束NLP的迭代过程的框图。
[图7B]
图7B是约束雅可比矩阵的块结构拟牛顿型秩一更新方案的示意图。
[图7C]
图7C是基于离散时间系统动力学的显式公式化经由连续局部QP近似和约束雅可比矩阵的块结构拟牛顿型更新方案的非线性MPC控制器的实时实现的伪代码。
[图8A]
图8A是基于离散时间系统动力学的隐式公式化经由连续局部QP近似以及中间压缩和约束雅可比矩阵的块结构拟牛顿型更新方案来求解约束NLP的迭代过程的框图。
[图8B]
图8B是中间压缩和约束雅可比矩阵的块结构拟牛顿型秩一更新方案的示意图。
[图8C]
图8C是基于离散时间系统动力学的隐式公式化经由连续局部QP近似以及中间压缩和约束雅可比矩阵的块结构拟牛顿型更新方案的非线性MPC控制器的实时实现的伪代码。
[图9A]
图9A是基于离散时间系统动力学的显式公式化在非线性MPC控制器中状态值和控制值以及约束雅可比矩阵的初始化过程的框图。
[图9B]
图9B是基于离散时间系统动力学的隐式公式化在非线性MPC控制器中状态值和控制值以及中间压缩和约束雅可比矩阵的初始化过程的框图。
[图10A]
图10A是在预测时间范围的各个间隔经由使用连续局部近似和更新的约束雅可比近似的数值压缩在各个控制时间步求解约束NLP的迭代过程的框图。
[图10B]
图10B是在预测时间范围的各个间隔经由使用连续局部近似以及更新的约束雅可比和海森近似的数值压缩在各个控制时间步求解约束NLP的迭代过程的框图。
[图11A]
图11A是给定对约束雅可比矩阵的秩一更新,压缩海森矩阵的对称秩二更新的框图。
[图11B]
图11B是给定对约束雅可比矩阵的秩一更新以及对海森矩阵的秩一更新,压缩海森矩阵的对称秩三更新的框图。
[图12]
图12是包括采用一些实施方式的原理的控制器的车辆的示意图。
[图13]
图13是根据一些实施方式的采用一些实施方式的原理的控制器与车辆1201的控制器之间的交互的示意图。
具体实施方式
本发明的一些实施方式提供一种用于控制系统的操作的系统和方法或使用预测控制器的系统。预测控制器的示例是基于受控系统的模型来确定控制输入的模型预测控制(MPC)。当使用受控系统的非线性模型确定控制输入时,此预测控制器基于非线性模型预测控制(NMPC)。
图1示出经由状态估计器130连接到控制系统(例如,预测控制器110)的示例系统120。在一些实现方式中,预测控制器是根据系统的动力学模型102规划的MPC控制器。模型可以是作为当前和先前输入111和先前输出103的函数表示系统120的状态和输出103随时间的改变的方程组。模型可包括表示系统的物理和操作限制的约束104。在操作期间,控制器接收指示系统的期望行为的命令101。该命令可以是例如运动命令。响应于接收到命令101,控制器生成用作系统的输入的控制信号111。响应于该输入,系统更新系统的输出103。基于系统103的输出的测量,估计器更新系统121的估计状态。系统121的该估计状态将状态反馈提供给预测控制器110。
如本文中提及的,系统120可以是通过特定控制信号111(输入)(可能与诸如电压、压力、力、转矩的物理量关联)控制并返回一些受控输出信号103(输出)(可能与诸如指示系统的状态从先前状态转变为当前状态的电流、流量、速度、位置的物理量关联)的任何机器或装置。输出值部分与系统的先前输出值关联,部分与先前和当前输入值关联。对先前输入和先前输出的依赖性被编码于系统的状态中。系统的操作(例如,系统的组件的运动)可包括在施加特定输入值之后由系统生成的输出值序列。
系统的模型102可包括作为当前和先前输入与先前输出的函数描述系统输出如何随时间改变的数学方程组。系统的状态是通常随时间变化的任何信息集合,例如当前和先前输入和输出的适当子集,其与系统的模型和未来输入一起可唯一地限定系统的未来运动。
该系统可服从于限制输出、输入以及还可能系统的状态被允许操作的范围的物理限制和规格约束104。
预测控制器110可被实现于硬件中或实现为在处理器(例如,微处理器)中执行的软件程序,其以固定或可变的控制时段采样间隔接收系统121的估计状态和期望的运动命令101并使用该信息确定用于操作系统的输入(例如,控制信号111)。
估计器130可被实现于硬件中或实现为在处理器(与控制器110相同或不同的处理器)中执行的软件程序,其以固定或可变的控制时段采样间隔接收系统103的输出并使用新的和先前的输出测量来确定系统120的估计状态121。
图2示出根据一些实施方式的预测控制器110的框图,其对系统进行致动,使得系统的估计状态121和输出103遵循命令101。控制器110包括例如连接到存储器202的单个中央处理单元(CPU)或多个CPU处理器201形式的计算机,存储器202用于存储模型102和对系统操作的约束104。
在一些实施方式中,处理器201连接到控制器203,该控制器203被配置为使用处理器201所确定的控制解来控制系统。例如,处理器201可实现控制器203的功能。例如,控制器203基于处理器201所确定的控制解来确定控制信号111,并将控制信号提交给系统120。例如,控制器203可将处理器所确定的控制解变换为与特定系统120的物理量(例如,电压、压力、力和转矩)关联的信号111。
图3A示出根据一些实施方式的给定系统121的当前状态和控制命令101,用于模型预测控制(MPC)以实现计算控制信号111的控制器110的系统和方法的框图。具体地,MPC通过在各个控制时间步求解不等式约束优化问题350来计算包含在系统360的预测时间范围内的未来最优控制输入序列的控制解(例如,解向量355)。该优化问题350中的目标函数、等式约束和不等式约束的数据345取决于动力学模型、系统约束340、系统121的当前状态和控制命令101。
通常,不等式约束优化问题350是最优控制结构非线性规划(NLP),其中目标函数、特定等式或不等式约束或这些目标函数和约束函数345的组合是非线性的和非凸的。例如,在一些实施方式中,MPC所使用的系统模型102是非线性动力学方程340的集合,使得预测控制器110基于非线性模型预测控制(NMPC)。
在一些实施方式中,该不等式约束优化问题350的解使用来自先前控制时间步310的预测时间范围内的状态值和控制值,其可读取自存储器。此概念被称为优化算法的热启动,并且在一些实施方式中可减少MPC控制器的所需计算工作量。以类似方式,对应解向量355可用于更新和存储下一控制时间步360的最优状态值和控制值的序列。
图3B示出非线性MPC控制器的框图,其基于离散时间系统动力学的显式公式化353通过在各个控制时间步求解最优控制结构非线性规划(NLP)350来给定系统121的当前状态和控制命令101计算控制信号111。系统的动力学模型公式化是显式的,因为特定时间点ti+1的状态值xi+1经由显式函数xi+1=Fi(xi,ui)由先前时间点ti的状态值xi和控制输入ui明确地定义。如进一步讨论的,在一些实施方式中,通过将显式积分方案的一个或多个步骤应用于连续时间微分方程组来获得离散时间系统动力学的该显式公式化353。
除了强加于系统353的非线性动力学的等式约束之外,还存在强制初始状态值x0等于系统
Figure GDA0003568380620000102
的当前状态估计121的初始值约束352以及强制任何附加系统约束(表示系统的物理和操作限制)的不等式约束354。最优控制问题的目标函数351可包括与预测时间范围的各个时间点对应的成本项。在一些实施方式中,目标函数包括系统的特定输出函数相对于预测时间范围的各个时间点的参考输出值序列的偏差的(非线性)最小二乘型惩罚。
图3C示出非线性MPC控制器的框图,其基于离散时间系统动力学的隐式公式化356-357通过在各个控制时间步求解最优控制结构非线性规划(NLP)350来给定系统121的当前状态和控制命令101计算控制信号111。系统的动力学模型公式化是隐含的,因为特定时间点ti+1的状态值xi+1由先前时间点ti的状态值xi、控制输入ui和附加中间变量Ki的集合357定义。这些中间变量Ki由非线性方程组0=Gi(xi,ui,Ki)356隐含地定义,即,这些方程相对于中间变量的雅可比
Figure GDA0003568380620000101
是通常必须非奇异的方阵。如进一步讨论的,在一些实施方式中,通过将隐式积分方案的一个或多个步骤应用于连续时间微分方程组来获得离散时间系统动力学的该隐式公式化356-357。
图4A示出经由使用连续局部近似406在各个控制时间步求解约束的最优控制结构非线性规划(NLP)350的迭代过程的框图。NLP 401的解猜测用于构造该局部近似并且其解用于更新预测时间范围415内的当前状态值和控制值序列,从而在算法过程的每次迭代得到对约束NLP 401的当前解猜测的更新。来自先前控制时间步310的状态值和控制值可用于形成约束NLP 401的初始解猜测。
基于非线性目标函数和约束函数345并使用当前解猜测作为线性化点401,在算法过程的每次迭代构造对NLP 406的局部近似。为此,需要计算或近似约束雅可比矩阵以便形成复杂非线性动力学的离散化系统402的线性化。在局部近似的解形成NLP407的足够精确的解的情况下,则获得最优控制解355。相反,当达到最大迭代次数407时,获得略微次优和/或不可行解355。在还未找到具有足够精度的NLP的解并且还未达到最大迭代次数407的情况下,则使用局部近似406的解来更新在预测时间范围415内的状态值和控制值的当前值以及NLP 401的当前解猜测。
可经由使用连续局部近似406在各个控制时间步使用不同类型的优化算法来求解不等式约束的最优控制结构非线性规划(NLP)350。一些实施方式基于序列二次规划(SQP),其中在每次迭代构造并求解二次规划(QP)作为对原始NLP的局部近似。相反,一些实施方式基于内部点(IP)方法,其中各个局部近似是与不等式约束对应的互补条件被大致平滑的NLP的最优性一阶必要条件的线性化。在一些实施方式中,使用屏障函数来迭代地强制不等式约束,并且每次迭代构造并求解对屏障重新公式化问题的局部近似。
当在每次迭代406构造和求解局部子问题时,上述各个优化方法可针对约束雅可比和海森矩阵使用不同的牛顿型近似技术。一些实施方式基于通过计算精确约束雅可比矩阵对一些或所有约束函数的精确线性化。一些实施方式相反使用拟牛顿型更新公式以经由低秩更新技术迭代地更新对约束雅可比矩阵的近似。类似地,对于NLP的拉格朗日海森矩阵,也可使用不同的牛顿型近似技术。一些实施方式基于当构造对NLP的各个局部近似时对拉格朗日的精确海森矩阵的评估。一些实施方式相反使用拟牛顿型更新公式以经由对称低秩更新技术迭代地更新对海森矩阵的近似。在NLP的目标函数包括(非线性)最小二乘型成本项的情况下,一些实施方式相反基于高斯-牛顿型海森近似。
图4B示出经由使用连续局部近似406在各个控制时间步求解约束的最优控制结构非线性规划(NLP)350的迭代过程的框图。具体地,基于非线性目标函数和约束函数的局部线性化来构造对NLP的近似。需要线性化点,其包括基于局部近似问题415的解更新的预测时间范围401内的状态值和控制值。另外,基于局部近似问题415的解在每次迭代421中构造和更新预测时间范围的各个间隔的约束雅可比矩阵的近似。
在非线性MPC控制器的一些实施方式中,基于离散时间系统动力学的隐式公式化356-357在各个控制时间步350求解最优控制结构NLP。非线性方程系统0=Gi(xi,ui,Ki)356隐含地定义中间变量Ki的集合。在一些实施方式中,使用压缩过程来从NLP的各个局部近似数值消除那些附加中间变量,从而得到中间压缩矩阵以便在压缩近似问题公式化405中计算预测时间范围的各个间隔的对应约束雅可比矩阵。随后,使用展开过程来从压缩近似406的解计算数值消除的中间变量的值。迭代优化算法可直接更新这些中间压缩矩阵420的各个近似,从而得到对近似约束雅可比矩阵421的更新。可针对预测范围的各个时间间隔独立地执行对中间压缩矩阵420和约束雅可比矩阵421二者的近似的构造和/或更新。
在非线性MPC控制器的一些实施方式中,基于离散时间系统动力学的显式公式化353在各个控制时间步350求解最优控制结构NLP。在这种情况下,可直接更新约束雅可比矩阵421,而无需中间压缩矩阵的构造或更新,因为在离散时间系统动力学的显式公式化353的情况下,不存在由非线性方程系统隐含地定义的中间变量。
图4C示出针对各个时间间隔420基于中间压缩矩阵的构造和更新使用约束雅可比近似421的更新公式经由使用连续局部近似406在各个控制时间步求解约束的最优控制结构非线性规划(NLP)350的迭代过程的框图。另外,一些实施方式从优化过程的一个迭代到下一迭代构造和更新海森块矩阵425的近似。也可针对预测范围425的各个时间间隔独立地执行对这些海森近似的构造和/或更新。
图5A示出作为在各个控制时间步350求解的最优控制结构NLP的一部分获得离散时间系统动力学的显式公式化353的框图。系统的动力学模型公式化是显式的,因为特定时间点ti+1的状态值经由显式函数xi+1=Fi(xi,ui)506由先前时间点ti的状态值501和控制输入502明确地定义。在一些实施方式中,系统的动态模型最初由连续时间微分方程系统503给出,其经由初始值问题500的解描述在特定时间间隔[ti,ti+1]内的系统状态。作为该初始值问题的公式化的一部分,需要提供时间点ti的初始状态值507以及完整时间间隔[ti,ti+1]内的控制输入508。为此,需要使用在各个控制时间步350求解的最优控制结构NLP中直接使用的有限维表示将预测时间范围内的控制输入序列参数化。在一些实施方式中,使用分段常数控制参数化,其中在各个时间间隔内控制输入独立地是常数值,即,对于t∈[ti,ti+1]508,
Figure GDA0003568380620000121
一些其它实施方式使用更高阶控制参数化,例如基于预测时间范围内的分段多项式或样条表示。
在一些实施方式中,通过应用显式积分方案505的一个或多个步骤以求解由连续时间微分方程组
Figure GDA0003568380620000131
503定义的初始值问题500来获得离散时间系统动力学的显式公式化506。这些显式积分方案的示例是Adams-Bashforth方法和显式Runge-Kutta方法族。然后,求解所得约束NLP的迭代过程针对预测时间范围的各个间隔基于约束雅可比矩阵512的近似来构造这些离散化系统动力学510的局部线性化,并且求解NLP 406的所得局部近似。在一些实施方式中,基于序列二次规划,预测时间范围的各个间隔的线性化离散时间系统动力学511是在优化算法406的每次迭代中求解的二次规划(QP)近似中的等式约束的一部分。在其它实施方式中,基于内部点技术,预测时间范围的各个间隔的线性化离散时间系统动力学511是在每次迭代406中求解的线性化最优性条件系统的一部分。
图5B示出作为在各个控制时间步350求解的最优控制结构NLP的一部分获得离散时间系统动力学的隐式公式化356-357的框图。系统的动力学模型公式化是隐式的,因为特定时间点ti+1的状态值由先前时间点ti的状态值501、控制输入502以及这些状态值和控制值516隐含地定义的附加中间变量集合524定义。这些中间变量Ki由非线性方程组0=Gi(xi,ui,Ki)517隐含地定义,即,这些方程相对于中间变量的雅可比
Figure GDA0003568380620000132
是必须非奇异的方阵。在一些实施方式中,系统的动态模型最初由连续时间微分方程系统504给出,其给定该间隔508内的初始状态值507和控制输入经由初始值问题500的解描述在特定时间间隔[ti,ti+1]内的系统状态。
在一些实施方式中,通过应用隐式积分方案515的一个或多个步骤以求解由连续时间微分方程组
Figure GDA0003568380620000133
504定义的初始值问题500来获得离散时间系统动力学的该隐式公式化516-517。在一些实施方式中,该微分方程系统504隐含地定义微分状态导数和/或其基于附加隐式代数方程定义代数变量。隐式积分方案的示例包括Adams-Moulton方法、向后微分公式和隐式Runge-Kutta方法族。
然后,求解所得约束NLP的迭代过程针对预测时间范围的各个间隔基于连续性方程521和定义中间变量的非线性方程522的局部线性化来构造这些离散化系统动力学520的局部线性化,并且求解NLP 406的所得局部近似。该线性化从包括状态值501、控制输入502以及中间变量524的当前值的线性化点开始。给定隐含地定义中间变量517的非线性方程,局部线性化可基于用于该非线性方程系统523的约束雅可比矩阵的近似。
在一些实施方式中,预测时间范围的各个间隔的线性连续性方程521和隐含地定义中间变量的线性化方程系统522二者是在优化算法406的每次迭代中求解的近似的一部分。在一些实施方式中,基于约束雅可比的可逆性及其近似
Figure GDA0003568380620000141
523从线性化方程系统数值消除中间变量,从而得到形式与系统动力学511的显式公式化的线性化相同的线性化离散时间系统动力学的压缩公式化。
图6A示出根据一些实施方式的基于序列二次规划在离散时间系统动力学的显式公式化353的情况下形成最优控制结构NLP 600的局部近似605的二次规划(QP)的框图。QP子问题中的线性等式约束603对应于基于约束雅可比矩阵512的近似的线性化离散时间系统动力学511。最优控制结构QP中的初始值条件602等效于NLP中的对应等式约束352。另外,原始NLP公式化中的不等式约束354需要局部线性化604,为此可将雅可比矩阵的精确线性化或近似用于这些不等式约束。
最优控制结构QP 605中的二次目标601局部近似非线性目标351。如前所述,海森矩阵Hi可基于拉格朗日的海森的精确评估,或者使用拟牛顿型更新公式或预测时间范围的各个间隔的高斯-牛顿海森近似。对于QP子问题605,与约束评估ai和梯度评估hi对应的向量均需要精确,以形成对NLP 600的局部近似。在一些实施方式中,梯度向量hi对应于相对于状态变量和控制变量的NLP的拉格朗日梯度评估。在一些其它实施方式中,梯度向量hi对应于相对于状态变量和控制变量的NLP目标函数351的梯度的评估,包括取决于NLP的局部QP近似中的等式和/或不等式约束的约束雅可比矩阵的近似质量的梯度校正。
图6B示出根据一些实施方式的基于序列二次规划在离散时间系统动力学的隐式公式化356-357的情况下形成最优控制结构NLP 600的局部近似610的二次规划(QP)的框图。由于给定中间变量的值,下一时间点和先前时间点的状态值之间的线性关系,QP近似中的线性连续性条件613等效于NLP中的对应等式约束357。QP子问题中的线性等式约束612对应于基于约束雅可比矩阵523的近似的线性化方程系统522,并且其形成NLP中的非线性方程系统356的局部线性化。最优控制结构QP 610的二次目标611中的梯度向量
Figure GDA0003568380620000142
还取决于用于构造局部QP近似的线性化点中的中间变量的值。与之前类似,该梯度向量可对应于NLP拉格朗日或NLP目标的梯度的评估,包括取决于NLP 600的局部QP近似610中的等式和/或不等式约束的约束雅可比矩阵的近似质量的梯度校正。
图6C示出给定最优控制结构NLP的局部QP近似610基于离散时间系统动力学的隐式公式化来构造压缩QP公式化615的压缩过程的框图。压缩过程基于约束雅可比的可逆性及其近似
Figure GDA0003568380620000151
523从QP近似中的线性化方程系统612数值消除中间变量。在一些实施方式中,针对预测范围的各个时间间隔,该数值压缩过程可独立地执行,因此并行执行。该过程的结果包括形式与系统动力学603的显式公式化的线性化相同的线性化离散时间系统动力学617的压缩公式化,以及局部QP近似615的新公式化中的压缩目标函数616。如进一步讨论的,可基于适当展开过程并且给定NLP 600的压缩QP近似615的最优解来获得数值消除的中间变量以及与原始QP公式化中的线性化约束612对应的拉格朗日乘子。
图7A示出使用约束雅可比块矩阵700的近似的更新公式经由使用连续局部近似406在各个控制时间步求解约束的最优控制结构非线性规划(NLP)350的迭代过程的框图。一些实施方式基于序列二次规划(SQP),并且其在离散时间系统动力学的显式公式化353的情况下将形成最优控制结构NLP 600的局部近似605的二次规划(QP)公式化并求解。QP子问题中的线性等式约束603对应于基于约束雅可比矩阵512的近似的线性化离散时间系统动力学511。
一些实施方式基于这样的认识:可针对预测时间范围中的各个间隔独立地执行对约束雅可比块矩阵700的更新。在本发明的一些实施方式中,更新对应于分块拟牛顿型更新公式703,其中分别对各个块矩阵的更新为秩一。分块拟牛顿型更新公式703的一个示例基于Broyden方法、使用好或坏Broyden方法或该类拟牛顿方法的任何其它变体,具有系统的离散化动力学的至少一个评估。另一示例基于双侧秩一(TR1)更新公式的分块变体,具有系统的离散化动力学的至少一个评估和系统的离散化动力学的伴随方向导数的至少一个评估,并且其中使用双侧秩一(TR1)更新方案来更新各个约束雅可比块矩阵。一些实施方式基于精确地满足直接正割条件并近似地满足伴随正割条件的TR1更新公式的前向变体。其它实施方式基于精确地满足伴随正割条件并近似地满足直接正割条件的TR1更新公式的伴随变体。并且一些其它实施方式根据特定启发式规则分别针对与预测时间范围中的特定间隔对应的各个块矩阵在前向或伴随更新公式之间进行决定。
图7B示出基于使用秩一更新公式703分别更新各个块矩阵的分块拟牛顿型方法的块结构约束雅可比矩阵700的拟牛顿型更新方案的示意图。块结构约束雅可比矩阵中的各个块矩阵对应于最优控制结构NLP的局部QP近似中的特定线性等式约束603。块对角线上的块矩阵对应于线性等式约束603中的矩阵Ai,并且与预测范围701的后续时间间隔的状态变量之间的线性耦合对应的约束雅可比矩阵的上块对角线上的各个块矩阵等于减去单位矩阵702。
图7C示出经由连续局部QP近似605和用于约束雅可比矩阵700的块结构拟牛顿型更新方案703基于离散时间系统动力学的显式公式化的非线性MPC控制器110的实时实现的伪代码。算法的输入包括原始状态变量和控制变量的当前值、对偶拉格朗日乘子以及预测时间范围的各个间隔711的约束雅可比块矩阵的当前近似。类似地,算法最终输出这些变量713中的每一个的更新的值。在从系统121获得新的状态估计
Figure GDA0003568380620000163
之后,可求解406局部QP近似605,使得可更新712原始和对偶变量,并且新的控制输入值可应用于系统111,然后是用于约束雅可比块矩阵703的分块拟牛顿型更新公式。在本发明的一些实施方式中,各个块矩阵的更新基于双侧秩一(TR1)公式,从而使用基于块TR1的雅可比更新710实时迭代实现非线性MPC。
图8A示出使用中间压缩矩阵805的近似的更新公式经由使用连续局部近似406在各个控制时间步求解约束的最优控制结构非线性规划(NLP)350,从而导致约束雅可比块矩阵800的近似的更新的迭代过程的框图。一些实施方式基于给定最优控制结构NLP的局部QP近似610基于离散时间系统动力学的隐式公式化来构造压缩QP公式化615的压缩过程。此过程的结果包括形式与系统动力学603的显式公式化的线性化相同的线性化离散时间系统动力学617的压缩公式化,以及局部QP近似615的新公式化中的压缩目标函数616。
一些实施方式基于这样的认识:可针对预测时间范围中的各个间隔独立地执行对中间压缩矩阵806-807的更新、从离散时间系统动力学617的隐式公式化的线性化方程数值消除中间变量的压缩过程以及对约束雅可比块矩阵803的所得更新。对隐含地定义中间变量523的方程的约束雅可比矩阵的近似的更新对应于分块拟牛顿型更新公式806,其中分别对各个块矩阵的更新可为秩一。这种拟牛顿型更新方案的示例包括Broyden方法的不同变体和双侧秩一(TR1)更新公式的不同变体。在本发明的一些实施方式中,根据用于约束雅可比矩阵的拟牛顿型更新公式并且使用可用于计算矩阵的秩一更新的逆的Sherman-Morrison公式,雅可比矩阵近似的逆
Figure GDA0003568380620000161
Figure GDA0003568380620000162
可被另外存储并作为中间压缩矩阵的一部分从一个迭代到下一迭代807更新。一些实施方式基于这样的认识:可基于中间压缩矩阵806-807的分块秩一更新公式使用分块秩一更新公式803直接更新压缩雅可比块矩阵。
图8B示出基于使用秩一更新公式803分别更新各个块矩阵的分块拟牛顿型方法的块结构约束雅可比矩阵800的拟牛顿型更新方案。块结构约束雅可比矩阵中的各个块矩阵对应于最优控制结构NLP 615的局部QP近似中的特定线性等式约束617。块对角线上的块矩阵对应于压缩雅可比矩阵[I,O]-BiEi,其中在压缩线性等式约束617中
Figure GDA0003568380620000171
并且与预测范围701的后续时间间隔的状态变量之间的线性耦合对应的约束雅可比矩阵的上块对角线上的各个块矩阵等于减去单位矩阵702。
图8C示出经由连续局部QP近似615以及用于约束雅可比矩阵800的块结构拟牛顿型更新方案805基于离散时间系统动力学的隐式公式化的非线性MPC控制器110的实时实现的伪代码。算法的输入包括原始状态、控制变量和中间变量的当前值、对偶拉格朗日乘子以及预测时间范围的各个间隔811的中间压缩矩阵和约束雅可比块矩阵的当前近似。类似地,算法最终输出这些变量813中的每一个的更新的值。在从系统121获得新的状态估计
Figure GDA0003568380620000172
之后,可求解406局部QP近似615,使得可更新712原始和对偶变量,并且新的控制输入值可应用于系统111,然后是用于中间压缩和约束雅可比块矩阵805的分块拟牛顿型更新公式。在本发明的一些实施方式中,各个块矩阵的更新基于双侧秩一(TR1)公式,并且离散时间系统动力学的隐式公式化基于直接配点,从而导致利用基于块TR1的雅可比更新810使用提升直接配点实时迭代实现非线性MPC。
可基于适当展开过程并给定压缩QP近似615的最优解406来获得数值消除的中间变量808以及与原始QP公式化中的线性化约束612对应的拉格朗日乘子809。在本发明的一些实施方式中,此算法(图8C中描绘了其伪代码)中的计算操作可被限制为基于中间压缩矩阵的矩阵向量乘法和伴随导数评估。在一些实施方式中,可基于算法微分(AD)的前向或后向模式来执行拉格朗日乘子809的展开步骤的方向导数评估。这些实施方式基于分块秩一更新公式来执行隐含定义的中间变量的数值消除或压缩,而没有任何迭代求解过程,也没有任何矩阵-矩阵乘法或矩阵因式分解。相反,这些实施方式仅需要矩阵向量运算以及非线性方程的一个评估和伴随方向导数的一个评估。
图9A示出利用如图7所示的离散时间系统动力学的显式公式化的分块拟牛顿型更新公式基于迭代求解过程在非线性MPC控制器中的状态值和控制值和约束雅可比矩阵的初始化过程的框图。可从存储器900读取来自先前控制时间步的解值以便提供修改的值910作为迭代求解过程711的初始解猜测。在本发明的一些实施方式中,来自先前控制时间步900的解值序列可直接用作迭代求解过程711的初始解猜测。在一些其它实施方式中,首先基于最终状态906、控制值907和约束雅可比块矩阵908的特定值将从存储器900读取的解值序列在预测范围中向前移位一个时间步905。这些最终状态、控制值和约束雅可比值可对应于在基于非线性MPC控制器执行系统之前离线计算的一些固定值,或者它们可从所存储的先前控制时间步900中的解计算。
图9B示出利用如图8所示的离散时间系统动力学的隐式公式化的分块拟牛顿型更新公式基于迭代求解过程在非线性MPC控制器中的状态值和控制值以及中间压缩和约束雅可比矩阵的初始化过程的框图。可从存储器900读取来自先前控制时间步的解值以便提供修改的值930作为迭代求解过程811的初始解猜测。在本发明的一些实施方式中,来自先前控制时间步920的解值序列可直接用作迭代求解过程811的初始解猜测。在一些其它实施方式中,首先基于最终状态906、控制值907、最终压缩块矩阵926和最终约束雅可比块矩阵927的值将从存储器920读取的解值序列在预测范围中向前移位一个时间步925。这些最终状态、控制值、中间压缩值和约束雅可比值可对应于在基于非线性MPC控制器执行系统之前离线计算的一些固定值,或者它们可从所存储的先前控制时间步920中的解计算。
图10A示出经由使用连续局部近似以及数值消除NLP 1000的局部近似中由线性化等式约束定义的一些或所有变量的压缩过程在各个控制时间步求解约束NLP的迭代过程的框图。压缩过程的一个示例是基于离散时间系统动力学的隐式公式化针对预测时间范围的各个间隔从隐含地定义这些中间变量522的线性化方程系统数值消除中间变量,这导致给定最优控制结构NLP的局部QP近似610的压缩QP公式化615。在本发明的一些实施方式中,最优控制结构NLP的目标和/或约束函数取决于被数值消除的变量,使得需要计算剩余等式和/或不等式约束的压缩海森矩阵和/或压缩雅可比矩阵以便构造局部近似问题1005。
一些实施方式基于压缩海森矩阵的逆的因式分解或计算,以便在各个控制时间步高效地求解非线性OCP的局部近似。一些实施方式基于这样的认识:给定对约束雅可比矩阵421的近似的低秩更新,可基于从一个迭代到下一迭代1005的低秩更新计算该矩阵因式分解或逆矩阵。要注意的是,在更新的块矩阵的数量相对小的情况下,对约束雅可比矩阵的分块秩一更新是低秩的。一些其它实施方式基于完整约束雅可比矩阵(在完整预测时间范围内的全局状态和控制参数化的情况下,通常是稠密矩阵)的近似的低秩更新。后者的一个示例包括在各个控制时间步使用伪谱方法来求解最优控制问题(例如,使用高斯求积规则基于全局多项式表示)。具体地,一些实施方式使用秩二对称更新公式基于对约束雅可比矩阵421的秩一更新来更新压缩海森矩阵1005及其因式分解或逆矩阵。
图10B示出经由使用连续局部近似和数值压缩过程1000在各个控制时间步求解约束NLP的迭代过程的框图,其中对海森块矩阵1010的近似的低秩更新与对约束雅可比矩阵421的近似的低秩更新组合用于预测范围的各个时间间隔。具体地,一些实施方式使用秩三对称更新公式基于对约束雅可比矩阵421的秩一更新以及用于海森近似矩阵1010的拟牛顿型秩一更新公式来更新压缩海森矩阵1015的因式分解或逆矩阵。海森近似的拟牛顿型更新公式的示例包括Broyden–Fletcher–Goldfarb–Shanno(BFGS)方法或对称秩一(SR1)更新公式。
图11A示出根据本发明的一些实施方式的给定对约束雅可比矩阵1100的秩一更新,计算压缩海森矩阵1105的对称秩二更新公式的框图。基于压缩海森矩阵1105的该对称秩二更新,一些实施方式另外计算压缩海森矩阵的因式分解的秩二更新。这种矩阵因式分解(针对其存在低秩因式分解更新技术)的示例包括Cholesky分解、LDL分解、QR分解或LU分解。基于压缩海森矩阵1105的对称秩二更新,一些实施方式使用Sherman-Morrison公式来另外计算压缩海森矩阵的逆的对称秩二更新。
图11B示出根据本发明的一些实施方式的给定约束雅可比矩阵1100的秩一更新并且给定对称海森矩阵近似1110的秩一更新,计算压缩海森矩阵1115的对称秩三更新公式的框图。基于压缩海森矩阵1115的该对称秩三更新,一些实施方式另外计算压缩海森矩阵的因式分解或逆的秩三更新。
图12示出包括采用本发明的一些实施方式的原理的预测控制器1202的车辆1201的示意图。如本文所使用的,车辆1201可以是任何类型的轮式车辆,例如客车、公共汽车或越野车。另外,车辆1201可以是自主或半自主车辆。例如,一些实施方式控制车辆1201的运动。运动的示例包括通过车辆1201的转向系统1203控制的车辆的横向运动。在一个实施方式中,转向系统1203由控制器1202控制。另外地或另选地,转向系统1203可由车辆1201的驾驶员控制。
车辆还可包括发动机1206,其可由控制器1202或由车辆1201的其它组件控制。车辆还可包括一个或更多个传感器1204以感测周围环境。传感器1204的示例包括测距仪、雷达、激光雷达和相机。车辆1201还可包括一个或更多个传感器1205以感测其当前运动量和内部状态。传感器1205的示例包括全球定位系统(GPS)、加速度计、惯性测量单元、陀螺仪、轴旋转传感器、转矩传感器、偏转传感器、压力传感器和流量传感器。传感器向控制器1202提供信息。车辆可配备有收发器1206,其实现控制器1202通过有线或无线通信信道的通信能力。
图13示出根据一些实施方式的预测控制器1202与车辆1201的控制器1300之间的交互的示意图。例如,在一些实施方式中,车辆1201的控制器1300是控制车辆1300的旋转和加速的转向1310和制动器/油门控制器1320。在这种情况下,预测控制器1202将控制输入输出到控制器1310和1320以控制车辆的状态。控制器1300还可包括进一步处理预测控制器1202的控制输入的高级控制器,例如车道保持辅助控制器1330。在两种情况下,控制器1300映射使用预测控制器1202的输出以控制车辆的至少一个制动器(例如,车辆的方向盘和/或制动器),以便控制车辆的运动。
本发明的上述实施方式可按众多方式中的任一种实现。例如,实施方式可使用硬件、软件或其组合来实现。当以软件实现时,软件代码可在任何合适的处理器或处理器集合(无论设置在单个计算机中还是分布于多个计算机)上执行。这些处理器可被实现为集成电路,在集成电路组件中具有一个或更多个处理器。然而,处理器可使用任何合适格式的电路来实现。
另外,本文所概述的各种方法或处理可被编码为可在采用各种操作系统或平台中的任一种的一个或更多个处理器上执行的软件。另外,这种软件可使用许多合适的编程语言和/或编程或脚本工具中的任一种来编写,并且还可被编译为可执行机器语言代码或在框架或虚拟机上执行的中间代码。通常,在各种实施方式中,程序模块的功能可根据需要组合或分布。
另外,本发明的实施方式可被具体实现为一种方法,已提供其示例。作为该方法的一部分执行的动作可按照任何合适的方式排序。因此,可构造以与所示不同的次序执行动作的实施方式,其可包括同时执行一些动作,尽管在例示性实施方式中作为顺序动作示出。

Claims (15)

1.一种用于控制系统的操作的控制系统,所述系统具有受制于包括对所述系统的状态变量和控制变量的等式约束和不等式约束的约束的连续时间非线性动力学,所述控制系统包括:
估计器,该估计器使用所述系统的所述操作的测量来估计所述系统的当前状态;
存储器,该存储器存储针对控制范围中的各个时间间隔确定的约束雅可比矩阵的近似和中间压缩矩阵,使得所述中间压缩矩阵和所述约束雅可比矩阵的所述近似具有块双对角结构;
处理器,该处理器在各个控制步迭代地求解约束非线性优化问题的近似以生成控制解,其中,所述近似包括所述系统的所述非线性动力学的通过所述控制范围中的时间间隔离散化并针对所述控制范围的各个时间间隔使用所述约束雅可比矩阵的所述近似表示的线性化,其中,在各个控制步,所述处理器被配置为:
从所述存储器检索针对各个时间间隔确定的所述约束雅可比矩阵的所述近似和所述中间压缩矩阵;
使用所述系统的离散化动力学和所述系统的所述离散化动力学的方向导数中的一个或组合的评估来分块更新所述约束雅可比矩阵的所述近似和所述中间压缩矩阵,其中,所述中间压缩矩阵和所述约束雅可比矩阵中的各个块表示所述控制范围中的一个时间间隔;
使用所更新的所述约束雅可比矩阵的近似来求解所述非线性优化问题的所述近似;并且
使用所更新的所述约束雅可比矩阵的近似和所更新的中间压缩矩阵来更新所述存储器;以及
控制器,该控制器使用所述控制解来控制所述系统。
2.根据权利要求1所述的控制系统,其中,所述非线性优化问题的所述近似包括取决于所述约束雅可比近似与所述系统的所述离散化动力学的精确约束雅可比矩阵之间的差异的梯度校正。
3.根据权利要求2所述的控制系统,其中,所述非线性优化问题的所述近似是二次规划QP。
4.根据权利要求1所述的控制系统,其中,所述约束雅可比矩阵的近似和所述中间压缩矩阵的所述分块更新是分块秩一更新,并且其中,所述秩一更新由所述系统的所述离散化动力学的评估和所述系统的所述离散化动力学的方向导数的至少一个评估中的一个或组合定义。
5.根据权利要求1所述的控制系统,其中,所述系统的所述离散化动力学基于显式积分以将连续时间非线性微分方程组离散化,并且其中,所述约束雅可比矩阵的所述近似是在所述控制范围的各个时间间隔中应用于所述连续时间非线性动力学的显式积分的雅可比近似。
6.根据权利要求1所述的控制系统,其中,所述系统的所述离散化动力学基于在所述控制范围的各个时间间隔中应用于所述连续时间非线性动力学的隐式积分,其中,所述压缩矩阵是包括由所述连续时间非线性动力学的隐式非线性方程系统定义的中间变量的方程的雅可比的函数,并且其中,所述约束雅可比矩阵的所述近似表示所述控制范围的各个时间间隔的所述离散化动力学与所述隐式非线性方程系统的组合系统。
7.根据权利要求6所述的控制系统,其中,所述处理器利用所述约束雅可比近似的分块秩一更新来从所述非线性优化问题的所述近似数值上消除所述中间变量,以形成所述非线性优化问题的压缩近似。
8.根据权利要求1所述的控制系统,其中,所述分块更新是秩一更新,具有所述系统的所述离散化动力学的至少一个评估。
9.根据权利要求1所述的控制系统,其中,所述分块更新是双侧秩一更新,具有所述系统的所述离散化动力学的至少一个评估和所述系统的所述离散化动力学的伴随方向导数的至少一个评估。
10.根据权利要求1所述的控制系统,其中,所述处理器响应于所述中间压缩矩阵和所述约束雅可比矩阵的所述近似的分块更新而计算所述非线性优化问题的所述近似的压缩海森的因式分解的低秩更新。
11.根据权利要求1所述的控制系统,其中,所述处理器响应于所述中间压缩矩阵和所述约束雅可比矩阵的所述近似的分块更新而计算所述非线性优化问题的所述近似的压缩海森的因式分解的对称秩二更新。
12.根据权利要求1所述的控制系统,其中,所述处理器响应于所述中间压缩矩阵和所述约束雅可比矩阵的所述近似的分块更新并且响应于海森矩阵的近似的秩一更新而计算所述非线性优化问题的所述近似的压缩海森的因式分解的对称秩三更新。
13.根据权利要求1所述的控制系统,其中,所述系统是车辆,并且其中,所述控制器基于所述控制解来确定所述车辆的输入,其中,所述车辆的所述输入包括所述车辆的加速度、所述车辆的马达的转矩和转向角中的一个或组合。
14.一种用于控制系统的操作的方法,所述系统具有受制于包括对所述系统的状态变量和控制变量的等式约束和不等式约束的约束的连续时间非线性动力学,其中,所述方法使用联接到存储器的处理器,该存储器存储针对控制范围中的各个时间间隔确定的约束雅可比矩阵的近似和中间压缩矩阵,使得所述中间压缩矩阵和所述约束雅可比矩阵的所述近似具有块双对角结构,其中,所述处理器与所存储的实现所述方法的指令联接,其中,所述指令在由所述处理器执行时执行所述方法的至少一些步骤,包括:
使用所述系统的所述操作的测量来估计所述系统的当前状态;
在各个控制步迭代地求解约束非线性优化问题的近似以生成控制解,其中,所述近似包括所述系统的所述非线性动力学的通过所述控制范围中的时间间隔离散化并针对所述控制范围的各个时间间隔使用所述约束雅可比矩阵的所述近似表示的线性化,其中,求解步骤的迭代包括:
从所述存储器检索针对各个时间间隔确定的所述约束雅可比矩阵的所述近似和所述中间压缩矩阵;
使用所述系统的离散化动力学和所述系统的所述离散化动力学的方向导数中的一个或组合的评估来分块更新所述约束雅可比矩阵的所述近似和所述中间压缩矩阵,其中,所述中间压缩矩阵和所述约束雅可比矩阵中的各个块表示所述控制范围中的一个时间间隔;
使用所更新的所述约束雅可比矩阵的近似来求解所述非线性优化问题的所述近似;以及
使用所更新的所述约束雅可比矩阵的近似和所更新的中间压缩矩阵来更新所述存储器;以及
使用所述控制解来控制所述系统。
15.一种具体实现有程序的非暂时性计算机可读存储介质,所述程序能够由处理器执行以用于执行一种方法,该方法包括:
使用系统的操作的测量来估计所述系统的当前状态;
在各个控制步迭代地求解约束非线性优化问题的近似以生成控制解,其中,所述近似包括所述系统的非线性动力学的通过控制范围中的时间间隔离散化并针对所述控制范围的各个时间间隔使用约束雅可比矩阵的近似表示的线性化,其中,求解步骤的迭代包括:
检索针对控制范围中的各个时间间隔确定的约束雅可比矩阵的近似和中间压缩矩阵,使得所述中间压缩矩阵和所述约束雅可比矩阵的所述近似具有块双对角结构;
使用所述系统的离散化动力学和所述系统的所述离散化动力学的方向导数中的一个或组合的评估来分块更新所述约束雅可比矩阵的所述近似和所述中间压缩矩阵,其中,所述中间压缩矩阵和所述约束雅可比矩阵中的各个块表示所述控制范围中的一个时间间隔;以及
使用所更新的所述约束雅可比矩阵的近似来求解所述非线性优化问题的所述近似;以及
使用所述控制解来控制所述系统。
CN201880088832.XA 2018-02-13 2018-08-20 用于控制系统的操作的控制系统和方法及存储介质 Active CN111699443B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/895,393 2018-02-13
US15/895,393 US10409233B2 (en) 2018-02-13 2018-02-13 Method with quasi-Newton Jacobian updates for nonlinear predictive control
PCT/JP2018/031462 WO2019159398A1 (en) 2018-02-13 2018-08-20 Control system and method for controlling operation of system

Publications (2)

Publication Number Publication Date
CN111699443A CN111699443A (zh) 2020-09-22
CN111699443B true CN111699443B (zh) 2022-05-31

Family

ID=63638245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880088832.XA Active CN111699443B (zh) 2018-02-13 2018-08-20 用于控制系统的操作的控制系统和方法及存储介质

Country Status (5)

Country Link
US (1) US10409233B2 (zh)
EP (1) EP3752889B1 (zh)
JP (1) JP6972342B2 (zh)
CN (1) CN111699443B (zh)
WO (1) WO2019159398A1 (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11853384B2 (en) * 2014-09-22 2023-12-26 Sureshchandra B. Patel Methods of patel loadflow computation for electrical power system
US10795330B2 (en) * 2018-07-30 2020-10-06 Mitsubishi Electric Research Laboratories, Inc. Symmetry alternating direction method of multipliers
WO2020096560A1 (en) * 2018-11-05 2020-05-14 General Electric Company Power system measurement based model calibration with enhanced optimization
JP7051771B2 (ja) * 2019-09-09 2022-04-11 株式会社東芝 計算装置、計算方法およびプログラム
JP7040505B2 (ja) * 2019-09-17 2022-03-23 株式会社豊田中央研究所 演算装置、演算システム、演算方法、およびコンピュータプログラム
CN111037550B (zh) * 2019-12-03 2023-02-10 华南理工大学 一种冗余度机械臂运动控制的解决方法
US11753023B2 (en) * 2020-01-19 2023-09-12 Mitsubishi Electric Research Laboratories, Inc. Adaptive control of autonomous or semi-autonomous vehicle
US11327449B2 (en) * 2020-05-29 2022-05-10 Mitsubishi Electric Research Laboratories, Inc. Nonlinear optimization for stochastic predictive vehicle control
CN111859640A (zh) * 2020-07-06 2020-10-30 上海交通大学 基于小波picard迭代法的弦振动位移预测方法及系统
CN111753255B (zh) * 2020-07-30 2024-03-15 中国南方电网有限责任公司 一种优化电网运行约束计算的线性化技术
US11790033B2 (en) 2020-09-16 2023-10-17 International Business Machines Corporation Accelerated Quasi-Newton methods on analog crossbar hardware
CN112363429A (zh) * 2020-11-04 2021-02-12 北方工业大学 一种大型车辆的远程智能一键破窗控制方法
CN112671286A (zh) * 2020-11-30 2021-04-16 潍柴动力股份有限公司 基于对偶优化的电机模型预测控制方法、装置及控制器
CN112881590A (zh) * 2021-01-15 2021-06-01 南京杰思尔环保智能科技有限公司 基于系统稳定性而设计的水样cod浓度测量方法
US11932262B2 (en) * 2021-07-01 2024-03-19 Mitsubishi Electric Research Laboratories, Inc. Stochastic nonlinear predictive controller and method based on uncertainty propagation by Gaussian-assumed density filters
CN115718986B (zh) * 2022-10-31 2023-12-12 南方电网数字电网研究院有限公司 一种基于分布式内存架构的多核并行时域仿真方法
CN115758784B (zh) * 2022-11-30 2023-12-12 南方电网数字电网研究院有限公司 支撑电力系统时域仿真的大型雅各比矩阵低耗时迭代方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103701125A (zh) * 2014-01-20 2014-04-02 武汉大学 一种基于序列二次规划法的配电网柔性潮流算法
CN103995466A (zh) * 2014-04-24 2014-08-20 燕山大学 一种基于软约束的区间预测控制建模及优化方法
CN104732057A (zh) * 2013-12-19 2015-06-24 国际商业机器公司 用于在求解最优功率流中计算问题函数的系统和方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3310632B2 (ja) * 1999-06-24 2002-08-05 建生 河村 非線形計画法による最適潮流計算システム
WO2014081945A2 (en) 2012-11-21 2014-05-30 The Trustees Of Columbia University In The City Of New York Systems, methods, and devices for image reconstruction using combined pde-constrained and simplified spherical harmonics algorithm
US9601109B2 (en) 2013-12-06 2017-03-21 International Business Machines Corporation Systems and methods for accelerating hessian-free optimization for deep neural networks by implicit preconditioning and sampling

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104732057A (zh) * 2013-12-19 2015-06-24 国际商业机器公司 用于在求解最优功率流中计算问题函数的系统和方法
CN103701125A (zh) * 2014-01-20 2014-04-02 武汉大学 一种基于序列二次规划法的配电网柔性潮流算法
CN103995466A (zh) * 2014-04-24 2014-08-20 燕山大学 一种基于软约束的区间预测控制建模及优化方法

Also Published As

Publication number Publication date
JP6972342B2 (ja) 2021-11-24
CN111699443A (zh) 2020-09-22
EP3752889A1 (en) 2020-12-23
WO2019159398A1 (en) 2019-08-22
US20190250571A1 (en) 2019-08-15
JP2021504815A (ja) 2021-02-15
US10409233B2 (en) 2019-09-10
EP3752889B1 (en) 2021-10-06

Similar Documents

Publication Publication Date Title
CN111699443B (zh) 用于控制系统的操作的控制系统和方法及存储介质
CN111670415B (zh) 用于控制系统的预测控制器、车辆及方法
EP3948440B1 (en) Nonlinear optimization method for stochastic predictive control
JP7183446B2 (ja) 機械の動作を制御する装置及び方法、並びに記憶媒体
EP2460059B1 (en) Estimating positions of a device and at least one target in an environment
US11254315B2 (en) Friction adaptive vehicle control
US11698625B2 (en) Stochastic model-predictive control of uncertain system
CN117581166A (zh) 基于借助高斯假设密度滤波器的不确定性传播的随机非线性预测控制器及方法
US11474486B2 (en) Model-based control with uncertain motion model
JP7357812B2 (ja) 予測制御のためのアクティブセットベースの内点最適化法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant