JP7357821B2

JP7357821B2 - 確率論的予測制御のための非線形最適化方法

Info

Publication number: JP7357821B2
Application number: JP2023514176A
Authority: JP
Inventors: クイリネン，リエン; フェン，シュホイ; ディ・カイラノ，ステファノ
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2020-05-29
Filing date: 2021-02-02
Publication date: 2023-10-06
Anticipated expiration: 2041-02-02
Also published as: CN115668072A; US20210373513A1; EP3948440B1; WO2021240905A1; US11327449B2; JP2023526873A; EP3948440A1

Description

本発明は、概して予測制御に関し、より具体的には、不確実性の存在下における非線形力学系の確率論的予測制御のための不正確な導関数ベースの最適化方法および装置に関する。

非線形モデル予測制御（ＮＭＰＣ：nonlinear model predictive control）は、成熟期に達しており、比較的複雑な制約付きプロセスを扱う能力を示している。ＮＭＰＣのような予測コントローラは、多くの用途において、非線形微分方程式のセットによって記述される複雑な力学系を制御するために、すなわち常微分方程式（ＯＤＥ：ordinary differential equation）、微分代数方程式（ＤＡＥ：differential-algebraic equation）、または偏微分方程式（ＰＤＥ：partial differential equation）の系を制御するために、使用される。そのような系の例は、生産ライン、車両、衛星、エンジン、ロボット、発電機およびその他の数値制御される機械を含む。

ＮＭＰＣは、フィードバックによる固有のロバスト性を示すが、そのようなコントローラは不確実性を直接考慮しないので、結果として、安全性を重視する制約の充足を、モデルの不確実性または外部外乱の存在下で保証することはできない。ある代替のアプローチは、有界の不確実性の存在下における最悪ケースのシナリオの下で制御ポリシーを最適化することに依拠するロバストなＮＭＰＣである。しかしながら、ロバストなＮＭＰＣは、極めて低い確率で発生する最悪ケースのシナリオが原因で、保守的な制御性能に至る可能性がある。

確率論的ＮＭＰＣは、このロバストなＮＭＰＣの保守性を、不確実性の確率的記述を最適制御問題（ＯＣＰ：optimal control problem）の定式化に直接組み込むことによって低減することを意図している。これは、何らかの確率で制約を充足することを必要とする、すなわち、指定されるがゼロではない制約違反の確率を考慮するいわゆる機会制約（chance constraint）を定式化することにより、充足することを必要とする。加えて、確率論的ＮＭＰＣは、プラントの実行可能領域の境界の近くで閉ループ動作の高い性能が実現される設定において、好都合である。一般的なケースにおいて、機会制約は、計算処理が難しく、典型的には近似定式化を必要とする。

サンプリング技術は、確率論的システムダイナミクスを、不確実性のランダム実現の有限集合を用いて特徴付けるが、これは、多くの場合不確実性伝搬に必要なサンプルの数が多いことに起因する多大な計算コストにつながることがある。シナリオベースの方法は、確率分布の適切な表現を利用するが、シナリオの数を決定するタスクは、ロバスト性と計算効率との兼ね合いに至る。ガウス混合近似を用いることにより、状態の遷移確率分布を記述することができるが、重みの適合化は多くの場合計算コストが高い。もう１つのアプローチは、多項式カオス（ＰＣ：polynomial chaos）の使用に依拠するが、これは、陰的マッピングを直交多項式基底関数の展開に置き換える。しかしながら、時変不確実性のため、ＰＣベースの確率論的ＮＭＰＣは多数の展開項を必要とする。そのため、直接的であるが近似的な不確実性伝搬が、非線形システムダイナミクスの確率論的予測制御における確率的機会制約の定式化に必要である。

直接最適制御方法は、制御ホライズン（control horizon）の離散化と予測ホライズンにわたる制御アクションの対応するパラメータ化とに基づいた、連続時間微分方程式の離散化に依拠する。加えて、確率論的予測制御の用途の場合、予測ホライズンにわたる制御フィードバックのパラメータ化に基づく、非線形システムダイナミクスについての不確実性を伝搬するための離散時間方程式または方程式の離散化されたセットは、直接ＯＣＰ定式化に含めることができる。結果として得られる大規模非線形最適化問題または非線形計画（ＮＬＰ：nonlinear program）は、任意の非線形最適化ソルバ（solver）によって解く（solve）ことができる。しかしながら、非線形システムのための予測制御のリアルタイム用途の場合、この非線形最適化問題は、厳密なタイミング制約の下で、かつ、計算能力に限りがありかつ利用できるメモリに限りがある埋め込まれたハードウェア上で、解く必要がある。

非線形微分方程式で記述されるシステムの確率論的予測制御は、各制御時間ステップにおいて非線形確率論的最適制御問題の解を必要とする。各問題を正確に解く代わりに、逐次二次計画法（ＳＱＰ：sequential quadratic programming）の、あるリアルタイム反復を、ある時点から次の時点までの解の推測を更新するために、実行することができる。そのようなニュートン型ＳＱＰアルゴリズムは、アルゴリズムの各反復において、離散化された非線形ダイナミクスの線形化を必要とする。この線形化は、とりわけ非線形システムダイナミクスについて不確実な伝搬を記述する方程式のセットの場合、コストが高く、陽的積分法を使用するときはヤコビアン（Jacobian）評価を必要とし、さらに、行列因数分解、行列－行列乗算および／または陰的積分法の場合は方程式の非線形システムを解くための反復手順が必要となる可能性がある。

したがって、不確実性を有する非線形力学系のための確率論的予測制御のリアルタイム用途においてＳＱＰソルバの計算コストを削減する必要がある。

いくつかの実施形態の目的は、不確実性の下で、システムを、このシステムの動的モデルを記述する非線形微分方程式の離散化と、非線形システムダイナミクスについての不確実性の離散時間伝搬とに基づいて、確率的機会制約を含む不等式制約付き非線形動的最適化問題を解くことにより、制御するためのシステムおよび方法を、提供することである。確率的機会制約の各々は、対応する不等式制約に違反する確率が、何らかの確率しきい値未満であることを保証することを意図している。

本発明のいくつかの実施形態は、その特定の時間ステップにおける、バックオフ係数値と、制約ヤコビアン行列と、予測された状態値の共分散行列とに依存する項による、不等式制約の各々の強化に基づいた、確率的機会制約の定式化を使用する。本発明のいくつかの実施形態は、共分散行列を、近似線形化ベースの共分散伝搬を使用して、制御ホライズン内の各時間ステップにおける状態値に対し、効率良く計算できるという認識に基づいている。共分散方程式は、連続時間非線形システムダイナミクスについての不確実性の線形化ベースの伝搬の離散化に、基づき得る。これに代えて、離散時間共分散伝搬を、非線形動的方程式の離散化されたセットの線形化に基づいて、直接行ってもよい。

いくつかの実施形態は、離散時間共分散伝搬方程式が、計算コストを削減するとともに、各制御時間ステップにおける共分散行列の正定値性を保つことができる、という認識に基づいている。いくつかの実施形態は、線形化ベースの共分散伝搬に非線形境界を含めることにより、共分散行列が各時間ステップにおける予測された状態値の正確な共分散の過大評価であることを、保証することができ、よって、確率的機会制約の各々は、違反の確率が何らかのしきい値未満であることを保証する。

本発明のいくつかの実施形態は、予測された状態値についての不確実性の順方向伝搬においてフィードバック制御アクションを考慮する必要がある、という認識に基づいている。いくつかの実施形態は、アフィンフィードバックゲインの時不変または時変シーケンスを用いることにより、非線形システムダイナミクスを事前に安定化させ、結果として、将来の不確実性に対するフィードバック制御アクションの効果を直接考慮した共分散伝搬方程式が得られる。たとえば、基準定常状態および入力値における線形化システムダイナミクスに対する無限ホライズン線形－二次レギュレータを用いることにより、確率論的非線形ＯＣＰ定式化におけるシステムダイナミクスを事前に安定化させることができる。

不等式制約の各々に対する個々の強化に基づく、確率的機会制約の近似定式化を使用し、得られた不等式制約付き非線形動的最適化問題を、最適性および実行可能性条件の連続線形化に基づいたニュートン型最適化アルゴリズムを用いて、解くことができる。そのようなニュートン型最適化アルゴリズムの例は、内点法（ＩＰＭ：interior point method）および逐次二次計画法（ＳＱＰ）を含む。本発明のいくつかの実施形態は、ＳＱＰアルゴリズムが、ＳＱＰ最適化アルゴリズムの各反復において、確率論的非線形ＯＣＰの二次計画（ＱＰ：quadratic program）近似を、不等式制約の各々および強化された確率的機会制約の各々について、目的関数の線形－二次近似、離散化されたシステムダイナミクスについての線形化ベースの近似、離散時間共分散伝搬方程式、および線形化ベースの近似に基づいて解く、という認識に基づいている。

システムの元の動的モデルが連続時間微分方程式のセットで記述されている場合、本発明のいくつかの実施形態は、システムダイナミクスを、陽的および陰的数値積分法を用いて離散化し、線形化は、離散時間または離散化された共分散伝搬方程式を構成するのに、対応するヤコビアン評価を必要とする。いくつかの実施形態は、ニュートン型最適化アルゴリズムの各反復において、共分散伝搬方程式の線形化は、非線形システムダイナミクスについてより高次の導関数の評価を必要とし、これは、ダイナミクスが高次元である場合、長い非線形式を必要とする場合、または硬直したもしくは陰的に既定された微分方程式のセットで記述されている場合、計算コストが高いステップを形成する、という認識に基づいている。

加えて、本発明のいくつかの実施形態は、確率論的非線形予測制御のための正確な線形化ベースの最適化アルゴリズムの解についての計算の複雑度およびメモリ要件が、不確実性を直接考慮しない名目上の実装よりも遥かに大きい、という認識に基づいている。より具体的には、名目上のＮＭＰＣにおけるブロック構造化ＱＰ近似を解く場合、メモリ要件は、Ｏ（Ｎｍ^２）として漸近的にスケーリングし、この場合、Ｎは制御ホライズンの長さを示し、ｍは制御ホライズン内の各時間ステップにおける状態および制御変数の数を示す。加えて、名目上のＮＭＰＣにおけるブロック構造化ＱＰを解く場合、計算の複雑度は、Ｏ（Ｎｍ^３）として漸近的にスケーリングする。したがって、確率論的非線形予測制御のための正確な線形化ベースの最適化アルゴリズムのメモリ要件および計算の複雑度は、各時間ステップにおける予測された状態値および対応する方程式のｍ×ｍ共分散行列により、それぞれＯ（Ｎｍ^４）およびＯ（Ｎｍ^６）として漸近的にスケーリングする。なお、確率論的ＮＭＰＣのメモリ要件は、共分散伝搬ダイナミクスが共分散に対して線形であり行列が制約ヤコビアン行列のクロネッカー積（Kronecker product）によって規定されるという認識に基づいて、Ｏ（Ｎｍ^３）まで削減することができる。

本発明のいくつかの実施形態は、代わりに、メモリ要件および計算複雑度がそれぞれＯ（Ｎｍ^２）およびＯ（Ｎｍ^３）として漸近的にスケーリングする確率論的非線形予測制御のための不正確な導関数ベースの最適化アルゴリズムを提案する。本発明のいくつかの実施形態は、不正確なＳＱＰ最適化アルゴリズムに基づき、これは、ブロック構造化問題のスパース性を保ちつつ、各ＱＰ下位問題からの共分散行列の数値的削除を可能にし、結果として、メモリ要件および計算複雑度が大幅に削減される。不正確な線形化ベースの最適化アルゴリズムは、状態変数または制御変数に対して共分散伝搬方程式のいかなる導関数も計算せず、したがって、システムダイナミクスのいかなる高次導関数も必要としない。加えて、不正確なＳＱＰアルゴリズムにおける各ＱＰ下位問題は、制御ホライズンにわたって状態変数および制御変数のみを含むが、共分散行列は、独立した伝搬手順において明示的に計算することができる。

本発明のいくつかの実施形態において、提案された、確率論的非線形予測制御のための不正確な最適化アルゴリズムは、３つの主要な計算ステップからなる。第１のステップは、線形－二次目的関数を準備し、ヤコビアン行列を計算することにより、線形化された等式および不等式制約を準備し、予測された状態値および制御値の所与の軌道についての非線形共分散伝搬方程式を評価することによって制御ホライズンにわたる予測された状態値の不確実性を表す共分散行列の軌道を計算する。したがって、標準的な最適化アルゴリズムとは異なり、提案されたアルゴリズムは、不正確なＳＱＰアルゴリズムの各反復の各時間ステップにおける共分散行列の正定値性を保つ。第２のステップは、個々の機会制約の各々を近似するための１つまたは複数の強化された不等式制約を用いて、結果として得られるブロック構造化ＱＰ下位問題を解くことからなる。第３および最終ステップは、予測された状態および制御値の軌道に対するニュートン型更新を含む。

本発明のいくつかの実施形態は、不正確な線形化ベースの最適化アルゴリズムが、システムダイナミクス、共分散伝搬方程式、不等式制約、および確率的機会制約に関して実現可能な確率論的非線形ＯＣＰの解に収束するが、この解は不正確な導関数計算が原因で準最適である可能性がある、という認識に基づいている。代わりに、本発明のいくつかの実施形態は、実現可能かつ最適である確率論的非線形ＯＣＰの解に収束する随伴勾配計算を用いる、不正確な線形化ベースの最適化アルゴリズムに基づく。なお、共分散伝搬方程式のための随伴計算は、システムダイナミクスのより高次の導関数の評価を必要とするが、完全なヤコビアン行列ではなく単一勾配に対応する。後者の随伴勾配計算は、アルゴリズム的または自動微分の随伴モードの１つの掃引を使用して効率的に実行することができる。

本発明のいくつかの実施形態において、確率論的非線形予測制御のための随伴勾配計算を用いる、提案された不正確な最適化アルゴリズムは、３つの主要な計算ステップからなる。第１のステップは、線形－二次目的関数を準備し、状態変数および制御変数に対してヤコビアン行列を計算することにより、線形化された等式および不等式制約を準備し、これは、予測された状態値および制御値の現在の軌道ならびに対応する共分散行列を考慮して、随伴ベースの勾配評価を計算し、目的関数および制約関数の各々から共分散行列を数値的に削除する。第２のステップは、個々の機会制約の各々を近似するための１つまたは複数の強化された不等式制約を用いて、結果として得られるブロック構造化ＱＰ下位問題を解くことからなる。第３および最終ステップは、予測された状態および制御値の軌道に対するニュートン型更新、ならびにラグランジュ乗数の対応する更新の展開および制御ホライズンにわたる共分散行列の軌道の更新を含む。

本発明のいくつかの実施形態は、共分散行列に加えて、確率論的最適制御問題における状態変数も、各反復において圧縮手順に基づいて数値的に削除することができ、これは、離散時間システムダイナミクスを用いて、予測ホライズン内の各段階の状態変数を、初期状態値の関数として規定し、予測ホライズン内の前のすべての段階における制御変数を規定する、という認識に基づいている。この完全または部分的な圧縮手順は、より小さいが全体的により高密度の最適化問題をもたらし、等式制約はより少ないまたはなく、同じ量の不等式制約および確率的機会制約があり、これらは、ＯＣＰ内の残りの最適化変数に関して説明される。本発明のいくつかの実施形態は、同じ不正確な線形化ベースの最適化アルゴリズムを、そのような圧縮手順と組み合わせて使用することができる、という認識に基づいている。より具体的には、状態変数の数値的削除は、第１のステップにおいて追加的に実行され、密なＱＰ解は、第２のステップにおいて実行され、一方、圧縮された状態変数の展開は、確率論的非線形予測制御のための不正確な最適化アルゴリズムの第３のステップにおいて追加的に実行される。

本発明のいくつかの実施形態は、予測コントローラにおける各制御ステップにおいて、提案された不正確なＳＱＰ方法の１回の反復を実行することにより、非線形確率論的ＯＣＰを解くための、リアルタイム反復方法を使用する。このことは、各制御ステップにおいて、非線形確率論的最適化問題のブロック構造化局所ＱＰ近似のために、１つの準備、解および展開ステップのみを実行する必要があることを意味する。ＱＰの準備は、離散化された非線形システムダイナミクスを課す非線形方程式の線形化と、非線形不等式制約の線形化と、共分散行列の圧縮または削除と、任意の随伴勾配計算とを含む。この準備に基づいて、結果として得られたブロック構造化ＱＰを解き、続いて、予測コントローラの各ステップにおいてシステムを制御するために使用される制御解を生成するために、展開ステップにより、すべての主最適化変数およびラグランジュ乗数値を更新する。

よって、一実施形態は、システムの状態および制御変数に対する制約を受ける不確実性の下でシステムを制御するための予測コントローラを開示し、予測コントローラは、少なくとも１つのプロセッサと、命令が格納されたメモリとを備え、命令は、少なくとも１つのプロセッサによって実行されると、予測コントローラに、予測コントローラの各制御ステップにおいて、制御コマンドを生成するために不確実性を表す確率的機会制約を含む不等式制約付き非線形動的最適化問題を解くことを実行させ、予測コントローラは、動的最適化問題を、終了条件が満たされるまで、状態および制御変数の固定値についての予測ホライズン内における確率的機会制約の共分散行列の伝搬と、共分散行列の固定値についての予測ホライズン内における状態および制御変数の最適化とを交互に行う２レベル最適化に基づいて、解き、命令はさらに、少なくとも１つのプロセッサによって実行されると、予測コントローラに、制御コマンドを使用してシステムの動作を制御することを実行させる。

別の実施形態は、システムの状態および制御変数に対する制約を受ける不確実性の下でシステムを制御するための予測制御方法を開示し、方法は、この方法を実現する格納された命令と結合されたプロセッサを使用し、命令は、プロセッサによって実行されると、方法のステップを実行し、方法のステップは、予測制御方法の各制御ステップにおいて、制御コマンドを生成するために不確実性を表す確率的機会制約を含む不等式制約付き非線形動的最適化問題を解くステップを含み、予測コントローラは、動的最適化問題を、終了条件が満たされるまで、状態および制御変数の固定値についての予測ホライズン内における確率的機会制約の共分散行列の伝搬と、共分散行列の固定値についての予測ホライズン内における状態および制御変数の最適化とを交互に行う２レベル最適化に基づいて、解き、方法のステップはさらに、制御コマンドを使用してシステムの動作を制御するステップを含む。

もう１つの実施形態は、システムの状態および制御変数に対する制約を受ける不確実性の下でシステムを制御するための予測制御方法を実行するためにプロセッサが実行可能なプログラムが実装される非一時的なコンピュータ読取可能記憶媒体を開示し、方法は、予測制御方法の各制御ステップにおいて、制御コマンドを生成するために不確実性を表す確率的機会制約を含む不等式制約付き非線形動的最適化問題を解くことを含み、予測コントローラは、動的最適化問題を、終了条件が満たされるまで、状態および制御変数の固定値についての予測ホライズン内における確率的機会制約の共分散行列の伝搬と、共分散行列の固定値についての予測ホライズン内における状態および制御変数の最適化とを交互に行う２レベル最適化に基づいて、解き、方法はさらに、制御コマンドを使用してシステムの動作を制御することを含む。

いくつかの実施形態に係る、不確実性を有するシステムのための予測コントローラおよびフィードバックループのブロック図である。いくつかの実施形態に係る、不確実性を有するシステムのための確率論的予測コントローラおよびフィードバックループのブロック図である。本発明のいくつかの実施形態に係る、ＣＰＵプロセッサおよびメモリを用いて実現されたコントローラおよびフィードバックシステムのブロック図である。いくつかの実施形態に係る、確率論的予測コントローラにおいて、共分散行列の伝搬と状態および制御変数の最適化とを交互に行う２レベル最適化のブロック図である。いくつかの実施形態に係る、コントローラを実現するための確率論的非線形モデル予測制御（ＳＮＭＰＣ）方法のブロック図である。いくつかの実施形態に係る、離散時間システムダイナミクスおよび共分散伝搬方程式に基づいて、直接最適制御構造化非線形計画（ＮＬＰ）を解くＳＮＭＰＣ方法のブロック図である。いくつかの実施形態に係る、確率論的予測コントローラにおける確率的機会制約の近似のブロック図である。確率論的予測コントローラにおける確率的機会制約の定式化および近似の背景にある考え方を示す図である。いくつかの実施形態に係る、連続時間線形ベースの状態共分散伝搬を示すブロック図である。いくつかの実施形態に係る、離散時間線形ベースの状態共分散伝搬を示すブロック図である。いくつかの実施形態に係る、離散時間で事前に安定化させた非線形システムダイナミクスについての線形化ベースの状態共分散伝搬を示すブロック図である。本発明のいくつかの実施形態に係る、状態フィードバック制御アクションに起因する確率的機会制約としての制御範囲の定式化および近似のブロック図である。確率論的予測コントローラにおける各時間ステップで、制約付き非線形最適制御問題を解くための反復導関数ベースの最適化手順のブロック図である。確率論的予測コントローラが解く必要がある最適制御構造化ＮＬＰのコンパクトな定式化を示す図である。本発明のいくつかの実施形態に係る、確率論的予測コントローラにおける最適制御構造化ＮＬＰの正確なヤコビアンベースの局所二次計画（ＱＰ）近似のブロック図である。いくつかの実施形態に係る、予測ホライズンにわたる現在の状態および制御値を考慮した、状態共分散行列値の陽的逐次計算のブロック図である。非線形システムダイナミクスのより高次の導関数を評価する必要がない、確率論的予測コントローラの効率的な実現のための反復不正確ＳＱＰ最適化アルゴリズムのブロック図である。随伴不正確ＳＱＰ最適化アルゴリズムの実現のための、ヤコビアン行列近似ならびに対応する随伴ベースの勾配補正およびラグランジュ乗数展開ステップのブロック図である。収束特性を改善するための随伴ベースの勾配補正に基づいた確率論的予測コントローラの効率的な実装のための反復不正確ＳＱＰ最適化アルゴリズムのブロック図である。本発明のいくつかの実施形態に係る、確率論的非線形モデル予測制御を実現する随伴ベースの不正確ＳＱＰ最適化アルゴリズムのためのリアルタイム変数のアルゴリズム記述の図である。随伴ベースのＳＱＰ最適化アルゴリズムにおいて圧縮された不等式制約値を計算するための順方向再帰における制約ヤコビアン行列のブロック構造化スパース性の利用のブロック図である。随伴ベースのＳＱＰ最適化アルゴリズムにおいて更新されたラグランジュ乗数値を計算するための逆方向回帰における制約ヤコビアン行列のブロック構造化スパース性の利用のブロック図である。いくつかの実施形態の原理を採用したコントローラを含む車両の概略図である。いくつかの実施形態の原理を採用したコントローラといくつかの実施形態に係る車両１００１のコントローラとの間のやり取りの概略図である。いくつかの実施形態の原理を採用する制御対象の車両に対するモーションプランニングおよび／または予測制御方法の概略図である。いくつかの実施形態の原理を採用する制御対象の車両に対するモーションプランニングおよび／または予測制御方法の概略図である。

本発明のいくつかの実施形態は、不確実性を有するシステムまたは確率論的予測コントローラを使用するシステムの動作を制御するためのシステムおよび方法を提供する。確率論的予測コントローラの一例は、制御されるシステムのモデルと不確実性のモデルとに基づいて制御入力を決定する確率論的モデル予測制御（ＳＭＰＣ：stochastic model predictive control）である。

図１Ａは、いくつかの実施形態に係る、状態推定器１３１を介して予測コントローラ１１０に接続された、不確実性１２５を有する一例としてのシステム１２０を示す。いくつかの実装形態において、予測コントローラは、システムの動的モデル１４０に従ってプログラムされるモデル予測コントローラ（ＭＰＣ：model predictive controller）である。モデルは、現在および以前の入力１１１と以前の出力１０３との関数として、ある時間にわたるシステム１２０の状態および出力１０３の変化を表す方程式のセットであってもよい。モデルは、システムの物理的および動作上の制限を表す制約１４２を含み得る。動作中、コントローラは、システムの所望の挙動を示すコマンド１０１を受ける。コマンドは、たとえばモーションコマンドであってもよい。コマンド１０１を受けたことに応じて、コントローラは、不確実性１２５を有する実システム１２０に対する入力として機能する制御信号１１１を生成する。この入力に応じて、システムは、システムの出力１０３を更新する。システム１０３の出力の測定値に基づいて、推定器は、システム１２１の推定された状態を更新する。システム１２１の推定された状態は、コントローラ１１０に状態フィードバックを与える。

本明細書で言及されるシステム１２０は、電圧、圧力、力、トルク等の物理量に、場合によっては関連付けられる、何らかの操作入力信号１１１（入力）によって制御され、以前の状態から現在の状態へのシステムの状態の遷移を示す電流、流量、速度、位置等の物理量に、場合によっては関連付けられる、いくつかの制御された出力信号１０３（出力）を返す、任意の機械またはデバイスであってもよい。出力値は、部分的にシステムの以前の出力値に関連し、部分的に以前および現在の入力値に関連する。以前の入力および以前の出力に対する依存性は、システムの状態で符号化される。システムの動作、たとえば、システムの構成要素のモーションは、何らかの入力値の適用後にシステムによって生成される出力値のシーケンスを含み得る。

不確実性１２５は、システム１２０に作用する任意の外部外乱、力、またはトルクを含む任意の時変不確実性、任意のモデル化されていないダイナミクス、または不確実な摩擦係数、物体の質量、もしくは実システム１２０の物理的挙動を記述する動的モデル方程式内の不確実な係数およびパラメータ等の、物理量における任意の不確実性である可能性がある。ＭＰＣコントローラのほとんどの実装形態は、コントローラの計算の複雑さを低減するために、または物理的挙動の一部があまりにも複雑でそのためにモデル化するのが困難または不可能であることが理由で、単純化された動的モデル１４０を使用し、その結果、実システム内の大量の物理的挙動がモデル化されていない状態に留まる。なお、時不変不確実性は、状態およびパラメータ推定器１３１の一部として、オンラインまたはオフラインのいずれかで推定または学習され得るものである。

システム１４０の動的モデルは、現在の入力および以前の入力と以前の出力との関数として、システム出力が時間とともにどのように変化するかを記述する、数学的方程式のセットを含み得る。システムの状態は、システムのモデルおよび将来の入力とともにシステムの将来のモーションを一意に定義することができる、一般的に時間とともに変化する任意の情報のセット、例として現在の入力および出力ならびに以前の入力および出力の適切なサブセットである。実システム１２０は、出力、入力、および場合によってはシステムの状態が動作することを可能にされる範囲を制限する物理的制限および仕様制約１４２を受ける可能性がある。

コントローラ１１０は、固定または可変制御周期サンプリング間隔で、システム１２１の推定状態および所望のモーションコマンド１０１を受信し、この情報を使用して、システムを動作させるための入力、たとえば制御信号１１１を決定する、ハードウェアで実現することができる、または、プロセッサ、たとえばマイクロプロセッサで実行されるソフトウェアプログラムとして実現することができる。

推定器１３１は、固定または可変制御周期サンプリング間隔でシステムの出力１０３を受信し、新たなおよび以前の出力測定値を使用して、システム１２０の推定状態１２１を決定する、ハードウェアで実現することができる、または、コントローラ１１０と同じまたは異なるプロセッサのいずれかであるプロセッサで実行されるソフトウェアプログラムとして実現することができる。

図１Ｂは、いくつかの実施形態に係る、状態推定器１３１および不確実性推定器１３２を介して確率論的予測コントローラ１５０に接続される、不確実性１２５を有する一例としてのシステム１２０を示す。いくつかの実装形態において、確率論的予測コントローラは、システムおよび不確実性の動的モデル１４０に従ってプログラムされる、確率論的モデル予測コントローラ（ＳＭＰＣ）である。動的モデルは、不確実性１２５と、システムの挙動に対するその関係とをモデル化するための不確実性モデル１４１を含む。不確実性モデルは、不確実性と、システムの動的挙動を記述する動的モデル方程式との間の線形関係および／または非線形関係のモデルを含む。加えて、不確実性モデルは、動的モデルにおける時変不確実性の各々についての確率分布のモデルを含む。

本発明のいくつかの実施形態において、確率論的予測コントローラ１５０のための動的モデル１４０は、１つまたは複数の確率的機会制約１４３を含み得る。システムに対する物理的制限および仕様制約のうちのいずれも、対応する制約に違反する確率が何らかの確率しきい値未満であることを強制することを意図する、１つまたは複数の確率的機会制約１４３として定式化することができる。

本発明のいくつかの実施形態において、不確実性推定器１３２は、たとえば確率論的予測コントローラ１５０によって使用される動的モデル１４０の不確実性のうちの１つまたは複数についての確率分布の一次および高次モーメントの推定値１２２を提供する。本発明のいくつかの実施形態において、状態推定器１３１および不確実性推定器１３２はともに、１つの推定器構成要素１３０において実現され、これは、固定または可変制御期間サンプリング間隔でシステム１０３の出力を受信し、新たなおよび以前の出力測定値を使用して、システム１２０の推定状態１２１および不確実性１２５の推定不確実性１２２を決定する。

図２Ａは、いくつかの実施形態に係る、確率論的予測コントローラ１５０のブロック図を示し、これは、推定不確実性１２２を考慮して、システムの推定状態１２１および出力１０３がコマンド１０１に従うようにシステムを作動させる。確率論的予測コントローラ１５０は、たとえば、動的モデル１４０、不確実性モデル１４１、制約１４２、および不確実性１２５を有する実システム１２０の動作に関する確率的機会制約１４３を格納するためのメモリ２０２に接続された、単一の中央処理装置（ＣＰＵ）または複数のＣＰＵプロセッサ２０１の形態の、コンピュータを含む。

図２Ｂは、制御コマンドを生成するための不確実性を表す確率的機会制約を含む、確率論的予測コントローラ１５０の各制御ステップにおける不等式制約付き非線形動的最適化問題を解くための、２レベル最適化手順のブロック図を示す。２レベル最適化手順は、状態および制御変数２６５の固定値についての予測ホライズン内における確率的機会制約の共分散行列の伝搬２５０と、状態共分散行列２５５の固定値についての予測ホライズン内における状態および制御変数の最適化２６０とを交互に行う。２レベル最適化手順の終了条件が満たされると、制御信号１１１が計算される。

本発明のいくつかの実施形態において、２レベル最適化手順１５０は、３つの段階または計算ステップを含む。第１のステップは、線形－二次目的関数を準備し、ヤコビアン行列を計算することにより、線形化された等式および不等式制約を準備し、状態および制御値２６５の現在の軌道についての非線形共分散伝搬方程式を評価することによって制御ホライズンにわたる予測された状態値の不確実性を表す共分散行列の軌道を伝搬する（２５０）。第２のステップは、機会制約の各々を近似するための１つまたは複数の強化された不等式制約を用いて、結果として得られるブロック構造化ＱＰ下位問題を解くこと（２７０）からなる。第３および最終ステップは、最適状態および制御値の現在の軌道に対するニュートン型更新（２７５）を含む。

本発明のいくつかの実施形態において、確率論的予測コントローラにおいて不正確なヤコビアン情報を修正するために随伴勾配計算が使用され、結果として得られる２レベル最適化手順は、３つの主要な計算ステップからなる。第１のステップは、線形－二次目的関数を準備し、状態および制御変数に関してヤコビアン行列を計算することにより、線形化された等式および不等式制約を準備し、随伴ベースの勾配評価を計算し、予測された状態および制御値２６５の現在の軌道に対して共分散行列の軌道を伝搬すること（２５０）によって、目的および制約関数の各々から共分散行列を数値的に削除する。第２のステップは、機会制約の各々を近似するための１つまたは複数の強化された不等式制約を用いて、結果として得られるブロック構造化ＱＰ下位問題を解くこと（２７０）からなる。第３および最終ステップは、最適状態および制御値の軌道のニュートン型更新（２７５）、ならびにラグランジュ乗数の対応する更新の拡張を含む。

図３Ａは、本発明のいくつかの実施形態に係る、システムの現在の状態推定値１２１、不確実性推定値１２２、および制御コマンド１０１を考慮して制御信号１１１を計算する確率論的予測コントローラ１５０を実現する確率論的非線形モデル予測制御（ＳＮＭＰＣ：stochastic nonlinear model predictive control）のためのシステムおよび方法のブロック図を示す。具体的には、ＳＮＭＰＣは、各制御時間ステップにおいて制約付き最適化問題３５０を解くことにより、制御解を、たとえば、システム３６０の予測時間ホライズンにわたる将来の最適なまたはほぼ最適な制御入力のシーケンスを含む解ベクトル３６５を、計算する。この最適化問題３５０における目的関数、等式および不等式制約のデータ３４５は、動的モデルおよびシステム制約３４０、システムの現在の状態推定値１２１、推定不確実性１２２および制御コマンド１０１に依存する。

本発明の実施形態は、連続時間ＳＮＭＰＣ問題を不等式制約付き非線形動的最適化問題として定式化するために、直接最適制御方法を使用する。本発明のいくつかの実施形態は、ニュートン型方法に基づく反復手順と、最適化問題に対する実現可能性および最適性条件の連続線形化とを使用して、不等式制約付き最適化問題３５０を正確にまたは近似的に解くために、導関数ベースの最適化アルゴリズムを使用する。そのようなニュートン型の最適化アルゴリズムの例は、内点法（ＩＰＭ）および逐次二次計画法（ＳＱＰ）を含む。本発明のいくつかの実施形態は、不等式制約付き最適化問題３５０が、最適制御構造化最適化問題（ＯＣＰ）の形態を有し、導関数ベースの最適化アルゴリズムの実現を利用する構造を、各制御時間ステップにおいて解ベクトル３６５を計算するために使用できる、という認識に基づいている。

本発明のいくつかの実施形態において、不等式制約付き最適化問題３５０の解は、現在の制御時間ステップにおいて不等式制約付き最適化問題３５０を解く計算労力を低減するために、解の推測としてメモリから読み出すことができる、以前の制御時間ステップからの予測時間ホライズンにわたる正確なまたは近似状態および／または制御値３１０を使用する。以前の制御時間ステップで解の情報から解の推測３１０を計算するというこの概念は、最適化アルゴリズムのウォームスタートまたはホットスタートと呼ばれ、本発明のいくつかの実施形態においてＳＮＭＰＣコントローラの必要な計算労力を低減することができる。同様に、対応する解ベクトル３６５を使用して、次の制御時間ステップ３６０のための正確なまたは近似状態および／または制御値のシーケンスを更新し格納することができる。

本発明のいくつかの実施形態において、非線形不等式制約３５５は、凸および／または非凸制約のいずれかを含む、任意の非線形平滑関数によって定義することができる。本発明の実施形態において、不等式制約３５５のうちの１つまたは複数は、対応する不等式制約に違反する確率が何らかの確率しきい値、すなわちバックオフ係数値を下回ることを保証することを意図する、確率的機会制約として、定義することができる、すなわち、確率的機会制約についてはα_ｉ＞０、標準的な決定論的不等式制約についてはα_ｉ＝０である。なお、決定論的不等式制約は、対応する不等式制約が状態および制御値の軌道の期待値に対して充足されることを保証することを意図している。

不等式制約の各々に対する個々の強化に基づく、確率的機会制約３５５の近似定式化を使用し、得られた不等式制約付き非線形動的最適化問題を、最適性および実行可能性条件の連続線形化に基づいたニュートン型最適化アルゴリズムを用いて、解くことができる。そのようなニュートン型最適化アルゴリズムの例は、内点法（ＩＰＭ）および逐次二次計画法（ＳＱＰ）を含む。本発明のいくつかの実施形態は、ＳＱＰアルゴリズムが、ＳＱＰ最適化アルゴリズムの各反復において、確率論的非線形ＯＣＰの二次計画（ＱＰ）近似を、不等式制約の各々および強化された確率的機会制約の各々について、目的関数の線形－二次近似、離散化されたシステムダイナミクスについての線形化ベースの近似、離散時間共分散伝搬方程式、および線形化ベースの近似に基づいて解く、という認識に基づいている。本発明のいくつかの実施形態において、目的関数３５１におけるステージおよび／またはターミナルコストは、凸関数および／または非凸関数のいずれかを含む、任意の線形、線形－二次および／または非線形平滑関数によって定義することができる。最適制御問題の目的関数３５１は、予測時間ホライズンの各時点に対応するコスト項を含み得る。いくつかの実施形態において、目的関数は、確率論的予測コントローラ１５０におけるコスト関数の基準追跡型定式化をもたらす、予測時間ホライズンの各時点における基準出力値のシーケンスからのシステムの何らかの出力関数の偏差の（非線形）最小二乗型ペナライザーションを含む。

図５Ｃは、確率論的予測コントローラの状態共分散伝搬の一部としてフィードバック制御アクションを考慮に入れるための非線形システムダイナミクスの事前安定化を示すブロック図である。いくつかの実施形態は、離散時間ダイナミクス５２０および時変外乱５２５を考慮して事前安定化非線形システムダイナミクス５６０を定式化するためのフィードバック制御アクションのパラメータ化に基づく。

なお、図５Ｃおよび図５Ｄのフィードバック制御アクションは、１つの制御ステップの動的最適化問題における予測時間ホライズンにわたる将来のフィードバック制御アクションの予測であり、したがって、これらのフィードバック制御アクションは、図１の予測コントローラ１１０へのシステム１２１の推定状態の実際のフィードバックと混同されてはならない。

図６Ａは、連続局所線形化に基づく近似６０５の使用を通して、確率論的予測コントローラにおける各制御時間ステップで制約付き最適制御構造化非線形計画（ＮＬＰ）３５０を解くための、反復導関数ベースの最適化手順のブロック図を示す。ＮＬＰに対する解の推測６０１はこの局所近似を構築するために使用され、制約付きＮＬＰの局所近似に対する解６１０は予測時間ホライズンにわたる状態、制御、および状態共分散値の現在のシーケンスの更新６１５のために使用され、結果として、アルゴリズム手順の各反復において制約付きＮＬＰに対する現在の解の推測６０１が更新される。最適化手順の各反復は、制約付きＮＬＰに対する解が発見されたか否かおよび／または反復の最大数に到達したか否かの確認６０７を行う。終了条件６０７が満たされる場合は、制御解３６５が発見されており、そうでない場合、最適化アルゴリズムの次の反復において局所線形化ベースの近似６０５を構築するために、制約ヤコビアン行列（の近似）の評価６２０が行われる。以前の制御時間ステップからの状態および制御値３１０を使用して、制約付きＮＬＰ６０１の初期解推測および線形化ポイントを形成することができる。

非線形目的および制約関数３４５に基づき、予測時間ホライズンにわたる状態、制御および状態共分散値の軌道を含む現在の解推測を線形化ポイント６０１として使用して、アルゴリズム手順の各反復においてＮＬＰ６０５への局所近似が構築される。これを目的として、複雑な非線形システムダイナミクスおよび／または非線形不等式制約の離散化システムの線形化を形成するために、制約ヤコビアン行列の計算または近似６２０が必要である。局所近似の解がＮＬＰ６０７に対して十分に正確な解を形成する場合、最適な制御解３６５が得られる。代わりに、反復の最大数に到達すると（６０７）、準最適および／または実現不可能な解が得られる（３６５）。十分な精度を有するＮＬＰに対する解がまだ発見されず、かつ反復の最大数にまだ到達していない場合（６０７）、局所近似６１０に対する解は、予測時間ホライズン６１５にわたる状態、制御および状態共分散値の軌道を更新し、ＮＬＰ６０１に対する解推測を更新するために使用される。

連続局所近似６０５の使用を通して、各制御時間ステップで、不等式制約付き最適制御構造化非線形計画（ＮＬＰ）３５０を解くために、異なるタイプの最適化アルゴリズムを使用することができる。いくつかの実施形態は、逐次二次計画法（ＳＱＰ）に基づいており、この場合、各反復において元のＮＬＰへの局所近似として二次計画（ＱＰ）が構築され解決される。代わりに、いくつかの実施形態は、内点（ＩＰ）法に基づいており、この場合、各局所近似は、不等式制約に対応する相補性条件が概ね平滑化される、ＮＬＰのための最適性の一次必要条件の線形化である。いくつかの実施形態において、バリア関数が、不等式制約を反復的に強制するために使用され、各反復は、バリア再定式化問題への局所近似を構築し解決する。

導関数ベースの最適化アルゴリズムは、各反復において局所下位問題を構築し（６０５）解く（６１０）ときに、制約ヤコビアン行列およびヘッセ行列に対して異なるニュートン型近似技術を使用することができる。いくつかの実施形態は、正確な制約ヤコビアン行列６２０の計算による、制約関数のうちの一部またはすべての正確な線形化に基づく。いくつかの実施形態は、代わりに、準ニュートン型更新式を使用し、低ランク更新技術を通して制約ヤコビアン行列への近似を反復的に更新する。同様に、ＮＬＰのラグランジュヘッセ行列についても、異なるニュートン型近似技術を使用することができる。いくつかの実施形態は、ＮＬＰへの各局所近似を構築するときに、ラグランジュの正確なヘッセ行列の評価に基づく。いくつかの実施形態は、代わりに、準ニュートン型更新式を使用し、対称低ランク更新技術を通してヘッセ行列への近似を反復的に更新する。ＮＬＰの目的関数が（非線形）最小二乗型コスト項を含む場合、いくつかの実施形態は、代わりにガウス－ニュートン型ヘッセ近似に基づく。

本発明のいくつかの実施形態において、非線形不等式制約６３４のうちの１つまたは複数は、１つまたは複数の非線形であるが凸状の不等式制約によって局所的に近似することができ、結果として、確率論的予測コントローラの逐次凸計画法（ＳＣＰ：sequential convex programming）の実現において解かれる（６１０）必要がある局所凸計画（ＣＰ：convex program）近似６０５が得られる。たとえば、いくつかの実施形態において、１つまたは複数の確率的機会制約は、凸二次円錐制約および／または凸二次不等式制約によって局所的に近似されてもよい。凸円錐制約の各々は、状態、制御および／または共分散行列変数の線形的な組み合わせが凸円錐の内側に制限されることを課す。凸円錐の例は、正象限、正の半定値行列のセットおよび／または二次円錐を含み得る。本発明のいくつかの実施形態は、最適制御構造化制約付きＮＬＰ３５０の局所凸計画近似６０５が、線形計画（ＬＰ：linear program）、二次計画（ＱＰ）、二次制約付き二次計画（ＱＣＱＰ：quadratically constrained quadratic program）、二次円錐計画（ＳＯＣＰ：second-order cone program）、または半定値計画（ＳＤＰ：semidefinite program）である可能性があり、これらのクラスの問題の各々を凸最適化アルゴリズムを利用する構造によって解くことができる、という認識に基づいている。

図１０Ａは、いくつかの実施形態の原理を採用する確率論的予測コントローラ１００２を含む車両１００１の概略図を示す。本明細書で使用される車両１００１は、乗用車、バス、またはローバー等の任意の種類の車輪自動車であればよい。また、車両１００１は、自動運転または半自動運転車両であってもよい。たとえば、いくつかの実施形態は車両１００１のモーションを制御する。モーションの例は、車両１００１のステアリングシステム１００３によって制御される車両の横方向モーションを含む。一実施形態において、ステアリングシステム１００３はコントローラ１００２によって制御される。これに加えてまたはこれに代えて、ステアリングシステム１００３は車両１００１の運転者によって制御されてもよい。

この車両はまた、コントローラ１００２によってまたは車両１００１の他の構成要素によって制御可能なエンジン１００６を含み得る。この車両はまた、周囲環境を検知する１つ以上のセンサ１００４を含み得る。センサ１００４の例は、測距装置、レーダー、ライダー、およびカメラを含む。車両１００１はまた、その現在のモーション量および内部ステータスを検知する１つ以上のセンサ１００５を含み得る。センサ１００５の例は、全地球測位システム（ＧＰＳ）、加速度計、慣性計測装置、ジャイロスコープ、シャフト回転センサ、トルクセンサ、撓みセンサ、圧力センサ、および流量センサを含み得る。センサは情報をコントローラ１００２に提供する。この車両は、有線または無線通信チャネルを介したコントローラ１００２通信機能を可能にするトランシーバ１００６を備えていてもよい。

図１０Ｂは、いくつかの実施形態に係る、確率論的予測コントローラ１００２と車両１００１のコントローラ１０２０との間のやり取りの概略図を示す。たとえば、いくつかの実施形態において、車両１００１のコントローラ１０２０は、車両１０２０の回転および加速を制御するステアリングコントローラ１０２５およびブレーキ／スロットルコントローラ１０３０である。このような場合、確率論的予測コントローラ１００２は、コントローラ１０２５および１０３０に対し制御入力を出力して車両の状態を制御する。コントローラ１０２０はまた、確率論的予測コントローラ１００２の制御入力をさらに処理する、ハイレベルコントローラ、たとえば車線維持支援コントローラ１０３５を含み得る。いずれの場合も、コントローラ１０２０は、車両のモーションを制御するために、確率論的予測コントローラ１００２の出力を用いて車両のステアリングホイールおよび／またはブレーキ等の車両の少なくとも１つのアクチュエータを制御する。

１０Ｃは、自動または半自動制御車両１０５０の概略図を示し、本発明の実施形態を使用することにより、この車両に対し、動的に実現可能であり多くの場合最適である軌道１０５５を計算することができる。生成された軌道は、車両を特定の道路境界１０５２の内部に留めることを意図しており、かつ、他の非制御車両を、すなわち制御車両１０５０に対する障害物１０５１を回避することを意図している。いくつかの実施形態において、障害物１０５１の各々は、制約付き最適制御問題の時間または空間式における１つまたは複数の不等式制約によって表すことができる。たとえば、確率論的モデル予測コントローラを実現するように構成された実施形態に基づいて、自動または半自動制御車両１０５０は、たとえば、左側もしくは右の別の車両を追い越す、またはその代わりに道路１０５２の現在の車線内の別の車両の後方に留まる等の決断を、リアルタイムで行うことができる。本発明の実施形態は、車両１０５０の現在の状態および予測された状態に関する不確実性、車両モデルのパラメータに関する不確実性、ならびに、たとえば自動または半自動制御車両１０５０の位置から一定の距離以内にある障害物１０５１を含む、環境の現在の状態および予測された状態に関する不確実性を、直接考慮する、ＳＮＭＰＣコントローラに基づく。

図１０Ｄは、本発明の実施形態を使用することにより、上側の道路境界１０６０および下側の道路境界１０６１の内部の急な車線変更操作の動的に実現可能かつ最適な軌道１０７０を追跡することを意図しているＳＮＭＰＣコントローラによって制御される、車両１０６５の概略図を示す。図１０Ｄは、第１の時点における、ＳＮＭＰＣコントローラ１０７１による予測状態軌道の不確実性の伝搬を含む車両位置１０６５と、第２の時点における、車両位置１０６６および対応する予測状態不確実性の伝搬１０７２と、第３の時点における、車両位置１０６７および対応する予測状態不確実性の伝搬１０７３とを示す。本発明のいくつかの実施形態に係る確率的機会制約を伴う確率論的予測コントローラの使用は、制御された車両が、何らかの確率しきい値を下回るように道路境界制約１０６０および／または１０６１に違反する確率を許容する。より具体的には、図１０Ｄは、第２の時点における予測状態軌道１０７２の確率論的チューブが上側道路境界制約１０６０に達すること（１０７５）を示し、これは、不確実性の下で制御されるシステムの決定論的制約と確率的機会制約の両方を充足することを意図している確率論的予測コントローラの挙動を示す。

システムおよびその環境の不確実性の例は、車両のタイヤと路面との間の摩擦挙動に関連する任意のパラメータ、たとえば車両を制御しながらオフラインおよび／またはオンラインのいずれかで学習または推定することができる、パセイカ（Pacejka）タイヤ－力モデルのパラメータを含み得る。推定パラメータ値および推定不確実性は、本発明の実施形態に係る、確率論的非線形モデル予測コントローラの直接最適制御問題定式化における時変および不確実外乱変数として定義することができる。

上記本発明の実施形態は、数多くのやり方のうちのいずれかで実現することができる。たとえば、これらの実施形態は、ハードウェア、ソフトウェア、またはその組み合わせを用いて実現されてもよい。ソフトウェアで実現される場合、ソフトウェアコードは、任意の適切なプロセッサまたはプロセッサの集まりにおいて、これが１つのコンピュータに設けられていても複数のコンピュータに分散されていても、実行することができる。このようなプロセッサは、１以上のプロセッサが集積回路コンポーネント内にある集積回路として実現されてもよい。しかしながら、プロセッサは、任意の適切なフォーマットの回路を用いて実現されてもよい。

また、本明細書で概要が示された各種方法またはプロセスは、さまざまなオペレーティングシステムまたはプラットフォームのうちのいずれか１つを採用する１つ以上のプロセッサ上で実行可能なソフトウェアとして符号化されてもよい。加えて、このようなソフトウェアは、複数の適切なプログラミング言語および／またはプログラミングもしくはスクリプトツールのうちのいずれかを用いて記述されてもよく、また、フレームワークもしくは仮想マシン上で実行される、実行可能なマシン言語コードまたは中間符号としてコンパイルされてもよい。典型的に、プログラムモジュールの機能は、各種実施形態において所望される通りに組み合わされても分散されてもよい。

また、実施形態は、方法として実施されてもよく、その一例が提供されている。この方法の一部として実行される動作の順序は任意の適切なやり方で決められてもよい。したがって、実施形態は、例示されている順序と異なる順序で動作が実行されるように構成されてもよく、これは、いくつかの動作を、例示されている実施形態では一連の動作として示されるが、同時に実行することを含み得る。

本発明を好ましい実施形態の例を用いて説明してきたが、その他の各種応用および修正を本発明の精神および範囲の中で行い得ることが理解されるはずである。したがって、以下の請求項の目的は、本発明の真の精神および範囲に含まれるこのような変形および修正のすべてをカバーすることである。

Claims

システムの状態および制御変数に対する制約を受ける不確実性の下で前記システムを制御するための確率論的モデル予測コントローラであって、前記確率論的モデル予測コントローラは、
少なくとも１つのプロセッサと、
命令が格納されたメモリとを備え、前記命令は、前記少なくとも１つのプロセッサによって実行されると、前記確率論的モデル予測コントローラに、
前記確率論的モデル予測コントローラの各制御ステップにおいて、制御コマンドを生成するために前記不確実性を表す確率的機会制約を含む不等式制約付き非線形動的最適化問題を解くことを実行させ、
前記システムの状態および制御変数に対する前記制約は不等式制約を含み、前記確率的機会制約は、対応する不等式制約の各々に違反する確率が確率しきい値未満であることを保証するために、予測ホライズン内の各時間ステップにおける、バックオフ係数値と、制約ヤコビアン行列と、予測された状態変数の共分散行列とに依存する項による、１つまたは複数の不等式制約の強化に基づき、
前記確率論的モデル予測コントローラは、前記動的最適化問題を、終了条件が満たされるまで、前記状態および制御変数の固定値についての前記予測ホライズン内における各時間ステップでの前記確率的機会制約の前記共分散行列の伝搬と、前記共分散行列の固定値についての前記予測ホライズン内における前記状態および制御変数の最適化とを交互に行う２レベル最適化に基づいて、解き、前記命令はさらに、前記少なくとも１つのプロセッサによって実行されると、前記確率論的モデル予測コントローラに、
前記最適化された制御変数を含む生成された前記制御コマンドを使用して前記システムの動作を制御することを実行させ、
前記予測ホライズン内における各時間ステップごとの前記共分散行列の前記伝搬は、前記予測ホライズンに対して最適化された前記状態および制御変数の現在の値に対して非線形共分散伝搬方程式を評価することによって実行され、
前記非線形共分散伝搬方程式は、前記予測ホライズンに対して最適化された前記状態および制御変数の前記現在の値に対して事前に計算されたヤコビアン行列を使用して、各制御時間ステップにおける前記共分散行列の正定値性を保つ線形化ベースの離散時間リアプノフ方程式である、確率論的モデル予測コントローラ。
前記状態および制御変数の前記最適化は、これらの状態および制御変数が、前記非線形動的最適化問題の局所二次計画近似を解くことを含む、請求項１に記載の確率論的モデル予測コントローラ。
前記予測ホライズン内における各時間ステップごとの前記共分散行列の前記伝搬は、前記予測ホライズン内の前記予測された状態変数の不確実性の順方向伝搬における将来のフィードバック制御アクションを考慮するために非線形システムダイナミクスの事前に安定化させたシステムに対して実行される、請求項１または２に記載の確率論的モデル予測コントローラ。
前記非線形システムダイナミクスの事前に安定化させたシステムは、アフィンフィードバックゲインの時不変または時変シーケンスを使用している、請求項３に記載の確率論的モデル予測コントローラ。
前記不等式制約付き非線形動的最適化問題は、前記非線形システムダイナミクスの事前に安定化させたシステムの実行可能性を保証するために前記予測ホライズン内の後続のフィードバック制御アクションに対する１つまたは複数の不等式制約についての１つまたは複数の確率的機会制約を含む、請求項３に記載の確率論的モデル予測コントローラ。
前記共分散行列の固定値についての前記予測ホライズン内における前記状態および制御変数の前記最適化は、前記状態および制御変数に対する共分散伝搬方程式の導関数を計算することなく、かつ共分散行列変数に対する確率的機会不等式制約の導関数を計算することなくブロック構造化スパース性を保つ各二次計画（ＱＰ）下位問題における前記共分散行列の固定値について不正確な逐次二次計画（ＳＱＰ）を用いて実行され、前記共分散行列の固定値についての前記予測ホライズン内における前記状態および制御変数の前記最適化は、随伴勾配計算を用いて、ブロック構造化ＱＰ下位問題の解が、線形－二次目的関数における随伴ベースの勾配評価を含むように、実行され、追加の随伴ベースの勾配は、前記共分散伝搬方程式についてのラグランジュ乗数値を用いて評価され、前記勾配は、前記状態および制御変数の最適性に対する前記共分散方程式の効果を表し、前記共分散伝搬方程式についての前記ラグランジュ乗数値は、前記不等式制約についてのラグランジュ乗数値に基づく展開ステップを用いて、前記不正確なＳＱＰ最適化アルゴリズムにおける前記ＱＰ下位問題の各解の後に更新される、請求項１に記載の確率論的モデル予測コントローラ。
前記確率論的モデル予測コントローラは、以前の制御ステップにおける前記予測ホライズンにわたる状態および制御値ならびに共分散行列値の最適または準最適シーケンスから始まる、各制御ステップにおける前記不等式制約付き非線形動的最適化問題を解くための前記２レベル最適化アルゴリズムの、１回のみまたは予め定められた数の反復を使用し、前記２レベル最適化は、前記予測ホライズンにわたる状態および制御値ならびに共分散行列値の最適または準最適シーケンスを更新するために各制御ステップにおいて１つのみのまたは予め定められた数のブロック構造化ＱＰ下位問題を解く不正確なＳＱＰ最適化方法に基づく、請求項１に記載の確率論的モデル予測コントローラ。
前記確率論的モデル予測コントローラは、制御される前記システムを構成する車両を制御するように構成され、前記車両の状態は、前記車両の、位置、向き、速度、角速度、スリップ比およびスリップ角度値のうちの１つまたは組み合わせを含み、制御入力は、加速度、ブレーキトルク、ステアリング角度、およびステアリングレート値のうちの１つまたは組み合わせを含み、前記不確実性は、前記車両のモデルにおける質量値、慣性値、またはその双方の不確実性、前記車両のステアリングモデルにおける不確実性、前記車両のタイヤと路面との間の摩擦を示す１つまたは複数のパラメータ値における不確実性のうちの１つまたは組み合わせを含む時変外乱を含む、請求項１に記載の確率論的モデル予測コントローラ。
システムの状態および制御変数に対する制約を受ける不確実性の下で前記システムを制御するための予測制御方法であって、前記方法は、前記方法を実現する格納された命令と結合されたプロセッサを使用し、前記命令は、前記プロセッサによって実行されると、前記方法のステップを実行し、前記方法のステップは、
前記予測制御方法の各制御ステップにおいて、制御コマンドを生成するために前記不確実性を表す確率的機会制約を含む不等式制約付き非線形動的最適化問題を解くステップを含み、
前記システムの状態および制御変数に対する前記制約は不等式制約を含み、前記確率的機会制約は、対応する不等式制約の各々に違反する確率が確率しきい値未満であることを保証するために、予測ホライズン内の各時間ステップにおける、バックオフ係数値と、制約ヤコビアン行列と、予測された状態変数の共分散行列とに依存する項による、１つまたは複数の不等式制約の強化に基づき、
確率論的モデル予測コントローラは、前記動的最適化問題を、終了条件が満たされるまで、前記状態および制御変数の固定値についての前記予測ホライズン内における各時間ステップでの前記確率的機会制約の前記共分散行列の伝搬と、前記共分散行列の固定値についての前記予測ホライズン内における前記状態および制御変数の最適化とを交互に行う２レベル最適化に基づいて、解き、前記方法のステップはさらに、
前記最適化された制御変数を含む生成された前記制御コマンドを使用して前記システムの動作を制御するステップを含み、
前記予測ホライズン内における各時間ステップごとの前記共分散行列の前記伝搬は、前記予測ホライズンに対して最適化された前記状態および制御変数の現在の値に対して非線形共分散伝搬方程式を評価することによって実行され、
前記非線形共分散伝搬方程式は、前記予測ホライズンに対して最適化された前記状態および制御変数の前記現在の値に対して事前に計算されたヤコビアン行列を使用して、各制御時間ステップにおける前記共分散行列の正定値性を保つ線形化ベースの離散時間リアプノフ方程式である、予測制御方法。
前記状態および制御変数の前記最適化は、これらの状態および制御変数が、前記非線形動的最適化問題の局所二次計画近似を解くことを含む、請求項９に記載の予測制御方法。
前記システムの状態および制御変数に対する前記制約は不等式制約を含み、前記確率的機会制約は、対応する不等式制約の各々に違反する確率が確率しきい値未満であることを保証するために、前記予測ホライズン内の各時間ステップにおける、バックオフ係数値と、制約ヤコビアン行列と、予測された状態変数の共分散行列とに依存する項による、１つまたは複数の不等式制約の強化に基づく、請求項９または１０に記載の予測制御方法。
前記予測ホライズン内における各時間ステップごとの前記共分散行列の前記伝搬は、前記予測ホライズンに対して最適化された前記状態および制御変数の現在の値に対して非線形共分散伝搬方程式を評価することによって実行される、請求項９または１０に記載の予測制御方法。
制御される前記システムは車両である、請求項９または１０に記載の予測制御方法。
システムの状態および制御変数に対する制約を受ける不確実性の下で前記システムを制御するための予測制御方法を実行するためにプロセッサが実行可能なプログラムが実装される非一時的なコンピュータ読取可能記憶媒体であって、前記方法は、
前記予測制御方法の各制御ステップにおいて、制御コマンドを生成するために前記不確実性を表す確率的機会制約を含む不等式制約付き非線形動的最適化問題を解くことを含み、
前記システムの状態および制御変数に対する前記制約は不等式制約を含み、前記確率的機会制約は、対応する不等式制約の各々に違反する確率が確率しきい値未満であることを保証するために、予測ホライズン内の各時間ステップにおける、バックオフ係数値と、制約ヤコビアン行列と、予測された状態変数の共分散行列とに依存する項による、１つまたは複数の不等式制約の強化に基づき、
確率論的モデル予測コントローラは、前記動的最適化問題を、終了条件が満たされるまで、前記状態および制御変数の固定値についての前記予測ホライズン内における各時間ステップでの前記確率的機会制約の前記共分散行列の伝搬と、前記共分散行列の固定値についての前記予測ホライズン内における前記状態および制御変数の最適化とを交互に行う２レベル最適化に基づいて、解き、前記方法はさらに、
前記最適化された制御変数を含む生成された前記制御コマンドを使用して前記システムの動作を制御することを含み、
前記予測ホライズン内における各時間ステップごとの前記共分散行列の前記伝搬は、前記予測ホライズンに対して最適化された前記状態および制御変数の現在の値に対して非線形共分散伝搬方程式を評価することによって実行され、
前記非線形共分散伝搬方程式は、前記予測ホライズンに対して最適化された前記状態および制御変数の前記現在の値に対して事前に計算されたヤコビアン行列を使用して、各制御時間ステップにおける前記共分散行列の正定値性を保つ線形化ベースの離散時間リアプノフ方程式である、非一時的なコンピュータ読取可能記憶媒体。
前記状態および制御変数の前記最適化は、これらの状態および制御変数が、前記非線形動的最適化問題の局所二次計画近似を解くことを含む、請求項１４に記載の非一時的なコンピュータ読取可能記憶媒体。