JP2024520874A

JP2024520874A - ガウス分布の仮定密度フィルタによる不確実性伝播に基づく確率論的非線形予測コントローラおよび方法

Info

Publication number: JP2024520874A
Application number: JP2024517607A
Authority: JP
Inventors: クイリネン，リエン; バーントープ，カール
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2021-07-01
Filing date: 2022-02-18
Publication date: 2024-05-24
Also published as: WO2023276268A1; US11932262B2; EP4363936A1; US20230022510A1; CN117581166A

Abstract

確率論的非線形モデル予測制御（ＳＮＭＰＣ）は、たとえば確率的な機会制約を含めることによって、ダイナミクスおよび／またはシステム環境の不確実性を直接考慮することができる。しかしながら、ＳＮＭＰＣでは、非線形システムダイナミクスを通して伝播される状態変数の確率分布を近似的に計算する必要がある。本発明は、ガウス分布の仮定密度フィルタ（ＡＤＦ）を用いて、非線形システムダイナミクスを通して状態変数の平均および共分散情報の高精度伝搬を行うことを提案するため、制御性能が改善された扱いやすいＳＮＭＰＣアプローチにつながる。さらに、制約付き最適制御問題（ＯＣＰ）の定式化において、共分散行列変数に行列分解を用いることで、最適化アルゴリズムの各反復における共分散行列の全軌道の正定値性が保証される。最後に、計算コストを大幅に削減し、不確実性の下での非線形動的システムを制御するために提案されたＡＤＦベースのＳＮＭＰＣ法のリアルタイム実行を可能にする、適合された随伴ベースの逐次二次計画法（ＳＱＰ）アルゴリズムについて説明する。

Description

本発明は、一般に予測制御に関し、より特定的には、不確実性の存在下における非線形動的システムの確率論的予測制御のための予測状態変数の平均および共分散情報の高精度伝播の方法ならびに装置に関する。

非線形モデル予測制御（nonlinear model predictive control：ＮＭＰＣ）は成熟しており、比較的複雑な制約付きのプロセスを処理する能力を示している。ＮＭＰＣのような予測コントローラは、非線形微分方程式の組、すなわち常微分方程式（ordinary differential equation：ＯＤＥ）または微分代数方程式（differential-algebraic equation：ＤＡＥ）のシステムによって記述される複雑な動的システムを制御するために、多くの用途で使用することができる。このようなシステムの例として、生産ライン、車両、人工衛星、エンジン、ロボット、発電機およびその他の（半）自動制御機械が挙げられる。
ＮＭＰＣはフィードバックに起因する固有のロバスト性を示すが、このようなコントローラは不確実性を直接考慮しないため、モデルの不確実性および／または外部外乱の存在下では、セーフティクリティカルな制約の充足を保証することができない。ある代替的なアプローチは、不確実性および／または有界外乱が存在する最悪のシナリオにおける制御ポリシーの最適化に依存するロバストＮＭＰＣである。しかしながら、ロバストＮＭＰＣは、最悪のシナリオが極めて低い確率で発生するため、制御性能が保守的になる可能性がある。

確率論的（Stochastic）ＮＭＰＣ（ＳＮＭＰＣ）は、不確実性の確率的記述を最適制御問題（optimal control problem：ＯＣＰ）の定式化に直接組み込むことにより、ロバストＮＭＰＣの保守性を低減することを意図している。ＳＮＭＰＣでは、ある確率で、すなわち、指定されるもののゼロではない制約違反確率を考慮するいわゆる機会制約を定式化することにより、制約が満たされることが要求される。さらに、確率論的ＮＭＰＣは、プラントの実行可能領域の境界付近で閉ループ動作で高い性能が達成されるような設定で有利である。一般的な場合、機会制約は計算が困難であり、たとえば、非線形システムダイナミクスを通して伝搬される状態変数の確率分布の近似計算に基づく近似定式化を必要とする。

サンプリング技術は、不確実性のランダムな実現値の有限集合を用いて確率論的システムダイナミクスを特徴付けるものであるが、不確実性伝播に必要なサンプル数が多いことがよくあるため、計算コストが多大になる可能性がある。シナリオベースの方法は、確率分布の適切な表現を利用するが、シナリオの数を決定するタスクは、ロバスト性と計算効率との間のトレードオフにつながる。状態の遷移確率分布を記述するためにガウス混合近似を用いることができるが、重みを適応するには計算コストがかかることが多い。また、別のアプローチは多項式カオス（polynomial chaos：ＰＣ）を使用し、暗黙的マッピングを直交多項式基底関数の展開に置き換えるが、時変不確実性の場合、ＰＣベースの確率論的ＮＭＰＣは多くの展開項を必要とする。

または、たとえば、テイラー級数近似に基づく非線形システムダイナミクスの陽的線形化を用いて、確率的機会制約を近似することができる。しかしながら、結果として得られる線形化ベースの共分散伝播は、非線形システムダイナミクスについて十分に正確でない可能性がある。さらに、後者のアプローチでは、状態変数の平均値の正確な伝搬ができず、非線形システムダイナミクスの公称値（すなわち、不確実性ゼロおよび/または外乱ゼロに対応する値）と異なる可能性がある。したがって、不確実性の下での非線形動的システムの確率論的予測制御において、確率的機会制約を定式化するために、平均および共分散情報の直接扱いやすいが正確な伝搬が必要である。

直接最適制御法は、制御範囲の離散化と予測範囲にわたる制御アクションの対応するパラメータ化とに基づく連続時間微分方程式の離散化に依存している。さらに、確率論的予測制御用途の場合、予測範囲にわたる制御フィードバックのパラメータ化に基づく非線形システムダイナミクスの不確実性を伝播するための離散時間または離散化された方程式の組を、直接ＯＣＰ定式化に含めることができる。結果として得られる大規模な非線形最適化問題または非線形計画（nonlinear program：ＮＬＰ）は、任意の非線形最適化ソルバによって解くことができる。しかしながら、非線形システムの予測制御のリアルタイム用途の場合、この非線形最適化問題は、厳密なタイミング制約の下で、計算能力が限られ、かつ利用可能なメモリが限られた組込みハードウェア上で、解く必要がある。

非線形微分方程式で記述されるシステムの確率論的予測制御は、各制御時間ステップにおいて非線形確率論的最適制御問題の解を必要とする。各問題を厳密に解く代わりに、ある時点から次の時点へ解の推測を更新するために、逐次二次計画法（sequential quadratic programming：ＳＱＰ）の１つのリアルタイム反復を実行することができる。このようなニュートン型ＳＱＰアルゴリズムは、アルゴリズムの各反復において、非線形制約関数および目的関数の線形化を必要とする。この線形化は、特に非線形システムダイナミクスの不確実性伝搬を記述する方程式の組の場合、コストがかかる可能性があり、陽的積分法を使用する場合にはヤコビアン評価が必要となり、非線形微分方程式を離散化する陰的積分法の場合には、非線形連立方程式を解くための行列分解、行列－行列乗算、および／または反復手順がさらに必要となる可能性がある。

したがって、結果として得られるＳＮＭＰＣコントローラの閉ループ性能を向上させるために、非線形システムダイナミクスを通じて状態変数の平均および共分散情報を伝播する精度を高める必要があり、不確実性の下での非線形動的システムのための確率論的予測制御のリアルタイム用途において、数値最適化アルゴリズムの計算コストを削減する必要がある。

いくつかの実施形態の目的は、システムの動的モデルを記述する非線形微分方程式の離散化、および非線形システムダイナミクスの不確実性の離散時間伝搬に基づいて、確率的機会制約を含む不等式制約付き非線形動的最適化問題を解くことによって、不確実性の下でシステムを制御するためのシステムおよび方法を提供することである。確率的機会制約の各々は、対応する不等式制約に違反する確率が、ある確率閾値を下回るように保証することを目的とする。

本発明のいくつかの実施形態は、バックオフ係数値と、制約ヤコビアン行列と、特定の時間ステップにおける予測状態値の一次および／または高次モーメント積分とに依存する項を有する不等式制約ごとの強化に基づく確率的機会制約の定式化を使用する。本発明のいくつかの実施形態において、一次および／または高次モーメント積分は、平均である第１のモーメント積分と、共分散である第２のモーメント積分とを含む。共分散行列は、近似線形化ベースの共分散伝播を用いて、制御範囲内の各時間ステップにおける状態値について効率的に計算することができる。線形化ベースの共分散方程式は、非線形システムダイナミクスを通して状態変数の平均および共分散情報の正確でない伝播につながる可能性がある。したがって、本発明のいくつかの実施形態において、ガウス分布の仮定密度フィルタ（assumed density filter：ＡＤＦ）を用いて、非線形システムダイナミクスを通して状態変数の平均および共分散情報の高精度の伝搬を実行する。状態変数の平均および共分散情報のより正確な伝播は、不確実性の下での非線形動的システムの確率論的予測制御の性能向上につながり得る。

本発明のいくつかの実施形態によれば、システムの状態および制御変数に対する制約を受ける不確実性の下でシステムを制御するための予測コントローラを提供することができる。予測コントローラは、少なくとも１つのプロセッサと、命令を格納したメモリとを備え得る。命令は、少なくとも１つのプロセッサによって実行されると、予測コントローラに、予測コントローラの各制御ステップにおいて、制御信号を生成するために、不確実性を表す確率的機会制約を含む不等式制約付き非線形動的最適化問題を解かせる。予測コントローラは、確率的機会制約に基づいて、ガウス分布の仮定密度フィルタリング（ＡＤＦ）に基づく離散時間近似伝搬方程式を用いて、直接最適制御構造化非線形プログラム（ＮＬＰ）を解いて、予測範囲内のある時間ステップから次の時間ステップまで、状態確率分布の一次および／または高次モーメント積分の近似予測を、時変モデル化不確実性および／または外部外乱のうちの１つまたは複数の時変モデル化不確実性および／または外部外乱の確率分布の一次および／または高次モーメント積分に応じて、終了条件が満たされるまで実行する。命令はさらに、予測コントローラに、制御信号を用いてシステムの動作を制御させる。

本発明のいくつかの実施形態は、確率的機会制約の制約関数が線形またはやや非線形である場合、制御範囲内の各時間ステップにおける予測状態値の共分散行列を考慮して、不等式制約ごとの線形化ベースの強化が厳密または十分に正確であり得る、という認識に基づいている。本発明のいくつかの実施形態は、確率的機会制約の制約関数が高度に非線形である場合、線形化ベースの強化は不正確である可能性があるが、代わりに、ＡＤＦを用いて、状態変数および／または制御入力変数に非線形に依存する制約関数ごとに、高精度の平均および共分散情報を直接計算することができる、という認識に基づいている。

たとえば、非線形システムダイナミクスの場合、たとえば拡張カルマンフィルタリング（extended Kalman filtering：ＥＫＦ）を使用する平均および共分散情報の線形化ベースの伝播よりも、アンセンテッド・カルマンフィルタリング（unscented Kalman filtering：ＵＫＦ）の方が正確であることが知られている。本発明のいくつかの実施形態は、ＵＫＦが、ガウス分布の仮定密度フィルタ（ＡＤＦ）のさらに一般的なファミリーの一部である線形回帰カルマンフィルタリング（linear-regression Kalman filtering：ＬＲＫＦ）のより一般的なファミリーの特別な場合である、という認識に基づいている。本発明のいくつかの実施形態は、ＡＤＦが、（たとえば、ＥＫＦにおける）テイラー級数近似に基づく陽的線形化の代わりに、１つおよび／または複数の高次モーメント積分の近似マッチングに基づく統計的線形化を使用する、という認識に基づいている。したがって、ＥＫＦは、非線形性を処理するための陽的線形化ベースに基づく一次法である一方、統計的線形化に基づくＡＤＦのファミリーは、非線形システムダイナミクスを介した状態変数の平均および共分散情報の伝播において、二次以上の精度を達成することができる。

本発明のいくつかの実施形態において、状態変数の平均および共分散情報の伝播のための連続時間方程式を得るために、ＡＤＦが連続時間システムダイナミクスに適用される。結果として得られる連続時間ＯＣＰは、数値最適化アルゴリズムで解くことができる扱いやすい非線形最適化問題に到達するために、時間離散化および最適制御パラメータ化に基づいて、たとえば、直接シングルシューティング、マルチプルシューティング、直接コロケーションまたは擬似スペクトル法を用いて、解くことができる。

本発明のいくつかの実施形態において、状態変数の平均および共分散情報の伝播の離散時間方程式を得るために、離散時間または離散化システムダイナミクスにＡＤＦが適用される。いくつかの実施形態は、離散時間共分散伝搬方程式が計算コストを削減し、各制御時間ステップにおける共分散行列の正定値性を保持できる、という認識に基づいている。いくつかの実施形態は、共分散行列が、各時間ステップにおける予測された状態値についての厳密な共分散の過大評価であることを保証するために、すなわち、矛盾のない予測をもたらすために、共分散伝播に非線形性界を含むことができ、その結果、確率的機会制約の各々は、違反の確率がある閾値を下回ることを保証する。

本発明のいくつかの実施形態は、予測された状態値の平均および共分散の不確実性情報の順方向伝播において、フィードバック制御アクションを考慮するべきである、という認識に基づいている。いくつかの実施形態は、非線形システムダイナミクスを事前に安定化させるために、アフィンフィードバックゲインの時不変または時変シーケンスを使用して非線形システムダイナミクスを事前に安定化させ、その結果、将来における不確実性および／または外乱に対するフィードバック制御アクションの影響を直接考慮する状態平均および共分散伝播方程式となる。たとえば、基準定常状態および入力値における線形化システムダイナミクスの無限範囲での線形－二次レギュレータは、確率論的非線形ＯＣＰ定式化においてシステムダイナミクスを事前安定化させるために使用することができる。

不等式制約ごとの個別の強化に基づく確率的機会制約の近似定式化を用いて、結果として生じる不等式制約付き非線形動的最適化問題を、最適性条件および実現可能性条件の逐次線形化に基づくニュートン型最適化アルゴリズムを用いて解くことができる。このようなニュートン型最適化アルゴリズムの例として、内点法（interior point method：ＩＰＭ）および逐次二次計画法（ＳＱＰ）が挙げられる。本発明のいくつかの実施形態は、ＳＱＰアルゴリズムが、ＳＱＰ最適化アルゴリズムの各反復において、確率論的非線形ＯＣＰの二次計画（ＱＰ）近似を、不等式制約ごとに、かつ強化された確率的機会制約ごとに、目的関数の線形－二次近似、離散化されたシステムダイナミクスの線形化ベースの近似、離散時間共分散伝搬方程式、および線形化ベースの近似に基づいて解く、という認識に基づいている。

システムの元の動的モデルが連続時間微分方程式の組によって記述されている場合、本発明のいくつかの実施形態は、離散時間または離散化ＡＤＦベースの状態平均および共分散伝播方程式を構築するために、陽的または陰的数値積分法、たとえば陽的または陰的ルンゲ・クッタ法を用いて、システムダイナミクスを離散化する。いくつかの実施形態は、ニュートン型最適化アルゴリズムの各反復において、状態平均および共分散伝播方程式の線形化は、非線形システムダイナミクスについて一次および／または高次導関数の評価を必要とし、これは、ダイナミクスが高次元および／または計算上複雑である場合、たとえば、ダイナミクスが長い非線形式を含む場合、および／または硬直した、もしくは陰的に定義された微分方程式の組によって記述されている場合に、計算コストが高いステップを形成し得る、という認識に基づいている。

本発明のいくつかの実施形態において、確率論的ＯＣＰ定式化における最適化変数は、たとえば、状態共分散行列の順コレスキー分解または逆コレスキー分解を使用する、制御範囲の各時間ステップにおける状態変数の共分散行列についての行列分解の因子を含む。本発明のいくつかの実施形態は、状態共分散行列ではなくコレスキー因子のみを最適化変数に含める必要があるように、ＡＤＦベースの状態平均および共分散伝播方程式が、コレスキー因子の観点から、たとえば、コレスキー分解演算子を用いて直接、再定式化可能である、という認識に基づいている。さらに、本発明のいくつかの実施形態は、状態共分散行列の軌道をコレスキー因子の対応する軌道から計算することができ、それゆえ、状態共分散行列は、各制御時間ステップおよび任意の最適化アルゴリズムの各反復において常に正定値であると保証される、という認識に基づいている。

本発明のいくつかの実施形態は、コレスキー分解演算子があらゆる場所で定義されることを保証するために、ＡＤＦベースの共分散伝播方程式に小さな正則化項を追加する必要とされる場合があり得るように、（順方向または逆方向）コレスキー分解が正定値行列についてのみ定義される、という認識に基づいている。コレスキー分解演算子の一次および高次導関数は、アルゴリズム的微分技術の順方向または逆方向モードによって計算することができる。

本発明のいくつかの実施形態は、厳密でない導関数ベースの最適化アルゴリズムが、システムダイナミクス、共分散伝播方程式、不等式制約、および確率的機会制約に関して実現可能な確率論的非線形ＯＣＰの解に収束するが、この解は、厳密でない導関数計算に起因して準最適である可能性がある、という認識に基づいている。その代わりに、本発明のいくつかの実施形態は、実行可能かつ局所最適な確率論的非線形ＯＣＰの解に収束する、厳密でない導関数の使用を補正するための随伴ベースの勾配計算を伴う、厳密でない導関数ベースの最適化アルゴリズムに基づいている。なお、共分散伝播方程式の随伴計算は、完全なヤコビアン行列ではなく単一の勾配に対応するシステムダイナミクスの一次および／または高次導関数の評価を必要とする。いくつかの実施形態において、後者の随伴勾配計算は、アルゴリズム的または自動微分の随伴モードの１回の掃引を用いて効率的に実行することができる。

本発明のいくつかの実施形態において、提案されたＳＮＭＰＣのための厳密でない最適化アルゴリズム（場合によっては、随伴ベースの勾配計算を伴う）は、３つの主要な計算ステップからなる。第１のステップでは、線形－二次目的関数を準備し、ベクトルおよび平均およびヤコビアン行列を計算して、線形化された等式および不等式制約を準備し、随伴ベースの勾配計算を評価し、予測された平均状態値および制御値の現在の軌道ならびに共分散行列および／またはコレスキー因子の現在の値が与えられると、目的関数および制約関数の各々から、共分散行列および／またはコレスキー因子を数値的に削除する。第２のステップは、確率的機会制約の各々を近似するための１つまたは複数の強化された不等式制約を有する、結果として得られるブロック構造化ＱＰ下位問題を解くことからなる。第３の最終ステップは、予測された状態および制御値の軌道についてのニュートン型更新に加えて、ラグランジュ乗数の対応する更新の展開と、制御範囲にわたる共分散行列および／またはコレスキー因子の軌道の更新とを含む。

本発明のいくつかの実施形態は、たとえば、高度に非線形性なＡＤＦベースの状態平均および共分散伝播方程式に起因して、確率論的ＯＣＰ問題を解くための導関数ベースの最適化アルゴリズムの収束挙動を改善するために、グローバル化技術が必要な場合がある、という認識に基づいている。このようなグローバル化技術の一例として、たとえば、ＳＱＰ最適化法を用いて、導関数ベースの最適化アルゴリズムの反復ごとに、最適性条件と実現可能性条件との両方に依存するメリット関数の十分な減少条件を満たすことができることを保証するために、主最適化変数および／または双対最適化変数のニュートン型更新におけるステップサイズを計算する直線探索法が挙げられる。本発明のいくつかの実施形態において、主最適化変数および／または双対最適化変数のニュートン型更新のための後者の直線探索ベースのステップサイズ選択は、ＳＮＭＰＣコントローラの最適化アルゴリズムにおける第３のステップの一部であり得る。

本発明のいくつかの実施形態は、共分散および／またはコレスキー因子に加えて、確率論的最適制御問題における平均状態変数も、各反復において圧縮手順に基づいて数値的に削除することができ、これは、離散時間システムダイナミクスを用いて、予測範囲内の各段階の状態変数を、初期状態値の関数として規定し、予測範囲内の前のすべての段階における制御変数を規定する、という認識に基づいている。この完全または部分的な圧縮手順は、より小さいが全体的により高密度の最適化問題となり、この問題では、等式制約はより少ないかまたは存在せず、同じ量の不等式制約および確率的機会制約があり、これらは、ＯＣＰ内の残りの最適化変数に関して説明される。本発明のいくつかの実施形態は、同じ厳密でない導関数ベースの最適化アルゴリズムを、そのような圧縮手順と組み合わせて使用することができる、という認識に基づいている。より具体的には、平均状態変数の数値的削除は、第１のステップにおいて追加的に実行され、密なＱＰ解は、第２のステップにおいて実行され、一方、圧縮された状態変数の展開は、ＳＮＭＰＣのための厳密でない最適化アルゴリズムの第３のステップにおいて追加的に実行される。

本発明のいくつかの実施形態は、確率論的予測コントローラにおける各制御時間ステップにおいて、提案された厳密なまたは厳密でない導関数ベースの最適化アルゴリズムの反復を１回実行することによって、非線形確率論的ＯＣＰを解くためのリアルタイム反復方法を使用する。つまり、各制御時間ステップにおいて、非線形確率論的最適化問題のブロック構造化局所（凸）ＱＰ近似のために、１つの準備、解法、展開ステップを実行するだけでよい。ＱＰの準備には、離散化非線形システムダイナミクスを課す非線形方程式の線形化と、非線形不等式制約の線形化と、共分散行列および／またはコレスキー因子の圧縮または削除と、随伴勾配計算のオプションの評価オプションとが含まれる。この準備に基づいて、結果として得られるブロック構造化ＱＰが解かれ、これに、確率論的非線形予測コントローラの各ステップにおいてシステムを制御するために使用される制御解を生成するために、すべての主最適化変数およびラグランジュ乗数値を更新する展開ステップが続く。

添付の図面を参照して、現在開示されている実施形態をさらに説明する。示された図面は、必ずしも縮尺通りではなく、一般に、現在開示されている実施形態の原理を説明することに重点が置かれている。

いくつかの実施形態に係る、不確実性を伴うシステムのための予測コントローラとフィードバックループとを示すブロック図である。いくつかの実施形態に係る、不確実性を伴うシステムのための確率論的予測コントローラとフィードバックループとを示すブロック図である。本発明のいくつかの実施形態に係る、ＣＰＵプロセッサおよびメモリを用いて実現されたコントローラと、フィードバックシステムとを示すブロック図である。本発明の実施形態に係る、非線形システムダイナミクスのガウス分布の仮定密度フィルタ（ＡＤＦ）を用いた、ある時間ステップから次の時間ステップまでの状態確率分布の予測を示す概略図である。本発明のいくつかの実施形態に係る、非線形システムダイナミクスに影響を与える時変不確実性および／または外乱を含む、状態確率分布の予測を示す概略図である。本発明のいくつかの実施形態に係る、非線形システムダイナミクスの陽的線形化に基づく、状態平均および共分散情報の離散時間または離散化伝搬を示すブロック図である。本発明のいくつかの実施形態に係る、非線形システムダイナミクスの統計的線形化に基づく、状態平均および共分散情報の離散時間または離散化伝搬を示すブロック図である。いくつかの実施形態に係る、不確実性の下での被制御システムの確率論的予測コントローラを実現するための確率論的非線形モデル予測制御（ＳＮＭＰＣ）法を示すブロック図である。いくつかの実施形態に係る、離散時間システムダイナミクスおよび確率的機会制約に基づく、直接最適制御構造化非線形プログラム（ＮＬＰ）を解くＳＮＭＰＣ法を示すブロック図である。いくつかの実施形態に係る、状態平均および共分散の陽的線形化ベースの伝播方程式に基づいて、直接最適制御構造化ＮＬＰを解くＳＮＭＰＣ法を示すブロック図である。いくつかの実施形態に係る、状態平均および共分散の統計的線形化ベースの伝搬方程式に基づいて、直接最適制御構造化ＮＬＰを解くＳＮＭＰＣ法を示すブロック図である。いくつかの実施形態に係る、確率論的予測コントローラにおける確率的機会制約の近似を示すブロック図である。確率論的予測コントローラにおける確率的機会制約の定式化および近似の背後にある考えを示す説明図である。いくつかの実施形態に係る、連続時間における非線形システムダイナミクスの状態平均および共分散伝播を示すブロック図である。いくつかの実施形態に係る、離散時間における非線形システムダイナミクスの状態平均および共分散伝播を示すブロック図である。いくつかの実施形態に係る、離散時間における事前安定化非線形システムダイナミクスの陽的線形化ベースの状態平均および共分散伝播を示すブロック図である。いくつかの実施形態に係る、離散時間における事前安定化非線形システムダイナミクスの統計的線形化ベースの状態平均および共分散伝播を示すブロック図である。本発明のいくつかの実施形態に係る、状態フィードバック制御アクションに起因する確率的機会制約としての制御境界の定式化および近似を示すブロック図である。確率論的予測コントローラにおける各時間ステップにおいて制約付き非線形最適制御問題を解くための反復微分ベースの最適化手順を示すブロック図である。確率論的予測コントローラで解く必要のある最適制御構造化ＮＬＰのコンパクトな定式化を示す図である。本発明のいくつかの実施形態に係る、確率論的予測コントローラにおける最適制御構造化ＮＬＰの厳密なヤコビアンベースの局所二次計画（ＱＰ）近似を示すブロック図である。いくつかの実施形態に係る、予測時間範囲にわたる現在の平均状態値および制御値を考慮した、状態平均値および共分散行列値の明示的かつ逐次的な計算を示すブロック図である。非線形等式制約関数の１つまたは複数の一次導関数および／または高次導関数を評価することを必要とせずに、本発明のいくつかの実施形態に係る、確率論的予測コントローラを効率的に実現するための反復的かつ厳密でないＳＱＰ最適化アルゴリズムを示すブロック図である。いくつかの実施形態に係る、随伴ベースの厳密でないＳＱＰ最適化アルゴリズムの実現のための、ヤコビアン行列近似および対応する随伴ベースの勾配補正、圧縮された制約評価、ならびにラグランジュ乗数展開ステップを示すブロック図である。収束特性を改善するための随伴ベースの勾配補正に基づく確率論的予測コントローラの効率的な実現のための反復的かつ厳密でないＳＱＰ最適化アルゴリズムを示すブロック図である。本発明のいくつかの実施形態に係る、確率論的非線形モデル予測制御を実現するための、随伴ベースの厳密でないＳＱＰ最適化アルゴリズムのリアルタイム変形例を示すアルゴリズム説明図である。本発明のいくつかの実施形態に係る、確率論的予測コントローラにおけるリアルタイム随伴ベースのＳＱＰ最適化アルゴリズムのステップサイズ値について十分な減少条件が満たされるような、望ましいステップサイズ選択のための探索手順の一例を示す図である。随伴ベースのＳＱＰ最適化アルゴリズムにおいて、状態共分散行列のコレスキー因子の更新シーケンスを計算するための、順方向再帰における制約ヤコビアン行列のブロック構造化スパース性の利用を示すブロック図である。随伴ベースのＳＱＰ最適化アルゴリズムにおいて、圧縮された不等式制約値を計算するための順方向再帰における制約ヤコビアン行列のブロック構造化スパース性の利用を示すブロック図である。随伴ベースのＳＱＰ最適化アルゴリズムにおいて、圧縮された等式制約値を計算するための順方向再帰における制約ヤコビアン行列のブロック構造化スパース性の利用を示すブロック図である。随伴ベースのＳＱＰ最適化アルゴリズムにおいて、更新されたラグランジュ乗数値を計算するための逆方向再帰における制約ヤコビアン行列のブロック構造化スパース性の利用を示すブロック図である。いくつかの実施形態の原理を採用した確率論的予測コントローラを含む車両を示す概略図である。いくつかの実施形態の原理を採用した確率論的予測コントローラと、いくつかの実施形態に係る車両１００１のコントローラとの間の相互作用を示す概略図である。本発明のいくつかの実施形態の原理を採用した、不確実性の下での被制御車両の運動計画および／または確率論的予測制御方法を示す概略図である。本発明のいくつかの実施形態の原理を採用した、不確実性の下での被制制御車両の運動計画および／または確率論的予測制御方法を示す概略図である。

実施形態の説明
図を参照して、本発明のさまざまな実施形態を以下で説明する。なお、図面は縮尺通りに描かれておらず、同様の構造または機能の要素は、図面全体を通して同様の参照数字で表されている。また、図面は、本発明の特定の実施形態の説明を容易にすることを意図しているに過ぎない。これらは、本発明の網羅的な説明として、または本発明の範囲の限定として意図されるものではない。くわえて、本発明の特定の実施形態と併せて説明される態様は、必ずしも当該実施形態に限定されるものではなく、本発明の他の任意の実施形態において実施され得る。

以下の説明は、例示的な実施形態のみを提供するものであり、本開示の範囲、適用性、または構成を限定することを意図するものではない。むしろ、例示的な実施形態の以下の説明は、１つ以上の例示的な実施形態を実施するための可能な説明を当業者に提供するものである。意図されるのは、添付の特許請求の範囲に記載されるように開示された主題の精神および範囲から逸脱することなく、要素の機能および配置において行われ得るさまざまな変更である。

本発明のいくつかの実施形態は、不確実性を伴うシステムまたは確率論的予測コントローラを使用するシステムの動作を制御するためのシステムおよび方法を提供する。確率論的予測コントローラの例は、被制御システムのモデルと不確実性のモデルとに基づいて制御入力を決定する確率論的モデル予測制御（stochastic model predictive control ：ＳＭＰＣ）である。

図１Ａは、いくつかの実施形態に係る、状態推定器１３１を介して予測コントローラ１１０に接続された、不確実性１２５を伴うシステム１２０の例を示す。いくつかの実現例において、予測コントローラは、システムの動的モデル１４０に従ってプログラムされたモデル予測コントローラ（model predictive controller：ＭＰＣ）である。モデルは、現在および以前の入力１１１と以前の出力１０３との関数として、経時的なシステム１２０の状態および出力１０３の変化を表す一組の方程式であり得る。モデルは、システムの物理的制限および動作上の制限を表す制約１４２を含み得る。動作中、コントローラは、システムの所望の挙動を示すコマンド１０１を受信する。コマンドは、たとえばモーションコマンドである。コマンド１０１の受信に応答して、コントローラは、不確実性１２５を伴う実システム１２０の入力として機能する制御信号１１１を生成する。入力に応答して、システム１２０は、システム１２０の出力１０３を更新する。システムの出力１０３の測定値に基づいて、状態推定器１３１は、システム１２０の推定状態１２１を更新する。システムのこの推定状態１２１は、コントローラ１１０に状態フィードバックを提供する。場合によっては、出力１０３の測定値は、実システム１２０に配置されたセンサ（図示せず）または実システム１２０のアクチュエータ（複数可）／回路（複数可）によって提供され得る。さらに、不確実性１２５は、実システム１２０上またはその周囲に配置された１つ以上の位置における温度、圧力、または空気の流れ、またはそれらの１つ以上の組み合わせによって示す外部外乱、システム１２０に作用する電流、力、もしくはトルク、モデル化されていないダイナミクス、または実システム１２０上／内に配置されたセンサもしくは他のセンサによって測定された不確実な摩擦係数、物体の質量、もしくは不確実な係数およびパラメータなどの物理量における不確実性を含む、観測可能／測定可能な物理量（信号）であり得る。

本明細書で言及するシステム１２０は、電圧、圧力、力、トルクなどの物理量に関連する可能性のある特定の操作入力信号１１１（入力）によって制御され、電流、流量、速度、前の状態から現在の状態へのシステムの状態の遷移を示す位置などの物理量に関連する可能性のあるいくつかの被制御出力信号１０３（出力）を返す、任意の機械または装置であり得る。出力値は、一部はシステムの以前の出力値に関連し、一部は以前および現在の入力値に関連する。以前の入力および以前の出力への依存性は、システムの状態で符号化される。システムの動作、たとえばシステムのコンポーネントの運動は、特定の入力値の適用後にシステムによって生成される出力値のシーケンスを含み得る。

不確実性１２５は、システム１２０に作用する外部外乱、力またはトルクを含む任意の時変不確実性、モデル化されていないダイナミクス、または不確実な摩擦係数、物体の質量、もしくは実システム１２０の物理的挙動を記述する動的モデル方程式における不確実な係数およびパラメータなどの、物理量における不確実性であり得る。ＭＰＣコントローラのほとんどの実現は、コントローラの計算複雑性を低減するため、または物理的挙動の一部が複雑すぎることによってモデル化が困難または不可能であるために、単純化された動的モデル１４０を使用し、その結果、実システムの物理的挙動の大部分がモデル化されないままとなる。なお、時不変不確実性は、状態およびパラメータ推定器１３１の一部として、オンラインまたはオフラインのいずれかで推定または学習可能である。

システム１４０の動的モデルは、現在の入力および以前の入力、ならびに以前の出力の関数として、システムの出力が経時的にどのように変化するかを記述するために、時不変または時変である可能性があり、線形または非線形である可能性がある方程式である、一組の数学的方程式を含み得る。システムの状態とは、一般に時間的に変化する情報の任意の集合であり、たとえば、現在および以前の入力と出力との適切な部分集合であり、システムの動的モデルおよび将来の入力と共に、システムの将来の運動を一意に（しかし近似的に）定義することができる。実システム１２０は、出力、入力、および場合によってはシステムの状態が動作可能な範囲を制限する物理的制限および仕様制約１４２を受ける可能性がある。

コントローラ１１０は、固定または可変の制御周期サンプリング間隔でシステム１２１の推定状態および所望のモーションコマンド１０１を受信し、この情報を用いて、システムを動作させるための入力、たとえば制御信号１１１を決定する、ハードウェアで、またはプロセッサ（たとえばマイクロプロセッサ）で実行されるソフトウェアプログラムとして実装することができる。

状態推定器１３１および（図１Ｂにおける）不確実性推定器１３２は、固定もしくは可変の制御周期サンプリング間隔でシステム１０３の出力を受信し、新たな出力測定値および以前の出力測定値を用いて、システム１２０の推定状態１２１を決定する、ハードウェアで、またはコントローラ１１０と同じもしくは異なるプロセッサのいずれかで実行されるソフトウェアプログラムとして実装することができる。

図１Ｂは、いくつかの実施形態に係る、状態推定器１３１および不確実性推定器１３２を介して確率論的予測コントローラ１５０に接続された、不確実性１２５を伴うシステム１２０の例を示す。いくつかの実現例では、確率論的予測コントローラ１５０は、実システム１２０および不確実性の動的モデル１４０に従ってプログラムされた確率論的モデル予測コントローラ（ＳＭＰＣ）である。動的モデル１４１は、不確実性１２５とシステム１２０の挙動との関係とをモデル化するための不確実性モデル１４１を含む。不確実性モデルは、不確実性とシステムの動的挙動を記述する動的モデル方程式との間の線形および／または非線形関係のモデルを含む。さらに、不確実性モデルは、動的モデルにおける時変不確実性ごとの確率分布のモデルを含む。

本発明のいくつかの実施形態において、確率論的予測コントローラ１５０の動的モデル１４０は、１つまたは複数の確率的機会制約１４３を含み得る。システムの物理的制限および仕様制約のいずれかは、対応する制約に違反する確率がある確率閾値を下回ることを強制することを目的とする、１つまたは複数の確率的機会制約１４３として定式化することができる。

本発明のいくつかの実施形態において、不確実性推定器１３２は、不確実性１２２の推定値、たとえば、確率論的予測コントローラ１５０によって使用される動的モデル１４０内の複数の時変不確実性のうちの１つまたは複数の時変不確実性についての確率分布の一次および／または高次モーメントの推定値を提供する。本発明のいくつかの実施形態において、状態推定器１３１および不確実性推定器１３２は、単一の状態で不確実性パラメータ推定器コンポーネント１３０において一緒に実装され、これらは、固定または可変制御周期サンプリング間隔でシステム１０３の出力を受信し、新たな出力測定値および以前の出力測定値を用いて、システム１２０および不確実性１２５の推定状態１２１および推定不確実性１２２、ならびに場合によっては１つまたは複数の追加の推定パラメータ値を決定する。

図１Ｃは、いくつかの実施形態に係る確率論的予測コントローラ１５０を示すブロック図であり、このコントローラは、システムの推定状態１２１および出力１０３が、推定不確実性１２２を与えられるとコマンド１０１に従うように、システムを作動させる。確率論的予測コントローラ１５０は、入力インターフェース１５１と、出力インターフェース１５２と、不確実性１２５を伴う実システム１２０の動作に関する動的モデル１４０、不確実性モデル１４１、制約１４２、および確率的機会制約１４３を格納するためのメモリ１６５に接続された、たとえば単一の中央処理装置（central processing unit：ＣＰＵ）または複数のＣＰＵプロセッサ１６０の形式のコンピュータとを含み得る。プロセッサ（複数可）１６０は、入力インターフェース１５１を介して推定状態１２１およびコマンド１０１を取得し／受付け、出力インターフェース１５２を介して実システム１２０に制御信号１１１を送信するように構成されている。プロセッサ（複数可）１６０は、シングルコアマイクロプロセッサ、マルチコアプロセッサ、コンピューティングクラスタ、複数のプロセッサが接続されたネットワーク、または任意の数の他の構成であり得る。メモリ１６５は、ランダムアクセスメモリ（random access memory：ＲＡＭ）、読み取り専用メモリ（read only memory：ＲＯＭ）、フラッシュメモリ、または任意の他の適切なメモリシステムを含み得る。

最後に、本発明のいくつかの実施形態に係る、離散時間または離散化非線形システムダイナミクスの陽的線形化ベースの伝搬方程式を用いて、状態平均および共分散情報の離散時間または離散化伝搬において、１つまたは複数の追加ステップ２５５を実行することができる。

本発明のいくつかの実施形態は、アンセンテッド・カルマンフィルタリング（ＵＫＦ）を使用して、非線形システムダイナミクスについて、たとえば拡張カルマンフィルタリング（ＥＫＦ）を使用して、平均および共分散情報の陽的線形化ベースの伝播よりも正確な平均および共分散情報の伝播を計算することができる、という認識に基づいている。本発明のいくつかの実施形態は、ＵＫＦが、線形回帰カルマンフィルタリング（ＬＲＫＦ）のより一般的なファミリーの特別な場合であり、これは、不確実性の下での被制御システムの確率論的予測コントローラの実現において使用することができるガウス分布の仮定密度フィルタ（ＡＤＦ）のさらに一般的なファミリーの一部である、という認識に基づいている。本発明のいくつかの実施形態は、ＡＤＦが、（たとえば、ＥＫＦにおける）テイラー級数近似に基づく陽的線形化の代わりに、１つおよび／または複数の高次モーメント積分の近似マッチングに基づく統計的線形化を使用する、という認識に基づいている。したがって、ＥＫＦは、非線形性を処理するための陽的線形化に基づく一次手法である一方、統計的線形化に基づくＡＤＦのファミリーは、非線形システムダイナミクスを介した状態変数の平均および共分散情報の離散時間または離散化された伝搬において、二次またはより高次の精度を達成することができる。

本発明のいくつかの実施形態は、特定のクラスの問題について、１つおよび／または複数の高次モーメント積分のマッチングに基づく統計的線形化を解析的に実行可能であり、これにより、平均および共分散情報の伝播の精度がさらに改善され、それゆえ、不確実性の下での被制御システムの確率論的予測コントローラの性能がさらに改善される、という認識に基づいている。

最後に、本発明のいくつかの実施形態に係る、状態平均および共分散情報の離散時間または離散化された伝搬において、不確実性の下での被制御システムの離散時間または離散化非線形システムダイナミクスの統計的線形化ベースの伝搬方程式を用いて、１つまたは複数の追加ステップ２７５を実行することができる。本発明のいくつかの実施形態において、統計的線形化ベースの伝搬方程式の１つまたは複数のステップにおいて、異なる積分点および重みの集合を使用することができる。

図３Ａは、本発明のいくつかの実施形態に係る、システムの現在の状態推定１２１を考慮し、推定不確実性１２２と制御コマンド１０１とを考慮した、制御信号１１１を計算する確率論的予測コントローラ１５０を実現するための確率論的非線形モデル予測制御（ＳＮＭＰＣ）のシステムおよび方法を示すブロック図である。具体的には、ＳＮＭＰＣは、各制御時間ステップにおいて制約付き最適化問題３５０を解くことによって、制御解、たとえば、システムの予測時間範囲にわたる将来の最適な、またはほぼ最適な制御入力のシーケンスを含む解ベクトル３６５を計算する（３６０）。この最適化問題３５０における目的関数、等式制約および不等式制約のデータ３４５は、動的モデルおよびシステム制約３４０と、システムの現在の状態推定１２１と、推定不確実性１２２と、制御コマンド１０１とに依存する。

本発明の実施形態は、直接最適制御法を使用して、連続時間ＳＮＭＰＣ問題を不等式制約付き非線形動的最適化問題として定式化する。本発明のいくつかの実施形態は、導関数ベースの最適化アルゴリズムを使用して、ニュートン法と、最適化問題の実行可能性条件および最適性条件の逐次線形化とに基づく反復手順を用いて、不等式制約付き最適化問題３５０を厳密にまたは近似的に解く。このようなニュートン型最適化アルゴリズムの例として、内点法（ＩＰＭ）および逐次二次計画法（ＳＱＰ）が挙げられる。本発明のいくつかの実施形態は、不等式制約付き最適化問題３５０が、微分ベースの最適化アルゴリズムの実現を利用する構造を各制御時間ステップにおいて解ベクトル３６５を計算するために使用可能となるような最適制御構造化非線形プログラム（ＮＬＰ）の形式を有している、という認識に基づいている。

本発明のいくつかの実施形態において、不等式制約付き最適化問題３５０の解は、現在の制御時間ステップにおいて不等式制約付き最適化問題３５０を解く計算労力を低減するために、メモリから読み出すことができる、前の制御時間ステップ３１０からの予測時間範囲にわたる厳密なまたは近似的な制御入力、状態平均値および／または共分散値を、解の推測として使用する。前の制御時間ステップ３１０における解情報から解の推測を計算するこの概念は、最適化アルゴリズムのウォーム・スタートまたはホット・スタートと呼ばれ、本発明のいくつかの実施形態において、ＳＮＭＰＣコントローラの必要な計算労力を削減することができる。同様の方法で、対応する解ベクトル３６５を使用して、次の制御時間ステップについて厳密なまたは近似的な制御入力、状態平均値および／または共分散値のシーケンスを更新し格納する（３６０）ことができる。本発明のいくつかの実施形態において、現在の制御時間ステップにおける不等式制約付き最適化問題３５０のより正確な解の推測を計算するために、前の制御時間ステップ３１０からの予測時間範囲にわたる制御入力、状態平均値および／または共分散値を考慮して、時間シフト手順を使用することができる。

不等式制約ごとの個々の強化に基づく、確率的機会制約３５５の近似定式化３７５または３８５を用いて、結果として生じる不等式制約付き非線形動的最適化問題を、最適性条件および実現可能性条件の逐次線形化に基づくニュートン型最適化アルゴリズムを用いて解くことができる。このようなニュートン型最適化アルゴリズムの例として、内点法（ＩＰＭ）および逐次二次計画法（ＳＱＰ）が挙げられる。本発明のいくつかの実施形態は、ＳＱＰアルゴリズムが、目的関数の線形－二次近似と、ＳＱＰ最適化アルゴリズムの各反復において、離散化システムダイナミクスおよび離散時間共分散伝搬方程式の線形化ベースの近似と、不等式制約ごと、かつ強化された確率的偶然制約ごとの線形化ベースの近似とに基づいて、確率論的非線形ＯＣＰの二次計画（ＱＰ）近似を解く、という認識に基づいている。

本発明のいくつかの実施形態において、目的関数３５１，３７１または３８１におけるステージコストおよび／または終端コストは、凸関数および／または非凸関数のいずれかを含む、任意の線形関数、線形－二次関数および／または非線形平滑関数によって定義することができる。確率論的最適制御問題の目的関数３５１，３７１または３８１は、予測時間範囲の各時点に対応するコスト項を含み得る。いくつかの実施形態において、目的関数は、予測時間範囲の各時点における基準出力値のシーケンスからのシステムの特定の出力関数の偏差の（非線形）最小二乗タイプのペナルティを課すことを含み、その結果、確率論的予測コントローラ１５０におけるコスト関数の基準追跡タイプの定式化となる。

図５Ｃは、確率論的予測コントローラの陽的線形化ベースの状態平均および共分散伝播の一部として、フィードバック制御アクションを考慮に入れるために非線形システムダイナミクスの事前安定化を説明するためのブロック図である。いくつかの実施形態は、離散時間ダイナミクス５２０および時変外乱５２５を考慮して事前安定化非線形システムダイナミクス５６０を定式化するために、フィードバック制御アクションのパラメータ化に基づいている。

なお、図５Ｃ、図５Ｄ、および図５Ｅにおけるフィードバック制御アクションは、１つの制御ステップでの動的最適化問題における予測時間範囲にわたる将来のフィードバック制御アクションの予測であり、それゆえ、これらのフィードバック制御アクションは、図１Ａの予測コントローラ１１０へのシステム１２１の推定状態の実際のフィードバックと混同されるべきではない。

図６Ａは、逐次的な局所線形化ベースの凸近似６０５の使用によって、確率論的予測コントローラにおける各制御時間ステップにおいて制約付き最適制御構造化非線形プログラム（ＮＬＰ）３５０を解くための、反復微分ベースの最適化手順を示すブロック図である。ＮＬＰ６０１の解の推測は、この局所凸近似を構築するために使用され、制約付きＮＬＰ６１０の局所（凸）近似の解は、予測時間範囲にわたる制御入力、状態平均値および共分散値の現在のシーケンスを更新する（６１５）ために使用され、その結果、アルゴリズム手順の各反復において、制約付きＮＬＰ６０１の現在の解の推測が更新される。最適化手順の各反復は、制約付きＮＬＰの解が発見されたかどうか、および／または最大反復回数に到達したかどうか（６０７）を確認する。終了条件６０７が満たされている場合は制御解３６５が発見されており、そうでない場合は、最適化アルゴリズムの次の反復において局所線形化ベースの近似６０５を構築するために、制約ヤコビアン行列（の近似）の評価（６２０）が行われる。前の制御時間ステップ３１０からの制御入力、状態平均値および共分散値を使用して、確率論的予測コントローラの各時間ステップにおいて、制約付きＮＬＰ６０１の初期解の推測および線形化点を形成することができる。

非線形目的および制約関数３４５に基づき、予測時間範囲にわたる制御入力、状態平均値および共分散値の軌道を含む現在の解の推測を線形化点６０１として用いて、アルゴリズム手順の各反復においてＮＬＰ６０５に対する局所（凸）近似が構築される。この目的のために、複雑な非線形システムダイナミクスの離散化システムの線形化、状態平均および共分散伝播方程式の線形化、ならびに／または非線形不等式制約の線形化を形成するために、制約ヤコビアン行列を計算または近似する（６２０）必要がある。局所近似の解がＮＬＰ６０７について十分に正確な解を形成する場合、最適制御解３６５が得られる。代わりに、最大反復回数６０７に達すると、最適でない、および／または実行不可能な解が得られる（３６５）。十分な精度のＮＬＰの解がまだ発見されておらず、最大反復回数にまだ到達していない場合（６０７）、局所近似６１０の解は、予測時間範囲６１５にわたる制御入力、状態平均値および共分散値の軌道を更新し、ＮＬＰ６０１の解の推測を更新するために使用される。

逐次局所近似６０５の使用によって、各制御時間ステップにおいて、不等式制約付き最適制御構造化非線形プログラム（ＮＬＰ）３５０を解くために、異なるタイプの最適化アルゴリズムを使用することができる。いくつかの実施形態は、（凸）二次計画（ＱＰ）が構築される、かつ各反復において元のＮＬＰに対する局所近似として解かれる逐次二次計画法（ＳＱＰ）に基づいている。本発明のいくつかの実施形態は、凸ＱＰは一般に、元のＮＬＰ３５０を解くのに必要な計算コストよりも大幅に少ない計算コストで解くことができる、という認識に基づいている。その代わりに、いくつかの実施形態は内点（ＩＰ）法に基づいており、内点（ＩＰ）法では、各局所近似は、不等式制約に対応する相補性条件が概ね緩和手順に基づいて平滑化される、ＮＬＰの最適性の一次必要条件の線形化である。いくつかの実施形態において、不等式制約を反復的に実行するためにバリア関数が使用され、各反復は、バリア再定式化問題の局所近似を構築し、これを解く。

導関数ベースの最適化アルゴリズムは、各反復において局所下位問題を構築し（６０５）これを解く（６１０）際に、制約ヤコビアン行列およびヘッセ行列について異なるニュートン型近似技術を使用することができる。いくつかの実施形態は、厳密なヤコビアン行列を計算する（６２０）ことによって、制約関数の一部またはすべての厳密な線形化に基づいている。いくつかの実施形態は、代わりに、準ニュートン型更新式を使用して、低ランク更新技術によって制約ヤコビアン行列へ近似を反復的に更新する。同様に、ＮＬＰのラグランジュ・ヘッセ行列についても、異なるニュートン型近似技術を使用することができる。いくつかの実施形態は、ＮＬＰの各局所近似を構築する際のラグランジュの厳密なヘッセ行列の評価に基づく。いくつかの実施形態は、代わりに準ニュートン型更新定式を用いて、対称低ランク更新技術によってヘッセ行列の近似を反復的に更新する。ＮＬＰの目的関数が（非線形）最小二乗タイプのコスト項を含む場合、いくつかの実施形態は、代わりにガウス・ニュートン型ヘッセ近似に基づく。

図６Ｃは、確率論的予測コントローラを実現するための逐次二次計画法（ＳＱＰ）に基づくいくつかの実施形態に係る、最適制御構造化ＮＬＰ６３０の局所（凸）近似６０５を形成する厳密なヤコビアンベースの二次計画法（ＱＰ）６４０を示すブロック図である。ＱＰ下位問題における線形等式制約６４２は、完全制約ヤコビアン行列６５２の評価に基づく離散時間システムダイナミクス６３２および状態共分散伝播方程式６３３の線形化に対応する。さらに、局所線形化６４３は、元のＮＬＰ定式化における不等式制約６３４に必要であり、そのために、厳密なヤコビアン行列６５３を、非線形不等式制約ごとに評価する必要がある。

本発明のいくつかの実施形態は、分離可能な目的関数３８１、ステージごとの個々の不等式制約３８４～３８５、および制約付きＮＬＰ３８０の等式制約３８２～３８３における予測時間範囲にわたる後続のステージでの状態と共分散行列変数との間のステージごとの結合に起因して、ヘッセ行列６５１、等式制約ヤコビアン行列６５２、および不等式制約ヤコビアン行列６５３がブロック構造化スパース性を示す、という認識に基づいている。したがって、本発明のいくつかの実施形態において、ブロック－スパース構造利用最適化アルゴリズムを用いて、確率論的予測コントローラを実現するためのＳＱＰ最適化アルゴリズムにおいて、最適制御構造化ＮＬＰ６３０の各局所（凸）ＱＰ近似６４０を解く（６１０）ことができる。ＱＰ最適化アルゴリズム利用するブロック－スパース構造の例として、プライマル、デュアル、またはプライマル－デュアルアクティブセット法、内点法、投影勾配法、前方－後方分割法、または交互方向乗数法（alternating direction method of multiplier：ＡＤＭＭ）が挙げられる。

本発明のいくつかの実施形態において、非線形不等式制約６３４のうちの１つまたは複数を、１つまたは複数の非線形であるが凸の不等式制約によって局所的に近似することができ、その結果、確率論的予測コントローラの逐次凸計画法（sequential convex programming：ＳＣＰ）の実現において解く（６１０）必要がある局所凸計画（convex program：ＣＰ）近似６０５となる。たとえば、いくつかの実施形態において、１つまたは複数の確率的機会制約は、凸二次円錐制約および／または凸二次不等式制約によって局所的に近似することができる。凸円錐制約の各々は、１つまたは複数の制御入力、状態平均、および／または状態共分散行列変数の線形結合が、凸円錐の内側になるように制限されることを課す。凸円錐の例として、正象限、正半正定値行列の集合、および／または二次円錐を挙げることができる。本発明のいくつかの実施形態は、最適制御構造化制約付きＮＬＰ３５０の局所凸プログラム近似６０５が、線形計画（linear program：ＬＰ）、二次計画（quadratic program：ＱＰ）、二次制約付き二次計画（quadratically constrained quadratic program：ＱＣＱＰ）、二次錐計画（second-order cone program：ＳＯＣＰ）、または半定値計画（semidefinite program：ＳＤＰ）であってもよく、これらのクラスの問題の各々を、凸最適化アルゴリズムを利用する構造によって解くことができる、という認識に基づいている。

図１０Ａは、いくつかの実施形態の原理を採用する確率論的予測コントローラ１００２を含む車両１００１を示す概略図である。本明細書で使用される車両１００１は、乗用車、バス、またはローバーなどの任意のタイプの車輪自動車であり得る。また、車両１００１は、自動車両または半自動車両であり得る。たとえば、いくつかの実施形態は、車両１００１の運動を制御する。運動の例として、車両１００１のステアリングシステム１００３によって制御される車両の横方向の運動が挙げられる。一実施形態において、ステアリングシステム１００３は、コントローラ１００２によって制御される。さらにまたは代替的に、ステアリングシステム１００３は、車両１００１の運転手によって制御され得る。

車両１００１は、コントローラ１００２によってまたは車両１００１の他の構成要素によって制御可能なエンジン１００６も含み得る。車両１００１は、周囲環境を感知する１つ以上のセンサ１００４も含み得る。センサ１００４の例として、距離計、レーダー、ライダーおよびカメラが挙げられる。車両１００１は、その現在の運動量および内部状態を検知する１つ以上のセンサ１００５も含み得る。センサ１００５の例として、全地球測位システム（global positioning system：ＧＰＳ）、加速度計、慣性測定ユニット、ジャイロスコープ、シャフト回転センサ、トルクセンサ、撓みセンサ、圧力センサ、および流量センサが挙げられる。センサ１００５は、コントローラ１００２に情報を提供する。本発明のいくつかの実施形態において、センサは、たとえば、車両の位置、縦方向速度および横方向速度、ヨー角およびヨーレート、車両の車輪のうちの１つまたは複数の車輪における角速度またはスリップ角、ならびに他の関連量といった量のうちの１つまたは複数を含む、車両の現在の状態を推定するために使用される。本発明のいくつかの実施形態によれば、予測コントローラ１００２は、たとえば、ステアリングホイール角またはステアリングレート、車両の車輪のうちの１つまたは複数の車輪における角速度またはトルク、および他の関連量の量といった量のうちの１つまたは複数を含む制御入力を計算する。車両１００１は、有線または無線通信チャネルを介してコントローラ１００２の通信機能を可能にするトランシーバ１００７を備え得る。

図１０Ｂは、いくつかの実施形態に係る、確率論的予測コントローラ１００２と車両１００１のコントローラ１０２０との間の相互作用の概略を示す。たとえば、いくつかの実施形態において、車両１００１のコントローラ１０２０は、車両１００１の回転および加速を制御するステアリングコントローラ１０２５およびブレーキ／スロットルコントローラ１０３０である。このような場合、確率論的予測コントローラ１００２は、コントローラ１０２５および１０３０に制御入力を出力して、車両の状態を制御する。コントローラ１０２０はまた、確率論的予測コントローラ１００２の制御入力をさらに処理する高レベルのコントローラ、たとえば、レーン維持アシストコントローラ１０３５を含み得る。いずれの場合も、コントローラ１０２０は、車両の運動を制御するために、確率論的予測コントローラ１００２の出力を使用して、車両のステアリングホイールおよび／またはブレーキといった、車両の少なくとも１つのアクチュエータを制御する。

図１０Ｃは、本発明の実施形態を使用することにより、動的に実現可能であり、多くの場合最適な軌道１０５５を計算することができる、自動または半自動制御車両１０５０を示す概略図である。生成された軌道は、車両を特定の道路境界１０５２内に維持することを意図しており、他の非制御車両を、すなわち被制御車両１０５０にとっての障害物１０５１を回避することを意図している。いくつかの実施形態において、障害物１０５１の各々は、制約付き最適制御問題の時間または空間定式化における１つまたは複数の不等式制約によって表すことができる。たとえば、確率論的モデル予測コントローラを実現するように構成された実施形態に基づいて、自動または半自動の被制御車両１０５０は、たとえば、左側もしくは右側の別の車両を追い越す、または代わりに道路１０５２の現在の車線内で別の車両の後方に留まるなどの決定を、リアルタイムで行うことができる。本発明の実施形態は、車両１０５０の現在の状態および予測される状態に関する不確実性、車両モデル内のパラメータに関する不確実性、ならびに環境の現在の状態および予測される状態に関する不確実性（たとえば、自動または半自動の被制御車両１０５０の現在の位置から一定距離内にある障害物１０５１を含む）を直接考慮するＳＮＭＰＣコントローラに基づいている。

図１０Ｄは、本発明の実施形態を使用することによって、上限の道路境界１０６０および下限の道路境界１０６１内で急激な車線変更操作の動的に実現可能で最適な軌道１０７０を追跡することを意図しているＳＮＭＰＣコントローラによって制御される車両１０６５を示す概略図である。図１０Ｄは、第１の時点における、ＳＮＭＰＣコントローラ１０７１による予測状態軌道の不確実性の伝播を含む車両位置１０６５と、第２の時点における車両位置１０６６および対応する予測状態不確実性の伝播１０７２と、第３の時点における車両位置１０６７および対応する予測状態不確実性の伝播１０７３とを示す。本発明のいくつかの実施形態に係る、確率的機会制約を伴う確率論的予測コントローラを使用することにより、被制御車両が道路境界制約１０６０および／または１０６１に違反する確率が、ある確率閾値を下回ることが可能になる。より具体的には、たとえば、図１０Ｄは、第２の時点における予測された状態軌道１０７２の確率論的チューブが上限道路境界制約１０６０に到達する（１０７５）ことを示し、不確実性の下で、被制御システムに対する決定論的制約と確率的機会制約との両方を満たすことを意図している確率論的予測コントローラの挙動を示す。

システムおよびその環境の不確実性の例として、車両のタイヤと路面との間の摩擦挙動に関連する任意の時変パラメータ、たとえば、車両を制御しながらオフラインおよび／またはオンラインのいずれかで学習または推定できるＰａｃｅｊｋａタイヤ－力モデルのパラメータを挙げることができる。推定パラメータ値および推定不確実性は、本発明の実施形態に係る確率論的非線形モデル予測コントローラの直接最適制御問題定式化において、時変および不確実な外乱変数として定義することができる。

上述の本発明の実施形態は、多数の方式のいずれかで実施することができる。たとえば、実施形態は、ハードウェア、ソフトウェア、またはそれらの組み合わせを使用して実現することができる。ソフトウェアで実現される場合、ソフトウェアコードは、単一のコンピュータに設けられているか、複数のコンピュータに分散されているかにかかわらず、任意の適切なプロセッサまたはプロセッサの集合体上で実現することができる。このようなプロセッサは、１つ以上のプロセッサが集積回路コンポーネント内に備えられた集積回路として実現することができる。しかしながら、プロセッサは、任意の適切な形式の回路を用いて実現されてもよい。

また、本発明の実施形態は方法として具体化されてもよく、その例が提供されている。方法の一部として実行される行為は、任意の適切な方法で順序付けることができる。したがって、例示的な実施形態では逐次的な行為として示されていても、いくつかの行為を同時に行うことを含む場合もある、図示とは異なる順序で行為が行われる実施形態が構成されてもよい。

請求項要素を修飾するために特許請求の範囲において「第１の」、「第２の」といった序数項を使用することは、それ自体、ある請求項要素の他の請求項要素に対する優先順位、先行順位、順序、または方法の行為が実行される時間的順序を意味するものではなく、請求項要素を区別するために、ある名称を有するある請求項要素を、同じ名称を有する（ただし序数項を使用する）他の請求項要素と区別するためのラベルとして使用されているに過ぎない。

Claims

システムの状態および制御変数に対する制約を受ける不確実性の下でシステムを制御するための予測コントローラであって、
少なくとも１つのプロセッサと、
命令を格納したメモリとを備え、前記命令は、前記少なくとも１つのプロセッサによって実行されると、前記予測コントローラに、
前記予測コントローラの各制御ステップにおいて、制御信号を生成するために前記不確実性を表す確率的機会制約を含む不等式制約付き非線形動的最適化問題を解かせ、前記予測コントローラは、確率的機会制約に基づいて、ガウス分布の仮定密度フィルタリング（ＡＤＦ）に基づく離散時間近似伝搬方程式を用いて、直接最適制御構造化非線形プログラム（ＮＬＰ）を解いて、予測範囲内のある時間ステップから次の時間ステップまで、状態確率分布の一次および／または高次モーメント積分の近似予測を、時変モデル化不確実性および／または外部外乱のうちの１つまたは複数の時変モデル化不確実性および／または外部外乱の確率分布の前記一次および／または高次モーメント積分に応じて、終了条件が満たされるまで実行し、前記命令はさらに、前記予測コントローラに、
前記制御信号を用いて前記システムの動作を制御させる、予測コントローラ。
前記システムの状態および制御変数に対する制約は、１つまたは複数の不等式制約を含み、前記確率的機会制約は、対応する不等式制約の各々に違反する確率が確率閾値を下回ることを保証するために、バックオフ係数値と、制約ヤコビアン行列と、前記予測範囲内の各時間ステップにおける予測状態変数の前記一次および／または高次モーメント積分とに依存する項を有する１つまたは複数の不等式制約の強化に基づいて近似される、請求項１に記載の予測コントローラ。
前記一次および／または高次モーメント積分は、平均である第１のモーメント積分と、共分散である第２のモーメント積分とを含む、請求項２に記載の予測コントローラ。
前記バックオフ係数値は、基礎となる状態確率分布に関係なく成立するカンテリ・チェビシェフ不等式を用いて計算される、請求項２に記載の予測コントローラ。
前記バックオフ係数値は、近似的に正規分布する状態軌道を仮定する逆ガウス誤差関数を用いて計算される、請求項２に記載の予測コントローラ。
前記バックオフ係数値は、前記状態確率分布の第１のモーメント積分と、第２のモーメント積分と、第４のモーメント積分とに基づいて、多変量ピアソンＶＩＩ確率分布の累積密度関数を用いて計算される、請求項２に記載の予測コントローラ。
前記予測範囲内の時間ステップごとの平均状態値および状態共分散行列の伝搬は、初期状態推定および不確実性を考慮し、前記時変モデル化不確実性および／または外部外乱の１つまたは複数の時変モデル化不確実性および／または外部外乱の平均および共分散を考慮し、かつ前記予測範囲について最適化される制御入力変数の現在値を考慮して、ガウス分布の仮定密度フィルタリング（ＡＤＦ）に基づいて非線形状態平均および共分散伝搬方程式を評価することによって実行される、請求項３に記載の予測コントローラ。
前記ガウス分布の仮定密度フィルタは、前記予測範囲について最適化される制御入力変数の現在値を考慮して、状態動的方程式および対応するヤコビアン行列の評価に基づいて、非線形システムダイナミクスの陽的線形化を使用する拡張カルマンフィルタ（ＥＫＦ）である、請求項７に記載の予測コントローラ。
前記ガウス分布の仮定密度フィルタは、前記予測範囲について最適化される制御入力変数の現在値を考慮して、１つまたは複数の積分点における状態動的方程式の評価に基づいて、前記状態確率分布の統計的線形化を使用する線形回帰カルマンフィルタ（ＬＲＫＦ）である、請求項７に記載の予測コントローラ。
積分点の集合は、球面立体求積公式またはアンセンテッド変換に従って選択される、請求項９に記載の予測コントローラ。
前記非線形共分散伝搬方程式は、各制御時間ステップにおける前記状態共分散行列の正定値性を保持するために、前記状態共分散行列のコレスキー分解について定義される、請求項７に記載の予測コントローラ。
各制御時間ステップにおいて前記状態共分散行列のコレスキー分解が存在することを保証するために、前記非線形共分散伝播方程式において正則化項が使用される、請求項１１に記載の予測コントローラ。
前記予測範囲内の時間ステップごとの平均状態値および状態共分散行列の伝播は、前記予測範囲内の前記予測状態変数の不確実性の順方向伝播における将来のフィードバック制御アクションを考慮するために、非線形システムダイナミクスの事前安定化システムについて実行される、請求項７に記載の予測コントローラ。
前記非線形システムダイナミクスの事前安定化システムは、アフィンフィードバックゲインの時不変または時変シーケンスを使用している、請求項１３に記載の予測コントローラ。
前記不等式制約付き非線形動的最適化問題は、前記非線形システムダイナミクスの事前安定化システムの実行可能性を保証するために、前記予測範囲内の後続のフィードバック制御アクションに対する１つまたは複数の不等式制約について１つまたは複数の確率的機会制約を含む、請求項１３に記載の予測コントローラ。
前記コントローラは、ブロック構造化スパース性を保持する二次計画法（ＱＰ）下位問題を解く逐次二次計画法（ＳＱＰ）最適化アルゴリズムを用いて、前記直接最適制御構造化非線形プログラム（ＮＬＰ）の（近似）最適解を計算して、前記ＳＱＰ最適化アルゴリズムの各反復において、状態平均および共分散変数の値の更新、ならびに前記制御変数の値の更新を、終了条件が満たされるまで計算する、請求項１に記載の予測コントローラ。
前記ＳＱＰ最適化アルゴリズムは、前記ＮＬＰの目的関数および／または制約関数の一次および／または高次導関数のうちの１つまたは複数の一次および／または高次導関数の厳密でない評価に基づいており、それによって、大幅に低い計算コストで解くことができるＱＰ下位問題になる、請求項１６に記載の予測コントローラ。
厳密でないＳＱＰ最適化アルゴリズムの各反復は、状態共分散行列のコレスキー因子の偏差変数の数値的除去を使用し、それによって、ブロック構造化スパース性を保持し、かつ大幅に低い計算コストで解くことができる、より小さいＱＰ下位問題になる、請求項１７に記載の予測コントローラ。
前記厳密でないＳＱＰ最適化アルゴリズムの各反復は、前記ＮＬＰの目的関数および／または制約関数の一次および／または高次導関数のうちの１つまたは複数の一次および／または高次導関数の厳密でない評価の補正として、１つまたは複数の随伴ベースの勾配計算を使用する、請求項１８に記載の予測コントローラ。
前記厳密でないＳＱＰ最適化アルゴリズムの各反復は、前記ＱＰ下位問題の主解および双対解に基づく展開ステップを用いて、前記予測範囲内の各時間ステップにおいて、前記状態共分散行列のコレスキー因子の偏差変数の更新と、状態共分散伝播方程式のラグランジュ乗数値の更新とを計算する、請求項１８に記載の予測コントローラ。
前記状態平均および共分散変数の値の更新、ならびに前記制御変数の値の更新は、直接最適制御構造化ＮＬＰの（近似）最適解を計算するために前記ＳＱＰ最適化アルゴリズムの各反復において十分な進行を保証するためのメリット関数を使用する、直線探索手順に基づくことができるグローバル化ベースのステップサイズ選択を必要とする、請求項１６に記載の予測コントローラ。
圧縮されたＱＰ下位問題を解いた後に、初期状態値から開始して線形化されたシステムダイナミクスをシミュレートし、かつ、前記予測範囲内の各時間ステップにおいて更新された制御値を使用することよって、平均状態変数の値を更新できるように、前記平均状態値および制御変数の最適化は、前記予測範囲内のすべての前の時間ステップにおける前記平均状態変数および制御変数の初期値の関数として、圧縮ルーチンにおいて前記予測範囲内の各時間ステップにおける前記平均状態変数を数値的に削除する、請求項１６に記載の予測コントローラ。
前記予測コントローラは、前の制御ステップにおける前記予測範囲にわたる状態平均値および共分散行列値ならびに制御入力値の最適シーケンスまたは準最適シーケンスから開始して、各制御ステップにおいて、前記不等式制約付き非線形動的最適化問題を解くために、導関数ベースの最適化アルゴリズムについて１回または所定回数の反復のみを使用する、請求項１に記載の予測コントローラ。
前記導関数ベースの最適化アルゴリズムは、目的関数および／または制約関数の一次および／または高次導関数のうちの１つまたは複数の一次および／または高次導関数の厳密でない評価を使用する随伴ベースのＳＱＰ最適化法であり、前記随伴ベースのＳＱＰ最適化法は、各制御ステップにおいて、１つまたは所定数のブロック構造化ＱＰ下位問題のみを解いて、前記予測範囲にわたる状態平均値および共分散行列値ならびに制御入力値の最適シーケンスまたは準最適シーケンスを更新する、請求項２３に記載の予測コントローラ。
被制御システムが、車両のコントローラに制御入力を出力するように構成されている、請求項１に記載の予測コントローラ。
前記車両の状態は、前記車両の位置、向き、速度、角速度、スリップ率およびスリップ角の値の１つまたは組み合わせを含み、前記制御入力は、加速度、ブレーキトルク、操舵角および操舵率の値の１つまたは組み合わせを含み、前記不確実性は、前記車両のモデルにおける質量値、慣性値、またはその両方の不確実性、前記車両のステアリングモデルの不確実性、前記車両のタイヤと路面との間の摩擦を示す１つまたは複数のパラメータ値の不確実性の１つまたは組み合わせを含む時変外乱を含む、請求項２５に記載の予測コントローラ。