JP2024520177A

JP2024520177A - 高次元物理システムのモデリング、予測、および制御を行うためのロバスト適応動的モード分解

Info

Publication number: JP2024520177A
Application number: JP2024510548A
Authority: JP
Inventors: ベノスマン，モウハシン; ナビ，サレー
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2021-05-20
Filing date: 2022-03-01
Publication date: 2024-05-21
Also published as: US20220374725A1; EP4341755A1; US11790247B2; WO2022244389A1; CN117321511A

Abstract

コンピュータ実施方法が提供される。コンピュータ実施は、メモリに記憶され、プロセッサを用いてシステムを制御するためのデータ駆動型モデルとロバストクロージャモデルとを含む。コンピュータ実施方法は、インターフェイスを介してシステムの少なくとも１つのセンサからセンサ信号を取得するステップと、センサ信号に基づいてシステムの状態を計算するステップと、システムの状態に基づいてロバストクロージャモデルのゲインを決定するステップと、決定されたゲインに基づいてシステムの状態を再現するステップと、データ駆動型モデルとロバストクロージャモデルとを組み合わせることによってシステムの物理学ベースモデルを推定するステップと、推定された物理学ベースモデルを用いてシステムの状態をマッピングすることによって制御コマンドを生成するステップとを含む。

Description

本発明は、一般的には、システムのモデリング、予測および制御に関し、より詳しくは、機械を制御するために動的モード分解を用いてロバストデータ駆動型モデルを改作するための方法および装置に関する。

制御システム工学において、制御理論は、設計プロセスおよび機械において連続的に動作する動的システムの制御を扱う数学サブフィールドである。本発明の目的は、遅延またはオーバーシュートすることなく最適な方法で制御動作を用いてこのようなシステムを制御すると共に、制御の安定性を確保するための制御ポリシーを開発することである。

例えば、モデル予測制御（ＭＰＣ）などの最適化ベースの制御および推定技術は、システム動力学および制約を直接に考慮できるモデルベースの設計フレームワークを可能にする。ＭＰＣは、多くの用途に使用され、様々の複雑な動的システムを制御する。このようなシステムの例は、生産ライン、自動車エンジン、ロボット、数値制御機械加工、モータ、衛星および発電機を含む。システムの動力学モデルまたはシステムのモデルは、本明細書に使用される場合、微分方程式を用いてシステムの動力学を記述する。

しかしながら、いくつかの状況において、制御されているシステムのモデルは、非線形であるため、設計が困難であり、リアルタイムで使用することが困難であり、または不正確である場合がある。このようなケースの例は、ロボット工学、建物制御（ＨＶＡＣ）、スマートグリッド、工場オートメーション、輸送、自己調整機械、および交通ネットワークにおいて多く見られる。

動的システムの正確なモデルがない場合、いくつかの制御方法は、例えば、制御動作に応答して、所定の時間範囲内のシステムの挙動を予測するのに役立つモデルを構築するために、動的システムシステムによって生成された動作データを利用する。データを用いて予測モデルおよび制御ポリシーを設計することは、データ駆動型モデリングおよび制御と呼ばれる。

推定および制御モデルを設計するために使用される既存のデータ駆動型方法の欠点は、システムの不確実性に対するロバスト性の欠如である。実際に、これらの不確実性は、いくつかの要因に起因する可能性がある。例えば、システムを再調整することで、モデルを構築するために収集されたデータでは把握できない不確実性を誘発する可能性がある。さらに、ノイズの多い測定値も、データ駆動型モデルに不確実性をもたらす可能性がある。

この重要な課題を克服するために、本発明者らは、本発明において、動的モード分解（ＤＭＤ）に基づいてデータ駆動型モデルをロバスト化するためのアルゴリズムを提案する。この場合、データは、直接測定によってシステムから収集される。得られたロバスト適応ＤＭＤ（ＲＡ－ＤＭＤ）モデルは、システムの推定および制御に使用される。

いくつかの実施形態の目的は、システムの動力学モデルをデータ駆動設計することによって、システムの不確実性に対してロバストであるシステムの動力学モデルを生成するためのシステムおよび方法を提供することである。このようにして、実施形態は、制御アプリケーションを設計する際にシステムモデルを有する利点を保持しながら、モデル設計プロセスを単純化する。しかしながら、現在のデータ駆動型手法は、システムの物理動力学の不確実性を捕捉するシステムモデルを推定するのに適していない。

例えば、物理学および工学の分野では、多数のパラメータを含む偏微分方程式（ＰＤＥ）の反復シミュレーションを必要とする問題が遍在する。このような問題は、制御、最適化および不確実性定量化の分野に現れ、ＰＤＥモデルを解くことは、しばしば時間がかかりすぎる。制御および最適化の時に次数低減モデル（ＲＯＭ）を使用すること、すなわち、ＰＤＥモデルを有限次元常微分方程式（ＯＤＥ）系に低減することは、極めて困難なシステム、例えば熱流体システム、特にＨＶＡＣシステム、および風力発電所などの制御の実用的な解決策をもたらした。

実験またはシミュレーションから得られた大規模なデータセットによって、動的モード分解（ＤＭＤ）などの手法を用いて、システムの所定のパラメータセットのデータから扱いやすく物理的に関連する情報を抽出することができるＲＯＭを設計することができる。しかしながら、大きな課題の１つは、ＲＯＭが安定性の低下および予測精度の劣化を引き起こす可能性があることである。これらの劣化は、主に、高次モードの切り捨ておよびパラメータの不確実性に起因する。より具体的には、１つの所定のパラメータセットのデータスナップショットから得られた基底関数（空間モード）は、異なる範囲のパラメータに対する解を表現するために適用された場合、ＲＯＭの予測精度の低下を示すまたは不安定になる可能性がある。

したがって、本発明は、パラメータの不確実性を有する偏微分方程式（ＰＤＥ）の安定的な次数低減モデル（ＲＯＭ）の設計を提供することができる。より具体的には、いくつかの実施形態は、動的モード分解（ＤＭＤ）を用いて、ＰＤＥをＤＭＤ－ＲＯＭに低減し、ＲＯＭ安定化またはクロージャ問題を非線形ロバスト制御のフレームワークに提起することを目標とする。このロバスト制御フレームワークを用いて、パラメータの不確実性およびモードの切り捨てに対してロバストである２つのＤＭＤ－ＲＯＭクロージャモデルを設計する。最後に、このフレームワークに適応レイヤを追加し、データ駆動型極値探索コントローラを用いてクロージャモデルをリアルタイムで調整する。

本発明は、このような問題を解決するものであり、データ測定値を用いて、大規模システム、例えば数百万個の状態を持つ気流モデルのロバスト適応モデルを構築することに関する。

いくつかの実施形態は、動的モード分解（ＤＭＤ）を用いて、システムの大規模モデルの最適な近似を構築する方法を説明する。より具体的には、いくつかの実施形態は、ＤＭＤ法をロバスト化することによって、観察されるシステムに不確実性が存在しても、大規模モデルのロバスト最適モデル近似をもたらすロバスト適応ＤＭＤ法（ＲＡ－ＤＭＤ）を設計する方法を説明する。

本発明のいくつかの実施形態によれば、コンピュータ実施方法が提供される。コンピュータ実施方法は、メモリに記憶され、プロセッサを用いてシステムを制御するためのデータ駆動型モデルとロバストクロージャモデルとを含むことができる。コンピュータ実施方法は、インターフェイスを介してシステムの少なくとも１つのセンサからセンサ信号を取得することと、センサ信号に基づいてシステムの状態を計算することと、システムの状態に基づいてロバストクロージャモデルのゲインを決定することと、決定されたゲインに基づいてシステムの状態を再現することと、データ駆動型モデルとロバストクロージャモデルとを組み合わせることによってシステムの物理学ベースモデルを推定することと、推定された物理学ベースモデルを用いてシステムの状態をマッピングすることによって制御コマンドを生成することとを含む。

さらに、本発明のいくつかの実施形態は、システムの動作を制御するためのコントローラを提供することができる。この場合、コントローラは、ネットワークを介してシステムの状態軌跡を受信するように構成された入力インターフェイスと、少なくとも１つの動的モード分解ベースのデータ駆動型モデルとロバストクロージャモデルとの組み合わせを含むシステムの動力学モデルを記憶するように構成されたメモリと、プロセッサと、出力インターフェイスとを含むことができる。プロセッサは、最適化アルゴリズムを用いてロバストクロージャモデルを更新するように構成され、最適化アルゴリズムは、受信した状態軌跡の形状と、更新されたロバストクロージャモデルを含むモデルを用いて推定された状態軌跡の形状との間の差を減少する価値関数を含み、更新されたロバストクロージャモデルを含むデータ駆動型モデルに基づいて制御コマンドを決定するように構成されている。出力インターフェイスは、制御コマンドをシステムのアクチュエータに送信することによって、システムの動作を制御するように構成されている。

本発明のさらなる理解を提供するために含まれる添付の図面は、本発明の実施形態を示し、詳細な説明と共に本発明の原理を説明する。

関連技術によって使用され、システムの動作を制御するための原理を示す概略図である。本発明の別の実施形態に従って、システムの動作を制御するための新規の原理を示す概略図である。いくつかの実施形態に従って、システムの動作を制御するための装置を示すブロック図である。本発明の一実施形態に従って、高次元システムとロバストモデル低減との間の関係を示す概略図である。本発明の一実施形態に従って、クロージャモデルおよびＤＭＤベースのモデルに基づいたロバストモデル低減アルゴリズムを示す概略図である。本発明の一実施形態に従って、ロバスト制御ベースのクロージャモデルおよびＤＭＤベースのモデルに基づいたロバストモデル低減アルゴリズムを示す概略図である。本発明の実施形態に従って、リヤプノフ関数に基づいたロバストモデル低減アルゴリズムを示す概略図である。本発明の一実施形態に従って、ロバストクロージャモデル調整を示す概略図である。本発明の一実施形態に従って、ロバストクロージャモデル適応アルゴリズムを示す概略図である。本発明の実施形態に従って、最適な極値探索に基づいたロバストモデル低減を示す概略図である。本発明の実施形態に従って、最適なガウス過程に基づいたロバストモデル低減を示す概略図である。本発明の実施形態に従って、ロバストモデル低減に基づいた深層ニューラルネットワーク学習プロセスを示す概略図である。本発明の一実施形態に従って、強化学習プロセスに基づいたロバストモデル低減を示す概略図である。本発明のいくつかの実施形態に従って、簡略化ＥＳを示すフローチャートである。本発明のいくつかの実施形態に従って、簡略化ＥＳを示す詳細フローチャートである。本発明のいくつかの実施形態に従って、１つの変数のリアルタイム極値探索を示す図である。本発明のいくつかの実施形態に従って、複数の変数のリアルタイム極値探索を示す図である。本発明のいくつかの実施形態に従って、空調システムを制御するための装置の例示的なリアルタイム実装を示す図である。本発明のいくつかの実施形態に従って、空調システムを制御するための装置の例示的なリアルタイム実装を示す図である。本発明のいくつかの実施形態に従って、車両を制御するための装置の例示的なリアルタイム実装を示す図である。本発明のいくつかの実施形態に従って、誘導モータ（システム）を制御するための装置の例示的なリアルタイム実装を示す図である。

上記の図面は、本開示の実施形態を図示しているが、上記で議論したように、他の実施形態も考えられる。本開示は、限定ではなく例示として、例示的な実施形態を提供する。当業者は、本開示の実施形態の原理の範囲および精神に含まれる多くの他の変形例および実施例を考案することができる。

以下の説明において、説明の目的のために、本開示に対する完全な理解を提供するために、多くの具体的な詳細が記載されている。これらの具体的な詳細がなくても、１つ以上の実施形態を実施することができることは、当業者にとって明白である。また、本開示を不明瞭にしないように、装置および方法をブロック図として示している。

以下の説明は、例示的な実施形態のみを提供しており、本開示の範囲、適用または構成を限定することを意図していない。むしろ、以下の例示的な実施形態の説明は、１つ以上の例示的な実施形態の実施を可能にするための説明を当業者に与える。添付の特許請求の範囲に記載された主題の精神および範囲から逸脱することなく、要素の機能および配置に対して様々な変更が考えられる。

以下の説明において、実施形態に対する完全な理解を提供するために、具体的な詳細が与えられる。しかしながら、当業者は、これらの具体的な詳細がなくても、実施形態を実施できることを理解することができる。例えば、不必要な詳細で実施形態を不明瞭にしないように、開示された主題におけるシステム、プロセス、および他の要素は、ブロック図のコンポーネントとして示されてもよい。また、実施形態を不明瞭にしないように、周知のプロセス、構造、および技術は、不必要な詳細なしで示されてもよい。さらに、様々な図面において、同様の参照番号および名称は、同様の要素を示している。

以下の説明において、説明の目的のために、本開示に対する完全な理解を提供するために、多くの具体的な詳細が記載される。これらの具体的な詳細がなくても、１つ以上の実施形態を実施することができることは、当業者にとって明白である。また、本開示を不明瞭にしないように、装置および方法をブロック図として示している。

本明細書および特許請求の範囲に使用された場合、用語「例えば」、「例示として」、「・・・のような」ならびに動詞「備える」、「有する」、「含む」およびそれらの他の動詞形は、１つ以上の構成要素または他の項目のリストと共に使用される場合、このリストから他の追加の構成要素または項目を排除しないことを意味するオープンエンドとして解釈すべきである。用語「・・・に基づく」は、少なくとも部分的に基づくことを意味する。さらに、理解すべきことは、本明細書に使用された表現および用語は、説明の目的のためのものであり、限定として具体的に定義されない限り、限定的なものとして見なすべきではないことである。本明細書に使用されたいずれかの見出しは、便宜のためのものであり、法的または限定的な効果を有しない。

本発明の実施形態を説明する際に、以下の定義が本開示の全体に適用可能である。

「制御システム」または「コントローラ」は、他の装置または他のシステムの挙動を管理、命令、指示、または調節するための装置または一組の装置と呼ばれてもよい。制御システムは、ソフトウェアまたはハードウェアのいずれかによって実装することができ、１つ以上のモジュールを含むことができる。フィードバックループを含む制御システムは、マイクロプロセッサを用いて実装することができる。制御システムは、組み込みシステムであってもよい。

「空調システム」または暖房、換気および空調（ＨＶＡＣ）システムは、蒸気圧縮サイクルを用いて、熱力学、流体力学および／または熱伝達の原理に基づいて、システムの構成要素を通して冷媒を移動させるシステムと呼ばれてもよい。空調システムは、建物の居住者に外気のみを供給するシステムから、建物の温度のみを制御するシステム、温度および湿度を制御するシステムまでの非常に幅広いシステムを含む。

「中央処理装置（ＣＰＵ）」または「プロセッサ」は、ソフトウェア命令を読み取り、実行するコンピュータまたはコンピュータの構成要素と呼ばれてもよい。さらに、プロセッサは、「少なくとも１つのプロセッサ」または「１つ以上のプロセッサ」であってもよい。

「モジュール」または「ユニット」は、タスクまたはタスクの一部を実行するコンピュータ内の基本構成要素と呼ばれてもよい。これは、ソフトウェアまたはハードウェアのいずれかによって実装されてもよい。

図１Ａは、システムの動作を制御するためにいくつかの実施形態によって使用される原理を示す概略図である。いくつかの実施形態は、システム１０２０を制御するように構成された制御装置１０００を提供する。例えば、装置１０００は、設計プロセスおよび機械において連続的に動作する動的システム１０２０を制御するように構成されてもよい。以下では、「制御装置」と「装置」とは、交換可能に使用されてもよく、同じことを意味する。以下では、「連続的に動作する動的システム」および「システム」は、交換可能に使用されてもよく、同じことを意味する。システム１０２０の例は、ＨＶＡＣシステム、ＬＩＤＡＲシステム、凝縮ユニット、生産ライン、自己調整機械、スマートグリッド、自動車エンジン、ロボット、数値制御機械加工、モータ、衛星、発電機、交通ネットワークなどを含む。いくつかの実施形態は、装置１０００が、遅延またはオーバーシュートすることなく最適な方法で制御動作を用いてシステム１０２０を制御すると共に、制御の安定性を確保するための制御コマンド１０６０を開発するという認識に基づく。

制御装置１０００は、モデル予測制御（ＭＰＣ）などのモデルベースの制御および予測技術を用いて、システム１０２０の制御コマンド１０６０を開発する。モデルベースの技術は、動的システムの制御に有利であり得る。例えば、ＭＰＣは、システム１０２０の動力学および制約を直接に考慮することができるモデルベースの設計フレームワークを可能にする。ＭＰＣは、システム１０４０のモデルに基づいて、制御コマンド１０６０を開発する。システム１０２０のモデル１０４０は、動的システム方程式、例えば偏微分方程式（ＰＤＥ）または常微分方程式（ＯＤＥ）を用いて記述されているシステム１０２０の動力学を指す。いくつかの実施形態において、モデル１０４０は、非線形高次元であり、リアルタイムで使用するのが困難であり得る。例えば、非線形モデルが正確に利用可能であっても、ハミルトン－ヤコビ－ベルマン（ＨＪＢ）方程式と名付けられた、システム１０２０の動力学を記述する偏微分方程式（ＰＤＥ）を解く必要があり、計算的に困難であるため、最適な制御コマンド１０６０を推定することは、本質的に困難なタスクである。

図１Ｂは、本発明の別の実施形態に従って、システムの動作を制御するための新規の原理を示す概略図である。

図１Ａに示す方法は、物理学原理を用いてモデル１０４０を設計する。このような物理学ベースのモデリング手法とは対照的に、本発明のいくつかの実施形態は、システム１０２０のセンサによって測定された動作データを用いて、制御システムのモデル、例えばモデル１０８０ａを設計し、次いで、データ駆動型モデル１０８０ａを用いて、様々なモデルベースの制御方法に従ってシステムを制御することができる。

なお、いくつかの実施形態の目的は、データからシステムの実際のモデルを決定することである。すなわち、このようなモデルを用いて、システムの挙動を推定することができる。例えば、いくつかの実施形態の目的は、微分方程式を用いて、システムの動力学を捕捉するデータからシステムのモデルを決定することである。さらに、いくつかの実施形態の目的は、データから、物理学ベースモデルと類似の精度を有するロバストモデルを学習することである。

計算を単純化するために、いくつかの実施形態は、システム１０２０の動力学を記述する常微分方程式（ＯＤＥ）１０８０ａを定式化する。常微分方程式（ＯＤＥ）１０８０ａは、システムのデータ駆動型モデル１０８０ａと呼ばれてもよい。いくつかの実施形態において、ＯＤＥ１０８０ａは、動的モード分解（ＤＭＤ）技術を用いて定式化されてもよい。しかしながら、場合によっては、ＯＤＥ１０８０ａは、不確実性条件の場合、システム１０２０の実際の動力学（すなわち、ＰＤＥによって記述されている動力学）を再現することができない。不確実性条件の例は、ＰＤＥの境界条件が経時的に変化していること、またはＰＤＥに関与する係数のうちの１つが経時的に変化していること、すなわちシステムの消耗であってもよい。

そのために、いくつかの実施形態は、不確実性条件をカバーすることによって、ＤＭＤデータ駆動型モデル１０８０ａをロバスト化するクロージャモデル１０８０ｂを定式化する。いくつかの実施形態において、クロージャモデル１０８０ｂは、ＯＤＥに従ってシステム１０２０の挙動（例えば、動力学）の差を捕捉する、システム１０２０の状態の非線形関数であってもよい。クロージャモデル１０８０ｂは、ロバスト非線形制御を用いて定式化されてもよい。言い換えれば、システム１０２０の物理学ベースモデルは、ＯＤＥ１０８０ａとロバストクロージャモデル１０８０ｂとの組み合わせによって近似（推定）され、ロバストクロージャモデル１０８０ｂは、非線形ロバスト制御法を用いて設計される。このように、物理学ベースモデルの精度に近似するモデルは、クロージャモデル１０８０ｂによってロバスト化されたＤＭＤモデル１０８０ａの形でデータから学習される。

そのために、いくつかの実施形態は、ゲインを決定し、ゲインをロバストクロージャモデル１０８０ｂに含むことによって、システム１０２０の動力学を最適に再現する。いくつかの実施形態において、ゲインは、最適化アルゴリズムを用いて適応されてもよい。ＯＤＥ１０８０ａと適応されたゲインを有するクロージャモデル１０８０ｂとを含む次数低減モデル１０８０は、システム１０２０の動力学を再現する。したがって、モデル１０８０は、システム１０２０の動力学を最適に再現する。いくつかの実施形態は、モデル１０８０が物理学ベースの高次元モデルよりも少ない数のパラメータを含むという認識に基づく。そのため、次数低減モデル１０８０は、システム１０２０の物理モデルを記述するモデル１０４０よりも計算的に簡単である。制御ポリシー（コマンド）１０６０は、モデル１０８０を用いて決定されてもよい。制御ポリシー１０６０は、システム１０２０の状態を制御（生成）コマンドに直接にマッピングすることによって、システム１０２０の動作を制御する。したがって、低減モデル１０８０は、システム１０２０の制御を効率的に設計するために使用される。

図１Ｃは、いくつかの実施形態に従って、システム１０２０の動作を制御するための制御装置１２００を示すブロック図である。装置１２００は、装置１２００を他のシステムおよび他の装置に接続するための入力インターフェイス１２０２と出力インターフェイス１２１８とを含む。いくつかの実施形態において、装置１２００は、複数の入力インターフェイスと、複数の出力インターフェイスとを含むことができる。入力インターフェイス１２０２は、システム１０２０の状態軌跡１２１６を受信するように構成されている。入力インターフェイス１２０２は、バス２１０を介して装置１２００をネットワーク１２１４に接続するように構成されたネットワークインターフェイスコントローラ（ＮＩＣ）１２１２を含む。装置１２００は、無線ネットワークまたは有線ネットワークのいずれかであるネットワーク１２１４を介して、システム１０２０の状態軌跡１２１６を受信する。

状態軌跡１２１６は、システム１０２０の実際の動力学挙動を定義するシステム１０２０の複数の状態であってもよい。例えば、状態軌跡１２１６は、システム１０２０を制御するための基準連続状態空間として機能する。いくつかの実施形態において、状態軌跡１２１６は、システム１０２０の一部の状態のリアルタイム測定値から受信されてもよい。

制御装置１２００は、プロセッサ１２０４と、プロセッサ１２０４によって実行可能な命令を記憶するためのメモリ１２０６とをさらに含む。プロセッサ１２０４は、シングルコアプロセッサ、マルチコアプロセッサ、コンピューティングクラスタ、または任意の他の構成であってもよい。メモリ１２０６は、ランダムアクセスメモリ（ＲＡＭ）、読取り専用メモリ（ＲＯＭ）、フラッシュメモリ、または任意の他の好適なメモリシステムを含むことができる。プロセッサ１２０４は、バス２１０を介して、１つ以上の入力装置および出力装置に接続されている。記憶された命令は、システム１０２０の動作を制御するための方法を実装する。

メモリ１２０６は、記憶装置１２０８を含むようにさらに拡張されてもよい。記憶装置１２０８は、モデル１２０８ａと、コントローラ１２０８ｂと、更新モジュール１２０８ｃと、制御コマンドモジュール１２０８ｄとを記憶するように構成されてもよい。いくつかの実施形態において、モデル１２０８ａは、少なくとも１つの微分方程式とロバストクロージャモデルとの組み合わせを含み、システム１０２０の動力学を記述するモデルであってもよい。モデルの微分方程式は、常微分方程式（ＯＤＥ）１０８０ａであってもよい。モデル１２０８ａのクロージャモデルは、システム１０２０の状態の線形関数または非線形関数であってもよい。ロバストクロージャモデルは、システム１０２０の挙動を模倣するように、非線形ロバスト制御に基づいて設計されてもよい。当然ながら、ロバストクロージャモデルが学習されると、クロージャモデルは、図１Ａに示されたクロージャ１０８０ｂであってもよい。

コントローラ１２０８ｂは、プロセッサ１２０４によって実行されると、１つ以上のモジュールを実行するための命令を記憶装置１２０８に記憶するように構成されてもよい。いくつかの実施形態は、コントローラ１２０８ｂが記憶装置１２０８の各モジュールを管理してシステム１０２０を制御するという認識に基づく。

さらに、いくつかの実施形態において、更新モジュール１２０８ｃは、更新されたロバストクロージャモデルのゲインを更新するように構成されてもよい。そのために、いくつかの実施形態は、更新されたゲインを有する更新されたクロージャモデルを含むモデル１２０８ａを用いて推定されたシステム１０２０の状態と、システムの実際の状態との間の誤差を低減するためのゲインを決定する。いくつかの実施形態において、システムの実際の状態は、測定された状態であってもよい。いくつかの実施形態において、更新モジュール１２０８ｃは、極値探索を用いてゲインを更新することができる。いくつかの他の実施形態において、更新モジュール１２０８ｃは、ガウスプロセスベースの最適化を用いてゲインを更新することができる。

制御コマンドモジュール１２０８ｄは、更新されたロバストクロージャモデルを含むモデル１２０８ａに基づいて、制御コマンドを決定するように構成されてもよい。制御コマンドは、システムの動作を制御することができる。いくつかの実施形態において、システムの動作は、制約を受けることができる。そのために、制御コマンドモジュール１２０８ｄは、予測モデルベースの制御を用いて、制約を実施しながら制御コマンドを決定する。制約は、システム１０２０の連続状態空間に対する状態制約と、システム１０２０の連続制御入力空間に対する制御入力制約とを含む。

出力インターフェイス１２１８は、制御コマンドをシステム１０２０のアクチュエータ１２２０に送信して、システムの動作を制御するように構成されている。出力インターフェイス１２１８のいくつかの例は、システム１０２０を制御するように、制御コマンドを提出する制御インターフェイスを含むことができる。

例えば、図１Ｄに示された本発明のいくつかの実施形態において、高次元を有するシステム１５０、例えば、部屋の全体にわたって分布する気流および温度値を表す多数の状態を有する空調システムを考える。次いで、データ１６０を収集するためにシステム上に複数のセンサを配置する。データは、ロバストデータ駆動型次数低減モデル（ＲＯＭ）１６５を生成するために使用される。次いで、このロバストデータ駆動型ＲＯＭは、実際のシステム１７０を予測および制御するために使用される。

図２に示された本発明のいくつかの実施形態において、データ駆動型ＲＯＭ１６５は、動的モード分解（ＤＭＤ）モデル１５０を用いて得られる。すなわち、ロバストクロージャモデル２５０を動的モード分解（ＤＭＤ）モデル１５０に追加することによって、ＤＭＤベースのロバスト次数低減モデル１６５を生成する。

図３Ａに示された本発明のいくつかの実施形態において、ロバストクロージャモデル２５０は、ロバスト制御法３５０に基づいて設計される。例えば、いくつかの実施形態において、図３Ｂに示すように、不確実ＤＭＤベースのデータ駆動型モデル１５０は、不確実モデルのエネルギー３２０を評価するために使用されるリヤプノフ関数３４０を用いてロバスト化（３５０）され、このエネルギー評価から、クロージャモデルの形にした補正項が得られる（３２５）。最後に、ロバストクロージャモデルと共に不確実ＤＭＤベースのモデルを追加することによって、ロバスト次数低減モデル１６５が得られる。

図４は、本発明の一実施形態に従って、ロバストクロージャモデル調整を示す概略図である。他の実施形態は、図５、図６、図７Ａ、図７Ｂおよび図７Ｃにも示されている。図５は、ロバストクロージャモデル適応アルゴリズムを示す概略図である。

図６は、最適な極値探索に基づいたロバストモデル低減を示す概略図である。図７Ａは、最適なガウス過程に基づいたロバストモデル低減を示す概略図である。図７Ｂは、ロバストモデル低減に基づいた深層ニューラルネットワーク学習プロセスを示す概略図である。図７Ｃは、強化学習プロセスに基づいたロバストモデル低減を示す概略図である。

ロバストクロージャモデル３２５は、物理システム４５０からの測定値とロバスト次数低減モデル４４０からの予測値との間の差４６０に基づいて、さらに調整される（４３０）。この調整は、クロージャモデルの一部のパラメータ、例えば基底関数の係数またはクロージャモデルの一部の物理係数を調整することによって実現することができる。これは、適応アルゴリズム５３０（図５）を用いて実現することができる。この場合の適応アルゴリズムは、極値探索最適化アルゴリズム６３０（図６）であってもよく、ガウスプロセスに基づいた最適化７３０のファミリーからのベイジアン最適化アルゴリズム（図７Ａ）であってもよく、深層ニューラルネットクローク８３０（図７Ｂ）であってもよく、または強化学習方法９３０（図７Ｃ）であってもよい。

図８は、いくつかの実施形態に従って、ゲインを更新するための極値探索（ＥＳ）アルゴリズム８９００のフローチャートを示す。いくつかの実施形態は、ＥＳアルゴリズム８９００が、装置１２００が最適なクロージャモデルのゲインを調整することを可能にするモデルフリー学習アルゴリズムであるという認識に基づく。いくつかの実施形態は、終了条件が満たされるまで、ＥＳアルゴリズム８９００が摂動信号を用いて最適なクロージャモジュールのゲインを反復的に摂動させるという認識に基づく。いくつかの実施形態において、摂動信号は、所定の周波数を有する周期信号であってもよい。最適なロバストクロージャモデルのゲインは、制御パラメータであってもよい。

ステップ８９０２ａにおいて、ＥＳアルゴリズム８９００は、最適なクロージャモデルの制御パラメータを摂動させることができる。例えば、ＥＳアルゴリズム８９００は、摂動信号を用いて制御パラメータを摂動させることができる。いくつかの実施形態において、摂動信号は、以前に更新された摂動信号であってもよい。ステップ８９０４ａにおいて、ＥＳアルゴリズム８９００は、制御パラメータの摂動に応答して、クロージャモデル性能のコスト関数Ｑを決定することができる。ステップ８９０６ａにおいて、ＥＳは、摂動信号を用いてコスト関数を修正することによって、コスト関数の勾配を決定することができる。例えば、コスト関数の勾配は、コスト関数と摂動信号とＥＳアルゴリズム８９００のゲインとの積として決定される。ステップ８９０８ａにおいて、ＥＳアルゴリズム８９００は、摂動信号を決定された勾配と統合することによって、次の反復の摂動信号を更新することができる。ＥＳ９８００の反復は、終了条件が満たされるまで繰り返すことができる。

図９は、いくつかの実施形態に従って、性能コスト関数を用いてゲインを更新するための極値探索（ＥＳ）アルゴリズム８９００のフローチャートを示す。ステップ８９０４ｂにおいて、ＥＳ８９００は、クロージャモデル性能のコスト関数を決定することができる。いくつかの実施形態において、ＥＳアルゴリズム８９００は、ステップ８９０４ｂにおいて、図８のステップ８９０４ａに例示的に示されているコスト関数を決定する。いくつかの実施形態において、決定されたコスト関数は、性能コスト関数８９０４ｂ－０であってもよい。いくつかの実施形態例によれば、性能コスト関数８９０４ｂ－０は、ギャップ４６０の挙動を表す二次方程式であってもよい。

ステップ８９０６ｂにおいて、ＥＳアルゴリズム８９００は、決定されたコスト関数に時間の第１の周期信号８９０６ｂ－０を乗算することによって、摂動コスト関数８９０６ｂ－１を生成することができる。ステップ８９０８ｂにおいて、ＥＳアルゴリズム８９００は、摂動コスト関数８９０６ｂ－１から、第１の周期信号８９０６ｂ－０の位相に対して９０度の直交位相シフトを有する第２の周期信号８９０８ｂ－０を減算することによって、コスト関数８９０８ｂ－１の導関数を生成することができる。ステップ８９１０ｂにおいて、ＥＳアルゴリズム８９００は、コスト関数８９０８ｂ－１の導関数を時間に対して積分することによって、時間の関数として制御パラメータ値８９１０ｂ－０を生成することができる。

図１１は、いくつかの実施形態に従って、複数のパラメータを調整するための極値探索（ＥＳ）コントローラ１１００を示す概略図である。いくつかの実施形態は、マルチパラメータＥＳコントローラ１１００が単一パラメータＥＳ１０００から導出されるという認識に基づく。例えば、単一パラメータＥＳコントローラ１０００をｎ回に複製することによって、ｎパラメータＥＳコントローラ１１００を得ることができる。いくつかの実施形態は、ｎパラメータＥＳコントローラ１１００が、ｎ個の異なる周波数を有する１～１１０４－ｎをそれぞれ有するｎ個の摂動信号１１０４を用いて、ｎ個の制御パラメータセットθ_ｉ１１０２を摂動させることによって最適なクロージャモデルを更新するという認識に基づく。いくつかの実施形態において、ｎ個の異なる周波数の各々は、システム１０２０の周波数応答よりも大きい。また、ｎ個の摂動信号１１０４－１～１１０４－ｎのｎ個の異なる周波数は、第１の摂動信号１１０４－１の第１の周波数と第２の摂動信号１１０４－２の第２の周波数との和が第３の摂動信号１１０４－３の第３の周波数に等しくない収束条件を満たす。

理解されるように、ＥＳアルゴリズムまたはガウスプロセスベースの最適化を用いて最適なクロージャモデル中の制御パラメータθ（すなわち、正のゲイン）を更新すると、ＤＭＤベースのＯＤＥモデル１５０と組み合わせた最適なクロージャモデルは、システム１０２０の実際の挙動１２６０２を模倣する。例えば、推定された挙動１２６０４は、ギャップ１２６０６のない実際の挙動１２６０２と定性的および定量的に類似することができる。

そのために、ＯＤＥ１０８０ａと更新されたゲインを有するクロージャモデル１０８０ｂとを含む最適な低減モデル１０８０を用いて、制御コマンド１０６０を決定することができる。いくつかの実施形態において、ＯＤＥと更新されたゲインを有する最適なクロージャモデルと含む最適な低減モデル１０８０は、システム１０２０の制御ポリシー１０６０を開発することができる。制御ポリシー１０６０は、システム１０２０の状態を制御コマンドに直接にマッピングすることによって、システム１０２０の動作を制御することができる。システム１０２０がＨＡＶＣシステム１３０６である場合、制御コマンドの例は、位置弁、圧縮機の速度、蒸発器のパラメータなどを含む。モータシステム１５００が回転子である場合、制御コマンドの例は、回転子の速度、モータの温度などを含む。さらに、出力インターフェイス１２１８を介して制御コマンドをシステム１０２０のアクチュエータに送信することによって、システム１０２０を制御することができる。

図１２Ｂは、システムを制御するための装置２００の例示的なリアルタイム実装を示す。この場合、システムは、空調システム１２００である。この例において、制御装置２００は、部屋１３００の外部に配置された空調システム１２００を制御するように構成され、部屋１３００は、ドア１３０２および少なくとも１つの窓１３０４を有する。システムの状態は、換気ユニット１３０６および空調システム１２００を介して装置２００によって制御されている部屋１３００の温度および気流速度であってもよい。一組のセンサ１３０８、例えば、部屋１３００の特定の位置の気流の速度を測定するための少なくとも１つの気流センサ１３０８ａおよび部屋の温度を測定するための少なくとも１つの温度センサ１３０８ｂは、部屋１３００に配置されている。この場合、コスト関数Ｑは、温度センサおよび気流センサからの測定信号と、次数低減モデル１０８０から得られた温度値および気流速度値の推定信号との差の二乗によって得られる。他の種類の環境、例えば、複数のＨＶＡＣユニットを有する部屋、または複数の部屋を有する家屋を考慮することができる。

図３Ａおよび３Ｂに例示的に示されたように、いくつかの実施形態は、空調システム１２００がブシネスク方程式と呼ばれる物理学ベースのモデルによって記述され得るという認識に基づく。しかしながら、ブシネスク方程式は、空調システム１０２を制御するためのブシネスク方程式を解決するための無限次元を含む。そのため、図１Ａ～１１の詳細な説明で説明したように、ＯＤＥ４０２と更新されたゲインを有する更新されたクロージャモデルとを含むモデルは、定式化される。このモデルは、空調システム１２００の動力学（例えば、気流動力学）を最適に再現する。さらに、いくつかの実施形態において、気流動力学モデルは、空調システム１２００の動作中に、気流の値（例えば、気流の速度）と空調されている部屋１３００の温度とを結び付ける。そのために、制御装置２００は、空調システム１２００を最適に制御して、空調された気流を生成する。

図１３は、車両のシステムを制御するための装置２００の例示的なリアルタイム実装を示す。この場合、システムは、車両（車両操作システム）１４００である。車両１４００は、乗用車、バス、またはローバーなどの任意の種類の車輪付き車両であってもよい。また、車両１４００は、自律車両または半自律車両であってもよい。例えば、いくつかの実施形態は、車両１４００の動作を制御する。動作を表すシステムの状態の例としては、車両１４００のステアリングシステム１４０４によって制御される車両の横方向動作が挙げられる。一実施形態において、ステアリングシステム１４０４は、コントローラ１４０２によって制御される。追加的にまたは代替的には、ステアリングシステム１４０４は、車両１４００の運転者によって制御されてもよい。

いくつかの実施形態において、車両は、コントローラ１４０２または車両１４００の他の構成要素によって制御され得るエンジン１４１０を含んでもよい。いくつかの実施形態において、車両１４００は、エンジン１４１０の代わりに電気モータを含んでもよく、コントローラ１４０２または車両１４００の他の構成要素によって制御されてもよい。車両はまた、周囲環境の状態を検知するための１つ以上のセンサ１４０６を含むことができる。センサ１４０６の例は、レーダなどの測距器を含む。いくつかの実施形態において、車両１４００は、車両の現在の運動パラメータおよび内部状態を検知するための１つ以上のセンサ１４０８を含む。１つ以上のセンサ１４０８の例は、全地球測位システム（ＧＰＳ）、加速度計、慣性測定ユニット、ジャイロスコープ、シャフト回転センサ、トルクセンサ、たわみセンサ、圧力センサ、および流量センサを含む。これらのセンサは、コントローラ１４０２に情報を提供する。車両は、有線または無線通信チャネルを介してコントローラ１４０２といくつかの実施形態の装置２００との通信を可能にするトランシーバ１４１２を装備してもよい。例えば、コントローラ１４０２は、トランシーバ１４１２を介して、装置２００から制御コマンドを受信する。また、コントローラ１４０２は、車両の動作を制御するために、受信した制御コマンドを車両１４００の１つ以上のアクチュエータ、例えば車両のステアリングホイールおよび／またはブレーキに出力する。さらに、制御装置２００は、ステアリングシステム１４０４、コントローラ１４０２およびエンジン１４１０を含む車両１４００の部品に配置された１つ以上のセンサ１４０８を介して、システム（車両１４００）の状態を取得／測定するように構成されている。この場合のコスト関数Ｑは、センサによって測定される車両の位置および速度と、システム１０８０の次数低減モデルから得られる車両の位置および速度との間の距離の二乗によって得られる。

図１４は、システム１０２０を制御するための装置２００の例示的なリアルタイム実装を示す。この場合、システム１０２０は、誘導モータ（誘導モータシステム）１５００である。この例において、誘導モータ１５００は、装置２００と一体化されている。装置は、図１Ａ～１１の詳細な説明で説明したように誘導モータ１５００の動作を制御するように構成されている。いくつかの実施形態において、誘導モータ１５００の動作は、制約を受けることがある。制約は、誘導モータ１５００の連続状態空間に対する状態制約と、誘導モータ１５００の連続制御入力空間に対する制御入力制約とを含む。いくつかの実施形態において、モータ１５００の状態は、固定子磁束、線電流、および回転子速度のうちの１つまたは組み合わせを含む。状態制約は、固定子磁束、線電流、および回転子速度のうちの１つまたは組み合わせの値に対する制約を含む。いくつかの実施形態において、制御入力は、励起電圧の値を含む。制御入力制約は、励起電圧に対する制約を含む。この場合のコスト関数Ｑは、センサによって測定されたモータの線電流および回転子速度と、システム１０８０の次数低減モデルから得られた線電流および回転子速度との間の距離の二乗によって得られる。
動的モード分解を用いたロバストデータ駆動型モデリングの例

ここで、上述したステップをより数学的な設定に置き換えてみよう。実際に、我々は、この形の厳密な高次元非線形ＰＤＥ２１０システムによって記述される物理システムの状態推定問題を検討する。

クロージャモデルおよび極値探索に基づいた調整の例

仮想制御項ｕは、ＤＭＤ－ＲＯＭモデルを安定させるために追加された一般的なクロージャモデル項を表すために追加されている。クロージャモデルに関する既存の物理学に基づく文献との違いは、このＤＭＤ－ＲＯＭの文脈において、クロージャモデル問題をロバスト安定化問題として定式化していることである。

本発明者らは、ロバスト補正と粘性消失によるロバスト補正と呼ばれる２つのクロージャモデルを提案する。次の節では、これらのクロージャモデルを紹介し、リヤプノフ理論を用いてその安定性およびロバスト性を解析する。

ＤＭＤ－ＲＯＭのクロージャモデル

クロージャモデル１の例－ロバスト補正

上記の各々の実施形態は、フローチャート、フロー図、データフロー図、構造図、またはブロック図として示されるプロセスとして説明されている。フローチャートが動作を順次のプロセスとして説明しても、多くの動作は、並列にまたは同時に実行されてもよい。また、動作の順序は、変更されてもよい。プロセスの動作が完了したときに、プロセスを終了することができるが、このプロセスは、討論されていないまたは図示されていない追加のステップを含むことができる。さらに、具体的に記載されたプロセス内の全ての動作は、全ての実施形態に含まれる必要がない。プロセスは、方法、関数、プロシージャ、サブルーチン、サブプログラムなどであってもよい。プロセスが関数である場合、関数の終了は、当該関数を呼び出し関数または主関数に復帰させることに対応する。

さらに、開示された主題の実施形態は、手動でまたは自動で、少なくとも部分的に実装されてもよい。手動または自動の実装は、マシン、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語、またはそれらの任意の組み合わせで実装されてもよく、または少なくとも支援されてもよい。ソフトウェア、ファームウェア、ミドルウェア、またはマイクロコードで実装される場合、必要なタスクを実行するためのプログラムコードまたはコードセグメントは、機械可読媒体に記憶されてもよい。プロセッサは、必要なタスクを実行することができる。

Claims

メモリに記憶され、プロセッサを用いてシステムを制御するためのデータ駆動型モデルとロバストクロージャモデルとを含むコンピュータ実施方法であって、
インターフェイスを介して、前記システムの少なくとも１つのセンサからセンサ信号を取得することと、
前記センサ信号に基づいて、前記システムの状態を計算することと、
前記システムの前記状態に基づいて、前記ロバストクロージャモデルのゲインを決定することと、
前記決定されたゲインに基づいて、前記システムの状態を再現することと、
前記データ駆動型モデルと前記ロバストクロージャモデルとを組み合わせることによって、前記システムの物理学ベースモデルを推定することと、
前記推定された物理学ベースモデルを用いて前記システムの前記状態をマッピングすることによって、制御コマンドを生成することとを含む、コンピュータ実施方法。
前記ネットワークは、有線ネットワークまたは無線ネットワークである、請求項１に記載のコンピュータ実施方法。
前記少なくとも１つのセンサは、前記システムの状態を測定するように構成されている、請求項１に記載のコンピュータ実施方法。
前記データ駆動型モデルモジュールおよび前記ロバストクロージャモデルに使用されているパラメータの数は、物理学ベースの高次元モデルに使用されているパラメータの数よりも少ない、請求項１に記載のコンピュータ実施方法。
前記ロバストクロージャモデルは、非線形ロバスト制御法に基づいて設計されている、請求項１に記載のコンピュータ実施方法。
前記クロージャモデルは、偏微分方程式（ＰＤＥ）の境界条件に基づいて定式化され、
前記境界条件は、経時的に変化する、請求項１に記載のコンピュータ実施方法。
前記ロバストクロージャモデルは、前記システムの前記状態の線形関数または前記システムの前記状態の非線形関数によって表される、請求項１に記載のコンピュータ実施方法。
前記システムは、空調システムである、請求項１に記載のコンピュータ実施方法。
前記システムは、車両操作システムである、請求項１に記載のコンピュータ実施方法。
前記システムは、誘導モータシステムである、請求項１に記載のコンピュータ実施方法。
システムの動作を制御するためのコントローラであって、
ネットワークを介して前記システムの状態軌跡を受信するように構成された入力インターフェイスと、
少なくとも１つの動的モード分解ベースのデータ駆動型モデルとロバストクロージャモデルとの組み合わせを含む前記システムの動力学モデルを記憶するように構成されたメモリと、
プロセッサと、
出力インターフェイスとを備え、
前記プロセッサは、
最適化アルゴリズムを用いて前記ロバストクロージャモデルを更新するように構成され、前記最適化アルゴリズムは、前記受信した状態軌跡の形状と、前記更新されたロバストクロージャモデルを含む前記モデルを用いて推定された状態軌跡の形状との間の差を減少する価値関数を含み、
前記更新されたロバストクロージャモデルを含む前記データ駆動型モデルに基づいて制御コマンドを決定するように構成され、
前記出力インターフェイスは、前記制御コマンドを前記システムのアクチュエータに送信することによって、前記システムの前記動作を制御するように構成されている、コントローラ。
前記ネットワークは、有線ネットワークまたは無線ネットワークである、請求項１１に記載のコントローラ。
前記少なくとも１つのセンサは、前記システムの前記状態軌跡を測定するように構成されている、請求項１１に記載のコントローラ。
前記少なくとも１つの動的モード分解ベースのデータ駆動型モデルおよび前記ロバストクロージャモデルに使用されているパラメータの数は、物理学ベースの高次元モデルに使用されているパラメータの数よりも少ない、請求項１１に記載のコントローラ。
前記ロバストクロージャモデルは、非線形ロバスト制御法に基づいて設計されている、請求項１１に記載のコントローラ。
前記クロージャモデルは、偏微分方程式（ＰＤＥ）の境界条件に基づいて定式化され、
前記境界条件は、経時的に変化する、請求項１１に記載のコントローラ。
前記ロバストクロージャモデルは、前記システムの前記状態の線形関数または前記システムの前記状態の非線形関数によって表される、請求項１１に記載のコントローラ。
前記システムは、空調システムである、請求項１１に記載のコントローラ。
前記システムは、車両操作システムである、請求項１１に記載のコントローラ。
前記システムは、誘導モータシステムである、請求項１１に記載のコントローラ。