JP2024520177A - 高次元物理システムのモデリング、予測、および制御を行うためのロバスト適応動的モード分解 - Google Patents

高次元物理システムのモデリング、予測、および制御を行うためのロバスト適応動的モード分解 Download PDF

Info

Publication number
JP2024520177A
JP2024520177A JP2024510548A JP2024510548A JP2024520177A JP 2024520177 A JP2024520177 A JP 2024520177A JP 2024510548 A JP2024510548 A JP 2024510548A JP 2024510548 A JP2024510548 A JP 2024510548A JP 2024520177 A JP2024520177 A JP 2024520177A
Authority
JP
Japan
Prior art keywords
model
robust
control
state
controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2024510548A
Other languages
English (en)
Inventor
ベノスマン,モウハシン
ナビ,サレー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JP2024520177A publication Critical patent/JP2024520177A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B17/00Systems involving the use of models or simulators of said systems
    • G05B17/02Systems involving the use of models or simulators of said systems electric
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/04Programme control other than numerical control, i.e. in sequence controllers or logic controllers
    • G05B19/042Programme control other than numerical control, i.e. in sequence controllers or logic controllers using digital processors
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/24Pc safety
    • G05B2219/24075Predict control element state changes, event changes
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/26Pc applications
    • G05B2219/2614HVAC, heating, ventillation, climate control

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Feedback Control In General (AREA)

Abstract

コンピュータ実施方法が提供される。コンピュータ実施は、メモリに記憶され、プロセッサを用いてシステムを制御するためのデータ駆動型モデルとロバストクロージャモデルとを含む。コンピュータ実施方法は、インターフェイスを介してシステムの少なくとも1つのセンサからセンサ信号を取得するステップと、センサ信号に基づいてシステムの状態を計算するステップと、システムの状態に基づいてロバストクロージャモデルのゲインを決定するステップと、決定されたゲインに基づいてシステムの状態を再現するステップと、データ駆動型モデルとロバストクロージャモデルとを組み合わせることによってシステムの物理学ベースモデルを推定するステップと、推定された物理学ベースモデルを用いてシステムの状態をマッピングすることによって制御コマンドを生成するステップとを含む。

Description

本発明は、一般的には、システムのモデリング、予測および制御に関し、より詳しくは、機械を制御するために動的モード分解を用いてロバストデータ駆動型モデルを改作するための方法および装置に関する。
制御システム工学において、制御理論は、設計プロセスおよび機械において連続的に動作する動的システムの制御を扱う数学サブフィールドである。本発明の目的は、遅延またはオーバーシュートすることなく最適な方法で制御動作を用いてこのようなシステムを制御すると共に、制御の安定性を確保するための制御ポリシーを開発することである。
例えば、モデル予測制御(MPC)などの最適化ベースの制御および推定技術は、システム動力学および制約を直接に考慮できるモデルベースの設計フレームワークを可能にする。MPCは、多くの用途に使用され、様々の複雑な動的システムを制御する。このようなシステムの例は、生産ライン、自動車エンジン、ロボット、数値制御機械加工、モータ、衛星および発電機を含む。システムの動力学モデルまたはシステムのモデルは、本明細書に使用される場合、微分方程式を用いてシステムの動力学を記述する。
しかしながら、いくつかの状況において、制御されているシステムのモデルは、非線形であるため、設計が困難であり、リアルタイムで使用することが困難であり、または不正確である場合がある。このようなケースの例は、ロボット工学、建物制御(HVAC)、スマートグリッド、工場オートメーション、輸送、自己調整機械、および交通ネットワークにおいて多く見られる。
動的システムの正確なモデルがない場合、いくつかの制御方法は、例えば、制御動作に応答して、所定の時間範囲内のシステムの挙動を予測するのに役立つモデルを構築するために、動的システムシステムによって生成された動作データを利用する。データを用いて予測モデルおよび制御ポリシーを設計することは、データ駆動型モデリングおよび制御と呼ばれる。
推定および制御モデルを設計するために使用される既存のデータ駆動型方法の欠点は、システムの不確実性に対するロバスト性の欠如である。実際に、これらの不確実性は、いくつかの要因に起因する可能性がある。例えば、システムを再調整することで、モデルを構築するために収集されたデータでは把握できない不確実性を誘発する可能性がある。さらに、ノイズの多い測定値も、データ駆動型モデルに不確実性をもたらす可能性がある。
この重要な課題を克服するために、本発明者らは、本発明において、動的モード分解(DMD)に基づいてデータ駆動型モデルをロバスト化するためのアルゴリズムを提案する。この場合、データは、直接測定によってシステムから収集される。得られたロバスト適応DMD(RA-DMD)モデルは、システムの推定および制御に使用される。
いくつかの実施形態の目的は、システムの動力学モデルをデータ駆動設計することによって、システムの不確実性に対してロバストであるシステムの動力学モデルを生成するためのシステムおよび方法を提供することである。このようにして、実施形態は、制御アプリケーションを設計する際にシステムモデルを有する利点を保持しながら、モデル設計プロセスを単純化する。しかしながら、現在のデータ駆動型手法は、システムの物理動力学の不確実性を捕捉するシステムモデルを推定するのに適していない。
例えば、物理学および工学の分野では、多数のパラメータを含む偏微分方程式(PDE)の反復シミュレーションを必要とする問題が遍在する。このような問題は、制御、最適化および不確実性定量化の分野に現れ、PDEモデルを解くことは、しばしば時間がかかりすぎる。制御および最適化の時に次数低減モデル(ROM)を使用すること、すなわち、PDEモデルを有限次元常微分方程式(ODE)系に低減することは、極めて困難なシステム、例えば熱流体システム、特にHVACシステム、および風力発電所などの制御の実用的な解決策をもたらした。
実験またはシミュレーションから得られた大規模なデータセットによって、動的モード分解(DMD)などの手法を用いて、システムの所定のパラメータセットのデータから扱いやすく物理的に関連する情報を抽出することができるROMを設計することができる。しかしながら、大きな課題の1つは、ROMが安定性の低下および予測精度の劣化を引き起こす可能性があることである。これらの劣化は、主に、高次モードの切り捨ておよびパラメータの不確実性に起因する。より具体的には、1つの所定のパラメータセットのデータスナップショットから得られた基底関数(空間モード)は、異なる範囲のパラメータに対する解を表現するために適用された場合、ROMの予測精度の低下を示すまたは不安定になる可能性がある。
したがって、本発明は、パラメータの不確実性を有する偏微分方程式(PDE)の安定的な次数低減モデル(ROM)の設計を提供することができる。より具体的には、いくつかの実施形態は、動的モード分解(DMD)を用いて、PDEをDMD-ROMに低減し、ROM安定化またはクロージャ問題を非線形ロバスト制御のフレームワークに提起することを目標とする。このロバスト制御フレームワークを用いて、パラメータの不確実性およびモードの切り捨てに対してロバストである2つのDMD-ROMクロージャモデルを設計する。最後に、このフレームワークに適応レイヤを追加し、データ駆動型極値探索コントローラを用いてクロージャモデルをリアルタイムで調整する。
本発明は、このような問題を解決するものであり、データ測定値を用いて、大規模システム、例えば数百万個の状態を持つ気流モデルのロバスト適応モデルを構築することに関する。
いくつかの実施形態は、動的モード分解(DMD)を用いて、システムの大規模モデルの最適な近似を構築する方法を説明する。より具体的には、いくつかの実施形態は、DMD法をロバスト化することによって、観察されるシステムに不確実性が存在しても、大規模モデルのロバスト最適モデル近似をもたらすロバスト適応DMD法(RA-DMD)を設計する方法を説明する。
本発明のいくつかの実施形態によれば、コンピュータ実施方法が提供される。コンピュータ実施方法は、メモリに記憶され、プロセッサを用いてシステムを制御するためのデータ駆動型モデルとロバストクロージャモデルとを含むことができる。コンピュータ実施方法は、インターフェイスを介してシステムの少なくとも1つのセンサからセンサ信号を取得することと、センサ信号に基づいてシステムの状態を計算することと、システムの状態に基づいてロバストクロージャモデルのゲインを決定することと、決定されたゲインに基づいてシステムの状態を再現することと、データ駆動型モデルとロバストクロージャモデルとを組み合わせることによってシステムの物理学ベースモデルを推定することと、推定された物理学ベースモデルを用いてシステムの状態をマッピングすることによって制御コマンドを生成することとを含む。
さらに、本発明のいくつかの実施形態は、システムの動作を制御するためのコントローラを提供することができる。この場合、コントローラは、ネットワークを介してシステムの状態軌跡を受信するように構成された入力インターフェイスと、少なくとも1つの動的モード分解ベースのデータ駆動型モデルとロバストクロージャモデルとの組み合わせを含むシステムの動力学モデルを記憶するように構成されたメモリと、プロセッサと、出力インターフェイスとを含むことができる。プロセッサは、最適化アルゴリズムを用いてロバストクロージャモデルを更新するように構成され、最適化アルゴリズムは、受信した状態軌跡の形状と、更新されたロバストクロージャモデルを含むモデルを用いて推定された状態軌跡の形状との間の差を減少する価値関数を含み、更新されたロバストクロージャモデルを含むデータ駆動型モデルに基づいて制御コマンドを決定するように構成されている。出力インターフェイスは、制御コマンドをシステムのアクチュエータに送信することによって、システムの動作を制御するように構成されている。
本発明のさらなる理解を提供するために含まれる添付の図面は、本発明の実施形態を示し、詳細な説明と共に本発明の原理を説明する。
関連技術によって使用され、システムの動作を制御するための原理を示す概略図である。 本発明の別の実施形態に従って、システムの動作を制御するための新規の原理を示す概略図である。 いくつかの実施形態に従って、システムの動作を制御するための装置を示すブロック図である。 本発明の一実施形態に従って、高次元システムとロバストモデル低減との間の関係を示す概略図である。 本発明の一実施形態に従って、クロージャモデルおよびDMDベースのモデルに基づいたロバストモデル低減アルゴリズムを示す概略図である。 本発明の一実施形態に従って、ロバスト制御ベースのクロージャモデルおよびDMDベースのモデルに基づいたロバストモデル低減アルゴリズムを示す概略図である。 本発明の実施形態に従って、リヤプノフ関数に基づいたロバストモデル低減アルゴリズムを示す概略図である。 本発明の一実施形態に従って、ロバストクロージャモデル調整を示す概略図である。 本発明の一実施形態に従って、ロバストクロージャモデル適応アルゴリズムを示す概略図である。 本発明の実施形態に従って、最適な極値探索に基づいたロバストモデル低減を示す概略図である。 本発明の実施形態に従って、最適なガウス過程に基づいたロバストモデル低減を示す概略図である。 本発明の実施形態に従って、ロバストモデル低減に基づいた深層ニューラルネットワーク学習プロセスを示す概略図である。 本発明の一実施形態に従って、強化学習プロセスに基づいたロバストモデル低減を示す概略図である。 本発明のいくつかの実施形態に従って、簡略化ESを示すフローチャートである。 本発明のいくつかの実施形態に従って、簡略化ESを示す詳細フローチャートである。 本発明のいくつかの実施形態に従って、1つの変数のリアルタイム極値探索を示す図である。 本発明のいくつかの実施形態に従って、複数の変数のリアルタイム極値探索を示す図である。 本発明のいくつかの実施形態に従って、空調システムを制御するための装置の例示的なリアルタイム実装を示す図である。 本発明のいくつかの実施形態に従って、空調システムを制御するための装置の例示的なリアルタイム実装を示す図である。 本発明のいくつかの実施形態に従って、車両を制御するための装置の例示的なリアルタイム実装を示す図である。 本発明のいくつかの実施形態に従って、誘導モータ(システム)を制御するための装置の例示的なリアルタイム実装を示す図である。
上記の図面は、本開示の実施形態を図示しているが、上記で議論したように、他の実施形態も考えられる。本開示は、限定ではなく例示として、例示的な実施形態を提供する。当業者は、本開示の実施形態の原理の範囲および精神に含まれる多くの他の変形例および実施例を考案することができる。
以下の説明において、説明の目的のために、本開示に対する完全な理解を提供するために、多くの具体的な詳細が記載されている。これらの具体的な詳細がなくても、1つ以上の実施形態を実施することができることは、当業者にとって明白である。また、本開示を不明瞭にしないように、装置および方法をブロック図として示している。
以下の説明は、例示的な実施形態のみを提供しており、本開示の範囲、適用または構成を限定することを意図していない。むしろ、以下の例示的な実施形態の説明は、1つ以上の例示的な実施形態の実施を可能にするための説明を当業者に与える。添付の特許請求の範囲に記載された主題の精神および範囲から逸脱することなく、要素の機能および配置に対して様々な変更が考えられる。
以下の説明において、実施形態に対する完全な理解を提供するために、具体的な詳細が与えられる。しかしながら、当業者は、これらの具体的な詳細がなくても、実施形態を実施できることを理解することができる。例えば、不必要な詳細で実施形態を不明瞭にしないように、開示された主題におけるシステム、プロセス、および他の要素は、ブロック図のコンポーネントとして示されてもよい。また、実施形態を不明瞭にしないように、周知のプロセス、構造、および技術は、不必要な詳細なしで示されてもよい。さらに、様々な図面において、同様の参照番号および名称は、同様の要素を示している。
以下の説明において、説明の目的のために、本開示に対する完全な理解を提供するために、多くの具体的な詳細が記載される。これらの具体的な詳細がなくても、1つ以上の実施形態を実施することができることは、当業者にとって明白である。また、本開示を不明瞭にしないように、装置および方法をブロック図として示している。
本明細書および特許請求の範囲に使用された場合、用語「例えば」、「例示として」、「・・・のような」ならびに動詞「備える」、「有する」、「含む」およびそれらの他の動詞形は、1つ以上の構成要素または他の項目のリストと共に使用される場合、このリストから他の追加の構成要素または項目を排除しないことを意味するオープンエンドとして解釈すべきである。用語「・・・に基づく」は、少なくとも部分的に基づくことを意味する。さらに、理解すべきことは、本明細書に使用された表現および用語は、説明の目的のためのものであり、限定として具体的に定義されない限り、限定的なものとして見なすべきではないことである。本明細書に使用されたいずれかの見出しは、便宜のためのものであり、法的または限定的な効果を有しない。
本発明の実施形態を説明する際に、以下の定義が本開示の全体に適用可能である。
「制御システム」または「コントローラ」は、他の装置または他のシステムの挙動を管理、命令、指示、または調節するための装置または一組の装置と呼ばれてもよい。制御システムは、ソフトウェアまたはハードウェアのいずれかによって実装することができ、1つ以上のモジュールを含むことができる。フィードバックループを含む制御システムは、マイクロプロセッサを用いて実装することができる。制御システムは、組み込みシステムであってもよい。
「空調システム」または暖房、換気および空調(HVAC)システムは、蒸気圧縮サイクルを用いて、熱力学、流体力学および/または熱伝達の原理に基づいて、システムの構成要素を通して冷媒を移動させるシステムと呼ばれてもよい。空調システムは、建物の居住者に外気のみを供給するシステムから、建物の温度のみを制御するシステム、温度および湿度を制御するシステムまでの非常に幅広いシステムを含む。
「中央処理装置(CPU)」または「プロセッサ」は、ソフトウェア命令を読み取り、実行するコンピュータまたはコンピュータの構成要素と呼ばれてもよい。さらに、プロセッサは、「少なくとも1つのプロセッサ」または「1つ以上のプロセッサ」であってもよい。
「モジュール」または「ユニット」は、タスクまたはタスクの一部を実行するコンピュータ内の基本構成要素と呼ばれてもよい。これは、ソフトウェアまたはハードウェアのいずれかによって実装されてもよい。
本明細書および特許請求の範囲に使用された場合、用語「例えば」、「例示として」、「・・・のような」ならびに動詞「備える」、「有する」、「含む」およびそれらの他の動詞形は、1つ以上の構成要素または他の項目のリストと共に使用される場合、このリストから他の追加の構成要素または項目を排除しないことを意味するオープンエンドとして解釈すべきである。用語「・・・に基づく」は、少なくとも部分的に基づくことを意味する。さらに、理解すべきことは、本明細書に使用された表現および用語は、説明の目的のためのものであり、限定として具体的に定義されない限り、限定的なものとして見なすべきではないことである。本明細書に使用されたいずれかの見出しは、便宜のためのものであり、法的または限定的な効果を有しない。
図1Aは、システムの動作を制御するためにいくつかの実施形態によって使用される原理を示す概略図である。いくつかの実施形態は、システム1020を制御するように構成された制御装置1000を提供する。例えば、装置1000は、設計プロセスおよび機械において連続的に動作する動的システム1020を制御するように構成されてもよい。以下では、「制御装置」と「装置」とは、交換可能に使用されてもよく、同じことを意味する。以下では、「連続的に動作する動的システム」および「システム」は、交換可能に使用されてもよく、同じことを意味する。システム1020の例は、HVACシステム、LIDARシステム、凝縮ユニット、生産ライン、自己調整機械、スマートグリッド、自動車エンジン、ロボット、数値制御機械加工、モータ、衛星、発電機、交通ネットワークなどを含む。いくつかの実施形態は、装置1000が、遅延またはオーバーシュートすることなく最適な方法で制御動作を用いてシステム1020を制御すると共に、制御の安定性を確保するための制御コマンド1060を開発するという認識に基づく。
制御装置1000は、モデル予測制御(MPC)などのモデルベースの制御および予測技術を用いて、システム1020の制御コマンド1060を開発する。モデルベースの技術は、動的システムの制御に有利であり得る。例えば、MPCは、システム1020の動力学および制約を直接に考慮することができるモデルベースの設計フレームワークを可能にする。MPCは、システム1040のモデルに基づいて、制御コマンド1060を開発する。システム1020のモデル1040は、動的システム方程式、例えば偏微分方程式(PDE)または常微分方程式(ODE)を用いて記述されているシステム1020の動力学を指す。いくつかの実施形態において、モデル1040は、非線形高次元であり、リアルタイムで使用するのが困難であり得る。例えば、非線形モデルが正確に利用可能であっても、ハミルトン-ヤコビ-ベルマン(HJB)方程式と名付けられた、システム1020の動力学を記述する偏微分方程式(PDE)を解く必要があり、計算的に困難であるため、最適な制御コマンド1060を推定することは、本質的に困難なタスクである。
図1Bは、本発明の別の実施形態に従って、システムの動作を制御するための新規の原理を示す概略図である。
図1Aに示す方法は、物理学原理を用いてモデル1040を設計する。このような物理学ベースのモデリング手法とは対照的に、本発明のいくつかの実施形態は、システム1020のセンサによって測定された動作データを用いて、制御システムのモデル、例えばモデル1080aを設計し、次いで、データ駆動型モデル1080aを用いて、様々なモデルベースの制御方法に従ってシステムを制御することができる。
なお、いくつかの実施形態の目的は、データからシステムの実際のモデルを決定することである。すなわち、このようなモデルを用いて、システムの挙動を推定することができる。例えば、いくつかの実施形態の目的は、微分方程式を用いて、システムの動力学を捕捉するデータからシステムのモデルを決定することである。さらに、いくつかの実施形態の目的は、データから、物理学ベースモデルと類似の精度を有するロバストモデルを学習することである。
計算を単純化するために、いくつかの実施形態は、システム1020の動力学を記述する常微分方程式(ODE)1080aを定式化する。常微分方程式(ODE)1080aは、システムのデータ駆動型モデル1080aと呼ばれてもよい。いくつかの実施形態において、ODE1080aは、動的モード分解(DMD)技術を用いて定式化されてもよい。しかしながら、場合によっては、ODE1080aは、不確実性条件の場合、システム1020の実際の動力学(すなわち、PDEによって記述されている動力学)を再現することができない。不確実性条件の例は、PDEの境界条件が経時的に変化していること、またはPDEに関与する係数のうちの1つが経時的に変化していること、すなわちシステムの消耗であってもよい。
そのために、いくつかの実施形態は、不確実性条件をカバーすることによって、DMDデータ駆動型モデル1080aをロバスト化するクロージャモデル1080bを定式化する。いくつかの実施形態において、クロージャモデル1080bは、ODEに従ってシステム1020の挙動(例えば、動力学)の差を捕捉する、システム1020の状態の非線形関数であってもよい。クロージャモデル1080bは、ロバスト非線形制御を用いて定式化されてもよい。言い換えれば、システム1020の物理学ベースモデルは、ODE1080aとロバストクロージャモデル1080bとの組み合わせによって近似(推定)され、ロバストクロージャモデル1080bは、非線形ロバスト制御法を用いて設計される。このように、物理学ベースモデルの精度に近似するモデルは、クロージャモデル1080bによってロバスト化されたDMDモデル1080aの形でデータから学習される。
そのために、いくつかの実施形態は、ゲインを決定し、ゲインをロバストクロージャモデル1080bに含むことによって、システム1020の動力学を最適に再現する。いくつかの実施形態において、ゲインは、最適化アルゴリズムを用いて適応されてもよい。ODE1080aと適応されたゲインを有するクロージャモデル1080bとを含む次数低減モデル1080は、システム1020の動力学を再現する。したがって、モデル1080は、システム1020の動力学を最適に再現する。いくつかの実施形態は、モデル1080が物理学ベースの高次元モデルよりも少ない数のパラメータを含むという認識に基づく。そのため、次数低減モデル1080は、システム1020の物理モデルを記述するモデル1040よりも計算的に簡単である。制御ポリシー(コマンド)1060は、モデル1080を用いて決定されてもよい。制御ポリシー1060は、システム1020の状態を制御(生成)コマンドに直接にマッピングすることによって、システム1020の動作を制御する。したがって、低減モデル1080は、システム1020の制御を効率的に設計するために使用される。
図1Cは、いくつかの実施形態に従って、システム1020の動作を制御するための制御装置1200を示すブロック図である。装置1200は、装置1200を他のシステムおよび他の装置に接続するための入力インターフェイス1202と出力インターフェイス1218とを含む。いくつかの実施形態において、装置1200は、複数の入力インターフェイスと、複数の出力インターフェイスとを含むことができる。入力インターフェイス1202は、システム1020の状態軌跡1216を受信するように構成されている。入力インターフェイス1202は、バス210を介して装置1200をネットワーク1214に接続するように構成されたネットワークインターフェイスコントローラ(NIC)1212を含む。装置1200は、無線ネットワークまたは有線ネットワークのいずれかであるネットワーク1214を介して、システム1020の状態軌跡1216を受信する。
状態軌跡1216は、システム1020の実際の動力学挙動を定義するシステム1020の複数の状態であってもよい。例えば、状態軌跡1216は、システム1020を制御するための基準連続状態空間として機能する。いくつかの実施形態において、状態軌跡1216は、システム1020の一部の状態のリアルタイム測定値から受信されてもよい。
制御装置1200は、プロセッサ1204と、プロセッサ1204によって実行可能な命令を記憶するためのメモリ1206とをさらに含む。プロセッサ1204は、シングルコアプロセッサ、マルチコアプロセッサ、コンピューティングクラスタ、または任意の他の構成であってもよい。メモリ1206は、ランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、フラッシュメモリ、または任意の他の好適なメモリシステムを含むことができる。プロセッサ1204は、バス210を介して、1つ以上の入力装置および出力装置に接続されている。記憶された命令は、システム1020の動作を制御するための方法を実装する。
メモリ1206は、記憶装置1208を含むようにさらに拡張されてもよい。記憶装置1208は、モデル1208aと、コントローラ1208bと、更新モジュール1208cと、制御コマンドモジュール1208dとを記憶するように構成されてもよい。いくつかの実施形態において、モデル1208aは、少なくとも1つの微分方程式とロバストクロージャモデルとの組み合わせを含み、システム1020の動力学を記述するモデルであってもよい。モデルの微分方程式は、常微分方程式(ODE)1080aであってもよい。モデル1208aのクロージャモデルは、システム1020の状態の線形関数または非線形関数であってもよい。ロバストクロージャモデルは、システム1020の挙動を模倣するように、非線形ロバスト制御に基づいて設計されてもよい。当然ながら、ロバストクロージャモデルが学習されると、クロージャモデルは、図1Aに示されたクロージャ1080bであってもよい。
コントローラ1208bは、プロセッサ1204によって実行されると、1つ以上のモジュールを実行するための命令を記憶装置1208に記憶するように構成されてもよい。いくつかの実施形態は、コントローラ1208bが記憶装置1208の各モジュールを管理してシステム1020を制御するという認識に基づく。
さらに、いくつかの実施形態において、更新モジュール1208cは、更新されたロバストクロージャモデルのゲインを更新するように構成されてもよい。そのために、いくつかの実施形態は、更新されたゲインを有する更新されたクロージャモデルを含むモデル1208aを用いて推定されたシステム1020の状態と、システムの実際の状態との間の誤差を低減するためのゲインを決定する。いくつかの実施形態において、システムの実際の状態は、測定された状態であってもよい。いくつかの実施形態において、更新モジュール1208cは、極値探索を用いてゲインを更新することができる。いくつかの他の実施形態において、更新モジュール1208cは、ガウスプロセスベースの最適化を用いてゲインを更新することができる。
制御コマンドモジュール1208dは、更新されたロバストクロージャモデルを含むモデル1208aに基づいて、制御コマンドを決定するように構成されてもよい。制御コマンドは、システムの動作を制御することができる。いくつかの実施形態において、システムの動作は、制約を受けることができる。そのために、制御コマンドモジュール1208dは、予測モデルベースの制御を用いて、制約を実施しながら制御コマンドを決定する。制約は、システム1020の連続状態空間に対する状態制約と、システム1020の連続制御入力空間に対する制御入力制約とを含む。
出力インターフェイス1218は、制御コマンドをシステム1020のアクチュエータ1220に送信して、システムの動作を制御するように構成されている。出力インターフェイス1218のいくつかの例は、システム1020を制御するように、制御コマンドを提出する制御インターフェイスを含むことができる。
例えば、図1Dに示された本発明のいくつかの実施形態において、高次元を有するシステム150、例えば、部屋の全体にわたって分布する気流および温度値を表す多数の状態を有する空調システムを考える。次いで、データ160を収集するためにシステム上に複数のセンサを配置する。データは、ロバストデータ駆動型次数低減モデル(ROM)165を生成するために使用される。次いで、このロバストデータ駆動型ROMは、実際のシステム170を予測および制御するために使用される。
図2に示された本発明のいくつかの実施形態において、データ駆動型ROM165は、動的モード分解(DMD)モデル150を用いて得られる。すなわち、ロバストクロージャモデル250を動的モード分解(DMD)モデル150に追加することによって、DMDベースのロバスト次数低減モデル165を生成する。
図3Aに示された本発明のいくつかの実施形態において、ロバストクロージャモデル250は、ロバスト制御法350に基づいて設計される。例えば、いくつかの実施形態において、図3Bに示すように、不確実DMDベースのデータ駆動型モデル150は、不確実モデルのエネルギー320を評価するために使用されるリヤプノフ関数340を用いてロバスト化(350)され、このエネルギー評価から、クロージャモデルの形にした補正項が得られる(325)。最後に、ロバストクロージャモデルと共に不確実DMDベースのモデルを追加することによって、ロバスト次数低減モデル165が得られる。
図4は、本発明の一実施形態に従って、ロバストクロージャモデル調整を示す概略図である。他の実施形態は、図5、図6、図7A、図7Bおよび図7Cにも示されている。図5は、ロバストクロージャモデル適応アルゴリズムを示す概略図である。
図6は、最適な極値探索に基づいたロバストモデル低減を示す概略図である。図7Aは、最適なガウス過程に基づいたロバストモデル低減を示す概略図である。図7Bは、ロバストモデル低減に基づいた深層ニューラルネットワーク学習プロセスを示す概略図である。図7Cは、強化学習プロセスに基づいたロバストモデル低減を示す概略図である。
ロバストクロージャモデル325は、物理システム450からの測定値とロバスト次数低減モデル440からの予測値との間の差460に基づいて、さらに調整される(430)。この調整は、クロージャモデルの一部のパラメータ、例えば基底関数の係数またはクロージャモデルの一部の物理係数を調整することによって実現することができる。これは、適応アルゴリズム530(図5)を用いて実現することができる。この場合の適応アルゴリズムは、極値探索最適化アルゴリズム630(図6)であってもよく、ガウスプロセスに基づいた最適化730のファミリーからのベイジアン最適化アルゴリズム(図7A)であってもよく、深層ニューラルネットクローク830(図7B)であってもよく、または強化学習方法930(図7C)であってもよい。
図8は、いくつかの実施形態に従って、ゲインを更新するための極値探索(ES)アルゴリズム8900のフローチャートを示す。いくつかの実施形態は、ESアルゴリズム8900が、装置1200が最適なクロージャモデルのゲインを調整することを可能にするモデルフリー学習アルゴリズムであるという認識に基づく。いくつかの実施形態は、終了条件が満たされるまで、ESアルゴリズム8900が摂動信号を用いて最適なクロージャモジュールのゲインを反復的に摂動させるという認識に基づく。いくつかの実施形態において、摂動信号は、所定の周波数を有する周期信号であってもよい。最適なロバストクロージャモデルのゲインは、制御パラメータであってもよい。
ステップ8902aにおいて、ESアルゴリズム8900は、最適なクロージャモデルの制御パラメータを摂動させることができる。例えば、ESアルゴリズム8900は、摂動信号を用いて制御パラメータを摂動させることができる。いくつかの実施形態において、摂動信号は、以前に更新された摂動信号であってもよい。ステップ8904aにおいて、ESアルゴリズム8900は、制御パラメータの摂動に応答して、クロージャモデル性能のコスト関数Qを決定することができる。ステップ8906aにおいて、ESは、摂動信号を用いてコスト関数を修正することによって、コスト関数の勾配を決定することができる。例えば、コスト関数の勾配は、コスト関数と摂動信号とESアルゴリズム8900のゲインとの積として決定される。ステップ8908aにおいて、ESアルゴリズム8900は、摂動信号を決定された勾配と統合することによって、次の反復の摂動信号を更新することができる。ES9800の反復は、終了条件が満たされるまで繰り返すことができる。
図9は、いくつかの実施形態に従って、性能コスト関数を用いてゲインを更新するための極値探索(ES)アルゴリズム8900のフローチャートを示す。ステップ8904bにおいて、ES8900は、クロージャモデル性能のコスト関数を決定することができる。いくつかの実施形態において、ESアルゴリズム8900は、ステップ8904bにおいて、図8のステップ8904aに例示的に示されているコスト関数を決定する。いくつかの実施形態において、決定されたコスト関数は、性能コスト関数8904b-0であってもよい。いくつかの実施形態例によれば、性能コスト関数8904b-0は、ギャップ460の挙動を表す二次方程式であってもよい。
ステップ8906bにおいて、ESアルゴリズム8900は、決定されたコスト関数に時間の第1の周期信号8906b-0を乗算することによって、摂動コスト関数8906b-1を生成することができる。ステップ8908bにおいて、ESアルゴリズム8900は、摂動コスト関数8906b-1から、第1の周期信号8906b-0の位相に対して90度の直交位相シフトを有する第2の周期信号8908b-0を減算することによって、コスト関数8908b-1の導関数を生成することができる。ステップ8910bにおいて、ESアルゴリズム8900は、コスト関数8908b-1の導関数を時間に対して積分することによって、時間の関数として制御パラメータ値8910b-0を生成することができる。
Figure 2024520177000002
図11は、いくつかの実施形態に従って、複数のパラメータを調整するための極値探索(ES)コントローラ1100を示す概略図である。いくつかの実施形態は、マルチパラメータESコントローラ1100が単一パラメータES1000から導出されるという認識に基づく。例えば、単一パラメータESコントローラ1000をn回に複製することによって、nパラメータESコントローラ1100を得ることができる。いくつかの実施形態は、nパラメータESコントローラ1100が、n個の異なる周波数を有する1~1104-nをそれぞれ有するn個の摂動信号1104を用いて、n個の制御パラメータセットθ1102を摂動させることによって最適なクロージャモデルを更新するという認識に基づく。いくつかの実施形態において、n個の異なる周波数の各々は、システム1020の周波数応答よりも大きい。また、n個の摂動信号1104-1~1104-nのn個の異なる周波数は、第1の摂動信号1104-1の第1の周波数と第2の摂動信号1104-2の第2の周波数との和が第3の摂動信号1104-3の第3の周波数に等しくない収束条件を満たす。
Figure 2024520177000003
理解されるように、ESアルゴリズムまたはガウスプロセスベースの最適化を用いて最適なクロージャモデル中の制御パラメータθ(すなわち、正のゲイン)を更新すると、DMDベースのODEモデル150と組み合わせた最適なクロージャモデルは、システム1020の実際の挙動12602を模倣する。例えば、推定された挙動12604は、ギャップ12606のない実際の挙動12602と定性的および定量的に類似することができる。
そのために、ODE1080aと更新されたゲインを有するクロージャモデル1080bとを含む最適な低減モデル1080を用いて、制御コマンド1060を決定することができる。いくつかの実施形態において、ODEと更新されたゲインを有する最適なクロージャモデルと含む最適な低減モデル1080は、システム1020の制御ポリシー1060を開発することができる。制御ポリシー1060は、システム1020の状態を制御コマンドに直接にマッピングすることによって、システム1020の動作を制御することができる。システム1020がHAVCシステム1306である場合、制御コマンドの例は、位置弁、圧縮機の速度、蒸発器のパラメータなどを含む。モータシステム1500が回転子である場合、制御コマンドの例は、回転子の速度、モータの温度などを含む。さらに、出力インターフェイス1218を介して制御コマンドをシステム1020のアクチュエータに送信することによって、システム1020を制御することができる。
図12Bは、システムを制御するための装置200の例示的なリアルタイム実装を示す。この場合、システムは、空調システム1200である。この例において、制御装置200は、部屋1300の外部に配置された空調システム1200を制御するように構成され、部屋1300は、ドア1302および少なくとも1つの窓1304を有する。システムの状態は、換気ユニット1306および空調システム1200を介して装置200によって制御されている部屋1300の温度および気流速度であってもよい。一組のセンサ1308、例えば、部屋1300の特定の位置の気流の速度を測定するための少なくとも1つの気流センサ1308aおよび部屋の温度を測定するための少なくとも1つの温度センサ1308bは、部屋1300に配置されている。この場合、コスト関数Qは、温度センサおよび気流センサからの測定信号と、次数低減モデル1080から得られた温度値および気流速度値の推定信号との差の二乗によって得られる。他の種類の環境、例えば、複数のHVACユニットを有する部屋、または複数の部屋を有する家屋を考慮することができる。
図3Aおよび3Bに例示的に示されたように、いくつかの実施形態は、空調システム1200がブシネスク方程式と呼ばれる物理学ベースのモデルによって記述され得るという認識に基づく。しかしながら、ブシネスク方程式は、空調システム102を制御するためのブシネスク方程式を解決するための無限次元を含む。そのため、図1A~11の詳細な説明で説明したように、ODE402と更新されたゲインを有する更新されたクロージャモデルとを含むモデルは、定式化される。このモデルは、空調システム1200の動力学(例えば、気流動力学)を最適に再現する。さらに、いくつかの実施形態において、気流動力学モデルは、空調システム1200の動作中に、気流の値(例えば、気流の速度)と空調されている部屋1300の温度とを結び付ける。そのために、制御装置200は、空調システム1200を最適に制御して、空調された気流を生成する。
図13は、車両のシステムを制御するための装置200の例示的なリアルタイム実装を示す。この場合、システムは、車両(車両操作システム)1400である。車両1400は、乗用車、バス、またはローバーなどの任意の種類の車輪付き車両であってもよい。また、車両1400は、自律車両または半自律車両であってもよい。例えば、いくつかの実施形態は、車両1400の動作を制御する。動作を表すシステムの状態の例としては、車両1400のステアリングシステム1404によって制御される車両の横方向動作が挙げられる。一実施形態において、ステアリングシステム1404は、コントローラ1402によって制御される。追加的にまたは代替的には、ステアリングシステム1404は、車両1400の運転者によって制御されてもよい。
いくつかの実施形態において、車両は、コントローラ1402または車両1400の他の構成要素によって制御され得るエンジン1410を含んでもよい。いくつかの実施形態において、車両1400は、エンジン1410の代わりに電気モータを含んでもよく、コントローラ1402または車両1400の他の構成要素によって制御されてもよい。車両はまた、周囲環境の状態を検知するための1つ以上のセンサ1406を含むことができる。センサ1406の例は、レーダなどの測距器を含む。いくつかの実施形態において、車両1400は、車両の現在の運動パラメータおよび内部状態を検知するための1つ以上のセンサ1408を含む。1つ以上のセンサ1408の例は、全地球測位システム(GPS)、加速度計、慣性測定ユニット、ジャイロスコープ、シャフト回転センサ、トルクセンサ、たわみセンサ、圧力センサ、および流量センサを含む。これらのセンサは、コントローラ1402に情報を提供する。車両は、有線または無線通信チャネルを介してコントローラ1402といくつかの実施形態の装置200との通信を可能にするトランシーバ1412を装備してもよい。例えば、コントローラ1402は、トランシーバ1412を介して、装置200から制御コマンドを受信する。また、コントローラ1402は、車両の動作を制御するために、受信した制御コマンドを車両1400の1つ以上のアクチュエータ、例えば車両のステアリングホイールおよび/またはブレーキに出力する。さらに、制御装置200は、ステアリングシステム1404、コントローラ1402およびエンジン1410を含む車両1400の部品に配置された1つ以上のセンサ1408を介して、システム(車両1400)の状態を取得/測定するように構成されている。この場合のコスト関数Qは、センサによって測定される車両の位置および速度と、システム1080の次数低減モデルから得られる車両の位置および速度との間の距離の二乗によって得られる。
図14は、システム1020を制御するための装置200の例示的なリアルタイム実装を示す。この場合、システム1020は、誘導モータ(誘導モータシステム)1500である。この例において、誘導モータ1500は、装置200と一体化されている。装置は、図1A~11の詳細な説明で説明したように誘導モータ1500の動作を制御するように構成されている。いくつかの実施形態において、誘導モータ1500の動作は、制約を受けることがある。制約は、誘導モータ1500の連続状態空間に対する状態制約と、誘導モータ1500の連続制御入力空間に対する制御入力制約とを含む。いくつかの実施形態において、モータ1500の状態は、固定子磁束、線電流、および回転子速度のうちの1つまたは組み合わせを含む。状態制約は、固定子磁束、線電流、および回転子速度のうちの1つまたは組み合わせの値に対する制約を含む。いくつかの実施形態において、制御入力は、励起電圧の値を含む。制御入力制約は、励起電圧に対する制約を含む。この場合のコスト関数Qは、センサによって測定されたモータの線電流および回転子速度と、システム1080の次数低減モデルから得られた線電流および回転子速度との間の距離の二乗によって得られる。
動的モード分解を用いたロバストデータ駆動型モデリングの例
ここで、上述したステップをより数学的な設定に置き換えてみよう。実際に、我々は、この形の厳密な高次元非線形PDE210システムによって記述される物理システムの状態推定問題を検討する。
Figure 2024520177000004
Figure 2024520177000005
Figure 2024520177000006
Figure 2024520177000007
Figure 2024520177000008

クロージャモデルおよび極値探索に基づいた調整の例
Figure 2024520177000009
Figure 2024520177000010
仮想制御項uは、DMD-ROMモデルを安定させるために追加された一般的なクロージャモデル項を表すために追加されている。クロージャモデルに関する既存の物理学に基づく文献との違いは、このDMD-ROMの文脈において、クロージャモデル問題をロバスト安定化問題として定式化していることである。
本発明者らは、ロバスト補正と粘性消失によるロバスト補正と呼ばれる2つのクロージャモデルを提案する。次の節では、これらのクロージャモデルを紹介し、リヤプノフ理論を用いてその安定性およびロバスト性を解析する。
DMD-ROMのクロージャモデル
クロージャモデル1の例-ロバスト補正
Figure 2024520177000011
Figure 2024520177000012
Figure 2024520177000013
Figure 2024520177000014
Figure 2024520177000015
Figure 2024520177000016
Figure 2024520177000017
上記の各々の実施形態は、フローチャート、フロー図、データフロー図、構造図、またはブロック図として示されるプロセスとして説明されている。フローチャートが動作を順次のプロセスとして説明しても、多くの動作は、並列にまたは同時に実行されてもよい。また、動作の順序は、変更されてもよい。プロセスの動作が完了したときに、プロセスを終了することができるが、このプロセスは、討論されていないまたは図示されていない追加のステップを含むことができる。さらに、具体的に記載されたプロセス内の全ての動作は、全ての実施形態に含まれる必要がない。プロセスは、方法、関数、プロシージャ、サブルーチン、サブプログラムなどであってもよい。プロセスが関数である場合、関数の終了は、当該関数を呼び出し関数または主関数に復帰させることに対応する。
さらに、開示された主題の実施形態は、手動でまたは自動で、少なくとも部分的に実装されてもよい。手動または自動の実装は、マシン、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語、またはそれらの任意の組み合わせで実装されてもよく、または少なくとも支援されてもよい。ソフトウェア、ファームウェア、ミドルウェア、またはマイクロコードで実装される場合、必要なタスクを実行するためのプログラムコードまたはコードセグメントは、機械可読媒体に記憶されてもよい。プロセッサは、必要なタスクを実行することができる。

Claims (20)

  1. メモリに記憶され、プロセッサを用いてシステムを制御するためのデータ駆動型モデルとロバストクロージャモデルとを含むコンピュータ実施方法であって、
    インターフェイスを介して、前記システムの少なくとも1つのセンサからセンサ信号を取得することと、
    前記センサ信号に基づいて、前記システムの状態を計算することと、
    前記システムの前記状態に基づいて、前記ロバストクロージャモデルのゲインを決定することと、
    前記決定されたゲインに基づいて、前記システムの状態を再現することと、
    前記データ駆動型モデルと前記ロバストクロージャモデルとを組み合わせることによって、前記システムの物理学ベースモデルを推定することと、
    前記推定された物理学ベースモデルを用いて前記システムの前記状態をマッピングすることによって、制御コマンドを生成することとを含む、コンピュータ実施方法。
  2. 前記ネットワークは、有線ネットワークまたは無線ネットワークである、請求項1に記載のコンピュータ実施方法。
  3. 前記少なくとも1つのセンサは、前記システムの状態を測定するように構成されている、請求項1に記載のコンピュータ実施方法。
  4. 前記データ駆動型モデルモジュールおよび前記ロバストクロージャモデルに使用されているパラメータの数は、物理学ベースの高次元モデルに使用されているパラメータの数よりも少ない、請求項1に記載のコンピュータ実施方法。
  5. 前記ロバストクロージャモデルは、非線形ロバスト制御法に基づいて設計されている、請求項1に記載のコンピュータ実施方法。
  6. 前記クロージャモデルは、偏微分方程式(PDE)の境界条件に基づいて定式化され、
    前記境界条件は、経時的に変化する、請求項1に記載のコンピュータ実施方法。
  7. 前記ロバストクロージャモデルは、前記システムの前記状態の線形関数または前記システムの前記状態の非線形関数によって表される、請求項1に記載のコンピュータ実施方法。
  8. 前記システムは、空調システムである、請求項1に記載のコンピュータ実施方法。
  9. 前記システムは、車両操作システムである、請求項1に記載のコンピュータ実施方法。
  10. 前記システムは、誘導モータシステムである、請求項1に記載のコンピュータ実施方法。
  11. システムの動作を制御するためのコントローラであって、
    ネットワークを介して前記システムの状態軌跡を受信するように構成された入力インターフェイスと、
    少なくとも1つの動的モード分解ベースのデータ駆動型モデルとロバストクロージャモデルとの組み合わせを含む前記システムの動力学モデルを記憶するように構成されたメモリと、
    プロセッサと、
    出力インターフェイスとを備え、
    前記プロセッサは、
    最適化アルゴリズムを用いて前記ロバストクロージャモデルを更新するように構成され、前記最適化アルゴリズムは、前記受信した状態軌跡の形状と、前記更新されたロバストクロージャモデルを含む前記モデルを用いて推定された状態軌跡の形状との間の差を減少する価値関数を含み、
    前記更新されたロバストクロージャモデルを含む前記データ駆動型モデルに基づいて制御コマンドを決定するように構成され、
    前記出力インターフェイスは、前記制御コマンドを前記システムのアクチュエータに送信することによって、前記システムの前記動作を制御するように構成されている、コントローラ。
  12. 前記ネットワークは、有線ネットワークまたは無線ネットワークである、請求項11に記載のコントローラ。
  13. 前記少なくとも1つのセンサは、前記システムの前記状態軌跡を測定するように構成されている、請求項11に記載のコントローラ。
  14. 前記少なくとも1つの動的モード分解ベースのデータ駆動型モデルおよび前記ロバストクロージャモデルに使用されているパラメータの数は、物理学ベースの高次元モデルに使用されているパラメータの数よりも少ない、請求項11に記載のコントローラ。
  15. 前記ロバストクロージャモデルは、非線形ロバスト制御法に基づいて設計されている、請求項11に記載のコントローラ。
  16. 前記クロージャモデルは、偏微分方程式(PDE)の境界条件に基づいて定式化され、
    前記境界条件は、経時的に変化する、請求項11に記載のコントローラ。
  17. 前記ロバストクロージャモデルは、前記システムの前記状態の線形関数または前記システムの前記状態の非線形関数によって表される、請求項11に記載のコントローラ。
  18. 前記システムは、空調システムである、請求項11に記載のコントローラ。
  19. 前記システムは、車両操作システムである、請求項11に記載のコントローラ。
  20. 前記システムは、誘導モータシステムである、請求項11に記載のコントローラ。
JP2024510548A 2021-05-20 2022-03-01 高次元物理システムのモデリング、予測、および制御を行うためのロバスト適応動的モード分解 Pending JP2024520177A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US17/325,434 US11790247B2 (en) 2021-05-20 2021-05-20 Robust adaptive dynamic mode decomposition for modeling, prediction, and control of high dimensional physical systems
US17/325,434 2021-05-20
PCT/JP2022/009580 WO2022244389A1 (en) 2021-05-20 2022-03-01 Robust adaptive dynamic mode decomposition for modeling, prediction, and control of high dimensional physical systems

Publications (1)

Publication Number Publication Date
JP2024520177A true JP2024520177A (ja) 2024-05-21

Family

ID=81308231

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2024510548A Pending JP2024520177A (ja) 2021-05-20 2022-03-01 高次元物理システムのモデリング、予測、および制御を行うためのロバスト適応動的モード分解

Country Status (5)

Country Link
US (1) US11790247B2 (ja)
EP (1) EP4341755A1 (ja)
JP (1) JP2024520177A (ja)
CN (1) CN117321511A (ja)
WO (1) WO2022244389A1 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112005002694B4 (de) * 2004-11-01 2010-03-11 Southwest Research Institute, San Antonio Steuerungssystem für Motoren mit mehreren Verbrennungsarten
US7285926B2 (en) * 2005-06-30 2007-10-23 General Electric Company System and method for locomotive adhesion control
US10145576B2 (en) * 2015-03-06 2018-12-04 Mitsubishi Electric Research Laboratories, Inc. System and method for controlling operations of air-conditioning system
US10619879B2 (en) * 2018-03-21 2020-04-14 Mitsubishi Electric Research Laboratories, Inc. System and method for controlling operations of air-conditioning system
US20210146531A1 (en) * 2019-11-20 2021-05-20 Nvidia Corporation Guided uncertainty-aware policy optimization: combining model-free and model-based strategies for sample-efficient learning

Also Published As

Publication number Publication date
US20220374725A1 (en) 2022-11-24
EP4341755A1 (en) 2024-03-27
US11790247B2 (en) 2023-10-17
WO2022244389A1 (en) 2022-11-24
CN117321511A (zh) 2023-12-29

Similar Documents

Publication Publication Date Title
JP7183446B2 (ja) 機械の動作を制御する装置及び方法、並びに記憶媒体
US8265854B2 (en) Configurable automotive controller
JP7297155B2 (ja) マシンの動作を制御するためのシステムおよびコンピュータ実施方法
US10895854B1 (en) System and method for control constrained operation of machine with partially unmodeled dynamics using Lipschitz constant
US10619879B2 (en) System and method for controlling operations of air-conditioning system
CN114761966A (zh) 用于以轨迹为中心的基于模型的强化学习的稳健优化的系统及方法
JP7357813B2 (ja) データ駆動型モデル適応を用いる制御のための装置および方法
US11474486B2 (en) Model-based control with uncertain motion model
Menner et al. Automated controller calibration by Kalman filtering
Rudd et al. A generalized reduced gradient method for the optimal control of multiscale dynamical systems
CN116382093A (zh) 用于模型未知的非线性系统最优控制方法及设备
Bierling et al. Comparative analysis of mrac architectures in a unified framework
JP2024520177A (ja) 高次元物理システムのモデリング、予測、および制御を行うためのロバスト適応動的モード分解
Menées et al. Fuzzy model predictive control for nonlinear processes
Rahmani et al. Optimal control of a MEMS gyroscope based on the Koopman theory
Khanduja et al. Hybrid state of matter search algorithm and its application to PID controller design for position control of ball balancer system
Rahmani et al. Data-driven Koopman fractional order PID control of a MEMS gyroscope using bat algorithm
US20240152748A1 (en) System and Method for Training of neural Network Model for Control of High Dimensional Physical Systems
Pandey et al. Learning koopman operators with control using bi-level optimization
US20230341141A1 (en) Time-varying reinforcement learning for robust adaptive estimator design with application to HVAC flow control
Medina et al. Trajectory tracking for non-holonomic mobile robots: A comparison of sliding mode control approaches
Kanai et al. Model Predictive Control with Model Error Compensation by Koopman Approach
Kuncara et al. Integration of nonlinear observer and unscented Kalman filter for pose estimation in autonomous truck–trailer and container truck
CN117716302A (zh) 用于校准反馈控制器的系统和方法
Feng et al. Model Parameter Identification for Non-Fully Controlled Nonlinear Dynamics Systems Using Trajectory Pattern Method

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231026

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231026