JP6359182B2 - 機械の動作を制御するための方法およびシステム - Google Patents

機械の動作を制御するための方法およびシステム Download PDF

Info

Publication number
JP6359182B2
JP6359182B2 JP2017516816A JP2017516816A JP6359182B2 JP 6359182 B2 JP6359182 B2 JP 6359182B2 JP 2017516816 A JP2017516816 A JP 2017516816A JP 2017516816 A JP2017516816 A JP 2017516816A JP 6359182 B2 JP6359182 B2 JP 6359182B2
Authority
JP
Japan
Prior art keywords
machine
model
prediction
horizon
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017516816A
Other languages
English (en)
Other versions
JP2017528848A (ja
Inventor
ディ・カイラノ、ステファノ
ダニエルソン、クロース
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JP2017528848A publication Critical patent/JP2017528848A/ja
Application granted granted Critical
Publication of JP6359182B2 publication Critical patent/JP6359182B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/04Programme control other than numerical control, i.e. in sequence controllers or logic controllers
    • G05B19/10Programme control other than numerical control, i.e. in sequence controllers or logic controllers using selector switches
    • G05B19/106Programme control other than numerical control, i.e. in sequence controllers or logic controllers using selector switches for selecting a programme, variable or parameter
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/048Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/23Pc programming
    • G05B2219/23456Model machine for simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Feedback Control In General (AREA)

Description

本発明は、包括的には、機械の動作を制御することに関し、より詳細には、後退ホライズンにわたってモデル予測制御(MPC)を用いて動作を制御することに関する。
機械制御では、ソフトウェアまたはハードウェアの一方または組み合わせを用いて実施することができるコントローラーが、例えば、センサーおよび/または推定器、機械の出力から取得された測定値に基づいて、この機械への入力のコマンド値を生成する。コントローラーは、機械が所望のとおり動作するように、例えば、動作が所望の基準プロファイルに従うかまたは出力をある特定の値に調整するように入力を選択する。いくつかの場合には、コントローラーは、例えば、対応する変数がいくつかの所定の範囲内にあることを確保して物理的仕様から安全な機械動作を確保する制約を機械の入力および出力に対して課す。そのような制約を課すために、コントローラーは、多くの場合、機械のモデルを用いて、コマンド、すなわち、制御入力が印加されたときに機械がどのような挙動を引き起こすのかを予測する。制約を機械の入力および出力に対して課している間に機械の制御を達成することが可能なコントローラーの1つの例は、モデル予測制御(MPC)である。
MPCは、機械のモデルの反復的な有限ホライズン最適化に基づいており、適切な制御動作を取るために将来のイベントを予想する能力を有する。これは、制約を条件として、将来の有限時間ホライズンにわたって機械の動作を最適化し、あとは、現在のタイムスロットにわたって制御を実施するだけで達成される。例えば、制約は、機械の物理的限界、機械の動作に対する安全性限界、および軌道上の性能限界を表すことができる。機械の制御ストラテジーは、そのような制御ストラテジーについて機械によって引き起こされた運動が全ての制約を満たすときに許容することができる。例えば、時間tにおいて、機械の現在の状態がサンプリングされ、許容可能なコスト最小化制御ストラテジーが、将来における比較的短い時間ホライズンについて求められる。具体的には、オンライン計算またはリアルタイム計算が、時間t+Tまでのコスト最小化制御ストラテジーを求める。制御のステップが実施された後、状態が再びサンプリングされ、計算がその時の現在の状態から開始して繰り返され、新たな制御および新たな予測された状態パスが得られる。予測ホライズンは、前方にシフトし、この理由から、MPCは、後退ホライズン制御とも呼ばれる。
MPCは、システムの様々な物理的制約および仕様制約を条件として、有限の将来の時間にわたって最適制御問題を解くことによって、システムのモデルおよび所望の基準軌道に基づいて機械の運動の実際の軌道を生成するのに用いることができる。MPCは、機械の基準運動と実際の運動との間の誤差、機械のエネルギー消費、および誘発されるシステム振動等の機械の運動の性能指数を最小化することを目標とする。
MPCは、モデルベースのフレームワークであるので、MPCの性能は、必然的に、最適制御計算において用いられる予測モデルの品質に依存する。しかしながら、ほとんどの場合、いくつかのパラメーターは、正確に測定されないので、機械動特性のモデルは、事前には未知である。このため、コントローラーは、機械の既に動作中に、機械のモデルの未知のパラメーターを推定することが必要な場合があり、このため、パラメーターが推定されている間、制約を課す場合もある。そのような問題を取り扱う従来の手法は、適応型MPCまたは学習ベースのMPCを含み、これらのMPCでは、未知の機械パラメーターを学習するために、MPC制御問題が、閉ループ同定方式を用いて強化される。未知のパラメーターを学習することによって、コントローラーによって達成される機械の動作が改善される。
しかしながら、適応型MPCおよび学習ベースのMPCの現在の手法は、複数の理由のために限界がある。第1に、未知のパラメーターを推定している間、制約が違反される可能性があるか、または制約を控えめに課すために、制御性能が過度に低減される場合がある。実際に、特許文献1に記載されている方法等のいくつかの既存の方法は、制約を単に無視し、このため、制約を条件として機械の許容可能な制御ストラテジーを生成することが可能でない。
第2に、機械の識別されたモデルに基づいてMPCの予測モデルを単に調整することは、機械の出力が所望の値を達成することを保証するのに十分でない。したがって、不確実性を含むMPCを用いて制約を受ける機械の動作を制御する方法が必要とされている。
MPCの挙動は、予測モデルおよび性能指数に依拠するため、第1のものが更新されると、第2のものも、機械出力の所望の値への収束を達成するように調整されなくてはならない。これは、MPC問題のある特定のさらなる制約の特定の設計も必要とする。また、コスト関数を調整することは、計算的に単純であることも必要である。
第3に、小さな推定誤差によって、小さな制御誤差しか生じないように、パラメーター推定誤差と、機械の制御における誤差との間に、ある特定の比例関係が存在することが望ましい。
最後に、適応型MPCのためのいくつかの方法は、かなりの計算量を必要とし、高価なプロセッサにおいても低速でしか実行することができず、低い応答帯域幅を有する機械を制御することしか可能でない。
したがって、不確実性を含むMPCを用いて機械の動作を制御する方法が必要とされている。ここで、機械の動作は、制約を条件としており、制御誤差は、パラメーター推定誤差に比例し、推定誤差が消えると収束が達成される。
米国特許出願公開第2011/0022193号
本発明のいくつかの実施の形態の目的は、不確実性を含むモデル予測制御(MPC)を用いて、制約を条件とする機械の動作を制御する方法を提供することである。
1つの実施の形態の別の目的は、MPCによって用いられる機械のモデルおよびコスト関数を更新することである。この実施の形態は、MPCが、予測ホライズンに沿って機械の動作を予測するのに用いられるモデルに依拠し、機械の動作の性能を指定するコスト関数にも依拠するという認識に基づく。したがって、機械のモデルが更新されるとき、所望の状態への機械の移動の収束を達成するために、コスト関数も更新される必要がある。異なる実施の形態の目的は、コスト関数を更新するのに必要とされる計算複雑度を低減することである。
本発明の異なる実施の形態の目的は、パラメーター推定誤差と機械の制御における誤差との間の比例関係を可能にし、それによって、例えば、小さな推定誤差によって小さな制御誤差しか生じないようにすることである。本発明の別の実施の形態の目的は、MPCの制御および更新中に全ての制約を満たすことを確実にするためのMPCの追加の制約を提供し、全ての時点において制約を強制し、機械の状態が最終的に目標値を達成するようにすることである。
本発明のいくつかの実施の形態は、コスト関数が、不確実性を有するモデルのパラメーターを含むように規定され得るという認識に基づく。そのようにして、モデルのパラメーターが更新されるとき、そのような更新の結果として、コスト関数も更新される。
いくつかの実施の形態は、機械パラメーターの不確実な値のための許容可能な範囲に基づいて規定されたモデルの集合体に対する制約、および調整可能なコスト関数に基づいて設計された追加の制約を強制することが可能であるという別の認識に基づく。モデルの集合体は、機械について、実現可能な状態および入力の集合を提供する。例えば、これらの実現可能な状態の特殊な部分集合は、この部分集合内の全ての状態について、それらの既知の範囲内の未知の機械パラメーターの全ての値について、その部分集合内で状態を維持する実現可能な制御入力が存在するように設計することができる。これによって、MPCによって制御されるシステムが、モデルのパラメーターが不確実であるときであっても制約を満たすことを保証する。
本発明のいくつかの実施の形態は、推定誤差と制御誤差との間の比例関係、および所望の値に対する機械の収束は、MPCの予測モデルにおける機械パラメーターが、それらが推定モジュールから得られた時点に関して、MPC予測ホライズンに等しい遅延を用いて調整される場合に達成されるという認識に基づく。
したがって、本発明の1つの実施の形態は、機械のモデルに従って該機械の動作を制御する方法を開示する。本方法は、制御入力に対する制約を条件とした予測ホライズンに沿ったコスト関数の最適化から決定された前記制御入力を用いて、前記機械の前記動作を反復的に制御することであって、前記最適化は、前記モデルに従い、前記コスト関数は、前記モデルの少なくとも1つのパラメーターを含むことと、前記モデルの前記パラメーターを更新することであって、結果として前記制御の少なくともいくつかの反復について前記コスト関数が更新されることと、を含み、該方法のステップは、プロセッサを用いて実行され、前記制御により前記機械の状態が変化する。
別の実施の形態は、機械のモデルに従って該機械の動作を制御するためのシステムであって、前記機械の状態を決定するセンサーと、前記機械の前記状態を用いて前記モデルの少なくとも1つのパラメーターの値を更新するためのプロセッサであって、前記パラメーターの前記更新値が前記パラメーターの許容可能な値に対する制約を満たすようにする、プロセッサと、前記制御入力に対する制約を条件とした予測ホライズンに沿ったコスト関数の最適化から決定された前記制御入力を用いて、前記予測ホライズンに沿った予測のために前記モデルを使用して前記機械の前記動作を反復的に制御するコントローラーであって、前記コスト関数は、前記モデルの少なくとも1つのパラメーターを含み、前記パラメーターの前記更新された値が前記モデルおよび前記コスト関数を更新するようにする、コントローラーと、を備える、システムを開示する。
本発明の1つの実施の形態による機械の動作を制御するコントローラーのブロック図である。 本発明の1つの実施の形態による図1Aのコントローラーの一般的な構造のブロック図である。 本発明の1つの実施の形態による機械の動作を制御する方法のブロック図である。 本発明の1つの実施の形態によるコントローラーモジュールのブロック図である。 本発明の1つの実施の形態による予測モデルを構築するコントローラーのモジュールのブロック図である。 本発明の1つの実施の形態によるコスト関数を調整するコントローラーのモジュールのブロック図である。 本発明の1つの実施の形態による制約を構築するコントローラーのモジュールのブロック図である。 本発明の1つの実施の形態による制御入力を計算するコントローラーのモジュールのブロック図である。 本発明の1つの実施の形態によるコントローラーのモジュールによって実行される方法のフローチャートである。 本方法の別の実施の形態によるコントローラーのモジュールによって実行される方法のフローチャートである。 本発明のいくつかの実施の形態の原理を視覚化した座標系に配置された一例示のポリトープの概略図である。 機械の状態に対するモデルのパラメーターの不確実性の影響の概略図である。 本発明のいくつかの実施の形態による機械の動作に対する様々な制約によって規定された状態の制御不変部分集合の2次元投影の一例の概略図である。 本発明のいくつかの実施の形態に従って求められた、機械の状態の実現可能領域と制御不変部分集合との間の関係を示す概略図である。 本発明の1つの実施の形態による制御不変部分集合を求める後方可到達領域計算のブロック図である。 本発明の1つの実施の形態による状態の以前の集合を求める一例示の実施態様のブロック図である。 終端制約に関連付けられた領域を画定する方法のブロック図である。
図1Aは、機械102の動作を制御する制御システム101のブロック図を示している。機械102は、その動作が、コマンドに応答して、位置、速度、電流、および温度等の物理量の値を変化させる装置である。機械の動作は、本明細書において用いられるように、そのような量を変化させる機械の運動を決定する。制御システムは、上記量のうちのいくつかの所望の軌道または目標点等の機械の所望の運動103を受け取り、制御入力104を介して機械を制御する。制御入力は、機械の動作のパラメーターを変化させるコマンドを含むこともできるし、機械の運動に影響を与え、結果として、所望の運動103に合致することが望ましい機械の出力量105を生成する電圧、圧力、トルク、力等のパラメーターの実際の値を含むこともできる。本発明のいくつかの実施の形態では、機械は、不確実性の少なくとも1つのパラメーターを含む。例えば、物体を動かすロボットのアームのモデルは、アームによって搬送される物体の質量についての不確実性を含むことがある。列車の移動のモデルは、現在の天候条件における車輪とレールとの摩擦についての不確実性を含むことがある。
制御システム101は、機械に直接またはリモートに接続されたセンサー、ハードウェア、またはソフトウェアから、機械の運動についての情報109を受信する。情報109は、機械の状態を含む。制御システムは、推定モジュール106からの不確実な機械パラメーターの現在の推定値108についての情報も受信する。制御システム101は、状態およびパラメーター推定値を制御入力104の選択のために用い、これらの制御入力によって、機械の運動および機械102の出力が決まる。量105、制御入力104、またはそれらの組み合わせには、機械の動作に対する制約によるいくつかのあらかじめ規定された範囲内に留まるように要求することができる。
図1Bは、本発明の1つの実施の形態による制御システム101の一般的な構造を示している。制御システム101は、コントローラーのモジュールを実行する少なくとも1つのプロセッサ130を備える。プロセッサ130は、機械102のモデル112、コスト関数115および制約114を記憶するメモリ120に作動接続されている。本発明のいくつかの実施の形態の目的は、制約114を条件として、調整可能なコスト関数115、および不確実性を有する機械のモデル112を用いて制御入力104を求めることである。いくつかの実施の形態では、機械の動作中の現在のパラメーター推定値108に基づいて、機械のモデルおよび調整可能なコスト関数が更新される(116)。代替的に、いくつかの実施の形態は、機械が動作していないときにモデルを更新する。
本発明のいくつかの実施の形態は、機械のモデル112が更新されるときに、所望の状態への機械の移動の収束を達成するために、コスト関数115も更新される必要があるという認識に基づいている。一方、そのような更新は、通常、計算コストが高い。例えば、そのような更新は、線形行列不等式またはリカッティ方程式の解を得るために、大量のメモリを有する強力なプロセッサ上で実行される高度な数値法を必要とすることがある。
図1Cは、本発明の1つの実施の形態による、機械の動作を制御するための方法のブロック図を示している。実施の形態は、不確実性を有するモデルのパラメーターを含むようにコスト関数を規定することができるという認識に基づいている。そのような方式では、モデルのパラメーターが更新されるとき、そのような更新の結果として、コスト関数も更新されることになり、これによって、コスト関数を更新するための計算要件が単純になる。方法のステップは、プロセッサ130等のプロセッサによって実行することができる。
本方法は、制御入力に対する制約を条件とする予測ホライズンに沿ったコスト関数115の最適化から求められた制御入力を用いて、機械の動作を反復的に制御する(150)。最適化は、MPCの原理に従ってモデル112を用いて実行される。
この実施の形態では、コスト関数115は、モデル112の少なくとも1つのパラメーター155を含む。実施の形態は、制御の少なくともいくつかの反復について、パラメーター155を更新する(160)。そのような方式で、更新160の結果として、モデル112およびコスト関数115の双方が更新される。
図2Aは、本発明の1つの実施の形態による制御システム101の異なるモジュールのブロック図を示している。モデル調整モジュール201は、現在のパラメーター推定値108に基づいて、不確実性を有するモデル112の少なくとも1つのパラメーターを更新する。同様に、コスト関数調整モジュール202は、コスト関数115を更新して、MPCの安定性および収束を保証する。制約および予測ホライズンモジュール203からの出力は、モジュール201によって出力された更新モデル241、モジュール202によって出力された、更新されたコスト関数242、および機械状態109と共に用いられ、機械に対する制御入力104が決定される(204)。
図2Bは、モデル調整モジュール201のブロック図を示している。パラメーターの現在の推定値108は、MPC予測ホライズンの長さに等しい長さ218を有する遅延バッファー211に入れられ、現在遅延バッファー内にある最も古い値219が除去される。不確実性を有する機械のモデルは、モデルの集合体212として表される。バッファー内に記憶されるモデルのパラメーターの現在および過去の推定値の値は、モデルの集合体と共に用いられ、現在のMPC予測モデル241が構築される(213)。
本発明のいくつかの実施の形態によれば、モデルのパラメーターの不確実性には限界がある。以下で、より詳細に説明されるように、不確実性に対するこれらの限界は、モデルのパラメーターの許容可能な値の範囲を規定する。許容可能な値は、モデルの集合体を形成し、いくつかの実施の形態は、モデルのパラメーターを、モデルの集合体の凸結合として求める(213)。
このため、モデルの集合は、不確実性の全ての可能な値を表すモデルとして得られる。例えば、モデルの集合は、不確実なパラメーターの最小値および最大値を検討し、最小パラメーターおよび最大パラメーターの許容可能な全ての組み合わせに対応するモデルを得ることによって得ることができる。次に、パラメーターが不確実なパラメーターの範囲内にある機械のためのモデルを得ることができる。
例えば、パラメーターの各推定値をモデルの集合体と共に用いて、特定の時点において有効なシステムのためのモデルを得ることができる。このため、遅延バッファー内のパラメーター推定値の各値をモデルの集合体と組み合わせることによって、遅延バッファーと長さが等しい、機械のモデルのシーケンスが得られる。
本発明の1つの実施の形態では、モデルのパラメーターの新たな値が決定され、制御入力の全体集合が、更新されたパラメーターを有するモデルを用いて決定される。この実施の形態は、実施がより単純であり、パラメーターのより正確な値を利用する。一方、代替的な実施の形態は、制御入力のシーケンス全体のそのような更新が、モデルのパラメーターの古い値を用いて以前に決定された制御入力のシーケンスとの不連続性をもたらすという認識に基づく。
そのために、モデルのパラメーターが更新されるとき、バッファー内のパラメーターの全体集合をあらかじめ決定する代わりに、いくつかの実施の形態は、パラメーターのうちの最も古い(219)推定値のみを除去し、パラメーターの新たな(219)推定値を追加する。例えば、連続メモリセルの観点においてバッファー211の抽象表現を検討する場合、新たな推定値が挿入されるとき、現在バッファー内にあるパラメーター推定値は、右のメモリセルが存在する場合、右のメモリセルにコピーされる。このため、最も右側のセル219に配置された最も古い推定値が上書きされ、このため、消失する。新たな推定値が最も左のセル217に配置され、このため、バッファーに入る。
連続メモリセルの観点におけるバッファー211のこの抽象表現は、コントローラー101のメモリ120内のメモリセルの異なる物理的表現に対応することができる。そのような更新は、バッファー211がパラメーターの異なる値を記憶し、このため、不確実性パラメーターが一定の固定値を有する場合であっても、予測のために用いられるモデル112が予測ホライズンのステップに沿って時間変動する状況をもたらす。一方、これによって、単純な計算のみを用いることによってコスト関数の単一の成分のみを更新し、依然として安定性を得ることが可能となる。
例えば、予測ホライズンは、予測時点のシーケンスを含み、最適化によって、予測時点ごとの制御入力が生成され、予測ホライズンのための制御入力のシーケンスが形成されるようになっている。いくつかの実施の形態によれば、制御入力のシーケンスを決定するためのモデルは、少なくともいくつかの予測時点間で変化する。
例えば、1つの実施の形態は、予測時点ごとに、予測時点の前の複数の時点に決定されたパラメーターを用いて予測モデルを決定して、予測ホライズンのための予測モデルのシーケンスを生成し、予測モデルのシーケンスを用いて制御入力のシーケンスを共同で決定する。
さらに、いくつかの実施の形態は、推定誤差と制御誤差との間の比例関係、および所望の値への機械の収束は、MPCの予測モデルにおける機械パラメーターが、それらが推定モジュールから得られる時点に関してMPC予測ホライズンに対し等しい遅延で調整される場合に達成されるという認識に基づく。そのために、1つの実施の形態では、時点の数は、予測ホライズンの長さによって規定される。
図2Cは、1つの実施の形態によるコスト関数調整モジュール202のブロック図を示している。現在のコスト関数は、現在のパラメーター推定値108と、調整可能なコスト関数115を表すコスト関数成分221とから計算される(222)。例えば、この実施の形態のいくつかの実施態様では、コスト関数は、目標状態への機械の移動を方向付けるための安定化成分223と、目標状態まで機械の移動を最適化するための性能成分224とを備える。これらの実施態様では、モデルのパラメーター155は、安定化成分の関数を含む。例えば、安定化成分は、モデルのパラメーターの推定値によって重み付けされた安定化行列の和を含むことができる。例えば、安定化行列を決定することに加えて、1つまたは複数の安定化利得も決定することができる。
図2Dは、MPCの制約および予測ホライズンの計算の詳細を示している。仕様制約231、コスト関数成分のアンサンブル、好ましい予測ホライズン232、およびモデルのアンサンブルから、MPC制約の集合およびMPCモデルのための実際の予測ホライズンが計算される(233)。
図2Eは、制御入力の計算の詳細を示している。調整されたモデル241、調整されたコスト関数242、予測ホライズン243、MPC制約244、および現在の機械状態245から、数値問題が構築され(246)、数値アルゴリズムによって解かれ(247)、その解から、制御入力が選択される(248)。
図2Fは、本発明のいくつかの実施の形態における方法の動作のフローチャートを示している。まず、モデルの集合体212と、コスト関数成分221と、制約および好ましいホライズン232と、計算されたMPC制約および予測ホライズン203を含む、制御システムメモリ120にロードされたパラメーターとを決定することによって、調整可能なコントローラーが設計される(250)。次に、機械の制御が開始する。各反復において、新たなパラメーター推定値が決定され(251)、現在の機械モデルが調整され(252)、コスト関数が調整され(253)、機械状態が決定される(254)。次に、まず、制約を満たし、コスト関数を最適化する予測される入力のシーケンスを決定し(256)、次に、そのようなシーケンスの最初の部分を選択する(257)ことによって、制御入力が計算される(255)。次に、コントローラーは、次の測定を待つ(258)。
図2Gは、本発明の他の実施の形態における方法の動作のフローチャートを説明する。動作は、同じであるが、モデルおよびコスト関数の調整は、第1の入力の選択前に、ただし、コントローラーメモリがプログラムされた後に、1回のみ行われる。
モデルの調整
本発明のいくつかの実施の形態は、モデルのパラメーターの真の値が不確実であっても、モデルのパラメーターの不確実性が既知の範囲内にあるという認識に基づいている。例えば、列車の質量は、空の列車および一杯に荷を積んだ列車の値の範囲内とすることができる。モデル212のアンサンブルは、モデルの不確実なパラメーターの全ての可能な値について得られるモデルを表す。
図3Aは、上記認識の原理を視覚化した座標系320に配置された一例示のポリトープ310を示している。座標系320は、通常、不確実性を有するモデルのパラメーターの低次元系である。例えば、モデルが、不確実性を有する4つのパラメーターを含む場合、座標系320は、4次元であり、パラメーターの組み合わせの新たな値、例えば、値333、335、337がポリトープ310内で選択されるように、パラメーターのそれぞれにつき1つの次元322、324、326、および328を有する。
例えば、所与の機械状態、入力、および不確実性dの連立差分方程式によって等時間間隔のサンプリング時点における機械の運動を記述する関数は、以下の式となる。
Figure 0006359182
ここで、kは、サンプリング時点のインデックスであり、fは、汎用関数であり、Cは、行列であり、xは、機械状態109であり、uは、機械入力104であり、yは、機械出力105である。複数の状況において、不確実性は範囲D内に制限され、状態は、範囲
Figure 0006359182
内に制限され、制御入力は、範囲U内に制限されることが了解されている。
Figure 0006359182
例えば、値の範囲Dは、機械質量の最小値および最大値によって求めることができる。同様に、入力および状態の範囲は、速度、位置、電圧、またはトルクの最小値および最大値によって求めることができる。
いくつかの実施の形態は、fおよびDに基づいて、
Figure 0006359182
である行列の集合、この結果、任意の所与のxおよびuについて、
Figure 0006359182
となるような多元差分包含
Figure 0006359182
を構築する。ここで、「co」は、この集合の凸包を示す。
多元差分包含(4)は、モデルの集合体212によって記述される。
Figure 0006359182
式(4b)における線形モデルは、例えば、Dによって許容されるベクトルdを形成するパラメーターおよび/またはそれらの組み合わせの最大値および最小値を選ぶことによって求めることができる。また、(4)は、機械運動の所望の値がx=0に配置されるように構築することができる。
図3Bは、機械の状態を推定する際の、式(4)によって求められたモデルのパラメーターの不確実性の影響の概略図を示している。機械の現在の状態x301および制御入力が与えられると、機械の次の状態は、機械のモデルのパラメーターのdの種々の可能な値について集合302内で変動する可能性がある。例えば、ベクトルdの特定の値に応じて、状態301は、制御入力の同じ値について集合302内で異なる状態310に遷移する可能性がある。
本発明のいくつかの実施の形態では、モデルの集合体は、それらの範囲内の不確実なパラメーターの全ての値についてのモデルが線形モデルの凸結合303に含まれるように設計される。例えば、W=0のとき、式(4)のモデルは、有界多面体、すなわちポリトープである集合303によって集合302を過剰近似する。ここで、頂点304は、以下の式から求められる。
Figure 0006359182
ここで、l、(A,B),i=1、・・・、lは、それぞれ、式(3)において規定された数および行列である。
式(4)に基づいて、全てが
Figure 0006359182
を満たす範囲
Figure 0006359182
内の入力uによって、集合303は、完全に、許容可能な状態の範囲320内となり、したがって、(1)による機械の可能な次の状態302も、320内になる。このため、式(4)に対して制約を課すことによって、式(1)に対して制約を課すことが保証される。式(4)によって求められたモデルを用いる実施の形態は、計算上有利である。なぜならば、式(4)によって求められたモデルは、式(1)に記述された不確実な非線形モデルではなく、線形モデルの集合を含むからである。
このため、通常、不確実なシステムモデルは以下のように書くことができる。
Figure 0006359182
ここで、ξは、未知であるが以下を満たし、
Figure 0006359182
不確実なシステムモデルがモデル(7)のアンサンブルの凸結合であるようになっており、[a]はベクトルaのi番目の成分を表す。
不確実なパラメーターの特定の実現のためのモデルが以下のように書かれる。
Figure 0006359182
このため、推定モジュール106は、ξ(t)および対応する推定されるモデル(10)を決定することによって、時点tにおけるパラメーターの現在の推定値を提供する。
例えば、モジュール106は、入力および出力または状態データの最近の集合を、場合によっては、何らかの移動低減項と共に検討しながら、最良の適合を与える値として、ξ(t)を得ることができる。
Figure 0006359182
一方、本発明の実施の形態は、(9)を満たす有効な推定値ξ(t)をもたらす限り、任意の推定モジュールについて機能するため、特定の推定モジュールに限定されない。
コスト関数の調整
MPCコントローラーのコスト関数は、エネルギーを節減し、振動を最小限にし、部品の摩耗を低減するために、機械作動システムの使用を制限しながら、機械の状態を調整して所望の機械の挙動を達成することの所望の優先度を符号化する。
このため、コントローラーが設計されるときにξが固定され既知である(10)等のモデルについて、MPCコスト関数を以下のように書くことができる。
Figure 0006359182
ここで、Q、Rは、機械の状態を調整する所望の優先度を符号化する重み行列である。
一方、機械の制御の性能目標を符号化するコスト関数(11)は、機械の動作の所望の状態および安定性に収束する保証を得るように変更される必要がある。例えば、(11)に安定化項を加えることが可能であり、これにより、(8)等のモデルについて、結果として
Figure 0006359182
が得られる。
このため、完全なコスト関数は、性能項(11)および安定性項(12)の組み合わせであり、下式となる。
Figure 0006359182
ここで、Pは、MPC予測ホライズンの端部における終端状態のための適切に設計された重み行列である。
本発明のいくつかの実施の形態は、システムパラメーターの推定値を変更することに起因したモデル変更の間に、性能項(11)を変更しないままに留めることができるが、安定化成分(13)は、更新されたモデルの安定性を達成するように調整される必要があるという認識に基づく。したがって、いくつかの実施の形態は、
Figure 0006359182
であるパラメーター推定値に依拠する安定化項を含めるように安定化成分を変更する。ここで、P(ξ)はパラメーターに依拠する重み行列である。
いくつかの実施の形態によれば、モデル(7)および不確実なモデル(8)、(9)の集合体のための項P(ξ)は、パラメーターξの現在の推定値から得られる行列重みの凸結合を含む。
Figure 0006359182
Figure 0006359182
である場合、(15)における行列重みが、変数
Figure 0006359182
について線形行列不等式
Figure 0006359182
を解き、次に
Figure 0006359182
を計算して(15)における行列を構築することによって設計され得ることがさらに理解される。
代わりに、線形行列不等式を以下のように表すことができる。
Figure 0006359182
Figure 0006359182
が解かれ、
Figure 0006359182
である。
線形行列不等式の複雑度は、大規模システムの場合、大きくなることがある。一方、いくつかの実施の形態は、機械のモデルの対称性を利用して、計算コストを低減する。対称性は、全ての
Figure 0006359182
について、
Figure 0006359182
を満たす
Figure 0006359182
が存在するような可逆行列ΘおよびΩのペアである。
本発明のいくつかの実施の形態は、対称性が極限のシステムモデルAに関係することに起因して、極限のコスト関数およびコントローラーを関係付けることができるという認識に基づいている。したがって、1つの実施の形態は、(16)、(17)を解く際の計算を低減するためにモデルのパラメーターの値間の対称性を用いて、コスト関数(13)の安定化項(14)の少なくとも一部を決定する。
例えば、いくつかの実施の形態は、対称性によって関係付けられない集合体内のモデルのみについて式(16)、(17)を解き、これによって、(16)、(17)における変数の数を低減し、これによって、これらを解くのを容易にする。例えば、
Figure 0006359182
によって、対称性によって関係付けられていないモデルの集合体内のモデルAの部分集合を表す。また、
Figure 0006359182
によって、対称性によって関係付けられていない集合体内のモデルのペア(i,j)の部分集合を表す。いくつかの実施の形態は、集合体における対称的に関係付けられていないモデルi∈Iごとに、1回のみ変数S、GおよびEを求める。また、いくつかの実施の形態は、対称的に関係付けられていないペア(i,j)∈Iごとに、1回のみ(15)を解く。
例えば、1つの実施の形態は、各(i,j)∈Iについて、
Figure 0006359182
を解き、ここで、i∈IおよびΘSΘ−1=Sである。次に、実施の形態は、各
Figure 0006359182
について、
Figure 0006359182
を求める。ここで、i∈Iについて、A=ΘAΘ−1である。
制約計算
本発明のいくつかの実施の形態は、機械の運動に対する制約が、所定の範囲内のモデルのパラメーターの値の全ての変動について、機械の動作中満たされることを保証するために、状態の実現可能領域
Figure 0006359182
の部分集合を、機械の状態がそのような部分集合内にあるときは、常に、その状態がパラメーターの全ての可能な値および擾乱についてその部分集合内に留まるような少なくとも1つの許容可能な制御入力が存在するように求めることができるという認識に基づいている。部分集合内に留まることによって、その部分集合は実現可能領域
Figure 0006359182
に含まれるので、全ての機械の運動制約が満たされる。
本発明のいくつかの実施の形態は、本明細書において制御入力に対する制御不変制約と呼ばれる制御入力に対するそのような制約を求めて用い、本明細書において状態の制御不変部分集合と呼ばれる状態の実現可能領域
Figure 0006359182
のそのような部分集合内に機械の状態を維持する制御入力を求める。この構成によって、制御不変制約を満たす制御入力は、不確実性モデルによって規定された範囲内のモデルのパラメーターの全ての値について、機械の状態を、機械の動作に対する制約を満たす状態の制御不変部分集合内に維持する。
図4Aは、本発明の実施の形態による、機械の動作に対する様々な制約によって規定された状態の制御不変部分集合の2次元投影410の一例を示している。通常、この実現可能領域は、動作に対する制約に対応する複数の次元に沿って、1次不等式によって表される超平面によって決定された多次元ポリトープである。
後退ホライズン制御の性質に起因して、ある特定のホライズンの解が存在することは、それだけで、後続のホライズンの解が存在することを保証するものではない。例えば、機械の状態および基準軌道の状態420は、1つの反復にとって最適かつ実現可能である可能性があるが、コントローラーが次の反復中に取ることが可能な全ての制御動作421〜424は、機械の状態を実現可能領域410の外部に持って行く可能性がある。
本発明のいくつかの実施の形態は、実現可能領域の制御不変部分集合415を、その制御不変部分集合内の機械の任意の状態から、基準軌道の既知の将来の状態または基準軌道の全ての許容可能な将来の状態についてその部分集合内に機械の状態を維持する制御入力が存在するように選択することが可能であるというさらに別の認識に基づいている。例えば、部分集合415内およびコントローラーが実行することができる全ての可能な制御入力431〜434内の状態430等の任意の状態について、機械および基準の状態を部分集合415内に維持する少なくとも1つの制御入力434が存在する。この場合、部分集合415は制御不変部分集合である。
いくつかの実施の形態は、制御不変部分集合内の状態ごとに、式(5)による全ての可能な状態値について、機械の状態を制御不変部分集合内に維持する少なくとも1つの制御動作が存在するように、式(4)のモデルの状態の制御不変部分集合を求める。
図4Bは、機械の状態の実現可能領域401と、
Figure 0006359182
内における式(1)による不確実性を有するモデルの状態の最も大きい制御不変部分集合402との間の関係を示している。いくつかの実施の形態では、制御不変部分集合402は、この部分集合402よりも小さいが線形方程式によって形成されるより単純な形状を有する制御不変部分集合403を形成するように縮小される。部分集合402は、非線形方程式によって求められるので、部分集合402の形状は非凸である可能性がある。このように、403の計算は、より単純で、より効率的であり、制御目的に有利である。
図5は、本発明の1つの実施の形態による実現可能領域
Figure 0006359182
401から開始して制御不変部分集合403を求める後方可到達領域計算のブロック図を示している。後方可到達領域計算は、ロバスト制御不変部分集合Cを求めるとともに、制御不変集合C(x)も求める。この計算は、C内の任意のxについて、印加することができる
Figure 0006359182
内の入力uの集合を、(4)による全ての可能な次の状態がCの内部となるように求める。
後方可到達領域計算は、現在の集合
Figure 0006359182
を実現可能集合
Figure 0006359182
に初期化し(501)、P内のパラメーターpの全ての可能な値について、更新された状態が現在の集合
Figure 0006359182
内となるような
Figure 0006359182
内の入力uが、
Figure 0006359182
内の全ての状態xについて存在するように、状態の以前の集合
Figure 0006359182
を、現在の集合
Figure 0006359182
の部分集合として求める(502)。
503において、以前の集合
Figure 0006359182
が空である場合(504)、コントローラーの正しい動作を保証することができない。これは、パラメーターの可能な値の集合Pのサイズが、場合によっては機械の動作の設計または目的を変更することによって、縮小されるべきであることを意味する。505において、現在の集合と以前の集合とが等しい場合には、506において、集合Cが計算され、等しくない場合には、以前の集合が現在の集合となるように割り当てられ(507)、計算が再び反復される(508)。集合Cが見つかった場合、状態−入力対の最後に計算された集合が、C内の全てのxについてのロバスト許容可能入力集合C(x)である。
図6は、1つの実施の形態による状態の以前の集合を求める(502)一例示の実施態様のブロック図を示している。この実施の形態は、パラメーターの全ての値について現在の集合内にある更新された状態を生成する状態−入力対を特定し(601)、これらの状態入力対を状態値に投影する(602)。すなわち、この実施の形態は、そのような状態−入力対のうちの少なくとも1つに属する状態を特定する。
状態−入力対の計算方法601は、更新された状態が、アンサンブル内の全てのモデルについて現在の集合内にあるように、すなわち、
Figure 0006359182
となるように対(x,u)を求めることに基づく。
機械の動作に対する仕様制約に加えて、いくつかの実施の形態は、機械状態が所望の値に収束するように、MPCにさらなる制約を追加する。例えば、そのような追加の制約は、
Figure 0006359182
等の終端制約であり、MPC予測ホライズンの端部における終端状態のための領域を画定する。
いくつかの実施の形態では、そのような終端制約は、機械の仕様制約およびモデルに従って決定される。一方、そのような決定は、機械のモデルが不確実であるときに困難である。このため、本発明の代替的な実施の形態は、仕様制約231、モデルの集合体211およびコスト関数成分221を用いて終端制約を決定する。
例えば、1つの実施の形態は、終端制約を、集合
Figure 0006359182
として決定する。これは、それぞれ(16)または(17)を解くことによって得られる(16b)または(17b)における制御利得K、i=1、・・・、lまたはKから制御される機械が制約を満たす初期状態の集合である。
いくつかの実施の形態は、終端制約の集合を、
Figure 0006359182
によって、後方可到達集合のシーケンスの固定点として求める。ここで、
Figure 0006359182
は、実現可能な状態および入力の任意の部分集合である。
図7は、本発明の1つの実施の形態による終端制約に対応する領域を決定するための後方到達可能方法のブロック図を示す。後方到達可能方法は、機械の実現可能な状態の現在の集合から開始し、機械の状態の後方到達可能集合が現在の集合によって囲まれるまで、機械の動力学の1ステップの展開後に現在の集合内にある、現在の集合内の状態の後方到達可能集合を反復して求める。
例えば、現在の集合は、実現可能な状態の集合として初期化され(701)、ここで、それぞれ(16)または(17)を解くことによって得られる(16b)または(17b)における制御利得K、i=1、・・・、lまたはKによって生成される入力は、入力制約を満たす。現在の集合から、後方到達可能集合が計算され(702)、システムの動力学の1ステップの展開後に現在の集合内にある、現在の集合内の状態が求められる。703において、後方到達可能集合が現在の集合を含むかまたは現在の集合に等しい場合、現在の集合は、最大制御不変集合である(704)。そうでない場合(705)、後方到達可能集合は現在の集合と交差し、方法の反復706において新たな現在の集合として用いられる。
いくつかの実施の形態では、不変制約の存在に起因して、図7における後方到達可能方法は、
Figure 0006359182
に従って初期化される。
一方、終端制約(18)を常に満たすことができることを保証するために、いくつかの実施の形態は、予測ホライズンを変更することができる。そのような調整は、終端制約を満たすことができることを確実にするのに役立ち、すなわち、終端集合に対応する領域には、予測ホライズンの長さにおける任意の到達可能な初期状態によって到達することができる。
そのために、いくつかの実施の形態は、制御不変制約を満たす全ての状態についてコスト関数の最適化に対する解が存在する予測ホライズンの最小の長さを決定する。次に、実施の形態は、予測ホライズンの長さを、好ましい長さと最小の長さとの間で最大の長さとして決定する。
例えば、いくつかの実施の形態は、x(0)∈Cについて式(3)を常に満たすことができるように最小予測ホライズンNを決定し、好ましいホライズンN232がN未満である場合、実施の形態はN=Nを設定し、そうでない場合、実施の形態はN=Nを設定する。最小のホライズンの計算は、
Figure 0006359182
に従って交差する後方到達可能集合のシーケンスから決定された集合S(N)が
Figure 0006359182
となるような最小指数Nを求めることによって得ることができる。
いくつかの実施の形態は、終端集合
Figure 0006359182
が制御不変である場合、すなわち、集合体内のモデルおよび式(16)、(17)から得られる利得Kの任意の組み合わせについて不変である場合、制約(18)が常に満たされることも保証する制御不変量Cを好ましい予測ホライズンについて計算することができるという認識を利用する。
1つの実施の形態では、この計算は、式
Figure 0006359182
の厳密にN回の反復を行うことによって、Nステップ後方到達可能集合を構築することによって得られる。この場合、MPCホライズンは、好ましいホライズン集合N=NおよびC=R(N)に等しくなるように設定することができる。
例えば、B=B、i∈i=1、・・・、lであり、(17)が解かれた場合、(20)から計算される
Figure 0006359182
は、ロバスト不変であり、(21b)における方法を用いることができる。
予測モデル
本発明のいくつかの実施の形態は、MPCコントローラーがその予測ホライズンNに沿ってモデルの展開を予測する必要があるため、時点tにおけるモデルの推定値を全ての予測ステップについて用いることができないという認識に基づいている。代わりに、MPC予測ホライズンNの長さを有し、推定値ξの最も近似のN個の値を含む、時点tにおける現在の推定値ξ(t)が、遅延バッファー211内に配置される。次に、数値問題の構築(246)により、遅延バッファー上に配置された過去の全ての推定値からMPC予測モデルが組み立てられる。
このため、制御時点tに対するkステップ未来の予測モデルは、全てのk∈[0,N]
について、
Figure 0006359182
として得られる。
このため、いくつかの実施の形態では、予測ホライズンのための制御入力を決定するために用いられるモデルは、予測ホライズンに沿って異なるステップについて変化する。例えば、式(22)のモデルは、モデルおよびパラメーターのN個の最も近似の推定値の集合体から構築された線形時変系であり、ここで、予測ホライズンに沿った各ステップにおいて、Nステップ前に得られたパラメーター推定値が用いられる。
したがって、コスト関数の安定化項(14)は、(14)においてξ(N)=ξ(t)を設定し、(15)によって(14)を評価することによって、ξ(t)から調整される。
パラメーターの調整が機械の動作の前にのみ生じる場合、本発明において、
Figure 0006359182
を設定し、そのような値をモデル調整(22)およびコスト関数調整(14)の双方に用いれば十分であると認識される。ここで、
Figure 0006359182
は、推定が終了する時点において得られる推定値である。
制御入力の決定
いくつかの実施の形態では、予測モデル、コスト関数、MPC制約および現在の状態x(t)から、MPCコントローラーが有限ホライズン最適制御問題
Figure 0006359182
を構築する。ここで、
Figure 0006359182
は、予測される入力のシーケンスであり、
Figure 0006359182
は、システムパラメーターにおけるN個の最も近似の予測のシーケンスであり、
Figure 0006359182
は、機械の状態が所望の値にあるときにのみ0値を保つ非負値関数である。
問題は、数値問題にさらに変換される。これは、以下のような二次計画である。
Figure 0006359182
二次計画(25)の解は、現在の状態およびパラメーター推定値
Figure 0006359182
のための最適入力シーケンスを与える。次に、現時点tにおける機械のための制御入力が、最適制御シーケンス、例えば、
Figure 0006359182
の第1の要素として選択される。
(24)に対する解の計算能力は、機械状態の全ての値および機械パラメーターの全ての許容可能な推定値について、コスト関数行列Q、Rが正定値であるときはいつでも、得られる数値問題(26)が凸であることに基づく。また、パラメーター推定誤差の存在下の制約を満たすことは、Cおよび
Figure 0006359182
の構築に起因する。所望の状態への機械の収束は、
Figure 0006359182
を保証する、実施の形態による調整されたコスト関数(13)および終端制約(18)の構築に起因する。ここで、λmin(Q)は、Qの最小固有値であり、Qが正定値であるため、0よりも大きく、γISSは、推定誤差からの感度利得である。
本発明の上記で説明した実施の形態は、数多くの方法のうちの任意のもので実施することができる。例えば、これらの実施の形態は、ハードウェア、ソフトウェア、またはそれらの組み合わせを用いて実施することができる。ソフトウェアで実施されるとき、ソフトウェアコードは、単一のコンピューターに設けられるかまたは複数のコンピューター間に分散されるかを問わず、任意の適したプロセッサまたはプロセッサの集合体上で実行することができる。そのようなプロセッサは、集積回路コンポーネントに1つまたは複数のプロセッサを有する集積回路として実施することができる。ただし、プロセッサは、任意の適した形式の回路部を用いて実施することができる。
さらに、コンピューターは、ラックマウントコンピューター、デスクトップコンピューター、ラップトップコンピューター、ミニコンピューター、またはタブレットコンピューター等の複数の形態のうちの任意のもので具現化することができることが理解されるべきである。そのようなコンピューターは、エンタープライズネットワークまたはインターネット等のローカルエリアネットワークまたはワイドエリアネットワークを含む1つまたは複数のネットワークによって任意の適した形態に相互接続することができる。そのようなネットワークは、任意の適した技術に基づくことができ、任意の適したプロトコルに従って動作することができ、無線ネットワーク、有線ネットワーク、または光ファイバーネットワークを含むことができる。
また、本明細書において略述した様々な方法またはプロセスは、様々なオペレーティングシステムまたはプラットフォームのうちの任意の1つを用いる1つまたは複数のプロセッサ上で実行可能なソフトウェアとしてコード化することもできる。加えて、そのようなソフトウェアは、複数の適したプログラミング言語および/またはプログラミングツールもしくはスクリプティングツールのうちの任意のものを用いて記述することができる。
また、本発明の実施の形態は、方法として具現化することもできる。この方法の一例が提供されている。この方法の一部として実行されるステップは、任意の適した方法で順序付けることができる。したがって、例示されたものと異なる順序で動作が実行される実施の形態を構築することができ、これらの実施の形態は、いくつかの動作を、例示の実施の形態では順次的な作用として示されていても同時に実行することを含むことができる。

Claims (18)

  1. 機械のモデルに従って該機械の動作を制御する方法であって、
    制御入力に対する制約を条件とした予測ホライズンに沿ったコスト関数の最適化から決定された前記制御入力を用いて、前記機械の前記動作を反復的に制御することであって、前記最適化は、前記モデルに従い、前記コスト関数は、前記モデルの少なくとも1つのパラメーターを含むことと、
    前記モデルの前記パラメーターを更新することであって、結果として前記制御の少なくともいくつかの反復について前記コスト関数が更新されることと
    を含み、該方法は、プロセッサを用いて実行され、前記制御により前記機械の状態が変化し、
    前記コスト関数は、目標状態への前記機械の移動を方向付けるための安定化成分と、前記目標状態までの前記機械の前記移動を最適化するための性能成分とを含み、前記モデルの前記パラメーターは、前記安定化成分の関数に含まれ、前記パラメーターを変更することにより前記安定化成分が変更される、方法。
  2. 前記安定化成分は、前記モデルのパラメーターの推定値によって重み付けされた安定化行列の和を含む、請求項に記載の方法。
  3. 不確実なモデルのパラメーターの値間の対称性を利用して前記安定化行列の少なくとも一部分を求め、数値問題の複雑度を低減することをさらに含む、請求項に記載の方法。
  4. 前記機械の前記モデルは、
    Figure 0006359182
    を含み、前記コスト関数は、
    Figure 0006359182
    を含み、xは、前記機械の前記状態であり、uは、前記制御入力であり、ξは、長さlの不確実な凸結合ベクトルであり、[ξ]は、該凸結合ベクトルのi番目の成分を表し、A、B、i=1、・・・、lは、モデルの集合体のための状態および入力行列であり、
    Figure 0006359182
    は、前記モデルの前記状態および入力行列の推定値であり、Nは、前記予測ホライズンの長さであり、Q、Rは、状態および入力重み行列であり、P(ξ)は、ξに依拠した安定化行列の和である、請求項1に記載の方法。
  5. 前記モデルのパラメーターの許容可能な値の範囲を規定することで前記モデルの集合体が形成され、前記方法は、
    前記モデルの集合体の中で、線型モデルの凸結合に含まれるパラメーターを求めることをさらに含む、請求項1に記載の方法。
  6. 前記制約は、前記モデルの前記パラメーターの前記許容可能な値および前記機械への許容可能な制御入力について、仕様制約を満たすことを確実にする制御不変制約を含む、請求項に記載の方法。
  7. 前記制約は、前記予測ホライズンの端部における終端状態のための領域を指定する終端制約を含み、前記方法は、
    仕様制約、前記モデルの集合体および前記コスト関数を用いて前記終端制約を決定することをさらに含む、請求項に記載の方法。
  8. 前記機械の実現可能な状態の現在の集合から開始し、前記機械の状態の後方到達可能集合が前記現在の集合によって囲まれるまで、前記機械の動力学の1ステップの展開後に前記現在の集合内にある、前記現在の集合内の前記状態の前記後方到達可能集合を反復して求める後方到達可能方法を用いて、前記終端制約の前記領域を画定することをさらに含む、請求項に記載の方法。
  9. 前記制御不変制約を満たす全ての状態について前記コスト関数の前記最適化に対する解が存在する前記予測ホライズンの最小長さを決定することと、
    前記予測ホライズンの長さを、好ましい長さと前記最小長さとの間で最大の長さとして決定することと
    をさらに含む、請求項に記載の方法。
  10. 前記予測ホライズンは、好ましい予測ホライズンに等しく、終端集合は、安定化利得および仕様制約から計算され、制御不変集合は、前記終端集合および前記好ましい予測ホライズンから計算される、請求項に記載の方法。
  11. 前記予測ホライズンは、予測時点の予測モデルのシーケンスを含み、前記最適化が、予測時点ごとに、前記予測ホライズンについて制御入力のシーケンスを形成する制御入力を生成するようにし、前記制御入力の前記シーケンスを決定するための前記モデルは、少なくともいくつかの予測時点間で変化する、請求項1に記載の方法。
  12. 予測時点ごとに、該予測時点の前の複数の時点に決定された前記パラメーターを用いて予測モデルを決定して、前記予測ホライズンのための予測モデルのシーケンスを生成することと、
    前記予測モデルのシーケンスを用いて前記制御入力のシーケンスを共同で決定することと
    をさらに含む、請求項11に記載の方法。
  13. 前記複数の時点の数は、前記予測ホライズンの長さによって規定される、請求項12に記載の方法。
  14. 前記コスト関数の前記最適化を二次計画に変換することと、
    前記二次計画を解いて前記制御入力を決定することと
    をさらに含む、請求項1に記載の方法。
  15. 機械のモデルに従って該機械の動作を制御するためのシステムであって、
    前記機械の状態を決定するセンサーと、
    前記機械の前記状態を用いて前記モデルの少なくとも1つのパラメーターの値を更新するためのプロセッサであって、前記パラメーターの更新値が前記パラメーターの許容可能な値に対する制約を満たすようにする、プロセッサと、
    制御入力に対する制約を条件とした予測ホライズンに沿ったコスト関数の最適化から決定された前記制御入力を用いて、前記予測ホライズンに沿った予測のために前記モデルを使用して前記機械の前記動作を反復的に制御するコントローラーであって、前記コスト関数は前記モデルの少なくとも1つのパラメーターを含み、前記パラメーターの前記更新された値が前記モデルおよび前記コスト関数を更新するようにする、コントローラーと
    を備え
    前記コスト関数は、目標状態への前記機械の移動を方向付けるための安定化成分と、前記目標状態までの前記機械の前記移動を最適化するための性能成分とを含み、前記モデルの前記パラメーターは、前記安定化成分の関数に含まれ、前記パラメーターを変更することにより前記安定化成分が変更される
    システム。
  16. 前記モデルのパラメーターの許容可能な値の範囲を規定することで前記モデルの集合体が形成され、前記制約は、前記モデルの前記パラメーターの前記許容可能な値および前記機械への許容可能な制御入力について、仕様制約を満たすことを確実にする制御不変制約を含み、該制約は、前記予測ホライズンの端部における終端状態のための領域を指定する終端制約を含み、前記プロセッサは、前記機械の実現可能な状態の現在の集合から開始し、前記機械の状態の後方到達可能集合が前記現在の集合によって囲まれるまで、前記機械の動力学の1ステップの展開後に前記現在の集合内にある、前記現在の集合内の前記状態の前記後方到達可能集合を反復して求める後方到達可能方法を用いて、前記終端制約の前記領域を画定する、請求項15に記載のシステム。
  17. 前記予測ホライズンは、予測時点の予測モデルのシーケンスを含み、前記最適化が、予測時点ごとに、前記予測ホライズンについて制御入力のシーケンスを形成する制御入力を生成するようにし、前記制御入力の前記シーケンスを決定するための前記モデルは、少なくともいくつかの予測時点間で変化する、請求項15に記載のシステム。
  18. 前記予測時点の数は、前記予測ホライズンの長さによって規定される、請求項17に記載のシステム。
JP2017516816A 2015-06-02 2016-06-02 機械の動作を制御するための方法およびシステム Active JP6359182B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/727,970 US10281897B2 (en) 2015-06-02 2015-06-02 Model predictive control with uncertainties
US14/727,970 2015-06-02
PCT/JP2016/067153 WO2016195117A1 (en) 2015-06-02 2016-06-02 Method and system for controlling operation of machine

Publications (2)

Publication Number Publication Date
JP2017528848A JP2017528848A (ja) 2017-09-28
JP6359182B2 true JP6359182B2 (ja) 2018-07-18

Family

ID=56236007

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017516816A Active JP6359182B2 (ja) 2015-06-02 2016-06-02 機械の動作を制御するための方法およびシステム

Country Status (3)

Country Link
US (1) US10281897B2 (ja)
JP (1) JP6359182B2 (ja)
WO (1) WO2016195117A1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3304218B1 (en) * 2015-06-05 2022-09-07 Shell Internationale Research Maatschappij B.V. System and method for background element switching for models in model predictive estimation and control applications
JP6859633B2 (ja) * 2016-09-05 2021-04-14 オムロン株式会社 モデル予測制御装置、モデル予測制御装置の制御方法、情報処理プログラム、および記録媒体
JP2018041150A (ja) * 2016-09-05 2018-03-15 オムロン株式会社 モデル予測制御装置、モデル予測制御装置の制御方法、情報処理プログラム、および記録媒体
US11307538B2 (en) * 2017-02-10 2022-04-19 Johnson Controls Technology Company Web services platform with cloud-eased feedback control
FR3063265B1 (fr) * 2017-02-28 2019-04-05 Renault S.A.S Dispositif de controle de trajectoire d un vehicule
US20180275621A1 (en) * 2017-03-24 2018-09-27 Mitsubishi Electric Research Laboratories, Inc. Model Predictive Control with Uncertainties
FR3066660B1 (fr) * 2017-05-22 2020-04-03 Safran Electronics & Defense Procede de commande d'un circuit electronique commute
US11501193B2 (en) * 2017-12-18 2022-11-15 Mitsubishi Electric Research Laboratories, Inc. Model-based control under uncertainty
JP6939513B2 (ja) * 2017-12-21 2021-09-22 株式会社Ihi モデル予測制御装置
US10860002B2 (en) * 2018-03-19 2020-12-08 Mitsubishi Electric Research Laboratories, Inc. Receding horizon reference governor
US10795330B2 (en) * 2018-07-30 2020-10-06 Mitsubishi Electric Research Laboratories, Inc. Symmetry alternating direction method of multipliers
US11106189B2 (en) * 2019-03-06 2021-08-31 Mitsubishi Electric Research Laboratories, Inc. System and method for data-driven control of constrained system
US10996639B2 (en) * 2019-03-11 2021-05-04 Mitsubishi Electric Research Laboratories, Inc. Model predictive control of systems with continuous and discrete elements of operations
US11124196B2 (en) * 2019-07-02 2021-09-21 Mitsubishi Electric Research Laboratories, Inc. Receding horizon state estimator
CN111025898B (zh) * 2019-11-07 2021-08-24 江南大学 一种用于流程工业大规模过程控制的降维辨识方法
US11579575B2 (en) * 2019-12-03 2023-02-14 Baidu Usa Llc Inverse reinforcement learning with model predictive control
US11334085B2 (en) * 2020-05-22 2022-05-17 The Regents Of The University Of California Method to optimize robot motion planning using deep learning
US20210402980A1 (en) * 2020-06-26 2021-12-30 Mitsubishi Electric Research Laboratories, Inc. System and Method for Data-Driven Reference Generation
US11975725B2 (en) 2021-02-02 2024-05-07 Toyota Research Institute, Inc. Systems and methods for updating the parameters of a model predictive controller with learned external parameters generated using simulations and machine learning
US11977374B2 (en) * 2021-08-02 2024-05-07 Mitsubishi Electric Research Laboratories, Inc. System and method for calibrating feedback controllers
CN114326398B (zh) * 2021-12-27 2024-04-05 华中科技大学 带有不可稳模态的线性切换系统的控制方法及控制体系

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07191709A (ja) 1993-12-27 1995-07-28 Toshiba Corp モデル予測制御のパラメータ設定方法
US5659667A (en) 1995-01-17 1997-08-19 The Regents Of The University Of California Office Of Technology Transfer Adaptive model predictive process control using neural networks
US6826521B1 (en) 2000-04-06 2004-11-30 Abb Automation Inc. System and methodology and adaptive, linear model predictive control based on rigorous, nonlinear process model
US7376472B2 (en) * 2002-09-11 2008-05-20 Fisher-Rosemount Systems, Inc. Integrated model predictive control and optimization within a process control system
DE102004058238B4 (de) 2003-12-03 2016-02-04 Fisher-Rosemount Systems, Inc. Adaptive, multivariable Prozesssteuerung, die Modellschaltung und Attribut-Interpolation nutzt
EP1787172A1 (en) 2004-08-27 2007-05-23 Eidgenössische Technische Hochschule Zürich System for controlling hydroelectric power plants
EP1881786B1 (en) 2005-05-13 2017-11-15 Trustees of Boston University Fully automated control system for type 1 diabetes
US7447554B2 (en) 2005-08-26 2008-11-04 Cutler Technology Corporation Adaptive multivariable MPC controller
US20070055392A1 (en) 2005-09-06 2007-03-08 D Amato Fernando J Method and system for model predictive control of a power plant
US7599751B2 (en) 2006-10-13 2009-10-06 Cutler Technology Corporation Adaptive multivariable MPC controller with LP constraints
US8126575B2 (en) 2008-03-26 2012-02-28 Fakhruddin T Attarwala Universal model predictive controller
US8032236B2 (en) 2008-09-30 2011-10-04 Rockwell Automation Technologies, Inc. Asymetrical process parameter control system and method
US20110016610A1 (en) 2009-07-27 2011-01-27 Steven Wieder Sweatband with absorbent bamboo inner layer and related method of use
JP5569079B2 (ja) 2010-03-24 2014-08-13 Jfeスチール株式会社 オンラインモデル同定を用いたモデル予測制御方法および装置
US9400491B2 (en) * 2013-03-15 2016-07-26 Rockwell Automation Technologies, Inc. Stabilized deteministic optimization based control system and method
US9618912B2 (en) 2013-05-17 2017-04-11 Mitsubishi Electric Research Laboratories, Inc. MPC controller using parallel quadratic programming

Also Published As

Publication number Publication date
WO2016195117A1 (en) 2016-12-08
US10281897B2 (en) 2019-05-07
JP2017528848A (ja) 2017-09-28
US20160357169A1 (en) 2016-12-08

Similar Documents

Publication Publication Date Title
JP6359182B2 (ja) 機械の動作を制御するための方法およびシステム
JP6513015B2 (ja) 機械の動作を制御する方法、および機械の動作を反復的に制御する制御システム
EP3175306B1 (en) Optimized parameterization of active disturbance rejection control
EP3924884B1 (en) System and method for robust optimization for trajectory-centric model-based reinforcement learning
US10620604B2 (en) Online integration of model-based optimization and model-less control
JP7090734B2 (ja) 制御システム、制御方法及び記憶媒体
JP2016100009A5 (ja)
EP2818947A1 (en) Method for automatically setting controller bandwidth
JP6927446B1 (ja) 制御装置、制御方法及びプログラム
KR101234797B1 (ko) 로봇 및 산출된 공분산을 이용한 로봇의 위치 추정 방법
US11619929B2 (en) Automatic operation control method and system
Caarls et al. Parallel online temporal difference learning for motor control
JP6867307B2 (ja) ステージ済アプリケーションによりライブ状態の制御/推定アプリケーションを置換するシステムと方法
US9946241B2 (en) Model predictive control with uncertainties
JP2021051462A (ja) 情報処理装置及びプログラム
JP7357813B2 (ja) データ駆動型モデル適応を用いる制御のための装置および方法
CN117319169B (zh) 多智能体系统分布式优化方法、装置、终端及存储介质
JP2021015394A (ja) 情報処理装置及びプログラム
Sokolov Problems of adaptive optimal control of discrete-time systems under bounded disturbance and linear performance indexes
JP2023160722A (ja) Hvacフロー制御への適用を伴うロバストな適応型推定器設計のための時変強化学習
JP2024520177A (ja) 高次元物理システムのモデリング、予測、および制御を行うためのロバスト適応動的モード分解
Garcia et al. Adaptive Stabilization of Networked Control Systems
Vlachos et al. Neural Network Iterative Learning for SISO Non-Affine Control Systems
JP2022539441A (ja) 定義済みの有限時間収束を用いる連続時間最適化のためのシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170327

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20170327

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20170925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171017

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20171212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180522

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180619

R150 Certificate of patent or registration of utility model

Ref document number: 6359182

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250