JP2020503614A - 機械の動作を制御するモデル予測制御システム及び方法 - Google Patents

機械の動作を制御するモデル予測制御システム及び方法 Download PDF

Info

Publication number
JP2020503614A
JP2020503614A JP2019534779A JP2019534779A JP2020503614A JP 2020503614 A JP2020503614 A JP 2020503614A JP 2019534779 A JP2019534779 A JP 2019534779A JP 2019534779 A JP2019534779 A JP 2019534779A JP 2020503614 A JP2020503614 A JP 2020503614A
Authority
JP
Japan
Prior art keywords
machine
state
cost function
control
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019534779A
Other languages
English (en)
Other versions
JP6727744B2 (ja
Inventor
ニアゼフ、アンドレイ
マリシェフ、アレクサンドル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JP2020503614A publication Critical patent/JP2020503614A/ja
Application granted granted Critical
Publication of JP6727744B2 publication Critical patent/JP6727744B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/048Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

機械動特性のモデルに従って機械の動作を制御するモデル予測制御(MPC)システムは、制約を条件として時間ホライズンにわたってコスト関数を最適化して、時間ホライズンにわたる機械の状態を制御する制御入力のシーケンスを生成する。機械は、シーケンスにおける最初の制御入力を用いる制御である。コスト関数はMPCの目的によって規定される第1の項と、機械の状態の、機械の動特性の方程式を満たす値からの逸脱にペナルティを課す第2の項とを含む。

Description

本発明は、包括的には、機械の動作を制御することに関し、より詳細には、後退ホライズンにわたってモデル予測制御(MPC)を用いて動作を制御することに関する。
機械制御では、ソフトウェア又はハードウェアの一方又は組み合わせを用いて実施することができるコントローラーが、例えば、センサー及び/又は推定器、機械の出力から取得された測定値に基づいて、この機械への入力のコマンド値を生成する。コントローラーは、機械が所望のとおり動作するように、例えば、動作が所望の基準プロファイルに従うか又は出力を或る特定の値に調整するように入力を選択する。いくつかの場合には、コントローラーは、例えば、対応する変数がいくつかの所定の範囲内にあることを確保して物理的仕様から安全な機械動作を確保する制約を機械の入力及び出力に対して課す。そのような制約を課すために、コントローラーは、多くの場合、機械のモデルを用いて、コマンド、すなわち制御入力が印加されたときに機械がどのような挙動を引き起こすのかを予測する。制約を機械の入力及び出力に対して課している間に機械の制御を達成することが可能なコントローラーにおけるプロセスの1つの例は、モデル予測制御(MPC)である。
MPCは、機械動特性のモデルのホライズン最適化に基づいており、適切な制御動作を取るために将来のイベントを予想する能力を有する。これは、制約を条件として、将来の時間ホライズンにわたって機械の動作を最適化し、あとは、現在のタイムスロットにわたって制御を実施するだけで達成される。例えば、制約は、機械の物理的限界、機械の動作に対する安全性限界、及び軌道上の性能限界を表すことができる。機械の制御ストラテジーは、そのような制御ストラテジーについて機械によって引き起こされた運動が全ての制約を満たすときに許容することができる。例えば、時間tにおいて、機械の現在の状態がサンプリングされ、許容可能なコスト最小化制御ストラテジーが、将来における比較的短い時間ホライズンTについて求められる。具体的には、オンライン計算又はリアルタイム計算が、時間t+Tまでのコスト最小化制御ストラテジーを求める。制御のステップが実施された後、状態が再びサンプリングされ、計算がその時の現在の状態から開始して繰り返され、新たな制御及び新たな予測された状態パスが得られる。予測ホライズンは前方にシフトし、この理由から、MPCは、後退ホライズン制御とも呼ばれる。
MPCは、システムの様々な物理的制約及び仕様制約を条件として、将来の時間にわたって最適制御問題を解くことによって、システムのモデル及び所望の基準軌道に基づいて機械の運動の実際の軌道を生成するのに用いることができる。MPCは、機械の基準運動と実際の運動との間の誤差、機械のエネルギー消費、及び誘発されるシステム振動等の機械の運動の性能指数を最適化、例えば最小化又は最大化することを目標とする。
MPCは、モデルベースのフレームワークであるので、MPCの性能は、必然的に、最適制御計算において用いられる予測モデルの品質に依存する。しかしながら、ほとんどの場合、いくつかのパラメーターは正確に測定されないので、機械動特性のモデルは事前には(a priori)未知である。このため、コントローラーは、機械の既に動作中に、機械のモデルの未知のパラメーターを推定することが必要な場合があり、このため、パラメーターが推定されている間、制約を課す場合もある。そのような問題を取り扱う方法は、適応型MPC又は学習ベースのMPCを含み、これらのMPCでは、未知の機械パラメーターを学習するために、MPC制御問題が、閉ループ同定方式を用いて強化される。未知のパラメーターを学習することによって、コントローラーによって達成される機械の動作が改善される。
しかしながら、適応型MPC及び学習ベースのMPCの現在の手法は、複数の理由のために限界がある。例えば、未知のパラメーターを推定している間、制約が違反される可能性があるか、又は制約を控えめに課すために、制御性能が過度に低減される場合がある。実際に、特許文献1に記載されている方法等のいくつかの既存の方法は、制約を単に無視し、このため、制約を条件として機械の許容可能な制御ストラテジーを生成することが可能でない。特許文献2に記載されている方法は、制約の問題に対処しているが、しかし依然として、機械動特性のモデルの未知のパラメーターを推定することは、困難な問題である。
米国特許出願公開第2011/0022193号 米国特許出願公開第2016/0147203号
したがって、制約を受ける機械の動作を制御するのに適した、不確実性を含むMPCを用いて機械の動作を制御する方法が必要とされている。
いくつかの実施形態は、機械の動特性のモデルのパラメーターが厳密に知得されることは稀であるという認識に基づいている。種々の同定方法及び学習方法が、モデルのパラメーターを更新して、これらのパラメーターの真の値に関する不確実性を低減することを目的としているが、この不確実性を排除することはほとんどない。さらに、正確なモデルの欠如に起因した不確実性に加えて、制御の不確実性は、測定値における不正確性、モデル低次元化によって引き起こされる誤差、及び状態特徴における不確実性によってももたらされる可能性がある。
いくつかの実施形態は、種々のモデル予測制御(MPC)方法が、モデルのパラメーターが正確に知得されていない場合でも、機械の動特性のモデルを、制御最適化に対する硬制約として用いているという驚くべき認識に基づいている。これらのMPC方法が時間にわたってモデルの正確性を改善しようと試みる場合であっても、ごく僅かな期間のモデルの不正確性でさえ、機械を望ましくない状態に導くおそれがある。
いくつかの実施形態は、MPCにおける機械の動特性のモデルは、硬制約ではなく軟制約として用いられるべきであるという理解に基づいている。そのようにして、動特性のモデルを満たす値から逸脱する機械の状態を防ぐ一方で、そのような状態は、モデルのパラメーターが正確に知得される場合、動特性のモデルを満たすことができるという了解において許可することができる。
例えば、通常、機械の動特性のモデルは、機械の動特性の方程式によって表される。そのような方程式は、機械の動特性の方程式を真にする状態に機械を移行させる、機械の動作を制御する制御入力をMPCに生成させる、MPC最適化における硬制約として機能する。
いくつかの実施形態は、機械の動特性の方程式を機械の性能を最適化するように機能するMPCのコスト関数に移行させることによって、MPCに対するそのような硬制約を除去する。例えば、1つの実施形態では、コスト関数は、機械の状態の、MPCの目的からの逸脱にペナルティを課す、機械の状態の第1の項と、機械の状態の、機械の動特性の方程式を満たす値からの逸脱にペナルティを課す、機械の状態の第2の項とを含む。
これらの項の組み合わせにより、システムの動作の性能と、モデルのパラメーターの不確実性の度合いとの均衡を取ることが可能になる。例えば、モデルの不確実性の値が小さくなる程、コスト関数における第2の項の重みを増加させることが妥当となり得る。不確実性の値が大きくなる程、重みを減少させる動因となる。例えば、1つの実施形態において、コスト関数は、重み付き最小2乗方法を用いて制御入力のシーケンスを探索することにおいて、第1の項の重み及び第2の項の重みの均衡を取る。
いくつかの実施態様において、第2の項は、プロセッサによって実行されるコスト関数の最適化が、機械の動特性の方程式を真にする機械の動特性の方程式の要素を求めることを促すように求められる機械の動特性の方程式の要素を含む。
例えば、機械の動特性の方程式は、空間、例えば、幾何学的空間、制御空間等における状態の時間依存関係を記述する。機械の動特性の方程式は、機械の状態を変数として含む等式の命題である。等式の要素を片側に置くことで、最小最適化又は最大最適化を可能にすることができる。
例えば、機械の動特性の方程式がx’=v(x)である場合、そのような方程式は、magnitude(x’−v(x))=0と書き換えることができ、ここで、引数の「magnitude」は、その引数の0からの逸脱を求める非負の数である。そのようにして、大きさの項magnitude(x’−v(x))がコスト関数の一部である場合、コスト関数の最小化は、差x’−v(x)の0からの逸脱も最小化し、したがって、機械の動特性の方程式を真にすることを促す。反対に、MPC最適化がコスト関数を最大化する場合、機械の動特性の方程式は、−magnitude(x’−v(x))=0と書き換えることができる。この例では、方程式の要素magnitude(x’−v(x))又は−magnitude(x’−v(x))は、動特性の方程式を、硬制約を形成する方程式ではなく軟制約とみなすことを可能にする。magnitude(x’−v(x))の一例は、(x’−v(x))の絶対値の積分(平方)とすることができる。
いくつかの実施形態は、機械の動特性の方程式が軟制約として用いられる場合、機械の状態に対する追加の軟制約を用いて、不確実性の存在時に制御の正確性を更に改善することができるという理解に基づいている。例えば、いくつかの実施形態は、状態の構造に対する制約及び状態の挙動に対する制約等の軟制約からの状態の逸脱にペナルティを課すMPCのコスト関数における状態の第3の項を含む。そのような軟制約の例は、状態のスパース性に対する制約、状態の対称性に対する制約、状態の安定性に対する制約、状態の平滑性に対する制約、状態の時間における変化率に対する制約を含む。
いくつかの実施形態は、機械の動特性の方程式が軟制約として用いられる場合、種々のデータ同化方法を用いて、制御の正確性を更に改善することができるという理解に基づいている。データ同化は、動特性及び観測値の双方における不確実性を有するシステムの状態を推定するのに用いることができ、ここで、実システムの観測値は、そのシステムの数値モデルのモデル状態に組み込まれる。データ同化の応用は、地球科学の多くの分野、例えば天気予報及び水文学において生じている。
いくつかの実施形態は、データ同化を用いて、MPCの将来のホライズンの最適化の外の機械の現在の状態を推定することが可能であるという認識に基づいている。しかしながら、いくつかの実施形態は、機械の動特性の方程式が軟制約として用いられる場合、MPCの将来のホライズン内のデータ同化から借用される方法を用いることが可能であるという理解に基づいている。MPC内でのデータ同化の使用は、不確実性及びシステムに関する不完全な情報を解決することに役立ち得るので、データ同化の上に構築される従来のMPCと比較して、より正確でかつロバストな制御決定がもたらされる。
例えば、1つの実施形態では、コスト関数は、時間ホライズン内の状態のデータ同化を実行する第3の項を含むことで、プロセッサが同化された状態に従って機械の状態を移行させる制御入力のシーケンスを生成するようになっている。データ同化はMPC時間ホライズン内で用いられるので、実施形態は、データ同化に適切なカルマンフィルターの変形を用いてコスト関数を最適化する。カルマンフィルターの変形の例は、古典的カルマンフィルター(KF)、拡張カルマンフィルター(EKF)、無香カルマンフィルター(UKF)、アンサンブルカルマンフィルター(EnKF)、アンサンブルカルマンスムーザー(EnKS)、4D変分モデル(4DVAR)のうちの1つ又は組み合わせを含む。
いくつかの実施形態は、機械の動特性の方程式が軟制約として用いられる場合、その方程式は、厳密である必要がなく、簡略化することができるという別の理解に基づいている。例えば、1つの実施形態では、機械の動特性の方程式は、機械の動特性の厳密な方程式を近似する。
したがって、1つの実施形態は、機械動特性のモデルに従って機械の動作を制御するモデル予測制御(MPC)システムであって、MPCの目的によって規定される第1の項と、機械の状態の、機械の動特性の方程式を満たす値からの逸脱にペナルティを課す第2の項とを含むコスト関数を記憶するメモリと、制約を条件として時間ホライズンにわたってコスト関数を最適化して、この時間ホライズンにわたる機械の状態を制御する制御入力のシーケンスを生成するプロセッサと、シーケンスにおける最初の制御入力に従って機械を制御するコントローラーとを備える、システムを開示する。
別の実施形態は、機械動特性のモデルに従ってモデル予測制御(MPC)を用いて機械の動作を制御する方法であって、この方法は、この方法を実施する、記憶された命令と結合されたプロセッサを使用し、命令は、プロセッサによって実行されると、この方法の少なくともいくつかのステップを実行する、方法を開示する。この方法は、MPCの目的によって規定される第1の項と、機械の状態の、機械の動特性の方程式を満たす値からの逸脱にペナルティを課す第2の項とを含むコスト関数をメモリから索出することと、硬制約を条件として時間ホライズンにわたってコスト関数を最適化して、この時間ホライズンにわたる機械の状態を制御する制御入力のシーケンスを生成することと、シーケンスにおける最初の制御入力に従って機械を制御することとを含む。
更に別の実施形態は、方法を実行するプロセッサによって実行可能なプログラムを具現化した非一時的コンピューター可読記憶媒体を開示する。この方法は、MPCの目的によって規定される第1の項と、機械の状態の、機械の動特性の方程式を満たす値からの逸脱にペナルティを課す第2の項とを含むコスト関数をメモリから索出することと、硬制約を条件として時間ホライズンにわたってコスト関数を最適化して、この時間ホライズンにわたる機械の状態を制御する制御入力のシーケンスを生成することと、シーケンスにおける最初の制御入力に従って機械を制御することとを含む。
いくつかの実施形態による、機械の動作を制御する制御システムのブロック図である。 いくつかの実施形態による、機械の動作を制御するモデル予測制御(MPC)システムのブロック図である。 いくつかの実施形態によって用いられるコスト関数の概略図である。 いくつかの実施形態による、図1及び/又は図2の制御システムのモジュールによって実行される機械の動作を制御する方法のブロック図である。 別の実施形態によって用いられるコスト関数の概略図である。 いくつかの実施形態による、MPCの将来のホライズン内でデータ同化を用いる方法のブロック図である。 1つの実施形態による、データ同化を用いて変更されたMPCを実施する方法のブロック図である。 1つの実施形態によって制御される例示のレーザー加工機械の等角図である。
図1は、いくつかの実施形態による、機械102の動作を制御する制御システム101のブロック図を示している。制御システム101は、機械102への制御入力を、モデル予測制御(MPC)の原理に従って時間ホライズンにわたるこの機械の動特性のモデルを用いてコスト関数を最適化することによって求める。このために、制御システム101は、本明細書において、MPCシステムと称される。
機械102は、その動作が、コマンドに応答して、位置、速度、電流、温度、数値等の量を変化させる装置である。機械の動作は、本明細書において用いられるように、そのような量を変化させる機械の運動を決定する。制御システムは、上記量のうちのいくつかの所望の軌道又は目標点等の機械の所望の運動103を受け取り、制御入力104を介して機械を制御する。制御入力は、機械の動作のパラメーターを変化させるコマンドを含むこともできるし、機械の運動に影響を与え、結果として、機械の量105を生成する電圧、圧力、トルク、力等のパラメーターの実際の値を含むこともできる。
制御システム101は、機械に直接又はリモートに接続されたセンサー、ハードウェア、又はソフトウェアから、機械の運動についての情報106を受信する。情報106は、機械の状態を含む。機械は、制御入力104の選択のために、この状態を用いる。情報106は、運動量105のうちの幾分か又は全てを含むことができるとともに、機械に関する追加情報も含むことができる。この量105、制御入力104又はこれらの組み合わせを、機械の動作に対する制約114に従って、或る所定の範囲内に留めるように要求することができる。
図2は、いくつかの実施形態による、機械の動作を制御するモデル予測制御(MPC)システムのブロック図を示している。MPCシステムは、コスト関数212及び制約214を記憶するメモリ220を含む。また、MPCシステムは、制約214を条件として時間ホライズンにわたってコスト関数212を最適化して、時間ホライズンにわたる、機械102の状態を制御する制御入力のシーケンスを生成するプロセッサ230と、このシーケンス内の最初の制御入力104に従って機械を制御するコントローラー210とを含む。
いくつかの実施形態は、機械の動特性のモデルのパラメーターが厳密に知得されることは稀であるという認識に基づいている。種々の同定方法及び学習方法が、モデルのパラメーターを更新して、これらのパラメーターの真の値に関する不確実性を低減することを目的としているが、この不確実性を排除することはほとんどない。さらに、正確なモデルの欠如に起因した不確実性に加えて、制御の不確実性は、測定値における不正確性、モデル低次元化によって引き起こされる誤差、及び状態特徴における不確実性によってももたらされる可能性がある。
いくつかの実施形態は、種々のモデル予測制御(MPC)方法が、モデルのパラメーターが正確に知得されていない場合でも、機械の動特性のモデルを、制御最適化に対する硬制約として用いているという驚くべき観測に基づいている。これらのMPC方法が時間にわたってモデルの正確性を改善しようと試みる場合であっても、モデルの不正確性により、最適制御が現実に存在し得る一方で、機械が望ましくない状態に導かれ得るか、又は、ホライズンにわたるMPC最適化問題が自己矛盾(実現不能)になり得る。
いくつかの実施形態は、MPCにおける機械の動特性のモデルは、硬制約ではなく軟制約として用いられるべきであるという理解に基づいている。そのようにして、動特性のモデルを満たす値から逸脱する機械の状態を防ぐ一方で、そのような状態は、モデルのパラメーターが正確に知得される場合、動特性のモデルを満たすことができるという了解において許可することができる。
例えば、通常、機械の動特性のモデルは、機械の動特性の方程式によって表される。動特性の方程式は、機械の動特性の方程式を真にする状態に機械を移行させる、機械の動作を制御する制御入力をMPCに生成させる、MPC最適化における硬制約として機能する。いくつかの実施形態は、機械の動特性の方程式を機械の性能を最適化するように機能するMPCのコスト関数に移行させることによって、MPCに対するそのような硬制約を除去する。
図3は、いくつかの実施形態によって用いられるコスト関数212の概略図を示している。コスト関数は、MPCの目的によって規定される第1の項310と、機械の状態の、機械の動特性の方程式を満たす値からの逸脱にペナルティを課す第2の項320とを含む。第1の項310によって表されるMPC目的の例は、制御時間の間の、機械の状態の、基準軌道によって規定される値からの逸脱にペナルティを課す項、及び、動作時間及び/又は動作を実行するのに要するエネルギー等の機械の動作のコストを最小化する項を含む。
例えば、第1の項310は、最適化、例えば第1の項の最小化
Figure 2020503614
が性能メトリックを最適化、例えば最小化するように、制御入力u(τ)及び性能メトリックpの関数J(u,p)を含むことができる。
第2の項320は、MPC又は機械のモデルが不確実性の少なくとも1つのパラメーターを含むという理解に基づいている。例えば、ロボットのアームのモデルは、物体を搬送するアームの質量に関する不確実性を含み得る。列車の運動のためのモデルは、現在の天候条件における車輪のレールとの摩擦に関する不確実性を含み得る。このために、いくつかの実施形態では、第2の項は、プロセッサによって実行されるコスト関数の最適化が機械の動特性の方程式を真にする機械の状態を求めることを促すように求められる機械の動特性の方程式の要素を含む。そのようにして、機械のモデルは、軟制約として機能し、これは、モデルが不確実性を含む場合に硬制約よりも適している。
いくつかの実施形態では、機械の動特性の方程式は、空間、例えば、幾何学的空間、制御空間等における状態の時間依存関係を記述する。機械の動特性の方程式は、機械の状態を変数として含む等式の命題である。等式の要素を片側に置くことで、最小最適化又は最大最適化を可能にすることができる。
例えば、機械の動特性の方程式がx’=v(x)である場合、そのような方程式は、x’−v(x)=0と書き換えることができる。差x’−v(x)がコスト関数において現れる場合、コスト関数の最小化は、機械の動特性の方程式を真にすることを促す。しかしながら、コスト関数値は、実数である一方、x’−v(x)は、一般にベクトル関数である。magnitude(x’−v(x))を求めることにより、ベクトル関数の引数x’−v(x)が、原点0からの引数x’−v(x)の逸脱を特徴付ける非負の数magnitude(x’−v(x))に変換される。例えば、ベクトルの大きさは、ベクトルの長さとして求めることができる一方、関数の大きさは、関数の絶対値の積分として求めることができる。
したがって、項magnitude(x’−v(x))を、例えば、最小化すべきコスト関数に単に加算することができる。反対に、MPC最適化がコスト関数を最大化する場合、機械の動特性の方程式は、−magnitude(x’−v(x))=0と書き換えることができ、項magnitude(x’−v(x))を、最大化すべきコスト関数から減算することができる。
この例において、コスト関数における追加の項は、magnitude(x’−v(x))又は−magnitude(x’−v(x))であり、これにより、硬制約を形成する等式ではなく軟制約として動特性の方程式を考慮することが可能になる。
上記で言及した例に従って、コスト関数212Fは、
Figure 2020503614
を含むことができる。
図4は、いくつかの実施形態による、制御システム101のモジュールによって実行される機械の動作を制御する方法のブロック図を示している。方法は、機械動特性のモデルを軟制約として含むコスト関数の最適化に基づいて、機械動特性のモデルを用いて求められる制御入力を用いて機械の動作を制御する。方法は、以前の反復について求められた以前の制御入力を用いて制御することからもたらされた機械の現在状態を求める(410)。方法は、メモリから、制御の目的に対する軟制約及び機械動特性のモデルに従うことに対する軟制約を指定するコスト関数の軟制約を索出し(420)、メモリから、コスト関数の最適化に対する硬制約を索出する(430)。
次に、方法は、コスト関数を最適化することによって、現在の反復における制御のための現在の制御入力を求める(480)。例えば、方法は、現在の時点から、少なくとも、予測される将来の機械状態及び入力が硬制約を満たすように新たな機械状態測定値を得る程度の長さである将来の固定の時間量についての将来の入力のシーケンスを求める(440)。機械の状態の新たな測定値を得るのに必要な時間量に等しい持続時間の間、入力シーケンスの最初の部分が、機械への現在の制御入力として適用される(450)。機械の現在の状態、機械の現在のモデル、及び機械への現在の制御入力に基づいて、機械の次の状態が求められ(460)、コントローラーは、新たな状態測定値が受信されるまで待機する(470)。
図5は、別の実施形態によって用いられるコスト関数の概略図を示している。この実施形態は、機械の動特性の方程式が軟制約として用いられる場合、機械の状態に対する追加の軟制約510を用いて、不確実性の存在時に制御の正確性を更に改善することができるという理解に基づいている。例えば、いくつかの実施形態は、状態の構造に対する制約及び状態の挙動に対する制約等の軟制約からの状態の逸脱にペナルティを課すMPCのコスト関数における状態の第3の項を含む。そのような軟制約の例は、状態のスパース性に対する制約、状態の対称性に対する制約、状態の安定性に対する制約、状態の平滑性に対する制約、状態の時間における変化率に対する制約を含む。
いくつかの実施形態は、機械の動特性の方程式が軟制約として用いられる場合、種々のデータ同化方法を用いて、制御の正確性を更に改善することができるという理解に基づいている。データ同化は、動特性及び観測値の双方における不確実性を有するシステムの状態を推定するのに用いることができ、ここで、実システムの観測値は、そのシステムの数値モデルのモデル状態に組み込まれる。データ同化の応用は、地球科学の多くの分野、例えば天気予報及び水文学において生じている。
図6は、いくつかの実施形態による、MPCの将来のホライズン内でデータ同化610を用いる方法のブロック図を示している。MPC内でのデータ同化の使用は、システムに関する不確実性及び不完全な情報を解決することに役立ち得るので、データ同化の上に構築される従来のMPCと比較して、より正確でかつロバストな制御決定がもたらされる。例えば、いくつかの実施形態では、データ同化610は、状態の以前の値に基づいて、時間ホライズン内でモデル112に従って機械の動特性の方程式を用いて求められた状態の値を調整する。
いくつかの実施形態は、データ同化を、例えば過去の観測値からの被制御システムの現在の状態の推定に適用することができる(履歴照合)という認識に基づいている。しかしながら、時間ホライズンにわたるMPC内の状態観測値は、明確には存在しない。なぜならば、このホライズンは、将来のものであるためである。したがって、MPCの将来のホライズン最適化内でデータ同化方法を用いることは、不可能であり、したがって無意味であるように思われる。
しかしながら、いくつかの実施形態は、将来の状態観測値が追加の特徴に置き換えられる場合、データ同化が制御を決定するためにMPC内で有益であり得るという認識に基づいている。これらの追加の特徴は、状態の構造、例えば状態の所望の対称性を含むことができ、ここで、状態の対称性は、オフラインで求められ、対称性のタイプ及びパラメーターは、コントローラーのメモリに記憶される。このために、いくつかの実施態様において、データ同化610は、状態の構造及び/又は状態の挙動に対する軟制約620を課すことによって状態の値を調整することができる。
例えば、状態の対称性のタイプは、時間において周期的とすることができ、ここで、この場合における対称性のパラメーターは、期間の長さである。状態は、空間においてその対称性を呈す場合もあり、例えば、状態のベクトルは、任意の時間について対称的とすることができ、例えば20個の成分を有する状態ベクトルについて、第1の10個の成分は、第2の10個の成分と同じものであると知得することができる。状態は、時間において変化するので、対称表面、例えば球面に属するものであると知得することもでき、ここで、この場合における対称性のパラメーターである、球面の中心及び半径は、事前に知得されており、コントローラーのメモリに記憶される。
いくつかの実施形態は、未知の将来の状態測定値の代替とするために、状態の既知のスパース性をデータ同化において用いることができるという別の認識に基づいている。スパース性は、オフラインで求められ、スパース性のパターン及びパラメーターは、コントローラーのメモリに記憶される。例えば、状態のベクトルは、スパースである、すなわち、ベクトル内の特定のインデックスで0になる複数の成分を有するものとすることができ、ここで、インデックスは、スパース性のパターンを表し、一方で、インデックスの総数が、スパース性のパラメーターとして見られる。
付加的に又は代替的に、いくつかの実施形態は、データ同化における将来の状態観測値を、状態が保存則を満たすこと、状態が時間において平滑であること、状態が状態推定器の既知のモデルと一貫していること、状態が所与のプロファイルを追跡、追従すること、状態安定性、状態限界性、のうちの1つ又は組み合わせによって、所望の状態挙動を記述する状態の特性に置き換える。保存則は、例えば、MPCのいくつかの応用における状態の質量保存とすることができる。例えば、時間及び空間における状態の導関数のうちの1つ又は組み合わせを要求する状態の平滑性は、平滑性の所与の許容誤差による絶対値によって限界が規定され、ここで、導関数の次数及び第1の許容誤差の値は、コントローラーメモリに記憶される。
いくつかの実施形態は、状態の安定性及び限界性のうちの一方又は組み合わせも、MPC内のデータ同化において、将来のホライズンにわたる状態の利用不能な測定値に対する代替として機能することができるという別の認識に基づいている。状態の安定性は、コントローラーのメモリに記憶された、モデルにおける変化に対する状態における変化の限界を規定する安定性のパラメーターを用いて規定することができる。
代替的に又は付加的に、いくつかの実施形態は、制御の以下の特性のうちの1つ又は組み合わせを用いて所望の状態挙動の関数をオフラインで求め、ここで、制御は、制御の所与のプロファイルを追跡し、制御は、平滑であり、時間において安定しており、時間において限界を規定される。制御の特性を用いて求められる、状態の特性の関数の係数は、コントローラーのメモリに記憶される。
本発明のいくつかの実施形態によれば、システムのMPCのコスト関数は、システムの状態のデータ同化の関数を用いて変更され、ここで、データ同化の関数は、状態の動特性からの状態の逸脱にペナルティを課し、したがって、システムのモデルにおける状態の動特性の方程式を緩和する。付加的に、システムのMPCのコスト関数は、状態の構造及び状態の挙動のうちの一方又は組み合わせの関数を用いて変更され、この関数は、通常、状態の動特性の方程式及び種々の制約のみを含むシステムのモデルに加えて与えられる。MPC制御解に対する変更の影響は、コスト関数における軟制約として機能するものとして説明することができ、被制御システムを或る状態に移行させる各制御入力は、例えば、状態の構造及び/又は状態の挙動からの状態の逸脱についてペナルティを課されるようになっている。そのようにして、時間ホライズンにわたる全ての制御入力は、システムのモデルにおける不確実性に対処するために状態同化を共同で実行する。
図7は、1つの実施形態による、データ同化を用いて変更されたMPCを実施する方法701のブロック図を示している。MPCのコスト関数は、システム動特性の項が、モデルシステム動特性からの逸脱に対するペナルティ適用と、状態の構造及び挙動からの状態の逸脱に対するペナルティ適用との双方を含むデータ同化の項に置き換わるように変更される。ペナルティ適用項によって求められるデータ同化問題の最適解は、将来の時間ホライズンにわたる予測状態を与え、この予測状態は、ひいては制御入力のシーケンスを生成するのに用いられる。このシーケンスからの最初の制御入力は、現在のシステム状態における制御入力として用いられる。
方法701は、現在の状態703の測定値及び/又は推定値と、制御の以前の時間ステップについてのホライズン時間にわたる状態、制御、及びデータの値710とに基づいてシステムを制御する、制御信号711を生成するオンライン制御ステップを実行する。方法は、状態に対する軟(不確実性)制約705を同化することによって不確実性を許容して、システムのモデルに従って将来のホライズン時間における予測状態725を求め(720)、その後、必要な最適性条件に従ってホライズン時間における解ベクトル755を求める(750)。解ベクトルが求められた後、方法は、制御信号711を生成して、ホライズン時間にわたる状態、制御及びデータの値を更新する(760)。更新された値は、制御の次の時間ステップにおいて方法によって使用される。
例えば、1つの実施形態では、コスト関数は、時間ホライズン内の状態のデータ同化を実行する第3の項を含むことで、プロセッサが同化された状態に従って機械の状態を移行させる制御入力のシーケンスを生成するようになっている。データ同化はMPC時間ホライズン内で用いられるので、実施形態は、データ同化に適切なカルマンフィルターの変形を用いてコスト関数を最適化する。カルマンフィルターの変形の例は、古典的カルマンフィルター(KF)、拡張カルマンフィルター(EKF)、無香カルマンフィルター(UKF)、アンサンブルカルマンフィルター(EnKF)、アンサンブルカルマンスムーザー(EnKS)、4D変分モデル(4DVAR)のうちの1つ又は組み合わせを含む。
いくつかの実施形態は、機械の動特性の方程式が軟制約として用いられる場合、その方程式は、厳密である必要がなく、簡略化することができるという別の理解に基づいている。例えば、1つの実施形態では、機械の動特性の方程式は、機械の動特性の厳密な方程式を近似する。例えば、1つの実施形態は、システムの状態の動特性の近似方程式を用いて変更されたMPCのコスト関数を用いる。ここで、近似方程式は、システムの状態の動特性の厳密な方程式に適用される、モデル低次元化によって求められる。
例示の実施形態
1つの例示の実施形態では、MPCは、ホライズン[t,t+T]に対して予測モデルを解くことによって現在の制御入力u(t)を求める。全体的な枠組みの開始点として、この実施形態は、予測モデルの変更された変形を検討する。ここで、制御u(τ)及びパラメーターベクトルpは、性能インデックスJ(u,p)を最小化する。すなわち、
Figure 2020503614
であり、ここで、
Figure 2020503614
であるが、ただし、不確実性モデル動特性
Figure 2020503614
、状態に対する不確実性制約
Figure 2020503614
、及び確実性制約
Figure 2020503614
を条件とする。
時間依存微分方程式(1)の初期値x(τ)|τ=tは、動特性システムの現在の状態ベクトルx(t)である。予測問題を解く制御ベクトルu=u(τ)は、時点tにおいて動特性システムを制御するための入力として用いられる。ベクトルp(t)の成分は、システムのパラメーターである。非線形方程式(1)は、予測に用いられるモデルシステム動特性を記述する。時変擾乱η及びηがランダム性を有する場合、共分散行列C及びCが利用可能である。
元のコスト関数である性能インデックスJ(u,p)の最小化の補足として、擾乱ベクトルη及びηは、ホライズンにわたる適切解x(τ)を選ぶことによる4DVar/MHE最小化項を用いる本発明のいくつかの実施形態に従って最小化される。
Figure 2020503614
ここで、
Figure 2020503614
は、重み行列C−1を有するLノルムである。以下の記載を通じて、ノルムについて慣習的ではない表記を用いる。例えば、PfPは、実際にはfのノルムを意味し、これは一般的には||f||によって示される。本発明者らによるテスト例において、C=α−1
及びC=β−1Iの形の共分散行列を用いる。ただしα=1であり、適切なスカラーはβ>0であり、Iは恒等行列である。
本発明の一実施形態によれば、元のコスト関数である性能インデックスJ(u,p)に4DVar/MHE最小化項を加算することによって動特性の方程式が緩和される。本発明の一実施形態によれば、交互方向乗数法(ADMM:alternating direction method of multipliers)又は交互最小化アルゴリズム(AMA:Alternating Minimization Algorithm)によって、変更されるコスト関数の最小化を実行することができ、ここで、これらは、制御及び擾乱の最小化を繰り返し交互に行う。ホライズンにわたる解は、4DVar/MHEモデルにおける自由選択とは対照的に、固定の初期値x(t)を有することに留意されたい。
上記で言及したホライズン予測問題の連続定式化は、サイズΔτのN個の等しい時間ステップに分割されたホライズン[t,t+T]にわたる均一時間グリッド上で離散化することができ、時間連続ベクトル関数x(τ)及びu(τ)は、グリッド点τ、i=0,1,...,Nにおいてサンプリングされ、それぞれインデックス付けされた値x及びuによって示される。ホライズンにわたる性能コストJの積分は、矩形直交規則を用いて近似される。状態ベクトルの時間微分は、前方差分公式(forward difference formula)によって近似される。
NMPC定式化のためにオイラー方程式を導出する前に、この実施形態は、4DVarモデルを固定のxを用いて離散化する。
Figure 2020503614
更なる利便性のため、この実施形態は、ブロック対角行列
Figure 2020503614
及び、ベクトル
Figure 2020503614
を導入する。
この表記において、離散化された4DVar問題は、以下の形を取る。
Figure 2020503614
ベクトルG及びRのxに対する勾配は、
Figure 2020503614
に等しい。
したがって、4DVarの解x、i=1,...Nは、以下の方程式を満たす。
Figure 2020503614
したがって、離散化された最適制御問題NMPCは、以下のように定式化される。
Figure 2020503614
ただし、xについてのシステム(6)及び等式制約
Figure 2020503614
を条件とする。
離散化されたホライズン問題について必要な最適性条件は、離散ラグランジュ関数
Figure 2020503614
を用いて導出することができ、ここで、変数は、2つのより大きなベクトルX=[x λ、i=0,1,...,N及びU=[u μ v p](i=0,1,...,N−1)内のものである。ここで、
Figure 2020503614
は、共状態ベクトルであり、μは、制約(7)と関連付けられたラグランジュ乗数ベクトルである。終端制約(8)は、ラグランジュ乗数vの支援により緩和される。
ラグランジュ関数Lの導関数を計算することにより、必要な最適性条件であるカルーシュ−クーン−タッカー(KKT:Karush-Kuhn-Tucker)静止条件が以下のように得られる。
Figure 2020503614
例えば、1つの実施態様は、さらに、KKT条件を非線形方程式F[U,x,t]=0に変換し、ここで、ベクトルUは、制御入力u、ラグランジュ乗数μ、ラグランジュ乗数v、及びパラメーターpを、全て1つのベクトル内に組み合わせる。
Figure 2020503614
F[U,x,t]におけるベクトル引数xは、現在の測定又は推定された状態ベクトルであり、これは、以降の手順において初期ベクトルXとして機能し、これにより、状態変数x及び共状態変数λが消去される。
測定又は推定される現在状態xを有する1つの実施形態は、前方オイラー法xi+1=x+f(τ,x,u,p)Δτの代わりに方程式(6)を解くことによってx、i=1,2...,Nを計算する。次に、連立線形方程式
Figure 2020503614
から共状態λ、i=N,N−1,...,1を計算する。
値λは、xに対する項vψ(x,p)の微分によって規定される。
次に、この実施形態は、得られたばかりのx及びλを用いてF[U,x,t]を計算する。
Figure 2020503614
未知のベクトルU(t)に対する方程式
Figure 2020503614
は、要求される必要な最適性条件を与える。
いくつかの実施形態は、均一な時間グリッドt=jΔt、j=0,1,...上でMPCを用いて制御される動特性システムを使用し、x=x(t)を示す。これらの実施形態では、方程式(9)は、コントローラーボード上にてオンラインで各時間ステップtにおいて解く必要があり、これは、NMPC実施態様の困難な部分である。
未知の変数U=U(t)に対する非線形方程式F[U,x,t]=0は、以下の方程式
Figure 2020503614
に等しく、ここで、
Figure 2020503614
である。
時間ステップΔt及びΔτとは一般的に異なる小さなスカラーh>0を用いて、前方微分演算
Figure 2020503614
を導入し、これは、方向Vに沿って導関数F[Uj−1,x,t](V)を近似する。方程式F[U,x,t]=0は、演算方程式a(ΔU/h)=b/hに等しく、ここで、ΔU=U−Uj−1である。
定式A=a(e)によって規定される列A、k=1,...,mを有するm×m行列Aを導入する。ここで、mは、ベクトルUの次元であり、eは、m×m恒等行列の第kの列を示す。行列Aは、ヤコブ行列F[Uj−1,x,t]のO(h)近似である。ヤコブ行列Fは、対称であり、すなわち、ヤコブ行列F[U,x,t]は、全てのU、x、及びtについて対称である。
方程式F[U,x,t]=0に対する近似解Uが利用可能であると仮定する。十分に正確な近似Uを見つけることは、ニュートン法のような(Newton-like)方法及び探索の成功に極めて重要である。というのも、これは、通常困難な演算であるためである。
の最初のブロックエントリは、状態xにおいて入力制御uとして取り込まれる。次の状態x=x(t)は、センサーによって推定されるか、又は定式x=x+f(t,x,u)Δtによって計算される。(1)を参照されたい。時点t、j>1において、状態x及び以前の時点tj−1からのベクトルUj−1を有する。本発明者らの目的は、Vに対して以下の方程式を解くことである。
Figure 2020503614
次に、ΔU=hV、U=Uj−1+ΔUを設定し、制御uとしてUの最初のブロック成分を選ぶ。次のシステム状態xj+1=X(tj+1)は、センサーによって推定されるか、又は定式xj+1=X+f(t,x,u)Δtによって計算される。
演算方程式(13)を解く直接的な方法は、明示的に行列Aを形成し、その後、例えばガウスの消去法によって連立線形方程式AΔU=bを解くことである。より高速の代替方法は、GMRES反復法によって(13)を解くことである。ここで、演算子a(V)は、行列Aの明示的な構築を伴うことなく用いられる。
1つの実施形態は、Rにおける単位2次元球面にわたる初期状態xから終端状態xへの最小時間運動を数値的に計算する。すなわち、システム動特性は、連立常微分方程式
Figure 2020503614
によって統御され、ここで、制御入力uは、不等式制約|u−c|≦rを条件とし、この不等式制約は、等式制約
Figure 2020503614
を用いて緩和する。
変数uは、仮想のものであり、以下で導入されるスカラーwによって制御される。コスト関数は、
Figure 2020503614
であり、ここでp=t−tは、目的地に至るまでの時間であり、wは、小さい正の定数である。
この実施形態は、間隔[t,t]と一致する後退ホライズンを選択する。ホライズンは、線形マッピングτ→t+τpを用いて無次元時間τ∈[0,1]によってパラメーター化される。この正規化された間隔[0,1]は、ステップサイズΔτ=1/Nを有するグリッドτ=iΔτ、i=0,1,...,Nに均一に分割される。この離散化された変数は、状態x及び共状態λ、制御入力u及びスラック変数ud,i、ラグランジュ乗数μ及びv、パラメーターpを含む。
後退ホライズンに対する動的システムの不確実性予測モデルは、前方オイラー法
Figure 2020503614
であり、ここで、
Figure 2020503614
である。オイラー法の打ち切り誤差は、(1)における擾乱ηである。とりわけ、ηは、ここでは乱数ではなく、状態関数x(τ)と極めて相関している。連続システム動特性
Figure 2020503614
が状態に対する等式制約
Figure 2020503614
を満たすことが直接的に検証される。したがって、制約(4)は、
Figure 2020503614
及びη=0を有する。4DVar近似は、制約(4)を「ソフトに」満たすように設計される。この問題について、オイラー法の各ステップの後に単位球面上にxi+1を写像することによって状態制約
Figure 2020503614
を厳密に満たすことが可能であることに留意されたい。
等式制約
Figure 2020503614
を満たすための更なる別の方法は、いわゆる指数積分(exponential integrator)
Figure 2020503614
を用いることであり、これにより、ノルムPxが保存される。テスト例について、この指数積分を、システム動特性の数値シミュレーションのために用いる。
離散化されたコスト関数は、
Figure 2020503614
である。1つの実施態様は、固定の初期値x及びスカラーパラメーターβ≧0を条件として、状態xの4DVar近似を選択する。
Figure 2020503614
パラメーターβは、等式制約
Figure 2020503614
を満たす強制力を決定する。すなわち、定数βが大きいほど、強制が強くなる。
いくつかの実施形態によれば、4DVar最適化問題は、以下の連立非線形方程式に等しい。
Figure 2020503614
ここで、
Figure 2020503614
である。
対応する離散ラグランジュ関数は、以下の形態を有する。
Figure 2020503614
共状態λは、式
Figure 2020503614
を満たし、ここで、Cは、ブロック
Figure 2020503614
を有するブロック対角行列であり、すなわち、
Figure 2020503614
である。関数F(U,x,t)、ただし、
Figure 2020503614
は、上から下まで、以下の行を有する。
Figure 2020503614
いくつかの実施形態は、システム動特性から導出される状態制約を有する問題を検討する。これらの実施形態は、終端制約の数を、状態に対する等式制約によって求められる滑らかな多様体の次元に削減する。例えば、或る場合、球面の次元が2に等しく、したがって、ラグランジュ乗数vは、3つではなく2つのみの成分を含む。上記に記載された終端制約の削減が満たされない場合、後続の計算により、ニュートンタイプの反復における特異ヤコビ行列がもたらされる。
レーザー加工機械
いくつかの実施形態は、冗長レーザー加工機械の動作を制御するシステム及び方法を提供する。いくつかの実施形態は、追跡誤差の限界によって規定された誤差で基準軌道を追跡する実現可能性を保証する制約を条件として、最適化に基づく後退ホライズン制御を用いて機械を制御する。後退ホライズン制御の非限定的な一例は、モデル予測制御(MPC)である。
図8は、一発明の1つの実施形態による一例示のレーザー加工機械の等角図を示している。レーザー加工機械は、例示の目的で示されており、この機械の設計は、本発明の範囲を制限するものとは意図されていない。レーザー加工機械は、低速アクチュエーター及び高速アクチュエーターを備え、これらの例が以下で提供される。
ワーク800は、ガントリー820の下のビームダンプ810上で支持される。ガントリーは、第1の方向に沿って、例えば、Y軸に沿ってレール825及び826上を移動する。ガントリー820は、第1のサーボモーター及び第1のスクリュー823によって第1の方向に沿って移動される。ガントリー820上にはプラットフォーム830が配置され、このプラットフォームは、第1の方向に沿ってガントリーとともに移動する。また、プラットフォーム830は、第2のサーボモーター及び第2のスクリュー835によって第2の方向に沿って、例えば、X軸に沿って移動される。この実施形態では、ガントリー820と、第1のサーボモーター及び第1のスクリュー823と、第2のサーボモーター及び第2のスクリュー835とは、プラットフォームを、ワークに対して平行な面において、第1の方向及び第2の方向に沿って移動させる運動システムを形成する。しかしながら、本発明の他の実施形態は、異なるタイプの直動関節を用いてプラットフォームを移動させる。例えば、第1の直動関節は、第1の方向の線形駆動モーターを備えることができ、第2の直動関節は、第2の方向の線形駆動モーターを備えることができる。
プラットフォーム830上には、ガルバノアセンブリ、例えば2つの直交ガルバノドライブ、すなわち第1のドライブ840及び第2のドライブ845、第1のミラー841及び第2のミラー846を有する2軸ガルバノスキャンヘッドが配置される。第1のドライバー840によって引き起こされる第1のミラー841の第3の運動は、第3の方向に沿ってレーザービームを位置決めし、第2のドライバー845によって引き起こされる第2のミラー846の第4の運動は、第4の方向に沿ってレーザービームを位置決めする。
本明細書の関連において、ガントリー820は、広い動作範囲を有する第1のアクチュエーター、すなわち低速アクチュエーターであり、ガルバノアセンブリは、より狭小な動作範囲を有する第2のアクチュエーター、すなわち高速アクチュエーターである。しかしながら、そのような使用は、特許請求の範囲の適用範囲を制限するものとは意図されない。例えば、いくつかの変形形態では、第1のアクチュエーターが高速アクチュエーターであり、第2のアクチュエーターが低速アクチュエーターである。
種々の実施形態において、ガルバノアセンブリは、第3の方向が第1の方向に対して固定されるとともに、第4の方向が第2の方向に対して固定されるように、プラットフォーム上に配置される。例えば、1つの実施形態では、第1の方向は、第3の方向と一致するとともに、第2の方向は、第4の方向と一致する。別の実施形態では、第1の方向は、第3の方向と45度の角度をなすとともに、第2の方向は、第4の方向と45度の角度をなす。
ガルバノアセンブリは、運動の方向を固定するために、プラットフォームに取り付けることができる。代替的に、ガルバノアセンブリは、第1の方向、第2の方向、第3の方向、及び第4の方向の相互配向を、レーザー加工機械の動作前又は動作中に固定することができるように、プラットフォーム上に回転可能に配置することができる。本発明の関連において、ガルバノアセンブリは、狭小な動作範囲を有する第2の段、すなわち高速段である。
レーザー加工機械は、切断レーザービーム860を、光ファイバー870及びコリメーター875を介してガルバノアセンブリの第1のミラー841及び第2のミラー846に方向付けるレーザー850を備えることができる。代替的な実施形態では、レーザービームは、Yガントリー及びX軸プラットフォームに沿って移動する対角ミラーを介してガルバノアセンブリに方向付けられる。しかしながら、他の変形形態も可能である。
コリメートされた切断レーザービーム860は、ミラーによって、このレーザービームをワーク上で集束させる集束モジュール880を通して方向付けされ、これにより、ワーク800上に組み合わされたX軸及びY軸のガルバノアセンブリスキャンエリア865が生成され、ワーク800が切断される。集束モジュール880の一例は、フィールド平坦化Fθレンズ又は非テレセントリックFθレンズである。ワーク800のサイズは、プラットフォームの運動に起因して、ガルバノスキャンエリア865よりも大きいものとすることができる。
いくつかの実施形態では、制御モジュールは、コンピューター数値制御(CNC)コントローラー895を備える。他の実施形態は、異なるタイプのコントローラーを用いることができる。制御モジュールは、レーザービームの位置の軌道を規定する、予め計算されたGコード890に従って運動システム及びガルバノアセンブリを制御することができるか、又は、機械をどのように制御するかを判断するための計算を実行することができる。例えば、計算は、X軸プラットフォーム830、Y軸ガントリー、X運動ガルバノアセンブリ及びミラー841、並びにY運動ガルバノアセンブリ及びミラー846のための連続位置を規定することができる。
一般に、機械は、異なる動特性挙動を有するアクチュエーターを備えて構築される。例えば、第1のアクチュエーターは、通常、変位質量の差に起因して、第2のアクチュエーターよりも大幅に低速である。この差から、低速アクチュエーター及び高速アクチュエーターという示されてきた名称が取られている。
1つの実施形態は、低速アクチュエーターの動特性を、以下のようにモデル化する。
Figure 2020503614
ここで、pは、低速アクチュエーターの位置であり、vは、低速アクチュエーターの速度であり、τは、低速アクチュエーターのトルクであり、Tは、一制御サイクルが実行される機械の制御期間であり、kは、制御サイクルのインデックスであり、Jは、低速アクチュエーターの慣性であり、Lは、長手方向運動を線形運動に変換するボールスクリューのピッチ長であり、βは、低速アクチュエーターの所与の角速度について低速アクチュエーターにかかる摩擦トルクを求める摩擦係数である。
本発明の実施形態によれば、動特性の方程式のうちの一方又は双方は、元のコスト関数に対応する差の大きさを加算することによって緩和することができる。例えば、第1の方程式
Figure 2020503614
は、まず、
Figure 2020503614
と書き換えることができ、次に、
Figure 2020503614
と書き換えることができる。ここで、「magnitude」は、例えば、ベクトルノルム(2ノルム等)とすることができ、平方することができる。したがって、動特性の第1の元の方程式p(k+1)=p(k)+Tv(k)は、ドロップされ、追加の項magnitude(p(k+1)−p(k)−Tv(k))が元のコスト関数に加算される。結果として、動特性の第1の元の方程式p(k+1)=p(k)+Tv(k)は、真であることが促されるものの、変更されたコスト関数のMPC最小化において違反することができる。動特性の第1の元の方程式p(k+1)=p(k)+Tv(k)におけるパラメーターTが不確実である場合、これは有益であり得る。
一般に、パラメーターp、v、tは、x座標及びy座標を有する2次元ベクトルであり、以下の制約を受ける。
Figure 2020503614
これらの制約は、位置p、速度v、加速度a、及びトルクτに対する下限及び上限を規定し、本発明のいくつかの実施形態によれば、硬制約として保持され得る。
1つの実施形態は、低速アクチュエーターのモデルを、線形微分方程式
Figure 2020503614
として表現し、ここで、kは、信号がサンプリングされる時点、すなわち制御サイクルのインデックスであり、uは、機械入力であり、yは、機械出力であり、xは、機械の状態であり、A、B、Cは、モデルのパラメーターである。例えば、x=[p,v]’、y=p、u=τであり、A、B、Cは、適切な次元からなる行列であり、低速アクチュエーターの動作は、線形制約
Figure 2020503614
を受ける。ここで、X、Uは、多面体集合である。
本発明の他の実施形態によれば、動特性の方程式のうちの一方又は双方は、元のコスト関数に対応する差の大きさを加算することによって緩和することができる。例えば、第1の方程式
Figure 2020503614
は、まず、
Figure 2020503614
と書き換えることができ、次に、
Figure 2020503614
と書き換えることができる。ここで、「magnitude」は、例えば、ベクトルノルム(2ノルム等)であり、平方することができ、すなわち、magnitude(x(k+1)−Ax(k)−Bu(k))=||x(k+1)−Ax(k)−Bu(k)||である。したがって、動特性の第1の元の方程式x(k+1)=Ax(k)+Bu(k)は、ドロップされ、全てのkについて追加の項magnitude(x(k+1)−Ax(k)−Bu(k))が元のコスト関数に加算される。結果として、動特性の第1の元の方程式x(k+1)=Ax(k)+Bu(k)は、真であることが促されるものの、変更されたコスト関数のMPC最小化において違反することができる。動特性の第1の元の方程式x(k+1)=Ax(k)+Bu(k)における行列A及びBのうちの少なくとも一方が不確実である場合、これは、有益であり得る。付加的に又は代替的に、動特性の第1の元の方程式x(k+1)=Ax(k)+Bu(k)が、例えば、リアルタイムでの非線形最小化の非実用的な計算コストに起因してMPCにおいて直接用いることができないより正確な動特性の非線形方程式x(k+1)=F(x(k),u(k))を近似するため、近似的にのみ保たれていることが既知である場合、この緩和は有益であり得る。
動特性の第2の方程式y(k)=Cx(k)は、ホライズンにわたるリアルタイムMPC最適化において最小化されるべき元のコスト関数に追加の項magnitude(y(k)−Cx(k))を加算することに置き換えられることで、同様に付加的に又は代替的に緩和することができる。
本発明のいくつかの実施形態は、動特性の方程式を単に緩和することにより、MPC最適化問題の最適制御解が、緩和されているものの動特性の元の方程式を厳密に満たさない状態に対して得られるという状況がもたらされ得るという理解に基づいている。そのような些細なシナリオは望ましくない可能性があり、本発明のいくつかの実施形態では、制御及び状態のうちの一方又は組み合わせの所望の挙動及び構造の一方又は組み合わせを記述するコスト関数において追加の項を含めることによって回避することができる。レーザーカッターの例において、追加の項は、例えば、低速アクチュエーターの加速度にペナルティを課すことができ、ここで、コスト関数における追加の項は、加速度が所与の上限によって既に硬制約を受けているにもかかわらず、加速度aの|a|の大きさとなる。
本発明のいくつかの実施形態は、交互方向乗数法(ADMM)又は交互最小化アルゴリズム(AMA)を用いて、追加の項を用いて変更されたコスト関数を最小化することを提案し、ここで、制御のための最小化及び状態のための最小化が繰り返し交互に行われる。例えば、元のコスト関数をJ(u,x,y)とし、第1の追加の項をα||y−Cx||とし、全てのkについてy(k)=Cx(k)を促し、第2の追加の項をβ||x||とし、xが小さいものであることを促す。その場合、変更された最小2乗コスト関数は、
Figure 2020503614
である。
全ての変数に対してともに最小化するのではなく、制御uのための最小化並びに状態x及び観測値yのための最小化を繰り返し交互に行うことができ、これは、場合によっては計算的に有利となる。
本発明の上記で説明した実施形態は、数多くの方法のうちの任意のもので実施することができる。例えば、これらの実施形態は、ハードウェア、ソフトウェア、又はそれらの組み合わせを用いて実施することができる。ソフトウェアで実施されるとき、ソフトウェアコードは、単一のコンピューターに設けられるか又は複数のコンピューター間に分散されるかを問わず、任意の適したプロセッサ又はプロセッサの集合体上で実行することができる。そのようなプロセッサは、集積回路コンポーネントに1つ以上のプロセッサを有する集積回路として実施することができる。ただし、プロセッサは、任意の適した形式の回路部を用いて実施することができる。
さらに、コンピューターは、ラックマウントコンピューター、デスクトップコンピューター、ラップトップコンピューター、ミニコンピューター、又はタブレットコンピューター等の複数の形態のうちの任意のもので具現化することができることが理解されるべきである。そのようなコンピューターは、エンタープライズネットワーク又はインターネット等のローカルエリアネットワーク又はワイドエリアネットワークを含む1つ以上のネットワークによって任意の適した形態に相互接続することができる。そのようなネットワークは、任意の適した技術に基づくことができ、任意の適したプロトコルに従って動作することができ、無線ネットワーク、有線ネットワーク、又は光ファイバーネットワークを含むことができる。
また、本明細書において略述した様々な方法又はプロセスは、様々なオペレーティングシステム又はプラットフォームのうちの任意の1つを用いる1つ以上のプロセッサ上で実行可能なソフトウェアとしてコード化することもできる。加えて、そのようなソフトウェアは、複数の適したプログラミング言語及び/又はプログラミングツール若しくはスクリプティングツールのうちの任意のものを用いて記述することができる。
また、本発明の実施形態は、方法として具現化することもできる。この方法の一例が提供されている。この方法の一部として実行されるステップは、任意の適した方法で順序付けることができる。したがって、例示されたものと異なる順序で動作が実行される実施形態を構築することができ、これらの実施形態は、いくつかの動作を、例示の実施形態では順次的な作用として示されていても同時に実行することを含むことができる。

Claims (20)

  1. 機械動特性のモデルに従って機械の動作を制御するモデル予測制御(MPC)システムであって、
    前記MPCの目的によって規定される第1の項と、前記機械の状態の、前記機械の動特性の方程式を満たす値からの逸脱にペナルティを課す第2の項とを含むコスト関数を記憶するメモリと、
    制約を条件として時間ホライズンにわたって前記コスト関数を最適化して、該時間ホライズンにわたる前記機械の前記状態を制御する制御入力のシーケンスを生成するプロセッサと、
    前記シーケンスにおける最初の前記制御入力に従って前記機械を制御するコントローラーと、
    を備える、システム。
  2. 前記第2の項は、前記プロセッサによって実行される前記コスト関数の前記最適化が、前記機械の動特性の前記方程式を真にする前記機械の前記状態を求めることを促すように求められる前記機械の動特性の前記方程式の要素を含む、請求項1に記載のシステム。
  3. 前記コスト関数は、前記状態の、軟制約からの逸脱にペナルティを課す前記状態の第3の項を含む、請求項1に記載のシステム。
  4. 前記軟制約は、前記状態の構造に対する制約、及び前記状態の挙動に対する制約のうちの一方又は組み合わせを含む、請求項3に記載のシステム。
  5. 前記軟制約は、前記状態のスパース性に対する制約、前記状態の対称性に対する制約、前記状態の安定性に対する制約、前記状態の平滑性に対する制約、前記状態の時間における変化率に対する制約のうちの1つ又は組み合わせを含む、請求項3に記載のシステム。
  6. 前記コスト関数は、前記時間ホライズン内の前記状態のデータ同化を実行する第3の項を含むことで、前記プロセッサが前記同化された状態に従って前記機械の前記状態を移行させる前記制御入力のシーケンスを生成するようになっている、請求項1に記載のシステム。
  7. 前記データ同化は、前記状態の以前の値に基づいて、前記時間ホライズン内の、前記機械の前記動特性の前記方程式を用いて求められる前記状態の値を調整する、請求項6に記載のシステム。
  8. 前記プロセッサは、カルマンフィルターの変形を用いて前記コスト関数を最適化する、請求項6に記載のシステム。
  9. 前記カルマンフィルターの変形は、古典的カルマンフィルター(KF)、拡張カルマンフィルター(EKF)、無香カルマンフィルター(UKF)、アンサンブルカルマンフィルター(EnKF)、アンサンブルカルマンスムーザー(EnKS)、4D変分モデル(4DVAR)のうちの1つ又は組み合わせを含む、請求項8に記載のシステム。
  10. 前記コスト関数は、重み付き最小2乗方法を用いて前記制御入力のシーケンスを探索することにおいて、前記第1の項の重み及び前記第2の項の重みの均衡を取り、該重みは、前記MPCシステムの前記メモリに記憶される、請求項1に記載のシステム。
  11. 前記プロセッサは、前記制御入力のための最適化と前記状態の最適化とを繰り返し交互に行うことによって前記コスト関数を最適化する、請求項1に記載のシステム。
  12. 前記機械は、冗長レーザー加工機械である、請求項1に記載のシステム。
  13. 機械動特性のモデルに従ってモデル予測制御(MPC)を用いて機械の動作を制御する方法であって、該方法は、該方法を実施する、記憶された命令と結合されたプロセッサを使用し、前記命令は、前記プロセッサによって実行されると、該方法の少なくともいくつかのステップを実行し、該少なくともいくつかのステップは、
    前記MPCの目的によって規定される第1の項と、前記機械の状態の、前記機械の動特性の方程式を満たす値からの逸脱にペナルティを課す第2の項とを含むコスト関数をメモリから索出するステップと、
    硬制約を条件として時間ホライズンにわたって前記コスト関数を最適化して、該時間ホライズンにわたる前記機械の前記状態を制御する制御入力のシーケンスを生成するステップと、
    前記シーケンスにおける最初の前記制御入力に従って前記機械を制御するステップと、
    を含む、方法。
  14. 前記第2の項は、前記プロセッサによって実行される前記コスト関数の前記最適化が、前記機械の動特性の前記方程式を真にする前記機械の前記状態を求めることを促すように求められる前記機械の動特性の前記方程式の要素を含む、請求項13に記載の方法。
  15. 前記コスト関数は、前記状態の、軟制約からの逸脱にペナルティを課す前記状態の第3の項を含み、前記軟制約は、前記状態の構造に対する制約、及び前記状態の挙動に対する制約のうちの一方又は組み合わせを含む、請求項13に記載の方法。
  16. 前記コスト関数は、前記時間ホライズン内の前記状態のデータ同化を実行する第3の項を含むことで、前記プロセッサが前記同化された状態に従って前記機械の前記状態を移行させる前記制御入力のシーケンスを生成するようになっている、請求項13に記載の方法。
  17. 前記データ同化は、前記状態の以前の値に基づいて、前記時間ホライズン内の、前記機械の前記動特性の前記方程式を用いて求められる前記状態の値を調整する、請求項16に記載の方法。
  18. 前記プロセッサは、カルマンフィルターの変形を用いて前記コスト関数を最適化する、請求項16に記載の方法。
  19. 前記機械は、冗長レーザー加工機械である、請求項13に記載の方法。
  20. 機械動特性のモデルに従ってモデル予測制御(MPC)を用いて機械の動作を制御する方法を実行するプロセッサによって実行可能なプログラムを具現化した非一時的コンピューター可読記憶媒体であって、前記方法は、
    前記MPCの目的によって規定される第1の項と、前記機械の状態の、前記機械の動特性の方程式を満たす値からの逸脱にペナルティを課す第2の項とを含むコスト関数をメモリから索出することと、
    硬制約を条件として時間ホライズンにわたって前記コスト関数を最適化して、該時間ホライズンにわたる前記機械の前記状態を制御する制御入力のシーケンスを生成することと、
    前記シーケンスにおける最初の前記制御入力に従って前記機械を制御することと、
    を含む、非一時的コンピューター可読記憶媒体。
JP2019534779A 2017-03-24 2018-02-08 機械の動作を制御するモデル予測制御システム及び方法 Active JP6727744B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/468,481 US20180275621A1 (en) 2017-03-24 2017-03-24 Model Predictive Control with Uncertainties
US15/468,481 2017-03-24
PCT/JP2018/005363 WO2018173569A1 (en) 2017-03-24 2018-02-08 Model predictive control system and method for controlling operation of machine

Publications (2)

Publication Number Publication Date
JP2020503614A true JP2020503614A (ja) 2020-01-30
JP6727744B2 JP6727744B2 (ja) 2020-07-22

Family

ID=61617059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019534779A Active JP6727744B2 (ja) 2017-03-24 2018-02-08 機械の動作を制御するモデル予測制御システム及び方法

Country Status (5)

Country Link
US (1) US20180275621A1 (ja)
EP (1) EP3602209B1 (ja)
JP (1) JP6727744B2 (ja)
CN (1) CN110462531B (ja)
WO (1) WO2018173569A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6239294B2 (ja) * 2013-07-18 2017-11-29 株式会社日立ハイテクノロジーズ プラズマ処理装置及びプラズマ処理装置の運転方法
US20210240159A1 (en) * 2018-01-24 2021-08-05 Intact Solutions, Inc. Moment-Based Representation for Interoperable Analysis
EP3671373A1 (de) * 2018-12-19 2020-06-24 Bystronic Laser AG Prognoseverfahren zur prognose eines bearbeitungsergebnisses für ein laserbearbeitungsverfahren
US11106189B2 (en) * 2019-03-06 2021-08-31 Mitsubishi Electric Research Laboratories, Inc. System and method for data-driven control of constrained system
US11124196B2 (en) * 2019-07-02 2021-09-21 Mitsubishi Electric Research Laboratories, Inc. Receding horizon state estimator
US11644814B2 (en) * 2019-11-20 2023-05-09 Abb Schweiz Ag Method and apparatus for coordinating the utilization of operational zones to achieve production goals
JP7094377B2 (ja) 2019-12-23 2022-07-01 株式会社日立ハイテク プラズマ処理方法およびプラズマ処理に用いる波長選択方法
CN111897217B (zh) * 2020-07-20 2022-03-11 清华大学 一种模型预测控制器的时域分解加速方法
CN112462612B (zh) * 2020-12-01 2021-11-30 吉林大学 基于并行牛顿求解的车辆横纵耦合非线性模型预测控制器
CN113359471B (zh) * 2021-07-05 2022-10-14 湖南大学 基于协状态辅助的自适应动态规划最优控制方法及系统
CN113568067B (zh) * 2021-07-19 2022-04-05 中国科学院大气物理研究所 数值天气预报方法、装置、计算机存储介质及电子设备
US11977374B2 (en) 2021-08-02 2024-05-07 Mitsubishi Electric Research Laboratories, Inc. System and method for calibrating feedback controllers
WO2023013212A1 (en) * 2021-08-02 2023-02-09 Mitsubishi Electric Corporation System and method for calibrating feedback controllers
CN114003015B (zh) * 2021-10-11 2023-06-23 清华大学深圳国际研究生院 混合不确定下的主动故障诊断方法、装置及存储介质
CN115630566B (zh) * 2022-09-28 2024-05-07 中国人民解放军国防科技大学 一种基于深度学习和动力约束的资料同化方法和系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992014197A1 (en) * 1991-02-08 1992-08-20 Kabushiki Kaisha Toshiba Model forecasting controller
US7376472B2 (en) * 2002-09-11 2008-05-20 Fisher-Rosemount Systems, Inc. Integrated model predictive control and optimization within a process control system
US8374709B2 (en) * 2008-03-03 2013-02-12 Alstom Technology Ltd Control and optimization system
US20110016610A1 (en) 2009-07-27 2011-01-27 Steven Wieder Sweatband with absorbent bamboo inner layer and related method of use
US8686508B2 (en) * 2009-09-03 2014-04-01 International Business Machines Corporation Structures, methods and applications for electrical pulse anneal processes
WO2016010601A2 (en) * 2014-04-23 2016-01-21 The Florida State University Research Foundation, Inc. Adaptive nonlinear model predictive control using a neural network and input sampling
US9983554B2 (en) 2014-11-25 2018-05-29 Mitsubishi Electric Research Laboratories, Inc. Model predictive control with uncertainties
US10281897B2 (en) * 2015-06-02 2019-05-07 Mitsubishi Electric Research Laboratories, Inc. Model predictive control with uncertainties
US10336451B2 (en) * 2015-06-30 2019-07-02 Gopro, Inc. Coupling assembly for a removable propeller
CN105262083B (zh) * 2015-10-21 2019-05-21 中国电力科学研究院 一种基于时变负荷扰动的mpc二次调频有功分配方法

Also Published As

Publication number Publication date
CN110462531A (zh) 2019-11-15
JP6727744B2 (ja) 2020-07-22
EP3602209A1 (en) 2020-02-05
WO2018173569A1 (en) 2018-09-27
EP3602209B1 (en) 2022-08-17
CN110462531B (zh) 2022-09-06
US20180275621A1 (en) 2018-09-27

Similar Documents

Publication Publication Date Title
JP6727744B2 (ja) 機械の動作を制御するモデル予測制御システム及び方法
Akametalu et al. Reachability-based safe learning with Gaussian processes
TWI604287B (zh) 用於控制加工機之操作的方法及控制系統,以及加工機
JP7183446B2 (ja) 機械の動作を制御する装置及び方法、並びに記憶媒体
Mercy et al. Real-time motion planning in the presence of moving obstacles
US20150158121A1 (en) Control of Redundant Laser Processing Machines
CN104049598B (zh) 线性和非线性系统的基于确定性优化的控制系统及方法
Caarls et al. Parallel online temporal difference learning for motor control
Seo et al. Real-time robust receding horizon planning using Hamilton–Jacobi reachability analysis
Diwan et al. Fast nonlinear model predictive controller using parallel PSO based on divide and conquer approach
Atkeson et al. Trajectory-based dynamic programming
CN114502338A (zh) 用于生成机器人的控制器的技术
US20220291642A1 (en) Process controller with meta-reinforcement learning
Montenegro et al. Predictive dynamic matrix control (DMC) for ball and plate system used in a Stewart robot
Maiworm et al. Online gaussian process learningbased model predictive control with stability guarantees
Evain et al. Nonlinear dynamic inversion for redundant systems using the EKF formalism
Diwan et al. Computationally efficient nonlinear model predictive controller using parallel particle swarm optimization
Danilov et al. Algorithms for intelligent control of multi-link walking robots with self-learning capabilities
Gukov et al. Real-time Multi-Objective Trajectory Optimization
Clower Predicting parameters for bertini using neural networks
WO2017195257A1 (ja) 電子制御装置、数式モデル構築方法
Agboh Robust physics-based robotic manipulation in real-time
Khorasgani et al. Long-term planning, short-term adjustments
EP3659757A1 (en) Method for determining a controller sequence
Yamaguchi et al. Multirotor Ensemble Model Predictive Control I: Simulation Experiments

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190624

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200602

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200630

R150 Certificate of patent or registration of utility model

Ref document number: 6727744

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250