JP2020503614A

JP2020503614A - 機械の動作を制御するモデル予測制御システム及び方法

Info

Publication number: JP2020503614A
Application number: JP2019534779A
Authority: JP
Inventors: ニアゼフ、アンドレイ; マリシェフ、アレクサンドル
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2017-03-24
Filing date: 2018-02-08
Publication date: 2020-01-30
Anticipated expiration: 2038-02-08
Also published as: CN110462531A; JP6727744B2; EP3602209A1; WO2018173569A1; EP3602209B1; CN110462531B; US20180275621A1

Abstract

機械動特性のモデルに従って機械の動作を制御するモデル予測制御（ＭＰＣ）システムは、制約を条件として時間ホライズンにわたってコスト関数を最適化して、時間ホライズンにわたる機械の状態を制御する制御入力のシーケンスを生成する。機械は、シーケンスにおける最初の制御入力を用いる制御である。コスト関数はＭＰＣの目的によって規定される第１の項と、機械の状態の、機械の動特性の方程式を満たす値からの逸脱にペナルティを課す第２の項とを含む。

Description

本発明は、包括的には、機械の動作を制御することに関し、より詳細には、後退ホライズンにわたってモデル予測制御（ＭＰＣ）を用いて動作を制御することに関する。

機械制御では、ソフトウェア又はハードウェアの一方又は組み合わせを用いて実施することができるコントローラーが、例えば、センサー及び／又は推定器、機械の出力から取得された測定値に基づいて、この機械への入力のコマンド値を生成する。コントローラーは、機械が所望のとおり動作するように、例えば、動作が所望の基準プロファイルに従うか又は出力を或る特定の値に調整するように入力を選択する。いくつかの場合には、コントローラーは、例えば、対応する変数がいくつかの所定の範囲内にあることを確保して物理的仕様から安全な機械動作を確保する制約を機械の入力及び出力に対して課す。そのような制約を課すために、コントローラーは、多くの場合、機械のモデルを用いて、コマンド、すなわち制御入力が印加されたときに機械がどのような挙動を引き起こすのかを予測する。制約を機械の入力及び出力に対して課している間に機械の制御を達成することが可能なコントローラーにおけるプロセスの１つの例は、モデル予測制御（ＭＰＣ）である。

ＭＰＣは、機械動特性のモデルのホライズン最適化に基づいており、適切な制御動作を取るために将来のイベントを予想する能力を有する。これは、制約を条件として、将来の時間ホライズンにわたって機械の動作を最適化し、あとは、現在のタイムスロットにわたって制御を実施するだけで達成される。例えば、制約は、機械の物理的限界、機械の動作に対する安全性限界、及び軌道上の性能限界を表すことができる。機械の制御ストラテジーは、そのような制御ストラテジーについて機械によって引き起こされた運動が全ての制約を満たすときに許容することができる。例えば、時間ｔにおいて、機械の現在の状態がサンプリングされ、許容可能なコスト最小化制御ストラテジーが、将来における比較的短い時間ホライズンＴについて求められる。具体的には、オンライン計算又はリアルタイム計算が、時間ｔ＋Ｔまでのコスト最小化制御ストラテジーを求める。制御のステップが実施された後、状態が再びサンプリングされ、計算がその時の現在の状態から開始して繰り返され、新たな制御及び新たな予測された状態パスが得られる。予測ホライズンは前方にシフトし、この理由から、ＭＰＣは、後退ホライズン制御とも呼ばれる。

ＭＰＣは、システムの様々な物理的制約及び仕様制約を条件として、将来の時間にわたって最適制御問題を解くことによって、システムのモデル及び所望の基準軌道に基づいて機械の運動の実際の軌道を生成するのに用いることができる。ＭＰＣは、機械の基準運動と実際の運動との間の誤差、機械のエネルギー消費、及び誘発されるシステム振動等の機械の運動の性能指数を最適化、例えば最小化又は最大化することを目標とする。

ＭＰＣは、モデルベースのフレームワークであるので、ＭＰＣの性能は、必然的に、最適制御計算において用いられる予測モデルの品質に依存する。しかしながら、ほとんどの場合、いくつかのパラメーターは正確に測定されないので、機械動特性のモデルは事前には（a priori）未知である。このため、コントローラーは、機械の既に動作中に、機械のモデルの未知のパラメーターを推定することが必要な場合があり、このため、パラメーターが推定されている間、制約を課す場合もある。そのような問題を取り扱う方法は、適応型ＭＰＣ又は学習ベースのＭＰＣを含み、これらのＭＰＣでは、未知の機械パラメーターを学習するために、ＭＰＣ制御問題が、閉ループ同定方式を用いて強化される。未知のパラメーターを学習することによって、コントローラーによって達成される機械の動作が改善される。

しかしながら、適応型ＭＰＣ及び学習ベースのＭＰＣの現在の手法は、複数の理由のために限界がある。例えば、未知のパラメーターを推定している間、制約が違反される可能性があるか、又は制約を控えめに課すために、制御性能が過度に低減される場合がある。実際に、特許文献１に記載されている方法等のいくつかの既存の方法は、制約を単に無視し、このため、制約を条件として機械の許容可能な制御ストラテジーを生成することが可能でない。特許文献２に記載されている方法は、制約の問題に対処しているが、しかし依然として、機械動特性のモデルの未知のパラメーターを推定することは、困難な問題である。

米国特許出願公開第２０１１／００２２１９３号米国特許出願公開第２０１６／０１４７２０３号

したがって、制約を受ける機械の動作を制御するのに適した、不確実性を含むＭＰＣを用いて機械の動作を制御する方法が必要とされている。

いくつかの実施形態は、機械の動特性のモデルのパラメーターが厳密に知得されることは稀であるという認識に基づいている。種々の同定方法及び学習方法が、モデルのパラメーターを更新して、これらのパラメーターの真の値に関する不確実性を低減することを目的としているが、この不確実性を排除することはほとんどない。さらに、正確なモデルの欠如に起因した不確実性に加えて、制御の不確実性は、測定値における不正確性、モデル低次元化によって引き起こされる誤差、及び状態特徴における不確実性によってももたらされる可能性がある。

いくつかの実施形態は、種々のモデル予測制御（ＭＰＣ）方法が、モデルのパラメーターが正確に知得されていない場合でも、機械の動特性のモデルを、制御最適化に対する硬制約として用いているという驚くべき認識に基づいている。これらのＭＰＣ方法が時間にわたってモデルの正確性を改善しようと試みる場合であっても、ごく僅かな期間のモデルの不正確性でさえ、機械を望ましくない状態に導くおそれがある。

いくつかの実施形態は、ＭＰＣにおける機械の動特性のモデルは、硬制約ではなく軟制約として用いられるべきであるという理解に基づいている。そのようにして、動特性のモデルを満たす値から逸脱する機械の状態を防ぐ一方で、そのような状態は、モデルのパラメーターが正確に知得される場合、動特性のモデルを満たすことができるという了解において許可することができる。

例えば、通常、機械の動特性のモデルは、機械の動特性の方程式によって表される。そのような方程式は、機械の動特性の方程式を真にする状態に機械を移行させる、機械の動作を制御する制御入力をＭＰＣに生成させる、ＭＰＣ最適化における硬制約として機能する。

いくつかの実施形態は、機械の動特性の方程式を機械の性能を最適化するように機能するＭＰＣのコスト関数に移行させることによって、ＭＰＣに対するそのような硬制約を除去する。例えば、１つの実施形態では、コスト関数は、機械の状態の、ＭＰＣの目的からの逸脱にペナルティを課す、機械の状態の第１の項と、機械の状態の、機械の動特性の方程式を満たす値からの逸脱にペナルティを課す、機械の状態の第２の項とを含む。

これらの項の組み合わせにより、システムの動作の性能と、モデルのパラメーターの不確実性の度合いとの均衡を取ることが可能になる。例えば、モデルの不確実性の値が小さくなる程、コスト関数における第２の項の重みを増加させることが妥当となり得る。不確実性の値が大きくなる程、重みを減少させる動因となる。例えば、１つの実施形態において、コスト関数は、重み付き最小２乗方法を用いて制御入力のシーケンスを探索することにおいて、第１の項の重み及び第２の項の重みの均衡を取る。

いくつかの実施態様において、第２の項は、プロセッサによって実行されるコスト関数の最適化が、機械の動特性の方程式を真にする機械の動特性の方程式の要素を求めることを促すように求められる機械の動特性の方程式の要素を含む。

例えば、機械の動特性の方程式は、空間、例えば、幾何学的空間、制御空間等における状態の時間依存関係を記述する。機械の動特性の方程式は、機械の状態を変数として含む等式の命題である。等式の要素を片側に置くことで、最小最適化又は最大最適化を可能にすることができる。

例えば、機械の動特性の方程式がｘ’＝ｖ（ｘ）である場合、そのような方程式は、ｍａｇｎｉｔｕｄｅ（ｘ’−ｖ（ｘ））＝０と書き換えることができ、ここで、引数の「ｍａｇｎｉｔｕｄｅ」は、その引数の０からの逸脱を求める非負の数である。そのようにして、大きさの項ｍａｇｎｉｔｕｄｅ（ｘ’−ｖ（ｘ））がコスト関数の一部である場合、コスト関数の最小化は、差ｘ’−ｖ（ｘ）の０からの逸脱も最小化し、したがって、機械の動特性の方程式を真にすることを促す。反対に、ＭＰＣ最適化がコスト関数を最大化する場合、機械の動特性の方程式は、−ｍａｇｎｉｔｕｄｅ（ｘ’−ｖ（ｘ））＝０と書き換えることができる。この例では、方程式の要素ｍａｇｎｉｔｕｄｅ（ｘ’−ｖ（ｘ））又は−ｍａｇｎｉｔｕｄｅ（ｘ’−ｖ（ｘ））は、動特性の方程式を、硬制約を形成する方程式ではなく軟制約とみなすことを可能にする。ｍａｇｎｉｔｕｄｅ（ｘ’−ｖ（ｘ））の一例は、（ｘ’−ｖ（ｘ））の絶対値の積分（平方）とすることができる。

いくつかの実施形態は、機械の動特性の方程式が軟制約として用いられる場合、機械の状態に対する追加の軟制約を用いて、不確実性の存在時に制御の正確性を更に改善することができるという理解に基づいている。例えば、いくつかの実施形態は、状態の構造に対する制約及び状態の挙動に対する制約等の軟制約からの状態の逸脱にペナルティを課すＭＰＣのコスト関数における状態の第３の項を含む。そのような軟制約の例は、状態のスパース性に対する制約、状態の対称性に対する制約、状態の安定性に対する制約、状態の平滑性に対する制約、状態の時間における変化率に対する制約を含む。

いくつかの実施形態は、機械の動特性の方程式が軟制約として用いられる場合、種々のデータ同化方法を用いて、制御の正確性を更に改善することができるという理解に基づいている。データ同化は、動特性及び観測値の双方における不確実性を有するシステムの状態を推定するのに用いることができ、ここで、実システムの観測値は、そのシステムの数値モデルのモデル状態に組み込まれる。データ同化の応用は、地球科学の多くの分野、例えば天気予報及び水文学において生じている。

いくつかの実施形態は、データ同化を用いて、ＭＰＣの将来のホライズンの最適化の外の機械の現在の状態を推定することが可能であるという認識に基づいている。しかしながら、いくつかの実施形態は、機械の動特性の方程式が軟制約として用いられる場合、ＭＰＣの将来のホライズン内のデータ同化から借用される方法を用いることが可能であるという理解に基づいている。ＭＰＣ内でのデータ同化の使用は、不確実性及びシステムに関する不完全な情報を解決することに役立ち得るので、データ同化の上に構築される従来のＭＰＣと比較して、より正確でかつロバストな制御決定がもたらされる。

例えば、１つの実施形態では、コスト関数は、時間ホライズン内の状態のデータ同化を実行する第３の項を含むことで、プロセッサが同化された状態に従って機械の状態を移行させる制御入力のシーケンスを生成するようになっている。データ同化はＭＰＣ時間ホライズン内で用いられるので、実施形態は、データ同化に適切なカルマンフィルターの変形を用いてコスト関数を最適化する。カルマンフィルターの変形の例は、古典的カルマンフィルター（ＫＦ）、拡張カルマンフィルター（ＥＫＦ）、無香カルマンフィルター（ＵＫＦ）、アンサンブルカルマンフィルター（ＥｎＫＦ）、アンサンブルカルマンスムーザー（ＥｎＫＳ）、４Ｄ変分モデル（４ＤＶＡＲ）のうちの１つ又は組み合わせを含む。

いくつかの実施形態は、機械の動特性の方程式が軟制約として用いられる場合、その方程式は、厳密である必要がなく、簡略化することができるという別の理解に基づいている。例えば、１つの実施形態では、機械の動特性の方程式は、機械の動特性の厳密な方程式を近似する。

したがって、１つの実施形態は、機械動特性のモデルに従って機械の動作を制御するモデル予測制御（ＭＰＣ）システムであって、ＭＰＣの目的によって規定される第１の項と、機械の状態の、機械の動特性の方程式を満たす値からの逸脱にペナルティを課す第２の項とを含むコスト関数を記憶するメモリと、制約を条件として時間ホライズンにわたってコスト関数を最適化して、この時間ホライズンにわたる機械の状態を制御する制御入力のシーケンスを生成するプロセッサと、シーケンスにおける最初の制御入力に従って機械を制御するコントローラーとを備える、システムを開示する。

別の実施形態は、機械動特性のモデルに従ってモデル予測制御（ＭＰＣ）を用いて機械の動作を制御する方法であって、この方法は、この方法を実施する、記憶された命令と結合されたプロセッサを使用し、命令は、プロセッサによって実行されると、この方法の少なくともいくつかのステップを実行する、方法を開示する。この方法は、ＭＰＣの目的によって規定される第１の項と、機械の状態の、機械の動特性の方程式を満たす値からの逸脱にペナルティを課す第２の項とを含むコスト関数をメモリから索出することと、硬制約を条件として時間ホライズンにわたってコスト関数を最適化して、この時間ホライズンにわたる機械の状態を制御する制御入力のシーケンスを生成することと、シーケンスにおける最初の制御入力に従って機械を制御することとを含む。

更に別の実施形態は、方法を実行するプロセッサによって実行可能なプログラムを具現化した非一時的コンピューター可読記憶媒体を開示する。この方法は、ＭＰＣの目的によって規定される第１の項と、機械の状態の、機械の動特性の方程式を満たす値からの逸脱にペナルティを課す第２の項とを含むコスト関数をメモリから索出することと、硬制約を条件として時間ホライズンにわたってコスト関数を最適化して、この時間ホライズンにわたる機械の状態を制御する制御入力のシーケンスを生成することと、シーケンスにおける最初の制御入力に従って機械を制御することとを含む。

いくつかの実施形態による、機械の動作を制御する制御システムのブロック図である。いくつかの実施形態による、機械の動作を制御するモデル予測制御（ＭＰＣ）システムのブロック図である。いくつかの実施形態によって用いられるコスト関数の概略図である。いくつかの実施形態による、図１及び／又は図２の制御システムのモジュールによって実行される機械の動作を制御する方法のブロック図である。別の実施形態によって用いられるコスト関数の概略図である。いくつかの実施形態による、ＭＰＣの将来のホライズン内でデータ同化を用いる方法のブロック図である。１つの実施形態による、データ同化を用いて変更されたＭＰＣを実施する方法のブロック図である。１つの実施形態によって制御される例示のレーザー加工機械の等角図である。

図１は、いくつかの実施形態による、機械１０２の動作を制御する制御システム１０１のブロック図を示している。制御システム１０１は、機械１０２への制御入力を、モデル予測制御（ＭＰＣ）の原理に従って時間ホライズンにわたるこの機械の動特性のモデルを用いてコスト関数を最適化することによって求める。このために、制御システム１０１は、本明細書において、ＭＰＣシステムと称される。

機械１０２は、その動作が、コマンドに応答して、位置、速度、電流、温度、数値等の量を変化させる装置である。機械の動作は、本明細書において用いられるように、そのような量を変化させる機械の運動を決定する。制御システムは、上記量のうちのいくつかの所望の軌道又は目標点等の機械の所望の運動１０３を受け取り、制御入力１０４を介して機械を制御する。制御入力は、機械の動作のパラメーターを変化させるコマンドを含むこともできるし、機械の運動に影響を与え、結果として、機械の量１０５を生成する電圧、圧力、トルク、力等のパラメーターの実際の値を含むこともできる。

制御システム１０１は、機械に直接又はリモートに接続されたセンサー、ハードウェア、又はソフトウェアから、機械の運動についての情報１０６を受信する。情報１０６は、機械の状態を含む。機械は、制御入力１０４の選択のために、この状態を用いる。情報１０６は、運動量１０５のうちの幾分か又は全てを含むことができるとともに、機械に関する追加情報も含むことができる。この量１０５、制御入力１０４又はこれらの組み合わせを、機械の動作に対する制約１１４に従って、或る所定の範囲内に留めるように要求することができる。

図２は、いくつかの実施形態による、機械の動作を制御するモデル予測制御（ＭＰＣ）システムのブロック図を示している。ＭＰＣシステムは、コスト関数２１２及び制約２１４を記憶するメモリ２２０を含む。また、ＭＰＣシステムは、制約２１４を条件として時間ホライズンにわたってコスト関数２１２を最適化して、時間ホライズンにわたる、機械１０２の状態を制御する制御入力のシーケンスを生成するプロセッサ２３０と、このシーケンス内の最初の制御入力１０４に従って機械を制御するコントローラー２１０とを含む。

いくつかの実施形態は、種々のモデル予測制御（ＭＰＣ）方法が、モデルのパラメーターが正確に知得されていない場合でも、機械の動特性のモデルを、制御最適化に対する硬制約として用いているという驚くべき観測に基づいている。これらのＭＰＣ方法が時間にわたってモデルの正確性を改善しようと試みる場合であっても、モデルの不正確性により、最適制御が現実に存在し得る一方で、機械が望ましくない状態に導かれ得るか、又は、ホライズンにわたるＭＰＣ最適化問題が自己矛盾（実現不能）になり得る。

例えば、通常、機械の動特性のモデルは、機械の動特性の方程式によって表される。動特性の方程式は、機械の動特性の方程式を真にする状態に機械を移行させる、機械の動作を制御する制御入力をＭＰＣに生成させる、ＭＰＣ最適化における硬制約として機能する。いくつかの実施形態は、機械の動特性の方程式を機械の性能を最適化するように機能するＭＰＣのコスト関数に移行させることによって、ＭＰＣに対するそのような硬制約を除去する。

図３は、いくつかの実施形態によって用いられるコスト関数２１２の概略図を示している。コスト関数は、ＭＰＣの目的によって規定される第１の項３１０と、機械の状態の、機械の動特性の方程式を満たす値からの逸脱にペナルティを課す第２の項３２０とを含む。第１の項３１０によって表されるＭＰＣ目的の例は、制御時間の間の、機械の状態の、基準軌道によって規定される値からの逸脱にペナルティを課す項、及び、動作時間及び／又は動作を実行するのに要するエネルギー等の機械の動作のコストを最小化する項を含む。

例えば、第１の項３１０は、最適化、例えば第１の項の最小化

が性能メトリックを最適化、例えば最小化するように、制御入力ｕ（τ）及び性能メトリックｐの関数Ｊ（ｕ，ｐ）を含むことができる。

第２の項３２０は、ＭＰＣ又は機械のモデルが不確実性の少なくとも１つのパラメーターを含むという理解に基づいている。例えば、ロボットのアームのモデルは、物体を搬送するアームの質量に関する不確実性を含み得る。列車の運動のためのモデルは、現在の天候条件における車輪のレールとの摩擦に関する不確実性を含み得る。このために、いくつかの実施形態では、第２の項は、プロセッサによって実行されるコスト関数の最適化が機械の動特性の方程式を真にする機械の状態を求めることを促すように求められる機械の動特性の方程式の要素を含む。そのようにして、機械のモデルは、軟制約として機能し、これは、モデルが不確実性を含む場合に硬制約よりも適している。

いくつかの実施形態では、機械の動特性の方程式は、空間、例えば、幾何学的空間、制御空間等における状態の時間依存関係を記述する。機械の動特性の方程式は、機械の状態を変数として含む等式の命題である。等式の要素を片側に置くことで、最小最適化又は最大最適化を可能にすることができる。

例えば、機械の動特性の方程式がｘ’＝ｖ（ｘ）である場合、そのような方程式は、ｘ’−ｖ（ｘ）＝０と書き換えることができる。差ｘ’−ｖ（ｘ）がコスト関数において現れる場合、コスト関数の最小化は、機械の動特性の方程式を真にすることを促す。しかしながら、コスト関数値は、実数である一方、ｘ’−ｖ（ｘ）は、一般にベクトル関数である。ｍａｇｎｉｔｕｄｅ（ｘ’−ｖ（ｘ））を求めることにより、ベクトル関数の引数ｘ’−ｖ（ｘ）が、原点０からの引数ｘ’−ｖ（ｘ）の逸脱を特徴付ける非負の数ｍａｇｎｉｔｕｄｅ（ｘ’−ｖ（ｘ））に変換される。例えば、ベクトルの大きさは、ベクトルの長さとして求めることができる一方、関数の大きさは、関数の絶対値の積分として求めることができる。

したがって、項ｍａｇｎｉｔｕｄｅ（ｘ’−ｖ（ｘ））を、例えば、最小化すべきコスト関数に単に加算することができる。反対に、ＭＰＣ最適化がコスト関数を最大化する場合、機械の動特性の方程式は、−ｍａｇｎｉｔｕｄｅ（ｘ’−ｖ（ｘ））＝０と書き換えることができ、項ｍａｇｎｉｔｕｄｅ（ｘ’−ｖ（ｘ））を、最大化すべきコスト関数から減算することができる。

この例において、コスト関数における追加の項は、ｍａｇｎｉｔｕｄｅ（ｘ’−ｖ（ｘ））又は−ｍａｇｎｉｔｕｄｅ（ｘ’−ｖ（ｘ））であり、これにより、硬制約を形成する等式ではなく軟制約として動特性の方程式を考慮することが可能になる。

上記で言及した例に従って、コスト関数２１２Ｆは、

を含むことができる。

図４は、いくつかの実施形態による、制御システム１０１のモジュールによって実行される機械の動作を制御する方法のブロック図を示している。方法は、機械動特性のモデルを軟制約として含むコスト関数の最適化に基づいて、機械動特性のモデルを用いて求められる制御入力を用いて機械の動作を制御する。方法は、以前の反復について求められた以前の制御入力を用いて制御することからもたらされた機械の現在状態を求める（４１０）。方法は、メモリから、制御の目的に対する軟制約及び機械動特性のモデルに従うことに対する軟制約を指定するコスト関数の軟制約を索出し（４２０）、メモリから、コスト関数の最適化に対する硬制約を索出する（４３０）。

次に、方法は、コスト関数を最適化することによって、現在の反復における制御のための現在の制御入力を求める（４８０）。例えば、方法は、現在の時点から、少なくとも、予測される将来の機械状態及び入力が硬制約を満たすように新たな機械状態測定値を得る程度の長さである将来の固定の時間量についての将来の入力のシーケンスを求める（４４０）。機械の状態の新たな測定値を得るのに必要な時間量に等しい持続時間の間、入力シーケンスの最初の部分が、機械への現在の制御入力として適用される（４５０）。機械の現在の状態、機械の現在のモデル、及び機械への現在の制御入力に基づいて、機械の次の状態が求められ（４６０）、コントローラーは、新たな状態測定値が受信されるまで待機する（４７０）。

図５は、別の実施形態によって用いられるコスト関数の概略図を示している。この実施形態は、機械の動特性の方程式が軟制約として用いられる場合、機械の状態に対する追加の軟制約５１０を用いて、不確実性の存在時に制御の正確性を更に改善することができるという理解に基づいている。例えば、いくつかの実施形態は、状態の構造に対する制約及び状態の挙動に対する制約等の軟制約からの状態の逸脱にペナルティを課すＭＰＣのコスト関数における状態の第３の項を含む。そのような軟制約の例は、状態のスパース性に対する制約、状態の対称性に対する制約、状態の安定性に対する制約、状態の平滑性に対する制約、状態の時間における変化率に対する制約を含む。

図６は、いくつかの実施形態による、ＭＰＣの将来のホライズン内でデータ同化６１０を用いる方法のブロック図を示している。ＭＰＣ内でのデータ同化の使用は、システムに関する不確実性及び不完全な情報を解決することに役立ち得るので、データ同化の上に構築される従来のＭＰＣと比較して、より正確でかつロバストな制御決定がもたらされる。例えば、いくつかの実施形態では、データ同化６１０は、状態の以前の値に基づいて、時間ホライズン内でモデル１１２に従って機械の動特性の方程式を用いて求められた状態の値を調整する。

いくつかの実施形態は、データ同化を、例えば過去の観測値からの被制御システムの現在の状態の推定に適用することができる（履歴照合）という認識に基づいている。しかしながら、時間ホライズンにわたるＭＰＣ内の状態観測値は、明確には存在しない。なぜならば、このホライズンは、将来のものであるためである。したがって、ＭＰＣの将来のホライズン最適化内でデータ同化方法を用いることは、不可能であり、したがって無意味であるように思われる。

しかしながら、いくつかの実施形態は、将来の状態観測値が追加の特徴に置き換えられる場合、データ同化が制御を決定するためにＭＰＣ内で有益であり得るという認識に基づいている。これらの追加の特徴は、状態の構造、例えば状態の所望の対称性を含むことができ、ここで、状態の対称性は、オフラインで求められ、対称性のタイプ及びパラメーターは、コントローラーのメモリに記憶される。このために、いくつかの実施態様において、データ同化６１０は、状態の構造及び／又は状態の挙動に対する軟制約６２０を課すことによって状態の値を調整することができる。

例えば、状態の対称性のタイプは、時間において周期的とすることができ、ここで、この場合における対称性のパラメーターは、期間の長さである。状態は、空間においてその対称性を呈す場合もあり、例えば、状態のベクトルは、任意の時間について対称的とすることができ、例えば２０個の成分を有する状態ベクトルについて、第１の１０個の成分は、第２の１０個の成分と同じものであると知得することができる。状態は、時間において変化するので、対称表面、例えば球面に属するものであると知得することもでき、ここで、この場合における対称性のパラメーターである、球面の中心及び半径は、事前に知得されており、コントローラーのメモリに記憶される。

いくつかの実施形態は、未知の将来の状態測定値の代替とするために、状態の既知のスパース性をデータ同化において用いることができるという別の認識に基づいている。スパース性は、オフラインで求められ、スパース性のパターン及びパラメーターは、コントローラーのメモリに記憶される。例えば、状態のベクトルは、スパースである、すなわち、ベクトル内の特定のインデックスで０になる複数の成分を有するものとすることができ、ここで、インデックスは、スパース性のパターンを表し、一方で、インデックスの総数が、スパース性のパラメーターとして見られる。

付加的に又は代替的に、いくつかの実施形態は、データ同化における将来の状態観測値を、状態が保存則を満たすこと、状態が時間において平滑であること、状態が状態推定器の既知のモデルと一貫していること、状態が所与のプロファイルを追跡、追従すること、状態安定性、状態限界性、のうちの１つ又は組み合わせによって、所望の状態挙動を記述する状態の特性に置き換える。保存則は、例えば、ＭＰＣのいくつかの応用における状態の質量保存とすることができる。例えば、時間及び空間における状態の導関数のうちの１つ又は組み合わせを要求する状態の平滑性は、平滑性の所与の許容誤差による絶対値によって限界が規定され、ここで、導関数の次数及び第１の許容誤差の値は、コントローラーメモリに記憶される。

いくつかの実施形態は、状態の安定性及び限界性のうちの一方又は組み合わせも、ＭＰＣ内のデータ同化において、将来のホライズンにわたる状態の利用不能な測定値に対する代替として機能することができるという別の認識に基づいている。状態の安定性は、コントローラーのメモリに記憶された、モデルにおける変化に対する状態における変化の限界を規定する安定性のパラメーターを用いて規定することができる。

代替的に又は付加的に、いくつかの実施形態は、制御の以下の特性のうちの１つ又は組み合わせを用いて所望の状態挙動の関数をオフラインで求め、ここで、制御は、制御の所与のプロファイルを追跡し、制御は、平滑であり、時間において安定しており、時間において限界を規定される。制御の特性を用いて求められる、状態の特性の関数の係数は、コントローラーのメモリに記憶される。

本発明のいくつかの実施形態によれば、システムのＭＰＣのコスト関数は、システムの状態のデータ同化の関数を用いて変更され、ここで、データ同化の関数は、状態の動特性からの状態の逸脱にペナルティを課し、したがって、システムのモデルにおける状態の動特性の方程式を緩和する。付加的に、システムのＭＰＣのコスト関数は、状態の構造及び状態の挙動のうちの一方又は組み合わせの関数を用いて変更され、この関数は、通常、状態の動特性の方程式及び種々の制約のみを含むシステムのモデルに加えて与えられる。ＭＰＣ制御解に対する変更の影響は、コスト関数における軟制約として機能するものとして説明することができ、被制御システムを或る状態に移行させる各制御入力は、例えば、状態の構造及び／又は状態の挙動からの状態の逸脱についてペナルティを課されるようになっている。そのようにして、時間ホライズンにわたる全ての制御入力は、システムのモデルにおける不確実性に対処するために状態同化を共同で実行する。

図７は、１つの実施形態による、データ同化を用いて変更されたＭＰＣを実施する方法７０１のブロック図を示している。ＭＰＣのコスト関数は、システム動特性の項が、モデルシステム動特性からの逸脱に対するペナルティ適用と、状態の構造及び挙動からの状態の逸脱に対するペナルティ適用との双方を含むデータ同化の項に置き換わるように変更される。ペナルティ適用項によって求められるデータ同化問題の最適解は、将来の時間ホライズンにわたる予測状態を与え、この予測状態は、ひいては制御入力のシーケンスを生成するのに用いられる。このシーケンスからの最初の制御入力は、現在のシステム状態における制御入力として用いられる。

方法７０１は、現在の状態７０３の測定値及び／又は推定値と、制御の以前の時間ステップについてのホライズン時間にわたる状態、制御、及びデータの値７１０とに基づいてシステムを制御する、制御信号７１１を生成するオンライン制御ステップを実行する。方法は、状態に対する軟（不確実性）制約７０５を同化することによって不確実性を許容して、システムのモデルに従って将来のホライズン時間における予測状態７２５を求め（７２０）、その後、必要な最適性条件に従ってホライズン時間における解ベクトル７５５を求める（７５０）。解ベクトルが求められた後、方法は、制御信号７１１を生成して、ホライズン時間にわたる状態、制御及びデータの値を更新する（７６０）。更新された値は、制御の次の時間ステップにおいて方法によって使用される。

いくつかの実施形態は、機械の動特性の方程式が軟制約として用いられる場合、その方程式は、厳密である必要がなく、簡略化することができるという別の理解に基づいている。例えば、１つの実施形態では、機械の動特性の方程式は、機械の動特性の厳密な方程式を近似する。例えば、１つの実施形態は、システムの状態の動特性の近似方程式を用いて変更されたＭＰＣのコスト関数を用いる。ここで、近似方程式は、システムの状態の動特性の厳密な方程式に適用される、モデル低次元化によって求められる。

例示の実施形態
１つの例示の実施形態では、ＭＰＣは、ホライズン［ｔ，ｔ＋Ｔ］に対して予測モデルを解くことによって現在の制御入力ｕ（ｔ）を求める。全体的な枠組みの開始点として、この実施形態は、予測モデルの変更された変形を検討する。ここで、制御ｕ（τ）及びパラメーターベクトルｐは、性能インデックスＪ（ｕ，ｐ）を最小化する。すなわち、

であり、ここで、

であるが、ただし、不確実性モデル動特性

、状態に対する不確実性制約

、及び確実性制約

を条件とする。

時間依存微分方程式（１）の初期値ｘ（τ）｜_τ＝ｔは、動特性システムの現在の状態ベクトルｘ（ｔ）である。予測問題を解く制御ベクトルｕ＝ｕ（τ）は、時点ｔにおいて動特性システムを制御するための入力として用いられる。ベクトルｐ（ｔ）の成分は、システムのパラメーターである。非線形方程式（１）は、予測に用いられるモデルシステム動特性を記述する。時変擾乱η_ｆ及びη_ｇがランダム性を有する場合、共分散行列Ｃ_ｆ及びＣ_ｇが利用可能である。

元のコスト関数である性能インデックスＪ（ｕ，ｐ）の最小化の補足として、擾乱ベクトルη_ｆ及びη_ｇは、ホライズンにわたる適切解ｘ（τ）を選ぶことによる４ＤＶａｒ／ＭＨＥ最小化項を用いる本発明のいくつかの実施形態に従って最小化される。

ここで、

は、重み行列Ｃ^−１を有するＬ_２ノルムである。以下の記載を通じて、ノルムについて慣習的ではない表記を用いる。例えば、ＰｆＰは、実際にはｆのノルムを意味し、これは一般的には｜｜ｆ｜｜によって示される。本発明者らによるテスト例において、Ｃ_ｆ＝α^−１Ｉ
及びＣ_ｇ＝β^−１Ｉの形の共分散行列を用いる。ただしα＝１であり、適切なスカラーはβ＞０であり、Ｉは恒等行列である。

本発明の一実施形態によれば、元のコスト関数である性能インデックスＪ（ｕ，ｐ）に４ＤＶａｒ／ＭＨＥ最小化項を加算することによって動特性の方程式が緩和される。本発明の一実施形態によれば、交互方向乗数法（ＡＤＭＭ：alternating direction method of multipliers）又は交互最小化アルゴリズム（ＡＭＡ：Alternating Minimization Algorithm）によって、変更されるコスト関数の最小化を実行することができ、ここで、これらは、制御及び擾乱の最小化を繰り返し交互に行う。ホライズンにわたる解は、４ＤＶａｒ／ＭＨＥモデルにおける自由選択とは対照的に、固定の初期値ｘ（ｔ）を有することに留意されたい。

上記で言及したホライズン予測問題の連続定式化は、サイズΔτのＮ個の等しい時間ステップに分割されたホライズン［ｔ，ｔ＋Ｔ］にわたる均一時間グリッド上で離散化することができ、時間連続ベクトル関数ｘ（τ）及びｕ（τ）は、グリッド点τ_ｉ、ｉ＝０，１，．．．，Ｎにおいてサンプリングされ、それぞれインデックス付けされた値ｘ_ｉ及びｕ_ｉによって示される。ホライズンにわたる性能コストＪの積分は、矩形直交規則を用いて近似される。状態ベクトルの時間微分は、前方差分公式（forward difference formula）によって近似される。

ＮＭＰＣ定式化のためにオイラー方程式を導出する前に、この実施形態は、４ＤＶａｒモデルを固定のｘ_０を用いて離散化する。

更なる利便性のため、この実施形態は、ブロック対角行列

及び、ベクトル

を導入する。

この表記において、離散化された４ＤＶａｒ問題は、以下の形を取る。

ベクトルＧ及びＲのｘに対する勾配は、

に等しい。

したがって、４ＤＶａｒの解ｘ_ｉ、ｉ＝１，．．．Ｎは、以下の方程式を満たす。

したがって、離散化された最適制御問題ＮＭＰＣは、以下のように定式化される。

ただし、ｘ_ｉについてのシステム（６）及び等式制約

を条件とする。

離散化されたホライズン問題について必要な最適性条件は、離散ラグランジュ関数

を用いて導出することができ、ここで、変数は、２つのより大きなベクトルＸ＝［ｘ_ｉ λ_ｉ］^Ｔ、ｉ＝０，１，．．．，Ｎ及びＵ＝［ｕ_ｉ μ_ｉｖｐ］^Ｔ（ｉ＝０，１，．．．，Ｎ−１）内のものである。ここで、

は、共状態ベクトルであり、μは、制約（７）と関連付けられたラグランジュ乗数ベクトルである。終端制約（８）は、ラグランジュ乗数ｖの支援により緩和される。

ラグランジュ関数Ｌの導関数を計算することにより、必要な最適性条件であるカルーシュ−クーン−タッカー（ＫＫＴ：Karush-Kuhn-Tucker）静止条件が以下のように得られる。

例えば、１つの実施態様は、さらに、ＫＫＴ条件を非線形方程式Ｆ［Ｕ，ｘ，ｔ］＝０に変換し、ここで、ベクトルＵは、制御入力ｕ、ラグランジュ乗数μ、ラグランジュ乗数ｖ、及びパラメーターｐを、全て１つのベクトル内に組み合わせる。

Ｆ［Ｕ，ｘ，ｔ］におけるベクトル引数ｘは、現在の測定又は推定された状態ベクトルであり、これは、以降の手順において初期ベクトルＸ_０として機能し、これにより、状態変数ｘ_ｉ及び共状態変数λ_ｉが消去される。

測定又は推定される現在状態ｘ_０を有する１つの実施形態は、前方オイラー法ｘ_ｉ＋１＝ｘ_ｉ＋ｆ（τ_ｉ，ｘ_ｉ，ｕ_ｉ，ｐ）Δτの代わりに方程式（６）を解くことによってｘ_ｉ、ｉ＝１，２．．．，Ｎを計算する。次に、連立線形方程式

から共状態λ_ｉ、ｉ＝Ｎ，Ｎ−１，．．．，１を計算する。

値λ_Ｎは、ｘに対する項ｖ^Ｔψ（ｘ_Ｎ，ｐ）の微分によって規定される。

次に、この実施形態は、得られたばかりのｘ_ｉ及びλ_ｉを用いてＦ［Ｕ，ｘ，ｔ］を計算する。

未知のベクトルＵ（ｔ）に対する方程式

は、要求される必要な最適性条件を与える。

いくつかの実施形態は、均一な時間グリッドｔ_ｊ＝ｊΔｔ、ｊ＝０，１，．．．上でＭＰＣを用いて制御される動特性システムを使用し、ｘ_ｊ＝ｘ（ｔ_ｊ）を示す。これらの実施形態では、方程式（９）は、コントローラーボード上にてオンラインで各時間ステップｔ_ｊにおいて解く必要があり、これは、ＮＭＰＣ実施態様の困難な部分である。

未知の変数Ｕ_ｊ＝Ｕ（ｔ_ｊ）に対する非線形方程式Ｆ［Ｕ_ｊ，ｘ_ｊ，ｔ_ｊ］＝０は、以下の方程式

に等しく、ここで、

である。

時間ステップΔｔ及びΔτとは一般的に異なる小さなスカラーｈ＞０を用いて、前方微分演算

を導入し、これは、方向Ｖに沿って導関数Ｆ_Ｕ［Ｕ_ｊ−１，ｘ_ｊ，ｔ_ｊ］（Ｖ）を近似する。方程式Ｆ［Ｕ_ｊ，ｘ_ｊ，ｔ_ｊ］＝０は、演算方程式ａ_ｊ（ΔＵ_ｊ／ｈ）＝ｂ_ｊ／ｈに等しく、ここで、ΔＵ_ｊ＝Ｕ_ｊ−Ｕ_ｊ−１である。

定式Ａ_ｊｅ_ｋ＝ａ_ｊ（ｅ_ｋ）によって規定される列Ａ_ｊｅ_ｋ、ｋ＝１，．．．，ｍを有するｍ×ｍ行列Ａ_ｊを導入する。ここで、ｍは、ベクトルＵの次元であり、ｅ_ｋは、ｍ×ｍ恒等行列の第ｋの列を示す。行列Ａ_ｊは、ヤコブ行列Ｆ_Ｕ［Ｕ_ｊ−１，ｘ_ｊ，ｔ_ｊ］のＯ（ｈ）近似である。ヤコブ行列Ｆ_Ｕは、対称であり、すなわち、ヤコブ行列Ｆ_Ｕ［Ｕ，ｘ，ｔ］は、全てのＵ、ｘ、及びｔについて対称である。

方程式Ｆ［Ｕ_０，ｘ_０，ｔ_０］＝０に対する近似解Ｕ_０が利用可能であると仮定する。十分に正確な近似Ｕ_０を見つけることは、ニュートン法のような（Newton-like）方法及び探索の成功に極めて重要である。というのも、これは、通常困難な演算であるためである。

Ｕ_０の最初のブロックエントリは、状態ｘ_０において入力制御ｕ_０として取り込まれる。次の状態ｘ_１＝ｘ（ｔ_１）は、センサーによって推定されるか、又は定式ｘ_１＝ｘ_０＋ｆ（ｔ_０，ｘ_０，ｕ_０）Δｔによって計算される。（１）を参照されたい。時点ｔ_ｊ、ｊ＞１において、状態ｘ_ｊ及び以前の時点ｔ_ｊ−１からのベクトルＵ_ｊ−１を有する。本発明者らの目的は、Ｖに対して以下の方程式を解くことである。

次に、ΔＵ_ｊ＝ｈＶ、Ｕ_ｊ＝Ｕ_ｊ−１＋ΔＵ_ｊを設定し、制御ｕ_ｊとしてＵ_ｊの最初のブロック成分を選ぶ。次のシステム状態ｘ_ｊ＋１＝Ｘ（ｔ_ｊ＋１）は、センサーによって推定されるか、又は定式ｘ_ｊ＋１＝Ｘ_ｊ＋ｆ（ｔ_ｊ，ｘ_ｊ，ｕ_ｊ）Δｔによって計算される。

演算方程式（１３）を解く直接的な方法は、明示的に行列Ａ_ｊを形成し、その後、例えばガウスの消去法によって連立線形方程式Ａ_ｊΔＵ_ｊ＝ｂ_ｊを解くことである。より高速の代替方法は、ＧＭＲＥＳ反復法によって（１３）を解くことである。ここで、演算子ａ_ｊ（Ｖ）は、行列Ａ_ｊの明示的な構築を伴うことなく用いられる。

１つの実施形態は、Ｒ^３における単位２次元球面にわたる初期状態ｘ_０から終端状態ｘ_ｆへの最小時間運動を数値的に計算する。すなわち、システム動特性は、連立常微分方程式

によって統御され、ここで、制御入力ｕは、不等式制約｜ｕ−ｃ｜≦ｒを条件とし、この不等式制約は、等式制約

を用いて緩和する。

変数ｕ_ｄは、仮想のものであり、以下で導入されるスカラーｗ_ｄによって制御される。コスト関数は、

であり、ここでｐ＝ｔ_ｆ−ｔは、目的地に至るまでの時間であり、ｗ_ｄは、小さい正の定数である。

この実施形態は、間隔［ｔ，ｔ_ｆ］と一致する後退ホライズンを選択する。ホライズンは、線形マッピングτ→ｔ＋τｐを用いて無次元時間τ∈［０，１］によってパラメーター化される。この正規化された間隔［０，１］は、ステップサイズΔτ＝１／Ｎを有するグリッドτ_ｉ＝ｉΔτ、ｉ＝０，１，．．．，Ｎに均一に分割される。この離散化された変数は、状態ｘ_ｉ及び共状態λ_ｉ、制御入力ｕ_ｉ及びスラック変数ｕ_ｄ，ｉ、ラグランジュ乗数μ_ｉ及びｖ、パラメーターｐを含む。

後退ホライズンに対する動的システムの不確実性予測モデルは、前方オイラー法

であり、ここで、

である。オイラー法の打ち切り誤差は、（１）における擾乱η_ｆである。とりわけ、η_ｆは、ここでは乱数ではなく、状態関数ｘ（τ）と極めて相関している。連続システム動特性

が状態に対する等式制約

を満たすことが直接的に検証される。したがって、制約（４）は、

及びη_ｇ＝０を有する。４ＤＶａｒ近似は、制約（４）を「ソフトに」満たすように設計される。この問題について、オイラー法の各ステップの後に単位球面上にｘ_ｉ＋１を写像することによって状態制約

を厳密に満たすことが可能であることに留意されたい。

等式制約

を満たすための更なる別の方法は、いわゆる指数積分（exponential integrator）

を用いることであり、これにより、ノルムＰｘ_ｊＰ_２が保存される。テスト例について、この指数積分を、システム動特性の数値シミュレーションのために用いる。

離散化されたコスト関数は、

である。１つの実施態様は、固定の初期値ｘ_０及びスカラーパラメーターβ≧０を条件として、状態ｘ_ｉの４ＤＶａｒ近似を選択する。

パラメーターβは、等式制約

を満たす強制力を決定する。すなわち、定数βが大きいほど、強制が強くなる。

いくつかの実施形態によれば、４ＤＶａｒ最適化問題は、以下の連立非線形方程式に等しい。

ここで、

である。

対応する離散ラグランジュ関数は、以下の形態を有する。

共状態λは、式

を満たし、ここで、Ｃは、ブロック

を有するブロック対角行列であり、すなわち、

である。関数Ｆ（Ｕ，ｘ_０，ｔ）、ただし、

は、上から下まで、以下の行を有する。

いくつかの実施形態は、システム動特性から導出される状態制約を有する問題を検討する。これらの実施形態は、終端制約の数を、状態に対する等式制約によって求められる滑らかな多様体の次元に削減する。例えば、或る場合、球面の次元が２に等しく、したがって、ラグランジュ乗数ｖは、３つではなく２つのみの成分を含む。上記に記載された終端制約の削減が満たされない場合、後続の計算により、ニュートンタイプの反復における特異ヤコビ行列がもたらされる。

レーザー加工機械
いくつかの実施形態は、冗長レーザー加工機械の動作を制御するシステム及び方法を提供する。いくつかの実施形態は、追跡誤差の限界によって規定された誤差で基準軌道を追跡する実現可能性を保証する制約を条件として、最適化に基づく後退ホライズン制御を用いて機械を制御する。後退ホライズン制御の非限定的な一例は、モデル予測制御（ＭＰＣ）である。

図８は、一発明の１つの実施形態による一例示のレーザー加工機械の等角図を示している。レーザー加工機械は、例示の目的で示されており、この機械の設計は、本発明の範囲を制限するものとは意図されていない。レーザー加工機械は、低速アクチュエーター及び高速アクチュエーターを備え、これらの例が以下で提供される。

ワーク８００は、ガントリー８２０の下のビームダンプ８１０上で支持される。ガントリーは、第１の方向に沿って、例えば、Ｙ軸に沿ってレール８２５及び８２６上を移動する。ガントリー８２０は、第１のサーボモーター及び第１のスクリュー８２３によって第１の方向に沿って移動される。ガントリー８２０上にはプラットフォーム８３０が配置され、このプラットフォームは、第１の方向に沿ってガントリーとともに移動する。また、プラットフォーム８３０は、第２のサーボモーター及び第２のスクリュー８３５によって第２の方向に沿って、例えば、Ｘ軸に沿って移動される。この実施形態では、ガントリー８２０と、第１のサーボモーター及び第１のスクリュー８２３と、第２のサーボモーター及び第２のスクリュー８３５とは、プラットフォームを、ワークに対して平行な面において、第１の方向及び第２の方向に沿って移動させる運動システムを形成する。しかしながら、本発明の他の実施形態は、異なるタイプの直動関節を用いてプラットフォームを移動させる。例えば、第１の直動関節は、第１の方向の線形駆動モーターを備えることができ、第２の直動関節は、第２の方向の線形駆動モーターを備えることができる。

プラットフォーム８３０上には、ガルバノアセンブリ、例えば２つの直交ガルバノドライブ、すなわち第１のドライブ８４０及び第２のドライブ８４５、第１のミラー８４１及び第２のミラー８４６を有する２軸ガルバノスキャンヘッドが配置される。第１のドライバー８４０によって引き起こされる第１のミラー８４１の第３の運動は、第３の方向に沿ってレーザービームを位置決めし、第２のドライバー８４５によって引き起こされる第２のミラー８４６の第４の運動は、第４の方向に沿ってレーザービームを位置決めする。

本明細書の関連において、ガントリー８２０は、広い動作範囲を有する第１のアクチュエーター、すなわち低速アクチュエーターであり、ガルバノアセンブリは、より狭小な動作範囲を有する第２のアクチュエーター、すなわち高速アクチュエーターである。しかしながら、そのような使用は、特許請求の範囲の適用範囲を制限するものとは意図されない。例えば、いくつかの変形形態では、第１のアクチュエーターが高速アクチュエーターであり、第２のアクチュエーターが低速アクチュエーターである。

種々の実施形態において、ガルバノアセンブリは、第３の方向が第１の方向に対して固定されるとともに、第４の方向が第２の方向に対して固定されるように、プラットフォーム上に配置される。例えば、１つの実施形態では、第１の方向は、第３の方向と一致するとともに、第２の方向は、第４の方向と一致する。別の実施形態では、第１の方向は、第３の方向と４５度の角度をなすとともに、第２の方向は、第４の方向と４５度の角度をなす。

ガルバノアセンブリは、運動の方向を固定するために、プラットフォームに取り付けることができる。代替的に、ガルバノアセンブリは、第１の方向、第２の方向、第３の方向、及び第４の方向の相互配向を、レーザー加工機械の動作前又は動作中に固定することができるように、プラットフォーム上に回転可能に配置することができる。本発明の関連において、ガルバノアセンブリは、狭小な動作範囲を有する第２の段、すなわち高速段である。

レーザー加工機械は、切断レーザービーム８６０を、光ファイバー８７０及びコリメーター８７５を介してガルバノアセンブリの第１のミラー８４１及び第２のミラー８４６に方向付けるレーザー８５０を備えることができる。代替的な実施形態では、レーザービームは、Ｙガントリー及びＸ軸プラットフォームに沿って移動する対角ミラーを介してガルバノアセンブリに方向付けられる。しかしながら、他の変形形態も可能である。

コリメートされた切断レーザービーム８６０は、ミラーによって、このレーザービームをワーク上で集束させる集束モジュール８８０を通して方向付けされ、これにより、ワーク８００上に組み合わされたＸ軸及びＹ軸のガルバノアセンブリスキャンエリア８６５が生成され、ワーク８００が切断される。集束モジュール８８０の一例は、フィールド平坦化Ｆθレンズ又は非テレセントリックＦθレンズである。ワーク８００のサイズは、プラットフォームの運動に起因して、ガルバノスキャンエリア８６５よりも大きいものとすることができる。

いくつかの実施形態では、制御モジュールは、コンピューター数値制御（ＣＮＣ）コントローラー８９５を備える。他の実施形態は、異なるタイプのコントローラーを用いることができる。制御モジュールは、レーザービームの位置の軌道を規定する、予め計算されたＧコード８９０に従って運動システム及びガルバノアセンブリを制御することができるか、又は、機械をどのように制御するかを判断するための計算を実行することができる。例えば、計算は、Ｘ軸プラットフォーム８３０、Ｙ軸ガントリー、Ｘ運動ガルバノアセンブリ及びミラー８４１、並びにＹ運動ガルバノアセンブリ及びミラー８４６のための連続位置を規定することができる。

一般に、機械は、異なる動特性挙動を有するアクチュエーターを備えて構築される。例えば、第１のアクチュエーターは、通常、変位質量の差に起因して、第２のアクチュエーターよりも大幅に低速である。この差から、低速アクチュエーター及び高速アクチュエーターという示されてきた名称が取られている。

１つの実施形態は、低速アクチュエーターの動特性を、以下のようにモデル化する。

ここで、ｐは、低速アクチュエーターの位置であり、ｖは、低速アクチュエーターの速度であり、τは、低速アクチュエーターのトルクであり、Ｔ_ｓは、一制御サイクルが実行される機械の制御期間であり、ｋは、制御サイクルのインデックスであり、Ｊは、低速アクチュエーターの慣性であり、Ｌは、長手方向運動を線形運動に変換するボールスクリューのピッチ長であり、βは、低速アクチュエーターの所与の角速度について低速アクチュエーターにかかる摩擦トルクを求める摩擦係数である。

本発明の実施形態によれば、動特性の方程式のうちの一方又は双方は、元のコスト関数に対応する差の大きさを加算することによって緩和することができる。例えば、第１の方程式

は、まず、

と書き換えることができ、次に、

と書き換えることができる。ここで、「ｍａｇｎｉｔｕｄｅ」は、例えば、ベクトルノルム（２ノルム等）とすることができ、平方することができる。したがって、動特性の第１の元の方程式ｐ（ｋ＋１）＝ｐ（ｋ）＋Ｔ_ｓｖ（ｋ）は、ドロップされ、追加の項ｍａｇｎｉｔｕｄｅ（ｐ（ｋ＋１）−ｐ（ｋ）−Ｔ_ｓｖ（ｋ））が元のコスト関数に加算される。結果として、動特性の第１の元の方程式ｐ（ｋ＋１）＝ｐ（ｋ）＋Ｔ_ｓｖ（ｋ）は、真であることが促されるものの、変更されたコスト関数のＭＰＣ最小化において違反することができる。動特性の第１の元の方程式ｐ（ｋ＋１）＝ｐ（ｋ）＋Ｔ_ｓｖ（ｋ）におけるパラメーターＴ_ｓが不確実である場合、これは有益であり得る。

一般に、パラメーターｐ、ｖ、ｔは、ｘ座標及びｙ座標を有する２次元ベクトルであり、以下の制約を受ける。

これらの制約は、位置ｐ、速度ｖ、加速度ａ、及びトルクτに対する下限及び上限を規定し、本発明のいくつかの実施形態によれば、硬制約として保持され得る。

１つの実施形態は、低速アクチュエーターのモデルを、線形微分方程式

として表現し、ここで、ｋは、信号がサンプリングされる時点、すなわち制御サイクルのインデックスであり、ｕは、機械入力であり、ｙは、機械出力であり、ｘは、機械の状態であり、Ａ、Ｂ、Ｃは、モデルのパラメーターである。例えば、ｘ＝［ｐ，ｖ］’、ｙ＝ｐ、ｕ＝τであり、Ａ、Ｂ、Ｃは、適切な次元からなる行列であり、低速アクチュエーターの動作は、線形制約

を受ける。ここで、Ｘ、Ｕは、多面体集合である。

本発明の他の実施形態によれば、動特性の方程式のうちの一方又は双方は、元のコスト関数に対応する差の大きさを加算することによって緩和することができる。例えば、第１の方程式

は、まず、

と書き換えることができ、次に、

と書き換えることができる。ここで、「ｍａｇｎｉｔｕｄｅ」は、例えば、ベクトルノルム（２ノルム等）であり、平方することができ、すなわち、ｍａｇｎｉｔｕｄｅ（ｘ（ｋ＋１）−Ａｘ（ｋ）−Ｂｕ（ｋ））＝｜｜ｘ（ｋ＋１）−Ａｘ（ｋ）−Ｂｕ（ｋ）｜｜^２である。したがって、動特性の第１の元の方程式ｘ（ｋ＋１）＝Ａｘ（ｋ）＋Ｂｕ（ｋ）は、ドロップされ、全てのｋについて追加の項ｍａｇｎｉｔｕｄｅ（ｘ（ｋ＋１）−Ａｘ（ｋ）−Ｂｕ（ｋ））が元のコスト関数に加算される。結果として、動特性の第１の元の方程式ｘ（ｋ＋１）＝Ａｘ（ｋ）＋Ｂｕ（ｋ）は、真であることが促されるものの、変更されたコスト関数のＭＰＣ最小化において違反することができる。動特性の第１の元の方程式ｘ（ｋ＋１）＝Ａｘ（ｋ）＋Ｂｕ（ｋ）における行列Ａ及びＢのうちの少なくとも一方が不確実である場合、これは、有益であり得る。付加的に又は代替的に、動特性の第１の元の方程式ｘ（ｋ＋１）＝Ａｘ（ｋ）＋Ｂｕ（ｋ）が、例えば、リアルタイムでの非線形最小化の非実用的な計算コストに起因してＭＰＣにおいて直接用いることができないより正確な動特性の非線形方程式ｘ（ｋ＋１）＝Ｆ（ｘ（ｋ），ｕ（ｋ））を近似するため、近似的にのみ保たれていることが既知である場合、この緩和は有益であり得る。

動特性の第２の方程式ｙ（ｋ）＝Ｃｘ（ｋ）は、ホライズンにわたるリアルタイムＭＰＣ最適化において最小化されるべき元のコスト関数に追加の項ｍａｇｎｉｔｕｄｅ（ｙ（ｋ）−Ｃｘ（ｋ））を加算することに置き換えられることで、同様に付加的に又は代替的に緩和することができる。

本発明のいくつかの実施形態は、動特性の方程式を単に緩和することにより、ＭＰＣ最適化問題の最適制御解が、緩和されているものの動特性の元の方程式を厳密に満たさない状態に対して得られるという状況がもたらされ得るという理解に基づいている。そのような些細なシナリオは望ましくない可能性があり、本発明のいくつかの実施形態では、制御及び状態のうちの一方又は組み合わせの所望の挙動及び構造の一方又は組み合わせを記述するコスト関数において追加の項を含めることによって回避することができる。レーザーカッターの例において、追加の項は、例えば、低速アクチュエーターの加速度にペナルティを課すことができ、ここで、コスト関数における追加の項は、加速度が所与の上限によって既に硬制約を受けているにもかかわらず、加速度ａの｜ａ｜^２の大きさとなる。

本発明のいくつかの実施形態は、交互方向乗数法（ＡＤＭＭ）又は交互最小化アルゴリズム（ＡＭＡ）を用いて、追加の項を用いて変更されたコスト関数を最小化することを提案し、ここで、制御のための最小化及び状態のための最小化が繰り返し交互に行われる。例えば、元のコスト関数をＪ（ｕ，ｘ，ｙ）とし、第１の追加の項をα｜｜ｙ−Ｃｘ｜｜^２とし、全てのｋについてｙ（ｋ）＝Ｃｘ（ｋ）を促し、第２の追加の項をβ｜｜ｘ｜｜^２とし、ｘが小さいものであることを促す。その場合、変更された最小２乗コスト関数は、

である。

全ての変数に対してともに最小化するのではなく、制御ｕのための最小化並びに状態ｘ及び観測値ｙのための最小化を繰り返し交互に行うことができ、これは、場合によっては計算的に有利となる。

本発明の上記で説明した実施形態は、数多くの方法のうちの任意のもので実施することができる。例えば、これらの実施形態は、ハードウェア、ソフトウェア、又はそれらの組み合わせを用いて実施することができる。ソフトウェアで実施されるとき、ソフトウェアコードは、単一のコンピューターに設けられるか又は複数のコンピューター間に分散されるかを問わず、任意の適したプロセッサ又はプロセッサの集合体上で実行することができる。そのようなプロセッサは、集積回路コンポーネントに１つ以上のプロセッサを有する集積回路として実施することができる。ただし、プロセッサは、任意の適した形式の回路部を用いて実施することができる。

さらに、コンピューターは、ラックマウントコンピューター、デスクトップコンピューター、ラップトップコンピューター、ミニコンピューター、又はタブレットコンピューター等の複数の形態のうちの任意のもので具現化することができることが理解されるべきである。そのようなコンピューターは、エンタープライズネットワーク又はインターネット等のローカルエリアネットワーク又はワイドエリアネットワークを含む１つ以上のネットワークによって任意の適した形態に相互接続することができる。そのようなネットワークは、任意の適した技術に基づくことができ、任意の適したプロトコルに従って動作することができ、無線ネットワーク、有線ネットワーク、又は光ファイバーネットワークを含むことができる。

また、本明細書において略述した様々な方法又はプロセスは、様々なオペレーティングシステム又はプラットフォームのうちの任意の１つを用いる１つ以上のプロセッサ上で実行可能なソフトウェアとしてコード化することもできる。加えて、そのようなソフトウェアは、複数の適したプログラミング言語及び／又はプログラミングツール若しくはスクリプティングツールのうちの任意のものを用いて記述することができる。

また、本発明の実施形態は、方法として具現化することもできる。この方法の一例が提供されている。この方法の一部として実行されるステップは、任意の適した方法で順序付けることができる。したがって、例示されたものと異なる順序で動作が実行される実施形態を構築することができ、これらの実施形態は、いくつかの動作を、例示の実施形態では順次的な作用として示されていても同時に実行することを含むことができる。

Claims

機械動特性のモデルに従って機械の動作を制御するモデル予測制御（ＭＰＣ）システムであって、
前記ＭＰＣの目的によって規定される第１の項と、前記機械の状態の、前記機械の動特性の方程式を満たす値からの逸脱にペナルティを課す第２の項とを含むコスト関数を記憶するメモリと、
制約を条件として時間ホライズンにわたって前記コスト関数を最適化して、該時間ホライズンにわたる前記機械の前記状態を制御する制御入力のシーケンスを生成するプロセッサと、
前記シーケンスにおける最初の前記制御入力に従って前記機械を制御するコントローラーと、
を備える、システム。
前記第２の項は、前記プロセッサによって実行される前記コスト関数の前記最適化が、前記機械の動特性の前記方程式を真にする前記機械の前記状態を求めることを促すように求められる前記機械の動特性の前記方程式の要素を含む、請求項１に記載のシステム。
前記コスト関数は、前記状態の、軟制約からの逸脱にペナルティを課す前記状態の第３の項を含む、請求項１に記載のシステム。
前記軟制約は、前記状態の構造に対する制約、及び前記状態の挙動に対する制約のうちの一方又は組み合わせを含む、請求項３に記載のシステム。
前記軟制約は、前記状態のスパース性に対する制約、前記状態の対称性に対する制約、前記状態の安定性に対する制約、前記状態の平滑性に対する制約、前記状態の時間における変化率に対する制約のうちの１つ又は組み合わせを含む、請求項３に記載のシステム。
前記コスト関数は、前記時間ホライズン内の前記状態のデータ同化を実行する第３の項を含むことで、前記プロセッサが前記同化された状態に従って前記機械の前記状態を移行させる前記制御入力のシーケンスを生成するようになっている、請求項１に記載のシステム。
前記データ同化は、前記状態の以前の値に基づいて、前記時間ホライズン内の、前記機械の前記動特性の前記方程式を用いて求められる前記状態の値を調整する、請求項６に記載のシステム。
前記プロセッサは、カルマンフィルターの変形を用いて前記コスト関数を最適化する、請求項６に記載のシステム。
前記カルマンフィルターの変形は、古典的カルマンフィルター（ＫＦ）、拡張カルマンフィルター（ＥＫＦ）、無香カルマンフィルター（ＵＫＦ）、アンサンブルカルマンフィルター（ＥｎＫＦ）、アンサンブルカルマンスムーザー（ＥｎＫＳ）、４Ｄ変分モデル（４ＤＶＡＲ）のうちの１つ又は組み合わせを含む、請求項８に記載のシステム。
前記コスト関数は、重み付き最小２乗方法を用いて前記制御入力のシーケンスを探索することにおいて、前記第１の項の重み及び前記第２の項の重みの均衡を取り、該重みは、前記ＭＰＣシステムの前記メモリに記憶される、請求項１に記載のシステム。
前記プロセッサは、前記制御入力のための最適化と前記状態の最適化とを繰り返し交互に行うことによって前記コスト関数を最適化する、請求項１に記載のシステム。
前記機械は、冗長レーザー加工機械である、請求項１に記載のシステム。
機械動特性のモデルに従ってモデル予測制御（ＭＰＣ）を用いて機械の動作を制御する方法であって、該方法は、該方法を実施する、記憶された命令と結合されたプロセッサを使用し、前記命令は、前記プロセッサによって実行されると、該方法の少なくともいくつかのステップを実行し、該少なくともいくつかのステップは、
前記ＭＰＣの目的によって規定される第１の項と、前記機械の状態の、前記機械の動特性の方程式を満たす値からの逸脱にペナルティを課す第２の項とを含むコスト関数をメモリから索出するステップと、
硬制約を条件として時間ホライズンにわたって前記コスト関数を最適化して、該時間ホライズンにわたる前記機械の前記状態を制御する制御入力のシーケンスを生成するステップと、
前記シーケンスにおける最初の前記制御入力に従って前記機械を制御するステップと、
を含む、方法。
前記第２の項は、前記プロセッサによって実行される前記コスト関数の前記最適化が、前記機械の動特性の前記方程式を真にする前記機械の前記状態を求めることを促すように求められる前記機械の動特性の前記方程式の要素を含む、請求項１３に記載の方法。
前記コスト関数は、前記状態の、軟制約からの逸脱にペナルティを課す前記状態の第３の項を含み、前記軟制約は、前記状態の構造に対する制約、及び前記状態の挙動に対する制約のうちの一方又は組み合わせを含む、請求項１３に記載の方法。
前記コスト関数は、前記時間ホライズン内の前記状態のデータ同化を実行する第３の項を含むことで、前記プロセッサが前記同化された状態に従って前記機械の前記状態を移行させる前記制御入力のシーケンスを生成するようになっている、請求項１３に記載の方法。
前記データ同化は、前記状態の以前の値に基づいて、前記時間ホライズン内の、前記機械の前記動特性の前記方程式を用いて求められる前記状態の値を調整する、請求項１６に記載の方法。
前記プロセッサは、カルマンフィルターの変形を用いて前記コスト関数を最適化する、請求項１６に記載の方法。
前記機械は、冗長レーザー加工機械である、請求項１３に記載の方法。
機械動特性のモデルに従ってモデル予測制御（ＭＰＣ）を用いて機械の動作を制御する方法を実行するプロセッサによって実行可能なプログラムを具現化した非一時的コンピューター可読記憶媒体であって、前記方法は、
前記ＭＰＣの目的によって規定される第１の項と、前記機械の状態の、前記機械の動特性の方程式を満たす値からの逸脱にペナルティを課す第２の項とを含むコスト関数をメモリから索出することと、
硬制約を条件として時間ホライズンにわたって前記コスト関数を最適化して、該時間ホライズンにわたる前記機械の前記状態を制御する制御入力のシーケンスを生成することと、
前記シーケンスにおける最初の前記制御入力に従って前記機械を制御することと、
を含む、非一時的コンピューター可読記憶媒体。