JP6939513B2 - モデル予測制御装置 - Google Patents

モデル予測制御装置 Download PDF

Info

Publication number
JP6939513B2
JP6939513B2 JP2017245001A JP2017245001A JP6939513B2 JP 6939513 B2 JP6939513 B2 JP 6939513B2 JP 2017245001 A JP2017245001 A JP 2017245001A JP 2017245001 A JP2017245001 A JP 2017245001A JP 6939513 B2 JP6939513 B2 JP 6939513B2
Authority
JP
Japan
Prior art keywords
function
model prediction
constraint
prediction control
moving body
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017245001A
Other languages
English (en)
Other versions
JP2019113926A (ja
Inventor
亮 吉光
亮 吉光
藤井 正和
正和 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IHI Corp
Original Assignee
IHI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IHI Corp filed Critical IHI Corp
Priority to JP2017245001A priority Critical patent/JP6939513B2/ja
Publication of JP2019113926A publication Critical patent/JP2019113926A/ja
Application granted granted Critical
Publication of JP6939513B2 publication Critical patent/JP6939513B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Feedback Control In General (AREA)

Description

本発明は、システムのモデル予測制御を行うモデル予測制御装置に関するものである。
システムの制御を行う制御手法の一つとしては、モデル予測制御(Model Predictive Control,以下、MPCという)が知られている。
MPCは、制御対象となるシステムの未来の状態を、有限の時間区間であるホライズン(評価区間)について予測し、設定された制御周期の時刻ごとに、ホライズンについての最適化問題を解くことで、システムの制御量を算出する手法である。
また、MPCにおける最適化問題を解くアルゴリズムとしては、連続変形法の手法の1つであるC/GMRES法を用いることが従来提案されている(たとえば、特許文献1参照)。
C/GMRES法は、最適化問題を、一般的な解法であるニュートン法などの反復法によらずに解くことができる。
よって、MPCにC/GMRES法を取り入れた方法によれば、MPCを行う際、各制御周期の時刻で、最適化問題を一般的な解法に比して高速に解くことができるとされている。
また、MPCにロバスト性を考慮した手法としては、確率的モデル予測制御(Stochastic MPC,以下、SMPCという)がある。SMPCは、外乱を確率分布として定量化し、MPCの予測に外乱情報を加味することで、ロバスト性の向上化を図っている(たとえば、非特許文献1参照)。
特開2017−84343号公報
フラウケショーンフェルド,アレサンドラパリシオ,コリンジョーンズ,ディミトリオスギャリストラス,マーカスウェルダー,ヴァネッサスタッチ,ビートレーマン,マニフレッドモラリ(Frauke Oldewurtel,Alessandra Parisio,Colin N. Jones,Dimitrios Gyalistras,Markus Gwerder, Vanessa Stauch, Beat Lehmann,Manfred Morari)、「効率的なビルの空調制御のためのモデル予測制御と気象予測の利用(Use of model predictive control and weather forecasts for energy efficient building climate control)」、エナジーアンドビルディングス(Energy and Buildings)、エルゼビア(Elsevier)、2012年、第45巻、p.15-27
ところで、制御対象となるシステムが、自律移動する機能を備えたロボットや、ロボットアームや加工機等の機械システムのような速い制御が求められる装置の場合は、MPCを行うときの制御周期が、1ms〜100ms程度というような短い制御周期に設定されることがある。
この場合、制御周期が短くなるにつれて、MPCを行う際に設定されるホライズンでは、単位時間当たりのステップ数が増大する。そのため、たとえば、制御対象となるシステムについて遠い未来を予測する必要がある場合は、ホライズンに設定されるステップ数が多くなる。
MPCにおける最適化計算をC/GMRES法で行う方法は、制御周期が短い場合に有効であるとされている。しかし、MPCを行う際に非凸な制約が1つでも存在すると、C/GMRES法は、ニュートン法などの一般的な最適化手法に比して、計算が不安定化しやすい、というのが実情である。そのため、MPCでステップ数が多い場合は、C/GMRES法では、最適化問題を解く計算が収束しないことがあり、更には、発散する結果になることもある。
なお、C/GMRES法以外の連続変形法も、C/GMRES法と同様に、MPCを行う際に非凸な制約が1つでも存在すると計算が不安定化しやすい。
なお、SMPCについては、C/GMRES法などの連続変形法で最適化計算を行う考え自体が従来提案されていない。
そこで、本発明は、MPCにおける最適化問題を解くアルゴリズムとして連続変形法を使用し、且つMPCの制約に非凸な制約が1つでも存在することで生じる連続変形法の計算による不安定化を抑制した状態で、制御対象となるシステムのMPCを実施できるモデル予測制御装置を提供しようとするものである。
本発明は、前記課題を解決するために、制御対象となるシステムの状態量を取得する状態量取得部と、目標状態量を記憶した記憶部と、制約設定部と、計算部と、を備え、前記計算部は、前記システムに関するモデル予測制御の最適化問題を、無制約化に際して評価関数に加えたペナルティ項を時間軸方向に沿って制約を緩和させる機能と、前記無制約化された最適化問題を、連続変形法で解いて制御量を求める機能と、ホライズンにおける1ステップ目の制御量を、ホライズンで1ステップ分の時間が経過した時点での前記システムの制御量として求める機能と、を備え、更に、前記計算部で求められた制御量、または、該制御量を基に求められる操作量を、前記システムへ指令として与える機能を備えた構成を有するモデル予測制御装置とする。
前記計算部は、前記システムに関するモデル予測制御の最適化問題として、確率的モデル予測制御の最適化問題を、ホライズン上で時間軸方向に沿い制約を緩和させるペナルティ項を加えて無制約化する機能を備えた構成としてある。
前記計算部は、前記ペナルティ項を、前記ホライズンにおけるステップの順序の数を変数とする関数により設定する機能を備えた構成としてある。
前記計算部は、前記ペナルティ項を、モデル予測制御における不等式制約の値をペナルティ関数に代入した式で与える機能を備えた構成としてある。
前記制御対象となるシステムは、自律移動する移動体とし、前記状態量取得部は、前記移動体の位置の情報を状態量として取得する機能を備え、前記記憶部は、前記目標状態量として前記移動体の移動目標となる目標位置を記憶する機能を備えた構成としてある。
本発明のモデル予測制御装置によれば、MPCにおける最適化問題を解くアルゴリズムとして連続変形法を使用し、且つMPCの制約に非凸な制約が1つでも存在することで生じる連続変形法の計算による不安定化を抑制した状態で、制御対象となるシステムのMPCを実施することができる。
制御装置の第1実施形態を示す概要図である。 第1実施形態のモデル予測制御装置を適用した移動体の移動経路を示す概要図である。 無制約化したコスト関数のペナルティ項の値の変化を示す図である。 第1実施形態のモデル予測制御装置におけるパラメータ設定部で設定されるパラメータについて、ホライズンにおけるステップ数との関連を示す図である。 制御装置の第2実施形態を示す概要図である。 第2実施形態のモデル予測制御装置を適用した移動体の移動経路を示す概要図である。
以下、本発明を実施するための形態を図面を参照して説明する。
[第1実施形態]
図1は、モデル予測制御装置の第1実施形態を示すものである。図2は、第1実施形態のモデル予測制御装置を適用した移動体の移動経路を示す図である。図3は、コスト関数の無制約化に伴い加えたペナルティ項の値の変化を示す図である。図4は、図1のモデル予測制御装置におけるパラメータ設定部で設定されるパラメータについて、ホライズンにおけるステップ数との関連を示す図である。
本実施形態のモデル予測制御装置は、図1に符号1で示すもので、状態量取得部2と、記憶部3と、制約設定部4と、パラメータ設定部5と、計算部6とを備えた構成とされている。状態量取得部2は、制御対象となるシステムの状態量を取得するものである。記憶部3は、設定された目標状態量およびゲインを記憶するものである。制約設定部4は、後述するコスト関数((4)式)における制約が設定されるものである。パラメータ設定部5は、後述するパラメータQが設定されるものである。計算部6は、状態量取得部2から受け取る制御対象の状態量の情報と、記憶部3から受け取る目標状態量およびゲインの情報と、制約設定部4から受け取る制約の情報と、パラメータ設定部5から受け取るパラメータQpの情報とを基に、制御対象となるシステムの制御量を算出するものである。
本実施形態では、具体例として、モデル予測制御装置1の制御対象となるシステムが、たとえば、自律移動するロボットのような移動体8であり、本実施形態のモデル予測制御装置1により、図2に示すように、移動体8について、移動体8の現在位置から移動目標となるよう設定された目標位置9までの移動を制御する場合について説明する。なお、本実施形態では、移動体8は2次元平面を移動するものとした例について説明する。
移動体8は、図1に示すように、本実施形態のモデル予測制御装置1と、位置検出装置10と、障害物検知部11と、移動装置12とを備えた構成とされている。
位置検出装置10は、ジャイロセンサ、加速度センサ、地磁気センサ、SLAM(Simultaneous Localization and Mapping)などを備えて、移動体8の自機の位置の検出を行うものである。なお、位置検出装置10は、移動体8の自機の位置の検出を行うことができれば、前記した以外の形式のセンサを備えた構成を備えていてもよく、更には、航法衛星システムを用いて位置・姿勢情報を取得したり、外部機器で計測した移動体8の位置の情報を、その外部機器との通信により取得したりする方式を採用してもよいことは勿論である。
位置検出装置10は、本実施形態のモデル予測制御装置1における状態量取得部2に接続されている。
障害物検知部11は、俯瞰カメラや前方ソナーなどを備えて、図2に示すように、移動体8が現在位置から、ゴールとして設定された目標位置9まで移動する過程で、移動体8の移動の障害となる障害物13の検知を行うものである。なお、障害物検知部11は、前記したような障害物13を検知することができれば、障害物13を検知するために従来用いられているか、または、従来提案されている任意の機器を採用してもよいことは勿論である。更に、障害物検知部11は、外部機器で検知した障害物13の情報を、その外部機器との通信により取得する方式を採用してもよいことは勿論である。
図1に示すように、障害物検知部11は、本実施形態のモデル予測制御装置1における制約設定部4に接続されている。
移動装置12は、移動体8の推進や操舵を行う装置である。移動体8が、陸上を走行する形式の場合は、駆動輪の回転駆動を行うアクチュエータや、操舵用のアクチュエータが移動装置12に含まれる。また、移動体8が水中を移動する形式の場合は、プロペラの回転駆動を行うアクチュエータや、操舵用のアクチュエータが移動装置12に含まれる。
移動装置12は、本実施形態のモデル予測制御装置1から指令7を受け取ると、その指令7に従って作動する機能を備えている。なお、本実施形態のモデル予測制御装置1から移動装置12へ送る指令7は、移動体8の制御量とすればよいが、その制御量を基に求めた移動装置12の個々のアクチュエータの操作量であってもよい。本実施形態のモデル予測制御装置1から移動装置12へ送る指令7が移動体8の制御量の場合は、その制御量に対応する個々のアクチュエータの操作量を求める処理を移動装置12側で行うようにすればよい。
以上の構成としてある移動体8に適用される本実施形態のモデル予測制御装置1では、状態量取得部2で取得する状態量は、移動体8の位置となる。そのため、状態量取得部2は、位置検出装置10から、位置検出装置10で検出された移動体8の位置の情報を受け取る機能を備えている。
記憶部3には、移動体8がゴールとして設定された目標位置9(図2参照)に存在するときの状態量が、目標状態量として記憶されている。
制約設定部4には、移動体8の使用条件に関する制約として、速度制約や加速度制約などの移動体8の状態量に関する制約、および、移動装置12のアクチュエータの出力制約などの移動体8への入力量に関する制約が設定されている。更に、本実施形態では、制約設定部4は、障害物検知部11が検知した障害物の位置とサイズの情報を障害物検知部11から受け取ると、その障害物との接触を回避するための衝突回避制約を設定する機能を備えている。本実施形態では、この障害物回避の制約が、後述するMPCに関する制約における非凸な制約となる。
また、制約設定部4は、設定された各制約の情報を計算部6へ送る機能を備えている。
次に、計算部6の機能について説明すると共に、パラメータ設定部5の機能について説明する。
本実施形態は、MPCにおける最適化問題を解くアルゴリズムとして使用する連続変形法として、たとえば、C/GMRES法を使用するものとし、ここで、先ず、C/GMRES法を安定化させる原理について示す。
たとえば,以下の(1)式のようなMPCの最適化問題を考える。
Figure 0006939513
コスト関数は、以下の(2)式となる。
Figure 0006939513
前記(2)式において、X,Uは、それぞれMPCのiステップ後の状態量と制御入力を表す(i=0…N,Nは予測ホライズン)。
前記(1)式の制約関数は、hが状態量に関する不等式制約、gが制御量に関する不等式制約、f(X,U)は移動体8の状態方程式、をそれぞれ意味している。前記(1)式は、制約条件の下、前記(2)式に示すコスト関数J(U)を最小化する。
コスト関数J(U)は、予測ホライズンおよび制御ホライズン上でのステージコストと、予測ホライズンの終端時刻における終端コストで構成される。
は、移動体8がゴールとして設定された目標位置9に存在する状態を表している。Q,R,Sは、それぞれ状態量、制御量、終端コストの各成分への重みを決める調整パラメータである。
これを、以下に述べるように無制約化する。無制約化した最適化問題は、以下の(3)式となる。
Figure 0006939513
コスト関数は、以下の(4)式となる。
Figure 0006939513
前記(4)式におけるhj,i,gj,iは、ホライズン上のiステップ目における制約関数h,gを表す。hは状態量に関する制約であり、移動体8の場合は速度制約や加速度制約、衝突回避制約などがある。gは入力量に関する制約であり、移動体8の場合は移動装置12のアクチュエータの出力制約などがある。J´(U)では、不等式制約の値をペナルティ関数に代入して、図3に示すようなペナルティを与えるペナルティ項を、前記(2)式における右辺の第1項、第2項に加えている。なお、前記(4)式では、ペナルティ関数に指数関数を利用したが、対数や逆数のような一般的に用いられているペナルティ関数の表現方法を利用してもよい。Qは、ペナルティ関数の形状を決めるパラメータであり、図3の場合、Q=10程度にすると、hが正のときにペナルティ項の値が急激に増加する。一方、Q=0.5程度のときは、ペナルティ項の値が増加する勾配が緩やかになる。
ここで、本発明者等が実施した予備試験について説明する。
本実施形態のモデル予測制御装置1は、前記のように無制約化された最適化問題を、計算部6にてC/GMRES法によって解き、移動体8の移動装置12へ与えるべき制御入力を算出する。
この制御入力の算出は以下の手順で行うようにすればよい。
まず、時刻tの時点での状態量をXとし,この時に出力した制御量をUとする。
次に、時刻t+Δtにおける状態量X(t+Δt)を取得する。
次いで、状態量Xの時間微分を数値微分で計算するため、以下の(5)式で示すXt+hを算出する(なお、hはΔt未満の十分小さな値である)。
Figure 0006939513
更に、以下の(6)式として示す方程式を解いて、制御量Uの時間微分を算出する。
Figure 0006939513
その後、
Figure 0006939513
とし、Ut+Δtの1ステップ目を、次ステップの制御量Uとする。
予備試験は、前記(4)式におけるQを、Q=10とQ=0.5に設定したそれぞれの場合について、障害物13が存在する環境下における移動体8の移動の軌跡を、最適化計算により求めた。その結果、Q=10のときは、初期位置から少し移動した後、最適化計算が不安定になり、最終的に制御量が発散した。分析の結果、制御量が発散し始める瞬間は、予測ホライズンの先端が、障害物13に接触した時であった。この瞬間、前記(4)式におけるペナルティ項の値が急激に増加し、MPCにおける停留条件Fが無限大となっていた。その結果、ヤコビ行列が非正則となり、GMRES法の解も不安定になったと考えられた。
一方、Qp=0.5のときは、最適化計算は安定していたが、障害物13との干渉が生じた際にペナルティ項の値として与えられるペナルティの効果が低すぎて、求めた移動体の8の移動の軌跡は、障害物13を通過するものとなった。
以上の予備試験の結果に鑑みて、本発明者等は、計算部6では、前記(4)式の最適化計算を行うときに、ホライズンにおける終端寄りとなる遠い未来の予測値には、緩い制約を与えることで最適化計算を安定させるようにし、ホライズンにおける始端寄りとなる近い未来の予測値には、厳しい制約を与えることとした。
そこで、本実施形態では、パラメータ設定部5が、ホライズン上で、iステップ目(i=0…N)の順序が大きくなるにしたがって単調減少するパラメータQの値を、計算部6に与える機能を備えている。
具体的には、本実施形態におけるパラメータ設定部5は、たとえば、以下の(7)式で表されるシグモイド関数を使って、ホライズンにおけるステップごとにパラメータQの値を算出する機能と、算出されたパラメータQpを計算部6へ送る機能とを備えている。
Figure 0006939513
前記(7)式によるステップの順序iと、Qpとの関係は、図4に示す。
これにより、計算部6では、前記(4)式にて、ホライズン上で時間軸方向に沿い制約が緩和されてゆくようにペナルティ項を与えることができ、よって、C/GMRES法においても安定して解を算出できるようになる。
しかる後、本実施形態のモデル予測制御装置1は、各ホライズンにおける1ステップ目の制御量Uを、各ホライズンで1ステップ分の時間が経過した時点での制御量Uとして、移動体8の移動装置12へ指令7として送るようにしてある。
したがって、本実施形態のモデル予測制御装置1によれば、MPCにおける最適化問題を解くアルゴリズムとしてC/GMRES法を使用し、更に、MPCの制約に障害物回避という非凸な制約が1つでも存在することで生じるC/GMRES法の計算による不安定化を抑制した状態で、制御対象のシステムである移動体8の移動についてのMPCを実施することができる。
たとえば、図2に示すように、移動体8が目標位置9に向けて移動する経路上に、移動体8の移動の障害となる障害物13が、移動体8の現在位置からの距離が異なる2個所に存在している状況を考える。なお、2つの障害物13を識別するために、図2に括弧書きで示すように、移動体8の現在位置に近い方を障害物13aとし、遠い方を障害物13bという。
この状況で、従来のMPCにおける最適化計算をC/GMRES法で行う方法では、移動体8が現在位置から近い方の障害物13aを回避するように経路を設定した結果、遠い方の障害物13bと接触する経路となる場合がある。この時、従来の方法では、ペナルティ項が増大し、MPCにおける最適化計算が収束しないという問題が生じる可能性がある。
これに対し、本実施形態のモデル予測制御装置1では、図2に示すように、移動体8が現在位置から近い方の障害物13aに近付く段階では、近い方の障害物13aとの接触を回避することの方が、遠い方の障害物13bとの接触を回避することに比して、より重要視された状態でMPCにおける最適化計算が行われることになる。このため、移動体8の現在位置から目標位置9までの間に、近い方の障害物13aが存在している間は、その障害物13aの回避に重点がおかれた経路を設定することができる。
その後、移動体8が、障害物13aが目標位置9へ向かう移動経路上の障害とならない位置まで移動を行うと、その時点での位置から目標位置9へ向かう移動経路上で、障害物13bが移動体8に最も近い障害物になる。この状態になると、本実施形態のモデル予測制御装置1では、障害物13bとの回避が重要視された状態でMPCの最適化計算が行われて、障害物13bを回避するための経路を設定することができる。
よって、本実施形態のモデル予測制御装置1を採用した移動体8は、現在位置から目標位置9へ向かう移動経路上に複数の障害物13が存在している状態であっても、近付く障害物13を順に回避する経路を設定しながら目標位置9に向けた移動を行うことができる。
[第2実施形態]
前記第1実施形態のモデル予測制御装置1は、MPCにおける最適化計算を連続変形法としてのC/GMRES法で行う方法について、ホライズンに設定されているステップ数が多くなる場合であってもC/GMRES法の計算による不安定化を抑制できるものとして説明した。
そこで、第2実施形態のモデル予測制御装置1は、第1実施形態のモデル予測制御装置1の応用例として、MPCにロバスト性を考慮したSMPCについて、最適化問題を解くアルゴリズムとしてC/GMRES法を使用する場合について説明する。
図5(a)(b)は、第2実施形態のモデル予測制御装置にて、計算部6で進行方向の速度のプロセスノイズの大きさを変化させることに伴う作用を説明するための図である。図6(a)は、第2実施形態のモデル予測制御装置を適用した移動体の移動経路の例を示すものである。図6(b)は、対比として、通常のSMPCを適用した移動体の移動経路の例を示す図である。
なお、第2実施形態のモデル予測制御装置1の構成は、図1に示した第1実施形態のモデル予測制御装置1と同様である。また、図5(a)(b)、図6(a)(b)において、第1実施形態と同一のものには同一符号を付して、その説明を省略する。
本実施形態のモデル予測制御装置1は、第1実施形態と同様の構成において、制約設定部4と計算部6が、以下のような機能を備えるものとされている。
ここで、本実施形態では、移動体8は、たとえば、二次元平面を移動する車輪駆動ロボットとし、移動体8がスリップする路面上を走行しながら障害物13を回避する場合について説明する。
事前準備として、移動体8の状態方程式を以下の(8)式で定義する。
移動体8はノンホロノミック拘束で移動し、前後方向の加速度uと、旋回角加速度uで制御される。
Figure 0006939513
この状態で、本実施形態のモデル予測制御装置1は、図1に示したと同様に、移動体8に備えた位置検出装置10で検出された移動体8の位置の情報を、移動体8の現在の状態量として状態量取得部2で受け取る。この現在の状態量がXとなる。
次に、本実施形態のモデル予測制御装置1は、移動体8の障害物検知部11で検知された障害物13の位置とサイズの情報を、制約設定部4で受け取る。制約設定部4では、受け取った情報を基に、障害物13の中心位置を[o,o]、サイズを半径Dminの球で近似する。
次いで、本実施形態のモデル予測制御装置1は、記憶部3より目標状態量を取得する。この目標状態量がXとなる。
その後、計算部6は、制御量の計算を行う。
この制御量の計算は、以下の(9)式に示す制約付き最適化問題を、第1実施形態で説明したと同様に無制約化し、C/GMRES法で解く。
具体的には、制約付き最適化問題は、以下の(9)式となる。
Figure 0006939513
コスト関数は、以下の(10)式となる。
Figure 0006939513
制約関数は、以下の(11)式で与えられる。
Figure 0006939513
前記(10)式において、X,Uは、それぞれiステップ後の状態量と制御入力を表す。px,i、ux,iなどのiを含む記号も、同様に、iステップ後の状態量や制御入力の各成分を表す。
前記(10)式のコスト関数は、予測ホライズン、制御ホライズン上でのステージコストと、予測ホライズンの終端時刻における終端コストで構成される。Q,R,Sは状態量、制御量の各成分への重みを決める調整パラメータである。
前記(11)式の制約関数は、制約設定部4から、計算部6へ与えられるもので、それぞれ、制御入力の制約(f,f)、速度・角速度制約(f,f)、衝突回避制約(f)を定式化したものである。ここで、σは、衝突回避にロバスト性を与える項であり、以下の(12)式で算出される。
Figure 0006939513
前記(12)式中のNprocは、ロバスト性を考慮したSMPCが想定する移動体8のプロセスノイズの分散行列(6×6)である。たとえば、Nprocの4行4列目を大きな値にすると、進行方向の速度Vの誤差を大きく見積もることになる。
このように、進行方向の速度Vの誤差を大きく見積もって得られる移動体8の移動経路(軌道)を、図5(a)に示す。図5(b)は、進行方向の速度Vの誤差を大きく見積もらない場合の移動体の移動経路である。図5(a)を図5(b)と比較すると、進行方向の速度Vの誤差を大きく見積もることにより、障害物13に近づく前に旋回を始めるような保守的な移動経路が生成されることが分かり、よって、この場合は、移動体8を、スリップの多い環境でも確実に障害物13との衝突を回避させることができるようになる。
よって、計算部6は、前記(9)式を無制約化して、前記(3)式と同様な無制約化した最適化問題を立てる。この際、計算部6は、前記(10)式に対して、前記(4)式と同様にペナルティ項を加えたコスト関数を設定し、且つ、そのペナルティ項が、ホライズン上で時間軸方向に沿い制約が緩和されてゆくように設定する。
その状態で、計算部6は、無制約化された最適化問題について、C/GMRES法によって解き、本実施形態のモデル予測制御装置1は、計算部6で得られた最適制御量行列Uの第1成分Uを、各ホライズンで1ステップ分の時間が経過した時点での制御量Uとして、移動体8の移動装置12へ指令7として送る。
以上の構成としてある本実施形態のモデル予測制御装置1によれば、MPCにロバスト性を考慮したSMPCにおける最適化問題を解くアルゴリズムとしてC/GMRES法を使用し、更に、MPCの制約に障害物回避という非凸な制約が1つでも存在することで生じるC/GMRES法の計算による不安定化を抑制することができて、第1実施形態と同様の効果を得ることができる。
更に、たとえば、図6(b)に示すように、移動体8が目標位置9に向けて移動する経路上に、2つの障害物13が並んで存在している場合は、従来のSMPCを行う際に、ホライズンにおける終端寄りで誤差を考慮した移動範囲を大きく見積もりすぎると、移動体8が2つの障害物13の間を通過する移動経路を予測することができなくなる。その場合、移動体8の移動経路としては、図6(b)に二点鎖線で示すように、左の障害物13の左側を迂回する経路や、一点鎖線で示すような右の障害物13の右側を迂回する経路が設定されてしまう。
これに対し、本実施形態のモデル予測制御装置1では、図6(a)に示すように、SMPCを行う際に、ホライズンにおける終端寄りで誤差を考慮した移動範囲を、図6(b)に比して小さく予測することができる。よって、本実施形態のモデル予測制御装置1は、従来のSMPCに比して、より効率的な移動体8の移動経路を予測することができる。
なお、本発明は、前記各実施形態にのみ限定されるものではない。
図1では、モデル予測制御装置1における状態量取得部2、記憶部3、制約設定部4、パラメータ設定部5、計算部6をそれぞれ別々に記載したが、これらのうちの複数あるいは全部が、或る装置に機能としてまとめて備えられていてもよいことは勿論である。
本発明のモデル予測制御装置1は、MPCや、MPCの一種であるSMPCにて、ホライズンにおけるステップ数が多い場合に適用することが好適なモデル予測制御装置1であるが、適用対象となるシステムのホライズンのステップ数に特に限定はないことは勿論である。また、本発明のモデル予測制御装置1は、短い制御周期のシステムに適用することが好適であるが、適用対象となるシステムの制御周期に特に限定はないことは勿論である。
前記各実施形態においては、MPCにおける最適化問題を解くアルゴリズムとしてC/GMRES法を用いる例を示したが、MPCにおける最適化問題を解くアルゴリズムは、C/GMRES法以外の連続変形法を採用してもよい。この構成によれば、MPCにおける最適化問題を解くアルゴリズムとして連続変形法を使用し、且つMPCの制約に非凸な制約が1つでも存在することで生じる連続変形法の計算による不安定化を抑制した状態で、制御対象となるシステムのMPCを実施することができる。
前記各実施形態においては、本発明のモデル予測制御装置1の制御対象となるシステムとして、ロボットのような自律移動する移動体8を例示して、その移動体8の移動の制御を行う場合について説明したが、ロボットアームや加工機等の機械システムなど、ロボットにおける移動以外の動作の制御に適用してもよいことは勿論である。
更に、本発明のモデル予測制御装置1は、従来MPCやSMPCが適用されているシステムであれば、石油化学プラントや、その他の各種プラント、各種生産設備、各種動力設備など、移動体8以外の任意のシステムに適用してもよいことは勿論である。
前記各実施形態においては、本発明のモデル予測制御装置1の制御対象となるシステムとして、ロボットのような自律移動する移動体8を例示して、MPCの制約に関する非凸な制約としては障害物回避の制約を例示したが、制御対象となるシステムに応じてMPCの制約に関する非凸な制約は自在に変更してもよいことは勿論である。
第2実施形態のモデル予測制御装置1は、制御される状態量が不確かさを含む移動体であれば、その状態量の不確かさは、外乱によるものであってもよいし、移動体8に備えた位置検出装置10における検出精度があまり高くないことに起因して、制御される状態量が不確かさを含むような移動体に適用してもよい。
その他、本発明の要旨を逸脱しない範囲内で種々変更を加え得ることは勿論である。
2 状態量取得部、3 記憶部、4 制約設定部、6 計算部、7 指令、8 移動体(システム)、9 目標位置

Claims (5)

  1. 制御対象となるシステムの状態量を取得する状態量取得部と、
    目標状態量を記憶した記憶部と、
    制約設定部と、
    計算部と、を備え、
    前記計算部は、
    前記システムに関するモデル予測制御の最適化問題の制約を評価区間上で時間軸方向に沿って緩和させ、緩和させた前記最適化問題の制約をペナルティ項としてコスト関数に加えて無制約化する機能と、
    前記無制約化された最適化問題を、連続変形法で解いて前記評価区間分全ての制御量を求める機能と、
    前記評価区間における1ステップ目の前記制御量を、前記評価区間で1ステップ分の時間が経過した時点での前記システムの前記制御量として求める機能と、を備え、
    更に、前記計算部で求められた前記1ステップ目の前記制御量、または、該制御量を基に求められる操作量を、
    前記システムへ指令として与える機能を備えたこと
    を特徴とするモデル予測制御装置。
  2. 前記計算部は、前記システムに関するモデル予測制御の最適化問題として、確率的モデル予測制御の最適化問題を、前記評価区間上で時間軸方向に沿って緩和させ、緩和させた前記最適化問題の制約をペナルティ項としてコスト関数に加えて無制約化する機能を備えた
    請求項1記載のモデル予測制御装置。
  3. 前記計算部は、前記ペナルティ項を、前記評価区間におけるステップの順序の数を変数とする関数により設定する機能を備えた
    請求項1または2記載のモデル予測制御装置。
  4. 前記計算部は、前記ペナルティ項を、モデル予測制御における不等式制約の値をペナルティ関数に代入した式で与える機能を備えた
    請求項3記載のモデル予測制御装置。
  5. 前記制御対象となるシステムは、自律移動する移動体とし、
    前記状態量取得部は、前記移動体の位置の情報を状態量として取得する機能を備え、
    前記記憶部は、前記目標状態量として前記移動体の移動目標となる目標位置を記憶する機能を備えた
    請求項1から請求項4のいずれか一項に記載のモデル予測制御装置。
JP2017245001A 2017-12-21 2017-12-21 モデル予測制御装置 Active JP6939513B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017245001A JP6939513B2 (ja) 2017-12-21 2017-12-21 モデル予測制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017245001A JP6939513B2 (ja) 2017-12-21 2017-12-21 モデル予測制御装置

Publications (2)

Publication Number Publication Date
JP2019113926A JP2019113926A (ja) 2019-07-11
JP6939513B2 true JP6939513B2 (ja) 2021-09-22

Family

ID=67223660

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017245001A Active JP6939513B2 (ja) 2017-12-21 2017-12-21 モデル予測制御装置

Country Status (1)

Country Link
JP (1) JP6939513B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10739768B2 (en) * 2018-08-08 2020-08-11 Toyota Motor Engineering & Manufacturing North America, Inc. Smoothed and regularized Fischer-Burmeister solver for embedded real-time constrained optimal control problems in autonomous systems
JP2021077090A (ja) * 2019-11-08 2021-05-20 三菱重工業株式会社 複数のビークルの移動制御方法、移動制御装置、移動制御システム、プログラム及び記録媒体
CN111027822B (zh) * 2019-11-25 2023-10-31 秒针信息技术有限公司 一种确定饲料类型的方法及装置
CN111708277B (zh) * 2020-05-29 2021-10-01 中国科学技术大学 一种自适应时域的事件触发模型预测控制方法
CN111682792B (zh) * 2020-07-02 2023-07-11 湖南师范大学 一种多步预测的变流器模型预测控制方法
WO2022044470A1 (ja) * 2020-08-27 2022-03-03 パナソニックIpマネジメント株式会社 移動体制御方法、移動体制御装置、および移動体
US11698625B2 (en) 2020-12-10 2023-07-11 Mitsubishi Electric Research Laboratories, Inc. Stochastic model-predictive control of uncertain system
CN114684165B (zh) * 2022-03-04 2023-03-24 阿波罗智能技术(北京)有限公司 车辆控制方法、装置、设备、存储介质和自动驾驶车辆
CN115309044B (zh) * 2022-07-26 2024-05-17 福建工程学院 一种基于模型预测控制的机械臂角速度控制方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5168134B2 (ja) * 2008-12-26 2013-03-21 富士通株式会社 環境地図生成プログラム、環境地図生成方法及び移動ロボット
US8554343B2 (en) * 2010-12-08 2013-10-08 Mitsubishi Electric Research Laboratories, Inc. Method for solving control problems
JP5903925B2 (ja) * 2012-02-20 2016-04-13 富士通株式会社 情報処理方法、装置及びプログラム
US10281897B2 (en) * 2015-06-02 2019-05-07 Mitsubishi Electric Research Laboratories, Inc. Model predictive control with uncertainties
JP2017004373A (ja) * 2015-06-12 2017-01-05 株式会社リコー 情報処理装置、情報処理プログラム、および情報処理システム
US10209685B2 (en) * 2015-10-29 2019-02-19 Mitsubishi Electric Research Laboratories, Inc. Method and apparatus for preconditioned model predictive control

Also Published As

Publication number Publication date
JP2019113926A (ja) 2019-07-11

Similar Documents

Publication Publication Date Title
JP6939513B2 (ja) モデル予測制御装置
US20220362932A1 (en) Determination of robotic step path
JP4746349B2 (ja) ロボット行動選択装置及びロボット行動選択方法
JP7469850B2 (ja) 経路決定装置、ロボット及び経路決定方法
US9931753B1 (en) Methods and devices for automatic gait transition
EP3793783A1 (en) System and methods for pixel based model predictive control
JPWO2020136978A1 (ja) 経路決定方法
Li et al. A behavior-based mobile robot navigation method with deep reinforcement learning
Ferreira et al. An approach to avoid obstacles in mobile robot navigation: the tangential escape
Kon et al. Mixed integer programming-based semiautonomous step climbing of a snake robot considering sensing strategy
KR20210048969A (ko) 사용자 선호에 따른 강화학습 기반 자율주행 최적화 방법 및 시스템
CN113988196A (zh) 一种机器人移动方法、装置、设备及存储介质
Gonçalves et al. A line follower educational mobile robot performance robustness increase using a competition as benchmark
Guo et al. Optimal navigation for AGVs: A soft actor–critic-based reinforcement learning approach with composite auxiliary rewards
JP7258046B2 (ja) 経路決定装置、ロボット及び経路決定方法
JP5079602B2 (ja) 自律移動ロボットの動作計画装置、方法、プログラム及び記録媒体並びに自律移動ロボットの動作制御装置及び方法
JP7250571B2 (ja) 倒立振子型ロボット
WO2021167670A2 (en) Autonomous sense and guide machine learning system
CN114609925B (zh) 水下探索策略模型的训练方法及仿生机器鱼水下探索方法
Vilca et al. An overall control strategy based on target reaching for the navigation of an urban electric vehicle
KR102617418B1 (ko) 센서 구성과 로봇 형태에 적응 가능한 강화학습 기반 자율주행 방법, 컴퓨터 시스템, 및 컴퓨터 프로그램
Chen et al. Improved dynamic window approach for dynamic obstacle avoidance of quadruped robots
Schleich et al. Predictive Angular Potential Field-based Obstacle Avoidance for Dynamic UAV Flights
JP4964255B2 (ja) 自律移動ロボットの動作計画装置、方法、プログラム及び記録媒体並びに自律移動ロボットの動作制御装置及び方法
Chu et al. Underwater vehicle trajectory planning in dynamic environments based on radau pseudospectral method

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20190325

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190326

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200817

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210803

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210816

R151 Written notification of patent or utility model registration

Ref document number: 6939513

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151