JP7305061B2 - パラメータ調整装置およびパラメータ調整方法 - Google Patents

パラメータ調整装置およびパラメータ調整方法 Download PDF

Info

Publication number
JP7305061B2
JP7305061B2 JP2022557233A JP2022557233A JP7305061B2 JP 7305061 B2 JP7305061 B2 JP 7305061B2 JP 2022557233 A JP2022557233 A JP 2022557233A JP 2022557233 A JP2022557233 A JP 2022557233A JP 7305061 B2 JP7305061 B2 JP 7305061B2
Authority
JP
Japan
Prior art keywords
parameter
adjustment
control
unit
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022557233A
Other languages
English (en)
Other versions
JPWO2022079761A1 (ja
JPWO2022079761A5 (ja
Inventor
清石 前川
七星 春尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2022079761A1 publication Critical patent/JPWO2022079761A1/ja
Publication of JPWO2022079761A5 publication Critical patent/JPWO2022079761A5/ja
Application granted granted Critical
Publication of JP7305061B2 publication Critical patent/JP7305061B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Description

本開示は、ロボット、産業機械、工作機械、昇降機、輸送機械などのメカニカルシステムを制御する際の制御パラメータを調整するパラメータ調整装置およびパラメータ調整方法に関する。
ロボット、産業機械、工作機械、昇降機、輸送機械などのメカニカルシステムでは、動作時間短縮、精度向上などの高性能化を目的として、メカニカルシステムを制御する制御装置に設定する制御パラメータを調整している。メカニカルシステムの挙動を詳細に再現するシミュレータの実現が困難であるため、制御パラメータの調整は、実際にメカニカルシステムを動作させて必要なデータを収集し、収集したデータに基づいて行われる。高い性能を実現するには、駆動機構の位置、速度、加速度などにより決まる動作条件ごとに、制御パラメータを個別に調整する必要がある。
制御パラメータを調整する従来の方法が特許文献1で開示されている。特許文献1に記載の調整方法では、各動作条件での制御パラメータを調整する際、まず、第1範囲で制御パラメータの値を変更しながらシミュレーションを繰り返し行い制御パラメータの最適値の候補を抽出し、次に、抽出した各候補の近傍である第2範囲内で実機を繰り返し動作させて得られた結果に基づき、制御パラメータの最適値を決定する。
特開2017-102619号公報
特許文献1に記載の技術によれば、動作条件毎の実機での調整のための試行回数は削減できるが、実機で調整を行う動作条件の数は削減できない。例えば、停止位置を様々に変動させながら制御パラメータの調整を実機で行う場合、実機の停止位置を高精度に計測する必要があるが、こうした計測を行うためのシステムの設置および測定には時間を要する。そのため、実機で調整を行う動作条件の数が削減できないと、調整時間を短縮できない。
本開示は、上記に鑑みてなされたものであって、実機で制御パラメータの調整を行う動作条件の数を削減できるパラメータ調整装置を得ることを目的とする。
上述した課題を解決し、目的を達成するために、本開示は、制御装置が実機を制御する際に使用する制御パラメータを調整するパラメータ調整装置であって、実機の挙動のシミュレーション結果に基づいて制御パラメータを調整する第1パラメータ調整部と、実機の挙動に基づいて制御パラメータを調整する第2パラメータ調整部と、第1パラメータ調整部による制御パラメータの調整結果である第1の調整結果と第2パラメータ調整部による制御パラメータの調整結果である第2の調整結果の関係を学習し、制御パラメータの決定処理で使用する学習モデルを生成するパラメータ変換関係学習部と、第1の調整結果を学習モデルに基づいて変換して制御パラメータを生成するパラメータ変換部と、を備える
本開示にかかるパラメータ調整装置は、実機で制御パラメータの調整を行う動作条件の数を削減できるという効果を奏する。
実施の形態1にかかるパラメータ調整装置の構成例を示す図 パラメータ変換関係学習部の構成例を示す図 実施の形態1にかかるパラメータ調整装置が制御パラメータを調整する動作の一例を示すフローチャート パラメータ変換関係学習部の他の構成例を示す図 実施の形態2にかかるパラメータ調整装置の構成例を示す図 パラメータ関係学習部の構成例を示す図 実施の形態2にかかるパラメータ調整装置が制御パラメータを調整する動作の一例を示すフローチャート パラメータ関係学習部の他の構成例を示す図 実施の形態3にかかるパラメータ調整装置の構成例を示す図 仕様変換関係学習部の構成例を示す図 仕様変換関数学習部の構成例を示す図 実施の形態3にかかるパラメータ調整装置が制御パラメータを調整する動作の一例を示すフローチャート 実施の形態4にかかるパラメータ調整装置の構成例を示す図 補正モデル学習部の構成例を示す図 実施の形態4にかかるパラメータ調整装置が制御パラメータを調整する動作の一例を示すフローチャート パラメータ調整装置を実現するハードウェアの一例を示す図
以下に、本開示の実施の形態にかかるパラメータ調整装置およびパラメータ調整方法を図面に基づいて詳細に説明する。
実施の形態1.
図1は、実施の形態1にかかるパラメータ調整装置の構成例を示す図である。本実施の形態にかかるパラメータ調整装置1は、シミュレーション部2、第1パラメータ調整部3、第2パラメータ調整部4、パラメータ変換関係学習部7およびパラメータ変換部8を備える。第1パラメータ調整部3、第2パラメータ調整部4、パラメータ変換関係学習部7およびパラメータ変換部8はパラメータ決定部31を構成する。
パラメータ調整装置1は、制御対象実機6を制御する制御装置5の制御パラメータを調整する装置である。制御対象実機6は制御装置5によって制御されるメカニカルシステムであり、産業用ロボット、産業機械、工作機械、昇降機等である。
ここで、本実施の形態では、パラメータ調整装置1は、制御装置5の外部のパーソナルコンピュータもしくはサーバに構築されるものとするがこれに限定するものではない。パラメータ調整装置1は制御装置5の内部に構成されてもよいし、クラウド上に構成してもよい。シミュレーション部2は、制御装置5と組み合わせたときの制御対象実機6の挙動をパーソナルコンピュータなどの仮想環境下で再現するシミュレータである。
第1パラメータ調整部3および第2パラメータ調整部4は、制御装置5の制御パラメータを調整する。制御パラメータの例は、制御対象実機6であるメカニカルシステムの駆動軸を制御するモータのフィードバックゲイン、フィードフォワード制御パラメータ、フィルタパラメータ、指令パラメータ、などである。第1パラメータ調整部3および第2パラメータ調整部4は、これらの制御パラメータの中の少なくとも1つの調整を実施する。
第1パラメータ調整部3は、シミュレーション部2を対象として制御パラメータの調整を行う。具体的には、第1パラメータ調整部3は、制御対象実機6の挙動を再現するシミュレーションをシミュレーション部2に実行させ、シミュレーションの結果に基づいて制御パラメータの調整を行う。一方、第2パラメータ調整部4は、制御装置5および制御対象実機6を対象として制御パラメータの調整を行う。具体的には、第2パラメータ調整部4は、制御装置5を介して制御対象実機6を実際に動作させ、動作結果に基づいて制御パラメータの調整を行う。第1パラメータ調整部3および第2パラメータ調整部4は、それぞれ、調整対象の制御パラメータの値を試行錯誤で変更し、位置決め時間短縮、軌跡精度向上などの目標仕様を満たす制御パラメータの値を探索する。第1パラメータ調整部3および第2パラメータ調整部4は、目標仕様を満たす制御パラメータの値が複数存在する場合は目標仕様を最も満たす制御パラメータの値を探索する。「目標仕様を最も満たす」とは、目標仕様に応じて決める評価関数が最小になることを意味する。例えば、目標仕様が位置決め時間短縮の場合、第1パラメータ調整部3および第2パラメータ調整部4は、最も位置決め時間が短くなる制御パラメータを探索する。第1パラメータ調整部3および第2パラメータ調整部4による制御パラメータの値の探索方法としては、強化学習、粒子群最適化と呼ばれるPSO(Particle Swarm Optimization)、ベイズ最適化、グリッドサーチ、遺伝的アルゴリズムと呼ばれるGA(Genetic Algorithm)、などを適用する。
第1パラメータ調整部3は、制御パラメータの調整が終了すると、制御パラメータの調整処理で得られる複数の調整結果の一部をパラメータ変換関係学習部7に出力し、残りをパラメータ変換部8に出力する。第2パラメータ調整部4は、制御パラメータの調整が終了すると、調整結果をパラメータ変換関係学習部7および制御装置5に出力する。なお、第1パラメータ調整部3が出力する調整結果は第1の調整結果、第2パラメータ調整部4が出力する調整結果は第2の調整結果である。
パラメータ変換関係学習部7は、第1パラメータ調整部3および第2パラメータ調整部4が特定の同一動作条件下で制御パラメータを調整して得られた、調整後の制御パラメータ同士の関係を学習し、第1パラメータ調整部3で調整された制御パラメータを制御装置5の制御パラメータに変換するための学習モデルを生成する。動作条件は、動作開始地点および動作終了地点におけるメカニカルシステムの先端部の位置、動作開始地点および動作終了地点における、メカニカルシステムを構成する各軸の位置、設定されている最高速度、など、1つ以上の動作パラメータによって決定される。これらの各動作パラメータの値を変更することで動作条件が変更される。
図2は、パラメータ変換関係学習部7の構成例を示す図である。図2に示すように、パラメータ変換関係学習部7は、ニューラルネットワーク14を含んで構成される。
パラメータ変換関係学習部7においては、第1パラメータ調整部3がパラメータ調整を行った時の動作条件(以下、学習用動作条件とする)と、学習用動作条件での第1パラメータ調整部3による調整結果すなわち調整後の制御パラメータと、学習用動作条件での第2パラメータ調整部4による調整結果すなわち調整後の制御パラメータと、をニューラルネットワーク14に入力する。なお、学習用動作条件とは、制御パラメータを調整する際に使用する様々な動作条件の中の一部の動作条件である。ニューラルネットワーク14は、第1パラメータ調整部3による調整結果および第1パラメータ調整部3が制御パラメータを調整する際に用いた動作条件が入力されると、入力された動作条件での第2パラメータ調整部4による制御パラメータの調整結果を出力するよう、学習を行う。第1パラメータ調整部3および第2パラメータ調整部4による調整結果の例は、比例ゲイン、積分ゲインおよび微分ゲインといったフィードバックゲイン、フィードフォワードパラメータ、指令にかけるフィルタのパラメータ、加減速時間、などである。換言すると、第1パラメータ調整部3および第2パラメータ調整部4が調整する制御パラメータは、比例ゲイン、積分ゲインおよび微分ゲインといったフィードバックゲイン、フィードフォワードパラメータ、指令にかけるフィルタのパラメータ、加減速時間、などである。学習済みのニューラルネットワーク14は、学習モデルとしてパラメータ変換関係学習部7からパラメータ変換部8に出力される。
パラメータ変換部8は、パラメータ変換関係学習部7で生成された学習モデル(学習済みのニューラルネットワーク14)を受け取って保持している。パラメータ変換部8は、保持しているニューラルネットワークを利用して、第1パラメータ調整部3から出力される調整後の制御パラメータを、制御装置5が制御対象実機6の制御で実際に使用する制御パラメータに変換する。具体的には、パラメータ変換部8は、第1パラメータ調整部3が制御パラメータを調整した時の動作条件および制御パラメータの調整結果(調整後の制御パラメータ)が第1パラメータ調整部3から出力されるとこれらを受け取り、受け取った動作条件および調整結果を、保持しているニューラルネットワークに入力し、このときのニューラルネットワークの出力を、第1パラメータ調整部3から受け取った動作条件で制御対象実機6を制御する際の制御パラメータとして制御装置5に出力する。パラメータ変換部8が出力する制御パラメータは、第2パラメータ調整部4が制御対象実機6を動作させて調整を行った制御パラメータと同等の制御パラメータとなる。
以上の第1パラメータ調整部3、第2パラメータ調整部4、パラメータ変換関係学習部7およびパラメータ変換部8で構成されるパラメータ決定部31は、第1パラメータ調整部3が制御パラメータを調整する動作に関する第1の情報と第2パラメータ調整部4が制御パラメータを調整する動作に関する第2の情報との関係を学習した結果に基づいて、複数の動作条件それぞれで制御対象実機6を動作させる際の制御パラメータを動作条件ごとに決定する。本実施の形態においては、第1パラメータ調整部3が特定動作条件で制御パラメータを調整した結果が上記第1の情報に該当し、第2パラメータ調整部4が特定動作条件で制御パラメータを調整した結果が上記第2の情報に該当する。
つづいて、パラメータ調整装置1が制御パラメータを調整する際の全体動作について、図3を用いて説明する。図3は、実施の形態1にかかるパラメータ調整装置1が制御パラメータを調整する動作の一例を示すフローチャートである。
パラメータ調整装置1が制御装置5の制御パラメータを調整する場合、まず、第1パラメータ調整部3が、多様な動作条件下で制御パラメータを導出する第1パラメータ調整ステップを実行する(ステップS11)。すなわち、第1パラメータ調整部3は、動作条件を変更しながらシミュレーション部2にシミュレーションを繰り返し実施させ、シミュレーションの結果に基づいて制御パラメータを更新していくことで、それぞれの動作条件で制御対象実機6を動作させる際の適切な制御パラメータを動作条件ごとに導出する。第1パラメータ調整部3は、オーバーシュート量、整定時間などの制御仕様から構成される評価関数が最小となる制御パラメータの値を、PSO、ベイズ最適化、強化学習などの手法を用いて探索する。
次に、第2パラメータ調整部4が、特定動作条件下で制御パラメータを導出する第2パラメータ調整ステップを実行する(ステップS12)。すなわち、第2パラメータ調整部4は、上記のステップS11で第1パラメータ調整部3が制御パラメータを導出する際に使用した多様な動作条件の中の一部の動作条件である特定動作条件を使用し、制御装置5を介して制御対象実機6を繰り返し動作させる。そして、第2パラメータ調整部4は、制御対象実機6の動作結果に基づいて制御パラメータを更新していくことで、それぞれの特定動作条件で制御対象実機6を動作させる際の適切な制御パラメータを特定動作条件ごとに導出する。第2パラメータ調整部4は、第1パラメータ調整部3と同様に、PSO、ベイズ最適化、強化学習などの手法を用いて、オーバーシュート量、整定時間などの制御仕様から構成される評価関数が最小となる制御パラメータの値を探索する。なお、特定動作条件は上記の学習用動作条件に相当する。
次に、パラメータ変換関係学習部7が、特定動作条件下で導出された制御パラメータ同士の関係を学習して学習モデルを生成する学習モデル生成ステップを実行する(ステップS13)。すなわち、パラメータ変換関係学習部7は、ステップS12で第2パラメータ調整部4が制御パラメータを導出した時の動作条件(特定動作条件)と、ステップS12で第2パラメータ調整部4が導出した制御パラメータと、ステップS11で第1パラメータ調整部3が導出した制御パラメータのうち、特定動作条件下で導出された制御パラメータとの関係を学習することで、パラメータ決定部31による制御パラメータの決定処理で使用する学習モデルを生成する。より詳細には、パラメータ変換関係学習部7は、第1パラメータ調整部3が導出した制御パラメータ、および、第1パラメータ調整部3が制御パラメータを導出した際の動作条件がニューラルネットワーク14に入力されると、入力された動作条件下で第2パラメータ調整部4が導出する制御パラメータと同様の制御パラメータを出力するよう、ニューラルネットワーク14に学習を実施させる。パラメータ変換関係学習部7は、ニューラルネットワーク14の学習が終了すると、学習済みのニューラルネットワーク14を学習モデルとしてパラメータ変換部8に出力する。
次に、パラメータ変換部8が、第1パラメータ調整部3で調整された制御パラメータおよび学習結果に基づいて実機の制御パラメータを導出するパラメータ変換ステップを実行する(ステップS14)。すなわち、パラメータ変換部8は、第1パラメータ調整部3から調整後の制御パラメータおよび制御パラメータの調整時に使用した動作条件を受け取り、受け取った制御パラメータおよび動作条件を、パラメータ変換関係学習部7から受け取った学習済みのニューラルネットワーク14に入力する。そして、パラメータ変換部8は、学習済みのニューラルネットワーク14から出力される制御パラメータを、制御装置5が制御対象実機6を制御する際の制御パラメータである実機の制御パラメータとして、制御装置5に出力する。
このように、第1パラメータ調整部3がシミュレーション部2を利用したシミュレーションにより制御パラメータを調整し、調整後の制御パラメータをパラメータ変換部8が実機の制御パラメータに変換する。そのため、パラメータ調整装置1においては、制御対象実機6を動作させて制御パラメータの調整を行う第2パラメータ調整部4が、制御パラメータの調整に必要な様々な動作条件の中の一部の動作条件について、制御パラメータを導出し、残りの動作条件については、第1パラメータ調整部3がシミュレーションにより導出した制御パラメータをパラメータ変換部8が変換することで、制御装置5が制御対象実機6を制御する際の制御パラメータを導出する。これにより、動作条件を変更しながら制御対象実機6を動作させて制御パラメータを導出する回数を削減することができる。また、制御パラメータの調整に要する時間を削減することができる。なお、上記では第2パラメータ調整部4にて調整を行った一部の動作条件では第2パラメータ調整部4での調整結果を適用する事例を説明したが、第2パラメータ調整部4にて調整を行った動作条件に関しても第1パラメータ調整部3がシミュレーションにより導出した制御パラメータをパラメータ変換部8が変換することで、制御装置5が制御対象実機6を制御する際の制御パラメータを導出しても構わない。
図2に示すパラメータ変換関係学習部7は、ニューラルネットワーク14が、特定動作条件(学習用動作条件)で第1パラメータ調整部3および第2パラメータ調整部4のそれぞれが制御パラメータを調整して得られる調整結果同士の関係を学習する構成であるが、図4に示す構成としてもよい。図4は、パラメータ変換関係学習部7の他の構成例を示す図である。
図4に示すパラメータ変換関係学習部7は、同じ動作条件で第1パラメータ調整部3および第2パラメータ調整部4が制御パラメータを調整したときの、第2パラメータ調整部4による調整結果と第1パラメータ調整部3による調整結果の差をニューラルネットワーク14が学習する構成である。図4に示すように、ニューラルネットワーク14には、第2パラメータ調整部4による調整結果と第1パラメータ調整部3による調整結果の差が入力されるとともに、第1パラメータ調整部3および第2パラメータ調整部4が制御パラメータを調整したときの動作条件が入力される。ニューラルネットワーク14は、動作条件が入力されると、入力された動作条件で第1パラメータ調整部3および第2パラメータ調整部4が制御パラメータを調整したときの第2パラメータ調整部4による調整結果と第1パラメータ調整部3による調整結果の差を出力するように学習を行う。
図4に示す構成のパラメータ変換関係学習部7は、図2に示す構成のパラメータ変換関係学習部7と同様に、学習済みのニューラルネットワーク14を学習モデルとしてパラメータ変換部8に出力する。
パラメータ変換部8は、第1パラメータ調整部3が制御パラメータを調整した時の動作条件および制御パラメータの調整結果(調整後の制御パラメータ)を第1パラメータ調整部3から受け取る。パラメータ変換部8は、受け取った動作条件を、保持しているニューラルネットワークに入力し、このときのニューラルネットワークの出力を、第1パラメータ調整部3から受け取った調整後の制御パラメータに加算して、制御対象実機6を制御する際の制御パラメータを生成する。パラメータ変換部8は、生成した制御パラメータを制御装置5に出力する。
以上のように、本実施の形態にかかるパラメータ調整装置1は、図2に示す構成のパラメータ変換関係学習部7および図4に示す構成のパラメータ変換関係学習部7のいずれを適用した場合も、特定動作条件下で第2パラメータ調整部4が制御パラメータを調整して得られた調整結果である調整後の制御パラメータについては、そのまま制御装置5に送信する。一方、第2パラメータ調整部4が制御パラメータの調整を行わない動作条件下の制御パラメータについては、特定動作条件以外の動作条件下で第1パラメータ調整部3が制御パラメータを調整して得られた調整結果を、パラメータ変換部8が、パラメータ変換関係学習部7で学習したニューラルネットワークを用いて変換することにより導出する。パラメータ変換部8は、導出した制御パラメータを制御装置5に送信する。
本実施の形態にかかるパラメータ調整装置1は、シミュレーションによる制御パラメータの調整結果と実機での制御パラメータの調整結果の関係を学習し、学習結果とシミュレーションによる制御パラメータの調整結果とに基づき、制御対象実機6を動作させて制御パラメータを調整する特定動作条件以外の動作条件の制御パラメータを決定する。そのため、実機を動作させて制御パラメータの調整を行う必要のある動作条件の数を削減し、制御パラメータの調整に要する時間を削減できるという効果が得られる。また、パラメータ調整装置1は、実機を動作させて制御パラメータの調整を行う特定動作条件以外の動作条件の制御パラメータについてもシミュレーションにより適切な値に調整することができる。
実施の形態2.
図5は、実施の形態2にかかるパラメータ調整装置の構成例を示す図である。なお、図5においては、実施の形態1で説明したパラメータ調整装置1(図1参照)と共通の構成要素に同じ符号を付している。また、図5に示す制御装置5および制御対象実機6は図1に示す制御装置5および制御対象実機6と同じものであるため、説明を省略する。本実施の形態では、実施の形態1と異なる構成要素および動作を中心に説明を行う。
実施の形態2にかかるパラメータ調整装置1aは、実施の形態1にかかるパラメータ調整装置1のパラメータ決定部31をパラメータ決定部32に置き換えたものである。パラメータ決定部32は、第1パラメータ調整部3、第2パラメータ調整部4、パラメータ関係学習部9およびパラメータ変換部10を備える。
第1パラメータ調整部3は、実施の形態1と同様に、複数の動作条件それぞれについて、制御装置5の制御パラメータを調整する。ここで、複数の動作条件には、基準となる動作条件である第1の動作条件が含まれる。複数の動作条件のうち、第1の動作条件以外の動作条件は第2の動作条件である。第1パラメータ調整部3は、複数の動作条件それぞれについての制御パラメータの調整が終了すると、調整結果をパラメータ関係学習部9に出力する。一方、第2パラメータ調整部4は、第1の動作条件下で制御パラメータの調整を行い、調整結果を制御装置5およびパラメータ変換部10に出力する。
パラメータ関係学習部9は、第1パラメータ調整部3による制御パラメータの調整結果に基づいて、第1の動作条件での調整結果と、第2の動作条件での調整結果との関係を学習する。パラメータ関係学習部9は、学習動作では、第2パラメータ調整部4が第1の動作条件で制御パラメータを調整した結果から第2の動作条件での制御パラメータの調整結果を導出するための学習モデルを生成する。
図6は、パラメータ関係学習部9の構成例を示す図である。図6に示すように、パラメータ関係学習部9は、実施の形態1で説明したパラメータ変換関係学習部7と同様に、ニューラルネットワーク14を含んで構成される。
パラメータ関係学習部9においては、第1パラメータ調整部3がパラメータ調整を行った時の第2の動作条件と第1の動作条件の差、および、第2の動作条件での調整結果と第1の動作条件での調整結果の差、をニューラルネットワーク14に入力する。ニューラルネットワーク14は、第2の動作条件と第1の動作条件の差が入力されると、第2の動作条件での調整結果と第1の動作条件での調整結果の差を出力するよう、学習を行う。学習済みのニューラルネットワーク14は、学習モデルとしてパラメータ関係学習部9からパラメータ変換部10に出力される。
パラメータ変換部10は、パラメータ関係学習部9で生成された学習モデル(学習済みのニューラルネットワーク14)を受け取って保持している。パラメータ変換部10は、保持しているニューラルネットワークを利用して、第2パラメータ調整部4から出力される、第1の動作条件における制御パラメータの調整結果を、制御装置5が制御対象実機6の制御で実際に使用する制御パラメータに変換する。具体的には、パラメータ変換部10は、第2の動作条件と第1の動作条件の差を、保持しているニューラルネットワークに入力し、このときのニューラルネットワークの出力を、第2パラメータ調整部4から入力された、第1の動作条件での制御パラメータの調整結果に加算し、加算した結果を、第2の動作条件で制御対象実機6を制御する際の制御パラメータとして制御装置5に出力する。パラメータ変換部10が出力する制御パラメータは、第2パラメータ調整部4が第2の動作条件で制御対象実機6を動作させて調整を行った制御パラメータと同等の制御パラメータとなる。
なお、本実施の形態では、第1パラメータ調整部3のみが制御パラメータの調整を行う第2の動作条件(特定動作条件)が、パラメータ決定部32が制御パラメータを決定する際に使用する第1の情報に該当する。また、第2パラメータ調整部4が制御パラメータの調整を行う第1の動作条件(特定動作条件に該当しない動作条件)が、パラメータ決定部32が制御パラメータを決定する際に使用する第2の情報に該当する。
つづいて、パラメータ調整装置1aが制御パラメータを調整する際の全体動作について、図7を用いて説明する。図7は、実施の形態2にかかるパラメータ調整装置1aが制御パラメータを調整する動作の一例を示すフローチャートである。
パラメータ調整装置1aが制御装置5の制御パラメータを調整する場合、まず、第1パラメータ調整部3が、多様な動作条件下で制御パラメータを導出する(ステップS11)。この処理は、実施の形態1で説明した図3のステップS11と同様の処理である。
次に、第2パラメータ調整部4が、特定動作条件下で制御パラメータを導出する(ステップS12)。このステップS12における特定動作条件は、上記の第1の動作条件である。すなわち、第2パラメータ調整部4は、上記のステップS11で第1パラメータ調整部3が制御パラメータを導出する際に使用した多様な動作条件の中の基準の動作条件である第1の動作条件を使用し、制御装置5を介して制御対象実機6を繰り返し動作させる。そして、第2パラメータ調整部4は、制御対象実機6の動作結果に基づいて制御パラメータを更新していくことで、第1の動作条件で制御対象実機6を動作させる際の適切な制御パラメータを導出する。なお、第1の動作条件である特定動作条件は、多様な動作条件の中から任意に選択してよい。
次に、パラメータ関係学習部9が、第1パラメータ調整部3による特定動作条件下での調整結果と、他の動作条件下での調整結果との関係を学習して学習モデルを生成する学習モデル生成ステップを実行する(ステップS21)。具体的には、パラメータ関係学習部9は、第1パラメータ調整部3がパラメータ調整を行った時の特定動作条件以外の動作条件と特定動作条件の差と、第1パラメータ調整部3による特定動作条件以外の動作条件での制御パラメータの調整結果と特定動作条件での制御パラメータの調整結果の差との関係を学習することで、パラメータ決定部32による制御パラメータの決定処理で使用する学習モデルを生成する。より詳細には、パラメータ関係学習部9は、第1パラメータ調整部3が制御パラメータの調整を行った時の特定動作条件以外の動作条件と特定動作条件の差がニューラルネットワーク14に入力されると、第1パラメータ調整部3による特定動作条件以外の動作条件での制御パラメータの調整結果と特定動作条件での制御パラメータの調整結果の差を出力するよう、ニューラルネットワーク14に学習を実施させる。パラメータ関係学習部9は、ニューラルネットワーク14の学習が終了すると、学習済みのニューラルネットワーク14を学習モデルとしてパラメータ変換部10に出力する。
次に、パラメータ変換部10が、第2パラメータ調整部4で調整された制御パラメータおよび学習結果に基づいて実機の制御パラメータを導出するパラメータ変換ステップを実行する(ステップS22)。すなわち、パラメータ変換部10は、第2パラメータ調整部4から調整後の制御パラメータおよび制御パラメータの調整時に使用した特定動作条件を受け取り、受け取った特定動作条件と特定動作条件以外の動作条件との差を、パラメータ関係学習部9から受け取った学習済みのニューラルネットワーク14に入力する。そして、パラメータ変換部10は、学習済みのニューラルネットワーク14の出力を、第2パラメータ調整部4から出力された制御パラメータの調整結果に加算し、加算した結果を、制御装置5が制御対象実機6を制御する際の制御パラメータである実機の制御パラメータとして、制御装置5に出力する。
このように、第1パラメータ調整部3がシミュレーション部2を利用したシミュレーションにより制御パラメータを調整し、調整後の制御パラメータをパラメータ変換部10が実機の制御パラメータに変換する。そのため、パラメータ調整装置1aにおいては、制御対象実機6を動作させて制御パラメータの調整を行う第2パラメータ調整部4が、制御パラメータの調整に必要な様々な動作条件の中の一部の動作条件である第1の動作条件について、制御パラメータを導出し、残りの動作条件である第2の動作条件については、第1パラメータ調整部3がシミュレーションにより導出した制御パラメータをパラメータ変換部8が変換することで、制御装置5が制御対象実機6を制御する際の制御パラメータを導出する。これにより、動作条件を変更しながら制御対象実機6を動作させて制御パラメータを導出する回数を削減することができる。また、制御パラメータの調整に要する時間を削減することができる。
図6に示すパラメータ関係学習部9は、ニューラルネットワーク14が、複数の動作条件の中の第2の動作条件での第1パラメータ調整部3による調整結果と第1の動作条件での第1パラメータ調整部3による調整結果の差を学習する構成であるが、図8に示す構成としてもよい。図8は、パラメータ関係学習部9の他の構成例を示す図である。
図8に示すパラメータ関係学習部9は、第1の動作条件での第1パラメータ調整部3による調整結果と第2の動作条件での第1パラメータ調整部3による調整結果の比を算出する除算部18と、除算部18が算出した比を学習するニューラルネットワーク14とを備える。図8に示すように、ニューラルネットワーク14には、第2の動作条件と第1の動作条件の差が入力されるとともに、第1の動作条件での第1パラメータ調整部3による調整結果と第2の動作条件での第1パラメータ調整部3による調整結果の比が入力される。ニューラルネットワーク14は、第2の動作条件と第1の動作条件の差が入力されると、第1の動作条件での制御パラメータの調整結果と第2の動作条件での制御パラメータの調整結果の比を出力するように学習を行う。
図8に示す構成のパラメータ関係学習部9は、図6に示す構成のパラメータ関係学習部9と同様に、学習済みのニューラルネットワーク14を学習モデルとしてパラメータ変換部10に出力する。
パラメータ変換部10は、第2パラメータ調整部4が第1の動作条件で制御パラメータを調整した結果を第2パラメータ調整部4から受け取ると、第1の動作条件と第2の動作条件の差を、保持しているニューラルネットワークに入力し、このときのニューラルネットワークの出力を、第2パラメータ調整部4から受け取った調整後の制御パラメータに乗算して、制御対象実機6を制御する際の制御パラメータを生成する。パラメータ変換部10は、生成した制御パラメータを制御装置5に出力する。
以上のように、本実施の形態にかかるパラメータ調整装置1aは、図6に示す構成のパラメータ関係学習部9および図8に示す構成のパラメータ関係学習部9のいずれを適用した場合も、第2パラメータ調整部4が第1の動作条件下で制御パラメータを調整して得られた調整結果である調整後の制御パラメータについては、そのまま制御装置5に送信する。一方、第2パラメータ調整部4が制御パラメータの調整を行わない第2の動作条件下の制御パラメータについては、第2の動作条件下で第1パラメータ調整部3が制御パラメータを調整して得られた調整結果を、パラメータ変換部10が、パラメータ関係学習部9で学習したニューラルネットワークを用いて変換することにより導出する。パラメータ変換部10は、導出した制御パラメータを制御装置5に送信する。
本実施の形態にかかるパラメータ調整装置1aは、基準の動作条件である第1の動作条件でのシミュレーションによる制御パラメータの調整結果と、第2の動作条件でのシミュレーションによる制御パラメータの調整結果との関係を学習し、学習結果と第1の動作条件での実機による制御パラメータの調整結果とに基づき、第2の動作条件の制御パラメータを決定する。そのため、実機で調整を行う必要のある動作条件の数を削減し、制御パラメータの調整に要する時間を削減できるという効果が得られる。また、パラメータ調整装置1aは、実機を動作させて制御パラメータの調整を行う第1の動作条件以外の第2の動作条件の制御パラメータについてもシミュレーションにより適切な値に調整することができる。
実施の形態3.
図9は、実施の形態3にかかるパラメータ調整装置の構成例を示す図である。なお、図9においては、実施の形態1で説明したパラメータ調整装置1(図1参照)と共通の構成要素に同じ符号を付している。また、図9に示す制御装置5および制御対象実機6は図1に示す制御装置5および制御対象実機6と同じものであるため、説明を省略する。本実施の形態では、実施の形態1と異なる構成要素および動作を中心に説明を行う。
実施の形態3にかかるパラメータ調整装置1bは、実施の形態1にかかるパラメータ調整装置1のパラメータ決定部31をパラメータ決定部33に置き換えたものである。パラメータ決定部33は、第1パラメータ調整部3、第2パラメータ調整部4、仕様変換関係学習部11および仕様変換部12を備える。
第1パラメータ調整部3は、実施の形態1と同様に、複数の動作条件それぞれについて、制御装置5の制御パラメータを調整する。第1パラメータ調整部3は、複数の動作条件それぞれについての制御パラメータの調整が終了すると、調整後の制御パラメータを制御装置5に出力する。なお、第1パラメータ調整部3は、制御仕様が仕様変換部12によって適切な値に調整された状態で制御パラメータを調整する。ここで、制御仕様とは、整定時間およびオーバーシュート量といった、制御パラメータの調整の指針となる値のことである。詳細については後述するが、仕様変換部12は、仕様変換関係学習部11で生成された学習モデルと、第1パラメータ調整部3が制御パラメータの調整で使用する動作条件とに基づいて、第1パラメータ調整部3が使用する調整後の制御仕様を生成する。
第2パラメータ調整部4は、複数の動作条件の中の一部の動作条件について、実機を用いて制御パラメータの調整を行う。第2パラメータ調整部4は、制御パラメータの調整が完了すると、制御パラメータの調整結果、調整で使用した動作条件および制御仕様を仕様変換関係学習部11に出力する。第2パラメータ調整部4は、制御パラメータの調整結果については、仕様変換関係学習部11に加えて制御装置5にも出力する。
仕様変換関係学習部11は、第1パラメータ調整部3が制御パラメータを調整する際の制御仕様と第2パラメータ調整部4が制御パラメータを調整する際の制御仕様の関係を学習する。具体的には、仕様変換関係学習部11は、第1パラメータ調整部3および第2パラメータ調整部4が同じ動作条件で制御パラメータを調整した結果が同等となる場合の第1パラメータ調整部3の制御仕様と第2パラメータ調整部4の制御仕様との関係を学習する。仕様変換関係学習部11は、学習動作では、第2パラメータ調整部4の制御仕様から第1パラメータ調整部3の制御仕様を導出するための学習モデルを生成する。
図10は、仕様変換関係学習部11の構成例を示す図である。図10に示すように、仕様変換関係学習部11は、制御仕様値学習部15および仕様変換関数学習部16を備える。
制御仕様値学習部15は、第1パラメータ調整部3が制御パラメータを調整する際に使用する制御仕様の値(以下、制御仕様値とする)を調整する。具体的には、制御仕様値学習部15は、第1パラメータ調整部3による制御パラメータの調整結果と第2パラメータ調整部4による制御パラメータの調整結果とが同等となるよう、第1パラメータ調整部3が使用する制御仕様値を調整する。制御仕様値学習部15は、以下のようにして第1パラメータ調整部3が使用する制御仕様値を調整する。まず、制御仕様値学習部15は、第2パラメータ調整部4が制御パラメータの調整で用いた制御仕様値、すなわち、第2パラメータ調整部4から出力される制御仕様の値を初期値として第1パラメータ調整部3に出力する。第1パラメータ調整部3は、制御仕様値学習部15から入力された制御仕様値を用いて制御パラメータの調整を行い、調整結果を制御仕様値学習部15に出力する。次に、制御仕様値学習部15は、第1パラメータ調整部3から出力された調整結果と、第2パラメータ調整部4による調整結果とを比較し、第1パラメータ調整部3による調整結果と第2パラメータ調整部4による調整結果の差が小さくなるように、第1パラメータ調整部3に出力する制御仕様値を更新する。制御仕様値学習部15は、PSO、GA、ベイズ最適化などを用いて制御仕様値を更新する。更新後の制御仕様値は第1パラメータ調整部3に出力され、第1パラメータ調整部3は更新後の制御仕様値を用いて再度制御パラメータを調整して調整結果を制御仕様値学習部15に出力する。このような動作を制御仕様値学習部15は繰り返し実行し、第1パラメータ調整部3による調整結果と第2パラメータ調整部4による調整結果の差が定められた規定値以下になれば、学習を完了し、学習した第1パラメータ調整部3の制御仕様値として、仕様変換関数学習部16に出力する。
図11は、仕様変換関数学習部16の構成例を示す図である。図11に示すように、仕様変換関数学習部16は、ニューラルネットワーク14を含んで構成される。仕様変換関数学習部16においては、第1パラメータ調整部3の制御仕様値と第2パラメータ調整部4の制御仕様値の差と、第2パラメータ調整部4の動作条件とをニューラルネットワーク14に入力する。ニューラルネットワーク14は、動作条件が入力されると第1パラメータ調整部3の制御仕様値と第2パラメータ調整部4の制御仕様値の差を出力するよう、学習を行う。学習済みのニューラルネットワーク14は、学習モデルとして仕様変換関係学習部11から仕様変換部12に出力される。
仕様変換部12は、仕様変換関係学習部11で生成された学習モデル(学習済みのニューラルネットワーク14)を受け取って保持している。また、仕様変換部12には、第1パラメータ調整部3が制御パラメータを調整する際に使用する動作条件および制御仕様値が入力される。仕様変換部12は、第1パラメータ調整部3から動作条件および制御仕様値が入力されると、保持しているニューラルネットワークを利用して、入力された動作条件および制御仕様値から、第1パラメータ調整部3が制御パラメータを調整する際に使用する、調整後の制御仕様値を生成する。具体的には、仕様変換部12は、動作条件を、保持しているニューラルネットワークに入力し、このときのニューラルネットワークの出力を、第1パラメータ調整部3から入力された制御仕様値に加算して、調整後の制御仕様値を生成する。仕様変換部12は、調整後の制御仕様値を第1パラメータ調整部3に出力する。第1パラメータ調整部3は、仕様変換部12から入力される調整後の制御仕様値を用いて制御パラメータを調整し、調整後の制御パラメータを制御装置5に送信する。
なお、本実施の形態では、第1パラメータ調整部3の制御仕様値が、パラメータ決定部33が制御パラメータを決定する際に使用する第1の情報に該当し、第2パラメータ調整部4の制御仕様値が、パラメータ決定部33が制御パラメータを決定する際に使用する第2の情報に該当する。
つづいて、パラメータ調整装置1bが制御パラメータを調整する際の全体動作について、図12を用いて説明する。図12は、実施の形態3にかかるパラメータ調整装置1bが制御パラメータを調整する動作の一例を示すフローチャートである。
パラメータ調整装置1bが制御装置5の制御パラメータを調整する場合、まず、第2パラメータ調整部4が、特定動作条件下で制御パラメータを導出する(ステップS12)。この処理は、実施の形態1で説明した図3のステップS12と同様の処理である。
次に、仕様変換関係学習部11が、第2パラメータ調整部4の制御仕様値と、第2パラメータ調整部4による制御パラメータの調整結果とに基づいて、第1パラメータ調整部3の制御仕様値を導出する(ステップS31)。具体的には、仕様変換関係学習部11の制御仕様値学習部15が、第2パラメータ調整部4がステップS12で制御パラメータを導出した際の特定動作条件と同じ動作条件にて、第1パラメータ調整部3に制御パラメータの調整を繰り返し実行させ、第1パラメータ調整部3による調整結果が第2パラメータ調整部4による調整結果に近づくよう制御仕様値を更新していくことで、特定動作条件に対応する第1パラメータ調整部3の制御仕様値を導出する。特定動作条件に対応する第1パラメータ調整部3の制御仕様値とは、第1パラメータ調整部3が特定動作条件で制御パラメータを調整する際に使用する制御仕様値である。上述したように、制御仕様値学習部15は、制御仕様値の更新ではPSO、GA、ベイズ最適化などを用いる。
次に、仕様変換関係学習部11が、動作条件と、第1パラメータ調整部3の制御仕様値と、第2パラメータ調整部4の制御仕様値との関係を学習して学習モデルを生成する学習モデル生成ステップを実行する(ステップS32)。ここでの第1パラメータ調整部3の制御仕様値はステップS31で導出した制御仕様値である。ステップS32では、具体的には、仕様変換関係学習部11の仕様変換関数学習部16が、第2パラメータ調整部4の動作条件と、第1パラメータ調整部3の制御仕様値と第2パラメータ調整部4の制御仕様値の差との関係を学習することで、パラメータ決定部33による制御パラメータの決定処理で使用する学習モデルを生成する。より詳細には、仕様変換関数学習部16は、動作条件がニューラルネットワーク14に入力されると、第1パラメータ調整部3の制御仕様値と第2パラメータ調整部4の制御仕様値の差を出力するよう、ニューラルネットワーク14に学習を実施させる。仕様変換関係学習部11は、仕様変換関数学習部16によるニューラルネットワーク14の学習が終了すると、学習済みのニューラルネットワーク14を学習モデルとして仕様変換部12に出力する。
次に、仕様変換部12が、仕様変換関係学習部11による学習結果に基づいて第1パラメータ調整部3の制御仕様値を導出する仕様変換ステップを実行する(ステップS33)。具体的には、仕様変換部12は、第1パラメータ調整部3で制御パラメータを調整する動作条件を取得し、取得した動作条件を、仕様変換関係学習部11から受け取った学習済みのニューラルネットワーク14に入力する。そして、仕様変換部12は、学習済みのニューラルネットワーク14の出力を、第2パラメータ調整部4の対応する制御仕様値に加算し、加算結果を第1パラメータ調整部3の制御仕様値として第1パラメータ調整部3に出力する。ここで、学習済みのニューラルネットワーク14に入力する動作条件はユーザが指定する。すなわち、仕様変換部12は、動作条件の指定をユーザから受け付け、受け付けた動作条件を学習済みのニューラルネットワーク14への入力とする。なお、ユーザから指定を受け付ける動作条件は、制御パラメータを調整する際に使用する複数の動作条件のうち、上記のステップS12で第2パラメータ調整部4が制御パラメータを導出する特定動作条件には該当しない動作条件である。また、第2パラメータ調整部4の対応する制御仕様値とは、学習済みのニューラルネットワーク14に入力する動作条件で第2パラメータ調整部4が制御パラメータを調整する場合に第2パラメータ調整部4が使用する制御仕様値である。この制御仕様値は仕様変換部12がユーザからの入力を受け付けることで取得してもよいし、仕様変換部12が第2パラメータ調整部4から該当の制御仕様値を取得してもよい。
次に、第1パラメータ調整部3が、仕様変換部12で導出された制御仕様値を用いて、実機の制御パラメータを導出する制御パラメータ生成ステップを実行する(ステップS34)。すなわち、第1パラメータ調整部3は、仕様変換部12で導出された制御仕様値を使用してシミュレーション部2がシミュレーションを実行した結果に基づいて、制御パラメータを導出する。
以上のように、本実施の形態にかかるパラメータ調整装置1bは、第2パラメータ調整部4が特定動作条件下で制御パラメータを調整して得られた調整結果である調整後の制御パラメータについては、そのまま制御装置5に送信する。一方、第2パラメータ調整部4が制御パラメータの調整を行わない動作条件下の制御パラメータについては、第1パラメータ調整部3の制御仕様値と、第2パラメータ調整部4の制御仕様値と、動作条件との関係を学習した結果に基づいて導出した制御仕様値を使用して第1パラメータ調整部3が調整を行う。なお、上記では第2パラメータ調整部4が特定動作条件下で制御パラメータを調整して得られた調整結果である調整後の制御パラメータについては、そのまま制御装置5に送信する事例を説明したが、第2パラメータ調整部4が調整した特定動作条件の場合も、第1パラメータ調整部3の制御仕様値と、第2パラメータ調整部4の制御仕様値と、動作条件との関係を学習した結果に基づいて導出した制御仕様値を使用して第1パラメータ調整部3が調整を行っても構わない。
本実施の形態にかかるパラメータ調整装置1bは、実機での制御パラメータの調整結果とシミュレーションによる制御パラメータの調整結果の差が規定値以下となるように制御仕様値を変換する仕様変換関係を学習し、学習結果に基づいて、シミュレーションによる制御パラメータの調整で使用する制御仕様値を導出するため、実機での制御パラメータの調整結果と同等の調整結果をシミュレーションによる調整動作で得ることができる。また、実機で調整を行う必要のある動作条件の数を削減し、制御パラメータの調整に要する時間を削減できるという効果が得られる。
実施の形態4.
図13は、実施の形態4にかかるパラメータ調整装置の構成例を示す図である。なお、図13においては、実施の形態1で説明したパラメータ調整装置1(図1参照)と共通の構成要素に同じ符号を付している。また、図13に示す制御装置5および制御対象実機6は図1に示す制御装置5および制御対象実機6と同じものであるため、説明を省略する。本実施の形態では、実施の形態1と異なる構成要素および動作を中心に説明を行う。
実施の形態4にかかるパラメータ調整装置1cは、実施の形態1にかかるパラメータ調整装置1のパラメータ決定部31をパラメータ決定部34に置き換えたものである。パラメータ決定部34は、第1パラメータ調整部3、第2パラメータ調整部4および補正モデル学習部13を備える。本実施の形態では、シミュレーション部2を構成するシミュレータが、第1パラメータ調整部3の調整結果と第2パラメータ調整部4の調整結果との差を小さくするための補正モデルを内部に備えるものとする。
第1パラメータ調整部3は、実施の形態1と同様に、複数の動作条件それぞれについて、制御装置5の制御パラメータを調整する。なお、第1パラメータ調整部3が制御パラメータを調整する際に利用するシミュレーション部2が備える補正モデルは補正モデル学習部13によって生成される。詳細については後述するが、第1パラメータ調整部3は、補正モデル学習部13が補正モデルを作成するための学習が完了するまでの間は、制御パラメータの調整結果(調整後の制御パラメータ)を補正モデル学習部13に出力する。第1パラメータ調整部3は、補正モデル学習部13が補正モデルを作成するための学習が完了した後は、複数の動作条件それぞれについての制御パラメータの調整結果を制御装置5に出力する。
第2パラメータ調整部4は、複数の動作条件の中の一部の動作条件について、実機を用いて制御パラメータの調整を行う。第2パラメータ調整部4は、制御パラメータの調整が完了すると、制御パラメータの調整結果および調整で使用した動作条件を補正モデル学習部13に出力する。第2パラメータ調整部4は、制御パラメータの調整結果については、補正モデル学習部13に加えて制御装置5にも出力する。
補正モデル学習部13は、第1パラメータ調整部3による制御パラメータの調整結果と、第2パラメータ調整部4による制御パラメータの調整結果との関係を学習し、シミュレーション部2を構成する補正モデルを生成する。
図14は、補正モデル学習部13の構成例を示す図である。図13に示すように、補正モデル学習部13は、補正モデルパラメータ学習部17を含んで構成される。
補正モデルパラメータ学習部17は内部に補正モデルのパラメータ(以下、補正モデルパラメータとする)の初期値を記憶しており、以下に示す手順で補正モデルを生成する。まず、補正モデルパラメータ学習部17は、第2パラメータ調整部4が制御パラメータを調整する際に使用した動作条件を第1パラメータ調整部3に出力して制御パラメータの調整を指示するとともに、記憶している補正モデルパラメータの初期値をシミュレーション部2に出力する。第1パラメータ調整部3は、補正モデルパラメータ学習部17から入力された動作条件それぞれを使用して制御パラメータの調整を実施し、調整結果を補正モデルパラメータ学習部17に出力する。第1パラメータ調整部3による制御パラメータの調整が終了すると、補正モデルパラメータ学習部17は、第2パラメータ調整部4による調整結果と第1パラメータ調整部3による調整結果の差が小さくなるよう、シミュレーション部2に送信する補正モデルパラメータを更新する。補正モデルパラメータ学習部17は、PSO、GA、ベイズ最適化などを用いて補正モデルパラメータを更新する。次に、補正モデルパラメータ学習部17は、更新後の補正モデルパラメータをシミュレーション部2に送信するとともに、第1パラメータ調整部3に制御パラメータの再調整を指示する。この指示を受けた第1パラメータ調整部3は制御パラメータの再調整を実施し、調整結果を補正モデルパラメータ学習部17に出力する。このような動作を補正モデルパラメータ学習部17は繰り返し実行し、第1パラメータ調整部3による調整結果と第2パラメータ調整部4による調整結果の差が定められた規定値以下になれば、学習を完了し、その時点の補正モデルパラメータを最終的な補正モデルパラメータとしてシミュレーション部2に出力する。
なお、本実施の形態では、第1パラメータ調整部3が特定動作条件で制御パラメータを調整した結果が、パラメータ決定部34が制御パラメータを決定する際に使用する第1の情報に該当し、第2パラメータ調整部4が特定動作条件で制御パラメータを調整した結果が、パラメータ決定部34が制御パラメータを決定する際に使用する第2の情報に該当する。
つづいて、パラメータ調整装置1cが制御パラメータを調整する際の全体動作について、図15を用いて説明する。図15は、実施の形態4にかかるパラメータ調整装置1cが制御パラメータを調整する動作の一例を示すフローチャートである。
パラメータ調整装置1cが制御装置5の制御パラメータを調整する場合、まず、第2パラメータ調整部4が、特定動作条件下で制御パラメータを導出する(ステップS12)。この処理は、実施の形態1で説明した図3のステップS12と同様の処理である。
次に、補正モデル学習部13が、第2パラメータ調整部4による制御パラメータの調整結果と、第2パラメータ調整部4が制御パラメータを調整した時の動作条件と、に基づいて、シミュレーション部2の補正モデルパラメータを更新することで、パラメータ決定部34による制御パラメータの決定処理で使用する学習モデルを生成する(ステップS41)。このステップS41は学習モデル生成ステップである。すなわち、補正モデル学習部13は、同じ動作条件下での第1パラメータ調整部3による制御パラメータの調整結果と第2パラメータ調整部4による制御パラメータの調整結果の差が規定値以下となるよう、シミュレーション部2の補正モデルパラメータを探索して決定する。補正モデルパラメータを探索は上述した補正モデルパラメータ学習部17が行う。
次に、第1パラメータ調整部3が、実機の制御パラメータを導出する制御パラメータ生成ステップを実行する(ステップS42)。すなわち、第1パラメータ調整部3は、ステップS41で内部の補正モデルのパラメータが更新された状態のシミュレーション部2に様々な動作条件でのシミュレーションを実行させ、シミュレーションの結果に基づいて制御パラメータを調整する。第1パラメータ調整部3は、制御パラメータの調整が終了すると、調整結果を制御装置5に出力する。
以上のように、本実施の形態にかかるパラメータ調整装置1cは、第2パラメータ調整部4が特定動作条件下で制御パラメータを調整して得られた調整結果である調整後の制御パラメータについては、そのまま制御装置5に送信する。一方、第2パラメータ調整部4が制御パラメータの調整を行わない動作条件下の制御パラメータについては、第1パラメータ調整部3が、実機による制御パラメータの調整結果とシミュレーションによる制御パラメータの調整結果の差が小さくなるようにパラメータを学習済みの補正モデルを備えるシミュレーション部2でのシミュレーション結果に基づいて調整を行う。なお、上記では第2パラメータ調整部4が特定動作条件下で制御パラメータを調整して得られた調整結果である調整後の制御パラメータについては、そのまま制御装置5に送信する事例を説明したが、第2パラメータ調整部4が調整した特定動作条件の場合も、第1パラメータ調整部3が、実機による制御パラメータの調整結果とシミュレーションによる制御パラメータの調整結果の差が小さくなるようにパラメータを学習済みの補正モデルを備えるシミュレーション部2でのシミュレーション結果に基づいて調整を行っても構わない。
本実施の形態にかかるパラメータ調整装置1cは、実機での制御パラメータの調整結果とシミュレーションによる制御パラメータの調整結果が規定値以下となるようにパラメータを調整した補正モデルを使用してシミュレーションを行い、シミュレーション結果に基づいて制御パラメータを調整することが可能であるため、実機で調整を行う必要のある動作条件の数を削減し、制御パラメータの調整に要する時間を削減できるという効果が得られる。また、パラメータ調整装置1cは、実機を動作させて制御パラメータの調整を行う特定動作条件以外の動作条件の制御パラメータについてもシミュレーションにより適切な値に調整することができる。
つづいて、上述の各実施の形態にかかるパラメータ調整装置(パラメータ調整装置1,1a,1b,1c)のハードウェア構成について説明する。各パラメータ調整装置(パラメータ調整装置1,1a,1b,1c)のハードウェア構成は同一であるため、一例として、実施の形態1にかかるパラメータ調整装置1のハードウェア構成について説明する。図16は、パラメータ調整装置1を実現するハードウェアの一例を示す図である。
実施の形態1にかかるパラメータ調整装置1は、演算装置101、記憶装置102およびインタフェース回路103により実現することができる。演算装置101の例は、CPU(Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、DSP(Digital Signal Processor)ともいう)、システムLSI(Large Scale Integration)などである。記憶装置102の例は、RAM(Random Access Memory)、ROM(Read Only Memory)、ハードディスクドライブ、SSD(Solid State Drive)、着脱可能なメモリデバイス、またはこれらを組み合わせたものである。
パラメータ調整装置1のシミュレーション部2、第1パラメータ調整部3、第2パラメータ調整部4、パラメータ変換関係学習部7およびパラメータ変換部8は、これらの各部として動作するためのプログラムを演算装置101が実行することにより実現される。シミュレーション部2、第1パラメータ調整部3、第2パラメータ調整部4、パラメータ変換関係学習部7およびパラメータ変換部8として動作するためのプログラムは記憶装置102に予め格納されている。演算装置101は、上記のプログラムを記憶装置102から読み出して実行することにより、シミュレーション部2、第1パラメータ調整部3、第2パラメータ調整部4、パラメータ変換関係学習部7およびパラメータ変換部8として動作する。
記憶装置102は、上記のプログラムを保持するとともに、演算装置101が各種処理を実行する際の一時メモリとしても使用される。インタフェース回路103は、パラメータ調整装置1が制御装置5との間でデータを送受信する際に使用される。
なお、パラメータ調整装置1の各部として動作するための上記のプログラムは記憶装置102に予め格納されているものとしたがこれに限定されない。上記のプログラムは、CD(Compact Disc)-ROM、DVD(Digital Versatile Disc)-ROMなどの記録媒体に書き込まれた状態でユーザに供給され、ユーザが記憶装置102にインストールする形態であってもよい。また、上記のプログラムは、インターネットなどのネットワークを介してユーザに提供される形態であってもよい。
なお、上述した各実施の形態では、制御パラメータの調整が必要な複数の動作条件の一部である特定動作条件についての制御パラメータを第2パラメータ調整部4が調整し、残りの動作条件についての制御パラメータを第1パラメータ調整部3が調整することとしたが、全ての動作条件についての制御パラメータを第1パラメータ調整部3が調整するようにしてもよい。すなわち、第2パラメータ調整部4による特定動作条件についての制御パラメータの調整結果は、各実施の形態で説明した学習モデルを生成する学習動作でのみ使用するようにしてもよい。
以上の実施の形態に示した構成は、一例を示すものであり、別の公知の技術と組み合わせることも可能であるし、実施の形態同士を組み合わせることも可能であるし、要旨を逸脱しない範囲で、構成の一部を省略、変更することも可能である。
1,1a,1b,1c パラメータ調整装置、2 シミュレーション部、3 第1パラメータ調整部、4 第2パラメータ調整部、5 制御装置、6 制御対象実機、7 パラメータ変換関係学習部、8,10 パラメータ変換部、9 パラメータ関係学習部、11 仕様変換関係学習部、12 仕様変換部、13 補正モデル学習部、14 ニューラルネットワーク、15 制御仕様値学習部、16 仕様変換関数学習部、17 補正モデルパラメータ学習部、18 除算部、31,32,33,34 パラメータ決定部。

Claims (8)

  1. 制御装置が実機を制御する際に使用する制御パラメータを調整するパラメータ調整装置であって、
    前記実機の挙動のシミュレーション結果に基づいて前記制御パラメータを調整する第1パラメータ調整部と、
    前記実機の挙動に基づいて前記制御パラメータを調整する第2パラメータ調整部と、
    前記第1パラメータ調整部による前記制御パラメータの調整結果である第1の調整結果と前記第2パラメータ調整部による前記制御パラメータの調整結果である第2の調整結果の関係を学習し前記制御パラメータの決定処理で使用する学習モデルを生成するパラメータ変換関係学習部と、
    前記第1の調整結果を前記学習モデルに基づいて変換して前記制御パラメータを生成するパラメータ変換部と、
    を備えることを特徴とするパラメータ調整装置。
  2. 制御装置が実機を制御する際に使用する制御パラメータを調整するパラメータ調整装置であって、
    前記実機の挙動のシミュレーション結果に基づいて前記制御パラメータを調整する第1パラメータ調整部と、
    前記実機の挙動に基づいて前記制御パラメータを調整する第2パラメータ調整部と、
    前記第1パラメータ調整部による前記制御パラメータの調整結果である第1の調整結果のうち、前記第2パラメータ調整部が前記制御パラメータを調整する際に前記実機を動作させる動作条件である特定動作条件でのシミュレーション結果に基づく第1の調整結果と、前記第1の調整結果のうち、前記特定動作条件に該当しない動作条件でのシミュレーション結果に基づく第1の調整結果との関係を学習し前記制御パラメータの決定処理で使用する学習モデルを生成するパラメータ関係学習部と、
    前記第2パラメータ調整部による前記制御パラメータの調整結果である第2の調整結果を前記学習モデルに基づいて変換して前記制御パラメータを生成するパラメータ変換部と、
    を備えることを特徴とするパラメータ調整装置。
  3. 制御装置が実機を制御する際に使用する制御パラメータを調整するパラメータ調整装置であって、
    前記実機の挙動のシミュレーション結果に基づいて前記制御パラメータを調整する第1パラメータ調整部と、
    前記実機の挙動に基づいて前記制御パラメータを調整する第2パラメータ調整部と、
    前記第1パラメータ調整部による前記制御パラメータの調整結果である第1の調整結果と前記第2パラメータ調整部による前記制御パラメータの調整結果である第2の調整結果とにおいて、前記第1パラメータ調整部および前記第2パラメータ調整部が同じ動作条件で前記制御パラメータを調整したときの前記第1の調整結果と前記第2の調整結果が同等となる場合の、前記第1パラメータ調整部が前記制御パラメータを調整する際の制御仕様値と前記第2パラメータ調整部が前記制御パラメータを調整する際の制御仕様値との関係を学習し前記制御パラメータの決定処理で使用する学習モデルを生成する仕様変換関係学習部と、
    前記第1パラメータ調整部が前記制御パラメータの調整を行う動作条件と、前記学習モデルとに基づいて前記第1パラメータ調整部の制御仕様値を生成する仕様変換部と、
    を備え、
    前記第1パラメータ調整部は、前記仕様変換部で生成された前記制御仕様値を使用して前記シミュレーション結果に基づく前記制御パラメータの調整を行い、前記制御パラメータを生成する、
    ことを特徴とするパラメータ調整装置。
  4. 制御装置が実機を制御する際に使用する制御パラメータを調整するパラメータ調整装置であって、
    前記実機の挙動のシミュレーション結果に基づいて前記制御パラメータを調整する第1パラメータ調整部と、
    前記実機の挙動に基づいて前記制御パラメータを調整する第2パラメータ調整部と、
    を備え、
    前記第1パラメータ調整部による前記制御パラメータの調整結果である第1の調整結果および前記第2パラメータ調整部による前記制御パラメータの調整結果である第2の調整結果のうち、少なくとも前記第1の調整結果を用いた学習を行い、前記制御パラメータの決定処理で使用する学習モデルを生成し、
    前記学習モデルは前記実機の挙動のシミュレーションで使用される補正モデルであり、
    前記第1の調整結果および前記第2の調整結果に基づいて、前記第1の調整結果と前記第2の調整結果の差が小さくなるように前記補正モデルのパラメータを更新する補正モデル学習部、
    を備え、
    前記第1パラメータ調整部は、前記パラメータの更新が完了した後の前記補正モデルを使用したシミュレーション結果に基づいて前記制御パラメータを生成する、
    ことを特徴とするパラメータ調整装置。
  5. 制御装置が実機を制御する際に使用する制御パラメータをパラメータ調整装置が調整するパラメータ調整方法であって、
    前記実機の挙動のシミュレーション結果に基づいて前記制御パラメータを調整する第1パラメータ調整ステップと、
    前記実機の挙動に基づいて前記制御パラメータを調整する第2パラメータ調整ステップと、
    第1パラメータ調整ステップにおける前記制御パラメータの調整結果である第1の調整結果と前記第2パラメータ調整ステップにおける前記制御パラメータの調整結果である第2の調整結果の関係を学習し前記制御パラメータの決定処理で使用する学習モデルを生成する学習モデル生成ステップと
    前記第1の調整結果を前記学習モデルに基づいて変換して前記制御パラメータを生成するパラメータ変換ステップ
    を含むことを特徴とするパラメータ調整方法。
  6. 制御装置が実機を制御する際に使用する制御パラメータをパラメータ調整装置が調整するパラメータ調整方法であって、
    前記実機の挙動のシミュレーション結果に基づいて前記制御パラメータを調整する第1パラメータ調整ステップと、
    前記実機の挙動に基づいて前記制御パラメータを調整する第2パラメータ調整ステップと、
    第1パラメータ調整ステップにおける前記制御パラメータの調整結果である第1の調整結果のうち、前記第2パラメータ調整ステップが前記制御パラメータを調整する際に前記実機を動作させる動作条件である特定動作条件でのシミュレーション結果に基づく第1の調整結果と、前記第1の調整結果のうち、前記特定動作条件に該当しない動作条件でのシミュレーション結果に基づく前記第1の調整結果との関係を学習し前記制御パラメータの決定処理で使用する学習モデルを生成する学習モデル生成ステップと
    前記第2パラメータ調整ステップにおける前記制御パラメータの調整結果である第2の調整結果を前記学習モデルに基づいて変換して前記制御パラメータを生成するパラメータ変換ステップ
    を含むことを特徴とするパラメータ調整方法。
  7. 制御装置が実機を制御する際に使用する制御パラメータをパラメータ調整装置が調整するパラメータ調整方法であって、
    前記実機の挙動のシミュレーション結果に基づいて前記制御パラメータを調整する第1パラメータ調整ステップと、
    前記実機の挙動に基づいて前記制御パラメータを調整する第2パラメータ調整ステップと、
    前記第1パラメータ調整ステップにおける前記制御パラメータの調整結果である第1の調整結果と前記第2パラメータ調整ステップにおける前記制御パラメータの調整結果である第2の調整結果とにおいて、前記第1パラメータ調整ステップおよび前記第2パラメータ調整ステップにおいて同じ動作条件で前記制御パラメータを調整したときの前記第1の調整結果と前記第2の調整結果が同等となる場合の、前記第1パラメータ調整ステップにおいて前記制御パラメータを調整する際の制御仕様値と前記第2パラメータ調整ステップにおいて前記制御パラメータを調整する際の制御仕様値との関係を学習し前記制御パラメータの決定処理で使用する学習モデルを生成する学習モデル生成ステップと
    前記第1パラメータ調整ステップにおいて前記制御パラメータの調整を行う動作条件と、前記学習モデルとに基づいて、前記シミュレーション結果に基づいて前記制御パラメータを調整する際に使用する制御仕様値を生成する仕様変換ステップと、
    前記仕様変換ステップで生成した前記制御仕様値を使用して前記シミュレーション結果に基づく前記制御パラメータの調整を行い、前記制御パラメータを生成する制御パラメータ生成ステップと、
    を含むことを特徴とするパラメータ調整方法。
  8. 制御装置が実機を制御する際に使用する制御パラメータをパラメータ調整装置が調整するパラメータ調整方法であって、
    前記実機の挙動のシミュレーション結果に基づいて前記制御パラメータを調整する第1パラメータ調整ステップと、
    前記実機の挙動に基づいて前記制御パラメータを調整する第2パラメータ調整ステップと、
    前記第1パラメータ調整ステップにおける前記制御パラメータの調整結果である第1の調整結果および前記第2パラメータ調整ステップにおける前記制御パラメータの調整結果である第2の調整結果のうち、少なくとも前記第1の調整結果を用いた学習を行い、前記制御パラメータの決定処理で使用する学習モデルを生成する学習モデル生成ステップと、
    を含み、
    前記学習モデルは前記実機の挙動のシミュレーションで使用される補正モデルであり、
    前記学習モデル生成ステップでは、前記第1の調整結果および前記第2の調整結果に基づいて、前記第1の調整結果と前記第2の調整結果の差が小さくなるように前記補正モデルのパラメータを更新し、
    前記パラメータの更新が完了した後の前記補正モデルを使用したシミュレーション結果に基づいて前記制御パラメータを生成する制御パラメータ生成ステップ、
    を含むことを特徴とするパラメータ調整方法。
JP2022557233A 2020-10-12 2020-10-12 パラメータ調整装置およびパラメータ調整方法 Active JP7305061B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/038475 WO2022079761A1 (ja) 2020-10-12 2020-10-12 パラメータ調整装置およびパラメータ調整方法

Publications (3)

Publication Number Publication Date
JPWO2022079761A1 JPWO2022079761A1 (ja) 2022-04-21
JPWO2022079761A5 JPWO2022079761A5 (ja) 2022-12-21
JP7305061B2 true JP7305061B2 (ja) 2023-07-07

Family

ID=81207767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022557233A Active JP7305061B2 (ja) 2020-10-12 2020-10-12 パラメータ調整装置およびパラメータ調整方法

Country Status (4)

Country Link
JP (1) JP7305061B2 (ja)
CN (1) CN116075782A (ja)
DE (1) DE112020007693T5 (ja)
WO (1) WO2022079761A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011136160A1 (ja) 2010-04-26 2011-11-03 三菱電機株式会社 サーボ制御装置
JP2017157112A (ja) 2016-03-03 2017-09-07 三菱日立パワーシステムズ株式会社 制御パラメータ自動調整装置、制御パラメータ自動調整方法、及び制御パラメータ自動調整装置ネットワーク
WO2020246005A1 (ja) 2019-06-06 2020-12-10 三菱電機株式会社 パラメータ算出装置、ロボット制御システム、ロボットシステム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017102619A (ja) 2015-11-30 2017-06-08 オムロン株式会社 制御パラメータ調整装置、制御パラメータ調整方法、制御パラメータ調整プログラム
JP7206874B2 (ja) * 2018-12-10 2023-01-18 富士電機株式会社 制御装置、制御方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011136160A1 (ja) 2010-04-26 2011-11-03 三菱電機株式会社 サーボ制御装置
JP2017157112A (ja) 2016-03-03 2017-09-07 三菱日立パワーシステムズ株式会社 制御パラメータ自動調整装置、制御パラメータ自動調整方法、及び制御パラメータ自動調整装置ネットワーク
WO2020246005A1 (ja) 2019-06-06 2020-12-10 三菱電機株式会社 パラメータ算出装置、ロボット制御システム、ロボットシステム

Also Published As

Publication number Publication date
WO2022079761A1 (ja) 2022-04-21
DE112020007693T5 (de) 2023-08-10
JPWO2022079761A1 (ja) 2022-04-21
CN116075782A (zh) 2023-05-05

Similar Documents

Publication Publication Date Title
CN108628355B (zh) 伺服控制装置及系统、机器学习装置及方法
JP4223894B2 (ja) Pidパラメータ調整装置
CN109274314B (zh) 机器学习装置、伺服电动机控制装置、伺服电动机控制系统以及机器学习方法
JP6774637B2 (ja) 制御装置及び制御方法
JP6514257B2 (ja) 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法
CN110376965B (zh) 机器学习装置、控制装置以及机器学习方法
US10824121B2 (en) Machine learning device, servo motor controller, servo motor control system, and machine learning method
US11023827B2 (en) Machine learning device, servo control device, servo control system, and machine learning method for suppressing variation in position error using feedforward control
KR101849464B1 (ko) Pid 게인 자동 튜닝 방법
KR102275302B1 (ko) 입력 포화를 가지는 불확실한 전기 구동 로봇 시스템에 대해 pso를 이용한 rbfnn 기반 분산 적응 추종 시스템
JP6841852B2 (ja) 制御装置及び制御方法
JP7305061B2 (ja) パラメータ調整装置およびパラメータ調整方法
JP6740263B2 (ja) 機械学習装置、サーボモータ制御装置、サーボモータ制御システム、及び機械学習方法
WO2021186500A1 (ja) 学習装置、学習方法、及び、記録媒体
JP7101091B2 (ja) モータ制御装置のフィードフォワード制御器導出装置、モータ制御装置、制御装置、及びフィードフォワード制御器導出方法
JP2019053594A (ja) 制御装置及び機械学習装置
WO2021176619A1 (ja) 位置決め制御装置および位置決め方法
JP6740290B2 (ja) 機械学習装置、制御装置、及び機械学習方法
JP3834815B2 (ja) 最適指令作成装置
Papageorgiou et al. Joint position tracking with prescribed performance of uncertain robotic manipulators using only joint position measurements
JP2024001878A (ja) 制御ルールを実装するための機械学習モデルをトレーニングするための方法
JP2020149177A (ja) 制御装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221004

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230627

R150 Certificate of patent or registration of utility model

Ref document number: 7305061

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150