WO2021176619A1 - 位置決め制御装置および位置決め方法 - Google Patents

位置決め制御装置および位置決め方法 Download PDF

Info

Publication number
WO2021176619A1
WO2021176619A1 PCT/JP2020/009264 JP2020009264W WO2021176619A1 WO 2021176619 A1 WO2021176619 A1 WO 2021176619A1 JP 2020009264 W JP2020009264 W JP 2020009264W WO 2021176619 A1 WO2021176619 A1 WO 2021176619A1
Authority
WO
WIPO (PCT)
Prior art keywords
position command
value
positioning
acceleration
unit
Prior art date
Application number
PCT/JP2020/009264
Other languages
English (en)
French (fr)
Inventor
将哉 木村
辰啓 松田
Original Assignee
三菱電機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三菱電機株式会社 filed Critical 三菱電機株式会社
Priority to CN202080097202.6A priority Critical patent/CN115136095B/zh
Priority to PCT/JP2020/009264 priority patent/WO2021176619A1/ja
Priority to JP2020540646A priority patent/JP6800384B1/ja
Priority to TW110103444A priority patent/TWI777395B/zh
Publication of WO2021176619A1 publication Critical patent/WO2021176619A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D3/00Control of position or direction
    • G05D3/12Control of position or direction using feedback

Definitions

  • the position command generated based on the position command parameter Pr2 of the second set is used to execute the positioning control.
  • the evaluation unit 13 acquires the positioning time Tst2 and the maximum acceleration value Amp2 corresponding to the position command parameter Pr2 of the second set based on the motor position and the acceleration detection value in this case.
  • the positioning time Tst2 is the time from the start of the positioning control to the completion of positioning in which the magnitude of the deviation between the position command and the motor position becomes smaller than the permissible value Ptoll.
  • the maximum value of the vibration amplitude of the acceleration detection value after the positioning is completed is set to the maximum acceleration value Amp2.
  • the evaluation value Q2 corresponding to the position command parameter Pr2 of the second set is expressed by the following equation (27) from the equation (1).
  • Q2 -Tst2-w x Amp2 ... (27)
  • the position command parameter of the first set is written as position command parameter Pr11
  • the position command parameter of the second set is written as position command parameter Pr12
  • the position command parameter of the third set is written as position command parameter Pr13. NS.
  • the positioning control device 20 can appropriately adjust the position command parameters without the need for trial and error by the operator. From the above, the positioning control device 20 can efficiently adjust a good command shape for speeding up the positioning control. Further, in the positioning control device 20 according to the second embodiment, the learning unit 24 outputs a function that outputs an estimated value of the evaluation value Q corresponding to the position command parameter or outputs an estimated value of the average value and the variance value of the evaluation value Q. Get the function as a relational expression. This makes it possible to adjust the balance between search and exploitation by estimating the distribution of the evaluation value Q.
  • the command shapes generated by the X-axis position command generation unit 31X and the Y-axis position command generation unit 31Y are the same as the command shapes shown in the first embodiment, respectively. That is, seven parameters with respect to the X-axis are X-axis position command parameters, and seven parameters with respect to the Y-axis are Y-axis position command parameters. At this time, the X-axis position command parameter and the Y-axis position command parameter do not have to be the same parameter.
  • the learning unit 34 receives the evaluation value Q as an input and learns the relationship between the X-axis position command parameter, the Y-axis position command parameter, and the evaluation value Q. Specifically, a function is learned that outputs the average value of the evaluation value Q and the estimated value of the variance value by collectively using the X-axis position command parameter and the Y-axis position command parameter as input parameters. It is assumed that the learning method is the same as that of the second embodiment.
  • the configuration shown in the above embodiments is an example, and can be combined with another known technique, can be combined with each other, and does not deviate from the gist. It is also possible to omit or change a part of the configuration.

Abstract

位置決め制御装置は、位置指令生成部と、駆動制御部と、評価部と、学習部と、を備える。位置指令生成部は、位置指令パラメータに基づいて加速区間および減速区間の加速度の形状が独立に決定される位置指令を生成する。駆動制御部は、モータの位置を示すモータ位置が位置指令に追従するようにモータを駆動する。評価部は、制御対象の加速度を示す加速度検出値を加速度検出部から取得し、モータ位置と、モータ位置に基づいて位置決め制御の完了が判定された後の加速度検出値と、に基づいて制御対象の位置決め性能に関する評価値を算出する。学習部は、位置指令パラメータに基づいて決定される加速区間と減速区間とにおける位置指令の加速度の形状のそれぞれを独立に変更しつつ、複数回の位置決め制御が実行された場合の位置指令パラメータと評価値との関係を学習し、位置指令パラメータと評価値の関係式を得る。

Description

位置決め制御装置および位置決め方法
 本開示は、制御対象について位置決め制御を行う位置決め制御装置および位置決め方法に関する。
 電子部品実装機または半導体製造装置のように、サーボモータの駆動により制御対象であるヘッドを繰り返し移動させる装置では、生産性能の向上のためにサーボモータについて高速な制御が求められる。サーボモータが高速に動作すると、装置の剛性の低さに起因する機械振動が生じる場合がある。この場合、サーボモータの位置指令の指令形状が適切に調整されていれば、機械振動の影響を受ける状況下であっても高速な位置決め制御を実現することができる。そのため、位置指令の指令形状を適切に調整することが求められる。
 特許文献1には、ロボットの移動経路上での振動を低減するために、ロボットの移動動作中の制御対象の加速度の振動が最小となるように指令形状を調整する技術が開示されている。特許文献1では、指令形状のパラメータを与えて位置決め動作をさせたときの振動値を変数として評価関数を演算し、パラメータを少しずつ変更しながら評価値を求め、ロボットの移動経路上での振動の大きさが最小となる指令形状が見つけられる。
特開平10-143249号公報
 しかしながら、特許文献1に記載の技術では、パラメータと評価値との関係が不明な状況下で評価値を収束させるためにはパラメータの変更幅を小さくする必要があるが、パラメータの変更幅が小さすぎると、位置決め動作の回数が膨大になり調整に時間を要してしまうという問題があった。また、局所最適解に陥りやすく真の最適解に到達することができない可能性がある。
 本開示は、上記に鑑みてなされたものであって、制御対象の振動を抑える位置指令のパラメータを従来に比して少ない試行回数で調整することができる位置決め制御装置を得ることを目的とする。
 上述した課題を解決し、目的を達成するために、本開示の位置決め制御装置は、1つ以上のモータを駆動させて制御対象を目標位置に移動させる位置決め制御装置である。位置決め制御装置は、位置指令生成部と、駆動制御部と、評価部と、学習部と、を備える。位置指令生成部は、位置指令パラメータに基づいて加速区間および減速区間の加速度の形状が独立に決定される位置指令を生成する。駆動制御部は、モータの位置を示すモータ位置が位置指令に追従するようにモータを駆動する。評価部は、制御対象の加速度を示す加速度検出値を加速度検出部から取得し、モータ位置と、モータ位置に基づいて位置決め制御の完了が判定された後の加速度検出値と、に基づいて制御対象の位置決め性能に関する評価値を算出する。学習部は、位置指令パラメータに基づいて決定される加速区間と減速区間とにおける位置指令の加速度の形状のそれぞれを独立に変更しつつ、複数回の位置決め制御が実行された場合の位置指令パラメータと評価値との関係を学習し、位置指令パラメータと評価値の関係式を得る。
 本開示にかかる位置決め制御装置は、制御対象の振動を抑える位置指令のパラメータを従来に比して少ない試行回数で調整することができるという効果を奏する。
実施の形態1による位置決め制御装置の構成の一例を模式的に示す図 実施の形態1で用いられる位置指令並びに位置指令から求められる速度指令、加速度指令およびジャークの一例を示す図 実施の形態1において位置指令パラメータに基づいて生成された指令形状を用いて位置決め制御が行われた場合の位置指令とモータ位置との偏差の時間応答および制御対象の加速度検出値の時間応答の一例を示す図 実施の形態1で用いられるニューラルネットワークの一例を模式的に示す図 実施の形態2による位置決め制御装置の構成の一例を模式的に示す図 実施の形態2による位置決め制御装置における位置決め方法の手順の一例を示すフローチャート 実施の形態2による位置決め制御装置によって得られる効果を説明するための図 実施の形態2による位置決め制御装置によって得られる効果を説明するための図 実施の形態3による位置決め制御装置の構成の一例を模式的に示す図 実施の形態3においてX軸位置指令パラメータおよびY軸位置指令パラメータを用いて位置決め制御が行われた場合の、X軸位置指令とX軸モータ位置との偏差の時間応答、Y軸位置指令とY軸モータ位置との偏差の時間応答および制御対象の加速度検出値の時間応答を示す図 実施の形態1,2,3による位置決め制御装置を実現するハードウェア構成の一例を模式的に示す図
 以下に、本開示の実施の形態にかかる位置決め制御装置および位置決め方法を図面に基づいて詳細に説明する。なお、これらの実施の形態によりこの開示が限定されるものではない。
実施の形態1.
 図1は、実施の形態1による位置決め制御装置の構成の一例を模式的に示す図である。位置決め制御装置10は、モータ1を駆動させて制御対象3を目標位置に移動させる装置であって、モータ1と加速度検出器4とに接続される。モータ1は、ボールねじ2を介して制御対象3にトルクおよび推力を与えて、制御対象3を移動させる。モータ1は、制御対象3を駆動することができるものであればよい。モータ1の例は、回転型サーボモータ、リニアモータまたはステッピングモータである。
 制御対象3は、モータ1により所望の目標位置に移動させられる。制御対象3は、位置決め制御が必要とされる機械または部品である。制御対象3の例は、電子部品実装機または半導体製造装置のヘッド部分である。
 加速度検出器4は、制御対象3の加速度を検出し、加速度検出値を示す情報を位置決め制御装置10に出力する。加速度検出値は、加速度検出器4による検出の結果である加速度を示す。加速度検出器4は、加速度検出部に対応する。
 位置決め制御装置10は、位置指令生成部11と、駆動制御部12と、評価部13と、学習部14と、を備える。
 位置指令生成部11は、モータ1を駆動させて制御対象3を目標位置に移動させるための位置指令を、当該位置指令の形状を定める位置指令パラメータに基づいて生成する。位置指令生成部11は、位置指令パラメータに基づいて加速区間および減速区間の加速度形状が決定される位置指令を生成する。
 駆動制御部12は、モータ1の位置を示すモータ位置が位置指令生成部11によって生成された位置指令に追従するようにモータ1を駆動する。
 評価部13は、加速度検出値を取得し、モータ位置と、モータ位置に基づいて位置決め制御の完了が判定された後の加速度検出値と、に基づいて制御対象3の位置決め性能に関する評価値を算出する。つまり、評価部13は、制御対象3についての位置決め制御の実行時のモータ位置および制御対象3の加速度検出値に基づいて駆動制御部12による位置決め制御の良し悪しを評価するための評価値を算出する。
 学習部14は、位置指令パラメータの上限値および下限値を規定するパラメータ範囲内において位置指令パラメータが変更されて複数回の制御対象3についての位置決め制御が実行された場合の位置指令パラメータと評価部13によって算出された評価値との関係を学習する。学習部14は、位置指令パラメータに基づいて決定される加速区間と減速区間とにおける位置指令の加速度の形状のそれぞれを独立に変更しつつ、複数回の位置決め制御が実行された場合の位置指令パラメータと評価値との関係を学習し、位置指令パラメータと評価値との関係式を得る。さらに言うと、学習部14は、学習によって得た関係式に基づいて位置指令パラメータを決定する。
 以下に、位置指令生成部11、駆動制御部12、評価部13および学習部14についてさらに詳細に説明する。
 位置指令生成部11は、位置指令パラメータに基づいて、モータ1の位置指令を生成して出力する。位置指令パラメータは、位置指令の指令形状を規定するパラメータである。図2は、実施の形態1で用いられる位置指令並びに位置指令から求められる速度指令、加速度指令およびジャークの一例を示す図である。図2においてグラフ210は、位置指令の一例を示す図であり、横軸は時間を示し、縦軸は位置を示している。グラフ220は、位置指令の一階微分であり、横軸は時間を示し、縦軸は速度を示している。グラフ230は、位置指令の二階微分であり、横軸は時間を示し、縦軸は加速度を示している。グラフ240は、加速度指令の一階微分である加加速度、すなわちジャークであり、横軸は時間を示し、縦軸はジャークを示している。
 図2のグラフ230に示されるように、実施の形態1における加速度指令は、第1区間から第3区間までにおいて加速方向の台形形状を示す指令であり、第4区間では0であり、第5区間から第7区間までにおいて減速方向の台形形状を示す指令である。第1区間が加速開始の区間を示し、第3区間が加速終了の区間を示し、第5区間が減速開始の区間を示し、第7区間が減速終了の区間を示す。第m区間の時間長を、第m時間長Tmとする。mは、1から7までの整数である。例えば、第1区間の時間長は第1時間長T1である。
 図2の加速度指令において、第1区間から第3区間までの加速区間の台形形状と、第5区間から第7区間までの減速区間の台形形状とは合同でなくても、つまり非対称でもよい。加速区間の第1時間長T1と第3時間長T3とを0として、加速度指令の形状を矩形形状としてもよい。実施の形態1では、第1時間長T1から第7時間長T7までの7個のパラメータが位置指令パラメータである。指令形状は、位置指令パタメータに基づいて規定される。指令形状の計算方法は後述する。
 図1に戻り、駆動制御部12は、モータ1の回転位置が位置指令に追従するようにモータ1に電流を供給する。例えば、駆動制御部12は、モータ1の回転位置と位置指令との偏差が小さくなるようにPID(Proportional-Integral-Differential)制御に基づいてモータ1に供給される電流の値を計算し、計算によって得られた値の電流をモータ1に供給する。なお、駆動制御部12は、モータ1の回転位置を位置指令に追従させるものであれば、どのようなものであってもよい。例えば、駆動制御部12は、フィードバック制御にフィードフォワード制御を加えた2自由度制御を行なってもよい。
 駆動制御部12は、モータ1の回転位置が位置指令に追従するようにモータ1を駆動するものではなく、制御対象3の位置をフィードバック制御のための信号として検出して、制御対象3の位置が位置指令に追従するようにモータ1を駆動するものであってもよい。
 評価部13は、モータ1のモータ位置と、制御対象3の加速度検出値とを受け取り、駆動制御部12による位置決め制御の良し悪しを評価するための評価値Qを後述する方法で計算して出力する。駆動制御部12は位置指令に基づいて動作し、位置指令は位置指令パラメータに基づいて計算される。したがって、評価部13によって算出される評価値Qは、位置指令パラメータの値に依存する。つまり、評価値Qは位置指令パラメータを評価するための指標であるといえる。
 ここで、評価値Qの具体的な計算方法を説明する。図3は、実施の形態1において位置指令パラメータに基づいて生成された指令形状を用いて位置決め制御が行われた場合の位置指令とモータ位置との偏差の時間応答および制御対象の加速度検出値の時間応答の一例を示す図である。グラフ310は、モータ1の位置の偏差の時間応答を示す図であり、横軸は時間を示し、縦軸はモータ1の位置の偏差を示す。グラフ320は、制御対象3の加速度の時間応答を示す図であり、横軸は時間を示し、縦軸は制御対象3の加速度を示す。
 図3に示されるように、位置決め制御の開始から位置指令とモータ位置との偏差の大きさが予め定められた許容値Ptolよりも小さくなる位置決め完了までの時間を、位置決め時間Tstとする。位置決め時間Tstが小さい場合、評価値Qが大きな値を示すように評価値Qが設定される。また位置決め完了の後の加速度検出値の振動振幅の最大値を加速度最大値Aampとする。目標位置近傍での加速度検出値の振動振幅が小さい値を示すように評価値Qが設定される。これらを満たすために評価値Qは次式(1)により設定される。
 Q=-Tst-w×Aamp ・・・(1)
 (1)式において、wは重み係数であり正の値であるとする。(1)式によれば、位置決め時間Tstが小さいほど評価値Qは大きな値になる。また位置決め完了の後の加速度最大値Aampが小さいほど評価値Qは大きな値となる。つまり、実施の形態1では、評価値Qが大きな値であるほど、位置指令パラメータは優良であるといえる。ただし、評価値Qは、位置決め制御の性能を評価することができるものであれば、(1)式によって特定されるものに限定されない。例えば、位置決め時間Tstと加速度最大値Aampの和を評価値Qとして、評価値Qが小さな値であるほど位置指令パラメータは優良であると定められてもよい。また、加速度最大値Aampが加速度振幅の許容値を超える場合のみペナルティとして評価値Qに加算するようにしてもよい。さらに、位置決め完了の時点から一定の時間が経過した後の時間における加速度の最大値を加速度最大値Aampとして、(1)式の計算に用いてもよい。
 図1に戻り、学習部14は、評価値Qを入力として、位置指令パラメータと評価値Qとの関係を学習する。具体的には、学習部14において、位置指令パラメータを入力として評価値Qを出力とするニューラルネットワークが構成され、学習部14は、ニューラルネットワークの重み係数を更新して学習を行う。重み係数を更新して学習が行われた場合、ニューラルネットワークは位置指令パラメータに対応する評価値Qの良好な推定値を出力する。
 学習部14は、ニューラルネットワークを用い、位置指令パラメータを入力として評価値Qを出力とする関数を得ることで、学習結果として位置指令パラメータと評価値Qとの関係式を得る。学習部14は、位置指令パラメータと評価値Qとの関係を学習することができれば、位置指令パラメータと評価値Qとの関係を、ニューラルネットワークを用いる方法以外の方法で学習してもよい。
 学習部14は、次の位置決め制御を実行するための位置指令パラメータを、規定されるパラメータ範囲のなかから選定して出力する。学習部14は、次の位置指令パラメータの選定にあたって、学習により得た関数に基づいて優良な評価値Qを示す位置指令パラメータを選定してもよいし、各位置指令パラメータを等間隔に刻んだグリッドの点のなかから順に位置指令パラメータを選定してもよい。学習部14は、位置指令パラメータに基づいて評価値Qを計算する関数を更新する機能を有する。
 実施の形態1による位置決め制御装置10の機能をさらに説明する。学習部14は、パラメータ範囲で定められる範囲内で1組の位置指令パラメータを決定し、決定された位置指令パラメータを位置指令生成部11に出力する。位置指令生成部11は、入力された位置指令パラメータに基づいて位置指令を計算する。
 位置指令の計算方法を説明する。第2区間の加速度の大きさをAaと定め、第6区間の加速度の大きさをAdと定める。第2区間の加速度の大きさAaと第6区間の加速度の大きさAdとは、位置指令パラメータの従属変数となるため、これらには設定自由度は無い。位置指令生成部11は、「0≦t<T1」の範囲の時間tにおける第1区間の加速度指令A1(t)、速度指令V1(t)および位置指令P1(t)のそれぞれを、次式(2)、次式(3)および次式(4)を用いて計算する。
Figure JPOXMLDOC01-appb-M000001
Figure JPOXMLDOC01-appb-M000002
Figure JPOXMLDOC01-appb-M000003
 位置指令生成部11は、「T1≦t<T1+T2」の範囲の時間tにおける第2区間の加速度指令A2(t)、速度指令V2(t)および位置指令P2(t)のそれぞれを、次式(5)、次式(6)および次式(7)を用いて計算する。
 A2(t)=Aa ・・・(5)
Figure JPOXMLDOC01-appb-M000004
Figure JPOXMLDOC01-appb-M000005
 位置指令生成部11は、「T1+T2≦t<T1+T2+T3」の範囲の時間tにおける第3区間の加速度指令A3(t)、速度指令V3(t)および位置指令P3(t)のそれぞれを、次式(8)、次式(9)および次式(10)を用いて計算する。
Figure JPOXMLDOC01-appb-M000006
Figure JPOXMLDOC01-appb-M000007
Figure JPOXMLDOC01-appb-M000008
 位置指令生成部11は、「T1+T2+T3≦t<T1+T2+T3+T4」の範囲の時間tにおける第4区間の加速度指令A4(t)、速度指令V4(t)および位置指令P4(t)のそれぞれを、次式(11)、次式(12)および次式(13)を用いて計算する。
 A4(t)=0 ・・・(11)
Figure JPOXMLDOC01-appb-M000009
Figure JPOXMLDOC01-appb-M000010
 位置指令生成部11は、「T1+T2+T3+T4≦t<T1+T2+T3+T4+T5」の範囲の時間tにおける第5区間の加速度指令A5(t)、速度指令V5(t)および位置指令P5(t)のそれぞれを、次式(14)、次式(15)および次式(16)を用いて計算する。
Figure JPOXMLDOC01-appb-M000011
Figure JPOXMLDOC01-appb-M000012
Figure JPOXMLDOC01-appb-M000013
 位置指令生成部11は、「T1+T2+T3+T4+T5≦t<T1+T2+T3+T4+T5+T6」の範囲の時間tにおける第6区間の加速度指令A6(t)、速度指令V6(t)および位置指令P6(t)のそれぞれを、次式(17)、次式(18)および次式(19)を用いて計算する。
 A6(t)=-Ad ・・・(17)
Figure JPOXMLDOC01-appb-M000014
Figure JPOXMLDOC01-appb-M000015
 位置指令生成部11は、「T1+T2+T3+T4+T5+T6≦t≦T1+T2+T3+T4+T5+T6+T7」の範囲の時間tにおける第7区間の加速度指令A7(t)、速度指令V7(t)および位置指令P7(t)のそれぞれを、次式(20)、次式(21)および次式(22)を用いて計算する。
Figure JPOXMLDOC01-appb-M000016
Figure JPOXMLDOC01-appb-M000017
Figure JPOXMLDOC01-appb-M000018
 終端時間t=T1+T2+T3+T4+T5+T6+T7においては、速度指令は0に一致する必要があり、位置指令は移動距離Dに一致する必要がある。そのため、終端時間において次式(23)および次式(24)が成立する。
 V7=0 ・・・(23)
 P7=D ・・・(24)
 上記の(5)式および(17)式より、第2区間の加速度の大きさAaおよび第6区間の加速度の大きさAdが決定される。上述のように、指令形状は位置指令パラメータと移動距離Dとに基づいて計算される。
 上述の通り、また図2のグラフ230に示されるように、第1区間、第3区間、第5区間および第7区間では、加速度は時間の一次関数である。そのため、これらの区間では、図2のグラフ240に示されるように、加速度の一階微分であるジャークは非零の一定値である。つまり、第1時間長T1、第3時間長T3、第5時間長T5および第7時間長T7は、ジャークが非零の一定値となる時間を定めたものであると言える。非零の一定値は、0より大きい一定値または0より小さい一定値である。
 これらの区間では、時間長の代わりにジャークの大きさを指定するパラメータが選択されてもよい。例えば、第1区間におけるジャークの大きさをJ1として定めると、ジャークJ1は、次式(25)に示されるように、第1時間長T1を用いて算出することができる。
 J1=Aa/T1 ・・・(25)
 つまり、ジャークが非零の一定値となる区間の時間をパラメータとして定めることと、ジャークが非零の一定値となる区間のジャークの大きさをパラメータとして定めることとは、等価である。このように、指令形状を規定するパラメータの選択の仕方には任意性があり、指令形状を規定するパラメータの選択は上述の方法に限定されない。
 上述のように、実施の形態1の位置指令生成部11が実行する指令生成方法では、指令形状を規定するために7個の位置指令パラメータを使用する。従来の技術で多く用いられる加速度および速度の2個のパラメータにより指令形状を規定する方法と比較すると、実施の形態1における調整の自由度は従来のそれより高い。そのため、適切に位置指令パラメータを調整することができれば、位置決め制御装置10は、制御対象3が載置されている装置の機械振動の影響を受ける状況であっても、良好な応答を示す位置決め制御を実現することができる。
 他方、制御対象3が載置されている装置の操作者が当該装置を動作させつつ、試行錯誤によって上記の7個のパラメータを人手で調整する場合、比較的大きな労力および比較的長い時間が必要となる。以下では、位置決め制御装置10が評価部13、学習部14を有することにより、位置決め制御装置10が操作者の試行錯誤を必要とせず、位置指令パラメータを適切に調整することができることを説明する。
 評価部13および学習部14の動作によれば、学習部14による位置指令パラメータの変更と、変更された位置指令パラメータが用いられた位置決め制御と、評価部13による評価値Qの計算とが繰り返し実行される。この繰り返し実行される評価部13および学習部14の動作を説明する。
 学習部14は、位置指令パラメータの上限値および下限値を規定するパラメータ範囲内において位置指令パラメータを選定する。評価部13および学習部14の動作が3回実行されて、第3組目までの位置指令パラメータが評価される過程を説明する。第1組目の位置指令パラメータを位置指令パラメータPr1と表記し、第2組目の位置指令パラメータを位置指令パラメータPr2と表記し、第3組目の位置指令パラメータを位置指令パラメータPr3と表記する。3組の位置指令パラメータのそれぞれは、第1時間長T1から第7時間長T7までの7個のパラメータを有している。
 学習部14から第1組目の位置指令パラメータPr1が出力され、位置指令生成部11が第1組目の位置指令パラメータPr1に基づいて位置指令を生成する。第1組目の位置指令パラメータPr1に基づいて生成された位置指令が用いられて、位置決め制御が実行される。評価部13は、この場合のモータ位置および加速度検出値に基づいて、第1組目の位置指令パラメータPr1に対応する位置決め時間Tst1および加速度最大値Aamp1を取得する。位置決め制御の開始から、位置指令とモータ位置との偏差の大きさが予め定められた許容値Ptolより小さくなる位置決め完了までの時間を位置決め時間Tst1とする。また、位置決め完了の後の加速度検出値の振動振幅の最大値を加速度最大値Aamp1とする。第1組目の位置指令パラメータPr1に対応する評価値Q1は、(1)式より次式(26)のように表される。
 Q1=-Tst1-w×Aamp1 ・・・(26)
 学習部14は、評価値Q1を受け取り、位置指令パラメータを第2組目の位置指令パラメータPr2に変更する。学習部14は、位置指令パラメータを変更する際、第1組目の位置指令パラメータPr1が用いられた位置決め制御の結果に基づいて第2組目の位置指令パラメータPr2を選定してもよいし、第1組目の位置指令パラメータPr1が用いられた位置決め制御の結果に関わらず、予め定められていた通りに第2組目の位置指令パラメータPr2を選定してもよい。
 学習部14が位置指令パラメータを変更すると、第2組目の位置指令パラメータPr2に基づいて生成される位置指令が用いられて位置決め制御が実行される。評価部13は、この場合のモータ位置および加速度検出値に基づいて、第2組目の位置指令パラメータPr2に対応する位置決め時間Tst2および加速度最大値Aamp2を取得する。位置決め制御の開始から、位置指令とモータ位置との偏差の大きさが許容値Ptolより小さくなる位置決め完了までの時間を位置決め時間Tst2とする。また位置決め完了の後の加速度検出値の振動振幅の最大値を加速度最大値Aamp2とする。第2組目の位置指令パラメータPr2に対応する評価値Q2は、(1)式より次式(27)のように表される。
 Q2=-Tst2-w×Aamp2 ・・・(27)
 学習部14は、評価値Q2を受け取り、位置指令パラメータを第3組目の位置指令パラメータPr3に変更する。評価部13は、評価値Q1と評価値Q2とを得た手順と同様にして、評価値Q3を、位置決め時間Tst3および加速度最大値Aamp3に基づいて、(1)式を用いて評価する。その評価値Q3は、次式(28)のように表される。
 Q3=-Tst3-w×Aamp3 ・・・(28)
 学習部14は、評価値Q3を受け取る。ここまでの評価部13および学習部14の動作によって、学習部14は3組の位置指令パラメータPr1、位置指令パラメータPr2および位置指令パラメータPr3に対応する評価値Q1、評価値Q2および評価値Q3を得る。
 評価部13および学習部14は、上述のように、位置指令パラメータに対応する評価値Qを取得する動作を繰り返し実施する。
 学習部14は、位置指令パラメータと位置指令パラメータに対応する評価値Qとを学習用データとして、ニューラルネットワークを用いた学習動作を行う。図4は、実施の形態1で用いられるニューラルネットワークの一例を模式的に示す図である。当該ニューラルネットワーク400は、入力層410、中間層420および出力層430を有する。左端の入力層410に位置指令パラメータが入力され、右端の出力層430から評価値Qが出力される。位置指令パラメータは、上記したように、第1時間長T1から第7時間長T7までの7個のパラメータを含む。入力層410の各ノード411から中間層420の各ノード421に対する重み係数は全て独立に設定することができるが、図4ではこれらは全て同一の重み係数W1として表記されている。同様に、中間層420の各ノード421から出力層430のノード431に対する重み係数は、全て同一の重み係数W2として表記されている。
 入力層410の各ノード411の出力値に対して重み係数W1が乗算され、乗算によって得られた結果の線形結合が中間層420の各ノード421に入力される。中間層420の各ノード421の出力値に対して重み係数W2が乗算され、乗算によって得られた結果の線形結合が出力層430のノード431に入力される。各層410,420,430の各ノード411,421,431では、例えばシグモイド関数といった非線形関数により入力値から出力値が計算されてもよい。入力層410および出力層430では、出力値は入力値の線形結合であってもよい。
 学習部14は、位置指令パラメータと評価値Qとを用いて、ニューラルネットワーク400の重み係数W1と重み係数W2とを計算する。ニューラルネットワーク400の重み係数W1および重み係数W2は、一例では、誤差逆伝播法または勾配降下法を用いることで計算することができる。ただし、ニューラルネットワーク400の重み係数が得られる計算方法であれば、重み係数W1および重み係数W2の計算方法は上述の方法に限られない。
 ニューラルネットワーク400の重み係数W1および重み係数W2が決定されれば、位置指令パラメータと評価値Qとの関係式が得られたことになる。
 以上の説明において、3層のニューラルネットワーク400を用いた学習を行う例が示された。しかし、ニューラルネットワーク400を用いた学習は、上述の例に限定されない。
 ここまでの評価部13および学習部14の動作によって、ニューラルネットワーク400による関係式が得られた。
 上述のように評価部13および学習部14の動作によってニューラルネットワーク400による関係式が得られれば、位置指令パラメータを入力として評価値Qを出力とする関数が得られたことになる。この関数を用いれば、新たな位置指令パラメータに対して位置決め制御を実行しなくとも、その新たな位置指令パラメータに対応する評価値Qを得ることが可能になる。
 一般に、加速度検出器4はその設置環境および電源環境の影響を受けるため検出値にノイズを多く含む。そのため制御対象3の加速度検出値を評価する場合にもノイズの影響は免れず、同じ位置指令パラメータを使って位置決め制御を行ったとしても、取得された加速度検出値の値が異なることに起因して異なる評価値Qが得られることが多々ある。学習部14の動作によれば、ノイズの影響を受けて取得された複数の評価値Qのそれぞれとの誤差を最小にするような評価値Qが得られるため、位置指令パラメータに対する評価値Qの適切な推定値を得ることが可能になる。
 続いて、学習部14は、位置指令パラメータと評価値Qとの関係式に基づいて、数値計算により、評価値Qが最大となる位置指令パラメータを求める。このとき、例えばグリッド探索、ランダム探索またはニュートン法といった最適化アルゴリズムを用いることができる。
 上述のように、評価部13および学習部14の動作によって指令パラメータと評価値Qとの関係式を学習することができる。加えて、関係式を用いることで評価値Qを最大とするような優良な位置指令パラメータを見つけることが可能である。この関係式を用いれば位置決め制御を実施しなくても位置指令パラメータに対応する評価値Qの適切な推定値を取得することができるため、位置決め制御装置10は、必ずしも優良なパラメータを用いた位置決め制御を行なっていなくとも、優良なパラメータを見つけることが可能である。
 以上により、位置決め制御装置10は制御対象3の振動を抑制しつつ、短時間の位置決め制御を実現することが可能である。
 また、位置決め制御装置10はモータ位置と制御対象3の加速度検出値とによって位置指令パラメータを適切に調整することができる。このとき、加速度検出器4は制御対象3に接着しておくことが可能である。そのため制御対象3の停止位置が変更されても評価のために操作者が加速度検出器4の配置を変更する必要がない。
 よって、位置決め制御装置10は、操作者の試行錯誤を必要とせず、位置指令パラメータを適切に調整することができる。
 上述のことから、実施の形態1による位置決め制御装置10では、位置決め制御を高速化するための指令形状の調整を効率よく行うことができるという効果を得ることができる。
 位置指令生成部11は、位置指令の信号を二回微分した信号である加速度指令信号が零より大きい一定値または零より小さい一定値となる時間が存在するように、位置指令の信号の形状を定めてもよい。位置指令生成部11は、位置指令の信号を三回微分した信号であるジャークの信号が零より大きい一定値または零より小さい一定値となる時間が存在するように、位置指令の信号の形状を定めてもよい。位置指令生成部11は、ジャークの信号が零より大きい一定値または零より小さい一定値となる時間を示す情報を位置指令パラメータに含めてもよい。位置指令生成部11は、ジャークの信号が零より大きい一定値または零より小さい一定値となる時間におけるジャークの信号の大きさを示す情報を位置指令パラメータに含めてもよい。
 実施の形態1では、学習部14は位置指令パラメータを入力として評価値Qの推定値を計算する関数を得る。これにより、位置指令パラメータと位置決め制御を実行することによって得られた評価値Qとの組の中からも優良な位置指令パラメータを選定することができる。つまり、学習により見つけた最適な位置指令パラメータで位置決め制御を行うことができる。
 実施の形態1による位置決め制御装置10は、制御対象3の加速度検出値に基づく評価値Qと、位置指令パラメータとの関係を学習する学習部14を備える。これによって、制御対象3の振動を抑えるような位置指令パラメータを少ない試行回数で調整することが可能になる。その結果、非対称で多自由度の指令形状の最適化ができる。また、学習部14の学習によって得られた位置指令パラメータが位置指令生成部11に設定され、位置指令生成部11が位置指令を生成することで高速な位置決め制御を実現することができる。さらに、評価値Qは、位置決め開始から位置決め完了が判定されるまでの位置決め時間Tstに基づいて計算されるので、位置決め時間Tstを短時間化するような位置決め制御の調整が可能となる。
実施の形態2.
 図5は、実施の形態2による位置決め制御装置の構成の一例を模式的に示す図である。以下では、実施の形態1と同一の部分には同一の符号を付し、その説明を省略し、異なる部分について説明する。位置決め制御装置20は、位置指令生成部11と、駆動制御部12と、評価部13と、学習部24と、を備える。
 学習部24は、評価値Qを入力として位置指令パラメータと評価値Qとの関係を学習する。具体的には、学習部24は、位置指令パラメータに対応する評価値Qの平均値と分散値とを推定する関数を更新して学習を行う。学習部24は、学習を行うことで、位置指令パラメータに対応した評価値Qの平均値と、位置指令パラメータに対応する評価値Qの分散値と、を計算して推定することが可能となる。平均値と分散値とを計算するための関数には、一例では、ガウス過程モデルを用いることができる。このように、学習部24は位置指令パラメータと評価値Qとの関係式を得る。
 学習部24は、次の位置決め制御を実行するための位置指令パラメータを選定して位置指令生成部11に出力する。学習部24は、次の位置指令パラメータの選定にあたって、学習結果に基づいて評価値Qの平均値と分散値との和が最大値を示す位置指令パラメータを選定する。
 学習部24は、位置指令パラメータを変更しつつ、予め定められた回数を終えるまで繰り返し実行された位置決め制御によって評価部13から得られた評価値Qの中から、評価値Qを最大とした位置指令パラメータを位置指令生成部11に出力する。
 実施の形態2による位置決め制御装置20の機能をさらに説明する。学習部24は、1組の位置指令パラメータを決定し、決定された位置指令パラメータを位置指令生成部11に出力する。位置指令生成部11は、入力された位置指令パラメータに基づいて位置指令を計算する。位置指令生成部11は、実施の形態1で説明したように、指令形状を規定するために7個の位置指令パラメータを使用する。従来の技術で多く用いられる加速度および速度の2個のパラメータにより指令形状を規定する方法と比較すると、実施の形態2における調整の自由度は従来のそれより高い。そのため、位置指令パラメータを適切に調整することができれば、位置決め制御装置20は、制御対象3が載置されている装置の機械振動の影響を受ける状況であっても、良好な応答を示す位置決め制御を実現することができる。
 図6は、実施の形態2による位置決め制御装置における位置決め方法の手順の一例を示すフローチャートである。まず、位置指令生成部11に位置指令パラメータの初期値が設定される(ステップS1)。位置指令パラメータの初期値は、どのような値でも構わない。次いで、位置指令生成部11は、ステップS1で設定された位置指令パラメータに基づいて位置指令を計算する(ステップS2)。駆動制御部12は、計算された位置指令によって位置決め制御を実行する(ステップS3)。
 次いで、評価部13は、モータ位置および制御対象3の加速度検出値を用いて評価値Qを計算する(ステップS4)。その後、学習部24は、予め定められた回数の位置決め制御が終了したかを判定する(ステップS5)。予め定められた回数の位置決め制御が終了していない場合(ステップS5でNoの場合)には、学習部24は、位置指令パラメータと計算された評価値Qとに基づいて、評価値Qの平均値と評価値Qの分散値とを計算する関数を更新する(ステップS6)。
 その後、学習部24は、ステップS6で更新された関数に基づいて、評価値Qの平均値と分散値との和が最大となる位置指令パラメータを求める(ステップS7)。また、学習部24は、ステップS7で求められた位置指令パラメータを位置指令生成部11に設定する(ステップS8)。その後、設定された位置指令パラメータによって位置決め制御を再度実行して評価値Qを得るべく、位置決め制御装置20の動作はステップS2に移行する。
 ステップS5において、予め定められた回数の位置決め制御が終了した場合(ステップS5でYesの場合)には、予め定められた回数の評価値Qが得られた状態であり、学習部24は、予め定められた数の評価値Qの中から、評価値Qを最大とする位置指令パラメータを選定し、位置指令生成部11に設定する(ステップS9)。以上で、処理が終了する。
 上述のように、学習部24は、ステップS7において位置指令パラメータと評価値Qとの関係を学習し、位置指令パラメータに対応する評価値Qの平均値と分散値とを得ることができる。そして、学習部24は、ステップS8において、評価値Qの平均値と分散値との和を最大とする位置指令パラメータを求める。求められた位置指令パラメータは、次回の位置決め制御に用いられる。
 次に、平均値と分散値との和を最大とする位置指令パラメータを次回の位置決め制御に用いることによって得られる効果を説明する。図7および図8は、実施の形態2による位置決め制御装置によって得られる効果を説明するための図である。
 ここでは、評価部13および学習部24の動作が2回実行された後に第3組目の位置指令パラメータが選定される過程を説明する。第1組目の位置指令パラメータは位置指令パラメータPr11と表記され、第2組目の位置指令パラメータは位置指令パラメータPr12と表記され、第3組目の位置指令パラメータは位置指令パラメータPr13と表記される。
 図7および図8は、説明のために位置指令パラメータを1次元に簡略化して示している。これらの図で、横軸は位置指令パラメータを示し、縦軸は評価値Qを示している。評価部13および学習部24の動作が2回実行された場合、図7の丸印で示されるように、位置指令パラメータPr11に対応する評価値Q11と、位置指令パラメータPr12に対応する評価値Q12とが得られる。学習部24は、得られた評価値Q11と評価値Q12とに基づく学習を行い、位置指令パラメータに対応する評価値Qの平均値と分散値とを計算する関数を更新する。
 図7に示す平均値を示す曲線AVと、平均値と分散値との和を示す曲線ADと、が、学習部24により得られた関数に基づいて計算される。図7に示されるように、位置指令パラメータPr11と位置指令パラメータPr12との中間点のように、取得されたデータからの距離が遠いほど評価値Qの不確実性が高いため、分散値は大きくなる。学習部24の動作により、評価値Qの平均値と分散値との和が最大となる図7の星印の点Pに対応する位置指令パラメータPr13が次の位置指令パラメータとして選定される。
 位置指令パラメータPr13を用いて位置指令が計算されて位置決め制御が行われた結果として、図8に示すように、評価値Q13が得られる。ここでは、評価値Q13は、評価値Q11および評価値Q12より大きい値であると仮定する。この段階で調整が終了した場合、評価値Q13が最大となるため、調整終了時点で位置指令パラメータPr13が最も優良なパラメータとなる。
 仮に、第3組目の位置指令パラメータPr13を選定する段階で、評価値Qの平均値と分散値との和の最大値でなく、評価値Qの平均値の最大値を選ぶ場合を想定する。図7において平均値の曲線AVの最大値は位置指令パラメータPr13の点ではないため、第3組目の位置指令パラメータとして位置指令パラメータPr13が選定されることはない。そのため、評価値Qの平均値の最大値を選ぶ場合には優良なパラメータを選定することができない可能性がある。
 上述のように、分散値は過去に取得されたデータからの距離が遠い点において大きくなる傾向がある。平均値は、過去に取得されたデータに基づいて良好と推定される点において大きくなる傾向がある。つまり、位置決め制御装置20は、平均値と分散値との和が最大となる点を次の位置指令パラメータとして選定することで、比較的大きな評価値Qを得るための探索と搾取とのバランスを良好に保つことができ、調整の終了時に比較的大きな評価値Qを得る位置指令パラメータを見つけることができる。
 よって、実施の形態2による位置決め制御装置20は、操作者の試行錯誤を必要とせず、位置指令パラメータを適切に調整することができる。上述のことから、位置決め制御装置20は、位置決め制御を高速化する良好な指令形状の調整を効率よく行うことができる。また、実施の形態2による位置決め制御装置20では、学習部24は、位置指令パラメータに対応する評価値Qの推定値を出力する関数または評価値Qの平均値および分散値の推定値を出力する関数を関係式として得る。これによって、評価値Qの分布を推定することで探索と搾取のバランスのよい調整が可能となる。
 上述した説明では、位置決め制御装置20は、評価値Qの平均値と分散値との和が最大となる点を次の位置指令パラメータとして選定する場合を例に挙げたが、実施の形態2がこれに限定されるものではない。一例では、位置決め制御装置20は、評価値Qの平均値に分散値の2倍を加算した値が最大となる点に対応する位置指令パラメータを次の位置指令パラメータとして選定してもよい。また、他の例では、位置決め制御装置20は、学習して得られた評価関数の平均値と分散値とを使って、EI(Expected Improvement)関数、PI(Probability of Improvement)関数またはその他の獲得関数を用いて、次の位置指令パラメータとなる点を計算してもよい。つまり、実施の形態2では、評価値Qの平均値と分散値とを含む関数を用いて次の位置指令パラメータとなる点が算出されるものであればよい。
 実施の形態2では、位置決め制御装置20は、評価値Qの平均値と分散値との和が最大となる点を次の位置指令パラメータとして選定する。このとき、位置決め制御装置20は、評価値Qの平均値と分散値との和が最大となる点を見つけるにあたり、各位置指令パラメータを等間隔に刻んだグリッドの点の中から順に評価値Qの平均値と分散値とを計算して、グリッドのなかで評価値Qの平均値と分散値とが最大となる位置指令パラメータを選定してもよい。また、位置決め制御装置20は、評価値Qの平均値と分散値との和が最大となる点を見つけるにあたり、疑似ランダム関数に基づくランダム探索により評価値Qの平均値と分散値とが最大となる位置指令パラメータを選定してもよい。
実施の形態3.
 図9は、実施の形態3による位置決め制御装置の構成の一例を模式的に示す図である。以下では、実施の形態1と同一の部分には同一の符号を付し、その説明を省略し、異なる部分について説明する。
 位置決め制御装置30は、モータ1およびモータ5を駆動させて制御対象3を目標位置に移動させる装置であって、モータ1とモータ5と加速度検出器4とに接続される。ここでは、モータ1は、制御対象3をX軸方向に駆動するものであり、モータ5は、モータ1をX軸に垂直なY軸方向に駆動するものであるとする。モータ1は、ボールねじ2を介して制御対象3にトルクおよび推力を与えて、制御対象3をX軸方向に移動させる。モータ1は、制御対象3を駆動することができるものであればよい。モータ5は、ボールねじ6を介してモータ1をY軸方向に移動させる。モータ5は、モータ1を駆動することができるものであればよい。モータ1およびモータ5の例は、回転型サーボモータ、リニアモータまたはステッピングモータである。
 制御対象3は、モータ1とモータ5により所望の目標位置に移動させられる。制御対象3は、位置決め制御が必要とされる機械または部品である。制御対象3の例は、電子部品実装機または半導体製造装置のヘッド部分である。
 位置決め制御装置30は、X軸位置指令生成部31Xと、Y軸位置指令生成部31Yと、X軸駆動制御部32Xと、Y軸駆動制御部32Yと、評価部33と、学習部34と、を備える。
 X軸位置指令生成部31XおよびY軸位置指令生成部31Yは、それぞれモータ1およびモータ5を駆動させて制御対象3を目標位置に移動させるための位置指令を、当該位置指令の形状を定める位置指令パラメータに基づいて生成する。具体的には、X軸位置指令生成部31Xは、X軸位置指令パラメータに基づいて加速区間および減速区間の加速度形状が決定されるX軸位置指令を生成する。Y軸位置指令生成部31Yは、Y軸位置指令パラメータに基づいて加速区間および減速区間の加速度形状が決定されるY軸位置指令を生成する。X軸方向およびY軸方向の位置指令の生成について実施の形態1の位置指令生成部11を適用したものが、それぞれX軸位置指令生成部31XおよびY軸位置指令生成部31Yである。
 X軸駆動制御部32Xは、モータ1がX軸位置指令生成部31Xによって生成されたX軸位置指令に追従するようにモータ1を駆動するX軸電流を出力する。Y軸駆動制御部32Yは、モータ1がY軸位置指令生成部31Yによって生成されたY軸位置指令に追従するようにモータ5を駆動するY軸電流を出力する。X軸方向のモータ1の制御およびY軸方向のモータ5の制御について実施の形態1の駆動制御部12を適用したものが、それぞれX軸駆動制御部32XおよびY軸駆動制御部32Yである。すなわち、X軸駆動制御部32XおよびY軸駆動制御部32Yの動作は、実施の形態1の駆動制御部12の動作と同じである。
 評価部33は、制御対象3についての位置決め制御の実行時のモータ1の位置を示すX軸モータ位置とモータ5の位置を示すY軸モータ位置と制御対象3の加速度検出値とに基づいて位置決め制御の良し悪しを評価するための評価値Qを算出する。評価部33は、制御対象3についての位置決め制御の実行時のX軸モータ位置とY軸モータ位置と加速度検出値とに基づいて位置決め性能に関する評価値Qを算出する。評価部33の機能は、基本的には実施の形態1の評価部13と同じである。
 学習部34は、X軸およびY軸の位置指令パラメータの上限値および下限値を規定するパラメータ範囲内において位置指令パラメータが変更されて複数回の制御対象3についての位置決め制御が実行された場合のX軸位置指令パラメータとY軸位置指令パラメータと評価部33によって算出された評価値Qとの関係を学習する。
 学習部34は、位置指令パラメータに基づいて決定される加速区間と減速区間とにおける加速度の形状のそれぞれを独立に変更しつつ、複数回の位置決め制御が実行された場合のX軸位置指令パラメータとY軸位置指令パラメータと評価値Qとの関係を学習する。そして、学習部34は、学習の結果、X軸位置指令パラメータとY軸位置指令パラメータと評価値Qとの関係式を得る。さらに、学習部34は、学習によって得た関係式に基づいてX軸およびY軸の位置指令パラメータを決定する。
 ここで、X軸位置指令生成部31XおよびY軸位置指令生成部31Yにより生成される指令形状はそれぞれ実施の形態1に示す指令形状と同じである。つまりX軸に関して7個のパラメータがX軸位置指令パラメータであり、Y軸に関して7個のパラメータがY軸位置指令パラメータである。このときのX軸位置指令パラメータとY軸位置指令パラメータは同じパラメータである必要はない。
 以下に、評価部33および学習部34についてさらに詳細に説明する。
 評価部33は、X軸モータ位置とY軸モータ位置と制御対象3の加速度検出値とを受け取り、位置決め制御の良し悪しを評価するための評価値Qを後述する方法で計算して出力する。X軸駆動制御部32XおよびY軸駆動制御部32YはそれぞれX軸位置指令およびY軸位置指令に基づいて動作し、X軸位置指令およびY軸位置指令はそれぞれX軸位置指令パラメータおよびY軸位置指令パラメータに基づいて計算される。したがって、評価部33によって算出される評価値Qは、X軸位置指令パラメータおよびY軸位置指令パラメータの値に依存する。つまり、評価値QはX軸位置指令パラメータおよびY軸位置指令パラメータを評価するための指標であるといえる。
 次に、評価値Qの具体的な計算方法を説明する。図10は、実施の形態3においてX軸位置指令パラメータおよびY軸位置指令パラメータを用いて位置決め制御が行われた場合の、X軸位置指令とX軸モータ位置との偏差の時間応答、Y軸位置指令とY軸モータ位置との偏差の時間応答および制御対象の加速度検出値の時間応答を示す図である。グラフ1010は、X軸のモータ1の位置の偏差の時間応答を示す図であり、横軸は時間を示し、縦軸はモータ1の位置の偏差を示す。グラフ1020は、Y軸のモータ5の位置の偏差の時間応答を示す図であり、横軸は時間を示し、縦軸はモータ5の位置の偏差を示す。グラフ1030は、制御対象3の加速度の時間応答を示す図であり、横軸は時間を示し、縦軸は制御対象3の加速度を示す。
 グラフ1010に示されるように、X軸の位置決め開始からX軸位置指令とX軸モータ位置との偏差の大きさが予め定められた許容値Ptolより小さくなるX軸の位置決め完了までの時間を、X軸位置決め時間TstXとする。同様に、グラフ1020に示されるように、Y軸の位置決め開始からY軸位置指令とY軸モータ位置との偏差の大きさが予め定められた許容値Ptolより小さくなるY軸の位置決め完了までの時間を、Y軸位置決め時間TstYとする。許容値PtolはX軸とY軸とで別の値にしてもよい。
 制御対象3が目標位置近傍に到達する時間は、X軸位置決め時間TstXとY軸位置決め時間TstYとの長い方の時間である。つまり位置決め実行時のX軸位置決め時間TstXとY軸位置決め時間TstYとを比較してその長い方の時間を評価値Qとすることで、制御対象3が目標位置近傍に到達する時間を短時間化するような調整が可能となる。
 また、グラフ1030に示されるように、位置決め時間Tstが長い方の軸の位置決め完了の後の加速度検出値の振動振幅の最大値を加速度最大値Aampとする。さらに、加速度検出値の振動振幅の許容値を加速度許容値Atolとする。目標位置近傍での加速度検出値の振動振幅が小さい値を示すように評価値Qが設定される。これらを満たすために評価値Qは次式(29)により設定される。
 Q=-max(TstX,TstY)-γ×max(0,Aamp-Atol) ・・・(29)
 ここで、γは、正の値である。また、max(x1,x2)は、2つの引数x1と引数x2とのうちの大きい方を出力する関数である。(29)式によれば、X軸位置決め時間TstXとY軸位置決め時間TstYのいずれか大きい方のモータの位置決め時間Tstの値が小さいほど評価値Qは大きな値になる。このとき、X軸位置決め時間TstXとY軸位置決め時間TstYの小さい方のモータの位置決め時間Tstは評価値Qには寄与しない。また、位置決め完了の後の加速度最大値Aampが加速度許容値Atolよりも大きい場合に加速度最大値Aampが小さいほど評価値Qは大きな値になる。加速度最大値Aampが加速度許容値Atolよりも小さい場合には、加速度最大値Aampは評価値Qに寄与しない。
 図10では、一例としてX軸位置決め時間TstXよりもY軸位置決め時間TstYの方が長い例を示している。この場合には、位置決め時間Tstの長いY軸の位置決め時間TstYが評価値Qに寄与することとなる。また、図10では、一例として位置決め時間Tstの長いY軸の位置決め完了後の加速度最大値Aampは加速度許容値Atolよりも小さいものとする。このように評価値Qを計算することで多軸の位置決め制御の位置決め時間Tstと位置決め完了後の加速度の大きさを評価することができる。
 以上により、実施の形態3では、評価値Qが大きな値であるほど、位置指令パラメータは優良であるといえる。ただし、評価値Qは、位置決め制御を評価することができるものであれば、(29)式によって特定されるものに限定されない。
 学習部34は、評価値Qを入力として、X軸位置指令パラメータとY軸位置指令パラメータと評価値Qとの関係を学習する。具体的には、X軸位置指令パラメータとY軸位置指令パラメータとを一括して入力パラメータとして、評価値Qの平均値および分散値の推定値を出力するような関数を学習する。学習方法は実施の形態2と同様であるとする。
 学習部34の動作によって、X軸位置指令パラメータおよびY軸位置指令パラメータに対応する評価値Qの平均値と分散値とを得ることができる。さらに学習部34は、実施の形態2と同様に、評価値Qの平均値と分散値との和を最大とするX軸位置指令パラメータとY軸位置指令パラメータとを求める。求められたX軸位置指令パラメータとY軸位置指令パラメータとは、次回の位置決め制御に用いられる。
 学習部34の動作によって、比較的大きな評価値Qを得るための探索と搾取とのバランスを良好に保つことができ、調整の終了時に比較的大きな評価値Qを得る位置指令パラメータを見つけることができる。
 実施の形態3ではX軸およびY軸の双方を同時に動作させる例を示したが、X軸を停止させておきY軸のみを動作させて位置指令形状を調整してもよい。例えばY軸の調整を終える毎にX軸方向に位置を少しずつ移動させることで、各X軸の位置に対応するY軸の最適な位置指令形状を調整することが可能となる。実施の形態3によれば、制御対象3の停止位置に関わらず加速度検出値によって位置指令形状の最適化が可能であるので、加速度検出器4の設置位置を変更するといった操作者の手間を必要としない。
 また、実施の形態3では、X軸およびY軸の2方向における位置決め制御を例に挙げたが、3軸以上における位置決め制御でも、同様にして位置指令を生成することが可能である。
 実施の形態3による位置決め制御装置30によれば、実施の形態1,2の場合と同様に、操作者の試行錯誤を必要とせず、複数の軸の位置指令パラメータを適切に調整することができる。その結果、実施の形態3による位置決め制御装置30によれば、位置決め制御を高速化する良好な指令形状の調整を効率よく行うことができるという効果を得ることができる。
 さらに、実施の形態3では、評価値Qは、1つ以上のモータのうち最も長いモータの位置決め時間Tstに基づいて計算されるようにした。これによって、多軸システムの位置決め時間Tstを短時間化するような位置決め制御の調整が可能になるという効果も有する。
 ここで、実施の形態1,2,3で説明した位置決め制御装置10,20,30のハードウェア構成について説明する。図11は、実施の形態1,2,3による位置決め制御装置を実現するハードウェア構成の一例を模式的に示す図である。なお、位置決め制御装置10,20,30は、同様のハードウェア構成を有しているので、ここでは位置決め制御装置10のハードウェア構成について説明する。
 位置決め制御装置10は、プロセッサ71と、メモリ72と、がバスライン73を介して接続される。プロセッサ71の例は、CPU(Central Processing Unit)またはシステムLSI(Large Scale Integration)である。メモリ72の例は、主記憶装置であるRAM(Random Access Memory)、ROM(Read Only Memory)、補助記憶装置であるHDD(Hard Disk Drive)またはSSD(Solid State Drive)である。
 位置指令生成部11、駆動制御部12、評価部13および学習部14一部又は全部の機能がプロセッサ71によって実現される場合、当該一部又は全部の機能は、プロセッサ71と、ソフトウェア、ファームウェア、またはソフトウェアおよびファームウェアとの組み合わせにより実現される。ソフトウェアまたはファームウェアはプログラムとして記述され、メモリ72に格納される。プロセッサ71は、メモリ72に記憶されたプログラムを読み出して実行することにより、位置指令生成部11、駆動制御部12、評価部13および学習部14の一部または全部の機能を実現する。
 位置指令生成部11、駆動制御部12、評価部13および学習部14の一部または全部の機能がプロセッサ71によって実現される場合、位置決め制御装置10は、位置指令生成部11、駆動制御部12、評価部13および学習部14の一部または全部によって実行されるステップが結果的に実行されることになるプログラムがメモリ72に格納される。メモリ72に格納されるプログラムは、位置指令生成部11、駆動制御部12、評価部13および学習部14の一部または全部が実行する手順または方法をコンピュータに実行させるものであるともいえる。
 以上の実施の形態に示した構成は、一例を示すものであり、別の公知の技術と組み合わせることも可能であるし、実施の形態同士を組み合わせることも可能であるし、要旨を逸脱しない範囲で、構成の一部を省略、変更することも可能である。
 1,5 モータ、10,20,30 位置決め制御装置、11 位置指令生成部、12 駆動制御部、13,33 評価部、14,24,34 学習部、31X X軸位置指令生成部、31Y Y軸位置指令生成部、32X X軸駆動制御部、32Y Y軸駆動制御部。

Claims (6)

  1.  1つ以上のモータを駆動させて制御対象を目標位置に移動させる位置決め制御装置であって、
     位置指令パラメータに基づいて加速区間および減速区間の加速度の形状が独立に決定される位置指令を生成する位置指令生成部と、
     前記モータの位置を示すモータ位置が前記位置指令に追従するように前記モータを駆動する駆動制御部と、
     前記制御対象の加速度を示す加速度検出値を加速度検出部から取得し、前記モータ位置と、前記モータ位置に基づいて位置決め制御の完了が判定された後の前記加速度検出値と、に基づいて前記制御対象の位置決め性能に関する評価値を算出する評価部と、
     前記位置指令パラメータに基づいて決定される加速区間と減速区間とにおける位置指令の加速度の形状のそれぞれを独立に変更しつつ、複数回の位置決め制御が実行された場合の前記位置指令パラメータと前記評価値との関係を学習し、前記位置指令パラメータと前記評価値の関係式を得る学習部と、
     を備えることを特徴とする位置決め制御装置。
  2.  前記評価値は、位置決め開始から位置決め完了が判定されるまでの位置決め時間に基づいて計算されることを特徴とする請求項1に記載の位置決め制御装置。
  3.  前記評価値は、1つ以上の前記モータのうち前記位置決め時間の最も長い前記モータの前記位置決め時間に基づいて計算されることを特徴とする請求項2に記載の位置決め制御装置。
  4.  前記学習部は、前記位置指令パラメータに対応する前記評価値の推定値を出力する関数または前記評価値の平均値および分散値の推定値を出力する関数を前記関係式として得ることを特徴とする請求項1から3のいずれか1つに記載の位置決め制御装置。
  5.  前記学習部は、前記位置指令パラメータと前記評価値との前記関係式に基づいて1つ以上の前記モータの位置指令パラメータを変更することを特徴とする請求項1から4のいずれか1つに記載の位置決め制御装置。
  6.  位置指令生成部、駆動制御部、評価部および学習部を備える位置決め制御装置で1つ以上のモータを駆動させて制御対象を目標位置に移動させる位置決め方法であって、
     前記位置指令生成部が、位置指令パラメータに基づいて加速区間および減速区間の加速度の形状が独立に決定される位置指令を生成するステップと、
     前記駆動制御部が、前記モータの位置を示すモータ位置が前記位置指令に追従するように前記モータを駆動するステップと、
     前記評価部が、前記制御対象の加速度を示す加速度検出値を取得し、前記モータ位置と、前記モータ位置に基づいて位置決め制御の完了が判定された後の前記加速度検出値と、に基づいて前記制御対象の位置決め性能に関する評価値を算出するステップと、
     前記学習部が、前記位置指令パラメータに基づいて決定される加速区間と減速区間とにおける位置指令の加速度の形状のそれぞれを独立に変更しつつ、複数回の位置決め制御が実行された場合の前記位置指令パラメータと前記評価値との関係を学習し、前記位置指令パラメータと前記評価値の関係式を得るステップと、
     を含むことを特徴とする位置決め方法。
PCT/JP2020/009264 2020-03-04 2020-03-04 位置決め制御装置および位置決め方法 WO2021176619A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202080097202.6A CN115136095B (zh) 2020-03-04 2020-03-04 定位控制装置及定位方法
PCT/JP2020/009264 WO2021176619A1 (ja) 2020-03-04 2020-03-04 位置決め制御装置および位置決め方法
JP2020540646A JP6800384B1 (ja) 2020-03-04 2020-03-04 位置決め制御装置および位置決め方法
TW110103444A TWI777395B (zh) 2020-03-04 2021-01-29 定位控制裝置及定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/009264 WO2021176619A1 (ja) 2020-03-04 2020-03-04 位置決め制御装置および位置決め方法

Publications (1)

Publication Number Publication Date
WO2021176619A1 true WO2021176619A1 (ja) 2021-09-10

Family

ID=73740953

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/009264 WO2021176619A1 (ja) 2020-03-04 2020-03-04 位置決め制御装置および位置決め方法

Country Status (4)

Country Link
JP (1) JP6800384B1 (ja)
CN (1) CN115136095B (ja)
TW (1) TWI777395B (ja)
WO (1) WO2021176619A1 (ja)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04324507A (ja) * 1991-04-25 1992-11-13 Hitachi Ltd 駆動装置の加減速制御方法及びロボットシステム
JPH07244517A (ja) * 1994-03-04 1995-09-19 Mitsubishi Electric Corp モーション制御装置
JPH10143249A (ja) * 1996-11-15 1998-05-29 Fujitsu Ltd 制御システムおよび制御システムにおける加速度パターンの設定方法およびパラメータ設定方法
JP2005339503A (ja) * 2004-04-26 2005-12-08 Japan Science & Technology Agency 駆動装置の位置決め制御方法及び装置
JP2007034781A (ja) * 2005-07-28 2007-02-08 Fuji Electric Fa Components & Systems Co Ltd 位置決め制御装置の制御パラメータ調整方法
JP2008204188A (ja) * 2007-02-20 2008-09-04 Nagoya Institute Of Technology モーションコントローラおよびモーションプランナおよび多軸サーボシステムおよびサーボアンプ
WO2012169278A1 (ja) * 2011-06-09 2012-12-13 三菱電機株式会社 モータ制御装置
JP2018126796A (ja) * 2017-02-06 2018-08-16 セイコーエプソン株式会社 制御装置、ロボットおよびロボットシステム
JP2018186610A (ja) * 2017-04-25 2018-11-22 株式会社安川電機 システムおよび評価装置ならびに評価方法
JP2019008472A (ja) * 2017-06-22 2019-01-17 ファナック株式会社 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5707129B2 (ja) * 2010-12-28 2015-04-22 Thk株式会社 モータ制御装置、モータ制御方法、及び制御プログラム
KR101611148B1 (ko) * 2014-06-26 2016-04-08 미쓰비시덴키 가부시키가이샤 위치 결정 제어 장치
JP5968572B1 (ja) * 2015-06-18 2016-08-10 三菱電機株式会社 制御パラメータ調整装置
JP6450732B2 (ja) * 2016-11-11 2019-01-09 ファナック株式会社 数値制御装置
JP6490127B2 (ja) * 2017-03-15 2019-03-27 ファナック株式会社 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法
JP6469171B2 (ja) * 2017-06-14 2019-02-13 ファナック株式会社 電動機の制御装置
JP6734318B2 (ja) * 2018-03-23 2020-08-05 ファナック株式会社 駆動装置及び機械学習装置
DE112018000122T8 (de) * 2018-06-14 2020-04-09 Mitsubishi Electric Corporation Maschinelles-Lernen-Vorrichtung, Korrekturparameter-Anpassungssystem und Maschinelles-Lernen-Verfahren
KR102494187B1 (ko) * 2018-10-12 2023-01-31 미쓰비시덴키 가부시키가이샤 위치 결정 제어 장치 및 위치 결정 방법

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04324507A (ja) * 1991-04-25 1992-11-13 Hitachi Ltd 駆動装置の加減速制御方法及びロボットシステム
JPH07244517A (ja) * 1994-03-04 1995-09-19 Mitsubishi Electric Corp モーション制御装置
JPH10143249A (ja) * 1996-11-15 1998-05-29 Fujitsu Ltd 制御システムおよび制御システムにおける加速度パターンの設定方法およびパラメータ設定方法
JP2005339503A (ja) * 2004-04-26 2005-12-08 Japan Science & Technology Agency 駆動装置の位置決め制御方法及び装置
JP2007034781A (ja) * 2005-07-28 2007-02-08 Fuji Electric Fa Components & Systems Co Ltd 位置決め制御装置の制御パラメータ調整方法
JP2008204188A (ja) * 2007-02-20 2008-09-04 Nagoya Institute Of Technology モーションコントローラおよびモーションプランナおよび多軸サーボシステムおよびサーボアンプ
WO2012169278A1 (ja) * 2011-06-09 2012-12-13 三菱電機株式会社 モータ制御装置
JP2018126796A (ja) * 2017-02-06 2018-08-16 セイコーエプソン株式会社 制御装置、ロボットおよびロボットシステム
JP2018186610A (ja) * 2017-04-25 2018-11-22 株式会社安川電機 システムおよび評価装置ならびに評価方法
JP2019008472A (ja) * 2017-06-22 2019-01-17 ファナック株式会社 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法

Also Published As

Publication number Publication date
JPWO2021176619A1 (ja) 2021-09-10
TWI777395B (zh) 2022-09-11
CN115136095B (zh) 2023-04-04
CN115136095A (zh) 2022-09-30
JP6800384B1 (ja) 2020-12-16
TW202139587A (zh) 2021-10-16

Similar Documents

Publication Publication Date Title
US10261497B2 (en) Machine tool for generating optimum acceleration/deceleration
JP6774637B2 (ja) 制御装置及び制御方法
US10331104B2 (en) Machine tool, simulation apparatus, and machine learning device
US10481566B2 (en) Machine learning device, servo control device, servo control system and machine learning method
JP6474449B2 (ja) 調整装置及び調整方法
JP2020032481A (ja) ロボット制御装置、ロボット装置、ロボット制御のパラメータ調整方法、およびプログラム
US20170090452A1 (en) Machine tool for generating speed distribution
JP6811908B1 (ja) 数値制御装置、機械学習装置および数値制御方法
JPWO2007046257A1 (ja) モータ制御装置及び方法及びプログラム記憶媒体
JP6664561B1 (ja) 位置決め制御装置及び位置決め方法
Fan et al. Robust dexterous manipulation under object dynamics uncertainties
KR102494187B1 (ko) 위치 결정 제어 장치 및 위치 결정 방법
Ng et al. Model predictive control and transfer learning of hybrid systems using lifting linearization applied to cable suspension systems
Le Flohic et al. Model-based method for feed drive tuning applied to serial machine tool
WO2021176619A1 (ja) 位置決め制御装置および位置決め方法
Mbede et al. Exponential tracking control using backstepping approach for voltage-based control of a flexible joint electrically driven robot
US20030173928A1 (en) Servo control method
JP7305061B2 (ja) パラメータ調整装置およびパラメータ調整方法
WO2022186051A1 (ja) 調整支援装置、制御システム及び調整支援方法
JP6981579B2 (ja) 位置決め制御装置及び位置決め制御方法
JP2019181635A (ja) 情報処理装置及び情報処理方法
WO2023209754A1 (ja) サーボ調整システム
Zhang et al. A brief review and discussion on learning control of robotic manipulators
Shiriaev et al. Control synthesis of robotic manipulator by Lyapunov's direct method in conditions of incomplete information
Shcherbakov et al. Robot Manipulator Control Using Predictive Model under Conditions of Incomplete Information

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2020540646

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20923513

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20923513

Country of ref document: EP

Kind code of ref document: A1