WO2024034338A1

WO2024034338A1 - 情報処理装置

Info

Publication number: WO2024034338A1
Application number: PCT/JP2023/026367
Authority: WO
Inventors: 武史成田; 直樹丸井
Original assignee: Ntn株式会社
Priority date: 2022-08-08
Filing date: 2023-07-19
Publication date: 2024-02-15

Abstract

パラメータ調整装置（５）は、産業機械の座標データを取得する座標データ取得部（１０）と、動作パラメータを生成するパラメータ生成部（２０）と、動作パラメータを記憶するパラメータ記憶部（３０）と、産業機械の状態データを取得する状態データ取得部（４０）と、状態データに基づいて指標データを計算する指標データ計算部（５０）と、動作パラメータと指標データとを紐付けたサンプルデータを記憶するサンプル記憶部（６０）と、サンプルデータを用いて適正と推定される動作パラメータを探索するパラメータ探索部（７０）と、適正と推定される動作パラメータと座標データとを紐付けた学習用データを用いて座標データから適正パラメータを推定するための学習モデルを生成するモデル学習部（８０）とを備える。

Description

情報処理装置

　本開示は、生産設備の位置決めに用いられる産業機械などの駆動装置の動作の制御に用いられる動作パラメータを、自動で調整する情報処理装置に関する。

　特許文献１は、産業機械に対する動作指令に応じて、適切な制御パラメータを適用するパラメータ調整装置を開示する。特許文献１に記載のパラメータ調整装置は、産業機械の動作における速度、加速度、ジャークの少なくとも１つの指令を含む状態データ、および産業機械を制御する制御器から取得した該動作の最適パラメータに基づいて、状態データから最適な制御パラメータを推定するためのモデルを機械学習によって生成し、動作指令に応じて適した動作パラメータをモデルから取得し、適用する。

特開２０２０－３５１５９号公報

　多軸ロボット等の産業機械の動作を制御する上で、産業機械の動作時の振動、および軌道のズレを修正するためには、ゲインパラメータを始めとした制御パラメータの調整を行なうことが求められる。一方、制御パラメータを適切に調整するには、制御およびセンサに関する知識が必要となる上に、産業機械には個体差があるため、それらに対応できるだけの経験も必要となることから、制御パラメータの調整は未だに手作業での試行錯誤によって行なわれているのが現状である。

　特許文献１は、工作機械、ロボット等の産業機械の速度、加速度、ジャーク等の指令に応じて、より適した制御パラメータを設定するパラメータ調整装置を提案している。しかし、たとえば、予め設定した座標間の位置決め等の動作において、動作時間の短縮を目的に、産業機械に可能な限り早く動作することを望む場合、速度、加速度、ジャークについても、適切な値に調整する手間が必要となる。

　特に、制御対象である位置決め装置の剛性や振動特性が、位置決め装置の現在の位置や姿勢によって大きく変わる場合、位置決め可能な全領域に対して固定された１組の制御パラメータを用いると、条件の悪い姿勢を考慮しなくてはならないため、全体として動作時間の短縮が困難である。

　本開示は、上記の課題を解決するためになされたものであって、その目的は、従来のような手作業での試行錯誤による調整を行なうことなく、駆動装置の動作を行なうのに適した動作パラメータ（制御パラメータ）を推定することである。

　本開示による情報処理装置は、制御器によって制御される駆動装置の情報処理装置であって、駆動装置の動作座標を示す座標データを外部から取得する座標データ取得部と、制御器による駆動装置の制御に用いられる動作パラメータを生成するパラメータ生成部と、動作パラメータを記憶するパラメータ記憶部と、動作パラメータによる動作中の駆動装置の状態を示す状態データを取得する状態データ取得部と、動作パラメータの適否を判定するための指標となる指標データを状態データに基づいて計算する指標データ計算部と、動作パラメータと指標データとを紐付けたサンプルデータを記憶するサンプル記憶部と、指標データに基づいて適正と推定される動作パラメータをサンプルデータを用いて探索するパラメータ探索部と、パラメータ探索部によって適正と推定される動作パラメータと座標データとを紐付けた学習用データを用いて、座標データの動作を行なうのに適した動作パラメータである適正パラメータを座標データから推定するための学習モデルを生成するモデル学習部とを備える。

　本開示によれば、座標データ取得部に座標データを入力することによって、動作パラメータが生成され、その動作パラメータによる状態データから指標データが計算され、指標データに基づいて適正と推定される動作パラメータが探索される。そして、適正と推定される動作パラメータと座標データとを紐付けた学習用データを用いて、座標データから適正パラメータを推定するための学習モデルが生成される。すなわち、情報処理装置に座標データを入力するだけで、座標データから適正パラメータを推定するための学習モデルを生成することができる。そのため、従来のような手作業での試行錯誤によるパラメータ調整を行なうことなく、この学習モデルに座標データを入力するだけで、座標データの動作を行なうのに適した動作パラメータを推定することができる。

パラメータ調整装置（情報処理装置）を備える制御システムの全体構成の一例を模式的に示す図である。パラメータ生成の一例を示す図である。サンプルデータの一例を示す図である。モデル学習部の学習の一例を模式的に示す図（その１）である。学習モデルを生成する処理手順の一例を示すフローチャートである。サンプルデータを生成する処理の詳細な流れの一例を示すフローチャートである。学習用データを生成する処理の詳細な流れの一例を示すフローチャートである。適正パラメータの出力の一例を示す図（その１）である。適正パラメータを出力する処理手順の一例を示す。パラメータ調整装置の構成の一例を模式的に示す図（その１）である。パラメータ調整装置の構成の一例を模式的に示す図（その２）である。モデル学習部の学習の一例を模式的に示す図（その２）である。適正パラメータの出力の一例を示す図（その２）である。産業機械の構成の一例を示す図である。角度調整装置の構成の一例を示す図である。パラレルリンク機構の構成の一例を示す斜視図である。一組のリンク機構を直線で表現した図である。

　以下、本開示の実施の形態について図面を参照しつつ説明する。なお、以下の図面において同一または相当する部分には同一の参照番号を付し、その説明は繰り返さない。

　図１は、本実施の形態によるパラメータ調整装置５（情報処理装置）を備える制御システム１の全体構成の一例を模式的に示す図である。

　この制御システム１は、産業機械２と、制御器３と、センサ４と、パラメータ調整装置５とを備える。産業機械２は、制御器３の制御対象となる駆動装置（モータあるいは空圧シリンダなどアクチュエータ）を含んで構成される。産業機械２は、たとえば、生産設備等に用いられる、多軸ロボット、工作機械などである。

　制御器３は、予め設定された動作パラメータに従って産業機械２の動作（位置決め動作など）の制御を行なう。動作パラメータとは、産業機械２の動作時の速度、加速度等の速度に関連するパラメータ、および産業機械２の制御に用いられる制御パラメータである。制御パラメータは、たとえば、ＰＩＤ制御におけるゲインパラメータ、状態フィードバックの係数、ロバスト制御のパラメータである。

　制御器３は、産業機械２の状態データを取得することができる。状態データとは、産業機械２の動作中における状態を示すデータであって、たとえば、制御器３に予め組み込まれたプログラムによって生成される信号、制御対象となるモータを流れる電流値、追従誤差等のフィードバック信号などである。パラメータ調整装置５は、産業機械２の状態データを制御器３から取得することができる。

　制御器３には、複数の座標データが設定されている。座標データとは、産業機械２を動作させる上で設定される始点座標と終点座標とを一組にしたデータである。たとえば、制御器３の制御対象が産業機械２のモータである場合、座標データは、モータの出力軸の始点角度と終点角度とを一組にしたデータとすることができる。

　センサ４は、産業機械２の状態データを検出する。センサ４は、たとえば、加速度ピックアップである。パラメータ調整装置５は、産業機械２の状態データを、制御器３からだけでなく、必要に応じてセンサ４からも取得することができる。なお、センサ４は省略されてもよい。

　パラメータ調整装置５は、産業機械２の座標データを入力として産業機械２の適正パラメータを出力する情報処理装置である。適正パラメータは、産業機械２がある座標データの動作を行なうのに適した動作パラメータである。本実施の形態においては、後述する指標データ計算部５０によって計算される指標データに基づいて、動作パラメータの適否が判定される。すなわち、指標データは、動作パラメータが適正であるか否かを評価するための指標となるデータである。たとえば、産業機械２が位置決め動作を行なう場合には、指標データは、位置決め動作の継続時間、位置決め動作終了後の振動の最大振幅、振動時間、位置偏差の累計値、あるいは、それらの組み合わせ等とすることができる。たとえば、指標データが位置決め動作の継続時間である場合、動作パラメータのうち、位置決め動作の継続時間が予め設定された閾値内に収まる動作パラメータが適正であると判定される。

　パラメータ調整装置５は、座標データ取得部１０と、パラメータ生成部２０と、パラメータ記憶部３０と、状態データ取得部４０と、指標データ計算部５０と、サンプル記憶部６０と、パラメータ探索部７０と、モデル学習部８０と、モデル記憶部９０と、パラメータ出力部１００とを備える。

　座標データ取得部１０は、サンプル記憶部６０から座標取得指令を受信すると、サンプル記憶部６０に記憶されていない座標データを制御器３から取得する。たとえば、座標データ取得部１０は、サンプル記憶部６０に記憶されている座標データと、制御器３に記憶されている座標データとを照合し、制御器３に記憶されている座標データのなかに、サンプル記憶部６０に記憶されていない座標データが存在する場合、サンプル記憶部６０に記憶されていない座標データを制御器３から取得する。

　座標データ取得部１０は、制御器３から座標データを取得すると、その座標データを学習フェーズで使用するのか、それとも活用フェーズで使用するのかを判定する。学習フェーズとは、座標データから適正パラメータを推定するための学習モデルを生成するフェーズである。活用フェーズとは、学習フェーズで生成された学習モデルに座標データを入力することによって、適正パラメータを出力するフェーズである。たとえば、座標データ取得部１０は、サンプル記憶部６０から受信する座標取得指令に座標データの使用目的を示す情報が含まれている場合には、座標取得指令に含まれる使用目的に応じて、制御器３から取得した座標データを学習フェーズで使用するのか、それとも活用フェーズで使用するのかを判定する。

　［学習フェーズ］
　制御器３から取得された座標データを「学習フェーズ」で使用する場合、パラメータ調整装置５は、座標データを入力とし適正パラメータを出力とする学習モデルを、２段階で生成する。１段階目では、後述のパラメータ探索部７０が、制御器３に設定されている複数の座標データ（動作）の各々について、適正パラメータを探索する。２段階目では、後述するモデル学習部８０が、座標データとその座標データにおける適正パラメータとの複数の組合せ（学習用データ）から、座標データを入力とし適正パラメータを出力とする学習モデルを機械学習を用いて生成する。以下、学習モデルの生成について詳細に説明する。

　座標データ取得部１０は、制御器３から取得された座標データを「学習フェーズ」で使用すると判定した場合、その座標データとともにパラメータ生成指令をパラメータ生成部２０に出力する。

　パラメータ生成部２０は、座標データ取得部１０から座標データおよびパラメータ生成指令を受信する毎に、受信した座標データに対して第１所定数の動作パラメータを生成し、生成した第１所定数の動作パラメータをその座標データとともにパラメータ記憶部３０に記憶する。

　たとえば、パラメータ生成部２０は、学習モデルの生成前に予め設定しておいた動作パラメータの探索範囲から、一様分布のような確率分布を用いてサンプリングされた動作パラメータを生成する。なお、動作パラメータの探索範囲は、たとえば、学習モデルの生成前に予め設定しておいた動作パラメータの下限値と上限値との間の範囲とすることができる。

　各座標データに対して生成される動作パラメータの数（すなわち上述の「第１所定数」）は、後述するパラメータ探索部７０のパラメータ探索方法に応じて設定される。具体的には、第１所定数は、後述するパラメータ探索部７０が各座標データに対する適正候補パラメータを探索するのに必要な数以上の値に設定される。第１所定数は、たとえば、外部から適切な値が設定されてもよい。パラメータ探索部７０による適正候補パラメータの探索方法としてベイズ最適化が用いられる場合には、ベイズ最適化が１点のデータからでも適正値を探索できることに鑑み、各座標データに対して生成される動作パラメータの数（第１所定数）を「１」に設定するができる。そのため、適正パラメータの探索方法としてベイズ最適化以外の回帰モデルが用いられる場合と比較して、動作パラメータの生成数を少なく抑えることができる。

　各座標データに対して生成される動作パラメータの数（第１所定数）が２以上である場合、パラメータ生成部２０は、生成された２以上の動作パラメータの各々に対して順番ラベルを付与する。順番ラベルは、制御器３が産業機械２を動作させる順番を示すものである。

　図２は、第１所定数がｎ（ｎは２以上の整数）である場合、すなわち、ある座標データに対してｎ個の動作パラメータが生成され、ｎ個の動作パラメータにそれぞれｎ個の順番ラベルが付与される場合の、パラメータ生成の一例を示す図である。ｎ個の順番ラベルは、たとえば、１からｎまでの連続した整数値で表される。パラメータ生成部２０は、ｎ個（第１所定数）の順番ラベル付きの動作パラメータを、座標データともにパラメータ記憶部３０に記憶する。なお、第１所定数の値は、固定値であってもよいし、座標データに応じて変更される変動値であってもよい。

　図１に戻って、パラメータ記憶部３０は、ある座標データに対して図２に示すような順番ラベルが付与された第１所定数の動作パラメータが記憶されると、それらのデータを含む動作指令を制御器３に出力する。

　制御器３は、パラメータ記憶部３０からの動作指令を受信すると、動作指令に含まれる座標データの動作を、動作指令に含まれる第１所定数の動作パラメータを用いて、順番ラベルが示す順番で順次実行するように産業機械２を制御する。これにより、動作指令に含まれる１つの座標データの動作が、動作パラメータを変えながら第１所定数と同じ回数だけ実行されることになる。

　また、パラメータ記憶部３０は、制御器３に動作指令を出力する際に、その動作指令を指標データ計算部５０にも出力する。この際、パラメータ記憶部３０は、動作指令の出力元がパラメータ記憶部３０であることを示すラベルを動作指令に付与する。

　状態データ取得部４０は、制御器３による産業機械２の動作中に、制御器３あるいはセンサ４から産業機械２の状態データを取得し、取得された状態データとともに計算指令を指標データ計算部５０に出力する。

　指標データ計算部５０は、状態データ取得部４０から状態データおよび計算指令を受信すると、取得した状態データを用いて指標データを計算するとともに、状態データ取得部４０が状態データを取得した時の動作パラメータをパラメータ記憶部３０もしくは後述するパラメータ探索部７０から取得する。

　指標データは、上述のように、動作パラメータが適正であるか否かを評価するための指標となるデータであって、たとえば、産業機械２の位置決め動作の継続時間である。たとえば、産業機械２の動作中に制御器３が状態データの１つとして連続的に信号を発信する場合、その信号が連続的に発信され続けた時間を、指標データ（位置決め動作の継続時間）とすることができる。

　また、指標データは２種類以上でもよい。例えば、上記の継続時間は産業機械２の動作時間に関する指標だが、これに加えて位置決め時の残留振動を考慮した指標も併せて計算し、動作時間と残留振動の２つのデータを組み合わせたものを１つの指標データとしてもよい。組み合わせ方については、例えば、２つ以上の指標の値を線形結合してもよいし、それぞれの指標の値を保持する形でもよい。

　また、残留振動を表現する指標としては、例えば産業機械２の先端に設置した加速度ピックアップから取得したデータを加工したものが考えられる。もしくは、産業機械２を制御する駆動装置からトルクデータを取得し、トルクデータの振動振幅とトルク波形の減衰率を線形結合した値を残留振動を表現する指標としてもよい。

　また、指標データ計算部５０は、取得した動作パラメータが、パラメータ記憶部３０から取得された動作パラメータであるのか、それとも、パラメータ探索部７０から取得された動作パラメータ（後述の適正候補パラメータ）であるのかを判定する。たとえば、取得した動作パラメータに出力元を示すラベルが付与されている場合には、指標データ計算部５０は、そのラベルを参照することによって、取得した動作パラメータがパラメータ記憶部３０から取得された動作パラメータであるのか、それとも、パラメータ探索部７０から取得された動作パラメータであるのかを判定する。

　取得した動作パラメータがパラメータ記憶部３０から取得された動作パラメータである場合、指標データ計算部５０は、取得した動作パラメータと指標データとを紐付けたサンプルデータを生成し、そのサンプルデータにパラメータ記憶部３０から取得した動作パラメータであることを示すラベルと各サンプルデータの動作（座標データ）とを付与して、サンプル記憶部６０に記憶する。

　なお、指標データ計算部５０が取得した動作パラメータがパラメータ探索部７０で探索された動作パラメータ（後述の適正候補パラメータ）である場合の処理については、後に詳述する。

　上述した一連のサンプルデータの生成処理は、パラメータ生成部２０が座標データ取得部１０から受信する複数の座標データの各々に対して行なわれる。したがって、各座標データに対して、複数（第１所定数）のサンプルデータがサンプル記憶部６０に記憶される。

　サンプル記憶部６０は、記憶されているサンプルデータをパラメータ探索部７０に送信する。この際、サンプル記憶部６０は、各座標データについて、記憶している全て（第１所定数以上）のサンプルデータをパラメータ探索部７０に送信する。

　パラメータ探索部７０は、サンプル記憶部６０からサンプルデータを受信すると、受信したサンプルデータに基づいて、複数の座標データの各々について、適正パラメータを推定（探索）する機能を有する。具体的には、パラメータ探索部７０は、探索用モデル構築部７１と、探索用モデル記憶部７２と、パラメータ推定部７３とを含む。

　探索用モデル構築部７１は、サンプル記憶部６０からサンプルデータを取得した場合、サンプル記憶部６０から取得したサンプルデータを用いて探索用モデルを生成する。探索用モデルは、動作パラメータを入力として指標データを出力するブラックボックス関数を推論する回帰モデルである。なお、探索用モデルは、複数の座標データに対して、それぞれ生成される。

　そして、探索用モデル構築部７１は、生成した探索用モデルを、サンプルデータに付与されていた座標データとともに、探索用モデルとして探索用モデル記憶部７２に出力する。これにより、探索用モデル記憶部７２には、複数の座標データにそれぞれ対応する複数の探索用モデルが記憶される。

　探索用モデル記憶部７２は、探索用モデル構築部７１が生成した探索用モデルを記憶すると、パラメータ推定部７３にパラメータ推定指令を出力する。

　パラメータ推定部７３は、探索用モデル記憶部７２からパラメータ推定指令を受信すると、探索用モデル記憶部７２に記憶されている探索用モデルに基づいて、適正と推定される動作パラメータ（適正パラメータの候補となる動作パラメータ、以下「適正候補パラメータ」ともいう）を推定する。そして、パラメータ推定部７３は、適正候補パラメータの推定に用いた座標データの動作を産業機械２に実行させる動作指令を制御器３に出力するとともに、推定した適正候補パラメータを指標データ計算部５０に出力する。

　パラメータ探索部７０による適正候補パラメータの推定は、たとえば、ベイズ最適化を用いて実施することができる。この場合、まず、探索用モデル構築部７１においてガウス過程回帰モデルが生成され、生成されたガウス過程回帰モデルが探索用モデルとして探索用モデル記憶部７２に記憶される。その後、パラメータ推定部７３において、探索用モデルを用いてベイズ最適化を実施することによって、適正候補パラメータが推定（探索）される。ベイズ最適化による探索方法そのものは、論文等で既に公知であるため、ここでは詳細の説明を省略する。

　また、指標データが２種類以上の指標の値をセットで保持している場合、適正候補パラメータの推定に多目的最適化アルゴリズムを用いてもよい。多目的最適化については論文等で公知のため、ここでは詳細な説明は省略する。例えば適正候補パラメータの推定にベイズ最適化を用いるならば、獲得関数にＥＨＶＩ（Expected　Hypervolume　Improvement）を用いることで、２つ以上の指標に基づくパレート解を、適正候補パラメータとして推定することができる。

　なお、適正候補パラメータの推定方法はベイズ最適化に限られない。たとえば、回帰モデルにニューラルネットワークを採用し、最適化方法に勾配法を用いた方法でもよい。もしくは、動作パラメータを入力とし指標データを出力とする関数をスプライン曲線で描画し、ピーク値の一つに対応するパラメータを適正パラメータとして推定する方法でもよい。

　指標データ計算部５０は、パラメータ探索部７０から動作パラメータ（適正候補パラメータ）を受信すると、状態データ取得部４０から取得した状態データを用いて指標データを計算するとともに、計算した指標データを用いて、パラメータ探索部７０から取得した動作パラメータが適正パラメータであるか否かを判定する。たとえば、指標データ計算部５０は、計算した指標データと予め設定されている比較用の指標データとを比較し、計算した指標データが比較用の指標データに対して有意に改善されているとみなせる場合に、パラメータ探索部７０から受信した動作パラメータ（適正候補パラメータ）を適正パラメータであると判定する。

　指標データが１種類の指標のみの場合、たとえば、指標データ計算部５０は、計算した指標データｙと比較用の指標データｙｓとの差異ｄを下記の式（１）を用いて定量化する。

　　　ｄ＝１－ｙ／ｙｓ　・・・（１）
　そして、式（１）で算出された差異ｄが予め設定された閾値内に収まる場合には、指標データ計算部５０は、受信した動作パラメータ（適正候補パラメータ）を適正パラメータであると判定する。一方、式（１）で算出された差異ｄが予め設定された閾値内に収まらない場合には、指標データ計算部５０は、受信した動作パラメータ（適正候補パラメータ）を適正パラメータでないと判定する。

　指標データが２種類以上の指標の値をセットで保持している場合、例えば、指標データを構成する指標それぞれについて上記の式（１）の計算を行うことで指標毎に差異ｄを計算し、指標毎に計算した差異ｄを足し合わせた値が予め設定した閾値内に収まれば適正パラメータと判定する。

　受信した動作パラメータ（適正候補パラメータ）が適正パラメータである場合、指標データ計算部５０は、その動作パラメータと指標データとを紐付けたサンプルデータに、そのサンプルデータ中の動作パラメータがパラメータ探索部７０から取得されたことを示すラベルと、そのサンプルデータの動作（座標データ）と、そのサンプルデータ中の動作パラメータが適正パラメータであることを示すラベルとを付与して、サンプル記憶部６０に記憶する。

　一方、受信した動作パラメータ（適正候補パラメータ）が適正パラメータでない場合、指標データ計算部５０は、動作パラメータと指標データとを紐付けたサンプルデータに、そのサンプルデータ中の動作パラメータがパラメータ探索部７０から取得されたことを示すラベルと、そのサンプルデータの動作（座標データ）と、そのサンプルデータ中の動作パラメータが適正パラメータでないことを示すラベルとを付与して、サンプル記憶部６０に記憶する。

　なお、サンプルデータに付与される各ラベルは、たとえば「０」または「１」の２値の整数によって構成することができる。なお、サンプルデータに付与する複数のラベルを１つのラベルに統合してもよい。たとえば、サンプルデータ中の動作パラメータがパラメータ記憶部３０から取得された動作パラメータである場合には「０」、サンプルデータ中の動作パラメータがパラメータ探索部７０で探索された動作パラメータであり、かつ適正パラメータでない場合には「１」、サンプルデータ中の動作パラメータがパラメータ探索部７０で探索された動作パラメータであり、かつ適正パラメータである場合には「２」とする、３値の整数を付与してもよい。こうすることで、サンプルデータに付与するラベルの数を削減することができる。

　図３は、サンプル記憶部６０が記憶しているサンプルデータの一例を示す図である。図３には、複数の動作１，２，…（複数の座標データ１，２，…）の各々について、複数のサンプルデータが生成される例が示されている。

　動作１（座標データ１）のサンプルデータには、パラメータ生成部２０で生成されたｎ個の動作パラメータに基づいてｎ回の動作１を行なうことでそれぞれ得られたｎ個のサンプルデータと、パラメータ探索部７０で推定されたｍ個の動作パラメータに基づいてｍ回の動作１を行なうことでそれぞれ得られたｍ個のサンプルデータとの、合計（ｎ＋ｍ）個のサンプルデータが含まれている。

　さらに、パラメータ生成部２０で生成された動作パラメータを含むｎ個のサンプルデータには、パラメータ生成部２０で生成されたことを示すラベルと、座標データ１を示すラベルとが付与されている。一方、パラメータ探索部７０で推定された動作パラメータを含むｍ個のサンプルデータには、パラメータ探索部７０で推定されたことを示すラベルと、座標データ１を示すラベルとに加えて、適正パラメータであるか否かを示すラベルが付与されている。

　座標データ２に対応する動作２のサンプルデータも、動作１のサンプルデータと同様である。具体的には、動作２のサンプルデータには、パラメータ生成部２０で生成されたｐ個の動作パラメータを含むｐ個のサンプルデータと、パラメータ探索部７０で推定されたｑ個の動作パラメータを含むｑ個のサンプルデータとの、合計（ｐ＋ｑ）個のサンプルデータが含まれている。

　また、パラメータ生成部２０で生成された動作パラメータを含むｐ個のサンプルデータには、パラメータ生成部２０で生成されたことを示すラベルと、座標データ２を示すラベルとが付与されている。パラメータ探索部７０で推定された動作パラメータを含むｑ個のサンプルデータには、パラメータ探索部７０で推定されたことを示すラベルと、座標データ２を示すラベルとに加えて、適正パラメータであるか否かを示すラベルが付与されている。

　図３に示す例では、動作１（座標データ１）に対しては、（ｎ＋ｍ）番目のサンプルデータに含まれる動作パラメータが適正パラメータであると判定されている。また、動作２（座標データ２）に対しては、（ｐ＋ｑ）番目のサンプルデータに含まれる動作パラメータが適正パラメータであると判定されている。このような座標データとその座標データに対する適正パラメータとの組合せが、学習用データとして、後述するモデル学習部８０による学習モデルの生成に用いられる。

　なお、図３に示す例では、（座標データ１、動作パラメータｎ＋ｍ）、（座標データ２、動作パラメータｐ＋ｑ）の２組が学習用データとして示されているが、実際には、サンプル記憶部６０には、後述するモデル学習部８０のモデル学習方法に応じて設定された第２所定数の学習用データが記憶される。サンプル記憶部６０に記憶されている学習用データの数である「第２所定数」は、後述するモデル学習部８０による学習モデルの生成に必要な数以上の値に設定される。

　図１に戻って、サンプル記憶部６０に第２所定数の学習用データが記憶されると、サンプル記憶部６０は、モデル学習指令をモデル学習部８０に送信する。

　モデル学習部８０は、サンプル記憶部６０からモデル学習指令を受信すると、サンプル記憶部６０に記憶されている第２所定数の学習用データを用いて、座標データを入力として適正パラメータを出力とする学習モデルを生成する。モデル学習部８０は、たとえば、ニューラルネットワークを用いた深層学習によって学習モデルを生成する。モデル学習部８０は、生成した学習モデルをモデル記憶部９０に記憶する。

　図４は、モデル学習部８０の学習の一例を模式的に示す図である。図４に示される学習モデルは、機械学習（たとえば、ニューラルネットワークを用いた深層学習）によって得られた回帰モデルである。図４に示されるように、モデル学習部８０は、ｒ個（第２所定数）の学習用データ（座標データと適正パラメータとの組合せ）を用いて機械学習を行なうことによって、座標データを入力として適正パラメータを出力とする学習モデルを生成する。

　図５は、パラメータ調整装置５が学習フェーズにおいて学習モデルを生成する処理手順の一例を示すフローチャートである。このフローチャートは、座標データ取得部１０が制御器３から取得した座標データを「学習フェーズ」で使用すると判定した場合に開始される。

　まず、座標データ取得部１０が、制御器３から取得した座標データとともにパラメータ生成指令をパラメータ生成部２０に出力する（ステップＳ１０）。

　次いで、パラメータ生成部２０が、座標データ取得部１０から受信した座標データに対して、第１所定数の動作パラメータを生成し、生成した第１所定数の動作パラメータをその座標データとともにパラメータ記憶部３０に記憶する（ステップＳ２０）。

　次いで、パラメータ記憶部３０が、サンプルデータを生成する処理を行なう（ステップＳ３０）。

　図６は、サンプルデータを生成する処理（図５のステップＳ３０）の詳細な流れの一例を示すフローチャートである。

　パラメータ記憶部３０は、記憶されている第１所定数の動作パラメータのうちから、今回の処理対象となる動作パラメータを上述の順番ラベルを参照して特定し、特定された動作パラメータと座標データとを含む動作指令を生成する（ステップＳ３１）。

　次いで、パラメータ記憶部３０は、生成された動作指令を制御器３に出力する（ステップＳ３２）。これにより、制御器３は、動作指令に応じて産業機械２を動作させる。

　次いで、状態データ取得部４０が、制御器３による産業機械２の動作中に、制御器３あるいはセンサ４から産業機械２の状態データを取得する（ステップＳ３３）。

　次いで、状態データ取得部４０が、取得された状態データとともに計算指令を指標データ計算部５０に出力する（ステップＳ３４）。これにより、指標データ計算部５０において指標データが計算される。

　次いで、指標データ計算部５０が、動作パラメータと指標データとを紐付けたサンプルデータに、動作パラメータがパラメータ生成部２０で生成された動作パラメータであることを示すラベルを付与して、サンプル記憶部６０に記憶する（ステップＳ３５）。

　図５に戻って、指標データ計算部５０は、サンプル記憶部６０に記憶されたサンプルデータの数が第１所定数に達したか否かを判定する（ステップＳ４０）。サンプルデータの数が第１所定数に達していない場合（ステップＳ４０においてＮＯ）、指標データ計算部５０は、処理対象となる動作パラメータを順番ラベルに従って順次変えながら、サンプルデータが第１所定数に達するまでステップＳ３０の処理を繰り返し実行する。

　サンプルデータが第１所定数に達した場合（ステップＳ４０においてＹＥＳ）、学習用データを生成する処理が行なわれる（ステップＳ５０）。

　図７は、学習用データを生成する処理（図５のステップＳ５０）の詳細な流れの一例を示すフローチャートである。

　まず、パラメータ探索部７０が、記憶している全て（第１所定数以上）のサンプルデータを用いて、動作パラメータを入力として指標データを出力する探索用モデルを生成し、生成した探索用モデルを探索用モデル記憶部７２に記憶する（ステップＳ５１）。

　次いで、パラメータ探索部７０が、探索用モデル記憶部７２に記憶されている探索用モデルを用いて、座標データ取得部１０から受信した座標データに対する適正候補パラメータを推定する（ステップＳ５２）。

　次いで、パラメータ探索部７０が、推定された適正候補パラメータと座標データとを含む動作指令を生成し、生成した動作指令を制御器３に出力する（ステップＳ５３）。これにより、制御器３は、動作指令に応じて産業機械２を動作させる。

　次いで、状態データ取得部４０が、制御器３による産業機械２の動作中に、制御器３あるいはセンサ４から産業機械２の状態データを取得する（ステップＳ５４）。

　次いで、状態データ取得部４０が、取得された状態データとともに計算指令を指標データ計算部５０に出力する（ステップＳ５５）。これにより、指標データ計算部５０において指標データが計算される。

　次いで、指標データ計算部５０は、計算した指標データを用いて、今回の適正候補パラメータが適正パラメータであるか否かを判定する（ステップＳ５６）。

　今回の適正候補パラメータが適正パラメータでないと判定された場合（ステップＳ５６においてＮＯ）、指標データ計算部５０は、今回の適正候補パラメータと指標データとを紐付けたサンプルデータに、パラメータ探索部７０から取得した適正候補パラメータであることを示すラベルと、適正パラメータではないことを示すラベルとを付与して、サンプル記憶部６０に記憶する（ステップＳ５７）。その後、処理はステップＳ５１に戻され、適正パラメータと判定される適正候補パラメータが推定されるまで、ステップＳ５１～Ｓ５６の処理が繰り返される。

　そして、適正パラメータであると判定される適正候補パラメータが推定された場合（ステップＳ５６においてＹＥＳ）、指標データ計算部５０は、その適正候補パラメータと指標データとを紐付けたサンプルデータに、パラメータ探索部７０で生成された動作パラメータであることを示すラベルと、適正パラメータであることを示すラベルとを付与して、サンプル記憶部６０に学習用データとして記憶する（ステップＳ５８）。

　図５に戻って、指標データ計算部５０は、サンプル記憶部６０に記憶された学習用データの数が第２所定数（モデル学習部８０による学習モデルの生成に必要な数以上の値）に達したか否かを判定する（ステップＳ６０）。サンプル記憶部６０に記憶された学習用データの数が第２所定数に達していない場合（ステップＳ６０においてＮＯ）、座標データ取得部１０が、サンプル記憶部６０に記憶されている座標データとは異なる新たな座標データを制御器３から取得する（ステップＳ７０）。その後、処理はステップＳ２０に戻され、サンプル記憶部６０に記憶された学習用データの数が第２所定数に達するまで、ステップＳ２０～Ｓ６０の処理が繰り返される。

　サンプル記憶部６０に記憶された学習用データの数が第２所定数に達した場合（ステップＳ６０においてＹＥＳ）、モデル学習部８０が、サンプル記憶部６０に記憶された第２所定数の学習用データを用いて、座標データを入力とし動作パラメータを出力とする学習モデルを生成し（ステップＳ８０）、生成した学習モデルをモデル記憶部９０に記憶する（ステップＳ９０）。

　［活用フェーズ］
　次に、活用フェーズの処理について説明する。座標データ取得部１０は、制御器３から取得された座標データを「活用フェーズ」で使用すると判定した場合、パラメータ出力部１００に対してパラメータ出力指令を出力する。

　図８は、パラメータ出力部１００による適正パラメータの出力の一例を示す図である。パラメータ出力部１００は、座標データ取得部１０からパラメータ出力指令を受信すると、座標データ取得部１０から取得した座標データをモデル記憶部９０に記憶されている学習モデルに入力することによって、その座標データに対する適正パラメータを出力する。

　図９は、パラメータ調整装置５が活用フェーズにおいて適正パラメータを出力する処理手順の一例を示す。このフローチャートは、座標データ取得部１０が、制御器３から取得した座標データを「活用フェーズ」で使用すると判定した場合に開始される。

　まず、座標データ取得部１０が、制御器３から取得した座標データをパラメータ出力部１００に出力する（ステップＳ１００）。

　次いで、パラメータ出力部１００が、座標データ取得部１０が取得した座標データを、モデル記憶部９０に記憶されている学習モデルに入力することで、入力した座標データに対応する適正パラメータを取得する（ステップＳ１１０）。

　以上に説明したパラメータ調整装置５は、以下のような特徴を有する。
　（１）　本実施の形態によるパラメータ調整装置５は、産業機械２の動作座標を示す座標データを取得する座標データ取得部１０と、制御器３による産業機械２の制御に用いられる動作パラメータを生成するパラメータ生成部２０と、動作パラメータを記憶し、動作パラメータを含む動作指令を制御器３に出力するパラメータ記憶部３０と、動作パラメータによる動作中の産業機械２の状態データを取得する状態データ取得部４０と、動作パラメータの適否を判定するための指標となる指標データを状態データに基づいて計算する指標データ計算部５０と、動作パラメータと指標データとを紐付けたサンプルデータを記憶するサンプル記憶部６０と、指標データに基づいて適正と推定される動作パラメータをサンプルデータを用いて探索するパラメータ探索部７０と、パラメータ探索部７０によって適正と推定される動作パラメータと座標データとを紐付けた学習用データを用いて、座標データから適正パラメータを推定するための学習モデルを生成するモデル学習部８０とを備える。

　上記構成においては、座標データ取得部１０に座標データを入力することによって、動作パラメータが生成され、その動作パラメータによる状態データから指標データが計算され、指標データに基づいて適正と推定される動作パラメータが探索される。そして、適正と推定される動作パラメータと座標データとを紐付けた学習用データを用いて、座標データから適正パラメータを推定するための学習モデルが生成される。すなわち、パラメータ調整装置５に座標データを入力するだけで、座標データから適正パラメータを推定するための学習モデルを生成することができる。そのため、従来のような手作業での試行錯誤によるパラメータ調整を行なうことなく、この学習モデルに座標データを入力するだけで適正パラメータを推定することができる。

　（２）　さらに、本実施の形態によるパラメータ調整装置５は、モデル学習部８０が生成した学習モデルを記憶するモデル記憶部９０と、座標データ取得部１０が取得した座標データを、モデル記憶部９０が記憶している学習モデルに入力することで、適正パラメータを出力するパラメータ出力部１００とをさらに備える。

　そのため、パラメータ調整装置５に座標データに入力するだけで、適正パラメータを出力することができる。

　（３）　さらに、パラメータ探索部７０は、パラメータ探索部７０によって適正と推定される動作パラメータで産業機械２を制御するように制御器３に指令する。状態データ取得部４０は、パラメータ探索部７０によって適正と推定される動作パラメータで産業機械２を動作させた場合の産業機械２の状態を示す状態データ（探索状態データ）を取得する。指標データ計算部５０は、探索状態データに基づいて指標データを計算する。サンプル記憶部６０は、探索状態データに基づいて適正と判定される動作パラメータと座標データとを紐付けたデータを学習用データとして記憶する。モデル学習部８０は、サンプル記憶部６０に記憶された学習用データを用いて学習モデルを生成する。

　上記構成においては、パラメータ探索部７０によって適正と推定される動作パラメータをそのまま学習用データとして用いるのではなく、パラメータ探索部７０によって適正と推定される動作パラメータで産業機械２の実際に動作させた場合の状態データ（探索状態データ）に基づいて指標データを計算し、その指標データに基づいて適正と判定される動作パラメータを学習データとして用いる。そのため、パラメータ探索部７０によって適正と推定される動作パラメータをそのまま学習用データとして用いる場合に比べて、学習モデルをより適切に生成することができる。

　（４）さらに、指標データ計算部５０は探索状態データに基づいて２種類以上の指標を計算して、計算された２種類以上の指標の組合せを前記指標データとし、パラメータ探索部７０は、指標データを構成するそれぞれの指標に基づいて、多目的最適化手法を用いて適正と判定される動作パラメータを推定する。

　こうすることで、複数の指標を線形結合して一つにした値を指標データとした場合よりも、さらに適正なパラメータを推定できる。

　（５）　さらに、パラメータ生成部２０は、パラメータ探索部７０のパラメータ探索方法に応じて設定された第１所定数の動作パラメータを生成する。

　これにより、パラメータ探索部７０による探索を目的とした産業機械２の動作回数が無駄に多くなることを抑制することができる。そのため、パラメータ調整装置５が探索用モデルを生成するのに要する時間を短くすることができる。

　（６）　さらに、モデル学習部８０は、モデル学習部８０のモデル学習方法に応じて設定された第２所定数の学習用データがサンプル記憶部６０に記憶された場合に、第２所定数の学習用データを用いて学習モデルを生成する。

　これにより、モデル学習部８０による学習モデルの生成を目的とした産業機械２の動作回数が無駄に多くなることを抑制することができる。そのため、パラメータ調整装置５が学習モデルを生成するのに要する時間を短くすることができる。

　（７）　さらに、パラメータ探索部７０は、サンプル記憶部６０が記憶しているサンプルデータを用いて、動作パラメータから指標データを推定するための探索用モデルを生成する探索用モデル構築部７１と、探索用モデルを記憶する探索用モデル記憶部７２と、探索用モデルを用いて推定される指標データに基づいて適正と推定される動作パラメータを探索するパラメータ推定部７３とを備える。

　これにより、動作パラメータと指標データとの関係が探索用モデルから把握できるようになる。そのため、適正パラメータをより効率的に探索することができる。

　（８）さらに、状態データ取得部４０は、産業機械２を動作する駆動装置からトルクデータを取得し、指標データ計算部５０は、トルクデータから計算したトルクの振動振幅値とトルク波形の減衰率の線形結合を産業機械２の位置決め後の残留振動の指標とする。

　こうすることで、産業機械に取り付けるエンドエフェクタの制約によって加速度ピックアップを取り付けられない場合でも、残留振動の指標を計算することができる。

　また、トルクデータを用いることで、位置決め装置を構成する減速機の減速比が大きくても残留振動のデータを取得することができる。

　また、トルクの振動振幅値だけでなく、トルク波形の減衰率を考慮することで、より適切に残留振動の度合いを示す指標を計算することができる。

　なお、本実施の形態によるパラメータ調整装置５は上記（１）～（８）の構成を備えるが、本開示によるパラメータ調整装置は、少なくとも上記（１）の構成を備えるものであればよく、必ずしも上記（２）～（８）の構成を全て備えるものに限定されない。たとえば、本開示によるパラメータ調整装置は、上記（１）の構成と、上記（２）～（８）の少なくとも１つの構成との組合せであればよい。

　［変形例１］
　上述の実施の形態によるパラメータ調整装置５は、学習フェーズで学習モデルを生成する構成と、活用フェーズで適正パラメータを出力する構成との双方を備える。

　これに対し、学習フェーズで学習モデルを生成する構成と、活用フェーズで適正パラメータを出力する構成とを、別々の装置に分割して備えるようにしてもよい。

　図１０は、本変形例１によるパラメータ調整装置５Ａの構成の一例を模式的に示す図である。本変形例１によるパラメータ調整装置５Ａは、上述の実施の形態によるパラメータ調整装置５から、学習フェーズでは用いられずに活用フェーズで用いられる「パラメータ出力部１００」を取り除いたものである。

　図１１は、本変形例１によるパラメータ調整装置５Ｂの構成の一例を模式的に示す図である。本変形例１によるパラメータ調整装置５Ｂは、上述の実施の形態によるパラメータ調整装置５に対して、活用フェーズで用いられる座標データ取得部１０、モデル記憶部９０およびパラメータ出力部１００を残し、その他の部分を取り除いたものである。

　このように、学習フェーズで学習モデルを生成する構成と、活用フェーズで適正パラメータを出力する構成とを、別々の装置に分割して備えるようにしてもよい。こうすることで、特に活用フェーズで適正パラメータを出力するための構成を有するハードウェア（図１１に示すパラメータ調整装置５Ｂ）に要求される性能を下げることができ、コストを低減することができる。

　［変形例２］
　上述の実施の形態においてはモデル学習部８０が生成する学習モデルが単一の回帰モデルである例について説明した（図４参照）が、モデル学習部８０が生成する学習モデルは単一の回帰モデルであることには限定されない。

　図１２は、本変形例２によるモデル学習部８０Ａの学習の一例を模式的に示す図である。図１２に示されるように、本変形例２によるモデル学習部８０Ａは、学習モデルとして、分類モデルと、複数の回帰モデルとを生成する。分類モデルは、たとえば、教師なし機械学習の分類方法であるクラスタリングを行なうためのモデルである。複数の回帰モデルは、それぞれ、たとえば重回帰モデルのような一般的な機械学習の回帰モデルである。

　図１２に示されるように、モデル学習部８０Ａは、学習用データ中のｒ個の座標データを用いて、ｒ個の学習用データを複数のグループに分類するための分類モデルを学習する。分類モデルが座標データをグループ分けする基準は、たとえば、始点座標と終点座標の距離である。この場合、分類モデルは、たとえば、距離が長いグループと短いグループとの２つのグループに座標データを分類するように生成される。

　生成された分類モデルは、少なくとの１つ以上の学習用データから構成される複数のグループを出力する。そのため、複数のグループの各々に対して、座標データを入力として適正パラメータを出力する回帰モデルが生成される。

　このような学習方法では、学習用データを複数のグループに分類するため、個々の回帰モデルの学習量を削減することができ、学習モデルの生成に要する時間を短縮することができる。たとえば、回帰モデルにガウス過程回帰モデルを採用している場合、カーネル関数のハイパーパラメータの学習、及び、未知の座標データに対する適正パラメータの推定時に必要な共分散行列の逆行列の計算量のオーダーは、分類モデルによる分割数が多いほど削減されるため、各回帰モデルの学習に要する時間を短くすることができる。

　なお、モデルの入力として学習させる座標データは、必要に応じて特徴ベクトルに変換してもよい。たとえば、産業機械２がＸ軸、Ｙ軸、Ｚ軸の直交座標系からなる３軸の自由度を有するロボットであり、座標データとして始点座標（Ｘs，Ｙs，Ｚs）、終点座標（Ｘｇ，Ｙｇ，Ｚｇ)を設定できる場合、座標データを各軸の座標間の差異（ΔＸ，ΔＹ，ΔＺ）に変換してもよい。

　図１３は、本変形例２によるパラメータ出力部１００Ａによる適正パラメータの出力の一例を示す図である。パラメータ出力部１００Ａは、図１２にて例示した学習モデルを用いて適正パラメータを出力する。具体的には、図１３に示すように、パラメータ出力部１００Ａは、座標データを分類モデルに入力することで、座標データが属するグループを特定し、特定されたグループに対応する回帰モデルに座標データを入力することで、その座標に対する適正パラメータを出力する。

　以上のように、モデル学習部８０が生成する学習モデルは、単一の回帰モデルであることには限定されず、たとえば分類モデルと複数の回帰モデルとであってもよい。

　（産業機械２の構成例）
　以下に、上述のパラメータ調整装置５（情報処理装置）が好適に適用される産業機械２の構成例について説明する。

　図１４は、産業機械２の構成の一例を示す図である。図１４を参照して、産業機械２は、ワーク２２０を載置場所から取り上げるピックアップ装置である。産業機械２は、ワーク設置台２１４上または容器２１３の内部等に任意の姿勢で置かれたワーク２２０をピックアップすることが可能である。産業機械２は、ワーク２２０を撮影する撮影方向を変えることが可能な撮像装置２０９と、ワーク２２０へのアプローチ方向を変えることが可能なピックアップ部２１０とを備える。撮像装置２０９とピックアップ部２１０とは、制御器３によって制御される。

　撮像装置２０９は、少なくとも１つ以上のワーク２２０を撮影する。ピックアップ部２１０は、ワーク２２０にアプローチ方向から近づき、ワーク２２０をピックアップする。ピックアップ対象のワーク２２０は、ワーク設置台２１４上のワーク容器２１３内に乱雑に積みあげられる場合が多い。

　産業機械２は、位置決め機構２４７と角度調整装置２０８とをさらに備える。位置決め機構２４７は、回転機構２０７と直動ユニット２０４によって構成される。角度調整装置２０８には、撮像装置２０９とピックアップ部２１０が取り付けられる。位置決め機構２４７は、ワーク２２０に対する角度調整装置２０８の相対位置を調整することが可能に構成される。回転機構２０７の空間上の位置は、直交３軸の直動ユニット２０４によって変更可能である。

　直動ユニット２０４は、互いに直交するＸ軸、Ｙ軸、Ｚ軸にそれぞれ対応する第１電動アクチュエータ２０４Ｘ，第２電動アクチュエータ２０４Ｙ，第３電動アクチュエータ２０４Ｚを含む。回転機構２０７は、第３電動アクチュエータ２０４Ｚの出力部２０６に取り付けられている。

　角度調整装置２０８は、回転機構２０７に取り付けられている。角度調整装置２０８は、回転機構２０７によって回転が可能である。また、角度調整装置２０８の先端側のリンクハブには、撮像装置２０９とピックアップ部２１０とが取り付けられている。角度調整装置２０８は、撮像装置２０９の光軸方向およびピックアップ部２１０のアプローチ方向を任意に調整可能に構成される。

　図１５は、角度調整装置２０８の構成の一例を示す図である。図１５に示した角度調整装置２０８は、パラレルリンク機構２３０とアクチュエータ２３１とを含む。図１６は、パラレルリンク機構２３０の構成の一例を示す斜視図である。なお、図１５には、図１６に示された３組のリンク機構２３４のうち代表として１組が抽出して示されている。

　図１５、図１６に示すように、産業機械２は、さらに、第１リンクハブ２３２と、撮像装置２０９とピックアップ部２１０とが取り付けられた第２リンクハブ２３３とを備える。位置決め機構２４７は、第１リンクハブ２３２の位置を変更可能に構成される。角度調整装置２０８は、第１リンクハブ２３２と第２リンクハブ２３３とを連結する。

　角度調整装置２０８は、撮像装置２０９およびピックアップ部２１０を姿勢変更可能に支持するパラレルリンク機構２３０と、このパラレルリンク機構２３０を作動させる姿勢制御用のアクチュエータ２３１とで構成される。アクチュエータ２３１は、図１５の角度αを変更することができる。

　図１５、図１６を参照して、パラレルリンク機構２３０は、基端側の第１リンクハブ２３２に対し先端側の第２リンクハブ２３３を３組のリンク機構２３４によって姿勢変更可能に連結したものである。先端側の第２リンクハブ２３３には、図１４に示された撮像装置２０９およびピックアップ部２１０が取り付けられている。なお、ここでは３組のリンク機構２３４を有するパラレルリンク機構２３０について示したが、リンク機構２３４の数は、４組以上であっても良い。

　各リンク機構２３４は、基端側の端部リンク部材２３５、先端側の端部リンク部材２３６、および中央リンク部材２３７で構成される。リンク機構２３４は、４つの回転対偶からなる４節連鎖のリンク機構である。基端側および先端側の端部リンク部材２３５，２３６はＬ字状の形状を有する。

　基端側の端部リンク部材２３５の一端は、基端側の第１リンクハブ２３２に回転自在に連結されている。先端側の端部リンク部材２３６の一端は、先端側の第２リンクハブ２３３に回転自在に連結されている。中央リンク部材２３７は、両端に端部リンク部材２３５，２３６の各他端がそれぞれ回転自在に連結されている。

　パラレルリンク機構２３０は、２つの球面リンク機構を組み合わせた構造を有する。端部リンク部材２３５，２３６と中央リンク部材２３７との各回転対偶の中心軸は、ある交差角γ（図１５）を持っていてもよいし、平行であってもよい。

　図１７は、一組のリンク機構２３４を直線で表現した図である。３組のリンク機構２３４は、幾何学的に同一形状のモデルで示すことができる。

　基端側の第１リンクハブ２３２と先端側の第２リンクハブ２３３と３組のリンク機構２３４とは、２自由度機構を構成する。この２自由度機構では、基端側の第１リンクハブ２３２に対し先端側の第２リンクハブ２３３が直交する２軸の周りに回転自在な２自由度を有する。これらの直交する２軸は、図１７に示す旋回角φの回転軸（中心軸ＱＡ）と折れ角θの回転軸（点Ｏを通り、中心軸ＱＡおよび中心軸ＱＢに直交する軸）である。旋回角φは、第１リンクハブ２３２の中心軸ＱＡに垂直な平面において、中心軸ＱＡの交点を通る基準直線と第２リンクハブ２３３の中心軸ＱＢを投映した直線とが成す角度である。折れ角θは、第１リンクハブ２３２の中心軸ＱＡと第２リンクハブ２３３の中心軸ＱＢとが成す角度である。この２自由度機構は、コンパクトでありながら、基端側の第１リンクハブ２３２に対する先端側の第２リンクハブ２３３の可動範囲を広くとれる。

　折れ角θの調整はリンク機構２３４の動作のみで可能であり、多関節ロボットのようには複数の関節の動作を伴わない。このため、パラレルリンク機構２３０は、多関節ロボットと比べて素早い動作が可能である。したがって、図１６のパラレルリンク機構２３０を機械学習に必要な画像データの収集に用いれば、多関節ロボットと比較して、大量の画像データを短時間で収集することができる。

　図１５に示す角度調整装置２０８の姿勢制御用のアクチュエータ２３１は、減速機構を備えたロータリアクチュエータである。アクチュエータ２３１は、第１リンクハブ２３２の基端部材２４０の面に、回転軸２４２と同軸上に設置されている。アクチュエータ２３１と減速機構は一体に設けられ、減速機構が基端部材２４０に固定されている。３組のリンク機構２３４に図１６の角α１～α３を変更するための３つの姿勢制御用のアクチュエータ２３１を設けても良いが必ずしもアクチュエータ２３１を３つ設けなくても良い。３組のリンク機構２３４のうち少なくとも２組に姿勢制御用のアクチュエータ２３１を設ければ、基端側の第１リンクハブ２３２に対する先端側の第２リンクハブ２３３の姿勢を確定することができる。

　上述のパラメータ調整装置５（情報処理装置）は、図１４～図１７に示す産業機械２のような多軸ロボットの位置決め制御に好適に適用される。

　今回開示された実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本開示の範囲は、上記した実施の形態の説明ではなくて請求の範囲によって示され、請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

　１　制御システム、２　産業機械、３　制御器、４　センサ、５，５Ａ，５Ｂ　パラメータ調整装置、１０　座標データ取得部、２０　パラメータ生成部、３０　パラメータ記憶部、４０　状態データ取得部、５０　指標データ計算部、６０　サンプル記憶部、７０　パラメータ探索部、７１　探索用モデル構築部、７２　探索用モデル記憶部、７３　パラメータ推定部、８０，８０Ａ　モデル学習部、９０　モデル記憶部、１００，１００Ａ　パラメータ出力部、２０４　直動ユニット、２０４Ｘ　第１電動アクチュエータ、２０４Ｙ　第２電動アクチュエータ、２０４Ｚ　第３電動アクチュエータ、２０６　出力部、２０７　回転機構、２０８　角度調整装置、２０９　撮像装置、２１０　ピックアップ部、２１３　容器、２１４　ワーク設置台、２２０　ワーク、２３０　パラレルリンク機構、２３１　アクチュエータ、２３２　第１リンクハブ、２３３　第２リンクハブ、２３４　リンク機構、２３５，２３６　端部リンク部材、２３７　中央リンク部材、２４０　基端部材、２４２　回転軸、２４７　位置決め機。

Claims

　制御器によって制御される駆動装置の情報処理装置であって、
　前記駆動装置の動作座標を示す座標データを外部から取得する座標データ取得部と、
　前記制御器による前記駆動装置の制御に用いられる動作パラメータを生成するパラメータ生成部と、
　前記動作パラメータを記憶し、前記動作パラメータを含む動作指令を前記制御器に出力するパラメータ記憶部と、
　前記動作パラメータによる動作中の前記駆動装置の状態を示す状態データを取得する状態データ取得部と、
　前記動作パラメータの適否を判定するための指標となる指標データを前記状態データに基づいて計算する指標データ計算部と、
　前記動作パラメータと前記指標データとを紐付けたサンプルデータを記憶するサンプル記憶部と、
　前記指標データに基づいて適正と推定される動作パラメータを前記サンプルデータを用いて探索するパラメータ探索部と、
　前記パラメータ探索部によって適正と推定される動作パラメータと前記座標データとを紐付けた学習用データを用いて、前記座標データの動作を行なうのに適した動作パラメータである適正パラメータを前記座標データから推定するための学習モデルを生成するモデル学習部とを備える、情報処理装置。
　前記モデル学習部が生成した前記学習モデルを記憶するモデル記憶部と、
　前記座標データ取得部が取得した前記座標データを、前記モデル記憶部が記憶している前記学習モデルに入力することで、前記適正パラメータを出力するパラメータ出力部とをさらに備える、請求項１に記載の情報処理装置。
　前記パラメータ探索部は、前記パラメータ探索部によって適正と推定される動作パラメータで前記駆動装置を制御するように前記制御器に指令し、
　前記状態データ取得部は、前記パラメータ探索部によって適正と推定される動作パラメータで前記駆動装置を動作させた場合の前記駆動装置の状態を示す探索状態データを取得し、
　前記指標データ計算部は、前記探索状態データに基づいて前記指標データを計算し、
　前記サンプル記憶部は、前記探索状態データに基づいて適正と判定される動作パラメータと前記座標データとを紐付けたデータを前記学習用データとして記憶し、
　前記モデル学習部は、前記サンプル記憶部に記憶された前記学習用データを用いて前記学習モデルを生成する、請求項１または２に記載の情報処理装置。
　前記状態データ取得部は、前記パラメータ探索部によって適正と推定される動作パラメータで前記駆動装置を動作させた場合の前記駆動装置の状態を示す探索状態データを取得し、
　前記指標データ計算部は、前記探索状態データに基づいて２種類以上の指標を計算して、計算された前記２種類以上の指標の組合せを前記指標データとし、
　前記パラメータ探索部は、前記指標データを構成するそれぞれの指標に基づいて、多目的最適化手法を用いて適正と判定される動作パラメータを推定する、請求項１または２に記載の情報処理装置。
　前記パラメータ生成部は、前記パラメータ探索部のパラメータ探索方法に応じて設定された第１所定数の動作パラメータを生成する、請求項１または２に記載の情報処理装置。
　前記モデル学習部は、前記モデル学習部のモデル学習方法に応じて設定された第２所定数の学習用データが前記サンプル記憶部に記憶された場合に、前記第２所定数の前記学習用データを用いて前記学習モデルを生成する、請求項１または２に記載の情報処理装置。
　前記パラメータ探索部は、
　　前記サンプル記憶部が記憶している前記サンプルデータを用いて、前記動作パラメータから前記指標データを推定するための探索用モデルを生成する探索用モデル構築部と、
　　前記探索用モデルを記憶する探索用モデル記憶部と、
　　前記探索用モデルを用いて推定される前記指標データに基づいて適正と推定される動作パラメータを探索するパラメータ推定部とを備える、請求項１または２に記載の情報処理装置。
　前記状態データ取得部は、駆動装置からトルクデータを取得し、
　前記指標データ計算部は、前記トルクデータから計算したトルクの振動振幅値とトルク波形の減衰率の線形結合を駆動装置の位置決め後の残留振動を示す指標とする、請求項１または２に記載の情報処理装置。
　前記モデル学習部は、前記サンプル記憶部が記憶している学習用データを複数のグループに分割する分類モデルと、前記複数のグループに対応してそれぞれ設けられる複数の回帰モデルとを生成する、請求項１または２に記載の情報処理装置。