JP2020055095A - 制御装置及び制御システム - Google Patents

制御装置及び制御システム Download PDF

Info

Publication number
JP2020055095A
JP2020055095A JP2019108190A JP2019108190A JP2020055095A JP 2020055095 A JP2020055095 A JP 2020055095A JP 2019108190 A JP2019108190 A JP 2019108190A JP 2019108190 A JP2019108190 A JP 2019108190A JP 2020055095 A JP2020055095 A JP 2020055095A
Authority
JP
Japan
Prior art keywords
manipulator
control device
data
control
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019108190A
Other languages
English (en)
Other versions
JP6928031B2 (ja
Inventor
佐藤 貴之
Takayuki Sato
貴之 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fanuc Corp
Original Assignee
Fanuc Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fanuc Corp filed Critical Fanuc Corp
Priority to DE102019006725.8A priority Critical patent/DE102019006725B4/de
Priority to US16/588,081 priority patent/US20200101603A1/en
Priority to CN201910949712.0A priority patent/CN110978014A/zh
Publication of JP2020055095A publication Critical patent/JP2020055095A/ja
Application granted granted Critical
Publication of JP6928031B2 publication Critical patent/JP6928031B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】ロボットのマニピュレータを制御する際の押付け力や進行速度、進行方向等のパラメータ調整を適切に行うことが可能な制御装置及び制御システムを提供すること。【解決手段】本発明の制御装置1は、産業用ロボット2を制御指令に基づいて制御する制御部32と、マニピュレータに掛かる力及びモーメントの少なくともいずれかを取得データとして取得するデータ取得部34と、マニピュレータに掛かる力に係る情報を含む力状態データ、及びマニピュレータに係る制御指令の調整行動を示す制御指令調整データを、状態データとして生成すると共に、調整行動を行った後のマニピュレータの動作状態の判定結果を示す判定データを生成する前処理部36と、状態データ及び判定データを用いて、マニピュレータに掛かる力の状態に対する、マニピュレータに係る制御指令の調整行動を強化学習した学習モデルを生成する学習部110と、を備える。【選択図】図2

Description

本発明は、制御装置及び制御システムに関し、特にロボットのマニピュレータを力制御する際の押付け力や進行速度、進行方向等のパラメータ調整を適切に行うことが可能な制御装置及び制御システムに関する。
部品同士を精密な嵌め合う場合やギヤの位相合わせ、バリ取りや研磨などの作業を力センサ付きロボットで行う場合がある。このような作業をロボットに行わせる場合には、ロボットに部品やツールを把持させて、所定の方向の力を所望の値に制御する(力制御)が、この様な力制御の方式として、インピーダンス制御やダンピング制御、ハイブリッド制御などが知られている。いずれの方式でも適切な制御ゲインを設定する必要がある。制御ゲインを自動調整する方法は公知である(例えば、特許文献1等)。
特開2007−237312号公報
上記したように、力制御における制御ゲインの設定方法については公知となっているが、その他のパラメータ、例えば適切な押付け力や進行速度、進行方向などは作業者による調整に頼っている。この様なパラメータ調整に慣れていない作業者にとって、実際の調整作業は難しく、時間がかかったり、人によって結果にばらつきがあったり、調整中に不適切な設定値によりワークやツールを破損させたりする問題がある。
そこで、ロボットのマニピュレータを制御する際の押付け力や進行速度、進行方向等のパラメータ調整を適切に行うことが可能な制御装置及び制御システムが望まれている。
本発明の一態様では、産業用ロボットのマニピュレータの制御に関する各パラメータの自動調整を機械学習で行う機能をロボットの制御装置に設けることにより、上記課題を解決する。
そして、本発明の一態様は、マニピュレータに掛かる力とモーメントを検出する機能を備えた産業用ロボットを制御する制御装置であって、前記産業用ロボットを制御指令に基づいて制御する制御部と、前記産業用ロボットのマニピュレータに掛かる力及びモーメントの少なくともいずれかを取得データとして取得するデータ取得部と、前記取得データに基づいて、前記マニピュレータに掛かる力に係る情報を含む力状態データ、及び前記マニピュレータに係る制御指令の調整行動を示す制御指令調整データを、状態データとして生成すると共に、前記調整行動を行った後の前記マニピュレータの動作状態の判定結果を示す判定データを生成する前処理部と、前記状態データ及び前記判定データを用いて、前記マニピュレータに掛かる力の状態に対する、前記マニピュレータに係る制御指令の調整行動を強化学習した学習モデルを生成する学習部と、を備える制御装置である。
そして、本発明の他の態様は、マニピュレータに掛かる力とモーメントを検出する機能を備えた産業用ロボットを制御する制御装置であって、前記産業用ロボットを制御指令に基づいて制御する制御部と、前記産業用ロボットのマニピュレータに掛かる力及びモーメントの少なくともいずれかを取得データとして取得するデータ取得部と、前記取得データに基づいて、前記マニピュレータに掛かる力に係る情報を含む力状態データ、及び前記マニピュレータに係る制御指令の調整行動を示す制御指令調整データを、状態データとして生成する前処理部と、前記マニピュレータに掛かる力の状態に対する、前記マニピュレータに係る制御指令の調整行動を強化学習した学習モデルを記憶する学習モデル記憶部と、前記状態データに基づいて、前記学習モデル記憶部に記憶された学習モデルを用いた前記マニピュレータに係る制御指令の調整行動を推定する意志決定部と、を備える制御装置である。
本発明の他の態様は、複数の装置がネットワークを介して相互に接続されたシステムであって、前記複数の装置は、少なくとも学習部を備えた制御装置を含む制御システムである。
本発明の一態様により、学習結果に基づいてロボットのマニピュレータを制御する際の押付け力や進行速度、進行方向等のパラメータ調整を適切に行うことが可能となる。
一実施形態による制御装置の概略的なハードウェア構成図である。 第1実施形態による制御装置の概略的な機能ブロック図である。 産業用ロボットによる部品の嵌合作業の例を示す図である。 産業用ロボットによるギヤの組立作業の例を示す図である。 産業用ロボットによるワークのバリ取り・研磨作業の例を示す図である。 クラウドサーバ、フォグコンピュータ、エッジコンピュータを含む3階層構造のシステムの例を示す図である。 コンピュータ上に実装した形態での制御装置の概略的なハードウェア構成図である。 第2実施形態による制御システムの概略的な構成図である。 第3実施形態による制御システムの概略的な構成図である。 第4実施形態による制御システムの概略的な構成図である。
以下、本発明の実施形態を図面と共に説明する。
図1は一実施形態による機械学習装置を備えた制御装置の要部を示す概略的なハードウェア構成図である。本実施形態の制御装置1は、例えば部品の嵌め込みや組付け、バリ取り等をする産業用ロボットを制御する制御装置として実装することができる。
本実施形態による制御装置1が備えるCPU11は、制御装置1を全体的に制御するプロセッサである。CPU11は、ROM12に格納されたシステム・プログラムをバス20を介して読み出し、該システム・プログラムに従って制御装置1全体を制御する。RAM13には一時的な計算データ、教示操作盤60や入力装置71を介して作業者が入力した各種データ等が一時的に格納される。
不揮発性メモリ14は、例えば図示しないバッテリでバックアップされたメモリやSSD(Solid State Drive)等で構成され、制御装置1の電源がオフされても記憶状態が保持される。不揮発性メモリ14には、インタフェース19を介して教示操作盤60から入力された教示データや、入力装置71から入力されたデータ、図示しないインタフェースを介して入力された産業用ロボット制御用のプログラム、産業用ロボットに取り付けられたセンサ3が検出したデータ(マニピュレータに掛かる力やモーメント等)、産業用ロボットの軸を駆動するサーボモータ50から検出されたデータ(サーボモータ50の電流値、位置、速度、加速度、トルク等)、図示しない外部記憶装置やネットワークを介して読み込まれたデータ等が記憶される。不揮発性メモリ14に記憶されたプログラムや各種データは、実行時/利用時にはRAM13に展開されても良い。また、ROM12には、ロボットの制御や教示位置の教示に掛かる処理などを実行するための各種のシステム・プログラム(後述する機械学習装置100とのやりとりを制御するためのシステム・プログラムを含む)があらかじめ書き込まれている。
表示装置70には、メモリ上に読み込まれた各データ、プログラム等が実行された結果として得られたデータ、後述する機械学習装置100から出力されたデータ等がインタフェース17を介して出力されて表示される。また、キーボードやポインティングデバイス等から構成される入力装置71は、作業者による操作に基づく指令,データ等をインタフェース18を介してCPU11に渡す。
教示操作盤60はディスプレイやハンドル、ハードウェアキー等を備えた手動データ入力装置であり、インタフェース19を介して制御装置1からの情報を受けて表示すると共に、ハンドルやハードウェアキー等から入力されたパルスや指令、各種データをCPU11に渡す。
産業用ロボットが備える関節等の軸を制御するための軸制御回路30はCPU11からの軸の移動指令量を受けて、軸の指令をサーボアンプ40に出力する。サーボアンプ40はこの指令を受けて、ロボットが備える軸を移動させるサーボモータ50を駆動する。軸のサーボモータ50は位置・速度検出器を内蔵し、この位置・速度検出器からの位置・速度フィードバック信号を軸制御回路30にフィードバックし、位置・速度のフィードバック制御を行う。なお、図1のハードウェア構成図では軸制御回路30、サーボアンプ40、サーボモータ50は1つずつしか示されていないが、実際には制御対象となるロボットに備えられた軸の数だけ用意される。例えば、6つの軸を備えたロボットの場合には、軸制御回路30、サーボアンプ40、サーボモータ50は、それぞれの軸に対して用意される。
インタフェース21は、制御装置1と機械学習装置100とを接続するためのインタフェースである。機械学習装置100は、機械学習装置100全体を統御するプロセッサ101と、システム・プログラム等を記憶したROM102、機械学習に係る各処理における一時的な記憶を行うためのRAM103、及び学習モデル等の記憶に用いられる不揮発性メモリ104を備える。機械学習装置100は、インタフェース21を介して制御装置1で取得可能な各情報(マニピュレータに掛かる力やモーメント、サーボモータ50の電流値、位置、速度、加速度、トルク等)を観測することができる。また、制御装置1は、機械学習装置100から出力される、力指令乃至トルク指令の変更指示を受けて、プログラムや教示データに基づくロボットの制御指令の修正等を行う。
図2は、第1実施形態による制御装置1と機械学習装置100の概略的な機能ブロック図である。本実施形態の制御装置1は、機械学習装置100が学習を行う場合に必要とされる構成を備えている(学習モード)。図2に示した各機能ブロックは、図1に示した制御装置1が備えるCPU11、及び機械学習装置100のプロセッサ101が、それぞれのシステム・プログラムを実行し、制御装置1及び機械学習装置100の各部の動作を制御することにより実現される。
本実施形態の制御装置1は、制御部32、データ取得部34、前処理部36を備え、制御装置1が備える機械学習装置100は、学習部110、意志決定部120を備えている。また、不揮発性メモリ14上には、産業用ロボット2,センサ3等から取得されたデータが記憶される取得データ記憶部54が設けられており、機械学習装置100の不揮発性メモリ104上には、学習部110による機械学習により構築された学習モデルを記憶する学習モデル記憶部130が設けられている。
制御部32は、不揮発性メモリ104に記憶された制御用プログラム52に基づいて、産業用ロボット2の動作を制御する機能手段である。
制御部32は、作業者による図示しない操作盤の制御操作や、不揮発性メモリ14等に記憶された制御用プログラムに基づいて産業用ロボット2を制御する機能手段である。制御部32は、制御用プログラム52により産業用ロボット2が備える各軸(関節)の移動が指令されている場合に当該軸を駆動するモータに対して制御周期毎に軸角度の変化量としての指令データを出力する、等といったように、産業用ロボット2の各部を制御するために必要とされる一般的な制御のための機能を備える。また、制御部32は、産業用ロボット2が備える各モータのモータ状態量(モータの電流値、位置、速度、加速度、トルク等)を取得し、データ取得部34へと出力する。
データ取得部34は、産業用ロボット2、センサ3、及び入力装置71等から入力された各種データを取得する機能手段である。データ取得部34は、例えば、産業用ロボット制御用のプログラムによる指令や、産業用ロボット2のマニピュレータに掛かる力やモーメント、産業用ロボット2の軸を駆動するサーボモータ50の電流値、位置、速度、加速度、トルク等を取得し、取得データ記憶部54に記憶する。データ取得部34は、センサ3から検出するデータや、サーボモータ50に掛かるデータを時系列データとして取得するようにしても良い。データ取得部34は、図示しない外部記憶装置や有線/無線のネットワークを介して他のコンピュータからデータを取得するようにしても良い。
前処理部36は、データ取得部34が取得したデータに基づいて、機械学習装置100による学習に用いられる状態データを作成する。前処理部36は、データ取得部34が取得したデータを機械学習装置100において扱われる統一的な形式へと変換(数値化、サンプリング等)した状態データを作成する。例えば、前処理部36は、機械学習装置100が強化学習をする場合において、該学習における所定の形式の状態データS及び判定データDの組を作成する。
前処理部36が作成する状態データSは、産業用ロボット2のマニピュレータに掛かる力に係る情報を含む力状態データS1、前記力状態データS1の力の状態において行ったマニピュレータの制御指令(速度指令、力指令、トルク指令等)の調整行動を示す制御指令調整データS2を含む。
力状態データS1は、産業用ロボット2のマニピュレータに掛かる送り方向の力を少なくとも含み、また、送り方向以外の方向に掛かる力や、力のモーメントを含んでいても良い。力状態データS1は、産業用ロボット2のマニピュレータに設置されたセンサ3により検出してもよいし、産業用ロボット2のそれぞれの軸を駆動するサーボモータ50に流れる電流等から総合的に求めるようにしても良い。
制御指令調整データS2は、前記力状態データS1の力の状態において行ったマニピュレータの送り方向の制御指令(速度指令、力指令、トルク指令等)の調整行動としてマニピュレータの送り方向の速度指令、力指令、トルク指令等の制御指令を少なくとも含み、また、更に送り方向以外の方向の制御指令を含んでいても良い。
前処理部36が作成する判定データDは、前記力状態データS1の力の状態において、前記制御指令調整データS2で示される制御指令の調整行動を行った場合における、該調整行動後のマニピュレータの動作状態を判定結果を示すデータである。判定データDは、マニピュレータに掛かる負荷の程度を示す負荷判定データD1を少なくとも含み、また、マニピュレータの作業時間の程度を示す作業時間判定データD2を含んでも良い。
学習部110は、前処理部36が作成したデータを用いた機械学習を行う。学習部110は、公知の強化学習の手法により、産業用ロボット2の動作状態に対する、マニピュレータの制御指令(速度指令、力指令、トルク指令等)の調整行動を学習した学習モデルを生成し、生成した学習モデルを学習モデル記憶部130に記憶する。強化学習は、学習対象が存在する環境の現在状態(つまり入力)を観測すると共に現在状態で所定の行動(つまり出力)を実行し、その行動に対し何らかの報酬を与えるというサイクルを試行錯誤的に反復して、報酬の総計が最大化されるような方策(本願の機械学習装置ではマニピュレータの速度指令、力指令、トルク指令等の制御指令の調整行動)を最適解として学習する手法である。学習部110が行う強化学習の手法としては、Q学習等が挙げられる。
学習部110によるQ学習において、報酬Rは、例えば、マニピュレータを送り方向へと移動させる際に加わる負荷の大きさが予め定めた所定の負荷の範囲内に収まる場合に「良」と判定して正(プラス)の報酬Rとし、予め定めた所定の負荷を超える場合に「否」と判定して負(マイナス)の報酬Rとすることができる。また、報酬Rは、例えば、マニピュレータを送り方向へと移動させる作業にかかる時間(1作業にかかる時間、所定の距離を移動するのに係る時間等)が予め定めた所定の閾値以内である場合に「良」と判定して正(プラス)の報酬Rとし、予め定めた所定の閾値を超える場合に「否」と判定して負(マイナス)の報酬Rとするようにしても良い。報酬Rの値は、負荷の大きさの度合いや、作業にかかる時間の長さに応じて変化するものであっても良い。また、判定の条件として、判定データDに複数のデータが含まれている場合には、それら複数のデータを組み合わせて判定するようにしても良い。
学習部110は、ニューラルネットワークを価値観数Q(学習モデル)をとして用い、状態データSと行動aとをニューラルネットワークの入力とし、当該状態における当該行動aの価値(結果y)を出力するように構成しても良い。この様に構成する場合、学習モデルとしては入力層、中間層、出力層の三層を備えたニューラルネットワークを用いても良いが、三層以上の層を為すニューラルネットワークを用いた、いわゆるディープラーニングの手法を用いることで、より効果的な学習及び推論を行うように構成することも可能である。学習部110が生成した学習モデルは、不揮発性メモリ104上に設けられた学習モデル記憶部130に記憶され、意志決定部120による産業用ロボット2のマニピュレータの制御指令の調整行動の推定処理に用いられる。
なお、学習部110は、学習の段階では必須の構成となるが、学習部110による産業用ロボット2のマニピュレータの制御指令の調整行動の学習が完了した後には必ずしも必須の構成ではない。例えば、学習が完了した機械学習装置100を顧客に出荷する場合等には、学習部110を取り外して出荷するようにしても良い。
意志決定部120は、前処理部36から入力された状態データSに基づいて、学習モデル記憶部130に記憶された学習モデルを用いて産業用ロボット2のマニピュレータの送り方向に係る制御指令の調整行動の最適解を求め、求めた産業用ロボット2のマニピュレータの送り方向に係る制御指令の調整行動を出力する。本実施形態の意志決定部120では、学習部110による強化学習により生成された(パラメータが決定された)学習モデルに対して、前処理部36から入力された状態データS(力状態データS1、制御指令調整データS2等)と、産業用ロボット2のマニピュレータの制御指令の調整行動(例えば、速度や力、トルクの指令値の調整)を入力データとして入力することで現在の状態において当該行動をとった場合の報酬を算出できるが、この報酬の算出を現在取り得る複数の産業用ロボット2のマニピュレータの制御指令の調整行動について行い、算出された複数の報酬を比較して、最も大きな報酬が算出される産業用ロボット2のマニピュレータの制御指令の調整行動を最適解として推定する。意志決定部120が推定した産業用ロボット2のマニピュレータの制御指令の調整行動の最適解は、制御部32へと入力されて産業用ロボット2のマニピュレータの制御指令の調整に用いられる他、例えば表示装置70に表示出力したり、図示しない有線/無線ネットワークを介してホストコンピュータやクラウドコンピュータ等に送信出力したりすることで利用しても良い。
上記した構成を備えた制御装置1では、産業用ロボット2を用いて行われる様々な作業において、マニピュレータの送り方向に掛かる力やモーメントを検出しながら、適切な速度加減、力加減でマニピュレータを送る制御を自動的に調整することが可能となる。
図3〜5は、本願の制御装置1により産業用ロボット2を制御して行う作業の例を示している。
図3は、制御装置1により産業用ロボット2を制御して、該産業用ロボット2に取り付けられたマニピュレータで部品を把持して、他の部品の所定位置に対して嵌合する作業の例を示している。この様な例において、データ取得部34は、産業用ロボット2のマニピュレータに掛かる各軸方向(X軸方向、Y軸方向、Z軸方向)の力と各軸周りのモーメントを取得し、これら力及びモーメントに基づいて前処理部36が力状態データS1を生成する。これに対して、マニピュレータの送り方向(部品の嵌合方向)に係る制御指令の調整行動として、送り方向の力指令及び速度指令の少なくともいずれかを調整し、その結果として、マニピュレータに掛かる各軸方向の負荷の合力が所定の閾値以下に収まっているか否かを負荷判定データD1、嵌合方向への移動に掛かる時間(所定距離の移動に掛かる時間)が予め定めた所定の閾値以下に収まっているか否かを作業時間判定データD2とする。なお、マニピュレータの制御指令の調整行動としては、更に送り方向以外の方向へのマニピュレータの調整行動(部品の傾きの微調整、部品の嵌合方向に対する垂直方向の位置の微調整等)を含んでも良い。このような調整行動を行いながら、学習部110は嵌合作業におけるマニピュレータに掛かる各軸方向の力と各軸周りのモーメント対する適切な調整行動の学習を行い、その学習結果に基づいた意志決定部120が決定した調整行動に従って、制御部32は適切な産業用ロボット2の制御を行うことができるようになる。
図4は、制御装置1により産業用ロボット2を制御して、該産業用ロボット2に取り付けられたマニピュレータでギヤを把持して、他のギヤに対して歯車の位相を合わせながらギヤを組み立てる作業の例を示している。この様な例において、データ取得部34は、産業用ロボット2のマニピュレータに掛かる送り方向の力とギヤの軸周りのモーメントを取得し、これら力及びモーメントに基づいて前処理部36が力状態データS1を生成する。これに対して、マニピュレータの送り方向に係る制御指令の調整行動として、送り方向の力指令を調整し、その結果として、マニピュレータに掛かる送り方向の負荷が所定の閾値以下に収まっているか否か、及びギヤの軸周りの負荷が所定の閾値以下に収まっているか否か、を負荷判定データD1、マニピュレータの送り方向への移動に掛かる時間(所定距離の移動に掛かる時間)が予め定めた所定の閾値以下に収まっているか否かを作業時間判定データD2とする。なお、マニピュレータの制御指令の調整行動としては、更にギヤの軸周りの角速度指令や速度指令の調整行動を含んでも良い。このような調整行動を行いながら、学習部110はギヤ組立作業におけるマニピュレータに掛かる送り方向の力とギヤの軸周りのモーメントに対する適切な調整行動の学習を行い、その学習結果に基づいた意志決定部120が決定した調整行動に従って、制御部32は適切な産業用ロボット2の制御を行うことができるようになる。
図5は、制御装置1により産業用ロボット2を制御して、該産業用ロボット2にマニピュレータの代わりに取り付けられた研磨工具でワークのバリ取りや研磨を行う作業の例を示している。この様な例において、データ取得部34は、産業用ロボット2のマニピュレータに掛かる送り方向の力とワークに対する工具の押しつけ方向の力を取得し、これら力に基づいて前処理部36が力状態データS1を生成する。これに対して、マニピュレータの送り方向に係る制御指令の調整行動として、送り方向の速度指令を調整し、その結果として、マニピュレータに掛かる送り方向の負荷が所定の閾値以下に収まっているか否か、及びワークに対する押しつけ方向の負荷が所定の範囲(第1閾値以上、第2閾値以下)であるか否か、を負荷判定データD1、マニピュレータの送り方向への移動に掛かる時間(所定距離の移動に掛かる時間)が予め定めた所定の閾値以下に収まっているか否かを作業時間判定データD2とする。なお、マニピュレータの制御指令の調整行動としては、更にワークへの押しつけ方向の力指令の調整行動を含んでも良い。このような調整行動を行いながら、学習部110はバリ取りや研磨の作業におけるマニピュレータに掛かる送り方向の力とワークへの押し付け方向の力に対する適切な調整行動の学習を行い、その学習結果に基づいた意志決定部120が決定した調整行動に従って、制御部32は適切な産業用ロボット2の制御を行うことができるようになる。
以下の、第2〜4実施形態では、第1実施形態による制御装置1が、クラウドサーバやホストコンピュータ、フォグコンピュータ、エッジコンピュータ(ロボットコントローラ、制御装置等)を含む複数の装置と有線/無線のネットワークを介して相互に接続したシステムの一部として実装されている実施形態について説明する。図6に例示されるように、以下の第2〜4実施形態では、複数の装置のそれぞれがネットワークに接続された状態でクラウドサーバ6等を含む層、フォグコンピュータ7等を含む層、エッジコンピュータ8(セル9に含まれるロボットコントローラ、制御装置等)等を含む層の、3つの階層に論理的に分けて構成されているシステムを想定する。この様なシステムに於いて、本発明による一態様による制御装置1は、クラウドサーバ6、フォグコンピュータ7、エッジコンピュータ8のいずれの上にも実装することが可能であり、それぞれの複数の装置との間でネットワークを介して相互に機械学習に係る処理で用いるデータを共有して分散学習をしたり、生成した学習モデルをフォグコンピュータ7やクラウドサーバ6に収集して大規模な解析を行ったり、更に、生成した学習モデルの相互再利用等をしたりすることができる。図6に例示されるシステムにおいて、セル9は各地の工場にそれぞれ複数設けられ、それぞれのセル9を所定の単位(工場単位、同じ製造業者の複数の工場単位等)で上位層のフォグコンピュータ7が管理する。そして、これらフォグコンピュータ7が収集、解析したデータを、更に上位層のクラウドサーバ6で収集、解析等を行い、その結果として得られた情報を各々のエッジコンピュータ8における制御等に活用することができる。
図7はクラウドサーバ、フォグコンピュータ等のコンピュータ上に制御装置を実装した場合の概略的なハードウェア構成図である。
本実施形態によるコンピュータ上に実装された制御装置1’が備えるCPU311は、制御装置1’を全体的に制御するプロセッサである。CPU311は、ROM312に格納されたシステム・プログラムをバス320を介して読み出し、該システム・プログラムに従って制御装置1’の全体を制御する。RAM313には一時的な計算データや表示データ、図示しない入力部を介してオペレータが入力した各種データ等が一時的に格納される。
不揮発性メモリ314は、例えば図示しないバッテリでバックアップされるなどして、制御装置1’の電源がオフされても記憶状態が保持されるメモリとして構成される。不揮発性メモリ314には、入力装置371を介して入力されたプログラム、制御装置1’の各部やネットワーク5を介して産業用ロボット2’等から取得された各種データが記憶されている。不揮発性メモリ314に記憶されたプログラムや各種データは、実行時/利用時にはRAM313に展開されても良い。また、ROM312には、公知の解析プログラムなどの各種のシステム・プログラム(後述する機械学習装置100とのやりとりを制御するためのシステム・プログラムを含む)があらかじめ書き込まれている。
制御装置1’は、インタフェース319を介して有線/無線のネットワーク5と接続されている。ネットワーク5には、少なくとも1つの産業用ロボット2’(制御装置を備えた産業用ロボット)や、他の制御装置1、エッジコンピュータ8、フォグコンピュータ7、クラウドサーバ6等が接続され、制御装置1’との間で相互にデータのやり取りを行っている。
表示装置370には、メモリ上に読み込まれた各データ、プログラム等が実行された結果として得られたデータ等がインタフェース317を介して出力されて表示される。また、キーボードやポインティングデバイス等から構成される入力装置371は、作業者による操作に基づく指令,データ等をインタフェース318を介してCPU311に渡す。
インタフェース321は、制御装置1’と機械学習装置100とを接続するためのインタフェースである。機械学習装置100については、図1で説明したものと同様の構成を備える。
この様に、クラウドサーバ、フォグコンピュータ等のコンピュータ上に制御装置1’を実装する場合、産業用ロボット2’からの情報の取得や、産業用ロボット2’に対するマニピュレータの制御指令の調整が、ネットワーク5を介してやり取りされる点を除けば、制御装置1’が備える機能については第1実施形態で説明したものと同様のものとなる。この時、産業用ロボット2’は制御装置を備えているため、制御装置1’が備える制御部32は、産業用ロボット2’の制御は行わず、産業用ロボット2’が備える制御装置を介した該産業用ロボット2’の加工状態に係る情報の取得と制御を行う。
図8は、制御装置1’を備えた第2実施形態による制御システムの概略的な構成図である。制御システム500は、複数の制御装置1,1’、複数の産業用ロボット2’、及びそれら制御装置1,1’、産業用ロボット2’を互いに接続するネットワーク5とを備える。
制御システム500では、機械学習装置100を備える制御装置1’は、学習部110の学習結果を用いて、産業用ロボット2’におけるマニピュレータの制御指令の調整を推定する。また、少なくとも1つの制御装置1’が、他の複数の制御装置1、1’のそれぞれが得た状態変数S及び判定データDに基づき、全ての制御装置1、1’に共通する産業用ロボット2,2’におけるマニピュレータの制御指令の調整を学習し、その学習結果を全ての制御装置1、1’が共有するように構成できる。したがって制御システム500によれば、より多様なデータ集合(状態変数S及び判定データDを含む)を入力として、学習の速度や信頼性を向上させることができる。
図9は、機械学習装置と制御装置とを異なる装置上に実装した第3実施形態によるシステムの概略的な構成図である。制御システム500’は、クラウドサーバ、ホストコンピュータ、フォグコンピュータ等のコンピュータの一部として実装された少なくとも1台の機械学習装置100(図9では、フォグコンピュータ7の一部として実装された例を示している)と、複数の制御装置1”と、それら制御装置1”とコンピュータとを互いに接続するネットワーク5とを備える。なお、コンピュータのハードウェア構成は、図7に示した制御装置1’の概略的なハードウェア構成と同様に、CPU311、RAM313,不揮発性メモリ314等の一般的なコンピュータが備えるハードウェアがバス320を介して接続して構成される。
上記構成を有する制御システム500’は、機械学習装置100が、複数の制御装置1”のそれぞれについて得られた状態変数S及び判定データDに基づき、全ての制御装置1”に共通する産業用ロボット2におけるマニピュレータの制御指令の調整を学習し、その学習結果を用いて、それぞれの産業用ロボット2におけるマニピュレータの制御指令の調整を行うことができるようになる。制御システム500’の構成によれば、複数の制御装置1”のそれぞれが、存在する場所や時期に関わらず、必要なときに必要な数の制御装置1”を機械学習装置100に接続することができる。
図10は、機械学習装置100’と制御装置1とを備えた第4実施形態による制御システム500”の概略的な構成図である。制御システム500”は、エッジコンピュータやフォグコンピュータ、ホストコンピュータ、クラウドサーバ等のコンピュータの上に実装された少なくとも1台の機械学習装置100’(図10では、フォグコンピュータ7の一部として実装された例を示している)と、複数の制御装置1と、それら制御装置1とコンピュータとを互いに接続する有線/無線のネットワーク5とを備える。
上記構成を有する制御システム500”では、機械学習装置100’を備えるフォグコンピュータ7が、各々の制御装置1から、該制御装置1が備える機械学習装置100による機械学習の結果として得られた学習モデルを取得する。そして、フォグコンピュータ7が備える機械学習装置100’は、これら複数の学習モデルに基づく知識の最適化や効率化の処理を行うことで、新たに最適化乃至効率化された学習モデルを生成し、生成した学習モデルを各々の制御装置1に対して配布する。
機械学習装置100’が行う学習モデルの最適化乃至効率化の例としては、各制御装置1から取得した複数の学習モデルに基づいた蒸留モデルの生成が挙げられる。この場合、本実施例による機械学習装置100’は、学習モデルに対して入力する入力データを作成し、該入力データを各々の学習モデルに対して入力した結果として得られる出力を用いて、1から学習を行うことで新たに学習モデル(蒸留モデル)を生成する。このようにして生成された蒸留モデルは、上記でも説明したように、外部記憶媒体やネットワーク5を介して制御装置1や他のコンピュータに対して配布して活用される。
機械学習装置100’が行う学習モデルの最適化乃至効率化の他の例としては、各制御装置1から取得した複数の学習モデルに対して蒸留を行う過程において、入力データに対する各学習モデルの出力データの分布を一般的な統計的手法(例えば、外れ値検定等)で解析し、入力データと出力データの組の外れ値を抽出し、該外れ値を除外した入力データと出力データの組を用いて蒸留を行うことも考えられる。このような過程を経ることで、それぞれの学習モデルから得られる入力データと出力データの組から例外的な推定結果を除外し、例外的な推定結果を除外した入力データと出力データの組を用いて蒸留モデルを生成することができる。このようにして生成された蒸留モデルは、複数の制御装置1で生成された学習モデルと比べてより汎用的な学習モデルとして活用することが可能となる。
なお、他の一般的な学習モデルの最適化乃至効率化の手法(各学習モデルを解析し、その解析結果に基づいて学習モデルのハイパパラメータを最適化する等)も適宜導入することが可能である。
本実施例による制御システム500”では、例えばエッジコンピュータとしての複数の制御装置1に対して設置されたフォグコンピュータ7の上に機械学習装置100’を配置し、各々の制御装置1で生成された学習モデルをフォグコンピュータ7上に集約して記憶しておき、記憶した複数の学習モデルに基づいた最適化乃至効率化を行った上で、最適化乃至効率化された学習モデルを必要に応じて各制御装置1に対して再配布するという運用を行うことができる。
また、本実施例による制御システム500”では、例えばフォグコンピュータ7の上に集約して記憶された学習モデルや、フォグコンピュータ7上で最適化乃至効率化された学習モデルを、更に上位のホストコンピュータやクラウドサーバ上に集め、これら学習モデルを用いて工場や制御装置1のメーカでの知的作業への応用(上位サーバでの更なる汎用的な学習モデルの構築及び再配布、学習モデルの解析結果に基づく保守作業の支援、各々の制御装置1の性能等の分析、新しい機械の開発への応用等)を行うことができる。
以上、本発明の実施の形態について説明したが、本発明は上述した実施の形態の例のみに限定されることなく、適宜の変更を加えることにより様々な態様で実施することができる。
例えば、上記した実施形態では制御装置1と機械学習装置100が異なるCPU(プロセッサ)を有する装置として説明しているが、機械学習装置100は制御装置1が備えるCPU11と、ROM12に記憶されるシステム・プログラムにより実現するようにしても良い。
1,1’,1” 制御装置
2 産業用ロボット
3 センサ
5 ネットワーク
6 クラウドサーバ
7 フォグコンピュータ
8 エッジコンピュータ
9 セル
11 CPU
12 ROM
13 RAM
14 不揮発性メモリ
16,17,18,19 インタフェース
20 バス
21 インタフェース
30 軸制御回路
32 制御部
34 データ取得部
36 前処理部
40 サーボアンプ
50 サーボモータ
52 制御用プログラム
54 取得データ記憶部
60 教示操作盤
70 表示装置
71 入力装置
100,100’ 機械学習装置
101 プロセッサ
102 ROM
103 RAM
104 不揮発性メモリ
110 学習部
120 意志決定部
130 学習モデル記憶部
500,500’500” 制御システム

Claims (9)

  1. マニピュレータに掛かる力とモーメントを検出する機能を備えた産業用ロボットを制御する制御装置であって、
    前記産業用ロボットを制御指令に基づいて制御する制御部と、
    前記産業用ロボットのマニピュレータに掛かる力及びモーメントの少なくともいずれかを取得データとして取得するデータ取得部と、
    前記取得データに基づいて、前記マニピュレータに掛かる力に係る情報を含む力状態データ、及び前記マニピュレータに係る制御指令の調整行動を示す制御指令調整データを、状態データとして生成する前処理部と、
    を備え、
    前記状態データに基づいて、前記マニピュレータに係る制御指令の調整行動に係る機械学習の処理を実行する、
    制御装置。
  2. 前記前処理部は、前記取得データに基づいて、更に前記調整行動を行った後の前記マニピュレータの動作状態の判定結果を示す判定データを生成し、
    前記制御装置は、
    前記機械学習の処理として、前記状態データ及び前記判定データを用いて、前記マニピュレータに掛かる力の状態に対する、前記マニピュレータに係る制御指令の調整行動を強化学習した学習モデルを生成する学習部を更に備える、
    請求項1に記載の制御装置。
  3. 前記マニピュレータに掛かる力の状態に対する、前記マニピュレータに係る制御指令の調整行動を強化学習した学習モデルを記憶する学習モデル記憶部と、
    前記機械学習の処理として、前記状態データに基づいて、前記学習モデル記憶部に記憶された学習モデルを用いた前記マニピュレータに係る制御指令の調整行動を推定する意志決定部と、を更に備える、
    請求項1に記載の制御装置。
  4. 前記前処理部は、前記判定データとして、前記調整行動を行った後のマニピュレータに掛かる負荷の程度を示す負荷判定データを生成する、
    請求項2に記載の制御装置。
  5. 前記前処理部は、前記判定データとして、前記調整行動を行った後のマニピュレータの作業時間の程度を示す作業時間データを生成する、
    請求項2に記載の制御装置。
  6. 複数の装置がネットワークを介して相互に接続されたシステムであって、
    前記複数の装置は、少なくとも請求項2,4,5のいずれかに記載された制御装置である第1の制御装置を含む
    制御システム。
  7. 前記複数の装置は、機械学習装置を備えたコンピュータを含み、
    前記コンピュータは、前記第1の制御装置の少なくとも1つの前記強化学習の結果としての学習モデルを取得し、
    前記コンピュータが備える機械学習装置は、取得した前記学習モデルに基づく最適化乃至効率化を行う、
    請求項6に記載の制御システム。
  8. 前記複数の装置は、前記第1の制御装置とは異なる第2の制御装置を含み、
    前記第1の制御装置による学習結果は、前記第2の制御装置と共有される、
    請求項6に記載の制御システム。
  9. 前記複数の装置は、前記第1の制御装置とは異なる第2の制御装置を含み、
    前記第2の制御装置において観測されたデータは、前記ネットワークを介して前記第1の制御装置による強化学習に利用可能である、
    請求項6に記載の制御システム。
JP2019108190A 2018-10-02 2019-06-10 制御装置及び制御システム Active JP6928031B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE102019006725.8A DE102019006725B4 (de) 2018-10-02 2019-09-25 Steuereinrichtung und Steuersystem
US16/588,081 US20200101603A1 (en) 2018-10-02 2019-09-30 Controller and control system
CN201910949712.0A CN110978014A (zh) 2018-10-02 2019-10-08 控制装置以及控制系统

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018187717 2018-10-02
JP2018187717 2018-10-02

Publications (2)

Publication Number Publication Date
JP2020055095A true JP2020055095A (ja) 2020-04-09
JP6928031B2 JP6928031B2 (ja) 2021-09-01

Family

ID=70106348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019108190A Active JP6928031B2 (ja) 2018-10-02 2019-06-10 制御装置及び制御システム

Country Status (1)

Country Link
JP (1) JP6928031B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022172812A1 (ja) 2021-02-10 2022-08-18 オムロン株式会社 ロボットモデルの学習装置、ロボットモデルの機械学習方法、ロボットモデルの機械学習プログラム、ロボット制御装置、ロボット制御方法、及びロボット制御プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195127A (ja) * 1992-12-22 1994-07-15 Agency Of Ind Science & Technol マニピュレータのハイブリッド遠隔制御装置
JP2018126796A (ja) * 2017-02-06 2018-08-16 セイコーエプソン株式会社 制御装置、ロボットおよびロボットシステム
JP2020040132A (ja) * 2018-09-06 2020-03-19 株式会社東芝 ハンド制御装置
JP2020110900A (ja) * 2019-01-16 2020-07-27 ファナック株式会社 判定装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195127A (ja) * 1992-12-22 1994-07-15 Agency Of Ind Science & Technol マニピュレータのハイブリッド遠隔制御装置
JP2018126796A (ja) * 2017-02-06 2018-08-16 セイコーエプソン株式会社 制御装置、ロボットおよびロボットシステム
JP2020040132A (ja) * 2018-09-06 2020-03-19 株式会社東芝 ハンド制御装置
JP2020110900A (ja) * 2019-01-16 2020-07-27 ファナック株式会社 判定装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022172812A1 (ja) 2021-02-10 2022-08-18 オムロン株式会社 ロボットモデルの学習装置、ロボットモデルの機械学習方法、ロボットモデルの機械学習プログラム、ロボット制御装置、ロボット制御方法、及びロボット制御プログラム

Also Published As

Publication number Publication date
JP6928031B2 (ja) 2021-09-01

Similar Documents

Publication Publication Date Title
US20200101603A1 (en) Controller and control system
JP4850956B2 (ja) 学習制御機能を備えたロボット
JP7000359B2 (ja) 判定装置
Brunete et al. Hard material small-batch industrial machining robot
US7912584B2 (en) Power consumption estimation apparatus
JP6669715B2 (ja) 振動抑制装置
JP6940542B2 (ja) 把持力調整装置及び把持力調整システム
US11059142B2 (en) Controller, machine learning device, and system
JP7239399B2 (ja) 調整支援装置
JP2020129220A (ja) 管理装置及び管理システム
US20200257253A1 (en) Management device and management system
CN110174871B (zh) 控制装置、机器学习装置以及系统
EP3731994B1 (en) Method and apparatus for robotic machining
JP6928031B2 (ja) 制御装置及び制御システム
CN109507879B (zh) 控制装置以及机器学习装置
Pomares et al. Dynamic visual servo control of a 4-axis joint tool to track image trajectories during machining complex shapes
Denkena et al. Holistic process planning chain for robot machining
US11327462B2 (en) Maintenance support system, numerical controller, and control method of maintenance support system
Lei et al. Vision-based position/impedance control for robotic assembly task
JP2020110884A (ja) ロボット制御装置、ロボット制御方法、及びロボット制御プログラム
Carlier et al. A Digital Twin Framework for Virtual Re-Commissioning of Work-Drive Systems Using CAD-based Motion Co-Simulation
Ren et al. Sliding Mode Set-Point Control of a Three-DOF Cable-Suspended Parallel Robot With Uncertain Mass and Disturbances
Pan et al. Robotic machining from programming to process control
Juschanin et al. Low frequency vibration consideration in tool-path computation of two-link serial manipulator for improved accuracy
JP2021002238A (ja) 制御装置、制御システム、及び機械学習装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210326

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210805

R150 Certificate of patent or registration of utility model

Ref document number: 6928031

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150