JPWO2018042730A1 - ロボットの制御装置およびロボットの制御方法 - Google Patents

ロボットの制御装置およびロボットの制御方法 Download PDF

Info

Publication number
JPWO2018042730A1
JPWO2018042730A1 JP2018536921A JP2018536921A JPWO2018042730A1 JP WO2018042730 A1 JPWO2018042730 A1 JP WO2018042730A1 JP 2018536921 A JP2018536921 A JP 2018536921A JP 2018536921 A JP2018536921 A JP 2018536921A JP WO2018042730 A1 JPWO2018042730 A1 JP WO2018042730A1
Authority
JP
Japan
Prior art keywords
robot
state
work
hand
action
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018536921A
Other languages
English (en)
Other versions
JP6651636B2 (ja
Inventor
浩太郎 村岡
浩太郎 村岡
康孝 石塚
康孝 石塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Publication of JPWO2018042730A1 publication Critical patent/JPWO2018042730A1/ja
Application granted granted Critical
Publication of JP6651636B2 publication Critical patent/JP6651636B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B23MACHINE TOOLS; METAL-WORKING NOT OTHERWISE PROVIDED FOR
    • B23PMETAL-WORKING NOT OTHERWISE PROVIDED FOR; COMBINED OPERATIONS; UNIVERSAL MACHINE TOOLS
    • B23P19/00Machines for simply fitting together or separating metal parts or objects, or metal and non-metal parts, whether or not involving some deformation; Tools or devices therefor so far as not provided for in other classes
    • B23P19/04Machines for simply fitting together or separating metal parts or objects, or metal and non-metal parts, whether or not involving some deformation; Tools or devices therefor so far as not provided for in other classes for assembling or disassembling parts
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • B25J13/08Controls for manipulators by means of sensing devices, e.g. viewing or touching devices
    • B25J13/085Force or torque sensors
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1612Programme controls characterised by the hand, wrist, grip control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/163Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/1633Programme controls characterised by the control loop compliant, force, torque control, e.g. combined with position control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1679Programme controls characterised by the tasks executed
    • B25J9/1687Assembly, peg and hole, palletising, straight line, weaving pattern movement
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS], computer integrated manufacturing [CIM]
    • G05B19/41805Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS], computer integrated manufacturing [CIM] characterised by assembly
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B23MACHINE TOOLS; METAL-WORKING NOT OTHERWISE PROVIDED FOR
    • B23PMETAL-WORKING NOT OTHERWISE PROVIDED FOR; COMBINED OPERATIONS; UNIVERSAL MACHINE TOOLS
    • B23P19/00Machines for simply fitting together or separating metal parts or objects, or metal and non-metal parts, whether or not involving some deformation; Tools or devices therefor so far as not provided for in other classes
    • B23P19/02Machines for simply fitting together or separating metal parts or objects, or metal and non-metal parts, whether or not involving some deformation; Tools or devices therefor so far as not provided for in other classes for connecting objects by press fit or for detaching same
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39469Grip flexible, deformable plate, object and manipulate it
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/40Robotics, robotics mapping to robotics vision
    • G05B2219/40499Reinforcement learning algorithm

Abstract

ロボットの制御装置は、予め強化学習によって得られた第1部品の複数の組付途中状態と各々の組付途中状態に対し最も高い報酬を与えるロボット(1)の最適行動との関係を記憶する記憶部(21)と、第1部品の組付途中状態を検知する力検出器(15)と、記憶部(21)に記憶された関係に基づき、力検出器(15)により検知された組付途中状態に対応するロボット(1)の最適行動を特定し、最適行動に従いサーボモータ(13)を制御する通常制御部(24)と、を備える。本発明によれば、強化学習を利用することで、第1部品と第2部品との間に芯ずれ等が存在する場合であっても、ロボットのハンドの駆動により第1部品を第2部品に容易に組み付けることができる。

Description

本発明は、圧入作業などを行うロボットの制御装置およびロボットの制御方法に関する。
従来より、ロボットのハンドに取り付けられて、圧入作業時の反力を低減するようにした装置が知られている(例えば特許文献1参照)。特許文献1には、被圧入ワークに穿設された圧入孔に軸状部品を圧入する圧入装置が記載される。この圧入装置は、一対のばねを介して取り付け部材に揺動可能に支持された圧入手段を有し、これにより圧入孔のエッジから軸状部品が偏心荷重を受けると圧入手段が揺動し、圧入反力を低減する。
特開2006−116669号公報
しかしながら、上記特許文献1記載の装置は、単に圧入反力を低減するに過ぎず、例えば軸状部品の個体差に起因して軸状部品と圧入孔との間に芯ずれ等が存在する場合、上記特許文献1記載の装置を用いても圧入を行うことは困難である。
本発明の一態様は、アクチュエータにより駆動されるロボットのハンドに支持された第1部品を第2部品に組み付けるようにロボットを制御するロボットの制御装置であって、予め強化学習によって得られた第1部品の複数の組付途中状態と各々の組付途中状態に対し最も高い報酬を与えるロボットの最適行動との関係を記憶する記憶部と、第1部品の組付途中状態を検知する状態検知部と、記憶部に記憶された関係に基づき、状態検知部により検知された組付途中状態に対応するロボットの最適行動を特定し、最適行動に従いアクチュエータを制御するアクチュエータ制御部と、を備える。
また、本発明の別の態様は、アクチュエータにより駆動されるロボットのハンドに支持された第1部品を第2部品に組み付けるようにロボットを制御するロボットの制御方法であって、ハンドの駆動により第1部品を第2部品へ組み付ける作業を複数回行って、第1部品の複数の組付途中状態と各々の組付途中状態に対し最も高い報酬を与えるロボットの最適行動との関係を取得する強化学習工程と、第1部品を第2部品に組み付けるときに、第1部品の組付途中状態を検知し、検知した組付途中状態に対応する最適行動を強化学習工程で取得した関係に基づいて特定し、特定した最適行動に従いアクチュエータを制御する組付作業工程と、を含む。
本発明によれば、強化学習を利用することで、第1部品と第2部品との間に芯ずれ等が存在する場合であっても、ロボットのハンドの駆動により第1部品を第2部品に容易に組み付けることができる。
本発明の実施形態に係るロボットの制御装置を含むロボットシステムを概略的に示す図。 図1のロボットのアーム先端部の拡大図。 ワークの組付作業時におけるワークの曲がり状態を示す図。 ワークの組付作業時におけるワークの座屈状態を示す図。 ワークの組付作業時における基準移動経路の一例を示す図。 ワークの組付途中状態を説明する図。 Q学習で用いられる報酬テーブルの一例を示す図。 図4の一部を取り出した図であり、ワークの移動経路を説明する図。 ワークの組付作業時におけるロボットのとり得る行動を示す図。 ハンドの動作した試行回数とQ値との関係を示す図。 強化学習工程で得られたQテーブルの一例を示す図。 強化学習工程で得られたQテーブルの他の例を示す図。 Qテーブルの具体例を示す図。 図1の通常制御部で実行される処理の一例を示すフローチャート。
以下、図1〜図12を参照して本発明の実施形態について説明する。図1は、本発明の実施形態に係るロボットの制御装置を含むロボットシステムを概略的に示す図である。このロボットシステムは、ロボット1と、ロボット1を制御するコントローラ2とを有する。コントローラ2は、PLC(Programmable Logic Controller)やサーボアンプなどを含んで構成される。
ロボット1は、例えば回動可能な複数のアーム11を有する垂直多関節ロボットであり、アーム先端部に作業用のハンド12が設けられる。ロボット1は、ロボット駆動用の複数(便宜上1つのみ図示)のサーボモータ13を有する。各サーボモータ13にはエンコーダ14が設けられ、エンコーダ14によりサーボモータ13の回転角度が検出される。検出された回転角度はコントローラ2にフィードバックされ、コントローラ2でのフィードバック制御により、三次元空間におけるハンド12の位置および姿勢が制御される。
コントローラ2は、CPU,ROM,RAMおよびその他の周辺回路などを有する演算処理装置を含んで構成される。コントローラ2は、予めメモリに格納されたプログラムに従いサーボモータ13に制御信号を出力し、ロボット1の動作を制御する。ロボット1は種々の作業を行うことが可能であるが、本実施形態に係るロボット1は、特にワークを部品に組み付ける組付作業を行うように構成される。
図2は、ロボット1のアーム先端部の拡大図である。図2に示すように、ハンド12は軸線CL1を中心として拡縮可能な爪部12aを有し、爪部12aを介し軸線CL1を中心としてワーク100を把持することができる。ワーク100は、例えば可撓性を有する材質(ゴム等)によって構成されたチューブである。このワーク100は、例えばエンジンから突設されてワーク100よりも硬い材質(金属等)によって構成された部品(例えばパイプ)101の外側に圧入され、これによりワーク100が部品101に組み付けられる。ワーク100と部品101とにより、エンジン内へまたはエンジン内から流体が流入または流出する流路が形成される。
ワーク100の組付作業時には、予め基準となるワーク形状を定義する。例えば本実施形態のようにワーク100がチューブである場合には、軸線CL1を中心とした円筒形状の基準ワーク形状(点線)を定義する。そして、ハンド12の先端部に基準点P0を設定し、基準点P0の位置を制御することでワーク組付作業を行う。基準点P0は、例えば図示のように軸線CL1上の基準ワーク形状の先端の点に設定される。なお、ハンド12の取付部から所定距離だけ離れた点(例えば爪部12aの先端等)に基準点P0を設定することもできる。
ところで、チューブ形状のワーク100にはワーク固有の曲がり癖が存在し、個々のワーク形状に個体差が生じる。この個体差はワーク100の成形条件等の違いによっても生じる。さらに、使用時の気温や湿度の差異により、ワーク100の物理的特性(弾性率等)が変化するおそれがある。その結果、図2に示すように軸線CL1とワーク先端部の中心軸CL2との間にずれが生じる。このため、予め定められた軌跡に沿ってハンド12を動作させてワーク100の組付作業を行うと(位置制御)、例えば図3Aに示すようにワーク100の曲がり、あるいは図3Bに示すようにワーク100に座屈が生じるおそれがある。
このようなワーク100の曲がりや座屈を避けるために、例えばハンド12に圧入反力を低減する反力受け部を設けるように構成すると、ハンド12の構成が複雑になり、ハンド12が大型化する。また、仮にハンド12に反力受け部あるいはハンド12に作用する力を検出するセンサ等を設け、ハンド12に作用する力を制御するように構成しても(力制御)、チューブ等の柔軟性のあるワーク100の圧入を迅速に行うことは困難である。特に、ワーク100と部品101との間に芯ずれが存在する場合、芯ずれを解消しながら圧入を行うことは難しい。そこで、本実施形態では、ハンド12の構成を複雑にすることなく、かつ、ワーク100の圧入を迅速に行わせることができるよう、以下のようにロボットの制御装置を構成する。
図1に示すように、コントローラ2には、エンコーダ14の他、力検出器15と入力部16とからの信号が入力される。
図2に示すように、力検出器15は、ハンド12の先端部に設けられた6軸力覚センサにより構成される。軸線CL1の方向をZ方向、軸線CL1に垂直な平面を構成する直交2軸方向をX方向およびY方向と定義すると、力検出器15は、ハンド12に作用するX軸、Y軸およびZ軸方向の並進力Fx,Fy,Fzと、X軸、Y軸およびZ軸廻りのモーメントMx,My,Mzとを検出する。Z方向はハンド12の進行方向(軸線CL1に沿った方向)であり、Y方向は部品101の軸線CL3とワーク先端の中心軸CL2との芯ずれが生じる方向である。すなわち、部品間の芯ずれをYZ面内で生じさせるようにロボット1は動作し、ハンド12は芯ずれを修正するようにYZ面内を移動する。
図1の入力部16は、キーボードやタッチパネル等により構成され、入力部16を介して組付作業に係わる各種指令や設定値、基準ワーク形状等が入力される。本実施形態に係るロボット1は、コントローラ2からの指令により通常のワーク組付作業を行う他、強化学習としての作業を行うことが可能であり、これらの作業の切換も入力部16を介して指令される。強化学習において必要となる各種設定値、例えば、ハンド先端部(基準点P0)の基準となる移動経路(図4の基準移動経路PA)や単位時間当たりの移動量(ピッチ)等も入力部16を介して設定される。
コントローラ2は、機能的構成として、記憶部21と、モータ制御部22とを有する。モータ制御部22は、強化学習の際にサーボモータ13を制御する学習制御部23と、通常のワーク組付作業時にサーボモータ13を制御する通常制御部24とを有する。記憶部21には、ワーク100の組付途中の状態とその組付途中状態に対応するロボット1の行動との関係(後述するQテーブル)が記憶される。強化学習の工程では、学習制御部23での処理によりサーボモータ13を駆動し、ワーク100を部品101へ組み付ける作業を複数回行う。以下、強化学習について説明する。
強化学習とは、ある環境内におけるエージェントが現在の状態を観測し、取るべき行動を決定する問題を扱う機械学習の一種である。エージェントは行動を選択することで環境から報酬を得る。強化学習には種々の手法があるが、本実施形態ではQ学習(Q-learning)を用いる。Q学習は、ある環境状態の下で、最も行動評価関数の値(Q値)が高い行動(最も多くの報酬を受けるような行動)をとるように学習を行う手法である。
Q値は、時刻tにおける状態stと行動atとに基づき、次式(I)により更新される。
Q(st,at)←
Q(st,at)+α[rt+1+γmaxQ(st+1,at+1)−Q(st,at)]・・・(I)
上式(I)のαは、Q値を更新する度合いを表す係数(学習率)であり、γは、この先起こりうる事象の結果をどの程度反映させるかを表す係数(割引率)である。これら係数α,γは、いずれも経験に基づいて0<α≦1, 0<γ≦1の範囲内で適宜調整して設定される。上式(I)のrは、状態stの変化に対して行動atを評価する指標(報酬)であり、状態stがよくなればQ値が増加するように設定される。
強化学習としての作業を行うに当たっては、まず、ワーク100の組付開始から組付完了に至るまでの基準移動経路を定義する。図4は、基準移動経路PAの一例を示す図である。この基準移動経路PAは、ワーク100の組付作業に習熟した作業者が実際に手でワーク100を圧入するときの態様を考慮して決定される。
すなわち、柔軟性を有するワーク100を部品101の外周面に圧入する場合、作業者は、まずワーク100の先端部を把持して、ワーク先端部を部品101の外側に、軸線CL3に対し所定角度θ(例えば45°)で斜めに挿入する。次いで作業者は、ワーク100の中心軸CL2が軸線CL3に一致するようにワーク100を回転させた後、その姿勢のままワーク100を軸線CL3に沿って所定位置まで押し込む。この点を考慮して、図4に示すように、ロボット1によりワーク100を圧入する場合の基準移動経路PAがYZ面上で定義される。なお、図4では、基準移動経路PAに沿ってハンド12の動作方向(Z方向)が変化し、それに伴いZ方向に垂直なY方向も変化する。
図4では、ワーク100の先端(基準点P0)が部品101に接触する直前の組付開始位置から、ワーク先端が所定位置まで圧入された組付完了位置に至るまでを、基準移動経路PAに沿って複数(例えば20個)のステップ(ST1〜ST20)に分割する。そして、上式(I)の時刻tをステップに置き換え、ステップ毎にQ値を算出する。なお、ステップST1〜ST9では、ワーク100が軸線CL3に対して斜めに挿入され、ステップST10〜ST12ではワーク100が回転させられ、ステップST13〜ST20ではワーク100が軸線CL3に沿って押し込まれる。以下では、ワーク組付作業時における現在のステップ、直前のステップ、直後のステップを、それぞれSTt、STt-1、STt+1で表すことがある。
ロボット1に強化学習(Q学習)としてのワーク組付作業を行わせるためには、ワーク100の組付開始から組付完了に至るまでのワーク100の状態(組付途中状態)とロボット1のとり得る行動とを定義する必要がある。まず、組付途中状態について説明する。
図5は、YZ平面内を移動するワーク100の組付途中状態を説明する図である。図5に示すように、ワーク100の組付途中状態は、ハンド先端部に作用する軸線CL2方向(Z方向)の力Fzの変化量ΔFzと、YZ平面に直交するX軸回りのモーメントMxとに応じて、6つの状態、すなわちモードMD1〜モードMD6に分類することができる。
なお、力の変化量ΔFzは、現在のステップSTtにおいてワークに作用する力Fzと直前のステップSTt-1においてワークに作用した力Fzとの差である。例えば現在ステップST3であるとき、ステップST3で作用した力Fzとその直前のステップST2で作用した力Fzとの差がΔFzである。力の変化量ΔFzをパラメータとすることで、ワーク100の個体差による影響を受けずに、精度よく状態を特定することができる。また、力Fz自体をパラメータする場合には、ワークの種類が変化する度に閾値を設定し直す必要があるが、本実施形態のように力の変化量ΔFzをパラメータとすることで、ワークの種類が変化した場合であっても、閾値を改めて設定し直す必要がなく、状態の特定が容易である。モーメントMxは、ハンド12に+Y方向への回転力が作用するときにプラス、−Y方向への回転力が作用するときにマイナスの値となる。モーメントMxの正負の値を判定することにより、軸線CL3に対するワーク100の芯ずれ方向を特定することができる。
図5において、モードMD2は、力の変化量ΔFzとモーメントMxとがともに0またはほぼ0の状態である。より具体的には、力の変化量ΔFzがプラスの所定値ΔF1以下で、かつ、モーメントMxがマイナスの所定値M2以上かつプラスの所定値M1以下の状態であり、例えばワーク100が部品101に接触していない非接触状態に対応する。モードMD1は、力の変化量ΔFzがΔF1以下で、かつ、モーメントMxがM1より大きい状態であり、図示のようにワーク100が+Y方向に座屈した状態に対応する。モードMD3は、力の変化量ΔFzがΔF1以下で、かつ、モーメントMxがM2未満の状態であり、図示のようにワークが−Y方向に座屈した状態に対応する。なお、モードMD1〜モードMD3は、力の変化量ΔFzがマイナスの場合も含む。
モードMD5は、力の変化量ΔFzがΔF1より大きく、かつ、モーメントMxがM2以上かつM1以下の状態である。この状態は、図示のようにワーク100が正常に圧入されるときの正常状態に対応する。モードMD4は、力の変化量ΔFzがΔF1より大きく、かつ、モーメントMxがM1より大きい状態であり、図示のようにワークが+Y方向に曲がった曲がり状態に対応する。モードMD6は、力の変化量ΔFzがΔF1より大きく、かつ、モーメントMxがM2未満の状態であり、図示のようにワークが−Y方向に曲がった曲がり状態に対応する。
現在のワーク100の組付途中状態、すなわちワーク100がどのモードMD1〜MD6に該当するかは、力検出器15により検出された力FzとモーメントMx、より正確には力の変化量ΔFzとモーメントMxととに基づき学習制御部23が特定する。
上式(I)の報酬rは、予め記憶された報酬テーブル、すなわち現在のステップSTtにおける状態と直前のステップSTt-1における状態との関係で定義される報酬テーブルを用いて設定される。図6は、報酬テーブルの一例を示す図である。図6において、現ステップSTtにおける状態が正常状態(MD5)であれば、直前ステップSTt-1における状態に拘らず報酬r(具体的には報酬r15、r25,r35,r45,r55,r65)には所定値(例えば+2)が設定される。すなわち、この場合には正の報酬rが与えられる。
現ステップSTtにおける状態と直前ステップSTt-1における状態との間に変化がないとき(例えば現ステップSTtと直前ステップSTt-1とがともに座屈状態MD1またはMD3のとき)、報酬r(具体的には報酬r11、r22,r33,r44,r66)には所定値(例えば−3)が設定される。すなわち、この場合には、これ以上状態は改善されないとして、負の報酬rが与えられる。それ以外の場合(正常状態MD5以外に状態が変化した場合)には、報酬rに0が設定される。なお、上述した報酬rの値は、実際の圧入作業の結果を踏まえて適宜変更可能である。学習制御部23は、図6の報酬テーブルに従い各ステップで上式(I)の報酬rを設定し、Q値を算出する。
次に、ワーク組付時におけるロボット1の行動について説明する。まず、図4に示すように、基準移動経路PAに沿ってYZ平面内に所定間隔の格子を定義する。図7は、図4の格子の一部を取り出した図である。図7に示すように、格子の交点(ドット)はハンド先端部の移動点に相当する。すなわち、ハンド先端部(基準点P0)は各ステップST1〜ST20においてドット単位で移動し、ドットの間隔はハンド12の移動時のピッチに相当する。
例えば、現在のステップSTtにおいてハンド先端部(基準点P0)の位置が基準移動経路PA上の図7の点P1であるとき、直後のステップSTt+1では、ハンド12は基準移動経路PAに沿った点P2、基準移動経路PAから+Y方向に1ピッチずれた点P3、−Y方向に1ピッチずれた点P4のいずれかに移動する。現在のステップSTtが仮に点P4になると、直後のステップSTt+1では、点P5,P6,P7のいずれかに移動する。
これらハンド12の移動可能な方向(移動方向を示す角度)および移動量は予めメモリに記憶される。例えば移動方向を示す角度として、軸線CL1に対し0°および±45°が、移動量として、隣り合うドットの間隔に相当する長さが設定される。学習制御部23は、この定められた条件に従い高い報酬rが得られるようにロボット1を動作させる。ロボット1は、単なるハンド12の移動だけではなく、X軸廻りにハンド12を回転させることもできる。したがって、コントローラ2には、ハンド12の移動方向に対するX軸廻りの回転量も設定される。
図8は、ワーク組付作業時におけるロボット1のとり得る行動を示す図である。図8に示すように、ロボット1は、ステップST1〜ST20でそれぞれ9通りの行動a1〜a9をとることができる。行動a1は、図7の点P1から点P2への移動および点P4から点P5への移動に対応する。行動a2は、図7の点P1から点P4への移動および点P4から点P7への移動に対応する。行動a3は、図7の点P1から点P3への移動および点P4から点P6への移動に対応する。行動a4〜a6は、行動a1〜a3による移動に加え、X軸廻りに時計方向に回転する行動である。行動a7〜a9は、行動a1〜a3による移動に加え、X軸廻りに反時計方向に回転する行動である。
強化学習としての作業は、ワーク100の6通りの組付途中状態(モードMD1〜MD6)のそれぞれに対し、9通りの行動a1〜a9を適用することにより行うことができる。しかしながら、その場合には、状態と行動との組み合わせが多数となり、強化学習工程に多大な時間がかかる。そこで、強化学習工程にかかる時間を短縮するために、強化学習における行動を絞り込むことが好ましい。
行動の絞り込みは、例えばワークの組付作業に習熟した作業者に予め手動で組付作業を行わせ、そのときの行動パターンを把握することにより行う。すなわち、ワーク100の組付開始から組付完了までの各ステップST1〜ST20において、作業者が明らかに選択しない行動があるとき、その行動を除外することで、行動の絞り込みを行う。
例えば図4のステップST1〜ST9およびステップST13〜ST20では、作業者は行動a1〜a3のみを選択し、行動a4〜a9を選択しない。一方、ステップST10〜ST12では、作業者は行動a4〜a6のみを選択し、行動a1〜a3および行動a7〜a9を選択しない。このとき、ステップST1〜ST9およびステップST13〜ST20で行動a1〜a3のみを適用し、ステップST10〜ST12で行動a4〜a6のみを適用するように、強化学習としてのワーク組付作業を制限する。
各々のステップST1〜ST20における適用可能な行動は、予め入力部16を介して設定される。学習制御部23は、これら適用可能な行動の中から正の報酬が得られるような任意の行動を選択してロボット1を動作させるとともに、行動を選択する度に上式(I)を用いてQ値を算出する。強化学習としてのワーク組付作業は、各々のステップST1〜ST20でQ値が収束するまで繰り返し行う。
図9は、あるステップSTtにおけるハンド12の動作回数(試行回数N)とQ値との関係を示す図である。強化学習が開始された初期状態ではQ値は0であり、試行回数Nの増加に伴いQ値は一定値に収束する。このような収束後のQ値を用いてQテーブルが構築される。
図10A,図10Bは、強化学習工程で得られたQテーブルの一例を示す図である。Q値は、状態と行動とに応じてステップST1〜ST20毎に設定される。具体的には、上述した作業者によるワーク組付作業を考慮して、ステップST1〜ST9およびステップST13〜ST20においては、図10Aに示すように、状態(モード)MD1〜MD6と行動a1〜a3とに応じたQテーブルQT1〜QT9およびQT13〜QT20が構築される。ステップST10〜ST12においては、図10Bに示すように、状態MD1〜MD6と行動a4〜a6とに応じたQテーブルQT10〜QT12が構築される。構築されたQテーブルQT1〜QT20は、図1の記憶部21に記憶される。
図11は、Qテーブルの具体例を示す図である。このQテーブルは、例えばステップST1のQテーブルQT1である。図11に示すように、強化学習工程の初期状態では(図11の左側)、Q値は全て0である。強化学習工程でQ値が更新され、Q値が収束すると(図11の右側)、これが記憶部21に記憶される。図1の通常制御部24は、記憶部21に記憶されたQテーブルの中から、そのときどきの状態に対して最もQ値の高い行動を選択する。例えば状態MD1のときに行動a2を選択し、状態MD2のときに行動a1を選択する。そして、その選択した行動をロボット1が実行するようにサーボモータ13を制御する。
図12は、通常制御部24で実行される処理の一例を示すフローチャートである。このフローチャートに示す処理は、強化学習工程でQテーブルが記憶された後、入力部16の操作により通常のワーク組付作業の開始が指令されると開始される。図12の処理は、各々のステップST1〜ST20でそれぞれ実行される。
まず、S11で、力検出器15からの信号に基づきワーク100の現在の組付途中状態を検知する。すなわちワーク100がどのモードMD1〜MD6に該当するかを検知する。次いでS12で、現在のステップSTtに対応したQテーブルQTを記憶部21から読み込み、検知された組付途中状態に対しQ値が最も高くなる行動を選択する。次いで、S13で、ロボット1が選択した行動をとるようにサーボモータ13に制御信号を出力する。
本発明の実施形態に係るロボットの制御装置の具体的な動作を、ロボットの制御方法とともに説明する。
(1)事前作業工程
まず、強化学習工程を行う前に、事前作業工程として、熟練の作業者に手動でワーク100を部品101に組み付ける作業を行わせる。このとき、ワーク100の状態をモードMD1〜MD6に変化させながら、そのときの行動パターンを分析する。これによりロボット1によりワーク100の組付作業を行う際の基準移動経路PA(図4)と、各々のステップST1〜AT20でロボット1がとり得る行動とを決定することができる。すなわち、ステップST1〜ST9,ST13〜ST20で行動a1〜a3を、ステップST10〜ST12で行動a4〜a6をとるように、行動の絞り込みを行うことができる。事前作業工程において決定した基準移動経路PAとロボット1がとり得る行動とは、入力部16を介してコントローラ2に設定される。
(2)強化学習工程
事前作業工程が終了すると強化学習工程を実行する。強化学習工程においては、学習制御部23がサーボモータ13に制御信号を出力し、ロボット1を実際に動作させてワーク100の組付作業を繰り返し行わせる。このとき、学習制御部23は、予めステップST1〜ST20毎に設定された複数の行動の中から一の行動を選択し、ロボット1がその行動を実行するようにサーボモータ13を制御する。さらに、力検出器15からの信号により状態の変化を把握し、予め定められた報酬テーブル(図6)を参照して、状態の変化に基づく報酬rを決定する。そして、この報酬rを用いて、上式(I)により、各々のステップST1〜ST20における状態と行動とに対応したQ値を算出する。
強化学習が開始された初期状態ではQ値は0であり、このとき学習制御部23は各々のステップST1〜ST20における行動をランダムに選択する。強化学習が進むにつれて、学習制御部23は、高い報酬rが得られる行動を優先的に選択するようになり、各々のステップST1〜ST20における各々の状態に対し特定の行動のQ値が徐々に増加する。例えば芯ずれによるワーク100の曲がりや座屈(モードMD1,MD3,MD4,MD6)に対しては、これらを修正した場合に高い報酬rが得られる。このため、曲がりや座屈を修正するような行動のQ値が増加する。ワーク100の組付作業とQ値の算出とを繰り返し行ってQ値が徐々に一定値に収束すると(図9)、そのときのQ値でQテーブルQTを構築してこれを記憶部21に記憶する。
(3)組付作業工程
強化学習工程が終了すると、組付作業工程として通常制御部24での処理により、ワーク100の組付作業を行う。この場合、通常制御部24は、力検出器15からの信号により現在のステップSTtでのワーク100の組付途中状態を検知する(S11)。なお、ST1〜ST20のうちの現在のステップは、例えばエンコーダ14からの信号により特定することができる。さらに通常制御部24は、Qテーブルに設定された組付途中状態に対応する複数の行動の中から、Q値が最も高い行動を最適行動として選択し(S12)、ロボット1が最適行動をとるようにサーボモータ13を制御する(S13)。
これにより、例えばワーク100の個体差に起因してワーク100と部品101との間に芯ずれが生じた場合に、その芯ずれを検知して、芯ずれを修正する適切な行動をとるようにロボット1を動作させることができる。すなわち、状態の変化に応じて最適な行動をとることが可能であり、ワーク100の個体差に拘らず、ワーク100の部品101への良好な圧入が可能となる。ワーク100が可撓性を有するチューブにより構成されている場合であっても、ワーク100の曲がりや座屈を容易かつ適切に修正しながら、ワーク100を圧入することができる。
本発明の実施形態によれば以下のような作用効果を奏することができる。
(1)本発明の実施形態に係るロボットの制御装置は、サーボモータ13により駆動されるロボット1のハンド12に支持されたワーク100を部品101に組み付けるようにロボット1を制御するものである。この制御装置は、予め強化学習によって得られたワークの複数の組付途中状態(MD1〜MD6)と各々の組付途中状態に対し最も高い報酬を与えるロボット1の最適行動(a1〜a6)との関係(Qテーブル)を記憶する記憶部21と、ワーク100の組付途中状態を検知する力検出器15と、記憶部21に記憶されたQテーブルに基づき、力検出器15により検知された組付途中状態に対応するロボット1の最適行動を特定し、この最適行動に従いサーボモータ13を制御する通常制御部24とを備える(図1)。
このように強化学習によって取得したQテーブルを参照してサーボモータ13を制御することで、ワーク100に曲がり癖等の個体差があってワーク100の中心軸CL2と部品101の軸線CL3との間に芯ずれが存在する場合であっても、ワーク100の曲がりや座屈等を生じさせることなく、芯ずれを修正しながらワーク100を部品101に容易かつ迅速に圧入することができる。また、ハンド12に反力受け部等を別途設ける必要がなく、ハンド12の構成を簡素化でき、ハンド12の大型化を避けることができる。
(2)ロボット1の最適行動は、ハンド12の移動方向を示す角度、移動方向に沿ったハンド12の移動量、および移動方向に対するハンド12の回転量の組み合わせによって規定される(図8)。このように移動方向、移動量および回転量をパラメータとして各ステップST1〜ST20におけるロボット1の行動を定義することで、柔軟性を有するワーク100の圧入等の作業を容易に行うことができる。
(3)力検出器15は、ハンド12に作用する並進力Fx,Fy,FzとモーメントMx,My,Mzとを検出する力検出器15を有し、力検出器15により検出された並進力FyとモーメントMxとに基づきワーク100の組付途中状態を特定する(図5)。これにより、ワーク100の芯ずれに起因したワーク100の曲がり状態や座屈状態等を簡易な構成で検知することができ、カメラ等を用いた場合に比べ装置を安価に構成することができる。
(4)記憶部21は、ワーク100の組付開始から組付完了に至るまでの複数の組付途中状態と各々の組付途中状態に対応する最適行動との関係、すなわちQテーブル(図10A,図10B)を記憶する。これにより複数のステップST1〜ST20の各々で、ワーク100の組付途中状態に応じたロボット1の最適な行動を選択することができる。したがって、ワーク100の芯ずれを早期に修正することができ、ワーク100を部品101に良好に圧入することができる。
(5)本発明の実施形態に係るロボットの制御方法は、サーボモータ13により駆動されるロボット1のハンド12に支持されたワーク100を部品101に組み付けるようにロボット1を制御するものである(図1)。この制御方法は、ハンド12の駆動によりワーク100を部品101へ組み付ける作業を複数回行って、ワーク100の複数の組付途中状態と各々の組付途中状態に対し最も高い報酬を与えるロボット1の最適行動との関係(Qテーブル)を取得する強化学習工程と、ワーク100を部品101に組み付けるときに、ワーク100の組付途中状態を検知し、検知した組付途中状態に対応する最適行動を強化学習工程で取得したQテーブルに基づいて特定し、特定した最適行動に従いサーボモータ13を制御する組付作業工程とを含む。このように予め強化学習工程でQテーブルを取得し、そのQテーブルを用いて通常の組付作業を行うことで、ワーク100と部品101との間に芯ずれが存在する場合であっても、芯ずれを修正しながらワーク100を部品101に容易かつ迅速に圧入することができる。
(6)本発明の実施形態に係るロボットの制御方法は、強化学習工程を行う前に、作業者がワーク100を部品101へ組み付ける事前作業工程をさらに含み、強化学習工程では、事前作業工程で把握した作業者の行動パターンに基づき、強化学習工程におけるロボット1の行動を決定する。これにより、熟練者と同様の行動をロボット1が実現可能となる。また、例えばステップST1〜ステップST9およびステップST13〜ステップST20では行動a1〜a3を、ステップST10〜ステップST12では行動a4〜a6をとるように、ロボット1の行動を絞り込むことができる。したがって、強化学習工程に要する時間を短縮することができ、効率的なロボット1の制御を実現することができる。
(変形例)
上記実施形態は、種々の形態に変形することができる。以下、変形例について説明する。上記実施形態では、ロボットの制御装置を構成するコントローラ2が学習制御部23と通常制御部24とを有し、学習制御部23での処理により、強化学習としてのワーク組付作業を行うようにしたが、学習制御部23での処理を別の制御装置で行うようにしてもよい。すなわち、ワーク100の組付途中状態とロボット1の最適行動との関係を示すQテーブルを別の制御装置から取得し、これを記憶部としてのロボット制御装置の記憶部21に記憶するようにしてもよい。例えば工場出荷時に、量産のロボット制御装置の記憶部21にそれぞれ同一のQテーブルを記憶させてもよい。したがって、コントローラ2(図1)から学習制御部23を省略することができる。
上記実施形態では、Q学習を用いてワーク100の組付途中状態とロボット1の最適行動との関係を取得するようにしたが、強化学習としてQ学習に限らず他の手法を用いてもよい。したがって、記憶部にQテーブル以外を記憶してもよい。上記実施形態では、力検出器15によりワーク100の組付途中状態を検知するようにしたが、状態検知部はこれに限らない。例えばワーク100の基端部の周面あるいはハンド先端部に一対の振動センサを装着し、一対の振動センサが振動を検知する時間差に基づいてモーメントを検知して、これによりワーク組付途中状態を検知してもよい。
上記実施形態では、予め記憶されたQテーブルに基づき、力検出器15により検知されたワーク100の組付途中状態に対応したロボット1の最適行動を特定し、その最適行動に従いサーボモータ13を制御するようにしたが、アクチュエータ制御部としての通常制御部24の構成はこれに限らない。ロボット1にサーボモータ13に限らず他のアクチュエータ(例えばシリンダ)を設け、アクチュエータ制御部が他のアクチュエータを制御し、ロボット1が最適行動をとるようにしてもよい。上記実施形態では、ワーク100の組付途中状態を6つのモードMD1〜MD6に分類したが、これはワーク100の材質や形状等によって定まるものであり、他のモードに分類してもよい。
上記実施形態では、垂直多関節ロボット1を用いたが、ロボットの構成はこれに限らない。上記実施形態では、可撓性を有するチューブをワーク100として用いたが、ワークの形状および材質はいかなるものでもよく、例えばワーク100は金属でもよい。上記実施形態では、ワーク組付作業としてチューブ形状のワーク100(第1部品)をパイプ形状の部品101(第2部品)に圧入する作業を想定したが、第1部品と第2部品の構成はこれに限らない。したがって、ロボットによる組付作業は圧入作業に限らず、本発明のロボットの制御装置および制御方法は種々の作業を行う場合にも同様に適用することができる。
以上の説明はあくまで一例であり、本発明の特徴を損なわない限り、上述した実施形態および変形例により本発明が限定されるものではない。上記実施形態と変形例の1つまたは複数を任意に組み合わせることも可能であり、変形例同士を組み合わせることも可能である。
1 ロボット、2 コントローラ、12 ハンド、13 サーボモータ、15 力検出器、21 記憶部、24 通常制御部、100 ワーク、101 部品

Claims (6)

  1. アクチュエータにより駆動されるロボットのハンドに支持された第1部品を第2部品に組み付けるように前記ロボットを制御するロボットの制御装置であって、
    予め強化学習によって得られた前記第1部品の複数の組付途中状態と各々の組付途中状態に対し最も高い報酬を与える前記ロボットの最適行動との関係を記憶する記憶部と、
    前記第1部品の組付途中状態を検知する状態検知部と、
    前記記憶部に記憶された前記関係に基づき、前記状態検知部により検知された組付途中状態に対応する前記ロボットの最適行動を特定し、該最適行動に従い前記アクチュエータを制御するアクチュエータ制御部と、を備えることを特徴とするロボットの制御装置。
  2. 請求項1に記載のロボットの制御装置において、
    前記最適行動は、前記ハンドの移動方向を示す角度、前記移動方向に沿った前記ハンドの移動量、および前記移動方向に対する前記ハンドの回転量の組み合わせによって規定されることを特徴とするロボットの制御装置。
  3. 請求項1または2に記載のロボットの制御装置において、
    前記状態検知部は、前記ハンドに作用する並進力とモーメントとを検出する検出器を有し、該検出器により検出された並進力とモーメントとに基づき前記第1部品の組付途中状態を特定することを特徴とするロボットの制御装置。
  4. 請求項1〜3のいずれか1項に記載のロボットの制御装置において、
    前記記憶部は、前記第1部品の組付開始から組付完了に至るまでの複数の組付途中状態と各々の組付途中状態に対応する最適行動との関係を記憶することを特徴とするロボットの制御装置。
  5. アクチュエータにより駆動されるロボットのハンドに支持された第1部品を第2部品に組み付けるように前記ロボットを制御するロボットの制御方法であって、
    前記ハンドの駆動により前記第1部品を前記第2部品へ組み付ける作業を複数回行って、前記第1部品の複数の組付途中状態と各々の組付途中状態に対し最も高い報酬を与える前記ロボットの最適行動との関係を取得する強化学習工程と、
    前記第1部品を前記第2部品に組み付けるときに、前記第1部品の組付途中状態を検知し、検知した組付途中状態に対応する最適行動を前記強化学習工程で取得した前記関係に基づいて特定し、特定した最適行動に従い前記アクチュエータを制御する組付作業工程と、を含むことを特徴とするロボットの制御方法。
  6. 請求項5に記載のロボットの制御方法において、
    前記強化学習工程を行う前に、作業者が前記第1部品を前記第2部品へ組み付ける事前作業工程をさらに含み、
    前記強化学習工程では、前記事前作業工程で把握した前記作業者の行動パターンに基づき、前記強化学習工程における前記ロボットの行動を決定することを特徴とするロボットの制御方法。
JP2018536921A 2016-08-30 2017-03-17 ロボットの制御装置およびロボットの制御方法 Active JP6651636B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016168350 2016-08-30
JP2016168350 2016-08-30
PCT/JP2017/010887 WO2018042730A1 (ja) 2016-08-30 2017-03-17 ロボットの制御装置およびロボットの制御方法

Publications (2)

Publication Number Publication Date
JPWO2018042730A1 true JPWO2018042730A1 (ja) 2019-07-18
JP6651636B2 JP6651636B2 (ja) 2020-02-19

Family

ID=61301492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018536921A Active JP6651636B2 (ja) 2016-08-30 2017-03-17 ロボットの制御装置およびロボットの制御方法

Country Status (5)

Country Link
US (1) US20190184564A1 (ja)
JP (1) JP6651636B2 (ja)
CN (1) CN109641354B (ja)
CA (1) CA3035492C (ja)
WO (1) WO2018042730A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10730182B2 (en) * 2017-03-31 2020-08-04 Fanuc Corporation Action information learning device, robot control system and action information learning method

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6879009B2 (ja) * 2017-03-30 2021-06-02 株式会社安川電機 ロボット動作指令生成方法、ロボット動作指令生成装置及びコンピュータプログラム
US10967510B2 (en) * 2017-11-16 2021-04-06 Industrial Technology Research Institute Robot arm processing system and method thereof
FR3075409B1 (fr) * 2017-12-15 2020-01-03 Commissariat A L'energie Atomique Et Aux Energies Alternatives Dispositif electronique de traitement de signaux a optimisation integree de consommation d'energie electrique et procede correspondant
EP3743250A1 (en) * 2018-02-27 2020-12-02 Siemens Aktiengesellschaft Reinforcement learning for contact-rich tasks in automation systems
JP6970949B2 (ja) * 2018-06-11 2021-11-24 Necソリューションイノベータ株式会社 行動学習装置
DE102018004898A1 (de) * 2018-06-16 2019-12-19 Psa Automobiles Sa Roboteranordnung und Verfahren zur Durchführung einer Montageoperation an einem Werkstück
JP2020034994A (ja) * 2018-08-27 2020-03-05 株式会社デンソー 強化学習装置
KR102213061B1 (ko) * 2018-12-03 2021-02-09 한국생산기술연구원 로봇용 학습 프레임워크 설정방법 및 이를 수행하는 디지털 제어 장치
JP7000359B2 (ja) * 2019-01-16 2022-01-19 ファナック株式会社 判定装置
US20200320035A1 (en) * 2019-04-02 2020-10-08 Micro Focus Software Inc. Temporal difference learning, reinforcement learning approach to determine optimal number of threads to use for file copying
US11426874B2 (en) * 2019-04-30 2022-08-30 Flexiv Ltd. Robot-based insertion mounting of workpieces
JP2020192614A (ja) * 2019-05-24 2020-12-03 京セラドキュメントソリューションズ株式会社 ロボット装置及び把持方法
JP7209859B2 (ja) * 2019-10-09 2023-01-20 三菱電機株式会社 組み立て装置
CN114746226B (zh) * 2019-12-05 2024-03-08 三菱电机株式会社 连接器嵌合装置及连接器嵌合方法
JP7342974B2 (ja) * 2020-01-15 2023-09-12 オムロン株式会社 制御装置、学習装置、制御方法、及び制御プログラム
WO2022087859A1 (en) * 2020-10-28 2022-05-05 Shanghai Flexiv Robotics Technology Co., Ltd. Method for assembling an opreating member and an adapting member by a robot, robot, and controller

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011248728A (ja) * 2010-05-28 2011-12-08 Honda Motor Co Ltd 学習制御システム及び学習制御方法
JP2013158850A (ja) * 2012-02-01 2013-08-19 Seiko Epson Corp ロボット装置、組立て方法、及び組立てプログラム
JP2015033747A (ja) * 2013-08-09 2015-02-19 株式会社安川電機 ロボットシステム、ロボット制御装置及びロボット制御方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE394197T1 (de) * 1996-06-15 2008-05-15 Cinetic Landis Grinding Ltd Flexible verbindung einer schleifmaschinenspindel zu einer plattform
JP2000176868A (ja) * 1998-12-16 2000-06-27 Toyoda Mach Works Ltd ロボット制御装置
JP5330138B2 (ja) * 2008-11-04 2013-10-30 本田技研工業株式会社 強化学習システム
US8428780B2 (en) * 2010-03-01 2013-04-23 Honda Motor Co., Ltd. External force target generating device of legged mobile robot
JP4980453B2 (ja) * 2010-09-06 2012-07-18 ファナック株式会社 加工を高精度化するサーボ制御システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011248728A (ja) * 2010-05-28 2011-12-08 Honda Motor Co Ltd 学習制御システム及び学習制御方法
JP2013158850A (ja) * 2012-02-01 2013-08-19 Seiko Epson Corp ロボット装置、組立て方法、及び組立てプログラム
JP2015033747A (ja) * 2013-08-09 2015-02-19 株式会社安川電機 ロボットシステム、ロボット制御装置及びロボット制御方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10730182B2 (en) * 2017-03-31 2020-08-04 Fanuc Corporation Action information learning device, robot control system and action information learning method

Also Published As

Publication number Publication date
CA3035492A1 (en) 2018-03-08
CN109641354A (zh) 2019-04-16
JP6651636B2 (ja) 2020-02-19
CA3035492C (en) 2021-03-23
CN109641354B (zh) 2022-08-05
WO2018042730A1 (ja) 2018-03-08
US20190184564A1 (en) 2019-06-20

Similar Documents

Publication Publication Date Title
JP6651636B2 (ja) ロボットの制御装置およびロボットの制御方法
EP1845427B1 (en) Control
JP6046218B1 (ja) 物体と物体とを合わせ状態にするロボットのロボット制御装置
US9156164B2 (en) Method for adjusting parameters of impedance control
CN108214485B (zh) 机器人控制装置、以及机器人控制方法
CN108422420B (zh) 具有学习控制功能的机器人系统以及学习控制方法
CN110997249B (zh) 作业机器人和作业机器人的控制方法
US10350749B2 (en) Robot control device having learning control function
EP2749974A2 (en) Robot teaching system, robot teaching assistant device, and robot teaching method
EP3299129A1 (en) Robot control device, robot, and robot system
US20120109379A1 (en) Robust operation of tendon-driven robot fingers using force and position-based control laws
WO2018212265A1 (ja) ロボットシステム及びロボットシステムの制御方法
JP5218540B2 (ja) 組立ロボットとその制御方法
US11951625B2 (en) Control method for robot and robot system
JP6705847B2 (ja) 加工結果に基づいた学習制御を行うロボットシステム及びその制御方法
US20210039256A1 (en) Robot control method
US9827673B2 (en) Robot controller inhibiting shaking of tool tip in robot equipped with travel axis
JP6862604B2 (ja) 垂直多関節ロボットの慣性パラメータ同定システム及び慣性パラメータ同定方法並びに垂直多関節ロボットの制御装置及び制御方法
JP7423943B2 (ja) 制御方法およびロボットシステム
JPH0890461A (ja) ロボットの制御装置及び制御方法
JP7227018B2 (ja) 学習制御装置、ロボット制御装置およびロボット
JP2023003592A (ja) 力制御パラメーターの調整方法および力制御パラメーター調整装置
CN115771140A (zh) 动作参数调整方法
JP2020004020A (ja) ロバスト制御値調整システム、ロバスト制御値の調整方法、およびロバスト制御値調整プログラム
JP2010012575A (ja) 制御装置及び制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191008

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200122

R150 Certificate of patent or registration of utility model

Ref document number: 6651636

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150