JP6550605B2 - 動作の転移装置、動作の転移方法及びプログラム - Google Patents

動作の転移装置、動作の転移方法及びプログラム Download PDF

Info

Publication number
JP6550605B2
JP6550605B2 JP2014243740A JP2014243740A JP6550605B2 JP 6550605 B2 JP6550605 B2 JP 6550605B2 JP 2014243740 A JP2014243740 A JP 2014243740A JP 2014243740 A JP2014243740 A JP 2014243740A JP 6550605 B2 JP6550605 B2 JP 6550605B2
Authority
JP
Japan
Prior art keywords
robot
transfer
joint
transfer destination
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014243740A
Other languages
English (en)
Other versions
JP2016107346A (ja
Inventor
大毅 木村
大毅 木村
長谷川 修
修 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SOINN INC.
Original Assignee
SOINN INC.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SOINN INC. filed Critical SOINN INC.
Priority to JP2014243740A priority Critical patent/JP6550605B2/ja
Priority to EP15865660.3A priority patent/EP3228427B1/en
Priority to US15/525,730 priority patent/US10265847B2/en
Priority to PCT/JP2015/005981 priority patent/WO2016088367A1/ja
Publication of JP2016107346A publication Critical patent/JP2016107346A/ja
Application granted granted Critical
Publication of JP6550605B2 publication Critical patent/JP6550605B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/1605Simulation of manipulator lay-out, design, modelling of manipulator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/008Artificial life, i.e. computing arrangements simulating life based on physical entities controlled by simulated intelligence so as to replicate intelligent life forms, e.g. based on robots replicating pets or humans in their appearance or behaviour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33029ANNS artificial neural network with sigmoid function
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33045Selforganizing network
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39296Learn inverse and forward model together

Description

本発明は動作の転移装置、動作の転移方法及びプログラムに関し、例えば転移先ロボットで取得した少量の学習サンプルを用いて、転移元ロボットからの動作の転移を行う技術に関する。
現在、ロボットが家庭をはじめとする人間社会に急速に進出している。現在のところ、ロボットのための知的発達機構は未だ発展途上であり、実行できる動作や理解できる事柄は限られている。一方、機体の特性がそれぞれ異なる多種多様なロボットが開発され、それらが一般家庭へ導入されることを想定すると、それらのロボット1つ1つに独立に動作等を学習させることは非効率的である。
そこで、ロボットが学習した知識、特に動作情報をロボット同士で共有できる機構が必要となる。このように、ロボット同士が動作情報の共有によって動作を獲得することを、動作の転移という。換言すれば、動作の転移とは、転移元(ソースドメイン)のロボット上で獲得した動作情報を利用して、転移先(ターゲットドメイン)のロボットが動作を効率的に学習することである。
ロボットの動作の基となる情報(動作情報)は、例えばある物理特性(例えば腕の長さ、関節の数等)を有するロボットについて、関節角(関節値)と、腕の先端部分の座標(エンドエフェクタ)と、の対応関係を集積した情報として考えることができる。このような動作情報を用いることで、ロボットは動作を行うことができる。したがって、ロボットの動作の転移においては、物理特性が重要な意味を有する。しかし、ロボットの物理特性は、多種多様なロボット間で同一化することが困難である。そのため、動作の転移においては、他のロボットから得た動作情報を、自らの物理特性に合わせる機構が重要となる。
かかる機構としては、転移先ロボットの物理特性を得たうえで、移転元ロボットの動作情報を、移転先ロボットの物理特性に適合するよう加工する手法が一般的である。しかし、この手法では事前に移転先ロボットの物理特性を測定するなどの準備が必要となる。また、移転先ロボットの物理特性が変更となった場合や、測定に誤差が生じていた場合には、正確な動作が出来ないという問題もある。さらに、人や動物は、事前に自己の体の物理特性を得ることなく、動作を学習できている。してみると、移転先ロボットの物理特性を事前に想定せず、実機における経験ベースで動作の転移を実現することが、より現実的に則したアプローチと考えられる。
この点、非特許文献1は、転移先ロボットの物理特性が一部未知であっても、転移元のロボットと転移先のロボットとの双方から取得した同数の動作サンプルを利用して、転移元ロボットの動作サンプルを転移先に転移する手法を提案している。なお、ここでの転移は、行列計算によるフィッティングで実現されている。
Botond Bocsi外2名,"Alignment−based Transfer Learning for Robot Models",[online],2013年,[2014年10月6日検索],URL:http://www.cs.ubbcluj.ro/〜bboti/pubs/ijcnn_2013.pdf
しかしながら、非特許文献1は、動作の転移において必要となるデータサンプルの量への言及が少なく、転移元のロボットと転移先のロボットとの双方で同数のデータサンプルを取得することが必要と考えられる。すなわち、同手法では転移元のみならず転移先においても大量の学習サンプルを取得する必要がある。そのため、動作の転移に大量の時間、工数及び費用等を要し、迅速かつ正確な転移が出来ないという問題があった。
一般に、転移元のロボットについては、シミュレータや実験施設内の実機等を用いることにより、大量の動作サンプルを取得することが比較的容易である。しかし、転移先のロボットは、家庭内などで現実の稼働に供される実機であることが想定され、このような状況のもとでは移転元ロボットと同量の学習サンプルを取得することは困難と考えられる。したがって、転移先ロボットにおいては大量の学習サンプルを取得する工程を要せず、高い効率で動作の転移を実現する機構が望まれる。
本発明は、このような問題点を解決するためになされたものであり、転移先ロボットで取得した少量の学習サンプルを用いて、転移元ロボットからの動作の転移を行うことができる動作の転移装置、動作の転移方法及びプログラムを提供することを目的とする。
本発明に係る動作の転移装置は、転移元ロボットの動作情報を複数取得する転移元動作情報取得部と、転移先ロボットの第1の動作情報を複数取得する転移先動作情報取得部と、
前記転移先ロボットの第1の動作情報を用いて、所定の更新式により前記転移元ロボットの動作情報を補正することにより、転移先ロボットの第2の動作情報を複数生成する補正部と、を有する。前記転移先ロボットの第1の動作情報は、前記転移元ロボットの動作情報より少なく、前記転移先ロボットの第2の動作情報は、前記転移先ロボットの第1の動作情報より多い。
本発明に係る動作の転移方法は、転移元ロボットの動作情報を複数取得する転移元動作情報取得ステップと、転移先ロボットの第1の動作情報を複数取得する転移先動作情報取得ステップと、前記転移先ロボットの第1の動作情報を用いて、所定の更新式により前記転移元ロボットの動作情報を補正することにより、転移先ロボットの第2の動作情報を複数生成する補正ステップと、を有する。前記転移先ロボットの第1の動作情報は、前記転移元ロボットの動作情報より少なく、前記転移先ロボットの第2の動作情報は、前記転移先ロボットの第1の動作情報より多い。
本発明に係るプログラムは、上記動作の転移方法をコンピュータに実行させるためのプログラムである。
本発明においては、動作の転移装置が、転移先のロボットにおいて取得された少量の動作サンプル(転移先ロボットの第1の動作情報)を用いて、転移元のロボットの大量のデータセット(転移元ロボットの動作情報)を変形することで、転移先のロボットに最適化された大量のデータセット(転移先ロボットの第2の動作情報)を生成する。これにより、転移先のロボットで大量の動作サンプルを得ることなく、転移元のロボットの動作を、転移先のロボットに転移することができる。
本発明により、転移先ロボットで取得した少量の学習サンプルを用いて、転移元ロボットからの動作の転移を行うことができる動作の転移装置、動作の転移方法及びプログラムを提供することができる。
実施の形態1にかかる動作の転移装置100の構成を示す図である。 実施の形態1にかかる動作の転移装置100の動作を示す図である。 実施の形態1にかかる動作の転移装置100の動作アルゴリズムの一例を示す図である。 実施の形態2にかかる動作の転移装置100の動作を示す図である。 実施の形態2にかかる動作の転移装置100の動作アルゴリズムの一例を示す図である。 比較実験に用いたロボットの物理特性を示す図である。 比較実験に用いたロボットの物理特性を示す図である。 比較実験の結果を示す図である。 比較実験の結果を示す図である。 比較実験の結果を示す図である。 比較実験に用いたロボットの図である。 比較実験に用いたロボットの図である。 比較実験に用いたロボットの物理特性を示す図である。 比較実験の結果を示す図である。 比較実験の結果を示す図である。 比較実験の結果を示す図である。 比較実験の結果を示す図である。 本発明に係る動作の転移の概念を示す図である。 データセットを用いて腕を動作させるための関節値を求めるアルゴリズムの一例を示す図である。
<はじめに>
はじめに、本発明にかかる動作の転移手法の前提となる諸条件について説明する。
本発明は、以下の条件の下にあるロボット間で動作の転移を実施する手法を提案するものである(図18)。後述する本発明の実施の形態も、以下の条件に従うものとする。なお、ここでロボットの動作とは、腕のエンドエフェクタ(人間の手先にあたる、腕の先端部分)などのロボットの特定の部分を任意の場所(座標値)へ移動させることを指す。
条件1:転移元及び転移先のロボットはいずれも、関節数が既知であり、かつ等しいものとする。
条件2:関節数以外の物理特性(例えば腕の長さ等)は未知であるものとする。
条件3:転移元のロボットは、大量の動作サンプルが抽出可能であるものとする。典型的にはシミュレータ上又は実験施設内に存在するロボットである。
条件4:転移先のロボットは、少量の動作サンプルのみが抽出可能であるものとする。典型的には実機のロボットである。
本発明にかかる手法は、上述の制約条件を満たす転移元のロボットから、転移先のロボットに動作を転移させるものである。動作の転移とは、転移元のロボット上で作成された動作の経験データベースDsrcから、転移先のロボットの作業空間に合わせた経験データベース
を作成することを意味している。このとき、
は、まず転移先のロボットにて少量の動作を行って経験データセットDtgtを作成し、次にDsrcをDtgtによって補正することで作成する。ここで、DtgtのサイズはDsrcよりも小さく、
のサイズはDsrcと同等である。したがって、本手法によれば、転移先のロボットを実際に大量に動作させてデータセットを生成する場合に比べ、少ないデータセットでの学習が可能である。また、Dsrcをそのままコピーして
を生成する場合に比べ、精度が向上する。なお、Dsrc等の経験データベースは、単に関節値と座標値とのペアの集合であれば良く、単純なデータベース(単純なペアの情報を記録したデータベース)の他にも、例えば、競合学習を用いた自己組織化マップSOM(Self Organizing Maps)や、SOMを改良した追加学習可能なオンライン教師なし学習手法であるSOINN(Self Organizing Incremental Neural Network)等を用いて情報を圧縮したものであっても良い。
なお、SOM及びSOINNについては下記参考文献1及び参考文献2に説明されているため、ここでは詳細な説明を省略する。
(参考文献1)Kohonen T.,“Self−organized formation of topologically correct feature maps”,Biological Cybernetics Vol.43,pp.59−69,1982年
(参考文献2)Shen F.,Hasegawa O.,“A Fast Nearest Neighbor Classifier Based on Self−organizing Incremental Neural Network”,Neural Networks,2008年
ここで、ロボット上で動作の経験データベースDを作成する方法について説明する。この方法は、Dsrc及びDtgtの作成に適用できる。一般に、ロボットの物理特性が既知の場合は、公知技術であるInverse Kinematics(IK)を用いることにより、腕のエンドエフェクタを任意の場所に移動させる制御が可能である。ところが、今回の仮定ではその物理特性が未知である。したがって、本発明の手法では、経験ベースのIKを実施することによりエンドエフェクタの移動を行う。以下、経験ベースのIKを実行するためにロボットが獲得すべきデータと、そのデータを用いたIKの実行方法について開示する。
まず、対象とするロボットが持つ全ての関節の関節角を示すデータである関節値のセット
を生成する。例えば、m軸のロボット、すなわちm個の関節を持つロボットの場合、関節値
はm次元ベクトルとなる。
そして、Jに含まれる関節値それぞれを用いて実際にロボットを動作させ、ロボットの各種センサ情報(例えば視覚情報等)により腕のエンドエフェクタの絶対座標値(以下、単に座標値という)を求める。シミュレータ上のロボットなど、物理特性が既知の場合には、Forward Kinematicsを用いることで、座標値取得の所要時間を短縮できる。そして、計算された座標値をまとめたデータセット
を生成する。このとき、ロボットの関節値からエンドエフェクタの座標値は一意に決定される。つまり、関節値と座標値との間には関数の関係がある。
これらの経験、すなわち実際の動作から獲得される関節値と座標値を、データセットDとする(式(1)(2))。
ここで、獲得したデータセットDに基づいて、ランダムに指定される座標値
へ腕のエンドエフェクタを移動させるための関節値
を求める方法を示す。ここでは、指定された座標値
の近傍の座標値データを、データセットDの中からk個探し出し、それらk個の座標値にそれぞれ対応する関節値
の逆距離加重平均(InverseDistanceWeighting)を計算することにより
を求める。
ここで、指定された座標値へエンドエフェクタを動かすことのできる関節値が、複数存在することがある。この事象は関節数が大きくなるほど生じやすい。そのため、似通った座標値であっても、それぞれの座標値に到達するための関節値が大きく異なる場合が存在する。このような場合、座標値空間だけを用いて平均を算出すると、大きく異なる関節値同士の平均を用いてしまうことになり、結果として位置誤差が大きくなる可能性がある。そこで、本手法では、関節値空間における関節値の距離も参考にしながら、
を算出している。
具体的には、まず座標値空間において、指定された座標値の最近傍である
と、その周辺の座標値サンプルXknnと、を探し出す。ついで、探し出した座標値それぞれに対応する関節値
を求める。そして、関節値Jknnの中から、
に距離の近いデータJselectedを探し出す。そして、それらの逆距離加重平均を
とする。このアルゴリズムを図19に示す。なお、パラメータkは本手法では3とした。
つづいて、本発明の実施の形態として、転移元のロボットにおいて獲得したDsrcを補正することで、
すなわち転移先のロボットの作業空間へ適応させたデータセットを求める2種類の手法を開示する。まず、実施の形態1として、SOM変形法(Transfer by SOM−algorithm)を開示する。つぎに、実施の形態2として、誤差伝播法(Transfer by Error propagation)を開示する。
<実施の形態1>
実施の形態1にかかるSOM変形法は、転移先のロボットにおいて少量の動作サンプルDtgtを取得し、Dtgt中の座標値空間のデータXtgtを用いて、かつSOMを参考に作成した更新式により、転移元のロボットの座標値空間Xsrcを変形する手法である。
SOM変形法は、従来より公知であるSOM(Self Organizing Maps)の更新式から着想されたアルゴリズムである。SOMは、ネットワーク構造(トポロジー)を入力に合わせて変化させる手法としてKohonenらによって考案された自己組織化マップである。SOMは人工ニューラルネットワークの一種であり、入力に従ってニューロンのトポロジーを変形させる機構を持つ。SOMの学習方式は競合学習であり、入力に対する近傍ニューロンに対して更新を行う。
一方、従来のSOMとSOM変形法とでは対象とする問題設定が異なるため、SOM変形法では、更新率の変動方法に新たな知見を加えている。従来のSOMは、1つの空間内におけるノードの更新を行うものであり、当該空間内における、入力と、入力の近傍ノードと、の距離を用いて更新率の決定を行っている。一方、SOM変形法は、関節値空間及びエンドエフェクタの座標空間とうい2つの空間が存在することを前提としている。本手法においては、入力されたデータに応じて更新が行われる空間は、座標値空間が適当と考えられる。但し、上述のように座標値と関節値の間には一定の制約条件が存在することから、関節値空間内での関節値の距離も考慮することが重要である。そこで、本手法では、関節値空間内での関節値の距離も座標値空間の更新率に反映することができるような仕組みを設けている。
以下、SOM変形法により
を求める手法を具体的に開示する。
まず、図1を用いて、本発明の実施の形態1にかかる動作情報の転移装置100の構成について説明する。
動作の転移装置100は、典型的にはサーバコンピュータ、パーソナルコンピュータ(PC)等の情報処理装置である。典型的な動作の転移装置100は、演算処理装置、揮発性又は不揮発性の記憶装置、及び入出力装置を有する。演算処理装置は、記憶装置に格納されたプログラムに基づいて各種制御を実行することにより、後述の各処理部を論理的に実現する。動作の転移装置100は、物理的に単一である必要はなく、複数の情報処理装置による分散処理により実現されてもよい。また、動作の転移装置100は、例えば転移先のロボットに内蔵されても良く、又は転移先のロボットとは分離されていても良い。
転移元動作情報取得部101は、転移元のロボットを動作させるためのデータセットDsrcを取得する。Dsrcは、関節値群Jsrc及びエンドエフェクタの座標値群Xsrcを含む。典型的には、Dsrcは、シミュレータ上及び実験施設内等において転移元ロボットを幾度にもわたり動作させ、エンドエフェクタと、それに対応する関節値と、のペアを多数取得することにより生成できる。本実施の形態では、Dsrcは予め生成済みであるものとし、転移元動作情報取得部101は、入力装置又は記憶装置からDsrcを取得するものとする。
転移先動作情報取得部102は、転移先のロボットを試験動作させた際に得られたデータセットDtgtを取得する。Dtgtは、関節値群Jtgt及びエンドエフェクタの座標値群Xtgtを含む。典型的には、Dtgtは、転移元ロボットを何度かランダムに動作させ、エンドエフェクタの座標値と、それに対応する関節値と、のペアを幾つか取得することにより生成できる。ここで、Dtgtの大きさは、Dsrcよりも極めて小さくて良い。すなわち、転移元ロボットの動作試行回数に比べて、転移先ロボットの動作試行回数は少なくて良い。
本実施の形態では、Dtgtは予め生成済みであるものとし、転移先動作情報取得部102は、入力装置又は記憶装置からDtgtを取得するものとする。
補正部103は、Dtgtを利用して、Dsrc
に変形する処理を行う。本実施の形態では、補正部103はSOM変形法を用いた変形処理を行う。
出力部104は、補正部103が生成した
を外部に出力する。転移先ロボットは、出力部104が出力した
を取得し、これに基づいた動作を行うことで、転移元ロボット同様の動作を獲得できる。
つづいて、図2のフローチャートを用いて、本発明の実施の形態1にかかる動作の転移装置100の動作について説明する。なお、図3のアルゴリズムは、上記フローチャートが示す処理の一実装例である。
S101:転移先データセットの初期化
転移元動作情報取得部101は、転移元のデータセットDsrcを取得する。
補正部103は、転移先データセットとして
を生成する。この際、初期値としてDsrcと同じ値を設定する(図3、第2行)。
S102:転移先動作サンプルの関節値、座標値の全ての組について繰返し処理
転移先動作情報取得部102は、転移先ロボットの動作サンプルDtgtを取得する。
補正部103は、Dtgtに含まれる関節値Jtgt及び座標値Xtgtのペアそれぞれについて、S103以降の処理を繰り返し実行する。
S103:転移先動作サンプルの座標値と転移先データセットの最寄りの座標値との距離を算出
補正部103は、転移先ロボットの動作サンプルDtgtに含まれる座標値
に最も近い座標値
を、転移先のデータセット
から探し出し、両者の距離dnearestを算出する(図3、第3、6−8行)。
より具体的には、補正部103はまず、転移先ロボットの動作サンプルDtgtに含まれる関節値
に最も近い座標値
を、転移先のデータセット内の関節値群
から探し出す(図3、第6行)。ついで、補正部103は、
のペアである
を、転移先のデータセット
から探し出す(図3、第7行)。そして、補正部103は、

との距離dnearestを計算する(図3、第8行)。なお、このように関節値空間から先に計算する理由は、ある座標値に対応する関節値が複数存在する場合があるためである。このような場合には、座標値空間から計算を始めてしまうと、座標値に対応する関節値を探し出すことができない。
S104:パラメータ設定
ここで補正部103は、
の変形処理にかかるパラメータを設定しても良い(図3、第4−5行)。本実施の形態では、変形処理に用いるシグモイド関数(後述)の特性を設定するためのパラメータをここで設定することができる。シグモイド関数の特性を変更することで、変形処理(学習処理)のスピードを調整することが可能である。なお、このパラメータは任意に設定して構わない。
S105:転移先データセットの関節値、座標値を補正
補正部103は、転移先のデータセット
を変形する処理を行う。すなわち、
に含まれるすべての座標値
を補正することにより、関節値
と上記座標値のマッピングを、転移先のロボットに最適化する(図3、第9−12行)。
より具体的には、補正部103はまず、
に含まれる関節値

との距離dを算出する(図3、第10行)。ついで、補正部103は、

との差分
を算出する(図3、第11行)。そして、補正部103は、
及びS103で算出したdnearestを用いて、以下の更新式により
を補正する(図3、第12行)。
ここで、上記更新式は、従来のSOMの更新式を基としながら、座標値空間の更新を行うに際し、関節値空間の情報も加味している点に留意されたい。これは、従来のSOMとは異なり、本発明では関節値空間及び座標値空間という複数の空間を扱う必要があることに起因している。
本実施の形態においては、動作の転移装置100は、SOM変形法を用いて、転移元のロボットのデータセットを変形し、転移先のロボットに最適化されたデータセットを生成する。この変形処理においては、転移先のロボットにおいて取得された、上記データセットに含まれるよりも少ない数の動作サンプルが用いられる。これにより、たとえ転移先のロボット上で大量の動作サンプルを得ていなくても、転移元のロボットの動作を、転移先のロボットにて獲得することができる。すなわち、同等の動作を実施できることとなり、動作が転移される。
また、本実施の形態では、従来のSOMを修正し、性質の違う2つの空間を同時に考慮した更新式を導入した。これにより、ロボットにおける動作の転移という問題設定すなわち課題にふさわしい手法となった。
さらに、本実施の形態によれば、従来技術に比較して少量の計算量で動作の転移を実現できる。特に、転移先のロボットにおける学習サンプルが従来よりも少なくて済むことから、計算量を大幅に削減することが可能である。
<実施の形態2>
実施の形態2にかかる誤差伝播法は、DsrcとDtgtとの誤差を算出して、その誤差値を用いて、転移元のロボットの座標値空間Xsrcを変形する手法である。すなわち、少量の動作サンプルを用いて算出した誤差値を、Dsrc内の周辺のデータへと伝播させることで、変形を行う。具体的には、転移先ロボットにおいて得られた動作サンプルデータDtgt内のサンプルそれぞれについて、移転元ロボットのデータセットDsrcの中から、近い動作を探し出す。そして、双方の動作に対応するエンドエフェクタの座標値の誤差を算出する。さらに、その誤差を、同じような関節値を持つDsrc内のデータへと伝播させて、座標値空間を変改させてゆく。
以下、誤差伝播法により
を求める手法を具体的に開示する。
実施の形態2にかかる動作の転移装置100の構成は、実施の形態1と同様であるため説明を省略する。
つづいて、図4のフローチャートを用いて、本発明の実施の形態2にかかる動作の転移装置100の動作について説明する。なお、図5のアルゴリズムは、上記フローチャートが示す処理の一実装例である。
S201:転移先データセットの初期化
実施の形態1と同様に、転移元動作情報取得部101は、転移元のデータセットDsrcを取得する。また、補正部103は、転移先データセットとして
を生成する。この際、初期値としてDsrcと同じ値を設定する(図5、第2行)。
S202:転移先動作サンプルの関節値、座標値の全ての組について繰返し処理
実施の形態1と同様に、転移先動作情報取得部102は、転移先ロボットの動作サンプルDtgtを取得する。また、補正部103は、Dtgtに含まれる関節値Jtgt及び座標値Xtgtのペアそれぞれについて、S203以降の処理を繰り返し実行する。
S203:転移先動作サンプルの座標値と転移先データセットの最寄りの座標値との差分を算出
補正部103は、転移先ロボットの動作サンプルDtgtに含まれる座標値
に最も近い座標値
を、転移先のデータセット
から探し出し、両者の誤差
を算出する(図5、第3、5−7行)。
より具体的には、補正部103はまず、転移先ロボットの動作サンプルDtgtに含まれる関節値
の、関節値空間における最近傍の関節値
を、転移先のデータセット内の関節値群
から探し出す(図5、第5行)。ついで、補正部103は、
のペアである
を、転移先のデータセット
から探し出す(図5、第6行)。そして、補正部103は、今回の入力

の誤差
を計算する(図5、第7行)。ここでも、実施の形態1と同様に、関節値空間から先に計算が行われる。
S204:パラメータ設定
ここで補正部103は、
の変形処理にかかるパラメータを設定しても良い(図5、第4行)。ここでも、実施の形態1と同様に、シグモイド関数の特性を変更することで、変形処理(学習処理)のスピードを調整することが可能である。
S205:転移先データセットの関節値、座標値を補正
補正部103は、転移先のデータセット
を変形する処理を行う。すなわち、
に含まれるすべての座標値
を補正することにより、関節値
と上記座標値のマッピングを、転移先のロボットに最適化する(図3、第9−12行)。
より具体的には、補正部103はまず、
に含まれる関節値

との距離dを算出する(図3、第9行)。ついで、補正部103は、d及びS103で算出した変位
を用いて、以下の更新式により
を補正する(図5、第10行)。これにより、上記変位が他の座標点にも伝播する。
ここで、上記更新式は、実施の形態1の更新式を修正したものである。詳しくは後述するが、実施の形態1のSOM変形法では、入力された座標値(転移先の動作サンプルDtgtの座標値群Xtgt)に対し、
の他の座標値が寄って行くような変形が行われる。これに対し、実施の形態2の誤差伝播法では、入力された座標値と、
内の対応する座標値との誤差が他の座標値にも伝播し、それに基づいて移動するような変形が行われる。本発明における、ロボットの動作の転移という問題設定に鑑みると、実施の形態2の更新式によりデータセットを変形させる方がより効率が良い。
本実施の形態によれば、動作の転移装置100は、実施の形態1に比較してより適切かつ効率の良い動作の転移を実現できる。
<実験>
実施の形態1及び2にかかる動作転移手法の効果を検証するため、発明者は2種類の実験を実施した。1つめの実験はエンドエフェクタが2次元平面上を動作する2軸のロボットを用いた実験、2つめの実験はエンドエフェクタが3次元空間内を動作する6軸の実機のロボットを用いた実験である。前者の2軸のロボットを用いて主に定量的な評価を、後者の6軸のロボットを用いて有効性の評価を行う。
<2軸のロボットによる実験>
実験環境:2軸の片腕ロボットをシミュレータ上に作成し、シミュレータ上で動作を転移した後、エンドエフェクタの位置誤差の定量的な評価を実施する。そのために、腕の長さが異なるロボットを4種類用意した。それぞれのロボットの腕の長さを図7に示す。また、それぞれの腕の長さの場合のロボットの動作可能な空間を図6に示す。また、関節値の可動範囲は、0から180度に限定した場合(以降「関節値に制限あり」と呼び、図6はこちらである)と、0から360度にした場合(以降「関節値に制限なし」と呼ぶ)の2つのパターンで実験を行う。関節値に制限なしの場合、任意の場所にエンドエフェクタを持って行くための関節値の候補が複数存在することがあり、ロボットの動作生成が一律でない。
本実験では、ロボットSrcを転移元のロボットとして、ロボットA、B、Cへと動作の転移を実施する。そして、その時の位置誤差の絶対値
を計測する。ここで、
は目標として指定された座標値、
は実際にロボットが到達したエンドエフェクタの座標値である。
転移元のロボットのデータセットDsrcは、ロボットSrcの各関節の値を0.0314≒π/100[rad]ずつ動かして得られたグリッド上の関節値のデータと、その関節値それぞれから得られたエンドエフェクタの絶対座標値(XY平面)である。データ数は、関節値に制限ありの場合で10000サンプル、関節値に制限なしの場合で40000サンプルとした。
転移先のロボットの動作サンプルDtgtは、ロボットA、B、Cそれぞれにおいてランダムに設定した関節値と、その関節値それぞれから得られた座標値である。データ数は、関節値の制限の有無に関わらず、50サンプルとした。
本実験の評価は、ランダムな目標へ200回腕を動かす実験を100回実施し、その時の目標とエンドエフェクタとの位置誤差を記録することで行った。パラメータは、a=1、a=0.1とした。これらの値は、一番難しいと考えられる転移を小規模で事前実施し多彩に得られた、それぞれのパラメータの最良値である。本実験では、以下の6つの実験データを比較した。
STgt:少量のサンプルデータDtgtを、転移先のロボットのデータセットとして単純に利用した場合
Lsrc:データDsrcを単純にコピーし、転移先のロボットのデータセットとして利用した場合
TSom:SOM変形法を用いて転移した場合
TErr:誤差伝播法を用いて転移した場合
LTgt:転移先のロボットにおいて大量の動作サンプルを得た場合(理論上の最小誤差)
実験結果:関節値に制限ありの場合の、位置誤差の箱ひげ図を図9に示す。また、関節値に制限なしの場合の、箱ひげ図を図10に示す。また、関節値に制限ありの場合(L)及び関節値に制限なし(N)の場合それぞれにおける平均値、標準偏差を図8に記す。
図8乃至10によれば、幾つかの転移手法の中でも、誤差伝播法(TErr)を用いることで、理論上の最小誤差(LTgt)に近い位置誤差まで抑えることができることがわかる。これは、腕の長さ等の物理特性の異なるロボットであっても、転移元のロボットが十分学習されていれば(ここでは数万サンプル)、転移先のロボット上で少量のサンプル(50サンプル)を集めることで、大量のサンプル(数万サンプル)を学習したときと同程度での精度での稼働が実現できることを意味する。つまり、ロボット1台1台に対して動作の学習を行う手間を抑制し、効率的な動作の転移を行うことができる。
ところで、誤差伝播法を用いてもなお位置誤差は一定程度存在しており、本実験のみでは、本発明にかかる手法が実際にロボットの動作の転移手法として有効であるか不明である。よって、つぎに実機のロボットにおける本発明の有効性について検証する。
<6軸の実機ロボットによる実験>
実験環境:本実験では、図12に示す実機のロボットを転移先として使用する。この移転先のロボットは、6軸の左腕を備えている。このロボットに対する転移元として、移転先のロボットの腕に似たスペックを持つロボットを、シミュレータ上に作成する。この移転元のロボットの外観を図11に示す。また、このロボットの腕と手首の長さを図13に示す。ここでは、シミュレータ上にロボットα、ロボットβの2種類の移転元ロボットを作成した。これらのシミュレータ上の移転元ロボットα及びロボットβの左腕を用いて、大量にデータベースを収集し、実機のロボットに対して動作の転移を実施した。
実験時に使用したデータの詳細を記述する。転移元であるシミュレータ上のロボットで獲得したデータセットDsrcは、それぞれの関節を0.0157≒π/200[rad]ずつ動かしたものであり、データ数は約70万サンプルである。転移先の実機のロボットにて獲得した少量の動作サンプルDtgtは、ランダムに実機のロボットを動かすことで取得し、100サンプルとした。
ここでは、2種類の実験を実施する。6軸のロボットを用いた場合の定量的な評価と、実機を用いた実証実験である。前者の実験の方法は、上述の2軸のロボットによる実験と同様である。後者の実験としては、実機のロボットにて任意の目標位置にエンドエフェクタを持っていかせ、その場所に予め置かれた物体を把持させる。この時、物体の位置については、ロボットが搭載するカメラと深度センサを用いることで絶対座標を特定できる。
本実験でも、STgt、Lsrc、TSom、TErr及びLTgtの6つの実験データを比較した。
実験結果:ロボットα、βのそれぞれを転移元とし、6つの手法をそれぞれ用いた場合のエンドエフェクタの位置誤差の箱ひげ図を図14に示す。また、平均値、標準偏差を図15に記す。図14及び15によれば、2軸の場合と同様、6軸の場合においても、誤差伝播法を用いることでより高い効率で位置誤差を削減できることがわかる。また、誤差伝播法を用いた1回の転移に要する時間は、56.8±3[sec]であり、実用に耐えうる時間と評価できる。
つぎに、実機の6軸のロボットにてロボットβから転移された情報を使い、任意の場所に置かれた物体を把持する実験を実施した。その結果、実際に物体を把持することができることを確認した。よって、本発明にかかる手法は、実環境における動作転移にも有効と評価できる。
<実施例の比較>
上記実験結果によれば、実施の形態1にかかるSOM変形法により動作転移を行った場合、位置誤差が比較的大きくなることがわかる。一方、実施の形態2にかかる誤差伝播法によれば、位置誤差は非常に小さい。
2軸のロボットを転移先として使用し、ロボットAからの転移を実施した時の2つの変形法のそれぞれのエンドエフェクタの絶対座標空間を図16及び17に記す。図16はSOM変形法を用いた場合、図17は誤差伝播法を用いた場合である。
図16及び図17において、点A(白抜きの丸で表される)は転移先のロボット上で入力された少量の動作サンプルの座標値Xtgtを示す。点B(大きな黒丸で表される)は転移後の座標値
を示す。線分は動作の転移による座標値の移動(データセットの補正変形)の軌跡を示す。点C(小さな黒丸で表される)は転移先のロボットで大量の動作サンプルを取得できると仮定した場合の座標値を示す。ここで、点Bと点Cとが重なっている状態であれば、その転移手法では、移転先ロボットにおいて十分にすなわち移転元ロボットと同程度に学習したときと同じ誤差を抑えられていることになる。
図16から分かるように、SOM変形法では、転移先のロボット上で入力された少量の動作サンプルである点Aの近傍に、転移後の座標値である点Bが移動している。これは、SOM変形法の基礎となっているSOMは、元来、未知の対象に対してネットワークを変形する手法として提案されたものであり、入力された情報に沿って変形させるアルゴリズムであることによる。
一方、図17からわかるように、誤差伝播法では、転移先のロボット上で入力された少量の動作サンプルである点Aと転移元のロボットにおける座標点との誤差、つまり線分で示された座標点の補正量が、周辺の座標点に伝播して、データセットが持つ座標点の補正が行われる。これは、誤差伝播法は、SOM変形法とは問題設定が異なり、転移先と似た環境を有する転移元についての情報を事前に得ている状態から、転移先へ情報を“転移”させることを目的としていることによる。かかる問題を解決する手段として、誤差伝播法では、新しい環境(転移先)と学習済みの環境(転移元)との誤差を用いてデータを転移先に適応させている。
すなわち、ある環境から似た環境へ学習データを転移させる問題に対しては、誤差伝播法のほうがより適しており、誤差の少ない転移を実現しやすいのである。
<その他の実施の形態>
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、上述の実施の形態では、転移元の座標値と転移先の座標値とのマッピングにシグモイド関数を採用した。しかし、シグモイド関数に代えて、アークタンジェント(arctan)をはじめとする任意の関数を採用しても良い。
また、上述の実施の形態では、関節値空間、座標値空間の2空間の存在を前提として動作情報の転移を行う手法を開示した。しかしながら、空間数は任意のNであって良い。この場合、上述の更新式は空間数に応じ任意に拡張することができる。例えば、センサ値の空間を追加し、関節値及び座標値の関数として座標値を定義することが考えられる。センサ値は、例えば腕の状態(折れや曲がり等)を示すデータであって良い。これにより、センサ値を考慮しながら動作を行うことができるので、ロボット自身やその周辺の状態に応じた動作の選択、動作の生成が行うことができると考えられる。
また、上述の実施の形態では、本発明を主にハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non−transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
100 動作の転移装置
101 転移元動作情報取得部
102 転移先動作情報取得部
103 補正部
104 出力部

Claims (10)

  1. 転移元ロボットの動作情報を複数取得する転移元動作情報取得部と、
    転移先ロボットの第1の動作情報を複数取得する転移先動作情報取得部と、
    前記転移元ロボットの動作情報と前記第1の動作情報とを用いた学習により生成された所定の更新式により前記転移元ロボットの動作情報を補正することにより、前記転移先ロボットの第2の動作情報を複数生成する補正部と、を有し、
    前記第1の動作情報は、前記転移先ロボットに設けられた複数の関節の複数の関節値と、前記複数の関節値に対応する座標値と、からなるセットを含み、
    前記転移元ロボットの動作情報は、前記転移元ロボットに設けられた複数の関節の複数の関節値と、前記複数の関節値に対応する座標値と、からなるセットを含み、
    前記第2の動作情報は、前記補正部により生成された、前記転移先ロボットに設けられた複数の関節の複数の関節値と、前記複数の関節値に対応する座標値と、からなるセットを含み、
    前記第1の動作情報に含まれる前記セットの数は、前記転移元ロボットの動作情報に含まれる前記セットの数より少なく、
    前記第2の動作情報に含まれる前記セットの数は、前記第1の動作情報に含まれる前記セットの数より多い
    動作の転移装置。
  2. 前記転移先ロボットに設けられた前記関節の数は、前記転移元ロボットに設けられた前記関節の数と等しい、
    請求項1記載の動作の転移装置。
  3. 各関数の関節値は、各関節の関節角である、
    請求項1又は2記載の動作の転移装置。
  4. 前記第1及び第2の動作情報のそれぞれに含まれる前記座標値は、前記転移先ロボットの特定部分の位置を示し、
    前記転移元ロボットの動作情報に含まれる前記座標値は、前記転移先ロボットの前記特定部分に対応する前記転移元ロボットの特定部分の位置を示すものである、
    請求項1乃至3のいずれか1項記載の動作の転移装置。
  5. 前記更新式は、前記転移先ロボットの第1の動作情報と、前記転移元ロボットの動作情報と、の誤差に基づいて前記補正を行う
    請求項1乃至のいずれか1項記載の動作の転移装置。
  6. 前記転移元ロボットの動作情報、前記転移先ロボットの第1の動作情報及び前記転移先ロボットの第2の動作情報は、それぞれ異なる空間において定義され、
    前記更新式は、前記異なる空間それぞれにかかる制約条件を同時に満足するものである
    請求項1乃至のいずれか1項記載の動作の転移装置。
  7. 前記更新式は、SOM(Self−Organizing maps)アルゴリズムを複数の前記空間に拡張することにより、前記補正を行う
    請求項記載の動作の転移装置。
  8. 前記更新式は、前記転移先ロボットの第1の動作情報に含まれる第1の関節値の近傍に位置する、第2の関節値を、前記転移元ロボットの動作情報から抽出し、
    前記転移先ロボットの第1の動作情報に含まれ、前記第1の関節値に対応する第1の座標値と、
    前記転移元ロボットの動作情報に含まれ、前記第2の関節値に対応する第2の座標値と、の誤差を算出し、
    前記誤差を、前記転移元ロボットの動作情報に含まれる他の座標値に伝播させることにより前記補正を行う
    請求項1乃至6いずれか1項記載の動作の転移装置。
  9. 転移元ロボットの動作情報を複数取得する転移元動作情報取得ステップと、
    転移先ロボットの第1の動作情報を複数取得する転移先動作情報取得ステップと、
    前記転移元ロボットの動作情報と前記第1の動作情報とを用いた学習により生成された所定の更新式により前記転移元ロボットの動作情報を補正することにより、前記転移先ロボットの第2の動作情報を複数生成する補正ステップと、を有し、
    前記第1の動作情報は、前記転移先ロボットに設けられた複数の関節の複数の関節値と、前記複数の関節値に対応する座標値と、からなるセットを含み、
    前記転移元ロボットの動作情報は、前記転移元ロボットに設けられた複数の関節の複数の関節値と、前記複数の関節値に対応する座標値と、からなるセットを含み、
    前記第2の動作情報は、前記補正ステップにより生成された、前記転移先ロボットに設けられた複数の関節の複数の関節値と、前記複数の関節値に対応する座標値と、からなるセットを含み、
    前記第1の動作情報に含まれる前記セットの数は、前記転移元ロボットの動作情報に含まれる前記セットの数より少なく、
    前記第2の動作情報に含まれる前記セットの数は、前記第1の動作情報に含まれる前記セットの数より多い
    動作の転移方法。
  10. コンピュータに、請求項9記載の方法を実行させるためのプログラム。
JP2014243740A 2014-12-02 2014-12-02 動作の転移装置、動作の転移方法及びプログラム Active JP6550605B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2014243740A JP6550605B2 (ja) 2014-12-02 2014-12-02 動作の転移装置、動作の転移方法及びプログラム
EP15865660.3A EP3228427B1 (en) 2014-12-02 2015-12-02 Action transfer device, action transfer method, and non-transitory computer-readable medium in which program is stored
US15/525,730 US10265847B2 (en) 2014-12-02 2015-12-02 Action transfer device, action transfer method, and non-transitory computer-readable medium storing program
PCT/JP2015/005981 WO2016088367A1 (ja) 2014-12-02 2015-12-02 動作の転移装置、動作の転移方法及びプログラムが格納された非一時的なコンピュータ可読媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014243740A JP6550605B2 (ja) 2014-12-02 2014-12-02 動作の転移装置、動作の転移方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2016107346A JP2016107346A (ja) 2016-06-20
JP6550605B2 true JP6550605B2 (ja) 2019-07-31

Family

ID=56091329

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014243740A Active JP6550605B2 (ja) 2014-12-02 2014-12-02 動作の転移装置、動作の転移方法及びプログラム

Country Status (4)

Country Link
US (1) US10265847B2 (ja)
EP (1) EP3228427B1 (ja)
JP (1) JP6550605B2 (ja)
WO (1) WO2016088367A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11207773B2 (en) 2016-11-07 2021-12-28 Soinn Inc. Action transfer device, action transfer method, and non-transitory computer-readable medium storing action transfer program
JP6661027B2 (ja) * 2016-11-17 2020-03-11 株式会社Fuji 作業ロボット
JP6828572B2 (ja) * 2017-04-18 2021-02-10 富士通株式会社 ロボット移動時間推定プログラム及びロボット移動時間推定方法
US20210178578A1 (en) * 2017-11-16 2021-06-17 Sony Corporation Information processing apparatus, information processing method, computer program, and program manufacturing method
JP7110884B2 (ja) * 2018-10-01 2022-08-02 オムロン株式会社 学習装置、制御装置、学習方法、及び学習プログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5495410A (en) * 1994-08-12 1996-02-27 Minnesota Mining And Manufacturing Company Lead-through robot programming system
US6272396B1 (en) 1998-02-20 2001-08-07 Tairob Industrial Technology Ltd. Method for applying knowledge from a skilled worker via a master expert machine to a slave expert machine for repetitive tasks
JP4170530B2 (ja) * 1999-08-09 2008-10-22 川崎重工業株式会社 ロボットの作業教示方法及び装置
US7859540B2 (en) * 2005-12-22 2010-12-28 Honda Motor Co., Ltd. Reconstruction, retargetting, tracking, and estimation of motion for articulated systems
US8467904B2 (en) * 2005-12-22 2013-06-18 Honda Motor Co., Ltd. Reconstruction, retargetting, tracking, and estimation of pose of articulated systems
JP2007276052A (ja) * 2006-04-06 2007-10-25 Sony Corp 制御システム、記録システム、情報処理装置および方法、プログラム、並びに記録媒体
US8924021B2 (en) * 2006-04-27 2014-12-30 Honda Motor Co., Ltd. Control of robots from human motion descriptors
US8271132B2 (en) * 2008-03-13 2012-09-18 Battelle Energy Alliance, Llc System and method for seamless task-directed autonomy for robots
US8781624B2 (en) * 2009-03-24 2014-07-15 Disney Enterprises, Inc. Systems and methods for tracking and balancing robots for imitating motion capture data
JP2011110621A (ja) * 2009-11-24 2011-06-09 Toyota Industries Corp ロボットの教示データを作成する方法およびロボット教示システム
WO2013073683A1 (ja) * 2011-11-16 2013-05-23 日産自動車株式会社 接合体の製造方法およびその製造装置
EP2685403A3 (en) * 2012-07-09 2017-03-01 Technion Research & Development Foundation Limited Natural machine interface system
US9840008B2 (en) * 2013-03-19 2017-12-12 Panasonic Intellectual Property Management Co., Ltd. Robot system control method and robot system
US10112303B2 (en) * 2013-10-25 2018-10-30 Aleksandar Vakanski Image-based trajectory robot programming planning approach
JP6201126B2 (ja) * 2013-11-07 2017-09-27 株式会社人機一体 マスタスレーブシステム
US10248085B2 (en) * 2016-10-13 2019-04-02 Disney Enterprises, Inc. Computational design of robots from high-level task specifications
US11207773B2 (en) * 2016-11-07 2021-12-28 Soinn Inc. Action transfer device, action transfer method, and non-transitory computer-readable medium storing action transfer program

Also Published As

Publication number Publication date
US20170326727A1 (en) 2017-11-16
JP2016107346A (ja) 2016-06-20
EP3228427B1 (en) 2020-07-22
US10265847B2 (en) 2019-04-23
EP3228427A1 (en) 2017-10-11
WO2016088367A1 (ja) 2016-06-09
EP3228427A4 (en) 2018-09-26

Similar Documents

Publication Publication Date Title
Chebotar et al. Closing the sim-to-real loop: Adapting simulation randomization with real world experience
JP6550605B2 (ja) 動作の転移装置、動作の転移方法及びプログラム
JP7295421B2 (ja) 制御装置及び制御方法
Gao et al. Optimal trajectory planning for robotic manipulators using improved teaching-learning-based optimization algorithm
Nikandrova et al. Towards informative sensor-based grasp planning
JP2022176917A (ja) ロボットデバイスを制御するための方法
Sturm et al. Unsupervised body scheme learning through self-perception
JP6518982B2 (ja) 動作転移装置、動作転移方法及び動作転移プログラムが格納された非一時的なコンピュータ可読媒体
Das et al. A modified real time A* algorithm and its performance analysis for improved path planning of mobile robot
JP7263987B2 (ja) 制御装置、制御方法、及び制御プログラム
WO2021033471A1 (ja) 制御装置、制御方法、及び制御プログラム
Beik Mohammadi et al. Mixed-reality deep reinforcement learning for a reach-to-grasp task
EP2359989B1 (en) Robot control with bootstrapping inverse kinematics
Liu et al. Research on motion planning of seven degree of freedom manipulator based on DDPG
Chanrungmaneekul et al. Non-Parametric Self-Identification and Model Predictive Control of Dexterous In-Hand Manipulation
Daniel et al. Multi Actor-Critic DDPG for Robot Action Space Decomposition: A Framework to Control Large 3D Deformation of Soft Linear Objects
Mishani et al. Learning configurations of wires for real-time shape estimation and manipulation planning
WO2021033472A1 (ja) 制御装置、制御方法、及び制御プログラム
Li et al. An image-based visual servo system to operate a flexible wire
Mishani DUAL-ARM ROBOTIC MANIPULATION OF WIRES USING SOLELY FORCE/TORQUE FEEDBACK
Guzman Robotic Embodiment of Human-Like Motor Skills via Sim-to-Real Reinforcement Learning
Yu et al. Generalizable whole-body global manipulation of deformable linear objects by dual-arm robot in 3-D constrained environments
Wang et al. Reinforcement Learning based End-to-End Control of Bimanual Robotic Coordination
Li Implementation of motion-mapping algorithms on a teleoperation humanoid mechanical arm system during the COVID-19
Wang et al. Posture error correction of a six-DOF serial manipulator based on genetic algorithms

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20161020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20161020

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190405

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190507

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20190605

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20190605

R150 Certificate of patent or registration of utility model

Ref document number: 6550605

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250