JP2010179454A - ロボット装置におけるスキーマの学習と使用 - Google Patents
ロボット装置におけるスキーマの学習と使用 Download PDFInfo
- Publication number
- JP2010179454A JP2010179454A JP2009287375A JP2009287375A JP2010179454A JP 2010179454 A JP2010179454 A JP 2010179454A JP 2009287375 A JP2009287375 A JP 2009287375A JP 2009287375 A JP2009287375 A JP 2009287375A JP 2010179454 A JP2010179454 A JP 2010179454A
- Authority
- JP
- Japan
- Prior art keywords
- schema
- robot controller
- controller according
- model
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001953 sensory effect Effects 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 31
- 238000013528 artificial neural network Methods 0.000 claims description 19
- 230000000306 recurrent effect Effects 0.000 claims description 7
- 230000001537 neural effect Effects 0.000 claims description 5
- 230000009471 action Effects 0.000 claims description 4
- 230000000877 morphologic effect Effects 0.000 claims description 2
- 230000003542 behavioural effect Effects 0.000 claims 1
- 230000006399 behavior Effects 0.000 abstract description 52
- 238000000034 method Methods 0.000 abstract description 20
- 230000000694 effects Effects 0.000 description 20
- 230000002441 reversible effect Effects 0.000 description 15
- 238000000354 decomposition reaction Methods 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 8
- 230000003213 activating effect Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 238000013507 mapping Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000005587 bubbling Effects 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000004936 stimulating effect Effects 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000000946 synaptic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/161—Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/33—Director till display
- G05B2219/33025—Recurrent artificial neural network
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/33—Director till display
- G05B2219/33051—BBC behavior based control, stand alone module, cognitive, independent agent
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/39—Robotics, robotics to robotics hand
- G05B2219/39285—From database find strategy and select corresponding neural servo controller
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/39—Robotics, robotics to robotics hand
- G05B2219/39376—Hierarchical, learning, recognition and skill level and adaptation servo level
Landscapes
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Fuzzy Systems (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Feedback Control In General (AREA)
- Manipulator (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
【解決手段】スキーマを使用し、該スキーマは、ロボットが設定されたゴールを達成するようにするための、パラメータで表した運動指令の系列の集合であって、該系列のためのパラメータは、該ロボットコントローラの状態変数から得られ、該ロボットコントローラへ知覚入力を供給するためのインタフェースと、スキーマ認識モジュールからの入力、または逆方向モデルモジュールからの入力、またはそれらの組み合わせを供給されるスキーマ状態メモリと、状態変数及び格納されたスキーマに基づいて、運動指令を生成する逆方向モデルと、状態変数及び格納されたスキーマに基づいて、状態変数を予測する順方向モデルと、該ロボットコントローラによって制御された該ロボットの、供給された状態変数に基づいてスキーマを選択するスキーマ認識モジュールと、を備えた。
【選択図】図1
Description
該ロボットコントローラへ知覚入力を供給するためのインタフェースと、
スキーマ認識モジュール(4)からの入力、または逆方向モデルモジュール(2)からの入力、またはそれらの組み合わせを供給されるスキーマ状態メモリ(1)と、
状態変数及び格納されたスキーマに基づいて、運動指令を生成する逆方向モデルモジュール(2)と、
状態変数及び格納されたスキーマに基づいて、状態変数を予測する順方向モデルモジュール(3)と、
該ロボットコントローラによって制御された該ロボットの、供給された状態変数に基づいてスキーマを選択するスキーマ認識モジュールと、を備える。
ロボット装置と物理的な世界との間の相互作用のための規則(「スキーマ」)は、経験における規則性を記述する認識構造である。スキーマは、ロボット装置の知識の構成のために役立ち、ロボット装置がその環境をどのように見て解釈するかを規定する。スキーマは、階層的に構成されており、それによって、全ての抽象レベルにおける知識を表す。階層の最も低いレベルにおけるスキーマは、ロボット装置がその環境と相互作用を行う際に観察する、空間・時間運動パターンを記述する必要がある。それに関して、知覚運動パターンという用語は、運動指令及び状態変数の値を指す。このように、スキーマは、事象の連続的な流れを、一時的なまとまりに分ける。
本発明によるスキーマは、ロボット装置の一般的な挙動を記述する。この理由により、両方の用語は、交換して使用される。一般的な挙動は、その適用が結果として特定の状況に至れば、意味のある情報を保持するので、スキーマは、そのような一般的な挙動の適用が必然的に伴うゴールによって特徴付けられる。そのため、一般的なという用語は、種々の状況において挙動を適用することができるが、常に、そのゴールに対応する状況をもたらすという事実を指す。たとえば、「手を見つめる」というスキーマは、ロボット装置が、中心窩、すなわち、カメラの入力視野の中心においてその手を見るという状況をもたらす。しかし、そのスキーマを適用する際に、ロボット装置が観察する、空間・時間知覚運動パターンは、(たとえば、最初の見つめる状態、すなわち、カメラの入力視野位置、及びロボットの手の位置などによって)大幅に異なるかもしれない。このように、スキーマは、種々の背景に対して、どのようにして単一の平衡ポイントに到達するかについて記述する、汎用のアトラクター・ダイナミックのコンパクトな表現である。そのため、ダイナミックの平衡ポイントは、スキーマのゴールを表す。
ロボット装置の仕事は、目的に到達することであると仮定する。ロボット装置は、所定の関節を有するモータ駆動アームと2個の可動カメラを有する頭部とを備える。カメラは、外部知覚入力のためのセンサを表し、また、モータによって駆動される。
カメラを指示するロボットの頭部の関節角度
カメラ(目を中心とする)座標における目標の位置
カメラからの目標の距離(目標を固視したときの目の関節角度から得ることができる)
カメラ(目を中心とする)座標における目標と手との間の距離
さらに、ロボットの制御ユニットには、以下のスキーマが格納されている(たとえば、予め設定されるか先行する学習ステップによって獲得される)。
そのゴールは、目標を見つめ、カメラで目標を固視することである「目標を見つめる」
それぞれが所定の位置を見つめるというゴールを有する、多数の「位置XYを見つめる」スキーマ
そのゴールは、ロボットが見つめる位置に到達することである「見つめるところへ到達する」
それぞれが空間における所定の3次元位置へ到達するというゴールを有する、多数の「位置XYZへ到達する」スキーマ
以下において、目標へ到達するために、ロボットがそのスキーマと提案されるシステムをどのように使用するかを説明する。従って、図6は、スキーマの状態(たとえば、0は非アクティブであり、1はアクティブである)の時間的な展開を示し、さらに、以下に詳細に説明する基本事象(a−f)を表示する。
以前に記したように、本発明は、また、フレームワークの特定の実施例を提案する。スキーマシステムの提案される実施例は、スキーマの間の階層的な依存性を含まない。したがって、ここで提示されるシステムは、「例」において説明した全ての機能は含まない。しかし、提案される実施例は、全ての機能を含むように容易に拡張することができる。むしろ、この仕事は、低いレベルのスキーマのオンライン学習、及び整合したフレームワークにおける種々の処理原理の組み入れに焦点を当てている。図7は、提案される実施例のシステムを示す図である。以下において、種々のコンポーネントをより詳細に説明する。
適用される原理の一つは、ポピュレーションコーディングの原理である。より正確には、2次元マップに分散したユニットがスキーマを表す。さらに、このマップ内の活動が、多数の同時にアクティブなスキーマをコード化する。そのときフレームワークが達成すべきことは、知覚運動パターン系列からスキーマへのトポロジー保存マッピングを学習することである。換言すれば、スキーマは、隣接するユニットが同様の挙動を表し、それとともに、同様のゴールに対して機能するように、形態学的に構成する必要がある。
式(1)によれば、ハイパーネットワークは、基底関数活動の重み付けられた組み合わせ及びバイアスbによって多変数関数f(z)を近似する。そこで、基底関数の中心ξiおよび重み付けマトリクスを組み入れる、式(2)における重み付けられたノルムは、アクティブ化関数として機能し、動径関数Gは、基底関数活動を計算する。ここで、Gは式(3)に従って選択される。
pi=(pi x,pi y)Tがグリッドインデクスiにおけるスキーママップユニットの位置であるとする。さらに、Ii(t)が時刻におけるそのユニットの入力であるとする。ユニットの活動を確実にするために、式(4)にしたがって、最初に入力にシグモイド関数を適用する。
z(t)は、HyperBFネットワーク(順方向モデルまたは逆方向モデル)への入力であるとする。上記入力は、スキーママップのピーク位置s(t)および他の入力i(t)からなる。ポピュレーション読み取りメカニズムが時刻tにおけるM個のピークをもたらすと仮定すると、ピーク位置の集合は、S(t)={s1(t), s2(t), …, sM(t)}である。そこで、式(10)にしたがって、時刻tにおける入力の集合Z(t)を定義する。さらに、式(11)にしたがって、時刻tにおけるハイパー基底関数jの活動Gj(t)を定義する。
順方向モデル、逆方向モデル及びスキーマ認識部のパラメータを学習するために、ロボット装置は、知覚運動パターンのストリームを観察すると仮定する。このようなストリームは、初期の運動バブリングフェーズの間に、または直接のガイダンスによって生成されてもよい。
提案したフレームワークをテストするために、予め定めたコントローラC(χ,x)を使用して、知覚運動パターンを生成した。上記コントローラは、目標値χ=( χ1,χ2)Tが達成されるように、式(1)にしたがって、状態変数x=(x1,x2)Tの値を動的に変化させる。目標値は、間隔[0,10]2からランダムに選択され、コントローラへ供給される。それに関して、
ポピュレーション読み取りメカニズムがニューラルマップにおいて適用されるコントローラ。ポピュレーション読み取りメカニズムは、滑らかな局所化ピークを生成し、ニューラルマップにおいてその位置を抽出する。
Claims (20)
- スキーマを使用するロボットコントローラであって、該スキーマは、ロボットが設定されたゴールを達成するようにするための、パラメータで表した運動指令の系列の集合であって、該系列のためのパラメータは、該ロボットコントローラの状態変数から得られ、
該ロボットコントローラへ知覚入力を供給するためのインタフェースと、
スキーマ認識モジュール(4)からの入力、または逆方向モデルモジュール(2)からの入力、またはそれらの組み合わせを供給されるスキーマ状態メモリ(1)と、
状態変数及び格納されたスキーマに基づいて、運動指令を生成する逆方向モデルモジュール(2)と、
状態変数及び格納されたスキーマに基づいて、状態変数を予測する順方向モデルモジュール(3)と、
該ロボットコントローラによって制御された該ロボットの、供給された状態変数に基づいてスキーマを選択するスキーマ認識モジュールと、を備えたロボットコントローラ。 - 該順方向モデル、該逆方向モデル、及び該スキーマ認識モジュールへの入力として、現在知覚されている状態変数値及び予測される状態変数値の使用を切り替えることができるようにする、追加の切り替えモジュールをさらに備えた、請求項1に記載のロボットコントローラ。
- 該順方向モデルが、状態変数の現在値及びスキーマの現在の状態によって、状態変数の将来値を予測する、請求項1または2に記載のロボットコントローラ。
- 該順方向モデルが、状態変数の現在値及びスキーマの現在の状態によって、状態変数の導関数を予測する、請求項1または2に記載のロボットコントローラ。
- 該順方向モデルが、リカレントニューラルネットワークを使用して実現される、請求項3または4に記載のロボットコントローラ。
- 該順方向モデルが、時間遅れニューラルネットワークを使用して実現される、請求項3または4に記載のロボットコントローラ。
- 該ニューラルネットワークが、その中間層の表現として動径基底関数またはハイパー基底関数を使用する、請求項5または6に記載のロボットコントローラ。
- 該逆方向モデルが、状態変数の現在値及びスキーマの現在の状態によって、現在アクティブなスキーマのアトラクター・ダイナミックスを生成する行動を選択する、請求項1または2に記載のロボットコントローラ。
- 該逆方向モデルが、状態変数の現在値及びスキーマの現在の状態によって、現在アクティブなスキーマのアトラクター・ダイナミックスを生成する行動導関数を選択する、請求項1または2に記載のロボットコントローラ。
- 該逆方向モデルが、リカレントニューラルネットワークを使用して実現される、請求項8または9に記載のロボットコントローラ。
- 該逆方向モデルが、時間遅れニューラルネットワークを使用して実現される、請求項8または9に記載のロボットコントローラ。
- 該逆方向モデルが、フィードフォワードニューラルネットワークを使用して実現される、請求項8または9に記載のロボットコントローラ。
- 該ニューラルネットワークが、その中間層の表現として動径基底関数またはハイパー基底関数を使用する、請求項10乃至12のいずれかに記載のロボットコントローラ。
- 順方向モデル及び逆方向モデルが、単一のモジュールに組み合わされている請求項3乃至13のいずれかに記載のロボットコントローラ。
- スキーマの認識が、状態変数の現在値及びその履歴を使用して行われる請求項1または2に記載のロボットコントローラ。
- スキーマの認識が、リカレントニューラルネットワークを使用して行われる請求項15に記載のロボットコントローラ。
- スキーマの認識が、時間遅れニューラルネットワークを使用して行われる請求項15に記載のロボットコントローラ。
- 該ニューラルネットワークが、その中間層の表現として動径基底関数またはハイパー基底関数を使用する、請求項16または17に記載のロボットコントローラ。
- スキーマ状態のメモリ構造が、多次元グリッド上に分布したユニットから攻勢されるニューラルマップである請求項1または2に記載のロボットコントローラ。
- 該ニューラルマップは、形態学的な構成、すなわち、近傍のスキーマは同様のアトラクター・ダイナミックスを表すことを特徴とする請求項19に記載のロボットコントローラ。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP09001710A EP2216145B1 (en) | 2009-02-06 | 2009-02-06 | Learning and use of schemata in robotic devices |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010179454A true JP2010179454A (ja) | 2010-08-19 |
JP2010179454A5 JP2010179454A5 (ja) | 2012-07-26 |
Family
ID=40793656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009287375A Pending JP2010179454A (ja) | 2009-02-06 | 2009-12-18 | ロボット装置におけるスキーマの学習と使用 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8332070B2 (ja) |
EP (1) | EP2216145B1 (ja) |
JP (1) | JP2010179454A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021030393A (ja) * | 2019-08-28 | 2021-03-01 | 株式会社DailyColor | ロボット制御装置 |
JP2021030433A (ja) * | 2020-07-21 | 2021-03-01 | 株式会社DailyColor | ロボット制御装置 |
WO2021039995A1 (ja) * | 2019-08-28 | 2021-03-04 | 株式会社DailyColor | ロボット制御装置 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120011078A1 (en) * | 2010-07-06 | 2012-01-12 | International Business Machines Corporation | Developing Business Process Models That Are Aligned With Business Components And Business Intent |
US8775341B1 (en) | 2010-10-26 | 2014-07-08 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
US9015093B1 (en) | 2010-10-26 | 2015-04-21 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
US10552734B2 (en) | 2014-02-21 | 2020-02-04 | Qualcomm Incorporated | Dynamic spatial target selection |
US10166680B2 (en) * | 2015-07-31 | 2019-01-01 | Heinz Hemken | Autonomous robot using data captured from a living subject |
JP7207207B2 (ja) * | 2019-07-09 | 2023-01-18 | トヨタ自動車株式会社 | 演算装置、機械学習方法及び制御プログラム |
CN116079730B (zh) * | 2023-02-06 | 2024-06-25 | 北京大学 | 一种提升机器人手臂操作精度的控制方法及系统 |
CN116300410B (zh) * | 2023-05-25 | 2023-08-22 | 武汉理工大学 | 数据驱动前馈加反馈补偿的转角优化方法及系统 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6031549A (en) * | 1995-07-19 | 2000-02-29 | Extempo Systems, Inc. | System and method for directed improvisation by computer controlled characters |
JPH10289006A (ja) * | 1997-04-11 | 1998-10-27 | Yamaha Motor Co Ltd | 疑似感情を用いた制御対象の制御方法 |
JP3086206B2 (ja) * | 1998-07-17 | 2000-09-11 | 科学技術振興事業団 | エージェント学習装置 |
US6295602B1 (en) * | 1998-12-30 | 2001-09-25 | Spyrus, Inc. | Event-driven serialization of access to shared resources |
US6347261B1 (en) * | 1999-08-04 | 2002-02-12 | Yamaha Hatsudoki Kabushiki Kaisha | User-machine interface system for enhanced interaction |
US6587846B1 (en) * | 1999-10-01 | 2003-07-01 | Lamuth John E. | Inductive inference affective language analyzer simulating artificial intelligence |
US6490501B1 (en) * | 1999-10-06 | 2002-12-03 | Bell Helicopter Textron Inc. | Cure monitoring and control system |
JP2001260063A (ja) * | 2000-03-21 | 2001-09-25 | Sony Corp | 多関節型ロボット及びその動作制御方法 |
FR2811449B1 (fr) * | 2000-07-05 | 2008-10-10 | Mathematiques Appliquees S A | Systeme automatique pour la prise de decision par un agent virtuel ou physique |
JP2002036158A (ja) * | 2000-07-27 | 2002-02-05 | Yamaha Motor Co Ltd | 自律機能を有する電子機器 |
KR100624403B1 (ko) * | 2001-10-06 | 2006-09-15 | 삼성전자주식회사 | 인체의 신경계 기반 정서 합성 장치 및 방법 |
US7324980B2 (en) | 2002-05-10 | 2008-01-29 | Sony Corporation | Information processing apparatus and method |
JP2004268235A (ja) * | 2003-03-11 | 2004-09-30 | Sony Corp | ロボット装置、その行動制御方法及びプログラム |
JP4773680B2 (ja) | 2003-08-07 | 2011-09-14 | ソニー株式会社 | 情報処理装置および方法、プログラム記録媒体、並びにプログラム |
-
2009
- 2009-02-06 EP EP09001710A patent/EP2216145B1/en not_active Ceased
- 2009-11-17 US US12/619,840 patent/US8332070B2/en not_active Expired - Fee Related
- 2009-12-18 JP JP2009287375A patent/JP2010179454A/ja active Pending
Non-Patent Citations (6)
Title |
---|
CSNG200400013017; 鮫島 和行 Kazuyuki SAMEJIMA: '複数の予測モデルを用いた強化学習による非線形制御 Multiple Model-Based Reinforcement Learning of Non' 電子情報通信学会論文誌 (J84-D-II) 第9号 THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONI 第J84-D-II巻, 社団法人電子情報通信学会 THE INSTITUTE OF ELECTRO * |
CSNG200400359009; 鮫島 和行 Kazuyuki SAMEJIMA: 'モジュール競合による運動パターンのシンボル化と見まね学習 Symbolization and Imitation Learning of Mo' 電子情報通信学会論文誌 (J85-D-II) 第1号 THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONI 第J85-D-II巻, 社団法人電子情報通信学会 THE INSTITUTE OF ELECTRO * |
JPN6012008624; Jun Tani, Ryunosuke Nishimoto, Rainer W. Paine: 'Achieving "organic compositionality" through self-organization: Reviews on brain-inspired robotics' Neural Networks Volume 21, Issue 4, 20080504, pp. 584-603 * |
JPN6012008625; 鮫島 和行 Kazuyuki SAMEJIMA: '複数の予測モデルを用いた強化学習による非線形制御 Multiple Model-Based Reinforcement Learning of Non' 電子情報通信学会論文誌 (J84-D-II) 第9号 THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONI 第J84-D-II巻, 社団法人電子情報通信学会 THE INSTITUTE OF ELECTRO * |
JPN6012008626; 鮫島 和行 Kazuyuki SAMEJIMA: 'モジュール競合による運動パターンのシンボル化と見まね学習 Symbolization and Imitation Learning of Mo' 電子情報通信学会論文誌 (J85-D-II) 第1号 THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONI 第J85-D-II巻, 社団法人電子情報通信学会 THE INSTITUTE OF ELECTRO * |
JPN6012008627; Mathieu Bertin, Nicolas Schweighofer, Kenji Doya: 'Multiple model-based reinforcement learning explains dopamine neuronal activity' Neural Networks Vol. 20, 2007, pp. 668-675 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021030393A (ja) * | 2019-08-28 | 2021-03-01 | 株式会社DailyColor | ロボット制御装置 |
WO2021039995A1 (ja) * | 2019-08-28 | 2021-03-04 | 株式会社DailyColor | ロボット制御装置 |
GB2600843A (en) * | 2019-08-28 | 2022-05-11 | Daily Color Inc | Robot control device |
GB2600843B (en) * | 2019-08-28 | 2022-11-09 | Daily Color Inc | Robot control device |
US11511414B2 (en) | 2019-08-28 | 2022-11-29 | Daily Color Inc. | Robot control device |
JP2021030433A (ja) * | 2020-07-21 | 2021-03-01 | 株式会社DailyColor | ロボット制御装置 |
Also Published As
Publication number | Publication date |
---|---|
US20100249999A1 (en) | 2010-09-30 |
EP2216145A1 (en) | 2010-08-11 |
US8332070B2 (en) | 2012-12-11 |
EP2216145B1 (en) | 2011-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2010179454A (ja) | ロボット装置におけるスキーマの学習と使用 | |
Chebotar et al. | Path integral guided policy search | |
Bekey et al. | Neural networks in robotics | |
CN111144580B (zh) | 一种基于模仿学习的层级强化学习训练方法和装置 | |
CN114423574B (zh) | 确定针对机器人任务的环境调节的动作序列 | |
JP2010179454A5 (ja) | ||
WO2020065001A1 (en) | Learning motor primitives and training a machine learning system using a linear-feedback-stabilized policy | |
Kawamura et al. | Implementation of cognitive control for a humanoid robot | |
Leconte et al. | Design and integration of a spatio-temporal memory with emotional influences to categorize and recall the experiences of an autonomous mobile robot | |
Jin et al. | Task learning, intent prediction, and adaptive blended shared control with application to excavators | |
Burgsteiner | Training networks of biological realistic spiking neurons for real-time robot control | |
Arie et al. | Imitating others by composition of primitive actions: A neuro-dynamic model | |
Ahmadi et al. | How can a recurrent neurodynamic predictive coding model cope with fluctuation in temporal patterns? Robotic experiments on imitative interaction | |
Zhu et al. | A distributed and parallel control mechanism for self-reconfiguration of modular robots using L-systems and cellular automata | |
Salehzadeh et al. | Purposeful Communication in Human–Robot Collaboration: A Review of Modern Approaches in Manufacturing | |
Sheikh et al. | A comparison of various robotic control architectures for autonomous navigation of mobile robots | |
Kargin et al. | A reinforcement learning approach for continuum robot control | |
Ogata et al. | Open-end human–robot interaction from the dynamical systems perspective: mutual adaptation and incremental learning | |
Arie et al. | Creating novel goal-directed actions at criticality: A neuro-robotic experiment | |
Saxena et al. | Advancement of industrial automation in integration with robotics | |
Gonçalves et al. | Defining behaviors for autonomous agents based on local perception and smart objects | |
Pan et al. | Realtime planning for high-dof deformable bodies using two-stage learning | |
Antonelo et al. | Modeling multiple autonomous robot behaviors and behavior switching with a single reservoir computing network | |
Zhang et al. | A Review on Robot Manipulation Methods in Human-Robot Interactions | |
Koshelev et al. | Intelligent control of mobile robot with redundant manipulator & stereovision: quantum/soft computing toolkit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120221 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120521 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120524 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120605 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20120605 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20121218 |