JP2008000883A - ロボットの対話型挙動の制御 - Google Patents

ロボットの対話型挙動の制御 Download PDF

Info

Publication number
JP2008000883A
JP2008000883A JP2007134071A JP2007134071A JP2008000883A JP 2008000883 A JP2008000883 A JP 2008000883A JP 2007134071 A JP2007134071 A JP 2007134071A JP 2007134071 A JP2007134071 A JP 2007134071A JP 2008000883 A JP2008000883 A JP 2008000883A
Authority
JP
Japan
Prior art keywords
mechanical system
simulation
robot
simulated
goal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007134071A
Other languages
English (en)
Inventor
Michael Gienger
ミヒャエル・ギンガー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Research Institute Europe GmbH
Original Assignee
Honda Research Institute Europe GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Research Institute Europe GmbH filed Critical Honda Research Institute Europe GmbH
Publication of JP2008000883A publication Critical patent/JP2008000883A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1671Programme controls characterised by programming, planning systems for manipulators characterised by simulation, either to verify existing program or to create and verify new program, CAD/CAM oriented, graphic oriented programming systems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1674Programme controls characterised by safety, monitoring, diagnostic
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S901/00Robots
    • Y10S901/14Arm movement, spatial
    • Y10S901/16Cartesian, three degrees of freedom

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Manipulator (AREA)
  • Feedback Control In General (AREA)

Abstract

【課題】ロボットの対話型挙動の制御を提供すること。
【解決手段】挙動の目標をセレクタ・ユニットに定義し、セレクタ・ユニットが目標に到達するための複数の挙動命令をそれぞれ発生させ、各々の命令に対して、前記機械的システムの対応する結果として得られる動作を、機械的システムの一体化した部分であるコンピューティング・ユニットによって、内部的にシミュレートする。シミュレートされた結果として得られた動作の各々の適応度を、少なくとも1つの目的に関して評価し、最高の適応度値を有するシミュレートされた動作が得られた命令を、機械的システムの物理的アクチュエータに送り、知能的機械的システムの挙動を制御し、複数の自由度からなる異なる動作挙動を行うことができる。
【選択図】図1

Description

本発明は、動的環境に応答してロボットの反応を計算し制御する技術に関する。
この技術は、例えば動的な対話(interaction)を要する協働的な物品の引渡し、または任意の他の協働的なタスクのようなシステムと動的な対話を作り出すために、例えば使用することができる。しかしながら、本発明は、制御理論の分野に限定されず、他の機械的システムにも適用することができる。
例えばロボットなどの機械的システムの、その環境との対話を改善することが本発明の目的である。
この目的は、独立請求項の特徴を用いて達成することができる。従属請求項は、さらに本発明の中心的着想を発展させる。
本発明の第1の態様は、それぞれ複数の自由度からなる異なる動作挙動を行うことができる、例えばロボットなどの知能的機械的システム(intelligent mechanical system)の挙動(behaviour)を制御する方法に関し、この方法は以下のステップを含む:
− 挙動のための目標をセレクタ・ユニットに定義するステップ、
− セレクタ・ユニットが、定義された目標にそれぞれ到達するようになされた複数の挙動命令を発生させるステップ、
− 各々の命令に対して、前記機械的システムの対応する結果として得られる(複数の)動作を、前記機械的システムの一体化した部分であるコンピューティング・ユニットによって、内部的(internally)にシミュレートするステップと、
− シミュレートされた結果として得られる動作の各々の適応度を、少なくとも1つの目的に関して評価するステップ、および
− 最高の適応度値を有するシミュレートされた動作が得られる命令を機械的システムの物理的アクチュエータに送るステップ。
「内部的にシミュレートする」は、例えば一体化されたコンピューティング・ユニットを使用して機械的システムが自立的に異なる案をシミュレートすることであると理解されるべきである。
この機械的システムは、自立的ロボットであることができる。
目標は、この機械的システムの視覚システムによって発生させることができる。
シミュレーションは、逆運動学(inverse kinematics)または逆動力学(inverse dynamics)手法を使用して行われる。
適応度(fitness)は、費用関数(cost function)を使用して計算することができる。
内部シミュレーション処理速度は、下位の機械的システムの機械的応答時間より早く設定することができる。
処理ステップは、反復方法で行うことができる。
シミュレーションは、自己コリジョン検出、自己コリジョン回避および/または外部オブジェクトの回避を含むことができる。
シミュレーションは、動作の運動学的シミュレーションまたはシステムの動きおよび力の対話を考慮する動力学的シミュレーションである。
本発明は、そのような方法を実施するように設計される制御器にも関する。
本発明はそのような制御器を有するロボットにも関する。
最後に本発明は、コンピュータ装置上で実行するとき、添付の請求項のいずれかに記載の方法を実施するコンピュータ・ソフトウェア製品にも関する。
本発明の別の特徴、態様および目的は、添付の図面の図と共に行われる実施形態の添付の詳細な説明を読むとき、技術者に明らかになるであろう。
本発明は、それぞれ複数の自由度を含む、異なる動作挙動を行うことができるロボットなどの知能的機械的システムを提案する。
「知能的(intelligent)」は、高レベルの命令を処理し、これらの命令に応答して機械的システムの物理的挙動を制御することができるコンピューティング・ユニットが装備されるシステムを意味し、(環境に関連する)高レベル命令に応答する挙動は対話型挙動(interactive behaviour)を示す。
この機械的システムは、挙動を「切り換える(switch)」、すなわち挙動の任意選択肢の中から選択するように設計される。現実面で(かつ内部シミュレーションでのみではなく)実際に行われるこの物理的な挙動の選択は、例えば図1に示すような内部シミュレーション・アーキテクチャに基づいて行うことができる。図1に示すように、高レベルのタスクから結果として発生する高レベル命令は、選択インスタンス(セレクタ(selector))に送られる。ここで、高レベルのタスクとは、例えばロボットの視覚システムまたは他の(例えば音響的)検知システムによって処理され決められる目標などである。この目標は抽象的な形態を有することができ、必ずしもロボット特有の目標記述に対応する必要はない。
この高レベルのタスクは、ロボット自体によって(例えば物体認識を介して)、およびロボットに外部命令を供給することによっての一方または両方によって発生させることができる。
第2のステップで、この高レベル目標はセレクタによって処理される。この機構は抽象的な目標から異なる命令cmd1、cmd2、...を発生させる。個々の命令の各々は、高レベル目標を達成できるように発生させられる。これらの命令cmd1、cmd2、...は、下位にあるロボットまたは他の機械的システムによって多次元の自由度で物理的に制御できる制御入力に対応する。発生する命令cmd1、cmd2、...の数に関して上限はない。
第3のステップで、各々の個々の命令は下位ロボット/システムの内部シミュレーション機構に渡される。この内部シミュレーションはこの命令を受け取り、ロボット/システムのそれぞれの動作を計算することを介してシミュレートする。ロボット制御では、これは例えば「逆運動学」または「逆動力学」の方法で行うことができる。
さらなるステップでは次いで、この内部シミュレーションはシミュレートされた動作を評価するが、そこではそれは異なる目的(速度、消費されるリソースを最適化する、等)を示す費用関数を使用してある値を計算する。この値は、「適応度値(fitness value)」と呼ぶこともできる。
「費用関数」および「適応度値」は、最適化の分野ではよく認知された術語である。
この費用関数値は、所与の対話型シナリオによって変わる。どのようにそのような費用関数をもたらすことができるかの考え得る例が以下の実施例で与えられる。次のステップでは、個々の内部シミュレーション・インスタンスの各々がその費用値(cost value)を選択機構に通信して戻す。選択機構は次に、例えば適応度値に「勝者がすべてを得る(winner takes all)」戦略を適用することによって、特定の状況に対して最も適切なシミュレーションを選ぶ。次に選ばれたシミュレーション・インスタンスの命令が物理的なロボット/システムに送られる。
以下の点が強調されるべきである。
・ 内部シミュレーションの処理速度はリアルタイムより高い場合がある。これは、内部シミュレーション・インスタンスが、物理的なロボットがそのような状態に達してしまう前に戦略が適切か否かを決めることができることを意味する。これは「内部予測(internal prediction)」能力と命名することができる。
・ 提示された方法は、反復ステップで働くことができる。これは、セレクタ、シミュレーションおよび現実のロボット/システムの間のループが非常に短い時間間隔(例えば1ミリ秒)内でアップデートされることを意味する。これによってこの方法は、変化が現行の「高レベル命令」に反映されるであろうから、変化する環境に迅速に反応できるようになる。したがってロボットの挙動は、進行中のタスクの実行中にアップデートすることができる。
・ この内部シミュレーションはロボット制御器の完全なシミュレーションを含む。これは、自己コリジョン検出、自己コリジョン回避および外部オブジェクトの回避のための方法も含むことができる。
・ このシミュレーションは、(動作のみを考慮する)運動学的シミュレーションまたは(システムの力の対話も考慮する)動力学的シミュレーションであることができる。
ロボットが人間の手から物体を取るとする。人間はその物体を保持し、かつ適宜移動させることができる。「高レベル命令」は、例えばカメラ・システムによって抽出されるその物体の座標であろう。次に選択機構は図2に示すように以下の命令分離を行うことができた。
・ 物体の座標を左手に割り当てる、静止して立つ(選択肢1)
・ 物体の座標を右手に割り当てる、静止して立つ(選択肢2)
・ 物体の座標を左手に割り当てる、歩く(選択肢3)
・ 物体の座標を右手に割り当てる、歩く(選択肢4)
次に各シミュレーションが評価される。最も適切な戦略の選択は多基準費用関数(multi−criteria cost function)(適応度関数も)に基づいている。これを示すために、人間の手から物体を握らなければならないロボットが想定されている。したがって、「物体を握っている」が高レベル命令である。
この例では、費用関数が以下の発見的方法を符号化する:立っていることが歩くことより、歩くことは何もしないことより好ましい。このために、以下の判定基準が適応度関数に組み込まれる:
・ 目標の到達可能性
目標に到達できない場合、高いペナルティが費用関数に加えられる。これは結果としてこの戦略は選択されないであろうことになる。
・ 姿勢の不快さ
関節の中心位置に対する、関節の重み付け最小二乗距離(weighted least squares)が、「不快(discomfort)」ペナルティを規定する。目標は1つの側からもう1つの側に移動するときはいつでも、このペナルティはシステムを伸ばす腕に切り換えさせる。
・ 「怠惰(Laziness)」
歩くことより立っていることの方が選ばれるように、歩く戦略の両方は一定のペナルティを受ける。
・ 目標までの時間
このペナルティは歩く戦略に加えられる。それは目標までの推測時間の尺度であり、その結果目標に最も効率的に到達することができる。このペナルティはロボットに、ロボットを最小の歩数を有する姿勢に向かわせる戦略を選択するようにさせる。
この実施例は簡単に見えるが、一般的な考え方はより進んだ決定機構を組み込み、任意の複雑な判断基準を策定することを可能にする。この新生ロボットの挙動は非常に興味深い(進行を示す図2を参照):
− 物体を左から右に移動させるとき、ロボットは最初(図2の最初の期間)に右手でそれに到達しようと試み、次いで動的に左手に切り換える(第2の期間)。
− 物体が到達圏外にある場合、ロボットは歩き始め物体を追跡する(図2の第3の期間)。
− 図2の第3の期間に、ロボットは歩き、同時に左手で物体に到達しようと試みる。
− 図2の第4の期間に、ロボットは歩き、同時に右手で物体に到達しようと試みる。
図2は、最初から最後までの時間にわたる4つの費用関数の展開を示す。最低値を有する費用関数が最良であるとみなされる。それぞれの戦略が動作中である期間が時間軸の下で示されている。
図2から、高レベル命令を実施しようと試みている間、この内部シミュレーションは、この高レベル・タスクの遂行の現行の進行状況の見地から最良の挙動案を反復して計算しつづける。
以下の点に留意すべきである:上記で述べた方法で内部シミュレーションを使用する提案された選択機構は、他のロボットまたはシステムにも適用することができる。
ロボットの対話型挙動を制御するための線図である。 時間に対する4つのシミュレーション・インスタンスの適応度関数の進行の図である。

Claims (12)

  1. それぞれ複数の自由度からなる異なる動作挙動を行うことができる、知能的機械的システムの挙動を制御するための方法であって、前記方法が、
    挙動の目標をセレクタ・ユニットに定義するステップと、
    前記セレクタ・ユニットが、前記定義された目標に到達するための複数の挙動命令をそれぞれ発生させるステップと、
    各々の命令に対して、前記機械的システムの対応する結果として得られる動作を、前記機械的システムの一体化した部分であるコンピューティング・ユニットによって、内部的にシミュレートするステップと、
    シミュレートされた結果として得られた動作の各々の適応度を、少なくとも1つの目的に関して評価するステップと、
    最高の適応度値を有するシミュレートされた動作が得られた前記命令を、前記機械的システムの物理的アクチュエータに送るステップと
    を含む方法。
  2. 前記機械的システムが自立的ロボットである、請求項1に記載の方法。
  3. 前記目標が前記機械的システムの視覚システムによって発生する、請求項1または2に記載の方法。
  4. 前記シミュレーションが逆運動学または逆動力学手法を使用して行われる、請求項1から3のいずれかに記載の方法。
  5. 前記適応度が費用関数を使用して計算される、請求項1から4のいずれかに記載の方法。
  6. 前記内部シミュレーション処理速度が、前記下位の機械的システムの機械的な応答時間より早く設定される、請求項1から5のいずれかに記載の方法。
  7. 前記処理ステップが反復方法で行われる、請求項1から6のいずれかに記載の方法。
  8. 前記シミュレーションが、自己コリジョン検出、自己コリジョン回避および外部オブジェクトの回避の一方または両方を含む、請求項1から7のいずれかに記載の方法。
  9. 前記シミュレーションが、動作の運動学的シミュレーションまたは前記システムの動きおよび力の対話を考慮する動力学的シミュレーションである、請求項1から8のいずれかに記載の方法。
  10. 請求項1から9のいずれかに記載の方法を実施するように設計される制御器。
  11. 請求項10に記載の制御器を有するロボット。
  12. コンピュータ装置で実行されるとき、請求項1から11のいずれかに記載の方法を実施する、コンピュータ・ソフトウェア製品。
JP2007134071A 2006-06-22 2007-05-21 ロボットの対話型挙動の制御 Pending JP2008000883A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP06012901.2A EP1870211B1 (en) 2006-06-22 2006-06-22 Method for controlling a robot by assessing the fitness of a plurality of simulated behaviours

Publications (1)

Publication Number Publication Date
JP2008000883A true JP2008000883A (ja) 2008-01-10

Family

ID=37714387

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007134071A Pending JP2008000883A (ja) 2006-06-22 2007-05-21 ロボットの対話型挙動の制御

Country Status (5)

Country Link
US (1) US8725294B2 (ja)
EP (1) EP1870211B1 (ja)
JP (1) JP2008000883A (ja)
KR (1) KR20070121574A (ja)
CN (1) CN101092032B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014147998A (ja) * 2013-01-31 2014-08-21 Shangyin Sci & Technol Co Ltd 向き付け式位置制御方法

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009032189A (ja) * 2007-07-30 2009-02-12 Toyota Motor Corp ロボットの動作経路生成装置
JP4947073B2 (ja) * 2009-03-11 2012-06-06 トヨタ自動車株式会社 ロボット装置及びその制御方法
ATE516930T1 (de) * 2009-05-15 2011-08-15 Honda Res Inst Europe Gmbh Autonome roboter mit planung in unvorhersagbaren, dynamischen und komplizierten umgebungen
WO2011145239A1 (ja) * 2010-05-19 2011-11-24 国立大学法人東京工業大学 位置推定装置、位置推定方法及びプログラム
US9193573B1 (en) * 2012-05-11 2015-11-24 The Boeing Company Process for measuring and controlling extension of scissor linkage systems
US8630742B1 (en) * 2012-09-30 2014-01-14 Nest Labs, Inc. Preconditioning controls and methods for an environmental control system
US9111348B2 (en) * 2013-03-15 2015-08-18 Toyota Motor Engineering & Manufacturing North America, Inc. Computer-based method and system of dynamic category object recognition
CN106326643B (zh) * 2016-08-16 2020-01-14 完美鲲鹏(北京)动漫科技有限公司 一种应用于类人形骨架的反向动力学解算方法及装置
CN109844671B (zh) 2016-08-26 2022-04-29 克朗设备公司 物料搬运车辆和关于物料搬运车辆执行路径确认逻辑的方法
MX2019002215A (es) 2016-08-26 2019-07-08 Crown Equip Corp Herramientas de escaneo de campos multiples en vehiculos de manejo de materiales.
MX2019002217A (es) 2016-08-26 2019-07-08 Crown Equip Corp Herramientas de escaneo de obstaculos para vehiculo de manejo de materiales.
CN107179683B (zh) * 2017-04-01 2020-04-24 浙江工业大学 一种基于神经网络的交互机器人智能运动检测与控制方法
JP7087316B2 (ja) * 2017-09-27 2022-06-21 オムロン株式会社 情報処理装置、情報処理方法およびプログラム
KR101976358B1 (ko) * 2017-10-31 2019-08-28 경희대학교 산학협력단 로봇의 안전성 향상 방법
US11511429B2 (en) 2017-10-31 2022-11-29 Safetics, Inc. Method of improving safety of robot and method of evaluating safety of robot
GB2584608B (en) * 2019-05-01 2021-09-15 Arrival Ltd Robot motion optimization system and method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005078516A (ja) * 2003-09-02 2005-03-24 Advanced Telecommunication Research Institute International 並列学習装置、並列学習方法及び並列学習プログラム
JP2006035388A (ja) * 2004-07-28 2006-02-09 Riyuukoku Univ 学習装置およびそれを備えた動作物体、学習方法、学習プログラムおよびそれを記録したコンピュータ読取り可能な記録媒体

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4412293A (en) * 1981-03-30 1983-10-25 Kelley Robert B Robot system which acquires cylindrical workpieces from bins
JPS58143981A (ja) * 1982-02-19 1983-08-26 株式会社日立製作所 産業用ロボツトの制御方法
US5040056A (en) * 1990-01-29 1991-08-13 Technistar Corporation Automated system for locating and transferring objects on a conveyor belt
US5643060A (en) * 1993-08-25 1997-07-01 Micron Technology, Inc. System for real-time control of semiconductor wafer polishing including heater
US5835684A (en) * 1994-11-09 1998-11-10 Amada Company, Ltd. Method for planning/controlling robot motion
US5655060A (en) * 1995-03-31 1997-08-05 Brooks Automation Time optimal trajectory for cluster tool robots
US6246972B1 (en) * 1996-08-23 2001-06-12 Aspen Technology, Inc. Analyzer for modeling and optimizing maintenance operations
WO2003006215A2 (en) * 2001-07-13 2003-01-23 Fsi International Robotic system control

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005078516A (ja) * 2003-09-02 2005-03-24 Advanced Telecommunication Research Institute International 並列学習装置、並列学習方法及び並列学習プログラム
JP2006035388A (ja) * 2004-07-28 2006-02-09 Riyuukoku Univ 学習装置およびそれを備えた動作物体、学習方法、学習プログラムおよびそれを記録したコンピュータ読取り可能な記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014147998A (ja) * 2013-01-31 2014-08-21 Shangyin Sci & Technol Co Ltd 向き付け式位置制御方法

Also Published As

Publication number Publication date
CN101092032A (zh) 2007-12-26
US8725294B2 (en) 2014-05-13
KR20070121574A (ko) 2007-12-27
EP1870211A1 (en) 2007-12-26
US20080009957A1 (en) 2008-01-10
EP1870211B1 (en) 2019-02-27
CN101092032B (zh) 2012-06-06

Similar Documents

Publication Publication Date Title
JP2008000883A (ja) ロボットの対話型挙動の制御
KR101942167B1 (ko) 전방향 휠을 가지고 선형 예측 위치 및 속도 제어기를 기초한 휴머노이드 로봇
CN112428278B (zh) 机械臂的控制方法、装置及人机协同模型的训练方法
JP6496396B2 (ja) 線形予測位置及び速度コントローラに基づいた全方向車輪を有する人間型ロボット
US8571714B2 (en) Robot with automatic selection of task-specific representations for imitation learning
Salini et al. Synthesis of complex humanoid whole-body behavior: A focus on sequencing and tasks transitions
US9387589B2 (en) Visual debugging of robotic tasks
US11069079B2 (en) Interaction with physical objects as proxy objects representing virtual objects
JP4239635B2 (ja) ロボット装置、その動作制御方法、及びプログラム
Santucci et al. Autonomous reinforcement learning of multiple interrelated tasks
Schultz et al. Goal-predictive robotic teleoperation from noisy sensors
JP2005342873A (ja) ロボット装置及びその動作制御方法
Neo et al. A switching command-based whole-body operation method for humanoid robots
Lober et al. Efficient reinforcement learning for humanoid whole-body control
Maeda et al. Anticipative interaction primitives for human-robot collaboration
Radulescu et al. Whole-body trajectory optimization for non-periodic dynamic motions on quadrupedal systems
JP2008090606A (ja) エージェントコントローラ及びコンピュータプログラム
JP2006285898A (ja) 制御装置および方法、並びにプログラム
Belter et al. Kinematically optimised predictions of object motion
Fachantidis et al. Model-based reinforcement learning for humanoids: A study on forming rewards with the iCub platform
TWI835638B (zh) 於非對稱策略架構下以階層式強化學習訓練主策略的方法
JP4539291B2 (ja) ロボット装置及びその動作制御方法
Bertolucci et al. Collaborative robotic manipulation: A use case of articulated objects in three-dimensions with gravity
TW202345036A (zh) 於非對稱策略架構下以階層式強化學習訓練主策略的方法
Ogura et al. Realization of dynamics simulator embedded robot brain for humanoid robots

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100302

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100531

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100603

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100625

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100630

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100730

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100804

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110419

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110714

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110720

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110812

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110818

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120403