JP2001191284A - ロボット装置及びロボット装置の学習方法 - Google Patents

ロボット装置及びロボット装置の学習方法

Info

Publication number
JP2001191284A
JP2001191284A JP2000327028A JP2000327028A JP2001191284A JP 2001191284 A JP2001191284 A JP 2001191284A JP 2000327028 A JP2000327028 A JP 2000327028A JP 2000327028 A JP2000327028 A JP 2000327028A JP 2001191284 A JP2001191284 A JP 2001191284A
Authority
JP
Japan
Prior art keywords
walking
robot
parameter
evaluation
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000327028A
Other languages
English (en)
Inventor
Hornby Gregory
グレゴリー・ホーンビィ
Seiichi Takamura
成一 高村
Masahiro Fujita
雅博 藤田
Takashi Yamamoto
隆司 山本
Osamu Hanagata
理 花形
Jun Yokono
順 横野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2000327028A priority Critical patent/JP2001191284A/ja
Priority to US09/694,957 priority patent/US6534943B1/en
Publication of JP2001191284A publication Critical patent/JP2001191284A/ja
Pending legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B62LAND VEHICLES FOR TRAVELLING OTHERWISE THAN ON RAILS
    • B62DMOTOR VEHICLES; TRAILERS
    • B62D57/00Vehicles characterised by having other propulsion or other ground- engaging means than wheels or endless track, alone or in addition to wheels or endless track
    • B62D57/02Vehicles characterised by having other propulsion or other ground- engaging means than wheels or endless track, alone or in addition to wheels or endless track with ground-engaging propulsion means, e.g. walking members
    • B62D57/032Vehicles characterised by having other propulsion or other ground- engaging means than wheels or endless track, alone or in addition to wheels or endless track with ground-engaging propulsion means, e.g. walking members with alternately or sequentially lifted supporting base and legs; with alternately or sequentially lifted feet or skid

Abstract

(57)【要約】 【課題】歩行型ロボットの歩行パターン生成作業が煩雑
であった。 【解決手段】歩行型のロボット装置及びその学習方法に
おいて、歩行を制御するためのパラメータに応じた歩行
を行わせ、その歩行を評価し、当該評価が向上するよう
にパラメータを更新するようにした。また歩行型のロボ
ット装置において、歩行時における各脚部の駆動位相を
規定するパラメータに応じた歩行を行わせるように制御
する制御手段と、歩行の速度を評価する評価手段と、評
価手段による歩行の評価が向上するようにパラメータを
更新するパラメータ更新手段とを設けるようにした。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はロボット装置及びロ
ボット装置の学習方法に関し、例えば歩行型ロボットに
適用して好適なものである。
【0002】
【従来の技術】従来、歩行型ロボットの歩行パターン
は、専用のプログラムを用いて歩行制御のための各種パ
ラメータのパラメータ値を設計者がそれぞれ選択した
り、ある制御則に従って数学的に導かれた結果を用いて
当該各種パラメータのパラメータ値をそれぞれ選択する
ことにより生成していた。
【0003】
【発明が解決しようとする課題】ところが例えば娯楽用
の歩行型ロボットに対し、成長に伴って歩行パターンを
変えてゆくような機能を搭載する場合など、多くの歩行
パターンを必要とする場合には、冗長なパラメータ空間
の中から各歩行パターンごとに歩行制御のための各種パ
ラメータとして適切なパラメータをそれぞれ選択する必
要がある。そしてこのような作業を人手により行うには
設計者に高度な制御理論の専門知識が要求され、そうで
なければ相当の時間を要する問題があった。
【0004】かかる問題を解決するための1つの手法と
して、歩行型ロボットの歩行パターンをモデル化し、歩
行制御のための各種パラメータを順次変更しながらコン
ピュータ上でシミュレーションを行い、シミュレーショ
ン結果から適切なパラメータを選択して実際のロボット
にそのパラメータを適用する方法がある。
【0005】しかしながらかかる方法によると、シミュ
レーションにおけるロボットのモデルやロボットの動特
性、物理法則等を正確に記述することが困難であった
り、同じ型のロボットであっても個体ごとに動特性が微
妙に異なることから、シミュレーション結果が実際のロ
ボットにおいて保証されない。そしてこのような現実が
歩行型ロボットの開発現場においても大きな問題となっ
ている。
【0006】従って歩行型ロボットの歩行パターンを、
高度な専門知識や煩雑な作業を必要とすることなくロボ
ットごとに最適化して生成することができれば、歩行パ
ターン生成作業を容易化し、さらには用途に応じた様々
な歩行パターンをも容易に取得できるようになるものと
考えられる。
【0007】本発明は以上の点を考慮してなされたもの
で、歩行パターン生成作業を容易化し得るロボット装置
及びロボット装置の学習方法を提案しようとするもので
ある。
【0008】
【課題を解決するための手段】かかる課題を解決するた
め本発明においては、歩行型のロボット装置において、
歩行を制御するためのパラメータに応じた歩行を行うよ
うに制御する制御手段と、歩行を評価する評価手段と、
評価手段による歩行の評価が向上するようにパラメータ
を更新するパラメータ更新手段とを設けるようにした。
【0009】この結果このロボット装置では、パラメー
タの更新に伴って歩行パターンも徐々に向上してゆく。
従ってこのロボット装置によれば、評価の高い歩行パタ
ーンを高度な専門知識や煩雑な作業を必要とすることな
く得ることができる。
【0010】また本発明においては、歩行型のロボット
装置において、歩行時における各脚部の駆動位相を規定
するパラメータに応じた歩行を行わせる制御手段と、歩
行の速度を評価する評価手段と、評価手段による歩行の
評価が向上するようにパラメータを更新するパラメータ
更新手段とを設けるようにした。
【0011】この結果このロボット装置では、パラメー
タの更新に伴って歩行パターンも静歩行から動歩行へと
徐々に変化してゆく。従ってこのロボット装置によれ
ば、動歩行時における歩容として、当該ロボット装置の
ハードウェアや行動環境等の条件に最適な歩容を容易に
検出することができる。
【0012】さらに本発明においては、歩行型のロボッ
ト装置の学習方法において、パラメータに基づいてロボ
ット装置に歩行を行わせる第1のステップと、歩行を評
価する第2のステップと、歩行の評価が向上するように
パラメータを更新する第3のステップとを設けるように
した。
【0013】この結果このロボット装置の学習方法によ
れば、パラメータの更新に伴って歩行パターンも徐々に
向上してゆくため、評価の高い歩行パターンを高度な専
門知識や煩雑な作業を必要とすることなく得ることがで
きる。
【0014】
【発明の実施の形態】以下図面について、本発明の一実
施の形態を詳述する。
【0015】(1)原理 従来、生物の遺伝と進化のメカニズムを工学的にモデル
化したアルゴリズムとして遺伝的アルゴリズム(GA:
Genetic Algorithm )がある。
【0016】この遺伝的アルゴリズムは、母集団からの
個体の選択、選択した個体についての適応度の評価及び
当該評価に基づく個体の交叉といった一連の処理を繰り
返すことによって、生物の遺伝と進化をモデル化したも
のである。また遺伝的アルゴリズムでは、交叉の繰り返
しによって個体が図1のように複数ある適応度のピーク
のうちの低いピークに収束するのを防止するため、自然
界と同様に必要に応じて個体の突然変異操作も行われ
る。そしてこの遺伝的アルゴリズムを用いることによっ
て、適応度の高い個体を生成できることが知られてい
る。
【0017】そこで本願発明は、この遺伝的アルゴリズ
ムを用いて、歩行制御のための各種パラメータのパラメ
ータ値としてロボットのハードウェアや環境に最適なパ
ラメータ値を実際のロボットに自動検出させることによ
り、歩行型ロボットの開発作業を容易化させようとする
ものである。
【0018】(2)第1の実施の形態 (2−1)本実施の形態によるロボット開発環境システ
ムの構成 図2において、1は全体として本実施の形態によるロボ
ット開発環境システムを示し、環境ユニット2と、ロボ
ット3とから構成されている。
【0019】環境ユニット2においては、所定広さの長
方形状の床面10を有し、当該床面10上に所定径の2
本のポール11A、11Bが床面10の長手方向と垂直
に並設されている。
【0020】また床面10の周囲には、当該床面10を
取り囲むように複数の壁12A〜12Dが立設されてお
り、対向する一対の壁の12A、12Cの各内壁面に、
それぞれ異なる所定色(この実施の形態においては黄色
及び水色)の短冊状のパネル13A、13Bが床面10
と垂直に取り付けられている。
【0021】さらに床面10の上方には、壁12A及び
壁12C間を架け渡すようにワイヤ14が配設されると
共に、当該ワイヤ14に嵌通されたスリップリング15
に支持されるようにしてロボット3に対して電源電圧を
供給するためのケーブル16が配設されている。
【0022】これによりこの環境ユニット2において
は、ロボット3がケーブル16に絡まることなく床面1
0上を長時間に亘って自由に移動し得るようになされて
いる。一方、ロボット3においては、図3に示すよう
に、胴体部ユニット20の前後左右にそれぞれ脚部ユニ
ット21A〜21Dが連結されると共に、胴体部ユニッ
ト20の前端部及び後端部にそれぞれ頭部ユニット22
及び尻尾部ユニット23が連結されることにより構成さ
れている。
【0023】この場合図4に示すように、胴体部ユニッ
ト20にはコントローラ30、タイマ31、加速度セン
サ32及び角速度センサ33などが収納され、頭部ユニ
ット22にはCCD(Charge Coupled Device )カメラ
34及び距離センサ35などがそれぞれ所定位置に配設
されている。
【0024】また各脚部ユニット21A〜21Dの関節
部分や、各脚部ユニット21A〜21D及び胴体部ユニ
ット20の各連結部分、頭部ユニット22及び胴体部ユ
ニット20の連結部分、並びに尻尾部ユニット23及び
胴体部ユニット20の連結部分などにはそれぞれ自由度
数分のアクチュエータ36A〜36n及びポテンショメ
ータ37A〜37nが配設されている。
【0025】そして胴体部ユニット20の加速度センサ
32は、数十ミリ秒単位で3軸(X軸、Y軸、Z軸)方
向の加速度をそれぞれ検出し、検出結果を加速度検出信
号S1としてコントローラ30に送出する。また角速度
センサ33は、数十ミリ秒単位で3角(R角、P角、Y
角)方向の回転角速度を検出し、検出結果を角速度検出
信号S2としてコントローラ30に送出する。
【0026】さらにCCDカメラ34は、前方向の状況
を撮像し、得られた画像信号S3をコントローラ30に
送出すると共に、赤外線距離センサ等でなる距離センサ
35は、前方の対象物までの距離を測定し、測定結果を
距離測定信号S4としてコントローラ30に送出する。
さらに各ポテンショメータ37A〜37nは、それぞれ
対応するアクチュエータ36A〜36nの出力軸の回転
角度を検出し、検出結果を角度検出信号S5A〜S5n
としてコントローラ30に送出する。
【0027】コントローラ30は、CCDカメラ34か
らの画像信号S3に基づいて環境ユニット2のパネル1
3A、13Bを検出し、ロボット3が一方のパネル13
A、13Bに向けて所定の規定時間だけ歩行するよう
に、また規定時間の歩行後には向きを代えて他方のパネ
ル13B、13Aに向けて再び規定時間だけ歩行するよ
うに、対応する各アクチュエータ36A〜36nを駆動
制御する。
【0028】またコントローラ30は、この際加速度セ
ンサ32、角速度センサ33、CCDカメラ34及び距
離センサ35からそれぞれ供給される加速度検出信号S
1、角速度検出信号S2、画像信号S3及び距離センサ
S4等に基づいて、その歩行の速度及び直進性に関する
適応度を評価し、当該評価結果に基づいて評価を向上さ
せるように歩行パターンを変化(すなわち歩行制御のた
めの各種パラメータを更新)する。
【0029】以下、このようなコントローラ30の処理
について説明する。
【0030】(2−2)本実施の形態による歩行パター
ン生成手順 (2−2−1)ロボット3における歩行制御のための各
種パラメータ ここでまずこのロボット3における歩行制御のための各
種パラメータについて説明する。このロボット3の場
合、歩行制御は、メモリ38に格納された図5に示すよ
うな22個のパラメータによって記述される制御プログラ
ムに基づいて行われる。
【0031】そしてこれらパラメータは、歩行基準姿勢
を決定するパラメータ、脚部の運動を決定するパラメー
タ、ボディ全体の運動を決定するパラメータからなる。
以下、これらパラメータについて説明する。
【0032】まず図6に示すように、4脚をすべて伸ば
して立っている状態のロボット3の胴体部ユニット20
に中心座標を設定する。この中心座標を絶対座標系に対
して設定したときに、歩行の基準姿勢においては脚部ユ
ニット21A〜21Dを曲げて体をかがめる姿勢をとる
ことになり、絶対座標系において上述の中心座標は上下
方向と前後方向に移動することになる。この値を「body
center x 」及び「body center z 」というパラメータ
で制御する。
【0033】またこの歩行の基準姿勢は、並行移動だけ
でなく胴体部ユニット20を前傾又は後傾にすることも
あり、これを「body pitch」というパラメータで制御す
る。さらにこの基準姿勢において、脚部ユニット21A
〜21Dの接地位置も歩行に影響を与える。パラメータ
を減らす目的で、前後の脚部ユニット21A〜21Dに
対して開脚方向のオフセットは同値とし、これを「all
legs y」というパラメータで制御する。
【0034】さらに前後方向へのオフセットは、前側の
脚部ユニット21A、21Bを「front legs z」、後側
の脚部ユニット21C、21Dを「rear legs z 」とい
うパラメータで制御する。以上が歩行の基準姿勢に対す
るパラメータである。
【0035】一方、脚部ユニット21A〜21Dの運動
を制御するパラメータとしては、以下のようなものがあ
る。ひとつの脚部ユニット21A(21B〜21D)の
運動を単純化したものを図7に示す。
【0036】まず歩行のステップの長さを決定するパラ
メータを「step length 」とする。また遊脚時に持ち上
げる脚部ユニット21A(21B〜21D)の高さ及び
その時間をそれぞれ「swing hight 」及び「swing tim
e」というパラメータで制御する。
【0037】「swing multi 」は、1脚の1周期におけ
る接地時間と遊脚時間の比率を与えるパラメータであ
り、これによって各脚部ユニット21A〜21Dの接地
時間と遊脚時間とを制御する。なおこのパラメータは、
例えばクロール歩容(静歩行)からトロット歩容(動歩
行)又はペース歩容(動歩行)への移行処理を異なるア
ルゴリズムによって行うときの各脚部ユニット21A〜
21Dの上げ方のパラメータとして使用することも可能
である。
【0038】歩行時にロボット3の胴体部ユニット20
を相対的に前後左右の並進運動、又はロール、ピッチ、
ヨーの回転運動を加えることで歩行の安定性やスピード
を改善することができる。これらはそれぞれ「ample bo
dy x」、「ample body y」、「ample body z」、「ampl
e roll」、「ample pitch 」及び「ample yaw 」といっ
たパラメータにより制御する。
【0039】「min. gain 」、「shift 」及び「lengt
h」は、ロボット3の歩行動作に使用するアクチュエー
タ36A〜36n(サーボモータ)のPID制御のゲイ
ンに関する制御を決定するためのパラメータである。こ
れらパラメータにより接地時に衝撃を吸収するような柔
らかいPIDゲインを与えたりすることでスムーズな歩
行が実現できる可能性をもたせている。実際には、PI
DゲインのうちのPゲインのみを次式
【0040】
【数1】
【0041】によって制御する。
【0042】ここで「leg phase 」は、〔shift,shift
+length〕を値域としてもつものである。すなわちPゲ
インは、「g min 」、から「g max 」の値をサインカー
ブを描いて変化し、その位相は「shift 」というパラメ
ータで与える位置で最大となるようなものである。ただ
し「g max 」は、予め与えられており、位相に関して
は、0〔°〕で前方向に振り上げられ、180 〔°〕で後
方向に地面をかき、360〔°〕で初期位置にもどるよう
なものである。
【0043】「L−R」及び「F−H」は、図8及び図
9に示すように、右前側の脚部ユニット21Bを基準と
して、それぞれ脚部ユニット21Bが遊脚し始めてから
左前側の脚部ユニット21A又は右後側の脚部ユニット
21Dが遊脚し始めるまでの歩行動作1周期に対する比
率を与えるパラメータであり、例えば静歩行(クロール
歩容)の場合は図9(A)、準動歩行の場合は図9
(B)、動歩行(トロット歩容)の場合は図9(C)の
ようになる。
【0044】(2−2−2)パラメータ進化のアルゴリ
ズム 次にこのロボット3における歩行制御のための各種パラ
メータの進化のさせ方について説明する。
【0045】このロボット3では、パラメータ進化のた
めの処理を遺伝的アルゴリズムを用いてコントローラ3
0(図4)が行う。この実施の形態においては、遺伝的
アルゴリズムとして、「steady state GA」と呼ばれ
る各世代の個体数を一定に保ちながら進化させる方法を
採用している。また遺伝子型としては、実数値表現(re
al value encoding )を採用し、上述した22個のパラメ
ータをそのまま遺伝子型としている。
【0046】そしてコントローラ30は、パラメータ進
化のための遺伝的アルゴリズム処理を図10に示すパラ
メータ進化処理手順RT1に従って行う。すなわちコン
トローラ30は、このパラメータ進化処理手順RT1を
ステップSP1において開始後、続くステップSP2に
おいて、所定個数(例えば30個)の個体(22個のパラメ
ータにより規定される1つの歩行パターン)をランダム
に選択することにより初期の母集団を生成する。
【0047】この場合各個体の遺伝子型(パラメータ)
は、検索範囲(図5における「initial range 」)の中
心値を中心とする例えば5〔%〕内でランダムに選択さ
れる。なお図5における各パラメータの検索範囲は、経
験的な値として設定したものである。
【0048】ただしこのようにしてランダムに選択した
個体の多くはロボット3が簡単に転んでしまったり、前
進できないようなものが多い。このためコントローラ3
0は、1つの個体を生成するごとに当該個体に基づいて
実際にロボット3を歩行させるようにして評価を行い、
ロボット3が正しく前進できない個体については新たに
個体を選択し直すようにして、ロボット3が少しでも前
進できる個体を所定個数収集することにより個体の母集
団を生成する。
【0049】続いてコントローラ30は、ステップSP
3に進んで遺伝的アルゴリズムによるパラメータ進化の
ための処理を開始する。ここでこの実施の形態において
は、遺伝的アルゴリズム処理として、個体の交叉と突然
変異の発生とを並行して行うようにしている。このため
このコントローラ30は、このステップSP3において
まず交叉を行うか、または突然変異を行うかをある確率
(本実施の形態においては等確率)で選択する。
【0050】そしてコントローラ30は、交叉を選択し
た場合、ステップSP4に進んで母集団から3つの個体
をランダムに選択すると共に、続くステップSP5にお
いてこれら選択した3つの個体について後述のように実
際にロボット3を歩行させて速度及び直進性に対する各
個体の適応度を評価する。
【0051】そしてコントローラ30は、この後ステッ
プSP6に進んで、ステップSP5における各個体の評
価に基づいて、これら3つの個体の中から適応度の高い
2つの個体を選択し、これら2つの個体を交叉するよう
にして新たな個体を生成する。
【0052】具体的に、コントローラ30は、選択した
2つの個体(p1、p2とする)のi番目の遺伝子型
(パラメータ)をそれぞれp1i 、p2i とし、交叉に
より生成される新たな個体のi番目の遺伝子型をci
し、ci に対して発生させた−1〜1の範囲の一様な乱
数の値をσi として、次式
【0053】
【数2】
【0054】によってci を決定するようにして、新た
な個体を生成する。
【0055】そしてコントローラ30は、この後ステッ
プSP7に進んで、ステップSP4において選択した3
つの個体のうちのステップSP5において適応度が最も
低かった個体をステップSP6において生成した新たな
個体と交換し、この後ステップSP3に戻る。
【0056】これに対してコントローラ30は、ステッ
プSP3において突然変異を選択した場合には、ステッ
プSP8に進んで母集団から2つの個体をランダムに選
択し、続くステップSP9において、ステップSP5と
同様にして実際にロボット3を歩行させることにより速
度及び直進性に対する各個体の適応度を評価する。
【0057】そしてコントローラ30は、この後ステッ
プSP10に進んで、ステップSP9における各個体の
評価に基づいて、これら2つの個体の中から適応度の高
い方の個体を選択し、当該個体の遺伝子型に対して突然
変異操作を実行する。
【0058】具体的に、コントローラ30は、ステップ
SP10において選択した個体の22個の遺伝子型(パラ
メータ)の中から1〜8個の遺伝子型をランダムに選択
し、これら選択した遺伝子型のうちのi番目の遺伝子型
をp1i とし、突然変異により生成される新たな個体の
i番目の遺伝子型をci とし、ci に対して発生させた
−1〜1の範囲の一様な乱数の値をδi(mutate) とし
て、次式
【0059】
【数3】
【0060】によってci を決定するようにして、新た
な個体を生成する。
【0061】そしてコントローラ30は、この後ステッ
プSP11に進んで、ステップSP8において選択した
2つの個体のうちのステップSP9において適応度が低
かった方の個体をステップSP10において生成した新
たな個体と交換し、この後ステップSP3に戻る。
【0062】そしてコントローラ30は、この後交叉又
は突然変異をランダムに選択しながら同様の処理を何度
も繰り返す。この結果個体の母集団は、徐々に適応度の
高い所定個数(30個)の個体の集合体となってゆく。こ
の一例として、「L−R」及び「F−H」のパラメータ
が進化することにより、歩行パターンが静歩行の歩容か
ら動歩行の歩容へと変化してゆく様子を図11に示す。
【0063】従ってこのロボット開発環境システム1で
は、このような交叉又は突然変異操作をロボット3に所
望回数だけ行わせ、かくして得られた30個の個体の中か
ら最も適応度の高い個体を選択することによって、速度
及び直進性に優れた歩行制御のための22個のパラメータ
のパラメータ値を得ることができる。
【0064】(2−2−3)個体の適応度の評価手順 ここでコントローラ30は、パラメータ進化処理手順R
T1のステップSP5及びステップSP9における各個
体の適応度の評価を図12に示す適応度評価処理手順R
T2に従って行う。
【0065】すなわちコントローラ30は、パラメータ
進化処理手順RT1のステップSP5及びステップSP
9に移るとこの適応度評価処理手順RT2をステップS
P20において開始し、続くステップSP21におい
て、パラメータ進化処理手順RT1のステップSP4又
はステップSP8(図10)において選択した3つ又は
2つの個体の中から1つの個体を選択し、当該個体の各
パラメータを歩行制御のためのパラメータとして設定す
る。
【0066】そしてコントローラ30は、続くステップ
SP22において、ロボット3の頭部ユニット22をヨ
ー方向に回転させたり、必要に応じて各脚部ユニット2
1A〜21Dを駆動させてその場において胴体部ユニッ
ト20をヨー方向に回転させるようにして、環境ユニッ
ト2(図2)におけるいずれか一方のパネル13Aを探
索させる。
【0067】そしてコントローラ30は、この探索によ
り一方のパネル13Aを検出すると、ステップSP23
に進んで各脚部ユニット21A〜21Dを駆動させるこ
とにより、当該パネル13Aが正面に位置するように胴
体部ユニット20をヨー方向に回転させる。
【0068】続いてコントローラ30は、ステップSP
24に進んで、距離センサ35(図4)からの距離測定
信号S4に基づいてパネル13Aまでの距離dstart
測定してこれを記憶し、この後ステップSP25に進ん
で各脚部ユニット21A〜21Dを駆動することにより
ロボット3をそのパネル13Aに向けて所定の規定時間
1 (例えば7秒)分だけ歩行させる。
【0069】この際コントローラ30は、距離センサ3
5からの距離測定信号S4に基づいて正面の壁12Aま
での距離を常時監視し、当該距離が予め設定された所定
距離内となったときには、ロボット3の歩行を停止させ
てこの試行での歩行時間T2を記憶する。
【0070】続いてコントローラ30は、ロボット3が
歩行動作を停止すると、ステップSP26に進んでロボ
ット3の頭部ユニット22のみをヨー方向に回転させる
ようにして対象とするパネル13Aを探索する。
【0071】そしてコントローラ30は、このパネル1
3を検出すると、図13に示すように、当該パネル13
Aまでの距離dstopを距離センサ35(図4)からの距
離測定信号S4に基づいて測定すると共に、胴体部ユニ
ット20の前後軸とパネル13Aへの方向のなす角度θ
を頭部ユニット22をヨー方向に回転させるアクチュエ
ータ36Aと対応するポテンショメータ37Aからの角
度検出信号S5Aに基づき得られる頭部ユニット22の
向きに基づいて測定する。
【0072】続いてコントローラ30は、ステップSP
27に進み、ステップSP26において得られた距離d
stop及び角度θに基づいてその個体の速度及び直進性に
対する評価値Scoreを算出する。
【0073】具体的に、コントローラ30は、ロボット
3の速度を次式
【0074】
【数4】
【0075】により与えられる評価関数v(dstart
stop,T)を用いて算出すると共に、直進性を次式
【0076】
【数5】
【0077】により与えられる評価関数s(θ,
stop)を用いて算出し、これらを次式
【0078】
【数6】
【0079】のように乗算するようにしてその個体の評
価値Scoreを算出する。
【0080】なお(4)式及び(5)式におけるTは、
ロボット3が規定時間歩行できたときには上述のT1
歩行を中止したときには上述のT2 となる。また(6)
式におけるf(θ)は、直進性を評価するための補助関
数であり、この実施の形態の場合においては次式
【0081】
【数7】
【0082】を用いている。さらに(6)式に含まれる
定数80及び10は、ロボットに搭載された距離センサ35
の測定可能な最大及び最小距離(単位はセンチメート
ル)である。
【0083】続いてコントローラ30は、ステップSP
28に進んで同一個体について合計3回の試行を行った
か否かを判断し、否定結果を得るとステップSP22に
戻ってこの後対象とするパネル13A、13Bを順次交
互に変えながらステップSP22〜ステップSP28に
おいて同様の処理を繰り返す。
【0084】そしてコントローラ30は、やがて同一個
体について合計3回の試行を終了することによりステッ
プSP28において肯定結果を得ると、ステップSP2
9に進んで3回の試行により得られた合計3個の評価値
coreの平均値Ascore を算出する。この平均値A
score がその個体の速度及び直進性に対する適応度とな
る。
【0085】続いてコントローラ30は、ステップSP
30に進んでパラメータ進化処理手順RT1のステップ
SP4又はステップSP8において選択した全ての個体
について同様の処理を終えたか否かを判断し、否定結果
を得るとステップSP21に戻ってこの後ステップSP
22〜ステップSP30を同様に処理する。
【0086】そしてコントローラ30は、やがて全ての
個体について同様の処理を終えることによりステップS
P30において肯定結果を得ると、ステップSP31に
進んでこの適応度処理手順RT2を終了してパラメータ
進化処理手順RT1(図10)に戻り、この後パラメー
タ進化処理手順RT1のステップSP6又はステップS
P10に進ようになされている。
【0087】(2−3)本実施の形態の動作及び効果 以上の構成において、ロボット3のコントローラ30
は、歩行制御を行うための22個のパラメータからなる個
体を所定個数だけ生成することにより母集団を生成し、
これら個体の速度及び直進性に対する適応度を実際にロ
ボット3を歩行させて評価しながら、当該評価結果に基
づいて遺伝的アルゴリズムに従ってこれら個体を進化さ
せる。
【0088】従ってこのロボット開発環境システム1に
よれば、高い専門知識を必要としたり、またパーソナル
コンピュータを用いたシミュレーションの繰り返し等の
作業を必要とすることなく、歩行制御のための各種パラ
メータのパラメータ値として速度性及び直進性に優れた
パラメータ値(歩行パターン)を容易に得ることができ
る。
【0089】またこのロボット開発環境システム1によ
れば、ロボット3の実機を用いて各個体それぞれについ
て評価を行うようにしているため、例えば従来行われて
いたシミュレーションによって適切なパラメータ値を取
得する手法に比べて、実機ロボット3とシミュレーショ
ン上のロボット間での誤差、動特性等の実機ロボット個
体間でのばらつき等を考慮することなく直ちに製品に適
応できる最適なパラメータ値を格段的に容易に取得し得
るようにすることができる。
【0090】さらにこのロボット開発環境システム1で
は、ロボット3が環境ユニット2の各パネル13A、1
3Bを自動的に探索し、検出したパネル13A、13B
に向けて歩行してゆくため、1回の試行(歩行)の度に
ユーザがロボット3を元の位置に戻したり、又はロボッ
ト3の向きを変えたりする必要がなく、その分より一層
歩行パターンの生成作業を容易化させることができる。
【0091】さらにこのロボット開発環境システム1で
は、ロボット3の各脚部ユニット21A〜21Dの駆動
位相を規定するパラメータ(図5の「L−R」及び「F
−H」)をも進化させるようにしているため、ロボット
3のハードウェアや歩行路面に最適な動歩行の歩容(ト
ロット歩容、ペース歩容等)を容易に検出することがで
きる。
【0092】以上の構成によれば、歩行制御を行うため
の複数のパラメータからなる個体を複数生成することに
より母集団を生成し、これら各個体の速度及び直進性に
対する適応度を実際にロボット3を歩行させて評価しな
がら、当該評価結果に基づいて遺伝的アルゴリズムに従
ってこれら個体を進化させるようにしたことにより、高
い専門知識や煩雑な作業を必要とすることなく、歩行制
御のための各種パラメータのパラメータ値として優れた
パラメータ値を容易に得ることができ、かくて歩行パタ
ーン生成作業を容易化させることができる。
【0093】(3)第2の実施の形態 (3−1)本実施の形態によるロボットの構成 図3及び図4との対応部分に同一符号を付して示す図1
4及び図15は、第2の実施の形態によるロボット40
を示し、頭部ユニット42にマイクロホン43、タッチ
センサ44及びスピーカ45がそれぞれ所定位置に設け
られている点を除いてハードウェアは第1の実施の形態
のロボット3とほぼ同様に構成されている。
【0094】この場合マイクロホン43は、ユーザから
図示しないサウントコマンダを介して音階として与えら
れる「歩け」、「伏せ」又は「ボールを追いかけろ」等
の指令音を集音し、得られた音声信号S10を胴体部ユ
ニット41内のコントローラ46に送出する。
【0095】またタッチセンサ44は、図14において
明らかなように、頭部ユニット42の上部に設けられて
おり、ユーザからの「なでる」や「たたく」といった物
理的な働きかけにより受けた圧力を検出し、検出結果を
圧力検出信号S11としてコントローラ46に送出す
る。
【0096】コントローラ46は、マイクロホン43、
CCDカメラ34、タッチセンサ44、距離センサ3
5、加速度センサ32、角速度センサ33及び各ポテン
ショメータ37A〜37nからそれぞれ供給される音声
信号S10、画像信号S3、圧力検出信号S11、距離
測定信号S4、加速度検出信号S1、角速度検出信号S
2及び角度検出信号S5A〜S5nに基づいて周囲の状
況や、ユーザからの指令及び働きかけの有無、ロボット
40の姿勢や状態を判断する。
【0097】そしてコントローラ46は、この判断結果
と、予めメモリ47に格納されているプログラムとに基
づいて続く行動を決定し、決定結果に基づいて必要なア
クチュエータ36A〜36nを駆動することにより頭部
ユニット42を上下左右に振らせたり、各脚部ユニット
21A〜21Dを駆動して歩行させるなどの動作を行わ
せる。
【0098】またこの際コントローラ46は、必要に応
じて所定の音声信号S12をスピーカ45に与えること
により当該音声信号S12に基づく音声を外部に出力さ
せたり、このロボット40の「目」の位置に設けられた
図示しないLED(Light Emitting Diode)を点灯、消
灯又は点滅させる。
【0099】このようにしてこのロボット40において
は、周囲の状況や、自己の姿勢及び状態に応じて自律的
に行動し得るようになされている。
【0100】かかる構成に加えこのロボット40の場
合、コントローラ46は、歩行制御のための各種パラメ
ータを遺伝的アルゴリズムによって進化させてゆくこと
により、歩行パターンを歩行路面の状態(フローリン
グ、カーペット又は畳)に適合させてゆくようになされ
ている。
【0101】すなわちこのロボット40の場合、上述の
第1の実施の形態のようにして得られた速度及び直進性
についての適応度が最も高い個体の遺伝子型が歩行制御
のための各種パラメータの初期値として予め設定されて
いる。そしてコントローラ46は、初期時、この設定さ
れたパラメータに基づいて対応するアクチュエータを制
御することによりロボット40の歩行制御を行う。
【0102】またコントローラ46は、これとは別に適
当なタイミングで上述のパラメータ進化処理手順RT1
(図10)のステップSP2の場合と同様にして所定個
数の個体を生成して個体の母集団(初期設定の個体をも
含む)を生成すると共に、当該母集団を構成する各個体
をパラメータ進化処理手順RT1のステップSP3〜ス
テップSP11と同様の処理により進化させる。
【0103】またコントローラ46は、このような処理
を行いながら、交叉又は突然変異の操作を行う度に、母
集団を構成する個体の中から最も適応度の高い個体を選
択し、当該個体の各遺伝子型(パラメータ)を歩行制御
のための各種パラメータのパラメータ値として設定す
る。
【0104】これによりこのロボット40においては、
歩行制御のための22個のパラメータとして常に適応度の
高いパラメータ値が設定されるため、母集団の各個体が
進化するに伴って歩行パターンを歩行路面の状態に適合
させてゆくことができるようになされている。
【0105】なおこのロボット40の場合、コントーラ
46は、図16に示す適応度評価処理手順RT3に従っ
て各個体の適応度を評価するようになされている。
【0106】すなわちコントローラ46は、評価対象の
個体を選択するとこの適応度評価処理手順をステップS
P40において開始し、続くステップSP41において
その個体の各遺伝子型(パラメータ)を歩行制御のため
の各パラメータのパラメータ値として設定する。
【0107】続いてコントローラ46は、ステップSP
42に進んでこれらパラメータ値により規定される歩行
パターンで規定時間歩行すると共に、このとき加速度セ
ンサ32(図15)から与えられる加速度検出信号S1
に基づき得られる加速度情報(上述のように数十ミリ秒
毎に更新される)と、角速度センサ33(図15)から
与えられる角速度検出信号S2に基づき得られる角速度
情報(上述のように数十ミリ秒毎に更新される)とを順
次メモリ47(図15)に格納する。
【0108】そしてコントローラ46は、このようにし
て規定時間の歩行を終了すると、ステップSP43に進
んでメモリ47に格納した加速度情報及び角速度情報を
読み出し、当該読み出した加速度情報を積分処理するこ
とによりこの試行での速度を算出すると共に、角速度情
報を積分処理することによりこの試行での横方向の移動
距離(直進性に相当)を計算する。
【0109】さらにコントローラ46は、続くステップ
SP44において、ステップSP43において算出した
速度と、横方向の移動距離とを乗算することによりその
個体の速度及び直進性に対する評価値を算出し、これを
この個体の適応度としてメモリ47に格納した後、ステ
ップSP45に進んでこの適応度評価処理手順RT3を
終了する。
【0110】(3−2)本実施の形態の動作及び効果 以上の構成において、ロボット40のコントローラ46
は、歩行制御を行うための複数のパラメータからなる個
体を複数生成することにより母集団を生成し、これら個
体の速度及び直進性に対する適応度を実際にロボット4
0を歩行させて評価しながら、当該評価結果に基づいて
遺伝的アルゴリズムに従ってこれら個体を進化させる。
またこのときコントローラ46は、母集団のうちの最も
適応度の高い個体の各遺伝子型(パラメータ)を利用し
て歩行制御する。
【0111】従ってこのロボット40は、例えば開発の
際に予め種々の歩行路面の状態を想定して各状態ごとの
歩行パターンを用意するなどの煩雑な開発作業を必要と
することなく、歩行パターンを歩行路面の状態に適合さ
せて、常に速度及び直進性の高い歩行パターンで歩行を
行うことができる。
【0112】以上の構成によれば、歩行制御を行うため
の複数のパラメータからなる個体を複数生成して母集団
を生成し、これら個体の速度及び直進性に対する適応度
を実際にロボット40を歩行させて評価しながら、当該
評価結果に基づいて遺伝的アルゴリズムに従ってこれら
個体を進化させるようにしたことにより、常に歩行路面
の状態に適合した歩行パターンで歩行を行うようにする
ことができる。かくするにつき例えば開発の際に予め種
々の歩行路面の状態を想定して各状態ごとの歩行パター
ンを用意するなどの煩雑な開発作業を必要とせず、歩行
パターン生成作業を容易化させることができる。
【0113】また以上の構成によれば、実機を用いて最
適なパラメータ値を取得するようにしたことにより、最
適なパラメータ値の取得処理をロボット40だけで完結
して行うことができる。かくするにつき、例えばこのロ
ボット40を製品として販売した場合に、ロボット40
の歩行パターン等を使用環境(ユーザの家の床面の形態
等)に応じた最適な歩行パターン等に自動的に変化させ
てゆくことができることから、ロボット40の歩行パタ
ーン等が使用環境に適合しないことに起因するロボット
40の動きのぎこちなさの発生を未然に防止でき、又は
ユーザに特化したバラエティに富んだロボットが実現で
き、かくしてロボット40のエンターテイメント性を向
上させることができる。
【0114】(4)他の実施の形態 なお上述の第1及び第2の実施の形態においては、本発
明を4脚歩行型のロボット3、40に適用するようにし
た場合について述べたが、本発明はこれに限らず、4脚
以外のこの他種々の構成の歩行型ロボットに広く適用す
ることができる。
【0115】また上述の第1及び第2の実施の形態にお
いては、ロボット3、40の各脚部ユニット21A〜2
1Dを駆動する駆動手段(アクチュエータ36A〜36
n)としてサーボモータを適用するようにした場合につ
いて述べたが、本発明はこれに限らず、この他種々のア
クチュエータを広く適用することができる。
【0116】さらに上述の第1及び第2の実施の形態に
おいては、ロボット3、40の歩行制御のためのパラメ
ータに基づいてアクチュエータ36A〜36nを制御す
る制御手段と、歩行を評価する評価手段と、評価手段に
よる歩行の評価が向上するように歩行制御のためのパラ
メータを更新するパラメータ更新手段とを1つのコント
ローラ30、46により構成するようにした場合につい
て述べたが、本発明はこれに限らず、これらを別体とし
て個別に設けるようにしても良い。
【0117】さらに上述の第1及び第2の実施の形態に
おいては、遺伝的アルゴリズムにより進化させる歩行制
御のためのパラメータとして図5に示すような22個のパ
ラメータを適用するようにした場合について述べたが、
本発明はこれに限らず、これらのうちの一部又はこれ以
外のパラメータを進化させるようにしても良い。
【0118】さらに上述の第1及び第2の実施の形態に
おいては、歩行制御のための各種パラメータを進化させ
る際の評価基準を速度及び直進性とするようにした場合
について述べたが、本発明はこれに限らず、これに加え
て又はこれ以外の新たな評価基準を設けるようにしても
良い。
【0119】なおこのような新たな評価基準として、例
えばCCDカメラ34からの画像信号S3に基づく画像
のぶれ難さを採用することが考えられる。そしてこの評
価方法としては、CCDカメラ34からの画像信号S3
に基づく画像内の各画素の輝度値の総和を各フレームご
とに計算すると共に、各フレーム間の輝度値の差分をそ
れぞれ計算し、当該差分の総和が小さいほど画像がぶれ
ていないものとして評価する方法を適用できる。
【0120】さらに上述の第1の実施の形態において
は、ロボット開発環境システム1の環境ユニット2にお
けるロボット3の歩行時の障害物としてポール11A、
11Bを適用するようにした場合について述べたが、本
発明はこれに限らず、この他種々の障害物を広く適用で
きる。
【0121】またこれに加えて又はこれに代えて環境ユ
ニット2の床面10に凹凸等を設けてロボット3の歩行
路面を不整地とするようにしても良く、このようにする
ことによって不整地においても安定した歩行を行い得る
歩行パターンを得ることができる。
【0122】さらに上述の第1の実施の形態において
は、ロボット開発環境システム1の環境ユニット2にお
けるロボット3が歩行する際の目標として着色されたパ
ネル13A、13Bを適用するようにした場合について
述べたが、本発明はこれに限らず、これ以外のものをロ
ボット3が歩行する際の目標として設けるようにしても
良い。
【0123】さらに上述の第1及び第2の実施の形態に
おいては、ロボット3、40の歩行制御のための各種パ
ラメータを遺伝的アルゴリズムにより進化させるように
した場合について述べたが、本発明はこれに限らず、こ
れ以外のアルゴリズムを用いてこれらパラメータを進化
させるようにしても良い。
【0124】さらに上述の実施の形態においては、本発
明を、歩行パターン生成に適用する場合に適用するよう
にした場合について述べたが、本発明はこれに限らず、
例えばブラキエーション動作や、ダンス等のあらゆる動
作及び又は行動パターン生成に広く適用することができ
る。
【0125】
【発明の効果】上述のように本発明によれば、歩行型の
ロボット装置において、歩行を制御するためのパラメー
タに応じた歩行を行わせるように制御する制御手段と、
歩行を評価する評価手段と、評価手段による歩行の評価
が向上するようにパラメータを更新するパラメータ更新
手段とを設けるようにしたことにより、評価の高い歩行
パターンを高度な専門知識や煩雑を作業を必要とするこ
となく得ることができ、かくして歩行パターン生成を容
易化させ得るロボット装置を実現できる。
【0126】また本発明によれば、歩行型のロボット装
置において、歩行時における各脚部の駆動位相を規定す
るパラメータに応じた歩行を行わせるように制御する制
御手段と、歩行の速度を評価する評価手段と、評価手段
による歩行の評価が向上するようにパラメータを更新す
るパラメータ更新手段とを設けるようにしたことによ
り、動作時における歩容として当該ロボット装置のハー
ドウェア等の条件に最適な歩容を容易に検出することが
でき、かくして歩行パターン生成作業を容易化させ得る
ロボット装置を実現できる。
【0127】さらに本発明によれば、歩行型のロボット
装置の学習方法において、歩行を制御するためのパラメ
ータに応じた歩行を行わせる第1のステップと、歩行を
評価する第2のステップと、評価手段による歩行の評価
が向上するようにパラメータを更新する第3のステップ
とを設けるようにしたことにより、評価の高い歩行パタ
ーンを高度な専門知識や煩雑を作業を必要とすることな
く得ることができ、かくして歩行パターン生成作業を容
易化させ得るロボット装置の学習方法を実現できる。
【図面の簡単な説明】
【図1】適応度の説明に供する特性曲線図である。
【図2】第1の実施の形態によるロボット開発環境シス
テムの構成を示す略線的な斜視図である。
【図3】第1の実施の形態によるロボットの外観構成を
示す斜視図である。
【図4】第1の実施の形態によるロボットの内部構成を
示すブロック図である。
【図5】歩行制御のための22個のパラメータを示す図表
である。
【図6】歩行基準姿勢を示す略線図である。
【図7】1つの脚部ユニットの運動の説明に供する略線
図である。
【図8】パラメータの説明に供する略線図である。
【図9】各種歩容におけるパラメータの位相関係を示す
タイミングチャートである。
【図10】パラメータ進化処理手順を示すフローチャー
トである。
【図11】静歩行から動歩行への変化の様子を示す略線
図である。
【図12】第1の実施の形態による適応度評価処理手順
を示すフローチャートである。
【図13】個体の評価の仕方の説明に供する略線図であ
る。
【図14】第2の実施の形態によるロボットの外観構成
を示す斜視図である。
【図15】第2の実施の形態によるロボットの内部構成
を示すブロック図である。
【図16】第2の実施の形態による適応度評価処理手順
を示すフローチャートである。
【符号の説明】
1……ロボット開発環境システム、2……環境ユニッ
ト、3、40……ロボット、13A、13B……パネ
ル、20、41……胴体部ユニット、21A〜21D…
…脚部ユニット、22、42……頭部ユニット、30、
46……コントローラ、31……タイマ、32……加速
度センサ、33……角速度センサ、34……CCDカメ
ラ、35……距離センサ、36A〜36n……アクチュ
エータ、37A〜37n……ポテンショメータ、38、
47……メモリ、S1……加速度検出信号、S2……角
速度検出信号、S3……画像信号、S4……距離測定信
号、RT1……パラメータ進化処理手順、RT2、RT
3……適応度評価処理手順。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 藤田 雅博 東京都品川区北品川6丁目7番35号ソニー 株式会社内 (72)発明者 山本 隆司 東京都品川区北品川6丁目7番35号ソニー 株式会社内 (72)発明者 花形 理 東京都品川区北品川6丁目7番35号ソニー 株式会社内 (72)発明者 横野 順 東京都品川区北品川6丁目7番35号ソニー 株式会社内

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】複数の脚部を有し、各上記脚部を所定パタ
    ーンで駆動するようにして歩行するロボット装置におい
    て、 各上記脚部を駆動する駆動手段と、 上記歩行を制御するための所定のパラメータに基づいて
    上記駆動手段を制御することにより、当該パラメータに
    応じた上記歩行を行わせる制御手段と、 上記歩行を評価する評価手段と、 上記評価手段による上記歩行の評価が向上するように上
    記パラメータを更新するパラメータ更新手段とを具える
    ことを特徴とするロボット装置。
  2. 【請求項2】上記パラメータ更新手段は、 遺伝的アルゴリズムによって上記パラメータを更新する
    ことを特徴とする請求項1に記載のロボット装置。
  3. 【請求項3】上記評価手段は、 上記歩行の速度及び又は直進性を評価することを特徴と
    する請求項1に記載のロボット装置。
  4. 【請求項4】複数の脚部を有し、各脚部を所定パターン
    で駆動するようにして歩行するロボット装置において、 上記脚部を駆動する駆動手段と、 上記歩行時における上記各脚部の駆動位相を規定する所
    定のパラメータに基づいて上記駆動手段を制御すること
    により、当該パラメータに応じた上記歩行を行わせる制
    御手段と、 上記歩行の速度を評価する評価手段と、 上記評価手段による上記動作の評価が向上するように上
    記パラメータを更新するパラメータ更新手段とを具える
    ことを特徴とするロボット装置。
  5. 【請求項5】複数の脚部を有し、各上記脚部を所定パタ
    ーンで駆動するようにして歩行するロボット装置の学習
    方法において、 上記歩行を制御するための所定のパラメータに基づいて
    上記ロボット装置に上記歩行を行わせる第1のステップ
    と、 上記歩行を評価する第2のステップと、 上記歩行の評価が向上するように上記パラメータを更新
    する第3のステップとを具えることを特徴とするロボッ
    ト装置の学習方法。
  6. 【請求項6】上記第3のステップでは、 遺伝的アルゴリズムに従って上記パラメータを更新する
    ことを特徴とする請求項5に記載のロボット装置の学習
    方法。
  7. 【請求項7】上記第2のステップでは、 上記歩行の速度及び又は直進性を評価することを特徴と
    する請求項5に記載のロボット装置の学習方法。
  8. 【請求項8】上記ロボット装置に所定の目標を探索する
    探索機能を設け、 上記第1のステップにおいて、上記ロボット装置は、 所定位置に設けられた第1の上記目標を探索し、 検出した上記第1の目標に向けて歩行し、 上記歩行終了後には第2の上記目標を探索し、 検出した上記第2の目標に向けて歩行することを特徴と
    する請求項5に記載のロボット装置の学習方法。
  9. 【請求項9】上記第1のステップにおける上記ロボット
    装置の歩行路面上に障害物を設け、 及び又は当該歩行路面を不整地とすることを特徴とする
    請求項5に記載のロボット装置の学習方法。
JP2000327028A 1999-10-25 2000-10-20 ロボット装置及びロボット装置の学習方法 Pending JP2001191284A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000327028A JP2001191284A (ja) 1999-10-25 2000-10-20 ロボット装置及びロボット装置の学習方法
US09/694,957 US6534943B1 (en) 1999-10-25 2000-10-24 Robot device and learning method of robot device

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP11-303163 1999-10-25
JP30316399 1999-10-25
JP2000327028A JP2001191284A (ja) 1999-10-25 2000-10-20 ロボット装置及びロボット装置の学習方法

Publications (1)

Publication Number Publication Date
JP2001191284A true JP2001191284A (ja) 2001-07-17

Family

ID=26563421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000327028A Pending JP2001191284A (ja) 1999-10-25 2000-10-20 ロボット装置及びロボット装置の学習方法

Country Status (2)

Country Link
US (1) US6534943B1 (ja)
JP (1) JP2001191284A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004188541A (ja) * 2002-12-11 2004-07-08 Yamazaki Mazak Corp 工作機械の送り軸パラメータ調整システム
JPWO2005077611A1 (ja) * 2004-02-16 2007-10-18 本田技研工業株式会社 移動ロボットの歩容生成装置
KR101105346B1 (ko) * 2008-12-09 2012-01-16 (주)로보티즈 학습에 의한 로봇의 보행 방법 및 학습에 의한 보행 메커니즘을 구비한 로봇
JP6326167B1 (ja) * 2017-03-31 2018-05-16 株式会社ドワンゴ 学習装置、学習方法、学習プログラム、動画配信装置、活動装置、活動プログラムおよび動画生成装置
CN114639163A (zh) * 2022-02-25 2022-06-17 纯米科技(上海)股份有限公司 行走程序的打分方法、系统、电子装置及存储介质
KR102664200B1 (ko) 2021-12-20 2024-05-10 주식회사 현대케피코 가속도센서를 이용한 보행 로봇의 강화 학습 방법

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4480843B2 (ja) * 2000-04-03 2010-06-16 ソニー株式会社 脚式移動ロボット及びその制御方法、並びに、脚式移動ロボット用相対移動測定センサ
WO2004030870A1 (ja) * 2002-10-01 2004-04-15 Sony Corporation ロボット装置及びロボット装置の制御方法
US7418312B2 (en) * 2003-09-19 2008-08-26 Sony Corporation Robot apparatus and walking control method thereof
JP4513320B2 (ja) * 2003-12-17 2010-07-28 ソニー株式会社 ロボット装置、並びにロボット装置の運動制御方法
JP2006198017A (ja) * 2005-01-18 2006-08-03 Sega Toys:Kk ロボット玩具
KR101399199B1 (ko) * 2007-07-16 2014-05-27 삼성전자주식회사 소프트웨어 로봇의 유전자 코드 구성 방법
US8414350B2 (en) * 2008-08-18 2013-04-09 Rehco, Llc Figure with controlled motorized movements
US9594377B1 (en) * 2015-05-12 2017-03-14 Google Inc. Auto-height swing adjustment
CN108733083B (zh) * 2018-03-21 2022-03-25 北京猎户星空科技有限公司 机器人转动的控制方法、装置、机器人及存储介质
JP2021133487A (ja) * 2020-02-28 2021-09-13 ソニーグループ株式会社 脚式ロボット、および脚式ロボットの制御方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02136904A (ja) * 1988-11-18 1990-05-25 Hitachi Ltd 動作系列自己生成機能を持つ運動制御装置
DE69113486T2 (de) * 1990-01-22 1996-05-30 Matsushita Electric Ind Co Ltd Adaptives Regelungssystem.
JP2819353B2 (ja) * 1990-09-28 1998-10-30 本田技研工業株式会社 脚式移動ロボットの歩行制御装置
JP3286334B2 (ja) * 1992-01-17 2002-05-27 本田技研工業株式会社 移動体の制御装置
JP3167404B2 (ja) * 1992-02-26 2001-05-21 本田技研工業株式会社 ロボットの関節駆動制御装置
US5551525A (en) * 1994-08-19 1996-09-03 Vanderbilt University Climber robot
US5758734A (en) * 1996-01-19 1998-06-02 Korea Institute Of Science And Technology Foot system for jointed leg type walking robot
US6068073A (en) * 1996-05-10 2000-05-30 Cybernet Systems Corporation Transformable mobile robot
US5832189A (en) * 1996-09-26 1998-11-03 Interval Research Corporation Affect-based robot communication methods and systems
US5929585A (en) * 1996-11-19 1999-07-27 Sony Corporation Robot system and its control method
JP3667914B2 (ja) * 1997-01-31 2005-07-06 本田技研工業株式会社 脚式移動ロボットの遠隔制御システム
JP3919040B2 (ja) * 1997-11-30 2007-05-23 ソニー株式会社 ロボツト装置
JP3765356B2 (ja) * 1997-12-22 2006-04-12 ソニー株式会社 ロボツト装置
JP2000153476A (ja) * 1998-09-14 2000-06-06 Honda Motor Co Ltd 脚式移動ロボット
JP4366617B2 (ja) * 1999-01-25 2009-11-18 ソニー株式会社 ロボット装置
TW581273U (en) * 1999-09-14 2004-03-21 Hon Hai Prec Ind Co Ltd Computer casing
JP2001150374A (ja) * 1999-11-25 2001-06-05 Sony Corp ロボットの故障診断システム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004188541A (ja) * 2002-12-11 2004-07-08 Yamazaki Mazak Corp 工作機械の送り軸パラメータ調整システム
JPWO2005077611A1 (ja) * 2004-02-16 2007-10-18 本田技研工業株式会社 移動ロボットの歩容生成装置
JPWO2005077610A1 (ja) * 2004-02-16 2007-10-18 本田技研工業株式会社 移動ロボットの歩容生成装置
JP4800039B2 (ja) * 2004-02-16 2011-10-26 本田技研工業株式会社 移動ロボットの歩容生成装置
JP4800038B2 (ja) * 2004-02-16 2011-10-26 本田技研工業株式会社 移動ロボットの歩容生成装置
KR101105346B1 (ko) * 2008-12-09 2012-01-16 (주)로보티즈 학습에 의한 로봇의 보행 방법 및 학습에 의한 보행 메커니즘을 구비한 로봇
JP6326167B1 (ja) * 2017-03-31 2018-05-16 株式会社ドワンゴ 学習装置、学習方法、学習プログラム、動画配信装置、活動装置、活動プログラムおよび動画生成装置
JP2018173790A (ja) * 2017-03-31 2018-11-08 株式会社ドワンゴ 学習装置、学習方法、学習プログラム、動画配信装置、活動装置、活動プログラムおよび動画生成装置
KR102664200B1 (ko) 2021-12-20 2024-05-10 주식회사 현대케피코 가속도센서를 이용한 보행 로봇의 강화 학습 방법
CN114639163A (zh) * 2022-02-25 2022-06-17 纯米科技(上海)股份有限公司 行走程序的打分方法、系统、电子装置及存储介质

Also Published As

Publication number Publication date
US6534943B1 (en) 2003-03-18

Similar Documents

Publication Publication Date Title
JP2001191284A (ja) ロボット装置及びロボット装置の学習方法
US7024276B2 (en) Legged mobile robot and its motion teaching method, and storage medium
Pongas et al. A robust quadruped walking gait for traversing rough terrain
KR101121763B1 (ko) 환경 인식 장치 및 방법
JP6715952B2 (ja) バランスのとれた運動および行動能力が向上した移動型ロボット
JP3855812B2 (ja) 距離計測方法、その装置、そのプログラム、その記録媒体及び距離計測装置搭載型ロボット装置
CN1293606A (zh) 机器人装置
JP5052013B2 (ja) ロボット装置及びその制御方法
JP2009066698A (ja) 脚式ロボット、及びその制御方法
JP2007276052A (ja) 制御システム、記録システム、情報処理装置および方法、プログラム、並びに記録媒体
JP5104355B2 (ja) ロボット制御装置、ロボット制御方法およびロボット制御プログラム
JP2004142095A (ja) ロボット装置及びロボット装置の制御方法
US20220143819A1 (en) System and methods for training robot policies in the real world
JP2009214255A (ja) 脚式ロボット、及びその制御方法
JP4285279B2 (ja) ロボットに搭載されたステレオ・カメラの診断用装置、並びにロボット装置に搭載されたステレオ・カメラの診断方法
JP2005111654A (ja) ロボット装置及びロボット装置の歩行制御方法
JP3555945B2 (ja) ロボット装置のためのモーション編集装置及びモーション編集方法、ロボット装置及びロボット装置の制御方法、並びにコンピュータ・プログラム
Endo et al. Co-evolution of morphology and walking pattern of biped humanoid robot using evolutionary computation-evolutionary designing method and its evaluation
Jiang et al. Motion sequence learning for robot walking based on pose optimization
JP2004181613A (ja) ロボット装置、脚式移動ロボットの動作制御装置及び動作制御方法、脚式移動ロボットのためのセンサ・システム、並びに移動体装置
JP3568527B2 (ja) 移動体装置
JP4539291B2 (ja) ロボット装置及びその動作制御方法
Palankar A distributed local-leg feedback algorithm for robust walking on uneven terrain
CN117207203B (zh) 机器人控制方法、装置、机器人及存储介质
KR20150076743A (ko) 인간과 유사한 이족 보행을 위한 인간형 로봇의 하지 관절궤적 생성 방법