JP2003311669A - ロボット装置 - Google Patents

ロボット装置

Info

Publication number
JP2003311669A
JP2003311669A JP2002116510A JP2002116510A JP2003311669A JP 2003311669 A JP2003311669 A JP 2003311669A JP 2002116510 A JP2002116510 A JP 2002116510A JP 2002116510 A JP2002116510 A JP 2002116510A JP 2003311669 A JP2003311669 A JP 2003311669A
Authority
JP
Japan
Prior art keywords
evaluation
individual
condition
engine
population
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002116510A
Other languages
English (en)
Other versions
JP3905413B2 (ja
Inventor
Shunsuke Tezuka
俊介 手塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Subaru Corp
Original Assignee
Fuji Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Heavy Industries Ltd filed Critical Fuji Heavy Industries Ltd
Priority to JP2002116510A priority Critical patent/JP3905413B2/ja
Publication of JP2003311669A publication Critical patent/JP2003311669A/ja
Application granted granted Critical
Publication of JP3905413B2 publication Critical patent/JP3905413B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Manipulator (AREA)

Abstract

(57)【要約】 【課題】 遺伝的アルゴリズムを用いた歩容生成におけ
る最適解の収束性を高めて進化の停滞を防止し、高速且
つ信頼性の高い歩容パターンを得る。 【解決手段】 パラメータ発生器10で生成した歩容パ
ラメータでシミュレータ20又は歩行型ロボット1によ
って動作状況をシミュレートし、その結果をGAエンジ
ン群30の各評価部31で評価する。そして、各評価部
31からの評価値に基づいて各GAエンジン32におけ
る最良個体の評価値が向上するように演算を行って最適
解をパラメータ発生器10に渡し、パラメータ発生器1
0から歩行型ロボット1に出力する歩容パラメータを更
新して、再度シミュレータ20又は歩行型ロボット1に
よる動作状況の評価を繰り返すことにより、徐々に評価
値の高い歩容パラメータに進化させていく。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、遺伝的アルゴリズ
ムを用いて歩容を生成し、脚によって歩行するロボット
装置に関する。
【0002】
【従来の技術】従来、脚を持ったロボットの歩容を生成
する場合には、多くのパラメータを決定する必要があ
り、シミュレーション及び実験等に多くの工数を要して
いた。
【0003】このため、例えば、特開2001−191
284号公報には、歩行型ロボットの歩行を制御するた
めのパラメータを、歩行の評価値が向上するよう、遺伝
的アルゴリズムを用いて更新することで、歩行パターン
の生成作業を容易化する技術が開示されている。
【0004】
【発明が解決しようとする課題】しかしながら、歩行型
ロボットの歩容生成は煩雑であるため、ロボットの歩行
において満たすべき評価条件が多く、且つ、それぞれの
条件が相互に影響しあっていたり、トレードオフの関係
になることがある。
【0005】このため、先行術のように、遺伝的アルゴ
リズムを用いた進化的学習法を適用しても、進化計算の
収束が遅く、結果的に局所解にトラップされて進化が停
滞してしまう現象が発生する場合がある。
【0006】本発明は上記事情に鑑みてなされたもの
で、遺伝的アルゴリズムを用いた歩容生成における最適
解の収束性を高めて進化の停滞を防止し、高速且つ信頼
性の高い歩容パターンを得ることのできるロボット装置
を提供することを目的としている。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、請求項1記載の発明は、遺伝的アルゴリズムに基づ
いて、単一或いは複数の脚部により歩行する歩行型ロボ
ットが満たすべき複数の評価条件を下位から上位に向か
って段階的に分割し、各段の評価条件に適合した最適解
の候補を進化個体群としてそれぞれ演算する手段と、下
位側の進化個体群と上位側の進化個体群との間で個体の
評価値に応じて個体交換を行う手段と、最上位の進化個
体群に基づいて最適化演算の収束判定を行う手段と、最
適化演算が収束した最上位の進化個体群に基づいて、上
記歩行型ロボットの制御パラメータを更新する手段とを
備えたことを特徴とする。
【0008】請求項2記載の発明は、請求項1記載の発
明において、上記進化個体群の演算を、複数の演算器で
分散して実行することを特徴とする。
【0009】請求項3記載の発明は、請求項1又は2記
載の発明において、上記評価値を、上記歩行型ロボット
の動きをモデル化したシミュレータからのデータに基づ
いて算出することを特徴とする。
【0010】請求項4記載の発明は、請求項1,2,3
の何れか一に記載の発明において、上記評価値を、上記
歩行型ロボットからの実機データに基づいて算出するこ
とを特徴とする。
【0011】すなわち、請求項1記載の発明は、歩行型
ロボットが満たすべき複数の評価条件を下位から上位に
向かって段階的に分割し、下位側の進化個体群と上位側
の進化個体群との間で個体の評価値に応じて個体交換を
行いながら、各段の評価条件に適合した最適解の候補を
それぞれ演算する。そして、最上位の進化個体群の最適
化演算が収束判定されたとき、この最上位の進化個体群
に基づいて歩行型ロボットの制御パラメータを更新する
ことで、最適解の収束性を高めて進化の停滞を防止す
る。
【0012】その際、進化個体群の演算は、請求項2記
載の発明のように、複数の演算器で分散して実行するこ
とが望ましく、解探索をより高速化することができる。
また、個体の評価値は、請求項3記載の発明のように、
歩行型ロボットの動きをモデル化したシミュレータから
のデータ、或いは、請求項4記載の発明のように、歩行
型ロボットからの実機データに基づいて算出することが
できる。
【0013】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図1〜図8は本発明の実施の一形
態に係わり、図1はロボット装置の全体構成図、図2は
段階的進化法を用いた最適化装置のブロック図、図3は
複数の演算装置を用いた最適化装置のブロック図、図4
はGAエンジン間での移民処理のフローチャート、図5
は4脚歩行型ロボットに上下方向の動きを与える関節角
の説明図、図6は4脚歩行型ロボットに前後・左右方向
の動きを与える関節角の説明図、図7は1脚分の歩容パ
ターンを生成するニューラルネットワークの説明図、図
8はシミュレータの処理を示すフローチャートである。
【0014】図1に示すロボット装置は、単一或いは複
数の脚部を有し、この脚部の駆動によって歩行する歩行
型ロボット1と、この歩行型ロボット1の歩行制御パラ
メータを生成・更新するパラメータ発生器10と、歩行
型ロボット1をモデル化したシミュレータ20と、複数
の評価条件に応じて段階的進化を実現するため、下位か
ら上位へ逐次的に評価条件が追加されていくN個の評価
部31を伴い、同時並行的に演算を実行するN個の遺伝
的アルゴリズム計算部(GAエンジン)32を有するG
Aエンジン群30とを備えて構成される。
【0015】GAエンジン群30は、進化の初期段階か
ら歩行型ロボット1に与えるタスクを徐々に複雑化する
ことにより進化の停滞を防ぐ、いわゆる段階的進化法を
用いた最適化装置として構成される。詳細には、図2に
示すように、GAエンジン群30は、N個の評価部31
及び対応するN個のGAエンジン32に対し、(N−
1)個の個体移民制御部33と、収束判定部34とを備
えて構成される。
【0016】GAエンジン32は、下位から上位に亘っ
て複数段設けられ、後述するように、個々のGAエンジ
ン32に対して評価部31で設定される評価条件が下位
から上位へ段階的に追加される。尚、各段の評価部31
及びGAエンジン32は、最下位を1段目、上位に向か
って順次2段目,3段目,…、そして最上位をN段目と
定義する。
【0017】個体移民制御部33は、互いに隣接したG
Aエンジン32の間に設けられており、最適化対象とな
る進化個体群PGn(n=1〜N)中の一部個体群を、
互いに隣接した直近段の間で移動させる。本明細書で
は、上下の進化個体群PGn間で移動される個体を「移
民」と呼ぶ。
【0018】収束判定部34は、最上位のGAエンジン
32のみに付随しており、最上位のGAエンジン32で
出力される進化個体群PGNに基づいて、最適化の収束
判定を行う。ここで、「最上位」とは、最終的な目的と
なる最適解を含み得る目的段、換言すれば、最終的に与
えるべき全条件が設定されている段をいう。従って、最
終的に求める最適解、すなわち考慮すべき全条件に適合
する解は、最上位のGAエンジン32において算出され
る。
【0019】各段の評価部31でGAエンジン32に対
して設定される評価条件は、下位から上位に向かって階
段的に追加された形態となっている。すなわち、1段目
の評価条件(1段目のGAエンジン32に設定される評
価条件)が単一の「条件1」のみであるのに対して、2
段目の評価条件は1段目の「条件1」に新たな「条件
2」を追加した「条件1+2」(”+”は「且つ(an
d)」の意味)となっている。また、3段目の評価条件
は、直下位の評価条件である「条件1+2」に新たな
「条件3」を追加した「条件1+2+3」になってい
る。すなわち、複数の条件が組み合わさった「評価条件
1+2+・・・+N」(最終的な評価条件)を段階的に
分割し、下位から上位に亘って条件が段階的に追加され
るように各段の評価条件を個別に設定する。
【0020】尚、各段に追加する条件は単一である必要
は必ずしもなく、複数の条件を同時に追加してもよい。
例えば、1段目の評価条件を「条件1」とし、2段目の
評価条件を「条件1+2+3」とするといった如くであ
る。
【0021】それぞれのGAエンジン32に段階的に追
加される条件は、拘束力の強いものほど下位に配置し、
拘束力の弱いものほど上位に配置する。換言すれば、下
位側には必要条件的な条件を配置し、上位側には十分条
件的な条件を配置する。具体的には、歩行型ロボット1
に関する歩行の最適化で考慮すべき条件として、以下に
説明するように、「脚で立つ」、「転倒しない」、「な
るべく足音を立てずに歩行する」等があり、歩行の大前
提である「脚で立つ」という拘束力の強い条件が最下位
の「条件1」に相当し、「転倒しない」という条件がそ
れに統く「条件2」に相当し、高度な条件である「なる
べく足音を立てずに歩行する」という条件が最上位の
「条件N」(拘束力が最も弱い)に相当する。
【0022】詳細には、単一又は複数の脚部を持つロボ
ットの歩行に要求される条件として、例えば、以下の
(1)〜(9)に示す条件等があり、概ね(1)→
(9)の順序で拘束力が強い。 (1)脚で立つ(体を地面につけない)。 (2)転倒しない(体の角度を限度内に保つ)。 (3)移動する(足踏みだけではない)。 (4)行きたい方向へ進む。 (5)より速く歩行する。 (6)より安定した歩行をする(外乱に耐える)。 (7)使用するエネルギーが少ない。 (8)なるべく姿勢を崩さずに歩行する。 (9)なるべく足音を立てずに歩行する。
【0023】これらの条件のうち、最も拘束力の強い条
件、すなわち(1)の「脚で立つ」条件を1段目の評価
部31にて判定し、最も拘束力の強い条件と、2番目に
拘束力の強い条件、この場合は(2)の「転倒しない」
条件とを同時に、2段目の評価部31で判定する。この
ように、拘束力が強い条件から順次、評価部31に付け
加えるように、N個の条件に対してN個の独立したGA
エンジン32を用意することで、N段目のGAエンジン
32では、要求される全ての条件に対して評価が行われ
ることとなる。
【0024】このGAエンジン群30をスタンドアロン
のシングルプロセッサ型のコンピュータ等の単一の演算
装置で実現する場合、単一のコンピュータがN個の評価
部31及びGAエンジン32、(N−1)個の個体移民
制御部33、収束判定部34の全機能を担うが、処理速
度の高速化を図るために、マルチプロセッサ型のコンピ
ュータ或いはLAN等によってネットワーク接続された
複数のシングルプロセッサ型のコンピュータ等、複数の
演算装置でGAエンジン群30を実現することも可能で
ある。
【0025】この場合、図3に示すように、N個のコン
ピュータ(プロセッサ)30−1,30−2,…,30
−Nのそれぞれが、1個の評価部31及びGAエンジン
32、それに対応した個体移民制御部33の機能を実現
し、並列処理を行うコンピュータ(プロセッサ)間の情
報伝達(個体交換)は、ネットワーク、バス、マルチポ
ートメモリ、その他のインターフェースを介して行われ
る。そして、最上位のGAエンジン32に相当するコン
ピュータ(プロセッサ)に収束判定部34の機能を担わ
せる。
【0026】それぞれのGAエンジン32は、互いに独
立してGA演算を行うため簡単に並列化でき、最適化に
要する処理時間は、使用するコンピュータ(プロセッ
サ)の数の増加に伴い短縮化される。互いに隣接したG
Aエンジン32間の個体交換に要するデータ量は比較的
少なく、その発生頻度も高くない。そのため、個体交換
用のインターフェースとして高速な専用線を用いる必要
は必ずしもない。尚、単一のGAエンジン32に通常の
分散GAを用いて更に細分化・並列化すれば、処理速度
の一層の高速化を図ることができる。
【0027】以上の構成によるロボット装置では、パラ
メータ発生器10で生成した歩容パラメータでシミュレ
ータ20又は歩行型ロボット1によって動作状況をシミ
ュレートし、その結果をGAエンジン群30の評価部3
1で評価する。すなわち、GA演算は繰り返し学習を行
う手法であるため、計算時間の制約から評価は実機(歩
行型ロボット1)でなくシミュレータを用いて進化を進
め、最も上位の評価条件を持つものの最良個体の結果を
実機に適用しても良いが、制御の確実性と制御結果を得
るまでの時間との兼ね合いを考慮し、評価の一部又は全
部を実機に対して適用することも可能である。
【0028】そして、GAエンジン群30では、各評価
部31からの評価値に基づいて各GAエンジン32にお
ける最良個体の評価値が向上するように演算を行い、新
たなパラメータをパラメータ発生器10に渡し、パラメ
ータ発生器10から歩行型ロボット1に出力する歩容パ
ラメータ(制御パラメータ)を更新する。そして、再
度、シミュレータ20又は歩行型ロボット1による動作
状況の評価を繰り返すことにより、徐々に評価値の高い
歩容パラメータに進化させていく。
【0029】このGAエンジン群30における最適化演
算は、最下位のGAエンジン32で最も単純な評価条件
1、例えば「脚で立つ」条件のみに基づいて解探索を行
い、進化個体群PG1を出力する。また、これよりも1
つ上位のGAエンジン32は、評価条件1に、新たな評
価条件2、例えば「転倒しない」条件を加え、両者の評
価条件(1+2)下で解探索を行い、進化個体群PG2
を出力する。
【0030】同様に、GAエンジン32が上位になるに
つれて評価条件が段階的に追加され、より複雑な評価条
件下での最適化が試みられる。各段のGAエンジン32
は、個別に設定された評価条件に適合した解の候補を進
化個体群PGnとして出力する。進化個体群PGnを構
成する個々の個体は、最適化に応じて適宜設定されたル
ールに従いコーディングされている。尚、各段の進化個
体群PGnの初期設定は、個体の多様性を確保するため
に、GAエンジン32毎にランダムに作り出すことが好
ましい。また、各段のGAエンジン32に設定する進化
個体群PGnの個体数は同一であっても良いが、異なる
個体数に設定しても良い。
【0031】一方、進化個体群の中で評価値の悪い個体
は、下位の評価条件の少ない群に移民し、評価値の良い
個体は、上位の評価条件の多い群に移民する。すなわ
ち、個体移民制御部33は、定められたタイミングで進
化個体群PGnから定められた数の個体(移民)を、相
対的な評価値の良い順番に、上位の進化個体群PGn+1
に移動させる(ステップアップ)。移民を受け入れた上
位側のGAエンジン32は、下位の評価条件については
そこそこの評価を得ている個体から進化操作を行う。従
って、評価条件の段階的な追加とともに最適解が存在す
るであろう空間を限定していくことができるため、最適
解発見の可能性を高めることができる。
【0032】また、個体移民制御部33は、定められた
タイミングで、進化個体群PGnから定められた数の移
民を、相対的な評価値の悪い順番に、下位の進化個体群
PGn-1に移動させる(ステップダウン)。移民を受け
入れた下位側のGAエンジン32は、従前よりも単純な
評価条件下で解探索をリトライする。これは、複合条件
での解探索が難しかった場合に、条件を簡略化して個体
近傍の新たな局所解を素早く見つけ、再度上位に個体移
動させるためである。
【0033】このように、より単純な評価条件を満たし
た個体は、1つ上位の進化個体群にステップアップし、
より複雑な評価条件下での最適化が行われる。一方、複
雑な評価条件を満たせなかった個体は、1つ下位の進化
個体群にステップダウンし、単純な評価条件下での最適
化を再トライする。
【0034】すなわち、段階的に条件が追加された評価
環境の下で、最適化演算を段階的に実行し、上下間で進
化個体群PGnの一部を相互に交換を行うことで、個体
の最適化度合いに応じた進化計算を自動的・自律的に行
うことが可能となる。それとともに、上位側における進
化個体群PGnの解探索も効率的に行われ、個体遺伝子
の偏りも避けられる(多様性の維持)。従って、局所解
に陥ったとしても、局所解脱出の可能性が飛躍的に高ま
るとともに、進化の進行度合いはより連続的になるた
め、複雑な評価条件下においても良質な解を高速に算出
することが可能となる。
【0035】ここで、上位に位置する複合度の増した解
空間において局所解(最適解)へは近いがアプローチが
難しい場合(解にたどり着くまでに1山あるようなケー
ス)を考える。本実施形態では、個体移民制御部33に
よる制御でステップアップしたものの進化に行き詰まっ
た場合、その個体をステップダウンし、下位側で若干の
修正を加えた後に再度ステップアップするというリトラ
イループが結果として構成される。
【0036】このリトライループによって、下位にステ
ップダウンした個体に若干の変更を加えて再びステップ
アップすれば、アプローチの角度が変わり、結果的に山
を迂回し解にたどり着く可能性を高めることができる。
すなわち、多数の条件が組み合わさった複雑な評価条件
が与えられるほど解空間が飛躍的に広がるため、従来の
単純GAでは局所解に陥り易いが、本実施形態に係る最
適化手法では、進化の進み具合は連続的となり、局所解
に陥ることなく良好な最適解が得られることになる。
【0037】また、本実施形態によれば、集団の多様性
が維持できるという効果もある。GAにおいて多様性の
維持こそが広い解探索を保証する唯一の拠り所であり、
下位側において生成・変更された個体を移民すること
は、上位側における集団の多様性維持に大きく貢献して
いる。また、下位側には上位側よりも拘束力が強い条件
を設けることで、最終的な最適解の探索を効率的に行う
ことが可能となる。一般に、ある条件に合致する解が存
在する空間は、与えられた条件の拘束力が大きいほど大
きくなる傾向がある。従って、下位側になるほど拘束力
の強い条件を段階的に追加し、下位側において求められ
た大域的な解を考慮した上で、上位側での解探索を実行
すれば、上位側での解探索を効率的に行うことが期待で
きる。
【0038】GAエンジン間での移民処理は、図4に示
す手順に従って実行される。この処理は、それぞれの個
体移民制御部33において独立して実行されるものであ
るが、以下、中間段であるn段目のGAエンジン32に
関する処理を例示しながら説明する。
【0039】先ず、ステップS1において、上位移民タ
イミング、すなわち、進化個体群PGnの一部を直上位
にステップアップさせるタイミングであるか否かが判断
される。このタイミングは、例えば20世代毎のような
固定タイミングでも良く、或いは一定確率による抽選で
決定しても良い。
【0040】ステップS1で肯定判定された場合には、
ステップS2に進む。これに対して、このステップS1
で否定判定された場合には、上位移民処理(ステップS
2〜S5)をスキップしてステップS6に進む。尚、最
上位のGAエンジン32に関しては、上位側にGAエン
ジン32が存在しないため、上位移民処理(すなわち、
移民のステップアップ処理および上位側からの交換移民
の受取り処理)は行われない。
【0041】ステップS2において、n段目の進化個体
群PGnの中で上位側にステップアップさせる一部個体
群、すなわち上位側への移民個体が決定される。具体的
には、所定の個体選択法に基づいて進化個体群を構成す
る個々の個体を評価し、基本的には、この進化個体群の
中で相対的な評価が良い個体をステップアップする移民
として選択する。選択される移民数は一定であり、進化
個体群PGnの全体個体数が進化計算中に変化すること
はない。また、移民数は、最初に全個体数からの割合で
決めるのが妥当である。
【0042】GAには評価値の良い個体を選択する手法
として一般的な手法がいくつかあり、適宜の手法に基づ
いて上位側への移民が決定される。これらの手法は、単
純に評価値が良いものだけを順位から一意に決定すると
いう方法ではなく、集団の遺伝子の多様性を維持すると
いう意味合いから確率的選択で行う。代表的なものとし
ては、ルーレット式選択、ランク方式選択、トーナメン
ト式選択等が挙げられる。標準的なGAにおいて、これ
らの手法は、次世代の個体を作り出す際の親個体の選択
に用いられるが、本実施形態ではそれと同等な選択方式
を採用している。
【0043】ステップS3において、上位側の進化個体
群PGn+1への移民に関する個体データが上位側である
(n+1)段目に送信される。すなわち、n段目で決定
された移民は、(n+1)段目に対して送信され、n段
目は、交換個体データの受信待ち状態となる(ステップ
S4)。そして、(n+1)段目からの交換個体データ
をn段目が受信すると、受信した受領個体データがn段
目の進化個体群PGnにセットされる(ステップS
5)。
【0044】ステップS5に続くステップS6におい
て、n段目が下位側である(n−1)段目からの移民個
体データを受信しているか否かが判断される。移民個体
データを受信している場合、ステップS7に進み、下位
移民処理(ステップS7〜S9)が行われる。最下位の
GAエンジン32に関しては、下位側にGAエンジン3
2が存在しないため、下位移民処理(すなわち、移民の
ステップダウン処理および下位側からの交換移民の受取
り処理)は行われない。
【0045】この下位移民処理では、例えば、「脚で立
つ」と「転倒しない」という2つの評価条件を満たした
個体を考えると、この個体が一つ上位の条件である「移
動する」という条件を加えた上位側のGAエンジン32
で評価されるべく移民したにも拘らず、その個体群の中
で評価値が悪い状態にいる場合、この個体は淘汰されて
しまうのではなく、もう一度もとの2つの評価条件の下
位側に移民されて近くの解が探索される。そこで、2つ
の評価条件において、評価値の良い個体となることで、
再度、上位の評価条件を加えたGAエンジン32での最
適化の挑戦が可能となる。
【0046】具体的は、ステップS7において、進化個
体群PGnの中で下位側に移動させる個体、すなわち下
位側への移民個体が決定される。この下位側への移民
は、所定の個体選択法に基づいて進化個体群を構成する
個々の個体を評価し、基本的には、この進化個体群の中
で相対的な評価が悪い個体をステップダウンさせる移民
として選択する。下位側への移民数は一定であり、進化
個体群PGnの全体個体数が進化計算中に変化すること
はない。また、移民数は、最初に全個体数からの割合で
決めるのが妥当である。下位側への移民を決定する手法
としては、逆ルーレット式選択、逆ランク方式選択、逆
トーナメント式選択といった周知の手法を用いることが
でき、選択率を評価値に関して逆転させて(評価値の悪
い方が選択率が高まるように)使用する。
【0047】ステップS8において、n段目は、下位側
の進化個体群PGn-1への移民に関する個体データを下
位側である(n−1)段目に送信する。そして、ステッ
プS9において、n段目の進化個体群PGnには、一部
個体を移民として削除したことに代えて、下位側からの
受領個体データがセットされ、次の世代の進化計算へ進
む。
【0048】尚、上述の移民処理は、互いに隣接した直
近の進化個体群PGn,PGn+i(またはPGn,PG
n-1)の間で個体移動を行う例について説明したが、例
えば2つ跳ばしといった飛び級的な個体移動に対して適
用することも可能である。更に、上述したリトライルー
プによる最適解の精度向上よりも処理速度の方を優先す
る場合には、ステップダウンを行うことなく、ステップ
アップのみを単独で行っても良い。その場合、ステップ
ダウンについては単独で行っても意味はなく、ステップ
アップと併せて行う必要がある。
【0049】以上の世代進化計算に対し、最上位に位置
する収束判定部34は、最上位のGAエンジン32によ
り算出された進化個体群PGNを常時観測し、最終的な
評価条件である「条件1+2+・・・+N」を満足する
最適化が行われたか否かを判断する。具体的は、この
「評価条件1+2+・・・+N」に適合する個体ほど高
い適合度が得られるように適切に設定された評価関数に
基づいて、最上位の進化個体群PGNを構成する個体を
個別に評価する。
【0050】そして、ある世代Kにおいて、満足な最適
化が完了しない場合には、個体移民を伴う世代進化計算
を続行し、最適化が満足されたならば、最上位の演算結
果をパラメータ発生器10に出力するとともに、各GA
エンジン32に対してGA演算の終了を指示する。これ
により、GAエンジン群30で全体の最適化演算が終了
する。
【0051】尚、最適化の結果を見て新たな評価条件を
逐次的に追加(挿入)したい場合には、その評価条件を
加えた新たなGAエンジン32を一つ追加すれば良い。
GAエンジン32の追加(挿入)位置は、新たに追加
(挿入)する評価条件に関する拘束力の強さに基づいて
決定する。つまり、追加する条件の拘束力が強いなら
ば、下位側にGAエンジン32を追加することが好まし
く、追加する条件の拘束力が弱いならば、上位側にGA
エンジン32を追加することが好ましい。これにより、
実際の解探索アプローチにマッチした優れた利便性を有
するシステムを実現することができる。
【0052】GAエンジン群30での最適化演算が終了
すると、パラメータ発生器10において、GAエンジン
群30で進化させた個体からシミュレータ20又は歩行
型ロボット1に出力する制御パラメータが生成・更新さ
れる。
【0053】本実施形態においては、歩行型ロボット1
を四脚歩行型ロボットとして、その歩容パターンを生成
するケースについて説明する。歩行型ロボット1は、図
5,図6に示すように、胴体部2から延出される4つの
脚部3a,3b,3c,3dを備え、各脚部を駆動する
サーボ機構や姿勢を検出する検出部を備えている。そし
て、上下方向の動きを与える各脚部の関節角θ2,θ3
及び前後・左右方向の動きを与える関節角θ1に対する
指示値を入力することにより、サーボ機構によって各脚
部の関節の駆動し、歩行を行う。
【0054】パラメータ発生器10は、3層のフィード
フォワード型ニューラルネットワークから構成され、各
個体の遺伝子をニューロン間の結合係数として、シグモ
イド関数を用いる。このニューラルネットワークの結合
係数が段階的進化法で調整され、最適な歩容パターンが
生成される。歩行は周期運動であることから、図7に示
す1脚分のニューラルネットワークには、経過時間tと
歩行周期wとを引数とするsin関数とcos関数とを
入力し、歩行型ロボット1の各関節角度指示値θ1,θ
2,θ3を出力する。
【0055】パラメータ発生器10からの関節角度指示
値が歩行型ロボット1に出力されると、歩行型ロボット
1ではサーボ機構により各関節指示値に基づいて各脚部
を適当な位相差で駆動して歩行を行い、実際の各関節角
度θ1,θ2,θ3や姿勢データ等をGAエンジン群3
0の評価部31に対して出力する。
【0056】一方、シミュレータ20は、実機の歩行型
ロボット1を模擬したモデルであり、パラメータ発生器
10からの関節角度指示値が入力されると、ロボットの
姿勢、歩行距離、転倒判定等の演算を行い、結果をGA
エンジン群30の評価部31に対して出力する。
【0057】図8は、シミュレータ20における処理手
順を示し、この処理では、先ず、ステップS11におい
て、パラメータ発生器10から関節指示値を受け取る。
次にステップS12へ進み、ロボットモデルから関節指
示値に基づいて各脚部の位置を計算し、ステップS13
で各脚部の位置から全体の姿勢を計算する。
【0058】続くステップS14においては、先に計算
したロボットの脚部の位置や姿勢から体の角度が設定限
度を越え、転倒したか否かが判断される。そして、転倒
したと判断される場合には、ステップS17へジャンプ
し、転倒していないと判断される場合、ステップS15
で各脚部の位置及び姿勢から安定性を計算し、ステップ
S16で歩容パターンの1周期が終了したか否かを判断
する。そして、1周期分のシミュレーションが終了して
いない場合には、ステップS11へ戻って同様の処理を
続行する。
【0059】一方、ステップS14における転倒判断、
或いはステップS16における1周期分のシミュレーシ
ョン終了判断がなされると、ステップS17において、
ロボットの総移動距離、使用エネルギーが計算される。
そして、ステップS18で評価部31にデータが渡さ
れ、1周期分の処理が終了する。
【0060】評価部31において歩容パターンを評価す
る評価条件としては、「脚で立つ(体を地面につけな
い)」,「転倒しない」といった拘束の強い条件をはじ
めとして、比較的拘束の弱い「使用するエネルギーが少
ない」,「なるべく姿勢を崩さずに歩行する」,「なる
べく足音を立てずに歩行する」といった様々な条件が考
えられる。このうち拘束力が強い条件が下位になるよう
に、図2に示した各GAエンジン32に評価条件を個別
に割り当てていく。
【0061】例えば、「脚で立つ」という評価条件を最
下位に割り当てた場合における下位空間(調整パラメー
タがなす空間)では、「脚で立つ」いくつかの局所解が
GAによる進化で算出される。この局所解は、下位空間
上に多数存在し、互いに無関係の位置にあるかも知れな
いものの、この局所解近傍にある個体を確率的に選択す
ることで、「脚で立つ+転倒しない」を評価条件とする
上位側に移民する。上位側では、「脚で立つ」という条
件については、そこそこの評価を得ている個体から進化
操作が行えるので、最適解発見の可能性が高まる。
【0062】また、上位側からは評価が低い個体を移民
として受け入れ、「脚で立つ」という単純な条件のみで
解探索をやり直す。その理由は、上述したように、複合
条件での解探索が難しかった場合、条件を単一化・簡略
化することにより、その個体近傍に存在する新たな局所
解を素早く見つけ、再度上位に個体移動させるためであ
る。
【0063】このように、歩行型ロボットとして満たす
べき評価条件が多数で、且つ相互に複雑な関連をもつ場
合においても、GAによる最適化演算を段階的に接続
し、相互に進化個体交換を行うことで、個体の最適化度
合いに応じた進化計算を自動的・自立的に行うことがで
き、最適な歩容を生成することができる。
【0064】また、より望ましい歩行を実現する歩容の
解探索も効率的に行うことができ、個体遺伝子の偏りも
避けられる。一部の評価条件によって歩容が局所解にト
ラップされる可能性が低くなり、進化の度合いがより継
続的になる。
【0065】
【発明の効果】以上説明したように本発明によれば、歩
行型ロボットが満たすべき複数の評価条件を下位から上
位に向かって段階的に分割し、下位側の進化個体群と上
位側の進化個体群との間で個体の評価値に応じて個体交
換を行いながら、各段の評価条件に適合した最適解の候
補をそれぞれ演算し、最上位の進化個体群の最適化演算
が収束判定されたとき、この最上位の進化個体群に基づ
いて歩行型ロボットの制御パラメータを更新するので、
歩容生成における最適解の収束性を高めて進化の停滞を
防止し、高速且つ信頼性の高い歩容パターンを得ること
ができる。
【図面の簡単な説明】
【図1】ロボット装置の全体構成図
【図2】段階的進化法を用いた最適化装置のブロック図
【図3】複数の演算装置を用いた最適化装置のブロック
【図4】GAエンジン間での移民処理のフローチャート
【図5】4脚歩行型ロボットに上下方向の動きを与える
関節角の説明図
【図6】4脚歩行型ロボットに前後・左右方向の動きを
与える関節角の説明図
【図7】1脚分の歩容パターンを生成するニューラルネ
ットワークの説明図
【図8】シミュレータの処理を示すフローチャート
【符号の説明】
1 歩行型ロボット 3a,3b,3c,3d 脚部 10 パラメータ発生器 20 シミュレータ 30 GAエンジン群 31 評価部 32 GAエンジン 33 個体移民制御部 34 収束判定部 PGn 進化個体群

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 遺伝的アルゴリズムに基づいて、単一或
    いは複数の脚部により歩行する歩行型ロボットが満たす
    べき複数の評価条件を下位から上位に向かって段階的に
    分割し、各段の評価条件に適合した最適解の候補を進化
    個体群としてそれぞれ演算する手段と、 下位側の進化個体群と上位側の進化個体群との間で個体
    の評価値に応じて個体交換を行う手段と、 最上位の進化個体群に基づいて最適化演算の収束判定を
    行う手段と、 最適化演算が収束した最上位の進化個体群に基づいて、
    上記歩行型ロボットの制御パラメータを更新する手段と
    を備えたことを特徴とするロボット装置。
  2. 【請求項2】 上記進化個体群の演算を、複数の演算器
    で分散して実行することを特徴とする請求項1記載のロ
    ボット装置。
  3. 【請求項3】 上記評価値を、上記歩行型ロボットの動
    きをモデル化したシミュレータからのデータに基づいて
    算出することを特徴とする請求項1又は2記載のロボッ
    ト装置。
  4. 【請求項4】 上記評価値を、上記歩行型ロボットから
    の実機データに基づいて算出することを特徴とする請求
    項1,2,3の何れか一に記載のロボット装置。
JP2002116510A 2002-04-18 2002-04-18 ロボット装置 Expired - Fee Related JP3905413B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002116510A JP3905413B2 (ja) 2002-04-18 2002-04-18 ロボット装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002116510A JP3905413B2 (ja) 2002-04-18 2002-04-18 ロボット装置

Publications (2)

Publication Number Publication Date
JP2003311669A true JP2003311669A (ja) 2003-11-05
JP3905413B2 JP3905413B2 (ja) 2007-04-18

Family

ID=29534059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002116510A Expired - Fee Related JP3905413B2 (ja) 2002-04-18 2002-04-18 ロボット装置

Country Status (1)

Country Link
JP (1) JP3905413B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2005077611A1 (ja) * 2004-02-16 2007-10-18 本田技研工業株式会社 移動ロボットの歩容生成装置
CN105956297A (zh) * 2016-05-09 2016-09-21 金陵科技学院 一种冗余机器人运动灵活性能综合评价与优化方法
US9927966B2 (en) 2014-03-07 2018-03-27 Siemens Aktiengesellschaft Method for enabling an interaction between an assistance device and a medical apparatus and/or an operator and/or a patient, assistance device, assistance system, unit, and system
JP6326167B1 (ja) * 2017-03-31 2018-05-16 株式会社ドワンゴ 学習装置、学習方法、学習プログラム、動画配信装置、活動装置、活動プログラムおよび動画生成装置
CN113190029A (zh) * 2021-04-06 2021-07-30 北京化工大学 基于深度强化学习的四足机器人适应性步态自主生成方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105353760B (zh) * 2015-12-15 2018-04-24 中国北方车辆研究所 基于支撑域位置反馈的足式机器人机身摆动幅度规划方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2005077611A1 (ja) * 2004-02-16 2007-10-18 本田技研工業株式会社 移動ロボットの歩容生成装置
JPWO2005077610A1 (ja) * 2004-02-16 2007-10-18 本田技研工業株式会社 移動ロボットの歩容生成装置
JP4800038B2 (ja) * 2004-02-16 2011-10-26 本田技研工業株式会社 移動ロボットの歩容生成装置
JP4800039B2 (ja) * 2004-02-16 2011-10-26 本田技研工業株式会社 移動ロボットの歩容生成装置
US9927966B2 (en) 2014-03-07 2018-03-27 Siemens Aktiengesellschaft Method for enabling an interaction between an assistance device and a medical apparatus and/or an operator and/or a patient, assistance device, assistance system, unit, and system
CN105956297A (zh) * 2016-05-09 2016-09-21 金陵科技学院 一种冗余机器人运动灵活性能综合评价与优化方法
CN105956297B (zh) * 2016-05-09 2022-09-13 金陵科技学院 一种冗余机器人运动灵活性能综合评价与优化方法
JP6326167B1 (ja) * 2017-03-31 2018-05-16 株式会社ドワンゴ 学習装置、学習方法、学習プログラム、動画配信装置、活動装置、活動プログラムおよび動画生成装置
JP2018173790A (ja) * 2017-03-31 2018-11-08 株式会社ドワンゴ 学習装置、学習方法、学習プログラム、動画配信装置、活動装置、活動プログラムおよび動画生成装置
CN113190029A (zh) * 2021-04-06 2021-07-30 北京化工大学 基于深度强化学习的四足机器人适应性步态自主生成方法
CN113190029B (zh) * 2021-04-06 2023-02-28 北京化工大学 基于深度强化学习的四足机器人适应性步态自主生成方法

Also Published As

Publication number Publication date
JP3905413B2 (ja) 2007-04-18

Similar Documents

Publication Publication Date Title
KR102086815B1 (ko) 인공 신경망을 구성하는 복수의 학습 모델 중 최적 학습 모델 선택 방법 및 장치
Stork et al. A new taxonomy of global optimization algorithms
Gomez et al. Solving non-Markovian control tasks with neuroevolution
US7072741B2 (en) Robot control algorithm constructing apparatus
Kramer Iterated local search with Powell’s method: a memetic algorithm for continuous global optimization
Qazani et al. Optimising control and prediction horizons of a model predictive control-based motion cueing algorithm using butterfly optimization algorithm
US12019967B2 (en) Routing connections in integrated circuits based on reinforcement learning
Shao et al. Towards hardware accelerated reinforcement learning for application-specific robotic control
Gaier et al. Data-efficient neuroevolution with kernel-based surrogate models
Feldt et al. Broadening the search in search-based software testing: It need not be evolutionary
US20070179917A1 (en) Intelligent design optimization method and system
Koppejan et al. Neuroevolutionary reinforcement learning for generalized helicopter control
Nygaard et al. Multi-objective evolution of fast and stable gaits on a physical quadruped robotic platform
Varghese et al. A hybrid multi-task learning approach for optimizing deep reinforcement learning agents
Wang et al. A surrogate-assisted controller for expensive evolutionary reinforcement learning
JP2003311669A (ja) ロボット装置
Liu et al. Retrosynthetic planning with dual value networks
EP1251459A2 (en) Optimization system using genetic algorithm, control apparatus, optimization method, and program and storage medium therefor
JP2004116351A (ja) 制御パラメータの最適化システム
Chidambaran et al. Multi-criteria evolution of neural network topologies: Balancing experience and performance in autonomous systems
CN101894063A (zh) 一种用于微处理器功能验证的测试程序生成方法及装置
KR102190100B1 (ko) 인공 신경망 학습 방법
Stork et al. Surrogate models for enhancing the efficiency of neuroevolution in reinforcement learning
Galinier et al. Genetic algorithm to improve diversity in MDE
Lin et al. Efficient reinforcement learning through dynamic symbiotic evolution for TSK-type fuzzy controller design

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050401

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060912

A521 Written amendment

Effective date: 20061109

Free format text: JAPANESE INTERMEDIATE CODE: A523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Effective date: 20061219

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Effective date: 20070111

Free format text: JAPANESE INTERMEDIATE CODE: A61

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 4

Free format text: PAYMENT UNTIL: 20110119

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110119

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 5

Free format text: PAYMENT UNTIL: 20120119

LAPS Cancellation because of no payment of annual fees