JP2011240475A - ロボットおよび制御システム - Google Patents

ロボットおよび制御システム Download PDF

Info

Publication number
JP2011240475A
JP2011240475A JP2010194891A JP2010194891A JP2011240475A JP 2011240475 A JP2011240475 A JP 2011240475A JP 2010194891 A JP2010194891 A JP 2010194891A JP 2010194891 A JP2010194891 A JP 2010194891A JP 2011240475 A JP2011240475 A JP 2011240475A
Authority
JP
Japan
Prior art keywords
action
external
module
robot
internal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010194891A
Other languages
English (en)
Other versions
JP5465137B2 (ja
Inventor
Takumi Kamioka
拓未 上岡
Masanori Takeda
政宣 武田
Mitsuhide Kuroda
貢秀 黒田
Hide Kanzaki
秀 神崎
Tomoaki Tanaka
智明 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2010194891A priority Critical patent/JP5465137B2/ja
Publication of JP2011240475A publication Critical patent/JP2011240475A/ja
Application granted granted Critical
Publication of JP5465137B2 publication Critical patent/JP5465137B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B62LAND VEHICLES FOR TRAVELLING OTHERWISE THAN ON RAILS
    • B62DMOTOR VEHICLES; TRAILERS
    • B62D57/00Vehicles characterised by having other propulsion or other ground- engaging means than wheels or endless track, alone or in addition to wheels or endless track
    • B62D57/02Vehicles characterised by having other propulsion or other ground- engaging means than wheels or endless track, alone or in addition to wheels or endless track with ground-engaging propulsion means, e.g. walking members
    • B62D57/032Vehicles characterised by having other propulsion or other ground- engaging means than wheels or endless track, alone or in addition to wheels or endless track with ground-engaging propulsion means, e.g. walking members with alternately or sequentially lifted supporting base and legs; with alternately or sequentially lifted feet or skid
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S901/00Robots
    • Y10S901/01Mobile robot

Landscapes

  • Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Robotics (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • Transportation (AREA)
  • Manipulator (AREA)

Abstract

【課題】
連続状態変数および離散状態変数の組み合わせ最適化問題の解導出の高速化を図ることができる制御システム等を提供する。
【解決手段】
内部モジュールmod1による行動候補ai1の探索範囲(第1探索範囲)は、低周波の外部モジュールmod2による外部行動候補ai2の探索範囲(第2探索範囲)よりも狭くすることで、その分だけ演算処理が早くなる。これにより、ロボットRの状態測定値に鑑みて、ロボットRが外乱に緊急に対応する必要がある場合、低周波の外部モジュールmod2の演算処理結果を待たずに、高周波の内部モジュールmod1の演算処理結果にしたがってロボットRの動作が制御されうる。
【選択図】 図9

Description

本発明は、制御システムおよびその制御対象の1つであるロボットに関する。
多自由度ロボットの制御は複数の制約を満たす多次元の制御入力を実時間で決定する問題である。従来、この問題が線形問題に分解され、当該線形問題の組み合わせによってロボットの制御が実現されていた。近年ではロボットのより複雑な動きを実現するため、当該問題を多目的最適化問題として定式化し、直接的に解を求めることにより制御量を決定する手法が提案されている(特許文献1参照)。
最適化問題の目的関数は、ロボットの状態ベクトルを入力値とし、スカラー値を出力値とする関数である。ロボットの動きには冗長性があり、多目的および多制約がスカラー値で評価されるので、解を求めるのが容易な凸関数により目的関数を定義することは困難である。このため、問題が非凸最適化問題となるが、探索的アルゴリズムによる解法が一般的である。
また、ロボットの制御には実時間性が要求される。しかるに、当該最適化問題は当該目的関数の最大化と解導出とのトレードオフ問題となる。一般的に解導出にかけられる演算時間は制御目的と制御対象から決定される制御周期内で行われる必要があるため、ロボット外部に設けた高速演算装置を用いるなど高速化が図られている(特許文献2参照)。
特開2004−306231号公報 特開2006−88331号公報
しかし、ロボットの行動において決定されるべき変数、すなわち、前記最適化問題における変数には、ロボットの着地位置指令などの連続状態変数値のみならず、歩行および走行など、行動の種類を指定するためのフラグのような有限離散状態変数も含まれている。有限離散状態変数はその変化に応じて目的関数の値が不連続に大きく変化する。
このため、進化的アルゴリズムまたは焼きなまし法など、解候補の評価値に基づいて次の探索点が決定されるような効率的な探索アルゴリズムが適用されえない。その結果、連続値(実数値)および離散値が含まれる最適化問題を解くためには、全探索またはランダム探索など、非効率的な探索手法しか適用されていなかった。したがって、ロボットの制御に必要な実時間性のある解導出、さらにはロボットの行動決定が困難であった。
また、外部演算装置を用いた場合、通信遅延などにより制御周期が保証されない可能性がある。2脚歩行ロボットに代表される倒立振子型の移動体などの制御において、制御周期の遅れは転倒など修正不可能な状態に繋がるため、通信遅延を補償するシステムが必要である。
そこで、本発明は、連続状態変数および離散状態変数の組み合わせ最適化問題によって定義される制御問題の解導出の高速化を図ると共に、通信遅延を補償することができる制御システム等を提供することを解決課題とする。
前記課題を解決するための本発明の制御システムは、制御対象の動力源であるアクチュエータを駆動する制御モジュールと、前記制御対象に搭載され、前記制御対象の動作状態を表わす状態測定値を検出するように構成されている高周波の内部モジュールと、前記制御対象の外部にある低周波の外部モジュールとを備え、前記外部モジュールが、前記内部モジュールから前記制御対象の最近の状態測定値を無線により受信した上で、前記制御対象の最近の状態測定値に基づき、一または複数の連続状態変数値および一または複数の離散状態変数値により表わされる前記制御対象の単位行動形態の組み合わせとしての外部行動候補であって、当該連続状態変数値により表わされる前記制御対象の予測状態に基づいた、当該外部行動候補の指定行動目的に対する適合度に応じた少なくとも1つの外部行動候補を外部行動計画として第2探索範囲において探索し、当該探索した前記外部行動計画を前記内部モジュールに対して無線で送信するように構成され、前記内部モジュールが、前記外部モジュールにより探索された前記外部行動計画を無線により受信した上で、前記状態測定値に基づき、前記一または複数の連続状態変数値および前記一または複数の離散状態変数値により表わされる前記制御対象の単位行動形態の組み合わせとしての内部行動候補であって、当該連続状態変数値により表わされる前記制御対象の予測状態に基づいた、当該内部行動候補の指定行動目的に対する適合度に応じた少なくとも1つの内部行動候補を内部行動計画として、前記外部行動計画を包含する一方で前記第2探索範囲よりも狭い第1探索範囲において探索するように構成され、前記制御モジュールが、前記内部モジュールにより決定された前記内部行動計画にしたがって、前記アクチュエータの動作を制御するように構成されていることを特徴とする(第1発明)。
本発明の制御システムによれば、内部モジュールおよび外部モジュールのそれぞれが、一または複数の連続状態変数値および一または複数の離散状態変数値により表わされる制御対象の複数の行動候補の中から、各行動候補の指定行動目的に対する適合度に応じて当該制御対象の行動計画を探索するという並列演算処理を実行するように構成されている。この意味で、各モジュールは並列演算装置に該当する。内部モジュールの演算処理能力のみならず、外部モジュールの演算処理能力も利用されることにより、内部行動計画の決定(解の導出)に要する演算処理時間の短縮が図られている。
低周波の外部モジュールによる外部行動計画の探索範囲(第2探索範囲)は、高周波の(外部モジュールよりも演算周期が短い)内部モジュールによる内部行動計画の探索範囲(第1探索範囲)よりも広い。その結果、内部モジュールにより探索された内部行動計画よりも、指定行動目的に対する適合度が高い外部行動計画が外部モジュールによって探索されうる。
したがって、前記のように解の導出に要する演算処理時間の短縮を図りながらも、内部モジュール単独で解としての内部行動計画が決定される場合と比較して、指定行動目的に鑑みて最適な形態で制御対象の動作が制御されうる。
その一方、内部モジュールによる演算処理結果さえ得られれば、制御対象の動作が制御されうる。高周波の(外部モジュールよりも演算周期が短い)内部モジュールによる行動計画の探索範囲(第1探索範囲)は、低周波の外部モジュールによる外部行動計画の探索範囲(第2探索範囲)よりも狭いが、その分だけ演算処理が早い。これにより、制御対象の状態測定値(制御対象の状態を表わす状態変数の計測器による測定値)に鑑みて、制御対象が外乱に緊急に対応する必要がある場合、低周波の外部モジュールの演算処理結果を待たずに、高周波の内部モジュールの演算処理結果にしたがって制御対象の動作が制御されうる。
よって、制御対象が行動候補にしたがって行動した場合の結果および当該行動候補を構成する複数種類の単位行動形態の組み合わせ最適化問題の解としての、当該制御対象の内部行動計画の導出の高速化を図ることができる。その結果、任意形態の外乱に対して、制御対象の行動目的に鑑みて適当な形態で、当該制御対象を行動させることができる。
前記外部モジュールが、一または複数の連続状態変数値および一または複数の離散状態変数値により表わされる外部行動計画を探索するにあたって、全てまたは一部の離散状態変数値に対する連続状態変数値の最適な組み合わせを探索アルゴリズムによって決定し、全てまたは一部の離散状態変数値に対する連続状態変数値の最適な組み合わせの中で最高の適合度となる離散状態変数値と連続状態変数値の組み合わせを最適な行動として決定するように構成されていてもよい(第2発明)。
前記外部モジュールが、前記外部行動候補のそれぞれについて、前記指定行動目的とは異なる副行動目的に対する副適合度を評価し、前記適合度の寄与度が前記副適合度の寄与度よりも高くなるように総合適合度を評価するように構成され、前記総合適合度の評価結果に応じて前記外部行動計画を決定するように構成されていてもよい(第3発明)。
前記外部モジュールが、前記外部行動候補のそれぞれについて、前記適合度eおよび前記副適合度esubに基づき、評価式f=e(esub+1)またはf=w1e(w2sub+1)(ここで、w1=(w2+1)-1)にしたがって前記総合適合度f1を評価するように構成されていてもよい(第4発明)。
当該構成の制御システムによれば、外部モジュールが指定行動目的を優先させながらも、他の行動目的をも勘案した形で、制御対象の外部行動候補が探索される。また、外部行動候補のそれぞれについて、指定行動目的に鑑みた適合度が、他の行動目的に鑑みた副適合度よりも寄与度が高くなるように総合適合度が評価される。
したがって、外乱が発生した場合、当初は応答が速い内部モジュールによる演算処理結果(内部行動計画)によって求められる指定行動目的のみが制御対象の行動形態に反映され、この外乱による影響の迅速な低減が図られる。そして、時間経過とともに応答が遅い外部モジュールによる演算処理結果(外部行動計画)によって求められる指定行動目的に加えて他の行動目的もが制御対象の行動形態に反映され、当該目的のすべてに適合するような制御対象の行動形態の回復が図られる。これにより、任意形態の外乱に対して、制御対象の行動目的に鑑みて適当な形態で、当該制御対象を行動させることができる。
前記内部モジュールおよび前記外部モジュールのそれぞれが、基体と、前記基体から延設された複数の脚体とを有する前記制御対象としてのロボットの、前記複数種類の単位行動形態としての歩行、走行および片足跳びの指定の組み合わせにより構成される指定歩数にわたる目標歩容を前記内部行動候補および前記外部行動候補のそれぞれとして探索するように構成されていてもよい(第5発明)。
前記内部モジュールおよび前記外部モジュールのそれぞれが、前記ロボットの姿勢を安定させることを前記指定行動目的として、前記適合度を評価するように構成されていてもよい(第6発明)。
当該構成の制御システムによれば、前記のように組み合わせ最適化問題の解導出の高速化を図るとともに、歩行、走行および片足跳びの組み合わせにより構成される歩容のうち、指定行動目的に鑑みて最適な形態の歩容にしたがって、制御対象であるロボットの動作が制御されうる。
第5または第6発明の制御システムにおいて、前記内部モジュールが、前記外部モジュールから今回の前記外部行動計画としての今回目標歩容を受信していないまま、今回の前記内部行動計画を探索する場合、前記外部モジュールから前回の前記外部行動計画として受信した前回目標歩容を構成するi+1歩目(i=1〜n−1。nは前記指定歩数。)の歩容を、i歩目の歩容として有する暫定的な今回目標歩容を認識した上で、当該暫定的な今回目標歩容を包含する前記第1探索範囲において今回の前記内部行動計画を探索するように構成されていてもよい(第7発明)。
当該構成の制御システムによれば、暫定的な今回目標歩容にしたがって、ロボットの歩容が制御される。これにより、内部モジュールによる探索に時間がかかった場合、内部モジュール間でデータをやり取りする通信ラインが混雑した場合、または、内部モジュールと外部モジュールとの無線通信に支障が生じた場合でも、ロボットの歩容が継続的に制御されうる。
その後、モジュール間の無線通信障害が解消され、外部モジュールにより生成された外部行動計画としての次回目標歩容が、内部モジュールにより無線により受信された場合、制御モジュールにより、暫定的な今回目標歩容に代えてこの次回目標歩容にしたがってロボットの歩容が制御されうる。すなわち、一時的に無線通信障害が発生した場合でも、ロボットに動作を停止させることなく歩行等の動作を継続させることができる。
前記課題を解決するための本発明のロボットは、基体と、前記基体から延設されている複数の脚体とを備え、前記複数の脚体の動作により移動する前記制御対象としてのロボットであって、第5〜第7発明のうち1つの制御システムを構成する前記制御モジュールおよび前記内部モジュールを備えていることを特徴とする(第8発明)。
本発明のロボットによれば、制御対象であるロボットが行動候補にしたがって行動した場合の結果(連続状態変数値により表わされる。)および当該行動候補を構成する複数種類の単位行動形態(離散状態変数値により表わされる。)の組み合わせ最適化問題の解としての、当該制御対象の内部行動計画の導出の高速化を図ることができる。これにより、任意の外乱に対して、ロボットの行動目的に鑑みて適当な形態で、当該ロボットを行動させることができる。
本発明の一実施形態としてのロボットの構成説明図。 ロボットの制御システムの構成説明図。 モジュール間の信号のやり取りに関する説明図。 各モジュールによる並列演算処理に関する説明図。 ロボットの歩容の単位構成要素(行動形態)に関する説明図。 未来状態の予測に関する説明図。 適合度の評価方法に関する説明図。 行動候補探索の多様性および収束性に関する説明図。 ロボットの行動に関する説明図。 ロボットの歩容制御に関する説明図。
本発明の制御システムおよびその制御対象の実施形態について図面を用いて説明する。
(ロボットの構成)
まず、本発明の一実施形態としてのロボットの構成について説明する。
図1に示されているロボットRは脚式移動ロボットであり、人間と同様に、基体B0と、基体B0の上方に配置された頭部B1と、基体B0の上部に上部両側から延設された左右の腕体B2と、左右の腕体B2のそれぞれの先端に設けられているハンドHと、基体B0の下部から下方に延設された左右の脚体B4とを備えている。
基体B0はヨー軸回りに相対的に回動しうるように上下に連結された上部および下部により構成されている。頭部B1は基体B0に対してヨー軸回りに回動する等、動くことができる。
腕体B2は第1腕体リンクB22と、第2腕体リンクB24とを備えている。基体B0と第1腕体リンクB21とは肩関節機構(第1腕関節機構)B21を介して連結され、第1腕体リンクB22と第2腕体リンクB24とは肘関節機構(第2腕関節機構)B23を介して連結され、第2腕体リンクB24とハンドHとは手首関節機構(第3腕関節機構)B25を介して連結されている。肩関節機構B21はロール、ピッチおよびヨー軸回りの回動自由度を有し、肘関節機構B23はピッチ軸回りの回動自由度を有し、手首関節機構B25はロール、ピッチ、ヨー軸回りの回動自由度を有している。
脚体B4は第1脚体リンクB42と、第2脚体リンクB44と、足部B5とを備えている。基体B0と第1脚体リンクB42とは股関節機構(第1脚関節機構)B41を介して連結され、第1脚体リンクB42と第2脚体リンクB44とは膝関節機構(第2脚関節機構)B43を介して連結され、第2脚体リンクB44と足部B5とは足関節機構(第3脚関節機構)B45を介して連結されている。
股関節機構B41はロール、ピッチおよびロール軸回りの回動自由度を有し、膝関節機構B43はピッチ軸回りの回動自由度を有し、足関節機構B45はロールおよびピッチ軸回りの回動自由度を有している。股関節機構B41、膝関節機構B43および足関節機構B45は「脚関節機構群」を構成する。なお、脚関節機構群に含まれる各関節機構の並進および回転自由度は適宜変更されてもよい。また、股関節機構B41、膝関節機構B43および足関節機構B45のうち任意の1つの関節機構が省略された上で、残りの2つの関節機構の組み合わせにより脚関節機構群が構成されていてもよい。さらに、脚体B4が膝関節とは別の第2脚関節機構を有する場合、当該第2脚関節機構が含まれるように脚関節機構群が構成されてもよい。足部B5の底には着地時の衝撃緩和のため、特開2001−129774号公報に開示されているような弾性素材B52が設けられている。
ロボットRには、ロボットRの世界座標系における位置および姿勢などの内部状態を測定するための複数の内部状態センサS1が搭載されている。ロボットRの各関節機構の屈曲角度(関節角度)に応じた信号を出力するエンコーダ(図示略)、基体B0の姿勢(方位角および仰角により特定される。)に応じた信号を出力する傾斜センサ、および、足部B5および着地および離床の別を判定するための圧力センサなどが内部状態センサS1に該当する。ロボットRの周囲の様子を撮像し、当該撮像座標に基づいて世界座標系に固定されている標識の位置を認識することにより、世界座標系におけるロボットRの位置を認識するための撮像装置が内部状態センサS1に該当する。
たとえば、頭部B1に搭載され、ロボットRの前方を撮像範囲とするCCDカメラ、赤外線カメラ等、種々の周波数帯域における光を感知しうる左右一対の頭カメラC1が撮像装置として採用されうる。また、基体B0の前側下部に搭載され、ロボットRの前方下方に向けて発せられた近赤外レーザー光の物体による反射光を検知することによりこの物体の位置や方位等を測定するための腰カメラ(アクティブセンサ)C2が撮像装置として採用されうる。
ロボットRには、その周辺における物体の位置などの外部状態を測定するための外部状態センサS2が搭載されている。前記のような撮像装置が外部状態センサS2に該当する。
ロボットRは制御システム1の一部を構成するコンピュータと、前記の複数の関節機構のそれぞれを動かすための複数のアクチュエータ2とを備えている。ロボットRの内部状態および外部状態に応じて制御システム1から出力される制御指令にしたがってアクチュエータ2のそれぞれの動作が制御されることにより、ロボットRがさまざまな態様で適応的に行動することができる。
(制御システムの構成)
図2に示されている制御システム1は、ロボットRに搭載されている制御モジュールmod0および内部モジュールmod1(内部並列演算装置)と、ロボットRの外部に設置されているコンピュータ・クラスターにより構成されている外部モジュールmod2(外部並列演算装置)とを備えている。
内部モジュールmod1は第1演算周期T1ごとに入力信号を演算処理することにより出力信号の生成を繰り返すように構成されている。外部モジュールmod2は第1演算周期T1より長い第2演算周期T2(たとえばT2=4T1)ごとに入力信号を演算処理することにより出力信号の生成を繰り返すように構成されている。
(ロボットの機能)
前記構成のロボットRの機能について説明する。
(制御システムの基本的思想)
本発明の制御システムは、制御対象であるロボットRの行動形態を表すためのn個の連続状態変数値およびm個の離散状態変数値の組み合わせの最適化問題を解決するように構成されている。具体的には、n個の連続状態変数値x={x,‥,x}およびm個の離散状態変数値z={z1,‥,z}の組み合わせのうち、ロボットRの指定行動目的に対する適合度が最高となる1つの組み合わせが、当該ロボットRの行動計画として決定される。この手法は、式(002)によって表わされる連続値離散値混合最適化問題として定義される。
find{x*, z*}=argmax f(x, z) ..(002)。
ここで「f」は、連続値および離散値の組み合わせ状態変数空間{x,z}∈Sから、スカラー空間(1次元の実数空間)Rへの写像関数(f:S→R)であって、適合度を評価するために用いられる。「x*」および「z*」は、適合度が最高となるようなベクトルxおよびzの組み合わせを表わしている。
(制御システムによる演算処理手順)
制御システム1により、次の手順にしたがってアクチュエータ2の動作およびロボットRの行動が制御される。
まず、制御モジュールmod0に対してロボットRの最近の状態測定値を表わす状態変数の測定値が入力される。具体的には、内部状態センサS1からの出力信号に基づき、ロボットRの世界座標系における位置(着地位置およびZMP位置など)および姿勢(基体B0の姿勢)などの内部状態変数値が認識される。また、外部状態センサS2からの出力信号に基づき、ロボットRの周囲にある物体のサイズおよび世界座標系における位置などの外部状態変数値が認識される。
なお、物体のサイズおよび位置などの外部状態を表わすデータがロボットRの外部から制御システム1に入力または送信されることにより、制御モジュールmod0が外部状態の一部または全部を認識してもよい。
ロボットRの「状態変数値」は第1演算周期T1ごとに制御モジュールmod0から内部モジュールmod1に入力される(図3/矢印D1+参照)。さらに、外部行動計画処理の実行により得られる「外部行動計画」が第2演算周期T2ごとに外部モジュールmod2から内部モジュールmod1に入力される(図3/矢印D2-参照)。
当該入力信号に応じて、内部モジュールmod1により第1演算周期T1ごとに「内部行動計画処理」が実行される。内部行動計画処理の実行により得られる「内部行動計画」は第1演算周期T1ごとに内部モジュールmod1から制御モジュールmod0に入力される(図3/矢印D1-参照)。
なお、内部モジュールmod1の今回サイクルの開始時刻において外部モジュールmod2から入力信号がない場合、内部モジュールmod1の最近の過去サイクルの開始時刻における外部モジュールmod2からの入力信号が用いられて内部行動計画処理が実行される。
直近の状態変数値、または、当該状態変数値に応じた直近未来におけるロボットRの最新予測状態が第2演算周期T2ごとに内部モジュールmod1から外部モジュールmod2に入力される(図3/矢印D2+参照)。
当該入力信号に応じて、外部モジュールmod2により第2演算周期T2ごとに「外部行動計画処理」が実行される。これにより得られる「外部行動計画」は第2演算周期T2ごとに外部モジュールmod2から内部モジュールmod1に入力される(図3/矢印D2-参照)。
第1演算周期T1ごとの内部モジュールmod1からの入力信号(図3/矢印D1-参照)に応じて指令信号が制御モジュールmod0により逐次生成される。そして、この指令信号が制御モジュールmod0からアクチュエータ2に送信されることにより、アクチュエータ2が指令信号に応じて駆動され、その結果、ロボットRが最新の内部行動計画にしたがって行動する。
(各行動計画処理の内容)
内部モジュールmod1により実行される「内部行動計画処理」および外部モジュールmod2により実行される「外部行動計画処理」の詳細について説明する。
(外部行動計画処理の手順)
外部モジュールmod2により、内部モジュールmod1から無線を通じて最近の状態測定値が受信される(図4/矢印D2+参照)。当該最近の状態測定値に基づき、ロボットRの挙動を表わす挙動予測モデルにしたがって、ロボットRの直近未来状態が予測される(図4/STEP200)。これにより、たとえば、ロボットRが現在位置から1歩進んだときの着地位置が決定される。
また、ロボットRの複数の外部行動候補ai2が第2探索範囲において探索される(図4/STEP210)。外部行動候補ai2は上記最適化問題の解候補{x,z}である。これにより、図6(a)に示されているように、ロボットRの1歩先の予測着地位置から、指定歩数q(たとえばq=2)にわたる着地位置pos(ai2)により表現される歩容が外部行動候補ai2として探索される。
「歩容」とは、着地タイミングに着目した脚移動の繰り返しパターンを意味する。歩容は、歩行(W)、走行(R)または片足跳び(S)などの離散変数によって表される単位行動形態の種類と、着地位置(着地時の足部B5の代表位置)、足部B5の着地時姿勢(たとえば方位角により定義される。)、足部B5の着地時の速度の大きさおよび方向、ロボットRの重心位置、速度または加速度、基体B0のピッチ軸回りの角速度または角加速度、ロボットRのヨー軸回りのモーメントなど、連続変数によって表される単位行動形態の詳細内容との組み合わせにより表現される。
歩行、走行および片足とびのそれぞれは、プログラムにおいて、有限離散状態変数値z=0,1,2のそれぞれにより記述されている。その一方、着地位置などの単位行動形態の詳細内容は、ロボット座標系または世界座標系などの座標系における当該位置の座標値などの連続状態変数ベクトルxにより表わされている。
なお、単位行動形態の種類が、複数の離散状態変数ベクトルz={z1,‥,z}により記述されてもよい。たとえば、全ての脚が空中に浮いている空中期の有無が、第1の離散状態変数z1の「0」および「1」の別により記述され、今回支持脚と次回支持脚とが同一であるか否かが、第2の離散状態変数z2の「0」および「1」の別により記述されてもよい。この場合、「歩行」は当該2つの離散状態変数の組み合わせ(z,z)=(1,1)により記述され、「走行」は当該2つの離散状態変数の組み合わせ(z,z)=(0,1)により記述され、「片足跳び」は当該2つの離散状態変数の組み合わせ(z,z)=(0,0)により記述される。当該2つの離散状態変数の組み合わせ(z,z)=(1,0)は、今回支持脚の足平を着地させたまま連続して次回支持脚とし、今回遊脚を連続して次回遊脚とする動作(たとえば「踏み直し」)を表わしている。
単位行動形態としての「歩行」とは、図5(a)に示されているように、ロボットRが、今回支持脚(着地している脚体を意味する。)および今回遊脚(離床している脚体を意味する。)のそれぞれを、次回遊脚および次回支持脚のそれぞれに交代させながら1歩分だけ並進するという行動形態を意味する。図5において、脚体B4にはその左右を区別するための添え字「L」または「R」が付されている。歩行には空中期(すべての脚体が離床している期間を意味する。)は含まれない。
単位行動形態としての「走行」とは、ロボットRが、今回支持脚(着地している脚体)および今回遊脚(離床している脚体)のそれぞれを、空中期を経て、次回遊脚および次回支持脚のそれぞれに交代させながら、1歩分だけ並進するという行動形態を意味する。
「片足跳び」とは、ロボットRが、空中期を挟んで今回支持脚と次回支持脚とが同じになるように、1歩分だけ並進する行動形態を意味する。
第2探索範囲は、指定歩数qにおいて実行可能な全ての単位行動形態を含んでいる。たとえば(1歩目の着地位置pos(ai2,1)を定める単位行動候補、2歩目の着地位置pos(ai2,2)を定める単位行動候補)=(W,W)(W,R)(W,S)(R,W)(R,R)(R,S)(S,W)(S,R)および(S,S)の9パターンが、第2探索範囲として定義されている。第2探索範囲は後述する第1探索範囲よりも広い。
さらに、外部行動候補ai2に基づき、状態予測モデルにしたがってロボットRの複数の未来状態si2が予測される(図4/STEP220)。これにより、たとえば、ロボットRの1歩先の予測着地位置から、外部行動候補ai2にしたがって指定歩数qだけ移動した時点におけるロボットRのZMP(Zero Moment Point)が未来状態si2として予測される。当該予測状態si2は、連続状態変数値により表わされる。
そして、複数の内部行動候補ai2のそれぞれについて、未来状態si2に基づき、指定行動目的に鑑みた適合性を表わす適合度e(ai2)が評価される。適合度e(ai2)は、たとえば、図6(b)に示されている予測ZMPの目標ZMPからのずれzmpbias(ai2)と、目標ZMPから予測ZMPに向かう方向についての、目標ZMPおよび足部B5の縁の間隔Lfootとに基づき、図7に変化特性が示されている式(210)で表される適合度が算出される。たとえば、足部B5の着地面(たとえば矩形状)の中心位置が目標ZMPとして定義される。
e(ai2)=exp(−((zmpbias(ai2)/Lfoot)2)) ..(210)。
式(210)から明らかなように、ロボットRの予測ZMPが目標ZMPに近いほど、すなわち、ロボットRの姿勢が安定になる可能性が高い外部行動候補ai2であるほど適合度e(ai2)が高く評価される。
上記適合度に基づいて、各離散変数値に対して探索アルゴリズムによって連続変数ベクトルの最適解{x**|z}が決定される。すなわち、連続値離散値混合最適化問題を離散変数値が取りうる組み合わせの数の連続値最適化問題として並列に探索する。そして、各々の離散変数値の組み合わせにおける連続変数ベクトルの最適解{x**|z}の中で、適合度が最高であった一つの外部行動候補ai2 *={x*,z*}が「外部行動計画」として決定される。その他の実施形態として、前記のように適合度が最高となるようなベクトルxおよびzの一つの組み合わせを探索しうる、あらゆる手法が代替的に採用されてもよい。外部行動計画は、無線または有線通信によって外部モジュールmod2から内部モジュールmod1に対して送信される(図4/矢印D2-参照)。
(内部行動計画処理の手順)
内部モジュールmod1により、制御モジュールmod0からロボットR内部のネットワークを通じて最近の状態測定値が受信される(図4/矢印D1+参照)。当該最近の状態測定値に基づき、ロボットRの挙動を表わす挙動予測モデルにしたがって、ロボットRの直近未来状態が予測される(図4/STEP100)。これにより、たとえば、ロボットRが現在位置から1歩進んだときの着地位置が予測される。
また、ロボットRの複数の内部行動候補ai1が第1探索範囲において探索される(図4/STEP110)。内部行動候補ai1は上記外部行動候補と同じく上記最適化問題の解候補{x,z}となりうる。内部モジュールmod1は、外部モジュールmod2から送られてくる外部行動計画ai2 *を反映し、第2探索範囲に包含される第1探索範囲を比較的高速に探索する。これにより、外部モジュールmod2の予測エラー通信遅延を補償しながら、高周波での制御が可能となる。
第1探索範囲は、指定歩数qにおける実行可能な単位行動形態の一部である。ロボットRの1歩先の予測着地位置から、指定歩数q(たとえばq=2)にわたるk歩目の着地位置pos(ai1,k)により表現される歩容が内部行動候補ai1として探索される(図6(a)参照)。たとえば(1歩目の着地位置pos(ai1,1)を定める単位行動候補、2歩目の着地位置pos(ai1,2)を定める単位行動候補)=(W,W)(R,R)(S,S)および外部行動計画ai2 *が、第1探索範囲として定義されている。第1探索範囲は前述の第2探索範囲よりも狭い。
さらに、複数の内部行動候補ai1のそれぞれに基づき、状態予測モデルにしたがってロボットRの複数の未来状態{si1|i1=1,2,‥,n}が予測される(図4/STEP120)。これにより、たとえば、ロボットRの1歩先の予測着地位置から、内部行動候補ai1にしたがって指定歩数qだけ移動した時点におけるロボットRのZMPが第1未来状態si1として予測される。当該予測状態si1は、連続状態変数値により表わされる。この際、最近の状態測定値に応じた1歩先の予測着地位置に加え、外部行動計画に基づき、状態予測モデルにしたがってロボットRの未来状態が予測される。当該予測状態は、連続状態変数値により表わされる。
そして、複数の内部行動候補ai1のそれぞれについて、未来状態si1に基づき、指定行動目的に鑑みた適合性を表わす適合度e(ai1)が評価される(図4/STEP130)。適合度e(ai1)は、外部モジュールmod2により用いられる評価式(式(210)参照)と同様の評価式(110)にしたがって算出される。外部行動計画について、最近の状態測定値が反映されたロボットRの未来状態に基づき、指定行動目的に鑑みた適合性を表わす適合度eが同様に評価される。
e(ai1)=exp(−((zmpbias(ai1)/Lfoot)2)) ..(110)。
そして、内部行動候補ai1適合度e(ai1)の評価が最高であった一つの内部行動候補ai1 *={x*,z*}が「内部行動計画」として決定される。内部行動計画は、ロボット内部のネットワークを通じて内部モジュールmod1から制御モジュールmod0に対して送信される(図4/矢印D1-参照)。これに応じて、制御モジュールmod0によってアクチュエータ2の動作が制御される。
(探索戦略にしたがった行動候補の探索方法)
行動候補の探索方法について説明する。探索方法としては「収束性」および「多様性」がある方法が採用される。「収束性」がある方法により、探索範囲(行動候補により定義される空間における範囲を意味する。)のうち前回評価が高かった行動候補の近くにおいて、今回評価がより高くなるような行動候補が探索されうる。「多様性」がある当該方法により、前回評価に拘泥されすぎることなく、今回評価がよりより高くなるような行動候補が広範囲で探索されうる。
収束性および多様性がある行動候補の探索方法として、進化的探索手法が採用されうる。
具体的には、まず、図8(a)に示されている複数の親個体(行動候補aに対応している。「●」により表現されている。)のうち、円で囲まれた親個体が選択される。選択確率は適合度f(a)(実線で示されている評価曲線にしたがって評価される。)が高いほど高い。
そして、図8(b)に示されているように適合度f(a)が高い親個体ほど当該親個体に比較的小さいノイズ(ノイズは適合度f(a)が高いほど小さくなる。)が加えられた結果として子個体(「○」により表現されている。)が当該親個体の周囲の比較的狭い範囲に高確率で分布するように生成される。その一方、適合度f(a)が低い親個体ほど当該親個体に比較的大きいノイズ(ノイズは適合度f(a)が低いほど大きくなる。)が加えられた結果として子個体が当該親個体の周囲の比較的広い範囲に高確率で分布するように生成される。そのほか、図示しないが不規則に個体が生成される。すべての個体に対する不規則な個体の占有率はたとえば0.30程度に設定される。
前記のような世代交代手法が採用されることにより、世代を経るに連れて適合度f(a)が大きい領域に個体が集中していく。これにより、モジュールが主担当する目的への適合性が高い行動候補aが適応的に求められる。
(本発明のロボットRおよびその制御システムの作用効果)
前記機能を発揮するロボットRによれば、内部モジュールmod1が、一または複数の連続状態変数値および一または複数の離散状態変数値により表わされる制御対象(ロボットR)の複数の行動候補ai1の中から、各行動候補ai1の指定行動目的に対する適合度e(ai1)に応じて当該制御対象の行動計画を探索するという並列演算処理を実行するように構成されている(図4/STEP100〜STEP130参照)。同様に、外部モジュールmod2が、一または複数の連続状態変数値および一または複数の離散状態変数値により表わされる制御対象(ロボットR)の複数の行動候補ai2の中から、各行動候補ai1の指定行動目的に対する適合度e(ai2)に応じて当該制御対象の行動計画を探索するという並列演算処理を実行するように構成されている(図4/STEP200〜STEP230参照)。内部モジュールmod1の演算処理能力のみならず、外部モジュールmod2の演算処理能力も利用されることにより、内部行動計画の決定(解の導出)に要する演算処理時間の短縮が図られている。
低周波の外部モジュールmod2による外部行動候補ai2の探索範囲(第2探索範囲)は、高周波の(外部モジュールmod2よりも演算周期が短い)内部モジュールmod1による行動候補ai1の探索範囲(第1探索範囲)よりも広い。その結果、内部モジュールmod1により探索された内部行動候補ai1(たとえば、2歩分の歩容W→W、R→RまたはS→Sにより定まる着地位置)よりも、「ロボットRの姿勢安定化」という指定行動目的に対する適合度eが高い外部行動計画ai2(たとえば、2歩分の歩容S→Wにより定まる着地位置)が外部モジュールmod2によって求められうる。
したがって、前記のように解の導出に要する演算処理時間の短縮を図りながらも、内部モジュールmod1単独で解としての内部行動計画が決定される場合と比較して、指定行動目的に鑑みて最適な形態で制御対象の動作が制御されうる。
その一方、内部モジュールmod1による演算処理結果さえ求められれば、制御対象であるロボットRの動作が制御されうる(図3/矢印D1-参照)。高周波の(外部モジュールmod2よりも演算周期が短い)内部モジュールmod1による行動候補ai1の探索範囲(第1探索範囲)は、低周波の外部モジュールmod2による外部行動候補ai2の探索範囲(第2探索範囲)よりも狭いが、その分だけ演算処理が早い。これにより、ロボットRの状態測定値(図4/矢印D1+およびD2+参照)に鑑みて、ロボットRが外乱に緊急に対応する必要がある場合、低周波の外部モジュールmod2の演算処理結果を待たずに、高周波の内部モジュールmod1の演算処理結果にしたがってロボットRの動作が制御されうる。
よって、一または複数の連続状態変数値および一または複数の離散状態変数値により表わされる行動候補の組み合わせ最適化問題の解としての、当該制御対象の内部行動計画の導出の高速化を図ることができる。その結果、任意形態の外乱に対して、制御対象の行動目的に鑑みて適当な形態で、当該制御対象を行動させることができる。
たとえば、図9に示されているように外乱がロボットRに与えられた後、まず、ロボットRは瞬時に姿勢安定を図るため、自重を支えるように、遊脚であった一方の脚体を着地させるなどの反応を示す(state0参照)。そして、ロボットRは、(S)片足跳び(state1参照)→(S)片足跳び(state2参照)、(S)片足跳び(state1参照)→(W)歩行、(R)走行(state3参照)、または、(W)歩行、(R)走行(state3参照)→(W)歩行、(R)走行(state4参照)などの単位行動形態の組み合わせである内部行動計画にしたがって、姿勢の安定を図りながら並進を継続することができる。
(本発明の他の実施形態)
なお、制御対象はロボットR(図1参照)のほか、車両等、複数種類の単位行動形態のそれぞれが離散状態変数値により表わされ、かつ、当該複数種類の単位行動形態の組み合わせとしての行動候補の結果が連続状態変数値により表わされるとともに、アクチュエータを動力源として備えているあらゆる装置であってもよい。
外部モジュールmod2が、外部行動候補ai2のそれぞれについて、指定行動目的とは異なる副行動目的に対する副適合度esub(ai2)を評価し、適合度e(ai2)(式(210)参照)の寄与度が副適合度副適合度esub(ai2)の寄与度よりも高くなるように総合適合度f(ai2)を評価するように構成され、総合適合度f(ai2)の評価結果に応じて外部行動計画(図4/矢印D2+参照)を決定するように構成されていてもよい。
ここで、副行動目的として「ロボットRが目標位置に到達する」という大局的行動目的が採用されている場合について考える。
この場合、副適合度esub(ai2)は、ロボットRの着地位置pos(ai2,k)と、目標位置を終点とする大局経路との間隔poserr(ai2,k)と、ロボットRの歩幅(最大歩幅)Lstepとに基づき、評価式(120)にしたがって算出される。
esub(ai2)=Πk=1~qexp(−poserr(ai2, k)/Lstep) ..(120)。
評価式(120)から明らかなように、ロボットRの着地位置pos(ai2,k)が大局経路に近いほど、すなわち、ロボットRが大局経路に沿って目標位置に到達すると予測される外部行動候補ai2であるほど副適合度esub(ai2)が高く評価される。
そして、適合度e(ai2)および副適合度esub(ai2)に基づき、評価式(141)または(142)にしたがって総合適合度f(ai2)が評価される。
f(ai2)=e(ai2)(esub(ai2)+1) ..(141)。
f(ai2)=w1e(ai2) (w2esub(ai2)+1) ..(142)。
ここで「w2」および「w1(=(w2+1)-1)」は重み係数である。
そして、総合適合度fが最高の1つの外部行動候補ai2が、ロボットRの外部行動計画として決定される。
当該構成の制御システムによれば、外部モジュールmod2が指定行動目的(局所的行動目的)を優先させながらも、他の行動目的(大局的行動目的)をも勘案した形で、ロボットRの外部行動候補が探索される(図8(a)(b)参照)。また、外部行動候補のそれぞれについて、指定行動目的に鑑みた適合度eが、他の行動目的に鑑みた副適合度esubよりも寄与度が高くなるように総合適合度fが評価される(式(141)(142)参照)。
したがって、外乱が発生した場合、当初は応答が速い内部モジュールmod1による演算処理結果(内部行動計画)に反映されている、指定行動目的のみがロボットRの行動形態に反映され、この外乱による影響の迅速な低減が図られる。そして、時間経過とともに応答が遅い外部モジュールmod2による演算処理結果(外部行動計画)に反映されている、指定行動目的に加えて他の行動目的もがロボットRの行動形態に反映され、当該目的のすべてに適合するようなロボットRの行動形態の回復が図られる。これにより、任意形態の外乱に対して、ロボットRの行動目的に鑑みて適当な形態で、当該ロボットRを行動させることができる。
(ロボットの歩容制御について)
ロボットRの歩容制御の他の実施形態について説明する。
外部モジュールmod2は外部行動計画として第k次目標歩容を生成した上で、内部モジュールmod1に対して無線により送信する。第k次目標歩容は、ロボットRが移動を開始してからk−1歩分だけ移動した時点以降のn歩分(n:指定歩数)の目標着地位置pos_des(k,i)(i=1〜n)を定める。たとえば、第k次目標歩容により、図10(a)に示されている3歩分(n=3)の目標着地位置pos_des(k,1)〜pos_des(k,3)が指定される。
内部モジュールmod1は、外部モジュールmod2から第k次目標歩容を無線により受信する。内部モジュールmod1および外部モジュールmod2のそれぞれにおいて同等の評価式が用いられるので(式(110)(210)参照)、ロボットRに外乱が生じた等の特段の事情がない限り、内部モジュールmod1は、外部行動計画としての第k次目標歩容をそのまま内部行動計画として決定する。
この場合、制御モジュールmod0は、内部行動計画としての第k次目標歩容にしたがってアクチュエータ2の動作、ひいてはロボットRの動作を制御する。これにより、ロボットRの次の着地位置が、第k次目標歩容により指定されている1歩目の着地位置pos_des(k,1)に一致するようにロボットRの動作が制御される。
第k次目標歩容にしたがってロボットRが1歩分だけ歩行、走行または片足跳びをするまでの間に、外部モジュールmod2により外部行動計画として第k+1次目標歩容が生成された上で、内部モジュールmod1に対して無線により送信される。たとえば、第k+1次目標歩容により、図10(b)に示されている3歩分の目標着地位置pos_des(k+1,1)〜pos_des(k+1,3)が指定される。これにより、ロボットRの次の着地位置が、第k+1次目標歩容により指定されている1歩目の着地位置pos_des(k+1,1)に一致するようにロボットRの動作が制御される。
ここで、内部モジュールmod1による探索に時間がかかった場合、内部モジュールmod1間でデータをやり取りするBus(バス)が混雑した場合、または、内部モジュールmod1と外部モジュールmod2との間の無線通信に支障が生じた場合、図10(a)に示されている状態からロボットRが1歩だけ歩行等するまでの間に、外部行動計画としての第k+1次目標歩容(今回目標歩容)が内部モジュールmod1に受信されないことが想定される。
この場合、内部モジュールmod1は、第k次目標歩容(前回目標歩容)の一部を用いて暫定的な第k+1次目標歩容を認識し、この暫定的な第k+1次目標歩容を包含する第1探索範囲において内部行動計画として探索する。暫定的な第k+1次目標歩容が内部行動計画として探索された場合、制御モジュールmod0は、この暫定的な目標歩容にしたがってロボットRの歩容を制御する。
たとえば、図10(c)に示されているように、第k次目標歩容により指定されている2歩目の目標着地位置pos_des(k,2)および3歩目の目標着地位置pos_des(k,3)のそれぞれが、第k+1次目標歩容の1歩目の暫定目標着地位置pos_des’(k+1,1)および2歩目の暫定目標着地位置pos_des’(k+1,2)として定められる。
第k+1次目標歩容の3歩目の暫定目標着地位置pos_des’(k+1,3)の設定のため、i歩目(i=1,2,3)の暫定目標着地位置pos_des’(k+1,i) にある足平の踵座標系(「第i踵座標系」という。)が定義される。各踵座標系の原点は足平の内側の後端位置に定義される。踵座標系は、略矩形状の足平の長辺方向(x軸方向)および短辺方向(y軸方向)ならびに鉛直方向(z軸方向)により定義される直交座標系である。
さらに、第1踵座標系のx軸を基準として反転された第2足平位置姿勢における足平の後端内側を原点とする新たな踵座標系が「反転踵座標系」として定義される。
3歩目の暫定目標着地位置pos_des’(k+1,3)は、第2踵座標系を基準とする第3踵座標系の相対的な位置および姿勢のそれぞれが、第1踵座標系を基準とする反転踵座標系の相対的な位置及び姿勢のそれぞれに一致するように定められる。
なお、目標歩容により指定される歩数nが比較的大きい場合(たとえばn≧5)、暫定的な第k+1次目標歩容により、n歩目の目標着地位置は定められなくてもよい。
そして、暫定的な第k+1次目標歩容にしたがって、ロボットRの歩容が制御される。これにより、前記のように内部モジュールmod1による探索に時間がかかった場合、内部モジュールmod1間でデータをやり取りするBus(バス)が混雑した場合、または、内部モジュールmod1および第2モジュールmod2の間の無線通信に支障が生じた場合でも、ロボットRの歩容が継続的に制御されうる。
その後、モジュール間の無線通信障害が解消され、外部モジュールmod2により生成された外部行動計画としての第k+2次目標歩容(次回目標歩容)が、内部モジュールmod1により無線により受信された場合、制御モジュールmod0により、暫定的な第k+1次目標歩容に代えてこの第k+2次目標歩容にしたがってロボットRの歩容が制御されうる。すなわち、一時的に無線通信障害が発生した等の場合でも、ロボットRに動作を停止させることなく、歩行等の動作を継続させることができる。
1‥制御システム、2‥アクチュエータ、mod1‥内部モジュール、mod2‥外部モジュール、R‥ロボット(制御対象)。

Claims (8)

  1. 制御対象の動力源であるアクチュエータを駆動する制御モジュールと、前記制御対象に搭載され、前記制御対象の動作状態を表わす状態測定値を検出するように構成されている高周波の内部モジュールと、前記制御対象の外部にある低周波の外部モジュールとを備え、
    前記外部モジュールが、前記内部モジュールから前記制御対象の最近の状態測定値を無線により受信した上で、前記制御対象の最近の状態測定値に基づき、一または複数の連続状態変数値および一または複数の離散状態変数値により表わされる前記制御対象の単位行動形態の組み合わせとしての外部行動候補であって、当該連続状態変数値により表わされる前記制御対象の予測状態に基づいた、当該外部行動候補の指定行動目的に対する適合度に応じた少なくとも1つの外部行動候補を外部行動計画として第2探索範囲において探索し、当該探索した前記外部行動計画を前記内部モジュールに対して無線で送信するように構成され、
    前記内部モジュールが、前記外部モジュールにより探索された前記外部行動計画を無線により受信した上で、前記状態測定値に基づき、前記一または複数の連続状態変数値および前記一または複数の離散状態変数値により表わされる前記制御対象の単位行動形態の組み合わせとしての内部行動候補であって、当該連続状態変数値により表わされる前記制御対象の予測状態に基づいた、当該内部行動候補の指定行動目的に対する適合度に応じた少なくとも1つの内部行動候補を内部行動計画として、前記外部行動計画を包含する一方で前記第2探索範囲よりも狭い第1探索範囲において探索するように構成され、
    前記制御モジュールが、前記内部モジュールにより決定された前記内部行動計画にしたがって、前記アクチュエータの動作を制御するように構成されていることを特徴とする制御システム。
  2. 請求項1記載の制御システムにおいて、
    前記外部モジュールが、前記一または複数の連続状態変数値および一または複数の離散状態変数値により表わされる外部行動計画を決定するにあたって、全てまたは一部の離散状態変数値に対する連続状態変数値の最適な組み合わせを探索アルゴリズムによって決定し、全てまたは一部の離散状態変数値に対する連続状態変数値の最適な組み合わせの中で最高の適合度となる離散状態変数値と連続状態変数値の組み合わせを最適な行動計画として採用するように構成されていることを特徴とする制御システム。
  3. 請求項1記載の制御システムにおいて、
    前記外部モジュールが、前記外部行動候補のそれぞれについて、前記指定行動目的とは異なる副行動目的に対する副適合度を評価し、前記適合度の寄与度が前記副適合度の寄与度よりも高くなるように総合適合度を評価するように構成され、前記総合適合度の評価結果に応じて前記外部行動計画を決定するように構成されていることを特徴とする制御システム。
  4. 請求項3記載の制御システムにおいて、
    前記外部モジュールが、前記外部行動候補のそれぞれについて、前記適合度eおよび前記副適合度esubに基づき、評価式f=e(esub+1)またはf=w1e(w2sub+1)(ここで、w1=(w2+1)-1)にしたがって前記総合適合度f1を評価するように構成されていることを特徴とする制御システム。
  5. 請求項1〜4のうちいずれか1つに記載の制御システムにおいて、
    前記内部モジュールおよび前記外部モジュールのそれぞれが、基体と、前記基体から延設された複数の脚体とを有する前記制御対象としてのロボットの、前記複数種類の単位行動形態の指定の組み合わせにより構成される指定歩数にわたる目標歩容を前記内部行動候補および前記外部行動候補のそれぞれとして探索するように構成されていることを特徴とする制御システム。
  6. 請求項5記載の制御システムにおいて、
    前記内部モジュールおよび前記外部モジュールのそれぞれが、前記ロボットの姿勢を安定させることを前記指定行動目的として、前記適合度を評価するように構成されていることを特徴とする制御システム。
  7. 請求項5または6記載の制御システムにおいて、
    前記内部モジュールが、前記外部モジュールから今回の前記外部行動計画としての今回目標歩容を受信していないまま、今回の前記内部行動計画を探索する場合、前記外部モジュールから前回の前記外部行動計画として受信した前回目標歩容を構成するi+1歩目(i=1〜n−1。nは前記指定歩数。)の歩容を、i歩目の歩容として有する暫定的な今回目標歩容を認識した上で、当該暫定的な今回目標歩容を包含する前記第1探索範囲において今回の前記内部行動計画を探索するように構成されていることを特徴とする制御システム。
  8. 基体と、前記基体から延設されている複数の脚体とを備え、前記複数の脚体の動作により移動する前記制御対象としてのロボットであって、
    請求項5〜7のうちいずれか1つに記載の制御システムを構成する前記制御モジュールおよび前記内部モジュールを備えていることを特徴とするロボット。
JP2010194891A 2010-04-22 2010-08-31 ロボットおよび制御システム Active JP5465137B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010194891A JP5465137B2 (ja) 2010-04-22 2010-08-31 ロボットおよび制御システム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010098963 2010-04-22
JP2010098963 2010-04-22
JP2010194891A JP5465137B2 (ja) 2010-04-22 2010-08-31 ロボットおよび制御システム

Publications (2)

Publication Number Publication Date
JP2011240475A true JP2011240475A (ja) 2011-12-01
JP5465137B2 JP5465137B2 (ja) 2014-04-09

Family

ID=44816471

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010194891A Active JP5465137B2 (ja) 2010-04-22 2010-08-31 ロボットおよび制御システム

Country Status (2)

Country Link
US (1) US8805580B2 (ja)
JP (1) JP5465137B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015174155A (ja) * 2014-03-13 2015-10-05 三菱重工業株式会社 ロボット、ロボットの制御方法、及びロボットの制御プログラム
JP2016150419A (ja) * 2015-02-18 2016-08-22 トヨタ自動車株式会社 ロボット制御装置、制御方法、及び制御プログラム
WO2022176751A1 (ja) 2021-02-22 2022-08-25 ソニーグループ株式会社 情報処理装置、情報処理方法及びプログラム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9387589B2 (en) * 2014-02-25 2016-07-12 GM Global Technology Operations LLC Visual debugging of robotic tasks
CN106094817B (zh) * 2016-06-14 2018-12-11 华南理工大学 基于大数据方式的强化学习仿人机器人步态规划方法
WO2019060791A1 (en) * 2017-09-22 2019-03-28 North Carolina State University HIP EXOSQUELET
CN110405750B (zh) * 2018-04-28 2020-11-24 深圳市优必选科技有限公司 一种机器人的运动控制方法、装置及机器人
CN109799710B (zh) * 2019-02-02 2021-12-03 南京林业大学 基于多方位肌电信号的老年座椅运动控制方法和系统
US11498211B2 (en) * 2019-12-30 2022-11-15 Intrinsic Innovation Llc Composability framework for robotic control system
CN117656100B (zh) * 2024-01-31 2024-04-05 燕山大学 运动轴线自适应踝关节运动机器人及其控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003334785A (ja) * 2002-03-15 2003-11-25 Sony Corp ロボットの行動制御システム及び行動制御方法、並びにロボット装置
JP2004167666A (ja) * 2002-08-30 2004-06-17 Sony Corp ロボット装置及びその動作制御方法
JP2006051564A (ja) * 2004-08-11 2006-02-23 Sony Corp ロボット装置の動作制御装置及び動作制御方法
JP2007125631A (ja) * 2005-11-01 2007-05-24 Sony Corp ロボット装置及びその行動制御方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3972854B2 (ja) 2003-04-10 2007-09-05 ソニー株式会社 ロボットの運動制御装置
JP4531520B2 (ja) * 2004-10-15 2010-08-25 本田技研工業株式会社 脚式移動ロボットの制御装置
JP2006088331A (ja) 2005-12-05 2006-04-06 Japan Science & Technology Agency 二足歩行ロボット
EP1870210A1 (en) * 2006-06-22 2007-12-26 Honda Research Institute Europe GmbH Evaluating visual proto-objects for robot interaction
KR101358477B1 (ko) * 2008-04-02 2014-02-05 아이로보트 코퍼레이션 로보틱스 시스템

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003334785A (ja) * 2002-03-15 2003-11-25 Sony Corp ロボットの行動制御システム及び行動制御方法、並びにロボット装置
JP2004167666A (ja) * 2002-08-30 2004-06-17 Sony Corp ロボット装置及びその動作制御方法
JP2006051564A (ja) * 2004-08-11 2006-02-23 Sony Corp ロボット装置の動作制御装置及び動作制御方法
JP2007125631A (ja) * 2005-11-01 2007-05-24 Sony Corp ロボット装置及びその行動制御方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015174155A (ja) * 2014-03-13 2015-10-05 三菱重工業株式会社 ロボット、ロボットの制御方法、及びロボットの制御プログラム
JP2016150419A (ja) * 2015-02-18 2016-08-22 トヨタ自動車株式会社 ロボット制御装置、制御方法、及び制御プログラム
WO2022176751A1 (ja) 2021-02-22 2022-08-25 ソニーグループ株式会社 情報処理装置、情報処理方法及びプログラム

Also Published As

Publication number Publication date
US8805580B2 (en) 2014-08-12
JP5465137B2 (ja) 2014-04-09
US20110264263A1 (en) 2011-10-27

Similar Documents

Publication Publication Date Title
JP5465137B2 (ja) ロボットおよび制御システム
US8849452B2 (en) Robot and control system
US9193072B2 (en) Robot and control method thereof
JP5859036B2 (ja) ロボット
JP5035802B2 (ja) ロボットおよびタスク実行システム
JP2010134907A (ja) 強化学習システム
JP2009136996A (ja) 目標経路生成システム
US20120078419A1 (en) Robot and control method thereof
JP6450273B2 (ja) 移動ロボットの動作環境情報生成装置
KR102330754B1 (ko) 궤도 생성 장치 및 궤도 생성 방법
JP5480799B2 (ja) 移動装置およびロボットならびにこれらの制御システム
JP2012071358A (ja) ロボットおよびその行動制御システム
JP5404519B2 (ja) ロボット、制御システムおよび制御プログラム
US8805583B2 (en) Robot and control method thereof
JP5306934B2 (ja) ロボットおよび制御システム
JP6026393B2 (ja) 移動装置
US9862095B2 (en) Control device for mobile robot
JP2011194539A (ja) ロボット、及びその制御方法
JP2009134642A (ja) 移動装置および移動装置システム
JP5539001B2 (ja) 制御装置
JP5306933B2 (ja) ロボットおよび制御システム
JP5456557B2 (ja) ロボット、制御システムおよび制御プログラム
JP5921979B2 (ja) 制御システム
JP5450218B2 (ja) ロボットおよび制御システム
JP5638283B2 (ja) 制御装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131008

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140121

R150 Certificate of patent or registration of utility model

Ref document number: 5465137

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150