JP2011025339A

JP2011025339A - 移動体の制御装置

Info

Publication number: JP2011025339A
Application number: JP2009172218A
Authority: JP
Inventors: Takahide Yoshiike; 孝英吉池; Toru Takenaka; 透竹中; Takashi Matsumoto; 隆志松本
Original assignee: Honda Motor Co Ltd
Current assignee: Honda Motor Co Ltd
Priority date: 2009-07-23
Filing date: 2009-07-23
Publication date: 2011-02-10
Anticipated expiration: 2029-07-23
Also published as: US20110022232A1; JP5219956B2; US8204626B2

Abstract

【課題】基体の上下動運動を行いながら移動する移動体において、オーバーシュートやアンダーシュートの発生を抑制しつつ、基体の目標姿勢に対する実際の姿勢のずれを円滑に解消する。
【解決手段】基体２４の姿勢に関する状態量偏差Δθを“０”に収束させるようにフィードバック制御則により要求操作量を決定するとき、フィードバック制御則のフィードバックゲインを、移動体１又は基体２４の目標慣性力の時系列のうちの現在時刻から将来の所定時刻までの期間内の時系列を用いて決定し、その決定したフィードバックゲインと状態量偏差の観測値とからフィードバック制御則の演算により要求操作量を決定する。
【選択図】図８

Description

本発明は、脚式移動ロボット等の移動体の制御装置に関する。

基体と、基体を床面上で移動させる移動機構とを備えた移動体としては、例えば脚式移動ロボットが一般に知られている。該脚式移動ロボットでは、その脚体が上記移動機構、上体が上記基体に相当する。

そして、例えば、脚式移動ロボットにおいては、該ロボットの姿勢の安定性を高める技術として、特許文献１等に開示されている技術が本願出願人により先に提案されている。この技術では、ロボットの上体の実際の姿勢の目標姿勢に対する状態量偏差を観測し、該状態量偏差を“０”に収束させるために要求されるフィードバック要求操作量（制御入力）として、ロボットに付加的に作用させる操作モーメント（目標ＺＭＰまわりの操作モーメント）が、該状態量偏差の観測値からＰＤ則（比例・微分則）により算出される。さらに、この操作モーメントは、実際のロボットに直接的に作用させる実ロボット側操作モーメントと、ロボットの目標歩容を生成するための動力学モデルにおいてロボットに作用させるモデル側操作モーメントとに分配される。そして、実際のロボットにおいては、目標ＺＭＰまわりに実ロボット側操作モーメントを発生させるように、コンプラインス動作制御によって実際のロボットの両脚の足平の位置・姿勢が目標歩容における足平の位置・姿勢から修正される。また、動力学モデルにおいては、目標ＺＭＰまわりにモデル側操作モーメントを発生させるように、ロボットの目標歩容が生成される。

これにより、外乱等によって、ロボットの上体の実際の姿勢が、目標姿勢に対してずれが生じた場合に、そのずれを解消する床反力モーメントを、ロボットに作用させるようにしている。

ＰＣＴ国際公開公報ＷＯ２００３／０６１９１７

ところで、特許文献１に見られるように前記状態量偏差を“０”に収束させるための要求操作量（操作モーメント）をＰＤ則により決定する技術では、状態量偏差の観測値に掛かるゲイン係数と、該状態量偏差の観測値の時間的変化率（微分値）にかかるゲイン係数とは、通常、あらかじめ定められた固定値に設定される。

この場合、本願発明者の知見によれば、ロボットの上体の高さ（鉛直方向の位置）がほぼ一定に保たれるような歩容（例えば歩行歩容）でロボットを移動させる場合には、前記の如くＰＤ則により決定される操作モーメントを用いて、ロボットの上体の姿勢を円滑に、目標姿勢に復元させることができる。

しかるに、ロボットの走行を行う場合等のように、上体の上下動運動を伴う歩容である場合には、前記の如くゲイン係数を固定値としたＰＤ則により決定される操作モーメントによってロボットの上体の姿勢をフィードバック制御した場合に、上体の上下動運動によって、該上体（ひいてはロボット）に生じる慣性力が変化することの影響で、ロボットの上体の実際の姿勢が目標姿勢に対して、オーバーシュートやアンダーシュートを発生する場合が多々あることが判明した。

そこで、本願発明は、脚式移動ロボットの如き移動体を、その基体の上下動運動を行いながら移動させる場合に、オーバーシュートやアンダーシュートの発生を抑制しつつ、基体の目標姿勢に対する実際の姿勢のずれを円滑に解消することができるような要求操作量を決定し、該要求操作量に応じて基体の姿勢の上記ずれを円滑に解消することができる移動体の制御装置を提供することを目的とする。

本発明の移動体の制御装置の第１の態様は、基体と、基体を床面上で移動させる移動機構とを備えた移動体を、該基体の上下動運動を行いながら移動させるように制御する制御装置であって、
前記移動体又は前記基体の上下方向の目標慣性力の時系列を規定するパラメータである上下方向慣性力パラメータを決定する上下方向慣性力パラメータ決定手段と、
前記決定された上下方向慣性力パラメータにより規定される目標慣性力の時系列を満足するように、少なくとも上下方向慣性力パラメータを用いて前記移動体の目標運動の時系列を決定する目標運動決定手段と、
少なくとも前記決定された目標運動に応じて前記移動体の動作制御を行なう動作制御手段と、
前記決定された目標運動における基体の目標姿勢に対する該基体の実姿勢のずれの程度を表す状態量偏差を逐次観測する状態量偏差観測手段と、
前記状態量偏差を“０”に収束させるために前記移動体に付加的に作用させるべき付加的外力を規定する要求操作量を、該状態量偏差の観測値に応じてフィードバック制御則により逐次決定する要求操作量決定手段とを備え、
前記動作制御手段は、前記移動体の実際の運動を前記目標運動に追従させつつ、前記要求操作量により規定される付加的外力を前記移動体に付加的に作用させるように該移動体の動作制御を行なう手段であり、
前記要求操作量決定手段は、前記要求操作量を決定する各時刻において、将来の前記状態量偏差を“０”に収束させるために必要な前記フィードバック制御則のフィードバックゲインを、前記上下方向慣性力パラメータにより規定される目標慣性力の時系列のうちの現在時刻から将来の所定時刻までの期間内の時系列を用いて決定するフィードバックゲイン決定手段を含み、その決定したフィードバックゲインと前記状態量偏差の観測値とから前記フィードバック制御則の演算により前記要求操作量を決定することを特徴とする（第１発明）。

また、本発明の移動体の制御装置の第２の態様は、基体と、基体を床面上で移動させる移動機構とを備えた移動体を、該基体の上下動運動を行いながら移動させるように制御する制御装置であって、
前記移動体又は前記基体の上下方向の目標慣性力の時系列を規定するパラメータである上下方向慣性力パラメータを決定する上下方向慣性力パラメータ決定手段と、
少なくとも、前記移動体の動力学を表現するものとしてあらかじめ設定された動力学モデルと、前記決定された上下方向慣性力パラメータと、前記動力学モデル上での移動体に作用させる目標外力の時系列とを用いて前記移動体の目標運動のパターンを決定する目標運動決定手段と、
少なくとも前記決定された目標運動に応じて前記移動体の動作制御を行なう動作制御手段と、
前記決定された目標運動における基体の目標姿勢に対する該基体の実姿勢のずれの程度を表す状態量偏差を逐次観測する状態量偏差観測手段と、
前記状態量偏差を“０”に収束させるために前記移動体に付加的に作用させるべき付加的外力を規定する要求操作量を、該状態量偏差の観測値に応じてフィードバック制御則により逐次決定する要求操作量決定手段とを備え、
前記目標運動決定手段は、前記決定された要求操作量に応じて前記動力学モデル上で前記目標外力に付加すべきモデル操作外力を決定し、その決定したモデル操作外力を前記目標外力に付加してなる外力を前記動力学モデル上での移動体に作用させつつ、前記決定された上下方向慣性力パラメータにより規定される目標慣性力の時系列を前記動力学モデル上で満足するように前記目標運動を決定する手段であり、
前記要求操作量決定手段は、前記要求操作量を決定する各時刻において、将来の前記状態量偏差を“０”に収束させるために必要な前記フィードバック制御則のフィードバックゲインを、前記上下方向慣性力パラメータにより規定される目標慣性力の時系列のうちの現在時刻から将来の所定時刻までの期間内の時系列を用いて決定するフィードバックゲイン決定手段を含み、その決定したフィードバックゲインと前記状態量偏差の観測値とから前記フィードバック制御則の演算により前記要求操作量を決定することを特徴とする（第２発明）。

なお、本明細書では、「床」は、通常的な意味での床（屋内の床など）だけを意味するものではなく、屋外の地面もしくは路面をも含むものとして使用する。

上記第１発明及び第２発明においては、前記要求操作量決定手段のフィードバックゲイン決定手段は、前記要求操作量を決定する各時刻において、将来の前記状態量偏差を“０”に収束させるために必要な前記フィードバック制御則のフィードバックゲインを、前記上下方向慣性力パラメータに規定される目標慣性力の時系列のうちの現在時刻から将来の所定時刻までの期間内の時系列を用いて決定する。このため、フィードバックゲイン決定手段は、現在時刻から将来の所定時刻までの期間内での基体の上下動運動に伴う移動体又は基体の上下方向の慣性力の変化の影響を考慮した態様で、前記フィードバックゲインを決定できる。換言すれば、移動体又は基体の上下方向の将来の実際の慣性力が、目標慣性力の時系列に追従して変化すると仮定した場合に、移動体又は基体の上下方向の将来の慣性力の変化が、前記状態量偏差を円滑に“０”に収束させることを損なうことが無いように（収束時のオーバーシュートやアンダーシュートの発生を抑制するように）、前記フィードバックゲインを決定できる。

そして、第１発明及び第２発明では、上記の如く決定されたフィードバックゲイン決定手段により決定されたフィードバックゲインと状態量偏差の観測値とからフィードバック制御則の演算により前記要求操作量を決定する。

このとき、前記フィードバックゲインは、上記の如く、移動体又は基体の上下方向の将来の慣性力の変化が、前記状態量偏差を円滑に“０”に収束させることを損なうことが無いように決定されているので、決定される要求操作量は、オーバーシュートやアンダーシュートの発生を抑制しつつ、円滑に状態量偏差を“０”に収束させる上で適切な要求操作量となる。

従って、第１発明及び第２発明によれば、オーバーシュートやアンダーシュートの発生を抑制しつつ基体の実際の姿勢の目標姿勢に対するずれを円滑に解消することができるような要求操作量を決定できる。

そして、第１発明では、このように決定された要求操作量が、前記動作制御手段に与えられる。このとき、該動作制御手段は、前記移動体の実際の運動を前記目標運動に追従させつつ、前記要求操作量により規定される付加的外力を前記移動体に付加的に作用させるように該移動体の動作制御を行なう。すなわち、前記動作制御手段は、前記移動体の実際の運動を前記目標運動に追従させつつ、前記要求操作量により規定される付加的外力を前記移動体に付加的に作用させるように前記移動体のアクチュエータを駆動する。これにより、実際の移動体に、状態量偏差を“０”に近づけるような外力を付加的に作用させ、基体の目標姿勢に対する実姿勢（実際の姿勢）のずれを円滑に解消することができる。

また、第２発明では、上記のように決定された要求操作量が、前記目標運動決定手段に与えられる。このとき、前記目標運動決定手段は、前記決定された要求操作量に応じて前記動力学モデル上で前記目標外力に付加すべきモデル操作外力を決定し、その決定したモデル操作外力を前記目標外力に付加してなる外力を前記動力学モデル上での移動体に作用させつつ、前記決定された上下方向慣性力パラメータにより規定される目標慣性力の時系列を前記動力学モデル上で満足するように前記目標運動を決定する。そして、前記動作制御手段は、少なくとも前記決定された目標運動に応じて前記移動体の動作制御を行なう。すなわち、前記決定された目標運動に移動体の実際の運動を追従させるように該移動体のアクチュエータを駆動する。これにより、移動体に、状態量偏差を“０”に近づけるような外力を付加的に作用させ、基体の目標姿勢に対する実姿勢（実際の姿勢）のずれを円滑に解消することができる。

なお、第１発明及び第２発明では、前記状態量偏差としては、例えば、基体の目標姿勢と実姿勢との角度差、あるいは、この角度差に所定値を乗じた値、あるいは、目標運動における基体の重心点の位置と、実際の基体の重心点の位置との水平方向の偏差などが挙げられる。

また、第１発明及び第２発明における「上下方向」は、基本的には、鉛直方向（重力方向）でよいが、厳密な意味での鉛直方向でなくてもよい。例えば、床面が水平方向に対して若干傾斜した傾斜面である場合には、その床面に垂直な方向を「上下方向」とみなしてもよい。

また、第１発明及び第２発明における前記要求操作量としては、例えば移動体に作用させる付加的外力（床反力、床反力モーメント等の並進力や力のモーメント）の目標値、外力の作用点の目標値もしくはその目標値の補正量等を用いることができる。

また、第２発明におけるモデル操作外力の一例としては、例えば、前記要求操作量により規定される付加的外力の符号を反転させた外力が用いることができる。

また、前記要求操作量を前記動作制御手段と目標運動決定手段との両方に分配してもよい。この場合、例えば、前記第２発明において、前記目標運動決定手段は、前記決定された要求操作量を、前記モデル操作外力と、前記移動体に実際に付加的に作用させるべき実移動体操作外力とに分配する分配手段を備え、前記動作制御手段は、前記移動体の実際の運動を前記目標運動に追従させつつ、前記実移動体操作外力を前記移動体に付加的に作用させるように該移動体の動作制御を行なうようにする（第３発明）。

この第３発明によれば、目標運動決定手段と動作制御手段とが協働して、状態量偏差を“０”に収束させるように機能することとなる。

なお、第３発明では、モデル操作外力と実移動体操作外力との差が、前記要求操作量に対して単調に変化するように、モデル操作外力と実移動体操作外力とを決定することが望ましい。このようにするためには、例えば、実移動体操作外力からモデル操作外力を差し引いたものが、要求操作量により規定される付加的外力に一致するようにすることが一例として挙げられる。

上記第１〜第３発明では、前記目標運動決定手段は、前記移動体の目標運動の時系列の将来の収束目標として、同じパターンの運動を周期的に繰り返す仮想的な規範運動の時系列を規定する規範パラメータを決定する規範パラメータ決定手段を含み、決定しようとする目標運動の時系列を該規範パラメータにより規定される仮想的な規範運動の時系列に収束させることをさらなる要件として、該目標運動の時系列を決定する手段であり、
前記フィードバックゲイン決定手段は、前記要求操作量を決定する各時刻において、前記フィードバック制御則のフィードバックゲインを、前記上下方向慣性力パラメータにより規定される目標慣性力の時系列のうちの現在時刻から将来の所定時刻までの期間内の時系列と、前記規範パラメータにより規定される規範運動の時系列に対応する前記移動体又は基体の慣性力の時系列のうち、前記規範運動の１周期の期間内の時系列とを用いて、前記フィードバック制御則のフィードバックゲインを決定することが好ましい（第４発明）。

かかる第４発明によれば、前記目標運動決定手段は、決定しようとする目標運動の時系列を前記規範パラメータにより規定される仮想的な規範運動に収束させることをさらなる要件として、該目標運動の時系列を決定する。より詳しく言えば、前記第１発明においては、前記決定された上下方向慣性力パラメータにより規定される目標慣性力の時系列を満足することに加えて、決定しようとする目標運動の時系列を前記仮想的な規範運動に収束させるように、目標運動の時系列を決定する。また、前記第２発明又は第３発明においては、前記決定されたモデル操作外力を前記目標外力に付加してなる外力を前記動力学モデル上での移動体に作用させつつ、前記決定された上下方向慣性力パラメータにより規定される目標慣性力の時系列を前記動力学モデル上で満足することに加えて、決定しようとする目標運動の時系列を前記仮想的な規範運動に収束させるように、目標運動の時系列を決定する。

このため、前記規範運動の時系列に対応する移動体又は基体の慣性力の時系列は、前記上下方向慣性力パラメータにより規定される目標慣性力の時系列の将来の収束目標としての意味を持つ。また、前記規範運動は、同じパターンの運動を周期的に繰り返すものであるから、移動体の継続的な移動を可能とする安定な運動である。

従って、前記フィードバックゲイン決定手段が、フィードバックゲインを、前記上下方向慣性力パラメータにより規定される目標慣性力の時系列のうちの現在時刻から将来の所定時刻までの期間内の時系列と、前記規範パラメータにより規定される規範運動の時系列に対応する前記移動体又は基体の慣性力の時系列のうち、前記所定時刻から前記規範運動の１周期の期間内の時系列とを用いて、前記フィードバック制御則のフィードバックゲインを決定することによって、移動体の運動を安定に行いながら、前記状態量偏差を円滑に“０”に収束させる上で、適切なフィードバックゲインを決定することができる。

上記第１〜第４発明では、前記状態量偏差を好適な応答特性で“０”に収束させる上で、前記フィードバック制御則は、比例・微分則であり、前記フィードバックゲイン決定手段が決定するフィードバックゲインは、前記状態量偏差の観測値に掛かる第１ゲイン係数と、該観測値の時間的変化率に掛かる第２ゲイン係数とから成ることが好ましい（第５発明）。

そして、特に、上記第４発明と第５発明とを組み合わせた場合においては、前記フィードバックゲイン決定手段は、前記要求操作量により規定される前記付加的外力と、前記状態量偏差と、前記移動体又は基体の上下方向の慣性力との間の動力学的関係を近似表現するようにあらかじめ設定され、且つ、前記状態量偏差及びその時間的変化率を状態変数として有すると共に前記移動体又は基体の上下方向の慣性力に依存する状態遷移行列を有する状態方程式に基づいて構築された演算処理によって、前記第１ゲイン係数と第２ゲイン係数とを決定する手段であり、
前記演算処理は、該演算処理によって決定される前記第１ゲイン係数及び第２ゲイン係数と現在時刻での前記状態量偏差の観測値及びその時間的変化率とから前記比例・微分則により算出される前記要求操作量により規定される付加的外力を現在時刻で前記移動体に作用させ、且つ、その後の付加的外力を前記所定時刻まで“０”に維持したと仮定した場合において、現在時刻の状態量偏差の観測値及びその時間的変化率と、該現在時刻から前記所定時刻までの期間内における前記目標慣性力の時系列と、前記規範運動の１周期の期間内における前記移動体又は基体の慣性力の時系列とから前記状態方程式に基づいて算出される前記所定時刻での前記状態量偏差及びその時間的変化率の所定の線形結合値を“０”に収束させるように構築されていることが好ましい（第６発明）。

かかる第６発明によれば、前記第１ゲイン係数と第２ゲイン係数とを決定するための前記演算処理が、現在時刻の状態量偏差の観測値及びその時間的変化率と、該現在時刻から前記所定時刻までの期間内における前記目標慣性力の時系列と、前記規範運動の１周期の期間内における前記移動体又は基体の慣性力の時系列とから前記状態方程式に基づいて算出される前記所定時刻での前記状態量偏差及びその時間的変化率の所定の線形結合値を“０”に収束させるように構築されているので、現在時刻から前記所定時刻までの期間内の前記目標慣性力の時系列と、該目標慣性力の時系列の収束目標としての前記規範運動における移動体又は基体の慣性力の時系列とを的確に反映させて（より詳しくは該目標慣性力の時系列に従って実際の慣性力が発生する状況で、移動体の運動が前記規範運動に収束するようにしつつ、状態量偏差を円滑に“０”に収束させていくことができるように）、第１ゲイン係数と第２ゲイン係数とを決定できる。

なお、この場合、前記状態方程式の状態遷移行列は、前記移動体又は基体の上下方向の慣性力に依存する（状態遷移行列の成分値が該慣性力の関数値となる）ので、前記所定時刻での状態量偏差およびその時間的変化率は、現在時刻から前記所定時刻までの所定の刻み時間毎のｎ個の状態遷移行列（ｎ＝（所定時刻−現在時刻）／刻み時間）を相互に掛け合わせて得られる行列に依存する値となる。また、前記線形結合値において、前記状態量偏差とその時間的変化率とにそれぞれ掛かる係数は、前記規範運動の１周期の期間内における前記移動体又は基体の慣性力の時系列に依存するように決定することが望ましい。該線形結合値の一例としては、例えば後述の式１１８により定義される発散成分ｑ（又はこれに所定値の係数を乗じた値）が挙げられる。この場合、該発散成分ｑは、規範運動の１周期の初期時刻から終端時刻までの所定の刻み時間毎のｋcyc個（ｋcyc＝（初期時刻−終端時刻）／刻み時間）の状態遷移行列を相互に掛け合わせて得られる行列を対角化し得る行列（ｋcyc個の状態遷移行列を相互に掛け合わせて得られる行列の固有ベクトルを並べた行列）に依存する値となる。

補足すると、以上説明した本発明では、前記移動体としては、前記移動機構及び基体としてそれぞれ脚体、上体を有する脚式移動ロボットや、前記支持体としての車輪の車軸に基体を支持した構造の移動体等が挙げられる。

また、前記６発明において、前記状態方程式（離散時間系での状態方程式）が次式３００により表現されるとした場合、前記第１ゲイン係数及び第２ゲイン係数を、例えば前記演算処理としての次式３０２により決定することができる。なお、Ｓ1(k)など、変数に付した添え字（）は、離散時間系での時刻を意味する。また、「＊」は乗算記号を意味する。

なお、式３０２に関して補足すると、上記φ(kcyc,0)を決定するためのＡ(i)（ｉ＝０，１，……，kcyc−１）は、前記規範運動の１周期の初期時刻（ｉ＝０の時刻）から、終端時刻（ｉ＝kcycの時刻）までの期間内における所定の刻み時間毎のkcyc個（kcyc＝１周期の時間／刻み時間）の状態遷移行列を意味する。そして、このkcyc個の状態遷移行列Ａ(i)（ｉ＝０，１，……，kcyc−１）の積として与えられる行列がφ(kcyc,0)である。この場合、各Ａ(i)（ｉ＝０，１，……，kcyc−１）は、その成分値が前記規範運動に対応する移動体又は基体の上下方向の慣性力の時刻ｉでの値の関数値となる行列である。従って、移動体の規範運動の１周期分の時系列が与えられれば、kcyc個の各状態遷移行列Ａ(i)（ｉ＝０，１，……，kcyc−１）が特定され、ひいてはφ(kcyc,0)を決定できることとなる。

さらに、この行列φ(kcyc,0)を対角化する行列Γcycは、より詳しく言えば、φ(kcyc,0)の固有値に対応する固有ベクトルを並べた行列であり、Γcyc^-1＊φ(kcyc,0)＊Γcycが対角行列（固有値を対角成分とする対角行列）となる。従って、φ(kcyc,0)を決定すれば、行列Γcycも決定できることとなる。よって、移動体の規範運動の１周期分の時系列が与えられれば、その規範運動に対応する移動体又は基体の慣性力の時系列を基に、前記第１ゲイン係数及び第２ゲイン係数を決定するために必要なΓcycを決定できることとなる。

また、上記φ(N,k)を決定するためのＡ(j)（ｊ＝ｋ，ｋ＋１，……，Ｎ−１）は、詳しくは、現在時刻（時刻ｋ）から前記所定時刻（時刻Ｎ）までの期間内における所定の刻み時間毎のｎ個（Ｎ−ｋ個）の状態遷移行列である。そして、このＮ−ｋ個の状態遷移行列Ａ(j)（ｊ＝ｋ，ｋ＋１，……，Ｎ−１）の積として与えられる行列がφ(N,k)である。この場合、各Ａ(j)（ｊ＝ｋ，ｋ＋１，……，Ｎ−１）は、その成分値が前記移動体又は基体の目標慣性力の時系列のうち、時刻ｊでの目標慣性力の値の関数値となる行列である。

同様に、上記φ(N,k+1)を決定するためのＡ(j)（ｊ＝ｋ＋１，ｋ＋２，……，Ｎ−１）は、詳しくは、現在時刻の次の時刻（時刻ｋ＋１）から前記所定時刻（時刻Ｎ）までの期間内における所定の刻み時間毎のｎ−１個（Ｎ−ｋ−１個）の状態遷移行列を意味する。そして、このＮ−ｋ−１個の状態遷移行列Ａ(j)（ｊ＝ｋ＋１，ｋ＋２，……，Ｎ−１）の積として与えられる行列がφ(N,k+1)である。この場合、各Ａ(j)（ｊ＝ｋ＋１，ｋ＋２，……，Ｎ−１）は、その成分値が前記移動体又は基体の目標慣性力の時系列のうち、時刻ｊでの目標慣性力の値の関数値となる行列である。

従って、現在時刻（時刻ｋ）から前記所定時刻（時刻Ｎ）までの期間内における移動体又は基体の目標慣性力の時系列が与えられれば、その目標慣性力の時系列を基に、前記第１ゲイン係数及び第２ゲイン係数を決定するために必要なφ(N,k)及びφ(N,k+1)を決定できることとなる。

また、式３０２ａにおける係数ベクトルＢ(k)は、その各成分値が、現在時刻（時刻ｋ）での移動体又は基体の目標慣性力の関数値となるベクトルである。

以上のことから、式３０２により第１ゲイン係数と第２ゲイン係数とを決定する場合には、前記規範運動に対応する移動体又は基体の慣性力の時系列（１周期分の時系列）を基にΓcycを決定すると共に、現在時刻ｋから所定時刻Ｎまでの期間内における移動体又は基体の目標慣性力の時系列を基にφ(N,k)、φ(N,k+1)及びＢ(k)を決定し、これらの決定したΓcyc、にφ(N,k)、φ(N,k+1)及びＢ(k)を用いて、式３０２の演算を行なうことによって、第１ゲイン係数と第２ゲイン係数とを決定すればよい。

なお、α2は、式３０２ｄにより決定されるα1に、例えば、あらかじめ設定した正の定数（＜１）を乗じることによって（すなわちα2／α1が一定値となるように）決定すればよい。ただし、α2／α1を移動体又は基体の目標慣性力など応じて変化させるようにしてもよい。

また、[0 1]＊Γcyc^-1＊[S1(N) S2(N)]^T（但し、[S1(N) S2(N)]^Tは、[S1(N) S2(N)]の転置ベクトル）が、前記線形結合値（発散成分ｑ）に相当するものとなる。

本発明の一実施形態における移動体としての２足移動ロボットの概略構成を示す斜視図。図１のロボットに備えた制御ユニットのハード構成を示すブロック図。制御ユニットの機能的構成を示すブロック図。図３に示す補償全床反力モーメント分配器の処理を示すブロック図。図１のロボットの走行歩容を示す図。図３に示す歩容生成装置で生成される目標床反力鉛直成分軌道の例を示すグラフ。図７（ａ），（ｂ）は図３に示す歩容生成装置で生成される目標床反力鉛直成分軌道（Ｘ軸方向成分及びＹ軸方向成分）の例を示すグラフ。図３に示す歩容生成装置と姿勢安定化制御演算部との処理で使用されるロボットの動力学モデルを視覚的に示す図。図３に示す歩容生成装置が実行するメインルーチン処理を示すフローチャート。図１に示すロボットの姿勢の発散状態を視覚的に示す図。図９のＳ０２２のサブルーチン処理を示すフローチャート。図１に示すロボットの足平の動きの形態と支持脚座標系とを例示する図。図１に示すロボットの定常旋回歩容での目標床反力鉛直成分軌道を例示するグラフ。図１に示すロボットの定常旋回歩容での目標ＺＭＰ軌道（Ｘ軸方向成分）を例示するグラフ。図９のＳ０２４のサブルーチン処理を示すフローチャート。図１５のＳ２０８のサブルーチン処理を示すフローチャート。図９のＳ０２６のサブルーチン処理を示すフローチャート。図９のＳ０２８のサブルーチン処理を示すフローチャート。図１８のＳ７０２のサブルーチン処理を示すフローチャート。図１８のＳ７１０の処理を説明するためのグラフ。図９のＳ０３０の処理を説明するための図。図９のＳ０３２のサブルーチン処理を示すフローチャート。図１に示す姿勢安定化制御演算部の処理を説明するためのグラフ。図１に示す姿勢安定化制御演算部の処理で決定される比例ゲイン（第１ゲイン係数）Ｋxと微分ゲイン（第２ゲイン係数）Ｋvとを例示するグラフ。図１に示すロボットの歩行歩容での目標床反力鉛直成分軌道を例示するグラフ。図２６（ａ），（ｂ）は本発明を適用する移動体の他の例を模式的に示す図。

以下、移動体として２足移動ロボットを例にとって、本発明の一実施形態を説明する。

図１に示す如く、本実施形態の２足移動ロボット１（以下、単にロボット１という）は、基体としての上体２４と、この上体２４を床面上で移動させる移動機構として該上体２４と床との間に介在する左右一対の脚体（脚部リンク）２，２とを備える。

上体２４は、両脚体２，２の基端部（上端部）に後述する腰関節（股関節）を介して連結されており、両脚体２，２のうちの接地した脚体によって床面の上方に支持される。

両脚体２，２は同一構造であり、それぞれ６個の関節を備える。その６個の関節は上体２４側から順に、腰（股）の回旋用（上体２４に対するヨー方向の回転用）の関節１０Ｒ，１０Ｌと、腰（股）のロール方向（Ｘ軸まわり）の回転用の関節１２Ｒ，１２Ｌと、腰（股）のピッチ方向（Ｙ軸まわり）の回転用の関節１４Ｒ，１４Ｌと、膝部のピッチ方向の回転用の関節１６Ｒ，１６Ｌと、足首部のピッチ方向の回転用の関節１８Ｒ，１８Ｌと、足首部のロール方向の回転用の関節２０Ｒ，２０Ｌとから構成される。

なお、本実施形態の説明では、符号Ｒ，Ｌはそれぞれ右側脚体、左側脚体に対応するものであることを意味する。また、Ｘ軸、Ｙ軸、Ｚ軸は、後述する支持脚座標系の３つの座標軸を意味する。この支持脚座標系のＸ軸方向、Ｙ軸方向は、水平面上で互いに直交する２軸方向であり、Ｘ軸方向はロボット１の前後方向（ロール軸方向）、Ｙ軸方向はロボット１の左右方向（ピッチ軸方向）に相当する。また、Ｚ軸方向は鉛直方向（重力方向）であり、ロボット１の上下方向（ヨー軸方向）に相当する。この場合、本実施形態では、Ｚ軸方向である鉛直方向が、本発明における上下方向としての意味を持つ。

各脚体２の関節１０Ｒ（Ｌ），１２Ｒ（Ｌ），１４Ｒ（Ｌ）によって３自由度の腰関節（股関節）が構成され、関節１６Ｒ（Ｌ）によって１自由度の膝関節が構成され、関節１８Ｒ（Ｌ），２０Ｒ（Ｌ）によって２自由度の足首関節が構成されるている。

そして、腰関節（股関節）１０Ｒ（Ｌ），１２Ｒ（Ｌ），１４Ｒ（Ｌ）と膝関節１６Ｒ（Ｌ）とは大腿リンク３２Ｒ（Ｌ）で連結され、膝関節１６Ｒ（Ｌ）と足首関節１８Ｒ（Ｌ），２０Ｒ（Ｌ）とは下腿リンク３４Ｒ（Ｌ）で連結されている。また、各脚体２の足首関節１８Ｒ（Ｌ），２０Ｒ（Ｌ）の下部に、各脚体２の先端部（下端部）を構成する足平２２Ｒ（Ｌ）が取着されている。また、各脚体２の上端部（基端部）が、腰関節（股関節）１０Ｒ（Ｌ），１２Ｒ（Ｌ），１４Ｒ（Ｌ）を介して上体２４に連結されている。

上記した各関節は、例えば本願出願人が特開平３−１８４７８２号などにて提案した公知の構造のものでよい。この場合、各関節を回転駆動するアクチュエータは、減速機を備える電動モータ４２（図２参照）により構成される。

各脚体２の上記構成により、各脚体２の足平２２Ｒ（Ｌ）は、上体２４に対して６自由度を有する。そして、ロボット１の移動に際して両脚体２，２を合わせて６＊２＝１２個（この明細書で「＊」はスカラに対する演算においては乗算を示し、ベクトルに対する演算においては外積を示す）の関節をそれぞれ適宜な角度に駆動することで、両足平２２Ｒ，２２Ｌの所望の運動を行なうことができる。これにより、ロボット１は歩行動作や走行動作等、３次元空間を移動する運動を行うことが可能となっている。

この場合、両脚体２，２が基体としての上体２４を床面上で移動させる移動機構として機能する。また、基体としての上体２４は、腰関節（股関節）を介して、脚体２，２に対して相対運動を行い得るように該脚体２，２に支持されることとなる。さらに、両脚体２，２の各関節の駆動制御によって、床面に対する上体２４の運動を制御することが可能である。その上体２４の運動には、上体２４の水平方向（又は床面に平行な方向）の運動に加えて、上下方向（鉛直方向や、床面に垂直な方向等）の運動や、上体２４の姿勢を変化させる運動も含まれる。

なお、図示は省略するが、本実施形態では、上体２４の上部の両側部には左右一対の腕体が取り付けられると共に、上体２４の上端部には頭部が搭載される。そして、各腕体は、それに備える複数の関節（肩関節、肘関節、手首関節など）によって、該腕体を上体２４に対して前後に振る等の運動を行なうことが可能となっている。ただし、これらの腕体および頭部は無くてもよい。

上体２４の内部にはロボット１の動作制御を行う制御ユニット２６が格納されている。なお、図１では図示の便宜上、制御ユニット２６を上体２４の外部に記載している。

各脚体２の足首関節１８Ｒ（Ｌ），２０Ｒ（Ｌ）と足平２２Ｒ（Ｌ）との間には６軸力センサ３６が介装されている。この６軸力センサ３６は、床から足平２２Ｒ（Ｌ）を介して各脚体２に伝達される床反力の３軸方向の並進力成分及び３軸まわりのモーメント成分を検出し、その検出信号を制御ユニット２６に出力する。

上体２４には、鉛直方向（重力方向）に対する上体２４の傾斜角（ロール方向及びピッチ方向の傾斜角）とその変化速度（角速度）とを計測するための傾斜センサ４０が搭載されている。この傾斜センサ４０は、より詳しくは、加速度センサとジャイロセンサ等のレートセンサ（角速度センサ）とから構成され、これらのセンサの検出信号を制御ユニット２６に出力する。そして、制御ユニット２６において、傾斜センサ４０の出力を基に、公知の手法によって鉛直方向に対する上体２４の傾斜角と角速度とが計測される。

また、各関節を回転駆動する電動モータ４２（図２参照）には、各関節の回転角を検出するためのエンコーダ（ロータリエンコーダ）４４（図２参照）が付設され、該エンコーダ４４の検出信号が制御ユニット２６に出力される。

図２を参照して、制御ユニット２６はマイクロコンピュータを有する電子回路ユニットにより構成されており、ＣＰＵからなる第１演算装置５０及び第２演算装置５２、Ａ／Ｄ変換器５４、カウンタ５６、Ｄ／Ａ変換器５８、ＲＡＭ６０、ＲＯＭ６２、並びにこれらの間のデータ授受を行なうバスライン６４を備えている。

この制御ユニット２６では、前記６軸力センサ３６及び傾斜センサ４０の出力はＡ／Ｄ変換器５４でデジタル値に変換された後、バスライン６４を介してＲＡＭ６０に入力される。また、ロボット１の各関節のエンコーダ（ロータリエンコーダ）４４の出力はカウンタ５６を介してＲＡＭ６０に入力される。

前記第１の演算装置５０は、後述する目標歩容を生成すると共に、関節変位指令（各関節の回転角の目標値）を算出し、ＲＡＭ６０に送出する。また、第２の演算装置５２はＲＡＭ６０から関節変位指令と、前記エンコーダ４４の出力からカウンタ５６を介して計測された実関節変位（各関節の回転角の実測値）とを読み出し、該実関節変位を関節変位指令に追従させるために必要な各関節の電動モータ４２の駆動指令（電動モータ４２の出力トルクを規定する指令値）を算出する。

そして、第２の演算装置５２は、その算出した駆動指令をＤ／Ａ変換器５８を介して電動モータ４２の駆動用のサーボアンプ４６に出力する。このとき、サーボアンプ４６は、入力された駆動指令に応じて電動モータ４２を駆動する（電動モータ４２に通電する）。これにより、各関節の実関節変位が関節変位指令に追従するように制御される。

次に、図３を参照して、本実施形態におけるロボット１の制御装置の動作の概要を説明する。図３中の「実ロボット」以外の部分が制御ユニット２６が実行する処理（主として第１の演算装置６０及び第２の演算装置６２の処理）によって実現される機能である。

なお、図３では、便宜上、ロボット１に搭載された前記の各センサの出力から制御ユニット２６が認識する実測値（実関節変位など）が実ロボット１から出力されるものとして示している。また、以下の説明では、脚体２の左右を特に区別する必要がないときは、前記符号Ｒ，Ｌを省略する。

制御ユニット２６は、ロボット１の動作（歩容）の目標である目標歩容を生成して出力する歩容生成装置１００を備える。この歩容生成装置１００が生成して出力する目標歩容は、本実施形態では、上体２４の目標位置及び目標姿勢の軌道である目標上体位置姿勢軌道と、各足平２２の目標位置及び目標姿勢の軌道である目標足平位置姿勢軌道と、各腕体の目標姿勢の軌道である目標腕姿勢軌道と、ロボット１のＺＭＰ（Zero Morment Point）の目標位置の軌道である目標ＺＭＰ軌道と、ロボット１に作用する全床反力の目標の軌道である目標全床反力軌道とから構成される。なお、脚体２や腕体以外に、上体２４に対して可動な部位を備える場合には、その可動部位の目標位置姿勢軌道が目標歩容に加えられる。

ここで、上記目標歩容における「軌道」は時間的変化のパターン（時系列パターン）を意味し、歩容生成装置１００の制御周期（演算処理周期）毎に算出される瞬時値の時系列により構成される。以下の説明では、「軌道」の代わりに「パターン」と称することもある。また、以下の説明では、誤解を生じるおそれがない場合には、しばしば「目標」を省略する。

上体２４の位置及び速度は、上体２４のあらかじめ定めた代表点（例えば左右の股関節の間の中央点等）の位置及びその移動速度を意味する。同様に、各足平２２の位置及び速度は、各足平２２のあらかじめ定めた代表点の位置及びその移動速度を意味する。各足平２２の代表点は、本実施形態では、各足平２２の底面上の点、例えば、各脚体２の足首関節の中心から各足平２２の底面への垂線が該底面と交わる点に設定される。

また、「姿勢」は空間的な向きを意味する。例えば上体姿勢は鉛直方向に対するロール方向（Ｘ軸まわり）の上体２４の傾斜角（姿勢角）とピッチ方向（Ｙ軸まわり）の上体２４の傾斜角（姿勢角）とで表され、足平姿勢は各足平２２に固定的に設定された２軸の空間的な方位角で表される。本明細書では、上体姿勢は上体姿勢角ということもある。なお、上体姿勢にヨー方向（Ｚ軸まわり）の上体２４の回転角を含めてもよい。

また、歩容のうちの、床反力に係わる要素（目標ＺＭＰおよび目標全床反力）以外の構成要素、すなわち足平位置姿勢、上体位置姿勢等、ロボット１の各部の運動に係わる歩容を総称的に「運動」という。

また、各足平２２に作用する床反力（並進力及びモーメントからなる床反力）を「各足平床反力」と呼び、ロボット１の全て（２つ）の足平２２Ｒ，２２Ｌについての「各足平床反力」の合力を「全床反力」という。ただし、以下の説明においては、各足平床反力はほとんど言及しないので、特にことわらない限り、「床反力」は「全床反力」と同義として扱う。

ＺＭＰは、ロボット１の運動によって発生する慣性力とロボット１に作用する重力との合力がその点まわりに作用するモーメントの水平成分（水平軸まわりのモーメント成分）が零になる床面上の点を意味する。動力学的平衡条件を満足する歩容では、ＺＭＰと床反力中心点とは一致する。この場合、目標ＺＭＰを与えるということは、目標床反力中心点を与えるということと同じである。

目標床反力は、一般的には、作用点とその点に作用する並進力及びモーメントとにより表現される。作用点はどこに設定してもよいが、本実施形態では、目標ＺＭＰを目標床反力の作用点とする。動力学的平衡条件を満足する歩容では、上記の如くＺＭＰと床反力中心点とは一致するので、目標ＺＭＰを作用点とする目標床反力のモーメント成分は、鉛直成分（Ｚ軸まわりのモーメント成分）を除いて零になる。

歩容生成装置１００により生成される目標歩容のうち、目標上体位置姿勢軌道と目標腕姿勢軌道とは、ロボット幾何学モデル（キネマティクス演算部）１０２に入力される。

また、目標足平位置姿勢軌道、目標ＺＭＰ軌道（目標床反力中心点軌道）、および目標全床反力軌道（詳細には目標並進床反力鉛直成分軌道、目標並進床反力水平成分軌道、目標ＺＭＰまわりの目標床反力モーメント軌道）は、複合コンプライアンス動作決定部１０４と目標床反力分配器１０６とに入力される。

そして、目標床反力分配器１０６にて、目標床反力は各足平２２Ｒ，２２Ｌに分配され、目標各足平床反力中心点（各足平２２Ｒ，２２Ｌの床反力中心点の目標位置）と、目標各足平床反力（各足平２２Ｒ，２２Ｌの床反力中心点に作用させる目標床反力）とが決定される。この決定された目標各足平床反力中心点及び目標各足平床反力の軌道は複合コンプライアンス動作決定部１０４に入力される。なお、歩容生成装置１００から出力する目標床反力は、複合コンプライアンス動作決定部１０４によるコンプライアンス制御に必要な成分だけを出力しても良い。例えば、目標並進床反力水平成分を歩容生成装置１００から出力することを省略してもよい。

複合コンプライアンス動作決定部１０４では、目標足平位置姿勢を修正してなる機構変形補償付き修正目標足平位置姿勢が求められ、この修正目標足平位置姿勢の軌道がロボット幾何学モデル１０２に入力される。

ロボット幾何学モデル１０２は、入力された目標上体位置姿勢と機構変形補償付き修正目標足平位置姿勢とを満足する両脚体２，２の各関節の関節変位指令を、ロボット１のキネマティクスモデル（剛体リンクモデル）に基づく逆キネマティクス演算によって算出し、その算出した関節変位指令を変位コントローラ１０８に出力する。さらに、ロボット幾何学モデル１０２は、目標腕姿勢を満足する各腕体の各関節の関節変位指令を算出し、その算出した関節変位指令を変位コントローラ１０８に出力する。

そして、変位コントローラ１０８は、ロボット幾何学モデル１０２で算出された関節変位指令を目標値として、ロボット１の両脚体２，２及び両腕体の各関節の回転角（実関節変位）を前記サーボアンプ４６を介して追従制御する。より詳しくは、変位コントローラ１０８は、エンコーダ４４の出力から計測される実関節変位（実測値）を関節変位指令に一致させるように、アクチュエータ駆動力としての電動モータ４２の出力トルクを調整する。

上記のような追従制御によるロボット１の実際の運動によって該ロボット１の各足平２２に実際に作用する床反力である実各足平床反力が前記６軸力センサ３６の出力から計測され、その実各足平床反力の実測値が前記複合コンプライアンス動作決定部１０４に入力される。

また、ロボット１の上体２４の実際の姿勢角（鉛直方向に対する傾斜角）である実上体姿勢角が前記傾斜センサ４０の出力から計測され、その実上体姿勢角の実測値が姿勢安定化制御演算部１１２に入力される。さらに、姿勢安定化制御演算部１１２には、歩容生成装置１００が生成する目標上体位置姿勢のうちの目標上体姿勢角（鉛直方向に対する上体２４の姿勢角の目標値）等も入力される。目標上体姿勢角は、本実施形態では一定値（固定値）であり、例えば、ロボット１の上体２４の体幹軸が鉛直方向を向く姿勢での該上体２４の姿勢角（＝０）である。このように目標上体姿勢角が一定値（固定値）である場合には、姿勢安定化制御演算部１１２に目標上体姿勢角を入力することを省略してもよい。

そして、姿勢安定化制御演算部１１２は、入力される実上体姿勢角（実測値）と目標上体姿勢角との偏差である上体姿勢角偏差Δθを、これに所定値を乗じてなる後述の位置偏差ΔＸに変換する。本実施形態では、この位置偏差ΔＸが本発明における状態量偏差に相当するものである。

さらに、姿勢安定化制御演算部１１２は、この位置偏差ΔＸを“０”に収束させるための要求操作量（フィードバック要求操作量）として、目標ＺＭＰまわりでロボット１に付加的に作用させる床反力モーメントの要求値である補償全床反力モーメントMdmdを、算出した位置偏差ΔＸに応じてフィードバック制御則により算出する。この補償全床反力モーメントMdmdは、より詳しくは、ロール方向（Ｘ軸まわり）の成分Mdmdxと、ピッチ方向（Ｙ軸まわり）の成分Mdmdyとからなる。Mdmdx，Mdmdyは、それぞれ、上体姿勢角偏差Δθのうちのロール方向（Ｘ軸まわり）の成分、ピッチ方向（Ｙ軸まわり）の成分を“０”に収束させるために必要な、目標ＺＭＰまわりの要求モーメント（詳しくは目標ＺＭＰまわりの床反力モーメントの摂動分の要求値）を意味する。なお、この補償全床反力モーメントMdmdのより詳細な算出処理は後述する。

本実施形態では、姿勢安定化制御演算部１１２の上記した処理によって、本発明における状態量偏差観測手段と、要求操作量決定手段とが実現される。この場合、補償全床反力モーメントMdmdが、状態量偏差としての上体姿勢角偏差Δθを“０”に収束させるためにロボット１に付加的に作用させるべき付加的外力（本実施形態では、目標ＺＭＰまわりの床反力モーメントの摂動分）を規定する要求操作量としての意味を持つ。

姿勢安定化制御演算部１１２で決定された補償全床反力モーメントMdmdは、補償全床反力モーメント分配器１１０を介してコンプライアンス制御用目標床反力モーメントとモデル操作床反力モーメントとに分配される。

コンプライアンス制御用目標床反力モーメントは、前記上体姿勢角偏差Δθを“０”に近づけるために、実ロボット１に付加的に作用させる目標ＺＭＰまわりの摂動床反力モーメントである。モデル操作床反力モーメントは、コンプライアンス制御用目標床反力モーメントと同じ目的のために後述する歩容生成用の動力学モデルに付加的に発生させる目標ＺＭＰまわりの摂動床反力モーメントである。モデル操作床反力モーメントは、言い換えると、歩容生成装置１００により最終的に決定された目標歩容（歩容生成装置１００が出力する目標歩容）の運動が目標ＺＭＰまわりに発生する摂動床反力モーメントである。

これらの床反力モーメントは、ロール方向（Ｘ軸まわり）及びピッチ方向（Ｙ軸まわり）の各成分毎に以下のように決定される。まず、モデル操作床反力モーメントが次式５０により決定される。なお、式５０におけるMdmdは、ロール方向（Ｘ軸まわり）及びピッチ方向（Ｙ軸まわり）の各成分（Mdmdx又はMdmdy）を意味する。同様に、床反力モーメント許容範囲は、ロール方向（Ｘ軸まわり）及びピッチ方向（Ｙ軸まわり）の各成分の床反力モーメントの許容範囲を意味する。この床反力モーメント許容範囲は、歩容生成装置１００において後述するごとく決定されるものである。

Mdmd＞床反力モーメント許容範囲上限値である場合
モデル操作床反力モーメント＝−（Mdmd−床反力モーメント許容範囲上限値）
Mdmd＜床反力モーメント許容範囲下限値である場合
モデル操作床反力モーメント＝−（Mdmd−床反力モーメント許容範囲下限値）
床反力モーメント許容範囲下限値≦Mdmd≦床反力モーメント許容範囲上限値である場合
モデル操作床反力モーメント＝０
……式５０
なお、上記式５０では、補償全床反力モーメントMdmd（詳しくはMdmdx又はMdmdy）そのものを床反力モーメント許容範囲と比較しているが、本来は、上記式５０で床反力モーメント許容範囲と比較すべき対象は、Mdmdを目標ＺＭＰまわりの床反力モーメントの基準瞬時値に加えてなるモーメントである。該基準瞬時値は、前記上体姿勢角偏差Δθが定常的に“０”に維持されていると仮定した場合に歩容生成装置１００が生成する目標全床反力のうちの目標ＺＭＰまわりのモーメントである。

この場合、本実施形態では、目標ＺＭＰまわりのモーメントの基準瞬時値は、ロール方向（Ｘ軸まわり）及びピッチ方向（Ｙ軸まわり）のいずれの成分についても、定常的に“０”である。従って、この基準瞬時値にMdmdを加えたものは、Mdmdに等しい。このため、上記式５０では、Mdmd（詳しくはMdmdx又はMdmdy）を直接的に床反力モーメント許容範囲と比較するようにしている。

次に、コンプライアンス制御用目標床反力モーメントがロール方向（Ｘ軸まわり）及びピッチ方向（Ｙ軸まわり）の各成分毎に次式５２により決定される。なお、式５０の場合と同様に、式５２におけるMdmdは、ロール方向（Ｘ軸まわり）及びピッチ方向（Ｙ軸まわり）の各成分（Mdmdx又はMdmdy）を意味する。

コンプライアンス制御用目標床反力モーメント
＝Mdmd＋モデル操作床反力モーメント ……式５２

従って、コンプライアンス制御用目標床反力モーメントとモデル操作床反力モーメントとの差がMdmdに等しくなるようにそれらの床反力モーメントが決定される。

上記のような演算を行なう補償全床反力モーメント分配器１１０をブロック図で表すと、図４に示すようになる。この演算処理により、ロール方向（Ｘ軸まわり）及びピッチ方向（Ｙ軸まわり）の各成分毎に、補償全床反力モーメントMdmd（Mdmdx又はMdmdy）が、床反力モーメント許容範囲内に収まっている場合には、Mdmdがそのままコンプライアンス制御用目標床反力モーメントとして決定されると共に、モデル操作床反力モーメントは“０”に決定される。

また、ロール方向（Ｘ軸まわり）及びピッチ方向（Ｙ軸まわり）の各成分毎に、補償全床反力モーメントMdmd（Mdmdx又はMdmdy）が、床反力モーメント許容範囲から逸脱している場合には、床反力モーメント許容範囲の上限値及び下限値のうちのMdmdに近い方の境界値が、コンプライアンス制御用目標床反力モーメントとして決定されると共に、床反力モーメント許容範囲からのMdmdの逸脱分（＝Mdmd−床反力モーメント許容範囲の境界値）の符号を反転させてなるモーメントがモデル操作床反力モーメントとして決定される。

補足すると、以上説明した補償全床反力モーメント分配器１１０の処理によって、本発明における分配手段が実現される。この場合、前記コンプライアンス制御用目標床反力モーメントが実ロボット１に付加的に作用させるべき付加的外力としての実移動体操作外力として機能し、モデル操作床反力モーメントが目標歩容を生成するために用いる動力学モデル上でロボット１に作用させるべきモデル操作外力として機能する。

図３の説明に戻って、歩容生成装置１００には上記の如く決定されたモデル操作床反力モーメントが入力される。そして、詳細は後述するが、歩容生成装置１００は、該歩容生成装置１００において決定される目標ＺＭＰまわりの床反力モーメントの水平成分がモデル操作床反力モーメントとなるように動力学モデルを用いて目標歩容の運動（目標運動）を生成する。なお、歩容生成装置１００から複合コンプライアンス動作決定部１０４に対して出力される目標全床反力は、目標ＺＭＰまわりの床反力モーメントの水平成分が“０”になることを目標とするものとして出力される。

また、補償全床反力モーメント分配器１１０で上記の如く決定されたコンプライアンス制御用目標床反力モーメントは、複合コンプライアンス動作決定部１０４に入力される。そして、複合コンプライアンス動作決定部１０４は、歩容生成装置１００が生成する目標歩容の運動にロボット１の運動を追従させつつ、目標ＺＭＰまわりの実床反力モーメントがコンプライアンス制御用目標床反力モーメントに近づくように、目標足平位置姿勢を修正することにより、機構変形補償付き修正目標足平位置姿勢（軌道）を決定する。

この場合、ロボット１の足平位置姿勢及び床反力の全ての状態を目標に一致させることは事実上不可能であるので、これらの間にトレードオフ関係を与えて妥協的になるべく一致させる。すなわち、複合コンプライアンス動作決定部１０４は、各目標に対する制御偏差に重みを与えて、制御偏差（あるいは制御偏差の２乗）の重み付き平均が最小になるように機構変形補償付き修正目標足平位置姿勢（軌道）を決定する。

換言すれば、目標ＺＭＰまわりの実床反力モーメントと、ロボット１の実際の足平位置姿勢とがそれぞれコンプライアンス制御用目標床反力モーメント、目標足平位置姿勢にできるだけ近づくように機構変形補償付き修正目標足平位置姿勢（軌道）が決定される。そして、複合コンプライアンス動作決定部１０４は、この修正目標足平位置姿勢をロボット幾何学モデル１０２に足平位置姿勢の最終的な目標値として出力することで、ロボット１の動作を制御する。

本実施形態では、上記した複合コンプライアンス動作決定部１０４の処理によって、本発明における動作制御手段が実現される。すなわち、複合コンプライアンス動作決定部１０４は、ロボット１の実際の運動を目標歩容の運動に追従させつつ、コンプライアンス制御用目標床反力モーメントを付加的外力としてロボット１に付加的に作用させるように実際のロボット１の動作制御を行なう。

なお、上記した複合コンプライアンス動作決定部１０４などの構成および動作は、本出願人が先に出願した特開平１０−２７７９６９号公報などに詳細に記載されている。従って、複合コンプライアンス動作決定部１０４に関する本明細書での説明は以上に留める。

以上の如く、ロボット１の動作制御を行うことによって、目標歩容の運動は、ロボット１の動力学モデル上でモデル操作外力としてのモデル操作床反力モーメントが目標ＺＭＰまわりに付加的に発生するように生成されつつ、実際のロボッ１の床反力には、モデル操作床反力モーメントが付加されないように制御される。したがって、差し引きモデル操作床反力モーメント分だけ、目標歩容の運動と床反力の不平衡（アンバランス）を生じる。このことは、前記上体姿勢角偏差Δθを０に収束させる効果に関して言えば、モデル操作床反力モーメントの符号を反転した床反力モーメントを実ロボット１に作用させることと等価である。

つまり、モデル操作床反力モーメントを適宜決定することにより、実ロボット１の上体２４の実際の姿勢を目標姿勢に収束させ、ひいては、実ロボット１の全体の姿勢を安定化させることができる。

この場合、モデル操作床反力モーメントの符号を反転したモーメントとコンプライアンス制御用目標床反力モーメントとの和が上体姿勢角偏差Δθを０に収束させるトータルの復元力（床反力モーメント）になる。すなわち、コンプライアンス制御用目標床反力モーメントとモデル操作床反力モーメントとの差がトータルの復元力になる。

なお、モデル操作床反力モーメントは、ＺＭＰ存在可能範囲を無視していかなる値でも取ることが可能であるので、非常に高い姿勢復元力を発生することができる。

次に、図５に示す走行歩容を例にして、歩容生成装置１００が生成する目標歩容の概要を説明する。

なお、以降の説明では、「床反力鉛直成分」、「床反力水平成分」は、それぞれ、特に断らない限り、「並進床反力鉛直成分」、「並進床反力水平成分」を意味するものとする。

また、歩容における「両脚支持期」とは、ロボット１がその自重を両脚体２，２で支持する期間、「片脚支持期」とはいずれか一方のみの脚体２でロボット１の自重を支持する期間、「空中期」とは両脚体２，２が床から離れている（空中に浮いている）期間を言う。また、片脚支持期においてロボット１の自重を支持する側の脚体２を「支持脚」、自重を支持しない側の脚体２を「遊脚」と呼ぶ。本実施形態で主に説明する走行歩容では、両脚支持期は無く、片脚支持期（着地期）と空中期とが交互に繰り返される。この場合、空中期では両脚２，２とも、ロボット１の自重を支持しないこととなるが、該空中期の直前の片脚支持期において遊脚であった脚体２、支持脚であった脚体２をそれぞれ該空中期においても遊脚、支持脚と呼ぶ。

まず、図５に示す走行歩容を説明すると、この走行歩容は、人間の通常的な走行歩容と同様の歩容である。この走行歩容では、ロボット１の左右いずれか一方のみの脚体２（支持脚）の足平２２が着地（接地）する片脚支持期と、両脚体２，２が空中に浮く空中期とが交互に繰り返される。

図５中の丸付きの数字は、走行歩容の時系列的な順番を示している。この場合、図５の１番目の状態は片脚支持期の開始時（初期）の状態、２番目の状態は片脚支持期の中間時点の状態、３番目の状態は片脚支持期に続く空中期の開始時（片脚支持期の終了時）の状態、４番目の状態は空中期の中間時点の状態、５番目の状態は空中期の終了時（次の片脚支持期の開始時）の状態を示している。また、図５中の白抜き矢印は、ロボット１の進行方向を示している。

この走行歩容では、ロボット１は、図５の１番目の状態で示すように、片脚支持期の開始時において支持脚（ロボット１の進行方向前側の脚体２）の足平２２のかかとで着地する。

続いて、図５の２番目の状態で示すように、ロボット１は、着地した足平２２（支持脚の足平２２）の底面のほぼ全面を着地させた後、図５の３番目の状態で示すように、その支持脚の足平２２（図５の３番目の状態におけるロボット１の進行方向後側の脚体２の足平２２）のつま先で床を蹴って空中に飛び上がる。これより片脚支持期が終了すると共に空中期が開始する。尚、片脚支持期における遊脚は、図５の１番目の状態で示すように、片脚支持期の開始時では、支持脚の後側に存在する。その後、該遊脚は、図５の２番目及び３番目の状態で示すように次の着地予定位置に向かって支持脚の前側に振り出される。

次いで、図５の４番目の状態で示す空中期を経た後、ロボット１は、遊脚（空中期の開始直前の片脚支持期で遊脚となっていた脚体２）の足平２２のかかとで着地し、次の片脚支持期が開始される。

図５の走行歩容を想定しつつ、前記歩容生成装置１００が生成する目標歩容の基本的な概要を説明する。

歩容生成装置１００が目標歩容を生成するとき、ロボット１の運動形態に関する基本的な要求を表す要求パラメータが、ロボット１の外部の図示しない操縦装置やサーバ等から無線通信等により歩容生成装置１００に入力される。該要求パラメータは、例えば、ロボット１の運動種別（歩行、走行等）や、遊脚側の足平２２の目標とする着地位置姿勢（着地予定位置姿勢）、目標とする着地時刻（着地予定時刻）、あるいは、これらを決定するために必要なパラメータ（例えばロボット１の平均移動速度や移動方向等）により構成される。なお、このような要求パラメータは、ロボット１の図示しない記憶装置に事前に記憶保持しておき、それを歩容生成装置１００が所定のスケジュールで読み込むようにしてもよい。

そして、歩容生成装置１００は、上記要求パラメータを用いて所定のアルゴリズムにより目標歩容を生成する。より詳しく言えば、本実施形態では、歩容生成装置１００は、上記要求パラメータに応じて、目標歩容の目標足平位置姿勢軌道、目標床反力鉛直成分軌道等、目標歩容の一部の構成要素を規定するパラメータとしての歩容パラメータを決定した上で、その歩容パラメータとロボット１の動力学モデルとを用いて目標歩容の瞬時値を逐次決定する。これにより歩容生成装置１００は、目標歩容の時系列パターン（軌道）を生成する。

この場合、目標足平位置姿勢軌道は、例えば本願出願人が特許第３２３３４５０号にて提案した有限時間整定フィルタを用いて各足平２２毎に生成される。この有限時間整定フィルタは、可変時定数の１次遅れフィルタ、すなわち、伝達関数が１／（１＋τｓ）の形で表されるフィルタ（τは可変の時定数。以下、このフィルタを単位フィルタという）を複数段（本実施形態では３段以上）、直列に接続したものであり、所望の指定時刻に指定値に到達するような軌道を生成・出力することができるものである。この場合、各段の単位フィルタの時定数τは、いずれも、有限時間整定フィルタの出力生成を開始してから、上記指定時刻までの残時間に応じて逐次可変的に設定される。より詳しくは、該残時間が短くなるに伴いτの値が所定の初期値（＞０）から減少されていき、最終的には、該残時間が“０”になる指定時刻にて、τの値が“０”になるように設定される。そして、有限時間整定フィルタには、前記指定値（より詳しくは、有限時間整定フィルタの出力の初期値から前記指定値への変化量）に応じた高さのステップ入力が与えられる。このような有限時間整定フィルタは、指定時刻にて指定値に達するような出力が生成されるだけでなく、指定時刻における有限時間整定フィルタの出力の変化速度を“０”もしくはほぼ“０”にすることができる。特に、単位フィルタを３段以上（３段でよい）、接続した場合には、有限時間整定フィルタの出力の変化加速度（変化速度の微分値）をも“０”もしくはほぼ“０”にすることができる。

このような有限時間整定フィルタを用いる足平位置姿勢軌道（足平２２が着地してから次に着地するまでの位置姿勢軌道）の生成は、例えば次のように行なわれる。例えばＸ軸方向（前後方向）の目標足平位置軌道は次のように生成される。すなわち、前記要求パラメータにより規定される各足平２２の次の着地予定位置のＸ軸方向位置（より詳しくは、次の着地予定位置のひとつ前の着地位置に対するＸ軸方向の変化量（移動量）。これは前記指定値に相当する）に応じて有限時間整定フィルタへのステップ入力の高さが決定されると共に前記時定数τが所定の初期値に初期化された後、その決定されたステップ入力が有限時間整定フィルタに与えられ、足平２２のＸ軸方向位置の軌道生成が開始される。そして、この軌道生成時には、前記時定数τは、足平２２の着地予定時刻（これは前記指定時刻に相当する）までに初期値から“０”まで減少していくように、逐次可変設定される。これにより、着地予定時刻で着地予定位置に達するような、足平２２のＸ軸方向の位置の軌道が生成される。

また、Ｚ軸方向（鉛直方向）の目標足平位置軌道は、例えば次のように生成される。すなわち、まず、足平２２の次の着地予定位置及び着地予定時刻に応じて、該足平２２の高さ（鉛直位置）が最大になるときの該足平２２のＺ軸方向位置（以下、最高点位置という）とその最高点位置への到達時刻とが決定される。そして、その最高点位置（これは前記指定値に相当する）に応じて有限時間整定フィルタへのステップ入力の高さが決定されると共に時定数τが初期化された後、その決定されたステップ入力が有限時間整定フィルタに与えられ、前記最高点位置までのＺ軸方向の足平位置軌道が逐次生成される。この際、時定数τは、最高点位置への到達時刻（前記指定時刻に相当）までに初期値から０まで減少するように逐次可変設定される。さらに、最高点位置までのＺ軸方向位置の軌道の生成が終了したら、時定数τを初期化すると共にいままでのステップ入力と逆極性のステップ入力（より詳しくは、最高点位置から次の着地予定位置までのＺ軸方向の変化量（これは前記指定値に相当する）に応じた高さの逆極性のステップ入力）が有限時間整定フィルタに入力され、該最高点位置から着地予定位置までのＺ軸方向の足平位置の軌道が逐次生成される。この際、時定数τは足平２２の着地予定時刻までに初期値から０まで減少するように逐次可変設定される。

尚、Ｚ軸方向の足平位置軌道の生成においては、時定数τを軌道生成開始時刻から足平２２の着地予定時刻まで、初期値から“０”まで継続的に減少するように可変設定すると共に、最高点位置への到達時刻もしくはその近傍時刻で、ステップ入力の極性を逆極性に切り替えることで、Ｚ軸方向の足平位置軌道を生成するようにしてもよい。この場合には、足平２２を所望の最高点位置に精度よく到達させることはできないが、着地予定時刻での着地予定位置への到達は問題なく行なうことができる。

足平姿勢軌道についても、上述した足平位置軌道と同様に有限時間整定フィルタを用いて生成することができる。この場合、足平姿勢の空間的な各成分のうち、その姿勢の角度変化が単調的（単調増加もしくは単調減少）なものとなる成分については、前記したＸ軸方向の足平位置軌道の生成と同様に足平姿勢軌道を生成すればよい。また、姿勢の角度変化が極大値もしくは極小値をもつような成分については、前記したＺ軸方向の足平位置軌道の生成と同様に足平姿勢軌道を生成すればよい。

尚、上記のように有限時間整定フィルタにより生成される目標足平位置姿勢軌道は、後述の支持脚座標系での各足平２２の目標位置姿勢軌道である。

上述のように生成される目標足平位置姿勢軌道は、各足平２２の位置が、その初期接地状態（目標歩容の初期時刻の状態）から着地予定位置に向かって徐々に加速しながら移動を開始するように生成される。そして、該目標足平位置姿勢軌道は、最終的に着地予定時刻までに徐々に位置の変化速度を“０”またはほぼ“０”にまで減速し、着地予定時刻にて着地予定位置に到達して停止するように生成される。このため、各足平２２の着地瞬間における対地速度（床に固定された支持脚座標系での各足平２２の位置の変化速度）が“０”またはほぼ“０”になる。したがって、走行歩容において同時に全脚体２，２が空中に存在する状態（空中期での状態）から着地しても、着地衝撃が小さくなる。

前記走行歩容においては、ロボット１に作用する重力によって空中期後半から上体２４の鉛直速度は下向きになり、着地時でも下向きのままである。したがって、上記のように各足平２２の着地瞬間における対地速度が“０”またはほぼ“０”になるように目標足平位置姿勢軌道を生成すると共に、後述する如く動力学的平衡条件を満たすように上体２４の目標位置姿勢軌道を生成したとき、着地直前において、上体２４に対する遊脚側の足平２２の相対速度は、上向きになる。すなわち、走行歩容の着地瞬間では、ロボット１の目標歩容は遊脚側の脚体２を上体２４側に引っ込めながら着地するような歩容となる。言い換えれば、本実施形態での目標歩容では、ロボット１は、着地瞬間において、遊脚側の足平２２の対地速度が“０”またはほぼ“０”になるように、上体２４から見て該足平２２を引き上げるようにして着地する。これによって、着地衝撃は小さくなり、着地衝撃が過大になるのを防止するようにしている。

また、本実施形態では、有限時間整定フィルタは、単位フィルタを３段以上（例えば３段）、直列に接続したものであるため、着地予定時刻までに各足平２２の速度（足平位置の変化速度）が“０”またはほぼ“０”になるだけでなく、各足平２２は、その加速度も着地予定時刻にて０またはほぼ０になって停止する。つまり、着地瞬間における対地加速度も“０”またはほぼ“０”になる。したがって、着地衝撃がより一層小さくなる。特に、実際のロボット１の着地時刻が目標の着地時刻からずれても、衝撃があまり増大しなくなる。補足すると、着地予定時刻にて各足平２２の対地速度を“０”またはほぼ“０”にする上では、有限時間整定フィルタの単位フィルタの段数は２段でもよいが、この場合には、着地予定時刻での各足平２２の加速度は一般には“０”にならない。

尚、足平姿勢に関しては、各足平２２が着地予定時刻にてその踵で着地した後、該足平２２の底面のほぼ全面が床に接地するまで動き続ける。このため、該足平２２の底面のほぼ全面が床に接地する時刻を前記指定時刻に設定して、前記有限時間整定フィルタにより足平姿勢軌道が生成される。

また、本実施形態では、有限時間整定フィルタを用いて足平位置軌道を生成したが、着地予定時刻での足平位置の変化速度が“０”またはほぼ“０”になる（足平位置の時間微分値が“０”になる）ように、さらには、該着地予定時刻での足平位置の変化加速度（変化速度の時間微分値）が“０”またはほぼ“０”になるように設定された多項式などの関数を用いて目標足平位置軌道を生成するようにしても良い。このことは、目標足平姿勢軌道の生成に関しても同様である。但し、該目標足平姿勢軌道の生成に関しては、上述の如く、各足平２２の底面のほぼ全面が床に接地する時刻にて、各足平２２の姿勢の変化速度、さらにはその変化加速度が“０”またはほぼ“０”になるように多項式などの関数が設定される。

歩容生成装置１００は目標床反力鉛直成分を明示的に設定する。この目標床反力鉛直成分軌道は、例えば図６のように設定される。本実施形態では、走行歩容における目標床反力鉛直成分軌道の形状（詳しくは片脚支持期での形状）は、台形状（床反力鉛直成分の増加側に凸の形状）に定められている。そして、その台形の高さ、折れ点の時刻が目標床反力鉛直成分軌道を規定する歩容パラメータ（床反力鉛直成分軌道パラメータ）として決定される。

尚、走行歩容の空中期では、目標床反力鉛直成分は定常的に“０”に設定される。この例のように、目標床反力鉛直成分軌道は、実質的に連続になるように（値が不連続にならないように）設定するのがよい。これは床反力を制御する際のロボット１の関節の動作を滑らかにするためである。ここで、「実質的に連続」というのは、アナログ的に連続な軌道（真の意味での連続な軌道）を離散時間系でデジタル表現したときに必然的に生じる値の飛びは、該軌道の連続性を失わせるものではないということを意味するものである。

補足すると、本実施形態では、ロボット１に作用する外力の全体として、床反力を想定しているので、目標床反力鉛直成分は、ロボット１全体の（ロボット１の全体重心の）鉛直方向の慣性力を規定するものとなる。すなわち、目標床反力鉛直成分から、ロボット１全体に作用する重力に釣り合う成分を差し引いたものが、ロボット１全体の鉛直方向の慣性力に釣り合うものとなる。従って、目標床反力鉛直成分を決定することによって、結果的には、ロボット１全体の鉛直方向の慣性力が決定されることとなる。

目標ＺＭＰ軌道は，例えば図７（ａ），（ｂ）に示す如く設定される。図５の走行歩容においては、ロボット１は、前記したように支持脚側足平２２のかかとで着地し、次にその支持脚側足平２２のつま先で蹴って空中に飛び上がり、最後に遊脚側足平２２のかかとで着地する。従って、片脚支持期での目標ＺＭＰ軌道のＸ軸方向位置（前後方向位置）は、図７（ａ）に示すように、支持脚側足平２２のかかとを初期位置として、次に支持脚側足平２２の底面のほぼ全面が接地する期間において該足平２２の前後方向の中央に移動し、その後、離床時までに支持脚側足平２２のつまさきに移動するように設定される。尚、片脚支持期における目標ＺＭＰ軌道のＹ軸方向位置（左右方向位置）は、図７（ｂ）に示すように、支持脚側脚体２の足首関節の中心のＹ軸方向位置と同じ位置に設定される。

図７（ａ）に示すように、空中期における目標ＺＭＰ軌道のＸ軸方向位置は、該空中期が終了するまで（遊脚側脚体２が着地するまで）に支持脚側足平２２のつま先から遊脚側足平２２のかかとの着地位置まで連続的に移動するように設定される。また、図７（ｂ）に示すように、空中期における目標ＺＭＰ軌道のＹ軸方向位置は、該空中期が終了するまで（遊脚側脚体２が着地するまで）に支持脚側脚体２の足首関節の中心のＹ軸方向位置から遊脚側脚体２の足首関節の中心のＹ軸方向位置まで連続的に移動するように設定される。すなわち、目標ＺＭＰ軌道は歩容の全期間において連続（実質的に連続）する軌道に設定される。ここで、上記したＺＭＰ軌道の「実質的に連続」の意味は、前記床反力鉛直成分軌道の場合と同様である。

本実施形態では、図７（ａ），（ｂ）に示したような目標ＺＭＰ軌道の折れ点の位置や時刻が、ＺＭＰ軌道パラメータ（目標ＺＭＰ軌道を規定するパラメータ）として設定される。

ＺＭＰ軌道パラメータは、安定余裕が高く、かつ急激な変化をしないように決定される。ここで、ロボット１の接地面を含む最小の凸多角形（いわゆる支持多角形）の中央付近に目標ＺＭＰが存在する状態を安定余裕が高いと言う（詳細は特開平１０−８６０８１号公報を参照）。図７（ａ），（ｂ）の目標ＺＭＰ軌道はこのような条件を満たすように設定したものである。

また、目標腕姿勢は、上体２４に対する相対姿勢で表される。

また、目標上体位置姿勢及び目標足平位置姿勢はグローバル座標系で記述される。グローバル座標系は床に固定された座標系であり、より具体的には、以下に説明する支持脚座標系が用いられる。該支持脚座標系は、支持脚側足平２２を床面に平行な姿勢にして該支持脚側足平２２の底面のほぼ全面を床面に接触（密着）させた状態において、該支持脚側脚体２の足首中心から床面に延ばした垂線が該床面と交わる点（この点は、本実施形態の例では支持脚側足平２２の底面のほぼ全面を床面に接触させた状態では、該足平２２の代表点と合致する）を原点とし、その原点を通る水平面をＸＹ平面とする、床に固定された座標系である。この場合、Ｘ軸方向、Ｙ軸方向は、それぞれ支持脚側足平２２の前後方向、左右方向である。

尚、支持脚座標系の原点は、必ずしも支持脚側足平２２の底面のほぼ全面を床面に接触させた状態での該足平２２の代表点（足平２２の位置を代表する点）に合致する必要はなく、該代表点と異なる床面上の点に設定されてもよい。

次に、本実施形態で歩容生成に用いられるロボット１の動力学モデルについて図８を参照して説明する。

本実施形態に用いられるロボット１の動力学モデルは、図８に示す如く、目標ＺＭＰを支点として揺動自在な可変長のロッド２４ａと、このロッド２４ａの上端に支持された質点２４ｂとを備える倒立振子により構成されるモデル（以下、倒立振子モデルということがある）である。なお、ロッド２４ａは、質量を持たないものとする。この動力学モデルでは、倒立振子の質点２４ｂの運動が、ロボット１の上体２４の運動に対応しており、上体２４の運動とロボット１に作用する床反力との間の関係が、質点２４ｂ（以降、上体質点２４ｂという）の運動と、倒立振子に作用する床反力との間の関係として表現される。また、この動力学モデルでは、ロボット１の脚体２，２の質量は、上体２４（または上体２４と腕体及び頭部を合わせた質量）よりも十分に小さいものとみなし、上体質点２４ｂの質量は、ロボット１の全体の質量に一致するものとされる。なお、上体質点２４ｂの位置は、ロボット１の上体位置姿勢から一義的に定まる位置に設定される。

この動力学モデルの挙動は、以下に示すように数式化される。ただし、説明を簡単にするために、サジタルプレーン（支持脚座標系のＸ軸とＺ軸とを含む平面）での運動方程式のみを記述し、ラテラルプレーン（支持脚座標系のＹ軸とＺ軸とを含む平面）での運動方程式を省略した。

説明の便宜上、動力学モデルに関する変数およびパラメータを以下のように定義する。
Ｚb：上体質点鉛直位置（Ｚ軸方向位置）
Ｘb：上体質点水平位置（Ｘ軸方向位置）
mb：上体質点質量
Ｘzmp：目標ＺＭＰの水平位置（Ｘ軸方向位置）
Ｚzmp：目標ＺＭＰの鉛直位置（Ｚ軸方向位置）
Ｆx：床反力水平成分（詳しくは並進床反力のＸ軸方向成分）
Ｆz：床反力鉛直成分（詳しくは並進床反力のＺ軸方向成分）
Ｍzmp_y：目標ＺＭＰまわりの床反力モーメント（詳しくは該床反力モーメントのＹ軸まわり成分）
Ｍb_y：支持脚座標系の原点まわりの床反力モーメント（詳しくは該床反力モーメントのＹ軸まわり成分）

また、任意の変数Ａに対して、dA/dtはＡの１階微分値を表わし、d2A/dt2はＡの２階微分値を表わす。したがって、変数Ａが変位（位置）ならば、dA/dtは速度、d2A/dt2は加速度を意味する。ｇは重力加速度定数を示す。ここでは、ｇは正の値とする。

上記動力学モデルの運動方程式は、式０１〜０４で表される。

Fz＝mb＊(g＋d2Zb/dt2) ……式０１
Fx＝mb＊d2Xb/dt2 ……式０２
Mb_y＝−mb＊Xb＊(g＋d2Zb/dt2)
＋mb＊Zb＊(d2Xb/dt2) ……式０３
Mzmp_y＝−mb＊(Xb−Xzmp)＊(g＋d2Zb/dt2)
＋mb＊(Zb−Zzmp)＊(d2Xb/dt2) ……式０４

この場合、Mb_yとMzmp_yとの間の関係は、次式０５により表される。

Mb_y＝Mzmp_y−mb＊Xzmp＊(g＋d2Zb/dt2)＋mb＊Zzmp＊(d2Xb/dt2)
＝Mzmp_y−Xzmp＊Fz＋Zzmp＊Fx
……式０５

なお、目標ＺＭＰと支持脚座標系の原点との鉛直方向（Ｚ軸方向）での位置の差は通常、“０”又はほぼ“０”となるので、Ｚzmp＝０と見なしてもよい。

また、ロボット１の移動時の上体２４の高さ（鉛直方向位置）の、平均的な高さに対する相対的な変動量（換言すれば上体２４の鉛直方向位置の分散）は一般には十分に小さいので、Ｚb≒ｈ（ｈ：上体２４の平均的な高さに対応する上体質点２４ｂの平均的な高さとしての一定値）と見なすことができる。従って、上記式０３の右辺第２項と式０４の右辺第２項とにおけるＺbを定数値ｈで置き換えてもよい。

本実施形態における歩容生成装置１００は、ロボット１の片方の脚体２が着地してから他方の脚体２が着地するまでの１歩分の目標歩容を単位として、その１歩分の目標歩容を順番に生成する。従って、本実施形態で生成する図５の走行歩容では、該目標歩容は片脚支持期の開始時から、これに続く空中期の終了時（次の片脚支持期の開始時）までの目標歩容が順番に生成される。

ここで、本明細書では、目標歩容の「１歩」は、ロボット１の片方の脚体２が着地してからもう一方の脚体２が着地するまでの意味で使用する。また、新たに生成しようとしている目標歩容を「今回歩容」、その次の目標歩容を「次回歩容」、さらにその次の目標歩容を「次次回歩容」、というように呼ぶ。また、「今回歩容」の一つ前に生成した目標歩容を「前回歩容」と呼ぶ。

また、歩容生成装置１００が今回歩容を生成するとき、該歩容生成装置１００には、ロボット１の２歩先までの遊脚側足平２２の着地予定位置姿勢、着地予定時刻を規定する要求パラメータが入力される（あるいは歩容生成装置１００が記憶装置から要求パラメータを読み込む）。そして、歩容生成装置１００は、これらの要求パラメータを用いて、目標上体位置姿勢軌道、目標足平位置姿勢軌道、目標ＺＭＰ軌道、目標床反力鉛直成分軌道、目標腕姿勢軌道等を生成する。

このとき、歩容生成装置１００は、ロボット１の運動の継続性を確保し得る今回歩容を生成するために、今回歩容に続く仮想的な周期的歩容（同じパターンのロボット１の運動が一定周期で継続的に繰り返される歩容）としての定常旋回歩容を要求パラメータに応じて決定する。そして、歩容生成装置１００は、今回歩容を将来的に定常旋回歩容に収束させるようにして、該今回歩容を生成する。

以下に図５の走行歩容を生成することを主要例にして、歩容生成装置１００の歩容生成処理の詳細と、姿勢安定化制御演算部１１２の処理の詳細とを説明する。

まず、歩容生成装置１００の歩容生成処理の詳細を、図９〜図２２を参照しつつ説明する。歩容生成装置１００は、図９のフローチャート（構造化フローチャート）に示す歩容生成処理（メインルーチン処理）を実行することによって目標歩容を生成する。なお、本実施形態では、歩容生成装置１００は、それが実行する処理によって、目標運動決定手段としての機能と、上下方向慣性力パラメータ決定手段としての機能とを含んでいる。

まずＳ０１０において時刻ｔを“０”に初期化するなど種々の初期化作業が行なわれる。この処理は、歩容生成装置１００の起動時等に行なわれる。

次いで、Ｓ０１２を経てＳ０１４に進み、歩容生成装置１００は、制御周期（図９のフローチャートの演算処理周期）毎のタイマ割り込みを待つ。制御周期はΔｔである。

次いで、Ｓ０１６に進み、歩容生成装置１００は、歩容の切り替わり目であるか否かを判断する。このとき、歩容の切り替わり目である場合には、Ｓ０１８に進み、切り替わり目でない場合には、Ｓ０３２に進む。ここで、上記「歩容の切り替わり目」は、前回歩容の生成が完了し、今回歩容の生成を開始するタイミングを意味し、例えば前回歩容の生成を完了した制御周期の次の制御周期が歩容の切り替わり目になる。

Ｓ０１８に進むときは時刻ｔが“０”に初期化される。次いでＳ０２０に進み、歩容生成装置１００は、次回歩容支持脚座標系、次次回歩容支持脚座標系、今回歩容周期および次回歩容周期を決定する。なお、支持脚座標系を決定するということはその原点の位置と該支持脚座標系の姿勢（各座標軸の向き）とを決定することを意味する。

これらの支持脚座標系及び歩容周期は、前記要求パラメータに基づき決定されるものである。すなわち、本実施形態では、歩容生成装置１００に入力される要求パラメータは、２歩先までの遊脚側足平２２の着地予定位置姿勢（足平２２が着地してから足底を床面にほぼ全面的に接触させるように、滑らさずに回転させた状態での足平位置姿勢）と着地予定時刻とを規定する要求値を含んでいる。そして、その１歩目の要求値、２歩目の要求値がそれぞれ、今回歩容、次回歩容に対応するものとして、今回歩容の生成開始時（前記Ｓ０１６の歩容の切り替わり目）以前に歩容生成装置１００に与えられる。なお、これらの要求値は今回歩容の生成途中で変更し得るようにすることも可能である。

そして、上記要求パラメータにおける１歩目の遊脚側足平２２（今回歩容での遊脚側足平２２）の着地予定位置姿勢の要求値に対応して次回歩容支持脚座標系が決定される。

例えば図１２を参照して、今回歩容（１歩目）に係わる遊脚側足平２２（図では２２Ｌ）の着地予定位置姿勢の要求値が、今回歩容の支持脚側足平２２（図では２２Ｒ）の着地位置姿勢に対して、今回歩容支持脚座標系のＸ軸方向（今回歩容の支持脚側足平２２Ｒの前後方向）及びＹ軸方向（今回歩容の支持脚側足平２２Ｒの左右方向）に、それぞれxnext、ynextだけ移動し、且つＺ軸まわり（鉛直軸まわり）にθznextだけ回転させた位置姿勢であるとする。

このとき、次回歩容支持脚座標系は、図示のように今回歩容の遊脚側足平２２Ｌの着地予定位置姿勢の要求値に従って該足平２２Ｌを着地させた場合（足平２２の代表点を着地予定位置の要求値に一致させ、且つ、足平２２の姿勢（向き）を着地予定姿勢の要求値に一致させた場合）における該足平２２Ｌの代表点（より詳しくは該代表点に合致する床上の点）を原点とし、該原点を通る水平面内における該足平２２Ｌの前後方向、左右方向をそれぞれＸ’軸方向、Ｙ’軸方向とする座標系に決定される。

上記と同様に、２歩目の遊脚側足平２２の着地予定位置姿勢の要求値に応じて次々回歩容支持脚座標系（図１２のＸ”Ｙ”座標を参照）が決定される。また、今回歩容周期は、今回歩容の支持脚側足平２２の着地予定時刻（要求値）から、１歩目（今回歩容）の遊脚側足平２２の着地予定時刻（要求値）までの時間として決定され、次回歩容周期は、１歩目の遊脚側足平２２の着地予定時刻（要求値）から２歩目の遊脚側足平２２の着地予定時刻（要求値）までの時間として決定される。

尚、前記要求パラメータは、例えば、ロボット１の外部の操縦装置あるいはサーバ等から歩容生成装置１００に入力される。あるいは、要求パラメータは、ロボット１の移動スケジュールとしてロボット１に記憶装置にあらかじめ記憶保持されていてもよい。あるいは、操縦装置からの指令（要求）とそのときまでのロボットの１の移動履歴とを基に前記次回及び次次回歩容支持脚座標系、並びに今回及び次回歩容周期を決定してもよい。また、要求パラメータは、前記次回及び次次回歩容支持脚座標系の位置及び姿勢、並びに今回及び次回歩容周期を直接的に指定するパラメータであってもよい。

次いでＳ０２２に進み、歩容生成装置１００は、今回歩容に続く仮想的な周期的歩容（今回歩容の収束目標とする仮想的な周期的歩容）としての定常旋回歩容の歩容パラメータを決定する。該歩容パラメータは、本実施形態では、定常旋回歩容における目標足平位置姿勢軌道を規定する足平軌道パラメータ、目標上体姿勢軌道を規定する上体姿勢軌道パラメータ、目標腕姿勢軌道を規定する腕軌道パラメータ、目標ＺＭＰ軌道を規定するＺＭＰ軌道パラメータ、目標床反力鉛直成分軌道を規定する床反力鉛直成分軌道パラメータを含む。

ここで、「定常旋回歩容」は、その歩容を繰り返したときに歩容の境界（１周期毎の歩容の境界）においてロボット１の運動状態（足平位置姿勢、上体位置姿勢等の運動状態）に不連続が生じないような周期的歩容を意味する。また、「定常旋回歩容」は、周期的歩容、すなわち同じパターンの歩容を一定周期で繰り返す歩容であるから、ロボット１の運動を継続的に行い得る歩容である。換言すれば、「定常旋回歩容」は、歩容の軌道の不連続を発生することなく、同じパターンの運動を繰り返すことができる周期的歩容（原理上、無限回繰り返しても後述の「発散」が発生しない歩容）である。

周期的歩容である定常旋回歩容は、本実施形態では、ロボット１の２歩分の歩容、すなわち今回歩容に続く第１旋回歩容と該第１旋回歩容に続く第２旋回歩容とからなる歩容を１周期分の歩容として、その１周期分の歩容を一定周期で繰り返す歩容である。ここで「旋回」なる用語を用いたのは、旋回率を零とするときは直進を意味するので、直進も広義の意味で旋回に含ませることができるからである。

また、生成する目標歩容が前記した図５の走行歩容である場合には、定常歩容の第１旋回歩容及び第２旋回歩容は、いずれも目標歩容と同様に片脚支持期と空中期とを有する歩容である。つまり、第１旋回歩容及び第２旋回歩容の基本的な歩容形態は今回歩容と同一である。

定常旋回歩容（以降、単に定常歩容ということがある）について補足すると、２足移動ロボットでは、定常歩容の１周期分の歩容には、少なくとも２歩分の歩容が含まれる必要である。この場合、３歩以上の歩容を１周期分の歩容とする複雑な定常歩容を設定することも可能である。但し、定常歩容は、後述の如く、今回歩容の終端（終了時刻）における目標とする（適切な）発散成分の値を決定するためだけに用いられる。このため、３歩以上の歩容を１周期とする定常歩容を用いることは、歩容生成の処理が煩雑となるにもかかわらず、効果は少ない。そこで、本実施形態での定常歩容の１周期分の歩容を２歩分の歩容（第１旋回歩容及び第２旋回歩容の組）により構成するようにしている。尚、３足以上の脚式移動ロボットにあっては、それに応じて定常歩容を定義するに足る歩容数が増加する。

ここで、「発散」とは、図１０に示すように、ロボット１の上体２４の位置が両足平２２，２２の位置からかけ離れた位置にずれてしまうことを意味する。また、発散成分の値とは、ロボット１の上体２４の位置が両足平２２，２２の位置（より具体的には、支持脚側足平２２の接地面に設定された支持脚座標系の原点）からかけ離れていく具合を表す数値である。

定常歩容は、歩容生成装置１００で今回歩容の終端におけるロボット１の目標とする運動状態を決定するために作成される仮想的な歩容である。従って、定常旋回歩容は、歩容生成装置１００からそのまま出力されるものではない。

本実施形態では、目標歩容が、上記発散を生じることなく、継続的に生成されるように、発散成分を指標にして歩容を生成するようにした。この場合、継続的な歩容の代表例である定常歩容であっても、定常歩容の歩容パラメータが変われば、該定常歩容の初期発散成分（定常歩容の初期時刻での発散成分）も変わる。すなわち、歩き方、走り方、移動速度等の歩容形態によって、適切な発散成分が変わる。

そこで、本実施形態では、歩容生成装置１００は、今回歩容を生成しようとするときに、まず、その生成しようとする今回歩容の後に続く歩容（将来的な収束も目標とする歩容）として好適な将来の仮想的な周期的歩容（ロボット１の安定な移動を継続することが可能な将来の仮想的な周期的歩容）としての定常歩容を、今回歩容に係わる要求パラメータに応じて決定した上で、該定常歩容の初期発散成分を求める。そして、歩容生成装置１００は、今回歩容の終端発散成分を、その求めた定常歩容の初期発散成分に一致させる（より一般的には、今回歩容を定常歩容に連続させもしくは漸近させる）ように、今回歩容を生成する。このような歩容生成の基本的な指針は本出願人が先に提案した特許第３７２６０８１号のものと同様である。

ただし、本実施形態では、歩容の発散成分は、前記した図８の動力学モデル（倒立振子モデル）の状態方程式に基づいて後述するように定義される。該発散成分の定義の詳細については後述する。

本題に戻り、Ｓ０２２では、歩容生成装置１００は、図１１のフローチャートに示すサブルーチン処理を実行する。

まず、Ｓ１００において、歩容生成装置１００は、今回歩容、第１旋回歩容、第２旋回歩容の順に足平位置姿勢軌道がつながるように、定常歩容の歩容パラメータのうちの足平軌道パラメータが決定される。以下に具体的な設定方法を図１２を参照して説明する。尚、以降の説明では、支持脚側の脚体２の足平２２を支持脚足平２２と称し、遊脚側の脚体２の足平２２を遊脚足平２２と称する。また、歩容の「初期」、「終端」はそれぞれ歩容の開始時刻、終了時刻、あるいは、それらの時刻における瞬時歩容を意味する。

足平軌道パラメータは、第１旋回歩容および第２旋回歩容のそれぞれの初期と終端とにおける支持脚足平２２及び遊脚足平２２のそれぞれの位置姿勢、各旋回歩容の歩容周期（各旋回歩容の初期から終端までの時間）等から構成される。この足平軌道パラメータのうち、第１旋回歩容初期遊脚足平位置姿勢は、次回歩容支持脚座標系から見た今回歩容終端支持脚足平位置姿勢とされる。

この場合、走行歩容では、今回歩容終端における支持脚足平２２は、空中に移動している。そして、今回歩容終端支持脚足平位置姿勢は、今回歩容初期支持脚足平位置姿勢（＝前回歩容終端遊脚足平位置姿勢）から、前記要求パラメータにおける２歩目の遊脚足平２２の着地予定位置姿勢の要求値（今回歩容の支持脚足平２２の次回歩容における着地予定位置姿勢の要求値）もしくは該要求値に対応する次次回歩容支持脚座標系に応じて定まる次回歩容終端遊脚足平位置姿勢に至る足平位置姿勢軌道（詳しくは次回歩容支持脚座標系から見た軌道）を、今回歩容終端まで前記有限時間整定フィルタを用いて生成することにより求められる。

尚、次回歩容終端遊脚足平位置姿勢は、その位置姿勢から水平姿勢まで、足平２２を接地させたまま、つま先を下げるようにピッチ方向に回転させたときの該足平２２の位置姿勢が次次回歩容支持脚座標系の位置姿勢に合致するように決定される。換言すれば、次回歩容終端遊脚足平位置姿勢は、前記要求パラメータにおける２歩目の遊脚足平２２の着地予定位置姿勢の要求値から、該足平２２をすべらないように接地させたまま、つま先を持ち上げるようにピッチ方向に所定角度回転させた状態（つま先を上げてかかとを着地させた状態）での該足平２２の位置姿勢である。

また、第１旋回歩容初期支持脚足平位置姿勢は、次回歩容支持脚座標系から見た今回歩容終端遊脚足平位置姿勢とされる。この場合、今回歩容終端遊脚足平位置姿勢は、前記次回歩容終端遊脚足平位置姿勢の場合と同様、前記次回歩容支持脚座標系もしくはこれに対応する前記要求パラメータの１歩目（今回歩容）の遊脚着地予定位置姿勢の要求値に応じて決定されるものである。すなわち、今回歩容終端遊脚足平位置姿勢は、その位置姿勢から、足平２２を接地させたまま、つま先を下げるように該足平２２を回転させて該足平２２の底面のほぼ全面を床面に接地させたときの該足平２２の代表点が次回歩容支持脚座標系の原点に合致するように決定される。

第１旋回歩容終端遊脚足平位置姿勢は、今回歩容終端遊脚足平位置姿勢や次回歩容終端遊脚足平位置姿勢の決定手法と同様に、次回歩容支持脚座標系から見た次次回歩容支持脚座標系の位置姿勢に基づいて決定される。より具体的には、第１旋回歩容終端遊脚足平位置姿勢は、その位置姿勢から水平姿勢まで、足平２２を接地させたまま、すべらないように該足平２２をピッチ方向に回転させたときの該足平２２の位置姿勢が、次回歩容支持脚座標系から見た次次回歩容支持脚座標系の位置姿勢に合致するように決定される。

第１旋回歩容終端では、支持脚足平２２は離床して空中にある。支持脚足平２２が離床してから後の軌道を決定するために、第１旋回歩容支持脚足平着地予定位置姿勢が設定される。第１旋回歩容支持脚足平着地予定位置姿勢は、次回歩容支持脚座標系から見た次次次回歩容支持脚座標系の位置姿勢に基づいて決定される。より具体的には、第１旋回歩容支持脚足平着地予定位置姿勢は、次回歩容支持脚座標系から見た次次次回歩容支持脚座標系の位置姿勢である。なお、次次次回歩容支持脚座標系は、次次回歩容支持脚座標系と次次次回歩容支持脚座標系との相対的位置姿勢関係が、今回歩容支持脚座標系と次回歩容支持脚座標系との相対的位置姿勢関係と一致するように決定される。

第１旋回歩容終端支持脚足平位置姿勢は、第１旋回歩容初期支持脚足平位置姿勢を求めた場合と同様に、第１旋回歩容初期支持脚足平位置姿勢から、前記第１旋回歩容支持脚足平着地予定位置姿勢に至る足平位置姿勢軌道（より詳しくは次回歩容支持脚座標系から見た軌道）を、第１旋回歩容終端まで前記有限時間整定フィルタを用いて生成することにより求められる。

第２旋回歩容初期遊脚足平位置姿勢は、次次回歩容支持脚座標系から見た第１旋回歩容終端支持脚足平位置姿勢とされる。第２旋回歩容初期支持脚足平位置姿勢は、次次回歩容支持脚座標系から見た第１旋回歩容終端遊脚足平位置姿勢とされる。

第２旋回歩容終端遊脚足平位置姿勢は、今回歩容支持脚座標系から見た今回歩容終端遊脚足平位置姿勢とされる。第２旋回歩容終端支持脚足平位置姿勢は、今回歩容支持脚座標系から見た今回歩容終端支持脚足平位置姿勢とされる。

第１旋回歩容および第２旋回歩容の歩容周期は、次回歩容周期と同一に設定される。これらの第１旋回歩容及び第２旋回歩容の歩容周期は、互いに同一にすることは必ずしも必要ではないが、いずれの周期も、少なくとも次回歩容周期に応じて決定するのが好ましい。

次に、Ｓ１０２に進み、歩容生成装置１００は、定常歩容における目標上体姿勢軌道を規定する上体姿勢軌道パラメータを決定する。

この場合、本実施形態では、定常歩容の上体姿勢軌道パラメータは、それより規定される目標上体姿勢軌道があらかじめ定められた所定パターンの基準上体姿勢の軌道に一致するように決定される。この基準上体姿勢は、本実施形態では、経時的な変化の無い一定姿勢（固定的な姿勢）に設定されている。その基準上体姿勢は、例えば上体２４の体幹軸が定常的に鉛直方向を向く姿勢（ロボット１の直立姿勢で起立した状態での上体姿勢）、すなわち、鉛直方向に対する上体姿勢角が定常的に“０”に保たれる姿勢である。そして、このような基準上体姿勢の軌道を規定するパラメータ（基準上体姿勢の一定の上体姿勢角の値等）が上体姿勢軌道パラメータとして決定される。なお、このように上体姿勢を一定姿勢とした場合には、必然的に上体姿勢角の角速度及び角加速度も定常的に“０”に保たれる。

補足すると、定常歩容の上体姿勢は、定常歩容の初期（第１旋回歩容の初期）と終端（第２旋回歩容の終端）とでつながるように（上体姿勢角及びその角速度がそれぞれ、定常歩容の初期と終端とで一致するように）に設定されている限り、一定姿勢である必要はない。本実施形態では、本実施形態の理解を容易にするために基準上体姿勢を上記の如く一定姿勢とした。

次に、Ｓ１０４に進み、歩容生成装置１００は、腕姿勢軌道パラメータ、より詳しくは鉛直軸（あるいは上体２４の体幹軸）まわりの両腕体の角運動量変化に関すること以外の腕姿勢軌道パラメータが決定される。たとえば、上体２４に対する腕体の手先の相対高さや腕体全体の相対重心位置などを規定するパラメータが腕姿勢軌道パラメータとして決定される。この場合、本実施形態では、腕体全体の相対重心位置は、上体２４に対して一定に維持されるように設定される。

次に、Ｓ１０６に進み、歩容生成装置１００は、床反力鉛直成分軌道パラメータを決定する。この場合、該パラメータにより規定される床反力鉛直成分軌道が、第１旋回歩容および第２旋回歩容のいずれにおいても、実質的に連続なものとなるように床反力鉛直成分軌道パラメータが決定される。

具体的には、定常歩容の目標床反力鉛直成分軌道は、例えば図１３に示すようなパターンで設定される。そのパターンでは、第１旋回歩容及び第２旋回歩容のいずれにおいても、片脚支持期では床反力鉛直成分が台形状に変化し、空中期では床反力鉛直成分が零に維持される。そして、このパターンの折れ点の時刻や、台形部分の高さ（ピーク値）が床反力鉛直成分軌道パラメータとして決定される。

この床反力鉛直成分軌道パラメータは、定常歩容の１周期分の期間（第１旋回歩容の期間と第２旋回歩容の期間とを合わせた期間）における床反力鉛直成分の平均値をロボット１の自重と一致させるように決定される。すなわち、定常歩容の１周期分の期間における床反力鉛直成分の平均値がロボット１の全体に作用する重力と同じ大きさで反対向きになるようにする。

上記のごとく床反力鉛直成分軌道パラメータ（ひいては床反力鉛直成分軌道）を決定することは、定常歩容の条件を満たすために必要である。定常歩容の条件とは、該定常歩容のあらゆる状態量（ロボット１の各部の位置、姿勢、速度等の運動状態量）についての初期状態（定常歩容の第１旋回歩容の支持脚座標系から見た該第１旋回歩容の初期状態）と終端状態（定常歩容の第２旋回歩容に続く第１旋回歩容の支持脚座標系から見た該第２旋回歩容の終端状態）とが一致していることである（以下、この条件を定常歩容の境界条件ということがある）。

したがって、定常歩容終端におけるロボット１の全体重心鉛直速度と定常歩容初期における全体重心鉛直速度との差（詳細には、第２旋回歩容終端の全体重心鉛直速度と第１旋回歩容初期の全体重心鉛直速度との差）も零でなければならない。上記差は、床反力鉛直成分と重力との差の積分値（定常歩容の初期から終端までの１周期分の期間での１階積分値）であるから、上記差を零にするためには、上記のごとく、定常歩容の１周期分の期間における床反力鉛直成分の平均値がロボット１の自重に一致するように床反力鉛直成分軌道を決定する必要がある。

尚、本実施形態では、第１旋回歩容、第２旋回歩容それぞれの期間における床反力鉛直成分の平均値をロボット１の自重と一致させるようにした。より具体的には、例えば第１旋回歩容及び第２旋回歩容の歩容周期に応じて各旋回歩容における床反力鉛直成分軌道の台形部分の折れ点の時刻を設定した上で、その台形部分の高さ（床反力鉛直成分のピーク値）を、床反力鉛直成分の第１旋回歩容、第２旋回歩容それぞれの期間における平均値がロボット１の自重に一致するように決定した。この場合、該台形部分の高さは、その高さを未知数として、上記平均値及び自重の一致条件を表す方程式を解くことによって、求めることができる。

こうすることにより、第１旋回歩容終端の全体重心鉛直速度と第１旋回歩容初期の全体重心鉛直速度との差が“０”になると共に、第２旋回歩容終端の全体重心鉛直速度と第２旋回歩容初期の全体重心鉛直速度との差も“０”になる。ただし、このようにする必然性はない。例えば、第１旋回歩容と第２旋回歩容との境界付近で上体鉛直位置が高くなり過ぎたり低くなり過ぎたりする恐れがある場合には、各旋回歩容で上記平均値及び自重を一致させた状態から、各旋回歩容の床反力鉛直成分軌道の台形の高さ等を修正するようにしてもよい。

次いで、Ｓ１０８に進み、歩容生成装置１００は、第１旋回歩容および第２旋回歩容を合わせた定常歩容の目標ＺＭＰ軌道を規定するＺＭＰ軌道パラメータを決定する。この場合、目標ＺＭＰ軌道は、前述したように安定余裕が高くかつ急激な変化をしないように決定される。

さらに詳細には、図５の走行歩容においては、支持脚足平２２（空中期での遊脚足平２２）のかかとが着地した後、しばらくして該支持脚足平２２の底面のほぼ全面が接地し、さらにしばらくして、該支持脚足平２２のつま先だけが接地する。そして、次に、ロボット１が支持脚足平２２のつま先で蹴って空中に飛び上がり、最後に遊脚足平２２のかかとで着地する。また、目標ＺＭＰは接地面内に存在しなければならない。

そこで、本実施形態では、定常歩容の第１旋回歩容及び第２旋回歩容のそれぞれの目標ＺＭＰのＸ軸方向位置は、図７（ａ）に示したように、支持脚足平２２のかかとを初期位置として、該足平２２の底面のほぼ全体が接地するまでその位置に留まるように決定される。

続いて、目標ＺＭＰは、支持脚足平２２の中央に移動し、該足平２２がつま先接地状態になるまでにつま先に移動し、その後、離床時まで支持脚足平２２のつま先に留まるように決定される。さらにその後は、目標ＺＭＰは、前述のごとく、次の遊脚足平２２の着地までに目標ＺＭＰが、支持脚足平２２のつま先から遊脚足平２２のかかとの着地位置まで連続的に移動するように決定される。

したがって、第１旋回歩容と第２旋回歩容とから成る定常歩容の目標ＺＭＰ軌道（Ｘ軸方向位置の軌道）は、図１４に示す如く決定される。そして、この目標ＺＭＰ軌道の折れ点の時刻及び位置が定常歩容のＺＭＰ軌道パラメータとして決定される。この場合、折れ点の時刻は、前記要求パラメータに応じて定めた第１旋回歩容及び第２旋回歩容の歩容周期に応じて決定される。また、該折れ点の位置は、次回歩容支持脚座標系及び次次回歩容支持脚座標系の位置姿勢、あるいはこれらの座標系の位置姿勢を規定する、１歩目及び２歩目の遊脚側足平着地予定位置姿勢の要求値に応じて決定される。

尚、目標ＺＭＰ軌道のＹ軸方向位置は、図７（ｂ）に示したものと同様に決定される。より詳しくは、第１旋回歩容における目標ＺＭＰのＹ軸方向位置の軌道は、図７（ｂ）のものと同一パターンで決定される。さらに、第２旋回歩容における目標ＺＭＰのＹ軸方向位置の軌道は、第１旋回歩容のものと同じ形の軌道で、該軌道の終端につながるものに決定される。

以上が、図９のＳ０２２の処理の詳細である。

補足すると、本実施形態では、前記定常歩容におけるロボット１の運動が、本発明における規範運動に相当する。そして、本実施形態では、Ｓ０２２の処理によって、本発明における規範パラメータ決定手段が実現される。この場合、前記定常歩容パラメータ（詳しくは定常歩容の足平軌道パラメータ、上体姿勢軌道パラメータ、腕軌道パラメータ、ＺＭＰ軌道パラメータ、床反力鉛直成分軌道パラメータ）が本発明における規範パラメータとして決定される。

図９に戻って、歩容生成装置１００は、上記の如くＳ０２２の処理を実行した後、Ｓ０２４に進み、定常歩容の初期状態を算出する。ここで算出する初期状態は、具体的には、定常歩容の初期上体位置速度（初期上体位置及び初期上体速度）及び初期発散成分である。この初期状態の算出は、図１５のフローチャートに示す処理によって、探索的に行なわれる。

以下説明すると、まず、Ｓ２００において、歩容生成装置１００は、定常歩容パラメータ（図９のＳ０２２で決定された歩容パラメータ）に基づいて、定常歩容の目標足平位置姿勢、目標腕姿勢、および目標上体姿勢角の初期状態（定常歩容の初期時刻（＝今回歩容の終端時刻）での状態）を決定する。ここで「状態」とは、位置又は姿勢とその時間的変化率（位置又は姿勢の変化速度）との組を意味する。例えば目標足平位置姿勢の初期状態は、定常歩容の初期時刻での足平位置姿勢と、その時間的変化率（すなわち、足平２２の移動速度及び姿勢の変化速度）との組を意味する。目標腕姿勢の初期状態、目標上体姿勢角の初期状態についても同様である。

この場合、支持脚側の足平位置姿勢の初期状態と、遊脚側の足平位置姿勢の初期状態とは、図１１のＳ１００で決定した足平軌道パラメータに基づいて決定される。

具体的には、足平軌道パラメータにうちの、前記第１旋回歩容初期支持脚足平位置姿勢と、第１旋回歩容初期遊脚足平位置姿勢とが、それぞれ、定常歩容の初期時刻での支持脚側の足平位置姿勢、遊脚側の足平位置姿勢として決定される。

また、定常歩容の初期時刻での支持脚側の足平位置姿勢の時間的変化率は、第１旋回歩容初期支持脚足平位置姿勢から第２旋回歩容終端遊脚足平位置姿勢に至る足平位置姿勢軌道（次回歩容支持脚座標系から見た軌道）を有限時間整定フィルタにより生成した場合における該軌道の初期時刻（定常歩容の初期時刻）での足平位置姿勢の時間的変化率として算出される。この場合、第１旋回歩容初期支持脚足平位置姿勢から第２旋回歩容終端遊脚足平位置姿勢に至る足平位置姿勢軌道のうち、定常歩容の初期時刻からその直後の時刻までの軌道から定常歩容の初期時刻での支持脚側の足平位置姿勢の時間的変化率を算出することができる。

また、定常歩容の初期時刻での遊脚側の足平位置姿勢の時間的変化率は、今回歩容初期支持脚足平位置姿勢から第１旋回歩容終端終端遊脚足平位置姿勢に至る足平位置姿勢軌道（次回歩容支持脚座標系から見た軌道）を有限時間整定フィルタにより生成した場合における該軌道の初期時刻（定常歩容の初期時刻）での足平位置姿勢の時間的変化率として算出される。この場合、今回歩容初期支持脚足平位置姿勢から第１旋回歩容終端終端遊脚足平位置姿勢に至る足平位置姿勢軌道のうち、今回歩容の初期時刻から定常歩容の初期時刻（又はその直後の時刻）までの軌道を生成すれば、該軌道（定常歩容の初期時刻の近辺の軌道）から定常歩容の初期時刻での遊脚側の足平位置姿勢の時間的変化率を算出することができる。

また、腕姿勢の初期状態は、図１１のＳ１０４で決定した腕姿勢軌道パラメータに基づいて、定常歩容の初期時刻における腕姿勢（上体２４に対する両腕体の全体重心位置等）と該初期時刻の直後の期間の腕姿勢の変化量とを求めることで決定される。

また、上体姿勢角の初期状態は、図１１のＳ１０２で決定した上体姿勢軌道パラメータ基づいて、定常歩容の初期時刻における上体姿勢角と該初期時刻の直後の期間の上体姿勢角の変化量とを求めることで決定される。なお、本実施形態では、上体姿勢軌道パラメータにより規定される上体姿勢は、定常的に上体２４の体幹軸が鉛直方向に向く姿勢であるので、定常歩容の初期時刻での上体姿勢角およびその角速度は、いずれも“０”である。

次いで歩容生成装置１００は、Ｓ２０２において初期上体水平位置速度の候補（定常歩容の初期時刻での上体２４の水平位置及び水平速度の候補）である（Ｘs，Ｖxs）（Ｘs：水平位置、Ｖxs：水平速度）を仮決めする。ここで仮決めする候補（Ｘs，Ｖxs）は、任意でよいが、例えば前回歩容の生成時に求めた定常歩容の初期状態における上体水平位置速度の候補（Ｘs，Ｖxs）として仮決めすればよい。

尚、説明を簡略にするため、サジタルプレーン上でＸ軸方向（ロール軸方向）での定常歩容の初期状態（初期上体水平位置速度）を探索する場合を例にとって説明する。ただし、実際には位置・速度のいずれについても、Ｘ軸方向（ロール軸方向）と、Ｙ軸方向（ピッチ軸方向）とで別々に、あるいは同時に定常歩容の初期状態（定常歩容の前記境界条件を満たす初期状態）を探索する必要がある。

探索的な決定手法としては、擬似ヤコビアン（感度マトリックス）を求め、最急降下法などにより次候補を決定する方法や、シンプレックス法などを用いればよい。本実施形態では、例えば最急降下法を用いる。

次いで、Ｓ２０４を経てＳ２０６に進み、定常歩容の初期時刻での上体２４の鉛直位置（Ｚ軸方向位置）Ｚs及び鉛直速度（Ｚ軸方向速度）Ｖzsの組である初期上体鉛直位置速度（Ｚs，Ｖzs）が決定される。

初期上体鉛直速度Ｖzsは、本実施形態では例えば以下のように決定される。

ロボット１には、動力学的関係として、次式が成立する。

終端全体重心鉛直位置−初期全体重心鉛直位置
＝（床反力鉛直成分／ロボットの全体質量）の２階積分
＋重力加速度の２階積分
＋初期全体重心鉛直速度＊１歩の時間
…式１３
（ただし、重力加速度は負の値とする。）
また、定常歩容では、終端全体重心鉛直位置と初期全体重心鉛直位置は一致するので、上式１３の右辺は零にならなければならない。したがって、これらの関係から初期全体重心鉛直速度を求めることができる。具体的には、まず、前記図１１のＳ１０４で決定した床反力鉛直成分軌道パラメータによって算出される床反力鉛直成分をロボット１の全体質量で割った値を、定常歩容の初期から終端までの期間において２階積分することにより、床反力鉛直成分による全体重心移動量（式１３の右辺第１項）が求められる。

さらに、重力加速度を定常歩容の初期から終端までの期間において２階積分することにより、重力による全体重心移動量（式１３の右辺第２項）が求められる。そして、上記の如く求めた、床反力鉛直成分による全体重心移動量と重力による全体重心移動量との和の符号を反転させたものを、定常歩容の１周期Tcycの時間で割ることにより、初期全体重心鉛直速度が求められる。

そして、本実施形態では、例えば、上体２４と他の部位（脚体２，２や腕体）とに質点を有する多質点モデル（幾何学モデル）を用い、該多質点モデルの重心点の鉛直速度が上記初期全体重心鉛直速度に一致するような上体２４の鉛直速度を、Ｓ２００で決定した足平位置姿勢、腕姿勢等の初期状態と、Ｓ２０２（又は後述のＳ２１８）で決定された初期上体水平位置速度（Ｘs，Ｖxs）とを基に求め、その求めた鉛直速度を初期上体鉛直速度Ｖzsとして決定する。

上記多質点モデルとしては、例えば、上体２４の質量（又は上体２４と腕体とを合わせた質量）を有する１つの上体質点と、両脚体２，２のそれぞれの質量を有する２つの脚質点とから構成される３質点モデルが挙げられる。この場合、例えば、上体質点の位置は、上体２４の位置姿勢に応じて規定され、各脚質点の位置は、各脚体２の足平位置姿勢に応じて規定されるものとする。このような３質点モデルを用いた場合には、上記の如く求めた初期全体重心鉛直速度と、足平位置姿勢の初期状態とを基に、上体質点の鉛直速度を算出できる。そして、その上体質点の鉛直速度と、Ｓ２００で決定された上体姿勢角の初期状態とを基に、初期上体鉛直速度Ｖzsを決定することが可能である。

なお、より多くの質点を有する多質点モデル（例えばロボット１の各リンクに質点を有する幾何学モデル）を用いることによってより正確に、初期上体鉛直速度Ｖzsを決定するようにしてもよい。また、ロボット１の上体２４以外の部位の質量が上体２４に比して十分に小さいような場合には、例えばロボット１の全体重心の鉛直速度が上体２４の鉛直速度にほぼ一致すると見なし、上記初期全体重心鉛直速度を、そのまま初期上体鉛直速度Ｖzsとして決定するようにしてもよい。

一方、定常歩容の初期上体鉛直位置Ｚsは、例えば本出願人が先に特開平１０−８６０８０号公報で提案した上体高さ決定手法を用いて決定される。このとき、初期時刻における足平位置姿勢（前記図１１のＳ１００で決定した第１旋回歩容初期支持脚足平位置姿勢及び第１旋回歩容初期遊脚足平位置姿勢）と、各脚体２の膝部の曲げ角に関する所定の幾何学的条件とに基づいて、初期時刻での各脚体２，２の膝部が伸び切らないような初期上体鉛直位置Ｚsが決定される。例えば、支持脚側脚体２の膝曲げ角をθsup、遊脚側脚体２の膝曲げ角をθswgとしたとき、それらの膝曲げ角θsup，θswgの正弦関数値の逆数の和がある所定値（有限値）になるように、初期上体鉛直位置が決定される。ここで、膝曲げ角θsup，θswgは、各脚体２の大腿部の軸心に対する下腿部の軸心の角度であり、各脚体２が伸びきった状態から膝部を曲げていくに伴い、“０”から増加していく角度である。なお、このような上体２４の鉛直位置の決定手法は、上記特開平１０−８６０８０号公報に詳細に説明されているので、ここでは以上の説明に留める。

補足すると、ロボット１は、片脚当たり６自由度であることから、足平位置姿勢軌道および上体位置姿勢軌道の初期状態（位置姿勢とその時間的変化率）が与えられれば、ロボット１の上体２４及び脚体２，２の運動の初期状態は一義的にすべて決定されることになる。したがって、例えば、上体２４及び脚体２，２の全体の質量がロボット１の全体の質量にほぼ一致するような場合には、上体２４及び脚体２，２の運動の初期状態が与えられれば、初期全体重心鉛直速度も一義的に決定される。逆に、片脚当たり６自由度であることから、足平位置姿勢軌道および上体位置姿勢軌道の初期状態の内で速度に関する状態のひとつ（例えば初期上体鉛直速度）が未定であっても、初期全体重心鉛直速度が与えられれば、未定の初期状態は一義的に決定される。

Ｓ２０６の処理の後、次いでＳ２０８に進み、定常歩容の候補としての歩容（定常歩容の１歩分（１周期分）の歩容）が仮に生成される。より具体的には、図９のＳ０２２で決定した定常歩容パラメータを基に、初期時刻から終端時刻までの各瞬間における目標ＺＭＰ、目標床反力鉛直成分、目標足平位置姿勢、目標上体姿勢および目標腕姿勢の瞬時値が逐次求められる。そして、求めた目標ＺＭＰと目標床反力鉛直成分とを満足するように、図１０に示した動力学モデル（倒立振子モデル）を用いて上体位置を逐次決定することによって、定常歩容の初期時刻から終端時刻までの歩容を生成する。この場合、前記初期上体水平位置速度（Ｘs，Ｖxs）、初期上体鉛直位置速度（Ｚs，Ｖzs）が上体２４の位置及び速度の初期状態として設定される。

尚、この歩容生成は歩容生成装置１００の内部で行われるだけであって、実際のロボット１を駆動するための目標値として、歩容生成装置１００から出力されることはない。

Ｓ２０８の処理は、具体的には、図１６のフローチャートに示す如く実行される。

以下説明すると、歩容生成装置１００は、まず、Ｓ３００において、諸々の初期化を行なう。具体的には、歩容生成用時刻Ｔkが定常歩容の初期時刻Ｔsに初期化される。さらに、上体水平位置速度に、初期上体水平位置速度（Ｘs，Ｖxs）の最新の候補値（図１５のＳ２０２もしくは後述のＳ２１６もしくはＳ２１８で決定された最新の候補値）が代入され、上体鉛直位置速度に、初期上体鉛直位置速度（Ｚs，Ｖzs）の最新値（図１５のＳ２０６で決定された最新値）が代入される。また、上体姿勢角には、基準上体姿勢角の初期値、上体姿勢角速度には、基準上体姿勢角速度の初期値が代入される。

次いで、Ｓ３０２を経てＳ３０４において、歩容生成装置１００は、歩容生成用時刻Ｔk（現在値）が終端時刻Ｔe（＝Ｔs＋Ｔcyc）以前の時刻であるか否か（Ｔk≦Ｔeであるか否か）を判断する。この判断結果が肯定的である場合には、歩容生成装置１００は、Ｓ３０６〜Ｓ３１６の処理（詳細は後述する）を実行することによって、時刻Ｔkでの歩容の瞬時値を決定する。

次いでＳ３１８に進み、歩容生成装置１００は、歩容生成用時刻Ｔkを所定の刻み時間ΔＴkだけ増加させた後、Ｓ３０４の判断を再び行なう。ここで、刻み時間ΔTkは、例えば制御周期Δｔと一致させておけばよい。ただし、演算量を低減するために、ΔTkをΔｔよりも長い時間に設定してもよい。

Ｓ３０４の判断結果が肯定的である場合には、Ｓ３０６からＳ３１８までの処理が繰り返され、Ｓ３０４の判断結果が否定的になった場合には、図１６の処理、すなわち、図１５のＳ２０８の処理は終了する。これにより、定常歩容の初期時刻から終端時刻までの１周期分の定常歩容（仮の定常歩容）の生成が完了する。

歩容生成装置１００は、上記Ｓ３０６〜Ｓ３１６で仮の定常歩容の瞬時値を決定する処理を次のように実行する。まずＳ３０６において、歩容生成装置１００は、定常歩容パラメータ（より詳しくは床反力鉛直成分軌道パラメータ）を基に、図１３に示した目標床反力鉛直成分軌道の時刻Ｔkでの瞬時値を求める。

さらに、Ｓ３０８において、歩容生成装置１００は、定常歩容パラメータ（より詳しくはＺＭＰ軌道パラメータ）を基に、図１４に示した目標ＺＭＰ軌道の時刻Ｔkでの瞬時値を求める。

次いでＳ３０８に進み、歩容生成装置１００は、定常歩容パラメータ（より詳しくは足平軌道パラメータ、上体姿勢軌道パラメータ、及び腕姿勢軌道パラメータ）を基に、目標足平位置姿勢（支持脚側及び遊脚側の両方の目標足平位置姿勢）、目標上体姿勢および目標腕姿勢の時刻Ｔkでの瞬時値をそれぞれ求める。ただし、目標腕姿勢に関しては、より詳しくは両腕体の全体重心位置が決定されるが、鉛直軸（または上体２４の体幹軸）まわりの角運動量を変化させる腕体の運動（腕振り運動）は、未だ決定されない。

次いでＳ３１０に進み、歩容生成装置１００は、Ｓ３０６で求めた目標床反力鉛直成分を満足する（ロボット１の全体重心の鉛直方向の慣性力と重力との和を目標床反力鉛直成分に釣り合わせる）ように、時刻Ｔkでの上体鉛直位置を算出する。

具体的には、次式１５および式１６で表される動力学関係式（鉛直方向でのニュートンの運動方程式を離散化した式）を用いてロボット１の全体重心鉛直速度と全体重心鉛直位置とが算出される。

時刻Ｔkにおける全体重心鉛直速度
＝時刻(Ｔk−ΔTk)における全体重心鉛直速度
＋((時刻Ｔkにおける床反力鉛直成分／ロボットの全体質量)＋重力加速度)＊ΔTk
（ただし、重力加速度は負の値とする。）
…式１５

時刻Ｔkにおける全体重心鉛直位置
＝時刻(Ｔk−ΔTk)における全体重心鉛直位置
＋時刻Ｔkにおける全体重心鉛直速度＊ΔTk
…式１６

そして、本実施形態では、歩容生成装置１００は、上記の如く算出した時刻Ｔkでの全体重心鉛直位置と、目標足平位置姿勢と、基準上体姿勢（目標上体姿勢）とを基に、例えば、前記した３質点モデル（Ｓ２０６の処理に関して説明した３質点モデル）を用いて上体鉛直位置を求める。この場合、目標足平位置姿勢に基づき、３質点モデルにおける２つの脚質点の位置が決定される。さらに、この３質点モデルにおける全体重心の鉛直位置が、上記の如く求めた時刻Ｔkでの全体重心鉛直位置に一致するような上体質点の鉛直位置が決定される。そして、この上体質点の鉛直位置と目標上体姿勢（基準上体姿勢）とから上体鉛直位置が決定される。

なお、より多くの質点を有する多質点モデル（例えばロボット１の各リンクに質点を有するモデル）を用いることによって、より正確に上体鉛直位置を求めるようにしてもよい。また、上体２４以外の部位の質量が上体２４に比して十分に小さいような場合には、簡略的に、全体重心鉛直位置が、上体２４の重心の鉛直位置に一致するものとみなし、該全体重心鉛直位置と、目標上体姿勢（基準上体姿勢）とから上体鉛直位置を決定するようにしてもよい。

次いでＳ３１４に進み、歩容生成装置１００は、目標ＺＭＰを満足するように（ロボット１の慣性力と重力との合力が目標ＺＭＰまわりに発生するモーメントの水平成分が“０”であるという動力学的平衡条件を満足するように）、時刻Ｔkでの上体水平加速度（上体２４の水平方向の加速度）を決定する。

この時点において、定常歩容（仮の定常歩容）の足平位置姿勢、腕姿勢、上体姿勢および上体鉛直位置の瞬時値（現在時刻Ｔkでの値）が決定されているので、残りの上体水平位置を決定すれば、鉛直軸まわりの角運動量を変化させる腕体の運動自由度を除いて、ロボット１の全体の目標運動が決定されることとなる。したがって、上体水平位置を決定すれば、床反力の鉛直軸まわりのモーメントを除き、すべての床反力も一義的に決定される。

なお、本実施形態では、定常歩容（仮の定常歩容）の目標床反力鉛直成分及び目標ＺＭＰは、それぞれ前記図９のＳ０２２で決定した定常歩容パラメータの床反力鉛直成分軌道パラメータ、目標ＺＭＰ軌道パラメータによって規定される。したがって、上体水平位置の決定に応じて従属的に決定される床反力は、床反力水平成分のみである。

補足すると、本実施形態のロボット１は、各脚体２の自由度が６自由度であることから、目標足平位置姿勢と目標上体位置姿勢とを決定すれば、各脚体２の各部の位置姿勢も一義的に決定されることとなる。なお、鉛直軸まわりの角運動量を変化させる腕の運動自由度は、後述するように、スピン力を打ち消すために用いられる。

Ｓ３１４では、例えば図８の動力学モデル（倒立振子モデル）に係わる前記式０４を用いて上体水平加速度が求められる。より具体的には、現在時刻Ｔkの上体鉛直位置と、時刻（Ｔk−ΔTk)の上体水平位置と、現在時刻Ｔkの目標上体姿勢とから、現在時刻Ｔkでの上体質点２４ｂの鉛直位置及び水平位置が決定される。なお、時刻(Ｔk−ΔTk)までの上体水平位置の時系列又は時刻(Ｔk−ΔTk)での歩容状態を基に時刻Ｔkでの上体水平位置を補間的に推定し、その推定した上体水平位置を時刻(Ｔk−ΔTk)の上体水平位置の代わりに用いてもよい。

また、現在時刻Ｔkでの床反力鉛直成分から、上体質点２４ｂに作用する重力（＝ｍb＊ｇ）を差し引いた値を、上体質点２４ｂの質量ｍbにより除算することによって、現在時刻Ｔkでの上体質点２４ｂの鉛直加速度が求められる。

そして、上記の如く求めた上体質点２４ｂの鉛直位置、水平位置、鉛直加速度をそれぞれ、前記式０４のＺb、Ｘb、d2Zb/dt2に代入すると共に、現在時刻Ｔkでの目標ＺＭＰの水平位置および鉛直位置を式０４のＸzmp，Ｚzmpに代入し、さらに、同式０４のＭzmp_yを“０”にしてなる式を、d2Xb/dt2について解くことにより、現在時刻Ｔkでの上体質点水平加速度d2Xb/dt2が算出される。そして、この上体質点水平加速度d2Xb/dt2が現在時刻ｋでの上体水平加速度として求められる。

尚、より厳密な動力学モデルを用いて、目標ＺＭＰまわりの床反力モーメントの水平成分を“０”にするような上体水平加速度を探索的に求めるようにしてもよい。

次いでＳ３１６に進み、歩容生成装置１００は、Ｓ３１４で求めた上体水平加速度を２階積分することにより現在時刻Ｔkでの上体水平位置を算出する。より詳しくは、上体水平加速度に刻み時間ΔTkを乗じてなる値を時刻Ｔk−ΔTkでの上体水平速度に加算することによって、現在時刻Ｔkでの上体水平速度が求められる。さらにその上体水平速度に刻み時間ΔTkを乗じてなる値を時刻Ｔk−ΔTkでの上体水平位置に加算することによって現在時刻Ｔkでの上体水平位置が求められる。

以上がＳ３０６〜Ｓ３１６で実行される歩容の生成処理の詳細である。

図１５のＳ２０８の処理を完了した後、Ｓ２１０に進み、歩容生成装置１００は、生成した歩容（仮定常歩容）の終端上体水平位置・速度を、その瞬間の支持脚に対応する支持脚座標系（図１２のＸ'''軸及びＹ'''軸を水平方向の２軸とする支持脚座標系）から見た値に変換し、その値を（Ｘe，Ｖxe）とする（Ｘe：終端上体水平位置、Ｖxe：終端上体水平速度）。

次いでＳ２１２に進み、図示の如く、歩容生成装置１００は、初期上体水平位置速度（Ｘs，Ｖxs）と終端上体水平位置速度（Ｘe，Ｖxe）との差を算出する。この差（Ｘs−Ｘe，Ｖxs−Ｖxe）を上体水平位置速度境界条件誤差（errx，errv）と呼ぶ。定常歩容は、前記境界条件を満たす歩容であるので、（Ｘs，Ｖxs）と（Ｘe，Ｖxe）とが一致している必要がある。従って、上体水平位置速度境界条件誤差（errx，errv）が零またはほぼ零である必要がある。本実施形態では、以下のように、上体水平位置速度境界条件誤差（errx，errv）がほぼ零となる（Ｘs，Ｖxs）が探索的に求められる。

次いでＳ２１４に進み、歩容生成装置１００は、上体水平位置速度境界条件誤差（errx，errv）が、あらかじめ適宜設定された許容範囲内にあるか否か（errx，errvのいずれもが、許容範囲内にあるか否か）を判断する。

Ｓ２１４の判断結果が否定的であるときにはＳ２１６に進む。このＳ２１６では、（Ｘs，Ｖxs）の近辺に複数（本実施形態では２つ）の初期値候補（Ｘs＋ΔＸs，Ｖxs），（Ｘs，Ｖxs＋ΔＶxs）が決定される。ここで、ΔＸs，ΔＶxsは、それぞれＸs，Ｖxsに対する所定の微小変化量を意味している。そして、これらの初期値候補のそれぞれを上体水平位置速度の初期状態として、前記Ｓ２０８と同様の処理によって定常歩容（仮定常歩容）が歩容パラメータを用いて生成される。さらに、その生成された定常歩容の終端上体位置速度を、その瞬間の支持脚に対応する支持脚座標系（図１２のＸ'''軸及びＹ'''軸を水平方向の２軸とする支持脚座標系）から見た値に変換した値（Ｘe＋ΔＸe1，Ｖxe＋ΔＶxe1），（Ｘe＋ΔＸe2，Ｖxe＋ΔＶxe2）が求められる。ここで、（Ｘe＋ΔＸe1，Ｖxe＋ΔＶxe1）は（Ｘs＋ΔＸs，Ｖxs）に対応する終端上体位置速度を意味し、（Ｘe＋ΔＸe2，Ｖxe＋ΔＶxe2）は（Ｘs，Ｖxs＋ΔＶxs）に対応する終端上体位置速度を意味している。なお、この場合の定常歩容（仮定常歩容）の生成処理では、上体水平位置速度以外の状態量の初期状態は、例えば上体水平位置速度の初期値候補を（Ｘs，Ｖxs）とした場合と同一に設定すればよい。Ｓ２１６ではさらに、前記Ｓ２１０と同様の処理によって、各初期値候補とこれに対応する終端上体位置速度との差、すなわち、各初期値候補（Ｘs＋ΔＸs，Ｖxs），（Ｘs，Ｖxs＋ΔＶxs）のそれぞれに対応する上体水平位置速度境界条件誤差が求められる。

次いでＳ２１８に進み、歩容生成装置１００は、（Ｘs，Ｖxs）およびその付近の初期値候補（Ｘs＋ΔＸs，Ｖxs），（Ｘs，Ｖxs＋ΔＶxs）のそれぞれに対する上体水平位置速度境界条件誤差を基に、（Ｘs，Ｖxs）の次の初期値候補を探索法により決定する。該探索法としては、擬似ヤコビアン（感度マトリックス）を求め、最急降下法などにより次候補を決定する方法や、シンプレックス法などを用いることができる。例えば、（Ｘs，Ｖxs）およびその付近の初期値候補（Ｘs＋ΔＸs，Ｖxs），（Ｘs，Ｖxs＋ΔＶxs）のそれぞれに対する上体水平位置速度境界条件誤差によって、上体水平位置及び上体水平速度をそれぞれ初期値候補（Ｘs，Ｖxs）から微小変化させたときの、上体水平位置速度境界条件誤差の変化度合いを示す感度マトリックスが求められる。そして、その感度マトリックスに基づいて、上体水平位置速度境界条件誤差をより小さくするような初期値候補（Ｘｓ，Ｖｘｓ）が新たに決定される。このように上体水平位置速度の新たな初期値候補（Ｘｓ，Ｖｘｓ）が決定された後、Ｓ２０６に戻る。

Ｓ２１４の判断結果が否定的となる限りは歩容生成装置１００は、Ｓ２０６〜Ｓ２１８の処理を繰り返す。そして、Ｓ２１４の判断結果が肯定的になると、繰り返しループ（Ｓ２０４）を抜けてＳ２２０に進む。この場合、Ｓ２０４の繰り返しループを抜けたときの直前に生成された仮定常歩容が、境界条件を満たす定常歩容として得られることとなる。

Ｓ２２０では、Ｓ２０４の繰り返しループのＳ２０８で最終的に生成した仮定常歩容における初期上体水平位置速度の初期値候補（Ｘs，Ｖxs）と、初期上体鉛直位置速度（Ｚs，Ｖzs）とを、それぞれ求めるべき定常歩容の初期上体水平位置速度（Ｘ0，Ｖx0）、初期上体鉛直位置速度（Ｚ0，Ｖz0）として決定する。

次いでＳ２２２に進み、歩容生成装置１００は、定常歩容初期発散成分（定常歩容の初期時刻Ｔsでの発散成分の値）ｑ0を算出する。

ここで、本実施形態では、歩容の発散成分の値は、以下に説明するように定義される。そして、Ｓ２２２では、この定義に従って、定常歩容初期発散成分ｑ0が算出される。

まず、図８の倒立振子モデルにおける上体質点２４ｂの運動と、床反力モーメント（支持脚座標系の原点まわりの床反力モーメント）との間の関係を表す前記式０３を、状態方程式により表現すると次式１００となる。なお、ここでは、ロボット１の移動時の上体２４の高さ（鉛直位置）の、平均的な高さに対する相対的な変動量（上体２４の高さの分散）は十分に小さいものとして、式０３の右辺の第２項のＺbが、上体質点２４ｂの平均的な高さとしてあらかじめ設定された一定値ｈに一致するものとしている。また、ここでは、前記式０３の床反力モーメントＭb_yを、倒立振子に対する入力モーメントとして、Ｍinと表記している。

この式１００を離散時間系での表現に書き直すことによって、次式１０２の状態方程式が得られる。

XVb(k+1)＝Ａ(k)＊XVb(k)＋Ｂ(k)＊Min(k) ……式１０２

なお、添え字(k)、(k+1)を付した変数は、それぞれ、離散時間系のｋ番目の時刻での値、ｋ＋１番目の時刻での値を意味する。以降の説明では、ｋ番目の時刻、ｋ＋１番目の時刻をそれぞれ、単に時刻ｋ、時刻ｋ＋１、というように表現する場合がある。

式１０２におけるXVbは、式１００に関するただし書きで定義した通り、上体質点２４ｂの水平位置Xbと、その時間的変化率である水平速度Ｖxbとをそれぞれ状態変数とする状態変数ベクトル（縦ベクトル）である。

また、式１０２におけるＡ(k)、Ｂ(k)は、それぞれ、２次の正方行列（状態遷移行列）、２次の縦ベクトルであり、それぞれの各成分値が以下の式１０４ａ〜１０４ｃ，１０６ａ〜１０６ｃの如く決定されるものである。なお、ΔＴは離散時間系の刻み時間であり、ω0は下記のただし書きの式１０８によって定義される角周波数値である。また、exp( )は、自然対数の底の指数関数である。

この場合、式１０４ａ〜１０４ｃ，１０６ａ〜１０６ｃと式１０８とから明らかなように、Ａ(k)，Ｂ(k)の各成分値は、上体質点２４ｂの鉛直加速度d2Zb/dt2（鉛直方向の運動加速度d2Zb/dt2）の値に依存して定まる。従って、Ａ(k)，Ｂ(k)の各成分値は、上体質点２４ｂの鉛直方向の慣性力（＝−ｍb＊d2Zb/dt2）に依存する値、すなわち該慣性力の関数値となる。なお、上体質点２４ａに作用する重力は一定値であるから、Ａ(k)，Ｂ(k)の各成分値は、別の言い方をすれば、上体質点２４ｂの鉛直方向の慣性力と上体質点２４ｂに作用する重力との合力、または、該合力に釣り合う床反力鉛直成分の関数値でもある。

補足すると、本実施形態の如く倒立振子の上体質点２４ｂの質量ｍbがロボット１の全体質量に一致するものとした場合には、上体質点２４ｂの鉛直方向の慣性力と上体質点２４ｂに作用する重力との合力に釣り合う床反力鉛直成分は、ロボット１に作用する床反力鉛直成分（全床反力の並進床反力鉛直成分）に一致する。

また、図５の走行歩容では、片脚支持期においてはｇ＋d2Zb/dt2＞０、空中期においてはｇ＋d2Zb/dt2＝０となる。

上記式１０２の状態方程式により表される系では、状態変数ベクトルＸＶbの初期値ＸＶb(0)（ｋ＝０の時刻（時刻０）でのＸＶbの値）と、時刻０から時刻ｋ−１までの入力モーメントMin（床反力モーメントの水平成分Ｍb_y）の時系列とが与えられたとき、任意の時刻ｋ（＞０）での状態変数ベクトルＸＶbの値ＸＶb(k)は、次式１１０により与えられることとなる。

なお、式１１０中のただし書きで定義したφ(k,j)に関しては、ｊ＝ｋの場合はφ(k,j)≡単位行列とする。

次に、前記した定常歩容での倒立振子モデルの挙動に着目し、定常歩容の初期時刻Ｔsをｋ＝０の時刻、定常歩容の終端時刻Ｔe（＝Ｔs＋Ｔcyc）をｋ＝ｋcyc（ただし、ｋcyc≡Ｔcyc／ΔＴ）の時刻とし、初期時刻Ｔsでの定常歩容の運動により規定される状態変数ベクトルＸＶbがＸＶb(0)であるとする。そして、定常歩容の終端時刻Ｔe（ｋ＝ｋcycの時刻）における状態変数ベクトルＸＶbのうち、定常歩容の初期時刻Ｔsでの状態変数ベクトルの値ＸＶb(0)に依存する成分をＸＶb(kcyc)とおく。このとき、ＸＶb(kcyc)と、ＸＶb(0)との間の関係は、上記式１１０に基づいて、次式１１２により表されることとなる。

XVb(kcyc)＝φ(kcyc,0)＊XVb(0) ……式１１２
ただし、φ(kcyc,0)＝Ａ(kcyc-1)＊……＊Ａ(1)＊Ａ(0)

さらに、この式１１２の右辺の行列φ(kcyc,0)の２つの固有値をλ1，λ2、それぞれの固有値に対応する固有ベクトル（縦ベクトル）を(a11，a21)^T、(a12，a22)^T、これらの固有ベクトルをそれぞれ第１列、第２列とする２次の正方行列をΓcycとおき、この行列Γcycを用いてφ(kcyc,0)を対角化してなる行列をΛとおく。すなわち、Λを次式１１４により定義する。以降、行列Γcycを対角化用行列という。

この式１１４と前記式１１２とから次式１１６が得られる。

Γcyc^-1＊XVb(kcyc)＝Λ＊Γcyc^-1＊XVb(0) ……式１１６

なお、上記対角化用行列Γcycによる対角化の対象とする行列φ(kcyc,0)は、前記式１１２のただし書きに示したように、定常歩容の１周期の初期時刻（時刻０）から、終端時刻（時刻ｋcyc）のまでの期間内の各時刻（詳しくは時刻０から時刻ｋcyc−１までの刻み時間ΔＴ毎の各時刻）での状態遷移行列Ａ(0)、Ａ(1)、……、Ａ(kcyc-1)の積であるから、定常歩容の１周期の期間内での上体質点２４ｂの慣性力の時系列に依存して定まるものとなる。従って、対角化用行列Γcycも、結果的に、その各成分値が定常歩容の１周期の期間内での上体質点２４ｂの慣性力の時系列に依存して定まるものとなる。

ここで、任意の時刻ｋでの状態変数ベクトルＸＶb(k)を、対角化用行列Γcycの逆行列Γcyc^-1によって線形変換してなるベクトル（以降、変換状態変数ベクトルという）を(ｐ(k)，ｑ(k))^Tとおく。すなわち、変換状態変数ベクトル(ｐ(k)，ｑ(k))^Tを次式１１８により定義する。

(ｐ(k)，ｑ(k))^T≡Γcyc^-1＊XVb(k) ……式１１８

この式１１８と前記式１１６とから、次式１２０が得られる。

(ｐ(kcyc)，ｑ(kcyc))^T＝Λ＊(ｐ(0)，ｑ(0))^T ……式１２０

この式１２０において、λ1＞１であれば、ｐ(kcyc)の絶対値＞初期値ｐ(0)の絶対値となり、λ1≦１であれば、ｐ(kcyc)の絶対値≦初期値ｐ(0)の絶対値となる。同様に、λ2＞１であれば、ｑ(kcyc)の絶対値＞初期値ｑ(0)の絶対値となり、λ2≦１であれば、ｑ(kcyc)の絶対値≦初期値ｑ(0)となる。

一方、本実施形態における定常歩容は、片脚支持期と空中期とを交互に繰り返す歩容（図５の走行歩容）であるから、ｇ＋d2Zb/dt2≦０となる状態に常に保持されるということはなく、ｇ＋d2Zb/dt2≦０となる状態と、ｇ＋d2Zb/dt2＞０となる状態とが交互に生じると考えてよい。このような定常歩容では、一般にφ(kcyc,0)の２つの固有値λ1，λ2の一方が、“１”よりも大きい値となり、他方が“１”よりも小さい値となる。

そこで、以降、λ1＜１、λ2＞１であるとする。すなわち、変換状態変数ベクトル(ｐ(k)，ｑ(k))^Tのうちの、第１成分ｐ(k)が、“１”よりも小さい固有値λ1に対応する成分、第２成分ｑ(k)が、“１”よりも大きい固有値λ2に対応する成分であるとする。このとき、ｐ(k)は、無限に繰り返される定常歩容において収束性を有する運動成分の状態量としての意味を持ち、ｑ(k)は、無限に繰り返される定常歩容において発散性を有する運動成分の状態量としての意味を持つ。

そこで、本実施形態では、式１１８により定義した変換状態変数ベクトル(ｐ(k)，ｑ(k))^Tのうちの第２成分ｑ(k)を前記発散成分として定義する。このようにして定義される発散成分ｑ(k)は、状態変数Ｘb(k)，Ｖxb(k)の線形結合値となる。この場合、その線形結合において、Ｘb(k)，Ｖxb(k)にそれぞれ掛かる重み係数は、定常歩容の１周期の期間内での上体質点２４ｂの慣性力の時系列に依存して定まるものとなる。なお、式１１８により定義した変換状態変数ベクトル(ｐ(k)，ｑ(k))^Tのうちの第１成分ｐ(k)を収束成分と言う。

なお、前記式１１８で定義される収束成分ｐ(k)及び発散成分ｑ(k)は、詳しくはサジタルプレーン上での収束成分ｑ(k)及び発散成分ｑ(k)（Ｘ軸方向での上体質点２４ｂの水平位置Xbと水平速度Ｖxbとを成分とする状態変数ベクトルＸＶbに対応する収束成分及び発散成分）であるが、これと同様に、ラテラルプレーン上での収束成分及び発散成分も定義される。具体的には、式１１８の右辺の状態変数ベクトルＸＶb(k)の各成分Ｘb、Ｖxbをそれぞれ、Ｙ軸方向での上体質点２４ｂの水平位置と水平速度とに置き換えた式によって、ラテラルプレーン上での収束成分及び発散成分が定義される。この場合、式１１８の行列Γcyc^-1はＸ軸方向及びＹ軸方向のいずれの軸方向に関しても同一である。

以上説明した発散成分ｑの定義に従って、Ｓ２２２では、定常歩容初期発散成分ｑ0は次のように算出される。

すなわち、歩容生成装置１００は、定常歩容の初期時刻Ｔsから終端時刻Ｔsまでの１周期の期間内の刻み時間ΔＴ毎の各時刻Ｔk（離散時間系で言えばｋ＝０の時刻からｋ＝ｋcyc−１の時刻までの各時刻ｋ）における上体質点２４ｂの慣性力の瞬時値を、定常歩容パラメターを基に算出する。この場合、倒立振子の上体質点２４ｂの質量ｍbがロボット１の全体の質量に一致するものとした場合には、定常歩容での上体質点２４ｂの鉛直方向の慣性力と該上体質点２４ｂに作用する重力との合力が、定常歩容における床反力鉛直成分に釣り合うものとなる。そこで、本実施形態では、歩容生成装置１００は、定常歩容パラメータのうちの前記床反力鉛直成分軌道パラメータを基に、定常歩容の１周期の期間内の各時刻における床反力鉛直成分の瞬時値を算出する。該瞬時値は、図１６のＳ３０６で算出される値と同じである。そして、歩容生成装置１００は、その算出した床反力鉛直成分の各瞬時値を上体質点２４ｂの質量ｍb（＝ロボット１の全体質量）で除算してなる値を前記式１００の（ｇ＋d2Zb/dt2）の値として、前記式１０４ａ〜１０４ｃによって、状態遷移行列Ａ(k)（ｋ＝０，１，……,kcyc−１）を算出する。

なお、図５の走行歩容では、床反力鉛直成分は負の値となることはない。従って、実際上は、Ａ(k)は式１０４ａ，１０４ｂのいずれかの式によって算出されることとなる。

補足すると、前記した３質点モデルなどの多質点モデル（幾何学モデル）を用いて、定常歩容におけるロボット１の上体２４の鉛直方向の慣性力（又は鉛直加速度）を算出し、その算出した慣性力（又は鉛直加速度）を、上体質点２４ｂの慣性力（又は鉛直加速度）として用いることによって、各時刻での状態遷移行列Ａ(k)（ｋ＝０，１，……,kcyc−１）を算出するようにしてもよい。例えば、前記３質点モデルを用いて、次のようにして、定常歩容における上体質点２４ｂの慣性力の瞬時値を算出するようにしてもよい。すなわち、定常歩容の足平軌道パラメータを基に、前記３質点モデルにおける２つの脚質点の鉛直方向の慣性力の瞬時値を算出すると共に、床反力鉛直成分軌道を基に、ロボット１の全体重心の鉛直方向の慣性力の瞬時値を算出する。そして、全体重心の鉛直方向の慣性力の瞬時値から、２つの脚質点の鉛直方向の慣性力の瞬時値を差し引いたものを、上体質点２４ｂの鉛直方向の慣性力の瞬時値として算出する。この場合には、上体質点２４ｂの鉛直方向の慣性力と該上体質点２４ｂに作用する重力との合力（あるいはｇ＋d2Zb/dt2）が負の値となり得る。

歩容生成装置１００は、上記の如く定常歩容の初期時刻Ｔsから終端時刻Ｔsまでの１周期の期間におけるｋcyc個のＡ(k)（ｋ＝０，１，…，ｋcyc−１）を算出した後、これらのＡ(k)を掛け合わせることによって、式１１２の右辺の行列φ(kcyc,0)（＝Ａ(kcyc-1)＊…＊Ａ(1)＊Ａ(0)）を算出する。

さらに歩容生成装置１００は、この行列φ(kcyc,0)の固有値λ1，λ2と、これらに対応する固有ベクトル(a11，a21)^T、(a12，a22)^Tとを算出し、それらの固有ベクトルから、前記式１１４のただし書きに従って、前記対角化用行列Γcycを決定する。そして、歩容生成装置１００は、この対角化用行列Γcycの逆行列Γcyc^-1を算出する。

また、歩容生成装置１００は、Ｓ２２０で決定した定常歩容の初期上体水平位置速度（Ｘ0，Ｖx0）と、定常歩容の上体姿勢角の初期状態とから、定常歩容の初期時刻Ｔsでの倒立振子の上体質点２４ｂの水平位置及び水平速度の組である初期上体質点位置速度を決定する。

そして、歩容生成装置１００は、上記の如く求めた逆行列Γcyc^-1と、初期上体質点水平位置速度とから、前記式１１８に基づいて定常歩容初期発散成分ｑ0を算出する。より詳しくは、初期上体質点水平位置速度のＸ軸方向成分（Ｘ軸方向での状態量ベクトル）及びＹ軸方向成分（Ｙ軸方向での状態量ベクトル）に、それぞれΓ^-1を乗じることによって、Ｘ軸方向及びＹ軸方向の各軸方向での初期発散成分ｑ0が算出される。

以上の如く定常歩容の初期発散成分ｑ0を算出した後、Ｓ２２４に進み、歩容生成装置１００は、定常歩容の初期発散成分ｑ0を今回歩容支持脚座標系から見た値に変換し、これをｑ0”として求める。また、歩容生成装置１００は、初期上体鉛直位置速度（Ｚ0，Ｖz0）を今回歩容支持脚座標系から見た値に変換し、これを（Ｚ0”，Ｖz0”）として求める。

補足すると、（Ｚ0”，Ｖz0”）は、第２旋回歩容の支持脚座標系（図１２のＸ”軸、Ｙ”軸を水平面の２軸とする支持脚座標系）から見た第２旋回歩容終端上体鉛直位置速度に一致する。また、ｑ0”も第２旋回歩容の支持脚座標系から見た第２旋回歩容終端発散成分に一致している。したがって、これらの性質を用いて、（Ｚ0”，Ｖz0”）およびｑ0”を算出するようにしても良い。

以上により、図９のＳ０２４の処理、すなわち定常歩容の初期状態を求めるサブルーチン処理が終了する。

次いで、図９のＳ０２６に進み、歩容生成装置１００は、今回歩容の歩容パラメータを決定（一部は仮決定）する。Ｓ０２６では、より具体的には、図１７のフローチャートに示す処理が実行される。

まず、Ｓ６００において、歩容生成装置１００は、今回歩容の足平位置姿勢軌道が定常歩容の足平位置姿勢軌道につながるように、今回歩容の足平軌道パラメータを決定する。

具体的には、今回歩容初期遊脚足平位置姿勢（今回歩容の初期の遊脚足平位置姿勢）は、今回歩容支持脚座標系から見た前回歩容終端支持脚足平位置姿勢（現在の遊脚足平位置姿勢）に設定される。

今回歩容初期支持脚足平位置姿勢（今回歩容の初期の支持脚足平位置姿勢）は、今回歩容支持脚座標系から見た前回歩容終端遊脚足平位置姿勢（現在の支持脚足平位置姿勢）に設定される。

また、今回歩容終端遊脚足平位置姿勢は、今回歩容支持脚座標系から見た次回歩容支持脚座標系（今回歩容に係わる１歩目の遊脚足平２２の着地予定位置姿勢の要求値）に対応して決定される。すなわち、今回歩容終端遊脚足平位置姿勢から遊脚足平２２を床に接触させたまま、すべらないように該足平２２をその底面のほぼ全面が接地するまでピッチ方向に所定角度だけ回転させたときの、該足平２２の代表点が今回歩容支持脚座標系から見た次回歩容支持脚座標系の原点に合致するように今回歩容終端遊脚足平位置姿勢が決定される。

今回歩容終端では、支持脚足平２２は離床して空中にある。支持脚足平２２が離床してから後の軌道を決定するために、まず、次回歩容終端での今回歩容の支持脚足平２２の位置姿勢、すなわち次回歩容終端遊脚足平位置姿勢が決定される。次回歩容終端遊脚足平位置姿勢は、今回歩容支持脚座標から見た次次回歩容支持脚座標（今回歩容に係わる２歩目の遊脚足平２２の着地予定位置姿勢の要求値）に対応して決定される。より具体的には、次回歩容終端遊脚足平位置姿勢は、その位置姿勢から、足平２２を床に接触させたまま、すべらないように該足平２２をその底面のほぼ全面が床に接地するまでピッチ方向に所定角度だけ回転させたときの該足平２２の代表点が今回歩容支持脚座標から見た次次回歩容支持脚座標の原点に合致するように決定される。

そして、今回歩容終端支持脚足平位置姿勢は、上記の如く決定した今回歩容初期支持脚足平位置姿勢から、次回歩容終端遊脚足平位置姿勢に至る足平位置姿勢軌道を、今回歩容終端まで前記有限時間整定フィルタにより生成することにより求められる。

次いで、Ｓ６０２に進み、歩容生成装置１００は、今回歩容の上体姿勢軌道パラメータを決定する。この上体姿勢軌道パラメータは、それにより規定される上体姿勢軌道が、定常歩容の上体姿勢軌道に連続してつながる（今回歩容終端での上体姿勢角及び角速度がそれぞれ定常歩容初期の上体姿勢角及び角速度に一致する）ように決定される。この場合、本実施形態では、今回歩容の上体姿勢軌道パラメータにより規定される上体姿勢は、定常歩容の上体姿勢と同様に、定常的に一定姿勢である前記基準上体姿勢（上体２４の体幹軸が鉛直方向を向く姿勢）に設定される。

なお、今回歩容の上体姿勢軌道は、定常歩容の上体姿勢軌道に連続的につながるように設定されておれば、今回歩容の初期から終端まで経時的に変化するように設定してもよい。

次いで、Ｓ６０４に進み、歩容生成装置１００は、今回歩容の腕姿勢軌道パラメータを決定する。この腕姿勢軌道パラメータは、今回歩容の腕姿勢軌道が前記定常歩容の腕姿勢軌道に連続してつながるようにして、定常歩容の腕姿勢軌道パラメータと同様に決定される。

なお、ここで決定される今回歩容の腕姿勢軌道パラメータは、定常歩容の腕姿勢軌道パラメータと同様に、鉛直軸（あるいは上体２４の体幹軸）まわりの両腕体の角運動量変化に関すること以外のパラメータ（例えば上体２４に対する腕体の手先の相対高さや腕体全体の相対重心位置などを規定するパラメータ）である。

次いで、Ｓ６０６に進み、歩容生成装置１００は、今回歩容の床反力鉛直成分軌道パラメータを、それにより規定される床反力鉛直成分軌道が前記図６に示した如く実質的に連続な軌道になるように決定する。ただし、今回歩容の床反力鉛直成分軌道パラメータは、今回歩容のロボット１の全体重心鉛直位置速度と床反力鉛直成分軌道とのいずれもが、前記定常歩容に連続してつながるように決定される。

具体的には、まず、図９のＳ０２４の処理（定常歩容初期状態の決定処理）で最終的に求めた定常歩容の初期上体鉛直位置速度を今回歩容支持脚座標系から見た値に変換した値（Ｚ0”，Ｖz0”）、すなわち、図１５のＳ２２４で求めた（Ｚ0”，Ｖz0”）等を基に、今回歩容支持脚座標系から見た定常歩容の初期全体重心鉛直位置速度が求められる。

例えば、前記した３質点モデル（Ｓ２０６の処理に関して説明した３質点モデル）を用いて定常歩容の初期全体重心鉛直位置速度が求められる。この場合、今回歩容支持脚座標系から見た定常歩容初期の目標足平位置姿勢とその時間的変化率（変化速度）とに基づき、３質点モデルにおける２つの脚質点の位置・速度が求められる。さらに、上記（Ｚ0”，Ｖz0”）と、定常歩容初期の上体姿勢角（＝基準上体姿勢角）及びその時間的変化率とから、３質点モデルにおける上体質点の位置・速度が求められる。そして、これらの３つの質点の位置・速度から、その３質点の重心位置及び速度が、定常歩容の初期全体重心鉛直位置速度として算出される。

なお、より多くの質点を有する多質点モデル（例えばロボット１の各リンクに質点を有する幾何学モデル）を用いることによってより正確に、定常歩容の初期全体重心鉛直位置速度を求めるようにしてもよい。また、上体２４以外の部位の質量が上体２４に比して十分に小さいような場合には、上記（Ｚ0”，Ｖz0”）と、定常歩容初期の上体姿勢角（＝基準上体姿勢角）及びその時間的変化率とから、定常歩容の初期全体重心鉛直位置速度を求めるようにしてもよい。

このようにして求めた定常歩容の初期全体重心鉛直位置速度を、前記式１３と下記式４１の終端全体重心鉛直位置速度に代入すると共に、前回歩容の瞬時値（より詳しくは、前回歩容の終端状態を今回歩容支持脚座標系から見た値）の全体重心鉛直位置および速度を、前記式１３と下記式４１の初期全体重心鉛直位置および速度に代入し、式１３と式４１の関係を満足するように、今回歩容の床反力鉛直成分軌道パラメータが決定される。ただし、式１３と式４１における積分値は今回歩容の初期から終端までの期間の積分値とする。

終端全体重心鉛直速度−初期全体重心鉛直速度
＝（床反力鉛直成分/ロボットの質量）の１階積分
＋重力加速度の１階積分
…式４１
（ただし、重力加速度は負の値とする。）

より具体的には、まず、図６に示したような床反力鉛直成分軌道を規定する床反力鉛直成分軌道パラメータ（折れ点の時刻等）のうちの、少なくとも２つのパラメータを独立な未知変数として、その未知変数の値を、式１３と式４１とからなる連立方程式を解くことによって決定する。

未知変数とする床反力鉛直成分軌道パラメータには、例えば、図６に示した床反力鉛直成分軌道における台形の高さ（床反力鉛直成分のピーク値）と幅（片脚支持期時間）とを選択すればよい。この場合、図６の台形の両側部分の傾きは今回歩容周期等に応じて決定した値とし、あるいは、片脚支持期から空中期に移行する時刻を除く床反力鉛直成分軌道の折れ点の時刻を今回歩容周期等に応じて決定した値とする。補足すると、未知変数を１つとすると、一般的には式１３と式４１の連立方程式を満足する解が存在しない。

補足すると、本実施形態では、上記の如く決定される今回歩容の床反力鉛直成分軌道パラメータが、本発明における上下方向慣性力パラメータに相当する。従って、Ｓ６０６の処理によって、本発明における上下方向慣性力パラメータ決定手段が実現されることとなる。

次いで、Ｓ６０８に進み、歩容生成装置１００は、今回歩容のＺＭＰ軌道が、安定余裕が高くかつ急激な変化をしないように、該ＺＭＰ軌道を規定するＺＭＰ軌道パラメータ（ＺＭＰ軌道の折れ点の時刻や位置等）を決定する。例えば、ＺＭＰ軌道が、図７に示したようなパターンになるようにＺＭＰ軌道パラメータが仮決定される。ただし、今回歩容のＺＭＰ軌道が前記定常歩容のＺＭＰ軌道に連続してつながるように（今回歩容終端におけるＺＭＰの位置が定常歩容初期のＺＭＰの位置に一致するように）、今回歩容のＺＭＰ軌道パラメータが仮決定される。この場合、走行歩容では、片脚支持期におけるＺＭＰ軌道の折れ点の時刻や位置の設定の仕方は、前述した定常歩容のＺＭＰ軌道パラメータの設定の仕方と同様でよい。そして、空中期における目標ＺＭＰ軌道が、空中期開始時から、定常歩容初期のＺＭＰの位置まで、直線的に連続して変化するようにＺＭＰ軌道パラメータを設定すればよい。

なお、Ｓ６０８で決定される今回歩容のＺＭＰ軌道パラメータは、仮決定されたものであり、後述するように修正される。以降、その修正が終了するまでの仮決定されたＺＭＰ軌道パラメータにより規定される今回歩容の目標ＺＭＰを、以降、仮目標ＺＭＰと呼ぶ。その仮決定されたＺＭＰ軌道パラーメータを含む今回歩容の歩容パラメータを仮今回歩容パラメータという。

図９の説明に戻って、歩容生成装置１００は、上記のごとくＳ０２６の処理を行った後、次いでＳ０２８において、今回歩容の歩容パラメータ（詳しくはＺＭＰ軌道パラメータ）を修正する処理を実行する。この処理では、今回歩容の上体位置姿勢軌道を定常歩容に連続させ、もしくは近づけるべく歩容パラメータのうちのＺＭＰ軌道パラメータが修正される。

この処理は、図１８のフローチャートに示す如く実行される。

まずＳ７００を経てＳ７０２に進み、歩容生成装置１００は、仮決定されたＺＭＰ軌道パラメータを含む仮今回歩容パラメータを基に、今回歩容の終端時刻までの仮今回歩容を生成する。

Ｓ７０２では、図１９のフローチャートに示す処理が実行される。

以下説明すると、歩容生成装置１００は、まず、Ｓ８００において、諸々の初期化を行なう。具体的には、仮今回歩容の生成用時刻Ｔkが“０”に初期化される。また、前回歩容の終端状態（より具体的には、前回歩容の終端時刻での目標上体位置及び目標上体速度、目標上体姿勢角及びその角速度、目標足平位置姿勢、目標腕姿勢など）を今回歩容支持脚座標系に変換したものが、仮今回歩容の初期状態として設定される。

次いで、Ｓ８０２を経てＳ８０４において、歩容生成装置１００は、仮今回歩容の生成用時刻k（現在値）が今回歩容の終端時刻Tcurr以前の時刻であるか否か（Ｔk≦Tcurrであるか否か）を判断する。この判断結果が肯定的である場合には、歩容生成装置１００は、Ｓ８０６〜Ｓ８１６の処理（詳細は後述する）を実行することによって、時刻Ｔkでの歩容の瞬時値を決定する。

次いでＳ８１８に進み、歩容生成装置１００は、仮今回歩容の生成用時刻Ｔkを、所定の刻み時間ΔＴkだけ増加させた後、Ｓ８０４の判断を再び行なう。ここで、刻み時間ΔTkは、例えば制御周期Δｔと一致させておけばよい。ただし、演算量を低減するために、ΔTkをΔｔよりも長い時間に設定してもよい。

Ｓ８０４の判断結果が肯定的である場合には、Ｓ８０６からＳ８１８までの処理が繰り返され、Ｓ８０４の判断結果が否定的になった場合には、図１９の処理、すなわち、図１８のＳ７０２の処理は終了する。これにより、今回歩容の初期時刻から終端時刻までの仮今回歩容の生成が完了する。

歩容生成装置１００は、上記Ｓ８０６〜Ｓ８１６で仮今回歩容の瞬時値を決定する処理を次のように実行する。この仮今回歩容の瞬時値の決定の仕方は、図１６のＳ３０６〜Ｓ３１６で定常歩容（仮の定常歩容）の瞬時値を決定する仕方と同様である。

まずＳ８０６において、歩容生成装置１００は、仮今回歩容パラメータ（より詳しくは床反力鉛直成分軌道パラメータ）を基に、図６に示した目標床反力鉛直成分軌道の時刻Ｔkでの瞬時値を求める。

次いで、Ｓ８０８において、歩容生成装置１００は、仮今回歩容パラメータ（より詳しくは仮決定のＺＭＰ軌道パラメータ）を基に、図７に示した目標ＺＭＰ軌道（仮目標ＺＭＰ軌道）の時刻Ｔkでの瞬時値を求める。

次いでＳ８１０に進み、歩容生成装置１００は、仮今回歩容パラメータ（より詳しくは足平軌道パラメータ、上体姿勢軌道パラメータ、及び腕姿勢軌道パラメータ）を基に、目標足平位置姿勢、目標上体姿勢および目標腕姿勢の時刻Ｔkでの瞬時値をそれぞれ求める。ただし、目標腕姿勢に関しては、より詳しくは両腕体の全体重心位置が決定されるが、鉛直軸（または上体２４の体幹軸）まわりの角運動量を変化させる腕体の運動（腕振り運動）は、未だ決定されない。

次いでＳ８１２に進み、歩容生成装置１００は、Ｓ８０６で求めた目標床反力鉛直成分を満足する（ロボット１の全体重心の鉛直方向の慣性力と重力との和を目標床反力鉛直成分に釣り合わせる）ように、時刻Ｔkでの上体鉛直位置を算出する。その算出の仕方は、図１６のＳ３１２（定常歩容の上体鉛直位置の瞬時値を算出する処理）と同じでよい。ただし、Ｓ８１２で使用する多質点モデルは、Ｓ３１２で使用するものと異ならせてもよい。

次いでＳ８１４に進み、歩容生成装置１００は、目標ＺＭＰを満足するように（ロボット１の慣性力と重力との合力が目標ＺＭＰまわりに発生するモーメントの水平成分が“０”であるという動力学的平衡条件を満足するように）、時刻Ｔkでの上体水平加速度を決定する。この上体水平加速度の算出の仕方は、図１６のＳ３１４と同じであり、例えば図８の動力学モデル（倒立振子モデル）を用いて上体水平加速度が算出される。

次いでＳ８１６に進み、歩容生成装置１００は、Ｓ８１４で求めた上体水平加速度を２階積分することにより現在時刻Ｔkでの上体水平位置を算出する。この算出の仕方は、図１６のＳ３１４と同じである。

以上が図１８のＳ７０２で歩容生成装置１００が実行する処理（仮今回歩容の生成処理）の詳細である。

歩容生成装置１００は、以上のごとくＳ７０２の処理を実行した後、次にＳ７０４の処理を実行する。

Ｓ７０４では、歩容生成装置１００は、Ｓ７０２で生成した仮今回歩容の終端での上体水平位置速度（Ｘe，Ｖxe）を基に、終端発散成分ｑe1（仮今回歩容の終端での発散成分ｑe1）を算出する。

具体的には、歩容生成装置１００は、まず、（Ｘe，Ｖxe）と仮今回歩容の終端での上体姿勢（本実施形態では基準上体姿勢）とから、図８の倒立振子モデルの上体質点２４ｂの水平位置速度（水平位置及び水平速度）を決定する。そして、この上体質点水平位置速度から、前記した図１５のＳ２２２と同様に、前記式１１８に基づいて、仮今回歩容の終端発散成分ｑe1を算出する。この場合に、ｑe1を算出するために用いるΓ^-1は、Ｓ２２２の処理で算出したものと同じである。

次いでＳ７０６に進み、歩容生成装置１００は、上記の如く求めた仮今回歩容の終端発散成分ｑe1と、図１５のＳ２２４で求めた定常歩容の初期発散成分ｑ0”との差である終端発散成分誤差errq（＝ｑe1−ｑ0''）を算出する。

さらに、Ｓ７０８に進んで、歩容生成装置１００は、上記の如く求めた終端発散成分誤差errqが許容範囲内（“０”近傍の範囲内）にあるか否か、すなわち、errqが“０”もしくはほぼ“０”であるか否かを判断する。なお、Ｓ７０８の判断は、詳しくは、Ｘ軸方向及びＹ軸方向の各軸方向の終端発散成分誤差errqに対して行なわれる。そして、Ｘ軸方向及びＹ軸方向の両軸方向の終端発散成分誤差errqが許容範囲内にある場合にＳ７０８の判断結果が肯定的になり、いずれかの軸方向の終端発散成分誤差errqが許容範囲内に無い場合には、がＳ７０８の判断結果が否定的になる。

このＳ７０８の判断結果が否定的である場合には、Ｓ７１０に進み、歩容生成装置１００は、ａ＝Δａ（Δａ：所定の微小量）として、現在の仮目標ＺＭＰ軌道を台形パターンの修正量によって図２０に示す如く修正してなる目標ＺＭＰ軌道を用いて、前記Ｓ７０２と同様に、終端時刻までの仮今回歩容を生成する。すなわち、歩容生成装置１００は、Ｓ７０２での仮今回歩容の生成に用いた仮目標ＺＭＰ軌道の代わりに、それを修正してなる目標ＺＭＰ軌道を用いて、改めて仮今回歩容を生成する。この場合、目標ＺＭＰ以外の今回歩容パラメータは、Ｓ７０２で使用したものと同じである。

ここで、図２０を参照して、上記「ａ」は、仮今回歩容の終端発散成分を定常歩容の初期発散成分にできるだけ一致させる（ひいては今回歩容の上体水平位置姿勢軌道を定常歩容の上体水平位置姿勢軌道に収束させる）ために、仮目標ＺＭＰ軌道を修正する（仮目標ＺＭＰ軌道に加える）台形パターンの修正量（以下、ＺＭＰ修正量ということがある）の高さである。

この場合、本実施形態では、仮目標ＺＭＰ軌道の修正は、支持脚足平２２の底面のほぼ全面が接地する期間（足底全面接地期間）において行なうようにしている。このため、ＺＭＰ修正量は、足底全面接地期間内において、ＺＭＰ修正量≠０となり、足底全面接地期間以外の期間では、ＺＭＰ修正量＝０となるように設定されている。また、上記台形パターンのＺＭＰ修正量の折れ点の時刻は、足底全面接地期間における仮目標ＺＭＰ軌道の折れ点の時刻に合わせて設定されている。なお、Ｓ７１０でａ＝Δａ（Δａ：所定の微小量）とするのは、現在の仮目標ＺＭＰ軌道を上記台形パターンのＺＭＰ修正量によって微小量だけ、修正したときの前記終端発散成分誤差errqの変化を観測するためである。

補足すると、Ｓ７１０の上記の処理では、目標ＺＭＰのＸ軸方向位置を修正することを例に採って説明したが、実際には目標ＺＭＰのＹ軸方向位置の修正も併せて行なわれる。そのＹ軸方向位置の修正は、Ｘ軸方向位置の修正と同様に、足底全面接地期間における目標ＺＭＰ軌道を仮目標ＺＭＰ軌道から台形パターンで変化させるように行なわれる。この場合、上記Δａは各軸方向で同じ値でよいが、互いに異なる値に設定してもよい。

なお、Ｘ軸方向及びＹ軸方向の一方の軸方向での目標ＺＭＰ軌道の修正が、他方の軸方向での終端発散成分に影響を及ぼさないか、もしくはその影響が十分に小さい場合には、Ｓ７１０から、後述のＳ７１６までの処理をＸ軸方向とＹ軸方向とで各別に行なうようにしてもよい。

上記のようにＳ７１０にて仮今回歩容を生成した後、次にＳ７１２に進み、歩容生成装置１００は、Ｓ７１０で求めた仮今回歩容の終端での上体水平位置速度（Ｘe2，Ｖxe2）を基に、この仮今回歩容における終端発散成分ｑe2をＳ７０４と同様に算出する。

尚、本実施形態では、Ｓ７１０においてΔａを所定値の微小量としたが、以下に説明する繰り返し演算によって終端発散成分誤差errqが小さくなるにつれてΔａを“０”に近づけるように、該Δａを可変的に設定するようにしてもよい。ただし、一般には、Δａを定数にしておいても、数回の繰り返し演算で終端発散成分誤差errqを許容範囲内に収めることができる。

次いでＳ７１４に進み、歩容生成装置１００は、パラメータ感度ｒ（Δａに対する終端発散成分誤差の変化の割合）を図中の式によって算出する。すなわち、歩容生成装置１００は、Ｓ７１２で算出した終端発散成分ｑe2とＳ７０４で算出した終端発散成分ｑe1との差（＝ｑe2−ｑe1）をΔａにより除算することによって、パラメータ感度ｒを算出する。この場合、より詳しくは、例えば（ｑe2−ｑe1）のＸ軸方向成分を、Ｘ軸方向のＺＭＰ修正量に係わるΔａにより除算することによって、Ｘ軸方向でのパラメータ感度ｒが算出される。また、（ｑe2−ｑe1）のＹ軸方向成分を、Ｙ軸方向のＺＭＰ修正量に係わるΔａにより除算することによって、Ｙ軸方向でのパラメータ感度ｒが算出される。

次いでＳ７１６に進み、歩容生成装置１００は、ａ＝−errq／r、すなわちＳ７０６で求めた終端発散成分誤差errqを、Ｓ７１４で求めたパラメータ感度ｒで割った値の符号を反転させてなる値を台形パターンのＺＭＰ修正量の高さａとして、このＺＭＰ修正量によって図２０に示す如く仮目標ＺＭＰパターンを修正してなる目標ＺＭＰを、改めて仮目標ＺＭＰとして決定する。この場合、ＺＭＰ修正量の高さａは、Ｘ軸方向とＹ軸方向とで各別に算出される。

なお、Ｘ軸方向及びＹ軸方向の一方の軸方向での目標ＺＭＰ軌道の修正が、他方の軸方向での終端発散成分に影響を及ぼす場合には、その影響分を考慮して各軸方向でのＺＭＰ修正量の高さａを決定することが好ましい。

次いで歩容生成装置１００は、Ｓ７０２からの処理を再び実行する。このとき、Ｓ７０８の判断結果が否定的である限りは、上記したＳ７０２〜Ｓ７１６の処理が繰り返され、Ｓ７０８の判断結果が肯定的となった場合に、その繰り返しループ（Ｓ７００）を抜けてＳ７１８に進む。

以上のＳ７０２〜Ｓ７１６のループ処理によって、終端発散成分ｑe1を、定常歩容の初期発散成分ｑ0''に一致もしくはほぼ一致させることができるＺＭＰ修正量が（ひいては今回歩容の目標ＺＭＰ軌道が）探索的に求められる。

かかるループ処理の次のＳ７１８では、歩容生成装置１００は、現在の仮目標ＺＭＰ軌道（Ｓ７００の繰り返しループを抜ける直前で設定された仮目標ＺＭＰ軌道）を最終的に今回歩容の目標ＺＭＰ軌道として、これに対応するＺＭＰ軌道パラメータを決定する。これにより、図９のＳ０２８の処理（今回歩容パラメータの修正処理）が終了する。

なお、本実施形態では、ＺＭＰ修正量を台形パターンに設定したが、例えば、三角形状のパターンや、曲率が連続的に変化するようなパターン等に決定してもよい。

図９に戻って、上記のごとくＳ０２８において今回歩容パラメータを修正した後、Ｓ０３０に進み、歩容生成装置１００は、今回歩容の初期から終端までの各時刻での目標ＺＭＰまわりの床反力モーメント（より詳しくは床反力モーメントの水平成分）の許容範囲を規定する床反力モーメント許容範囲パラメータを決定する。

なお、床反力モーメントを、床反力鉛直成分で割ったものが、ＺＭＰ（床反力中心点）の目標ＺＭＰからのずれ量に相当するものとなる。従って、床反力モーメント許容範囲を、ＺＭＰの位置の許容範囲としてのＺＭＰ許容範囲（床反力中心点許容範囲）に変換し、このＺＭＰ許容範囲を規定するパラメータを決定するようにしてもよい。

Ｓ０３０で決定する床反力モーメント許容範囲は、前記複合コンプライアンス動作決定部１０４の制御処理（コンプライアンス制御）によって制御される目標ＺＭＰまわりの実床反力モーメントの許容範囲である。この床反力モーメント許容範囲について以下に説明する。

複合コンプライアンス動作決定部１０４の処理によるコンプライアンス制御は、目標ＺＭＰまわりに発生する床反力モーメントがコンプライアンス制御用目標床反力モーメントになるように足平２２の位置姿勢を制御する。コンプライアンス制御が目標通りに忠実に作動すると、実床反力中心点は、目標床反力モーメントを床反力鉛直成分で割った値だけ、目標ＺＭＰから水平方向に位置をずらした点になる。実床反力中心点は、いわゆる支持多角形で表されるＺＭＰ存在可能範囲（厳密な表現では、実床反力中心点の存在可能範囲）を逸脱することはできない。そして、実床反力中心点がＺＭＰ存在可能範囲の境界に近づき過ぎると、足平２２の本来の接地感を低下させたり、足平２２の底面が浮いてしまうような不具合が発生する。

床反力モーメント許容範囲は、このような不具合を防止するために、コンプライアンス制御用床反力モーメントに制限を加えるものである。したがって、床反力モーメント許容範囲は、これを床反力鉛直成分で割ることによって求められる床反力中心点許容範囲が、ＺＭＰ存在可能範囲に含まれるように決定されることが望ましい。

より具体的には、床反力中心点許容範囲（ＺＭＰ許容範囲）は、支持多角形に応じて決定されるべきである。この場合、床反力中心点許容範囲は、一般的には、複雑な形状に設定することができる。ただし、本実施形態では、演算を簡素化するために、床反力中心点許容範囲を、例えば床面上の長方形（Ｘ軸方向およびＹ軸方向に平行な辺を有する長方形）の領域とする。この場合、床反力中心点許容範囲を床反力モーメントに変換してなる床反力モーメント許容範囲は、X軸方向成分とＹ軸方向成分とでそれぞれ独立に範囲が設定される。

例えば、支持多角形と目標ＺＭＰとが図２１に示すような状況にある場合には、図示のごとく、床反力中心点許容範囲（ＺＭＰ許容範囲）は支持多角形に内包されるように設定される。また同時に、床反力中心点許容範囲（ＺＭＰ許容範囲）は目標ＺＭＰを内包するように設定される。

なお、図２１に点描領域として示す支持多角形は、歩行歩容（歩行歩容に関する歩容生成については後に補足説明を行なう）の両脚支持期での支持多角形を例示している。この例では、右足平２２Ｒのつま先が接地し、左足平２２Ｌのかかとが接地している状態を模式的に示している。

歩行歩容あるいは図５の走行歩容における片脚支持期では、支持多角形は、支持脚足平２２の接地面（床面との接触面）である。この場合においては、ＺＭＰ許容範囲は、目標ＺＭＰを内包しつつ、該支持多角形に内包され、もしくは、その支持多角形とほぼ一致するように設定すればよい。また、図５の走行歩容の空中期では、ＺＭＰ許容範囲は、例えば目標ＺＭＰを中心として、Ｘ軸、Ｙ軸両方向に幅が０の領域、すなわち、目標ＺＭＰそのものの点（これは面積が“０”の領域を意味する）に設定される。

図９に戻って、上記のごとくＳ０３０において床反力モーメント許容範囲を決定した後、あるいはＳ０１６の判断結果が否定的である場合には、次にＳ０３２において、歩容生成装置１００は、今回歩容瞬時値（現在の制御周期での今回歩容の目標足平位置姿勢等の瞬時値）を決定する。このＳ０３２では、前記姿勢安定化制御演算部１１２で前述の如く決定されるモデル操作床反力モーメントが目標ＺＭＰまわりに発生するように今回歩容瞬時値が決定される。

具体的には、図２２のフローチャートに示す如く、歩容瞬時値が決定される。以下説明すると、歩容生成装置１００は、まず、Ｓ１０００からＳ１００６まで、図１９のＳ８０６からＳ８１２まで（または図１６のＳ３０６からＳ３１２まで）と同様に処理を実行することによって、今回歩容の現在時刻ｔ（現在の制御周期）での目標床反力鉛直成分、目標ＺＭＰ、目標足平位置姿勢、目標上体姿勢、目標腕姿勢、目標上体鉛直位置の瞬時値を算出する。

これらの各瞬時値の算出の仕方は、歩容パラメータとして、図９のＳ０２８で最終的に修正した今回歩容パラメータを使用する点を除いて、図１９のＳ８０６からＳ８１２まで（または図１６のＳ３０６からＳ３１２まで）の処理と同じである。

次いで、Ｓ１００８に進み、歩容生成装置１００は、図９のＳ０３０で決定した床反力モーメント許容範囲パラメータを基に、今回歩容の現在時刻ｔでの床反力モーメント許容範囲の瞬時値を求める。この床反力モーメント許容範囲の瞬時値は、歩容生成装置１００から、前記補償全床反力モーメント分配器１１０（図３参照）に出力される。そして、この分配器１１０で前記式５０により算出されたモデル操作床反力モーメント（現在時刻ｔの値）が歩容生成装置１００に与えられる。

次いで、Ｓ１０１０に進み、歩容生成装置１００は、補償全床反力モーメント分配器１１０から与えられたモデル操作床反力モーメントが目標ＺＭＰまわりに発生するように（ロボット１の慣性力と重力との合力が目標ＺＭＰまわりに発生するモーメントの水平成分がモデル操作床反力モーメントに釣り合うように）、今回歩容の現在時刻ｔでの上体水平加速度を決定する。

言い換えると、ロボット１の慣性力と重力との合力が目標ＺＭＰまわりに発生するモーメントがモデル操作床反力モーメントの符号を反転したモーメントに一致するように、今回歩容の現在時刻ｔでの上体水平加速度が決定される。

この場合、例えば図８の動力学モデル（倒立振子モデル）を用いて今回歩容の上体水平加速度が算出される。

具体的には、今回歩容の現在時刻ｔで上体鉛直位置と、時刻（ｔ−Δｔ)の上体水平位置と、現在時刻ｔの目標上体姿勢とから、現在時刻ｔでの上体質点２４ｂの鉛直位置及び水平位置が決定される。なお、時刻(ｔ−Δｔ)までの上体水平位置の時系列又は時刻(ｔ−Δｔ)での歩容状態を基に時刻ｔでの上体水平位置を補間的に推定し、その推定した上体水平位置を時刻(ｔ−Δｔ)の上体水平位置の代わりに用いてもよい。

また、今回歩容の現在時刻ｔでの床反力鉛直成分から、上体質点２４ｂに作用する重力（＝ｍb＊ｇ）を差し引いた値を、上体質点２４ｂの質量ｍbにより除算することによって、現在時刻ｔでの上体質点２４ｂの鉛直加速度が求められる。

そして、上記の如く求めた上体質点２４ｂの鉛直位置、水平位置、鉛直加速度をそれぞれ、前記式０４のＺb、Ｘb、d2Zb/dt2に代入すると共に、現在時刻ｔでの目標ＺＭＰの水平位置および鉛直位置を式０４のＸzmp，Ｚzmpに代入し、さらに、同式０４のＭzmp_yを、モデル操作床反力モーメントに一致させてなる式を、d2Xb/dt2について解くことにより、現在時刻ｔでの上体質点水平加速度d2Xb/dt2が算出される。そして、この上体質点水平加速度d2Xb/dt2が現在時刻ｔでの上体水平加速度として求められる。

尚、より厳密な動力学モデルを用いて、目標ＺＭＰまわりの床反力モーメントの水平成分をモデル操作床反力モーメントに一致させるような上体水平加速度を探索的に求めるようにしてもよい。

次いで、Ｓ１０１２に進み、Ｓ１０１０で上記の如く求めた上体水平加速度を２階積分することにより現在時刻ｔでの上体水平位置を算出する。この算出の仕方は、図１６のＳ３１４（又は図１９のＳ８１６）と同じである。これにより、図９のＳ０３２の処理が完了する。

次いでＳ０３４に進み、スピン力をキャンセルする（ロボット１の腕体以外の運動によって目標ＺＭＰ回りに発生する床反力モーメント鉛直成分を“０”もしくはほぼ“０”にする）ための腕体の動作が決定される。具体的には、腕体を振らなかった場合の目標ＺＭＰにおける床反力モーメント鉛直成分軌道（厳密には、腕体を振らずに歩容を生成した場合において、ロボットの重力と慣性力の合力が目標ＺＭＰに作用するモーメント鉛直成分軌道の各瞬時値の符号を反転したもの）が求められる。すなわち、Ｓ０３２の処理によって生成された今回歩容の運動（これには腕振りの運動は含まれていない）の瞬時値に釣り合う目標ＺＭＰ回りの床反力モーメント鉛直成分の瞬時値が求められる。そして、この床反力モーメント鉛直成分の瞬時値を、腕振り運動の等価慣性モーメントで割ることにより、スピン力キャンセルに必要な腕振り動作の角加速度が求められる。なお、腕の振りが大き過ぎる場合には、等価慣性モーメントよりも大きな値で床反力モーメント鉛直成分の瞬時値を除算するようにしてもよい。

次に、歩容生成装置１００は、この角加速度を２階積分し、これを積分値が過大になるのを防ぐためのローカットフィルタに通して得た角度を腕振り動作角とする。ただし、腕振り動作では、左右の腕体を前後逆方向に振り、両腕体の重心位置を変化させないようにする。なお、スピン力をキャンセルするための腕振り運動を定常歩容でも生成しておき、これにつながるように、今回歩容における腕振り運動を決定するようにしてもよい。

次いでＳ０３６に進み、歩容生成装置１００は、時刻ｔに制御周期Δｔを加え、Ｓ０１４からの処理を再び実行する。

以上により、今回歩容の瞬時値が時系列的に生成されることとなる。

本実施形態では、以上説明した歩容生成装置１００の処理（図９のフローチャートに示す処理）によって、本発明における目標運動決定手段が実現される。この場合、ロボット１の今回歩容の目標運動（目標足平位置姿勢、目標上体位置姿勢、及び目標腕姿勢）の軌道（時系列）は、本発明における上下方向慣性力パラメータとしての、目標床反力鉛直成分軌道パラメータ（図１７のＳ６０６で決定されたパラメータ）により規定される目標床反力鉛直成分軌道を満足することを１つの要件として決定される。

また、今回歩容の目標運動の軌道は、将来において、仮想的な規範運動としての定常歩容の運動軌道に収束させる（漸近させる）ことを他の１つの要件として決定される。

さらに、前記モデル操作床反力モーメントが“０”でない場合（本実施形態では、補償全床反力モーメントが床反力モーメント許容範囲内に収まっている場合）には、今回歩容の目標運動は、ロボット１の運動と床反力との関係を表す動力学モデル（本実施形態では倒立振子モデル）において、目標ＺＭＰまわりに前記モデル操作床反力モーメントを付加的に発生させることを他の１つの要件として決定される。この場合、今回歩容の目標運動通りにロボット１の実際の運動を行なったと仮定した場合に、実ロボット１においては、目標ＺＭＰまわりにモデル操作床反力モーメントと逆向きのモーメントが付加的に作用することとなる。従って、実ロボット１の実際の上体姿勢が、目標姿勢からずれるのを抑制する床反力モーメントが付加的に作用するように、目標運動が決定されることとなる。

次に、説明を後回しにした姿勢安定化制御演算部１１２の演算処理をさらに詳細に説明する。

姿勢安定化制御演算部１１２が算出する前記補償全床反力モーメントＭdmdは、前記したように、実上体姿勢角（上体姿勢角の実測値）と目標上体姿勢角との偏差である上体姿勢角偏差Δθを“０”に収束させるためのフィードバック要求操作量である。

この場合、本実施形態では、上体姿勢角偏差Δθは、ロボット１の動力学（上体２４の運動と床反力との間の関係）を近似的に表現する図８の倒立振子モデルの上体質点２４ｂの水平位置の、基準位置（上体姿勢角偏差Δθが“０”である場合の目標上体位置姿勢に対応する上体質点２４ｂの水平位置）に対する位置偏差ΔＸに変換される。すなわち、上体姿勢角偏差Δθは、上体質点２４ｂの水平位置の摂動量としての位置偏差ΔＸに変換される。

この変換は、次式１５０により行なわれる。なお、式１５０におけるｈは、前記した如く、上体質点２４ｂの平均的な高さ（定数値）である。

ΔＸ＝ｈ＊Δθ ……式１５０

この式１５０について補足すると、上体姿勢角偏差Δθは、一般には“０”に近い角度となる。この場合、上体姿勢角偏差Δθに対応する上記位置偏差ΔＸは、近似的に、式１５０により与えられる。

なお、本実施形態では、前記したように、位置偏差ΔＸが本発明における状態量偏差に相当する。従って、姿勢安定化制御演算部１１２が、実上体姿勢角（前記傾斜センサ４０の検出信号に基づく実測値）と目標上体姿勢角の偏差である上体姿勢角偏差Δθから、式１５０により位置偏差ΔＸを算出する処理によって、本発明における状態量偏差観測手段が実現される。

そして、姿勢安定化制御演算部１１２は、この位置偏差ΔＸと、該ΔＸの時間的変化率（微分値）である速度偏差ΔＶxとから、フィードバック制御則としてのＰＤ則（比例・微分則）により補償全床反力モーメントＭdmdを決定する。

すなわち、姿勢安定化制御演算部１１２は、次式１５２の如く、上記位置偏差ΔＸと速度偏差ΔＶxとに比例ゲインＫx、微分ゲインＫvを乗じたものを加え合わせることによって、Ｍdmdを決定する。

Ｍdmd＝Ｋx＊ΔＸ＋Ｋv＊ΔＶx ……式１５２

なお、速度偏差ΔＶは、実際のロボット１の上体姿勢角の角速度の実測値（又は上体姿勢角の実測値の時間的変化率）と目標上体姿勢角の角速度（本実施形態では“０”）との偏差に、倒立振子の上体質点２４ｂの平均的な高さｈを乗じることによって求めてもよい。

また、Mdmdは、前記したように、ロール方向（Ｘ軸まわり）の成分Mdmdxと、ピッチ方向（Ｙ軸まわり）の成分Mdmdyとからなるベクトルである。従って、式１５２におけるΔＸ、ΔＶxは、Mdmdxを算出に関しては、それぞれＹ軸方向の位置偏差、速度偏差を意味し、Ｍdmdyの算出に関しては、それぞれＸ軸方向の位置偏差、速度偏差を意味する。

補足すると、前記したように、本実施形態では補償全床反力モーメントＭdmdが本発明における要求操作量に相当する。従って、ΔＸとΔＶxとから式１５２によりＭdmdを算出する処理によって、本発明における要求操作量決定手段が実現される。この場合、前記比例ゲインＫx、微分ゲインＫvがそれぞれ、本発明におけるフィードバックゲインとしての第１ゲイン係数、第２ゲイン係数に相当する。

ここで、ロボット１の歩容が図５の走行歩容のように、上体２４の上下方向の加速度（ひいては上下方向の慣性力）が比較的大きく変化するような歩容である場合には、上記比例ゲインＫx、微分ゲインＫvを固定値に設定すると、ロボット１の実上体姿勢角が、目標上体姿勢角に対して、オーバシュートやアンダーシュートが発生し易いことが本願発明者の種々様々の実験・検討により確認された。

そこで、本実施形態では、姿勢安定化制御演算部１１２は、上記比例ゲインＫx、微分ゲインＫvを逐次可変的に決定しつつ、補償全床反力モーメントＭdmdを決定する。

以下にその決定手法を説明する。

今回歩容の初期時刻から終端時刻までの任意の時刻を離散時間系で表現した時刻（刻み時間ΔＴの時間間隔での時刻）を時刻ｋ（ｋ＝０，１，…，Ｎ）とおく。なお、時刻０、時刻Ｎは、それぞれ今回歩容の初期時刻、終端時刻である。そして、実ロボット１の動力学（上体２４の運動と床反力との間の関係）が、前記式１００（又は式１０２）により表現される倒立振子モデルで近似できるものとし、時刻ｋでのロボット１の運動の瞬時値に対応する倒立振子の上体質点２４ｂの状態量ベクトル（上体質点２４ｂの水平位置及び水平速度の組）をＸＶb(k)（＝(Ｘb(k)，Ｖxb(k))^T）とおく。

また、今回歩容の任意の時刻ｋにおいて、前記式１０２の状態方程式に基づいて予測される今回歩容の終端時刻Ｎでの倒立振子の収束成分ｐ(N)及び発散成分ｑ(N)（以降、これらを今回歩容終端収束成分ｐ(N)、今回歩容終端発散成分ｑ(N)という）の値（予測値）を、それぞれｐ(N)_k，ｑ(N)_kというように表記する。

なお、姿勢安定化制御演算部１１２の処理に関する以下の説明では、特にことわらない限り、理解の便宜上、サジタルプレーン（ＸＺ平面）上での倒立振子の運動（あるいは、ロボット１の上体２４の運動）を想定する。

ここで、今回歩容のある時刻ｋにおいて、実ロボット１（実際のロボット１）の上体姿勢角が外乱等の影響で目標上体姿勢角に対してずれを生じ、そのずれを解消するために、目標ＺＭＰまわりに、ある付加的な床反力モーメント（Ｙ軸まわりの摂動床反力モーメント）を実ロボット１に瞬時的に作用させた場合を想定する。この状況は、実ロボット１の動力学を近似表現する倒立振子に関して言えば、時刻ｋにおいて、実ロボット１（実際のロボット１）の上体姿勢角の目標上体姿勢角からのずれに応じて、倒立振子に対する摂動床反力モーメントとしての入力モーメントＭinを該倒立振子に瞬時的に作用させ、且つ、時刻ｋ＋１から今回歩容の終端時刻Ｎまでの床反力モーメントを“０”に維持した場合に相当する。

このとき、時刻ｋ＋１で予測される今回歩容終端収束成分及び今回歩容終端発散成分のそれぞれの値ｐ(N)_k+1，ｑ(N)_k+1は、前記式１０２（倒立振子の状態方程式）と、前記式１１０のただし書きにおけるφの定義式と、前記式１１８（収束成分ｐ及び発散成分ｑの定義式）とに基づいて、次式２００により与えられる。

また、時刻ｋから今回歩容の終端時刻Ｎまで、実ロボット１に作用させる目標ＺＭＰまわりの床反力モーメント（Ｙ軸まわりのモーメント成分）を“０”に維持した場合を想定する。この状況は、倒立振子で言えば、時刻ｋから今回歩容の終端時刻Ｎまで倒立振子に対する入力モーメントＭin（Ｙ軸まわりのモーメント成分）を“０”に維持した場合に相当する。

この場合、時刻ｋで予測される今回歩容終端収束成分及び今回歩容終端発散成分のそれぞれの値ｐ(N)_k，ｑ(N)_kは、上記式２００の場合と同様に、前記式１０２と、式１１０のただし書きにおけるφの定義式と、式１１８とに基づいて、次式２０２により与えられる。

ここで、時刻ｋで適当な入力モーメントＭinを倒立振子に与えることによって、時刻ｋ＋１での倒立振子の状態を、時刻ｋでの倒立振子の状態と同じ状態に保持する場合、例えばＸＶb(k+1)＝ＸＶb(k)＝(１，０)^Tとする場合（倒立振子の上体質点２４ｂを時刻ｋから時刻ｋ＋１まで静止状態に保つ場合）を想定する。

この場合において、時刻ｋ＋１で予測される今回歩容終端発散成分の値ｑ(N)_k+1の、時刻ｋで予測される今回歩容終端発散成分の値ｑ(N)_kに対する比率（≡ｑ(N)_k+1／ｑ(N)_k）の値をα1とおくと、この比率値α1は、上記式２００のうちの第１段目の式と、上記式２０２とに基づいて、次式２０４により与えられる。

すなわち、時刻ｋから時刻ｋ＋１まで倒立振子の上体質点２４ｂを同じ位置で静止状態に保持するように入力モーメントＭinを倒立振子に与えた場合には、時刻ｋ＋１での今回歩容終端発散成分の予測値ｑ(N)_k+1は、時刻ｋでの今回歩容終端発散成分の予測値ｑ(N)_kのα1倍になる。この関係を視覚的に示すと、図２３のグラフで示すようになる。

すなわち、時刻ｋから今回歩容の終端時刻Ｎまで倒立振子に対する入力モーメントＭinを“０”に維持した場合には、発散成分ｑは、グラフａ１で示すように時刻ｋ以降、単調に増加していく。この場合、終端時刻Ｎでの発散成分ｑの値がｑ(N)_kとなる。

一方、時刻ｋ＋１での倒立振子の状態を時刻ｋと同じ状態に保持するように、時刻ｋで倒立振子に適当な入力モーメントＭinを与えた後に、時刻ｋ＋１から今回歩容の終端時刻Ｎまで倒立振子に対する入力モーメントＭinを“０”に維持した場合には、発散成分ｑは、グラフａ２で示すように、時刻ｋ＋１以降、グラフａ１と同様に単調に増加していく。この場合には、終端時刻Ｎでの発散成分ｑの値がｑ(N)_kをα1倍したｑ(N)_k+1（＜ｑ(N)_k）になる。

また、この場合、時刻ｋ＋１での倒立振子の状態を時刻ｋと同じ状態に保持するために必要な入力モーメントＭinの値（以下、これをＭin1とおく）は、前記式２００の第３段目の式と前記式２０２とに基づいて、次式２０６により与えられる。なお、倒立振子にＭin1の入力モーメントＭinを与えるということは、実ロボット１に関して言えば、実ロボット１に対して、目標ＺＭＰまわりに、値Ｍin1の床反力モーメント（Ｙ軸まわりのモーメント）を付加的に与えることに相当する。

今回歩容の時刻ｋにおいて、倒立振子に対する入力モーメントＭinが、上式２０６により算出される値Ｍin1になるように、実ロボット１に対して摂動床反力モーメントを付加的に作用させた場合、前記したように、終端時刻Ｎでの発散成分ｑの値がｑ(N)_kをα1倍したｑ(N)_k+1（＜ｑ(N)_k）になるものの、“０”に収束させていくことはできない。

他方、前記比率ｑ(N)_k+1／ｑ(N)_kが、前記式２０４により与えられるα1に“１”よりも小さい正の値を乗じてなる値（以下、これをα2とおく）になるように、倒立振子に対する入力モーメントＭinを決定すれば、今回歩容終端発散成分ｑ(N)を“０”に収束させていくことができる。

例えば、上記α2（＜α１）を、次式２０８によって与えられる値とし、前記比率ｑ(N)_k+1／ｑ(N)_kが、α2に一致するように、入力モーメントＭinを決定すれば、今回歩容終端発散成分ｑ(N)を時定数１／γで“０”に収束させていくことができる。

α2＝α1＊exp(−γ＊ΔＴ) ……式２０８

なお、式２０８におけるexp( )は自然対数の底ｅの指数関数である。また、γは正の定数である。

この場合、比率ｑ(N)_k+1／ｑ(N)_kをα2に一致させるのに必要な入力モーメントＭinの値（以下、これをＭin2とおく）は、前記式２００の第３段目の式、前記式２０２及び式２０８と、前記式１１８（発散成分の定義式）とに基づいて、次式２１０により与えられる。

時刻ｋにおいて、この式２１０により算出される値Ｍin2の入力モーメントＭinを与えた後に、時刻ｋ＋１から今回歩容の終端時刻Ｎまで倒立振子に対する入力モーメントＭinを“０”に維持した場合には、発散成分ｑは、図２３のグラフａ３で示すように変化する。すなわち、発散成分ｑが一旦、減少した後、単調に増加していく。そして、この場合には、終端時刻Ｎでの発散成分ｑの値がｑ(N)_k+1に、exp(−γ＊ΔＴ)を乗じた値（＜ｑ(N)_k+1）になる。

以上のことから、今回歩容の各時刻ｋにおいて、倒立振子に対する入力モーメントＭinが、例えば上式２１０により算出される値Ｍin2になるように、実ロボット１に対して摂動床反力モーメントを付加的に作用させれば、今回歩容終端発散成分ｑ(N)を発散させずに、位置偏差ΔＸを（ひいては上体姿勢角偏差Δθを）“０”に収束させていくことができることとなる。

補足すると、前記式２００〜２１０に関する説明は、詳しくはサジタルプレーン上での倒立振子の摂動運動に関する説明であるが、ラテラルプレーン上での倒立振子の摂動運動についても同様である。この場合、状態量ベクトルＸＶb(k)の各成分Ｘb、Ｖxbをそれぞれ、Ｙ軸方向での上体質点２４ｂの水平位置と水平速度とに置き換え、また、入力モーメントＭinとしてＸ軸まわりのモーメントを用いればよい。

以上のことを踏まえて、本実施形態では、前記姿勢安定化制御演算部１１２は、例えば前記式２１０を基礎として、補償全床反力モーメントＭdmdを決定する。

前記式２１０により与えられる入力モーメントＭin2は、時刻ｋから今回歩容の終端時刻Ｎまでの期間内の上体質点２４ｂの鉛直方向の慣性力の時系列に依存するものであるから、時刻ｋから将来の上体質点２４ｂの鉛直方向の慣性力の変化の影響（ひいては、上体２４の鉛直方向の慣性力の変化の影響）を見込んで、将来における位置偏差ΔＸを（ひいては上体姿勢角偏差Δθを）適切に“０”に収束させていくことが可能な入力モーメントとして機能するものとなる。換言すれば、入力モーメントＭin2は、今回歩容の上体２４の鉛直加速度、ひいては、倒立振子の上体質点２４ｂの鉛直加速度d2Zb/dt2が変動しても、ロボット１の上体２４の姿勢を目標上体姿勢に安定に追従させながら、ロボット１の運動を行い得るようにするための摂動床反力モーメントとして好適なモーメントであると言える。

また、式２１０の状態量ベクトルＸＶb(k)は、(Ｘb(k)，Ｖxb(k))^Tであるから、式２１０は、次式２１２に書き換えることができる。

すなわち、Ｍin2は、倒立振子の上体質点２４ｂの水平位置Ｘbと水平速度Ｖxbとの線形結合値として与えられる。また、上体質点２４ｂの水平位置の摂動と、摂動床反力モーメントとの間の関係（離散時間系での関係）は、前記式１０２の状態変数ベクトルＸＶbを、位置偏差ΔＸ及び速度偏差ΔＶからなるベクトル(ΔＸ，ΔＶ)^Tに置き換えた状態方程式により表現される。換言すれば、前記式３００の状態量偏差Ｓ1、及びその時間的変化率Ｓ2として、それぞれ、ΔＸ、ΔＶを使用してなる式が上体質点２４ｂの水平位置の摂動と、摂動床反力モーメントとの間の関係を離散時間系で表現する状態方程式となる。

この場合、倒立振子の挙動の摂動分に関しては、前記補償全床反力モーメントＭdmdを決定するための前記位置偏差ΔＸと、速度偏差ΔＶとを、それぞれ、式２１０のＸb、Ｖxbに対応づけることができる。

そこで、本実施形態では、姿勢安定化制御演算部１１２は、式２１０のＸbに掛かる係数Ｃ＊Ｋ1と、Ｖxbに掛かる係数Ｃ＊Ｋ2とをそれぞれ、前記式１５２の比例ゲインＫx、微分ゲインＫvとして用いて、次式１５２ａにより、補償全床反力モーメントＭdmdを逐次（制御周期毎に）算出する。

Ｍdmd＝Ｋx＊ΔＸ＋Ｋv＊ΔＶx
＝(Ｃ＊Ｋ1)＊ΔＸ＋(Ｃ＊Ｋ2)＊ΔＶx ……式１５２ａ

この場合、姿勢安定化制御演算部１１２は、比例ゲインＫx、微分ゲインＫvを決定するために、前記式１２０のただし書きで定義したＣ，Ｋ1，Ｋ2をそれぞれ、以下に説明するように決定する。

本実施形態では、歩容生成装置１００から姿勢安定化制御演算部１１２には、目標上体姿勢角の他、次のようなデータが与えられるようになっている。具体的には、姿勢安定化制御演算部１１２には、図９のＳ０２４の処理の中で、図１５のＳ２２２において前記した如く歩容生成装置１００が算出した対角化用行列Γcycの逆行列Γcyc^-1が与えられる。なお、Γcyc^-1は、図１５のＳ２２２に関して説明した場合と同様に、定常歩容の床反力鉛直成分軌道パラメータを基に、姿勢安定化制御演算部１１２で改めて算出するようにしてもよい。

また、姿勢安定化制御演算部１１２には、図９のＳ０２６の処理の中で、図１７のＳ６０６で歩容生成装置１００が決定した今回歩容の床反力鉛直成分軌道パラメータが与えられる。

そして、姿勢安定化制御演算部１１２は、今回歩容の現在時刻ｋから終端時刻Ｎまでの期間内の各時刻（詳しくは、現在時刻ｋから、時刻Ｎ−１までの刻み時間ΔＴ毎の各時刻）での上体質点２４ｂの鉛直方向の慣性力の瞬時値を今回歩容パラメータを基に算出する。その算出の手法は、定常歩容に関する上体質点２４ｂの鉛直方向の慣性力の算出手法と同様である。

具体的には、本実施形態では、姿勢安定化制御演算部１１２は、倒立振子の上体質点２４ｂの質量ｍbがロボット１の全体の質量に一致するものとして、今回歩容パラメータのうちの床反力鉛直成分軌道パラメータを基に、現在時刻ｋから、時刻Ｎ−１までの各時刻での上体質点２４ｂの鉛直方向の慣性力に釣り合う床反力鉛直成分の瞬時値を算出する。該瞬時値は、図１９のＳ８０６で算出される値と同じである。そして、姿勢安定化制御演算部１１２は、その算出した床反力鉛直成分の各瞬時値を上体質点２４ｂの質量ｍb（＝ロボット１の全体質量）で除算してなる値を前記式１００の（ｇ＋d2Zb/dt2）の値として、前記式１０４ａ〜１０４ｃによって、各時刻での状態遷移行列Ａ(k)，Ａ(k+1)，…，Ａ(N-1)を算出する。

さらに、姿勢安定化制御演算部１１２は、今回歩容の現在時刻ｋでの（ｇ＋d2Zb/dt2）の値として上記の如く決定した値を用いて、前記式１０６ａ〜１０６ｃによって、現在時刻ｋでの係数ベクトルＢ(k)（前記入力モーメントＭinに掛かる係数ベクトル）を算出する。

なお、図５の走行歩容では、床反力鉛直成分は負の値となることはないので、実際上は、Ａ(k)は状態遷移行列Ａ(k)，Ａ(k+1)，…，Ａ(N-1)は、式１０４ａ，１０４ｂのいずれかの式によって算出される。同様に、係数ベクトルＢ(k)は、実際上は、式１０６ａ，１０６ｂのいずれかの式によって算出される。

補足すると、定常歩容に係わる上体質点２４ｂの鉛直方向の慣性力に算出に関して補足した如く、今回歩容パラメータを基に、３質点モデルなどの多質点モデル（幾何学モデル）を用いて、今回歩容におけるロボット１の上体２４の鉛直方向の慣性力（又は鉛直加速度）を算出し、その算出した慣性力（又は鉛直加速度）を、上体質点２４ｂの慣性力（又は鉛直加速度）として用いることによって、状態遷移行列Ａ(k)，Ａ(k+1)，…，Ａ(N-1)を算出するようにしてもよい。

次いで、姿勢安定化制御演算部１１２は、上記の如く算出した状態遷移行列Ａ(k)，Ａ(k+1)，…，Ａ(N-1)を掛け合わせることによって、φ(N,k)（＝Ａ(N-1)＊Ａ(N-2)＊…＊Ａ(k)）を算出すると共に、Ａ(k+1)，…，Ａ(N-1)を掛け合わせることによって、φ(N,k)（＝Ａ(N-1)＊Ａ(N-2)＊…＊Ａ(k+1)）を算出する。

そして、姿勢安定化制御演算部１１２は、上記の如く算出したφ(N,k)と、歩容生成装置１００から与えられたΓcyc^-1（詳しくは今回歩容につながる定常歩容に対応するΓcyc^-1）とから、式２１０のただし書きの定義に従って、Ｋ1、Ｋ2を算出する。

さらに、姿勢安定化制御演算部１１２は、上記の如く算出したφ(N,k)及びφ(N,k+1)と、歩容生成装置１００から与えられたΓcyc^-1とから、前記式２０４により前記比率値α1を算出する。

そして、姿勢安定化制御演算部１１２は、このα1と、上記の如く算出したφ(N,k)、φ(N,k+1)及びＢ(k)と、歩容生成装置１００から与えられたΓcyc^-1（今回歩容につながる定常歩容に対応するΓcyc^-1）とから、式２１０のただし書きの定義に従って、Ｋ3を算出する。この場合、Ｋ3を算出するために必要なγの値は、あらかじめ設定された一定値（＞０）である。本実施形態では、γの値は、例えば倒立振子の固有振動数、すなわち、前記式１０８において、上体質点２４ｂの鉛直加速度d2Zb/dt2が“０”であるときの角周波数ω0（＝√（ｇ／ｈ））に設定されている。

なお、γの値は、上体質点２４ｂの鉛直加速度d2Zb/dt2等に応じて可変的に設定してもよい。

次いで、姿勢安定化制御演算部１１２は、上記の如く算出したＫ3とＫ1との積、Ｋ3とＫ2との積をそれぞれ、比例ゲインＫx、微分ゲインＫvとして決定する。この場合、Ｋx、Ｋvは、床反力鉛直成分の変化に同期するようにして、例えば図２４のグラフで示す如く変化するように決定される。

そして、姿勢安定化制御演算部１１２は、制御周期毎に、このように決定した比例ゲインＫx，微分ゲインＫvを用いて、式１５２ａの右辺の演算（比例・微分則の演算）を行なうことにより補償全床反力モーメントＭdmdを決定する。

なお、上記の如く比例ゲインＫx、微分ゲインＫvを決定することは、前記式３０２によって、第１比例ゲインとしての比例ゲインＫxと第２比例ゲインとしての微分ゲインＫvとを決定することになる。この場合、本実施形態では、式３０２ａのα2の値として、前記式２０８によりα1の値に応じて決定される値が用いられる。

以上が姿勢安定化制御演算部１１２の演算処理の詳細である。

補足すると、本実施形態では、姿勢安定化制御演算部１１２が、上記の如く制御周期毎に、比例ゲインＫx、微分ゲインＫvを決定する処理によって、本発明におけるフィードバックゲイン決定手段が実現されることとなる。

以上説明したように比例ゲインＫx、微分ゲインＫvを決定し、これらのＫx，Ｋvを用いて、比例・微分則の演算（前記１５２ａの演算）により補償全床反力モーメントＭdmdを決定することによって、上体２４の将来の慣性力の変化を見込んで予測される、将来の位置偏差ΔＸ及び速度偏差ΔＶを“０”に収束させることができるように（本実施形態では今回歩容の終端時刻Ｎでの位置偏差ΔＸ及び速度偏差ΔＶの線形結合値としての発散成分ｑの予測値が発散せずに“０”に収束するように）、Ｍdmdが決定されることとなる。この結果、上体２４の鉛直方向の慣性力が変化するような歩容（本実施形態では走行歩容）でロボット１の運動を行なう場合であっても、外乱等の影響で実上体姿勢が目標姿勢からずれを生じた場合に、実状態姿勢を円滑に（オーバーシュートやアンダ−シュートが発生しないように）、目標姿勢に復元させることができる。

なお、以上説明した実施形態では、上体２４の鉛直方向の慣性力が変化する目標歩容として、前記図５の走行歩容を例にとって説明したが、ロボット１の鉛直方向の慣性力が変化するような歩行歩容を目標歩容として、ロボット１の運動を行なうようにしてもよい。この場合には、床反力鉛直成分軌道（１歩分の軌道）を、例えば図２５に示すような折れ線状のパターンで設定することによって、ロボット１の歩行動作を行ないながら、上体２４の鉛直方向の慣性力を変化させることができる。この図２５の例では、床反力鉛直成分軌道は、両脚支持期では、床反力鉛直成分の増加側に凸（上に凸）の台形状に設定され、片脚支持期では床反力鉛直成分の減少側に凸（下に凸）の台形状に設定される。

このように床反力鉛直成分軌道を変化させる歩行歩容でロボット１の動作を行なわせる場合であっても、前記した実施形態と同じように目標歩容を生成しつつ、ロボット１の動作を制御することによって、実上体姿勢が目標上体姿勢からずれた場合に、実上体姿勢を円滑に目標姿勢に復元させることができる。

また、前記実施形態では、状態量偏差として、前記式１５０により算出される位置偏差ΔＸを用いたが、上体姿勢角偏差Δθを状態量偏差として用いてもよい。

この場合には、例えば、前記式１００の状態変数ベクトルＸＶbの代わりに、上体姿勢角偏差Δθとその時間的変化率である角速度偏差Δωと成分とする状態変数ベクトルを用いると共に、式１００の右辺の係数ベクトル(０，１／(ｈ＊ｍb))^Tの代わりに、(０，１／(ｈ²＊ｍb))^Tを用いた式を基に前記実施形態と同様に構築されるアルゴリズムによって、上体姿勢角偏差Δθと角速度偏差Δωとにそれぞれ掛かる比例ゲイン、微分ゲインを決定するようにすればよい。

さらに、状態量偏差として、例えば目標歩容における上体２４の重心の位置と、実際の上体２４の重心の位置との差を用いるようにしてもよい。

また、前記実施形態では、鉛直方向（重力方向）を上下方向として、上体２４（上体質点２４ｂ）の上下方向の慣性力の目標値の時系列を用いて比例ゲインＫx及び微分ゲインＫvを決定するようにしたが、例えば床面が傾斜しているような場合には、床面に垂直な方向を上下方向として、この上下方向における上体２４（上体質点２４ｂ）の慣性力の目標値の時系列を用いて比例ゲインＫx及び微分ゲインＫvを決定するようにしてもよい。

また、前記実施形態では、移動体として、２足移動ロボット１を例にとって説明したが、本発明を適用できる移動体は、２足移動ロボットに限られるものではない。例えば、３つ以上の脚体を有する脚式移動ロボットについても本発明を適用できる。

あるいは、例えば図２６（ａ），（ｂ）に模式的に示す構造の移動体についても本発明を適用できる。図２６（ａ）に例示する移動体２００は、移動機構としての車輪２０２を有する。そして、この車輪２０２の回転軸に揺動可能に軸支されたリンク機構２０４を介して基体２０６が車輪２０２に支持されている。この場合、リンク機構２０４は、車輪２０２の回転軸と基体２０６との間に直動型の関節２０８を有し、該直動関節２０８の動作によって、基体２０６の上下動運動が可能となっている。

また、図２６（ｂ）に例示する移動体２１０は、図２６（ａ）に示す移動体２００と、リンク機構２１２の構造だけが相違するものである。この例では、リンク機構２１２は、車輪２０２の回転軸に揺動可能に軸支されると共に、該回転軸と基体２０６との間に、回転型の関節２１４，２１６を有する。そして、関節２１４，２１６の動作によって、基体２０６の上下動運動が可能となっている。

なお、図２６（ａ），（ｂ）中のΔθは、基体２０６の実際の姿勢の、目標姿勢に対するずれ量（角度差）を示している。この例では、基体２０６が鉛直方向に起立する姿勢を基体２０６の目標姿勢として示している。

また、前記実施形態では、補償全床反力モーメントＭdmdをモデル操作床反力モーメントとコンプライアンス制御用床反力モーメントとに分配したが、モデル操作床反力モーメントとコンプライアンス制御用床反力モーメントとのいずれか一方だけを使用するようにしてもよい。例えば補償全床反力モーメントＭdmdの符号を反転させたもの（あるいは比例ゲインＫx及び微分ゲインＫvの符号を反転させた比例・微分則の演算により算出した要求操作モーメント）を、前記モデル操作床反力モーメントとして使用し、コンプライアンス制御用床反力モーメントを常時“０”に設定するようにしてもよい。

また、例えば、床反力モーメント許容範囲を十分に広い範囲に保つことができる場合には、補償全床反力モーメントＭdmdをそのままコンプアライアンス制御用モーメントとして使用し、モデル操作床反力モーメントを常時“０”に設定するようにしてもよい。このようにすることにより、前記第１発明の一実施形態が構築されることとなる。

また、前記実施形態では、目標歩容を生成するために用いるロボット１の動力学モデルとして、例えば１質点、あるいは３質点のモデルを例示したが、例えば上体２４の姿勢を適宜変化させるような目標歩容を生成する場合には、上体２４の姿勢変化と、床反力モーメントと関係を表現するフライホイール等を備える動力学モデルを用いてもよい。

また、前記実施形態では、補償全床反力モーメントＭdmdを本発明における要求操作量として用いたが、例えば目標ＺＭＰの補正量等、前記位置偏差ΔＸや上体姿勢角偏差Δθを操作し得る他の種類の要求操作量を用いてもよい。

１…２足移動ロボット（移動体）、２…脚体（移動機構）、２４…上体（基体）、１００…歩容生成装置（上下方向慣性力パラメータ決定手段、目標運動決定手段）、１０４…複合コンプラインス動作決定部（動作制御手段）、１１０…補償全床反力モーメント分配器（分配手段）、１１２…姿勢安定化制御演算部（状態量偏差観測手段、要求操作量決定手段）、Ｓ０２２…規範パラメータ決定手段、Ｓ６０６…上下方向慣性力パラメータ決定手段、２００，２１０…移動体、２０２…車輪（移動機構）、２０６…基体。

Claims

基体と、基体を床面上で移動させる移動機構とを備えた移動体を、該基体の上下動運動を行いながら移動させるように制御する制御装置であって、
前記移動体又は前記基体の上下方向の目標慣性力の時系列を規定するパラメータである上下方向慣性力パラメータを決定する上下方向慣性力パラメータ決定手段と、
前記決定された上下方向慣性力パラメータにより規定される目標慣性力の時系列を満足するように、少なくとも上下方向慣性力パラメータを用いて前記移動体の目標運動の時系列を決定する目標運動決定手段と、
少なくとも前記決定された目標運動に応じて前記移動体の動作制御を行なう動作制御手段と、
前記決定された目標運動における基体の目標姿勢に対する該基体の実姿勢のずれの程度を表す状態量偏差を逐次観測する状態量偏差観測手段と、
前記状態量偏差を“０”に収束させるために前記移動体に付加的に作用させるべき付加的外力を規定する要求操作量を、該状態量偏差の観測値に応じてフィードバック制御則により逐次決定する要求操作量決定手段とを備え、
前記動作制御手段は、前記移動体の実際の運動を前記目標運動に追従させつつ、前記要求操作量により規定される付加的外力を前記移動体に付加的に作用させるように該移動体の動作制御を行なう手段であり、
前記要求操作量決定手段は、前記要求操作量を決定する各時刻において、将来の前記状態量偏差を“０”に収束させるために必要な前記フィードバック制御則のフィードバックゲインを、前記上下方向慣性力パラメータにより規定される目標慣性力の時系列のうちの現在時刻から将来の所定時刻までの期間内の時系列を用いて決定するフィードバックゲイン決定手段を含み、その決定したフィードバックゲインと前記状態量偏差の観測値とから前記フィードバック制御則の演算により前記要求操作量を決定することを特徴とする移動体の制御装置。
基体と、基体を床面上で移動させる移動機構とを備えた移動体を、該基体の上下動運動を行いながら移動させるように制御する制御装置であって、
前記移動体又は前記基体の上下方向の目標慣性力の時系列を規定するパラメータである上下方向慣性力パラメータを決定する上下方向慣性力パラメータ決定手段と、
少なくとも、前記移動体の動力学を表現するものとしてあらかじめ設定された動力学モデルと、前記決定された上下方向慣性力パラメータと、前記動力学モデル上での移動体に作用させる目標外力の時系列とを用いて前記移動体の目標運動のパターンを決定する目標運動決定手段と、
少なくとも前記決定された目標運動に応じて前記移動体の動作制御を行なう動作制御手段と、
前記決定された目標運動における基体の目標姿勢に対する該基体の実姿勢のずれの程度を表す状態量偏差を逐次観測する状態量偏差観測手段と、
前記状態量偏差を“０”に収束させるために前記移動体に付加的に作用させるべき付加的外力を規定する要求操作量を、該状態量偏差の観測値に応じてフィードバック制御則により逐次決定する要求操作量決定手段とを備え、
前記目標運動決定手段は、前記決定された要求操作量に応じて前記動力学モデル上で前記目標外力に付加すべきモデル操作外力を決定し、その決定したモデル操作外力を前記目標外力に付加してなる外力を前記動力学モデル上での移動体に作用させつつ、前記決定された上下方向慣性力パラメータにより規定される目標慣性力の時系列を前記動力学モデル上で満足するように前記目標運動を決定する手段であり、
前記要求操作量決定手段は、前記要求操作量を決定する各時刻において、将来の前記状態量偏差を“０”に収束させるために必要な前記フィードバック制御則のフィードバックゲインを、前記上下方向慣性力パラメータにより規定される目標慣性力の時系列のうちの現在時刻から将来の所定時刻までの期間内の時系列を用いて決定するフィードバックゲイン決定手段を含み、その決定したフィードバックゲインと前記状態量偏差の観測値とから前記フィードバック制御則の演算により前記要求操作量を決定することを特徴とする移動体の制御装置。
請求項２記載の移動体の制御装置において、
前記目標運動決定手段は、前記決定された要求操作量を、前記モデル操作外力と、前記移動体に実際に付加的に作用させるべき実移動体操作外力とに分配する分配手段を備え、
前記動作制御手段は、前記移動体の実際の運動を前記目標運動に追従させつつ、前記実移動体操作外力を前記移動体に付加的に作用させるように該移動体の動作制御を行なうことを特徴とする移動体の制御装置。
請求項１〜３のいずれか１項に記載の移動体の制御装置において、
前記目標運動決定手段は、前記移動体の目標運動の時系列の将来の収束目標として、同じパターンの運動を周期的に繰り返す仮想的な規範運動の時系列を規定する規範パラメータを少なくとも前記移動体の移動形態の要求に基づいて決定する規範パラメータ決定手段を含み、決定しようとする目標運動の時系列を該規範パラメータにより規定される仮想的な規範運動の時系列に収束させることをさらなる要件として、該目標運動の時系列を決定する手段であり、
前記フィードバックゲイン決定手段は、前記要求操作量を決定する各時刻において、前記フィードバック制御則のフィードバックゲインを、前記上下方向慣性力パラメータにより規定される目標慣性力の時系列のうちの現在時刻から将来の所定時刻までの期間内の時系列と、前記規範パラメータにより規定される規範運動の時系列に対応する前記移動体又は基体の慣性力の時系列のうち、前記規範運動の１周期の期間内の時系列とを用いて、前記フィードバック制御則のフィードバックゲインを決定することを特徴とする移動体の制御装置。
請求項１〜４のいずれか１項に記載の移動体の制御装置において、
前記フィードバック制御則は、比例・微分則であり、前記フィードバックゲイン決定手段が決定するフィードバックゲインは、前記状態量偏差の観測値に掛かる第１ゲイン係数と、該観測値の時間的変化率に掛かる第２ゲイン係数とから成ることを特徴とする移動体の制御装置。
請求項４記載の移動体の制御装置において、
前記フィードバック制御則は、比例・微分則であり、前記フィードバックゲイン決定手段が決定するフィードバックゲインは、前記状態量偏差の観測値に掛かる第１ゲイン係数と、該観測値の時間的変化率に掛かる第２ゲイン係数とから成り、
前記フィードバックゲイン決定手段は、前記要求操作量により規定される前記付加的外力と、前記状態量偏差と、前記移動体又は基体の上下方向の慣性力との間の動力学的関係を近似表現するようにあらかじめ設定され、且つ、前記状態量偏差及びその時間的変化率を状態変数として有すると共に前記移動体又は基体の上下方向の慣性力に依存する状態遷移行列を有する状態方程式に基づいて構築された演算処理によって、前記第１ゲイン係数と第２ゲイン係数とを決定する手段であり、
前記演算処理は、該演算処理によって決定される前記第１ゲイン係数及び第２ゲイン係数と現在時刻での前記状態量偏差の観測値及びその時間的変化率とから前記比例・微分則により算出される前記要求操作量により規定される付加的外力を現在時刻で前記移動体に作用させ、且つ、その後の付加的外力を前記所定時刻まで“０”に維持したと仮定した場合において、現在時刻の状態量偏差の観測値及びその時間的変化率と、該現在時刻から前記所定時刻までの期間内における前記目標慣性力の時系列と、前記規範運動の１周期の期間内における前記移動体又は基体の慣性力の時系列とから前記状態方程式に基づいて算出される前記所定時刻での前記状態量偏差及びその時間的変化率の所定の線形結合値を“０”に収束させるように構築されていることを特徴とする移動体の制御装置。