WO2005077610A1

WO2005077610A1 - 移動ロボットの歩容生成装置

Info

Publication number: WO2005077610A1
Application number: PCT/JP2005/002353
Authority: WO
Inventors: Toru Takenaka; Takashi Matsumoto; Takahide Yoshiike
Original assignee: Honda Motor Co., Ltd.
Priority date: 2004-02-16
Filing date: 2005-02-16
Publication date: 2005-08-25
Also published as: EP1738878A4; JP4800038B2; KR20070003848A; US20070168080A1; EP1733852B1; US7319302B2; KR101131774B1; EP1738878A1; JPWO2005077610A1; US20080147237A1; JP4800039B2; KR101140810B1; JPWO2005077611A1; EP1738878B1; KR20060126759A; WO2005077611A1; US7765030B2; EP1733852A1; EP1733852A4

Abstract

　移動ロボット１の生成しようとする歩容を規定する歩容パラメータを決定するとき、歩容パラメータの優先パラメータの値を所定のベース歩容パラメータの優先歩容パラメータの値から、本来の要求値に一致するまで段階的に該要求値に近づけるように更新する。その更新の都度、優先パラメータ以外の非優先パラメータのうちの探索対象パラメータをロボット１の動力学モデル上で歩容の境界条件を満足し得るように探索的に決定し、その決定した探索対象パラメータと更新後の優先パラメータとを含む歩容パラメータを新たに決定する。最終的に優先パラメータを要求値に一致させるときに新たに決定した歩容パラメータと動力学モデルとを用いて移動ロボット１の歩容を生成する。

Description

移動ロボットの歩容生成装置

技術分野

[0001] 本発明は 2足移動ロボット等の移動ロボットの歩容を生成する装置に関する。

背景技術

[0002] 2足移動ロボット等の移動ロボットの目標歩容を生成する技術としては、例えば特開 2002— 326173号公報（特許文献 1)や、 PCT国際公開公報 WOZ03Z057427 ZA1 (特許文献 2)に見られるものが本願出願人により提案されている。これらの文献に見られる技術は、ロボットの運動（各部位の位置、姿勢）と、床反力との関係を表す第 1の動力学モデル (単純ィ匕モデル)を用、て該第 1の動力学モデル上での動力学的平衡条件 (床反力の並進力成分が目標値になる、ある点のまわりの床反力モーメントが目標値になるなどの条件)を満足するようにロボットの目標運動の瞬時値 (瞬時目標運動）と目標床反力の瞬時値 (瞬時目標床反力）とからなる瞬時目標歩容が逐次作成される。そして、この瞬時目標歩容を第 2の動力学モデル (フルモデル）に入力して、該瞬時目標運動の一部（目標上体位置姿勢や目標 ZMPまわりの目標モ一メントなど)を補正することで、最終的な瞬時目標歩容を時系列的に生成するようにしている。なお、文献 1, 2に見られる技術では、目標歩容は、 2足移動ロボットの 1歩の期間分の歩容を単位として、 1歩毎に生成される。この場合、ロボットの 1歩毎の目標歩容の瞬時値を生成するにあたっては、まず、その目標歩容に続く仮想的な周期的歩容である定常歩容を規定する歩容パラメータ (各足平の位置姿勢軌道を規定するパラメータ、目標 ZMP軌道を規定するパラメータなど力も構成されるもの）が、その歩容パラメータと前記第 1の動力学モデルとを用いて所要の境界条件 (定常歩容の 1 周期の始端と終端とで該歩容の状態が一致するという条件)を満たすように決定される。さらに、目標歩容を規定する歩容パラメータが、その歩容パラメータと前記第 1の動力学モデルとを用いて生成される歩容が所要の境界条件（目標歩容がその終端側で定常歩容に近づくという条件）を満たすように決定される。そして、このように決定された目標歩容の歩容パラメータと第 1の動力学モデルとを用いて該目標歩容の瞬時値の時系列が生成される。

[0003] 上記のように目標歩容を生成する技術では、第 1の動力学モデル (単純ィ匕モデル）としては、線形性の高いモデルが一般に使用される。線形性の高い動力学モデルを用いて瞬時目標歩容を作成することで、仮想的な周期的歩容である定常歩容につながり、もしくは漸近するような歩容（ロボットの安定な運動を継続的に行い得る歩容）を効率よく短時間で作成することが可能となり、ひいては実ロボットの実際の運動を行いながら、リアルタイムでロボットの瞬時目標歩容を逐次生成することが可能となる。また、定常歩容の歩容パラメータを決定する場合にも、該定常歩容の境界条件を満足し得る歩容パラメータを効率よく短時間で決定することが可能となる。

[0004] ところが、線形性の高い動力学モデルは、ロボットの種々様々の動作において一般に動力学的精度が比較的低くなりがちである。すなわち、その動力学モデル上でのロボットの動力学は、実ロボットの実際の動力学に対して誤差を生じやすい。このため、第 1の動力学モデルを用いて作成される瞬時目標歩容を、そのまま実ロボットに適用して、該実ロボットの動作を行わせると、第 1の動力学モデル上で保証された動力学的平衡条件が、実ロボット上では成立せず、実ロボットの動作が安定性に欠けるものとなりやすい。

[0005] そこで、前記特許文献 1、 2に見られる技術では、第 1の動力学モデルを用いて作成した瞬時目標歩容の一部をさらに、第 2の動力学モデルを用いて補正するようにしている。この場合、第 2の動力学モデルとしては、第 1の動力学モデルよりも動力学的精度の高いモデルが用いられる。これにより、第 1の動力学モデルを用いて作成した歩容よりも、より動力学的精度の高い (実ロボットの動力学により近い)歩容を生成することが可能となる。

[0006] しかし、前記特許文献 1, 2に見られる技術では、第 2動力学モデルを用いて作成される歩容は発散しやすいため、目標 ZMP軌道を修正する力もしくは目標 ZMPまわりに床反力モーメントを発生させるようにして、ロボットの目標運動軌道が第 1の動力学モデルで作成された歩容力かけはなれないようにする必要があった。そして、この場合、目標 ZMP軌道の修正量や、目標 ZMPまわりの床反力モーメントが比較的大きくなることがあり、このような場合には、安定余裕を高く保つことが困難となる場合あつた。逆に、安定余裕を高く保っために、目標 ZMP軌道の修正量や、目標 ZMPまわりの床反力モーメントの許容範囲を狭く設定すると、歩容が発散する恐れが高まるという不具合があった。

[0007] また、定常歩容の歩容パラメータを決定する場合にあっても、第 1の動力学モデルの動力学的精度を高くすると、該第 1の動力学モデルの線形性が低下して、定常歩容の境界条件を満たし得る定常歩容パラメータを効率よく短時間で見出すことが困難となることから、前記第 2の動力学モデルでの歩容の発散が生じ難い適切な定常歩容パラメータを決定することが困難であった。ひいては、前記した如ぐ安定余裕を高く保つことが困難となったり、第 2の動力学モデルで生成される歩容の発散が生じやすくなるという不都合があった。

[0008] 本発明は力かる背景に鑑みてなされたものであり、目標歩容の発散を防止しつつ、所要の境界条件を満足し得る目標歩容を効率よく生成することができる移動ロボットの歩容生成装置を提供することを目的とする。また、本発明は、定常歩容を規定する歩容パラメータを決定する場合に、定常歩容が所要の境界条件を満足し得る定常歩容パラメータを効率よく決定し、ひ、ては目標歩容の発散を防止することができる移動ロボットの歩容生成装置を提供することを目的とする。

発明の開示

[0009] かかる目的を達成するために、本発明の移動ロボットの歩容生成装置の第 1発明は所定の期間における移動ロボットの歩容を規定する複数のパラメータの組である歩容パラメータを決定し、その決定した歩容パラメータと前記移動ロボットの動力学モデルとを用いて前記所定の期間における移動ロボットの目標歩容を生成する歩容生成装置において、

前記目標歩容に関する要求が与えられ、前記歩容パラメータのうちの所定のパラメータを優先パラメータとし、該優先パラメータ以外のパラメータを非優先パラメータとしたとき、前記要求を満足するための前記優先パラメータの値である優先パラメータ要求値を決定する優先パラメータ要求値決定手段と、

前記移動ロボットのあらかじめ用意された基準歩容を規定する歩容パラメータと、所定の境界条件を満たすように過去に決定された歩容パラメータとのうちの、ずれかの歩容パラメータをベース歩容パラメータとして設定するベース歩容パラメータ設定手段と、

前記ベース歩容パラメータの優先パラメータの値を、該値が前記優先パラメータ要求値に一致するまで段階的に前記優先パラメータ要求値に漸近させるように更新する優先パラメータ漸近手段と、

該優先パラメータ漸近手段による優先パラメータの値の更新の都度、その更新後の値の優先パラメータを有し、且つ前記所定の境界条件を満足する歩容を前記動力学モデルを用いて生成し得る歩容パラメータである新規歩容パラメータを探索的に決定する新規歩容パラメータ決定手段とを備えると共に、

前記新規歩容パラメータ決定手段は、前記新規歩容パラメータを新たに決定するときの前記優先パラメータ漸近手段による優先パラメータの値の更新回数を n (n:n≥l を満たす整数）とし、その第 n回目の更新処理によって得られた優先パラメータの値を第 n優先パラメータ更新値とし、当該新たに決定する新規歩容パラメータを第 n新規歩容パラメータとし、前記ベース歩容パラメータを第 0新規歩容パラメータとしたとき、非優先パラメータの値に第 n— 1新規歩容パラメータの非優先パラメータの値を設定し、且つ、優先パラメータの値を第 n優先パラメータ更新値に設定してなる歩容パラメータを初期探索候補歩容パラメータとして、この初期探索候補歩容パラメータの非優先パラメータのうちの所定のパラメータである探索対象パラメータの値を前記所定の境界条件を満たすように探索することにより第 n新規歩容パラメータを決定する手段であり、

前記優先パラメータ漸近手段による優先パラメータの値の最後の更新時に決定された新規歩容パラメータを前記目標歩容を規定する歩容パラメータとして、該新規歩容パラメータと前記動力学モデルとを用いて該目標歩容を生成するようにしたことを特徴とするものである。

なお、この第 1発明を含めて本願発明においては、目標歩容は、ロボットの運動 (各部位の位置 ·姿勢、あるいは各関節の変位量)の目標瞬時値の時系列から構成され、あるいは、該運動の目標瞬時値の時系列とロボットに作用する床反力（並進力、モーメント、作用点の少なくともひとつ）の目標瞬時値の時系列とから構成される。また、ロボットの動力学モデルは、少なくともロボットの運動とロボットに作用する床反力との関係を表す運動'床反力モデル (ロボットの動力学方程式)を含むモデルである。この動力学モデルには、ロボットの運動に関する制約条件（ロボットのある部位の可動範囲や、リンク機構の幾何学的な拘束条件など)あるいは床反力に関する制約条件（床反力の所定成分の許容範囲、あるいは該床反力の作用点の存在許容範囲など）が付加されていてもよぐその場合、それらの制約条件と上記運動 ·床反力モデルとを合わせたものが動力学モデルである。また、歩容パラメータと動力学モデルとを用いて歩容を生成するということは、歩容パラメータを基に、動力学モデルに対する入力量あるいは動力学モデルの状態量を決定して、該動力学モデル上の動力学 (運動 ·床反力モデルの関係、あるいはその関係と付加された制約条件)を満たす歩容を生成することを意味する。

[0011] 前記第 1発明によれば、前記優先パラメータ漸近手段による優先パラメータの値の更新の都度、前記新規歩容パラメータ決定手段により新たに決定される前記新規歩容パラメータの優先パラメータの値は、優先パラメータ漸近手段による更新後の優先ノラメータの値に一致する。従って、該新規歩容パラメータの優先パラメータの値は、前記ベース歩容パラメータ（=第 0新規歩容パラメータ)力段階的に優先パラメータ要求値、すなわち前記目標歩容に関する要求を満足するための優先パラメータの値に近づ!/、て、き、最終的に該優先パラメータ要求値に一致するように更新されることとなる。

[0012] また、優先パラメータの値の任意の第 n回目の更新時に決定される第 n新規歩容パラメータは、非優先パラメータの値に第 n— 1新規歩容パラメータの非優先パラメータの値を設定し、且つ、優先パラメータの値を第 n回目の更新後の値 (第 n優先パラメ一タ更新値）に設定してなる歩容パラメータ (優先歩容パラメータ以外のパラメータが第 n— 1新規歩容パラメータと同一になる歩容パラメータ)を初期探索候補歩容パラメ一タとして、この初期探索候補歩容パラメータの非優先パラメータのうちの所定のパラメータである探索対象パラメータの値を前記所定の境界条件を満たすように探索することにより決定される。該該境界条件は、例えば前記所定の期間の一端 (始端または終端の時刻）における歩容（瞬時値)の所定の状態量 (例えばロボットのある部位の位置、姿勢、もしくはその変化速度、あるいは、床反力）が所定の値に一致またはほぼ一致するというような条件である。

[0013] この場合、初期探索候補歩容パラメータは、その探索パラメータ以外のパラメータ力これから決定しょうとする第 n新規歩容パラメータと同一である。そして、該初期探索候補歩容パラメータと先に決定された第 n— 1新規歩容パラメータとは、それらの優先パラメータの値の差を十分に小さくできるので、新たに決定しょうとする第 n新規歩容パラメータの、前記所定の境界条件を満たし得るような適正な探索対象パラメータの値は、第 n-1新規歩容パラメータの探索対象パラメータの値力も大きくかけ離れたものとなることはない。このため、前記境界条件を満たし得るような第 n新規歩容パラメータの探索対象パラメータを容易に短時間で探索することができる。

[0014] そして、優先パラメータの値の最後の更新時、すなわち、優先パラメータの値を最終的に前記優先パラメータ要求値に一致させたときに決定された新規歩容パラメ一タと前記動力学モデルとを用いて前記目標歩容が生成される。

[0015] 従って、第 1発明によれば、生成しょうとする前記目標歩容を規定する歩容パラメ一タは、その優先パラメータの値を前記ベース歩容パラメータの優先パラメータの値から徐々に (段階的に）、本来の要求値である優先パラメータ要求値に近づけつつ、優先パラメータでない探索対象パラメータの値を探索的に調整していくことで、最終的に前記境界条件を満足し得るように決定されることとなる。換言すれば、ベース歩容パラメータを起点として、それを、前記目標歩容に関する要求と境界条件とを徐々に満たして!/、くように変化させて、くことで該目標歩容を規定する歩容パラメータが決定されることとなる。この場合、ベース歩容パラメータは、あらカゝじめ用意された基準歩容を規定する歩容パラメータと、所定の境界条件を満たすように過去に決定された歩容パラメータとのうちのいずれかであるので、それと、動力学モデルとを用いて歩容を生成したときにその歩容の発散などの不都合を生じないか、もしくは生じ難い歩容パレメータ (歩容パラメータとして適切なもの）である。このため、第 1発明で、目標歩容を規定するものとして最終的に決定される歩容パラメータは、それと動力学モデルとを用いて生成される歩容が発散を生じな、か、もしくは発散が生じ難、ものとすることが可能となる。また、前記したように、優先パラメータの各回の更新時に、適正な新規歩容パラメータの探索対象パラメータは容易に短時間で探索できるので、結果的に、前記目標歩容を規定する最終的な歩容パラメータを効率よく決定できることとなる。

[0016] よって、第 1発明によれば、定常歩容が所要の境界条件を満足し得る定常歩容パラメータを効率よく決定し、ひ、ては目標歩容の発散を防止することができる目標歩容の発散を防止しつつ、所要の境界条件を満足し得る目標歩容を効率よく生成することができる。また、発散しない、あるいは発散し難い目標歩容を生成できることから、発散を防止するために目標歩容のうちの目標 ZMPや目標床反力モーメントなどを大きく修正したりする必要がなくなり、移動ロボットの安定余裕を高めることができる。

[0017] また、本発明の移動ロボットの歩容生成装置の第 2発明は、前記の目的を達成するために、

所定の期間における移動ロボットの目標歩容を生成するとき、該目標歩容に続く仮想的な周期的歩容である定常歩容を規定する複数のパラメータの組である定常歩容ノメータを決定すると共に、その決定した定常歩容パラメータと前記移動ロボットの動力学モデルとを用いて生成される定常歩容に前記目標歩容を近づけるように該目標歩容を生成する移動ロボットの歩容生成装置において、

前記目標歩容に対応する定常歩容に関する要求が入力され、前記定常歩容パラメータのうちの所定のパラメータを優先パラメータとし、該優先パラメータ以外のパラメ一タを非優先パラメータとしたとき、前記要求を満足するための該優先パラメータの値である優先パラメータ要求値を決定する優先パラメータ要求値決定手段と、前記移動ロボットのあらかじめ用意された基準定常歩容を規定する定常歩容パラメータと、所定の境界条件を満たすように過去に決定された定常歩容パラメータとのうちのいずれかの定常歩容パラメータをベース定常歩容パラメータとして設定するべ一ス定常歩容パラメータ設定手段と、

前記ベース定常歩容パラメータの優先パラメータの値を、該値が前記優先パラメ一タ要求値に一致するまで段階的に前記優先パラメータ要求値に漸近させるように更新する優先パラメータ漸近手段と、該優先パラメータ漸近手段のよる優先パラメータの値の更新の都度、その更新後の値の優先パラメータを有し、且つ前記所定の境界条件を満たす歩容を前記動力学モデルを用いて生成し得る定常歩容パラメータである新規定常歩容パラメータを探索的に決定する新規定常歩容パラメータ探索手段とを備えると共に、

前記新規定常歩容パラメータ探索手段は、前記新規定常歩容パラメータを新たに決定するときの前記優先パラメータ漸近手段による優先パラメータの値の更新回数を n (n : n≥ 1を満たす整数)とし、その第 n回目の更新後の優先パラメータの値を第 n優先パラメータ更新値とし、当該新たに決定する新規定常歩容パラメータを第 n新規定常歩容パラメータとし、前記ベース定常歩容パラメータを第 0新規定常歩容パラメ一タとしたとき、非優先パラメータの値に第 n— 1新規定常歩容パラメータの非優先パラメ一タの値を設定し、且つ、優先パラメータの値に第 n優先パラメータ更新値を設定してなる歩容パラメータを初期探索候補歩容パラメータとして、この初期探索候補歩容ノラメータの非優先パラメータのうちの所定のパラメータである探索対象パラメータの値を前記所定の境界条件を満たすように探索することにより第 n新規定常歩容パラメータを決定する手段であり、

前記優先パラメータ漸近手段による優先パラメータの値の最後の更新時に決定された新規定常歩容パラメータを前記目標歩容に対応する定常歩容の定常歩容パラメータとして、該定常歩容パラメータと前記動力学モデルとを用いて生成される定常歩容に近づけるように前記目標歩容を生成するようにしたことを特徴とするものであるこの第 2発明によれば、前記優先パラメータ漸近手段による優先パラメータの値の更新の都度、前記新規定常歩容パラメータ決定手段により新たに決定される前記新規定常歩容パラメータの優先パラメータの値は、優先パラメータ漸近手段による更新後の優先パラメータの値に一致する。従って、該新規定常歩容パラメータの優先パラメータの値は、前記ベース定常歩容パラメータ（ =第 0新規定常歩容パラメータ)から段階的に優先パラメータ要求値、すなわち前記定常歩容に関する要求を満足するための優先パラメータの値に近づいていき、最終的に該優先パラメータ要求値に一致するよう〖こ更新されることとなる。 [0019] また、優先パラメータの値の任意の第 n回目の更新時に決定される第 n新規定常歩容パラメータは、非優先パラメータの値に第 n— 1新規定常歩容パラメータの非優先パラメータの値を設定し、且つ、優先パラメータの値を第 n回目の更新後の値 (第 n優先ノラメータ更新値）に設定してなる歩容パラメータ (優先歩容パラメータ以外のノラメ一タが第 n— 1新規定常歩容パラメータと同一になる歩容パラメータ)を初期探索候補歩容パラメータとして、この初期探索候補歩容パラメータの非優先パラメータのうちの所定のパラメータである探索対象パラメータの値を前記所定の境界条件を満たすように探索することにより決定される。該境界条件は、例えば定常歩容の 1周期の期間の両端 (該期間の始端および終端）における該歩容の所定の状態量 (ロボットのある部位の位置、姿勢、もしくはその変化速度、あるいは、床反力）が互いに一致するというような条件である。

[0020] この場合、初期探索候補歩容パラメータは、その探索パラメータ以外のパラメータ力これから決定しょうとする第 n新規定常歩容パラメータと同一である。そして、該初期探索候補歩容パラメータと先に決定された第 n— 1新規定常歩容パラメータとは、それらの優先パラメータの値の差を十分に小さくできるので、新たに決定しょうとする第 n新規定常歩容パラメータの、前記所定の境界条件を満たし得るような適正な探索対象パラメータの値は、第 n— 1新規定常歩容パラメータの探索対象パラメータの値から大きくかけ離れたものとなることはない。このため、前記境界条件を満たし得るような第 n新規定常歩容パラメータの探索対象パラメータを容易に短時間で探索することができる。

[0021] 従って、第 2発明によれば、生成しょうとする前記目標歩容に対応する定常歩容を規定する定常歩容パラメータは、その優先パラメータの値を前記ベース歩容パラメ一タの優先パラメータの値力徐々に（段階的に）、本来の要求値である優先パラメータ要求値に近づけつつ、優先パラメータでない探索対象パラメータの値を探索的に調整していくことで、最終的に前記境界条件を満足し得るように決定されることとなる。換言すれば、ベース歩容パラメータを起点として、それを、前記定常歩容に関する要求と境界条件とを徐々に満たして!/、くように変化させて!/、くことで該定常歩容を規定する定常歩容パラメータが決定されることとなる。この場合、ベース歩容パラメータは、あらかじめ用意された基準定常歩容を規定する歩容パラメータと、所定の境界条件を満たすように過去に決定された定常歩容パラメータとのうちのいずれかであるので、それと、動力学モデルとを用いて定常歩容を生成したときに前記境界条件を満足し得るような適切な歩容パラメータである。このため、第 2発明で、前記目標歩容に対応する定常歩容を規定するものとして最終的に決定される定常歩容パラメータは、それと動力学モデルとを用いて生成される定常歩容が、前記境界条件を適切に満足し得るものとすることが可能となる。また、前記したように、優先パラメータの各回の更新時に、適正な新規定常歩容パラメータの探索対象パラメータは容易に短時間で探索できるので、結果的に、前記目標歩容に対応する定常歩容を規定する最終的な定常歩容パラメータを効率よく決定できることとなる。

[0022] そして、第 2発明では、優先パラメータの値の最後の更新時、すなわち、優先パラメ一タの値を最終的に前記優先パラメータ要求値に一致させたときに決定された新規定常歩容パラメータと前記動力学モデルとを用、て生成される定常歩容に近づけるように前記目標歩容が生成されるので、該目標歩容は、第 n動力学モデル上でロボットの継続的な安定性を適切に高め得る歩容となり、該目標歩容の発散を防止することができる。また、発散しない、あるいはし難い目標歩容を生成できることから、発散を防止するために目標歩容のうちの目標 ZMPや目標床反力モーメントなどを大きく修正したりする必要がなくなり、移動ロボットの安定余裕を高めることができる。

[0023] なお、第 1発明と第 2発明とは複合させてもよい。すなわち、第 1発明において、所定の期間における目標歩容を第 2発明における定常歩容に近づけるように生成し、このとき、その定常歩容を規定する定常歩容パラメータを第 2発明の如く決定する。この場合、第 1発明における動力学モデルと第 2発明における動力学モデルとは同じでよ、ことはもちろんであるが、異なるものでもよ!/、。

[0024] 前記第 1発明では、前記優先パラメータ漸近手段による優先パラメータの値の総更新回数は、前記ベース歩容パラメータの優先パラメータの値と、前記優先パラメータ要求値との差に応じて設定されることが好ま U、 (第 3発明）。

[0025] 同様に、前記第 2発明では、前記優先パラメータ漸近手段による優先パラメータの値の総更新回数は、前記ベース定常歩容パラメータの優先パラメータの値と、前記優先パラメータ要求値との差に応じて設定されることが好ま、 (第 4発明)。

[0026] これらの第 3発明または第 4発明によれば、優先パラメータの値の各更新時における更新量が過大あるいは過小にならないような適切な更新量にして、各第 n新規歩容ノメータまたは各第 n新規定常歩容パラメータの探索対象パラメータの探索処理を効率よく行なうことができる。

[0027] また、前記第 1発明では、前記歩容パラメータは、前記目標歩容のうちの目標 ZMP 軌道を規定するパラメータを前記探索対象パラメータとして含むことが好まし、 (第 5 発明)。

[0028] この第 5発明によれば、目標 ZMP軌道をロボットの安定余裕を確保するために好適な軌道から大きく修正しないようにしつつ、前記境界条件を満足し得る目標歩容を生成することが可能となる。

[0029] また、前記第 2発明では、前記定常歩容パラメータは、前記定常歩容の 1周期の期間の一端における移動ロボットの運動の所定の状態量を規定するパラメータを前記探索対象パラメータとして含むことが好まし、（第 6発明）。

[0030] この第 6発明によれば、定常歩容の境界条件が満たされる定常歩容パラメータを、定常歩容の 1周期の期間の一端における移動ロボットの運動の所定の状態量を調整することで決定することとなるので、安定余裕の高!ヽ定常歩容を規定する定常歩容パラメータを決定できる。なお、定常歩容は、周期的な歩容であるので、その 1周期の一端におけるロボットの運動の所定の状態量を調整することは、 1周期の他端におけるロボットの運動の所定の状態量を調整することを意味する。

[0031] また、前記第 1発明では、前記所定の境界条件は、前記所定の期間における歩容の境界における移動ロボットの運動の所定の状態量が前記境界において隣接する歩容における移動ロボットの運動の該所定の状態量と一致するという条件を含む (第 7発明)。

[0032] すなわち、目標歩容は、連続している必要があるので、前記所定の期間における目標歩容を生成するとき、該所定の期間における歩容の境界 (該所定の期間の始端または終端における歩容)で、移動ロボットの歩容の運動の所定の状態量 (例えばある移動ロボットのある部位の位置、姿勢、もしくはその変化速度）が該歩容に隣接する歩容における当該運動の所定の状態量と一致することが望ましい。

[0033] また、第 1発明において、前記所定の期間における目標歩容に続く仮想的な周期的歩容である定常歩容 (あるいはこれを規定する定常歩容パラメータ）を決定した上で、この目標歩容に近づけるように目標歩容を生成する場合には、前記所定の境界条件は、前記所定の期間における歩容の終端側の境界における移動ロボットの運動の所定の状態量が該歩容に続くべき仮想的な周期的歩容として決定された定常歩容における移動ロボットの運動の該所定の状態量と一致するという条件を含むことが好ましい (第 8発明)。

[0034] このように前記目標歩容に対応する境界条件を定めることで、目標歩容の終端側（前記所定の期間の終端側)で定常歩容に近づけるような目標歩容を生成し得る歩容ノメータを効率よく生成できる。なお、第 8発明において、定常歩容は、必ずしもそれを規定する定常歩容パラメータを第 2発明の如く段階的に決定する必要はないが、第 2発明の如く決定するようにしてもよい。

[0035] また、第 2発明においては、前記所定の境界条件は、前記定常歩容の 1周期の始端と終端における移動ロボットの運動の所定の状態量が一致するという条件を含むことが好ましい (第 9発明)。

[0036] 定常歩容は、周期的な歩容であるので、上記のように境界条件を定めることで、周期性の条件を満たす定常歩容を生成し得る定常歩容パラメータを適切に決定できる。なお、この第 9発明における定常歩容の 1周期の始端は必ずしも、前記目標歩容の終端と一致する必要はない。

[0037] 前記第 6—第 9発明では、特に、前記移動ロボットが、上体から延設された複数の脚体を備えた脚式移動ロボットである場合には、前記所定の状態量は、該ロボットの上体の位置、該上体の速度、該上体の姿勢角、該上体の姿勢角の角速度、該上体の位置と速度との重み付き平均値、該ロボットの全体重心の位置、該全体重心の速度、該全体重心の位置と速度との重み付き平均値、および発散成分のうちの少なくと ¾ 、ずれか一つを含むことが好ま、 (第 10発明）。

[0038] これによれば、第 6発明にあっては、前記探索対象パラメータを少なくしつつ、定常歩容の境界条件を満たすような定常歩容パラメータを効率よく決定できる。また、特に第 8発明にあっては、前記所定の期間における目標歩容を定常歩容に近づけるための歩容パラメータを、探索対象パラメータを少なくしつつ効率よく決定できる。なお、第 8発明では、特に、前記所定の状態量としては、上体の上体の位置と速度との重み付き平均値、あるいは全体重心の位置と速度との重み付き平均値、あるいは発散成分が好適である。

発明を実施するための最良の形態

[0039] 以下、添付図面を参照して本発明の実施形態を説明する。尚、本明細書の実施形態では、移動ロボットとしては脚式移動ロボットとしての 2足移動ロボットを例にとる。

[0040] 図 1は、本発明の実施形態を適用する 2足移動ロボットの全体的構成の概略を示す概略図である。

[0041] 図示の如ぐ 2足移動ロボット（以下、ロボットという） 1は上体 (ロボット 1の基体） 3から下方に延設された左右一対の脚体 (脚部リンク） 2, 2を備える。両脚体 2, 2は同一構造であり、それぞれ 6個の関節を備える。その 6個の関節は上体 3側力順に、股 (腰部）の回旋（回転)用（上体 3に対するョー方向の回転用）の関節 10R, 10Lと、股 (腰部）のロール方向（X軸まわり）の回転用の関節 12R, 12Lと、股 (腰部）のピッチ方向 (Y軸まわり）の回転用の関節 14R, 14L、膝部のピッチ方向の回転用の関節 16R, 1 6Lと、足首のピッチ方向の回転用の関節 18R, 18Lと、足首のロール方向の回転用の関節 20R, 20Lとから構成される。なお、本明細書において、符号 R, Lはそれぞれロボット 1の右側、左側に対応するものであることを意味する符号である。

[0042] 各脚体 2の足首の 2つの関節 18R (L) , 20R(L)の下部には、各脚体 2の先端部を構成する足平 (足部） 22R (L)が取着されると共に、両脚体 2, 2の最上位には、各脚体 2の股の 3つの関節 10R(L) , 12R (L) , 14R(L)を介して前記上体 3が取り付けられている。上体 3の内部には、詳細を後述する制御ユニット 60などが格納される。なお、図 1では図示の便宜上、制御ユニット 60を上体 3の外部に記載している。

[0043] 上記構成の各脚体 2においては、股関節（あるいは腰関節）は関節 10R (L) , 12R

(L) , 14R(L)から構成され、膝関節は関節 16R(L)から構成され、足首関節は関節 18R(L) , 20R(L)から構成される。また股関節と膝関節とは大腿リンク 24R(L)で連結され、膝関節と足首関節とは下腿リンク 26R (L)で連結される。 [0044] 上体 3の上部の両側部には左右一対の腕体 5, 5が取り付けられると共に、上体 3の上端部には頭部 4が配置される。各腕体 5は、 3つの関節 30R(L) , 32R (L) , 34R( L)から構成された肩関節と、関節 36R (L)から構成された肘関節と、関節 38R(L)から構成された手首関節と、この手首関節に連結された手先部 40R (L)とを備えている。肩関節と肘関節との間、および肘関節と手首関節との間はそれぞれ剛体状のリンクで構成されている。

[0045] 上記のロボット 1の構成により、各脚体 2の足平 22R(L)は、上体 3に対して 6つの自由度を与えられている。そして、ロボット 1の歩行等の移動中に、両脚体 2, 2を合わせて 6 * 2 = 12個（この明細書で「 *」はスカラに対する演算としては乗算を、ベクトルに対する演算としては外積を示す)の関節を適宜な角度で駆動することで、両足平 22 R, 22Lの所望の運動を行うことができる。これにより、ロボット 1は任意に 3次元空間を移動することができる。また、各腕体 5は、その肩関節、肘関節、手首関節の回転によって、腕振り等の運動を行うことができる。

[0046] 図 1に示す如ぐ各脚体 2の足首関節 18R (L) , 20R(L)の下方には足平 22R (L) との間に公知の 6軸力センサ 50が介装されている。該 6軸力センサ 50は、各脚体 2 の足平 22R(L)の着地の有無、および各脚体 2に作用する床反力（接地荷重)等を検出するためのものであり、該床反力の並進力の 3方向成分 Fx, Fy, Fz並びにモーメントの 3方向成分 Mx, My, Mzの検出信号を制御ユニット 60に出力する。また、上体 3には、 Z軸 (鉛直方向（重力方向））に対する上体 3の傾斜角（姿勢角）およびその角速度を検出するための姿勢センサ 54が備えられ、その検出信号が該姿勢センサ 5 4から制御ユニット 60に出力される。この姿勢センサ 54は、図示を省略する加速度センサおよびジャイロセンサを備え、これらのセンサの検出信号が上体 3の傾斜角およびその角速度を検出するために用いられる。また、詳細構造の図示は省略するが、ロボット 1の各関節には、それを駆動するための電動モータ 64 (図 3参照）と、その電動モータ 64の回転量 (各関節の回転角）を検出するためのエンコーダ (ロータリエンコーダ） 65 (図 3参照）とが設けられ、該エンコーダ 65の検出信号が該エンコーダ 65 力制御ユニット 60に出力される。

[0047] さらに、図 1では図示を省略する力ロボット 1の外部には、ロボット 1を操縦するためのジョイスティック (操作器） 73 (図 3参照）が設けられ、そのジョイスティック 73を操作することで、直進移動しているロボット 1を旋回させるなどロボット 1の移動方向を指定する、ロボット 1の歩行、走行などの運動形態および床面の摩擦状態 (路面状態)を指定するなど、ロボット 1の歩容に対する要求もしくは制約条件を必要に応じて制御ユニット 60に入力できるように構成されている。ジョイスティック 73は有線もしくは無線により制御ユニット 60との通信が可能とされている。

[0048] 図 2は本実施形態における各脚体 2の先端部分 (各足平 22R(L)を含む)の基本構成を概略的に示す図である。同図に示すように、各足平 22R(L)の上方には、前記 6 軸力センサ 50との間にばね機構 70が装備されると共に、足底 (各足平 22R, Lの底面）にはゴムなど力もなる足底弾性体 71が貼られている。これらのばね機構 70及び足底弾性体 71によりコンプライアンス機構 72が構成されている。詳細な図示は省略するが、ばね機構 70は、足平 22R(L)の上面部に取り付けられた方形状のガイド部材（図示省略)と、足首関節 18R(L) (図 2では足首関節 20R(L)を省略している）および 6軸力センサ 50側に取り付けられ、前記ガイド部材に弹性材 (ゴムやばね）を介して微動自在に収納されるピストン状部材（図示省略）とから構成されている。

[0049] 図 2に実線で表示された足平 22R(L)は、床反力を受けていないときの状態を示している。各脚体 2が床反力を受けると、コンプライアンス機構 72のばね機構 70と足底弾性体 71とがたわみ、足平 22R (L)は図中に点線で例示したような位置姿勢に移る。このコンプラインァス機構 72の構造は、着地衝撃を緩和するためだけでなぐ制御性を高めるためにも重要なものである。その詳細は、例えば本出願人が先に提案した特開平 5— 305584号公報に詳細に説明されているので、本明細書でのさらなる説明は省略する。

[0050] 図 3は制御ユニット 60の構成を示すブロック図である。該制御ユニット 60はマイクロコンピュータにより構成されており、 CPU力もなる第 1の演算装置 90及び第 2の演算装置 92、 AZD変^^ 80、カウンタ 86、 DZA変^^ 96、 RAM84、 ROM94、並びにこれらの間のデータ授受を行うバスライン 82を備えている。この制御ユニット 60 では、各脚体 2の 6軸力センサ 50、姿勢センサ 54 (加速度センサおよびレートジャィ口センサ）、ジョイスティック 73等の出力信号は AZD変翻80でデジタル値に変換された後、バスライン 82を介して RAM84に送られる。またロボット 1の各関節のェンコーダ 65 (ロータリーエンコーダ）の出力は、カウンタ 86を介して RAM84に入力される。

[0051] 前記第 1の演算装置 90は後述の如く目標歩容を生成すると共に、関節角変位指令 (各関節の変位角もしくは各電動モータ 64の回転角の指令値)を算出し、 RAM8 4に送出する。また、第 2の演算装置 92は RAM84から関節角変位指令と、前記ェンコーダ 65の出力信号に基づいて検出された関節角の実測値とを読み出し、各関節の駆動に必要な操作量を算出して、その操作量を DZA変換器 96とサーボアンプ 6 4aとを介して各関節を駆動する電動モータ 64に出力する。

[0052] 図 4は、本明細書の実施形態におけるロボット 1の制御ユニット 60の主な機能的構成を示すブロック図である。この図 4中の「実ロボット」の部分以外の部分が制御ュニット 60が実行する処理機能 (主として第 1の演算装置 90及び第 2の演算装置 92の機能）によって構成されるものである。その処理機能は、制御ユニット 60に実装されたプログラム等によって実現されている。尚、以下の説明では、ロボット 1の各部 (脚体 2、腕体 5など)の左右を特に区別する必要がないときは、前記符号 R, Lを省略する。

[0053] 以下説明すると、制御ユニット 60は、後述の如く目標歩容を自在かつリアルタイムに生成して出力する歩容生成装置 100を備えている。この歩容生成装置 100は、その機能によって本発明の実施形態を実現するものである。この歩容生成装置 100が出力する目標歩容は、補正目標上体姿勢軌道 (上体 3の目標姿勢の軌道)、補正目標上体位置軌道 (上体 3の目標位置の軌道)、目標足平位置姿勢軌道 (各足平 22の目標位置及び目標姿勢の軌道)、目標腕姿勢軌道 (各腕体の目標姿勢の軌道)、目標 ZMP (目標全床反力中心点）軌道、目標 ZMPまわりの補正目標床反力モーメント軌道および目標全床反力軌道から構成される。尚、脚体 2や腕体 5以外に、上体 3〖こ対して可動な部位 (頭部など)を備える場合には、その可動部位の目標位置姿勢軌道が目標歩容に加えられる。

[0054] ここで、本明細書での歩容に関する基本的な用語の定義などについて説明しておく。歩容における「軌道」は時間的変化のパターン (時系列パターン)を意味し、「軌道」の代わりに「パターン」と称することもある。また、「姿勢」は空間的な向きを意味する。例えば上体姿勢は Z軸 (鉛直軸）に対するロール方向（X軸まわり）の上体 3の傾斜角（姿勢角）とピッチ方向 (Y軸まわり）の上体 3の傾斜角（姿勢角）とで表され、足平姿勢は各足平 22に固定的に設定された 2軸の空間的な方位角で表される。本明細書では、上体姿勢は上体姿勢角もしくは上体傾斜角ということもある。なお、腕体 5に関する目標腕姿勢は、本明細書の実施形態では上体 3に対する相対姿勢で表される。

[0055] 上体位置は、上体 3のあら力じめ定めた代表点（上体 3に対して任意に固定設定したローカル座標系でのある固定点）の位置を意味する。同様に、足平位置は、各足平 22のあら力じめ定めた代表点（各足平 22に対して任意に固定設定したローカル座標系での固定点）の位置を意味する。例えば各足平 22の代表点は、各足平 22の底面上 (より具体的には各脚体 2の足首関節の中心から各足平 22の底面への垂線が該底面と交わる点等）に設定される。

[0056] 上体 3に関する前記補正目標上体姿勢および補正目標上体位置は、ある基本となる目標上体姿勢 (仮目標上体姿勢)および目標上体位置 (仮目標上体位置)を補正したものである。本明細書の実施形態では、基本となる目標上体位置姿勢は、後述する目標瞬時値発生部で決定される目標上体位置姿勢 (後述の図 12の S032で決定される目標上体位置姿勢)が相当する。

[0057] なお、以降の説明では、誤解を生じるおそれがない場合には、しばしば「目標」を省略する。

[0058] 歩容のうちの、床反力に係わる構成要素以外の構成要素、すなわち足平位置姿勢、上体位置姿勢等、ロボット 1の各部位の位置姿勢に関する構成要素を総称的に「運動」という。また、各足平 22に作用する床反力（並進力及びモーメントからなる床反力 )を「各足平床反力」と呼び、ロボット 1の全て（2つ）の足平 22R, 22Lについての「各足平床反力」の合力を「全床反力」という。ただし、以下の説明においては、各足平床反力はほとんど言及しないので、特に断らない限り、「床反力」は「全床反力」と同義として扱う。

[0059] 目標床反力は、一般的には、作用点とその点に作用する並進力及びモーメントによって表現される。作用点はどこにとっても良いので、同一の目標床反力でも無数の表現が考えられるが、特に目標床反力中心点 (全床反力の中心点の目標位置)を作用点にして目標床反力を表現すると、目標床反力のモーメント成分は、鉛直成分 (鉛直軸 (Z軸)まわりのモーメント成分)を除いて零になる。換言すれば、目標床反力中心点まわりの目標床反力のモーメントの水平成分 (水平軸 (X軸及び Y軸）まわりのモーメント）は零になる。

[0060] なお、動力学的平衡条件を満足する歩容では、ロボット 1の目標運動軌道力算出される ZMP (目標運動軌道力も算出される慣性力と重力との合力がその点まわりに作用するモーメントが、鉛直成分を除いて零になる点）と目標床反力中心点とは一致することから、目標床反力中心点軌道の代わりに目標 ZMP軌道を与えると言っても同じことである。

[0061] ここで、ロボット 1の歩行を行う場合には、例えば本出願人が先に特開平 10— 8608 0号公報で提案した上体高さ決定手法によってロボット 1の上体 3の鉛直位置 (上体高さ）が決定されると、並進床反力鉛直成分は従属的に決定される。さらに、目標歩容の運動による慣性力と重力との合力が目標 ZMPまわりに発生するモーメントの水平成分が 0になるようにロボット 1の上体水平位置軌道（あるいは全体重心の位置軌道）を決定することで、並進床反力水平成分も従属的に決定される。このため、ロボット 1の歩行を行う場合には、目標歩容の床反力に関して明示的に設定すべき物理量としては、目標 ZMPだけでもよい。

[0062] 一方、床反力が 0もしくはほぼ 0になるような時期を伴う歩容でのロボット 1の移動、例えばロボット 1の走行を行う場合には、並進床反力鉛直成分もロボット 1の動作制御上重要である。このため、並進床反力鉛直成分の目標軌道を明示的に設定した上で、ロボット 1の目標上体鉛直位置等の軌道を決定することが望ましい。また、ロボット 1 の歩行においても、摩擦係数が低、床面上 (低ミュー路上)でロボット 1を移動させるような場合には、並進床反力鉛直成分 (より厳密には並進床反力の床面に垂直な成分)が摩擦力に影響を及ぼすことから、ロボット 1のスリップなどを防止する上で、並進床反力鉛直成分の目標軌道を明示的に設定することが望ましい。さらに、本発明の実施形態では、最終的に歩容生成装置 100が出力する目標歩容では、目標 ZMPまわりに補正目標床反力モーメント (水平成分が 0とは限らな、モーメント）を発生させる [0063] このようなことから、本明細書の実施形態では、歩容生成装置 100が出力する目標歩容の床反力に関する構成要素として、目標 ZMP軌道のほか、目標 ZMPまわりの補正目標床反力モーメントと、目標並進床反力鉛直成分とを含ませて!/、る。

[0064] そして、本明細書では、歩容生成装置 100が出力する目標歩容は、広義には、「1 歩ないしは複数歩の期間の目標運動軌道と目標床反力軌道との組」の意味で使用され、狭義には、「1歩の期間の目標運動軌道と、目標 ZMP、補正目標床反力モーメント及び目標並進床反力鉛直成分を含む目標床反力軌道との組」の意味で使用される。

[0065] 但し、本明細書の実施形態においては、最終的な目標歩容 (歩容生成装置 100が出力する目標歩容)を決定するまでの過程で作成する目標歩容 (仮目標歩容)では、目標 ZMPまわりの目標床反力モーメントの水平成分は、本来の目標 ZMPの定義どおりに 0とされる。従って、最終的に決定する目標歩容以外の仮目標歩容では、上記狭義の目標歩容から、補正目標床反力モーメントを除、たものが目標歩容の意味で使用される。補足すると、本明細書の実施形態では、最終的な目標歩容 (歩容生成装置 100が出力する目標歩容)を決定するまでの過程で作成する目標歩容 (仮目標歩容）が本発明に密接に関連するものとなっている。このため、以降の説明で現れる目標歩容の大部分は、前記狭義の目標歩容から、補正目標床反力モーメントを除、たもの（目標 ZMPを満足する歩容）の意味で使用される。

[0066] なお、以降の説明では、「床反力鉛直成分」は「並進床反力鉛直成分」を意味するものとし、床反力のうちのモーメントの鉛直成分 (鉛直軸回り成分）は、「モーメント」という用語を用いて「床反力鉛直成分」と区別をする。同様に、「床反力水平成分」は「並進床反力水平成分」を意味するものとする。

[0067] また、目標歩容の「1歩」は、ロボット 1の片方の脚体 2が着地してからもう一方の脚体 2が着地するまでの意味で使用する。

[0068] また、歩容における両脚支持期とは、ロボット 1がその自重を両脚体 2, 2で支持する期間、片脚支持期とはいずれか一方のみの脚体 2でロボット 1の自重を支持する期間、空中期とは両脚体 2, 2が床力も離れている (空中に浮いている)期間を言う。片脚支持期においてロボット 1の自重を支持しない側の脚体 2を遊脚と呼ぶ。なお、片脚支持期と空中期とが交互に繰り返されるロボット 1の走行歩容では両脚支持期は無い。この場合、空中期では両脚 2, 2とも、ロボット 1の自重を支持しないこととなるが、便宜上、該空中期の直前の片脚支持期において遊脚であった脚体 2、支持脚であつた脚体 2をそれぞれ該空中期におヽても遊脚、支持脚と呼ぶ。

[0069] また、目標歩容の軌道は、グローバル座標系（床に固定された座標系）で記述される。グローバル座標系としては、例えば支持脚足平 22の着地位置姿勢に対応して定まる支持脚座標系が用いられる。この支持脚座標系は、例えば支持脚足平 22の底面のほぼ全面を床に接地した状態で、その足平 22が連結された足首関節の中心から床面に延ばした垂線が床と交わる点を原点とし、その原点を通る水平面に支持脚足平 22を投影したときの該足平 22の前後方向を X軸方向、左右方向を Y軸方向とする座標系（Z軸方向は鉛直方向）である。以降の説明では、特にことわらない限り、 X、 Υ、 Ζ座標は、この支持脚座標系の座標を意味する。

[0070] 図 5は、歩容生成装置 100の詳細を示すブロック図である。この図 5を参照して、歩容生成装置 100の処理のより具体的な概要を以下に説明する。

[0071] 図示の如ぐ歩容生成装置 100は歩容パラメータ決定部 100aを備える。歩容パラメータ決定部 100aは、目標歩容を規定する歩容パラメータの値あるいは時系列テーブルを決定する。この歩容パラメータ決定部 100aは、本発明の中核に係わる処理を担うものである。

[0072] 本明細書の実施形態では、歩容パラメータ決定部 100aが決定する歩容パラメータには、目標歩容のうちの、目標足平位置姿勢軌道、目標腕姿勢軌道、目標 ZMP軌道、および目標床反力鉛直成分軌道をそれぞれ規定するパラメータが含まれる。

[0073] ここで、歩容生成装置 100が目標歩容を生成するとき、遊脚足平 22の着地予定位置姿勢、着地予定時刻、あるいは歩幅、移動速度等の歩容生成用の基本的な要求値 (要求パラメータ）が、前記ジョイスティック 73、もしくは図示しない行動計画部（ロボット 1の行動計画を作成する装置)などの装置力歩容生成装置 100に与えられる。あるいは、上記要求パラメータをあらかじめ記憶保持した記憶媒体カも該要求パラメータを歩容生成装置 100が読み込む。そして、歩容生成装置 100の歩容パラメータ決定部 100aは、その要求パラメータに応じて歩容パラメータを決定する。

[0074] また、本明細書の実施形態では、歩容パラメータ決定部 100aが決定する歩容パラメータには、基準上体姿勢軌道、 ZMP許容範囲、床反力水平成分許容範囲をそれぞれ規定するパラメータも含まれる。

[0075] ここで、前記基準上体姿勢軌道は、最終的に歩容生成装置 100が出力するものではないが、目標歩容を決定するときに参酌されるものである。この基準上体姿勢軌道は、ロボット 1の上体姿勢に関して、前記ジョイスティック 73あるいは行動計画部から与えられ、もしくはあらかじめ定められた要求 (上体姿勢を鉛直姿勢に保つなどの要求）にそのまま従って生成される上体姿勢軌道である。目標上体姿勢 (以降、「基準」が付いていない「上体姿勢」は、目標上体姿勢を表す)は、基準上体姿勢に長期的に追従する力、または一致するように生成される。

[0076] また、前記 ZMP許容範囲に関して補足すると、本明細書の実施形態では、目標歩容は、目標 ZMPのまわりに補正目標床反力モーメント (これは一般には 0ではな、）を発生するように修正される。したがって、目標 ZMPは、本来の定義 (床反力モーメント水平成分が 0である点という定義）とは異なる点となり、本来の定義を満足する ZM P (以下、真の ZMPと、う）は、補正目標床反力モーメントを目標床反力鉛直成分で割った値だけ目標 ZMPからずれた位置に移る。

[0077] 修正された歩容 (歩容生成装置 100が最終的に出力する目標歩容）の真の ZMP は、少なくとも ZMP存在可能範囲（いわゆる支持多角形のこと。床と足平 22の底面との間に粘着力が作用しないと仮定した場合における床反力作用点 (ZMP)の存在可能範囲）内になければならない。さらにロボット 1の安定余裕を十分にとるためには、修正された歩容の真の ZMPは、 ZMP存在可能範囲のなかの中心付近の範囲にあることが望ましい。そこで、本明細書の実施形態では修正された歩容の真の ZMPが存在できる許容範囲を設定する。この範囲を ZMP許容範囲と呼ぶ。 ZMP許容範囲は、 ZMP存在可能範囲と一致あるいは ZMP存在可能範囲内に包含されるように設定される。

[0078] なお、前記したように、目標 ZMPまわりの補正目標床反力モーメントを目標床反力鉛直成分で除算したものが、目標 ZMPに対する真の ZMPの位置のずれ量を表すので、目標 ZMPまわりの補正目標床反力モーメントを設定する代わりに、目標 ZMP に対する真の ZMPの位置のずれ量 (補正目標床反力モーメントの ZMP換算値)を設定してもよい。また、 ZMP許容範囲は、その境界の位置に目標床反力鉛直成分を乗算することで、補正目標床反力モーメント許容範囲に変換することができ、その補正目標床反力モーメント許容範囲を ZMP許容範囲の代わりに設定するようにしてもよい。

[0079] また、前記床反力水平成分許容範囲は、ロボット 1の足平 22の床との接地面に、足平 22が滑らないような大きさの摩擦力を発生させ得る床反力水平成分の許容範囲である。本明細書の実施形態では、少なくとも最終的に歩容生成装置 100が出力する目標歩容の運動（目標運動）は、それによつて発生するロボット 1の慣性力の水平成分に釣り合う床反力水平成分が床反力水平成分許容範囲内に収まるように生成される。

[0080] なお、本明細書の実施形態で設定する床反力水平成分許容範囲は、後述の S02 2の処理で設定される定常歩容用のものと、 S026の処理で設定される基本歩容用のものと、 S030で設定される歩容補正用（フルモデル補正用）のものとがある。ただし、これらの床反力水平成分許容範囲は必ずしも互いに異なる必要はなぐ同一でもよい。一方、 ZMP許容範囲は、 S030処理で設定される歩容補正用（フルモデル補正用）のものだけである。

[0081] 補足すると、目標歩容を生成するための歩容パラメータには、上記したパラメータ以外のパラメータも含まれる。それらは、歩容パラメータ決定部 100aの中で、所要の境界条件を満たすように決定される。

[0082] 歩容パラメータ決定部 100aで決定された歩容パラメータは目標瞬時値発生部 100 bに入力される。目標瞬時値発生部 100bは入力された歩容パラメータに基づき、動力学モデルを用いて目標上体位置姿勢、目標足平位置姿勢、目標 ZMP、目標床反力鉛直成分、 ZMP許容範囲、床反力水平成分許容範囲等、目標歩容の構成要素の瞬時値 (前記制御ユニット 60の所定の制御処理周期毎の値)を逐次算出 (発生）する。なお、図 5では一部の目標瞬時値のみを代表的に記載している。

[0083] 目標瞬時値発生部 100bで算出された目標瞬時値は、フルモデル補正部 100cに入力される。このフルモデル補正部 100cは、目標瞬時値発生部 100bが求めた目標上体位置姿勢を、動力学的精度の高、動力学モデルとしてのフルモデルを用いて補正してなる補正目標上体位置姿勢を算出すると共に、目標 ZMPまわりの床反力モーメント水平成分の目標値である補正目標床反力モーメントを算出する。

[0084] フルモデル補正部 100cは、より一般的には、次の D1— D3の条件を満足するように、 E1あるいは E2の処理を実行する。すなわち、フルモデル補正部 100cは、

D1)目標瞬時値発生部 100bで生成した歩容よりも高い精度で動力学的平衡条件を満足する。

D2)真の ZMP (目標 ZMPのまわりに補正目標床反力モーメントを発生させることによつて修正された本来の定義を満足する ZMP)は、 ZMP許容範囲 (安定余裕が十分維持できる許容範囲）に存在する。

D3)床反力水平成分は床反力水平成分許容範囲内になる。

という条件を満足するように、

E1)目標瞬時値発生部 100bで生成した歩容の上体位置姿勢を補正する。

あるいは

E2)目標瞬時値発生部 100bで生成した歩容の上体位置姿勢を補正すると共に、目標 ZMPまわりの補正目標床反力モーメントを出力する（目標床反力を補正する)。

[0085] 本明細書の実施形態では、 D1— D3の条件を満足するように、 E2の処理が実行される。なお、本明細書の実施形態におけるフルモデル補正部 100cの処理は、例えば本願出願人が先に提案した PCT国際公開公報 WOZ03Z057427ZA1にて詳細に説明されているもの（具体的には、同公報の図 13の S038の処理）と同じである。従って、本明細書でのフルモデル補正部 100cの処理の詳細な説明は省略する。

[0086] また、本明細書の実施形態では、フルモデル補正部 100cによる補正を行うが、その補正を省略し、目標瞬時値発生部 100bで決定した目標歩容の瞬時値をそのまま歩容生成装置 100から出力するようにしてもょ、。

[0087] 図 4に戻って、上述のように決定される補正目標上体位置姿勢、目標 ZMPまわりの補正目標床反力モーメント、目標足平位置姿勢の瞬時値を含む目標歩容の瞬時値は、複合コンプライアンス制御装置 101 (図 4で破線で囲んだ部分）に入力される。この複合コンプライアンス制御装置 101では、ロボット 1のバランスを保ちつつ、目標歩容に追従するように関節ァクチユエータ (電動モータ 64)が制御される。なお、複合コンプライアンス制御装置 101のより具体的な処理は後述する。

[0088] 以上が歩容生成装置 100の概要である。

[0089] 次に、本発明の実施形態を具体的に説明していく。本実施形態では、歩容パラメ一タ決定部 100aは、前記制御ユニット 60の制御処理周期毎に、目標 ZMP軌道 (より正確には歩容パラメータのうちの目標 ZMP軌道を規定するパラメータ）を修正するためのパラメータを段階的に決定したり、前記したパラメータ以外のパラメータを探索的に決定することにより、そして、その決定した歩容パラメータと前記動力学モデルとを用いて目標瞬時値発生部 100bにより目標歩容の瞬時値の時系列を決定する。この場合、歩容パラメータは、既に作成済みの歩容に係わる歩容パラメータを初期値として、その歩容パラメータの一部のパラメータを、これから作成しょうとする歩容に対応して定まる歩容パラメータに段階的に近づけつつ、残りのパラメータのうちの所定のパラメータが探索的に決定される。

[0090] ここで、本実施形態で歩容生成に用いられる上体運動モードと動力学モデルとについて説明する。

[0091] 走行など、空中期がある歩容や、低摩擦床面での歩行においては、単に上体水平加速度を調整するだけでは、目標歩容の床反力水平成分が許容範囲内（あるいは摩擦限界内）に存在しつつ動力学的平衡条件を満足することができない場合がある。そこで、本実施形態では、以下に説明する上体 3の 2つの運動モード (上体並進モード及び上体回転モード)を複合的に発生させることにより、目標歩容の床反力水平成分が許容範囲内 (あるいは摩擦限界内）に存在しつつ動力学的平衡条件を満足するようにしている。

[0092] 図 6 (a)のように、ある運動状態から、上体水平加速度だけを摂動させると、全体重心水平加速度と全体重心まわりの角運動量が摂動する。すなわち、上体水平加速度の摂動は、それによつて発生する慣性力と重力の合力に対して動力学的に釣り合う床反力鉛直成分を摂動させずに、目標 ZMPまわりの床反力モーメント (ただし鉛直軸まわり成分を除く）と床反力水平成分 (厳密には、並進床反力水平成分)とを摂動させる。この運動モードを上体並進モードと呼ぶ。

[0093] 言いかえると、床反力鉛直成分を変化させずに、目標 ZMPまわりの床反力モーメントの水平成分と床反力水平成分 (並進床反力水平成分)を変化させる運動を上体並進モードと呼ぶ。

[0094] この時の単位加速度当たりの床反力モーメント成分の変化を Δ Μρ、単位加速度当たりの床反力水平成分の変化を A Fpとする。図 6 (a)に示す状況で上体 3を前方に水平加速すると、 Δ Μρと Δ Fpは図 6 (a)に示す矢印の向きに作用する。

[0095] 感覚的に判り易くするために、運動によって発生する慣性力と重力の合力に釣り合う床反力を用いて表現したが、慣性力と重力の合力を用いて表現した方が、理論的には的確である。なお、上記合力と床反力は、互いに大きさが同じで向きが逆になつている。

[0096] 一方、図 6 (b)のように、ある運動状態から、ある点 Prまわりに上体姿勢角加速度を摂動させると、全体重心は摂動せずに、全体重心まわりの角運動量が摂動する。すなわち、点 Prまわりの上体姿勢角加速度摂動は、床反力鉛直成分と床反力水平成分 (厳密には、並進床反力鉛直成分と並進床反力水平成分)を摂動させずに、目標 ZMPまわりの床反力モーメントの水平成分を摂動させる。この運動モードを上体回転モードと呼ぶ。

[0097] 言いかえると、床反力鉛直成分と床反力水平成分を変化させずに、目標 ZMPまわりの床反力モーメントの水平成分を変化させる運動を上体回転モードと呼ぶ。

[0098] この時の単位角加速度当たりの床反力モーメント成分の変化を A Mr、単位角加速度当たりの床反力の水平成分の変化を A Frとする。 A Frは零である。図 6 (b)に示す状況で上体が前傾するように角加速度を与えると、 Δ Mrは図 6 (b)に示す矢印の向きに作用する。

[0099] 上体 3の運動には、上体並進モードと上体回転モード以外に、上体鉛直移動モードがある。これは、上体 3を鉛直方向に移動させる運動である。

[0100] 第 1実施形態においては、目標瞬時値発生部 100bは、以下に示す動力学モデルを用いて歩容を生成する。本実施形態では、その動力学モデルとして、例えば図 7に示す動力学モデルが用ヽられる。図 7を参照して、この動力学モデルはロボット 1の各脚体 2にそれぞれ対応する 2つの質点（足平質点） 2m, 2m、及び上体 3に対応する質点（上体質点） 24mからなる合計 3質点と、イナーシャがあって質量のなヽフライホイール FHとから構成されるモデルである。上体質点は、上体 3に任意に固定設定されたローカル座標系において上体 3の代表点と一定の位置関係を有する点である。同様に、各足平質点は、それに対応する足平 22に任意に固定設定されたローカル座標系において該足平 22の代表点と一定の位置関係を有する点である。この動力学モデルは、本願出願人が例えば先に提案した PCT国際公開公報 WOZ03Z057427ZA1に例示した動力学モデルである。従って、本明細書での詳細な説明は省略する力該動力学モデルの動力学は、次のように変数を定義したとき、式 2a— 2cにより表される。なお、ここでは、本明細書の理解を容易にするために、サジタルプレーン (前後軸 (X軸）と鉛直軸（ Z軸)を含む平面)での動力学方程式 (運動と床反力との関係を表す式)のみを記述し、ラテラルプレーン (左右軸 (Y軸）と鉛直軸 (Z軸)を含む平面)での動力学方程式を省略する。

Zsu_P2 _:支持脚質点鉛直位置、 Z_SWg2 _:遊脚質点鉛直位置、 Zb2 :上体質点鉛直位置、 ZGtotal2 :全体重心鉛直位置、 Xsup2 :支持脚質点水平位置、 Xswg2 :遊脚質点水平位置、 Xb2：上体質点水平位置、 XGtotal2：全体重心水平位置、 Θ by2：鉛直方向に対する Y軸回りの上体姿勢角（傾斜角）、 mb2 :上体質点質量、 ms_Up2 _:支持脚質点質量、 mswg2 :遊脚質点質量、 mtotal:ロボット総質量（=mb2+msup2+mswg2)、J : 上体慣性モーメント（上体回転モードにおける等価慣性モーメント）、 Fx:床反力水平成分 (詳しくは並進床反力の前後方向 (X軸)成分)、 Fz：床反力鉛直成分 (詳しくは並進床反力の鉛直方向（Z軸)成分)、 My:目標 ZMPまわりの床反力モーメント (詳しくは床反力モーメントの左右軸 (Y軸)まわり成分)。

Fz=mb2 * (g+d2Zb2/dt2)+msup2 * (g+d2Zsup2/dt2)

+ mswg2 * (g + d2Zswg2/dt2) ……式 2a

Fx=mb2 * d2Xb/dt2+msup2 * d2Xsup2/dt2+mswg2 * d2Xswg2/dt2

……式 2b

My=-mb2 * (Xb2— Xzmp) + (g+d2Zb2/dt2)+mb2 * (Zb2— Zzmp) * d2Xb2/dt2 -msup2 * (Xsup2-Xzmp) * (g+d2Zsup2/dt2)

+ msup2*(Zsup2-Zzmp) * d2Xsup2/dt2

-mswg2 * (Xswg2— Xzmp) * (g+d2Zswg2/dt2)

+ mswg2*(Zswg2-Zzmp) * (d2Xswg2/dt2)+J * d2 0 by/dt2

……式 2c

なお、ロボット全体重心位置には次の関係式が成立する。

ZGtotal2 = (mb2 * Zb2+msup2 * Zsup2+mswg2 * Zswg2)/mtotal · "式 2d

XGtotal2 = (mb2 * Xb2 + msup2 * Xsup2 + mswg2 * Xswg2)/mtotal …式 2e この動力学モデルでは、脚体 2, 2の動力学 (各質点 2m, 2mの動力学）と上体 3の動力学 (質点 24m及びフライホイール FHの動力学）とが相互に非干渉に構成されると共に、ロボット 1全体の動力学は、それらの線形結合で表される。また、さらに、上体 3の運動と床反力との関係は、上体 3の並進運動 (上体並進モード)と床反力との関係、並びに上体 3の回転運動（上体回転モード)と床反力との関係に分離される。具体的には、上体質点 24mの水平運動によって発生する床反力は、上体 3の水平方向並進運動（上体並進モード）によって発生する床反力に対応し、フライホイールの回転運動によって発生する床反力は、上体 3の姿勢角の回転運動（上体回転モード )によって発生する床反力に対応する。

[0102] 尚、ロボット 1の腕体の質量は上体質点 24mに含まれるものとし、上体質点 24mは腕体の質量を含む質量をもつ。本実施形態では、目標歩容における腕体の運動 (腕振り運動）は、後述するように、ロボット 1の腕振り以外の運動によってロボット 1に発生する鉛直軸まわりの慣性力のモーメントを打ち消しつつも、上体 3に対する両腕体の全体の重心の相対位置が動かないように行なわれるので、腕体の腕振り運動による（鉛直軸まわり成分を除く)床反力モーメントへの影響と床反力水平成分への影響とは無視する。

[0103] なお、前記フルモデル補正部 100cで用いるフルモデルは、例えば図 8に示す如く、ロボット 1の各リンクに質点をもつような多質点モデルである。この場合、ロボット 1の各リンクは、それに対応する質点の回りにイナ一シャをもつようなものであってもよい。 [0104] 次に、歩容生成装置 100の処理の詳細をより具体的に説明する。

[0105] 本実施形態における歩容生成装置 100は、ロボット 1の片方の脚体 2が着地してから他方の脚体 2が着地するまでの 1歩の期間の目標歩容 (前記狭義の目標歩容)を単位として、その 1歩の期間の目標歩容を順番に生成する。ここで、新たに生成しょうとして、る目標歩容を「今回歩容」、その次の目標歩容を「次回歩容」、さらにその次の目標歩容を「次次回歩容」、というように呼ぶ。また、「今回歩容」の一つ前に生成した目標歩容を「前回歩容」と呼ぶ。「今回歩容」は、本発明における「所定の期間における目標歩容」に相当するものである。

[0106] また、歩容生成装置 100が今回歩容を新たに生成するとき、該歩容生成装置 100 には、ロボット 1の 2歩先までの遊脚側足平 22の着地予定位置姿勢、着地予定時刻の要求値 (要求)等が歩容に対する要求パラメータとして入力される (あるいは歩容生成装置 100が記憶装置から要求パラメータを読み込む)。そして、歩容生成装置 100 は、これらの要求パラメータを基に、補正目標上体位置姿勢軌道、目標足平位置姿勢軌道、目標 ZMP軌道、目標床反力鉛直成分軌道、目標腕姿勢軌道、補正目標床反力モーメント軌道等を生成する。なお、本実施形態では、要求パラメータには、 2 歩先までの遊脚側足平 22の着地予定位置姿勢、着地予定時刻の要求値の他、基準上体姿勢に対する要求、上体姿勢に対する相対的な腕姿勢に対するの要求、目標床反力鉛直成分のパターンに対する要求、床の摩擦力 (もしくは摩擦係数）に対する要求などを規定するパラメータも含まれる。基準上体姿勢に対する要求は、例えば上体姿勢を鉛直姿勢に維持するというような要求であり、腕姿勢に対する要求は、上体 3に対して腕姿勢を所定の姿勢に維持するというような要求である。また、目標床反力鉛直成分のパターンに対する要求は、ロボット 1の空中期では、目標床反力鉛直成分を 0にし、また、片脚支持期では、目標床反力鉛直成分を台形状のパターンで変化させるというような要求である。また、床の摩擦力に対する要求は、目標床反力鉛直成分と摩擦係数 (要求値)との積により定まる摩擦力限界に対して、どの程度の範囲内に目標床反力水平成分を収めるかというような要求である。

[0107] 以下に歩容生成装置 100の歩容生成処理の詳細を図 9一図 22を参照しつつ説明する。図 9は、その歩容生成装置 100が実行する歩容生成処理のメインルーチンを示すフローチャート（構造化フローチャート）である。なお、このメインルーチン処理の手順自体は、その一部のサブルーチン処理を除いて、例えば本願出願人による前記

PCT国際公開公報 WOZ03Z057427ZA1 (以下、公報文献 1という）と同じである。

[0108] まず S010において時刻 tを 0に初期化するなど種々の初期化作業が行なわれる。

この処理は、歩容生成装置 100の起動時等に行なわれる。次いで、 S012を経て SO 14に進み、歩容生成装置 100は、制御周期（図 9のフローチャートの演算処理周期）毎のタイマ割り込みを待つ。制御周期は Atである。

[0109] 次いで、 S016に進み、歩容の切り替わり目である力否かが判断され、歩容の切り替わり目であるときは S018に進むと共に、切り替わり目でないときは S030に進む。ここで、上記「歩容の切り替わり目」は、前回歩容の生成が完了し、今回歩容の生成を開始するタイミングを意味し、例えば前回歩容の生成を完了した制御周期の次の制御周期が歩容の切り替わり目になる。

[0110] S018に進むときは時刻 tが 0に初期化され、次いで S020に進み、次回歩容支持脚座標系、次次回歩容支持脚座標系、今回歩容周期および次回歩容周期が読み込まれる。これらの支持脚座標系及び歩容周期は、前記要求パラメータにより定まるものである。すなわち、本実施形態では、歩容生成装置 100にジョイスティック 44等力与えらる要求パラメータは、 2歩先までの遊脚足平 22の着地予定位置姿勢 (足平 22が着地して力足底を床面にほぼ全面的に接触させるように、滑らさずに回転させた状態での足平位置姿勢)、着地予定時刻の要求値を含んでおり、その 1歩目の要求値、 2歩目の要求値がそれぞれ、今回歩容、次回歩容に対応するものとして、今回歩容の生成開始時 (前記 S016の歩容の切り替わり目）以前に歩容生成装置 10 0に与えられたものである。なお、これらの要求値は今回歩容の生成途中でも変更することは可會である。

[0111] そして、上記要求パラメータにおける 1歩目の遊脚足平 22 (今回歩容での遊脚足平 22)の着地予定位置姿勢の要求値に対応して次回歩容支持脚座標系が定まる。また、 2歩目の遊脚足平 22の着地予定位置姿勢の要求値に応じて次々回歩容支持脚座標系が定まる。また、今回歩容周期は、今回歩容の支持脚足平 22の着地予定時刻（要求値)から、 1歩目（今回歩容)の遊脚足平 22の着地予定時刻（要求値)までの時間として定まり、次回歩容周期は、 1歩目の遊脚足平 22の着地予定時刻（要求値)から 2歩目の遊脚足平 22の着地予定時刻（要求値)までの時間として定まる。

[0112] この S020の処理は、前記公報文献 1の図 13の S020の処理と同一であり、本明細書での説明は以上に留める。

[0113] 次いで S022に進み、歩容生成装置 100は、今回歩容に続く仮想的な周期的歩容としての定常歩容の歩容パラメータ（定常歩容パラメータ）を決定する。ここで決定する歩容パラメータとしては、定常歩容における各足平 22の目標足平位置姿勢軌道を規定する足平軌道パラメータ、基準とする上体姿勢軌道を規定する基準上体姿勢軌道パラメータ、目標腕姿勢軌道を規定する腕姿勢軌道パラメータ、目標 ZMP軌道を規定する ZMP軌道パラメータ、目標床反力鉛直成分軌道を規定する床反力鉛直成分軌道パラメータと、目標床反力水平成分許容範囲を規定するパラメータとがある。

[0114] この明細書で「定常歩容」は、その歩容を繰り返したときに歩容の境界においてロボット 1の運動状態 (足平位置姿勢、上体位置姿勢等の状態）に不連続が生じないような周期的歩容を意味するものとして使用する。「定常歩容」は、ロボット 1を直進させる周期的歩容を含むことはもちろん、ロボット 1を旋回させる周期的歩容も含む。この場合、旋回率を零とするときは直進を意味することから、「旋回」には、広義の意味で直進も含まれる。このため、本明細書の実施形態では、「定常歩容」をしばしば「定常旋回歩容」と言うこともある。

[0115] 定常旋回歩容の詳細は、前記公報文献 1ゃ特願 2000— 352011号などにて説明されているので、本明細書での詳細な説明は省略する力その概要は次の通りである。

[0116] 周期的歩容である定常旋回歩容は、本実施形態では、ロボット 1の 2歩分の歩容、すなわち今回歩容に続く第 1旋回歩容と該第 1旋回歩容に続く第 2旋回歩容とからなる歩容を該定常旋回歩容の 1周期分の歩容として、その 1周期分の歩容を繰り返す歩容である。また、生成する今回歩容が例えばロボット 1の走行を行う走行歩容 (片脚支持期と空中期とを有する歩容)であるときには、定常旋回歩容の第 1旋回歩容及び第 2旋回歩容も走行歩容であり、ロボット 1の歩行を行う歩行歩容 (片脚支持期と両脚支持期とを有する歩容)であるときには、定常旋回歩容の第 1旋回歩容及び第 2旋回歩容も走行歩容である。つまり、第 1旋回歩容及び第 2旋回歩容の基本的な歩容形態は今回歩容と同一である。

[0117] なお、以降の説明では、特にことわらない限り、生成する歩容として走行歩容を例にとつて説明する。

[0118] 定常旋回歩容は、歩容生成装置 100で今回歩容の終端における発散成分や上体鉛直位置速度、上体姿勢角及びその角速度等のロボット 1の運動の状態量を決定するために暫定的に作成されるものであり、歩容生成装置 100からそのまま出力されるものではない。

[0119] 尚、「発散」とは、ロボット 1の上体 3の位置が両足平 22, 22の位置からかけ離れた位置にずれてしまうことを意味する。発散成分の値とは、ロボット 1の上体 3の位置が両足平 22, 22の位置 (より具体的には、支持脚側足平 22の接地面に設定されたグローバル座標系（支持脚座標系）の原点)からかけ離れてヽく具合を表す数値である。例えば、本明細書の実施形態では、前記した各動力学モデルに対して、発散成分は、次式により求められる。

[0120]

発散成分 =上体質点水平位置 +上体質点水平速度 Z ω θ …式 3 この式 3の ω θは所定の値である。なお、歩容における発散成分は、式 3の上体質点水平位置、上体質点水平速度の代わりに、それぞれ上体水平位置、上体水平速度を用いて発散成分が求められる。

[0121] 本明細書の実施形態では、目標歩容が前記発散を生じることなぐ継続的に生成されるように、発散成分を指標にして歩容 (今回歩容)を生成するようにした。すなわち、これ力生成しょうとする今回歩容の後に続く定常歩容 (より正確には定常歩容パラメータ）が前記今回歩容に係わる要求パラメータ等に応じて決定され、定常歩容の初期発散成分を求めてから、今回歩容の終端発散成分を定常歩容の初期発散成分に一致させる（より一般的には、今回歩容を定常歩容に連続させ、もしくは近づける）ように、今回歩容を生成する。 [0122] 本題に戻り、 S022では、図 10に示すサブルーチン処理のフローチャートに従って、定常歩容の歩容パラメータが決定される。すなわち、定常歩容に係る前記足平軌道パラメータ、基準上体姿勢軌道パラメータ、腕軌道パラメータ、 ZMP軌道パラメ一タ、床反力鉛直成分軌道パラメータ、目標床反力水平成分許容範囲を規定するパラメータがそれぞれ S100— S110の処理で決定される。そして、 S112において、定常歩容の初期時刻 Tsと、 1歩の期間（定常歩容の 1周期の時間) Tcycとが再定義される。これらの処理は、前記公報文献 1の図 15のフローチャートの処理と同一であるので、ここでの詳細な説明は省略する力 S100— S110で決定される定常歩容のパラメータは、そのそれぞれのパラメータにより規定される軌道が定常歩容の周期性を満たしつつ、前記した要求パラメータなどにより表される歩容に関する要求を優先的に満足するように決定されるパラメータである。例えば、前記公報文献 1の図 15のフローチャートに関して説明されている如ぐ定常歩容の足平軌道パラメータは、今回歩容に続く第 1旋回歩容の遊脚足平 22の着地予定位置姿勢 (前記次回歩容支持脚座標系で見た着地予定位置姿勢)が前記した 2歩目の着地予定位置姿勢 (要求値)に合致し、且つ、該第 2旋回歩容の遊脚足平 22の着地予定位置姿勢 (前記次次回歩容支持脚座標系で見た着地予定位置姿勢)が、今回歩容の遊脚足平 22の着地予定位置姿勢 (要求値）に合致するように決定される。なお、 ZMP軌道パラメータは、足平軌道パラメータを基に、目標 ZMPが支持脚足平 22の接地面のほぼ中央付近に位置し、且つ、定常歩容の全期間にわたって連続的に変化するように決定される。

[0123] また、図 10の S112で再定義する定常歩容の初期時刻 Tsは、定常歩容の 1周期分の歩容を後述するように作成するときの 1周期の始点の時刻（これは本実施形態では今回歩容の終端の時刻とは相違する）を意味し、第 1旋回歩容の空中期（目標床反力鉛直成分が 0となる時期）の開始直前の時刻である。また、定常歩容の 1歩の期間 Tcycは、定常歩容の第 1旋回歩容と第 2旋回歩容との合計時間の期間である。定常歩容は、その周期性によって、任意の時刻 Txにおける状態（ロボット 1の各部位の位置姿勢やその変化速度の状態）は時刻 Tx+Tcycにおける状態と同一になる歩容である。定常歩容は、 2歩分の歩容を 1周期とする周期的な歩容であるので、本明細書では、その 1周期の期間 (第 1旋回歩容と第 2旋回歩容との合計時間）を定常歩容の 1歩の期間とみなす。

[0124] 補足すると、 S 100— S 110の処理で決定される定常歩容のパラメータは、定常歩容に関する要求を優先的に満足するように決定されるパラメータであるので、前記第 2発明における優先パラメータに相当し、その決定された値は、優先パラメータ要求値に相当するものである。従って、 S 100— S 110の処理は、第 2発明における優先パラメータ要求値決定手段に相当するものである。また、 S100— S110の処理で決定される定常歩容のパラメータは、定常歩容パラメータを構成する全てのパラメータではない。この他にも、定常歩容の歩容パラメータには種々様々なパラメータが含まれる。本実施形態では、定常歩容パラメータを構成するパラメータとして、 S100— S 110で決定されるパラメータ (優先パラメータ）の他に、例えば、定常歩容の 1周期の期間の始端 (該期間の開始時刻)あるいは終端 (該期間の終了時刻）における上体 3 の位置および速度、並びに上体 3の姿勢角およびその角速度と、後述の上体傾斜復元モーメント ZMP換算値のピーク値とが含まれる。これらのパラメータのうち、上体 3 の水平位置および水平速度、上体 3の姿勢角の角速度、上体傾斜復元モーメント Z MP換算値のピーク値は、後述の S024の処理で定常歩容の境界条件（定常歩容の任意の時刻での状態と、 1周期後の時刻での状態とがー致もしくはほぼ一致するという条件)を満足するように探索的に決定される。定常歩容パラメータは、それを構成する各パラメータの値と、前記した各動力学モデルとを用いて定常歩容を一義的に生成することができる歩容パラメータである。

[0125] また、定常歩容パラメータを構成するパラメータを大別すると、前記優先パラメータとそれ以外の非優先パラメータとに大別される。そして、非優先パラメータには、上記の如く探索的に決定されるパラメータ (前記第 2発明における探索対象パラメータ）が含まれる。なお、定常歩容パラメータの非優先パラメータには、歩容に関する要求、あるいは歩容に関する境界条件に依存せずに固定的に決定されるパラメータもある。例えば、本実施形態では、ロボット 1の遊脚足平 22の持ち上げ高さ（支持脚足平 2 2の接地面に対する相対的な高さ）は、固定的に設定されるパラメータである。固定的に設定されるパラメータは、制御処理周期毎に、 S100から S110の処理において設定することは無駄であるので、 ROMに記憶しておく力、あるいは、制御ユニット 60 の電源投入直後における諸々の初期化処理（図 9の S010)において設定すればよい。

[0126] また、一つもしくは複数の上位のパラメータ力も従属的に決定される下位のパラメ一タもある。例えば、本実施形態では、定常歩容の初期（前記時刻 Ts)での上体姿勢は、基準上体姿勢と同一とされ、基準上体姿勢軌道パラメータ力従属的に決定される。本明細書では、一つの上位のパラメータ力も従属的に決定されるパラメータは、その上位のパラメータと同じ属性 (優先パラメータである力、非優先パラメータである力、探索対象パラメータであるか、固定的なパラメータであるかの属性)のパラメータであると見なす。そして、複数の上位のパラメータを基に決定される下位のパラメータについては、上位のパラメータに探索対象パラメータが含まれる場合には、下位のパラメータも探索対象パラメータと見なし、上位のパラメータに探索対象パラメータが含まれず、且つ優先パラメータが含まれる場合には、下位のパラメータは優先パラメータと見なす。本明細書では、全ての定常歩容パラメータの構成パラメータを列挙することは省略し、本願発明を理解する上で十分な典型的なパラメータだけを例示する。

[0127] 図 9の説明に戻って、次に S024に進み、定常歩容の初期状態が算出される。ここで算出される初期状態は、定常歩容の初期上体水平位置速度 (水平方向での初期上体位置及び初期上体速度)、初期上体鉛直位置速度 (鉛直方向での初期上体位置及び初期上体速度)、初期発散成分、初期上体姿勢角およびその角速度である。この初期状態の算出は、図 11のサブルーチン処理のフローチャートに従って探索処理により行なわれる。なお、図 11の処理で最終的に決定する定常歩容の初期状態は、今回歩容の終端の時刻（定常歩容の本来の初期時刻 0)での状態である力本実施形態では、図 11の S2008の処理が終了するまでは、図 10の S112で設定した初期時刻 Tsでの状態を定常歩容の初期状態とする。

[0128] 図 11のサブルーチン処理を説明すると、まず、 S2000において、前回歩容 (今回歩容の 1歩前の歩容）を生成したときの S022および S024の処理で最終的に決定された、初期（時刻 Ts)上体位置 Xsおよびその変化速度 Vxs、初期（時刻 Ts)上体姿勢角速度 ω bs、並びに上体傾斜復元モーメント ZMP換算値ピーク値 ZMPrecpeekを含む第 2旋回歩容パラメータ (第 2旋回歩容を規定する歩容パラメータ)の各パラメータ値を今回歩容に対応する定常旋回歩容の第 1旋回歩容パラメータの各パラメータの仮値とする。

[0129] なお、前記上体傾斜復元モーメント ZMP換算値ピーク値 ZMPrecpeekは、ロボット 1 の片脚支持期 (より詳しくは、片脚支持期の開始直後から終了直前までの時期。以下、上体傾斜角復元期間ということがある)で上体姿勢を基準上体姿勢に近づけるために必要な床反力モーメントの ZMP換算値 ZMPrec (基準となる目標 ZMP (S022で決定した ZMP軌道パラメータにより規定される目標 ZMP)からのずれ量)のピーク値を示すものであり、その例を図示したものが図 20である。 ZMPrecは同図示の如く台形状のパターンとされ、そのピーク値（台形の高さ）力 ¾MPrecpeekである。

[0130] S2000においてはさらに、前回歩容を生成するときの S022および S024の処理で最終的に決定された第 1旋回歩容パラメータ (第 1旋回歩容を規定するパラメータ)の各パラメータ値を今回歩容に対応する定常旋回歩容の第 2旋回歩容パラメータの各ノメータの仮値とする。なお、前回歩容に対応する定常旋回歩容における上体 3の初期状態を旋回歩容パラメータに含ませたのは、本実施形態では、定常旋回歩容の 1周期分を生成するときの初期時刻 Tsが本来の初期時刻 0と異なり、本来の初期時刻 0での上体 3の初期状態は、第 2旋回歩容内の途中時刻における上体 3の状態と同じになる力もである。以上が S2000の処理である。

[0131] この S2000の処理は、今回歩容に対応する定常旋回歩容の第 1旋回歩容パラメ一タおよび第 2旋回歩容パラメータの候補をそれぞれ、とりあえず、前回歩容に対応する定常旋回歩容の第 2旋回歩容パラメータ、第 1旋回歩容パラメータに一致させるということを意味する。このように設定された、今回歩容に対応する第 1旋回歩容パラメータおよび第 2旋回歩容パラメータ力なる定常旋回歩容パラメータを基に前記動力学モデルを用いて定常旋回歩容を生成すると、その定常旋回歩容は、定常旋回歩容の境界条件を満たすものとなる。なお、上記のように設定された今回歩容に対応する第 1旋回歩容パラメータおよび第 2旋回歩容パラメータ力なる定常旋回歩容パラメータは、第 2発明におけるベース定常歩容パラメータに相当するものである。従って、 S2000の処理は、第 2発明におけるベース定常歩容パラメータ設定手段に相当する。 [0132] 次、で、 S2000-1にお、て、探索対象 (探索対象パラメータ)である初期（Ts)上体水平位置 Xs、初期 (Ts)上体水平速度、初期 (Ts)上体姿勢角速度 co bsおよび上体傾斜復元モーメント換算値 ZMPrecpeekを除く定常歩容パラメータの優先パラメ一タ (より詳しくは S022で決定する定常歩容の足平軌道パラメータ、基準上体姿勢軌道パラメータ、腕姿勢軌道パラメータ、床反力鉛直成分軌道パラメータ、床反力水平成分許容範囲を規定するパラメータ、 ZMP軌道パラメータ)の値を現在候補値 (S20 00で設定された値)から前記 S022で決定した値に所定量だけ近づけた値に更新する。

[0133] 次、で、 S2004— 1にお、て、現在候補の定常歩容パラメータ（S2000で仮決定された定常歩容パラメータの優先パラメータを S2002— 1で更新したもの）を基に、定常歩容の境界条件を満足するような探索対象 Xs、 Vxs、 co bs、 ZMPrecpeekの値を探索的に決定する。この処理は、図 12のフローチャートに示す如く行なわれる。なお、以下の図 12の処理（その処理の中のサブルーチン処理を含む）の説明にお!/、ては、歩容パラメータの各パラメータの値に関する「現在値」は、該当するパラメータの「現在（該当処理の実行時点)設定されている候補値もしくは仮値」の意味で使用する。また、「現在の〇〇」（〇〇はあるパラメータ）というときは、「現在 (該当処理の実行時点）候補となっている〇〇」の意味で使用する。

[0134] 以下、図 12の処理を説明すると、まず、 S1200において、現在の定常旋回歩容パラメータを基に足平位置姿勢、上体姿勢角 Θ bsおよび腕姿勢の初期状態 (定常旋回歩容の初期時刻 Tsでの状態）が決定される。なお、これらの初期状態は、第 1旋回歩容の支持脚座標系（前記次回歩容支持脚座標系）で見た状態である。この処理では、足平位置姿勢の初期状態は、現在の定常歩容パラメータの足平軌道パラメータを基に有限時間整定フィルタを用いて算出される足平位置姿勢軌道のうちの時刻 Tsでの各足平 22の位置姿勢に決定される。該有限時間整定フィルタは、前記公報文献 1 等にて説明されているので、ここでの説明は省略する。また、上体姿勢角 Θ bsの初期状態は、現在の定常歩容パラメータの基準上体姿勢軌道パラメータ力も定まる時刻 Tsでの基準上体姿勢角と同一に決定され、腕姿勢の初期状態は、現在の定常歩容ノラメータの腕姿勢軌道パラメータにより定まる時刻 Tsでの状態と同一に決定される [0135] 次いで、 S1202において、探索対象である初期（時刻 Ts)上体水平位置、初期上体水平速度、初期上体姿勢角速度、および上体傾斜復元モーメント ZMP換算値ピーク値（Xsl, Vxl, co bsl, ZMPrecpeekl)の現在値を、これらの探索対象の初期候補として設定する。なお、これらの探索対象の値は、第 1旋回歩容の支持脚座標系（前記次回歩容支持脚座標系）で見た値である。

[0136] 次いで、 S1206— S 1218のループ処理が実行される。その処理を概略的に説明すれば、前記の如く設定した探索対象の初期候補を含む定常歩容パラメータと前記動力学モデルとを用いて定常歩容の終端（時刻 Ts+Tcyc)までの歩容を生成する。そして、その生成した定常歩容が境界条件 (初期と終端での状態 (本実施形態では上体水平位置、上体水平速度、上体姿勢角、上体姿勢角速度)がほぼ一致すること )を満たしている力否かを判断し、満たしていない場合には、探索対象の値を変更する。これを繰り返すことで、最終的に前記動力学モデル上で定常歩容の境界条件を満たすことができる該定常歩容の初期状態が決定される。

[0137] S1202— S 1218の処理をより具体的に説明すると、 S1202にお!/ヽて、動力学モデル上での定常歩容の初期（時刻 Ts)の上体鉛直位置および上体鉛直速度 (Zs, Vzs) が決定される。この場合、動力学モデル上でのロボット 1の全体重心の鉛直方向の慣性力と重力との合力が目標床反力鉛直成分に釣り合い、且つ、全体重心の鉛直位置が定常歩容の境界条件を満たすように決定される。この処理は、前記公報文献 1 の図 20の S206の処理と同様に行なわれる。なお、（Zs, Vzs)は、前記探索対象 Xs, Vxs, 0 bs, co sに依存する。従って、（Zs, Vzs)は従属的な探索対象パラメータとしての属性を持つ。

[0138] 次いで、 S 1208において、上体 3の初期状態（ 0 bs, Xs, Vxs, co bs, Zs, Vzs)の現在値と ZMPrecpeekの現在値とを含む定常歩容パラメータを基に、動力学モデルを用いて定常歩容が時刻 Ts + Tcyc (定常歩容の終端)まで生成される。この処理は、図 1 3のフローチャートで示すサブルーチン処理により実行され、さらに、この図 13の S30 4の処理は、図 14のフローチャートで示すサブルーチン処理により実行される。さらに、図 14の S412の処理は、図 15フローチャートで示すサブルーチン処理により実行される。これらの処理については後述する。

[0139] 次いで、 S1210において、 S 1208で生成した定常歩容の終端の上体水平位置、上体水平速度、上体姿勢角およびその角速度を、該定常歩容の次の 1歩の支持脚座標系（定常歩容の第 2旋回歩容に続く第 1旋回歩容の支持脚座標系)から見た値に変換し、その値を (Xel, Vxel, Θ bel, cobel)とする。

[0140] そして、 S1212において、現在の (Xsl, Vxsl, Θ bsl, cobsl)の値と、 (Xel, Vxel,

0bel, cobel)の値との差を定常歩容の境界条件誤差（errx, errv, err θ , err ω)として求める。定常歩容の境界条件を満足するためには、境界条件誤差はほぼ 0でなければならない。この境界条件誤差は、 S 1208において作成した定常歩容の、境界条件からのずれ度合、を表すものである。

[0141] 次いで、 S1214において、 errx, errv, err θ , err ωがいずれも十分に小さい（0近傍の）所定の許容範囲内にあるカゝ否かを判断し、その判断結果が YESである場合には、 S1206— S1218のループ処理を終了する。この場合、このループ処理の終了時現在の定常歩容パラメータが動力学モデル上で境界条件を満たし得る定常歩容ノラメータとして得られる。

[0142] 一方、 S1214の判断結果が NOである場合には、現在の探索対象 (Xs, Vx, cobs,

ZMPrecpeek)の値の近辺に、それぞれのパラメータの値を所定の微小量 AXs, AVx

, A cobs, Δ ZMPrecpeekだけ変化させた複数 (本実施形態では 4個）の探索対象の候補を決めて、それぞれの探索対象の候補を含む定常歩容パラメータ (現在の定常歩容パラメータの探索対象を新たに決めた各候補に修正した定常歩容パラメータ)を基に、 S1206— S1212と同じ処理を実行して、それぞれの探索対象の候補に対応する境界条件誤差を求める。

[0143] 次いで、 S1218において、現在の（Xs, Vx, cobs, ZMPrecpeek)およびその近辺の探索対象の候補のそれぞれに対応する境界条件誤差を基に、最急降下法やシンプレックス法などの探索手法によって、探索対象（Xs, Vx, cobs, ZMPrecpeek)の新たな候補を決定する。そして、 S 1206からの処理が再び繰り返される。

[0144] 以上のようにして、（Xs, Vx, cobs, ZMPrecpeek)を探索対象として、定常歩容の境界条件を満たす新たな定常歩容パラメータが探索的に決定される。なお、図 12の処理では、定常歩容パラメータのうちの優先パラメータ (足平軌道パラメータ、基準上体姿勢軌道パラメータなど）は図 12の処理の開始時の値に維持される。

[0145] 補足すると、図 12の処理の基本的な考え方（手法）は、前記公報文献 1の図 20の処理と同様である。但し、本明細書の実施形態では、上記探索対象として、上体姿勢角速度と上体傾斜復元モーメント ZMP換算値ピーク値とが含まれ、この点は、前記公報文献 1の図 20の処理と相違している。また、後述する S1208の処理の細部の処理 (サブルーチン処理)の一部も前記公報文献 1のものと相違して、る。

[0146] 前記 S1208のサブルーチン処理を以下に説明する。

[0147] S 1208のサブルーチン処理である図 13の処理は、図示の通り、（Xs, Vxs, Θ bs, co bs, Zs, Vzs)の現在値 (候補値または仮決め値)を定常歩容における上体 3の運動の初期状態として (S300)、その初期（時刻 Ts)状態から、時刻 Ts+Tcycまで (終端状態まで)の定常歩容の瞬時値を時系列的に実際に作成する（S302— S306)処理である。なお、図 13の「k」は、作成する定常歩容の瞬時値の時系列の時刻である

[0148] この図 13の S304のサブルーチン処理（定常歩容の瞬時値を決定するサブルーチン処理）である図 14の処理では、 S400— S410の処理によって、現在の定常歩容パラメータ (詳しくは優先パラメータ)を基に、目標床反力鉛直成分、目標 ZMP、目標両足平位置姿勢、基準上体姿勢、目標腕姿勢、目標上体鉛直位置、床反力水平成分許容範囲の瞬時値が求められる。

[0149] さらに、 S412の処理によって、動力学モデルを用いて、図中に記載された条件を満たすように上体水平加速度および上体姿勢角加速度の瞬時値が決定される。そして、 S414の処理によって、上体水平加速度および上体姿勢角加速度をそれぞれ 2 階積分して、上体水平位置および上体姿勢角の瞬時値が決定される。

[0150] 補足すると、図 14の処理のうち、 S412以外の処理は、前記公報文献 1の図 22のの S400— S410、 S414の処理と同じである。従って、 S412の処理以外の図 13の処理につ、ては詳細な説明を省略する。

[0151] 図 14の S412のサブルーチン処理である図 15の処理では、まず、定常歩容の上体傾斜角復元期間を規定する時刻 Tm、 Ts2、 Tm2を決定する。これらの時刻は、それぞれ、図 20に示す如ぐ前記上体傾斜復元モーメン ZMP換算値 ZMPrecを発生させる期間を規定するものである。すなわち、定常歩容の初期時刻 Tsの後の最初の片脚支持期の開始直後の時刻を Tm、該片脚支持期の終了直前の時刻を Ts2、次の片脚支持期の開始直後の時刻を Tm2として決定する。そして、期間 [Tm, Ts2]と、期間 [Tm2 , Te]を、それぞれ ZMPrecを発生させる期間（以下、上体傾斜角復元期間という）とする。これは、前記公報文献 1の図 23の S500の処理と同じである。

[0152] 次いで、 S502において、定常歩容の瞬時値を作成しょうとしている現在時刻 k (作成中の定常歩容内での時刻）が上体傾斜角復元期間にある力否かが判断される。そして、現在時刻 kが前記上体傾斜角復元期間内の時刻でないとき、換言すれば、現在時刻 kが、片脚支持期の終了直前から次の片脚支持期の開始直後までの期間（目標床反力鉛直成分が 0である力もしくは 0に近い期間）にあるときには、 S504— S51 6の処理によって、動力学モデル上で、目標 ZMPを満足し、且つ、該動力学モデル上でのロボット 1の全体重心の水平加速度による慣性力に釣り合う床反力水平成分が時刻 kの床反力水平成分許容範囲の瞬時値内に収まるように、上体並進モードの上体水平加速度 αと、上体回転モードの上体角加速度 j8 (上体姿勢角の角加速度）とが決定される。これらの S504— S516の処理は、前記公報文献 1の図 19の S504 一 S516の処理と同じである。

[0153] また、現在時刻 k (作成中の定常歩容内での時刻）が前記上体傾斜角復元期間内の時刻であるときには、 S518— S526の処理によって、上体角加速度 j8は、動力学モデル上で、上体傾斜復元モーメント ZMP換算値パターンの瞬時値 (これは、現在設定されて、る上体傾斜復元モーメント ZMP換算値ピーク値（図 12の S 1208の処理の直前に決定された候補値)と現在時刻 kとに応じて定まる。図 20を参照）に対応する床反力モーメントを目標 ZMPまわりに発生するように決定される。また、上体水平加速度は、動力学モデル上で、上体並進モードによって発生する目標 ZMPまわりの床反力モーメントが 0になるための上体水平加速度と、上体角加速度 j8による目標 ZMPまわりの床反力モーメントと同等の床反力モーメントを発生する上体水平加速度との差として求められる。これにより、上体傾斜角復元期間では、上体姿勢を基準上体姿勢に向力つて復元させつつ、目標 ZMPを満足するように上体角加速度 |8および上体水平加速度 OCが決定される。

[0154] 補足すると、本実施形態の図 15の S518— S526の処理は、前記公報文献 1の図 2 3の S520— S528の処理と同じである。

[0155] 以上、説明した図 11の S2002— 1、 2004— 1の処理は、それを簡潔的に言えば、定常歩容パラメータの優先パラメータ (足平軌道パラメータなど）の値を現在値 (現在候補値）から S022の処理（詳しくは図 10の S100— S110の処理）で決定した値に所定量だけ近づけて更新し、その更新後の優先パラメータを含んで、定常歩容の境界条件を動力学モデル上で満足し得る新たな定常歩容パラメータを探索する処理である。そして、この処理では、 (Xs, Vx, co bs, ZMPrecpeek)が探索対象とされる。なお、 S 2002-1における定常歩容パラメータの優先パラメータの現在値 (更新前の候補値）は、 S2000で決定された定常歩容パラメータの仮値のうちの優先パラメータの値である。また、 S2004— 1の処理では、探索対象の初期候補値として、 S2000で決定された仮値が用いられる。

[0156] 図 11の説明に戻って、 S2002-1, S2004— 1の上記した処理の後、 S2002-1, S 2004— 1の処理と同様の処理（図 11では S2002— 2, S2004— 2)力 S繰り返される。そして、最終的に、 S2004— n (nは総繰り返し回数）において、定常歩容パラメータの優先パラメータは、 S022の処理で決定された値に一致させる。さらに、 S2004— nにおいて、 S2004-1と同様に、現在候補の定常歩容パラメータを基に、動力学モデル上で定常歩容の境界条件を満足するような探索対象 Xs, Vx, co bs, ZMPrecpeekの値が探索的に決定され、新たな定常歩容パラメータが決定される。

[0157] これらの繰り返し処理において、 S2002— k(k= 2, · ··, n)で優先パラメータを更新する前における優先パラメータの値は、 S2002— (k 1)での更新後の優先パラメ一タの値である（S2002— 1では、前記したように更新前の優先パラメータの値は S200 0で決定された仮値である）。また、 S2004— k(k= 2, · ··, n)の処理は、 S2004— 1の処理と同じである。但し、 S2004— kでは、探索対象 Xs, Vx, co bs, ZMPrecpeekの初期値補（図 12の S1202で設定する初期値候補）として、 S2004— kの処理の開始時に設定されている値、すなわち、 S2004— (k 1)の処理で最終的に探索された探索対象の値が用いられる（S2004— 1では、前記したように探索対象の初期値候補は、 S 2000で決定された仮値である）。

[0158] 以上のようにして、 S2000で決定された定常歩容パラメータの優先パラメタ一の値（仮値)を初期値として、該優先パラメータの値力段階的に S022の処理で決定された値 (これは今回歩容に関する要求を満足するための優先パラメータの値 (優先パラメータ要求値)である）に近づくように、該優先パラメータの値が段階的に更新され、最終的に S022の処理で決定された値に一致させられる (S2002-1, S2002-2, …… , S2002— n)。従って、これらの S2002— 1, S2002-2,…… , S2002— nの処理は、第 2発明における優先パラメータ漸近手段に相当する。そして、その優先パラメータの更新の都度、その更新後の優先パラメータを含む定常歩容パラメータの探索対象の値が、その更新の直前に決定された値を初期値候補として、定常歩容の境界条件を満たすように探索され、その探索結果の探索対象を含む定常歩容パラメ一タカ S新たに決定される（S2004— 1, 2004-2,…… , S2004— n)。従って、これらの S 2004-1, S2004-2,…… , S2004— nの処理は、第 2発明における新規定常歩容パラメータ決定手段に相当し、それぞれの処理で最終的に決定される探索対象を含む定常歩容パラメータが第 2発明における新規定常歩容パラメータに相当する。そして、 S2004— nで最終的に決定された新たな定常歩容パラメータがこれから生成しようとする今回歩容に続くべき定常歩容の歩容パラメータとされる。

[0159] 補足すると、上記の繰り返し処理の総繰り返し回数 nは、 S2000で決定する定常歩容パラメータの優先パラメータの値と、 S022で決定した優先パラメータの値 (優先パラメータ要求値)との差に応じて決定される。また、定常歩容パラメータのうち、優先パラメータおよび探索対象のパラメータ以外のパラメータ（固定的なパラメータ）は、 S2 000で決定された定常歩容パラメータの当該パラメータの値に維持される。

[0160] 上記の如く S2002—1— S2004— nの繰り返し処理が実行された後、 S2006において、現在候補の定常旋回歩容（S 2004— nの処理で最後に作成された定常歩容）を基に、本来の初期時刻 0における定常歩容の上体 3の運動状態である初期上体水平位置 X0、初期上体水平速度 VxO、初期上体姿勢角 Θ bOおよびその角速度 co bO、並びに初期上体鉛直位置 Z0、初期上体鉛直速度 VzOが求められる。さらに、 S2008 において、前記した初期発散成分 qの定義式に従って、定常旋回歩容の、本来の初期時刻 0における発散成分である定常旋回初期発散成分 q[0]が求められる。 S2006 および S2008で求められる値は、今回歩容に続く定常旋回歩容の第 1旋回歩容の支持脚座標系で見た値である。そして、 S2010において、定常旋回初期発散成分 q [0]を今回歩容の支持脚座標系から見た値である q"と、初期上体鉛直位置'速度を今回歩容の支持脚座標系力も見た値である (Z0"， VzO")を求める。

[0161] 以上が、図 11の処理の詳細である。

[0162] 以上説明した図 11の処理によって、 S2000で決定された仮の定常歩容パラメータ

(定常歩容の境界条件を満足するように過去に決定された定常歩容パラメータ）の優先パラメータの値を徐々に S022で決定した優先パラメータ (これから生成しょうとする今回歩容に続く定常歩容の優先パラメータ）の値に近づけるように更新しつつ、その更新の都度、定常歩容の境界条件を満足する定常歩容パラメータが新たに決定される。このため、定常歩容の境界条件を満足するような定常歩容を上体位置姿勢の発散が生じたりすることなぐ効率よく短時間で作成して、今回歩容に対応する定常歩容の初期状態を適切に求めることができる。

[0163] 図 9の説明に戻って、以上説明したように S024の処理を実行した後、 S026において、今回歩容の歩容パラメータが決定 (一部は仮決定)される。この処理は、図 16のフローチャートに従って実行される。ここで決定する歩容パラメータとしては、今回歩容における足平位置姿勢軌道 (各足平 22の位置姿勢軌道)、基準上体姿勢軌道、腕姿勢軌道、床反力鉛直成分軌道、床反力水平成分許容範囲、 ZMP軌道をそれぞれ規定するパラメータがあり、これらの各パラメータが S600— S610の処理で決定される。そして、 S612において、今回歩容における上体傾斜角復元期間 [Ta, Tb]が設定される。これらの処理は、前記公報文献 1の図 33のフローチャートの処理と同一であるので、ここでの詳細な説明は省略する力上記各軌道が前回歩容の終端の状態（=今回歩容の初期状態)から、今回歩容に関する前記した要求を満たしつつ、定常歩容につながるように各軌道を規定するパラメータが決定される。例えば、今回歩容の遊脚足平 22に関する足平軌道パラメータは、今回歩容の遊脚足平 22の着地予定位置姿勢および時刻がそれらの要求値を満たしつつ、今回歩容の終端にぉ、て該遊脚足平 22の位置姿勢が定常歩容の初期 (今回歩容の終端の時刻)で一致するように決定される。

[0164] 補足すると、 S610で決定される ZMP軌道パラメータは今回歩容の基準とする ZM P軌道 (仮目標 ZMP軌道)を規定するパラメータであり、そのパラメータにより規定される仮 ZMP軌道の例 (X軸方向の軌道の例）が図 22の最上段に示されている。該 Z MP軌道パラメータは、今回歩容の片脚支持期において、支持脚足平 22の接地面のほぼ中央付近に目標 ZMP位置し、且つ、片脚支持期に続く空中期では、目標 Z MPが今回歩容の終端において定常歩容の初期の ZMPまで連続的に変化するように決定される。また、図 16の S612で設定する上体傾斜角復元期間は、図 22の時刻 Ta力時刻 Tbまでの期間であり、今回歩容の片脚支持期の開始直後から終了直前までの期間である。

[0165] 補足すると、 S600— S610の処理で決定される今回歩容のパラメータは、今回歩容に関する要求を優先的に満足するように決定されるパラメータであるので、前記 S6 00— S610の処理で決定される今回歩容のパラメータは、前記第 1発明における優先パラメータに相当し、その決定された値は、優先パラメータ要求値に相当するものである。従って、 S600— S610の処理は、第 1発明における優先パラメータ要求値決定手段に相当するものである。また、 S600— S610の処理で決定される今回歩容のノラメータは、今回歩容パラメータを構成する全てのパラメータではない。定常歩容ノラメータの場合と同様、この他にも、今回歩容の歩容パラメータには種々様々なパラメータが含まれる。本実施形態では、今回歩容パラメータを構成するパラメータとして、 S600— S610で決定されるパラメータ（優先パラメータ）の他に、例えば、 ZMP 軌道パラメータを修正するための ZMP修正量を規定する ZMP修正パラメータと、上体傾斜復元モーメント ZMP換算値のピーク値 (この場合 2種類のピーク値）とが含まれる。これらのパラメータは、以下に説明する S028の処理の中で今回歩容の境界条件 (定常歩容に近づける条件)を満足するように探索的に決定されるパラメータである

[0166] なお、定常歩容パラメータの場合と同様、今回歩容パラメータを構成するパラメータを大別すると、前記優先パラメータとそれ以外の非優先パラメータとに大別される。そして、非優先パラメータには、上記の如く探索的に決定されるパラメータ (前記第 1発明における探索対象パラメータ）が含まれる。また、非優先パラメータには、歩容に関する要求、あるいは歩容に関する境界条件に依存しな、固定的なパラメータもある（例えば、ロボット 1の遊脚足平 22の持ち上げ高さ）。また、一つもしくは複数の上位のノラメータ力も従属的に決定される下位のパラメータもある。この場合、下位のパラメータの属性にっ、ては、定常歩容パラメータの場合と同じである。

[0167] 図 9の S028に進んで、今回歩容の歩容パラメータ（ZMP軌道パラメータ）が修正される (最終的な今回歩容パラメータが決定される)。この処理では、今回歩容の終端における発散成分が S024で決定した定常旋回歩容の初期発散成分 q"に一致するように (より詳しくは上体位置姿勢軌道を定常歩容に連続させ、もしくは近づけるように）、今回歩容の歩容パラメータが修正されて、最終的な今回歩容パラメータが決定される（より詳しくは、 ZMP修正パラメータと上体傾斜復元モーメント ZMP換算値の 2 種類のピーク値とが決定される)。本実施形態では、上記の如ぐ今回歩容の終端における発散成分が定常旋回歩容の初期発散成分 q"に一致する (もしくはほぼ一致する）ことが今回歩容の終端における境界条件である。

[0168] この処理は、図 17のフローチャートで示すサブルーチン処理に従って、段階的な探索処理により行われる。

[0169] 図 17のサブルーチン処理を説明すると、まず、 S2100において、前回歩容を生成したときの S026および S028の処理で最終的に決定された ZMP修正パラメータ a、並びに上体傾斜復元モーメント換算値の第 1ピーク値 ZMPrecpeekaおよび第 2ピーク値 ZMPrecpeekbを含む今回歩容パラメータの各パラメータ値を、これから生成しようとする今回歩容パラメータの各パラメータの仮値とする。但し、前回歩容の歩容パラメータの左右を反転させた上で、今回歩容の当該パラメータの仮値とする。例えば、今回歩容の支持脚側の足平軌道パラメータ、遊脚側の足平軌道パラメータ、 ZMP軌道ノラメータの仮値は、前回歩容のこれらのパラメータの左右を反転させたものに設定される。

[0170] ここで、図 17のフローチャートの処理中で求める（探索する）上体傾斜復元モーメント ZMP換算値の第 1ピーク値 ZMPrecpeekaおよび第 2ピーク値 ZMPrecpeekbは、今回歩容の上体傾斜角復元期間 [Ta, Tb]で上体姿勢を基準上体姿勢に近づけるために必要な床反力モーメントの ZMP換算値のパターンの 2つのピーク値を示す探索対象パラメータであり、その例を図示したものが図 21である。定常歩容の場合の上体傾斜復元モーメント ZMP換算値のピーク値は 1つであった力今回歩容の終端における上体姿勢角およびその角速度をそれぞれ定常歩容の初期上体姿勢角およびその角速度に一致させるために、本実施形態では、上体傾斜復元モーメント ZMP換算値の調整可能な 2つのパラメータとして、第 1ピーク値 ZMPrecpeekaおよび第 2ピーク値 ZMPrecpeekbが用いられる。本実施形態では、図 21に示す如ぐ今回歩容における上体傾斜復元モーメント ZMP換算値は、片脚支持期の前半の台形状のパターンと、後半側の台形状のパターンとを合成した形のノターンとされ、その前半側の台形状のパターンのピーク値が第 1ピーク値 ZMPrecpeeka、後半側の台形状のパターンのピーク値が第 2ピーク値 ZMPrecpeekbである。

[0171] また、図 17のフローチャートの処理中で求める ZMP修正パラメータ aは、今回歩容を定常歩容につなげる (今回歩容の終端の発散成分を定常歩容の初期発散成分 q" にほぼ一致させる）ための目標 ZMPの修正量を規定するパラメータであり、その例を図示したもの力図 22の中段の図である。図示の如ぐ ZMP修正量は、片脚支持期の開始直後から終了直前まで発生させる台形状のパターンとされ、そのピーク値 aが ZMP修正量のパターンを規定する ZMP修正パラメータとして用いられる。

[0172] 以上説明した S2100の処理は、とりあえず、前回歩容 (これは既に歩容の境界条件を満足するように決定されてヽる）の左右を反転させたものの歩容パラメータを今回歩容の歩容パラメータとして設定するということを意味する。このように設定された、今回歩容パラメータを基に前記動力学モデルを用いて今回歩容を生成すると、その今回歩容は、既に歩容の境界条件を満たすように決定された前回歩容の左右を反転させたものと一致することとなる。なお、上記のように設定された今回歩容パラメ一タは、第 1発明におけるベース歩容パラメータに相当するものである。従って、 S210 0の処理は、第 1発明におけるベース歩容パラメータ設定手段に相当する。

[0173] 補足すると、今回歩容をロボット 1の 2歩分の歩容カも成る歩容とした場合には、左右の反転などを行なうことなぐ前回歩容（2歩前の歩容)の歩容パラメータをそのまま S2100で今回歩容の歩容パラメータの仮値として設定するようにしてもょ、。あるヽは、今回歩容の歩容パラメータの仮値を前前回歩容の歩容パラメータに設定してもよい。

[0174] 次、で、 S2102— 1にお、て、探索対象 (探索対象パラメータ)である ZMP修正パラメータ aと上体姿勢傾斜復元モーメント ZMP換算値の第 1ピーク値 ZMPrecpeekaおよび第 2ピーク値 ZMPrecpeekbとを除く今回歩容パラメータの優先パラメータ（より詳しくは、 S026で決定する今回歩容の足平軌道パラメータ、基準上体姿勢軌道パラメ一タ、腕姿勢軌道パラメータ、床反力鉛直成分軌道パラメータ、床反力水平成分許容範囲を規定するパラメータ、 ZMP軌道パラメータ)の値を現在候補値 (S2100で設定された値)から前記 S026で決定した値に所定量だけ近づけた値に更新する。

[0175] 次いで、 S2104— 1において、現在候補の今回歩容パラメータ（S2100で仮決定された定常歩容パラメータの優先パラメータを S2102-1で更新したもの）を基に、今回歩容の前記境界条件 (今回歩容の終端の発散成分が定常歩容の初期の発散成分に一致、もしくはほぼ一致するという条件)を満足するような探索対象 a、

ZMPrecpeeka, ZMPrecpeekbの値を探索的に決定する。この処理は、図 18のフローチャートに示す如く行なわれる。なお、前記図 12の処理の説明の場合と同様、以下の図 18の処理（その処理の中のサブルーチン処理を含む）の説明にお!/、ては、歩容ノラメータの各パラメータの値に関する「現在値」は、該当するパラメータの「現在 (該当処理の実行時点)設定されている候補値もしくは仮値」の意味で使用する。また、「現在の〇〇」（〇〇はあるパラメータ）というときは、「現在 (該当処理の実行時点)候補となっている〇〇」の意味で使用する。

[0176] 以下、図 18の処理を説明すると、まず、 S1700において、探索対象である ZMP修正パラメータ、上体傾斜復元モーメント ZMP換算値の第 1ピーク値、第 2ピーク値 (a , ZMPrecpeeka, ZMPrecpeekb)の現在値を、これらの探索対象の初期値候補として設定する。

[0177] 次いで、 S1704— S 1716のループ処理が実行される。その処理を概略的に説明すれば、まず、 S 1704において、探索対象である a、 ZMPrecpeekaおよび

ZMPrecpeekbの現在値 (現在候補値）と前記動力学モデルとを用いて今回歩容 (仮今回歩容）が算出される。より詳しくは、探索対象 a, ZMPrecpeeka, ZMPrecpeekbの現在値と優先パラメータの現在値とを含む回歩容パラメータと、動力学モデルとを用いて仮今回歩容が算出される。なお、 S 1704のより具体的な処理については後述する。

[0178] そして、 S1706— S1716において、 S 1704で算出した仮今回歩容の終端 (今回歩容の遊脚足平の着地予定時刻)での発散成分と定常歩容の初期発散成分 q" (前記 S024で最終的に算出したもの）との差、仮今回歩容の終端での上体姿勢角と定常歩容の初期上体姿勢角（前記 S024で最終的に算出したもの）との差、並びに、仮今回歩容の終端での上体姿勢角の角速度と定常歩容の初期上体姿勢角速度 (前記 S024で最終的に算出したもの）との差が求められる。そして、これらの差の値がいずれも許容範囲内にある力否か (0に近いか否力 )の条件を満たしている力判断し、満たしていない場合には、探索対象の値を変更する。これを繰り返すことで、最終的に動力学モデル上で仮今回歩容を定常歩容につながらせることが可能な探索対象のパラメータの修正値としての a、 ZMPrecpeekaおよび ZMPrecpeekbを含む今回歩容パラメータが新たに決定される。

[0179] S1706— S1706の処理をより具体的に説明すると、 S1706において、仮今回歩容の終端での上体位置速度 (Xe, Ve)から、今回歩容の終端発散成分 qO[k]を前記した発散成分の定義式に従って算出する。

[0180] 次いで、 S1708において、この終端発散成分 q0[k]と定常旋回歩容の初期発散成分 q"との差を終端発散成分誤差 errqとして求める。

[0181] さらに、 S1710において、定常歩容の初期上体姿勢角と、今回歩容 (仮今回歩容）の終端上体姿勢角との差を終端上体姿勢角誤差 Θ berrとして求めると共に、定常歩容の初期上体姿勢角速度と、今回歩容 (仮今回歩容)の終端上体姿勢角速度との差を終端上体姿勢角速度誤差 ω berrとして求める。

[0182] 上記の如くもとめた誤差 errq、 0 berr、 co berrは、 S1704において作成した仮今回歩容の、境界条件からのずれ度合いを表すものである。

[0183] 次いで、 S1712において、上記の如くもとめた errq、 0 berr、 co berrがいずれも 0近傍の所定の許容範囲内にあるカゝ否かを判断し、その判断結果が YESである場合には、 S1704— S1716のループ処理を終了する。この場合、このループ処理の終了時現在の探索対象を含む今回歩容パラメータが動力学モデル上で境界条件を満たし得る今回歩容パラメータとして得られる。

[0184] 一方、 S1712の判断結果が NOである場合には、現在の探索対象（a,

ZMPrecpeeka, ZMPrecpeekb)の値の近辺に、それぞれのパラメータの値を所定の微小量 A a, Δ ZMPrecpeeka, Δ ZMPrecpeekbだけ変化させた複数（本実施形態では 3 個）の探索対象の候補を決めて、それぞれの探索対象の候補を含む今回歩容パラメータ (現在の今回歩容パラメータの探索対象を新たに決めた各候補に修正した今回歩容パラメータ）を基に、 S1704— S1710と同じ処理を実行して、それぞれの探索対象の候補に対応する誤差（errq、 Θ berr、 co berr)の組を求める。

[0185] 次いで、 S1716において、現在の（a, ZMPrecpeeka, ZMPrecpeekb)およびその近辺の探索対象の候補のそれぞれに対応する誤差 (errq、 Θ berr, co berr)の組を基に、最急降下法やシンプレックス法などの探索手法によって、探索対象 (a,

ZMPrecpeeka, ZMPrecpeekb)の新たな候補を決定する。そして、 S 1704力の処理が再び繰り返される。

[0186] 以上のようにして、（a, ZMPrecpeeka, ZMPrecpeekb)を探索対象として、今回歩容の終端の境界条件を満たす新たな今回歩容パラメータが探索的に決定される。なお、図 18の処理では、今回歩容パラメータのうちの優先パラメータ (足平軌道パラメータ、基準上体姿勢軌道パラメータなど）は、図 18の処理の開始時の値に維持される。

[0187] この図 18の処理中の前記 S1704の処理を以下に説明する。この処理は、図 19のフローチャートで示すサブルーチン処理により実行される。図 19のサブルーチン処理は、図示の通り、前回歩容の終端状態 (詳しくは今回歩容の支持脚座標系で見た前回歩容の終端状態)を今回歩容 (仮今回歩容)の初期状態として (S800)、その初期状態力も今回歩容の終端時刻 Tcurr (今回歩容の遊脚足平 22の着地予定時刻）まで今回歩容の瞬時値を時系列的に作成する（S802— S806)処理である。なお、図 19の「k」は、作成する今回歩容の瞬時値の時系列の時刻である。そして、図 19の S804のサブルーチン処理は、先に定常歩容の作成処理に関して説明した図 14の処理と同様に行なわれる。

[0188] この場合の図 14の処理では、 S400、 S404— S410の処理では、現在の今回歩容パラメータの優先パラメータを基に、目標床反力鉛直成分、目標両足平位置姿勢、基準上体姿勢、目標腕姿勢、目標上体鉛直位置、床反力水平成分許容範囲の瞬時値が求められる。また、図 19の S804の中で実行される図 14中の S402の処理では、 ZMP修正パラメータ aの現在値 (候補値) aにより規定される ZMP修正量（図 22の中段図を参照）を現在の今回歩容パラメータの ZMP軌道パラメータにより規定される目標 ZMP軌道（図 22の上段図を参照）〖こカ卩えることで、該目標 ZMP軌道を修正してなる ZMP軌道（図 22の下段図を参照）の瞬時値が求められる。

[0189] さらに、 S412の処理によって、動力学モデルを用いて、図中に記載された条件を満たすように上体水平加速度および上体姿勢角加速度の瞬時値が決定される。そして、 S414の処理によって、上体水平加速度および上体姿勢角加速度をそれぞれ 2 階積分して、上体水平位置および上体姿勢角の瞬時値が決定される。

[0190] また、仮今回歩容の作成時における S412のサブルーチン処理である図 15の処理も、定常歩容の場合と同様に行われる。すなわち、仮今回歩容の瞬時値を作成しょうとしている現在時刻 k (作成中の仮今回歩容内での時刻）が前記上体傾斜角復元期間内の時刻でないときには、 S504— S516の処理〖こよって、動力学モデル上で、目標 ZMP (ZMP修正量により修正した目標 ZMP)を満足し、且つ、全体重心の水平加速度による慣性力に釣り合う床反力水平成分が時刻 kの床反力水平成分許容範囲の瞬時値内に収まるように、上体並進モードの上体水平加速度 αと、上体回転モードの上体角加速度 β (上体姿勢角の角加速度）とが決定される。

[0191] また、現在時刻 k (作成中の仮今回歩容内での時刻）が前記上体傾斜角復元期間内の時刻であるときには、 S518— S526の処理によって、上体角加速度 j8は、動力学モデル上で、上体傾斜復元モーメント ZMP換算値パターンの瞬時値 (これは上体傾斜復元モーメント ZMP換算値の第 1ピーク値 ZMPrecpeekaおよび第 2ピーク値 ZMPrecpeekbの現在値 (候補値）と現在時刻 kとに応じて定まる。図 21を参照）に対応する床反力モーメントを発生するように決定される。また、上体水平加速度は、動力学モデル上で、上体並進モードによって発生する目標 ZMP (ZMP修正量により修正した目標 ZMP)まわりの床反力モーメントが 0になるための上体水平加速度と、上体角加速度 13による床反力モーメントと同等の床反力モーメントを発生する上体水平加速度との差として求められる。これにより、上体姿勢を基準上体姿勢に向かつて復元させつつ、目標 ZMPを満足するように上体角加速度 βおよび上体水平加速度 OCが決定される。

[0192] なお、仮今回歩容を生成する場合の上体傾斜角復元期間は前記図 16の S612で決定した時刻 Taから Tbの期間であるので、図 15の S500の処理は省略される。

[0193] 以上、説明した図 17の S2102-l、 2104-1の処理は、それを簡潔的に言えば、今回歩容パラメータの優先パラメータ (足平軌道パラメータなど）の値を現在値 (現在候補値）から S026の処理（詳しくは図 16の S600— S610の処理）で決定した値に所定量だけ近づけて更新し、その更新後の優先パラメータを含んで、今回歩容の境界条件を動力学モデル上で満足し得る新たな今回歩容パラメータを探索する処理である。そして、この処理では、 (a, ZMPrecpeeka, ZMPrecpeekb)が探索対象とされる。なお、 S2102— 1における今回歩容パラメータの優先パラメータの現在値 (更新前の候補値）は、 S2100で決定された今回歩容パラメータの仮値のうちの優先パラメータの値である。また、 S2104— 1の処理では、探索対象の初期候補値として、 S2100で決定された仮値が用いられる。

[0194] 図 17の説明に戻って、 S2102-1, S2104— 1の上記した処理の後、 S2102-1, S 2104— 1の処理と同様の処理（図 17では S2102— 2, S2104— 2)力 S繰り返される。そして、最終的に、 S2104— n (nは総繰り返し回数）において、今回歩容パラメータの優先パラメータは、 S026の処理で決定された値に一致させる。さらに、 S2104-nにおいて、 S2104-1と同様に、現在候補の今回歩容パラメータを基に、動力学モデル上で今回歩容の境界条件を満足するような探索対象 a, ZMPrecpeeka,

ZMPrecpeekbの値が探索的に決定され、新たな今回歩容パラメータが決定される。

[0195] これらの繰り返し処理において、 S2102 k(k= 2, · ··, n)で優先パラメータを更新する前における優先パラメータの値は、 S2102— (k 1)での更新後の優先パラメ一タの値である（S2102— 1では、前記したように更新前の優先パラメータの値は S210 0で決定された仮値である）。また、 S2104— k(k= 2, · ··, n)の処理は、 S2104— 1の処理と同じである。但し、 S2104— kでは、探索対象 Xs, Vx, co bs, ZMPrecpeekの初期値候補（図 18の S1700で設定する初期値候補）として、 S2104-kの処理の開始時に設定されている値、すなわち、 S2104— (k 1)の処理で最終的に探索された探索対象の値が用いられる（S2104— 1では、前記したように探索対象の初期値候補は、 S2100で決定された仮値である）。

[0196] 以上のようにして、 S2100で決定された今回歩容パラメータの優先パラメータの値（仮値)を初期値として、該優先パラメータの値が段階的に S026の処理で決定された値 (これは今回歩容に関する要求を満足するための優先パラメータの値 (優先パラメータ要求値)である）に近づくように、該優先パラメータの値が段階的に更新され、最終的に S026の処理で決定された値に一致させられる（S2102— 1, S2102— 2,… · ··, S2102— n)。従って、これらの S2102— 1, S2102-2,…… , S2102— nの処理は、第 1発明における優先パラメータ漸近手段に相当する。そして、その優先パラメータの更新の都度、その更新後の優先パラメータを含む今回歩容パラメータの探索対象の値が、その更新の直前に決定された値を初期値候補として、今回歩容の境界条件を満たすように探索され、その探索結果の探索対象を含む今回歩容パラメータ力 ^s新たに決定される（S2104— 1, 2104-2,…… , S2104— n)。従って、これらの S2 104-1, S2104-2,…… , S2104— nの処理は、第 1発明における新規歩容ノラメータ決定手段に相当し、それぞれの処理で最終的に決定される探索対象を含む今回歩容パラメータが第 1発明における新規歩容パラメータに相当する。そして、 S210 4 nで最終的に決定された新たな今回歩容パラメータがこれから生成しょうとする今回歩容の歩容パラメータである。

[0197] 補足すると、上記の繰り返し処理の総繰り返し回数 nは、 S2100で決定する今回歩容パラメータの優先パラメータの値と、 S026で決定した優先パラメータの値 (優先パラメータ要求値)との差に応じて決定される。また、今回歩容パラメータのうち、優先パラメータおよび探索対象のパラメータ以外のパラメータ（固定的なパラメータ）は、 S2 100で決定された今回歩容パラメータの当該パラメータの値に維持される。

[0198] 以上説明した図 17の処理によって、 S2100で決定された仮の今回歩容パラメータ

(今回歩容の境界条件を満足するように過去に決定された今回歩容パラメータ）の優先パラメータの値を徐々に S026で決定した優先パラメータ (これから生成しょうとする今回歩容の優先パラメータ）の値に近づけるように更新しつつ、その更新の都度、境界条件を満足する今回歩容パラメータが新たに決定される。このため、境界条件を満足するような今回歩容を上体位置姿勢の発散が生じたりすることなぐ効率よく短時間で作成することができる。

[0199] 図 12の説明に戻って、以上説明したように S028の処理を実行した後、 S030に進んで、フルモデル補正用の ZMP許容範囲と床反力水平成分許容範囲を規定するパラメータが決定される。

[0200] この処理は、前記公報文献 1の図 13の S030の処理と同一であり、ここでの説明は省略する。

[0201] 以上説明した S018から S030までの処理力前記図 5の歩容パラメータ決定部 10 Oaで実行される処理である。

[0202] S030の処理を実行した後、あるいは、 S016の判断結果が NOであるときには、 SO 32に進んで、今回歩容の瞬時値を逐次決定する。この処理のサブルーチン処理は、仮今回歩容の生成に関して説明した前記図 19のフローチャートの処理と同じである。この場合、 ZMPパラメータ a、上体傾斜復元モーメント ZMP換算値の第 1ピーク値 ZMPrecpeekaおよび第 2ピーク値 ZMPrecpeekbとしては、図 12の S028で最終的に決定したもの（図 17の S2104-nの処理で最終的に探索されたもの）が用いられる。

[0203] 次いで、 S034に進んで、ロボット 1のスピン（鉛直軸まわりの回転）をキャンセルするための腕体 5, 5の動作が決定される。この処理は、ロボット 1の腕を振らずに目標歩容通りにロボット 1を運動させた場合に目標 ZMPまわりに発生する床反力モーメントの鉛直成分と逆向きの床反力モーメントを腕体 5, 5の腕振り（両腕体 5, 5を前後逆方向に振る運動）によって発生させるように腕体 5, 5の姿勢を決定するものであり、前記公報文献 1の図 13の S034と全く同様に行われる。その詳細は、同公報文献 1 に記載されているので、ここではさらなる説明を省略する。

[0204] 次!、で、 S036に進んで、フルモデル補正用（前記フルモデル補正部 100eの処理用）の ZMP許容範囲の瞬時値と、床反力水平成分許容範囲の瞬時値とが決定される。この処理では、前記 S030で決定した ZMP許容範囲および床反力水平成分許容範囲を規定する歩容パラメータに基づいて決定される。

[0205] 以上説明した S032— S036の処理が、前記図 5の目標瞬時値発生部 100bで実行される処理の詳細である。

[0206] 次!、で、 S038に進んで、フルモデルを用いた補正歩容を発生する。この処理は、前記フルモデル補正部 100cにより実行される処理である。この場合、この処理は、前記公報文献 1の図 13の S038の処理と同一であり、同公報文献 1に記載されたとおりに実行される。従って、本明細書では詳細な説明は省略する。この処理により、目標上体位置姿勢 (前記変位次元補正歩容の上体位置姿勢)をさらに修正してなる補正目標上体位置姿勢と補正目標床反力モーメントとが決定される。

[0207] 以上が、本実施形態における歩容生成装置 100の歩容生成処理である。

[0208] 次に図 4を参照して複合コンプアライアンス制御装置 101の動作を説明しておく。なお、複合コンプライアンス制御装置 101の動作は、本出願人が先に出願した特開平 10— 277969号公報などに詳細に記載されているので、本明細書では概略的な説明にとどめる。歩容生成装置 100において、上記したように生成された目標歩容のうち、補正目標上体位置姿勢 (軌道)、目標腕姿勢 (軌道)が、ロボット幾何学モデル（逆キネマテイクス演算部） 102に送出される。

[0209] また、目標足平位置姿勢 (軌道)、目標 ZMP軌道 (目標全床反力中心点軌道)、および目標全床反力（軌道）（補正目標床反力モーメントと目標床反力鉛直成分)は、複合コンプライアンス動作決定部 104に送られると共に、目標床反力分配器 106にも送られる。そして、目標床反力分配器 106で、床反力は各足平 22に分配され、目標各足平床反力中心点および目標各足平床反力が決定される。この決定された目標各足平床反力中心点および目標各足平床反力は複合コンプライアンス動作決定部 104に送られる。

[0210] 複合コンプライアンス動作決定部 104から、機構変形補償付き修正目標足平位置姿勢（軌道）がロボット幾何学モデル 102に送られる。ロボット幾何学モデル 102は、目標上体位置姿勢 (軌道)と機構変形補償付き修正目標足平位置姿勢 (軌道)を入力されると、それらを満足する脚体 2, 2の 12個の関節の関節変位指令 (値)を算出して変位コントローラ 108に送る。変位コントローラ 108は、ロボット幾何学モデル 102 で算出された関節変位指令 (値)を目標値としてロボット 1の 12個の関節の変位を追従制御する。また、ロボット幾何学モデル 102は、目標腕姿勢を満足する腕関節の変位指定 (値）を算出して変位コントローラ 108に送る。変位コントローラ 108は、ロボット幾何学モデル 102で算出された関節変位指令 (値)を目標値としてロボット 1の腕体の 12個の関節の変位を追従制御する。

[0211] ロボット 1に生じた床反力（詳しくは実各足床反力）は 6軸力センサ 50によって検出される。その検出値は前記複合コンプライアンス動作決定部 104に送られる。また、口ボット 1に生じた姿勢傾斜偏差 Θ errx, Θ erry (詳しくは目標上体姿勢角に対する実姿勢角の偏差で、ロール方向（X軸回り）の姿勢角偏差が Θ errxであり、ピッチ方向（ Y軸回り）の姿勢角偏差が Θ erryである）が姿勢センサ 54を介して検出され、その検出値は姿勢安定化制御演算部 112に送られる。この姿勢安定化制御演算部 112で、ロボット 1の上体姿勢角を目標上体姿勢角に復元するための目標全床反力中心点 (目標 ZMP)まわり補償全床反力モーメントが算出されて複合コンプライアンス動作決定部 104に送られる。複合コンプライアンス動作決定部 104は、入力値に基づいて目標床反力を修正する。具体的には、目標全床反力中心点（目標 ZMP)回りに補償全床反力モーメント、あるいは、補償全床反力モーメントと補正目標床反力モーメントとの和が作用するように目標床反力を修正する。

[0212] 複合コンプライアンス動作決定部 104は、修正された目標床反力に、センサ検出値など力も算出される実ロボットの状態および床反力を一致させようと上記機構変形補償付き修正目標足平位置姿勢 (軌道)を決定する。この場合、機構変形補償付き修正目標足平位置姿勢は、前記コンプライアンス機構 72の等の機構的変形を考慮したものである。ただしすベての状態を目標に一致させることは事実上不可能であるので、これらの間にトレードオフ関係を与えて妥協的になるベく一致させる。すなわち、各目標に対する制御偏差に重みを与えて、制御偏差 (あるいは制御偏差の 2乗）の重み付き平均が最小になるように制御する。これにより、実際の足平位置姿勢と全床反力とが目標足平位置姿勢と目標全床反力とに概ね従うように制御される。

[0213] なお、以上説明した実施形態では、歩容パラメータ (定常歩容パラメータおよび今回歩容パラメータ）を、前回歩容 (過去に決定した歩容）に対応するものから徐々に更新していくようにした力定常歩容、今回歩容のいずれにおいても、あら力じめ該歩容の境界条件を満足する標準 (基準)歩容パラメータを用意 (作成)して記憶保持しておき、それを起点として歩容パラメータを徐々に更新していくようにしてもよい。例えば、今回歩容の足平軌道パラメータに係る遊脚足平 22の着地予定位置姿勢を、口ボット 1の同じ場所での足踏みを行なう場合の位置姿勢から、要求値に対応する位置姿勢に徐々に更新したり、歩行周期を徐々に更新していくようにしてもよい。

[0214] また、前記実施形態では、今回歩容を定常歩容に近づけるために、今回歩容の終端の発散成分を定常歩容の初期発散成分にほぼ一致させることを今回歩容の境界条件として、その境界条件を満たすように今回歩容パラメータの探索対象を探索して決定するようにしたが、今回歩容の終端の上体位置 (水平位置および鉛直位置）と、上体速度 (水平速度および鉛直速度)とをそれぞれ定常歩容の初期の上体位置、上体速度にほぼ一致させることを今回歩容の境界条件とし、この境界条件を満たすように今回歩容パラメータの探索対象を探索して決定するようにしてもよ!、。

[0215] あるいは、今回歩容の終端のロボット 1の全体重心の位置とその変化速度との重み付き平均値を、定常歩容の初期の当該重み付き平均値にほぼ一致させることを境界条件として、その境界条件を満たすように今回歩容パラメータの探索対象を決定するようにしてもよい。

[0216] また、定常歩容パラメータを決定するとき、定常歩容の境界条件を満たすために、定常歩容パラメータの探索対象として、ロボット 1の上記重み付き平均値、または発散成分を用いてもよい。なお、重み付き平均値は、所定の重みを設定することで、絶対的な大きさを無視すれば、発散成分と等価 (より正確には、発散成分と比例関係）になる。

産業上の利用可能性

[0217] 以上の説明から明らかなように、本発明の移動ロボットの歩容生成装置は、歩容の発散を防止しつつ、所要の境界条件を満足し得る歩容を効率よく生成することができ、特に 2足移動ロボットのような本来的な安定性が低、移動ロボットの歩容を該移動口ボットの安定性を確保しつつ生成できる点で有用である。

図面の簡単な説明

[0218] [図 1]本発明の実施形態を適用する移動ロボット（2足歩行ロボット）の全体構成の概略を示す図。圆 2]図 1のロボットの各脚体の足平部分の構成を示す側面図。

[図 3]図 1のロボットに備えた制御ユニットの構成を示すブロック図。

[図 4]図 3の制御ユニットの機能的構成を示すブロック図。

圆 5]図 4に示す歩容生成装置の機能を示すブロック図。

[図 6] (a) , (b)はそれぞれロボットの運動モード（上体並進モード、上体回転モード）を説明するための図。

圆 7]歩容生成で用いる動力学モデルの構造を示す図。

[図 8]歩容生成で用いるフルモデルの構造を示す図。

[図 9]実施形態における歩容生成装置のメインルーチン処理を示すフローチャート。

[図 10]図 9のサブルーチン処理を示すフローチャート。

[図 11]図 10のサブルーチン処理を示すフローチャート。

[図 12]図 11のサブルーチン処理を示すフローチャート。

[図 13]図 12のサブルーチン処理を示すフローチャート。

[図 14]図 13のサブルーチン処理を示すフローチャート。

[図 15]図 14のサブルーチン処理を示すフローチャート。

[図 16]図 9のサブルーチン処理を示すフローチャート。

[図 17]図 9のサブルーチン処理を示すフローチャート。

[図 18]図 17のサブルーチン処理を示すフローチャート。

[図 19]図 18のサブルーチン処理を示すフローチャート。

[図 20]定常歩容における上体傾斜復元モーメント ZMP換算値の例を示すグラフ。

[図 21]今回歩容における上体傾斜復元モーメント ZMP換算値の例を示すグラフ。

[図 22]今回歩容における仮目標 ZMPと ZMP修正量と目標 ZMPとの例を示すグラフ

Claims

請求の範囲

所定の期間における移動ロボットの歩容を規定する複数のパラメータの組である歩容パラメータを決定し、その決定した歩容パラメータと前記移動ロボットの動力学モデルとを用いて前記所定の期間における移動ロボットの目標歩容を生成する歩容生成装置において、

前記新規歩容パラメータ決定手段は、前記新規歩容パラメータを新たに決定するときの前記優先パラメータ漸近手段による優先パラメータの値の更新回数を n (n: n≥l を満たす整数）とし、その第 n回目の更新処理によって得られた優先パラメータの値を第 n優先パラメータ更新値とし、当該新たに決定する新規歩容パラメータを第 n新規歩容パラメータとし、前記ベース歩容パラメータを第 0新規歩容パラメータとしたとき、非優先パラメータの値に第 n— 1新規歩容パラメータの非優先パラメータの値を設定し、且つ、優先パラメータの値を第 n優先パラメータ更新値に設定してなる歩容パラメータを初期探索候補歩容パラメータとして、この初期探索候補歩容パラメータの非優先パラメータのうちの所定のパラメータである探索対象パラメータの値を前記所定の境界条件を満たすように探索することにより第 n新規歩容パラメータを決定する手段であり、

前記優先パラメータ漸近手段による優先パラメータの値の最後の更新時に決定された新規歩容パラメータを前記目標歩容を規定する歩容パラメータとして、該新規歩容パラメータと前記動力学モデルとを用いて該目標歩容を生成するようにしたことを特徴とする移動ロボットの歩容生成装置。

所定の期間における移動ロボットの目標歩容を生成するとき、該目標歩容に続く仮想的な周期的歩容である定常歩容を規定する複数のパラメータの組である定常歩容パラメータを決定すると共に、その決定した定常歩容パラメータと前記移動ロボットの動力学モデルとを用いて生成される定常歩容に前記目標歩容を近づけるように該目標歩容を生成する移動ロボットの歩容生成装置において、

前記ベース定常歩容パラメータの優先パラメータの値を、該値が前記優先パラメ一タ要求値に一致するまで段階的に前記優先パラメータ要求値に漸近させるように更新する優先パラメータ漸近手段と、

該優先パラメータ漸近手段のよる優先パラメータの値の更新の都度、その更新後の値の優先パラメータを有し、且つ前記所定の境界条件を満たす歩容を前記動力学モデルを用いて生成し得る定常歩容パラメータである新規定常歩容パラメータを探索的に決定する新規定常歩容パラメータ探索手段とを備えると共に、

前記新規定常歩容パラメータ探索手段は、前記新規定常歩容パラメータを新たに決定するときの前記優先パラメータ漸近手段による優先パラメータの値の更新回数を n (n:n≥ 1を満たす整数)とし、その第 n回目の更新後の優先パラメータの値を第 n優先パラメータ更新値とし、当該新たに決定する新規定常歩容パラメータを第 n新規定常歩容パラメータとし、前記ベース定常歩容パラメータを第 0新規定常歩容パラメ一タとしたとき、非優先パラメータの値に第 n— 1新規定常歩容パラメータの非優先パラメ一タの値を設定し、且つ、優先パラメータの値に第 n優先パラメータ更新値を設定してなる歩容パラメータを初期探索候補歩容パラメータとして、この初期探索候補歩容ノラメータの非優先パラメータのうちの所定のパラメータである探索対象パラメータの値を前記所定の境界条件を満たすように探索することにより第 n新規定常歩容パラメータを決定する手段であり、

前記優先パラメータ漸近手段による優先パラメータの値の最後の更新時に決定された新規定常歩容パラメータを前記目標歩容に対応する定常歩容の定常歩容パラメータとして、該定常歩容パラメータと前記動力学モデルとを用いて生成される定常歩容に近づけるように前記目標歩容を生成するようにしたことを特徴とする移動ロボットの歩容生成装置。

[3] 前記優先パラメータ漸近手段による優先パラメータの値の総更新回数は、前記べ一ス歩容パラメータの優先パラメータの値と、前記優先パラメータ要求値との差に応じて設定されることを特徴とする請求項 1記載の移動ロボットの歩容生成装置。

[4] 前記優先パラメータ漸近手段による優先パラメータの値の総更新回数は、前記べース定常歩容パラメータの優先パラメータの値と、前記優先パラメータ要求値との差に応じて設定されることを特徴とする請求項 2記載の移動ロボットの歩容生成装置。

[5] 前記歩容パラメータは、前記目標歩容のうちの目標 ZMP軌道を規定するパラメ一タを前記探索対象パラメータとして含むことを特徴とする請求項 1記載の移動ロボットの歩容生成装置。

[6] 前記定常歩容パラメータは、前記定常歩容の 1周期の期間の一端における移動口ボットの運動の所定の状態量を規定するパラメータを前記探索対象パラメータとして含むことを特徴とする請求項 2記載の移動ロボットの歩容生成装置。

[7] 前記所定の境界条件は、前記所定の期間における歩容の境界における移動ロボットの運動の所定の状態量が前記境界において隣接する歩容における移動ロボットの運動の該所定の状態量と一致するという条件を含むことを特徴とする請求項 1記載の移動ロボットの歩容生成装置。

[8] 前記所定の境界条件は、前記所定の期間における歩容の終端側の境界における移動ロボットの運動の所定の状態量が該歩容に続くべき仮想的な周期的歩容として決定された定常歩容における移動ロボットの運動の該所定の状態量と一致するという条件を含むことを特徴とする請求項 1記載の移動ロボットの歩容生成装置。

[9] 前記所定の境界条件は、前記定常歩容の 1周期の始端と終端における移動ロボットの運動の所定の状態量が一致するという条件を含むことを特徴とする請求項 2記載の移動ロボットの歩容生成装置。

[10] 前記移動ロボットは、上体から延設された複数の脚体を備えた脚式移動ロボットであり、前記所定の状態量は、該ロボットの上体の位置、該上体の速度、該上体の姿勢角、該上体の姿勢角の角速度、該上体の位置と速度との重み付き平均値、該ロボットの全体重心の位置、該全体重心の速度、該全体重心の位置と速度との重み付き平均値、および発散成分のうちの少なくともいずれか一つを含むことを特徴とする請求項 6— 9のいずれか 1項に記載の移動ロボットの歩容生成装置。