JP2003334785A

JP2003334785A - ロボットの行動制御システム及び行動制御方法、並びにロボット装置

Info

Publication number: JP2003334785A
Application number: JP2003072844A
Authority: JP
Inventors: Masahiro Fujita; 雅博藤田; Takeshi Takagi; 剛高木; Rika Horinaka; 里香堀中; Nobuya Otani; 伸弥大谷
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2002-03-15
Filing date: 2003-03-17
Publication date: 2003-11-25
Anticipated expiration: 2023-03-17
Also published as: JP3558222B2

Abstract

(57)【要約】【課題】視覚や聴覚などの外部環境の認識結果や本能
や感情などの内部状態などのロボットが置かれている状
況を統合的に判断して行動を選択する。【解決手段】状況依存行動階層はスキーマのツリー構
造で構成され、親スキーマは外部刺激と内部状態を引数
として子供スキーマのＭｏｎｉｔｏｒ関数をコールする
ことができ、子供のスキーマはＡＬ値を返り値とする。
また、スキーマは自分のＡＬ値を算出するために、さら
に子供のスキーマのＭｏｎｉｔｏｒ関数をコールするこ
とができる。ルートのスキーマには各サブツリーからの
ＡＬ値が返されるので、Ｃｏｎｃｕｒｒｅｎｔな行動の
評価と行動の実行が実現する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、自律的な動作を行
ないユーザとのリアリスティックなコミュニケーション
を実現するロボットの行動制御システム及び行動制御方
法、並びにロボット装置に係り、特に、視覚や聴覚など
の外部環境の認識結果や本能や感情などの内部状態など
のロボットが置かれている状況を統合的に判断して適当
な行動を選択する状況依存行動型のロボットのための行
動制御システム及び行動制御方法、並びにロボット装置
に関する。

【０００２】

【従来の技術】電気的若しくは磁気的な作用を用いて人
間の動作に似せた運動を行なう機械装置のことを「ロボ
ット」という。ロボットの語源は、スラブ語の"ＲＯＢ
ＯＴＡ（奴隷機械）"に由来すると言われている。わが
国では、ロボットが普及し始めたのは１９６０年代末か
らであるが、その多くは、工場における生産作業の自動
化・無人化などを目的としたマニピュレータや搬送ロボ
ットなどの産業用ロボット（industrial robot）であっ
た。

【０００３】最近では、イヌやネコ、クマのように４足
歩行の動物の身体メカニズムやその動作を模したペット
型ロボット、あるいは、ヒトやサルなどの２足直立歩行
を行なう動物の身体メカニズムや動作を模した「人間
形」若しくは「人間型」のロボット（humanoid robot）
など、脚式移動ロボットの構造やその安定歩行制御に関
する研究開発が進展し、実用化への期待も高まってきて
いる。これら脚式移動ロボットは、クローラ式ロボット
に比し不安定で姿勢制御や歩行制御が難しくなるが、階
段の昇降や障害物の乗り越えなど、柔軟な歩行・走行動
作を実現できるという点で優れている。

【０００４】脚式移動ロボットの用途の１つとして、産
業活動・生産活動等における各種の難作業の代行が挙げ
られる。例えば、原子力発電プラントや火力発電プラン
ト、石油化学プラントにおけるメンテナンス作業、製造
工場における部品の搬送・組立作業、高層ビルにおける
清掃、火災現場その他における救助といったような危険
作業・難作業の代行などである。

【０００５】また、脚式移動ロボットの他の用途とし
て、上述の作業支援というよりも、生活密着型、すなわ
ち人間との「共生」あるいは「エンターティンメント」
という用途が挙げられる。この種のロボットは、ヒトあ
るいはイヌ（ペット）、クマなどの比較的知性の高い脚
式歩行動物の動作メカニズムや四肢を利用した豊かな感
情表現を忠実に再現する。また、あらかじめ入力された
動作パターンを単に忠実に実行するだけではなく、ユー
ザ（あるいは他のロボット）から受ける言葉や態度
（「褒める」とか「叱る」、「叩く」など）に対して動
的に対応した、生き生きとした応答表現を実現すること
も要求される。

【０００６】従来の玩具機械は、ユーザ操作と応答動作
との関係が固定的であり、玩具の動作をユーザの好みに
合わせて変更することはできない。この結果、ユーザは
同じ動作しか繰り返さない玩具をやがては飽きてしまう
ことになる。これに対し、インテリジェントなロボット
は、対話や機体動作などからなる行動を自律的に選択す
ることから、より高度な知的レベルでリアリスティック
なコミュニケーションを実現することが可能となる。こ
の結果、ユーザはロボットに対して深い愛着や親しみを
感じる。

【０００７】ロボットあるいはその他のリアリスティッ
クな対話システムでは、視覚や聴覚など外部環境の変化
に応じて逐次的に行動を選択していくのが一般的であ
る。また、行動選択メカニズムの他の例として、本能や
感情といった情動をモデル化してシステムの内部状態を
管理して、内部状態の変化に応じて行動を選択するもの
を挙げることができる。勿論、システムの内部状態は、
外部環境の変化によっても変化するし、選択された行動
を発現することによっても変化する。

【０００８】しかしながら、これら外部環境や内部状態
などのロボットが置かれている状況を統合的に判断して
行動を選択するという、状況依存型の行動制御に関して
は例は少ない。

【０００９】ここで、内部状態には、例えば生体で言え
ば大脳辺縁系へのアクセスに相当する本能のような要素
や、大脳新皮質へのアクセスに相当する内発的欲求や社
会的欲求などのように動物行動学的モデルで捉えられる
要素、さらには喜びや悲しみ、怒り、驚きなどのような
感情と呼ばれる要素などで構成される。

【００１０】従来のインテリジェント・ロボットやその
他の自律対話型ロボットにおいては、本能や感情などさ
まざまな要因からなる内部状態をすべて「情動」として
まとめて１次元的に内部状態を管理していた。すなわ
ち、内部状態を構成する各要素はそれぞれ並列に存在し
ており、明確な選択基準のないまま外界の状況や内部状
態のみで行動が選択されていた。

【００１１】従来のシステムでは、その動作の選択及び
発現は１次元の中にすべての行動が存在し、どれを選択
するかを決定していた。このため、動作が多くなるにつ
れてその選択は煩雑になり、そのときの状況や内部状態
を反映した行動選択を行なうことがより難しくなる。

【００１２】

【発明が解決しようとする課題】本発明の目的は、自律
的な動作を行ないリアリスティックなコミュニケーショ
ンを実現することができる、優れたロボットの行動制御
システム及び行動制御方法、並びにロボット装置を提供
することにある。

【００１３】本発明のさらなる目的は、視覚や聴覚など
の外部環境の認識結果や本能や感情などの内部状態など
のロボットが置かれている状況を統合的に判断して行動
を選択することができる、優れたロボットの行動制御シ
ステム及び行動制御方法、並びにロボット装置を提供す
ることにある。

【００１４】本発明のさらなる目的は、情動についての
存在意義をより明確にして、一定の秩序の下で外部刺激
や内部状態に応じた行動を好適に選択し実行することが
できる、優れたロボットの行動制御システム及び行動制
御方法、並びにロボット装置を提供することにある。

【００１５】本発明のさらなる目的は、視覚や聴覚など
の外部環境の認識結果や本能や感情などの内部状態など
のロボットが置かれている状況を統合的に判断して行動
を選択することができる、優れたロボットの行動制御シ
ステム及び行動制御方法、並びにロボット装置を提供す
ることにある。

【００１６】

【課題を解決するための手段及び作用】本発明は、上記
課題を参酌してなされたものであり、その第１の側面
は、自律的に動作するロボットのための行動制御システ
ムであって、ロボットの機体動作を記述する複数の行動
記述部と、機体の外部環境を認識する外部環境認識部
と、認識された外部環境及び／又は行動の実行結果に応
じたロボットの内部状態を管理する内部状態管理部と、
外部環境及び／又は内部状態に応じて前記の各行動記述
部に記述された行動の実行を評価する行動評価部と、を
具備することを特徴とするロボットの行動制御システム
である。

【００１７】但し、ここで言う「システム」とは、複数
の装置（又は特定の機能を実現する機能モジュール）が
論理的に集合した物のことを言い、各装置や機能モジュ
ールが単一の筐体内にあるか否かは特に問わない。

【００１８】前記外部環境認識部は、外部の視覚認識、
外部で発生する音声認識、外部から印加された接触認識
のうち少なくとも１つを行なう。また、前記内部状態管
理部は、ロボットの本能モデル及び／又は感情モデルを
管理する。

【００１９】前記行動記述部は、複数の行動記述部が機
体動作の実現レベルに応じた木構造形式に構成すること
ができる。この木構造は、動物行動学的（Ｅｔｈｏｌｏ
ｇｉｃａｌ）な状況依存行動を数式化した行動モデル
や、感情表現を実行するための枝など、複数の枝を含ん
でいる。例えば、ルート行動記述部の直近下位の階層で
は、「探索する（Ｉｎｖｅｓｔｉｇａｔｅ）」、「食べ
る（Ｉｎｇｅｓｔｉｖｅ）」、「遊ぶ（Ｐｌａｙ）」と
いう行動記述部が配設される。そして、「探索する（Ｉ
ｎｖｅｓｔｉｇａｔｅ）」の下位には、「Ｉｎｖｅｓｔ
ｉｇａｔｉｖｅＬｏｃｏｍｏｔｉｏｎ」、「Ｈｅａｄｉ
ｎＡｉｒＳｎｉｆｆｉｎｇ」、「Ｉｎｖｅｓｔｉｇａｔ
ｉｖｅＳｎｉｆｆｉｎｇ」というより具体的な探索行動
を記述した行動記述部が配設されている。同様に、行動
記述部「食べる（Ｉｎｇｅｓｔｉｖｅ）」の下位には
「Ｅａｔ」や「Ｄｒｉｎｋ」などのより具体的な飲食行
動を記述した行動記述部が配設され、行動記述部「遊ぶ
（Ｐｌａｙ）」の下位には「ＰｌａｙＢｏｗｉｎｇ」、
「ＰｌａｙＧｒｅｅｔｉｎｇ」、「ＰｌａｙＰａｗｉｎ
ｇ」などのより具体的な遊ぶ行動を記述した行動記述部
が配設されている。

【００２０】このような場合、前記行動評価部は該木構
造の上から下に向かって複数の行動記述部を同時並行的
に評価することができる。また、前記外部環境認識部に
よる新規認識及び／又は前記内部状態管理部による内部
状態の変化に応答して、前記行動評価部による前記の各
行動記述部の評価を実行して、木構造を上から下に向か
って評価結果としての実行許可を渡していくことによ
り、外部環境や内部状態の変化に応じた適当な行動を選
択的に実行することができる。すなわち、状況依存の行
動の評価並びに実行をＣｏｎｃｕｒｒｅｎｔに行なうこ
とができる。

【００２１】また、複数の行動記述部に記述された行動
を同時実行するときの機体上の資源の競合を管理する資
源管理部をさらに備えていてもよい。このような場合、
前記行動選択部は、資源の競合が調停されていることを
前提に、２以上の行動記述部を同時に選択することがで
きる。

【００２２】また、前記外部環境認識部による新規認識
により前記行動評価部による前記の各行動記述部の評価
を実行した結果、現在実行中の行動よりも高い評価値を
得た行動記述部が出現した場合、前記行動選択部は、現
在実行中の行動を停止して、評価値がより高い行動記述
部に記述された行動を優先的に実行するようにしてもよ
い。したがって、反射行動のようにより重要度や緊急性
の高い行動を、既に実行中の状況依存行動に割り込ん
で、優先的に実行することができる。このような場合、
該優先的に実行した行動が終了した後、一旦停止された
行動を再開させることが好ましい。

【００２３】また、前記行動選択部は、異なる外部環境
の変化に応じて同一の行動記述部を逐次選択するように
してもよい。このような場合、前記行動記述部に記述さ
れた行動を実行する度に外部環境毎に個別の作業空間を
割り当てるようにする。

【００２４】例えば、人物Ａとの対話という行動を実行
中に、人物Ｂがロボットと人物Ａとの対話に割り込み、
外部刺激と内部状態の変化に基づく活動度レベルの評価
を行なった結果、Ｂとの対話を行なう行動の方がより優
先度が高くなると、Ｂとの対話が割り込まれる。

【００２５】このような場合、Ａ又はＢのいずれとの対
話も同じ行動記述部に従って対話を行なうが、Ａとの対
話を行なう行動とは別に、Ｂとの対話を行なう行動のた
めの作業空間を割り当てることにより、対話内容の干渉
を防ぐ。すなわち、Ｂとの対話によりＡとの対話内容が
破壊されずに済むので、Ｂとの対話が終了すると、Ａと
の対話を中断した時点から再開することができる。

【００２６】また、本発明の第２の側面は、内部状態に
応じて自律的に動作するロボットの行動制御システム又
は行動制御方法であって、内部状態の指標である情動を
複数の階層構造にして管理する内部状態管理部又はステ
ップと、各階層の情動を満たす行動を選択的に実行する
行動選択部又はステップと、を特徴とするロボットの行
動制御システム又は行動制御方法である。

【００２７】ここで、前記内部状態管理部又はステップ
は、個体存続のために必要な１次情動と、該１次情動の
過不足により変化する２次情動という段階毎に階層化す
るとともに、該１次情動を生得的反射や生理的な階層か
ら連想に至るまで次元により階層化するようにしてもよ
い。

【００２８】そして、前記行動選択部又はステップは、
より低次の１次情動を満たす行動を優先的に選択するよ
うにしてもよい。あるいは、前記行動選択部又はステッ
プは、より高次の１次情動が低次の１次情動に比し著し
く不足している場合には、低次の１次情動を満たす行動
の選択を抑制するようにしてもよい。

【００２９】本発明の第２の側面に係るロボットの行動
制御システム又は行動制御方法によれば、情動について
その存在意義による複数階層化を行ない、それぞれの階
層で動作を決定する。決定された複数の動作から、その
ときの外部刺激や内部状態によってどの動作を行なうか
を決定する。それぞれの階層で行動は選択されるが、そ
の実施される順番はロボットの内部状態の優先順位に基
づくので、より低次の行動から優先的に動作を発現して
いくことにより、反射などの本能的行動や、記憶を用い
た動作選択などの高次の行動を１つの個体上で矛盾なく
発現することができる。また、行動をカテゴライズし
て、スキーマとして作成する際も明確な指標となる。

【００３０】本発明の第２の側面に係るロボットの行動
制御システム又は行動制御方法は、ロボットの外部環境
の変化を認識する外部環境認識部をさらに備えていても
よい。このような場合、前記行動選択部又はステップ
は、内部状態の指標に加え、外部環境の指標を基に行動
を選択することができる。

【００３１】また、前記内部状態管理部ステップは、バ
イオリズムなどを利用して、時間経過に応じて内部状態
の指標を変更するようにしてもよい。

【００３２】また、前記内部状態管理部又はステップ
は、行動選択部において選択された行動の実行に応じ
て、すなわち動作の程度に応じて内部状態の指標を変更
するようにしてもよい。

【００３３】また、前記内部状態管理部又はステップ
は、外部環境の変化に応じて内部状態の指標を変更する
ようにしてもよい。

【００３４】また、本発明の第２の側面に係るロボット
の行動制御システム又は行動制御方法は、外部環境から
内部状態の変化を連想記憶する連想記憶部又はステップ
をさらに備えていてもよい。このような場合、前記内部
状態管理部又はステップは、前記連想記憶部又はステッ
プが外部環境から想起した内部環境の変化を基に内部状
態の指標を変更するようにしてもよい。また、前記連想
記憶部又はステップは前記外部環境認識される対象物毎
に内部状態の変化を連想記憶するようにしてもよい。

【００３５】従来のロボットにおける動作の選択や発現
は、基本的には、対象物までの物理的距離や、そのとき
のロボットの内部状態によって決定されており、言い換
えれば、対象物の相違によりどのような行動をとるか、
といった行動選択は行なわれていない。

【００３６】これに対し、本発明の第２の側面に係るロ
ボットの行動制御システム又は行動制御方法によれば、
連想記憶を用いることにより、対象物毎に異なる内部状
態の変化を想起することができるので、同じ状況でもそ
の行動の発現し易さを異ならせることができる。すなわ
ち、外部の刺激や物理的状況、現在の内部状態に加え、
ロボットの対象物ごとの記憶を考慮して行動を選択する
ことができ、より多彩で多様化した対応を実現すること
ができる。

【００３７】例えば、「○○が見えているから××す
る」とか、「現在○○が不足だから（何に対しても）×
×する」などの外部環境又は内部状態によって決まった
行動をするのではなく、「○○が見えても△△なので□
□する」とか、「○○が見えているけど××なので■■
する」など、対象物に関する内部状態の変化記憶を用い
ることにより、行動にバリエーションを付けることがで
きる。

【００３８】本発明のさらに他の目的、特徴や利点は、
後述する本発明の実施形態や添付する図面に基づくより
詳細な説明によって明らかになるであろう。

【００３９】

【発明の実施の形態】以下、図面を参照しながら本発明
の実施形態について詳解する。

【００４０】Ａ．ロボット装置の構成図１には、本発明に実施に供されるロボット装置１の機
能構成を模式的に示している。同図に示すように、ロボ
ット装置１は、全体の動作の統括的制御やその他のデー
タ処理を行なう制御ユニット２０と、入出力部４０と、
駆動部５０と、電源部６０とで構成される。以下、各部
について説明する。

【００４１】入出力部４０は、入力部としてロボット装
置１の目に相当するＣＣＤカメラ１５や、耳に相当する
マイクロフォン１６、頭部や背中などの部位に配設され
てユーザの接触を感知するタッチ・センサ１８、あるい
は五感に相当するその他の各種のセンサを含む。また、
出力部として、口に相当するスピーカ１７、あるいは点
滅の組み合わせや点灯のタイミングにより顔の表情を形
成するＬＥＤインジケータ（目ランプ）１９などを装備
している。これら出力部は、音声やランプの点滅など、
脚などによる機械運動パターン以外の形式でもロボット
装置１からのユーザ・フィードバックを表現することが
できる。

【００４２】駆動部５０は、制御部２０が指令する所定
の運動パターンに従ってロボット装置１の機体動作を実
現する機能ブロックであり、行動制御による制御対象で
ある。駆動部５０は、ロボット装置１の各関節における
自由度を実現するための機能モジュールであり、それぞ
れの関節におけるロール、ピッチ、ヨーなど各軸毎に設
けられた複数の駆動ユニットで構成される。各駆動ユニ
ットは、所定軸回りの回転動作を行なうモータ５１と、
モータ５１の回転位置を検出するエンコーダ５２と、エ
ンコーダ５２の出力に基づいてモータ５１の回転位置や
回転速度を適応的に制御するドライバ５３の組み合わせ
で構成される。

【００４３】駆動ユニットの組み合わせ方によって、ロ
ボット装置１を例えば２足歩行又は４足歩行などの脚式
移動ロボットとして構成することができる。

【００４４】電源部６０は、その字義通り、ロボット装
置１内の各電気回路などに対して給電を行なう機能モジ
ュールである。本実施形態に係るロボット装置１は、バ
ッテリを用いた自律駆動式であり、電源部６０は、充電
バッテリ６１と、充電バッテリ６１の充放電状態を管理
する充放電制御部６２とで構成される。

【００４５】充電バッテリ６１は、例えば、複数本のリ
チウムイオン２次電池セルをカートリッジ式にパッケー
ジ化した「バッテリ・パック」の形態で構成される。

【００４６】また、充放電制御部６２は、バッテリ６１
の端子電圧や充電／放電電流量、バッテリ６１の周囲温
度などを測定することでバッテリ６１の残存容量を把握
し、充電の開始時期や終了時期などを決定する。充放電
制御部６２が決定する充電の開始及び終了時期は制御ユ
ニット２０に通知され、ロボット装置１が充電オペレー
ションを開始及び終了するためのトリガとなる。

【００４７】制御ユニット２０は、「頭脳」に相当し、
例えばロボット装置１の機体頭部あるいは胴体部に搭載
されている。

【００４８】図２には、制御ユニット２０の構成をさら
に詳細に図解している。同図に示すように、制御ユニッ
ト２０は、メイン・コントローラとしてのＣＰＵ（Cent
ralProcessing Unit）２１が、メモリやその他の各回路
コンポーネントや周辺機器とバス接続された構成となっ
ている。バス２７は、データ・バス、アドレス・バス、コ
ントロール・バスなどを含む共通信号伝送路である。バ
ス２７上の各装置にはそれぞれに固有のアドレス（メモ
リ・アドレス又はＩ／Ｏアドレス）が割り当てられてい
る。ＣＰＵ２１は、アドレスを指定することによってバ
ス２８上の特定の装置と通信することができる。

【００４９】ＲＡＭ（Random Access Memory）２２は、
ＤＲＡＭ（Dynamic RAM）などの揮発性メモリで構成さ
れた書き込み可能メモリであり、ＣＰＵ２１が実行する
プログラム・コードをロードしたり、実行プログラムに
よる作業データの一時的な保存のために使用される。

【００５０】ＲＯＭ（Read Only Memory）２３は、プロ
グラムやデータを恒久的に格納する読み出し専用メモリ
である。ＲＯＭ２３に格納されるプログラム・コードに
は、ロボット装置１の電源投入時に実行する自己診断テ
スト・プログラムや、ロボット装置１の動作を規定する
動作制御プログラムなどが挙げられる。

【００５１】ロボット装置１の制御プログラムには、カ
メラ１５やマイクロフォン１６などのセンサ入力を処理
してシンボルとして認識する「センサ入力・認識処理プ
ログラム」、短期記憶や長期記憶などの記憶動作（後
述）を司りながらセンサ入力と所定の行動制御モデルと
に基づいてロボット装置１の行動を制御する「行動制御
プログラム」、行動制御モデルに従って各関節モータの
駆動やスピーカ１７の音声出力などを制御する「駆動制
御プログラム」などが含まれる。

【００５２】不揮発性メモリ２４は、例えばＥＥＰＲＯ
Ｍ（Electrically Erasable and Programmable ROM）の
ように電気的に消去再書き込みが可能なメモリ素子で構
成され、逐次更新すべきデータを不揮発的に保持するた
めに使用される。逐次更新すべきデータには、暗号鍵や
その他のセキュリティ情報、出荷後にインストールすべ
き装置制御プログラムなどが挙げられる。

【００５３】インターフェース２５は、制御ユニット２
０外の機器と相互接続し、データ交換を可能にするため
の装置である。インターフェース２５は、例えば、カメ
ラ１５やマイクロフォン１６、スピーカ１７との間でデ
ータ入出力を行なう。また、インターフェース２５は、
駆動部５０内の各ドライバ５３−１…との間でデータや
コマンドの入出力を行なう。

【００５４】また、インターフェース２５は、ＲＳ（Re
commended Standard）−２３２Ｃなどのシリアル・イン
ターフェース、ＩＥＥＥ（Institute of Electrical an
d electronics Engineers）１２８４などのパラレル・
インターフェース、ＵＳＢ（Universal Serial Bus）イ
ンターフェース、ｉ−Ｌｉｎｋ（ＩＥＥＥ１３９４）イ
ンターフェース、ＳＣＳＩ（Small Computer System In
terface）インターフェース、ＰＣカードやメモリ・ス
ティックを受容するメモリ・カード・インターフェース
（カード・スロット）などのような、コンピュータの周
辺機器接続用の汎用インターフェースを備え、ローカル
接続された外部機器との間でプログラムやデータの移動
を行なうようにしてもよい。

【００５５】また、インターフェース２５の他の例とし
て、赤外線通信（ＩｒＤＡ）インターフェースを備え、
外部機器と無線通信を行なうようにしてもよい。さら
に、制御ユニット２０は、無線通信インターフェース２
６やネットワーク・インターフェース・カード（ＮＩ
Ｃ）２７などを含み、Ｂｌｕｅｔｏｏｔｈのような近接
無線データ通信や、ＩＥＥＥ８０２．１１ｂのような
無線ネットワーク、あるいはインターネットなどの広域
ネットワークを経由して、外部のさまざまなホスト・コ
ンピュータとデータ通信を行なうことができる。

【００５６】このようなロボット装置１とホスト・コン
ピュータ間におけるデータ通信により、遠隔のコンピュ
ータ資源を用いて、ロボット装置１の複雑な動作制御を
演算したり、リモート・コントロールすることができ
る。

【００５７】Ｂ．ロボット装置の行動制御システム図３には、本発明の実施形態に係るロボット装置１の行
動制御システム１００の機能構成を模式的に示してい
る。ロボット装置１は、外部刺激の認識結果や内部状態
の変化に応じて行動制御を行なうことができる。さらに
は、長期記憶機能を備え、外部刺激から内部状態の変化
を連想記憶することにより、外部刺激の認識結果や内部
状態の変化に応じて行動制御を行なうことができる。

【００５８】図示の行動制御システム１００にはオブジ
ェクト指向プログラミングを採り入れて実装することが
できる。この場合、各ソフトウェアは、データとそのデ
ータに対する処理手続きとを一体化させた「オブジェク
ト」というモジュール単位で扱われる。また、各オブジ
ェクトは、メッセージ通信と共有メモリを使ったオブジ
ェクト間通信方法によりデータの受け渡しとＩｎｖｏｋ
ｅを行なうことができる。

【００５９】行動制御システム１００は、外部環境（Ｅ
ｎｖｉｒｏｎｍｅｎｔｓ）を認識するために、視覚認識
機能部１０１と、聴覚認識機能部１０２と、接触認識機
能部１０３を備えている。

【００６０】視覚認識機能部（Ｖｉｄｅｏ）５１は、例
えば、ＣＣＤ（Charge Coupled Device：電荷結合素
子）カメラのような画像入力装置を介して入力された撮
影画像を基に、顔認識や色認識などの画像認識処理や特
徴抽出を行なう。視覚認識機能部５１は、後述する"Ｍ
ｕｌｔｉＣｏｌｏｒＴｒａｃｋｅｒ"，"ＦａｃｅＤｅｔ
ｅｃｔｏｒ"，"ＦａｃｅＩｄｅｎｔｉｆｙ"といった複
数のオブジェクトで構成される。

【００６１】聴覚認識機能部（Ａｕｄｉｏ）５２は、マ
イクなどの音声入力装置を介して入力される音声データ
を音声認識して、特徴抽出したり、単語セット（テキス
ト）認識を行ったりする。聴覚認識機能部５２は、後述
する"ＡｕｄｉｏＲｅｃｏｇ"，"ＡｕｔｈｕｒＤｅｃｏ
ｄｅｒ"といった複数のオブジェクトで構成される。接
触認識機能部（Ｔａｃｔｉｌｅ）５３は、例えば機体の
頭部などに内蔵された接触センサによるセンサ信号を認
識して、「なでられた」とか「叩かれた」という外部刺
激を認識する。

【００６２】内部状態管理部（ＩＳＭ：Internal Statu
s Manager）１０４は、本能や感情といった数種類の情
動を数式モデル化して管理しており、上述の視覚認識機
能部１０１と、聴覚認識機能部１０２と、接触認識機能
部１０３によって認識された外部刺激（ＥＳ：Ｅｘｔｅ
ｒｎａｌＳｔｉｍｕｌａ）に応じてロボット装置１の本
能や情動といった内部状態を管理する。

【００６３】感情モデルと本能モデルは、それぞれ認識
結果と行動履歴を入力に持ち、感情値と本能値を管理し
ている。行動モデルは、これら感情値や本能値を参照す
ることができる。

【００６４】本実施形態では、情動についてその存在意
義による複数階層で構成され、それぞれの階層で動作す
る。決定された複数の動作から、そのときの外部環境や
内部状態によってどの動作を行なうかを決定するように
なっている（後述）。また、それぞれの階層で行動は選
択されるが、より低次の行動から優先的に動作を発現し
ていくことにより、反射などの本能的行動や、記憶を用
いた動作選択などの高次の行動を１つの個体上で矛盾な
く発現することができる。

【００６５】本実施形態に係るロボット装置１は、外部
刺激の認識結果や内部状態の変化に応じて行動制御を行
なうために、時間の経過とともに失われる短期的な記憶
を行なう短期記憶部１０５と、情報を比較的長期間保持
するための長期記憶部１０６を備えている。短期記憶と
長期記憶という記憶メカニズムの分類は神経心理学に依
拠する。

【００６６】短期記憶部（ＳｈｏｒｔＴｅｒｍＭｅｍｏ
ｒｙ）１０５は、上述の視覚認識機能部１０１と、聴覚
認識機能部１０２と、接触認識機能部１０３によって外
部環境から認識されたターゲットやイベントを短期間保
持する機能モジュールである。例えば、カメラ１５から
の入力画像を約１５秒程度の短い期間だけ記憶する。

【００６７】長期記憶部（ＬｏｎｇＴｅｒｍＭｅｍｏｒ
ｙ）１０６は、物の名前など学習により得られた情報を
長期間保持するために使用される。長期記憶部１０６
は、例えば、ある行動モジュールにおいて外部刺激から
内部状態の変化を連想記憶することができる。

【００６８】また、本実施形態に係るロボット装置１の
行動制御は、反射行動部１０９によって実現される「反
射行動」と、状況依存行動階層１０８によって実現され
る「状況依存行動」と、熟考行動階層１０７によって実
現される「熟考行動」に大別される。

【００６９】反射的行動部（ＲｅｆｌｅｘｉｖｅＳｉｔ
ｕａｔｅｄＢｅｈａｖｉｏｒｓＬａｙｅｒ）１０９は、
上述の視覚認識機能部１０１と、聴覚認識機能部１０２
と、接触認識機能部１０３によって認識された外部刺激
に応じて反射的な機体動作を実現する機能モジュールで
ある。

【００７０】反射行動とは、基本的に、センサ入力され
た外部情報の認識結果を直接受けて、これを分類して、
出力行動を直接決定する行動のことである。例えば、人
間の顔を追いかけたり、うなずくといった振る舞いは反
射行動として実装することが好ましい。

【００７１】状況依存行動階層（ＳｉｔｕａｔｅｄＢｅ
ｈａｖｉｏｒｓＬａｙｅｒ）１０８は、短期記憶部１０
５並びに長期記憶部１０６の記憶内容や、内部状態管理
部１０４によって管理される内部状態を基に、ロボット
装置１が現在置かれている状況に即応した行動を制御す
る。

【００７２】状況依存行動階層１０８は、各行動毎にス
テートマシンを用意しており、それ以前の行動や状況に
依存して、センサ入力された外部情報の認識結果を分類
して、行動を機体上で発現する。また、状況依存行動階
層１０８は、内部状態をある範囲に保つための行動
（「ホメオスタシス行動」とも呼ぶ）も実現し、内部状
態が指定した範囲内を越えた場合には、その内部状態を
当該範囲内に戻すための行動が出現し易くなるようにそ
の行動を活性化させる（実際には、内部状態と外部環境
の両方を考慮した形で行動が選択される）。状況依存行
動は、反射行動に比し、反応時間が遅い。

【００７３】熟考行動階層（Ｄｅｌｉｂｅｒａｔｉｖｅ
Ｌａｙｅｒ）１０７は、短期記憶部１０５並びに長期記
憶部１０６の記憶内容に基づいて、ロボット装置１の比
較的長期にわたる行動計画などを行なう。

【００７４】熟考行動とは、与えられた状況あるいは人
間からの命令により、推論やそれを実現するための計画
を立てて行なわれる行動のことである。例えば、ロボッ
トの位置と目標の位置から経路を探索することは熟考行
動に相当する。このような推論や計画は、ロボット装置
１がインタラクションを保つための反応時間よりも処理
時間や計算負荷を要する（すなわち処理時間がかかる）
可能性があるので、上記の反射行動や状況依存行動がリ
アルタイムで反応を返しながら、熟考行動は推論や計画
を行なう。

【００７５】熟考行動階層１０７や状況依存行動階層１
０８、反射行動部１０９は、ロボット装置１のハードウ
ェア構成に非依存の上位のアプリケーション・プログラ
ムとして記述することができる。これに対し、ハードウ
ェア依存層制御部（ＣｏｎｆｉｇｕｒａｔｉｏｎＤｅｐ
ｅｎｄｅｎｔＡｃｔｉｏｎｓＡｎｄＲｅａｃｔｉｏｎ
ｓ）１１０は、これら上位アプリケーション（「スキー
マ」と呼ばれる行動モジュール）からの命令に応じて、
関節アクチュエータの駆動などの機体のハードウェア
（外部環境）を直接操作する。

【００７６】Ｃ．ロボット装置の記憶メカニズム上述したように、本実施形態に係るロボット装置１は、
短期記憶部１０５と長期記憶部１０６を備えているが、
このような記憶メカニズムは、神経心理学に依拠する。

【００７７】短期記憶は、字義通り短期的な記憶であ
り、時間の経過とともに失われる。短期記憶は、例え
ば、視覚や聴覚、接触など、外部環境から認識されたタ
ーゲットやイベントを短期間保持するために使用するこ
とができる。

【００７８】短期記憶は、さらに、感覚情報（すなわち
センサからの出力）をそのままの信号で１秒程度保持す
る「感覚記憶」と、感覚記憶をエンコードして限られた
容量で短期的に記憶する「直接記憶」と、状況変化や文
脈を数時間に渡って記憶する「作業記憶」に分類するこ
とができる。直接記憶は、神経心理学的な研究によれば
７±２チャンクであると言われている。また、作業記憶
は、短期記憶と長期記憶との対比で、「中間記憶」とも
呼ばれる。

【００７９】また、長期記憶は、物の名前など学習によ
り得られた情報を長期間保持するために使用される。同
じパターンを統計的に処理して、ロバストな記憶にする
ことができる。

【００８０】長期記憶はさらに「宣言的知識記憶」と
「手続的知識記憶」に分類される。宣言的知識記憶は、
場面（例えば教えられたときのシーン）に関する記憶で
ある「エピソード記憶」と、言葉の意味や常識といった
記憶からなる「意味記憶」からなる。また、手続的知識
記憶は、宣言的知識記憶をどのように使うかといった手
順記憶であり、入力パターンに対する動作の獲得に用い
ることができる。

【００８１】Ｃ−１．短期記憶部短期記憶部１０５は、自分の周りに存在する物体、ある
いはイベントを表現、記憶し、それに基づいてロボット
が行動することを目的とした機能モジュールである。視
覚や聴覚などのセンサ情報を基に物体やイベントの位置
を自己中心座標系上に配置していくが、視野外の物体な
どを記憶し、それに対する行動などを生じさせることが
できる。

【００８２】例えば、ある人物Ａと会話していて、別の
人物Ｂに声をかられたとき、Ａの位置や会話内容を保持
しながらＢとの会話を行ない、終了後Ａとの会話に戻る
場合などに短期記憶の機能が必要となる。但し、あまり
複雑な処理による統合を行なわずに、時間と空間で近い
センサ情報を同じ物体からの信号とみなすといった時空
間の簡単な近さによる統合を行なう。

【００８３】また、ステレオ視覚などの技術を用いてパ
ターン認識で判別可能な物体以外の物体の位置を記憶す
るために、自己中心座標系上に配置する。床面検出とと
もに利用して、障害物の位置を確率的に記憶するなどに
利用することができる。

【００８４】本実施形態では、短期記憶部１０５は、上
述した視覚認識機能部１０１、聴覚認識機能部１０２、
接触認識機能部１０３などの複数の認識器の結果からな
る外部刺激を時間的及び空間的に整合性を保つように統
合して、外部環境下の各物体に関する知覚を短期間の記
憶として状況依存行動階層（ＳＢＬ）１０８などの行動
制御モジュールに提供する。

【００８５】したがって、上位モジュールとして構成さ
れる行動制御モジュール側では、外界からの複数の認識
結果を統合して意味を持ったシンボル情報として扱い、
高度な行動制御を行なうことができる。また、以前に観
測された認識結果との対応問題などより複雑な認識結果
を利用して、どの肌色領域が顔でどの人物に対応してい
るかや、この声がどの人物の声なのかなどを解くことが
できる。

【００８６】また、認識した観測結果に関する情報を記
憶として短期記憶部５５が保持しているので、自律行動
する期間中に一時的に観測結果が来なかったりした場合
であっても、機体の行動制御を行なうアプリケーション
などの上位モジュールからは常にそこに物体が知覚され
ているように見えるようにすることができる。例えば、
センサの視野外の情報もすぐに忘れることなく保持して
いるので、ロボットが物体を一旦見失ったとしても、ま
た後で探し出すことができる。この結果、認識器の間違
いやセンサのノイズに強くなり、認識器の通知のタイミ
ングに依存しない安定したシステムを実現することがで
きる。また、認識器単体から見て情報が足りなくても、
他の認識結果が補うことができる場合があるので、シス
テム全体としての認識性能が向上する。

【００８７】また、関連する認識結果が結び付けられて
いるので、アプリケーションなどの上位モジュールで関
連する情報を使って行動判断することが可能である。例
えば、ロボット装置は、呼び掛けられた声を基に、その
人物の名前を引き出すことができる。この結果、挨拶の
応答に「こんにちは、ＸＸＸさん。」のように答えるな
どのリアクションが可能である。

【００８８】図４には、図３に示した行動制御システム
１００における外部刺激に応じた状況依存行動制御のメ
カニズムを図解している。外部刺激は、認識系の機能モ
ジュール１０１〜１０３によってシステムに取り込まれ
るとともに、短期記憶部（ＳＴＭ）１０５を介して状況
依存行動階層（ＳＢＬ）１０８に与えられる。図示の通
り、認識系の各機能モジュール１０１〜１０３や、短期
記憶部（ＳＴＭ）１０５、状況依存行動階層（ＳＢＬ）
１０８はオブジェクトとして構成されている。

【００８９】同図において、丸で表されているのが、
「オブジェクト」又は「プロセス」と呼ばれるエンティ
ティである。オブジェクト同士が非同期に通信し合うこ
とで、システム全体が動作する。各オブジェクトはメッ
セージ通信と共有メモリを使ったオブジェクト間通信方
法によりデータの受け渡しとＩｎｖｏｋｅを行なってい
る。以下に、各オブジェクトの機能について説明する。

【００９０】ＡｕｄｉｏＲｅｃｏｇ：マイクなどの音声
入力装置からの音声データを受け取って、特徴抽出と音
声区間検出を行なうオブジェクトである。また、マイク
がステレオである場合には、水平方向の音源方向推定を
行なうことができる。音声区間であると判断されると、
その区間の音声データの特徴量及び音源方向がＡｒｔｈ
ｅｒＤｅｃｏｄｅｒ（後述）に送られる。

【００９１】ＳｐｅｅｃｈＲｅｃｏｇ：ＡｕｄｉｏＲｅ
ｃｏｇから受け取った音声特徴量と音声辞書及び構文辞
書を使って音声認識を行なうオブジェクトである。認識
された単語のセットは短期記憶部（ＳｈｏｒｔＴｅｒｍ
Ｍｅｍｏｒｙ）１０５に送られる。

【００９２】ＭｕｌｔｉＣｏｌｏｒＴｒａｃｋｅｒ：色
認識を行なうオブジェクトであり、カメラなどの画像入
力装置から画像データを受け取り、あらかじめ持ってい
る複数のカラー・モデルに基づいて色領域を抽出し、連
続した領域に分割する。分割された各領域の位置や大き
さ、特徴量などの情報を出力して、短期記憶部（Ｓｈｏ
ｒｔＴｅｒｍＭｅｍｏｒｙ）１０５へ送る。

【００９３】ＦａｃｅＤｅｔｅｃｔｏｒ：画像フレーム
中から顔領域を検出するオブジェクトであり、カメラな
どの画像入力装置から画像データを受け取り、それを９
段階のスケール画像に縮小変換する。このすべての画像
の中から顔に相当する矩形領域を探索する。重なりあっ
た候補領域を削減して最終的に顔と判断された領域に関
する位置や大きさ、特徴量などの情報を出力して、Ｆａ
ｃｅＩｄｅｎｔｉｆｙ（後述）へ送る。

【００９４】ＦａｃｅＩｄｅｎｔｉｆｙ：検出された顔
画像を識別するオブジェクトであり、顔の領域を示す矩
形領域画像をＦａｃｅＤｅｔｅｃｔｏｒから受け取り、
この顔画像が手持ちの人物辞書のうちでどの人物に相当
するかを比較して人物の識別を行なう。この場合、顔検
出から顔画像を受け取り、顔画像領域の位置、大きさ情
報とともに人物のＩＤ情報を出力する。

【００９５】ＳｈｏｒｔＴｅｒｍＭｅｍｏｒｙ（短期記
憶部）：ロボット１の外部環境に関する情報を比較的短
い時間だけ保持するオブジェクトであり、Ｓｐｅｅｃｈ
Ｒｅｃｏｇから音声認識結果（単語、音源方向、確信
度）を受け取り、ＭｕｌｔｉＣｏｌｏｒＴｒａｃｋｅｒ
から肌色の領域の位置、大きさと顔領域の位置、大きさ
を受け取り、ＦａｃｅＩｄｅｎｔｉｆｙから人物のＩＤ
情報等を受け取る。また、ロボット１の機体上の各セン
サからロボットの首の方向（関節角）を受け取る。そし
て、これらの認識結果やセンサ出力を統合的に使って、
現在どこにどの人物がいて、しゃべった言葉がどの人物
のものであり、その人物とはこれまでにどんな対話を行
なったのかという情報を保存する。こうした物体すなわ
ちターゲットに関する物理情報と時間方向でみたイベン
ト（履歴）を出力として、状況依存行動階層（ＳＢＬ）
などの上位モジュールに渡す。

【００９６】ＳｉｔｕａｔｅｄＢｅｈａｖｉｏｒＬａｙ
ｅｒ（状況依存行動階層）：上述のＳｈｏｒｔＴｅｒｍ
Ｍｅｍｏｒｙ（短期記憶部）からの情報を基にロボット
１の行動（状況に依存した行動）を決定するオブジェク
トである。複数の行動を同時に評価したり、実行したり
することができる。また、行動を切り替えて機体をスリ
ープ状態にしておき、別の行動を起動することができ
る。

【００９７】ＲｅｓｏｕｒｃｅＭａｎａｇｅｒ：出力用
のコマンドに対してロボット１の各ハードウェアのリソ
ース調停を行なうオブジェクトである。図４に示す例で
は、音声出力用のスピーカをコントロールするオブジェ
クトと首のモーション・コントロールするオブジェクト
のリソース調停を行なう。

【００９８】ＳｏｕｎｄＰｅｒｆｏｒｍｅｒＴＴＳ：音
声出力を行なうためのオブジェクトであり、Ｒｅｓｏｕ
ｒｃｅＭａｎａｇｅｒ経由でＳｉｔｕａｔｅｄＢｅｈａ
ｖｉｏｒＬａｙｅｒから与えられたテキスト・コマンド
に応じて音声合成を行ない、ロボット１の機体上のスピ
ーカから音声出力を行なう。

【００９９】ＨｅａｄＭｏｔｉｏｎＧｅｎｅｒａｔｏ
ｒ：ＲｅｓｏｕｒｃｅＭａｎａｇｅｒ経由でＳｉｔｕａ
ｔｅｄＢｅｈａｖｉｏｒＬａｙｅｒから首を動かすコマ
ンドを受けたことに応答して、首の関節角を計算するオ
ブジェクトである。「追跡」のコマンドを受けたときに
は、ＳｈｏｒｔＴｅｒｍＭｅｍｏｒｙから受け取った物
体の位置情報を基に、その物体が存在する方向を向く首
の関節角を計算して出力する。

【０１００】短期記憶部１０５は、ターゲット・メモリ
とイベント・メモリという２種類のメモリ・オブジェク
トで構成される。

【０１０１】ターゲット・メモリは、各認識機能部１０
１〜１０３からの情報を統合して、現在知覚している物
体に関する情報すなわちターゲットを保持している。こ
のため、対象物体がいなくなったり現れたりすること
で、該当するターゲットを記憶領域から削除したり（Ｇ
ａｒｂａｇｅＣｏｌｌｅｃｔｏｒ）、新たに生成したり
する。また、１つのターゲットを複数の認識属性で表現
することができる（ＴａｒｇｅｔＡｓｓｏｃｉａｔ
ｅ）。例えば、肌色で顔のパターンで声を発する物体
（人間の顔）などである。

【０１０２】ターゲット・メモリで保持される物体（タ
ーゲット）の位置や姿勢情報は、それぞれの認識機能部
５１〜５３において使用されるセンサ座標系ではなく、
ロボット１の体幹などの機体上の特定の部位が所定の場
所に固定されたワールド座標系で表現を行なうようにし
ている。このため、短期記憶部（ＳＴＭ）１０５では、
ロボット１の各関節の現在値（センサ出力）を常に監視
して、センサ座標系からこの固定座標系への変換を行な
う。これにより、各認識機能部１０１〜１０３の情報を
統合することが可能になる。例えば、ロボット１００が
首などを動かしてセンサの姿勢が変化しても、状況依存
行動階層（ＳＢＬ）などの行動制御モジュールから見た
物体の位置は同じままであるので、ターゲットの取り扱
いが容易になる。

【０１０３】また、イベント・メモリは、外部環境下で
発生した過去から現在までのイベントを時系列的に格納
するオブジェクトである。イベント・メモリにおいて扱
われるイベントとして、ターゲットの出現と消失、音声
認識単語、自己の行動や姿勢の変化などの外界の状況の
変化に関する情報を挙げることができる。

【０１０４】イベントの中には、あるターゲットに関す
る状態変化が含まれている。このため、イベント情報と
して該当するターゲットのＩＤを含めることで、発生し
たイベントに関するより詳しい情報を、上述のターゲッ
ト・メモリから検索することも可能である。

【０１０５】図５及び図６には、各認識機能部１０１〜
１０３における認識結果に基づいて、短期記憶部１０５
内のターゲット・メモリ及びイベント・メモリに入る情
報の流れをそれぞれ示している。

【０１０６】図５に示すように、短期記憶部１０５（Ｓ
ＴＭオブジェクト）内には、外部環境からターゲットを
検出するターゲット検出器が設けられている。このター
ゲット検出器は、声認識結果や顔認識結果、色認識結果
などの各認識機能部１０１〜１０３による認識結果を基
に、新規ターゲットを追加したり、既存のターゲットを
認識結果に反映するように更新したりする。検出された
ターゲットは、ターゲット・メモリ内に保持される。

【０１０７】また、ターゲット・メモリには、もはや観
測されなくなったターゲットを探して消去するガーベッ
ジ・コレクタ（ＧａｒｂａｇｅＣｏｌｌｅｃｔｏｒ）
や、複数のターゲットの関連性を判別して同じターゲッ
トに結び付けるターゲット・アソシエート（Ｔａｒｇｅ
ｔＡｓｓｏｃｉａｔｅ）などの機能がある。ガーベッジ
・コレクタは、時間の経過に従ってターゲットの確信度
をデクリメントしていき、確信度が所定値を下回ったタ
ーゲットを削除（ｄｅｌｅｔｅ）することで実現され
る。また、ターゲット・アソシエートは、同じ属性（認
識タイプ）の特徴量が近いターゲット間で空間的・時間
的な近さを持つことで、同じターゲットを同定すること
ができる。

【０１０８】前述した状況依存型行動階層（ＳＢＬ）
は、短期記憶部１０５のクライアント（ＳＴＭクライア
ント）となるオブジェクトであり、ターゲット・メモリ
からは定期的に各ターゲットに関する情報の通知（Ｎｏ
ｔｉｆｙ）を受け取る。本実施形態では、ＳＴＭプロキ
シ・クラスが、短期記憶部１０５（ＳＴＭオブジェク
ト）とは独立したクライアント・ローカルな作業領域に
ターゲットをコピーして、常に最新の情報を保持してお
く。そして、ローカルなターゲット・リスト（Ｔａｒｇ
ｅｔｏｆＩｎｔｅｒｅｓｔ）の中から所望のターゲ
ットを外部刺激として読み出して、スキーマ（ｓｃｈｅ
ｍａ）すなわち行動モジュールを決定する（後述）。

【０１０９】また、図６に示すように、短期記憶部１０
５（ＳＴＭオブジェクト）内には、外部環境において発
生するイベントを検出するイベント検出器が設けられて
いる。このイベント検出器は、ターゲット検出器による
ターゲットの生成や、ガーベッジ・コレクタによるター
ゲットの削除をイベントとして検出する。また、認識機
能部１０１〜１０３による認識結果が音声認識である場
合には、その発話内容がイベントになる。発生したイベ
ントは、発生した時間順にイベント・メモリ内でイベン
ト・リストとして格納される。

【０１１０】状況依存型行動階層（ＳＢＬ）は、短期記
憶部１０５のクライアント（ＳＴＭクライアント）とな
るオブジェクトであり、イベント・メモリからは時々刻
々とのイベントの通知（Ｎｏｔｉｆｙ）を受け取る。本
実施形態では、ＳＴＭプロキシ・クラスが、短期記憶部
１０５（ＳＴＭオブジェクト）とは独立したクライアン
ト・ローカルな作業領域にイベント・リストをコピーし
ておく。そして、ローカルなイベント・リストの中から
所望のイベントを外部刺激として読み出して、スキーマ
（ｓｃｈｅｍａ）すなわち行動モジュールを決定する
（後述）。実行された行動モジュールは新たなイベント
としてイベント検出器により検出される。また、古いイ
ベントは、例えばＦＩＦＯ（Fast In Fast Out）形式で
イベント・リストから逐次的に廃棄される。

【０１１１】本実施形態に係る短期記憶メカニズムによ
れば、ロボット１は、外部刺激に関する複数の認識器の
結果を時間的及び空間的に整合性を保つように統合し
て、意味を持ったシンボル情報として扱うようになって
いる。これによって、以前に観測された認識結果との対
応問題などより複雑な認識結果を利用して、どの肌色領
域が顔でどの人物に対応しているかや、この声がどの人
物の声なのかなどを解くことを可能にしている。

【０１１２】以下では、図７〜図９を参照しながら、ロ
ボット１によるユーザＡ及びＢとの対話処理について説
明する。

【０１１３】まず、図７に示すように、ユーザＡが「ま
さひろ（ロボットの名前）くん！」と呼ぶと、各認識機
能部５１〜５３により音方向検出、音声認識、及び顔識
別が行なわれ、呼ばれた方向を向いて、ユーザＡの顔を
トラッキングしたり、ユーザＡとの対話を開始するとい
う状況依存の行動が行なわれる。

【０１１４】次いで、図８に示すように、今度はユーザ
Ｂが「まさひろ（ロボットの名前）くん！」と呼ぶと、
各認識機能部１０１〜１０３により音方向検出、音声認
識、及び顔識別が行なわれ、ユーザＡとの対話を中断し
た後（但し、会話のコンテキストを保存する）、呼ばれ
た方向を向いて、ユーザＢの顔をトラッキングしたり、
ユーザＢとの対話を開始するという状況依存の行動が行
なわれる。これは、状況依存行動階層１０８が持つＰｒ
ｅｅｍｐｔｉｏｎ機能（後述）である。

【０１１５】次いで、図９に示すように、ユーザＡが
「おーい！」と叫んで、会話の継続を催促すると、今度
は、ユーザＢとの対話を中断した後（但し、会話のコン
テキストを保存する）、呼ばれた方向を向いて、ユーザ
Ａの顔をトラッキングしたり、保存されているコンテキ
ストに基づいてユーザＡとの対話を再開するという状況
依存の行動が行なわれる。このとき、状況依存行動階層
１０８が持つＲｅｅｎｔｒａｎｔ機能（後述）により、
ユーザＡとの対話によってユーザＢとの対話内容が破壊
されずに済み、中断した時点から正確に対話を再開する
ことができる。

【０１１６】Ｃ−２．長期記憶部長期記憶は、物の名前など学習により得られた情報を長
期間保持するために使用される。同じパターンを統計的
に処理して、ロバストな記憶にすることができる。

【０１１７】長期記憶はさらに「宣言的知識記憶」と
「手続的知識記憶」に分類される。宣言的知識記憶は、
場面（例えば教えられたときのシーン）に関する記憶で
ある「エピソード記憶」と、言葉の意味や常識といった
記憶からなる「意味記憶」からなる。また、手続的知識
記憶は、宣言的知識記憶をどのように使うかといった手
順記憶であり、入力パターンに対する動作の獲得に用い
ることができる。

【０１１８】エピソード記憶は、長期記憶の中でも、宣
言的知識記憶（言明記憶とも言う）の一種である。例え
ば、自転車に乗ることを考えると、初めて自転車に乗っ
た場面（時間・場所など）を覚えていることがエピソー
ド記憶に相当する。その後、時間の経過によりそのエピ
ソードに関する記憶が薄れる一方、その意味を記憶する
のが意味記憶である。また、自転車の乗り方の手順を記
憶するようになるが、これが手続的知識記憶に相当す
る。一般的に、手続的知識の記憶には時間を要する。宣
言的知識記憶によって「言う」ことができるのに対し
て、手続的知識記憶は潜在的であり、動作の実行という
形で表れる。

【０１１９】本実施形態に係る長期記憶部１０６は、視
覚情報、聴覚情報などの物体に関するセンサ情報、及び
その物体に対して行なった行動に対する結果としての内
部状態が変化した結果などを記憶する連想記憶と、その
１つの物体に関するフレーム記憶と、周囲の情景から構
築されるマップ情報、あるいはデータとして与えられる
地図情報、原因となる状況とそれに対する行動とその結
果といったルールで構成される。

【０１２０】Ｃ−２−１．連想記憶連想記憶とは、あらかじめ複数のシンボルからなる入力
パターンを記憶パターンとして記憶しておき、その中の
ある１つのパターンに類似したパターンが想起される仕
組みのことを言う。本実施形態に係る連想記憶は、競合
型ニューラル・ネットワークを用いたモデルにより実現
される。このような連想記憶メカニズムによれば、一部
欠陥のあるパターンが入力されたとき、記憶されている
複数のパターンの中で最も近い記憶パターンを出力する
ことができる。これは、不完全なデータからなる外部刺
激しか与えられなかったときであっても、該当するニュ
ーロンの発火によりあるオブジェクトの意味などを想起
することができるからである。

【０１２１】連想記憶は、「自己想起型連想記憶」と
「相互想起型連想記憶」に大別される。自己想起型とは
記憶したパターンを直接キー・パターンで引き出すモデ
ルであり、また、相互想起型とは入力パターンと出力パ
ターンがある種の連合関係で結ばれているモデルであ
る。本実施形態では、自己想起型連想記憶を採用する
が、これは、従来のホップフィールドやアソシアトロン
（前述）などの記憶モデルに比し、追加学習が容易であ
る、入力パターンの統計的な記憶が可能である、などの
メリットがある。

【０１２２】追加学習によれば、新しいパターンを新た
に記憶しても、過去の記憶が上書きされて消されること
はない。また、統計的な学習によれば、同じものを多く
見ればそれだけ記憶に残るし、また同じことを繰り返し
実行すれば、忘れにくくなる。この場合、記憶過程にお
いて、毎回完全なパターンが入力されなくとも、繰り返
し実行により、多く提示されたパターンに収束してい
く。

【０１２３】Ｃ−２−２．連想記憶による意味記憶ロボット装置１が覚えるパターンは、例えばロボット装
置１への外部刺激と内部状態の組み合わせで構成され
る。

【０１２４】ここで、外的刺激とは、ロボット装置１が
センサ入力を認識して得られた知覚情報であり、例え
ば、カメラ１５から入力された画像に対して処理された
色情報、形情報、顔情報などであり、より具体的には、
色、形、顔、３Ｄ一般物体、ハンドジェスチャー、動
き、音声、接触、匂い、味などの構成要素からなる。
る。

【０１２５】また、内的状態とは、例えば、ロボットの
身体に基づいた本能や感情などの情動を指す。本能的要
素は、例えば、疲れ（fatigue）、熱あるいは体内温度
（temperature）、痛み（pain）、食欲あるいは飢え（h
unger）、乾き（thirst）、愛情（affection）、好奇心
（curiosity）、排泄（elimination）又は性欲（sexua
l）のうちの少なくとも１つである。また、情動的要素
は、幸せ（happiness）、悲しみ（sadness）、怒り（an
ger）、驚き（surprise）、嫌悪（disgust）、恐れ（fe
ar）、苛立ち（frustration）、退屈（boredom）、睡眠
（somnolence）、社交性（gregariousness）、根気（pa
tience）、緊張（tense）、リラックス（relaxed）、警
戒（alertness）、罪（guilt）、悪意（spite）、誠実
さ（loyalty）、服従性（submission）又は嫉妬（jealo
usy）のうちの少なくとも１つである。

【０１２６】本実施形態に係る競合型ニューラル・ネッ
トワークを適用した連想記憶メカニズムでは、これら外
部刺激や内部状態を構成する各要素に対して入力チャン
ネルを割り当てている。また、視覚認識機能部１０１や
聴覚認識機能部１０２などの各知覚機能モジュールは、
センサ出力となる生の信号を送るのではなく、センサ出
力を認識した結果をシンボル化して、シンボルに相当す
るＩＤ情報（例えば、色プロトタイプＩＤ、形プロトタ
イプＩＤ、音声プロトタイプＩＤなど）を該当するチャ
ンネルに送るようになっている。

【０１２７】例えば、カラー・セグメンテーション・モ
ジュールによりセグメンテーションされた各オブジェク
トは、色プロトタイプＩＤを付加されて連想記憶システ
ムに入力される。また、顔認識モジュールにより認識さ
れた顔のＩＤが連想記憶システムに入力される。また、
物体認識モジュールにより認識された物体のＩＤが連想
システムに入力される。また、音声認識モジュールから
は、ユーザの発話により単語のプロトタイプＩＤが入力
される。このとき、発話の音素記号列（Phoneme Sequen
ce）も入力されるので、記憶・連想の処理で、ロボット
装置１に発話させることが可能となる。また、本能に関
しては、アナログ値を扱えるようになっており（後
述）、例えば、本能のデルタ値を８０で記憶しておけ
ば、連想により８０というアナログ値を得ることが可能
である。

【０１２８】したがって、本実施形態に係る連想記憶シ
ステムは、色、形、音声…などの外部刺激や内部状態
を、各チャンネル毎のシンボル化されたＩＤの組み合わ
せからなる入力パターンとして記憶することができる。
すなわち、連想記憶システムが記憶するのは、

【０１２９】［色ＩＤ形ＩＤ顔ＩＤ音声ＩＤ…本
能ＩＤ（値）情動ＩＤ］

【０１３０】の組み合わせである。

【０１３１】連想記憶には、記憶過程と想起過程があ
る。図１０には、連想記憶の記憶過程の概念を示してい
る。

【０１３２】連想記憶システムに入力される記憶パター
ンは、外部刺激や内部状態の各要素毎に割り当てられて
いる複数のチャンネルで構成される（図示の例では入力
１〜入力８の８チャンネルからなる）。そして、各チャ
ンネルには、対応する外部刺激の認識結果や内部状態を
シンボル化したＩＤ情報が送られてくる。図示の例で
は、各チャンネルの濃淡がＩＤ情報を表しているものと
する。例えば、記憶パターン中のｋ番目のカラムが顔の
チャンネルに割り当てられている場合、その色により顔
のプロトタイプＩＤを表している。

【０１３３】図１０に示す例では、連想記憶システムは
既に１〜ｎの合計ｎ個の記憶パターンを記憶しているも
のとする。ここで、２つの記憶パターン間での対応する
チャンネルの色の相違は、同じチャンネル上で記憶して
いる外部刺激又は内部状態のシンボルすなわちＩＤが当
該記憶パターン間で異なることを意味する。

【０１３４】また、図１１には、連想記憶の想起過程の
概念を示している。上述したように、記憶過程で蓄えた
入力パターンに似たパターンが入力されると、欠落して
いた情報を補うように完全な記憶パターンが出力され
る。

【０１３５】図１１に示す例では、８チャンネルからな
る記憶パターンのうち上位の３チャンネルしかＩＤが与
えられていないパターンがキー・パターンとして入力さ
れる。このような場合、連想記憶システムでは、既に貯
えられている記憶パターンの中で、これら上位の３チャ
ンネルが最も近いパターン（図示の例では記憶パターン
１）を見つけ出して、想起されたパターンとして出力す
ることができる。すなわち、欠落していたチャンネル４
〜８の情報を補うように、最も近い記憶パターンが出力
される。

【０１３６】したがって、連想記憶システムによれば、
顔のＩＤのみから音声ＩＤ、つまり名前を連想したり、
食べ物の名前だけから、“おいしい”や“おいしくな
い”などを想起することができる。競合型ニューラル・
ネットワークによる長期記憶アーキテクチャによれば、
言葉の意味や常識などに関する意味記憶を、他の長期記
憶と同じ工学モデルで実現することができる。

【０１３７】Ｃ−３．競合型ニューラル・ネットワーク
による連想学習図１２には、競合型ニューラル・ネットワークを適用し
た連想記憶システムの構成例を模式的に示している。同
図に示すように、この競合型ニューラル・ネットワーク
は、入力層（input layer）と競合層（competitive lay
er）の２層からなる階層型ニューラル・ネットワークで
ある。

【０１３８】この競合型ニューラル・ネットワークは、
記憶モードと連想モードという２通りの動作モードを備
えており、記憶モードでは入力パターンを競合的に記憶
し、また、想起モードでは部分的に欠損した入力パター
ンから完全な記憶パターンを想起する。

【０１３９】入力層は、複数の入力ニューロンで構成さ
れる。各入力ニューロンには、外部刺激や内部状態を表
す各要素に対して割り当てられたチャンネルから、外部
刺激や内部状態の認識結果に相当するシンボルすなわち
ＩＤ情報が入力される。入力層では、色ＩＤの個数＋形
ＩＤの個数＋音声ＩＤの個数＋本能の種類…に相当する
個数のニューロンを用意する必要がある。

【０１４０】また、競合層は、複数の競合ニューロンで
構成される。各競合ニューロンは、入力層側の各入力ニ
ューロンとは、ある結合重みを持って結合されている。
競合ニューロンは、それぞれのニューロンが記憶すべき
１つのシンボルに相当する。言い換えれば、競合ニュー
ロンの数は記憶可能なシンボルの個数に相当する。

【０１４１】ある入力パターンが入力層に与えられたと
する。このとき、入力パターンは外部刺激や内部状態の
各要素を表すチャンネルで構成されており、チャンネル
から該当するＩＤが送られてきた入力ニューロンは発火
する。

【０１４２】競合ニューロンは、各入力ニューロンから
の出力をシナプスによる重み付けをして入力して、それ
ら入力値の総和を計算する。そして、競合層で入力値の
総和が最大となる競合ニューロンを選択して、勝ち抜い
た競合ニューロンと入力ニューロンとの結合力を強めて
いくことで、学習を行なう。また、欠損のある入力パタ
ーンに対して、競合層で勝ち抜いた競合ニューロンを選
択することにより、入力パターンに対応するシンボルを
想起することができる。

【０１４３】記憶モード：入力層と競合層の結合重み
は、０から１の間の値をとるものとする。但し、初期結
合重みはランダムに決定する。

【０１４４】競合型ニューラル・ネットワークにおける
記憶は、まず、記憶したい入力パターンに対して競合層
で勝ち抜いた競合ニューロンを選択して、その競合ニュ
ーロンと各入力ニューロンとの結合力を強めることで行
なう。

【０１４５】ここで、入力パターン・ベクトル［ｘ₁，
ｘ₂，…，ｘ_n］は、ニューロンが、色プロトタイプＩＤ
１に対応し、ＩＤ１が認識されたら、ニューロンｘ₁を
発火させ、順次、形、音声もそのように発火させること
とする。発火したニューロンは１の値をとり、発火しな
いニューロンは−１の値をとる。

【０１４６】また、ｉ番目の入力ニューロンとｊ番目の
競合ニューロンとの結合力をｗ_ijとおくと、入力ｘ_iに
対する競合ニューロンｙ_jの値は、下式のように表され
る。

【０１４７】

【数１】

【０１４８】したがって、競合に勝ち抜くニューロン
は、下式により求めることができる。

【０１４９】

【数２】

【０１５０】記憶は、競合層で勝ち抜いた競合ニューロ
ン（winner neuron）と各入力ニューロンとの結合力を
強めることで行なう。勝ち抜いたニューロン（winner n
euron）と入力ニューロンとの結合の更新は、Ｋｏｈｏ
ｎｅｎの更新規則により、以下のように行なわれる。

【０１５１】

【数３】

【０１５２】ここで、Ｌ２Ｎｏｒｍで正規化する。

【０１５３】

【数４】

【０１５４】この結合力がいわゆる記憶の強さを表し、
記憶力になる。ここで、学習率αは、提示する回数と記
憶の関係を表すパラメータである。学習率αが大きいほ
ど、１回の記憶で重みを大きく変更する。例えば、α＝
０．５を用いると、一度記憶させれば、忘却することは
なく、次回同じようなパターンを提示すれば、ほぼ間違
いなく記憶したパターンを連想することができる。

【０１５５】また、提示して記憶させればさせるほど、
ネットワークの結合値（重み）が大きくなっていく。こ
れは、同じパターンが何度も入力されるうちに、記憶が
強くなることを示し、統計的な学習が可能であり、実環
境下におけるノイズの影響の少ない長期記憶を実現する
ことができる。

【０１５６】また、新たなパターンが入力され、記憶し
ようとすれば、新たな競合層のニューロンが発火するた
め、その新しいニューロンとの結合が強まり、以前の記
憶によるニューロンとの結合が弱まる訳ではない。言い
換えれば、競合型ニューラル・ネットワークによる連想
記憶では、追加学習が可能なのであり、「忘却」の問題
から解放される。

【０１５７】想起モード：いま、以下に示すような入力
パターン・ベクトルが図１２に示す連想記憶システムに
提示されたとする。入力パターンは、完全なものではな
く一部が欠損していてもよい。

【０１５８】

【数５】

【０１５９】このとき、入力ベクトルは、プロトタイプ
ＩＤであっても、あるいはそのプロトタイプＩＤに対す
る尤度、確率であってもよい。出力ニューロンｙ_jの値
は、入力ｘ_iについて下式のように計算される。

【０１６０】

【数６】

【０１６１】上式は、各チャンネルの尤度に応じた競合
ニューロンの発火値の尤度を表しているとも言える。こ
こで重要なことは、複数のチャンネルからの尤度入力に
対して、それらをコネクションして全体的な尤度を求め
ることが可能である、という点である。本実施形態で
は、連想するものは唯一すなわち尤度が最大のものだけ
を選択することとし、競合に勝ち抜くニューロンを下式
により求めることができる。

【０１６２】

【数７】

【０１６３】求めた競合ニューロンＹの番号が記憶した
シンボルの番号に対応するので、下式のように、Ｗの逆
行列演算により入力パターンＸを想起することができ
る。

【０１６４】

【数８】

【０１６５】さらに図１２に示す競合型ニューラル・ネ
ットワークの入力層ニューロンにエピソードや動作ＩＤ
などのシンボルを割り当てることにより、宣言的知識記
憶や手続的知識記憶を連想記憶アーキテキチャにより実
現することができる。

【０１６６】Ｄ．状況依存行動制御状況依存行動階層（ＳｉｔｕａｔｅｄＢｅｈａｖｉｏｒ
ｓＬａｙｅｒ）１０８は、短期記憶部１０５並びに長期
記憶部１０６の記憶内容や、内部状態管理部１０４によ
って管理される内部状態を基に、ロボット装置１が現在
置かれている状況に即応した行動を制御する。また、状
況依存行動階層１０８の一部として、認識された外部刺
激に応じて反射的・直接的な機体動作を実行する反射行
動部１０９を含んでいる。

【０１６７】Ｄ−１．状況依存行動階層の構成本実施形態では、状況依存行動階層１０８は、各行動モ
ジュール毎にステートマシンを用意しており、それ以前
の行動や状況に依存して、センサ入力された外部情報の
認識結果を分類して、行動を機体上で発現する。行動モ
ジュールは、外部刺激や内部状態の変化に応じた状況判
断を行なうｍｏｎｉｔｏｒ機能と、行動実行に伴う状態
遷移（ステートマシン）を実現するａｃｔｉｏｎ機能と
を備えたスキーマ（ｓｃｈｅｍａ）として記述される。
状況依存行動階層１０８は、複数のスキーマが階層的に
連結された木構造として構成されている（後述）。

【０１６８】また、状況依存行動階層１０８は、内部状
態をある範囲に保つための行動（「ホメオスタシス行
動」とも呼ぶ）も実現し、内部状態が指定した範囲内を
越えた場合には、その内部状態を当該範囲内に戻すため
の行動が出易くなるようにその行動を活性化させる（実
際には、内部状態と外部環境の両方を考慮した形で行動
が選択される）。

【０１６９】図３に示したようなロボット１の行動制御
システム１００における各機能モジュールは、オブジェ
クトとして構成される。各オブジェクトは、メッセージ
通信と共有メモリを使ったオブジェクト間通信方法によ
りデータの受け渡しとＩｎｖｏｋｅを行なうことができ
る。図１３には、本実施形態に係る行動制御システム１
００のオブジェクト構成を模式的に示している。

【０１７０】視覚認識機能部１０１は、”ＦａｃｅＤｅ
ｔｅｃｔｏｒ”、”ＭｕｌｉｔＣｏｌｏｔＴｒａｃｋｅ
ｒ”、”ＦａｃｅＩｄｅｎｔｉｆｙ”という３つのオブ
ジェクトで構成される。

【０１７１】ＦａｃｅＤｅｔｅｃｔｏｒは、画像フレー
ム中から顔領域を検出するオブジェクトであり、検出結
果をＦａｃｅＩｄｅｎｔｉｆｙに出力する。Ｍｕｌｉｔ
ＣｏｌｏｔＴｒａｃｋｅｒは、色認識を行なうオブジェ
クトであり、認識結果をＦａｃｅＩｄｅｎｔｉｆｙ及び
ＳｈｏｒｔＴｅｒｍＭｅｍｏｒｙ（短期記憶ブ１０５を
構成するオブジェクト）に出力する。また、ＦａｃｅＩ
ｄｅｎｔｉｆｙは、検出された顔画像を手持ちの人物辞
書で検索するなどして人物の識別を行ない、顔画像領域
の位置、大きさ情報とともに人物のＩＤ情報をＳｈｏｒ
ｔＴｅｒｍＭｅｍｏｒｙに出力する。

【０１７２】聴覚認識機能部１０２は、”ＡｕｄｉｏＲ
ｅｃｏｇ”と”ＳｐｅｅｃｈＲｅｃｏｇ”という２つの
オブジェクトで構成される。ＡｕｄｉｏＲｅｃｏｇは、
マイクなどの音声入力装置からの音声データを受け取っ
て、特徴抽出と音声区間検出を行なうオブジェクトであ
り、音声区間の音声データの特徴量及び音源方向をＳｐ
ｅｅｃｈＲｅｃｏｇやＳｈｏｒｔＴｅｒｍＭｅｍｏｒｙ
に出力する。ＳｐｅｅｃｈＲｅｃｏｇは、ＡｕｄｉｏＲ
ｅｃｏｇから受け取った音声特徴量と音声辞書及び構文
辞書を使って音声認識を行なうオブジェクトであり、認
識された単語のセットをＳｈｏｒｔＴｅｒｍＭｅｍｏｒ
ｙに出力する。

【０１７３】触覚認識記憶部１０３は、接触センサから
のセンサ入力を認識する”ＴａｃｔｉｌｅＳｅｎｓｏ
ｒ”というオブジェクトで構成され、認識結果はＳＨｏ
ｒｔＴｅｒｍＭｅｍｏｒｙや内部状態を管理するオブジ
ェクトであるＩｎｔｅｒｎａｌＳｔａｔｅＭｏｄｅｌ
（ＩＳＭ）に出力する。

【０１７４】ＳｈｏｒｔＴｅｒｍＭｅｍｏｒｙ（ＳＴ
Ｍ）は、短期記憶部１０５を構成するオブジェクトであ
り、上述の認識系の各オブジェクトによって外部環境か
ら認識されたターゲットやイベントを短期間保持（例え
ばカメラ１５からの入力画像を約１５秒程度の短い期間
だけ記憶する）する機能モジュールであり、ＳＴＭクラ
イアントであるＳｉｔｕａｔｅｄＢｅｈａｖｉｏｒｓＬ
ａｙｅｒに対して外部刺激の通知（Ｎｏｔｉｆｙ）を定
期的に行なう。

【０１７５】ＬｏｎｇＴｅｒｍＭｅｍｏｒｙ（ＬＴＭ）
は、長期記憶部１０６を構成するオブジェクトであり、
物の名前など学習により得られた情報を長期間保持する
ために使用される。ＬｏｎｇＴｅｒｍＭｅｍｏｒｙは、
例えば、ある行動モジュールにおいて外部刺激から内部
状態の変化を連想記憶することができる。

【０１７６】ＩｎｔｅｒｎａｌＳｔａｔｕｓＭａｎａｇ
ｅｒ（ＩＳＭ）は、内部状態管理部１０４を構成するオ
ブジェクトであり、本能や感情といった数種類の情動を
数式モデル化して管理しており、上述の認識系の各オブ
ジェクトによって認識された外部刺激（ＥＳ：Ｅｘｔｅ
ｒｎａｌＳｔｉｍｕｌａ）に応じてロボット装置１の本
能や情動といった内部状態を管理する。

【０１７７】ＳｉｔｕａｔｅｄＢｅｈａｖｉｏｒｓｌａ
ｙｅｒ（ＳＢＬ）は状況依存型行動階層１０８を構成す
るオブジェクトである。ＳＢＬは、ＳｈｏｒＴｅｒｍＭ
ｅｍｏｒｙのクライアント（ＳＴＭクライアント）とな
るオブジェクトであり、ＳｈｏｒＴｅｒｍＭｅｍｏｒｙ
からは定期的に外部刺激（ターゲットやイベント）に関
する情報の通知（Ｎｏｔｉｆｙ）を受け取ると、スキー
マ（ｓｃｈｅｍａ）すなわち実行すべき行動モジュール
を決定する（後述）。

【０１７８】ＲｅｆｌｅｘｉｖｅＳｉｔｕａｔｅｄＢｅ
ｈａｖｉｏｒｓＬａｙｅｒは、反射的行動部１０９を構
成するオブジェクトであり、上述した認識系の各オブジ
ェクトによって認識された外部刺激に応じて反射的・直
接的な機体動作を実行する。例えば、人間の顔を追いか
けたり、うなずく、障害物の検出により咄嗟に避けると
いった振る舞いを行なう（後述）。

【０１７９】ＳｉｔｕａｔｅｄＢｅｈａｖｉｏｒｓｌａ
ｙｅｒは外部刺激や内部状態の変化などの状況に応じて
行動を選択する。これに対し、ＲｅｆｌｅｘｉｖｅＳｉ
ｔｕａｔｅｄＢｅｈａｖｉｏｒｓＬａｙｅｒは、外部刺
激に応じて反射的を行動する。これら２つのオブジェク
トによる行動選択は独立して行なわれるため、互いに選
択された行動モジュール（スキーマ）を機体上で実行す
る場合に、ロボット１のハードウェア・リソースが競合
して実現不可能なこともある。Ｒｅｓｏｕｒｃｅｍａｎ
ａｇｅｒというオブジェクトは、ＳｉｔｕａｔｅｄＢｅ
ｈａｖｉｏｒｓｌａｙｅｒとＲｅｆｌｅｘｉｖｅＳｉｔ
ｕａｔｅｄＢｅｈａｖｉｏｒｓＬａｙｅｒによる行動選
択時のハードウェアの競合を調停する。そして、調停結
果に基づいて機体動作を実現する各オブジェクトに通知
することにより機体が駆動する。

【０１８０】ＳｏｕｎｄＰｅｒｆｏｒｍｅｒ、Ｍｏｔｉ
ｏｎＣｏｎｔｒｏｌｌｅｒ、ＬｅｄＣｏｎｔｒｏｌｌｅ
ｒは、機体動作を実現するオブジェクトである。Ｓｏｕ
ｎｄＰｅｒｆｏｒｍｅｒは、音声出力を行なうためのオ
ブジェクトであり、ＲｅｓｏｕｒｃｅＭａｎａｇｅｒ経
由でＳｉｔｕａｔｅｄＢｅｈａｖｉｏｒＬａｙｅｒから
与えられたテキスト・コマンドに応じて音声合成を行な
い、ロボット１の機体上のスピーカから音声出力を行な
う。また、ＭｏｔｉｏｎＣｏｎｔｒｏｌｌｅｒは、機体
上の各関節アクチュエータの動作を行なうためのオブジ
ェクトであり、ＲｅｓｏｕｒｃｅＭａｎａｇｅｒ経由で
ＳｉｔｕａｔｅｄＢｅｈａｖｉｏｒＬａｙｅｒから手や
脚などを動かすコマンドを受けたことに応答して、該当
する関節角を計算する。また、ＬｅｄＣｏｎｔｒｏｌｌ
ｅｒは、ＬＥＤ１９の点滅動作を行なうためのオブジェ
クトであり、ＲｅｓｏｕｒｃｅＭａｎａｇｅｒ経由でＳ
ｉｔｕａｔｅｄＢｅｈａｖｉｏｒＬａｙｅｒからコマン
ドを受けたことに応答してＬＥＤ１９の点滅駆動を行な
う。

【０１８１】図１４には、状況依存行動階層（ＳＢＬ）
１０８（但し、反射行動部１０９を含む）による状況依
存行動制御の形態を模式的に示している。認識系１０１
〜１０３による外部環境の認識結果は、外部刺激として
状況依存行動階層１０８（反射行動部１０９を含む）に
与えられる。また、認識系による外部環境の認識結果に
応じた内部状態の変化も状況依存行動階層１０８に与え
られる。そして、状況依存行動階層１０８では、外部刺
激や内部状態の変化に応じて状況を判断して、行動選択
を実現することができる。

【０１８２】図１５には、図１４に示した状況依存行動
階層１０８による行動制御の基本的な動作例を示してい
る。同図に示すように、状況依存行動階層１０８（ＳＢ
Ｌ）では、外部刺激や内部状態の変化によって各行動モ
ジュール（スキーマ）の活動度レベルを算出して、活動
度レベルの度合いに応じてスキーマを選択して行動を実
行する。活動度レベルの算出には、例えばライブラリを
利用することにより、すべてのスキーマについて統一的
な計算処理を行なうことができる（以下、同様）。例え
ば、活動度レベルが最も高いスキーマを選択したり、所
定の閾値を越えた２以上のスキーマを選択して並列的に
行動実行するようにしてもよい（但し、並列実行すると
きは各スキーマどうしでハードウェア・リソースの競合
がないことを前提とする）。

【０１８３】また、図１６には、図１４に示した状況依
存行動階層１０８により反射行動を行なう場合の動作例
を示している。この場合、同図に示すように、状況依存
行動階層１０８に含まれる反射行動部１０９（Ｒｅｆｌ
ｅｘｉｖｅＳＢＬ）は、認識系の各オブジェクトによっ
て認識された外部刺激を直接入力として活動度レベルを
算出して、活動度レベルの度合いに応じてスキーマを選
択して行動を実行する。この場合、内部状態の変化は、
活動度レベルの計算には使用されない。

【０１８４】また、図１７には、図１４に示した状況依
存行動階層１０８により感情表現を行なう場合の動作例
を示している。内部状態管理部１０４では、本能や感情
などの情動を数式モデルとして管理しており、情動パラ
メータの状態値が所定値に達したことに応答して、状況
依存行動階層１０８に内部状態の変化を通知（Ｎｏｔｉ
ｆｙ）する。状況依存行動階層１０８は、内部状態の変
化を入力として活動度レベルを算出して、活動度レベル
の度合いに応じてスキーマを選択して行動を実行する。
この場合、認識系の各オブジェクトによって認識された
外部刺激は、内部状態管理部１０４（ＩＳＭ）における
内部状態の管理・更新に利用されるが、スキーマの活動
度レベルの算出には使用されない。

【０１８５】Ｄ−２．スキーマ状況依存行動階層１０８は、各行動モジュール毎にステ
ートマシンを用意しており、それ以前の行動や状況に依
存して、センサ入力された外部情報の認識結果を分類し
て、行動を機体上で発現する。行動モジュールは、機体
動作を記述し行動実行に伴う状態遷移（ステートマシ
ン）を実現するＡｃｔｉｏｎ機能と、Ａｃｔｉｏｎ機能
において記述された行動の実行を外部刺激や内部状態に
応じて評価して状況判断を行なうＭｏｎｉｔｏｒ機能と
を備えたスキーマ（ｓｃｈｅｍａ）として記述される。
図１８には、状況依存行動階層１０８が複数のスキーマ
によって構成されている様子を模式的に示している。

【０１８６】状況依存行動階層１０８（より厳密には、
状況依存行動階層１０８のうち、通常の状況依存行動を
制御する階層）は、複数のスキーマが階層的に連結され
たツリー構造として構成され、外部刺激や内部状態の変
化に応じてより最適なスキーマを統合的に判断して行動
制御を行なうようになっている。ツリーは、例えば動物
行動学的（Ｅｔｈｏｌｏｇｉｃａｌ）な状況依存行動を
数式化した行動モデルや、感情表現を実行するためのサ
ブツリーなど、複数のサブツリー（又は枝）を含んでい
る。

【０１８７】図１９には、状況依存行動階層１０８にお
けるスキーマのツリー構造を模式的に示している。同図
に示すように、状況依存行動階層１０８は、短期記憶部
１０５から外部刺激の通知（Ｎｏｔｉｆｙ）を受けるル
ート・スキーマを先頭に、抽象的な行動カテゴリから具
体的な行動カテゴリに向かうように、各階層毎にスキー
マが配設されている。例えば、ルート・スキーマの直近
下位の階層では、「探索する（Ｉｎｖｅｓｔｉｇａｔ
ｅ）」、「食べる（Ｉｎｇｅｓｔｉｖｅ）」、「遊ぶ
（Ｐｌａｙ）」というスキーマが配設される。そして、
「探索する（Ｉｎｖｅｓｔｉｇａｔｅ）」の下位には、
「ＩｎｖｅｓｔｉｇａｔｉｖｅＬｏｃｏｍｏｔｉｏ
ｎ」、「ＨｅａｄｉｎＡｉｒＳｎｉｆｆｉｎｇ」、「Ｉ
ｎｖｅｓｔｉｇａｔｉｖｅＳｎｉｆｆｉｎｇ」というよ
り具体的な探索行動を記述したスキーマが配設されてい
る。同様に、スキーマ「食べる（Ｉｎｇｅｓｔｉｖ
ｅ）」の下位には「Ｅａｔ」や「Ｄｒｉｎｋ」などのよ
り具体的な飲食行動を記述したスキーマが配設され、ス
キーマ「遊ぶ（Ｐｌａｙ）」の下位には「ＰｌａｙＢｏ
ｗｉｎｇ」、「ＰｌａｙＧｒｅｅｔｉｎｇ」、「Ｐｌａ
ｙＰａｗｉｎｇ」などのより具体的な遊ぶ行動を記述し
たスキーマが配設されている。

【０１８８】図示の通り、各スキーマは外部刺激と内部
状態を入力している。また、各スキーマは、少なくとも
Ｍｏｎｉｔｏｒ関数とＡｃｔｉｏｎ関数を備えている。

【０１８９】図２０には、スキーマの内部構成を模式的
に示している。同図に示すように、スキーマは、状態遷
移（ステートマシン）の形式で機体動作を記述したＡｃ
ｔｉｏｎ関数と、外部刺激や内部状態に応じてＡｃｔｉ
ｏｎ関数の各状態を評価して活動度レベル値として返す
Ｍｏｎｉｔｏｒ関数と、Ａｃｔｉｏｎ関数のステートマ
シンをＲＥＡＤＹ（準備完了）、ＡＣＴＩＶＥ（活動
中），ＳＬＥＥＰ（待機中）いずれかの状態としてスキ
ーマの状態を記憶管理する状態管理部で構成されてい
る。

【０１９０】Ｍｏｎｉｔｏｒ関数は、外部刺激と内部状
態に応じて当該スキーマの活動度レベル（Activation L
evel：ＡＬ値）を算出する関数である。図１９に示すよ
うなツリー構造を構成する場合、上位（親）のスキーマ
は外部刺激と内部状態を引数として下位（子供）のスキ
ーマのＭｏｎｉｔｏｒ関数をコールすることができ、子
供のスキーマはＡＬ値を返り値とする。また、スキーマ
は自分のＡＬ値を算出するために、さらに子供のスキー
マのＭｏｎｉｔｏｒ関数をコールすることができる。そ
して、ルートのスキーマには各サブツリーからのＡＬ値
が返されるので、外部刺激と内部状態の変化に応じた最
適なスキーマすなわち行動を統合的に判断することがで
きる。

【０１９１】例えばＡＬ値が最も高いスキーマを選択し
たり、ＡＬ値が所定の閾値を越えた２以上のスキーマを
選択して並列的に行動実行するようにしてもよい（但
し、並列実行するときは各スキーマ同士でハードウェア
・リソースの競合がないことを前提とする）。

【０１９２】図２１には、Ｍｏｎｉｔｏｒ関数の内部構
成を模式的に示している。同図に示すように、Ｍｏｎｉ
ｔｏｒ関数は、当該スキーマで記述されている行動を誘
発する評価値を活動度レベルとして算出する行動誘発評
価値演算器と、使用する機体リソースを特定する使用リ
ソース演算器を備えている。図２０で示す例では、Ｍｏ
ｎｉｔｏｒ関数は、スキーマすなわち行動モジュールの
管理を行なう行動状態制御部（仮称）からコールされる
と、Ａｃｔｉｏｎ関数のステートマシンを仮想実行し
て、行動誘発評価値（すなわち活動度レベル）と使用リ
ソースを演算して、これを返すようになっている。

【０１９３】また、Ａｃｔｉｏｎ関数は、スキーマ自身
が持つ行動を記述したステートマシン（後述）を備えて
いる。図１９に示すようなツリー構造を構成する場合、
親スキーマは、Ａｃｔｉｏｎ関数をコールして、子供ス
キーマの実行を開始したり中断させたりすることができ
る。本実施形態では、Ａｃｔｉｏｎのステートマシンは
Ｒｅａｄｙにならないと初期化されない。言い換えれ
ば、中断しても状態はリセットされず、スキーマが実行
中の作業データを保存することから、中断再実行が可能
である（後述）。

【０１９４】図２０で示す例では、スキーマすなわち行
動モジュールの管理を行なう行動状態制御部（仮称）
は、Ｍｏｎｉｔｏｒ関数からの戻り値に基づいて、実行
すべき行動を選択し、該当するスキーマのＡｃｔｉｏｎ
関数をコールし、あるいは状態管理部に記憶されている
スキーマの状態の移行を指示する。例えば行動誘発評価
値としての活動度レベルが最も高いスキーマを選択した
り、リソースが競合しないように優先順位に従って複数
のスキーマを選択したりする。また、行動状態制御部
は、より優先順位の高いスキーマが起動し、リソースの
競合が生じた場合、優先順位が下位のスキーマの状態を
ＡＣＴＩＶＥからＳＬＥＥＰに退避させ、競合状態が解
かれるとＡＣＴＩＶＥに回復するなど、スキーマの状態
を制御する。

【０１９５】行動状態制御部は、図２２に示すように、
状況依存行動階層１０８において１つだけ配設して、同
階層１０８を構成するすべてのスキーマを一元的に集中
管理するようにしてもよい。

【０１９６】図示の例では、行動状態制御部は、行動評
価部と、行動選択部と、行動実行部を備えている。行動
評価部は、例えば所定の制御周期で各スキーマのＭｏｎ
ｉｔｏｒ関数をコールして、各々の活動度レベルと使用
リソースを取得する。行動選択部は、各スキーマによる
行動制御と機体リソースの管理を行なう。例えば、集計
された活動度レベルの高い順にスキーマを選択するとと
もに、使用リソースが競合しないように２以上のスキー
マを同時に選択する。行動実行部は、選択されたスキー
マのＡｃｔｉｏｎ関数に行動実行命令を発行したり、ス
キーマの状態（ＲＥＡＤＹ、ＡＣＴＩＶＥ，ＳＬＥＥ
Ｐ）を管理して、スキーマの実行を制御する。例えば、
より優先順位の高いスキーマが起動し、リソースの競合
が生じた場合、優先順位が下位のスキーマの状態をＡＣ
ＴＩＶＥからＳＬＥＥＰに退避させ、競合状態が解かれ
るとＡＣＴＩＶＥに回復する。

【０１９７】あるいは、このような行動状態制御部の機
能を、状況依存行動階層１０８内の各スキーマ毎に配置
するようにしてもよい。例えば、図１９に示したよう
に，スキーマがツリー構造を形成している場合（図２３
を参照のこと）、上位（親）のスキーマの行動状態制御
は、外部刺激と内部状態を引数として下位（子供）のス
キーマのＭｏｎｉｔｏｒ関数をコールし、子供のスキー
マから活動度レベルと使用リソースを返り値として受け
取る。また、子供のスキーマは、自分の活動度レベルと
使用リソースを算出するために、さらに子供のスキーマ
のＭｏｎｉｔｏｒ関数をコールする。そして、ルートの
スキーマの行動状態制御部には、各サブツリーからの活
動度レベルと使用リソースが返されるので、外部刺激と
内部状態の変化に応じた最適なスキーマすなわち行動を
統合的に判断して、Ａｃｔｉｏｎ関数をコールして、子
供スキーマの実行を開始したり中断させたりする。

【０１９８】図２４には、状況依存行動階層１０８にお
いて通常の状況依存行動を制御するためのメカニズムを
模式的に示している。

【０１９９】同図に示すように、状況依存行動階層１０
８には、短期記憶部１０５から外部刺激が入力（Ｎｏｔ
ｉｆｙ）されるとともに、内部状態管理部１０９から内
部状態の変化が入力される。状況依存行動階層１０８
は、例えば動物行動学的（Ｅｔｈｏｌｏｇｉｃａｌ）な
状況依存行動を数式化した行動モデルや、感情表現を実
行するためのサブツリーなど、複数のサブツリーで構成
されており、ルート・スキーマは、外部刺激の通知（Ｎ
ｏｔｉｆｙ）に応答して、各サブツリーのｍｏｎｉｔｏ
ｒ関数をコールし、その返り値としての活動度レベル
（ＡＬ値）を参照して、統合的な行動選択を行ない、選
択された行動を実現するサブツリーに対してａｃｔｉｏ
ｎ関数をコールする。また、状況依存行動階層１０８に
おいて決定された状況依存行動は、リソース・マネージ
ャにより反射行動部１０９による反射的行動とのハード
ウェア・リソースの競合の調停を経て、機体動作（Ｍｏ
ｔｉｏｎＣｏｎｔｒｏｌｌｅｒ）に適用される。

【０２００】また、状況依存行動層１０８のうち、反射
的行動部１０９は、上述した認識系の各オブジェクトに
よって認識された外部刺激に応じて反射的・直接的な機
体動作を実行する（例えば、障害物の検出により咄嗟に
避ける）。このため、通常の状況依存行動を制御する場
合（図１９）とは相違し、認識系の各オブジェクトから
の信号を直接入力する複数のスキーマが、階層化されず
に並列的に配置されている。

【０２０１】図２５には、反射行動部１０９におけるス
キーマの構成を模式的に示している。同図に示すよう
に、反射行動部１０９には、聴覚系の認識結果に応答し
て動作するスキーマとして「ＡｖｏｉｄＢｉｇＳｏｕｎ
ｄ」、「ＦａｃｅｔｏＢｉｇＳｏｕｎｄ」及び「Ｎｏｄ
ｄｉｎｇＳｏｕｎｄ」、視覚系の認識結果に応答して動
作するスキーマとして「ＦａｃｅｔｏＭｏｖｉｎｇＯｂ
ｊｅｃｔ」及び「ＡｖｏｉｄＭｏｖｉｎｇＯｂｊｅｃ
ｔ」、並びに、触覚系の認識結果に応答して動作するス
キーマとして「手を引っ込める」が、それぞれ対等な立
場で（並列的に）配設されている。

【０２０２】図示の通り、反射的行動を行なう各スキー
マは外部刺激を入力に持つ。また、各スキーマは、少な
くともｍｏｎｉｔｏｒ関数とａｃｔｉｏｎ関数を備えて
いる。ｍｏｎｉｔｏｒ関数は、外部刺激に応じて当該ス
キーマのＡＬ値を算出して、これに応じて該当する反射
的行動を発現すべきかどうかが判断される。また、ａｃ
ｔｉｏｎ関数は、スキーマ自身が持つ反射的行動を記述
したステートマシン（後述）を備えており、コールされ
ることにより、該当する反射的行動を発現するとともに
ａｃｔｉｏｎの状態を遷移させていく。

【０２０３】図２６には、反射行動部１０９において反
射的行動を制御するためのメカニズムを模式的に示して
いる。

【０２０４】図２５にも示したように、反射行動部１０
９内には、反応行動を記述したスキーマや、即時的な応
答行動を記述したスキーマが並列的に存在している。認
識系のオブジェクトから認識結果が入力されると、対応
する反射行動スキーマがｍｏｎｉｔｏｒ関数によりＡＬ
値を算出し、その値に応じてａｃｔｉｏｎを軌道すべき
かどうかが判断される。そして、反射行動部１０９にお
いて起動が決定された反射的行動は、リソース・マネー
ジャにより反射行動部１０９による反射的行動とのハー
ドウェア・リソースの競合の調停を経て、機体動作（Ｍ
ｏｔｉｏｎＣｏｎｔｒｏｌｌｅｒ）に適用される。

【０２０５】状況依存行動階層１０８（反射行動部１０
９を含む）を構成するスキーマは、例えばＣ⁺⁺言語ベー
スで記述される「クラス・オブジェクト」として記述す
ることができる。図２７には、状況依存行動階層１０８
において使用されるスキーマのクラス定義を模式的に示
している。同図に示されている各ブロックはそれぞれ１
つのクラス・オブジェクトに相当する。

【０２０６】図示の通り、状況依存行動階層（ＳＢＬ）
１０８は、１以上のスキーマと、ＳＢＬの入出力イベン
トに対してＩＤを割り振るＥｖｅｎｔＤａｔａＨａｎｄ
ｌｅｒ（ＥＤＨ）と、ＳＢＬ内のスキーマを管理するＳ
ｃｈｅｍａＨａｎｄｌｅｒ（ＳＨ）と、外部オブジェク
ト（ＳＴＭやＬＴＭ、リソース・マネージャ、認識系の
各オブジェクトなど）からデータを受信する１以上のＲ
ｅｃｅｉｖｅＤａｔａＨａｎｄｌｅｒ（ＲＤＨ）と、外
部オブジェクトにデータを送信する１以上のＳｅｎｄＤ
ａｔａＨａｎｄｌｅｒ（ＳＤＨ）とを備えている。

【０２０７】ＥｖｅｎｔＤａｔａＨａｎｄｌｅｒ（ＥＤ
Ｈ）は、ＳＢＬの入出力イベントに対してＩＤを割り振
るためのクラス・オブジェクトであり、ＲＤＨやＳＤＨ
から入出力イベントの通知を受ける。

【０２０８】ＳｃｈｅｍａＨａｎｄｌｅｒは、状況依存
行動階層（ＳＢＬ）１０８や反射行動部１０９を構成す
る各スキーマやツリー構造などの情報（ＳＢＬのコンフ
ィギュレーション情報）をファイルとして保管してい
る。例えばシステムの起動時などに、ＳｃｈｅｍａＨａ
ｎｄｌｅｒは、このコンフィギュレーション情報ファイ
ルを読み込んで、図１９に示したような状況依存行動階
層１０８のスキーマ構成を構築（再現）して、メモリ空
間上に各スキーマのエンティティをマッピングする。

【０２０９】各スキーマは、スキーマのベースとして位
置付けられるＯｐｅｎＲ_Ｇｕｅｓｔを備えている。Ｏ
ｐｅｎＲ_Ｇｕｅｓｔは、スキーマが外部にデータを送
信するためのＤｓｕｂｊｅｃｔ、並びに、スキーマが外
部からデータを受信するためのＤＯｂｊｅｃｔというク
ラス・オブジェクトをそれぞれ１以上備えている。例え
ば、スキーマが、ＳＢＬの外部オブジェクト（ＳＴＭや
ＬＴＭ、認識系の各オブジェクトなど）にデータを送る
ときには、ＤｓｕｂｊｅｃｔはＳｅｎｄＤａｔａＨａｎ
ｄｌｅｒに送信データを書き込む。また、ＤＯｂｊｅｃ
ｔは、ＳＢＬの外部オブジェクトから受信したデータを
ＲｅｃｅｉｖｅＤａｔａＨａｎｄｌｅｒから読み取るこ
とができる。

【０２１０】ＳｃｈｅｍａＭａｎａｇｅｒ及びＳｃｈｅ
ｍａＢａｓｅは、ともにＯｐｅｎＲ_Ｇｕｅｓｔを継承
したクラス・オブジェクトである。クラス継承は、元の
クラスの定義を受け継ぐことであり、この場合、Ｏｐｅ
ｎＲ_Ｇｕｅｓｔで定義されているＤｓｕｂｊｅｃｔや
ＤＯｂｊｅｃｔなどのクラスオブジェクトをＳｃｈｅｍ
ａＭａｎａｇｅｒやＳｃｈｅｍａＢａｓｅも備えている
ことを意味する（以下、同様）。例えば図１９に示すよ
うに複数のスキーマがツリー構造になっている場合、Ｓ
ｃｈｅｍａＭａｎａｇｅｒは、子供のスキーマのリスト
を管理するクラス・オブジェクトＳｃｈｅｍａＬｉｓｔ
を持ち（子供のスキーマへのポインタを持ち）、子供ス
キーマの関数をコールすることができる。また、Ｓｃｈ
ｅｍａＢａｓｅは、親スキーマへのポインタを持ち、親
スキーマからコールされた関数の返り値を戻すことがで
きる。

【０２１１】ＳｃｈｅｍａＢａｓｅは、ＳｔａｔｅＭａ
ｃｈｉｎｅ及びＰｒｏｎｏｍｅという２つのクラス・オ
ブジェクトを持つ。ＳｔａｔｅＭａｃｈｉｎｅは当該ス
キーマの行動（Ａｃｔｉｏｎ関数）についてのステート
マシンを管理している。図２８には、スキーマの行動
（Ａｃｔｉｏｎ関数）についてのステートマシンを図解
している。このステートマシンの状態間の遷移にそれぞ
れ行動（Ａｃｔｉｏｎ）が紐付けされている

【０２１２】親スキーマは子供スキーマのＡｃｔｉｏｎ
関数のステートマシンを切り替える（状態遷移させる）
ことができる。また、Ｐｒｏｎｏｍｅには、当該スキー
マが行動（Ａｃｔｉｏｎ関数）を実行又は適用するター
ゲットを代入する。後述するように、スキーマはＰｒｏ
ｎｏｍｅに代入されたターゲットによって占有され、行
動が終了（完結、異常終了など）するまでスキーマは解
放されない。新規のターゲットのために同じ行動を実行
するためには同じクラス定義のスキーマをメモリ空間上
に生成する。この結果、同じスキーマをターゲット毎に
独立して実行することができ（個々のスキーマの作業デ
ータが干渉し合うことはなく）、行動のＲｅｅｎｔｒａ
ｎｃｅ性（後述）が確保される。

【０２１３】ＰａｒｅｎｔＳｃｈｅｍａＢａｓｅは、Ｓ
ｃｈｅｍａＭａｎａｇｅｒ及びＳｃｈｅｍａＢａｓｅを
多重継承するクラス・オブジェクトであり、スキーマの
ツリー構造において、当該スキーマ自身についての親ス
キーマ及び子供スキーマすなわち親子関係を管理する。

【０２１４】ＩｎｔｅｒｍｅｄｉａＰａｒｅｎｔＳｃｈ
ｅｍａＢａｓｅは、ＰａｒｅｎｔＳｃｈｅｍａＢａｓｅ
を継承するクラス・オブジェクトであり、各クラスのた
めのインターフェース変換を実現する。また、Ｉｎｔｅ
ｒｍｅｄｉａＰａｒｅｎｔＳｃｈｅｍａＢａｓｅは、Ｓ
ｃｈｅｍａＳｔａｔｕｓＩｎｆｏを持つ。このＳｃｈｅ
ｍａＳｔａｔｕｓＩｎｆｏは、当該スキーマ自身のステ
ートマシンを管理するクラス・オブジェクトである。

【０２１５】親スキーマは、子供スキーマのＡｃｔｉｏ
ｎ関数をコールすることによってそのステートマシンの
状態を切り換えることができる。また、子供スキーマの
Ａｏｎｉｔｏｒ関数をコールしてそのステートマシンの
状態に応じたＡＬ値を問うことができる。但し、スキー
マのステートマシンは、前述したＡｃｔｉｏｎ関数のス
テートマシンとは異なるということを留意されたい。

【０２１６】図２９には、スキーマ自身すなわちＡｃｔ
ｉｏｎ関数によって記述されている行動についてのステ
ートマシンを図解している。既に述べたように、スキー
マ自身のステートマシンは、Ａｃｔｉｏｎ関数に寄って
記述されている行動について、ＲＥＡＤＹ（準備完
了）、ＡＣＴＩＶＥ（活動中），ＳＬＥＥＰ（待機中）
という３つの状態を規定している。より優先順位の高い
スキーマが起動し、リソースの競合が生じた場合、優先
順位が下位のスキーマの状態をＡＣＴＩＶＥからＳＬＥ
ＥＰに退避させ、競合状態が解かれるとＡＣＴＩＶＥに
回復する。

【０２１７】図２９に示すように、ＡＣＴＩＶＥからＳ
ＬＥＥＰへの状態遷移にＡＣＴＩＶＥ_ＴＯ_ＳＬＥＥＰ
が、ＳＬＥＥＰからＡＣＴＩＶＥへの状態遷移にＳＬＥ
ＥＰ_ＴＯ_ＡＣＴＩＶＥがそれぞれ規定されている。本
実施形態において特徴的なのは、（１）ＡＣＴＩＶＥ_ＴＯ_ＳＬＥＥＰに、後にＡＣＴＩ
ＶＥに遷移して再開するために必要なデータ（コンテキ
スト）を保存するための処理と、ＳＬＥＥＰするために
必要な行動が紐付けされている。（２）ＳＬＥＥＰ_ＴＯ_ＡＣＴＩＶＥに、保存しておい
たデータ（コンテキスト）を復元するための処理と、Ａ
ＣＴＩＶＥに戻るために必要な行動が紐付けされてい
る。という点である。ＳＬＥＥＰするために必要な行動
とは、例えば、話し相手に休止を告げる「ちょっと待っ
ててね」などのセリフを言う行動（その他、身振り手振
りが加わっていてもよい）である。また、ＡＣＴＩＶＥ
に戻るために必要な行動とは、例えば、話し相手に謝意
を表わす「お待たせ」などのセリフを言う行動（その
他、身振り手振りが加わっていてもよい）である。

【０２１８】ＡｎｄＰａｒｅｎｔＳｃｈｅｍａ、Ｎｕｍ
ＯｒＰａｒｅｎｔＳｃｈｅｍａ、ＯｒＰａｒｅｎｔＳｃ
ｈｅｍａは、ＩｎｔｅｒｍｅｄｉａＰａｒｅｎｔＳｃｈ
ｅｍａＢａｓｅを継承するクラス・オブジェクトであ
る。ＡｎｄＰａｒｅｎｔＳｃｈｅｍａは、同時実行する
複数の子供スキーマへのポインタを持つ。ＯｒＰａｒｅ
ｎｔＳｃｈｅｍａは、いずれか択一的に実行する複数の
子供スキーマへのポインタを持つ。また、ＮｕｍＯｒＰ
ａｒｅｎｔＳｃｈｅｍａは、所定数のみを同時実行する
複数の子供スキーマへのポインタを持つ。

【０２１９】ＰａｒｅｎｔＳｃｈｅｍａは、これらＡｎ
ｄＰａｒｅｎｔＳｃｈｅｍａ、ＮｕｍＯｒＰａｒｅｎｔ
Ｓｃｈｅｍａ、ＯｒＰａｒｅｎｔＳｃｈｅｍａを多重継
承するクラス・オブジェクトである。

【０２２０】図３０には、状況依存行動階層（ＳＢＬ）
１０８内のクラスの機能的構成を模式的に示している。

【０２２１】状況依存行動階層（ＳＢＬ）１０８は、Ｓ
ＴＭやＬＴＭ、リソース・マネージャ、認識系の各オブ
ジェクトなど外部オブジェクトからデータを受信する１
以上のＲｅｃｅｉｖｅＤａｔａＨａｎｄｌｅｒ（ＲＤ
Ｈ）と、外部オブジェクトにデータを送信する１以上の
ＳｅｎｄＤａｔａＨａｎｄｌｅｒ（ＳＤＨ）とを備えて
いる。

【０２２２】ＥｖｅｎｔＤａｔａＨａｎｄｌｅｒ（ＥＤ
Ｈ）は、ＳＢＬの入出力イベントに対してＩＤを割り振
るためのクラス・オブジェクトであり、ＲＤＨやＳＤＨ
から入出力イベントの通知を受ける。

【０２２３】ＳｃｈｅｍａＨａｎｄｌｅｒは、スキーマ
を管理するためのクラス・オブジェクトであり、ＳＢＬ
を構成するスキーマのコンフィギュレーション情報をフ
ァイルとして保管している。例えばシステムの起動時な
どに、ＳｃｈｅｍａＨａｎｄｌｅｒは、このコンフィギ
ュレーション情報ファイルを読み込んで、ＳＢＬ内のス
キーマ構成を構築する。

【０２２４】各スキーマは、図２７に示したクラス定義
に従って生成され、メモリ空間上にエンティティがマッ
ピングされる。各スキーマは、ＯｐｅｎＲ_Ｇｕｅｓｔ
をベースのクラス・オブジェクトとし、外部にデータ・
アクセスするためのＤＳｕｂｊｅｃｔやＤＯｂｊｅｃｔ
などのクラス・オブジェクトを備えている。

【０２２５】スキーマが主に持つ関数とステートマシン
を以下に示しておく。

【０２２６】ＡｃｔｉｖａｔｉｏｎＭｏｎｉｔｏ
ｒ（）：スキーマがＲｅａｄｙ時にＡｃｔｉｖｅになる
ための評価関数。Ａｃｔｉｏｎｓ（）：Ａｃｔｉｖｅ時の実行用ステート
マシン。Ｇｏａｌ（）：Ａｃｔｉｖｅ時にスキーマがＧｏａｌに
達したかを評価する関数。Ｇｏａｌ（）：Ａｃｔｉｖｅ時にスキーマがｆａｉｌ状
態かを判定する関数。ＳｌｅｅｐＡｃｔｉｏｎｓ（）：Ｓｌｅｅｐ前に実行さ
れるステートマシン。ＳｌｅｅｐＭｏｎｉｔｏｒ（）：Ｓｌｅｅｐ時にＲｅｓ
ｕｍｅするための評価関数。ＲｅｓｕｍｅＡｃｔｉｏｎｓ（）：Ｒｅｓｕｍｅ前にＲ
ｅｓｕｍｅするためのステートマシン。ＤｅｓｔｒｏｙＭｏｎｉｔｏｒ（）：Ｓｌｅｅｐ時にス
キーマがｆａｉｌ状態か判定する評価関数。ＭａｋｅＰｒｏｎｏｍｅ（）：ツリー全体のターゲット
を決定する関数である。

【０２２７】これらの関数は、ＳｃｈｅｍａＢａｓｅで
記述されている。

【０２２８】図３１には、ＭａｋｅＰｒｏｎｏｍｅ関数
を実行する処理手順をフローチャートの形式で示してい
る。

【０２２９】スキーマのＭａｋｅＰｒｏｎｏｍｅ関数が
コールされると、まず、スキーマ自信に子供スキーマが
存在するかどうかを判別する（ステップＳ１）。

【０２３０】子供スキーマが存在する場合には、同様に
すべての子供スキーマのＭａｋｅＰｒｏｎｏｍｅ関数を
再帰的にコールする（ステップＳ２）。

【０２３１】そして、スキーマ自身のＭａｋｅＰｒｏｎ
ｏｍｅを実行して、Ｐｒｏｎｏｍｅオブジェクトにター
ゲットが代入される（ステップＳ３）。

【０２３２】この結果、自分以下のすべてのスキーマの
Ｐｒｏｎｏｍｅに対して同じターゲットが代入され、行
動が終了（完結、異常終了など）するまでスキーマは解
放されない。新規のターゲットのために同じ行動を実行
するためには同じクラス定義のスキーマをメモリ空間上
に生成する。

【０２３３】図３２には、Ｍｏｎｉｔｏｒ関数を実行す
る処理手順をフローチャートの形式で示している。

【０２３４】まず、評価フラグ（Ａｓｓｅｓｓｓｍｅｎ
ｔＦｌａｇ）をオンに設定して（ステップＳ１１）、ス
キーマ自身のＡｃｔｉｏｎを実行する（ステップＳ１
２）。このとき、子供スキーマの選定も行なう。そし
て、評価フラグをオフに戻す（ステップＳ１３）。

【０２３５】子供スキーマが存在する場合には（ステッ
プＳ１４）、ステップＳ１２において選択した子供スキ
ーマのＭｏｎｉｔｏｒ関数を再帰的にコールする（ステ
ップＳ１５）。

【０２３６】次いで、スキーマ自身のＭｏｎｉｔｏｒ関
数を実行して（ステップＳ１６）、活動度レベルと行動
実行に使用するリソースを算出して（ステップＳ１
７）、関数の戻り値とする。

【０２３７】図３３及び図３４には、Ａｃｔｉｏｎｓ関
数を実行する処理手順をフローチャートの形式で示して
いる。

【０２３８】まず、スキーマがＳＴＯＰＰＩＮＧ状態か
どうかをチェックし（ステップＳ２１）、次いで、ＳＴ
ＯＰＰＩＮＧすべき状態かどうかをチェックする（ステ
ップＳ２２）。

【０２３９】ＳＴＯＰＰＩＮＧすべき状態である場合に
は、さらに子供スキーマがいるかどうかをチェックする
（ステップＳ２３）。そして、子供スキーマがいる場合
にはこれをＧＯ_ＴＯ_ＳＴＯＰ状態に移行させてから
（ステップＳ２４）、ＨａｖｅＴｏＳｔｏｐＦｌａｇを
オンにする（ステップＳ２５）。

【０２４０】また、ＳＴＯＰＰＩＮＧすべき状態でない
場合には、ＲＵＮＮＩＮＧ状態かどうかをチェックする
（ステップＳ２６）。

【０２４１】ＲＵＮＮＩＮＧ状態でない場合には、さら
に子供スキーマがいるかどうかをチェックする（ステッ
プＳ２７）。そして、子供スキーマがいる場合には、Ｈ
ａｖｅＴｏＳｔｏｐＦｌａｇをオンにする（ステップＳ
２８）。

【０２４２】次いで、現在のシステム状態とＨａｖｅＴ
ｏＲｕｎＦｌａｇとＨａｖｅＴｏＳｔｏｐＦｌａｇと子
供スキーマの動作状態から次の自分自身の状態を決定す
る（ステップＳ２９）。

【０２４３】次いで、スキーマ自身のＡｃｔｉｏｎ関数
を実行する（ステップＳ３０）。

【０２４４】その後、スキーマ自身がＧＯ_ＴＯ_ＳＴＯ
Ｐ状態かどうかをチェックする（ステップＳ３１）。Ｇ
Ｏ_ＴＯ_ＳＴＯＰ状態でない場合には、さらに子供スキ
ーマがいるかどうかをチェックする（ステップＳ３
２）。そして、子供スキーマがいる場合には、ＧＯ_Ｔ
Ｏ_ＳＴＯＰ状態の子供スキーマがいるかどうかをチェ
ックする（ステップＳ３３）。

【０２４５】ＧＯ_ＴＯ_ＳＴＯＰ状態の子供スキーマが
いる場合には、これらのスキーマのＡｃｔｉｏｎ関数を
実行する（ステップＳ３４）。

【０２４６】次いで、ＲＵＮＮＩＮＧ中の子供スキーマ
がいるかどうかをチェックする（ステップＳ３５）。Ｒ
ＵＮＮＩＮＧ中の子供スキーマがいない場合には、停止
中の子供スキーマがいるかどうかをチェックして（ステ
ップＳ３６）、停止中の子供スキーマのＡｃｔｉｏｎ関
数を実行する（ステップＳ３７）。

【０２４７】次いで、ＧＯ_ＴＯ_ＲＵＮ状態の子供スキ
ーマがいるかどうかをチェックする（ステップＳ３
８）。ＧＯ_ＴＯ_ＲＵＮ状態の子供スキーマがいない場
合には、ＧＯ_ＴＯ_ＳＴＯＰ状態の子供スキーマがいる
かどうかをチェックして（ステップＳ３９）、いればこ
の子供スキーマのＡｃｔｉｏｎ関数を実行する（ステッ
プＳ４０）。

【０２４８】最後に、現在のシステム状態とＨａｖｅＴ
ｏＲｕｎＦｌａｇとＨａｖｅＴｏＳｔｏｐＦｌａｇと子
供の動作状態から自分自身の次の状態を決定して,本処
理ルーチン全体を終了する（ステップＳ４１）。

【０２４９】Ｄ−３．状況依存行動階層の機能状況依存行動階層（ＳｉｔｕａｔｅｄＢｅｈａｖｉｏｒ
ｓＬａｙｅｒ）１０８は、短期記憶部１０５並びに長期
記憶部１０６の記憶内容や、内部状態管理部１０４によ
って管理される内部状態を基に、ロボット装置１が現在
置かれている状況に即応した行動を制御する。

【０２５０】前項で述べたように、本実施形態に係る状
況依存行動階層１０８は、スキーマのツリー構造（図１
９を参照のこと）で構成されている。各スキーマは、自
分の子供と親の情報を知っている状態で独立性を保って
いる。このようなスキーマ構成により、状況依存行動階
層１０８は、Ｃｏｎｃｕｒｒｅｎｔな評価、Ｃｏｎｃｕ
ｒｒｅｎｔな実行、Ｐｒｅｅｍｐｔｉｏｎ、Ｒｅｅｎｔ
ｒａｎｔという主な特徴を持っている。以下、これらの
特徴について詳解する。

【０２５１】（１）Ｃｏｎｃｕｒｒｅｎｔな評価：行動
モジュールとしてのスキーマは外部刺激や内部状態の変
化に応じた状況判断を行なうＭｏｎｉｔｏｒ機能を備え
ていることは既に述べた。Ｍｏｎｉｔｏｒ機能は、スキ
ーマがクラス・オブジェクトＳｃｈｅｍａＢａｓｅでＭ
ｏｎｉｔｏｒ関数を備えていることにより実装されてい
る。Ｍｏｎｉｔｏｒ関数とは、外部刺激と内部状態に応
じて当該スキーマの活動度レベル（Activation Level：
ＡＬ値）を算出する関数である。

【０２５２】図１９に示すようなツリー構造を構成する
場合、上位（親）のスキーマは外部刺激と内部状態を引
数として下位（子供）のスキーマのＭｏｎｉｔｏｒ関数
をコールすることができ、子供のスキーマはＡＬ値を返
り値とする。また、スキーマは自分のＡＬ値を算出する
ために、さらに子供のスキーマのＭｏｎｉｔｏｒ関数を
コールすることができる。そして、ルートのスキーマに
は各サブツリーからのＡＬ値が返されるので、外部刺激
と内部状態の変化に応じた最適なスキーマすなわち行動
を統合的に判断することができる。

【０２５３】このようにツリー構造になっていることか
ら、外部刺激と内部状態の変化による各スキーマの評価
は、まずツリー構造の下から上に向かってＣｏｎｃｕｒ
ｒｅｎｔに行なわれる。図３２のフローチャートでも示
したように、スキーマに子供スキーマがある場合には
（ステップＳ１４）、選択した子供のＭｏｎｉｔｏｒ関
数をコールしてから（ステップＳ１５）、自身のＭｏｎ
ｉｔｏｒ関数を実行する。

【０２５４】次いで、ツリー構造の上から下に向かって
評価結果としての実行許可を渡していく。評価と実行
は、その行動が用いるリソースの競合を解きながら行な
われる。

【０２５５】本実施形態に係る状況依存行動階層１０８
は、スキーマのツリー構造を利用して、並列的に行動の
評価を行なうことができるので、外部刺激や内部状態な
どの状況に対しての適応性がある。また、評価時には、
ツリー全体に関しての評価を行ない、このとき算出され
る活動度レベル（ＡＬ）値によりツリーが変更されるの
で、スキーマすなわち実行する行動を動的にプライオリ
タイズすることができる。

【０２５６】（２）Ｃｏｎｃｕｒｒｅｎｔな実行：ルー
トのスキーマには各サブツリーからのＡＬ値が返される
ので、外部刺激と内部状態の変化に応じた最適なスキー
マすなわち行動を統合的に判断することができる。例え
ばＡＬ値が最も高いスキーマを選択したり、ＡＬ値が所
定の閾値を越えた２以上のスキーマを選択して並列的に
行動実行するようにしてもよい（但し、並列実行すると
きは各スキーマ同士でハードウェア・リソースの競合が
ないことを前提とする）。

【０２５７】実行許可をもらったスキーマは実行され
る。すなわち、実際にそのスキーマはさらに詳細の外部
刺激や内部状態の変化を観測して、コマンドを実行す
る。実行に関しては、ツリー構造の上から下に向かって
順次すなわちＣｏｎｃｕｒｒｅｎｔに行なわれる。図３
３及び図３４のフローチャートでも示したように、スキ
ーマに子供スキーマがある場合には、子供のＡｃｔｉｏ
ｎｓ関数を実行する。

【０２５８】Ａｃｔｉｏｎ関数は、スキーマ自身が持つ
行動を記述したステートマシン（後述）を備えている。
図１９に示すようなツリー構造を構成する場合、親スキ
ーマは、Ａｃｔｉｏｎ関数をコールして、子供スキーマ
の実行を開始したり中断させたりすることができる。

【０２５９】本実施形態に係る状況依存行動階層１０８
は、スキーマのツリー構造を利用して、リソースが競合
しない場合には、余ったリソースを使う他のスキーマを
同時に実行することができる。但し、Ｇｏａｌまでに使
用するリソースに対して制限を加えないと、ちぐはぐな
行動出現が起きる可能性がある。状況依存行動階層１０
８において決定された状況依存行動は、リソース・マネ
ージャにより反射行動部１０９による反射的行動とのハ
ードウェア・リソースの競合の調停を経て、機体動作
（ＭｏｔｉｏｎＣｏｎｔｒｏｌｌｅｒ）に適用される。

【０２６０】（３）Ｐｒｅｅｍｐｔｉｏｎ：１度実行に
移されたスキーマであっても、それよりも重要な（優先
度の高い）行動があれば、スキーマを中断してそちらに
実行権を渡さなければならない。また、より重要な行動
が終了（完結又は実行中止など）したら、元のスキーマ
を再開して実行を続けることも必要である。

【０２６１】このような優先度に応じたタスクの実行
は、コンピュータの世界におけるＯＳ（オペレーティン
グ・システム）のＰｒｅｅｍｐｔｉｏｎと呼ばれる機能
に類似している。ＯＳでは、スケジュールを考慮するタ
イミングで優先度のより高いタスクを順に実行していく
という方針である。

【０２６２】これに対し、本実施形態に係るロボット１
の行動制御システム１００は、複数のオブジェクトにま
たがるため、オブジェクト間での調停が必要になる。例
えば反射行動を制御するオブジェクトであるＲｅｆｌｅ
ｘｉｖｅＳＢＬは、上位の状況依存行動を制御するオブ
ジェクトであるＳＢＬの行動評価を気にせずに物を避け
たり、バランスをとったりする必要がある。これは、実
際に実行権を奪い取り実行を行なう訳であるが、上位の
行動モジュール（ＳＢＬ）に、実行権利が奪い取られた
ことを通知して、上位はその処理を行なうことによって
Ｐｒｅｅｍｐｔｉｖｅな能力を保持する。

【０２６３】また、状況依存行動層１０８内において、
外部刺激と内部状態の変化に基づくＡＬ値の評価の結
果、あるスキーマに実行許可がなされたとする。さら
に、その後の外部刺激と内部状態の変化に基づくＡＬ値
の評価により、別のスキーマの重要度の方がより高くな
ったとする。このような場合、実行中のスキーマのＡｃ
ｔｉｏｎｓ関数を利用してＳｌｅｅｐ状態にして中断す
ることにより、Ｐｒｅｅｍｐｔｉｖｅな行動の切り替え
を行なうことができる。

【０２６４】実行中のスキーマのＡｃｔｉｏｎｓ（）の
状態を保存して、異なるスキーマのＡｃｔｉｏｎｓ（）
を実行する。また、異なるスキーマのＡｃｔｉｏｎ
ｓ（）が終了した後、中断されたスキーマのＡｃｔｉｏ
ｎｓ（）を再度実行することができる。

【０２６５】また、実行中のスキーマのＡｃｔｉｏｎｓ
（）を中断して、異なるスキーマに実行権が移動する前
に、ＳｌｅｅｐＡｃｔｉｏｎｓ（）を実行する。例え
ば、ロボット１は、対話中にサッカーボールを見つける
と、「ちょっと待ってね」と言って、サッカーすること
ができる。

【０２６６】（４）Ｒｅｅｎｔｒａｎｔ：状況依存行動
階層１０８を構成する各スキーマは、一種のサブルーチ
ンである。スキーマは、複数の親からコールされた場合
には、その内部状態を記憶するために、それぞれの親に
対応した記憶空間を持つ必要がある。

【０２６７】これは、コンピュータの世界では、ＯＳが
持つＲｅｅｎｔｒａｎｔ性に類似しており、本明細書で
はスキーマのＲｅｅｎｔｒａｎｔ性と呼ぶ。図３０を参
照しながら説明したように、スキーマはクラス・オブジ
ェクトで構成されており、クラス・オブジェクトのエン
ティティすなわちインスタンスをターゲット（Ｐｒｏｎ
ｏｍｅ）毎に生成することによりＲｅｅｎｔｒａｎｔ性
が実現される。

【０２６８】スキーマのＲｅｅｎｔｒａｎｔ性につい
て、図３５を参照しながらより具体的に説明する。

【０２６９】ＳｃｈｅｍａＨａｎｄｌｅｒは、スキーマ
を管理するためのクラス・オブジェクトであり、ＳＢＬ
を構成するスキーマのコンフィギュレーション情報をフ
ァイルとして保管している。システムの起動時に、Ｓｃ
ｈｅｍａＨａｎｄｌｅｒは、このコンフィギュレーショ
ン情報ファイルを読み込んで、ＳＢＬ内のスキーマ構成
を構築する。図３１に示す例では、ＥａｔやＤｉａｌｏ
ｇなどの行動を規定するスキーマのエンティティがメモ
リ空間上にマッピングされているとする。

【０２７０】ここで、外部刺激と内部状態の変化に基づ
く活動度レベルの評価により、スキーマＤｉａｌｏｇに
対してＡというターゲット（Ｐｒｏｎｏｍｅ）が設定さ
れて、Ｄｉａｌｏｇが人物Ａとの対話を実行するように
なったとする。

【０２７１】その後、人物Ｂがロボット１と人物Ａとの
対話に割り込み、外部刺激と内部状態の変化に基づく活
動度レベルの評価を行なった結果、Ｂとの対話を行なう
スキーマの方がより優先度が高くなったとする。

【０２７２】このような場合、ＳｃｈｅｍａＨａｎｄｌ
ｅｒは、Ｂとの対話を行なうためのクラス継承した別の
Ｄｉａｌｏｇエンティティ（インスタンス）をメモリ空
間上にマッピングする。別のＤｉａｌｏｇエンティティ
を使用して、先のＤｉａｌｏｇエンティティとは独立し
て、Ｂとの対話を行なうことから、Ａとの対話内容は破
壊されずに済む。したがって、ＤｉａｌｏｇＡはデー
タの一貫性を保持することができ、Ｂとの対話が終了す
ると、Ａとの対話を中断した時点から再開することがで
きる。

【０２７３】Ｒｅａｄｙリスト内のスキーマは、その対
象物（外部刺激）に応じて評価すなわちＡＬ値の計算が
行なわれ、実行権が引き渡される。その後、Ｒｅａｄｙ
リスト内に移動したスキーマのインスタンスを生成し
て、これ以外の対象物に対して評価を行なう。これによ
り、同一のスキーマをａｃｔｉｖｅ又はｓｌｅｅｐ状態
にすることができる。

【０２７４】Ｅ．ロボットの内部状態管理本実施形態に係るロボットの行動制御システム１００で
は、状況依存行動階層１０８は内部状態と外部環境によ
って行動を決定する。

【０２７５】ロボット装置１の内部状態は、本能や感情
といった数種類の情動で構成され、数式モデル化して扱
われる。内部状態管理部（ＩＳＭ：Internal Status Ma
nager）１０４は、上述した各認識機能部１０１〜１０
３によって認識された外部刺激（ＥＳ：Ｅｘｔｅｒｎａ
ｌＳｔｉｍｕｌａ）と、時間的経過に基づいて、内部状
態を管理する。

【０２７６】Ｅ−１．情動の階層化本実施形態では、情動についてその存在意義による複数
階層で構成され、それぞれの階層で動作する。決定され
た複数の動作から、そのときの外部環境や内部状態によ
ってどの動作を行なうかを決定するようになっている
（後述）。また、それぞれの階層で行動は選択される
が、より低次の行動から優先的に動作を発現していくこ
とにより、反射などの本能的行動や、記憶を用いた動作
選択などの高次の行動を１つの個体上で矛盾なく発現す
ることができる。

【０２７７】図３６には、本実施形態に係る内部状態管
理部１０４の階層的構成を模式的に示している。

【０２７８】図示の通り、内部状態管理部１０４は、情
動などの内部情報を、情動を本能や欲求などの個体存続
に必要な１次情動と、この１次情動の満足度（過不足）
によって変化する２次情動に大別する。また、１次情動
は、個体存続においてより生理的なものから連想に至る
ものまで階層的に細分化されている。

【０２７９】図示の例では、１次情動は、低次から高次
に向かって、下位の１次情動、上位の１次情動、連想に
よる１次情動に区分される。下位の１次情動は、大脳辺
縁系へのアクセスに相当し、ホメオスタシス（個体維
持）が保たれるように情動発生するとともに、ホメオス
タシスが脅かされる場合には優先される。また、上位の
１次情動は、大脳新皮質へのアクセスに相当し、内発的
欲求や社会的欲求などの種族維持に関わる。上位の１次
情動は、学習や環境に依って満足度が変化する（学習や
コミュニケーションにより満足される）。

【０２８０】１次情動の各階層は、行動選択されたスキ
ーマを実行することによる一時情動（本能）レベルの変
化量ΔＩを出力する。

【０２８１】２次情動は、いわゆる感情（Ｅｍｏｔｉｏ
ｎ）に相当し、喜び（Ｊｏｙ）、悲しみ（Ｓａｄ）、怒
り（Ａｎｇｅｒ）、驚き（Ｓｕｒｐｒｉｓｅ）、嫌気
（Ｄｉｓｇｕｓｔ）、畏怖（Ｆｅｅｒ）などの要素から
なる。１次情動の変化量ΔＩに応じて２次情動の変化量
（満足度）ΔＥが決定される。

【０２８２】状況依存行動階層１０８では、主に１次情
動を基に行動選択を行なうが、２次情動が強い場合に
は、２次情動に基づく行動選択を行なうこともできる。
さらに、１次情動を基に選択された行動に対して２次情
動により生成されたパラメータを使用してモジュレーシ
ョンを行なうことも可能である。

【０２８３】個体存続のための情動階層は、生得的反射
による行動がまず選択される。次いで、下位の１次情動
を満たす行動を選択する。そして、上位の１次情動を満
たす行動発生、連想による１次情動を満たす行動発生
と、よりプリミティブな個体保持から実現する。

【０２８４】この際、各階層の１次情動は、直近の階層
に対して圧力をかけることができる。自身で決定した行
動を選択するための指標が強い場合、直近の階層で決定
された行動を抑制して、自身の行動を発現することがで
きる。

【０２８５】前項Ｄでも述べたように、状況依存行動階
層１０８は、目標とする動作を持った複数のスキーマに
よって構成されている（図１８、図１９などを参照のこ
と）。状況依存行動階層１０８では、各スキーマが持つ
活動度レベルを指標にしてスキーマすなわち行動を選択
する。内部状態の活動度レベルと外部状況の活動度レベ
ルによりスキーマ全体の活動度レベルが決定する。スキ
ーマは、目標とする動作を実行するための途中経過毎
に、活動度レベルを保持する。○○を満たす行動発生と
は、○○を満たす行動が最終目標であるスキーマを実行
することに相当する。

【０２８６】内部状態の活動度レベルは、スキーマを実
行したときの１次情動における階層毎の変化量ΔＩに基
づく２次情動の満足度の変化ΔＥの総和によって決定さ
れる。ここで、１次情動がＬ１，Ｌ２，Ｌ３の３階層か
らなり、スキーマ選択時の１次情動の各階層に由来する
２次情動の変化をそれぞれΔＥ_L1，ΔＥ_L2，ΔＥ_L3，と
すると、それぞれに重み因子ｗ₁，ｗ₂，ｗ₃を掛けて活
動度レベルを算出する。下位の１次情動に対する重み因
子をより大きくすることにより、下位の１次情動を満た
す行動がより選択され易くなる。また、これら重み因子
を調整することにより、各階層の１次情動が直近の階層
に対して圧力をかける（Ｃｏｎｃｅｎｔｒａｔｉｏｎ：
行動抑制）という作用を得ることができる。

【０２８７】ここで、情動の階層化構造を利用した行動
選択の実施例について説明する。但し、以下では下位の
１次情動としてＳｌｅｅｐ（眠気）を、上位の１次情動
としてＣｕｒｉｏｓｉｔｙ（好奇心）を扱う。

【０２８８】（１）下位の１次情動であるＳｌｅｅｐが
不足してきて、Ｓｌｅｅｐを満たすスキーマの活動度レ
ベルが高まってきたとする。このとき、他のスキーマの
活動度レベルが上がらなければ、Ｓｌｅｅｐを満たすス
キーマは、Ｓｌｅｅｐが満たされるまで自身を実行す
る。

【０２８９】（２）Ｓｌｅｅｐが満たされる前に、上位
の１次情動であるＣｕｒｉｏｓｉｔｙが不足してきたと
する。しかし、Ｓｌｅｅｐのほうが個体維持に直結する
ため、Ｓｌｅｅｐの活動度レベルが一定値以下になるま
では、Ｓｌｅｅｐを満たすスキーマが実行し続ける。そ
して、Ｓｌｅｅｐがある程度満たされたら、Ｃｕｒｉｏ
ｓｉｔｙを満たすスキーマを実行することができる。

【０２９０】（３）Ｃｕｒｉｏｓｉｔｙを満たすスキー
マ実行中に手を勢いよくロボットの顔面に近づけたとす
る。これに応答して、ロボットは色認識と大きさ認識に
よる突然肌色が近づいてきたことが判り、生得的な反射
行動として手から顔を避ける、すなわち後ろに頭を引く
という動作を反射的に行なう。この反射的な動作は動物
の脊髄反射に相当する。反射は、最も下位にあるスキー
マなので、反射スキーマがまず実行される。

【０２９１】脊髄反射の後、それに伴う情動変化が起
き、その変化幅と他のスキーマの活動度レベルから、続
いて情動表出スキーマを行なうかどうかを決定する。情
動表出スキーマが行なわれていない場合は、Ｃｕｒｉｏ
ｓｉｔｙを満たすスキーマが続行される。

【０２９２】（４）あるスキーマ自身の下位にあるスキ
ーマは通常自身より選択される可能性が高いが、自身の
活動度レベルが極端に高いときに限り、下位のスキーマ
を抑制して（Ｃｏｎｃｅｎｔｒａｔｉｏｎ）、一定値ま
で自身を実行することが可能である。Ｓｌｅｅｐの不足
が著しいときは、反射行動スキーマの行動を出したいと
きであっても、一定値に回復するまではＳｌｅｅｐを満
たすスキーマが優先的に実行される。

【０２９３】Ｅ−２．他の機能モジュールとの連携図３７には、内部状態管理部１０４と他の機能モジュー
ルとの通信経路を模式的に示している。

【０２９４】短期記憶部１０５は、外部環境の変化を認
識する各認識機能部１０１〜１０３からの認識結果を、
内部状態管理部１０４と状況依存行動階層１０８に出力
する。内部状態管理部１０４は、状況依存行動階層１０
８に内部状態を通知する。これに対し、状況依存行動階
層１０８は、連想又は決定した本能や感情の情報を返
す。

【０２９５】また、状況依存行動階層１０８は、内部状
態と外部環境から算出される活動度レベルを基に行動を
選択するとともに、選択した行動の実行と完了を短期記
憶部１０５経由で内部状態管理部１０４に通知する。

【０２９６】内部状態管理部１０４は、行動毎に内部状
態を長期記憶部１０６に出力する。これに対し、長期記
憶部１０６は、記憶情報を返す。

【０２９７】バイオリズム管理部は、バイオリズム情報
を内部状態管理部１０４に供給する。

【０２９８】Ｅ−３．時間経過による内部状態の変化内部状態の指標は時間経過により変化する。例えば、１
次情動すなわち本能であるＨｕｎｇｅｒ（空腹感）、Ｆ
ａｔｉｇｕｅ（疲労）、Ｓｌｅｅｐ（眠気）は、時間経
過によりそれぞれ以下のように変化する。

【０２９９】Ｈｕｎｇｅｒ：おなかが減る（仮想値又は
バッテリ残量）Ｆａｔｉｇｕｅ：疲れがたまるＳｌｅｅｐ：眠気がたまる

【０３００】また、本実施形態では、ロボットの２次情
動すなわち感情（Ｅｍｏｔｉｏｎ）の要素としてＰｌｅ
ａｓａｎｔｎｅｓｓ（満足度），Ａｃｔｉｖａｔｉｏｎ
（活動度），Ｃｅｒｔａｉｎｔｙ（確信度）を定義して
いるが、時間経過によりそれぞれ以下のように変化す
る。

【０３０１】Ｐｌｅａｓａｎｔｎｅｓｓ：Ｎｅｕｔｒａ
ｌ（中立）に向かって変化するＡｃｔｉｖａｔｉｏｎ：バイオリズムやＳｌｅｅｐ（眠
気）に依存するＣｅｒｔａｉｎｔｙ：Ａｔｔｅｎｔｉｏｎに依存する

【０３０２】図３８には、内部状態管理部１０４が時間
変化に伴って内部状態を変化させるための仕組みを示し
ている。

【０３０３】図示のように、バイオリズム管理部は、一
定の周期でバイオリズム情報を通知する。これに対し、
内部状態管理部１０４は、バイオリズムにより１次情動
の各要素の値を変更するとともに、２次情動であるＡｃ
ｔｉｖａｔｉｏｎ（活動度）を変動させる。そして、状
況依存行動階層１０８は、バイオリズム管理部からの通
知がある度に、内部状態管理部１０４から本能や感情な
ど内部状態の指標値を受け取るので、内部状態を基に各
スキーマの活動度レベルを算出することにより、状況に
依存した行動（スキーマ）を選択することができる。

【０３０４】Ｅ−４．動作実行による内部状態の変化内部状態は、ロボットが動作を実行することによっても
変化する。

【０３０５】例えば、「眠る」という行動を行なうスキ
ーマは、下位の１次情動としてのＳｌｅｅｐ（眠気）を
満たす行動が最終目標としている。状況依存行動階層１
０８では、１次情動としてのＳｌｅｅｐと２次情動とし
てのＡｃｔｉｖａｔｉｏｎを基に各スキーマの活動度レ
ベルを算出・比較して、「眠る」スキーマを選択し、こ
の結果、眠るという行動が実現される。

【０３０６】一方、状況依存行動階層１０８は、眠ると
いう行動の実行完了を短期記憶部１０５経由で内部状態
管理部１０４に伝達する。これに対し、内部状態管理部
１０４は、「眠る」行動の実行により、１次情動である
Ｓｌｅｅｐの指標値を変更する。

【０３０７】そして、状況依存行動階層１０８では、Ｓ
ｌｅｅｐが満たされた度合いと２次情動としてのＡｃｔ
ｉｖａｔｉｏｎを基に各スキーマの活動度レベルを改め
て算出・比較する。この結果、優先度が高くなった他の
スキーマを選択し、眠るというスキーマから抜ける。

【０３０８】図３９には、内部状態管理部１０４がロボ
ットの動作実行により内部状態を変化させるための仕組
みを示している。

【０３０９】状況依存行動階層１０８は、状況依存型で
選択された行動の実行開始及び実行終了、並びにＡｔｔ
ｅｎｔｉｏｎ情報を、短期記憶部１０５経由で内部状態
管理部１０４に通知する。

【０３１０】内部状態管理部１０４は、選択された行動
の実行完了情報が通知されると、Ａｔｔｅｎｔｉｏｎ情
報に則って、短期記憶部１０５から得た外部環境を確認
して、１次情動としての本能（Ｓｌｅｅｐ）の指標値を
変更するとともに、これに伴って２次情動としての感情
も変更する。そして、これら内部状態の更新データを、
状況依存行動階層１０８並びに長期記憶部１０６に出力
する。状況依存行動階層１０８では、新たに受け取った
内部状態の指標値を基に、各スキーマの活動度レベルを
算出して、状況に依存した次の行動（スキーマ）を選択
する。

【０３１１】また、長期記憶部１０６は、内部状態の更
新データを基に記憶情報を更新するとともに、更新内容
を内部状態管理部１０４に通知する。内部状態管理部１
０４では、外部環境に対する確信度と長期記憶部１０６
の確信度により、２次情動としての確信度（Ｃｅｒｔａ
ｉｎｔｙ）を決定する。

【０３１２】Ｅ−５．センサ情報による内部状態の変化ロボットが動作を実行したときのその動作程度は、各認
識機能部１０１〜１０３によって認識され、短期記憶部
１０５経由で内部状態管理部１０４に通知される。内部
状態管理部１０４は、この動作程度を例えばＦａｔｉｇ
ｕｅ（疲労）として１次情動の変化に反映させることが
できる。また、この１次情動の変化に応答して、２次情
動も変化させることができる。

【０３１３】図４０には、内部状態管理部１０４が外部
環境の認識結果により内部状態を変化させるための仕組
みを示している。

【０３１４】内部状態管理部１０４は、短期記憶部１０
５経由で各認識機能部１０１〜１０３による認識結果を
受け取ると、１次情動の指標値を変更するとともに、こ
れに伴って２次情動としての感情も変更する。そして、
これら内部状態の更新データを、状況依存行動階層１０
８に出力する。

【０３１５】状況依存行動階層１０８では、新たに受け
取った内部状態の指標値を基に、各スキーマの活動度レ
ベルを算出して、状況に依存した次の行動（スキーマ）
を選択することができる。

【０３１６】Ｅ−６．連想による内部状態の変化既に述べたように、本実施形態に係るロボットは、長期
記憶部１０６において連想記憶機能を備えている。この
連想記憶は、あらかじめ複数のシンボルからなる入力パ
ターンを記憶パターンとして記憶しておき、その中のあ
る１つのパターンに類似したパターンが想起される仕組
みのことであり、外部刺激から内部状態の変化を連想記
憶することができる。

【０３１７】例えば、りんごが見えた場合に「嬉しい」
という情動の変化を起こす場合について考察してみる。

【０３１８】りんごが視覚認識機能部１０１において認
識されると、短期記憶部１０５を経由して状況依存行動
階層１０８に外部環境の変化として通知される。

【０３１９】長期記憶部１０６では、「りんご」に関す
る連想記憶により、「（りんごを）食べる」という行動
と、食べることにより１次情動（空腹感）が指標値で３
０だけ満たされるという内部状態の変化を想起すること
ができる。

【０３２０】状況依存行動階層１０８は、長期記憶部１
０６から記憶情報を受け取ると、内部状態の変化ΔＩ＝
３０を、内部状態管理部１０４に通知する。

【０３２１】内部状態管理部１０４では、通知されたΔ
Ｉを基に、２次情動の変化量ΔＥを算出して、りんごを
食べることによる２次情動Ｅの指標値を得ることができ
る。

【０３２２】図４１には、内部状態管理部１０４が連想
記憶により内部状態を変化させるための仕組みを示して
いる。

【０３２３】外部環境が短期記憶部１０５を経由して状
況依存行動階層１０８に通知される。長期記憶部１０６
の連想記憶機能により、外部環境に応じた行動と、１次
情動の変化ΔＩを想起することができる。

【０３２４】状況依存行動階層１０８は、この連想記憶
により得られた記憶情報を基に行動を選択するととも
に、１次情動の変化ΔＩを内部状態管理部１０４に通知
する。

【０３２５】内部状態管理部１０４では、通知を受けた
１次情動の変化ΔＩと、自身で管理している１次情動の
指標値とを基に、２次情動の変化ΔＥを算出して、２次
情動を変化させる。そして、新たに生成された１次情動
及び２次情動を、内部状態更新データとして状況依存行
動階層１０８に出力する。

【０３２６】状況依存行動階層１０８では、新たに受け
取った内部状態の指標値を基に、各スキーマの活動度レ
ベルを算出して、状況に依存した次の行動（スキーマ）
を選択することができる。

【０３２７】Ｅ−７．生得的な行動による内部状態の変
化本実施形態に係るロボットが動作実行により内部状態を
変化させることは既に述べた通りである（図３９を参照
のこと）。この場合、１次情動と２次情動からなる内部
状態の指標値を基に行動が選択されるとともに、行動の
実行完了により情動が満たされる。他方、本実施形態に
係るロボットは、情動に依存しない、生得的な反射行動
も規定されている。この場合、外部環境の変化に応じて
反射行動が直接選択されることになり、通常の動作実行
による内部変化とは異なる仕組みとなる。

【０３２８】例えば、大きなものが突然現れたときに生
得的な反射行動をとる場合について考察してみる。

【０３２９】このような場合、例えば視覚的認識機能部
１０１による「大きいもの」という認識結果（センサ情
報）は、短期記憶部１０５を介さず、状況依存行動階層
１０８に直接入力される。

【０３３０】状況依存行動階層１０８では、「大きいも
の」という外部刺激により各スキーマの活動度レベルを
算出して、適当な行動を選択する（図１５、図２５及び
図２６を参照のこと）。この場合、状況依存行動階層１
０８では、「よける」という脊髄反射的行動を選択する
とともに、「驚く」という２次情動を決定して、これを
内部状態管理部１０４に通知する。

【０３３１】内部状態管理部１０４では、状況依存行動
階層１０８から送られてきた２次情動を自身の感情とし
て出力する。

【０３３２】図４２には、内部状態管理部１０４が生得
的反射行動により内部状態を変化させるための仕組みを
示している。

【０３３３】生得的な反射行動を行なう場合、各認識機
能部１０１〜１０３による戦さ情報は、短期記憶部１０
５を介さず、状況依存行動階層１０８に直接入力され
る。状況依存行動階層１０８では、センサ情報として得
た外部刺激により各スキーマの活動度レベルを算出し
て、適当な行動を選択するとともに、２次情動を決定し
て、これを内部状態管理部１０４に通知する。

【０３３４】内部状態管理部１０４では、状況依存行動
階層１０８から送られてきた２次情動を自身の感情とし
て出力する。また、状況依存行動階層１０８からのＡｃ
ｔｉｖａｔｉｏｎに対して、バイオリズムの高低によっ
て最終的なＡｃｔｉｖａｔｉｏｎを決定する。

【０３３５】状況依存行動階層１０８では、新たに受け
取った内部状態の指標値を基に、各スキーマの活動度レ
ベルを算出して、状況に依存した次の行動（スキーマ）
を選択することができる。

【０３３６】Ｅ−８．スキーマと内部状態管理部との関
係状況依存行動階層１０８は、複数のスキーマで構成さ
れ、各スキーマ毎に外部刺激や内部状態の変化によって
活動度レベルを算出して、活動度レベルの度合いに応じ
てスキーマを選択して行動を実行する（図１８、図１
９、図２５を参照のこと）。

【０３３７】図４３には、スキーマと内部状態管理部と
の関係を模式的に示している。スキーマは、ＤＳｕｂｊ
ｅｃｔやＤＯｂｊｅｃｔなどのプロキシを介して、短期
記憶部１０５、長期記憶部１０６、内部状態管理部１０
４などの外部オブジェクトと通信することができる（図
３０を参照のこと）。

【０３３８】スキーマは、外部刺激や内部状態の変化に
よって活動度レベルを算出するクラス・オブジェクトを
備えている。ＲＭ（Resource Management）オブジェク
トは、プロキシを介して短期記憶部１０５に通信して、
外部環境を取得して、外部環境に基づく活動度レベルを
算出する。また、Ｍｏｔｉｖａｔｉｏｎ算出クラス・オ
ブジェクトは、プロキシを介して長期記憶部１０６並び
に内部状態管理部１０４と通信して、内部状態の変化量
を取得して、内部状態に基づく活動度レベルすなわちＭ
ｏｔｉｖａｔｉｏｎを算出する。Ｍｏｔｉｖａｔｉｏｎ
の算出方法に関しては後に詳解する。

【０３３９】内部状態管理部１０４は、既に述べたよう
に、１次情動と２次情動とに段階的に階層化されてい
る。また、１次情動に関しては、生得的反応による１次
情動階層と、ホメオスタシスによる１次情動と、連想に
よる１次情動とに次元的に階層化されている（図３６を
参照のこと）。また、２次情動としての感情は、Ｐ（Ｐ
ｌｅａｓａｎｔｎｅｓｓ）、Ａ（Ａｃｔｉｖｉｔｙ）、
Ｃ（Ｃｏｎｃｅｎｔｒａｔｉｏｎ）の３要素にマッピン
グされている。

【０３４０】１次情動の各階層における変化ΔＩはすべ
て２次情動に入力されて、Ｐｌｅａｓａｎｔｎｅｓｓの
変化ΔＰの算出に利用される。

【０３４１】Ａｃｔｉｖｉｔｙは、センサ入力、動作時
間、バイオリズムなどの情報から統合的に判断される。

【０３４２】また、選択されたスキーマの確信度を、実
際の２次情動階層における確信度として使用する。

【０３４３】図４４には、Ｍｏｔｉｖａｔｉｏｎ算出ク
ラス・オブジェクトによるＭｏｔｉｖａｔｉｏｎ算出経
路を模式的に示している。

【０３４４】ＲＭクラス・オブジェクトは、プロキシ経
由で短期記憶部１０５にアクセスして、センサ情報を取
得し、認識された対象物の距離や大きさなどの刺激の強
さに基づいて外部刺激による活動度レベルを評価する。

【０３４５】一方、Ｍｏｔｉｖａｔｉｏｎ算出クラス・
オブジェクトは、プロキシ経由で短期記憶部１０５にア
クセスして、対象物に関する特徴を取得して、さらにプ
ロキシ経由で長期記憶部１０６の対象物の特徴を問い合
わせて内部状態の変化を取得する。そして、プロキシ経
由で内部状態管理部１０４にアクセスして、ロボット内
部にある内部評価値を算出する。したがって、Ｍｏｔｉ
ｖａｔｉｏｎの算出は、外部刺激の強さには無関係であ
る。

【０３４６】本実施形態に係るロボットの行動制御シス
テムが連想記憶を用いて外部刺激から内部状態の変化を
想起することにより、２次情動を算出して行動選択を行
なう、ということは既に述べた（図４１を参照のこ
と）。さらに、連想記憶を用いることにより、対象物毎
に異なる内部状態の変化を想起させることができる。こ
れによって、同じ状況でもその行動の発現し易さを異な
らせることができる。すなわち、外部の刺激や物理的状
況、現在の内部状態に加え、ロボットの対象物ごとの記
憶を考慮して行動を選択することができ、より多彩で多
様化した対応を実現することができる。

【０３４７】例えば、「○○が見えているから××す
る」とか、「現在○○が不足だから（何に対しても）×
×する」などの外部環境又は内部状態によって決まった
行動をするのではなく、「○○が見えても△△なので□
□する」とか、「○○が見えているけど××なので■■
する」など、対象物に関する内部状態の変化記憶を用い
ることにより、行動にバリエーションをつけることがで
きる。

【０３４８】図４５には、対象物が存在するときのＭｏ
ｔｉｖａｔｉｏｎ算出処理のメカニズムを模式的に示し
ている。

【０３４９】まず、プロキシ経由で短期記憶部１０５に
アクセスして、認識機能部１０１〜１０３により認識さ
れたターゲットの特徴を尋ねる。

【０３５０】次いで、取り出した特徴を用いて、今度は
プロキシ経由で長期記憶部１０６にアクセスして、その
特徴の対象物がスキーマに関係した欲求をどのように変
化させるか、すなわち１次情動の変化ΔＩを獲得する。

【０３５１】次いで、プロキシ経由で内部状態管理部１
０４にアクセスして、欲求の変化により快不快の値がど
のように変化するか、すなわち２次情動の変化ΔＰｌｅ
ａｓａｎｔを引き出す。

【０３５２】そして、２次情動の変化ΔＰｌｅａｓａｎ
ｔと対象物の確信度を引数とする以下のＭｏｔｉｖａｔ
ｉｏｎ算出関数ｇ_target-iにより、ｉ番目のＭｏｔｉｖ
ａｔｉｏｎを算出する。

【０３５３】

【数９】

【０３５４】また、図４６には、対象物が存在しないと
きのＭｏｔｉｖａｔｉｏｎ算出処理のメカニズムを模式
的に示している。

【０３５５】この場合、まず、行動に対する記憶に対し
て、その行動による欲求の変化ΔＩを尋ねる。

【０３５６】次いで、取得したΔＩを用いて、内部状態
管理部１０４により１次情動がΔＩだけ変化したときの
２次情動の変化ΔＰｌｅａｓａｎｔを引き出す。そし
て、この場合は、２次情動の変化ΔＰｌｅａｓａｎｔを
引数とする以下のＭｏｔｉｖａｔｉｏｎ算出関数ｇ
_nottarget-iにより、ｉ番目のＭｏｔｉｖａｔｉｏｎを
算出する。

【０３５７】

【数１０】

【０３５８】Ｅ−９．２次情動の各要素の変更方法図４７には、２次情動のうちのＰｌｅａｓａｎｔｎｅｓ
ｓを変更するためのメカニズムを図解している。

【０３５９】長期記憶部１０６は、記憶の量による１次
情動の変化を内部状態管理部１０４に入力する。また、
短期記憶部１０５は、認識機能部１０１〜１０３からの
センサ入力による１次情動の変化を内部状態管理部１０
４に入力する。

【０３６０】また、スキーマは、スキーマ実行による１
次情動の変化（Ｎｏｕｒｉｓｈｍｅｎｔ，Ｍｏｉｓｔｕ
ｒｅ，Ｓｌｅｅｐ）や、スキーマの内容による１次情動
の変化（Ａｆｆｅｃｔｉｏｎ）を内部状態管理部１０４
に入力する。

【０３６１】Ｐｌｅａｓａｎｔｎｅｓｓは、１次情動の
過不足の変化に応じて決定される。

【０３６２】また、図４８には、２次情動のうちのＡｃ
ｔｉｖｉｔｙを変更するためのメカニズムを図解してい
る。

【０３６３】Ａｃｔｉｖｉｔｙは、スキーマのＳｌｅｅ
ｐ以外の時間の総和と、バイオリズムと、センサ入力を
基に、統合的に判断される。

【０３６４】また、図４９には、２次情動のうちのＣｅ
ｒｔａｉｎｔｙを変更するためのメカニズムを図解して
いる。

【０３６５】長期記憶部１０６に対して対象物を尋ねる
と、Ｃｅｒｔａｉｎｔｙが返される。どの１次情動に着
目するかは、そのスキーマの目標とする行動に依存す
る。そして、引き出されたＣｅｒｔａｉｎｔｙがそのま
ま内部状態管理部１０４の２次情動におけるＣｅｒｔａ
ｉｎｔｙとなる。

【０３６６】図５０には、Ｃｅｒｔａｉｎｔｙを求める
ためのメカニズムを模式的に示している。

【０３６７】長期記憶部１０６では、対象物に関する認
識結果や情動などの各項目の確からしさを、スキーマ毎
に記憶している。

【０３６８】スキーマは、長期記憶部１０６に対して、
スキーマと関係する記憶の対する確からしさの値を尋ね
る。これに対し、長期記憶部１０６は、スキーマと関係
する記憶の確からしさを対象物の確からしさとして与え
る。

【０３６９】［追補］以上、特定の実施形態を参照しな
がら、本発明について詳解してきた。しかしながら、本
発明の要旨を逸脱しない範囲で当業者が該実施形態の修
正や代用を成し得ることは自明である。

【０３７０】本発明の要旨は、必ずしも「ロボット」と
称される製品には限定されない。すなわち、電気的若し
くは磁気的な作用を用いて人間の動作に似せた運動を行
なう機械装置であるならば、例えば玩具等のような他の
産業分野に属する製品であっても、同様に本発明を適用
することができる。

【０３７１】要するに、例示という形態で本発明を開示
してきたのであり、本明細書の記載内容を限定的に解釈
するべきではない。本発明の要旨を判断するためには、
冒頭に記載した特許請求の範囲の欄を参酌すべきであ
る。

【０３７２】

【発明の効果】本発明によれば、自律的な動作を行ない
ユーザとのリアリスティックなコミュニケーションを実
現することができる、優れたロボットの行動制御システ
ム及び行動制御方法、並びにロボット装置を提供するこ
とができる。

【０３７３】また、本発明によれば、視覚や聴覚などの
外部環境の認識結果や本能や感情などの内部状態などの
ロボットが置かれている状況を統合的に判断して行動を
選択することができる、優れたロボットの行動制御シス
テム及び行動制御方法、並びにロボット装置を提供する
ことができる。

【０３７４】また、本発明によれば、視覚や聴覚などの
外部環境の認識結果や本能や感情などの内部状態などの
ロボットが置かれている状況を統合的に判断して行動を
選択することができる、優れたロボットの行動制御シス
テム及び行動制御方法、並びにロボット装置を提供する
ことができる。

【０３７５】また、本発明によれば、情動についての存
在意義をより明確にして、一定の秩序の下で外部刺激や
内部状態に応じた行動を好適に選択し実行することがで
きる、優れたロボットの行動制御システム及び行動制御
方法、並びにロボット装置を提供することができる。

【０３７６】本発明によれば、情動についてその存在意
義による複数階層化を行ない、それぞれの階層で動作を
決定する。決定された複数の動作から、そのときの外部
刺激や内部状態によってどの動作を行なうかを決定す
る。それぞれの階層で行動は選択されるが、その実施さ
れる順番はロボットの内部状態の優先順位に基づくた
め、より低次の行動から優先的に動作を発現していくこ
とにより、反射などの本能的行動や、記憶を用いた動作
選択などの高次の行動を１つの個体上で矛盾なく発現す
ることができる。また、行動をカテゴライズして、スキ
ーマとして作成する際も明確な指標となる。

【０３７７】また、本発明に係るロボットの行動制御シ
ステム又は行動制御方法によれば、連想記憶を用いるこ
とにより、対象物毎に異なる内部状態の変化を想起する
ことができるので、同じ状況でもその行動の発現し易さ
を異ならせることができる。すなわち、外部の刺激や物
理的状況、現在の内部状態に加え、ロボットの対象物ご
との記憶を考慮して行動を選択することができ、より多
彩で多様化した対応を実現することができる。

【０３７８】例えば、「○○が見えているから××す
る」とか、「現在○○が不足だから（何に対しても）×
×する」などの外部環境又は内部状態によって決まった
行動をするのではなく、「○○が見えても△△なので□
□する」とか、「○○が見えているけど××なので■■
する」など、対象物に関する内部状態の変化記憶を用い
ることにより、行動にバリエーションを付けることがで
きる。

【図面の簡単な説明】

【図１】本発明に実施に供されるロボット装置１の機能
構成を模式的に示した図である。

【図２】制御ユニット２０の構成をさらに詳細に示した
図である。

【図３】本発明の実施形態に係るロボット装置１の行動
制御システム１００の機能構成を模式的に示した図であ
る。

【図４】図３に示した行動制御システム１００を構成す
る各オブジェクトによる動作の流れを示した図である。

【図５】各認識機能部１０１〜１０３における認識結果
に基づいて短期記憶部１０５内のターゲット・メモリに
入る情報の流れを示した図である。

【図６】各認識機能部１０１〜１０３における認識結果
に基づいて短期記憶部１０５内のイベント・メモリに入
る情報の流れを示した図である。

【図７】ロボット１によるユーザＡ及びＢとの対話処理
を説明するための図である。

【図８】ロボット１によるユーザＡ及びＢとの対話処理
を説明するための図である。

【図９】ロボット１によるユーザＡ及びＢとの対話処理
を説明するための図である。

【図１０】本発明の一実施形態に係る連想記憶の記憶過
程を概念的に示した図である。

【図１１】本発明の一実施形態に係る連想記憶の想起過
程を概念的に示した図である。

【図１２】競合型ニューラル・ネットワークを適用した
連想記憶システムの構成例を模式的に示した図である。

【図１３】本発明の実施形態に係る行動制御システム１
００のオブジェクト構成を模式的に示した図である。

【図１４】状況依存行動階層１０８による状況依存行動
制御の形態を模式的に示した図である。

【図１５】図１４に示した状況依存行動階層１０８によ
る行動制御の基本的な動作例を示した図である。

【図１６】図１４に示した状況依存行動階層１０８によ
り反射行動を行なう場合の動作例を示した図である。

【図１７】図１４に示した状況依存行動階層１０８によ
り感情表現を行なう場合の動作例を示した図である。

【図１８】状況依存行動階層１０８が複数のスキーマに
よって構成されている様子を模式的に示した図である。

【図１９】状況依存行動階層１０８におけるスキーマの
ツリー構造を模式的に示した図である。

【図２０】スキーマの内部構成を模式的に示している。

【図２１】Ｍｏｎｉｔｏｒ関数の内部構成を模式的に示
した図である。

【図２２】行動状態制御部の構成例を模式的に示した図
である。

【図２３】行動状態制御部の他の構成例を模式的に示し
た図である。

【図２４】状況依存行動階層１０８において通常の状況
依存行動を制御するためのメカニズムを模式的に示した
図である。

【図２５】反射行動部１０９におけるスキーマの構成を
模式的に示した図である。

【図２６】反射行動部１０９により反射的行動を制御す
るためのメカニズムを模式的に示した図である。

【図２７】状況依存行動階層１０８において使用される
スキーマのクラス定義を模式的に示した図である。

【図２８】スキーマのａｃｔｉｏｎ関数のステートマシ
ンを示した図である。

【図２９】スキーマのステートマシンを示した図であ
る。

【図３０】状況依存行動階層１０８内のクラスの機能的
構成を模式的に示した図である。

【図３１】ＭａｋｅＰｒｏｎｏｍｅ関数を実行する処理
手順を示したフローチャートである。

【図３２】Ｍｏｎｉｔｏｒ関数を実行する処理手順を示
したフローチャートである。

【図３３】Ａｃｔｉｏｎｓ関数を実行する処理手順を示
したフローチャートである。

【図３４】Ａｃｔｉｏｎｓ関数を実行する処理手順を示
したフローチャートである。

【図３５】スキーマのＲｅｅｎｔｒａｎｔ性を説明する
ための図である。

【図３６】本実施形態に係る内部状態管理部１０４の階
層的構成を模式的に示した図である。

【図３７】内部状態管理部１０４と他の機能モジュール
との通信経路を模式的に示した図である。

【図３８】内部状態管理部１０４が時間変化に伴って内
部状態を変化させるための仕組みを示した図である。

【図３９】内部状態管理部１０４がロボットの動作実行
に伴って内部状態を変化させるための仕組みを示した図
である。

【図４０】内部状態管理部１０４が外部環境の認識結果
により内部状態を変化させるための仕組みを示した図で
ある。

【図４１】内部状態管理部１０４が連想記憶により内部
状態を変化させるための仕組みを示した図である。

【図４２】内部状態管理部１０４が生得的反射行動によ
り内部状態を変化させるための仕組みを示した図であ
る。

【図４３】スキーマと内部状態管理部との関係を模式的
に示した図である。

【図４４】Ｍｏｔｉｖａｔｉｏｎ算出クラス・オブジェ
クトによるＭｏｔｉｖａｔｉｏｎ算出経路を模式的に示
した図である。

【図４５】対象物が存在するときのＭｏｔｉｖａｔｉｏ
ｎ算出処理のメカニズムを模式的に示した図である。

【図４６】対象物が存在しないときのＭｏｔｉｖａｔｉ
ｏｎ算出処理のメカニズムを模式的に示した図である。

【図４７】Ｐｌｅａｓａｎｔｎｅｓｓの変更方法を示し
た図である。

【図４８】Ａｃｔｉｖｉｔｙの変更方法を示した図であ
る。

【図４９】Ｃｅｒｔａｉｎｔｙの変更方法を示した図で
ある。

【図５０】Ｃｅｒｔａｉｎｔｙを求めるためのメカニズ
ムを示した図である。

【符号の説明】

１…ロボット装置１５…ＣＣＤカメラ１６…マイクロフォン１７…スピーカ１８…タッチセンサ１９…ＬＥＤインジケータ２０…制御部２１…ＣＰＵ２２…ＲＡＭ２３…ＲＯＭ２４…不揮発メモリ２５…インターフェース２６…無線通信インターフェース２７…ネットワーク・インターフェース・カード２８…バス２９…キーボード４０…入出力部５０…駆動部５１…モータ５２…エンコーダ５３…ドライバ１００…行動制御システム１０１…視覚認識機能部１０２…聴覚認識機能部１０３…接触認識機能部１０５…短期記憶部１０６…長期記憶部１０７…熟考行動階層１０８…状況依存行動階層１０９…反射行動部

───────────────────────────────────────────────────── フロントページの続き (72)発明者堀中里香東京都品川区北品川６丁目７番35号ソニー株式会社内 (72)発明者大谷伸弥東京都品川区北品川６丁目７番35号ソニー株式会社内Ｆターム(参考） 3C007 AS36 CS08 KS31 KS39 KT01 WA02 WB14 WB15 WB16 WB24 WB25 WC06 5H004 GA26 GB16 KD32 KD52 KD55 KD62

Claims

【特許請求の範囲】

【請求項１】自律的に動作するロボットのための行動制
御システムであって、ロボットの機体動作を記述する複数の行動記述部と、機体の外部環境を認識する外部環境認識部と、認識された外部環境及び／又は行動の実行結果に応じた
ロボットの内部状態を管理する内部状態管理部と、外部環境及び／又は内部状態に応じて前記の各行動記述
部に記述された行動の実行を評価する行動評価部と、を
具備することを特徴とするロボットの行動制御システ
ム。
【請求項２】前記外部環境認識部は、外部の視覚認識、
外部で発生する音声認識、外部から印加された接触認識
のうち少なくとも１つを行なう、ことを特徴とする請求
項１に記載のロボットの行動制御システム。
【請求項３】前記内部状態管理部は、ロボットの本能モ
デル及び／又は感情モデルを管理する、ことを特徴とす
る請求項１に記載のロボットの行動制御システム。
【請求項４】前記行動記述部は、複数の行動記述部が機
体動作の実現レベルに応じた木構造形式に構成されてお
り、前記行動評価部は該木構造の上から下に向かって複数の
行動記述部を同時並行的に評価する、ことを特徴とする
請求項１に記載のロボットの行動制御システム。
【請求項５】前記外部環境認識部による新規認識及び／
又は前記内部状態管理部による内部状態の変化に応答し
て、前記行動評価部による前記の各行動記述部の評価を
実行して、評価値を基に行動記述部に記述された行動を
選択的に実行する行動選択部をさらに備える、ことを特
徴とする請求項１に記載のロボットの行動制御システ
ム。
【請求項６】複数の行動記述部に記述された行動を同時
実行するときの機体上の資源の競合を管理する資源管理
部をさらに備え、前記行動選択部は、資源の競合関係に応じて２以上の行
動記述部を同時に選択することを許容する、ことを特徴
とする請求項５に記載のロボットの行動制御システム。
【請求項７】前記外部環境認識部による新規認識により
前記行動評価部による前記の各行動記述部の評価を実行
した結果、現在実行中の行動よりも高い評価値を得た行
動記述部が出現した場合、前記行動選択部は、現在実行
中の行動を停止して、評価値がより高い行動記述部に記
述された行動を優先的に実行する、ことを特徴とする請
求項５に記載のロボットの行動制御システム。
【請求項８】前記行動選択部は、該優先的に実行した行
動が終了した後、一旦停止された行動を再開させる、ことを特徴とする請求項７に記載のロボットの行動制御
システム。
【請求項９】前記行動選択部は、異なる外部環境の変化
に応じて同一の行動記述部を逐次選択することができ、前記行動記述部に記述された行動を実行する度に外部環
境毎に個別の作業空間を割り当てる作業空間管理部をさ
らに備える、ことを特徴とする請求項５に記載のロボッ
トの行動制御システム。
【請求項１０】自律的に動作するロボットのための行動
制御システムであって、機体動作を記述したステートマシンと、前記ステートマ
シンにおける現在の機体動作ステートの活性度レベルと
機体動作ステート起動時において使用する機体リソース
を評価する行動評価器とを備えた、１以上の行動モジュ
ールと、前記の各行動モジュールの行動評価器に対して活性度レ
ベルと使用リソースの算出を指示し、それぞれの活性度
レベルと使用リソースに応じて活性化させる行動モジュ
ールを選択し、該選択された行動モジュールのステート
マシンに実行を指示することにより、各行動モジュール
の行動状態を制御する行動状態制御部と、を具備するこ
とを特徴とするロボットの行動制御システム。
【請求項１１】前記行動評価器は、機体の外部環境及び
／又は前記ロボットの内部状態に応じて前記ステートマ
シンの活性度レベルを評価する、ことを特徴とする請求
項１０に記載のロボットの行動制御システム。
【請求項１２】前記の行動モジュールは機体動作の実現
レベルに応じた木構造形式に構成されており、前記行動状態制御部は、行動モジュール毎に実装され、
前記木構造の下位の行動モジュールに対して活性度レベ
ル及び使用リソースの評価の指示、行動モジュールの選
択、並びにステートマシンの実行の指示を行なう、こと
を特徴とする請求項１０に記載のロボットの行動制御シ
ステム。
【請求項１３】前記行動状態制御部は、活性度レベルの
低下した行動モジュールを活性状態から待機状態に遷移
させるとともに、活性度レベルが上昇した行動モジュー
ルを待機状態から活性状態に遷移させる、ことを特徴と
する請求項１０に記載のロボットの行動制御システム。
【請求項１４】行動モジュールを活性状態から待機状態
に遷移させるときに、該行動モジュールを再開するため
に必要なデータを保存するとともに待機状態に遷移させ
るために必要な行動を起動する手段と、行動モジュールを待機状態から活性状態に遷移させると
きに、保存しておいたデータを復元して行動モジュール
の状態を初期化するとともに、活性状態に遷移させるた
めに必要な行動を起動する手段と、をさらに備えること
を特徴とする請求項１３に記載のロボットの行動制御シ
ステム。
【請求項１５】自律的に動作するロボットのための行動
制御システムであって、ロボットを動作させるコマンドと該コマンド実行に必要
な機体リソースを評価する行動評価器との組み合わせか
らなる、１以上の行動モジュールと、解放されている機体リソースを検出する手段と、解放されている機体リソースによって実行可能な行動モ
ジュールを所定の優先順位に従がって選択的に起動する
手段とを備え、リソースが競合しない２以上の行動モジュールを並列実
行可能である、ことを特徴とするロボットの行動制御シ
ステム。
【請求項１６】内部状態に応じて自律的に動作するロボ
ットの行動制御システムであって、内部状態の指標である情動を複数の階層構造にして管理
する内部状態管理部と、各階層の情動を満たす行動を選択的に実行する行動選択
部と、を具備することを特徴とするロボットの行動制御
システム。
【請求項１７】前記内部状態管理部は、個体存続のため
に必要な１次情動と、該１次情動の過不足により変化す
る２次情動という段階毎に階層化するとともに、該１次
情動を生得的反射や生理的な階層から連想に至るまで次
元により階層化する、ことを特徴とする請求項１６に記
載のロボットの行動制御システム。
【請求項１８】前記行動選択部は、より低次の１次情動
を満たす行動を優先的に選択する、ことを特徴とする請
求項１７に記載のロボットの行動制御システム。
【請求項１９】前記行動選択部は、より高次の１次情動
が低次の１次情動に比し著しく不足している場合には、
低次の１次情動を満たす行動の選択を抑制する、ことを
特徴とする請求項１８に記載のロボットの行動制御シス
テム。
【請求項２０】ロボットの外部環境の変化を認識する外
部環境認識部をさらに備え、前記行動選択部は、内部状態の指標に加え、外部環境の
指標を基に行動を選択する、ことを特徴とする請求項１
６に記載のロボットの行動制御システム。
【請求項２１】前記内部状態管理部は、時間経過に応じ
て内部状態の指標を変更する、ことを特徴とする請求項
１６に記載のロボットの行動制御システム。
【請求項２２】前記内部状態管理部は、行動選択部にお
いて選択された行動の実行に応じて内部状態の指標を変
更する、ことを特徴とする請求項１６に記載のロボット
の行動制御システム。
【請求項２３】ロボットの外部環境の変化を認識する外
部環境認識部をさらに備え、前記内部状態管理部は、外部環境の変化に応じて内部状
態の指標を変更する、ことを特徴とする請求項１６に記
載のロボットの行動制御システム。
【請求項２４】ロボットの外部環境の変化を認識する外
部環境認識部と、外部環境から内部状態の変化を連想記
憶する連想記憶部をさらに備え、前記内部状態管理部は、前記連想記憶部が外部環境から
想起した内部環境の変化を基に内部状態の指標を変更す
る、ことを特徴とする請求項１６に記載のロボットの行
動制御システム。
【請求項２５】前記連想記憶部は認識される対象物毎に
内部状態の変化を連想記憶する、ことを特徴とする請求
項２４に記載のロボットの行動制御システム。
【請求項２６】自律的に動作するロボットのための行動
制御方法であって、ロボットの機体動作を記述する複数
の行動記述モジュールが用意させており、機体の外部環境を認識する外部環境認識ステップと、認識された外部環境及び／又は行動の実行結果に応じた
ロボットの内部状態を管理する内部状態管理ステップ
と、外部環境及び／又は内部状態に応じて前記の各行動記述
モジュールに記述された行動の実行を評価する行動評価
ステップと、を具備することを特徴とするロボットの行
動制御方法。
【請求項２７】前記外部環境認識ステップでは、外部の
視覚認識、外部で発生する音声認識、外部から印加され
た接触認識のうち少なくとも１つを行なう、ことを特徴
とする請求項２６に記載のロボットの行動制御方法。
【請求項２８】前記内部状態管理ステップでは、ロボッ
トの本能モデル及び／又は感情モデルを管理する、こと
を特徴とする請求項２６に記載のロボットの行動制御方
法。
【請求項２９】前記行動記述モジュールは、複数の行動
記述モジュールが機体動作の実現レベルに応じた木構造
形式に構成されており、前記行動評価ステップでは該木構造の上から下に向かっ
て複数の行動記述モジュールを同時並行的に評価する、
ことを特徴とする請求項２６に記載のロボットの行動制
御方法。
【請求項３０】前記外部環境認識ステップによる新規認
識及び／又は前記内部状態管理ステップによる内部状態
の変化に応答して、前記行動評価ステップによる前記の
各行動記述部の評価を実行して、評価値を基に行動記述
モジュールに記述された行動を選択的に実行する行動選
択ステップをさらに備える、ことを特徴とする請求項２
６に記載のロボットの行動制御方法。
【請求項３１】複数の行動記述部に記述された行動を同
時実行するときの機体上の資源の競合を管理する資源管
理ステップをさらに備え、前記行動選択ステップでは、資源の競合関係に応じて２
以上の行動記述部を同時に選択することを許容する、こ
とを特徴とする請求項３０に記載のロボットの行動制御
方法。
【請求項３２】前記外部環境認識ステップにおける新規
認識により前記行動評価ステップによる前記の各行動記
述モジュールの評価を実行した結果、現在実行中の行動
よりも高い評価値を得た行動記述モジュールが出現した
場合、前記行動選択ステップでは、現在実行中の行動を
停止して、評価値がより高い行動記述部に記述された行
動を優先的に実行する、ことを特徴とする請求項３０に
記載のロボットの行動制御方法。
【請求項３３】前記行動選択ステップは、該優先的に実
行した行動が終了した後、一旦停止された行動を再開さ
せる、ことを特徴とする請求項３２に記載のロボットの
行動制御方法。
【請求項３４】前記行動選択ステップでは、異なる外部
環境の変化に応じて同一の行動記述モジュールを逐次選
択することができ、前記行動記述モジュールに記述された行動を実行する度
に外部環境毎に個別の作業空間を割り当てる作業空間管
理ステップをさらに備える、ことを特徴とする請求項３
０に記載のロボットの行動制御方法。
【請求項３５】内部状態に応じて自律的に動作するロボ
ットのための行動制御方法であって、内部状態の指標で
ある情動を複数の階層構造にして管理する内部状態管理
ステップと、各階層の情動を満たす行動を選択的に実行する行動選択
ステップと、を具備することを特徴とするロボットの行
動制御方法。
【請求項３６】前記内部状態管理ステップでは、個体存
続のために必要な１次情動と、該１次情動の過不足によ
り変化する２次情動という段階毎に階層化するととも
に、該１次情動を生得的反射や生理的な階層から連想に
至るまで次元により階層化して内部状態を取り扱う、こ
とを特徴とする請求項３５に記載のロボットの行動制御
方法。
【請求項３７】前記行動選択ステップでは、より低次の
１次情動を満たす行動を優先的に選択する、ことを特徴
とする請求項３５に記載のロボットの行動制御方法。
【請求項３８】前記行動選択ステップでは、より高次の
１次情動が低次の１次情動に比し著しく不足している場
合には、低次の１次情動を満たす行動の選択を抑制す
る、ことを特徴とする請求項３５に記載のロボットの行
動制御方法。
【請求項３９】ロボットの外部環境の変化を認識する外
部環境認識ステップをさらに備え、前記行動選択ステップでは、内部状態の指標に加え、外
部環境の指標を基に行動を選択する、ことを特徴とする
請求項３５に記載のロボットの行動制御方法。
【請求項４０】前記内部状態管理ステップでは、時間経
過に応じて内部状態の指標を変更する、ことを特徴とす
る請求項３５に記載のロボットの行動制御方法。
【請求項４１】前記内部状態管理ステップでは、行動選
択ステップにおいて選択された行動の実行に応じて内部
状態の指標を変更する、ことを特徴とする請求項３５に
記載のロボットの行動制御方法。
【請求項４２】ロボットの外部環境の変化を認識する外
部環境認識ステップをさらに備え、前記内部状態管理ステップでは、外部環境の変化に応じ
て内部状態の指標を変更する、ことを特徴とする請求項
３５に記載のロボットの行動制御方法。
【請求項４３】ロボットの外部環境の変化を認識する外
部環境認識ステップと、外部環境から内部状態の変化を
連想記憶する連想記憶ステップをさらに備え、前記内部状態管理ステップでは、連想記憶により外部環
境から想起した内部環境の変化を基に内部状態の指標を
変更する、ことを特徴とする請求項３５に記載のロボッ
トの行動制御方法。
【請求項４４】前記連想記憶ステップでは認識される対
象物毎に内部状態の変化を連想記憶する、ことを特徴と
する請求項４３に記載のロボットの行動制御方法。
【請求項４５】内部入力又は外部入力に基づいて行動を
生成するロボット装置であって、前記ロボットの行動を決定する１以上の行動モジュール
と、前記行動モジュールを管理する行動モジュール管理手段
と、前記行動モジュールの現在のステートを記憶するステー
ト記憶手段と、前記ステート記憶手段に記憶されたステートに対応し
た、外部又は内部からの入力に基づいて行動命令を出力
する１又はそれ以上のステートマシンを備え、前記ステートマシンの行動命令の出力が停止され、その
後の行動出力が再開される際に、前記行動モジュール管
理手段は前記ステート記憶手段に記憶されたステートに
基づいて所定の行動をロボットに実行させた後、前記行
動出力が再開される、ことを特徴とするロボット装置。
【請求項４６】前記ステート記憶手段と、前記ステート
マシンは、前記行動モジュールの内部に設けられ、前記行動モジュール管理手段は、前記行動モジュールと
階層構造をなし、且つ、上位の階層に位置する他の行動
モジュールに格納されている、ことを特徴とする請求項
４５に記載のロボット装置。
【請求項４７】自律的に動作するロボット装置であっ
て、外部刺激と内部環境に基づいて状況判断して活動度レベ
ルを算出する手段と、所定のステートマシンに基づいて
入力とステートに対応した行動を出力する手段とを備え
た行動モジュールと、前記行動モジュールの状態を設定する状態設定手段と、
を具備することを特徴とするロボット装置。
【請求項４８】前記状態設定手段は、前記活動度レベル
に応じて、前記行動モジュールを準備完了、活動、又は
待機のうちいずれかの状態に設定する、を特徴とする請
求項４７に記載のロボット装置。
【請求項４９】２以上の行動モジュールが階層構造にな
されており、前記状態設定手段は、前記階層の上位の行動モジュール
が下位の行動モジュールを選択するように構成されてい
る、を特徴とする請求項４７に記載のロボット装置。