WO2001039932A1

WO2001039932A1 - Robot, son procede de commande et procede d'appreciation du caractere du robot

Info

Publication number: WO2001039932A1
Application number: PCT/JP2000/008472
Authority: WO
Inventors: Kohtaro Sabe; Rika Hasegawa; Makoto Inoue
Original assignee: Sony Corporation
Priority date: 1999-11-30
Filing date: 2000-11-30
Publication date: 2001-06-07
Also published as: US20030045203A1; US20060041332A1; CN1151016C; KR20010101883A; CN1338980A; US7117190B2

Description

明細書ロボット装置及びその制御方法並びにロボット装置の性格判別方法技術分野

本発明はロボット装置及びその制御方法並びにロボット装置の性格判別方法に関し、例えばぺットロボッ卜に適用して好適なものである。背景技術

第 1の背景技術として、近年、本願特許請求人により 4足歩行型のペットロボットが提案及び開発されている。かかるペットロボットは、一般家庭において飼育される犬や猫に似た形状を有し、「叩く」や「撫でる」といったユーザからの働きかけや、周囲の環境等に応じて自律的に行動し得るようになされたものである。

またこのペットロボットには、ユーザからの「叩く」及び「撫でる」といった働きかけに基づいて対応する行動の発現確率を変化させる学習機能や、当該働きかけの累積及び経過時間等に基づいて行動の難易度や煩雑さのレベルを段階的に変化させる成長機能などが搭載されており、これにより『ペットロボット』としての高い商品性及びァミユーズメント性を得てい.る。

ところでかかるペットロボットにおいては、各成長段階（以下、これを「成長ステージ」と呼ぶ）ごとに個別の確率状態遷移モデルでなる行動モデルを用意し、ュ一ザからの働や経過時間の累積等に基づいて行動モデルを上の「成長ステージ」の行動モデルに切り換えることにより「成長」を表現していた。またかかるぺットロボットにおいては、ユーザからの働きかけに応じて行動モデルの対応する箇所の遷移確率を変化させることにより、上述の「学習」を表現していた。ところがこの方法によると、「成長」するごとに行動モデルを新しい行動モデルに切り換えることから、「成長」の度に突然人格が変わってしまったかのごとく新しい行動を始めたり、それまでの「学習」の結果が破棄されることとなり、それまでの行動パターンに慣れ親しんだユーザからみて不自然さを感じさせる問題があった。

またかかる方法によると、重複した行動パターンがあつたとしても各「成長ステージ」ごとにその行動パターンのための行動モデル部分を用意する必要があり、その分行動モデルの生成作業が煩雑化する問題があった。

従って、例えば「成長」時において行動パターンや学習結果を次の「成長ステージ」に持ち越すことができるようにできれば、上述のような「成長」時の不自然さを解消して、より一層生物的な「成長」を表現することができ、その分ェンターティメント性を向上させることができるものと考えられる。

また第 2の背景技術として、近年、人間の感情を計算機上でモデル化し、これを表現する研究が盛んに行われている。またこのようなモデル化のロボット工学的な試みとして、日本国内では、東京理科大学原文雄研究室の顔ロボットや、早稲田大学理工学部菅野研究室の WAMO E B A 2、オムロン株式会社の猫口ボットなどがある（「人工感情生成のモデルと表出」原文雄数理科学 v o 1 . 3 2， N o . 7， p a g e 5 2 _ 5 8， 1 9 94、「人間とロボッ卜の情緒交流に関する研究評価用ロボット " WAMOE B A_ 2" の設定と試作」尾形、菅野日本機械学会ロボテイクス · メカトロニクス講演会講演論文集 v o 1 . A 1 9 9 6, p p 44 9— 4 5 2、「感情をもったインタラクティブぺットロボット」田島、斉藤、大角、ェ藤、柴田日本ロポット学会学術講演会予稿集 v o l . 1 6， p a g e l l - 1 2, 1 9 9 8)。

ところでこれらの研究では、始めから完成された感情 ·本能モデルを用いていかに生物に近い行動や表現を得ることができるかが主題となっている。しかしながら生物の成長過程を考えた場合、幼年期から成長期にいたるまで常に同じようなモデルに基づいて感情や本能が動作しているとは考えられない。このためかかるモデル化は「成長」という側面から見ると不自然な問題があった。

またぺットとして扱う自律型ロポットに感情や本能をもたせるアプリケーションについて考えた場合にも、最初から完成された感情や本能をもったロボットはユーザにとって理解が困難で受け入れ難いものである。例えば本能として複数の欲求（例えば「愛情欲」及び「運動欲」など）をもち、また感情として複数の情動（例えば「喜び」、「悲しみ」及び「恐怖」など）をもったロボットでは、その内部の動きが複雑であるために、現在ロボットが何を欲していてどのような感情状態にあるのかをユーザが理解することは難しい。

さらにかかるロボットにおいて感情 ·本能が変化せずに常に同じであることは、ユーザが飽きやすく、商品性及びアミューズメント性において不十分な問題もある。

さらに第 3の背景技術として、従来、上述のようにユーザからの指令や周囲の環境に応じて動作を行う 4足歩行型のいわゆるぺットロポットが提案及び開発されている。かかるペットロボットは、家庭内で飼う犬や猫のような 4足動物によく似た形状を有し、例えばユーザから「伏せ」という命令を受け取ると伏せの姿勢を取ったり、又は自分の口の前にユーザが手を差し出すと「おて」をするようになされている。

ところで、このようなペットロボットは、感情のモデルや自分で行動を決める機構を持ち、その特徴をロボットの性格と呼ぶことができるが、その性格の変化は、他のロボットの影響を受けるものではない。

ここで、動物の性格形成は、周囲の環境の影響を受け、例えば、 2匹のペットがー緒に飼われているような場合には、一方のぺットの存在が他方のぺットの性格形成に大きく影響するのが現実である。発明の開示

本発明は以上の点を考慮してなされたもので、第 1に、エンターテイメント性を向上させ得るロボット装置及びその制御方法、第 2に、アミューズメント性を向上させ得るロボット装置及びその制御方法、第 3に、より現実的に性格が形成されていくことを可能とするロボット装置及びロボット装置の性格判別方法を提案しょうとするものである。

かかる課題を解決するため本発明においては、ロボット装置において、行動モデルを保持する保持手段と、行動モデルの一部又は全部の状態空間を用いて行動を生成する行動生成手段とを設け、行動生成手段が、行動モデルのうちの行動生成に使用する状態空間を、拡大縮小させながら変化させるようにした。この結果このロボット装置では、行動生成に使用する状態空間が連続的に変化してゆくため、行動生成に使用する状態空間の変化の前後における行動出力の不連続性を低減することができる。かくするにっき出力行動の種類等を滑らかにかつ自然に順次変化させてゆくことができ、かくしてエンターティメント性を向上させ得る口ボット装置を実現できる。

また本発明においては、状態遷移モデルでなる行動モデルを有し、当該行動モデルに基づいて行動を生成するロボット装置において、行動モデルにおける所定のノードへの遷移を仮想的なノードでなる仮想ノードへの遷移として記述し、当該仮想ノードに所定の第 1のノード群を割り当てると共に、仮想ノードに割り当てるノード群を変更する変更手段を設けるようにした。この結果このロボット装置では、基本となる行動モデルが固定化されているため、出力行動に一貫性をもたせながらこれらを順次変化させることができる。かくするにっき出力行動の種類等を滑らかにかつ自然に順次変化させてゆくことができ、かくしてエンターティメント性を向上させ得るロボット装置を実現できる。

さらに本発明においては、ロボット装置の制御方法において、行動モデルの一部又は全部の状態空間を用いて行動を生成する第 1のステップと、行動モデルのうちの行動生成に使用する状態空間を、拡大縮小させながら変化させる第 2のステツプとを設けるようにした。この結果このロボット装置の制御方法によれば、行動生成に使用する状態空間が連続的に変化してゆくため、行動生成に使用する状態空間の変更の前後における行動出力の不連続性を低減することができる。かくするにつき出力行動の種類等を滑らかにかつ自然に順次変化させてゆくことができ、かくしてエンターティメント性を向上させ得る口ボット装置の制御方法を実現できる。

さらに本発明によれば、ロボット装置の制御方法において、行動モデルにおける所定のノードへの遷移を仮想的なノ一ドでなる仮想ノードへの遷移として記述すると共に、当該仮想ノードに所定のノード群を割り当てる第 1のステップと、仮想ノードに割り当てるノード群を変更する第 2のステップとを設けるようにした。この結果このロボット装置の制御方法によれば、基本となる行動モデルが固定化されているため、出力行動に一貫性をもたせながらこれらを順次変化させることができる。かくするにっき出力行動の種類等を滑らかにかつ自然に順次変化させてゆくことができ、かくしてエンターティメント性を向上させ得るロボット装置の制御方法を実現できる。

さらに本発明においては、所定条件で順次更新される感情モデルの各情動のパラメータ値及び又は本能モデルの各欲求のパラメータ値に基づいて行動を生成するロボット装置において、行動生成に使用する情動及び又は欲求の数を、段階的に増減させるように制限する制限手段を設けるようにした。この結果このロボット装置では、感情及び又は本能を、本物の生物の感情及び又は本能が「成長」するかのごとく変化させることができ、かくしてァミユーズメント性を向上させ得るロボット装置を実現できる。

さらに本発明においては、感情モデルの各情動のパラメータ値及び又は本能モデルの各欲求のパラメータ値に基づいて行動を生成する口ボット装置において、外部から与えられる刺激及び経過時間に基づいて、各情動のパラメータ値及び又は各欲求のパラメータ値を、各情動及び又は各欲求に対して個別に設定された対応する感度で順次更新する情動及び又は欲求更新手段と、環境を評価し、当該評価結果に基づいて各情動及び又は各欲求に対する各感度をそれぞれ更新する感度更新手段とを設けるようにした。この結果このロボット装置では、各情動及び又は各欲求の感度を、環境に対して最適化することができ、かくしてアミユーズメント性を向上させ得る口ボット装置を実現できる。

さらに本発明においては、所定条件で順次更新される感情モデルの各情動のパラメータ値及び又は本能モデルにおける各欲求のパラメータ値に基づいて行動を生成するロボット装置の制御方法において、初期時において行動生成に使用する情動及び又は欲求の数を制限する第 1のステップと、行動生成に使用する情動及び又は欲求の数を段階的に増減させる第 2のステップとを設けるようにした。この結果このロボット装置の制御方法によれば、感情及び又は本能を、本物の生物の感情及び又は本能が「成長」するかのごとく変化させることができ、かくしてァミユーズメント性を向上させ得る口ボット装置の制御方法を実現できる。

さらに本発明においては、感情モデルの各情動のパラメータ値及び又は本能モデルの各欲求のパラメータ値に基づいて行動を生成するロボット装置の制御方法において、外部から与えられる刺激及び経過時間に基づいて、各情動のパラメ一タ値及び又は各欲求のパラメータ値を、各情動及び又は各欲求に対して個別に設定された対応する感度で更新する第 1のステップと、環境を評価し、評価結果に基づいて各情動及び又は各欲求に対する感度をそれぞれ更新する第 2のステップとを設けるようにした。この結果このロボット装置の制御方法によれば、各情動及び又は各欲求の感度を、環境に対して最適化することができ、かくしてアミュ —ズメント性を向上させ得る口ボット装置を制御方法を実現できる。

さらに本発明においては、ロボット装置において、他のロボット装置の出力を検知する検知手段と、検知手段の検知結果に基づいて、他のロボット装置の性格を判別する性格判別手段とを設けるようにした。この結果かかるロボット装置においては、検知手段が検知した他のロボット装置の出力の検知結果に基づいて、他のロボット装置の性格を性格判別手段により判別する。これにより、ロボット装置は、例えば、他のロボット装置の性格の判別結果に基づいて、自己の性格を変化させることがき、より現実的に性格を形成し得るロボット装置を実現できるさらに本発明においては、ロボット装置の性格判別方法において、ロボット装置の出力を検知して、この検知結果に基づいて、当該ロボット装置の性格を判別するようにした。この結果このロボット装置の性格判別方法によれば、例えば他のロボット装置の性格の判別結果に基づいて、自己の性格を変化させ得るロボット装置の性格判別方法を実現できる。図面の簡単な説明

図 1は、第 1及び第 2の実施の形態によるぺットロボットの外観構成を示す斜視図である。

図 2は、ぺットロボットの回路構成を示すブロック図である。

図 3は、制御プログラムのソフトウエア構成を示す概念図である。

図 4は、ミドル ' ウェア · レイヤのソフトウェア構成を示す概念図である。図 5は、アプリケーション ■ レイヤのソフトウエア構成を示す概念図である。図 6は、行動モデルライブラリの説明に供する概念図である。

図 7は、確率オートマトンを示す略線図である。

図 8は、状態遷移表を示す図表である。

図 9は、行動モデルライブラリの詳細構成を示す概念図である。

図 1 0は、ペットロポットの成長モデルを示す概念図である。

図 1 1は、成長に伴う行動パターンの獲得及び忘却の説明に供する概念図である。

図 1 2は、第 1の実施の形態における差分ファイルの説明に供する概念図である。

図 1 3は、複数のノードから 1つの行動パターンの起点ノ一ドへの遷移の説明に供する概念図である。

図 1 4は、仮想ノードの利用の説明に供する概念図である。

図 1 5は、第 2の実施の形態における各行動関連条件項目の行動モデルの構成を示す概念図である。

図 1 6は、行動パターンファイルの説明に供する概念図である。

図 1 7は、第 2の実施の形態による差分ファイルの説明に供する概念図である図 1 8は、第 3及び第 4の実施の形態によるぺットロボットの外観構成を示す斜視図である。

図 1 9は、ペットロボットの回路構成を示すプロック図である。

図 2 0は、制御プログラムのソフトウェア構成を示す概念図である。

図 2 1は、ミドル · ウェア . レイヤのソフトウエア構成を示す概念図である。図 2 2は、アプリケーション ' レイヤのソフトウエア構成を示す概念図である図 2 3は、行動モデルライブラリの説明に供する概念図である。

図 2 4は、確率オートマトンを示す略線図である。

図 2 5は、状態遷移表を示す図表である。

図 2 6は、行動モデルライブラリの詳細構成を示す概念図である。

図 2 7は、ぺットロボットの成長モデルを示す概念図である。

図 2 8は、各「成長ステージ」ごとの感情パラメータファイルを示す概念図である。

図 2 9は、感度及び本能の成長の説明に供するフローチヤ一トである。

図 3 0は、各「成長ステージ」ごとの本能パラメータファイルを示す概念図である。

図 3 1は、第 5の実施の形態の説明に供するプロック図である。

図 3 2は、第 5の実施の形態によるぺットロボットの一実施の形態を示す斜視図である。

図 3 3は、ペットロボットの回路構成を示すブロック図である。

図 3 4は、コントローラにおけるデータ処理を示す略線図である。

図 3 5は、感情 ·本能モデル部によるデータ処理を示す略線図である。

図 3 6は、感情 ·本能モデル部によるデータ処理を示す略線図である。

図 3 7は、感情 ·本能モデル部によるデータ処理を示す略線図である。

図 3 8は、第 5の実施の形態によるぺットロボットにおける感情モデルのパラメータを変化させる構成部分のプロック図である。図 3 9は、相手ロボットの感情の表出割合を示す特性図である。

図 4 0は、行動決定機構部における有限ォートマトンの状態遷移図である。図 4 1は、姿勢遷移機構部における姿勢遷移のグラフを示す図である。

図 4 2は、第 5の実施の形態によるぺットロボットにおける感情モデルのパラメータを変化させる構成部分を示すものであって、感情モデルのパラメータを変化させる他の形態を説明するために使用したプロック図である。

図 4 3は、第 5の実施の形態によるペットロボットにおいて、相手ロボットとユーザとの対話を解析する対話解析機構部を備えて、感情モデルのパラメータを変化させる構成部分のプロック図である。

図 4 4は、第 5の実施の形態によるぺッ卜ロボットの他の実施の形態を示す斜視図である。発明を実施するための最良の形態

以下図面について、本発明の一実施の形態を詳述する。

( 1 ) 第 1の実施の形態

( 1 - 1 ) 第 1の実施の形態によるぺットロボットの構成

図 1において、 1は全体として第 1の実施の形態によるぺットロボットを示し、胴体部ュニット 2の前後左右にそれぞれ脚部ュ-ット 3 A〜 3 Dが連結されると共に、胴体部ュニット 2の前端部及ぴ後端部にそれぞれ頭部ュ-ット 4及び尻尾部ュニット 5が連結されることにより構成されている。

胴体部ュ-ット 2には、図 2に示すように、 C PU (C e n t r a l

P r o c e s s i n g U n i t ) 1 0、 DRAM D y n a m i c R a n d o m A c c e s s M e m o r y ) 1 1、フラッシュ ROM (R e a d O n l y M e m o r y) 1 2、 P C (P e r s o n a l C o m p u t e r ) カードィンタ一フェース回路 1 3及び信号処理回路 1 4が内部バス 1 5を介して相互に接続されることにより形成されたコントロール部 1 6と、このぺットロボット 1の動力源としてのバッテリ 1 7とが収納されている。また胴体部ュニット 2には、ペットロボット 1の向きや動きの加速度を検出するための角速度センサ 1 8及び加速度センサ 1 9なども収納されている。

また頭部ュ-ット 4には、外部の状況を撮像するための C C D (C h a r g e C o u l e d D e v i c e ) カメラ 20と、ユーザからの「撫でる」や「叩く」といった物理的な働きかけにより受けた圧力を検出するためのタツチセンサ 2 1 と、前方に位置する物体までの距離を測定するための距離センサ 2 2と、外部音を集音するためのマイクロホン 2 3 と、鳴き声等の音声を出力するためのスピー力 24と、ペットロボット 1の「目」に相当する LED (L i g h t Em i t t i n g D i o d e ) (図示せず）となどがそれぞれ所定位置に配設されている。

さらに各脚部ュニット 3 A〜 3 Dの関節部分や、各脚部ュニット 3 A〜 3 D及び胴体部ュニット 2の各連結部分、頭部ュニット 4及び胴体部ュニット 2の連結部分、並びに尻尾部ュ-ット 5の尻尾 5 Aの連結部分などにはそれぞれ自由度数分のァクチユエータ 2 5 i 〜 2 5_n 及びポテンショメータ 26i 〜26_n が配設されている。

そしてこれら角速度センサ 1 8、加速度センサ 1 9、タツチセンサ 2 1、距離センサ 2 2、マイクロホン 23、スピー力 24及び各ポテンショメータ 2 6 〜 2 6_n などの各種センサ並びに L ED及び各ァクチユエータ 2 5: 〜 2 5_n は、それぞれ対応するハブ 2 Ί _γ 〜 2 7_Ν を介してコントロール部 1 6の信号処理回路 1 4と接続され、 C CDカメラ 20及びバッテリ 1 7は、それぞれ信号処理回路 1 4と直接接続されている。

このとき信号処理回路 1 4は、上述の各センサから供給されるセンサデータや画像データ及び音声データを順次取り込み、これらをそれぞれ内部バス 1 5を介して DRAM 1 1内の所定位置に順次格納する。また信号処理回路 1 4は、これと共にバッテリ 1 7から供給されるバッテリ残量を表すバッテリ残量データを順次取り込み、これを DRAM1 1内の所定位置に格納する。

そしてこのようにして DRAM 1 1に格納された各センサデータ、画像データ、音声データ及びバッテリ残量データは、この後 C PU 1 0がこのペットロボット 1の動作制御を行う際に利用される。

実際上 C PU 1 0は、ペットロボット 1の電源が投入された初期時、胴体部ュニット 2の図示しない P Cカードス口ットに装填されたメモリカード 2 8又はフラッシュ ROM 1 2に格納された制御プログラムを P Cカードィンターフェース回路 1 3を介して又は直接読み出し、これを DRAM 1 1に格納する。

また C P U 1 0は、この後上述のように信号処理回路 1 4より DRAM 1 1に順次格納される各センサデータ、画像データ、音声データ及びバッテリ残量データに基づいて自己及び周囲の状況や、ユーザからの指示及び働きかけの有無などを判断する。

さらに C P U 1 0は、この判断結果及び D RAM 1 1に格納した制御プログラムに基づいて続く行動を決定すると共に、当該決定結果に基づいて必要なァクチユエータ 2 5 i 〜 2 5_n を駆動させることにより、頭部ュ-ット 4を上下左右に振らせたり、尻尾部ュニット 5の尻尾 5 Aを動かせたり、各脚部ュニット 3 A〜 3 Dを駆動させて歩行させるなどの行動を行わせる。

またこの際 C PU 1 0は、必要に応じて音声データを生成し、これを信号処理回路 1 4を介して音声信号としてスピーカ 24に与えることにより当該音声信号に基づく音声を外部に出力させたり、上述の L EDを点灯、消灯又は点滅させるこのようにしてこのペットロボット 1においては、自己及び周囲の状況や、ュ一ザからの指示及び働きかけに応じて自律的に行動し得るようになされている。 ( 1 - 2) 制御プログラムのソフトウェア構成

ここでぺットロボット 1における上述の制御プログラムのソフトウェア構成を図 3に示す。この図 3において、デバイス . ドライノく ' レイヤ 3 0は、この制御プログラムの最下位層に位置し、複数のデバイス · ドライバからなるデバイス · ドライバ 'セット 3 1から構成されている。この場合各デバイス ' ドライバは、 CCDカメラ 20 (図 2) やタイマ等の通常のコンピュータで用いられるハードウェアに直接アクセスすることを許されたオブジェクトであり、対応するハードウェアからの割り込みを受けて処理を行う。

またロボティック .サーバ .オブジェクト 3 2は、デバイス · ドライノく ' レイャ 3 0の上位層に位置し、例えば上述の各種センサゃァクチユエータ 2 5 i 〜 2 5 _n 等のハードウエアにアクセスするためのィンターフェースを提供するソフトウェア群でなるバ一チャル · ロボット 3 3と、電源の切換えなどを管理するソフトウエア群でなるパワーマネージャ 3 4と、他の種々のデバイス ' ドライバを管理するソフトウェア群でなるデバイス · ドライノく ·マネージャ 3 5と、ペット口ボット 1の機構を管理するソフトウエア群なるデザィンド ' ロボット 3 6とから構成されている。

マネージャ ·オブジェクト 3 7は、オブジェクト ·マネージャ 3 8及びサービス ·マネージャ 3 9から構成されている。この場合オブジェクト ·マネージャ 3 8は、口ボテイツク ' サーノ ·オブジェクト 3 2、ミドル · ウェア ' レイヤ 4 0 、及ぴアプリケーション ' レイヤ 4 1に含まれる各ソフトウェア群の起動や終了を管理するソフトウェア群であり、サービス ·マネージャ 3 9は、. メモリカード 2 8 (図 2 ) に格納されたコネクションファイルに記述されている各ォブジェクト間の接続情報に基づいて各オブジェクトの接続を管理するソフトウエア群である。

ミドル . ウェア . レイヤ 4 0は、口ボテイツク .サーバ .オブジェクト 3 2の上位層に位置し、画像処理や音声処理などのこのぺットロボット 1の基本的な機能を提供するソフトウエア群から構成されている。またアプリケーション · レイャ 4 1は、ミドル ' ウェア ' レイヤ 4 0の上位層に位置し、当該ミドル ' ウェア • レイヤ 4 0を構成する各ソフトウエア群によって処理された処理結果に基づいてぺットロボット 1の行動を決定するためのソフトウェア群から構成されている

― なおミドル ' ウェア ' レイヤ 4 0及びアプリケーシヨン ' レイヤ 4 1の具体なソフトウエア構成をそれぞれ図 4及び図 5に示す。ミドル · ウェア · レイヤ 4 0においては、図 4からも明らかなように、音階認識用、距離検出用、姿勢検出用、タツチセンサ用、動き検出用及び色認識用の各信号処理モジユーノレ 5 0 〜 5 5並びに入力セマンティクスコンバ一タモジユーノレ

5 6などを有する認識系 5 7と、出力セマンティクスコンバータモジュール 5 7 並びに姿勢管理用、トラッキング用、モーション再生用、歩行用、転倒復帰、 L E D点灯用及び音再生用の各信号処理モジュール 5 8 〜 6 4などを有する出力系

6 5とから構成されている。

この場合認識系 5 7の各信号処理モジュール 5 0 〜 5 5は、口ボテイツク 'サ —バ ·オブジェクト 3 2のバーチヤノレ · ロボット 3 3により D R A M 1 1 (図 2 ) から読み出される各センサデータや画像データ及び音声データのうちの対応するデータを取り込み、当該データに基づいて所定の処理を施して、処理結果を入力セマンティクスコンバータモジユー/レ 5 6に与える。

入力セマンティクスコンバ一タモジュール 5 6は、これら各信号処理モジユール 5 0 〜 5 5から与えられる処理結果に基づいて、「ボールを検出した」、「転倒を検出した」、「撫でられた」、「叩かれた」、「ドミソの音階が聞こえた」、「動く物体を検出した」又は「障害物を検出した」などの自己及び周囲の状況や、ユーザからの指令及び働きかけを認識し、認識結果をアプリケーション · レイヤ 4 1 ( 図 2 ) に出力する。

アプリケーション ' レイヤ 4 1においては、図 5に示すように、行動モデルライブラリ 7 0、行動切換えモジュール 7 1、学習モジュール 7 2、感情モデル 7 3及び本能モデル 7 4の 5つのモジュールから構成されている。

この場合行動モデルライブラリ 7 0には、図 6に示すように、「バッテリ残量 . が少なくなつた場合」、「転倒復帰する場合」、「障害物を回避する場合」、「感情を表現する場合」、「ボールを検出した場合」などの予め選択されたいくつかの条件項目にそれぞれ対応させて、それぞれ独立した行動モデル 7 〜 7 0 _n が設けられている。

そしてこれら行動モデル 7 O i 〜 7 0 _n は、それぞれ入力セマンティクスコンバータモジュール ₅ 6から認識結果が与えられたときや、最後の認識結果が与えられてから一定時間が経過したときなどに、必要に応じて後述のように感情モデル 7 3に保持されている対応する情動のパラメータ値や、本能モデル 74に保持されている対応する欲求のパラメータ値を参照しながら続く行動をそれぞれ決定し、決定結果を行動切換えモジュール 7 1に出力する。

なおこの実施の形態の場合、各行動モデル 7 〜 70_n は、次の行動を決定する手法として、図 7に示すような 1つのノード（状態） NODE。〜NODE _n から他のどのノード NO D E。〜N〇DE_n に遷移するかを各ノード NO D E。〜NODE_n 間を接続するアーク ARCi 〜ARC_nlに対してそれぞれ設定された遷移確率〜P_n に基づいて確率的に決定する確率オートマトンと呼ばれるァルゴリズムを用いる。

具体的に、各行動モデル 7 〜 70„ は、それぞれ自己の行動モデル 7 〜 70_n を形成する各ノード NODE。〜NODE_n にそれぞれ対応させて、これらノード NODE。〜NODE_n ごとの図 8に示すような状態遷移表 80を有している。

この状態遷移表 8 0では、そのノード NODE。〜NODE_n において遷移条件とする入力イベント（認識結果）が「入力イベント名」の行に優先順に列記され、その遷移条件についてのさらなる条件が「データ名」及び「データ範囲」の行における対応する列に記述されている。

従って図 8の状態遷移表 80で表されるノード NODE₁₀。では、「ボールを検出（BAL L)」という認識結果が与えられた場合に、当該認識結果と共に与えられるそのボールの「大きさ（S I Z E)」力 S 「0から 1 00 0」の範囲であることや、「障害物を検出（OB S TAC LES という認識結果が与えられた場合に、当該認識結果と共に与えられるその障害物までの「距離（D I S—

T ANC E)J 力 S 「0から 1 00」の範囲であることが他のノードに遷移するための条件となっている。

またこのノード NODE _1∞ では、認識結果の入力がない場合においても、行動モデル 7 0_X 〜 7 0_n が周期的に参照する感情モデル 7 3及び本能モデル 7 4 にそれそれ保持された各情動及び各欲求のパラメータ値のうち、感情モデル 7 3 に保持された「喜び（ J O Y)」、「驚き（S UR P R I S Ε)」若しくは「悲しみ

(S ADNE S S)」のいずれかのパラメータ値が「5 0カら 1 0 0」の範囲であるときには他のノードに遷移することができるようになっている。

また状態遷移表 8 0では、「他のノードへの遷移確率」の欄における「遷移先ノード」の列にそのノード NOD E。〜NOD E_n から遷移できるノード名が列記されると共に、「入力イベント名」、「データ値」及び「データの範囲」の行に記述された全ての条件が揃ったときに遷移できる他の各ノード NODE_Q 〜NO D E_n への遷移確率が「他のノードへの遷移確率」の欄内の対応する箇所にそれぞれ記述され、そのノード NOD E。〜NOD E_n に遷移する際に出力すべき行動が「他のノードへの遷移確率」の欄における「出力行動」の行に記述されている。なお「他のノードへの遷移確率」の欄における各行の確率の和は 1 0 0 〔％〕となっている。

従って図 8の状態遷移表 8 0で表されるノード NOD 。。では、例えば「ボルを検出（B A L L)」し、そのボールの「S I Z E (大きさ）」が「0力、ら 1 0 0 0」の範囲であるという認識結果が与えられた場合には、「3 0 〔％〕」の確率で「ノード NODE ₁₂。（n o d e 1 2 0)」に遷移でき、そのとき「AC Τ Ι ΟΝ 1」の行動が出力されることとなる。

そして各行動モデル 7 0, 〜 7 0_n は、それぞれこのような状態遷移表 8 0として記述されたノード NOD E。〜NODE_n がいくつも繫がるようにして構成されており、入力セマンティクスコンバータモジュール 5 6から認識結果が与えられたときなどに、対応するノード NODE。〜NOD E_n の状態遷移表 8 0を利用して確率的に次の行動を決定し、決定結果を行動切換えモジュール 7 1に出力するようになされている。

行動切換えモジュール 7 1は、行動モデルライブラリ 7 0の各行動モデル 7 0 i 〜7 0_n からそれぞれ出力される行動のうち、予め定められた優先順位の高い行動モデル 7 0 i 〜7 0 _n から出力された行動を選択し、当該行動を実行すべき旨のコマンド（以下、これを行動コマンドと呼ぶ）をミドル ' ウェア . レイヤ 4 0の出力セマンティクスコンバータ 5 7に送出する。なおこの実施の形態においては、図 6において下側に表記された行動モデル 7 〜7 0 _n ほど優先順位が高く設定されている。

また行動切換えモジュール 7 1は、行動完了後に出力セマンティクスコンバータ 5 7から与えられる行動完了情報に基づいて、その行動が完了したことを学習モジュール 7 2、感情モデル 7 3及び本能モデル 7 4に通知する。

一方、学習モジュール 7 2は、入力セマンティクスコンバータ 5 6から与えられる認識結果のうち、「叩かれた」や「撫でられた」など、ユーザからの働きかけとして受けた教示の認識結果を入力する。

そして学習モジュール 7 2は、この認識結果及び行動切換えモジュール 7 1からの通知に基づいて、「叩かれた（叱られた）」ときにはその行動の発現確率を低下させ、「撫でられた（誉められた）」ときにはその行動の発現確率を上昇させるように、行動モデルライブラリ 7 0における対応する行動モデル 7 〜7 0 _n の対応する遷移確率を変更する。

他方、感情モデル 7 3は、「喜び（ j o y )」、「悲しみ（ s a d n e s s )」、「怒り（a n g e r )」、「驚き（ s u r p r i s e )」、「嫌悪（ d i s g u s t )」及び「恐れ（ f e a r )」の合計 6つの情動について、各情動ごとにその情動の強さを表すパラメータを保持している。そして感情モデル 7 3は、これら各情動のパラメ一タ直を、それぞれ入力セマンティクスコンバータモジユーノレ 5 6から与えられる「叩かれた」及び「撫でられた」などの特定の認識結果と、経過時間及び行動切換えモジュール 7 1からの通知となどに基づいて順次更新するようになされている。

具体的に感情モデル 7 3は、入力セマンテイクスコンバータ 5 6からの認識結果及びそのときのぺットロポット 1の行動がその情動に対して作用する度合い（予め設定されている）と、本能モデル 7 4が保持している各欲求のパラメータ値及びそのときのぺットロボット 1の行動がその情動に対して作用する度合い（予め設定されている）と、他の情動から受ける抑制及び刺激の度合いと、経過時間となどに基づいて所定の演算式により算出されるその情動の変動量を Δ Ε 〔 t ] 、現在のその情動のパラメータ値を E 〔 t〕、認識結果等に応じてその情動を変化させる割合（以下、これを感度と呼ぶ）を表す係数を k_e として、所定周期で次式

E [ t + 1 ] = E [ t ] + k_e ΧΔΕ [ t ] ( 1 ) を用いて次の周期におけるその情動のパラメータ値 E [ t + 1 ] を算出する。そして感情モデル 7 3は、この演算結果を現在のその情動のパラメータ値 E 〔 t ] と置き換えるようにしてその情動のパラメータ値を更新する。なお各認識結果ゃ行動切換えモジュール 7 1からの通知に対してどの情動のパラメータ値を更新するかは予め決められており、例えば「叩かれた」といった認識結果が与えられた場合には「怒り」の情動のパラメータ値が上がり、「撫でられた」といった認識結果が与えられた場合には「喜び」の情動のパラメータ値が上がる。

これに対して本能モデル 7 4は、「運動欲（ e X e r c i s e )」、「愛情欲（ a f f e c t i o n )」、「食欲 ( a p p e t i t e )」及び「好奇心 ( c u r i ― o s i t y )J の互いに独立した 4つの欲求について、これら欲求ごとにその欲求の強さを表すパラメータを保持している。そして本能モデル 7 4は、これら欲求のパラメータ値を、それぞれ入力セマンティクスコンバータモジュール 5 6から与えられる認識結果や、経過時間及び行動切換えモジュール 7 1からの通知などに基づいて順次更新するようになされている。

具体的に本能モデル 7 4は、「運動欲」、「愛情欲」及び「好奇心」については、ぺットロボット 1の行動出力、経過時間及び認識結果などに基づいて所定の演算式により算出されるその欲求の変動量を Δ I 〔k〕、現在のその欲求のパラメ一タ値を I 〔k〕、その欲求の感度を表す係数をとして、所定周期で次式 I 〔k + 1〕 = I 〔k〕 + Χ Δ I 〔k〕 ( 2 ) を用いて次の周期におけるその欲求のパラメータ値 I 〔k + l〕を算出し、この演算結果を現在のその欲求のパラメータ値 I 〔k〕と置き換えるようにしてその欲求のパラメータ値を更新する。なお行動出力や認識結果等に対してどの欲求のパラメータ値を変化させるかは予め決められており、例えば行動切換えモジユール 7 1からの通知（行動を行ったとの通知）があったときには「運動欲」のパラメータ値が下がる。

また本能モデル 7 4は、「食欲」については、入力セマンティクスコンバータモジュール 5 6を介して与えられるバッテリ残量データに基づいて、バッテリ残量をとして、所定周期で次式

I 〔k〕 = 1 0 0— B _L ( 3 ) により「食欲」のパラメータ値 I 〔k〕を算出し、この演算結果を現在の食欲のパラメータ値 I 〔k〕と置き換えるようにして当該「食欲」のパラメータ値を更新する。

なお本実施の形態においては、各情動及び各欲求のパラメータ値がそれぞれ 0 から 1 0 0までの範囲で変動するように規制されており、また係数 k e 、 k i の値も各情動及び各欲求ごとに個別に設定されている。

一方、ミドノレ ' ウェア · レイヤ 4 0の出力セマンティクスコンバータモジユール 5 7は、図 4に示すように、上述のようにしてアプリケーション · レイヤ 4 1 の行動切換えモジュール 7 1から与えられる「前進」、「喜ぶ」、「鳴く」又は「トラッキング（ボールを追いかける）」といった抽象的な行動コマンドを出力系 6 5の対応する信号処理モジュール 5 8 〜 6 4に与える。

そしてこれら信号処理モジュール 5 8 〜 6 4は、行動コマンドが与えられると当該行動コマンドに基づいて、その行動を行うために対応するァクチユエータ 2 丄〜（図 2 ) に与えるべきサーボ指令値や、スピーカ 2 4 (図 2 ) から出力する音の音声データ及び又は「目」の L E Dに与える駆動データを生成し、これらのデータをロボティック · サーノ ·オブジェクト 3 2のノーチヤノレ口ボット 3 3及び信号処理回路 1 4 (図 2 ) を順次介して対応するァクチユエータ 2 5 ！〜 2 5 _n 、スピーカ 2 4又は L E Dに順次送出する。

このようにしてこのぺットロボット 1においては、制御プログラムに基づいて、自己及び周囲の状況や、ユーザからの指示及び働きかけに応じた自律的な行動を行うことができるようになされている。

( 1 - 3 ) ペットロボット 1 の成長モデノレ

次にこのぺットロボット 1に搭載された成長機能について説明する。このぺットロボット 1には、ユーザからの働きかけ等に応じて、あたかも「成長」するかのごとく行動を変化させてゆく成長機能が搭載されている。

すなわちこのペットロボット 1には、成長過程として「誕生期」、「幼年期」、「少年期」、「青年期」及び「成人期」の 5つの「成長ステージ」が設けられている。そしてアプリケーション . レイヤ 4 1の行動モデルライブラリ 7 0 (図 5 ) には、上述した「バッテリ残量が少なくなつた場合」等の各条件項目のうち、「モーシヨン（動き）」や「行動」などの「成長」に関係した全ての条件項目（以下、これを成長関連条件項目と呼ぶ）について、図 9に示すように、行動モデル 7 O _k として、「誕生期」、「幼年期」、「少年期」、「青年期」及び「成人期」にそれぞれ対応させた行動モデル 7 O _k(1)〜 7 O _k(5)が設けられている。そして行動モデルライブラリ 7 1では、これら成長関連条件項目について、初期時には「誕生期」の行動モデル 7 O _k(1)を用いて次の行動を決定するようになされている。

この場合「誕生期」の各行動モデル 7 O _k(1)はノード N O D E。〜N O D E _n ( 図 7 ) の数が少なく、またこれら行動モデル 7 O _k(1)から出力される行動の内容も「パターン 1 (「誕生期」用の歩行パターン）で前進」や、「パターン 1 (「誕. 生期」用の鳴き声パターン）で鳴く」のように、「誕生期」に対応した行動又は動作内容となっている。

かくしてこのペットロボット 1においては、初期時には「誕生期」の各行動モデル 7 0 _k(1)に従って、例えば「モーション」については単に「歩く」、「立つ」、「寝る」程度の「単純」な動きとなるように、「行動」については同じ行動を繰り返し行うことにより「単調」となるように行動する。

またこのときアプリケーション ' レイヤ 4 1の学習モジュール 7 2 (図 5 ) は、その内部に「成長」の度合いを表すパラメータ（以下、これを成長パラメータと呼ぶを保持しており、入力セマンティクスコンバータモジュール 5 6から与えられる認識結果や経過時間情報などに基づいて、成長パラメータの値を「撫でられた」や「叩かれた」等のユーザからの働きかけ（教示）の回数や経過時間等に応じて順次更新するようになされている。

そして学習モジュール 7 2は、ペットロボット 1に電源が投入される度にこの成長パラメータの値を評価し、当該値が「幼年期」に対応させて予め設定された閾値を越えた場合には、これを行動モデルライブラリ 7 0に通知する。また行動モデルライブラリ 7 0は、この通知が与えられると、上述の各成長関連条件項目について、それぞれ使用する行動モデルを「幼年期」の行動モデル 7 0 _k(2)に変更する。

このとき「幼年期」の各行動モデル 7 0 _k(2)は「誕生期」の行動モデル 7 0 _k(1) よりもノード N〇D E。〜N O D E _n の数が多く、またこれら行動モデル 7 0 _k(2) から出力される行動の内容も「幼年期」の行動に比べて難易度や複雑さのレベル (成長レベル）が高くなつている。

かくしてこのぺットロボット 1においては、この後はこれら行動モデル 7 0 _k(2)に従って、例えば「モーション」については行動の数が増加することにより「少しは高度かつ複雑」な動きとなるように、また「行動」については「少しは目的をもった」行動となるように行動する。

さらに学習モジュール 7 4は、この後上述の場合と同様にして、成長パラメ一タの値が「少年期」、「青年期」及び「成人期」にそれぞれ対応させて予め設定された各閾値を越える度にこれを行動モデルライブラリ 7 1に通知する。また行動モデルライブラリ 7 1は、この通知が与えられる度に上述の各成長関連条件項目について、それぞれ使用する行動モデルを「少年期」、「青年期」及び「成人期」の行動モデル 7 O_k( 〜 70_k(5)に順次変更する。

このとき「少年期」、「青年期」及び「成人期」の各行動モデル 7 O_k(3)〜 70 _k(5)は、それぞれ「成長ステージ」が上がるにつれてノード NODE。〜NODE „ の数が多くなり、またこれら行動モデル 7 0_k(3)〜 7 O_k(5)から出力される行動の内容も「成長ステージ」が上がるにつれて行動の難易度や複雑さのレベルが高くなっている。

この結果このペットロボット 1では、「成長ステージ」が上がる（すなわち「誕生期」から「幼年期」、「幼年期」から「少年期」、「少年期」から「青年期」、 r 青年期」から「成人期」に変化する）に従って、「モーション」が「単純」から「高度 ·複雑」に、また「行動」力 S 「単調」から「目的をもった行動」に順次段階的に変化する。

このようにしてこのぺットロボット 1においては、ユーザから与えられる教示や時間経過に応じて、行動及び動作が「誕生期 ί、「幼年期」、「少年期」、「青年期

」及ぴ「成人期」の 5段階で「成長」するようになされている。

なおこの実施の形態の場合、ペットロボット 1の成長モデルは、図 1 0に示すように「少年期」以降において枝分かれするモデルとなっている。

すなわちこのぺットロボット 1の場合、アプリケーシヨン ' レイヤ 4 1 (図 5 ) の行動モデルライブラリ 70には、上述の各成長関連条件項目について、「少年期」、「青年期」及び「成人期」の行動モデル 7 O_k(3)〜 7 O_k(5)としてそれぞれ複数の行動モデルが用意されている。

実際上、各成長関連条件項目の例えば「少年期」の行動モデル 7 O_k(3)としては、動きが雑で速い「荒々しい」性格の行動を行わせるための行動モデル（ CH I LD 1 ) と、これよりも動きが滑らかで遅い「おっとり」とした性格の行動を行わせるための行動モデル（CH I LD 2) とが用意されている。また「青年期」の行動モデル 7 O_k(4)としては、「少年期」の「荒々しい」性格よりもより動きが雑で速い「いらいら」した性格の行動を行わせるための行動モデル（YOUNG 1 ) と、これよりも動きが遅くかつ滑らかな「普通」の性格の行動及び動作を行わせるための行動モデル（YOUNG 2) と、これよりも一層動作が遅くかつ行動量が少ない「おっとり」とした性格の行動を行わせるための行動モデル（YOUNG 3) とが用意されている。

さらに「成人期」の行動モデル 70_k(5)としては、「青年期」の「いらいら」した性格よりもより動きが雑で速く、かつ非常に怒りやすい「攻撃的」な性格の行動を行わせるための行動モデル（ADULT 1 ) と、これよりも動きが滑らかで遅く、かつ怒りやすい「荒々しい」性格の行動を行わせるための行動モデル（ ADULT 2) と、これよりも動きが滑らかで遅く、かつ行動量が少ない「おとなしい」性格の行動を行わせるための行動モデル（ADULT 3) と、これよりもさらに一層動きが遅く、かつ行動量が少ない「静かな」性格の行動を行わせるための行動モデル（ADU L T 4) とが用意されている。

そしてアプリケ一ンョン · レイヤ 4 1の学習モジュール 7 2 (図 5 ) は、上述のように行動モデルライブラリ 70に対して「成長ステージ」を上げさせるための通知を行う際に、「少年期」以降では、その「成長ステージ」において「叩かれた」及び「撫でられた」回数等に基づいて、各成長関連条件項目の次の「成長ステージ」の行動モデルとしてどの「性格」の行動モデル（CH I LD 1、 CH I LD 2、 YOU G ；！〜 YOUNG 3、 ADULT 1〜

ADULT 4) を用いるかを指定する。

この結果、行動モデルライブラリ 70は、この指定に基づいて、各成長関連条件項目について、「少年期」以降では使用する行動モデル 70_k(3)〜 70_k(5)を指定された「性格」の行動モデル（CH I LD 1、 CH I LD 2、 YOUNG l〜YOUNG 3、 ADULT ：!〜 ADULT 4 ) にそれぞれ変更する。この場合「少年期」以降では、次の「成長ステージ」に移る際、現在の「成長ステージ」での「性格」によって次の「成長ステージ」での「性格」が決まっており、図 1 0において矢印で結ばれた「性格」間での移行しかできない。従って例えば「少年期」において「荒々しい」性格の行動モデル（CH I LD 1 ) が用いられている場合には、「青年期」において「おっとり」とした性格の行動モデル（YOUNG 3) に移行することができない。

このようにこのぺットロボット 1においては、あたかも本物の動物が飼い主の飼育の仕方等によって性格を形成してゆくかのごとく、ユーザからの働きかけ等に応じて、「成長」に伴って「性格」をも変化させてゆくようになされている。 ( 1 - 4) 行動モデル 70 _k の具体構成

次に、上述した各成長関連条件項目の行動モデル 70_k (図 9) の具体構成について説明する。

このペットロボット 1の場合、各成長関連条件項目の行動モデル 7 O_k は、それぞれぺットロボット 1が発現できる全ての行動パターンが格納された広大な状態空間を有している。

そしてこれら行動モデル 70_k は、その状態空間のうちの「歩く」、「寝る」及び「立つ」等のこのペットロボットにおける基本的な行動を生成する状態空間部分をコアとして、「誕生期」には当該コアを含む極一部だけを使用し、この後「成長」する度に、新たに増やしたい状態空間部分（新たに発現できるようにする行動や一連の行動パターンを生成する状態空間部分）への遷移を許可すると共に使わなくなった状態空間部分（発現しないようにする行動や一連の行動パターンを生成する状態空間部分）を切り離すようにして、各「成長ステージ」における行動モデル 70_k(1)〜 70_k(5)を生成している。

そしてこのペットロボット 1では、このように新たに増やしたい状態空間部分への遷移を許可したり、不要な状態空間を切り離す方法として、その状態空間への遷移確率を「成長」に応じて変更する方法を用いている。

例えば図 1 1において、ノード NODE_A からノード NODE_B への遷移条件力 S 『ボールを見つけた』ことであり、かつノード NOD E_B からの一連のノード群 90が『ボールに近づいてこれを蹴る』といった一連の行動パターンを行うためのものであるとすると、ノード NODE_A においてボールを見つけたときには遷移確率 Pi で『ボールを追いかけてこれを蹴る』という行動パターン PAi 発現されるが、この遷移確率 1^ 「0」である場合には、このような行動パターン PAi は決して発現されない。

そこでこのペットロボット 1においては、ある「成長ステージ」になってからこのような行動パターンを発現させる場合には、初期時にはこの遷移確率 P_x を「0」に設定しておき、当該「成長ステージ」になったときにこの遷移確率 Pi を「0」よりも大きい予め設定された数値に変更するようにする。またこれと逆に、ある「成長ステージ」となったときにこの行動パターン PAi を忘れさせる場合には、その「成長ステージ」になったときにノード NODE_A からノード NOD E_B への遷移確率を「0」に変更するようにしている。

そしてこのぺットロボットでは、このように必要箇所の遷移確率を更新するための具体的手法として、上述の成長関連条件項目の各行動モデルには、「幼年期」、「少年期」、「青年期」及び「成人期」の各「成長ステージ」にそれぞれ対応させて、図 1 2に示すようなファイル（以下、これを差分ファイルと呼ぶ） 9 1 A 〜 9 1 Dが設けられている。

これら差分ファイル 9 1 A〜 9 1 Dは、その「成長ステージ」に上がるに際して上述のように新たな行動を発現させるために上述のように遷移確率を変更すベきノード（図 1 1におけるノード Aに相当）のノード名（番号）と、そのノ一ドの状態遷移表 8 0 (図 8) における遷移確率を変更すべき箇所と、当該箇所における変更後の遷移確率とが格納されたものである。

そして各成長関連条件項目の行動モデル 70_k は、初期時には「誕生期」用の行動モデル 70_k(1)で行動を生成する一方、この後上述のように学習モジュール 7 2 (図 5) から「成長」したとの通知が与えられると、対応する「成長ステージ」用の差分ファイル 9 ：!〜 9 1 Dに基づいて、当該差分ファイル 9 ：!〜 9 1 D に記述された各ノ一ドについて、それぞれ指定された箇所の遷移確率を指定された数値に変更する。例えばこの図 8及び図 1 2に示す例の場合において、「幼年期」に成長したときには、各成長関連条件項目の行動モデル 7 O _k は、ノード N O D E _1Q。の状態遷移表 8 0における遷移確率が記述された領域（図 8において「出力行動」の列よりも下側でかつ「データの範囲」の行よりも右側部分）の「 1行目」でかつ「 1列目」の遷移確率を「2 0」〔％〕に変更すると共に、当該状態遷移表の「1 行目」でかつ「11歹1』目」の遷移確率を「3 0」〔％〕、 ……のようにそれぞれ変更する。またこれと共に各成長関連条件項目の行動モデル 7 0 _k は、この「幼年期」用の差分ファイル 9 1 Aに記述された他のノード N O D E ₃₂。、 N O D E ₇₂₀ 、 ……についても同様にして対応する遷移確率をそれぞれ変更する。

この場合このようにして数値を変更する遷移確率の中には、それまでの遷移確率が「0」であった（すなわち一連の行動パターンの起点となるノードへの遷移が禁止されていた）ものや、変更後の遷移確率が「0」となる（すなわち一連の行動パターンの起点となるノードへの遷移が禁止される）ものが含まれているが、このようにその遷移確率が「0」から所定の数値に変更されたり、又は変更後の遷移確率が「0」となることにより、新たな「成長ステージ」においてその一連の行動パターンが発現されるようになったり、又はその一連の行動パターンが発現されなくなったりする。

なおこのようにして必要な遷移確率を変更した場合においても、変更後の状態遷移表 8 0における対応する行に含まれる各遷移確率の和が 1 0 0 〔％〕となるように各差分ファイル 9 1 A〜 9 1 Dにおける各遷移確率の値が選定されている

( 1 - 5 ) 本実施の形態の動作及び効果

以上の構成において、このペットロボット 1では、全ての行動パターンが格納された広大な状態空間のうちの基本的な行動を行うための状態空間部分をコアとして、「誕生期」には当該コアを含む極一部だけを使用し、この後「成長」する度に、コア以外の使わなくなった状態空間部分を切り離すと共に新たに増やしたい状態空間部分への遷移を許可するようにして、各「成長ステージ」における行動モデル 7 0 _kひ)〜 7 0 _k(n)を生成し、当該生成した行動モデル 7 O _k(1)〜 7 O _k(n)に従って行動する。

従ってこのペットロボット 1では、各「成長ステージ」における行動モデル 7 O _kひ)〜 7 O _k ( の状態空間が連続的に変化してゆくため、「成長」の前後における出力行動の不連続性を軽減して、より自然に「成長」を表現することができる。またこのペットロボット 1では、基本的な行動を生成するための状態空間部分を全ての「成長ステージ」において共用しているため、基本的な行動の学習結果を順次次の「成長ステージ」に持ち越すことができる。

さらにこのぺットロボット 1では、このように基本的な行動を生成する状態空間部分を全ての「成長ステージ」において共用しているため、各「成長ステージ」の行動モデル 7 O _k(1)〜 7 O _k(n)の作成作業が容易であり、また従来のように各

「成長ステージ」ごとに個別の行動モデルを用意する場合に比べて行動モデル全体としてのデータ量を削減することもできる。

さらにこのペットロボット 1では、上述のように「成長」に合わせて不要な一連の行動パターンの状態空間を切り離し、必要な一連の行動パターンの状態空間への遷移を許可するようにして各「成長ステージ」における行動モデル 7 O _k(1) 〜 7 O _k(n)を生成するようにしているため、各一連の行動パターンを部品化することができ、その分各成長関連条件項目の行動モデル 7 Ο _κ の生成作業をより一層容易化することができる。

以上の構成によれば、全ての行動パターンが格納された広大な状態空間のうちの基本的な行動を行うための状態空間部分をコアとして、「誕生期」には当該コァを含む極一部だけを使用し、この後「成長」する度に、コア以外の使わなくなつた状態空間部分を切り離すと共に新たに増やしたい状態空間部分への遷移を許可するようにして各「成長ステージ」における行動モデル 7 0 _k(1)〜 7 O _k(n)を生成するようにしたことにより、各「成長ステージ」における行動モデル 7 O _k(1) 〜 7 O _k(n)の状態空間を連続的に変化させて、「成長」の前後における出力行動の不連続性を軽減することができる。かくするにっきより自然に「成長」を表現することができ、かくしてエンターティメント性を向上させ得るぺットロボットを実現できる。

( 1 - 6) 他の実施の形態

なお上述の第 1の実施の形態においては、本発明を 4足歩行型のぺットロボット 1に適用するようにした場合について述べたが、本発明はこれに限らず、この他いわゆる玩具、トイ、プラモデル等を含むすべての種々の形態のロボットに広く適用することができる。また第 2〜第 5の実施の形態においても同じであるものとする。

また上述の第 1の実施の形態においては、「成長」に伴って各「成長ステージ」の行動モデル 7 O_k(1)〜 7 O_k(5)の状態空間を順次拡大してゆく場合について述ベたが、本発明はこれに限らず、各「成長ステージ」の行動モデル 7 O_k(1)〜 7 O_k(5)の状態空間を順次縮小させたり、又は拡大の途中でいずれかの「成長ステ —ジ」においてその行動モデル 7 O_k(1)〜 Ί O_k(5)の状態空間を縮小させたりするようにしても良い。

さらに上述の第 1の実施の形態においては、ペットロボット 1が 5段階で「成長」するようにした場合について述べたが、本発明はこれに限らず、 5以外の段階数で「成長」するようにしても良い。

さらに上述の第 1の実施の形態においては、行動モデル（ペットロボット 1が行える全ての行動パターンを含む行動モデル）を保持する保持手段と、当該行動モデルの一部又は全部の状態空間を用いて行動を生成する行動生成手段とを 1つの行動モデル 7 O_k 及び。 PU 1 0により構成するようにした場合について述べたが、本発明はこれに限らず、この他種々の構成を広く適用することができる。

( 2) 第 2の実施の形態

( 2— 1 ) 原理

図 1 1に示すように、「成長」によって新たに取得する一連の行動パターン P A, への遷移が特定の状態（ノード NODE_A ) からしか起こらない場合には、その遷移確率 Pi を変更するだけでその行動パターンの発現を制御することができる。しかしながら図 1 3に示すように、この遷移が複数の状態（ノード NOD E_A1〜NODE_A3) から起こる場合には、対応する全ての遷移確率 P₁₀〜P₁₂をコトロールすることは容易ではない。

そこでこのような場合には、図 1 4に示すように、行動モデル中に仮想的なノード（以下、これを仮想ノードと呼ぶ） NODE_K を設けると共に、各ノード N OD E_A1〜NOD E_A3から一連の行動パターン P At の起点となるノ一ド NOD E_B への遷移を仮想ノード NOD Ε_κ への遷移に置き換え、仮想ノード NODE κ と、上述の一連の行動パターン P の起点のノード NOD E_B とを対応付けるようにすれば良い。

このようにすることによって、遷移確率のコントロールも容易となり、また「成長」に伴ってこの一連の行動パターン P を他の一連の行動パターン P A₂ に切り換える場合においても、仮想ノード NODE_K に対する実ノードの対応付けを前の行動パターン P A_t の起点のノード NOD E_B から次の行動パターン P A₂ の起点のノード NODE_c に変更するだけでこれを容易に行うことができる

(2 - 2) 本実施の形態によるぺットロボット 1 0 0の構成

ここで図 1の 1 00は全体として第 2の実施の形態によるぺットロボットを示すものであり、「成長」に伴う各成長関連条件項目の行動モデル 70_k (図 9) の構成が異なる点を除いて第 1の実施の形態のぺットロボット 1 と同様に構成されている。

すなわちこのぺットロボット 1 0 0において、各成長関連条件項目の行動モデル 70_k には、図 1 5に示すように、それぞれ「立つ」、「座る」及び「歩く」などの各「成長ステージ」に共通した基本的な行動を生成するための行動モデル（以下、これを基本行動モデルと呼ぶ） 1 0 1が設けられており、この基本行動モデル 1 0 1内にいくつかの仮想ノード NODE_K1〜NODE_Knが設けられているまた各成長関連条件項目の行動モデル 70_k には、各「成長ステージ」にそれぞれ対応させて、行動パターンファイル 1 0 2A〜 1 0 2 Eが設けられている。これら各行動パターンファイル 1 0 2 A〜 1 0 2 Eは、それぞれ図 1 6に示すように、その「成長ステージ」において基本行動モデル 1 0 1内の各仮想ノード N ODE_K1〜NODE_Knとそれぞれ対応付けられた各一連の行動パターン PAi 〜 P A_n をそれぞれ生成するノード群の状態遷移表を集めてファイル化したものである。

さらに各成長関連条件項目の行動モデル 70_k には、図 1 7に示すように、各「成長ステージ」における各仮想ノード NODE_K1〜NODE_Knと実ノード（その「成長ステージ」の行動パターンファイル 1 0 2 A〜 1 0 2 Eに格納されたいずれかの行動パターン PA_t 〜ΡΑ_Π の起点のノード、以下同じ）との対応関係を表す対応表 1 0 3 Α〜 1 03 Εをまとめたファイル（以下、これを差分フアイル 1 0 3と呼ぶ）が設けられている。

そして各成長関連条件項目の行動モデル 7 O_k は、初期時には「誕生期」用の行動パターンファイル 1 0 2 Aのデータを読み出してこれを基本行動モデル 1 0 1に付加すると共に、差分ファイル 1 0 3に格納されている「誕生期」用の対応表 1. 0 3 Aに基づいて基本行動モデル 1 0 1内の各仮想ノード NOD E_K1〜NO DE_K„を実ノードに変換するようにして「誕生期」用の行動モデル 70_k(1)を生成し、当該行動モデル 70_k(1)に基づいて行動を生成する。

また各成長関連条件項目の行動モデル 70_k は、この後学習モジュール 7 2 ( 図 5) から「成長」したとの通知が与えられると、「誕生期」用の行動パターンファイル 1 0 2Aのデータに代えて「幼年期」用の行動パターンファイル 1 0 2 Bのデータを基本行動モデル 1 0 1に付加すると共に、差分ファイル 1 0 3に格納されている「幼年期」用の対応表 1 0 3 Bに基づいて基本行動モデル 1 0 1内の各仮想ノード1^00£₁^₁〜1^00£ を実ノードに変換するようにして「幼年期」用の行動モデル 70_k(2)を生成し、当該行動モデル 70_k(2)に基づいて行動を生成する。

さらに各成長関連条件項目の行動モデル 70_k は、この後これと同様にして、学習モジュール 7 2から「成長」したとの通知が与えられる度に、基本行動モデル 1 0 1に付加する行動パターンファイル 1 0 2 A〜 1 0 2 Eのデータを「少年期」用、「青年期」用及び「成人期」用のものに順次変更すると共に、差分ファィル 1 0 3に格納されたその「成長ステージ」の対応表 1 0 3 C〜 1 0 3 Eに基づいて基本行動モデル 1 0 1内の各仮想ノード NODE_K1〜NODE_Knを実ノードに変換するようにして「少年期」用、「青年期」用及び「成人期」用の行動モデル 70_k ( 〜 ⁷0_k(5)を順次生成し、その行動モデル⁷0_k(3)〜 ⁷ O_k(5)に基づいて行動を生成する。

このようにしてこのぺットロボット 1 00では、基本行動モデル 1 0 1内の各仮想ノードNODE_K1〜NODE_Knにそれぞれ対応させる行動パターンPA₁ 〜 PA_n を「成長」に伴って順次変更するようにして、「成長」に応じて行動を変化させるようになされている。

(2— 3) 本実施の形態の動作及び効果

以上の構成において、このペットロボット 1 00では、基本行動モデル 1 0 1 内の各仮想ノード N O D E _K1〜 N O D E _Knにそれぞれ対応させる行動パターン Ρ

〜ΡΑ_η を「成長」に伴って順次変更するようにして、「成長」に応じて行動を変化させる。

従ってこのぺットロボット 1 00では、基本的な行動モデルを生成するための基本行動モデル 1 0 1を全ての「成長ステージ」において共用しているため、全ての「成長ステージ」を通して行動に一貫性をもたせることができ、また基本的な行動の学習結果を順次次の「成長ステージ」に持ち越すことができる。

またこのぺットロボット 1 00では、このように基本行動モデル 1 0 1を全ての「成長ステージ」において共用するため、行動モデルの作成作業が容易であり、また従来のように各「成長ステージ」ごとに個別の行動モデルを用意する場合に比べて行動モデル全体としてのデータ量を削減することもできる。

さらにこのぺットロボット 1 0 0では、基本行動モデル 1 0 1内の各仮想ノ一ド NODE_K1〜NODE_Knに対応付ける各行動パターン Ρ 〜 P A_n を部品化することができ、その分各成長関連条件項目の行動モデル 7 Ο_κ の生成作業をより一層容易化することができる。

さらにこのぺットロボット 1 00では、このような第 1の実施の形態において得られる作用効果と同様の作用効果に加えて、上述のように仮想ノ一ド NODE _Kl〜NOD E_Knを利用するようにしているために、例えば図 1 3のようにある一連の行動パターン P への遷移があちらこちらのノード NOD E_A1〜NO D E _A3から起こる場合においても、各成長関連条件項目の行動モデル 70_K を容易に生成し得るようにすることができる。

以上の構成によれば、基本行動モデル 1 0 1内に仮想ノード NO D E_K1〜NO DE_Knを設けると共に、各仮想ノード NODE_K1〜NODE_Knにそれぞれ「誕生期」用の各一連の行動パターン P 〜PA_n (の起点のノード）を対応付けるようにして各「誕生期」用の行動モデル 70_kU)を生成すると共に、この後「成長」に伴って各仮想ノード NODE_K1〜NODE_Knにそれぞれ対応付ける各一連の行動パターン〜PA_n を「幼年期」用、「少年期」用、「青年期」用及び「成人期」用に切り換えてゆくようにして、これら「幼年期」用、「少年期」用、「青年期」用及び「成人期」用の各行動モデル 70_k(2)〜 70_k(5)を生成するようにしたことにより、全ての「成長ステージ」を通して行動に一貫性をもたせることができる。かくするにっきより自然に「成長」を表現することができ、かくしてエンターティメント性を向上させ得るぺットロボットを実現できる。

(2 - 4) 他の実施の形態

なお上述の第 2の実施の形態においては、本発明を 4足歩行型のぺットロボット 1 00に適用するようにした場合について述べたが、本発明はこれに限らず、この他種々の形態のロボットに広く適用することができる。

また上述の第 2の実施の形態においては、「成長」に伴って各「成長ステージ」の行動モデル 70_k(1)〜70_k(5)の状態空間を順次拡大してゆく場合について述ベたが、本発明はこれに限らず、各「成長ステージ」の行動モデル 70_ku)〜 7 0_k(5)の状態空間を順次縮小させたり、又は拡大の途中でいずれかの「成長ステージ」においてその行動モデル 7 0_k(1)〜 7 0_k(5)の状態空間を縮小させたりするようにしても良い。

さらに上述の第 2の実施の形態においては、ペットロボット 1 0 0が 5段階で「成長」するようにした場合について述べたが、本発明はこれに限らず、 5以外の段階数で「成長」するようにしても良い。

さらに上述の第 2の実施の形態においては、仮想ノード NODE_K1〜NOD E _Knに割り当てるノード群を変更する変更手段を 1つの行動モデル 7 O_k 及び C P U 1 0により構成するようにした場合について述べたが、本発明はこれに限らず、この他種々の構成を広く適用することができる。

( 3 ) 第 3の実施の形態

( 3— 1 ) 第 3の実施の形態によるペットロボットの構成

図 1 8において、 1 1 0は全体として第 3の実施の形態によるぺットロボットを示し、胴体部ュ-ット 1 1 1の前後左右にそれぞれ脚部ュニット 1 1 2 A〜 1 1 2 Dが連結されると共に、胴体部ュニット 1 1 1の前端部及び後端部にそれぞれ頭部ュ-ット 1 1 3及び尻尾部ュニット 1 1 5が連結されることにより構成されている。

胴体部ュニット 1 1 1には、図 1 9に示すように、 C PU (C e n t r a l P r o c e s s i n g U n i t ) 1 2 0、 D RAM (D y n a m i c

R a n d o m A c c e s s Me m o r y) 1 2 1、フラッシュ ROM ( R e a d O n l y Me m o r y) 1 2 2、 P C (P e r s o n a l

C o m p u t e r ) カードィンターフェース回路 1 2 3及び信号処理回路 1 2 4 が内部バス 1 2 5を介して相互に接続されることにより形成されたコントロール部 1 2 6と、このぺットロボット 1 1 0の動力源としてのバッテリ 1 2 7とが収納されている。また胴体部ュニット 1 1 1には、ペットロボット 1 1 0の向きや動きの加速度を検出するための角速度センサ 1 2 8及び加速度センサ 1 2 9なども収納されている。

また頭部ュニット 1 1 3には、外部の状況を撮像するための C CD ( C h a r g e C o u p l e d D e v i c e ) カメラ 1 3 0と、ユーザからの「撫でる」や「叩く」といった物理的な働きかけにより受けた圧力を検出するためのタツチセンサ 1 3 1 と、前方に位置する物体までの距離を測定するための距離センサ 1 3 2と、外部音を集音するためのマイクロホン 1 3 3と、鳴き声等の音声を出力するためのスピーカ 1 3 4と、ペットロボット 1 1 0の「目」に相当する L E D (L i g h t Em i t t i n g D i o d e ) (図示せず）となどがそれぞれ所定位置に配設されている。

さらに各脚部ュニット 1 1 2 A〜 1 1 2 Dの関節部分や、各脚部ュ-ット 1 1

2 A〜 1 1 2 D及び胴体部ュ-ット 1 1 1の各連結部分、頭部ュニット 1 1 3及び胴体部ュニット 1 1 1の連結部分、並びに尻尾部ュニット 1 1 4の尻尾 1 1 4 Aの連結部分などにはそれぞれ自由度数分のァクチユエ一タ 1 3 5 〜 1 3 5_n 及びポテンショメータ 1 3 6 i 〜 1 3 6_n が配設されている。

そしてこれら角速度センサ 1 2 8、加速度センサ 1 2 9、タツチセンサ 1 3 1 、距離センサ 1. 3 2、マイクロホン 1 3 3、スピーカ 1 3 4及び各ポテンショメータ l s ei i s en などの各種センサ並びに L E D及び各ァクチユエータ ι

3 5！〜 1 3 5_n は、それぞれ対応するハブ 1 3 7L 〜 1 3 7_N を介してコントロール部 1 2 6の信号処理回路 1 2 4と接続され、 C CDカメラ 1 3 0及びバッテリ 1 2 7は、それぞれ信号処理回路 1 2 4と直接接続されている。

このとき信号処理回路 1 2 4は、上述の各センサから供給されるセンサデータや画像データ及び音声データを順次取り込み、これらをそれぞれ内部バス 1 2 5 を介して DRAM 1 2 1内の所定位置に順次格納する。また信号処理回路 1 2 4 は、これと共にバッテリ 1 2 7から供給されるバッテリ残量を表すバッテリ残量データを順次取り込み、これを D RAM 1 2 1内の所定位置に格納する。

そしてこのようにして D RAM 1 2 1に格納された各センサデータ、画像データ、音声データ及びバッテリ残量データは、この後 C PU 1 2 0がこのペット口ボット 1 1 0の動作制御を行う際に利用される。

実際上 C PU 1 2 0は、ペットロボット 1 1 0の電源が投入された初期時、月同体部ュニット 1 1 1の図示しない P Cカードス口ットに装填されたメモリカード 1 3 8又はフラッシュ ROM1 2 2に格納された制御プログラムを P Cカードィンターフェース回路 1 23を介して又は直接読み出し、これを D RAM 1 2 1に格納する。

また C PU 1 20は、この後上述のように信号処理回路 1 24より DRAM 1 2 1に順次格納される各センサデータ、画像データ、音声データ及びバッテリ残量データに基づいて自己及び周囲の状況や、ユーザからの指示及ぴ働きかけの有無などを判断する。

さらに C PU 1 20は、この判断結果及び DRAM 1 2 1に格納した制御プログラムに基づいて続く行動を決定すると共に、当該決定結果に基づいて必要なァクチユエ一タ I S Si l S Sn を駆動させることにより、頭部ュニット 1 1 3 を上下左右に振らせたり、尻尾部ュニット 1 1 4の尻尾 1 1 4 Aを動かせたり、各脚部ュニット 1 1 2 A〜 1 1 2 Dを駆動させて歩行させるなどの行動を行わせる。

またこの際 C PU 1 20は、必要に応じて音声データを生成し、これを信号処理回路 1 24を介して音声信号としてスピーカ 1 34に与えることにより当該音声信号に基づく音声を外部に出力させたり、上述の L EDを点灯、消灯又は点滅させる。

このようにしてこのぺットロボット 1 1 0においては、自己及び周囲の状況や、ユーザからの指示及び働きかけに応じて自律的に行動し得るようになされている。

(3 - 2) 制御プログラムのソフトウェア構成

ここでぺットロボット 1 1 0における上述の制御プログラムのソフトウェア構成を図 20に示す。この図 20において、デバイス · ドライバ · レイヤ 1 4 0は、この制御プログラムの最下位層に位置し、複数のデバイス ' ドライバからなるデバイス · ドライノ 'セット 1 4 1から構成されている。この場合各デバイス · ドライバは、 CCDカメラ 1 3 0 (図 1 9) やタイマ等の通常のコンピュータで用いられるハードウエアに直接アクセスすることを許されたオブジェクトであり、対応するハードウエアからの割り込みを受けて処理を行う。

またロボティック ·サーバ ·オブジェクト 1 4 2は、デバイス · ドライノ ' レィャ 1 4 0の上位層に位置し、例えば上述の各種センサゃァクチユエータ 1 3 5 ！〜 1 3 5 _n 等のハードウェアにアクセスするためのィンターフェースを提供するソフトウェア群でなるバーチャル · ロボット 1 4 3 と、電源の切換えなどを管理するソフトウェア群でなるパワーマネージャ 1 4 4と、他の種々のデバイス · ドライバを管理するソフトウエア群でなるデバイス . ドライノ ·マネージャ 1 4 5と、ペットロボット 1 1 0の機構を管理するソフトウエア群でなるデザインド • ロボット 1 4 6と力ら構成されている。

マネージャ .オブジェクト 1 4 7は、オブジェクト ·マネージャ 1 4 8及びサ一ビス ·マネージャ 1 4 9から構成されている。この場合オブジェクト ·マネージャ 1 4 8は、ロボティック ·サーバ ·オブジェクト 1 4 2、ミドル ' ウェア ' レイヤ 1 5 0、及びアプリケーシヨン . レイヤ 1 5 1に含まれる各ソフトウエア群の起動や終了を管理するソフトウエア群であり、サービス · マネージャ 1 4 9 は、メモリカード 1 3 8 (図 1 9 ) に格納されたコネクションファイルに記述されている各ォブジェクト問の接続情報に基づいて各ォブジェクトの接続を管理するソフトウェア群である。

ミドル . ウェア . レイヤ 1 5 0は、口ボテイツク .サーバ .オブジェクト 1 4 2の上位層に位置し、画像処理や音声処理などのこのぺットロボット 1 1 0の基本的な機能を提供するソフトウエア群から構成されている。またアプリケーション ' レイヤ 1 5 1は、ミドル ' ウェア ' レイヤ 1 5 0の上位層に位置し、当該ミドル ' ウェア ' レイヤ 1 5 0を構成する各ソフトウェア群によって処理された処理結果に基づいてぺットロボット 1 1 0の行動を決定するためのソフトウェア群から構成されている。

なおミドル · ウェア · レイヤ 1 5 0及びアプリケ一ション · レイヤ 1 5 1の具体なソフトウエア構成をそれぞれ図 2 1及び図 2 2に示す。ミドル . ウェア ' レイヤ 1 50においては、図 2 1からも明らかなように、音階認識用、距離検出用、姿勢検出用、タツチセンサ用、動き検出用及び色認識用の各信号処理モジユーノレ 1 60〜 1 6 5並びに入力セマンティクスコンバータモジュール 1 6 6などを有する認識系 1 6 7と、出力セマンティクスコンバ一タモジュール 1 6 7並びに姿勢管理用、トラッキング用、モーション再生用、歩行用、転倒復帰、 L ED点灯用及び音再生用の各信号処理モジュール 1 6 8〜 1 74 などを有する出力系 1 7 5とから構成されている。

この場合認識系 1 6 7の各信号処理モジュール 1 60〜 1 6 5は、口ボティック ·サーノく ·オブジェクト 1 4 2のバーチヤノレ · ロボット 1 4 3により DRAM 1 2 1 (図 1 9) から読み出される各センサデータや画像データ及び音声データのうちの対応するデータを取り込み、当該データに基づいて所定の処理を施して、処理結果を入力セマンティクスコンバ一タモジュール 1 6 6に与える。

入力セマンティクスコンバータモジュール 1 6 6は、これら各信号処理モジュール 1 6 0〜 1 6 5から与えられる処理結果に基づいて、「ボールを検出した」、

「転倒を検出した」、「撫でられた」、「叩かれた」、「ドミソの音階が聞こえた」、「動く物体を検出した」又は「障害物を検出した」などの自己及び周囲の状況や、ユーザからの指令及び働きかけを認識し、認識結果をアプリケーション · レイヤ 1 5 1 (図 1 9 ) に出力する。

アプリケーション . レイヤ 1 5 1においては、図 2 2に示すように、行動モデルライブラリ 1 8 0、行動切換えモジュール 1 8 1、学習モジュール 1 8 2、感情モデル 1 8 3及び本能モデル 1 84の 5つのモジュールから構成されている。この場合行動モデルライブラリ 1 8 0には、図 2 3に示すように、「バッテリ残量が少なくなつた場合」、「転倒復帰する場合」、「障害物を回避する場合」、「感情を表現する場合」、「ボールを検出した場合」などの予め選択されたいくつかの条件項目にそれぞれ対応させて、それぞれ独立した行動モデル 1 8 〜 1 8 0 _n が設けられている。

そしてこれら行動モデル 1 8 0 〜 1 8 O_n は、それぞれ入力セマンティクスコンバータモジュール 1 6 6から認識結果が与えられたときや、最後の認識結果が与えられてから一定時間が経過したときなどに、必要に応じて後述のように感情モデル 1 8 3に保持されている対応する情動のパラメータ値や、本能モデル 1 84に保持されている対応する欲求のパラメータ値を参照しながら続く行動をそれぞれ決定し、決定結果を行動切換えモジュール 1 8 1に出力する。

なおこの実施の形態の場合、各行動モデル 1 8 〜 1 8 O_n は、次の行動を決定する手法として、図 24に示すような 1つのノード（状態） NODE。 ' 〜 NODE_n ' から他のどのノード NODE。 ' 〜NODE_n ' に遷移するかを各ノード NODE。 ' 〜NODE_n ' 間を接続するアーク A R C i ' 〜ARC_n に対してそれぞれ設定された遷移確率 P_t ' 〜P_n ' に基づいて確率的に決定する確率ォートマトンと呼ばれるアルゴリズムを用いる。

具体的に、各行動モデル 1 8 〜 1 8 O_n は、それぞれ自己の行動モデル 1 8 〜 1 8 O_n を形成する各ノード NODE。 ' 〜NODE_n ' にそれぞれ対応させて、これらノード NODE。 ' 〜NODE_n ' ごとの図 2 5に示すような状態遷移表 1 90を有している。

この状態遷移表 1 90では、そのノード NODE。 ' 〜NODE_n ' において遷移条件とする入力イベント（認識結果）が「入力イベント名」の行に優先順に列記され、その遷移条件についてのさらなる条件が「データ名」及び「データ範囲」の行における対応する列に記述されている。

従って図 2 5の状態遷移表 1 90で表されるノード NODE_10Q ' では、「ボールを検出（BAL L)」という認識結果が与えられた場合に、当該認識結果と共に与えられるそのボールの「大きさ（S I Z E)」力 S 「0から 1 000」の範囲であることや「障害物を検出（OB S TAC L E) という認識結果が与えられた場合に、当該認識結果と共に与えられるその障害物までの「距離（D I S— T ANC E) J 力 S 「0から 1 00」の範囲であることが他のノードに遷移するための条件となっている。

またこのノード NODE₁₀。 ' では、認識結果の入力がない場合においても、行動モデル 1 8 〜 1 8 0_n が周期的に参照する感情モデル 1 8 3及び本能モデル 1 84に保持された各情動及び各欲求のパラメータ値のうち、又は感情モデル 1 8 3に保持された「喜び（ J O Y)」、「驚き（SURP R I S E)J 若しくは

「悲しみ（ S AD NE S S )」のいずれかのパラメータ直が「 5 0力、ら 1 00」の範囲であるときには他のノードに遷移することができるようになっている。また状態遷移表 1 90では、「他のノードへの遷移確率」の欄における「遷移先ノード」の列にそのノード NODE。 ' 〜NODE_n ' から遷移できるノード名が列記されると共に、「入力イベント名」、「データ値」及び「データの範囲」の行に記述された全ての条件が揃ったときに遷移できる他の各ノード NODE 0 ' 〜NODE_n z への遷移確率が「他のノードへの遷移確率」の欄内の対応する箇所にそれぞれ記述され、そのノード NODEo ' 〜NODE_n ' に遷移する際に出力すべき行動が「他のノードへの遷移確率」の欄における「出力行動」の行に記述されている。なお「他のノードへの遷移確率」の欄における各行の確率の和は 1 0 0 〔％〕となっている。

従って図 2 5の状態遷移表 1 90で表されるノード NODE_10Q ' では、例えば「ボールを検出（BAL L)」し、そのボールの「S I Z E (大きさ）」「0 から 1 00 0」の範囲であるという認識結果が与えられた場合には、「3 0 〔％〕」の確率で「ノード NOD E₁₂。 ' （n o d e 1 20 )」に遷移でき、そのとき「ACT I ON 1」の行動が出力されることとなる。

そして各行動モデル 1 8 〜 1 8 0_n は、それぞれこのような状態遷移表 1 9 0として記述されたノード NODE。 ' 〜NODE_n ' がいくつも繋がるようにして構成されており、入力セマンティクスコンバータモジュール 1 6 6から認識結果が与えられたときなどに、対応するノード NODE。 ' 〜NODE_n ' の状態遷移表 1 90を利用して確率的に次の行動を決定し、決定結果を行動切換えモジュール 1 8 1に出力するようになされている。

行動切換えモジュール 1 8 1は、行動モデルライブラリ 1 8 0の各行動モデル 1 8 〜 1 80_n からそれぞれ出力される行動のうち、予め定められた優先順位の高い行動モデル 1 8 0^ 〜 1 8 0_n から出力された行動を選択し、当該行動を実行すべき旨のコマンド（以下、これを行動コマンドと呼ぶ）をミドル · ゥェァ · レイヤ 1 5 0の出力セマンティクスコンバータ 1 6 7に送出する。なおこの実施の形態においては、図 2 3において下側に表記された行動モデル 1 8 0 〜 1 8 0_n ほど優先順位が高く設定されている。

また行動切換えモジュール 1 8 1は、行動完了後に出力セマンティクスコンパータ 1 6 7から与えられる行動完了情報に基づいて、その行動が完了したことを学習モジュール 1 8 2、感情モデル 1 8 3及ぴ本能モデル 1 8 4に通知する。一方、学習モジユーノレ 1 8 2は、入力セマンティクスコンバータ 1 6 6から与えられる認識結果のうち、「叩かれた」や「撫でられた」など、ユーザからの働きかけとして受けた教示の認識結果を入力する。

そして学習モジュール 1 8 2は、この認識結果及び行動切換えモジュール 1 8 1からの通知に基づいて、「叩かれた（叱られた）」ときにはその行動の発現確率を低下させ、「撫でられた（誉められた）」ときにはその行動の発現確率を上昇させるように、行動モデルライブラリ 1 8 0における対応する行動モデル 1 8 0, 〜 1 8 0_n の対応する遷移確率を変更する。

他方、感情モデル 1 8 3は、「喜び（ j o y )」、「悲しみ（ s a d n e s s )」、「怒り（a n g e r )」、「驚き（ s u r p r i s e )」、「嫌悪 ( d i s g u s t ) 」及び「恐れ（ f e a r )」の合計 6つの情動について、各情動ごとにその情動の強さを表すパラメータを保持している。そして感情モデル 1 8 3は、これら各情動のパラメータ値を、それぞれ入力セマンティクスコンバータモジュール 1 6 6から与えられる「叩かれた」及び「撫でられた」などの特定の認識結果と、経過時間及び行動切換えモジュール 1 8 1からの通知となどに基づいて順次更新するようになされている。

具体的に感情モデル 1 8 3は、入力セマンティクスコンバータ 1 6 6からの認識結果及びそのときのぺットロポット 1 1 0の行動がその情動に対して作用する度合い（予め設定されている）と、本能モデル 1 8 4が保持している各欲求のパラメータ値及びそのときのぺットロボット 1 1 0の行動がその情動に対して作用する度合い（予め設定されている）と、他の情動から受ける抑制及び刺激の度合いと、経過時間となどに基づいて所定の演算式により算出されるその情動の変動量を Δ Ε 〔 t〕 ' 、現在のその情動のパラメータ値を E 〔 t〕 ' 、認識結果等に応じてその情動を変化させる割合（以下、これを感度と呼ぶ）を表す係数を k _e ' として、所定周期で次式

E 〔 t + l〕 ' =E 〔 t〕 ' + k ΧΔΕ [ t ] ' (4 ) を用いて次の周期におけるその情動のパラメータ値 E [ t + 1 ] ' を算出する。そして感情モデル 1 8 3は、この演算結果を現在のその情動のパラメータ値 E 〔 t〕 ' と置き換えるようにしてその情動のパラメータ値を更新する。なお各認識結果や行動切換えモジュール 1 8 1からの通知に対してどの情動のパラメータ値を更新するかは予め決められており、例えば「叩かれた」といった認識結果が与えられた場合には「怒り」の情動のパラメータ値が上がり、「撫でられた」といった認識結果が与えられた場合には「喜び」の情動のパラメータ値が上がる。これに対して本能モデル 1 8 4は、「運動欲（e x e r c i s e)」、「愛情欲（ a f f e c t i o n)」、「食欲（ a p p e t i t e )」及び「好奇心 ( c u r i — o s i t y)j の互いに独立した 4つの欲求について、これら欲求ごとにその欲求の強さを表すパラメータを保持している。そして本能モデル 1 8 4は、これら欲求のパラメータ値を、それぞれ入力セマンティクスコンバータモジュール 1 6 6から与えられる認識結果や、経過時間及び行動切換えモジュール 1 8 1からの通知などに基づいて順次更新するようになされている。

具体的に本能モデル 1 8 4は、「運動欲」、「愛情欲」及び「好奇心」については、ペットロボット 1 1 0の行動出力、経過時間及び認識結果などに基づいて所定の演算式により算出されるその欲求の変動量を Δ I 〔k〕 ' 、現在のその欲求のパラメータ値を I 〔k〕 ' 、その欲求の感度を表す係数を ' として、所定周期で次式

I [ k + 1 ] ' = I 〔k〕 ' + k, ' ΧΔ I 〔k〕 ' （5) を用いて次の周期におけるその欲求のパラメータ値 I 〔k + l〕 ' を算出し、この演算結果を現在のその欲求のパラメータ値 I 〔k〕 ' と置き換えるようにしてその欲求のパラメータ値を更新する。なお行動出力や認識結果等に対してどの欲求のパラメータ値を変化させるかは予め決められており、例えば行動切換えモジユール 1 8 1からの通知（行動を行ったとの通知）があったときには「運動欲」のパラメータ値が下がる。

また本能モデル 1 8⁴は、「食欲」については、入力セマンティクスコンバータモジュール 1 6 6を介して与えられるバッテリ残量データに基づいて、バッテリ残量をとして、所定周期で次式

I 〔k〕 ' = 1 00— B_L ' (6) により「食欲」のパラメータ値 I 〔k〕 ' を算出し、この演算結果を現在の食欲のパラメータ値 I 〔k〕 ' と置き換えるようにして当該「食欲」のパラメータ値を更新する。

なお本実施の形態においては、各情動及び各欲求のパラメータ値がそれぞれ 0 から 1 0 0までの範囲で変動するように規制されており、また係数 k_e ' 、 k , ' の値も各情動及び各欲求ごとに個別に設定されている。

一方、ミドノレ · ウェア · レイヤ 1 5 0の出力セマンティクスコンバータモジュ —ル 1 6 7は、図 2 1に示すように、上述のようにしてアプリケーシヨン . レイャ 1 5 1の行動切換えモジュール 1 8 1から与えられる「前進」、「喜ぶ」、「鳴く」又は「トラッキング（ボールを追いかける）」といった抽象的な行動コマンドを出力系 1 7 5の対応する信号処理モジュール 1 6 8〜 1 74に与える。そしてこれら信号処理モジュール 1 68〜 1 74は、行動コマンドが与えられると当該行動コマンドに基づいて、その行動を行うために対応するァクチユエ一タ I S Si l S Sn (図 1 9) に与えるべきサ一ポ指令値や、スピー力 1 34

(図 1 9) から出力する音の音声データ及び又は「目」の L EDに与える駆動データを生成し、これらのデータをロボティック ·サーバ ·オブジェクト 1 4 2のバーチャルロボット 1 4 3及び信号処理回路 1 24 (図 1 9) を順次介して対応するァクチユエータ 1 3 5 J 〜 1 3 5_n 、スピーカ 1 3 4又は LEDに順次送出する。

このようにしてこのぺットロボット 1 1 0においては、制御プログラムに基づいて、自己及び周囲の状況や、ユーザからの指示及び働きかけに応じた自律的な行動を行うことができるようになされている。

(3— 3) ペットロボット 1 1 0の成長モデノレ

( 3 - 3 - 1 ) 行動の成長

次にこのぺットロボット 1 1 0に実装された成長機能について説明する。このペットロボット 1 1 0には、ユーザからの働きかけ等に応じて、あたかも本物の動物が「成長」するかのごとく行動を変化させてゆく成長機能が実装されているすなわちこのペットロボット 1 1 0には、成長過程として「誕生期」、「幼年期」、「少年期」、「青年期」及び「成人期」の 5つの「成長ステージ」が設けられている。そしてアプリケーション · レイヤ 1 5 1の行動モデルライブラリ 1 80 ( 図 2 2) には、上述した「バッテリ残量が少なくなつた場合」等の各条件項目のうち、「歩行状態」、「モーション（動き）」、「行動」及ぴ「サウンド（鳴き声）」の 4つの項目に関係した全ての条件項目（以下、これを成長関連条件項目と呼ぶ ) について、図 26に示すように、行動モデル 1 8 O_k として、「誕生期」、「幼年期」、「少年期」、「青年期」及び「成人期」にそれぞれ対応させた行動モデル 1 8 0_k(1)〜 1 80_k(5)が設けられている。そして行動モデルライブラリ 1 8 1では、これら成長関連条件項目について、初期時には「誕生期」の行動モデル 1 80 _k(1)を用いて次の行動を決定するようになされている。

この場合「誕生期」の各行動モデル 1 8 O_k(1)はノード NOD E。 ' 〜NODE _η ' (図 24) の数が少なく、またこれら行動モデル 1 8 0_k(1)から出力される行動の内容も「パターン 1 (「誕生期」用の歩行パターン) で前進」や、「パターン 1 (「誕生期」用の鳴き声パターン）で鳴く」のように、「誕生期」に対応した行動又は動作内容となっている。

かくしてこのペットロボット 1 1 0においては、初期時には「誕生期」の各行動モデル 1 8 0_k(1)に従って、例えば「歩行状態」は歩幅が小さく「よちよち歩き」となるように、「モーション」については単に「歩く」、「立つ」、「寝る」程度の「単純」な動きとなるように、「行動」については同じ行動を繰り返し行うことにより「単調」となるように、また「サウンド」については「小さく短い」鳴き声となるように行動及び動作する。

またこのときアプリケーション ' レイヤ 1 5 1の学習モジュール 1 8 2 (図 2 2) は、その内部に「成長」の度合いを表すパラメータ（以下、これを成長パラメータと呼ぶを保持しており、入力セマンティクスコンバータモジュール 1 6 6 から与えられる認識結果や経過時間情報などに基づいて、成長パラメータの値を「撫でられた」や「叩かれた」等のユーザからの働きかけ（教示）の回数や経過時間等に応じて順次更新するようになされている。

そして学習モジュール 1 8 2は、ペットロボット 1 1 0に電源が投入される度にこの成長パラメータの値を評価し、当該値が「幼年期」に対応させて予め設定された閾値を越えた場合には、これを行動モデルライブラリ 1 80に通知する。また行動モデルライブラリ 1 80は、この通知が与えられると、上述の各成長関連条件項目について、それぞれ使用する行動モデルを「幼年期」の行動モデル 1 80_k(¾に変更する。

このとき「幼年期」の各行動モデル 1 80_k(2)は「誕生期」の行動モデル 1 8 0_k ）よりもノード NODE。 ' 〜NODE_n ' の数が多く、またこれら行動モデル 70_k(2)から出力される行動の内容も「幼年期」の行動に比べて難易度や複雑さのレベル（成長レベル）が高くなつている。

かくしてこのぺットロボット 1 1 0においては、この後はこれら行動モデル 1

8 0 _k(2)に従って、例えば「歩行状態」については各ァクチユエータ 1 3 5 〜 1

3 5 _n (図 1 9 ) の回転速度を速くするなどして「少しはしつかり」と歩くように、「モーション」については行動の数が増加することにより「少しは高度かつ複雑」な動きとなるように、「行動」については「少しは目的をもった」行動となるように、また「サウンド」については「少しは長く大きい」鳴き声となるように行動及び動作する。

さらに学習モジュール 1 8 4は、この後上述の場合と同様にして、成長パラメータの値が「少年期」、「青年期」及び「成人期」にそれぞれ対応させて予め設定された各閾値を越える度にこれを行動モデルライブラリ 1 8 1に通知する。また行動モデルライブラリ 1 8 1は、この通知が与えられる度に上述の各成長関連条件項目について、それぞれ使用する行動モデルを「少年期」、「青年期」及び「成人期」の行動モデル 1 8 O _k(3)〜 l 8 O _k(5)に順次変更する。

このとき「少年期」、「青年期」及び「成人期」の各行動モデル 1 8 0 _k(3)〜 l

8 0 _k(5)は、それぞれ「成長ステージ」が上がるにつれてノード N O D E。 ' 〜N O D E _n ' の数が多くなり、またこれら行動モデル 1 8 0 _k( 〜 1 8 O _k(5)から出力される行動の内容も「成長ステージ」が上がるにつれて行動の難易度や複雑さのレベルが高くなっている。

この結果このペットロボット 1 1 0では、「成長ステージ」が上がる（すなわち「誕生期」から「幼年期」、「幼年期」から「少年期」、「少年期」から「青年期」、「青年期」から「成人期」に変化する）に従って、「歩行状態」が「よちよち歩き」から「しっかりした歩き」に、「モーション」が「単純」から「高度 ·複雑」に、「行動」力 S 「単調」から「目的をもった行動」に、かつ「サウンド」力 S 「小さく短い」から「長く大きい」に順次段階的に変化する。

このようにしてこのぺットロボット 1 1 0においては、ユーザから与えられる教示や時間経過に応じて、行動及び動作が「誕生期」、「幼年期」、「少年期」、「青年期」及び「成人期」の 5段階で「成長」するようになされている。

なおこの実施の形態の場合、ペットロボット 1 1 0の成長モデルは、図 2 7に示すように「少年期」以降において枝分かれするモデルとなっている。

すなわちこのぺットロボット 1 1 0の場合、アプリケーシヨン ' レイヤ 1 5 1 (図 2 2) の行動モデルライブラリ 1 80には、上述の各成長関連条件項目について、「少年期」、「青年期」及び「成人期」の行動モデル 1 80_k(3)〜 l 80_k(5)としてそれぞれ複数の行動モデルが用意されている。

実際上、各成長関連条件項目の例えば「少年期」の行動モデルとしては、動きが雑で速い「荒々しい」性格の行動を行わせるための行動モデル（CH I LD 1 ' ) と、これよりも動きが滑らかで遅い「おっとり」とした性格の行動を行わせるための行動モデル（CH I LD 2^f ) とが用意されている。

また「青年期」の行動モデルとしては、「少年期」の「荒々しい」性格よりもより動きが雑で速い「いらいら」した性格の行動を行わせるための行動モデル（ YOUNG 1 ' ) と、これよりも動きが遅くかつ滑らかな「普通」の性格の行動及び動作を行わせるための行動モデル（YOUNG 2' ) と、これよりも一層動作が遅くかつ行動量が少ない「おっとり」とした性格の行動を行わせるための行動モデル（YOUNG 3 ' ) とが用意されている。

さらに「成人期」の行動モデルとしては、「青年期」の「いらいら」した性格よりもより動きが雑で速く、かつ非常に怒りやすい「攻撃的」な性格の行動を行わせるための行動モデル（ADULT 1 ' ) と、これよりも動きが滑らかで遅く、かつ怒りやすい「荒々しい」性格の行動を行わせるための行動モデル（ ADULT 2) と、これよりも動きが滑らかで遅く、かつ行動量が少ない「おとなしい」性格の行動を行わせるための行動モデル（ADULT 3' ) と、これよりもさらに一層動きが遅く、かつ行動量が少ない「静かな」性格の行動を行わせるための行動モデル（ADULT 4 ' ) とが用意されている。

そしてアプリケーション ' レイヤ 1 5 1の学習モジュール 1 8 2 (図 2 2) は、上述のように行動モデルライブラリ 1 80に対して「成長ステージ」を上げさせるための通知を行う際に、「少年期」以降では、その「成長ステージ」において「叩かれた」及び「撫でられた」回数等に基づいて、各成長関連条件項目の次の「成長ステージ」の行動モデルとしてどの「性格」の行動モデル C H I LD 1 ' 、 CH I LD 2 ' 、 YOUNG 1 ' 〜YOUNG 3 ' 、 ADULT 1 ' 〜ADU LT 4' を用いるかを指定する。

この結果、行動モデルライブラリ 1 80は、この指定に基づいて、各成長関連条件項目について、「少年期」以降では使用する行動モデルを指定された「性格」の行動モデルにそれぞれ変更する。

この場合「少年期」以降では、次の「成長ステージ」に移る際、現在の「成長ステージ」での「性格」によって次の「成長ステージ」での「性格」が決まっており、図 2 7において矢印で結ばれた「性格」間での移行しかできない。従って例えば「少年期」において「荒々しい」性格の行動モデル（CH I LD 1 ' ) が用いられている場合には、「青年期」において「おっとり」とした性格の行動モデル（YOUNG 3' ) に移行することができない。

このようにこのぺットロボット 1 1 0においては、あたかも本物の動物が飼い主の飼育の仕方等によって性格を形成してゆくかのごとく、ユーザからの働きかけ等に応じて、「成長」に伴って「性格」をも変化させてゆくようになされている。

(3 - 3 - 2) 感情及び本能の成長

かかる構成に加えてこのペットロボット 1 1 0の場合、上述のような行動の「成長」に伴って感情及び本能をも「成長」させてゆくようになされている。

すなわちこのぺットロボット 1 1 0の場合、アプリケ一ション · レイヤ 1 5 1 の感情モデル 1 8 3 (図 2 2) には、図 28 (A) 〜（E) に示すような各「成長ステージ」ごとの各情動に対する（4) 式の係数の値をそれぞれ記述したファイル（以下、これらを感情パラメータファイルと呼ぶ） 200 A〜 200 Eが格納されている。

そして感情モデル 1 8 3は、初期時には（すなわち「成長ステージ」が「誕生期」の段階では）、「誕生期」用の感情パラメータファイル 2 0 O Aに記述された各係数 k _e ' の値を利用して、（4 ) 式に基づいて各情動のパラメータ値をそれぞれ周期的に更新するようになされている。

また感情モデル 1 8 3には、上述の行動モデルライブラリ 1 8 0 (図 2 2 ) と同様に、「成長ステージ」が上がる度に学習モジュール 1 8 2からこれを知らせる通知が与えられる。そして感情モデル 1 8 3は、この通知が与えられる度に各情動に対する（4 ) 式の係数 k _e ' の値を、対応する「成長ステ^"ジ」の感情パラメータファイル 2 0 0 B〜2 0 0 Eに記述された対応する値にそれぞれ更新するようになされている。

このとき例えば「誕生期」では、図 2 8 ( A ) からも明らかなように、「喜び」及ぴ「恐れ」以外の他の情動の係数 k _e ' の値が全て「0」に設定されている。従って「誕生期」では、周期的に更新される各情動のパラメータのうち値が変化するのは「喜び」及び「恐れ」の情動だけであり、他の情動のパラメータ値は常に一定値となるために「喜び」及び「恐れ」以外の情動が抑制される。この結果「誕生期」では、 6つの情動のうち「喜び」及び「恐れ」だけを行動として表現できる（すなわち 6つの情動のうち「喜び」及び「恐れ」の各パラメータ値だけを行動生成に使用する）。

また「幼児期」では、図 2 8 ( B ) からも明らかなように、「喜び」、「恐れ」及び「怒り」以外の情動の係数 k _e ' の値が全て「0」に設定されている。従つて「幼児期」では、周期的に更新される各情動のパラメータのうち値が変化するのは「喜び」、「恐れ」及び「怒り」の情動だけであり、他の情動のパラメータ値は常に一定値となるために「喜び」、「恐れ」及び「怒り」以外の情動が抑制される。この結果「幼児期」では、 6つの情動のうち上述の「喜び」、「恐れ」及び「怒り」だけを行動として表現できる。

同様にして、図 2 8 ( C ) 〜（E ) に示すように、「少年期」には、「喜び」、「恐れ」、「怒り」及び「驚き」の情動だけを行動として発現でき、「青年期」及び「成人期」になると全ての情動を行動として表現できるようになる。このようにこのぺットロボット 1 1 0では、図 2 9 ( A ) に示すように、「成長ステージ」が上がってゆくにつれて行動として表現できる情動の数（行動生成に使用する情動の数）が増加してゆくようになされ、これにより行動の「成長」に伴って感情をも「成長」させ得るようになされている。

これと同様にして、アプリケーション，レイヤ 1 5 1の本能モデル 1 8 4 (図 2 2 ) には、図 3 0 ( A ) 〜（E ) に示すような各「成長ステージ」ごとの各欲求に対する（5 ) 式の係数 k i ' の値を記述したファイル（以下、これらを本能パラメータファイルと呼ぶ） 2 0 1 A〜2 0 1 Eが格納されている。

そして本能モデル 1 8 4は、初期時には（すなわち「成長ステージ」が「誕生期」の段階では）、「誕生期」の本能パラメータファイル 2 0 1 Aに記述された各係数 1^ / の値を利用して、（5 ) 式に基づいて各欲求のパラメータ値を周期的に更新するようになされている。

また本能モデル 1 8 4には、感情モデル 1 8 3と同様に、「成長ステージ」力 S 上がる度に学習モジュール 1 8 2 (図 2 2 ) からこれを知らせる通知が与えられる。そして本能モデル 1 8 4は、この通知が与えられる度に各欲求に対する（5 ) 式の係数 kノの値を、対応する「成長ステージ」の本能パラメータファイル 2 0 1 B〜 2 0 1 Eに記述された対応する値にそれぞれ更新するようになされている。

このとき例えば「誕生期」では、図 3 0 ( A ) からも明らかなように、「食欲」以外の他の欲求の係数 kノの値が全て「0」に設定されている。従って「誕生期」では、周期的に更新される各欲求のパラメータのうち値が変化するのは「食欲」だけとなり、他の欲求のパラメータ値は常に一定値となるために「食欲」以外の欲求が抑制される。この結果「誕生期」では、 4つの欲求のうち「食欲」だけを行動として表現することができる（すなわち 4つの欲求のうち「食欲」のパラメータ値だけが行動生成に使用される）。

また「幼児期」では、図 3 0 ( B ) からも明らかなように、「食欲」及び「愛情欲」以外の欲求の係数 ' の値が全て「0」に設定されている。従って「幼児期」では、周期的に更新される各欲求のパラメータのうち値が変化するのは「食欲」及び「愛情欲」だけであり、他の欲求のパラメータは常に一定値となる。この結果「幼児期」では、「食欲」及び「愛情欲」以外の欲求が抑制され、 4つの欲求のうち「食欲」及び「愛情欲」だけを行動として表現することができる。同様にして、図 3 0 ( C ) 〜（E ) に示すように、「少年期」には、「食欲」、「愛情欲」及び「好奇心」の欲求を行動として表現でき、「青年期」及び「成人期」になると全ての欲求を行動として表現できるようになる。

このようにこのぺットロボット 1 1 0では、図 2 9 ( B ) に示すように、「成長ステージ」が上がってゆくにつれて行動及び動作として表現できる欲求の数（行動生成に使用する欲求の数）が増加してゆくようになされ、これにより行動の

「成長」に伴って本能も「成長」させ得るようになされている。

( 3 - 4 ) 本実施の形態の動作及ぴ効果

以上の構成において、このぺットロボット 1 1 0では、初期時には 6つの情動及び 4つの欲求のうちの一部の情動及び欲求だけを行動として表現でき、この後「成長ステージ」が上がるにつれて表現できる情動及び欲求の数が増加してゆく従ってこのぺットロボット 1 1 0では、行動の「成長」に伴って感情及び本能も「成長」するため、「成長」をより生物的かつ自然に表現することができ、またユーザがその過程を楽しむことができる。

さらにこのペットロボット 1 1 0では、感情 ·本能モデルが最初は単純な 2つの情動及び 1つの欲求から始まるためユーザにぺットロボット 1 1 0の行動を把握し易くすることができると共に、この後ユーザがこの感情 ·本能モデルに慣れたころに少しずつ感情 ·本能モデルが複雑になってゆくため、各「成長ステージ」での感情 ·本能モデルに対する理解や適応を容易化させることができる。

以上の構成によれば、初期時には 6つの情動及び 4つの欲求のうちの一部の情動及び欲求のみを行動として表現できるようにしておき、この後「成長ステージ」が上がるにつれて表現できる情動及び欲求の数を増加させるようにしたことにより、「成長」をより生物的かつ自然に表現することができ、かくしてエンターティメント性を向上させ得るぺットロボットを実現できる。

( 3 - 5 ) 他の実施の形態

なお上述の第 3の実施の形態においては、本発明を 4足歩行型のぺットロボット 1 1 0に適用するようにした場合について述べたが、本発明はこれに限らず、例えば 2足歩行型のロボットゃ、これ以外のこの他種々のロボット装置に広く適用することができる。

また上述の第 3の実施の形態においては、行動生成に使用する情動及び又は欲求の数を、段階的に増加させるように制限する制限手段として感情モデル 1 8 3 及び本能モデル 1 8 4を適用するようにした場合について述べたが、本発明はこれに限らず、例えば行動モデルライブラリ 1 8 0や学習モジュール 1 8 2において行動生成に使用する情動及び又は欲求の数を、段階的に増加させるように制限するようにしても良い。

さらに上述の第 3の実施の形態においては、外部から与えられる所定の刺激（例えば「叩く」や「撫でる」など）及び経過時間に基づいて、行動生成に使用する情動及び又は欲求の数を段階的に増加させるように制.限するようにした場合について述べたが、本発明はこれに限らず、これに加えて又はこれに代えてこれ以外の条件（例えば目的とする行動をうまく行えたなど）に基づいて行動生成に使用する情動及び又は欲求の数を段階的に増加させるように制限するようにしても良い。

さらに上述の第 3の実施の形態においては、行動の「成長」に合わせて「誕生期」、「幼年期」、「少年期」、「青年期」及び「成人期」の 5段階で情動及び欲求の数を増加させてゆくようにした場合について述べたが、本発明はこれに限らず、これ以外の「成長ステージ」を設けるようにしても良い。

さらに上述の第 3の実施の形態においては、情動及び欲求の各パラメータ値並びに行動モデル 1 8 〜 1 8 0 _Π に基づいて行動を生成する行動生成手段としての行動ライブラリ 1 8 0に複数の行動モデル 1 8 〜 1 8 Ο _η を設けるようした場合について述べたが、本発明はこれに限らず、 1つの行動モデルによって行動を生成するようにしても良く、行動生成手段の構成としては、この他種々の構成を広く適用することかできる。

さらに上述の第 3の実施の形態においては、所定の刺激（例えば「叩く」や「撫でる」）の累積及び時間経過に基づいて行動モデル 1 8 O _k(1)〜 l 8 O _k(B) (図 2 6 ) を成長レベルの高い行動モデル 1 8 0 _k(2)〜 l 8 O _k(5)に変更する行動モデル変更手段を、学習モジュール 1 8 2及び行動モデルライブラリ 1 8 0により構成するようにした場合について述べたが、本発明はこれに限らず、この他種々の構成を広く適用することができる。

さらに上述の第 3の実施の形態においては、情動として「喜び」、「悲しみ」、「怒り」、「驚き」、「嫌悪」及び「恐れ」の 6つの情動を設けると共に、欲求として「運動欲」、「愛情欲」、「食欲」及び「好奇心」の 4つの欲求を設けるようにした場合について述べたが、本発明はこれに限らず、情動及び欲求の数及び種類としては、この他種々の数及び種類を広く適用することができる。

( 4 ) 第 4の実施の形態

( 4— 1 ) 第 4の実施の形態によるぺットロボット 2 0 5の構成

図 1 8においては、 2 0 5は全体として第 4の実施の形態によるぺットロボットを示し、周囲の状況やユーザからの働きかけなどに応じて欲求及び情動の感度を変化させる点を除いて第 3の実施の形態によるぺットロポット 1 1 0と同様に構成されている。

すなわち第 3の実施の形態のぺットロボット 1 1 0においては、上述のように感情や本能を更新する際に（4 ) 式や（5 ) 式を用いるようになされているが、このときの更新に影響を与える外部入力（各種センサからのセンサデータや、画像データ及び音声データなど）はぺットロボット 1 1 0がいる環境やユーザの接し方に大きく依存する。

例えばユーザが頻繁に「叩く」が滅多に「撫でる」ことをしない場合、このぺットロボット 1 1 0はほとんどの時間は「叩かれた」ことで「怒り」の感情が増幅された状態にあり、たまに「撫でられた」くらいでは「喜び」の感情が行動や動作として表現されない。従ってこのような状況におかれたぺットロボット 1 1 0については、「怒り」の感度よりも「喜び」の感度を上げるようにして、行動や動作として表現される感情の数及び種類が偏らないように調整する必要があるそこでこの第 4の実施の形態によるぺットロボット 20 5においては、長い時間に渡って各情動及び各欲求のパラメータ値をそれぞれ別々に積算すると共に、これら積算値をパラメータ間で比較し、その積算値が全体に占める割合が極端に大きい場合や小さい場合にはその情動又は欲求の感度を下げ又は上げることにより、環境やユーザの接し方に適応して全ての情動及び欲求をまんべんなく行動や動作として表現させ得るようになされている。

実際上、ペットロボット 20 5においては、図 2 2に示すアプリケ一ション . レイヤ 20 6の感情モデル 20 7が所定周期 ΔΤ' (例えば 1〜2分）ごとに、そのときのその情動のパラメータ値を E_k ( t ) ' 、最後に電源が投入されてからそのときまでのその感情のパラメータ値の積算値を E_k ' 、最後に電源が投入されてからそのときまでの経過時間を T_all ' として、次式

E_k " =E_k ' +E_k ( t ΧΔΤ' (7)

T_all " =T_all ' +ΔΤ' (8) により、最後に電源が投入されてからの各情動それぞれについてのパラメータ値の積算値 E_k " と、最後に電源が投入されてからの経過時間 T_all " とを順次算出する。

また感情モデル 20 7は、ペットロボット 20 5の電源投入の停止時（システムシャツトダウン時）にはこれら各情動の積算値 E_k 〃及び経過時間の積算値 T _all 〃を、それぞれ予め用意されたファイル（以下、これを情動総合積算値ファィル）に保存されている各情動ごとの総合積算値 E_k(t。_tal)のうちの対応する総合積算値 E_k(t。_tal)又は経過時間の総合積算値 T_alKt。_tal)にそれぞれ積算してこれらを保存する。

そして感情モデル 20 7は、ペットロボット 20 5の電源が投入される度に情動総合積算値ファイルから経過時間の総合積算値 T_all(t。_tal)を読み出し、当該総合積算値 T_all(t。_tal)が予め設定された閾値（例えば 1 0時間）を越えていた場合には情動総合積算値フアイルに保存されている各情動の総合積算値 E _k(t。_tal)に対して評価を行う。具体的にこの評価は、各情動の総合積算値 E_k(t。_tal)の合計値（Σ Ε _k(total) ) に占めるその情動の総合積算値 E _k(total)の割合を算出することにより行われる。

そして感情モデル 2 0 7は、ある情動の総合積算値 E_k(t。_tal)の割合がその情動に対して予め設定された閾値よりも低い場合には、図 2 8 (A) 〜（E) について上述した感情パラメータファイル 2 00 A〜 200 Eのうちの対応する「成長ステージ」の感情パラメータファイル 200 A〜 200 Eに記述されているその情動の係数 k。 ' の値を所定量（例えば 0. 1 ) だけ上げ、低い場合にはこの係数 k_e ' の値を所定量（例えば 0. 1 ) だけ下げる。このようにして感情モデル 20 7は、その情動の感度を表す係数 k_e ' を調整する。

なお閾値は、個々のペット口ポット 20 5の個性を損なわないように、各情動ごとにある程度の幅をもたせて設定することができ、この実施の形態においては、例えば「喜び」の情動については各情動の総合積算値 E_k(t。_tal)の合計値（Σ Ε _k(total)) に対して 1 0 〔％〕〜50 〔％〕、「悲しみ」については 5 〔％〕〜 20 〔％〕、「怒り」については 1 0 〔％〕〜6 0 〔％〕のように設定されている。さらに感情モデル 20 7は、全ての情動について同様の処理をし終えると、情動総合積算値ファイルに保存された各情動の総合積算値 E_k(t。_tal)及び経過時間の総合積算値 T_all(t。_tal)を全て「0」に戻し、この後は新しく決定した各情動ごとの係数 k_e を用いて（4) 式に従って各情動のパラメータ値を変化させる一方、（ 7) 式に従って新たに各情動のパラメータ値の積算や経過時間の積算を開始し、この後は上述と同様の処理を繰り返す。

このようにしてこのぺットロボット 2 0 5においては、各情動の感度を変化させるようになされ、これにより環境やユーザの接し方に適応して全ての情動をまんべんなく行動や動作として表現できるようになされている。

これと同様にして、本能モデル 2 0 8 (図 2 2 ) は、所定周期 Δ Τ ' (例えば：!〜 2分）ごとに、そのときのその欲求のパラメータ値を I _k ( t ) ' 、最後に電源が投入されてからそのときまでのその欲求のパラメータ値の積算値を I _k ' として、次式

I _k " = I _k ' + I _k ( t X Δ Τ ' ( 9 ) により、最後に電源が投入されてからの各欲求それぞれについてのパラメータ値の積算値 I _k " を順次算出すると共に、最後に電源が投入されてからの経過時間の積算値 T _all 〃を（8 ) 式により順次算出する。

また本能モデル 2 0 8は、ペットロボット 2 0 5の電源投入の停止時にはこれら各欲求の積算値 I _k " 及び経過時間の積算値 T _all " を、それぞれ予め用意されたファイル（以下、これを欲求積算用ファイル）に保存されている各欲求ごとの総合積算値 I _k(t。_tal)のうちの対応する総合積算値 I _k(t。_tal)又は経過時間の総合積算値 T _alut。_tal)にそれぞれ積算してこれらを保存する。

そして本能モデル 2 0 8は、ぺットロボット 2 0 5の電源が投入される度に欲求総合積算値ファイルから経過時間の総合積算値 T _all(t。_tal)を読み出し、当該総合積算値 T _all(t。_tal)が予め設定された閾値（例えば 1 0時間）を越えていた場合には欲求総合積算値ファイルに保存されている各欲求の総合積算値 I _k(t。_tal)に対して評価を行う。具体的にこの評価は、各欲求の総合積算値 I _k(t。_tal)の合計値（Σ Ι _k(total)) に占めるその欲求の総合積算値 I _k(t。_tal)の割合を算出することにより行われる。

そして本能モデル 2 0 8は、ある欲求の総合積算値 I _k(t。_tal)の割合がその欲求に対して予め設定された閾値よりも低い場合には、図 3 0 (A) 〜（E) について上述した欲求パラメータファイル 2 0 1 A〜20 1 Eのうちの対応する「成長ステージ」の欲求パラメータファイル 20 1 A〜20 1 Eに記述されているその欲求の係数 ki ' の値を所定量（例えば 0. 1 ) だけ上げ、低い場合にはこの係数 ' の値を所定量（例えば 0. 1 ) 下げる。なおこのときの閾値も、上述と同様にして各欲求ごとにある程度の幅をもたせて設定されている。

さらに本能モデル 20 8は、全ての欲求について同様の処理をし終えると、欲求総合積算値ファイルに保存された各欲求の総合積算値 I _k(t。_tal)及び経過時間の総合積算値 T_all(t。_tal)を全て「0」に戻し、この後は新しく決定した各欲求ごとの係数 1^ ' を用いて（5) 式に従って各欲求のパラメータ値を変化させる一方、

(9) 式に従って新たに各欲求のパラメータ値の積算や経過時間の積算を開始し、この後は上述と同様の処理を繰り返す。

このようにしてこのぺットロボット 20 5においては、各欲求の感度を変化させるようになされ、これにより環境やユーザの接し方に適応して全ての欲求をまんべんなく行動や動作として表現できるようになされている。

(4 - 2) 本実施の形態の動作及び効果

以上の構成において、このぺットロボット 20 5では、各情動及び欲求のパラメータ値をそれぞれ順次積算すると共に、この積算結果に基づいて各情動及び欲求の感度を所定周期 ΔΤ' で変化させる。

従ってこのぺットロボット 20 5では、環境やユーザの接し方に適応して全ての欲求をまんべんなく行動や動作として表現でき、その分第 3の実施の形態のぺットロボット 1 1 0に比べてより一層アミーズメント性を向上させることができる。

以上の構成によれば、各情動及び欲求のパラメータ値をそれぞれ順次積算すると共に、この積算結果に基づいて各情動及び欲求の感度を所定周期 ΔΤ' で変化させるようにしたことにより、環境やユーザの接し方に適応して全ての欲求をまんべんなく行動や動作として表現し得るようにすることができ、かくしてより一層アミーズメント性を向上させ得るぺットロボットを実現できる。

( 4 - 3 ) 他の実施の形態

なお上述の第 4の実施の形態においては、本発明を 4足歩行型のぺットロボット 2 0 5に適用するようにした場合について述べたが、本発明はこれに限らず、例えば 2足歩行型のロボットゃ、これ以外のこの他種々のロボット装置に広く適用することができる。

また上述の第 4の実施の形態においては、行動生成に使用する情動及び又は欲求の数を、段階的に増加させるように制限する制限手段として感情モデル 2 0 7 及び本能モデル 2 0 8を適用するようにした場合について述べたが、本発明はこれに限らず、例えば行動モデルライブラリ 1 8 0や学習モジュール 1 8 2において行動生成に使用する情動及ぴ又は欲求の数を、段階的に増加させるように制限するようにしても良い。

さらに上述の第 4の実施の形態においては、外部から与えられる所定の刺激（例えば「叩く」や「撫でる」など）及び経過時間に基づいて、行動生成に使用する情動及び又は欲求の数を段階的に増加させるように制限するようにした場合について述べたが、本発明はこれに限らず、これに加えて又はこれに代えてこれ以外の条件（例えば目的とする行動をうまく行えたなど）に基づいて行動生成に使用する情動及び又は欲求の数を段階的に増加させるように制限するようにしても良い。

さらに上述の第 4の実施の形態においては、図 2 9 ( A ) や（B ) に示すような順番で情動及び欲求を増加させてゆくようにした場合について述べたが、本発明はこれに限らず、これ以外の順番で情動及び又は欲求を増加させてゆくようにしても良い。

さらに上述の第 4の実施の形態においては、行動の「成長」に合わせて「誕生期」、「幼年期」、「少年期」、「青年期」及び「成人期」の 5段階で情動及び欲求の数を増加させてゆくようにした場合について述べたが、本発明はこれに限らず、これ以外の「成長ステージ」を設けるようにしても良い。さらに上述の第 4の実施の形態においては、行動生成に使用する情動及び欲求の数が順次増加してゆく場合について述べたが、本発明はこれに限らず、始めから又は途中から行動生成に使用する情動及び欲求の数を減少させてゆく（例えば「成人期」のあとに「老年期」などの「成長ステージ」を設けて「成長ステージ」が「老年期」に移行する際には感情や欲求を減少させるなど）ようにしても良レ、。

さらに上述の第 4の実施の形態においては、情動及び欲求の各パラメータ値並びに行動モデル 1 8 〜 1 8 O _n に基づいて行動を生成する行動生成手段としての行動ライブラリ 1 8 0に複数の行動モデル 1 8 0 i 〜 1 8 O _n を設けるようした場合について述べたが、本発明はこれに限らず、 1つの行動モデルによって行動を生成するようにしても良く、行動生成手段の構成としては、この他種々の構成を広く適用することかできる。

さらに上述の第 4の実施の形態においては、所定の刺激（例えば「叩く」や Γ 撫でる」）の累積及び時間経過に基づいて行動モデル 1 8 O _k(1)〜 l 8 O _k(5) (図 2 6 ) を成長レベルの高い行動モデル 1 8 O _k(2)~ 1 8 O _k(5)に変更する行動モデル変更手段を、学習モジュール 1 8 2及び行動モデルライブラリ 1 8 0により構成するようにした場合について述べたが、本発明はこれに限らず、この他種々の構成を広く適用することができる。

さらに上述の第 4の実施の形態においては、情動として「喜び」、「悲しみ」、 Γ 怒り」、「驚き」、「嫌悪」及び「恐れ」の 6つの情動を設けると共に、欲求として「運動欲」、「愛情欲」、「食欲」及び「好奇心」の 4つの欲求を設けるようにした場合について述べたが、本発明はこれに限らず、情動及ぴ欲求の数及び種類としては、この他種々の数及び種類を広く適用することができる。

さらに上述の第 4の実施の形態においては、情動及び又は欲求更新手段としての感情モデル 2 0 7及び本能モデル 2 0 8が、外部から与えられる刺激及び経過時間に基づいて各情動及び各欲求のパラメータ値を更新するようにした場合について述べたが、本発明はこれに限らず、これ以外の条件に基づいて各情動及び各欲求のパラメータ値を更新するようにしても良い。

さらに上述の第 4の実施の形態においては、感度変更手段としての感情モデル 2 0 7及び本能モデル 2 0 8が各情動又は各欲求に対する感度をそれぞれ更新する手法として、（4 ) 式又は（9 ) 式の計数 k _e ' 、 k i ' の値を変更するようにした場合について述べたが、本発明はこれに限らず、これ以外の手法により各情動及び各欲求に対する感度をそれぞれ更新するようにしても良い。

さらに上述の第 4の実施の形態においては、環境を評価する手法として、順次更新されるその情動又は欲求のパラメータ値の総合積算値 E _k(total)、 I _k(total)が全情動又は全欲求のパラメータ値の総合積算値 E _k(t。_tal)、 I _k(t。_tal)の合計値（Σ Ε _k(total), ∑ I _k(total)) に占める割合に基づいて評価するようにした場合について述ベたが、本発明はこれに限らず、例えば「叩かれた」や「撫でられた」などの特定の外部刺激の回数や頻度に基づいて環境を評価するようにしても良く、環境を評価する手法としては、この他種々の手法を広く適用することができる。

( 5 ) 第 5の実施の形態

次に第 5の実施の形態について図面を用いて詳しく説明する。本発明は、四足動物のように動作するぺット口ボットに適用することができる。

ペットロボットは、図 3 1に示すように、他のぺットロボットの出力を検知する検知手段 2 1 5と、検知手段 2 1 5の検知結果に基づいて、他のぺットロボッ卜の性格を判別する性格判別手段 2 1 6と、性格判別手段 2 1 6の判別結果に基づいて、性格を変化させる性格変化手殳 2 1 7とを備えている。

これにより、ペットロボットは、検知手段 2 1 5が検知した他のペットロボットの出力の検知結果に基づいて、他のロボット装置の性格を性格判別手段 2 1 6 により判別する。そして、ペットロボットは、そのような他のペットロボットの性格の判別結果に基づいて、性格変化手段 2 1 7により自己の性格を変化させることができる。

詳しくは後述するが、検知手段 2 1 5による検知は、他のペットロボットの行動に表出された感情の検知等であり、性格変化手段 2 1 7による性格の変化は、感情に起因した自己の行動を決定する感情モデルのパラメータの変更等によるものである。

このようにぺットロボットは、他のぺットロボットの行動等に基づいて自己の性格を変化させることができる。

これにより、ペットロボットは、本物のぺットと同じように、性格が形成され、その性格に基づいて動作することができるようになる。

以下、本発明が適用されているぺットロボットの具体的な構成について説明する。

(5— 1 ) ペットロボット 2 1 0の構成

図 3 2に示すように、ペットロボット 2 1 0は全体が構成されており、頭に相当する頭部 2 1 1 と、胴体に相当する本体部 2 1 2と、足に相当する足部 2 1 3 A〜 2 1 3 Dと、尻尾に相当する尻尾部 2 1 4とを連結することによって構成され、本体部 2 1 2に対して頭部 2 1 1、足部 2 1 3 A〜 2 1 3 D、尻尾部 2 1 4 を動かすことによって本物の四足動物のように動作させるようになされている。頭部 2 1 1には、目に相当し、画像を撮像する例えば CCD (C h a r g e C o u p 1 e d D e v i c e ) カメラでなる画像認識部 2 2 0と、耳に相当し、音声を集音するマイク 2 1 1 と、口に相当し、音声を発するスピーカ 2 2 2とがそれぞれ所定位置に取り付けられている。また、頭部 2 1 1には、ユーザからリモートコントローラ（図示せず）を介して送信される指令を受信するリモートコントローラ受信部 ₂ 2 3と、ユーザの手などが接触されたことを検出するためのタツチセンサ 2 24と、内部で生成された画像を表示するための画像表示部 2 2 5とが取り付けられている。

本体部 2 1 2には、腹に相当する位置にバッテリ 23 1が取り付けられると共に、その内部にぺットロボット 2 1 0全体の動作を制御するための電子回路（図示せず）等が収納されている。

足部 2 1 3 A〜 2 1 3 Dの関節部分、足部 2 1 3 A〜 2 1 3 Dと本体部 2 1 2 の連結部分、本体部 2 1 2と頭部 2 1 1の連結部分、本体部 2 1 2と尻尾部 2 1 4の連結部分などは、それぞれのァクチユエータ 23 3 A〜2 3 3 Nによって連結されており、本体部 2 1 2内部に収納される電子回路の制御に基づいて駆動するようになされている。このようにペットロボット 2 1 0は、各ァクチユエータ

2 3 3 A〜2 3 3 Nを駆動させることにより、頭部 2 1 2を上下左右に振らせたり、尻尾部 2 1 4を振らせたり、足部 2 1 3 A〜 2 1 3 Dを動かして歩かせたり走らせたりして、本物の四足動物のような動作を行わせる。

( 5 - 2 ) ペットロボット 2 1 0の回路構成

ここで図 3 3を用いてぺットロボット 2 1 0の回路構成について説明する。頭部 2 1 2は、マイク 2 2 1及ぴリモートコントローラ受信部 2 23でなるコマンド受信部 240と、画像認識部 2 20及びタツチセンサ 2 24からなる外部センサ 24 1 と、スピーカ 2 2 2と、画像表示部 2 2 5とを有している。また、本体部 2 1 2は、バッテリ 2 3 1を有すると共に、その内部にぺットロボット 2 1 0 全体の動作を制御するためのコントローラ 24 2と、バッテリ 2 3 1の残量を検出するためのバッテリセンサ 24 3及びぺットロボット 2 1 0内部で発生する熱を検出する熱センサ 244でなる内部センサ 24 5とを有している。さらにぺットロボット 2 1 0の所定位置にはァクチユエータ 2 3 3 A〜2 3 3 Nがそれぞれ設けられている。

コマンド受信部 240は、ユーザからぺットロポット 2 1 0に与えられる指令、例えば「歩け」、「伏せ」、「ポールを追いかけろ」等の指令を受信するためのものであり、リモートコントローラ受信部 2 2 3及びマイク 2 2 1によって構成されている。リモートコントローラ（図示せず）は、ユーザの操作によって所望の指令が入力されると、当該入力された指令に応じた赤外線光をリモートコント口ーラ受信部 2 23に送信する。リモートコントローラ受信部 2 23は、この赤外線光を受信して受信信号 S 1 Aを生成し、これをコントローラ 24 2に送出する。マイク 2 2 1は、ユーザが所望の指令に応じた音声を発すると、当該ユーザの発した音声を集音して音声信号 S 1 Bを生成し、これをコントローラ 24 2に送出する。このようにコマンド受信部 240は、ユーザからぺットロボット 2 1 0 に与えられる指令に応じて受信信号 S 1 A及び音声信号 S 1 Bでなる指令信号 S 1を生成し、これをコントローラ 2 4 2に供給する。

外部センサ 2 4 1のタツチセンサ 2 2 4は、ユーザからぺットロボット 2 1 0 への働きかけ、例えば「なでる」、「たたく」等の働きかけを検出するためのものであり、ユーザが当該タツチセンサ 2 2 4を触れることによって所望の働きかけを行うと、当該働きかけに応じた接触検出信号 S 2 Aを生成し、これをコント口ーラ 2 4 2に送出する。

外部センサ 2 4 1の画像認識部 2 2 0は、ペットロボット 2 1 0の周囲の環境を識別した結果、例えば「暗い」、「お気に入りのおもちやがある」等の周囲の環境情報又は例えば「他のぺットロボットが走っている」等の他のぺットロボットの動きを検出するためのものであり、当該ぺットロボット 2 1 0の周囲の画像を撮影し、その結果得られる画像信号 S 2 Bをコントローラ 2 4 2に送出する。この画像認識部 2 2 0にて、他のぺットロポットによる感情を表出した行動が捕らえられる。

このように外部センサ 2 4 1は、ペットロボット 2 1 0の外部から与えられる外部情報に応じて接触検出信号 S 2 A及び画像信号 S 2 Bでなる外部情報信号 S 2を生成し、これをコントローラ 2 4 2に送出する。

内部センサ 2 4 5は、ペットロボット 2 1 0自身の内部状態、例えばバッテリ容量が低下したを意味する「お腹がすいた」、「熱がある」等の内部状態を検出するためのものであり、バッテリセンサ 2 4 3及び熱センサ 2 4 4から構成されている。

バッテリセンサ 2 4 3は、ペットロボット 2 1 0の各回路に電源を供給するバッテリ 2 3 1の残量を検出するためのものであり、その検出した結果であるバッテリ容量検出信号 S 3 Aをコントローラ 2 4 2に送出する。熱センサ 2 4 4は、ペットロボット 2 1 0内部の熱を検出するためのものであり、その結果した結果である熱検出信号 S 3 Bをコントローラ 2 4 2に送出する。このように内部センサ 2 4 5は、ペットロボット 2 1 0の内部の情報に応じてバッテリ容量検出信号 S 3 A及び熱検出信号 S 3 Bでなる内部情報信号 S 3を生成し、これをコントローラ 2 4 2に送出する。

コントローラ 2 4 2は、コマンド受信部 2 4 0から供給される指令信号 S 1 と、外部センサ 2 4 1 から供給される外部情報信号 S 2と、内部センサ 2 4 5から供給される内部情報信号 S 3 とに基づいて、各ァクチユエータ 2 3 3 A〜2 3 3 Nを駆動させるための制御信号 S 5 A〜S 5 Nを生成し、これらをァクチユエ一タ 2 3 3 A〜 2 3 3 Nにそれぞれ送出して駆動させることによりぺットロボット

2 1 0を動作させる。

その際コントローラ 2 4 2は、外部に出力するための音声信号 S 1 0や画像信号 S 1 1を必要に応じて生成し、このうち音声信号 S 1 0をスピーカ 2 2 2を介して外部に出力したり、画像信号 S 1 1を画像表示部 2 2 5に送出して所望の画像を表示させたりすることにより、ユーザに必要な情報を知らせるようになされている。

( 5— 3 ) コントローラ 2 4 2におけるデータ処理

ここでコントローラ 2 4 2におけるデータ処理について説明する。コント口一ラ 2 4 2は、コマンド受信部 2 4 0から供給される指令信号 S 1 と、外部センサ 2 4 1から供給される外部情報信号 S 2と、内部センサ 2 4 5から供給される内部情報信号 S 3とを、所定の記憶領域に予め格納されているプログラムに基づいてソフトウユア的にデータ処理を施し、その結果得られる制御信号 S 5をァクチユエータ 2 3 3に供給する。

図 3 4に示すように、コントローラ 2 4 2は、そのデータ処理の内容を機能的に分類すると、感情本能モデル変化手段としての感情 ·本能モデル部 2 5 0と動作状態決定手段としての行動決定機構部 2 5 1 と姿勢遷移手段としての姿勢遷移機構部 2 5 2と制御機構部 2 5 3とに分けられ、外部から供給される指令信号 S 1 と外部情報信号 S 2と内部情報信号 S 3とを感情 ·本能モデル部 2 5 0及び行動決定機構部 2 5 1に入力する。

図 3 5に示すように、感情 .本能モデル部 2 5 0は、複数の独立した感情モデルとしての情動ュニット 2 60 A〜 2 6 0 Cでなる基本情動群 2 6 0と、複数の独立した欲求モデルとしての欲求ュニット 26 1 A〜 2 6 1 Cでなる基本欲求群 2 6 1 とを有している。基本情動群 2 60のうち情動ュニット 260 Aは「うれしさ」という情動を示すものであり、情動ユニット 2 6 O Bは「悲しさ」という情動を結ぶものであり、情動ユニット 2 60 Cは「怒り」という情動を示すものである。

情報ュ-ット 260 A〜2 60 Cは、情動の度合いを例えば 0〜 1 00レベルまでの強度によってそれぞれ表し、供給される指令信号 S l、外部情報信号 S 2 及び内部情報信号 S 3に基づいて情動の強度をそれぞれ時々刻々と変化させる。かくして感情 '本能モデル部 2 50は、時々刻々と変化する情動ュニット 260 A〜 2 6 0 Cの強度を組み合わせることによりペット口ポット 2 1 0の感情の状態を表現し、感情の時間変化をモデル化している。

また、基本欲求群 2 6 1のうち欲求ュニット 26 1 Aは「食欲」という欲求を示すものであり、欲求ュニット 2 6 1 Bは「睡眠欲」という欲求を示すものであり、欲求ュニット 26 1 Cは「運動欲」という欲求を示すものである。欲求ュニット 2 6 1 A〜 26 1 Cは、情動ュニット 260 A〜260 Cと同様に、欲求の度合いを例えば 0〜 1 00レベルまでの強度によってそれぞれ表し、供給される指令信号 S 1 と外部情報信号 S 2と内部情報信号 S 3とに基づいて欲求の強度をそれぞれ時々刻々と変化させる。かくして感情 ·本能モデル群 2 5 0は、時々刻々と変化する欲求ュニット 2 6 1 A〜 2 6 1 Cの強度を組み合わせることによりペットロボット 2 1 0の本能の状態を表現し、本能の時間変化をモデル化している。

このようにして感情 ·本能モデル部 2 50は、指令信号 S 1 と外部情報信号 S 2と内部情報信号 S 3 とでなる入力情報 S 1〜S 3に基づいて情動ュニット 2 6 0 A〜 5 0 C及び欲求ュ-ット 26 1 A〜 2 6 1 Cの強度をそれぞれ変化させる。そして感情 '本能モデル部 2 50は、この変化した情動ユニット 2 6 0 A〜 2 6 0 Cの強度を組合せることにより感情の状態を決定すると共に、変化した欲求ユニット 2 6 1 A〜 2 6 1 Cの強度を組み合わせることにより本能の状態を決定し、当該決定された感情及び本能の状態を感情 ·本能状態情報 S 1 0として行動決定機構部 2 5 1に送出する。

ところで、感情 ·本能モデル部 2 5 0は、基本情動群 2 6 0のうち所望の情動ュニット同士を相互抑制的又は相互刺激的に結合し、当該結合した情動ュ-ットのうち一方の情動ュニットの強度を変化させると、これに応じて他方の情動ュニットの強度が変化することになり、自然な感情を有するぺットロボット 2 1 0を実現している。

すなわち図 3 6に示すように、感情 ·本能モデル部 2 5 0は、「うれしさ」情動ュ-ット 2 6 0 Aと「悲しさ」情動ュニット 2 6 0 Bとを相互抑制的に結合することにより、ユーザにほめてもらったときには「うれしさ」情動ユニット 2 6 0 Aの強度を大きくすると共に、その際「悲しさ」情動ュニット 2 6 0 Bの強度を変化させるような入力情報 S 1〜S 3が供給されていなくても、「うれしさ」情動ユニット 2 6 O Aの強度が大きくなることに応じて自然に「悲しさ」情動ュニット 2 6 0 Bの強度を低下させる。同様に感情 .本能モデル部 2 5 0は、「悲しさ」情動ユニット 2 6 0 Bの強度が大きくなると、当該「悲しさ」情動ュニット 2 6 0 Bの強度が大きくなることに応じて自然に「うれしさ」情動ユニット 2 6 0 Aの強度を低下させる。

また、感情 '本能モデル部 2 5 0は、「悲しさ」情動ユニット 2 6 O Bと「怒り」情動ユニット 2 6 0 Cとを相互刺激的に結合することにより、ユーザにたたかれたときには「怒り」情動ュ-ット 2 6 0 Cの強度を大きくすると共に、その際「悲しさ」情動ュ-ット 2 6 0 Bの強度を変化させるような入力情報 S 1〜S 3が供給されていなくても、「怒り」情動ユニット 2 6 0 Cの強度が大きくなることに応じて自然に「悲しさ」情動ユニット 2 6 0 Bの強度を増大させる。同様に感情 ·本能モデル部 2 5 0は、「悲しさ」情動ュ-ット 2 6 0 Bの強度が大きくなると、当該「悲しさ」情動ュ-ット 2 6 0 Bの強度が大きくなることに応じて自然に「怒り」情動ュニット 2 6 0 Cの強度を増大させる。さらに、感情 ·本能モデル部 2 5 0は、情動ュニット 2 6 0同士を結合した場合と同様に、基本欲求群 2 6 1のうち所望の欲求ュニット同士を相互抑制的又は相互刺激的に結合し、当該結合した欲求ュニットのうち一方の欲求ュニットの強度を変化させると、これに応じて他方の欲求ュニットの強度が変化することになり、自然な本能を有するぺットロボット 2 1 0を実現している。

図 3 4に戻って、感情 .本能モデル部 2 5 0は、後段の行動決定機構部 2 5 1 からペット口ポット 2 1 0自身の現在又は過去の行動、例えば「長時間歩いた」などの行動の内容を示す行動情報 S 1 2が供給されており、同一の入力情報 S 1 〜S 3が与えられても、当該行動情報 S 1 2が示すぺットロボット 2 1 0の行動に応じて異なる感情 ·本能状態情報 S 1 0を生成するようになされている。

具体的には図 3 7に示すように、感情 ·本能モデル部 2 5 0は、各情動ュニット 2 6 0 A〜 2 6 0 Cの前段に、ペットロボット 2 1 0の行動を示す行動情報 S

1 2と入力情報 S 1〜S 3 とを基に各情動ュニット 2 6 0 A〜 2 6 0 Cの強度を増減させるための強度情報 S 1 4 A〜S 1 4 Cを生成する強度増減関数 2 6 5 A 〜2 6 5 Cをそれぞれ設け、当該強度増減関数 2 6 5 A〜 2 6 5 Cから出力される強度情報 S 1 4 A〜S 1 4 Cに応じて各情動ュ-ット 2 6 0 A〜 2 6 0 Cの強度をそれぞれ増減させる。

例えば感情 ·本能モデル部 2 5 0は、ユーザに挨拶をしたときに頭をなでられれば、すなわちユーザに挨拶をしたという行動情報 S 1 2と頭をなでられたという入力情報 S 1〜S 3とが強度増減関数 2 6 5 Aに与えられると、「うれしさ」情動ュニット 2 6 0 Aの強度を増加させる一方、何らかの仕事を実行中に頭をなでられても、すなわち仕事を実行中であるという行動情報 S 1 2と頭をなでられたという入力情報 S 1 ~ S 3とが強度増減関数 2 6 5 Aに与えられても、「うれしさ」情動ュニット 2 6 0 Aの強度を変化させない。

このように感情 ·本能モデル部 2 5 0は、入力情報 S ：!〜 S 3だけでなく現在又は過去のぺットロボット 2 1 0の行動を示す行動情報 S 1 2も参照しながら各情動ュニット 2 6 0 A〜 2 6 0 Cの強度を決定することにより、例えば何らかのタスクを実行中にユーザがいたずらするつもりで頭をなでたとき、「うれしさ」情動ュニット 2 6 O Aの強度を増加させるような不自然な感情を起こさせることを回避することができる。因みに、感情 ·本能モデル部 2 5 0は、欲求ュニット 2 6 1 A〜 2 6 1 Cの場合も同様にして、供給される入力情報 S 1〜S 3及び行動情報 S 1 2に基づいて各欲求ュニット 2 6 1 A〜 2 6 1 Cの強度をそれぞれ増減させるようになされている。

以上、述べたように強度増減関数 2 6 5 A〜 2 6 5 Cは、入力情報 S 1〜S 3 及び行動情報 S 1 2が入力されると、予め設定されているパラメータに応じて強度情報 S 1 4 A〜S 1 4 Cを生成して出力するような関数であり、当該パラメ一タをぺットロボット 2 1 0毎に異なる値に設定することにより、例えば怒りつぼぃぺットロボットゃ明るい'性格のぺットロポットのように、当該ぺットロボット 2 1 0に個性をもたせることができる。

さらに、感情モデルについては、他のロボット装置（以下、相手ロボットという。）の性格に応じて、そのパラメータを変化させることもできる。すなわち、ペットロボット 2 1 0の持つ性格を、相手ロボットとの相互作用によって変化させ、いわゆる「朱に交われば赤くなる」といったような特性による性格の形成を行う。これにより、自然な性格形成がなされたペットロボット 2 1 0を実現することができる。 .

具体的には、図 3 8に示すように、感情認知機構部 2 7 1、記憶及び解析機構部 2 7 2、並びにパラメ一タ変更機構部 2 7 3を備えることにより、相手ロボット装置の性格に応じた性格形成が可能になる。

感情認知機構部 2 7 1は、相手ロボットの動作が何らかの感情表出に関するものであるかどうカまた、そうである場合には表出している感情の種類を強度を認知する。具体的には、感情認知機構部 2 7 1は、相手ロボットの行動を検知するセンサーと、センサーからのセンサ一入力に基づいて相手ロボット装置の感情を認知する感情認知部とからなり、相手ロボットの動作をセンサで捕らえ、感情認知部において、センサー入力からその相手ロボットの感情を認知する。例えば、センサー入力は、.上述した入力信号のうちの外部情報信号 S 2であって、図 3 3に示すマイク 2 2 1からの音声信号 S 1 Bであったり、図 3 3に示す画像認知部 2 2 0からの画像信号 S 2 Bであったりする。

感情の認知については、感情認知機構部 2 7 1は、センサー入力とされる、例えば、相手ロボットが発している鳴き声や、行動から、表出している感情を認知する。

具体的には、ペットロボット 2 1 0は、相手ロボットの感情に起因した動作の動作パターンを情報として持っており、この動作パターンと相手ロボットの実際の動作、例えば動作部の動きや発した音等とを比較することにより、相手ロボットの動作に表出している感情を得る。例えば、ペットロボット 2 1 0は、相手口ボットが怒っている場合の当該相手ロボットの足の動きの動作パターンを保持しており、画像認識部 2 2 0による得た相手ロボットの足の動きがそのような行動パターンと一致する場合、相手ロボットが怒っていることを検知する。

例えば、ペットロボット 2 1 0は、予め登録されている感情モデルに基づいて行動が決定されている。換言すれば、ぺットロボット 2 1 0の行動は、感情の表出の結果でもある。よって、相手ロボットも同様な感情モデルが構築されているぺットロボットであることを前提とすれば、ぺットロボット 2 1 0は、相手ロボットの動作パターンから相手ロボットの行動がどのような感情を表出した結果かを把握することができる。このように自己の保持している行動情報と相手ロボッ卜の動作情報とを比較すれば、相手ロボットの感情を容易に把握することができるようになる。

このような感情に認知により、例えば、怒っている歩き方や怒っている目が行動が検知された場合に、相手ロボットが怒っている認知することができるようになる。

感情認知機構部 2 7 1は、このようにして認知した相手ロボットの表出している感情の情報を、記憶及び解析機構部 2 7 2に送る。

記憶及び解析機構部 2 7 2は、感情認知機構部 2 7 1から送られてきた情報に基づいて、相手ロボットの性格、例えば、怒りつぼいと力、悲観的であるとかを判断する。具体的には、記憶及び解析機構部 2 7 2は、感情認知機構部 2 7 1から送られてきた情報を記憶しておき、ある程度の時間内の情報の変化に基づいて相手ロボットの性格を解析する。

具体的には、記憶及び解析機構部 2 7 2は、図示しないデータ記憶部に記憶された情報の内のある時間内における情報を取り出して、感情の表出割合を解析する。例えば、図 3 9に示すような割合で「怒り」についての感情の情報を得ていた場合、記憶及び解析機構部 2 7 2は、相手ロボットが怒りつぼい性格であると判断する。

記憶及び解析機構部 2 7 2は、上述のようにして取得した相手ロボットの性格の情報を、感情パラメータ変更機構部 2 7 3に送る。

感情パラメータ変更機構部 ₂ 7 3は、感情モデル（具体的には、感情 .本能モデル部である。） 2 5 0のパラメータを変化させる。すなわち、「怒り」や「悲しさ」等の感情に関する情動ュニッ卜のパラメータを変更する。

また、感情に関するパラメータとして、上述した強度増減関数 2 6 5 A〜 2 6 5 Cのパラメータを変更してもよい。この場合、強度増減関数 2 6 5 A〜 2 6 5 Cの変更されたパラメータに応じて、入力情報 S ：!〜 S 3及び行動情報 S 1 2から強度情報 S 1 4 A〜S 1 4 Cが生成されるので、例えば、おこりつぼくしたり明るい性格としたりすることができる。

感情モデル部 2 5 0は、入力情報 S 1〜S 3や行動情報 S 1 2であるセンサ入力が入力されており、そのように感情パラメータ変更機構部 2 7 3により変更されたパラメータ（強度）に応じた感情値とされる感情状態情報 S 1 0 aを決定行動機構部 2 5 1に出力する。そして、後段の行動決定機構部 2 5 1がこの感情値 (感情状態情報 S 1 0 a ) に基づいてぺットロボット 2 1 0の行動を決定することで、行動を介して性格を表出させる。

このように、ペットロボット 2 1 0は、相手ロボットの性格に応じて、感情モデルのパラメータ（強度）を変化させ、自然な性格形成が実現されている。すなわち、例えば、怒りつぼい他のペットロボットに接していると、自分自身の怒り安さパラメータを増加させて、自分も起こりつぼくなつたりする。

図 3 4に戻って、行動決定機構部 2 5 1は、指令信号 S 1 と外部情報信号 S 2 と内部情報信号 S 3 と感情 ·本能状態情報 S 1 0と行動情報 S 1 2とでなる入力情報 S 1 4に基づいて次の行動を決定し、当該決定された行動の内容を行動指令情報 S 1 6として姿勢遷移機構部 2 5 2に送出する。

具体的には図 4 0に示すように、行動決定機構部 2 5 1は、過去に供給された入力情報 S 1 4の履歴を動作状態（以下、ステートという。）で表し、現在供給された入力情報 S 1 4とそのときのステートとに基づいて当該ステ一トを別のステートに遷移させることにより、次の行動を決定するような有限個のステートを有する有限ォートマトン 2 6 7と呼ばれるアルゴリズムを用いている。このように行動決定機構部 2 5 1は、入力情報 S 1 4が供給される毎にステートを遷移させ、当該遷移したステートに応じて行動を決定することにより、現在の入力情報 S 1 4だけでなく過去の入力情報 S 1 4も参照して行動を決定している。

従って、例えば「ボールを追いかけている」というステート S T 1において、「ボールが見えなくなった」という入力情報 S 1 4が供給されると、「立っている」というステート S T 5に遷移する一方、「寝ている」というステート S T 2 において、「起きろ」という入力情報 S 1 4が供給されると、「立っている」というステート S T 4に遷移する。このようにこれらステート S T 4及びステート S T 5は、行動は同一であっても過去の入力情報 S 1 4の履歴が異なっていることから、ステートも異なっていることが分かる。

実際上、行動決定機構部 2 5 1は、所定のトリガーがあったことを検出すると、現在のステートを次のステートに遷移させる。トリガーの具体例としては、例えば現在のステートの行動を実行している時間が一定値に達した、又は特定の入力情報 S 1 4が入力された、又は感情 ·本能モデル部 2 5◦から供給される感情 •本能状態情報 S 1 0が示す情動ュ-ット 2 6 0 A〜 2 6 0 C及び欲求ュニット 2 6 1 A〜 2 6 1 Cの強度のうち、所望のュ-ットの強度が所定の閾値を超えたこと等が挙げられる。

その際、行動決定機構部 2 5 1は、感情 ·本能モデル部 2 5 0から供給された感情 ·本能状態情報 S 1 0が示す情動ュニット 2 6 0 A〜 2 6 0 C及び欲求ュ- ット 2 6 1 A〜 2 6 1 Cの強度のうち、所望のュ-ットの強度が所定の閾値を超えているか否かに基づいて遷移先のステートを選択する。これにより行動決定機構部 2 5 1は、例えば同一の指令信号 S 1が入力されても、情動ユニット 2 6 0 A〜 2 6 0 C及び欲求ュニット 2 6 1 A〜 2 6 1 Cの強度に応じて異なるステートに遷移するようになされている。

従って行動決定機構部 2 5 1は、供給される外部情報信号 S 2を基に例えば目の前に手のひらが差し出されたことを検出し、かつ感情 ·本能状態情報 S 1 0を基に「怒り」情動ユニット 2 6 0 Cの強度が所定の閾値以下であることを検出し、かつ内部情報信号 S 3を基に「お腹がすいていない」、すなわち電池電圧が所定の閾値以上であることを検出すると、目の前に手のひらが差し出されたことに応じて「おて」の動作を行わせるための行動指令情報 S 1 6を生成し、これを姿勢遷移機構部 2 5 2に送出する。

また、行動決定機構部 2 5 1は、例えば目の前に手のひらが差し出され、かつ「怒り」情動ユニット 2 6 0 Cの強度が所定の閾値以下であり、かつ「お腹がすいている」すなわち電池電圧が所定の閾値未満であることを検出すると、「手のひらをぺろぺろなめる」ような動作を行わせるための行動指令情報 S 1 6を生成し、これを姿勢遷移機構部 2 5 2に送出する。

また、行動決定機構部 2 5 1は、例えば目の前に手のひらが差し出され、かつ「怒り」情動ュニット 2 6 0 Cの強度が所定の閾値以上であることを検出すると、「お腹がすいていない」すなわち電池電圧が所定の閾値以上であるか否かにかかわらず、「ぶいと横を向く」ような動作を行わせるための行動指令情報 S 1 6 を生成する。例えば、相手ロボットに応じて、感情モデルのパラメータ（情動ュニットの強度）を変化させている場合においては、一緒にいる相手ロボットが怒りっぽい性格であるときには、ペットロボット 2 1 0は、感情モデルの強度が所定の閾値以上になる場合が多くなり、そのような「ぶいと横を向く」といった動作を頻出するようになる。

ところで、行動決定機構部 2 5 1は、感情 ·本能モデル部 2 5 0から供給された感情 ·本能状態情報 S 1 0が示す情動ュニット 2 6 0 A〜 2 6 0 C及び欲求ュニット 2 6 1 A〜 2 6 1 Cの強度のうち所望のュ-ットの強度に基づいて、遷移先のステートで行われる行動のパラメータ、例えば歩行の速度、手足を動かす際の動きの大きさや速度、音を出す際の音の高さや大きさなどを決定し、当該行動のパラメータに応じた行動指令情報 S 1 6を生成して姿勢遷移機構部 2 5 2に送出するようになされている。

因みに、指令信号 S 1 と外部情報信号 S 2と内部情報信号 S 3とでなる人力情報 S 1〜 S 3は、感情 ·本能モデル部 2 5 0及び行動決定機構部 2 5 1に入力されるタイミングに応じて情報の内容が異なるため、感情 ·本能モデル部 2 5 0と共に行動決定機構部 2 5 1にも入力されるようになされている。

例えばコントローラ 2 4 2は、「頭をなでられた」という外部情報信号 S 2が供給されると、感情 ·本能モデル部2 5 0にょって「うれしい」という感情 '本能状態情報 S 1 0を生成し、当該感情 ·本能状態情報 S 1 0を行動決定機構部 2 5 1に供給するが、この状態において、「手が目の前にある」という外部情報信号 S 2が供給されると、行動決定機構部 2 5 1において上述の「うれしい」という感情 ·本能状態情報 S 1 0と「手が目の前にある」という外部情報信号 S 2とに基づいて「喜んでおてをする」という行動指令情報 S 1 6を生成させ、これを姿勢遷移機構部 2 5 2に送出させるようになされている。

図 3 4に戻って、姿勢遷移機構部 2 5 2は、行動決定機構部 2 5 1から供給される行動指令情報 S 1 6に基づいて現在の姿勢から次の姿勢に遷移させるための姿勢繊維情報 S 1 8を生成し、これを制御機構部 2 5 3に送出する。この場合、現在の姿勢から次に遷移可能な姿勢は、例えば胴体や手や足の形状、重さ、各部の結合状態のようなぺットロボット 2 1 0の物理的形状と、例えば関節が曲がる方向や角度のようなァクチユエータ 2 3 3 A〜2 3 3 Nの機構とによって決定される。

ところでこのような遷移可能な姿勢は、現在の姿勢から直接遷移可能な姿勢と直接には遷移できない姿勢とに分類される。例えば 4本足のぺットロボット 2 1 0は、手足を大きく投げ出して寝転んでいる状態から伏せた状態へ直接遷移することはできるが、立った状態へ直接遷移することはできず、一旦手足を胴体近くに引き寄せて伏せた姿勢になり、それから立ち上がるという 2段階の動作が必要である。また安全に実行できない姿勢も存在する。例えば 4本足のペットロボット 2 1 0は、立っている姿勢で両前足を挙げてバンザィをしょうとすると、簡単に転倒してしまう場合である。

従って姿勢遷移機構部 2 5 2は、遷移可能な姿勢を予め登録しておき、行動決定機構部 2 5 1から供給された行動指令情報 S 1 6が直接遷移可能な姿勢を示す場合には、当該行動指令情報 S 1 6をそのまま姿勢遷移情報 S 1 8として制御機構部 2 5 3に送出する一方、直接遷移不可能な姿勢を示す場合には、遷移可能な他の姿勢に一旦遷移した後に目的の姿勢まで遷移させるような姿勢遷移情報 S 1 8を生成して制御機構部 2 5 3に送出する。これによりペットロボット 2 1 0は、遷移不可能な姿勢を無理に実行しようとする事態や転倒するような自体を回避することができる。

具体的には姿勢遷移機構部 2 5 2は、ペットロボット 2 1 0がとり得る姿勢を予め登録すると共に、遷移可能な 2つの姿勢の間を記録しておくようになされている。例えば図 4 1に示すように、姿勢遷移機構部 2 5 2は、ペットロボット 2 1 0がとり得る姿勢をノード N D i 〜N D ₅ で表すと共に、遷移可能な 2つの姿勢の間すなわちノード〜N D ₅ 間を有向アーク a i 〜 a i。で結合した有向グラフ 2 7 0と呼ばれるアルゴリズムを用いている。

姿勢遷移機構部 2 5 2は、行動決定機構部 2 5 1から行動指令情報 S 1 6が供給されると、現在の姿勢に対応したノード N D 〜N D ₅ と、行動指令情報 S 1 6が示す次に取るべき姿勢に対応するノード〜N D ₅ とを結ぶように、有向アーク a i 〜 a ₁₀の向きに従いながら現在のノード N D i 〜N D ₅ から次のノード〜ND₅ に至る経路を探索し、当該探索した経路上にあるノード ND ₁ 〜ND₅ を順番に記録することにより、姿勢遷移の計画を行うようになされている。これによりペットロボット 2 1 0は、遷移不可能な姿勢を無理に実行しようとする事態や転倒するような事態を回避しながら、行動決定機構部 2 5 1から指示された行動を実現することができる。

姿勢遷移機構部 2 5 2は、例えば現在の姿勢が「ふせる」という姿勢を示すノード ND₂ にある場合、「すわれ」という行動指令情報 S 1 6が供給されると、「ふせる」という姿勢を示すノード ND₂ から「すわる」という姿勢を示すノード ND₅ へは直接遷移可能であることを利用して、「すわれ」という姿勢遷移情報 S 1 8を制御機構部 2 5 3に与える。これに対して姿勢遷移機構部 2 5 2は、「歩け」という行動指令情報 S 1 6が供給されると、「ふせる」というノード ND₂ から「あるく」とレ、うノード ND₄ に至る経路を探索することにより姿勢遷移計画を行い、その結果、「たて」という指示を出した後に「歩け」という指示を出すような行動指令情報 S 1 8を生成して制御機構部 2 5 3に送出する。

図 3 4に戻って制御機構部 2 5 3は、行動指令情報 S 1 8を基にァクチユエ一タ 2 3 3 A〜 23 3 Nを駆動させるための制御信号 S 5を生成し、これをァクチユエ一タ 2 3 3 A〜 2 3 3 Nに送出して当該ァクチユエ一夕 2 3 3 A〜 23 3 N を駆動させることにより、ペットロボット 2 1 0に所望の動作を行わせるようになされている。

( 5 - 4 ) 本実施の形態の動作及び効果

以上の構成において、コントローラ 24 2の感情 .本能モデル部 2 5 0は、供給される入力情報 S 1〜S 3に基づいて、ぺットロボット 2 1 0の感情及び本能の状態を変化させ、この感情及び本能の状態の変化をぺットロボット 2 1 0の行動に反映させることにより、自分の感情や本能の状態に基づいて自律的に行動させる。

そして、感情 ·本能モデル部（図 3 8に示す感情モデル部） 2 50は、相手口ボットの性格に応じて変化された性格により行動を決定することができる。これにより、ユーザは、他のぺットロボットに応じてぺットロポット 2 1 0の性格が形成されることを楽しくことができ、育成のおもしろさを得ることができる。また、コントローラ 2 4 2の行動決定機構部 2 5 1は、順次供給される入力情報 S 1 4の履歴に応じた現在のステート及び次に供給される入力情報 S 1 4に基づいて現在のステ一トに続く次のステートを決定することにより、自分の感情や本能の状態に基づいて自律的に行動させる。

また、コントローラ 2 4 2の姿勢遷移機構部 2 5 2は、ペットロボット 2 1 0 の現在の姿勢から予め決められた所定の経路を経て現在の姿勢を変化させて行動指令情報 S 1 6に応じた姿勢に遷移させることにより、無理な姿勢をとらせるような事態や転倒するような事態を回避する。

以上の構成によれば、コントローラ 2 4 2に対する入力情報 S 1〜S 3に基づいてぺットロボット 2 1 0の感情及び本能の状態を変化させ、この感情及び本能の状態の変化を基にぺットロボット 2 1 0の行動を決定し、当該決定した行動に応じて遷移可能な姿勢を選択してぺットロボット 2 1 0を動作させることにより、自分の感情や本能の状態に基づいて自律的に行動することができ、かくして本物のぺットに近い動作を行うぺットロボット 2 1 0を実現できる。

( 5 - 5 ) 他の実施の形態

なお上述の第 5の実施の形態においては、相手ロボットの性格に応じた性格の変化を、感情パラメータ変更機構部 2 7 3が感情モデルのパラメータを変更することにより行っている場合について述べたが、本発明はこれに限定されず、図 4 2に示すように、行動決定機構部 2 5 1のパラメータを変更することにより行うこともできる。この場合、行動決定機構部 2 5 1の調整可能なパラメータを変化させる。例えば、有限オートマトンでは、入力情報 S 1 4の供給によりステートを遷移させているが、そのステートの遷移確率を変化させる。

また上述の第 5の実施の形態においては、相手ロボットの表出された感情のみに基づいて性格の状態を変化させているが、本発明はこれに限定されず、他の情報をも参照することができる。例えば、図 4 3に示すように、対話解析機構部 2 7 4を備え、相手ロボットとユーザ（飼い主）との対話を解析することにより、性格の状態を変化させることができる。

対話解析機構部 2 7 4は、ユーザと相手ロボットとの対話、例えば、ユーザが相手ロボットに発している言葉やユーザが相手ロボットに対して行っている仕草を解析する。例えば、ユーザが相手ロボットをしかっているのか、叩いているのか等を解析する。対話解析機構部 2 5 1は、その解析結果を記憶及び解析機構部 2 7 2に送る。

対話解析機構部 2 7 4は、感情認知機構部 2 7 1からの相手ロボットの表出している感情の情報と、対話解析機構部 2 7 4の解析結果とに基づいて、相手ロボットの性格を判別する。

これにより、例えば、感情認知機構部 2 7 1からの情報として吠えている情報だけが単に送られでい場合には相手ロポットが怒りっぽい性格と判断されてしまうが、ユーザとの対話を参照することにより、ユーザに叩かれた吠えているような場合には、相手ロボットを怒りつぼい性格と容易に判断するようなことなく、環境に応じて複合的な判断をすることができるようになる。

さらに上述の第 5の実施の形態においては、相手ロボットの性格と一致する方向に変化するように説明したが、本発明はこれに限定されず、相手ロボットの性格と反対の性格、すなわち反対方向の性格に変化させることもできる。

さらに上述の第 5の実施の形態においては、相手ロボットの性格の判断に相手ロボットの行動を参照しているが、本発明はこれに限定されず、相手ロボットとのデータ通信により当該相手ロボットの性格を判断することができる。データ通信の形態としては無線通信でもよく、有線通信でもよい。

さらに上述の第 5の実施の形態においては、相手ロボットが 1体である場合について説明したが、本発明はこれに限定されず、相手ロボットが複数体ある場合であってもよレ、。この場合、ペットロボット 2 1 0は、ロボットを識別して、複数体のロボッ卜から統合的に、或いは特定のロボットから個別的に自己の性格を変化させることができる。これにより、複数の相手ロボットがそれぞれ性格が異なっている場合があるので、それに応じて自己の性格を変化させることができるようになる。

さらに、このように複数体のロボットがある状況においては各ロボットを識別する必要がある。この場合、例えば、相手ロボットを個別判断できるように、顔を所定のパターンとして形成しておくことにより、複数のロボットを識別できるようにする。また、所定マークとしていわゆるバーコードを相手ロボットに付して、複数のロボットを識別できるようにしてもよい。また、データ通信により、相手ロボッ卜の性格を判断する場合においては、性格のデータに識別情報を付しておくことにより、複数のロボットを識別できるようにしてもよい。例えば、識別情報として、相手ロボットの備える装置の識別番号、例えば着脱自在とれた記憶媒体である、いわゆるメモリスティック（ソニー株式会社商標）の I D等が挙げられる。

さらに上述の第 5の実施の形態においては、相手ロボットの動作部の動作から感情を認知する場合について主に述べたが、本発明はこれに限らず、タツチセンサ 1 4に対する相手口ボットの接触状態から相手ロボットの感情の認知することもできる。

さらに上述の第 5の実施の形態においては、リモートコントローラから赤外線光によって送られてきたユーザの指令を受信するようにした場合について述べたが、本発明はこれに限らず、例えば電波や音波によって送られてきたユーザの指令を受信するようにしても良い。

さらに上述の第 5の実施の形態においては、ユーザからの指令をリモートコントローラ受信部 2 2 3及びマイク 2 2 1でなるコマンド受信部 2 4 0を介して入力するようにした場合について述べたが、本発明はこれに限らず、例えばペットロボット 1にコンピュータを接続し、当該接続されたコンピュータを介してユーザの指令を入力するようにしてもよい。

さらに上述の第 5の実施の形態においては、「うれしさ」、「悲しさ」、「怒り」という情動を示す情動ユニット 2 6 0 A〜 2 6 0 Cと、「食欲」、「睡眠欲」、「運動欲」という欲求を示す欲求ュニット 2 6 1 A〜 2 6 1 Cとを用いて感情及び本能の状態を決定するようにした場合について述べたが、本発明はこれに限らず、例えば情動ユニット 2 6 0 A〜 2 6 0 Cに「寂しさ」という情動を示す情動ュニットを追加したり、欲求ュニット 2 6 1 A〜 2 6 1 Cに「愛情欲」という欲求を示す欲求ュニットを追加しても良く、この他種々の種類や個数の組合わせでなる情動ュニットゃ欲求ュニットを使って感情や本能の状態を決定するようにしても良い。

さらに上述の第 5の実施の形態においては、指令信号 S 1と外部情報信号 S 2 と内部情報信号 S 3と感情 ·本能状態情報 S 1 0と行動情報 S 1 2とに基づいて次の行動を行動決定機構部 2 5 1によって決定した場合について述べたが、本発明はこれに限らず、指令信号 S 1と外部情報信号 S 2と内部情報信号 S 3と感情 •本能状態情報 S 1 0と行動情報 S 1 2 とのうち一部の情報に基づいて次の行動を決定するようにしても良い。

さらに上述の第 5の実施の形態においては、有限ォートマトン 2 6 7と呼ばれるアルゴリズムを用いて次の行動を決定した場合について述べたが、本発明はこれに限らず、ステートの数が有限でないステートマシンと呼ばれるアルゴリズムを用いて行動を決定するようにしても良く、この場合、入力情報 S 1 4が供給される毎に新たにステートを生成し、当該生成したステートに応じて行動を決定すれば良い。

さらに上述の第 5の実施の形態においては、有限ォートマトン 2 6 7と呼ばれるアルゴリズムを用いて次の行動を決定した場合について述べたが、本発明はこれに限らず、現在供給された入力情報 S 1 4とそのときのステートとに基づいて複数のステートを遷移先の候補として選定し、当該選定された複数のステートのうち遷移先のステ一トを乱数によってランダムに決定するような確率有限ォートマトンと呼ばれるアルゴリズムを用いて行動を決定するようにしても良い。

さらに上述の第 5の実施の形態においては、行動指令情報 S 1 6が直接遷移可能な姿勢を示す場合には、当該行動指令情報 S 1 6をそのまま姿勢遷移情報 S 1 8として制御機構部 2 5 3に送出する一方、直接遷移不可能な姿勢を示す場合には、遷移可能な他の姿勢に一旦遷移した後に目的の姿勢まで遷移させるような姿勢遷移情報 S 1 8を生成して制御機構部 2 5 3に送出した場合について述べたが、本発明はこれに限らず、行動指令情報 S 1 6が直接遷移可能な姿勢を示す場合にのみ当該行動指令情報 S 1 6を受け付けて制御機構部 4 3に送出する一方、直接遷移不可能な姿勢を示す場合には、当該行動指令情報 S 1 6を拒否するようにしても良い。

さらに上述の第 5の実施の形態においては、本発明をぺットロボット 2 1 0に適用した場合について述べたが、本発明はこれに限らず、例えばゲームや展示等のェンタティンメント分野で用いられるロボット装置のように、他の種々のロボット装置に本発明を適用し得る。

さらに本発明が適用されるぺットロボット 1の外観は、図 3 2に示すような構成をとることに限定されず、図 4 4に示すように、より現実の犬に類似の構成とすることもできる。産業上の利用の可能性

本発明は、ゲームや展示等のェンタティンメント分野で用いられる口ボットゃ、ペットとして用いられるペットロボット等に適用することができる。

Claims

請求の範囲

1 . 行動モデルが記憶された記憶手段と、

上記行動モデルの一部又は全部の状態空間を用いて行動を生成する行動生成手段と

を具え、

上記行動生成手段は、

上記行動モデルのうちの上記行動生成に使用する上記状態空間を、拡大縮小させながら変化させる

ことを特徴とするロボット装置。

2 . 上記行動モデルは、確率状態遷移モデルでなり、

上記行動生成手段は、

上記行動モデルのうちの遷移確率を 0とすることで遷移が禁止されていた状態への当該遷移確率を 0よりも大きい所定の値に変更することによって、上記行動モデルのうちの上記行動生成に使用する上記状態空間を拡大する

ことを特徴とする請求の範囲第 1項に記載のロボット装置。

3 . 上記行動モデルは、確率状態遷移モデルでなり、

上記行動生成手段は、

対象とする状態への遷移確率を 0とすることによって、上記行動モデルのうちの上記行動生成に使用する上記状態空間を縮小する

4 . 段階的に成長する成長モデルを有し、

上記行動生成手段は、

上記成長モデルの上記成長に合わせて上記行動モデルのうちの上記行動生成に使用する状態空間を、拡大縮小させながら変化させる

5 . 状態遷移モデルでなる行動モデルを有し、当該行動モデルに基づいて行動を生成するロボット装置において、

上記行動モデルでは、所定のノードへの遷移が仮想的なノードでなる仮想ノードへの遷移として記述されると共に、当該仮想ノードに所定のノード群が割り当てられ、

上記仮想ノードに割り当てる上記ノード群を変更する変更手段を具えることを特徴とするロボット装置。

6 . 段階的に成長する成長モデルを有し、

上記変更手段は、

上記成長モデルの上記成長に合わせて上記仮想ノードに割り当てる上記ノード群を変更する

を具えることを特徴とする請求の範囲第 5項に記載のロボット装置。

7 . 行動モデルを有し、当該行動モデルに基づいて行動を生成するロボット装置の制御方法において、

上記行動モデルの一部又は全部の状態空間を用いて上記行動を生成する第 1のステップと、

上記行動モデルのうちの上記行動生成に使用する上記状態空間を、拡大縮小させながら変化させる第 2のステップと

を具えることを特徴とするロボット装置の制御方法。

8 . 上記行動モデルは、確率状態遷移モデルでなり、

上記第 2のステップでは、上記行動モデルのうちの遷移確率を 0とすることで遷移が禁止されていた状態への当該遷移確率を 0よりも大きい所定の値に変更することによって、上記行動モデルのうちの上記行動生成に使用する上記状態空間を拡大する

ことを特徴とする請求の範囲第 7項に記載のロボット装置の制御方法。

9 . 上記行動モデルは、確率状態遷移モデルでなり、

上記第 2のステップでは、

1 0 . 上記ロボット装置は、段階的に成長する成長モデルを有し、

上記第 2のステップでは、

1 1 . 状態遷移モデルでなる行動モデルを有し、当該行動モデルに基づいて行動を生成するロボット装置の制御方法において、

上記行動モデルにおける所定のノードへの遷移を仮想的なノードでなる仮想ノ一ドへの遷移として記述すると共に、当該仮想ノードに所定のノード群を割り当てる第 1のステップと、

上記仮想ノードに割り当てる上記ノード群を変更する第 2のステップとを具えることを特徴とするロボット装置の制御方法。

1 2 . 上記ロボット装置は、段階的に成長する成長モデルを有し、

上記第 2のステップでは、上記成長モデルの上記成長に合わせて上記仮想ノードに割り当てる上記ノード群を変更する

ことを特徴とする請求の範囲第 1 1項に記載のロボット装置の制御方法。

1 3 . 複数の情動からなる感情モデル及び又は複数の欲求からなる本能モデルを有し、所定条件で順次更新される上記感情モデルの各上記情動のパラメータ値及び又は上記本能モデルの各上記欲求のパラメータ値に基づいて行動を生成する口ボット装置において、

上記行動生成に使用する上記情動及び又は上記欲求の数を、段階的に増減させるように制限する制限手段

を具えことを特徴とするロボット装置。

1 4 . 上記制限手段は、

外部から与えられる所定の刺激の累積及び又は経過時間に基づいて、上記行動生成に使用する上記情動及び又は上記欲求の数を段階的に増減させる

ことを特徴とする請求の範囲第 1 3項に記載のロボット装置。

1 5 . 上記情動及び又は上記欲求の各パラメータ値並びに所定の行動モデルに基づいて上記行動を生成する行動生成手段と、

外部から与えられる所定の刺激の累積及ぴ又は経過時間に基づいて、上記行動生成手段における上記行動モデルを成長レベルの高い上記行動モデルに変更する行動モデル変更手段とを具え、

上記制限手段は、

上記行動モデル変更手段が上記行動モデルを変更するのに合わせて、上記行動生成に使用する上記情動及び又は上記欲求の数を増減させる

1 6 . 上記感情モデルは、：

上記情動として、喜び、悲しみ、怒り、驚き、嫌悪及び恐れの 6つの上記情動を有する

1 7 . 上記本能モデルは、

上記欲求として、運動欲、愛情欲、食欲及び好奇心の 4つの上記欲求を有することを特徴とする請求の範囲第 1 3項に記載のロボット装置。

1 8 . 上記刺激及び又は上記経過時間に基づいて、各上記情動のパラメータ値及び又は各上記欲求のパラメータ値を、各上記情動及び又は各上記欲求に介して個別に設定された対応する感度で順次更新する情動及び又は欲求更新手段と、環境を評価し、当該評価結果に基づいて各上記情動及び又は各上記欲求に対する各上記感度をそれぞれ更新する感度更新手段と

を具えることを特徴とする請求の範囲第 1 3項に記載のロボット装置。

1 9 . 複数の情動からなる感情モデル及び又は複数の欲求からなる本能モデルを有し、上記感情モデルの各上記情動のパラメータ値及び又は上記本能モデルの各上記欲求のパラメ一タ値に基づいて行動を生成する口ボット装置において、外部から与えられる刺激及び又は経過時間に基づいて、各上記情動のパラメ一タ値及び又は各上記欲求のパラメータ値を、各上記情動及び又は各上記欲求に対して個別に設定された対応する感度で順次更新する情動及び又は欲求更新手段と環境を評価し、当該評価結果に基づいて各上記情動及び又は各上記欲求に対する各上記感度をそれぞれ更新する感度更新手段と

を具えることを特徴とするロボット装置。

2 0 . 上記感度変化手段は、

上記環境を、順次更新される各上記情動のパラメータ値及び又は各上記欲求のパラメータ値に基づいて評価する

ことを特徴とする請求の範囲第 1 9項に記載のロボット装置。

2 1 . 上記感情モデルは、

2 2 . 上記本能モデルは、

上記欲求として、運動欲、愛情欲、食欲及び好奇心の 4つの上記欲求を有することを特徴とする請求の範囲第 1 9項に記載のロボット装置。

2 3 . 複数の情動からなる感情モデル及ぴ又は複数の欲求からなる本能モデルを有し、所定条件で順次更新される上記感情モデルの各上記情動のパラメータ値及び又は上記本能モデルにおける各上記欲求のパラメータ値に基づいて行動を生成するロボット装置の制御方法において、

上記行動生成に使用する上記情動及び又は上記欲求の数を制限する第 1のステップと、

上記行動生成に使用する上記情動及び又は上記欲求の数を段階的に増減させる第 2のステップと

を具えることを特徴とするロボット装置の制御方法。

2 4 . 上記第 2のステップでは、

外部から与えられる所定の刺激の累積及び又は経過時間に基づいて、上記行動に使用する上記情動及び又は上記欲求の数を段階的に増加させることを特徴とする請求の範囲第 2 3項に記載のロボット装置の制御方法。

2 5 . 上記ロボット装置は、

上記情動及び又は上記欲求の各パラメータ値並びに所定の行動モデルに基づいて上記行動を生成すると共に、外部から与えられる所定の刺激の累積及び又は経過時間に基づいて、上記行動生成手段における上記行動モデルを成長レベルの高い上記行動モデルに変更し、

上記第 2のステップでは、

上記行動モデル変更手段が上記行動モデルを変更するのに合わせて、上記行動生成に使用する上記情動及ぴ又は上記欲求の数を増減させる

ことを特徴とする請求の範囲第 2 3項に記載のロボット装置の制御方法。

2 6 . 上記感情モデルは、

2 7 . 上記本能モデルは、

上記欲求として、運動欲、愛情欲、食欲及び好奇心の 4つの上記欲求を有することを特徴とする請求の範囲第 2 3項に記載のロボット装置の制御方法。

2 8 . 上記第 2のステップでは、各上記段階ごとに、

上記刺激及び又は上記経過時間に基づいて、各上記情動のパラメータ値及び又は各上記欲求のパラメータ値を、各上記情動及び又は各上記欲求に介して個別に設定された対応する感度で順次更新する更新ステップと、

環境を評価し、当該評価結果に基づいて各上記情動及び又は各上記欲求に対する各上記感度をそれぞれ更新する感度更新ステップとを具えることを特徴とする請求の範囲第 2 3項に記載のロボット装置の制御方法。

2 9 . 複数の情動からなる感情モデル及び又は複数の欲求からなる本能モデルを有し、上記感情モデルの各上記情動のパラメータ値及び又は上記本能モデルの各上記欲求のパラメ一タ値に基づいて行動を生成する口ボット装置の制御方法において、

外部から与えられる刺激及び又は経過時間に基づいて、各上記情動のパラメ一タ値及び又は各上記欲求のパラメータ値を、各上記情動及び又は各上記欲求に対して個別に設定された対応する感度で更新する第 1のステップと、

環境を評価し、評価結果に基づいて各上記情動及び又は各上記欲求に対する上記感度をそれぞれ更新する第 2のステップと

を具えることを特徴とする口ボット装置の制御方法。

3 0 . 上記第 2のステップでは、

上記環境を、順次更新される各情動の上記パラメータ値及び又は各上記欲求の上記パラメータ値に基づいて評価する

ことを特徴とする請求の範囲第 2 9項に記載のロボット装置の制御方法。

3 1 . 上記感情モデルは、

3 2 . 上記本能モデルは、

上記欲求として、運動欲、愛情欲、食欲及び好奇心の 4つの上記欲求を有することを特徴とする請求の範囲第 2 9項に記載のロボット装置の制御方法。

3 3 . 他のロボット装置の出力を検知する検知手段と、

上記検知手段の検知結果に基づいて、上記他のロボット装置の性格を判別する性格判別手段と

を具えることを特徴とするロボット装置。

3 4 . 上記性格判別手段の判別結果に基づいて、自己の性格を変化させる性格変化手段を具える

ことを特徴とする請求の範囲第 3 3項に記載のロボット装置。

3 5 . 上記検知手段は、上記他のロボット装置の行動を検出する行動検出部と、上記行動検出部の検出結果に基づいて上記他のロボット装置の感情を認知する感情認知手段とを具え、

上記性格判別手段は、上記感情認知手段が認知した上記感情に基づいて、上記他のロボット装置の性格を判別する

ことを特徴とする請求の範囲第 3 3項に記載のロボッ卜装置。

3 6 . 上記性格判別手段は、上記感情認知手段が認知した一定時間内の上記感情に基づいて、上記他のロボット装置の性格を判別する

ことを特徴とする請求の範囲第 3 5項に記載のロボット装置。

3 7 . 上記検知手段は、上記他のロボット装置からの感情データ又は性格データを検知し、

上記性格判別手段は、上記感情データ又は性格データに基づいて、上記他の口ボット装置の性格を判別する

3 8 . 上記性格変化手段は、上記性格判別手段の判別結果に基づいて、自己の性格を決定する性格モデルのパラメータを変化させる

ことを特徴とする請求の範囲第 3 4項に記載のロボット装置。

3 9 . 全体及び各構成部分を行動情報に基づいて動作させる動作制御手段を具え上記性格変化手段は、上記性格判別手段の判別結果に基づいて、上記行動情報を変化させる

4 0 . 他のロボット装置の感情に起因する動作パターンが記憶される記憶手段を具え、

上記感情認知手段は、上記他のロボット装置の動作と、上記動作パターンとを比較することにより、感情を認知する

4 1 . 他のロボット装置とユーザとの対話を検知する対話検知手段を具え、上記性格判別手段は、上記対話検知手段の検知結果を参照して、上記他のロボット装置の性格を判別する

4 2 . ロボット装置の出力を検知して、この検知結果に基づいて、当該ロボット装置の性格を判別する

ことを特徴とするロボット装置の性格判別方法。

4 3 . 性格判別結果が他のロボット装置の性格の変化に使用される

ことを特徴とする請求の範图第 4 2項に記載のロボット装置の性格判別方法。

4 4 . 上記ロボット装置の出力である上記ロボット装置の行動から感情を認知して、感情の認知結果に基づいて、上記ロボット装置の性格を判別する

ことを特徴とする請求の範囲第 4 2項に記載のロボット装置の性格判別方法。

4 5 . —定時間内の上記感情の認知結果に基づいて、上記ロボット装置の性格を判別する

ことを特徴とする請求の範囲第 4 4項に記載の口ボット装置の性格判別方法。

4 6 . 上記ロボット装置の出力である上記ロボット装置からの感情データ又は性格データを検知し、上記感情データ又は性格データに基づいて、上記ロボット装置の性格を判別する

4 7 . 上記ロボット装置の感情に起因する動作パターンを記憶している他のロボット装置が、上記ロボット装置の動作と当該行動パターンとを比較することにより、感情を認知する