明 細 書 ロボッ ト装置及びその制御方法並びにロボッ ト装置の性格判別方法 技術分野
本発明はロボッ ト装置及びその制御方法並びにロボッ ト装置の性格判別方法に 関し、 例えばぺッ トロボッ 卜に適用して好適なものである。 背景技術
第 1の背景技術として、 近年、 本願特許請求人により 4足歩行型のペッ トロボ ッ トが提案及び開発されている。 かかるペッ トロボッ トは、 一般家庭において飼 育される犬や猫に似た形状を有し、 「叩く」 や 「撫でる」 といったユーザからの 働きかけや、 周囲の環境等に応じて自律的に行動し得るようになされたものであ る。
またこのペッ トロボッ トには、 ユーザからの 「叩く」 及び 「撫でる」 といった 働きかけに基づいて対応する行動の発現確率を変化させる学習機能や、 当該働き かけの累積及び経過時間等に基づいて行動の難易度や煩雑さのレベルを段階的に 変化させる成長機能などが搭載されており、 これにより 『ペッ トロボッ ト』 とし ての高い商品性及びァミユーズメント性を得てい.る。
ところでかかるペッ トロボッ トにおいては、 各成長段階 (以下、 これを 「成長 ステージ」 と呼ぶ) ごとに個別の確率状態遷移モデルでなる行動モデルを用意し 、 ュ一ザからの働や経過時間の累積等に基づいて行動モデルを上の 「成長ステー ジ」 の行動モデルに切り換えることにより 「成長」 を表現していた。 またかかる ぺッ トロボッ トにおいては、 ユーザからの働きかけに応じて行動モデルの対応す る箇所の遷移確率を変化させることにより、 上述の 「学習」 を表現していた。 ところがこの方法によると、 「成長」 するごとに行動モデルを新しい行動モデ ルに切り換えることから、 「成長」 の度に突然人格が変わってしまったかのごと
く新しい行動を始めたり、 それまでの 「学習」 の結果が破棄されることとなり、 それまでの行動パターンに慣れ親しんだユーザからみて不自然さを感じさせる問 題があった。
またかかる方法によると、 重複した行動パターンがあつたとしても各 「成長ス テージ」 ごとにその行動パターンのための行動モデル部分を用意する必要があり 、 その分行動モデルの生成作業が煩雑化する問題があった。
従って、 例えば 「成長」 時において行動パターンや学習結果を次の 「成長ステ ージ」 に持ち越すことができるようにできれば、 上述のような 「成長」 時の不自 然さを解消して、 より一層生物的な 「成長」 を表現することができ、 その分ェン ターティメント性を向上させることができるものと考えられる。
また第 2の背景技術として、 近年、 人間の感情を計算機上でモデル化し、 これ を表現する研究が盛んに行われている。 またこのようなモデル化のロボッ ト工学 的な試みとして、 日本国内では、 東京理科大学 原文雄研究室の顔ロボッ トや、 早稲田大学理工学部 菅野研究室の WAMO E B A 2、 オムロン株式会社の猫口 ボッ トなどがある (「人工感情生成のモデルと表出」 原文雄 数理科学 v o 1 . 3 2, N o . 7, p a g e 5 2 _ 5 8, 1 9 94、 「人間とロボッ 卜の情緒 交流に関する研究 評価用ロボッ ト " WAMOE B A_ 2" の設定と試作」 尾 形、 菅野 日本機械学会ロボテイクス · メカ トロニクス講演会講演論文集 v o 1 . A 1 9 9 6, p p 44 9— 4 5 2、 「感情をもったインタラクティブぺッ トロボッ ト」 田島、 斉藤、 大角、 ェ藤、 柴田 日本ロポッ ト学会学術講演会予 稿集 v o l . 1 6, p a g e l l - 1 2, 1 9 9 8)。
ところでこれらの研究では、 始めから完成された感情 ·本能モデルを用いてい かに生物に近い行動や表現を得ることができるかが主題となっている。 しかしな がら生物の成長過程を考えた場合、 幼年期から成長期にいたるまで常に同じよう なモデルに基づいて感情や本能が動作しているとは考えられない。 このためかか るモデル化は 「成長」 という側面から見ると不自然な問題があった。
またぺッ トとして扱う自律型ロポッ トに感情や本能をもたせるアプリケーショ
ンについて考えた場合にも、 最初から完成された感情や本能をもったロボットは ユーザにとって理解が困難で受け入れ難いものである。 例えば本能として複数の 欲求 (例えば 「愛情欲」 及び 「運動欲」 など) をもち、 また感情として複数の情 動 (例えば 「喜び」、 「悲しみ」 及び 「恐怖」 など) をもったロボットでは、 その 内部の動きが複雑であるために、 現在ロボットが何を欲していてどのような感情 状態にあるのかをユーザが理解することは難しい。
さらにかかるロボットにおいて感情 ·本能が変化せずに常に同じであることは 、 ユーザが飽きやすく、 商品性及びアミューズメント性において不十分な問題も ある。
さらに第 3の背景技術として、 従来、 上述のようにユーザからの指令や周囲の 環境に応じて動作を行う 4足歩行型のいわゆるぺットロポットが提案及び開発さ れている。 かかるペットロボットは、 家庭内で飼う犬や猫のような 4足動物によ く似た形状を有し、 例えばユーザから 「伏せ」 という命令を受け取ると伏せの姿 勢を取ったり、 又は自分の口の前にユーザが手を差し出すと 「おて」 をするよう になされている。
ところで、 このようなペットロボッ トは、 感情のモデルや自分で行動を決める 機構を持ち、 その特徴をロボッ トの性格と呼ぶことができるが、 その性格の変化 は、 他のロボットの影響を受けるものではない。
ここで、 動物の性格形成は、 周囲の環境の影響を受け、 例えば、 2匹のペッ ト がー緒に飼われているような場合には、 一方のぺットの存在が他方のぺットの性 格形成に大きく影響するのが現実である。 発明の開示
本発明は以上の点を考慮してなされたもので、 第 1に、 エンターテイメント性 を向上させ得るロボット装置及びその制御方法、 第 2に、 アミューズメント性を 向上させ得るロボット装置及びその制御方法、 第 3に、 より現実的に性格が形成 されていくことを可能とするロボット装置及びロボット装置の性格判別方法を提
案しょうとするものである。
かかる課題を解決するため本発明においては、 ロボッ ト装置において、 行動モ デルを保持する保持手段と、 行動モデルの一部又は全部の状態空間を用いて行動 を生成する行動生成手段とを設け、 行動生成手段が、 行動モデルのうちの行動生 成に使用する状態空間を、 拡大縮小させながら変化させるようにした。 この結果 このロボッ ト装置では、 行動生成に使用する状態空間が連続的に変化してゆくた め、 行動生成に使用する状態空間の変化の前後における行動出力の不連続性を低 減することができる。 かくするにっき出力行動の種類等を滑らかにかつ自然に順 次変化させてゆく ことができ、 かく してエンターティメント性を向上させ得る口 ボッ ト装置を実現できる。
また本発明においては、 状態遷移モデルでなる行動モデルを有し、 当該行動モ デルに基づいて行動を生成するロボッ ト装置において、 行動モデルにおける所定 のノードへの遷移を仮想的なノードでなる仮想ノードへの遷移として記述し、 当 該仮想ノードに所定の第 1のノード群を割り当てると共に、 仮想ノードに割り当 てるノード群を変更する変更手段を設けるようにした。 この結果このロボッ ト装 置では、 基本となる行動モデルが固定化されているため、 出力行動に一貫性をも たせながらこれらを順次変化させることができる。 かくするにっき出力行動の種 類等を滑らかにかつ自然に順次変化させてゆく ことができ、 かく してエンターテ ィメント性を向上させ得るロボッ ト装置を実現できる。
さらに本発明においては、 ロボッ ト装置の制御方法において、 行動モデルの一 部又は全部の状態空間を用いて行動を生成する第 1のステップと、 行動モデルの うちの行動生成に使用する状態空間を、 拡大縮小させながら変化させる第 2のス テツプとを設けるようにした。 この結果このロボッ ト装置の制御方法によれば、 行動生成に使用する状態空間が連続的に変化してゆくため、 行動生成に使用する 状態空間の変更の前後における行動出力の不連続性を低減することができる。 か くするにつき出力行動の種類等を滑らかにかつ自然に順次変化させてゆく ことが でき、 かく してエンターティメント性を向上させ得る口ボッ ト装置の制御方法を
実現できる。
さらに本発明によれば、 ロボッ ト装置の制御方法において、 行動モデルにおけ る所定のノードへの遷移を仮想的なノ一ドでなる仮想ノードへの遷移として記述 すると共に、 当該仮想ノードに所定のノード群を割り当てる第 1のステップと、 仮想ノードに割り当てるノード群を変更する第 2のステップとを設けるようにし た。 この結果このロボッ ト装置の制御方法によれば、 基本となる行動モデルが固 定化されているため、 出力行動に一貫性をもたせながらこれらを順次変化させる ことができる。 かくするにっき出力行動の種類等を滑らかにかつ自然に順次変化 させてゆく ことができ、 かく してエンターティメント性を向上させ得るロボッ ト 装置の制御方法を実現できる。
さらに本発明においては、 所定条件で順次更新される感情モデルの各情動のパ ラメータ値及び又は本能モデルの各欲求のパラメータ値に基づいて行動を生成す るロボッ ト装置において、 行動生成に使用する情動及び又は欲求の数を、 段階的 に増減させるように制限する制限手段を設けるようにした。 この結果このロボッ ト装置では、 感情及び又は本能を、 本物の生物の感情及び又は本能が 「成長」 す るかのごとく変化させることができ、 かく してァミユーズメント性を向上させ得 るロボッ ト装置を実現できる。
さらに本発明においては、 感情モデルの各情動のパラメータ値及び又は本能モ デルの各欲求のパラメータ値に基づいて行動を生成する口ボッ ト装置において、 外部から与えられる刺激及び経過時間に基づいて、 各情動のパラメータ値及び又 は各欲求のパラメータ値を、 各情動及び又は各欲求に対して個別に設定された対 応する感度で順次更新する情動及び又は欲求更新手段と、 環境を評価し、 当該評 価結果に基づいて各情動及び又は各欲求に対する各感度をそれぞれ更新する感度 更新手段とを設けるようにした。 この結果このロボッ ト装置では、 各情動及び又 は各欲求の感度を、 環境に対して最適化することができ、 かく してアミユーズメ ント性を向上させ得る口ボッ ト装置を実現できる。
さらに本発明においては、 所定条件で順次更新される感情モデルの各情動のパ
ラメータ値及び又は本能モデルにおける各欲求のパラメータ値に基づいて行動を 生成するロボッ ト装置の制御方法において、 初期時において行動生成に使用する 情動及び又は欲求の数を制限する第 1のステップと、 行動生成に使用する情動及 び又は欲求の数を段階的に増減させる第 2のステップとを設けるようにした。 こ の結果このロボッ ト装置の制御方法によれば、 感情及び又は本能を、 本物の生物 の感情及び又は本能が 「成長」 するかのごとく変化させることができ、 かく して ァミユーズメント性を向上させ得る口ボッ ト装置の制御方法を実現できる。
さらに本発明においては、 感情モデルの各情動のパラメータ値及び又は本能モ デルの各欲求のパラメータ値に基づいて行動を生成するロボッ ト装置の制御方法 において、 外部から与えられる刺激及び経過時間に基づいて、 各情動のパラメ一 タ値及び又は各欲求のパラメータ値を、 各情動及び又は各欲求に対して個別に設 定された対応する感度で更新する第 1のステップと、 環境を評価し、 評価結果に 基づいて各情動及び又は各欲求に対する感度をそれぞれ更新する第 2のステップ とを設けるようにした。 この結果このロボッ ト装置の制御方法によれば、 各情動 及び又は各欲求の感度を、 環境に対して最適化することができ、 かく してアミュ —ズメント性を向上させ得る口ボッ ト装置を制御方法を実現できる。
さらに本発明においては、 ロボッ ト装置において、 他のロボッ ト装置の出力を 検知する検知手段と、 検知手段の検知結果に基づいて、 他のロボッ ト装置の性格 を判別する性格判別手段とを設けるようにした。 この結果かかるロボッ ト装置に おいては、 検知手段が検知した他のロボッ ト装置の出力の検知結果に基づいて、 他のロボッ ト装置の性格を性格判別手段により判別する。 これにより、 ロボッ ト 装置は、 例えば、 他のロボッ ト装置の性格の判別結果に基づいて、 自己の性格を 変化させることがき、 より現実的に性格を形成し得るロボッ ト装置を実現できる さらに本発明においては、 ロボッ ト装置の性格判別方法において、 ロボッ ト装 置の出力を検知して、 この検知結果に基づいて、 当該ロボッ ト装置の性格を判別 するようにした。 この結果このロボッ ト装置の性格判別方法によれば、 例えば他
のロボッ ト装置の性格の判別結果に基づいて、 自己の性格を変化させ得るロボッ ト装置の性格判別方法を実現できる。 図面の簡単な説明
図 1は、 第 1及び第 2の実施の形態によるぺッ トロボッ トの外観構成を示す斜 視図である。
図 2は、 ぺッ トロボッ トの回路構成を示すブロック図である。
図 3は、 制御プログラムのソフトウエア構成を示す概念図である。
図 4は、 ミ ドル ' ウェア · レイヤのソフ トウェア構成を示す概念図である。 図 5は、 アプリケーショ ン ■ レイヤのソフトウエア構成を示す概念図である。 図 6は、 行動モデルライブラリの説明に供する概念図である。
図 7は、 確率オートマトンを示す略線図である。
図 8は、 状態遷移表を示す図表である。
図 9は、 行動モデルライブラリの詳細構成を示す概念図である。
図 1 0は、 ペッ トロポッ トの成長モデルを示す概念図である。
図 1 1は、 成長に伴う行動パターンの獲得及び忘却の説明に供する概念図であ る。
図 1 2は、 第 1の実施の形態における差分ファイルの説明に供する概念図であ る。
図 1 3は、 複数のノードから 1つの行動パターンの起点ノ一ドへの遷移の説明 に供する概念図である。
図 1 4は、 仮想ノードの利用の説明に供する概念図である。
図 1 5は、 第 2の実施の形態における各行動関連条件項目の行動モデルの構成 を示す概念図である。
図 1 6は、 行動パターンファイルの説明に供する概念図である。
図 1 7は、 第 2の実施の形態による差分ファイルの説明に供する概念図である
図 1 8は、 第 3及び第 4の実施の形態によるぺッ トロボッ トの外観構成を示す 斜視図である。
図 1 9は、 ペッ トロボッ トの回路構成を示すプロック図である。
図 2 0は、 制御プログラムのソフトウェア構成を示す概念図である。
図 2 1は、 ミ ドル · ウェア . レイヤのソフトウエア構成を示す概念図である。 図 2 2は、 アプリケーショ ン ' レイヤのソフトウエア構成を示す概念図である 図 2 3は、 行動モデルライブラリの説明に供する概念図である。
図 2 4は、 確率オー トマ トンを示す略線図である。
図 2 5は、 状態遷移表を示す図表である。
図 2 6は、 行動モデルライブラリの詳細構成を示す概念図である。
図 2 7は、 ぺッ トロボッ トの成長モデルを示す概念図である。
図 2 8は、 各 「成長ステージ」 ごとの感情パラメータファイルを示す概念図で ある。
図 2 9は、 感度及び本能の成長の説明に供するフローチヤ一トである。
図 3 0は、 各 「成長ステージ」 ごとの本能パラメータファイルを示す概念図で ある。
図 3 1は、 第 5の実施の形態の説明に供するプロック図である。
図 3 2は、 第 5の実施の形態によるぺッ トロボッ トの一実施の形態を示す斜視 図である。
図 3 3は、 ペッ トロボッ トの回路構成を示すブロック図である。
図 3 4は、 コントローラにおけるデータ処理を示す略線図である。
図 3 5は、 感情 ·本能モデル部によるデータ処理を示す略線図である。
図 3 6は、 感情 ·本能モデル部によるデータ処理を示す略線図である。
図 3 7は、 感情 ·本能モデル部によるデータ処理を示す略線図である。
図 3 8は、 第 5の実施の形態によるぺッ トロボッ トにおける感情モデルのパラ メータを変化させる構成部分のプロック図である。
図 3 9は、 相手ロボッ トの感情の表出割合を示す特性図である。
図 4 0は、 行動決定機構部における有限ォートマトンの状態遷移図である。 図 4 1は、 姿勢遷移機構部における姿勢遷移のグラフを示す図である。
図 4 2は、 第 5の実施の形態によるぺッ トロボッ トにおける感情モデルのパラ メータを変化させる構成部分を示すものであって、 感情モデルのパラメータを変 化させる他の形態を説明するために使用したプロック図である。
図 4 3は、 第 5の実施の形態によるペッ トロボッ トにおいて、 相手ロボッ トと ユーザとの対話を解析する対話解析機構部を備えて、 感情モデルのパラメータを 変化させる構成部分のプロック図である。
図 4 4は、 第 5の実施の形態によるぺッ 卜ロボッ トの他の実施の形態を示す斜 視図である。 発明を実施するための最良の形態
以下図面について、 本発明の一実施の形態を詳述する。
( 1 ) 第 1の実施の形態
( 1 - 1 ) 第 1の実施の形態によるぺッ トロボッ トの構成
図 1において、 1は全体として第 1の実施の形態によるぺッ トロボッ トを示し 、 胴体部ュニッ ト 2の前後左右にそれぞれ脚部ュ-ッ ト 3 A〜 3 Dが連結される と共に、 胴体部ュニッ ト 2の前端部及ぴ後端部にそれぞれ頭部ュ-ッ ト 4及び尻 尾部ュニッ ト 5が連結されることにより構成されている。
胴体部ュ-ッ ト 2には、 図 2に示すように、 C PU (C e n t r a l
P r o c e s s i n g U n i t ) 1 0、 DRAM D y n a m i c R a n d o m A c c e s s M e m o r y ) 1 1、 フラッシュ ROM (R e a d O n l y M e m o r y) 1 2、 P C (P e r s o n a l C o m p u t e r ) カードィンタ一フェース回路 1 3及び信号処理回路 1 4が内部バス 1 5を介して 相互に接続されることにより形成されたコントロール部 1 6と、 このぺッ トロボ ッ ト 1の動力源としてのバッテリ 1 7とが収納されている。 また胴体部ュニッ ト
2には、 ペッ トロボッ ト 1の向きや動きの加速度を検出するための角速度センサ 1 8及び加速度センサ 1 9なども収納されている。
また頭部ュ-ッ ト 4には、 外部の状況を撮像するための C C D (C h a r g e C o u l e d D e v i c e ) カメラ 20と、 ユーザからの 「撫でる」 や 「叩 く」 といった物理的な働きかけにより受けた圧力を検出するためのタツチセンサ 2 1 と、 前方に位置する物体までの距離を測定するための距離センサ 2 2と、 外 部音を集音するためのマイクロホン 2 3 と、 鳴き声等の音声を出力するためのス ピー力 24と、 ペッ トロボッ ト 1の 「目」 に相当する LED (L i g h t Em i t t i n g D i o d e ) (図示せず) となどがそれぞれ所定位置に配設 されている。
さらに各脚部ュニッ ト 3 A〜 3 Dの関節部分や、 各脚部ュニッ ト 3 A〜 3 D及 び胴体部ュニッ ト 2の各連結部分、 頭部ュニッ ト 4及び胴体部ュニッ ト 2の連結 部分、 並びに尻尾部ュ-ッ ト 5の尻尾 5 Aの連結部分などにはそれぞれ自由度数 分のァクチユエータ 2 5 i 〜 2 5n 及びポテンショメータ 26i 〜26n が配設 されている。
そしてこれら角速度センサ 1 8、 加速度センサ 1 9、 タツチセンサ 2 1、 距離 センサ 2 2、 マイクロホン 23、 スピー力 24及び各ポテンショメータ 2 6 〜 2 6n などの各種センサ並びに L ED及び各ァクチユエータ 2 5: 〜 2 5n は、 それぞれ対応するハブ 2 Ί γ 〜 2 7Ν を介してコントロール部 1 6の信号処理回 路 1 4と接続され、 C CDカメラ 20及びバッテリ 1 7は、 それぞれ信号処理回 路 1 4と直接接続されている。
このとき信号処理回路 1 4は、 上述の各センサから供給されるセンサデータや 画像データ及び音声データを順次取り込み、 これらをそれぞれ内部バス 1 5を介 して DRAM 1 1内の所定位置に順次格納する。 また信号処理回路 1 4は、 これ と共にバッテリ 1 7から供給されるバッテリ残量を表すバッテリ残量データを順 次取り込み、 これを DRAM1 1内の所定位置に格納する。
そしてこのようにして DRAM 1 1に格納された各センサデータ、 画像データ
、 音声データ及びバッテリ残量データは、 この後 C PU 1 0がこのペッ トロボッ ト 1の動作制御を行う際に利用される。
実際上 C PU 1 0は、 ペッ トロボッ ト 1の電源が投入された初期時、 胴体部ュ ニッ ト 2の図示しない P Cカードス口ッ トに装填されたメモリカード 2 8又はフ ラッシュ ROM 1 2に格納された制御プログラムを P Cカードィンターフェース 回路 1 3を介して又は直接読み出し、 これを DRAM 1 1に格納する。
また C P U 1 0は、 この後上述のように信号処理回路 1 4より DRAM 1 1に 順次格納される各センサデータ、 画像データ、 音声データ及びバッテリ残量デー タに基づいて自己及び周囲の状況や、 ユーザからの指示及び働きかけの有無など を判断する。
さらに C P U 1 0は、 この判断結果及び D RAM 1 1に格納した制御プログラ ムに基づいて続く行動を決定すると共に、 当該決定結果に基づいて必要なァクチ ユエータ 2 5 i 〜 2 5n を駆動させることにより、 頭部ュ-ッ ト 4を上下左右に 振らせたり、 尻尾部ュニッ ト 5の尻尾 5 Aを動かせたり、 各脚部ュニッ ト 3 A〜 3 Dを駆動させて歩行させるなどの行動を行わせる。
またこの際 C PU 1 0は、 必要に応じて音声データを生成し、 これを信号処理 回路 1 4を介して音声信号としてスピーカ 24に与えることにより当該音声信号 に基づく音声を外部に出力させたり、 上述の L EDを点灯、 消灯又は点滅させる このようにしてこのペッ トロボッ ト 1においては、 自己及び周囲の状況や、 ュ 一ザからの指示及び働きかけに応じて自律的に行動し得るようになされている。 ( 1 - 2) 制御プログラムのソフトウェア構成
ここでぺッ トロボッ ト 1における上述の制御プログラムのソフトウェア構成を 図 3に示す。 この図 3において、 デバイス . ドライノく ' レイヤ 3 0は、 この制御 プログラムの最下位層に位置し、 複数のデバイス · ドライバからなるデバイス · ドライバ 'セッ ト 3 1から構成されている。 この場合各デバイス ' ドライバは、 CCDカメラ 20 (図 2) やタイマ等の通常のコンピュータで用いられるハード
ウェアに直接アクセスすることを許されたオブジェク トであり、 対応するハード ウェアからの割り込みを受けて処理を行う。
またロボティック .サーバ .オブジェク ト 3 2は、 デバイス · ドライ ノく ' レイ ャ 3 0の上位層に位置し、 例えば上述の各種センサゃァクチユエータ 2 5 i 〜 2 5 n 等のハードウエアにアクセスするためのィンターフェースを提供するソフト ウェア群でなるバ一チャル · ロボッ ト 3 3と、 電源の切換えなどを管理するソフ トウエア群でなるパワーマネージャ 3 4と、 他の種々のデバイス ' ドライバを管 理するソフトウェア群でなるデバイス · ドライ ノく ·マネージャ 3 5と、 ペッ ト口 ボッ ト 1の機構を管理するソフトウエア群 なるデザィンド ' ロボッ ト 3 6とか ら構成されている。
マネージャ ·オブジェク ト 3 7は、 オブジェク ト ·マネージャ 3 8及びサービ ス ·マネージャ 3 9から構成されている。 この場合オブジェク ト ·マネージャ 3 8は、 口ボテイツク ' サーノ ·オブジェク ト 3 2、 ミ ドル · ウェア ' レイヤ 4 0 、 及ぴアプリケーション ' レイヤ 4 1に含まれる各ソフトウェア群の起動や終了 を管理するソフ トウェア群であり、 サービス ·マネージャ 3 9は、. メモリカード 2 8 (図 2 ) に格納されたコネクショ ンファイルに記述されている各ォブジェク ト間の接続情報に基づいて各オブジェク トの接続を管理するソフトウエア群であ る。
ミ ドル . ウェア . レイヤ 4 0は、 口ボテイツク .サーバ .オブジェク ト 3 2の 上位層に位置し、 画像処理や音声処理などのこのぺッ トロボッ ト 1の基本的な機 能を提供するソフトウエア群から構成されている。 またアプリケーション · レイ ャ 4 1は、 ミ ドル ' ウェア ' レイヤ 4 0の上位層に位置し、 当該ミ ドル ' ウェア • レイヤ 4 0を構成する各ソフトウエア群によって処理された処理結果に基づい てぺッ トロボッ ト 1の行動を決定するためのソフトウェア群から構成されている
― なおミ ドル ' ウェア ' レイヤ 4 0及びアプリケーシヨ ン ' レイヤ 4 1の具体な ソフトウエア構成をそれぞれ図 4及び図 5に示す。
ミ ドル · ウェア · レイヤ 4 0においては、 図 4からも明らかなように、 音階認 識用、 距離検出用、 姿勢検出用、 タツチセンサ用、 動き検出用及び色認識用の各 信号処理モジユーノレ 5 0 〜 5 5並びに入力セマンティクスコンバ一タモジユーノレ
5 6などを有する認識系 5 7と、 出力セマンティクスコンバータモジュール 5 7 並びに姿勢管理用、 トラッキング用、 モーショ ン再生用、 歩行用、 転倒復帰、 L E D点灯用及び音再生用の各信号処理モジュール 5 8 〜 6 4などを有する出力系
6 5とから構成されている。
この場合認識系 5 7の各信号処理モジュール 5 0 〜 5 5は、 口ボテイツク 'サ —バ ·オブジェク ト 3 2のバーチヤノレ · ロボッ ト 3 3により D R A M 1 1 (図 2 ) から読み出される各センサデータや画像データ及び音声データのうちの対応す るデータを取り込み、 当該データに基づいて所定の処理を施して、 処理結果を入 力セマンティクスコンバータモジユー/レ 5 6に与える。
入力セマンティクスコンバ一タモジュール 5 6は、 これら各信号処理モジユー ル 5 0 〜 5 5から与えられる処理結果に基づいて、 「ボールを検出した」、 「転倒 を検出した」、 「撫でられた」、 「叩かれた」、 「ドミ ソの音階が聞こえた」、 「動く物 体を検出した」 又は 「障害物を検出した」 などの自己及び周囲の状況や、 ユーザ からの指令及び働きかけを認識し、 認識結果をアプリケーショ ン · レイヤ 4 1 ( 図 2 ) に出力する。
アプリケーション ' レイヤ 4 1においては、 図 5に示すように、 行動モデルラ イブラリ 7 0、 行動切換えモジュール 7 1、 学習モジュール 7 2、 感情モデル 7 3及び本能モデル 7 4の 5つのモジュールから構成されている。
この場合行動モデルライブラリ 7 0には、 図 6に示すように、 「バッテリ残量 . が少なくなつた場合」、 「転倒復帰する場合」、 「障害物を回避する場合」、 「感情を 表現する場合」、 「ボールを検出した場合」 などの予め選択されたいくつかの条件 項目にそれぞれ対応させて、 それぞれ独立した行動モデル 7 〜 7 0 n が設け られている。
そしてこれら行動モデル 7 O i 〜 7 0 n は、 それぞれ入力セマンティクスコン
バータモジュール 5 6から認識結果が与えられたときや、 最後の認識結果が与え られてから一定時間が経過したときなどに、 必要に応じて後述のように感情モデ ル 7 3に保持されている対応する情動のパラメータ値や、 本能モデル 74に保持 されている対応する欲求のパラメータ値を参照しながら続く行動をそれぞれ決定 し、 決定結果を行動切換えモジュール 7 1に出力する。
なおこの実施の形態の場合、 各行動モデル 7 〜 70n は、 次の行動を決定 する手法として、 図 7に示すような 1つのノード (状態) NODE。 〜NODE n から他のどのノード NO D E。 〜N〇DEn に遷移するかを各ノード NO D E。 〜NODEn 間を接続するアーク ARCi 〜ARCnlに対してそれぞれ設定され た遷移確率 〜Pn に基づいて確率的に決定する確率オートマトンと呼ばれる ァルゴリズムを用いる。
具体的に、 各行動モデル 7 〜 70„ は、 それぞれ自己の行動モデル 7 〜 70n を形成する各ノード NODE。 〜NODEn にそれぞれ対応させて、 こ れらノード NODE。 〜NODEn ごとの図 8に示すような状態遷移表 80を有 している。
この状態遷移表 8 0では、 そのノード NODE。 〜NODEn において遷移条 件とする入力イベント (認識結果) が 「入力イベント名」 の行に優先順に列記さ れ、 その遷移条件についてのさらなる条件が 「データ名」 及び 「データ範囲」 の 行における対応する列に記述されている。
従って図 8の状態遷移表 80で表されるノード NODE10。 では、 「ボールを 検出 (BAL L)」 という認識結果が与えられた場合に、 当該認識結果と共に与 えられるそのボールの 「大きさ (S I Z E)」 力 S 「0から 1 00 0」 の範囲であ ることや、 「障害物を検出 (OB S TAC LES という認識結果が与えられた場 合に、 当該認識結果と共に与えられるその障害物までの 「距離 (D I S—
T ANC E)J 力 S 「0から 1 00」 の範囲であることが他のノードに遷移するた めの条件となっている。
またこのノード NODE 1∞ では、 認識結果の入力がない場合においても、 行
動モデル 7 0X 〜 7 0n が周期的に参照する感情モデル 7 3及び本能モデル 7 4 にそれそれ保持された各情動及び各欲求のパラメータ値のうち、 感情モデル 7 3 に保持された 「喜び ( J O Y)」、 「驚き (S UR P R I S Ε)」 若しくは 「悲しみ
(S ADNE S S)」 のいずれかのパラメータ値が 「5 0カ ら 1 0 0」 の範囲で あるときには他のノードに遷移することができるようになっている。
また状態遷移表 8 0では、 「他のノードへの遷移確率」 の欄における 「遷移先 ノード」 の列にそのノード NOD E。 〜NOD En から遷移できるノード名が列 記されると共に、 「入力イベント名」、 「データ値」 及び 「データの範囲」 の行に 記述された全ての条件が揃ったときに遷移できる他の各ノード NODEQ 〜NO D En への遷移確率が 「他のノードへの遷移確率」 の欄内の対応する箇所にそれ ぞれ記述され、 そのノード NOD E。 〜NOD En に遷移する際に出力すべき行 動が 「他のノードへの遷移確率」 の欄における 「出力行動」 の行に記述されてい る。 なお 「他のノードへの遷移確率」 の欄における各行の確率の和は 1 0 0 〔% 〕 となっている。
従って図 8の状態遷移表 8 0で表されるノード NOD 。。 では、 例えば 「ボ ルを検出 (B A L L)」 し、 そのボールの 「S I Z E (大きさ)」 が 「0力、ら 1 0 0 0」 の範囲であるという認識結果が与えられた場合には、 「3 0 〔%〕」 の確 率で 「ノード NODE 12。 (n o d e 1 2 0)」 に遷移でき、 そのとき 「AC Τ Ι ΟΝ 1」 の行動が出力されることとなる。
そして各行動モデル 7 0, 〜 7 0n は、 それぞれこのような状態遷移表 8 0と して記述されたノード NOD E。 〜NODEn がいくつも繫がるようにして構成 されており、 入力セマンティクスコンバータモジュール 5 6から認識結果が与え られたときなどに、 対応するノード NODE。 〜NOD En の状態遷移表 8 0を 利用して確率的に次の行動を決定し、 決定結果を行動切換えモジュール 7 1に出 力するようになされている。
行動切換えモジュール 7 1は、 行動モデルライブラリ 7 0の各行動モデル 7 0 i 〜7 0n からそれぞれ出力される行動のうち、 予め定められた優先順位の高い
行動モデル 7 0 i 〜7 0 n から出力された行動を選択し、 当該行動を実行すべき 旨のコマンド (以下、 これを行動コマンドと呼ぶ) をミ ドル ' ウェア . レイヤ 4 0の出力セマンティクスコンバータ 5 7に送出する。 なおこの実施の形態におい ては、 図 6において下側に表記された行動モデル 7 〜7 0 n ほど優先順位が 高く設定されている。
また行動切換えモジュール 7 1は、 行動完了後に出力セマンティクスコンバー タ 5 7から与えられる行動完了情報に基づいて、 その行動が完了したことを学習 モジュール 7 2、 感情モデル 7 3及び本能モデル 7 4に通知する。
一方、 学習モジュール 7 2は、 入力セマンティクスコンバータ 5 6から与えら れる認識結果のうち、 「叩かれた」 や 「撫でられた」 など、 ユーザからの働きか けとして受けた教示の認識結果を入力する。
そして学習モジュール 7 2は、 この認識結果及び行動切換えモジュール 7 1か らの通知に基づいて、 「叩かれた (叱られた)」 ときにはその行動の発現確率を低 下させ、 「撫でられた (誉められた)」 ときにはその行動の発現確率を上昇させる ように、 行動モデルライブラリ 7 0における対応する行動モデル 7 〜7 0 n の対応する遷移確率を変更する。
他方、 感情モデル 7 3は、 「喜び ( j o y )」、 「悲しみ ( s a d n e s s )」、 「 怒り (a n g e r )」、 「驚き ( s u r p r i s e )」、 「嫌悪 ( d i s g u s t )」 及び 「恐れ ( f e a r )」 の合計 6つの情動について、 各情動ごとにその情動の 強さを表すパラメータを保持している。 そして感情モデル 7 3は、 これら各情動 のパラメ一タ 直を、 それぞれ入力セマンティクスコンバータモジユーノレ 5 6から 与えられる 「叩かれた」 及び 「撫でられた」 などの特定の認識結果と、 経過時間 及び行動切換えモジュール 7 1からの通知となどに基づいて順次更新するように なされている。
具体的に感情モデル 7 3は、 入力セマンテイクスコンバータ 5 6からの認識結 果及びそのときのぺッ トロポッ ト 1の行動がその情動に対して作用する度合い ( 予め設定されている) と、 本能モデル 7 4が保持している各欲求のパラメータ値
及びそのときのぺッ トロボッ ト 1の行動がその情動に対して作用する度合い (予 め設定されている) と、 他の情動から受ける抑制及び刺激の度合いと、 経過時間 となどに基づいて所定の演算式により算出されるその情動の変動量を Δ Ε 〔 t ] 、 現在のその情動のパラメータ値を E 〔 t〕、 認識結果等に応じてその情動を変 化させる割合 (以下、 これを感度と呼ぶ) を表す係数を ke として、 所定周期で 次式
E [ t + 1 ] = E [ t ] + ke ΧΔΕ [ t ] ( 1 ) を用いて次の周期におけるその情動のパラメータ値 E [ t + 1 ] を算出する。 そして感情モデル 7 3は、 この演算結果を現在のその情動のパラメータ値 E 〔 t ] と置き換えるようにしてその情動のパラメータ値を更新する。 なお各認識結 果ゃ行動切換えモジュール 7 1からの通知に対してどの情動のパラメータ値を更 新するかは予め決められており、 例えば 「叩かれた」 といった認識結果が与えら れた場合には 「怒り」 の情動のパラメータ値が上がり、 「撫でられた」 といった 認識結果が与えられた場合には 「喜び」 の情動のパラメータ値が上がる。
これに対して本能モデル 7 4は、 「運動欲 ( e X e r c i s e )」、 「愛情欲 ( a f f e c t i o n )」、 「食欲 ( a p p e t i t e )」 及び 「好奇心 ( c u r i ― o s i t y )J の互いに独立した 4つの欲求について、 これら欲求ごとにその欲 求の強さを表すパラメータを保持している。 そして本能モデル 7 4は、 これら欲 求のパラメータ値を、 それぞれ入力セマンティクスコンバータモジュール 5 6か ら与えられる認識結果や、 経過時間及び行動切換えモジュール 7 1からの通知な どに基づいて順次更新するようになされている。
具体的に本能モデル 7 4は、 「運動欲」、 「愛情欲」 及び 「好奇心」 については 、 ぺッ トロボッ ト 1の行動出力、 経過時間及び認識結果などに基づいて所定の演 算式により算出されるその欲求の変動量を Δ I 〔k〕、 現在のその欲求のパラメ 一タ値を I 〔k〕、 その欲求の感度を表す係数を として、 所定周期で次式
I 〔k + 1〕 = I 〔k〕 + Χ Δ I 〔k〕 ( 2 ) を用いて次の周期におけるその欲求のパラメータ値 I 〔k + l〕 を算出し、 この 演算結果を現在のその欲求のパラメータ値 I 〔k〕 と置き換えるようにしてその 欲求のパラメータ値を更新する。 なお行動出力や認識結果等に対してどの欲求の パラメータ値を変化させるかは予め決められており、 例えば行動切換えモジユー ル 7 1からの通知 (行動を行ったとの通知) があったときには 「運動欲」 のパラ メータ値が下がる。
また本能モデル 7 4は、 「食欲」 については、 入力セマンティクスコンバータ モジュール 5 6を介して与えられるバッテリ残量データに基づいて、 バッテリ残 量を として、 所定周期で次式
I 〔k〕 = 1 0 0— B L ( 3 ) により 「食欲」 のパラメータ値 I 〔k〕 を算出し、 この演算結果を現在の食欲の パラメータ値 I 〔k〕 と置き換えるようにして当該 「食欲」 のパラメータ値を更 新する。
なお本実施の形態においては、 各情動及び各欲求のパラメータ値がそれぞれ 0 から 1 0 0までの範囲で変動するように規制されており、 また係数 k e 、 k i の 値も各情動及び各欲求ごとに個別に設定されている。
一方、 ミ ドノレ ' ウェア · レイヤ 4 0の出力セマンティクスコンバータモジユー ル 5 7は、 図 4に示すように、 上述のようにしてアプリケーション · レイヤ 4 1 の行動切換えモジュール 7 1から与えられる 「前進」、 「喜ぶ」、 「鳴く」 又は 「ト ラッキング (ボールを追いかける)」 といった抽象的な行動コマンドを出力系 6 5の対応する信号処理モジュール 5 8 〜 6 4に与える。
そしてこれら信号処理モジュール 5 8 〜 6 4は、 行動コマンドが与えられると
当該行動コマンドに基づいて、 その行動を行うために対応するァクチユエータ 2 丄 〜 (図 2 ) に与えるべきサーボ指令値や、 スピーカ 2 4 (図 2 ) から 出力する音の音声データ及び又は 「目」 の L E Dに与える駆動データを生成し、 これらのデータをロボティック · サーノ ·オブジェク ト 3 2のノ ーチヤノレ口ボッ ト 3 3及び信号処理回路 1 4 (図 2 ) を順次介して対応するァクチユエータ 2 5 ! 〜 2 5 n 、 スピーカ 2 4又は L E Dに順次送出する。
このようにしてこのぺッ トロボッ ト 1においては、 制御プログラムに基づいて 、 自己及び周囲の状況や、 ユーザからの指示及び働きかけに応じた自律的な行動 を行うことができるようになされている。
( 1 - 3 ) ペッ トロボッ ト 1 の成長モデノレ
次にこのぺッ トロボッ ト 1に搭載された成長機能について説明する。 このぺッ トロボッ ト 1には、 ユーザからの働きかけ等に応じて、 あたかも 「成長」 するか のごとく行動を変化させてゆく成長機能が搭載されている。
すなわちこのペッ トロボッ ト 1には、 成長過程として 「誕生期」、 「幼年期」、 「 少年期」、 「青年期」 及び 「成人期」 の 5つの 「成長ステージ」 が設けられている 。 そしてアプリケーション . レイヤ 4 1の行動モデルライブラリ 7 0 (図 5 ) に は、 上述した 「バッテリ残量が少なくなつた場合」 等の各条件項目のうち、 「モ ーシヨン (動き)」 や 「行動」 などの 「成長」 に関係した全ての条件項目 (以下 、 これを成長関連条件項目と呼ぶ) について、 図 9に示すように、 行動モデル 7 O k として、 「誕生期」、 「幼年期」、 「少年期」、 「青年期」 及び 「成人期」 にそれ ぞれ対応させた行動モデル 7 O k(1)〜 7 O k(5)が設けられている。 そして行動モデ ルライブラリ 7 1では、 これら成長関連条件項目について、 初期時には 「誕生期 」 の行動モデル 7 O k(1)を用いて次の行動を決定するようになされている。
この場合 「誕生期」 の各行動モデル 7 O k(1)はノード N O D E。 〜N O D E n ( 図 7 ) の数が少なく、 またこれら行動モデル 7 O k(1)から出力される行動の内容 も 「パターン 1 (「誕生期」 用の歩行パターン) で前進」 や、 「パターン 1 (「誕. 生期」 用の鳴き声パターン) で鳴く」 のように、 「誕生期」 に対応した行動又は
動作内容となっている。
かく してこのペッ トロボッ ト 1においては、 初期時には 「誕生期」 の各行動モ デル 7 0 k(1)に従って、 例えば 「モーション」 については単に 「歩く」、 「立つ」、 「寝る」 程度の 「単純」 な動きとなるように、 「行動」 については同じ行動を繰 り返し行うことにより 「単調」 となるように行動する。
またこのときアプリケーション ' レイヤ 4 1の学習モジュール 7 2 (図 5 ) は 、 その内部に 「成長」 の度合いを表すパラメータ (以下、 これを成長パラメータ と呼ぶを保持しており、 入力セマンティクスコンバータモジュール 5 6から与え られる認識結果や経過時間情報などに基づいて、 成長パラメータの値を 「撫でら れた」 や 「叩かれた」 等のユーザからの働きかけ (教示) の回数や経過時間等に 応じて順次更新するようになされている。
そして学習モジュール 7 2は、 ペッ トロボッ ト 1に電源が投入される度にこの 成長パラメータの値を評価し、 当該値が 「幼年期」 に対応させて予め設定された 閾値を越えた場合には、 これを行動モデルライブラリ 7 0に通知する。 また行動 モデルライブラリ 7 0は、 この通知が与えられると、 上述の各成長関連条件項目 について、 それぞれ使用する行動モデルを 「幼年期」 の行動モデル 7 0 k(2)に変 更する。
このとき 「幼年期」 の各行動モデル 7 0 k(2)は 「誕生期」 の行動モデル 7 0 k(1) よりもノード N〇D E。〜N O D E n の数が多く、 またこれら行動モデル 7 0 k(2) から出力される行動の内容も 「幼年期」 の行動に比べて難易度や複雑さのレベル (成長レベル) が高くなつている。
かく してこのぺッ トロボッ ト 1においては、 この後はこれら行動モデル 7 0 k(2)に従って、 例えば 「モーション」 については行動の数が増加することにより 「少しは高度かつ複雑」 な動きとなるように、 また 「行動」 については 「少しは 目的をもった」 行動となるように行動する。
さらに学習モジュール 7 4は、 この後上述の場合と同様にして、 成長パラメ一 タの値が 「少年期」、 「青年期」 及び 「成人期」 にそれぞれ対応させて予め設定さ
れた各閾値を越える度にこれを行動モデルライブラリ 7 1に通知する。 また行動 モデルライブラリ 7 1は、 この通知が与えられる度に上述の各成長関連条件項目 について、 それぞれ使用する行動モデルを 「少年期」、 「青年期」 及び 「成人期」 の行動モデル 7 Ok( 〜 70k(5)に順次変更する。
このとき 「少年期」、 「青年期」 及び 「成人期」 の各行動モデル 7 Ok(3)〜 70 k(5)は、 それぞれ 「成長ステージ」 が上がるにつれてノード NODE。 〜NODE „ の数が多くなり、 またこれら行動モデル 7 0k(3)〜 7 Ok(5)から出力される行動 の内容も 「成長ステージ」 が上がるにつれて行動の難易度や複雑さのレベルが高 くなっている。
この結果このペッ トロボッ ト 1では、 「成長ステージ」 が上がる (すなわち 「 誕生期」 から 「幼年期」、 「幼年期」 から 「少年期」、 「少年期」 から 「青年期」、 r 青年期」 から 「成人期」 に変化する) に従って、 「モーション」 が 「単純」 から 「高度 ·複雑」 に、 また 「行動」 力 S 「単調」 から 「目的をもった行動」 に順次段 階的に変化する。
このようにしてこのぺッ トロボッ ト 1においては、 ユーザから与えられる教示 や時間経過に応じて、 行動及び動作が 「誕生期 ί、 「幼年期」、 「少年期」、 「青年期
」 及ぴ 「成人期」 の 5段階で 「成長」 するようになされている。
なおこの実施の形態の場合、 ペッ トロボッ ト 1の成長モデルは、 図 1 0に示す ように 「少年期」 以降において枝分かれするモデルとなっている。
すなわちこのぺッ トロボッ ト 1の場合、 アプリケーシヨン ' レイヤ 4 1 (図 5 ) の行動モデルライブラリ 70には、 上述の各成長関連条件項目について、 「少 年期」、 「青年期」 及び 「成人期」 の行動モデル 7 Ok(3)〜 7 Ok(5)としてそれぞれ 複数の行動モデルが用意されている。
実際上、 各成長関連条件項目の例えば 「少年期」 の行動モデル 7 Ok(3)として は、 動きが雑で速い 「荒々しい」 性格の行動を行わせるための行動モデル ( CH I LD 1 ) と、 これよりも動きが滑らかで遅い 「おっとり」 とした性格の 行動を行わせるための行動モデル (CH I LD 2) とが用意されている。
また 「青年期」 の行動モデル 7 Ok(4)としては、 「少年期」 の 「荒々しい」 性格 よりもより動きが雑で速い 「いらいら」 した性格の行動を行わせるための行動モ デル (YOUNG 1 ) と、 これよりも動きが遅くかつ滑らかな 「普通」 の性格 の行動及び動作を行わせるための行動モデル (YOUNG 2) と、 これよりも 一層動作が遅くかつ行動量が少ない 「おっとり」 とした性格の行動を行わせるた めの行動モデル (YOUNG 3) とが用意されている。
さらに 「成人期」 の行動モデル 70k(5)としては、 「青年期」 の 「いらいら」 し た性格よりもより動きが雑で速く、 かつ非常に怒りやすい 「攻撃的」 な性格の行 動を行わせるための行動モデル (ADULT 1 ) と、 これよりも動きが滑らか で遅く、 かつ怒りやすい 「荒々しい」 性格の行動を行わせるための行動モデル ( ADULT 2) と、 これよりも動きが滑らかで遅く、 かつ行動量が少ない 「お となしい」 性格の行動を行わせるための行動モデル (ADULT 3) と、 これ よりもさらに一層動きが遅く、 かつ行動量が少ない 「静かな」 性格の行動を行わ せるための行動モデル (ADU L T 4) とが用意されている。
そしてアプリケ一ンョン · レイヤ 4 1の学習モジュール 7 2 (図 5 ) は、 上述 のように行動モデルライブラリ 70に対して 「成長ステージ」 を上げさせるため の通知を行う際に、 「少年期」 以降では、 その 「成長ステージ」 において 「叩か れた」 及び 「撫でられた」 回数等に基づいて、 各成長関連条件項目の次の 「成長 ステージ」 の行動モデルとしてどの 「性格」 の行動モデル (CH I LD 1、 CH I LD 2、 YOU G ;!〜 YOUNG 3、 ADULT 1〜
ADULT 4) を用いるかを指定する。
この結果、 行動モデルライブラリ 70は、 この指定に基づいて、 各成長関連条 件項目について、 「少年期」 以降では使用する行動モデル 70k(3)〜 70k(5)を指定 された 「性格」 の行動モデル (CH I LD 1、 CH I LD 2、 YOUNG l〜YOUNG 3、 ADULT :!〜 ADULT 4 ) にそれぞれ変更する。 この場合 「少年期」 以降では、 次の 「成長ステージ」 に移る際、 現在の 「成長 ステージ」 での 「性格」 によって次の 「成長ステージ」 での 「性格」 が決まって
おり、 図 1 0において矢印で結ばれた 「性格」 間での移行しかできない。 従って 例えば 「少年期」 において 「荒々しい」 性格の行動モデル (CH I LD 1 ) が 用いられている場合には、 「青年期」 において 「おっとり」 とした性格の行動モ デル (YOUNG 3) に移行することができない。
このようにこのぺッ トロボッ ト 1においては、 あたかも本物の動物が飼い主の 飼育の仕方等によって性格を形成してゆくかのごとく、 ユーザからの働きかけ等 に応じて、 「成長」 に伴って 「性格」 をも変化させてゆくようになされている。 ( 1 - 4) 行動モデル 70 k の具体構成
次に、 上述した各成長関連条件項目の行動モデル 70k (図 9) の具体構成に ついて説明する。
このペッ トロボッ ト 1の場合、 各成長関連条件項目の行動モデル 7 Ok は、 そ れぞれぺッ トロボッ ト 1が発現できる全ての行動パターンが格納された広大な状 態空間を有している。
そしてこれら行動モデル 70k は、 その状態空間のうちの 「歩く」、 「寝る」 及 び 「立つ」 等のこのペッ トロボッ トにおける基本的な行動を生成する状態空間部 分をコアとして、 「誕生期」 には当該コアを含む極一部だけを使用し、 この後 「 成長」 する度に、 新たに増やしたい状態空間部分 (新たに発現できるようにする 行動や一連の行動パターンを生成する状態空間部分) への遷移を許可すると共に 使わなくなった状態空間部分 (発現しないようにする行動や一連の行動パターン を生成する状態空間部分) を切り離すようにして、 各 「成長ステージ」 における 行動モデル 70k(1)〜 70k(5)を生成している。
そしてこのペッ トロボッ ト 1では、 このように新たに増やしたい状態空間部分 への遷移を許可したり、 不要な状態空間を切り離す方法として、 その状態空間へ の遷移確率を 「成長」 に応じて変更する方法を用いている。
例えば図 1 1において、 ノード NODEA からノード NODEB への遷移条件 力 S 『ボールを見つけた』 ことであり、 かつノード NOD EB からの一連のノード 群 90が 『ボールに近づいてこれを蹴る』 といった一連の行動パターンを行うた
めのものであるとすると、 ノード NODEA においてボールを見つけたときには 遷移確率 Pi で 『ボールを追いかけてこれを蹴る』 という行動パターン PAi 発現されるが、 この遷移確率 1^ 「0」 である場合には、 このような行動パタ ーン PAi は決して発現されない。
そこでこのペットロボッ ト 1においては、 ある 「成長ステージ」 になってから このような行動パターン を発現させる場合には、 初期時にはこの遷移確率 Px を 「0」 に設定しておき、 当該 「成長ステージ」 になったときにこの遷移確 率 Pi を 「0」 よりも大きい予め設定された数値に変更するようにする。 またこ れと逆に、 ある 「成長ステージ」 となったときにこの行動パターン PAi を忘れ させる場合には、 その 「成長ステージ」 になったときにノード NODEA からノ ード NOD EB への遷移確率を 「0」 に変更するようにしている。
そしてこのぺットロボットでは、 このように必要箇所の遷移確率を更新するた めの具体的手法として、 上述の成長関連条件項目の各行動モデルには、 「幼年期 」、 「少年期」、 「青年期」 及び 「成人期」 の各 「成長ステージ」 にそれぞれ対応さ せて、 図 1 2に示すようなファイル (以下、 これを差分ファイルと呼ぶ) 9 1 A 〜 9 1 Dが設けられている。
これら差分ファイル 9 1 A〜 9 1 Dは、 その 「成長ステージ」 に上がるに際し て上述のように新たな行動を発現させるために上述のように遷移確率を変更すベ きノード (図 1 1におけるノード Aに相当) のノード名 (番号) と、 そのノ一ド の状態遷移表 8 0 (図 8) における遷移確率を変更すべき箇所と、 当該箇所にお ける変更後の遷移確率とが格納されたものである。
そして各成長関連条件項目の行動モデル 70k は、 初期時には 「誕生期」 用の 行動モデル 70k(1)で行動を生成する一方、 この後上述のように学習モジュール 7 2 (図 5) から 「成長」 したとの通知が与えられると、 対応する 「成長ステー ジ」 用の差分ファイル 9 :!〜 9 1 Dに基づいて、 当該差分ファイル 9 :!〜 9 1 D に記述された各ノ一ドについて、 それぞれ指定された箇所の遷移確率を指定され た数値に変更する。
例えばこの図 8及び図 1 2に示す例の場合において、 「幼年期」 に成長したと きには、 各成長関連条件項目の行動モデル 7 O k は、 ノード N O D E 1Q。 の状態 遷移表 8 0における遷移確率が記述された領域 (図 8において 「出力行動」 の列 よりも下側でかつ 「データの範囲」 の行よりも右側部分) の 「 1行目」 でかつ 「 1列目」 の遷移確率を 「2 0」 〔%〕 に変更すると共に、 当該状態遷移表の 「1 行目」 でかつ 「11歹1』目」 の遷移確率を 「3 0」 〔%〕、 ……のようにそれぞれ変更 する。 またこれと共に各成長関連条件項目の行動モデル 7 0 k は、 この 「幼年期 」 用の差分ファイル 9 1 Aに記述された他のノード N O D E 32。 、 N O D E 720 、 ……についても同様にして対応する遷移確率をそれぞれ変更する。
この場合このようにして数値を変更する遷移確率の中には、 それまでの遷移確 率が 「0」 であった (すなわち一連の行動パターンの起点となるノードへの遷移 が禁止されていた) ものや、 変更後の遷移確率が 「0」 となる (すなわち一連の 行動パターンの起点となるノードへの遷移が禁止される) ものが含まれているが 、 このようにその遷移確率が 「0」 から所定の数値に変更されたり、 又は変更後 の遷移確率が 「0」 となることにより、 新たな 「成長ステージ」 においてその一 連の行動パターンが発現されるようになったり、 又はその一連の行動パターンが 発現されなくなったりする。
なおこのようにして必要な遷移確率を変更した場合においても、 変更後の状態 遷移表 8 0における対応する行に含まれる各遷移確率の和が 1 0 0 〔%〕 となる ように各差分ファイル 9 1 A〜 9 1 Dにおける各遷移確率の値が選定されている
( 1 - 5 ) 本実施の形態の動作及び効果
以上の構成において、 このペットロボッ ト 1では、 全ての行動パターンが格納 された広大な状態空間のうちの基本的な行動を行うための状態空間部分をコアと して、 「誕生期」 には当該コアを含む極一部だけを使用し、 この後 「成長」 する 度に、 コア以外の使わなくなった状態空間部分を切り離すと共に新たに増やした い状態空間部分への遷移を許可するようにして、 各 「成長ステージ」 における行
動モデル 7 0 kひ)〜 7 0 k(n)を生成し、 当該生成した行動モデル 7 O k(1)〜 7 O k(n)に 従って行動する。
従ってこのペッ トロボッ ト 1では、 各 「成長ステージ」 における行動モデル 7 O kひ)〜 7 O k ( の状態空間が連続的に変化してゆくため、 「成長」 の前後における 出力行動の不連続性を軽減して、 より 自然に 「成長」 を表現することができる。 またこのペッ トロボッ ト 1では、 基本的な行動を生成するための状態空間部分を 全ての 「成長ステージ」 において共用しているため、 基本的な行動の学習結果を 順次次の 「成長ステージ」 に持ち越すことができる。
さらにこのぺッ トロボッ ト 1では、 このように基本的な行動を生成する状態空 間部分を全ての 「成長ステージ」 において共用しているため、 各 「成長ステージ 」 の行動モデル 7 O k(1)〜 7 O k(n)の作成作業が容易であり、 また従来のように各
「成長ステージ」 ごとに個別の行動モデルを用意する場合に比べて行動モデル全 体としてのデータ量を削減することもできる。
さらにこのペッ トロボッ ト 1では、 上述のように 「成長」 に合わせて不要な一 連の行動パターンの状態空間を切り離し、 必要な一連の行動パターンの状態空間 への遷移を許可するようにして各 「成長ステージ」 における行動モデル 7 O k(1) 〜 7 O k(n)を生成するようにしているため、 各一連の行動パターンを部品化する ことができ、 その分各成長関連条件項目の行動モデル 7 Ο κ の生成作業をより一 層容易化することができる。
以上の構成によれば、 全ての行動パターンが格納された広大な状態空間のうち の基本的な行動を行うための状態空間部分をコアとして、 「誕生期」 には当該コ ァを含む極一部だけを使用し、 この後 「成長」 する度に、 コア以外の使わなくな つた状態空間部分を切り離すと共に新たに増やしたい状態空間部分への遷移を許 可するようにして各 「成長ステージ」 における行動モデル 7 0 k(1)〜 7 O k(n)を生 成するようにしたことにより、 各 「成長ステージ」 における行動モデル 7 O k(1) 〜 7 O k(n)の状態空間を連続的に変化させて、 「成長」 の前後における出力行動の 不連続性を軽減することができる。 かくするにっきより自然に 「成長」 を表現す
ることができ、 かく してエンターティメント性を向上させ得るぺッ トロボッ トを 実現できる。
( 1 - 6) 他の実施の形態
なお上述の第 1の実施の形態においては、 本発明を 4足歩行型のぺッ トロボッ ト 1に適用するようにした場合について述べたが、 本発明はこれに限らず、 この 他いわゆる玩具、 トイ、 プラモデル等を含むすべての種々の形態のロボッ トに広 く適用することができる。 また第 2〜第 5の実施の形態においても同じであるも のとする。
また上述の第 1の実施の形態においては、 「成長」 に伴って各 「成長ステージ 」 の行動モデル 7 Ok(1)〜 7 Ok(5)の状態空間を順次拡大してゆく場合について述 ベたが、 本発明はこれに限らず、 各 「成長ステージ」 の行動モデル 7 Ok(1)〜 7 Ok(5)の状態空間を順次縮小させたり、 又は拡大の途中でいずれかの 「成長ステ —ジ」 においてその行動モデル 7 Ok(1)〜 Ί Ok(5)の状態空間を縮小させたりする ようにしても良い。
さらに上述の第 1の実施の形態においては、 ペッ トロボッ ト 1が 5段階で 「成 長」 するようにした場合について述べたが、 本発明はこれに限らず、 5以外の段 階数で 「成長」 するようにしても良い。
さらに上述の第 1の実施の形態においては、 行動モデル (ペッ トロボッ ト 1が 行える全ての行動パターンを含む行動モデル) を保持する保持手段と、 当該行動 モデルの一部又は全部の状態空間を用いて行動を生成する行動生成手段とを 1つ の行動モデル 7 Ok 及び。 PU 1 0により構成するようにした場合について述べ たが、 本発明はこれに限らず、 この他種々の構成を広く適用することができる。
( 2) 第 2の実施の形態
( 2— 1 ) 原理
図 1 1に示すように、 「成長」 によって新たに取得する一連の行動パターン P A, への遷移が特定の状態 (ノード NODEA ) からしか起こらない場合には、 その遷移確率 Pi を変更するだけでその行動パターンの発現を制御することがで
きる。 しかしながら図 1 3に示すように、 この遷移が複数の状態 (ノード NOD EA1〜NODEA3) から起こる場合には、 対応する全ての遷移確率 P10〜P12を コ トロールすることは容易ではない。
そこでこのような場合には、 図 1 4に示すように、 行動モデル中に仮想的なノ ード (以下、 これを仮想ノードと呼ぶ) NODEK を設けると共に、 各ノード N OD EA1〜NOD EA3から一連の行動パターン P At の起点となるノ一ド NOD EB への遷移を仮想ノード NOD Εκ への遷移に置き換え、 仮想ノード NODE κ と、 上述の一連の行動パターン P の起点のノード NOD EB とを対応付け るようにすれば良い。
このようにすることによって、 遷移確率のコントロールも容易となり、 また 「 成長」 に伴ってこの一連の行動パターン P を他の一連の行動パターン P A2 に切り換える場合においても、 仮想ノード NODEK に対する実ノードの対応付 けを前の行動パターン P At の起点のノード NOD EB から次の行動パターン P A2 の起点のノード NODEc に変更するだけでこれを容易に行うことができる
(2 - 2) 本実施の形態によるぺッ トロボッ ト 1 0 0の構成
ここで図 1の 1 00は全体として第 2の実施の形態によるぺッ トロボッ トを示 すものであり、 「成長」 に伴う各成長関連条件項目の行動モデル 70k (図 9) の構成が異なる点を除いて第 1の実施の形態のぺッ トロボッ ト 1 と同様に構成さ れている。
すなわちこのぺッ トロボッ ト 1 0 0において、 各成長関連条件項目の行動モデ ル 70k には、 図 1 5に示すように、 それぞれ 「立つ」、 「座る」 及び 「歩く」 な どの各 「成長ステージ」 に共通した基本的な行動を生成するための行動モデル ( 以下、 これを基本行動モデルと呼ぶ) 1 0 1が設けられており、 この基本行動モ デル 1 0 1内にいくつかの仮想ノード NODEK1〜NODEKnが設けられている また各成長関連条件項目の行動モデル 70k には、 各 「成長ステージ」 にそれ
ぞれ対応させて、 行動パターンファイル 1 0 2A〜 1 0 2 Eが設けられている。 これら各行動パターンファイル 1 0 2 A〜 1 0 2 Eは、 それぞれ図 1 6に示すよ うに、 その 「成長ステージ」 において基本行動モデル 1 0 1内の各仮想ノード N ODEK1〜NODEKnとそれぞれ対応付けられた各一連の行動パターン PAi 〜 P An をそれぞれ生成するノード群の状態遷移表を集めてファイル化したもので ある。
さらに各成長関連条件項目の行動モデル 70k には、 図 1 7に示すように、 各 「成長ステージ」 における各仮想ノード NODEK1〜NODEKnと実ノード (そ の 「成長ステージ」 の行動パターンファイル 1 0 2 A〜 1 0 2 Eに格納されたい ずれかの行動パターン PAt 〜ΡΑΠ の起点のノード、 以下同じ) との対応関係 を表す対応表 1 0 3 Α〜 1 03 Εをまとめたファイル (以下、 これを差分フアイ ル 1 0 3と呼ぶ) が設けられている。
そして各成長関連条件項目の行動モデル 7 Ok は、 初期時には 「誕生期」 用の 行動パターンファイル 1 0 2 Aのデータを読み出してこれを基本行動モデル 1 0 1に付加すると共に、 差分ファイル 1 0 3に格納されている 「誕生期」 用の対応 表 1. 0 3 Aに基づいて基本行動モデル 1 0 1内の各仮想ノード NOD EK1〜NO DEK„を実ノードに変換するようにして 「誕生期」 用の行動モデル 70k(1)を生 成し、 当該行動モデル 70k(1)に基づいて行動を生成する。
また各成長関連条件項目の行動モデル 70k は、 この後学習モジュール 7 2 ( 図 5) から 「成長」 したとの通知が与えられると、 「誕生期」 用の行動パターン ファイル 1 0 2Aのデータに代えて 「幼年期」 用の行動パターンファイル 1 0 2 Bのデータを基本行動モデル 1 0 1に付加すると共に、 差分ファイル 1 0 3に格 納されている 「幼年期」 用の対応表 1 0 3 Bに基づいて基本行動モデル 1 0 1内 の各仮想ノード1^00£1^1〜1^00£ を実ノードに変換するようにして 「幼年 期」 用の行動モデル 70k(2)を生成し、 当該行動モデル 70k(2)に基づいて行動を 生成する。
さらに各成長関連条件項目の行動モデル 70k は、 この後これと同様にして、
学習モジュール 7 2から 「成長」 したとの通知が与えられる度に、 基本行動モデ ル 1 0 1に付加する行動パターンファイル 1 0 2 A〜 1 0 2 Eのデータを 「少年 期」 用、 「青年期」 用及び 「成人期」 用のものに順次変更すると共に、 差分ファ ィル 1 0 3に格納されたその 「成長ステージ」 の対応表 1 0 3 C〜 1 0 3 Eに基 づいて基本行動モデル 1 0 1内の各仮想ノード NODEK1〜NODEKnを実ノー ドに変換するようにして 「少年期」 用、 「青年期」 用及び 「成人期」 用の行動モ デル 70k ( 〜 70k(5)を順次生成し、 その行動モデル70k(3)〜 7 Ok(5)に基づいて 行動を生成する。
このようにしてこのぺッ トロボッ ト 1 00では、 基本行動モデル 1 0 1内の各 仮想ノードNODEK1〜NODEKnにそれぞれ対応させる行動パターンPA1 〜 PAn を 「成長」 に伴って順次変更するようにして、 「成長」 に応じて行動を変 化させるようになされている。
(2— 3) 本実施の形態の動作及び効果
以上の構成において、 このペッ トロボッ ト 1 00では、 基本行動モデル 1 0 1 内の各仮想ノード N O D E K1〜 N O D E Knにそれぞれ対応させる行動パターン Ρ
〜ΡΑη を 「成長」 に伴って順次変更するようにして、 「成長」 に応じて行 動を変化させる。
従ってこのぺッ トロボッ ト 1 00では、 基本的な行動モデルを生成するための 基本行動モデル 1 0 1を全ての 「成長ステージ」 において共用しているため、 全 ての 「成長ステージ」 を通して行動に一貫性をもたせることができ、 また基本的 な行動の学習結果を順次次の 「成長ステージ」 に持ち越すことができる。
またこのぺッ トロボッ ト 1 00では、 このように基本行動モデル 1 0 1を全て の 「成長ステージ」 において共用するため、 行動モデルの作成作業が容易であり 、 また従来のように各 「成長ステージ」 ごとに個別の行動モデルを用意する場合 に比べて行動モデル全体としてのデータ量を削減することもできる。
さらにこのぺッ トロボッ ト 1 0 0では、 基本行動モデル 1 0 1内の各仮想ノ一 ド NODEK1〜NODEKnに対応付ける各行動パターン Ρ 〜 P An を部品化
することができ、 その分各成長関連条件項目の行動モデル 7 Οκ の生成作業をよ り一層容易化することができる。
さらにこのぺッ トロボッ ト 1 00では、 このような第 1の実施の形態において 得られる作用効果と同様の作用効果に加えて、 上述のように仮想ノ一ド NODE Kl〜NOD EKnを利用するようにしているために、 例えば図 1 3のようにある一 連の行動パターン P への遷移があちらこちらのノード NOD EA1〜NO D E A3から起こる場合においても、 各成長関連条件項目の行動モデル 70K を容易に 生成し得るようにすることができる。
以上の構成によれば、 基本行動モデル 1 0 1内に仮想ノード NO D EK1〜NO DEKnを設けると共に、 各仮想ノード NODEK1〜NODEKnにそれぞれ 「誕生 期」 用の各一連の行動パターン P 〜PAn (の起点のノード) を対応付ける ようにして各 「誕生期」 用の行動モデル 70kU)を生成すると共に、 この後 「成 長」 に伴って各仮想ノード NODEK1〜NODEKnにそれぞれ対応付ける各一連 の行動パターン 〜PAn を 「幼年期」 用、 「少年期」 用、 「青年期」 用及び 「成人期」 用に切り換えてゆく ようにして、 これら 「幼年期」 用、 「少年期」 用 、 「青年期」 用及び 「成人期」 用の各行動モデル 70k(2)〜 70k(5)を生成するよう にしたことにより、 全ての 「成長ステージ」 を通して行動に一貫性をもたせるこ とができる。 かくするにっきより 自然に 「成長」 を表現することができ、 かく し てエンターティメント性を向上させ得るぺッ トロボッ トを実現できる。
(2 - 4) 他の実施の形態
なお上述の第 2の実施の形態においては、 本発明を 4足歩行型のぺッ トロボッ ト 1 00に適用するようにした場合について述べたが、 本発明はこれに限らず、 この他種々の形態のロボッ トに広く適用することができる。
また上述の第 2の実施の形態においては、 「成長」 に伴って各 「成長ステージ 」 の行動モデル 70k(1)〜70k(5)の状態空間を順次拡大してゆく場合について述 ベたが、 本発明はこれに限らず、 各 「成長ステージ」 の行動モデル 70ku)〜 7 0k(5)の状態空間を順次縮小させたり、 又は拡大の途中でいずれかの 「成長ステ
ージ」 においてその行動モデル 7 0k(1)〜 7 0k(5)の状態空間を縮小させたりする ようにしても良い。
さらに上述の第 2の実施の形態においては、 ペッ トロボッ ト 1 0 0が 5段階で 「成長」 するようにした場合について述べたが、 本発明はこれに限らず、 5以外 の段階数で 「成長」 するようにしても良い。
さらに上述の第 2の実施の形態においては、 仮想ノード NODEK1〜NOD E Knに割り当てるノード群を変更する変更手段を 1つの行動モデル 7 Ok 及び C P U 1 0により構成するようにした場合について述べたが、 本発明はこれに限らず 、 この他種々の構成を広く適用することができる。
( 3 ) 第 3の実施の形態
( 3— 1 ) 第 3の実施の形態によるペットロボットの構成
図 1 8において、 1 1 0は全体として第 3の実施の形態によるぺットロボッ ト を示し、 胴体部ュ-ット 1 1 1の前後左右にそれぞれ脚部ュニット 1 1 2 A〜 1 1 2 Dが連結されると共に、 胴体部ュニッ ト 1 1 1の前端部及び後端部にそれぞ れ頭部ュ-ッ ト 1 1 3及び尻尾部ュニット 1 1 5が連結されることにより構成さ れている。
胴体部ュニッ ト 1 1 1には、 図 1 9に示すように、 C PU (C e n t r a l P r o c e s s i n g U n i t ) 1 2 0、 D RAM (D y n a m i c
R a n d o m A c c e s s Me m o r y) 1 2 1、 フラッシュ ROM ( R e a d O n l y Me m o r y) 1 2 2、 P C (P e r s o n a l
C o m p u t e r ) カードィンターフェース回路 1 2 3及び信号処理回路 1 2 4 が内部バス 1 2 5を介して相互に接続されることにより形成されたコントロール 部 1 2 6と、 このぺットロボッ ト 1 1 0の動力源としてのバッテリ 1 2 7とが収 納されている。 また胴体部ュニット 1 1 1には、 ペットロボット 1 1 0の向きや 動きの加速度を検出するための角速度センサ 1 2 8及び加速度センサ 1 2 9など も収納されている。
また頭部ュニッ ト 1 1 3には、 外部の状況を撮像するための C CD (
C h a r g e C o u p l e d D e v i c e ) カメラ 1 3 0と、 ユーザからの 「撫でる」 や 「叩く」 といった物理的な働きかけにより受けた圧力を検出するた めのタツチセンサ 1 3 1 と、 前方に位置する物体までの距離を測定するための距 離センサ 1 3 2と、 外部音を集音するためのマイクロホン 1 3 3と、 鳴き声等の 音声を出力するためのスピーカ 1 3 4と、 ペッ トロボッ ト 1 1 0の 「目」 に相当 する L E D (L i g h t Em i t t i n g D i o d e ) (図示せず) となど がそれぞれ所定位置に配設されている。
さらに各脚部ュニッ ト 1 1 2 A〜 1 1 2 Dの関節部分や、 各脚部ュ-ッ ト 1 1
2 A〜 1 1 2 D及び胴体部ュ-ッ ト 1 1 1の各連結部分、 頭部ュニッ ト 1 1 3及 び胴体部ュニッ ト 1 1 1の連結部分、 並びに尻尾部ュニッ ト 1 1 4の尻尾 1 1 4 Aの連結部分などにはそれぞれ自由度数分のァクチユエ一タ 1 3 5 〜 1 3 5n 及びポテンショメータ 1 3 6 i 〜 1 3 6n が配設されている。
そしてこれら角速度センサ 1 2 8、 加速度センサ 1 2 9、 タツチセンサ 1 3 1 、 距離センサ 1. 3 2、 マイクロホン 1 3 3、 スピーカ 1 3 4及び各ポテンショメ ータ l s ei i s en などの各種センサ並びに L E D及び各ァクチユエータ ι
3 5! 〜 1 3 5n は、 それぞれ対応するハブ 1 3 7L 〜 1 3 7N を介してコント ロール部 1 2 6の信号処理回路 1 2 4と接続され、 C CDカメラ 1 3 0及びバッ テリ 1 2 7は、 それぞれ信号処理回路 1 2 4と直接接続されている。
このとき信号処理回路 1 2 4は、 上述の各センサから供給されるセンサデータ や画像データ及び音声データを順次取り込み、 これらをそれぞれ内部バス 1 2 5 を介して DRAM 1 2 1内の所定位置に順次格納する。 また信号処理回路 1 2 4 は、 これと共にバッテリ 1 2 7から供給されるバッテリ残量を表すバッテリ残量 データを順次取り込み、 これを D RAM 1 2 1内の所定位置に格納する。
そしてこのようにして D RAM 1 2 1に格納された各センサデータ、 画像デー タ、 音声データ及びバッテリ残量データは、 この後 C PU 1 2 0がこのペッ ト口 ボッ ト 1 1 0の動作制御を行う際に利用される。
実際上 C PU 1 2 0は、 ペッ トロボッ ト 1 1 0の電源が投入された初期時、 月同
体部ュニッ ト 1 1 1の図示しない P Cカードス口ッ トに装填されたメモリカード 1 3 8又はフラッシュ ROM1 2 2に格納された制御プログラムを P Cカードィ ンターフェース回路 1 23を介して又は直接読み出し、 これを D RAM 1 2 1に 格納する。
また C PU 1 20は、 この後上述のように信号処理回路 1 24より DRAM 1 2 1に順次格納される各センサデータ、 画像データ、 音声データ及びバッテリ残 量データに基づいて自己及び周囲の状況や、 ユーザからの指示及ぴ働きかけの有 無などを判断する。
さらに C PU 1 20は、 この判断結果及び DRAM 1 2 1に格納した制御プロ グラムに基づいて続く行動を決定すると共に、 当該決定結果に基づいて必要なァ クチユエ一タ I S Si l S Sn を駆動させることにより、 頭部ュニッ ト 1 1 3 を上下左右に振らせたり、 尻尾部ュニッ ト 1 1 4の尻尾 1 1 4 Aを動かせたり、 各脚部ュニッ ト 1 1 2 A〜 1 1 2 Dを駆動させて歩行させるなどの行動を行わせ る。
またこの際 C PU 1 20は、 必要に応じて音声データを生成し、 これを信号処 理回路 1 24を介して音声信号としてスピーカ 1 34に与えることにより当該音 声信号に基づく音声を外部に出力させたり、 上述の L EDを点灯、 消灯又は点滅 させる。
このようにしてこのぺッ トロボッ ト 1 1 0においては、 自己及び周囲の状況や 、 ユーザからの指示及び働きかけに応じて自律的に行動し得るようになされてい る。
(3 - 2) 制御プログラムのソフ トウェア構成
ここでぺッ トロボッ ト 1 1 0における上述の制御プログラムのソフトウェア構 成を図 20に示す。 この図 20において、 デバイス · ドライバ · レイヤ 1 4 0は 、 この制御プログラムの最下位層に位置し、 複数のデバイス ' ドライバからなる デバイス · ドライノ 'セッ ト 1 4 1から構成されている。 この場合各デバイス · ドライバは、 CCDカメラ 1 3 0 (図 1 9) やタイマ等の通常のコンピュータで
用いられるハードウエアに直接アクセスすることを許されたオブジェク トであり 、 対応するハードウエアからの割り込みを受けて処理を行う。
またロボティック ·サーバ ·オブジェク ト 1 4 2は、 デバイス · ドライ ノ ' レ ィャ 1 4 0の上位層に位置し、 例えば上述の各種センサゃァクチユエータ 1 3 5 ! 〜 1 3 5 n 等のハードウェアにアクセスするためのィンターフェースを提供す るソフトウェア群でなるバーチャル · ロボッ ト 1 4 3 と、 電源の切換えなどを管 理するソフトウェア群でなるパワーマネージャ 1 4 4と、 他の種々のデバイス · ドライバを管理するソフトウエア群でなるデバイス . ドライ ノ ·マネージャ 1 4 5と、 ペッ トロボッ ト 1 1 0の機構を管理するソフ トウエア群でなるデザインド • ロボッ ト 1 4 6と力 ら構成されている。
マネージャ .オブジェク ト 1 4 7は、 オブジェク ト ·マネージャ 1 4 8及びサ 一ビス ·マネージャ 1 4 9から構成されている。 この場合オブジェク ト ·マネー ジャ 1 4 8は、 ロボティック ·サーバ ·オブジェク ト 1 4 2、 ミ ドル ' ウェア ' レイヤ 1 5 0、 及びアプリケーシヨン . レイヤ 1 5 1に含まれる各ソフトウエア 群の起動や終了を管理するソフトウエア群であり、 サービス · マネージャ 1 4 9 は、 メモリカード 1 3 8 (図 1 9 ) に格納されたコネクションファイルに記述さ れている各ォブジェク ト問の接続情報に基づいて各ォブジェク トの接続を管理す るソフトウェア群である。
ミ ドル . ウェア . レイヤ 1 5 0は、 口ボテイツク .サーバ .オブジェク ト 1 4 2の上位層に位置し、 画像処理や音声処理などのこのぺッ トロボッ ト 1 1 0の基 本的な機能を提供するソフトウエア群から構成されている。 またアプリケーショ ン ' レイヤ 1 5 1は、 ミ ドル ' ウェア ' レイヤ 1 5 0の上位層に位置し、 当該ミ ドル ' ウェア ' レイヤ 1 5 0を構成する各ソフトウェア群によって処理された処 理結果に基づいてぺッ トロボッ ト 1 1 0の行動を決定するためのソフトウェア群 から構成されている。
なおミ ドル · ウェア · レイヤ 1 5 0及びアプリケ一ション · レイヤ 1 5 1の具 体なソフトウエア構成をそれぞれ図 2 1及び図 2 2に示す。
ミ ドル . ウェア ' レイヤ 1 50においては、 図 2 1からも明らかなように、 音 階認識用、 距離検出用、 姿勢検出用、 タツチセンサ用、 動き検出用及び色認識用 の各信号処理モジユーノレ 1 60〜 1 6 5並びに入力セマンティクスコンバータモ ジュール 1 6 6などを有する認識系 1 6 7と、 出力セマンティクスコンバ一タモ ジュール 1 6 7並びに姿勢管理用、 トラッキング用、 モーショ ン再生用、 歩行用 、 転倒復帰、 L ED点灯用及び音再生用の各信号処理モジュール 1 6 8〜 1 74 などを有する出力系 1 7 5とから構成されている。
この場合認識系 1 6 7の各信号処理モジュール 1 60〜 1 6 5は、 口ボティッ ク ·サーノく ·オブジェク ト 1 4 2のバーチヤノレ · ロボッ ト 1 4 3により DRAM 1 2 1 (図 1 9) から読み出される各センサデータや画像データ及び音声データ のうちの対応するデータを取り込み、 当該データに基づいて所定の処理を施して 、 処理結果を入力セマンティクスコンバ一タモジュール 1 6 6に与える。
入力セマンティクスコンバータモジュール 1 6 6は、 これら各信号処理モジュ ール 1 6 0〜 1 6 5から与えられる処理結果に基づいて、 「ボールを検出した」、
「転倒を検出した」、 「撫でられた」、 「叩かれた」、 「ドミ ソの音階が聞こえた」、 「 動く物体を検出した」 又は 「障害物を検出した」 などの自己及び周囲の状況や、 ユーザからの指令及び働きかけを認識し、 認識結果をアプリケーショ ン · レイヤ 1 5 1 (図 1 9 ) に出力する。
アプリケーション . レイヤ 1 5 1においては、 図 2 2に示すように、 行動モデ ルライブラリ 1 8 0、 行動切換えモジュール 1 8 1、 学習モジュール 1 8 2、 感 情モデル 1 8 3及び本能モデル 1 84の 5つのモジュールから構成されている。 この場合行動モデルライブラリ 1 8 0には、 図 2 3に示すように、 「バッテリ 残量が少なくなつた場合」、 「転倒復帰する場合」、 「障害物を回避する場合」、 「感 情を表現する場合」、 「ボールを検出した場合」 などの予め選択されたいくつかの 条件項目にそれぞれ対応させて、 それぞれ独立した行動モデル 1 8 〜 1 8 0 n が設けられている。
そしてこれら行動モデル 1 8 0 〜 1 8 On は、 それぞれ入力セマンティクス
コンバータモジュール 1 6 6から認識結果が与えられたときや、 最後の認識結果 が与えられてから一定時間が経過したときなどに、 必要に応じて後述のように感 情モデル 1 8 3に保持されている対応する情動のパラメータ値や、 本能モデル 1 84に保持されている対応する欲求のパラメータ値を参照しながら続く行動をそ れぞれ決定し、 決定結果を行動切換えモジュール 1 8 1に出力する。
なおこの実施の形態の場合、 各行動モデル 1 8 〜 1 8 On は、 次の行動を 決定する手法として、 図 24に示すような 1つのノード (状態) NODE。 ' 〜 NODEn ' から他のどのノード NODE。 ' 〜NODEn ' に遷移するかを各 ノード NODE。 ' 〜NODEn ' 間を接続するアーク A R C i ' 〜ARCn に対してそれぞれ設定された遷移確率 Pt ' 〜Pn ' に基づいて確率的に決定す る確率ォートマトンと呼ばれるアルゴリズムを用いる。
具体的に、 各行動モデル 1 8 〜 1 8 On は、 それぞれ自己の行動モデル 1 8 〜 1 8 On を形成する各ノード NODE。 ' 〜NODEn ' にそれぞれ対 応させて、 これらノード NODE。 ' 〜NODEn ' ごとの図 2 5に示すような 状態遷移表 1 90を有している。
この状態遷移表 1 90では、 そのノード NODE。 ' 〜NODEn ' において 遷移条件とする入力イベント (認識結果) が 「入力イベン ト名」 の行に優先順に 列記され、 その遷移条件についてのさらなる条件が 「データ名」 及び 「データ範 囲」 の行における対応する列に記述されている。
従って図 2 5の状態遷移表 1 90で表されるノード NODE10Q ' では、 「ボ ールを検出 (BAL L)」 という認識結果が与えられた場合に、 当該認識結果と 共に与えられるそのボールの 「大きさ (S I Z E)」 力 S 「0から 1 000」 の範 囲であることや 「障害物を検出 (OB S TAC L E) という認識結果が与えら れた場合に、 当該認識結果と共に与えられるその障害物までの 「距離 (D I S— T ANC E) J 力 S 「0から 1 00」 の範囲であることが他のノードに遷移するた めの条件となっている。
またこのノード NODE10。 ' では、 認識結果の入力がない場合においても、
行動モデル 1 8 〜 1 8 0n が周期的に参照する感情モデル 1 8 3及び本能モ デル 1 84に保持された各情動及び各欲求のパラメータ値のうち、 又は感情モデ ル 1 8 3に保持された 「喜び ( J O Y)」、 「驚き (SURP R I S E)J 若しくは
「悲しみ ( S AD NE S S )」 のいずれかのパラメータ直が 「 5 0力、ら 1 00」 の範囲であるときには他のノードに遷移することができるようになっている。 また状態遷移表 1 90では、 「他のノードへの遷移確率」 の欄における 「遷移 先ノード」 の列にそのノード NODE。 ' 〜NODEn ' から遷移できるノード 名が列記されると共に、 「入力イベント名」、 「データ値」 及び 「データの範囲」 の行に記述された全ての条件が揃ったときに遷移できる他の各ノード NODE 0 ' 〜NODEn z への遷移確率が 「他のノードへの遷移確率」 の欄内の対応す る箇所にそれぞれ記述され、 そのノード NODEo ' 〜NODEn ' に遷移する 際に出力すべき行動が 「他のノードへの遷移確率」 の欄における 「出力行動」 の 行に記述されている。 なお 「他のノードへの遷移確率」 の欄における各行の確率 の和は 1 0 0 〔%〕 となっている。
従って図 2 5の状態遷移表 1 90で表されるノード NODE10Q ' では、 例え ば 「ボールを検出 (BAL L)」 し、 そのボールの 「S I Z E (大きさ)」 「0 から 1 00 0」 の範囲であるという認識結果が与えられた場合には、 「3 0 〔% 〕」 の確率で 「ノード NOD E12。 ' (n o d e 1 20 )」 に遷移でき、 そのと き 「ACT I ON 1」 の行動が出力されることとなる。
そして各行動モデル 1 8 〜 1 8 0n は、 それぞれこのような状態遷移表 1 9 0として記述されたノード NODE。 ' 〜NODEn ' がいくつも繋がるよう にして構成されており、 入力セマンティクスコンバータモジュール 1 6 6から認 識結果が与えられたときなどに、 対応するノード NODE。 ' 〜NODEn ' の 状態遷移表 1 90を利用して確率的に次の行動を決定し、 決定結果を行動切換え モジュール 1 8 1に出力するようになされている。
行動切換えモジュール 1 8 1は、 行動モデルライブラリ 1 8 0の各行動モデル 1 8 〜 1 80n からそれぞれ出力される行動のうち、 予め定められた優先順
位の高い行動モデル 1 8 0^ 〜 1 8 0n から出力された行動を選択し、 当該行動 を実行すべき旨のコマンド (以下、 これを行動コマンドと呼ぶ) をミ ドル · ゥェ ァ · レイヤ 1 5 0の出力セマンティクスコンバータ 1 6 7に送出する。 なおこの 実施の形態においては、 図 2 3において下側に表記された行動モデル 1 8 0 〜 1 8 0n ほど優先順位が高く設定されている。
また行動切換えモジュール 1 8 1は、 行動完了後に出力セマンティクスコンパ ータ 1 6 7から与えられる行動完了情報に基づいて、 その行動が完了したことを 学習モジュール 1 8 2、 感情モデル 1 8 3及ぴ本能モデル 1 8 4に通知する。 一方、 学習モジユーノレ 1 8 2は、 入力セマンティクスコンバータ 1 6 6から与 えられる認識結果のうち、 「叩かれた」 や 「撫でられた」 など、 ユーザからの働 きかけとして受けた教示の認識結果を入力する。
そして学習モジュール 1 8 2は、 この認識結果及び行動切換えモジュール 1 8 1からの通知に基づいて、 「叩かれた (叱られた)」 ときにはその行動の発現確率 を低下させ、 「撫でられた (誉められた)」 ときにはその行動の発現確率を上昇さ せるように、 行動モデルライブラリ 1 8 0における対応する行動モデル 1 8 0, 〜 1 8 0n の対応する遷移確率を変更する。
他方、 感情モデル 1 8 3は、 「喜び ( j o y )」、 「悲しみ ( s a d n e s s )」、 「怒り (a n g e r )」、 「驚き ( s u r p r i s e )」、 「嫌悪 ( d i s g u s t ) 」 及び 「恐れ ( f e a r )」 の合計 6つの情動について、 各情動ごとにその情動 の強さを表すパラメータを保持している。 そして感情モデル 1 8 3は、 これら各 情動のパラメータ値を、 それぞれ入力セマンティクスコンバータモジュール 1 6 6から与えられる 「叩かれた」 及び 「撫でられた」 などの特定の認識結果と、 経 過時間及び行動切換えモジュール 1 8 1からの通知となどに基づいて順次更新す るようになされている。
具体的に感情モデル 1 8 3は、 入力セマンティクスコンバータ 1 6 6からの認 識結果及びそのときのぺッ トロポッ ト 1 1 0の行動がその情動に対して作用する 度合い (予め設定されている) と、 本能モデル 1 8 4が保持している各欲求のパ
ラメータ値及びそのときのぺッ トロボッ ト 1 1 0の行動がその情動に対して作用 する度合い (予め設定されている) と、 他の情動から受ける抑制及び刺激の度合 いと、 経過時間となどに基づいて所定の演算式により算出されるその情動の変動 量を Δ Ε 〔 t〕 ' 、 現在のその情動のパラメータ値を E 〔 t〕 ' 、 認識結果等に 応じてその情動を変化させる割合 (以下、 これを感度と呼ぶ) を表す係数を k e ' として、 所定周期で次式
E 〔 t + l〕 ' =E 〔 t〕 ' + k ΧΔΕ [ t ] ' (4 ) を用いて次の周期におけるその情動のパラメータ値 E [ t + 1 ] ' を算出する。 そして感情モデル 1 8 3は、 この演算結果を現在のその情動のパラメータ値 E 〔 t〕 ' と置き換えるようにしてその情動のパラメータ値を更新する。 なお各認 識結果や行動切換えモジュール 1 8 1からの通知に対してどの情動のパラメータ 値を更新するかは予め決められており、 例えば 「叩かれた」 といった認識結果が 与えられた場合には 「怒り」 の情動のパラメータ値が上がり、 「撫でられた」 と いった認識結果が与えられた場合には 「喜び」 の情動のパラメータ値が上がる。 これに対して本能モデル 1 8 4は、 「運動欲 (e x e r c i s e)」、 「愛情欲 ( a f f e c t i o n)」、 「食欲 ( a p p e t i t e )」 及び 「好奇心 ( c u r i — o s i t y)j の互いに独立した 4つの欲求について、 これら欲求ごとにその欲 求の強さを表すパラメータを保持している。 そして本能モデル 1 8 4は、 これら 欲求のパラメータ値を、 それぞれ入力セマンティクスコンバータモジュール 1 6 6から与えられる認識結果や、 経過時間及び行動切換えモジュール 1 8 1からの 通知などに基づいて順次更新するようになされている。
具体的に本能モデル 1 8 4は、 「運動欲」、 「愛情欲」 及び 「好奇心」 について は、 ペッ トロボッ ト 1 1 0の行動出力、 経過時間及び認識結果などに基づいて所 定の演算式により算出されるその欲求の変動量を Δ I 〔k〕 ' 、 現在のその欲求 のパラメータ値を I 〔k〕 ' 、 その欲求の感度を表す係数を ' として、 所定
周期で次式
I [ k + 1 ] ' = I 〔k〕 ' + k, ' ΧΔ I 〔k〕 ' (5) を用いて次の周期におけるその欲求のパラメータ値 I 〔k + l〕 ' を算出し、 こ の演算結果を現在のその欲求のパラメータ値 I 〔k〕 ' と置き換えるようにして その欲求のパラメータ値を更新する。 なお行動出力や認識結果等に対してどの欲 求のパラメータ値を変化させるかは予め決められており、 例えば行動切換えモジ ユール 1 8 1からの通知 (行動を行ったとの通知) があったときには 「運動欲」 のパラメータ値が下がる。
また本能モデル 1 84は、 「食欲」 については、 入力セマンティクスコンバー タモジュール 1 6 6を介して与えられるバッテリ残量データに基づいて、 バッテ リ残量を として、 所定周期で次式
I 〔k〕 ' = 1 00— BL ' (6) により 「食欲」 のパラメータ値 I 〔k〕 ' を算出し、 この演算結果を現在の食欲 のパラメータ値 I 〔k〕 ' と置き換えるようにして当該 「食欲」 のパラメータ値 を更新する。
なお本実施の形態においては、 各情動及び各欲求のパラメータ値がそれぞれ 0 から 1 0 0までの範囲で変動するように規制されており、 また係数 ke ' 、 k , ' の値も各情動及び各欲求ごとに個別に設定されている。
一方、 ミ ドノレ · ウェア · レイヤ 1 5 0の出力セマンティクスコンバータモジュ —ル 1 6 7は、 図 2 1に示すように、 上述のようにしてアプリケーシヨン . レイ ャ 1 5 1の行動切換えモジュール 1 8 1から与えられる 「前進」、 「喜ぶ」、 「鳴く 」 又は 「トラッキング (ボールを追いかける)」 といった抽象的な行動コマンド を出力系 1 7 5の対応する信号処理モジュール 1 6 8〜 1 74に与える。
そしてこれら信号処理モジュール 1 68〜 1 74は、 行動コマンドが与えられ ると当該行動コマンドに基づいて、 その行動を行うために対応するァクチユエ一 タ I S Si l S Sn (図 1 9) に与えるべきサ一ポ指令値や、 スピー力 1 34
(図 1 9) から出力する音の音声データ及び又は 「目」 の L EDに与える駆動デ ータを生成し、 これらのデータをロボティック ·サーバ ·オブジェク ト 1 4 2の バーチャルロボッ ト 1 4 3及び信号処理回路 1 24 (図 1 9) を順次介して対応 するァクチユエータ 1 3 5 J 〜 1 3 5n 、 スピーカ 1 3 4又は LEDに順次送出 する。
このようにしてこのぺッ トロボッ ト 1 1 0においては、 制御プログラムに基づ いて、 自己及び周囲の状況や、 ユーザからの指示及び働きかけに応じた自律的な 行動を行うことができるようになされている。
(3— 3) ペッ トロボッ ト 1 1 0の成長モデノレ
( 3 - 3 - 1 ) 行動の成長
次にこのぺッ トロボッ ト 1 1 0に実装された成長機能について説明する。 この ペッ トロボッ ト 1 1 0には、 ユーザからの働きかけ等に応じて、 あたかも本物の 動物が 「成長」 するかのごとく行動を変化させてゆく成長機能が実装されている すなわちこのペッ トロボッ ト 1 1 0には、 成長過程として 「誕生期」、 「幼年期 」、 「少年期」、 「青年期」 及び 「成人期」 の 5つの 「成長ステージ」 が設けられて いる。 そしてアプリケーション · レイヤ 1 5 1の行動モデルライブラリ 1 80 ( 図 2 2) には、 上述した 「バッテリ残量が少なくなつた場合」 等の各条件項目の うち、 「歩行状態」、 「モーション (動き)」、 「行動」 及ぴ 「サウンド (鳴き声)」 の 4つの項目に関係した全ての条件項目 (以下、 これを成長関連条件項目と呼ぶ ) について、 図 26に示すように、 行動モデル 1 8 Ok として、 「誕生期」、 「幼 年期」、 「少年期」、 「青年期」 及び 「成人期」 にそれぞれ対応させた行動モデル 1 8 0k(1)〜 1 80k(5)が設けられている。 そして行動モデルライブラリ 1 8 1では 、 これら成長関連条件項目について、 初期時には 「誕生期」 の行動モデル 1 80
k(1)を用いて次の行動を決定するようになされている。
この場合 「誕生期」 の各行動モデル 1 8 Ok(1)はノード NOD E。 ' 〜NODE η ' (図 24) の数が少なく、 またこれら行動モデル 1 8 0k(1)から出力される行 動の内容も 「パターン 1 (「誕生期」 用の歩行パターン) で前進」 や、 「パターン 1 (「誕生期」 用の鳴き声パターン) で鳴く」 のように、 「誕生期」 に対応した行 動又は動作内容となっている。
かく してこのペッ トロボッ ト 1 1 0においては、 初期時には 「誕生期」 の各行 動モデル 1 8 0k(1)に従って、 例えば 「歩行状態」 は歩幅が小さく 「よちよち歩 き」 となるように、 「モーション」 については単に 「歩く」、 「立つ」、 「寝る」 程 度の 「単純」 な動きとなるように、 「行動」 については同じ行動を繰り返し行う ことにより 「単調」 となるように、 また 「サウンド」 については 「小さく短い」 鳴き声となるように行動及び動作する。
またこのときアプリケーション ' レイヤ 1 5 1の学習モジュール 1 8 2 (図 2 2) は、 その内部に 「成長」 の度合いを表すパラメータ (以下、 これを成長パラ メータと呼ぶを保持しており、 入力セマンティクスコンバータモジュール 1 6 6 から与えられる認識結果や経過時間情報などに基づいて、 成長パラメータの値を 「撫でられた」 や 「叩かれた」 等のユーザからの働きかけ (教示) の回数や経過 時間等に応じて順次更新するようになされている。
そして学習モジュール 1 8 2は、 ペッ トロボッ ト 1 1 0に電源が投入される度 にこの成長パラメータの値を評価し、 当該値が 「幼年期」 に対応させて予め設定 された閾値を越えた場合には、 これを行動モデルライブラリ 1 80に通知する。 また行動モデルライブラリ 1 80は、 この通知が与えられると、 上述の各成長関 連条件項目について、 それぞれ使用する行動モデルを 「幼年期」 の行動モデル 1 80k(¾に変更する。
このとき 「幼年期」 の各行動モデル 1 80k(2)は 「誕生期」 の行動モデル 1 8 0k )よりもノード NODE。 ' 〜NODEn ' の数が多く、 またこれら行動モデ ル 70k(2)から出力される行動の内容も 「幼年期」 の行動に比べて難易度や複雑
さのレベル (成長レベル) が高くなつている。
かく してこのぺッ トロボッ ト 1 1 0においては、 この後はこれら行動モデル 1
8 0 k(2)に従って、 例えば 「歩行状態」 については各ァクチユエータ 1 3 5 〜 1
3 5 n (図 1 9 ) の回転速度を速くするなどして 「少しはしつかり」 と歩く よう に、 「モーショ ン」 については行動の数が増加することにより 「少しは高度かつ 複雑」 な動きとなるように、 「行動」 については 「少しは目的をもった」 行動と なるように、 また 「サウンド」 については 「少しは長く大きい」 鳴き声となるよ うに行動及び動作する。
さらに学習モジュール 1 8 4は、 この後上述の場合と同様にして、 成長パラメ ータの値が 「少年期」、 「青年期」 及び 「成人期」 にそれぞれ対応させて予め設定 された各閾値を越える度にこれを行動モデルライブラリ 1 8 1に通知する。 また 行動モデルライブラリ 1 8 1は、 この通知が与えられる度に上述の各成長関連条 件項目について、 それぞれ使用する行動モデルを 「少年期」、 「青年期」 及び 「成 人期」 の行動モデル 1 8 O k(3)〜 l 8 O k(5)に順次変更する。
このとき 「少年期」、 「青年期」 及び 「成人期」 の各行動モデル 1 8 0 k(3)〜 l
8 0 k(5)は、 それぞれ 「成長ステージ」 が上がるにつれてノード N O D E。 ' 〜N O D E n ' の数が多くなり、 またこれら行動モデル 1 8 0 k( 〜 1 8 O k(5)から出 力される行動の内容も 「成長ステージ」 が上がるにつれて行動の難易度や複雑さ のレベルが高くなっている。
この結果このペッ トロボッ ト 1 1 0では、 「成長ステージ」 が上がる (すなわ ち 「誕生期」 から 「幼年期」、 「幼年期」 から 「少年期」、 「少年期」 から 「青年期 」、 「青年期」 から 「成人期」 に変化する) に従って、 「歩行状態」 が 「よちよち 歩き」 から 「しっかり した歩き」 に、 「モーション」 が 「単純」 から 「高度 ·複 雑」 に、 「行動」 力 S 「単調」 から 「目的をもった行動」 に、 かつ 「サウンド」 力 S 「小さく短い」 から 「長く大きい」 に順次段階的に変化する。
このようにしてこのぺッ トロボッ ト 1 1 0においては、 ユーザから与えられる 教示や時間経過に応じて、 行動及び動作が 「誕生期」、 「幼年期」、 「少年期」、 「青
年期」 及び 「成人期」 の 5段階で 「成長」 するようになされている。
なおこの実施の形態の場合、 ペッ トロボッ ト 1 1 0の成長モデルは、 図 2 7に 示すように 「少年期」 以降において枝分かれするモデルとなっている。
すなわちこのぺッ トロボッ ト 1 1 0の場合、 アプリケーシヨン ' レイヤ 1 5 1 (図 2 2) の行動モデルライブラリ 1 80には、 上述の各成長関連条件項目につ いて、 「少年期」、 「青年期」 及び 「成人期」 の行動モデル 1 80k(3)〜 l 80k(5)と してそれぞれ複数の行動モデルが用意されている。
実際上、 各成長関連条件項目の例えば 「少年期」 の行動モデルとしては、 動き が雑で速い 「荒々しい」 性格の行動を行わせるための行動モデル (CH I LD 1 ' ) と、 これよりも動きが滑らかで遅い 「おっとり」 とした性格の行動を行わ せるための行動モデル (CH I LD 2f ) とが用意されている。
また 「青年期」 の行動モデルとしては、 「少年期」 の 「荒々しい」 性格よりも より動きが雑で速い 「いらいら」 した性格の行動を行わせるための行動モデル ( YOUNG 1 ' ) と、 これよりも動きが遅くかつ滑らかな 「普通」 の性格の行 動及び動作を行わせるための行動モデル (YOUNG 2' ) と、 これよりも一 層動作が遅くかつ行動量が少ない 「おっとり」 とした性格の行動を行わせるため の行動モデル (YOUNG 3 ' ) とが用意されている。
さらに 「成人期」 の行動モデルとしては、 「青年期」 の 「いらいら」 した性格 よりもより動きが雑で速く、 かつ非常に怒りやすい 「攻撃的」 な性格の行動を行 わせるための行動モデル (ADULT 1 ' ) と、 これよりも動きが滑らかで遅 く、 かつ怒りやすい 「荒々しい」 性格の行動を行わせるための行動モデル ( ADULT 2) と、 これよりも動きが滑らかで遅く、 かつ行動量が少ない 「お となしい」 性格の行動を行わせるための行動モデル (ADULT 3' ) と、 こ れよりもさらに一層動きが遅く、 かつ行動量が少ない 「静かな」 性格の行動を行 わせるための行動モデル (ADULT 4 ' ) とが用意されている。
そしてアプリケーション ' レイヤ 1 5 1の学習モジュール 1 8 2 (図 2 2) は 、 上述のように行動モデルライブラリ 1 80に対して 「成長ステージ」 を上げさ
せるための通知を行う際に、 「少年期」 以降では、 その 「成長ステージ」 におい て 「叩かれた」 及び 「撫でられた」 回数等に基づいて、 各成長関連条件項目の次 の 「成長ステージ」 の行動モデルとしてどの 「性格」 の行動モデル C H I LD 1 ' 、 CH I LD 2 ' 、 YOUNG 1 ' 〜YOUNG 3 ' 、 ADULT 1 ' 〜ADU LT 4' を用いるかを指定する。
この結果、 行動モデルライブラリ 1 80は、 この指定に基づいて、 各成長関連 条件項目について、 「少年期」 以降では使用する行動モデルを指定された 「性格 」 の行動モデルにそれぞれ変更する。
この場合 「少年期」 以降では、 次の 「成長ステージ」 に移る際、 現在の 「成長 ステージ」 での 「性格」 によって次の 「成長ステージ」 での 「性格」 が決まって おり、 図 2 7において矢印で結ばれた 「性格」 間での移行しかできない。 従って 例えば 「少年期」 において 「荒々しい」 性格の行動モデル (CH I LD 1 ' ) が用いられている場合には、 「青年期」 において 「おっとり」 と した性格の行動 モデル (YOUNG 3' ) に移行することができない。
このようにこのぺッ トロボッ ト 1 1 0においては、 あたかも本物の動物が飼い 主の飼育の仕方等によって性格を形成してゆくかのごとく、 ユーザからの働きか け等に応じて、 「成長」 に伴って 「性格」 をも変化させてゆく ようになされてい る。
(3 - 3 - 2) 感情及び本能の成長
かかる構成に加えてこのペッ トロボッ ト 1 1 0の場合、 上述のような行動の 「 成長」 に伴って感情及び本能をも 「成長」 させてゆく ようになされている。
すなわちこのぺッ トロボッ ト 1 1 0の場合、 アプリケ一ション · レイヤ 1 5 1 の感情モデル 1 8 3 (図 2 2) には、 図 28 (A) 〜 (E) に示すような各 「成 長ステージ」 ごとの各情動に対する (4) 式の係数 の値をそれぞれ記述し たファイル (以下、 これらを感情パラメータファイルと呼ぶ) 200 A〜 200 Eが格納されている。
そして感情モデル 1 8 3は、 初期時には (すなわち 「成長ステージ」 が 「誕生
期」 の段階では)、 「誕生期」 用の感情パラメータファイル 2 0 O Aに記述された 各係数 k e ' の値を利用して、 (4 ) 式に基づいて各情動のパラメータ値をそれ ぞれ周期的に更新するようになされている。
また感情モデル 1 8 3には、 上述の行動モデルライブラリ 1 8 0 (図 2 2 ) と 同様に、 「成長ステージ」 が上がる度に学習モジュール 1 8 2からこれを知らせ る通知が与えられる。 そして感情モデル 1 8 3は、 この通知が与えられる度に各 情動に対する (4 ) 式の係数 k e ' の値を、 対応する 「成長ステ^"ジ」 の感情パ ラメータファイル 2 0 0 B〜2 0 0 Eに記述された対応する値にそれぞれ更新す るようになされている。
このとき例えば 「誕生期」 では、 図 2 8 ( A ) からも明らかなように、 「喜び 」 及ぴ 「恐れ」 以外の他の情動の係数 k e ' の値が全て 「0」 に設定されている 。 従って 「誕生期」 では、 周期的に更新される各情動のパラメータのうち値が変 化するのは 「喜び」 及び 「恐れ」 の情動だけであり、 他の情動のパラメータ値は 常に一定値となるために 「喜び」 及び 「恐れ」 以外の情動が抑制される。 この結 果 「誕生期」 では、 6つの情動のうち 「喜び」 及び 「恐れ」 だけを行動として表 現できる (すなわち 6つの情動のうち 「喜び」 及び 「恐れ」 の各パラメータ値だ けを行動生成に使用する)。
また 「幼児期」 では、 図 2 8 ( B ) からも明らかなように、 「喜び」、 「恐れ」 及び 「怒り」 以外の情動の係数 k e ' の値が全て 「0」 に設定されている。 従つ て 「幼児期」 では、 周期的に更新される各情動のパラメータのうち値が変化する のは 「喜び」、 「恐れ」 及び 「怒り」 の情動だけであり、 他の情動のパラメータ値 は常に一定値となるために 「喜び」、 「恐れ」 及び 「怒り」 以外の情動が抑制され る。 この結果 「幼児期」 では、 6つの情動のうち上述の 「喜び」、 「恐れ」 及び 「 怒り」 だけを行動として表現できる。
同様にして、 図 2 8 ( C ) 〜 (E ) に示すように、 「少年期」 には、 「喜び」、 「 恐れ」、 「怒り」 及び 「驚き」 の情動だけを行動として発現でき、 「青年期」 及び 「成人期」 になると全ての情動を行動として表現できるようになる。
このようにこのぺッ トロボッ ト 1 1 0では、 図 2 9 ( A ) に示すように、 「成 長ステージ」 が上がってゆくにつれて行動として表現できる情動の数 (行動生成 に使用する情動の数) が増加してゆく ようになされ、 これにより行動の 「成長」 に伴って感情をも 「成長」 させ得るようになされている。
これと同様にして、 アプリケーション, レイヤ 1 5 1の本能モデル 1 8 4 (図 2 2 ) には、 図 3 0 ( A ) 〜 (E ) に示すような各 「成長ステージ」 ごとの各欲 求に対する (5 ) 式の係数 k i ' の値を記述したファイル (以下、 これらを本能 パラメータファイルと呼ぶ) 2 0 1 A〜2 0 1 Eが格納されている。
そして本能モデル 1 8 4は、 初期時には (すなわち 「成長ステージ」 が 「誕生 期」 の段階では)、 「誕生期」 の本能パラメータファイル 2 0 1 Aに記述された各 係数 1^ / の値を利用して、 (5 ) 式に基づいて各欲求のパラメータ値を周期的 に更新するようになされている。
また本能モデル 1 8 4には、 感情モデル 1 8 3と同様に、 「成長ステージ」 力 S 上がる度に学習モジュール 1 8 2 (図 2 2 ) からこれを知らせる通知が与えられ る。 そして本能モデル 1 8 4は、 この通知が与えられる度に各欲求に対する (5 ) 式の係数 kノ の値を、 対応する 「成長ステージ」 の本能パラメータファイル 2 0 1 B〜 2 0 1 Eに記述された対応する値にそれぞれ更新するようになされて いる。
このとき例えば 「誕生期」 では、 図 3 0 ( A ) からも明らかなように、 「食欲 」 以外の他の欲求の係数 kノ の値が全て 「0」 に設定されている。 従って 「誕 生期」 では、 周期的に更新される各欲求のパラメータのうち値が変化するのは 「 食欲」 だけとなり、 他の欲求のパラメータ値は常に一定値となるために 「食欲」 以外の欲求が抑制される。 この結果 「誕生期」 では、 4つの欲求のうち 「食欲」 だけを行動として表現することができる (すなわち 4つの欲求のうち 「食欲」 の パラメータ値だけが行動生成に使用される)。
また 「幼児期」 では、 図 3 0 ( B ) からも明らかなように、 「食欲」 及び 「愛 情欲」 以外の欲求の係数 ' の値が全て 「0」 に設定されている。 従って 「幼
児期」 では、 周期的に更新される各欲求のパラメータのうち値が変化するのは 「 食欲」 及び 「愛情欲」 だけであり、 他の欲求のパラメータは常に一定値となる。 この結果 「幼児期」 では、 「食欲」 及び 「愛情欲」 以外の欲求が抑制され、 4つ の欲求のうち 「食欲」 及び 「愛情欲」 だけを行動として表現することができる。 同様にして、 図 3 0 ( C ) 〜 (E ) に示すように、 「少年期」 には、 「食欲」、 「 愛情欲」 及び 「好奇心」 の欲求を行動として表現でき、 「青年期」 及び 「成人期 」 になると全ての欲求を行動として表現できるようになる。
このようにこのぺッ トロボッ ト 1 1 0では、 図 2 9 ( B ) に示すように、 「成 長ステージ」 が上がってゆくにつれて行動及び動作として表現できる欲求の数 ( 行動生成に使用する欲求の数) が増加してゆく ようになされ、 これにより行動の
「成長」 に伴って本能も 「成長」 させ得るようになされている。
( 3 - 4 ) 本実施の形態の動作及ぴ効果
以上の構成において、 このぺッ トロボッ ト 1 1 0では、 初期時には 6つの情動 及び 4つの欲求のうちの一部の情動及び欲求だけを行動として表現でき、 この後 「成長ステージ」 が上がるにつれて表現できる情動及び欲求の数が増加してゆく 従ってこのぺッ トロボッ ト 1 1 0では、 行動の 「成長」 に伴って感情及び本能 も 「成長」 するため、 「成長」 をより生物的かつ自然に表現することができ、 ま たユーザがその過程を楽しむことができる。
さらにこのペッ トロボッ ト 1 1 0では、 感情 ·本能モデルが最初は単純な 2つ の情動及び 1つの欲求から始まるためユーザにぺッ トロボッ ト 1 1 0の行動を把 握し易くすることができると共に、 この後ユーザがこの感情 ·本能モデルに慣れ たころに少しずつ感情 ·本能モデルが複雑になってゆくため、 各 「成長ステージ 」 での感情 ·本能モデルに対する理解や適応を容易化させることができる。
以上の構成によれば、 初期時には 6つの情動及び 4つの欲求のうちの一部の情 動及び欲求のみを行動として表現できるようにしておき、 この後 「成長ステージ 」 が上がるにつれて表現できる情動及び欲求の数を増加させるようにしたことに
より、 「成長」 をより生物的かつ自然に表現することができ、 かく してエンター ティメント性を向上させ得るぺッ トロボッ トを実現できる。
( 3 - 5 ) 他の実施の形態
なお上述の第 3の実施の形態においては、 本発明を 4足歩行型のぺッ トロボッ ト 1 1 0に適用するようにした場合について述べたが、 本発明はこれに限らず、 例えば 2足歩行型のロボッ トゃ、 これ以外のこの他種々のロボッ ト装置に広く適 用することができる。
また上述の第 3の実施の形態においては、 行動生成に使用する情動及び又は欲 求の数を、 段階的に増加させるように制限する制限手段として感情モデル 1 8 3 及び本能モデル 1 8 4を適用するようにした場合について述べたが、 本発明はこ れに限らず、 例えば行動モデルライブラリ 1 8 0や学習モジュール 1 8 2におい て行動生成に使用する情動及び又は欲求の数を、 段階的に増加させるように制限 するようにしても良い。
さらに上述の第 3の実施の形態においては、 外部から与えられる所定の刺激 ( 例えば 「叩く」 や 「撫でる」 など) 及び経過時間に基づいて、 行動生成に使用す る情動及び又は欲求の数を段階的に増加させるように制.限するようにした場合に ついて述べたが、 本発明はこれに限らず、 これに加えて又はこれに代えてこれ以 外の条件 (例えば目的とする行動をうまく行えたなど) に基づいて行動生成に使 用する情動及び又は欲求の数を段階的に増加させるように制限するようにしても 良い。
さらに上述の第 3の実施の形態においては、 行動の 「成長」 に合わせて 「誕生 期」、 「幼年期」、 「少年期」、 「青年期」 及び 「成人期」 の 5段階で情動及び欲求の 数を増加させてゆくようにした場合について述べたが、 本発明はこれに限らず、 これ以外の 「成長ステージ」 を設けるようにしても良い。
さらに上述の第 3の実施の形態においては、 情動及び欲求の各パラメータ値並 びに行動モデル 1 8 〜 1 8 0 Π に基づいて行動を生成する行動生成手段とし ての行動ライブラリ 1 8 0に複数の行動モデル 1 8 〜 1 8 Ο η を設けるよう
した場合について述べたが、 本発明はこれに限らず、 1つの行動モデルによって 行動を生成するようにしても良く、 行動生成手段の構成としては、 この他種々の 構成を広く適用することかできる。
さらに上述の第 3の実施の形態においては、 所定の刺激 (例えば 「叩く」 や 「 撫でる」) の累積及び時間経過に基づいて行動モデル 1 8 O k(1)〜 l 8 O k(B) (図 2 6 ) を成長レベルの高い行動モデル 1 8 0 k(2)〜 l 8 O k(5)に変更する行動モデル 変更手段を、 学習モジュール 1 8 2及び行動モデルライブラリ 1 8 0により構成 するようにした場合について述べたが、 本発明はこれに限らず、 この他種々の構 成を広く適用することができる。
さらに上述の第 3の実施の形態においては、 情動として 「喜び」、 「悲しみ」、 「 怒り」、 「驚き」、 「嫌悪」 及び 「恐れ」 の 6つの情動を設けると共に、 欲求として 「運動欲」、 「愛情欲」、 「食欲」 及び 「好奇心」 の 4つの欲求を設けるようにした 場合について述べたが、 本発明はこれに限らず、 情動及び欲求の数及び種類とし ては、 この他種々の数及び種類を広く適用することができる。
( 4 ) 第 4の実施の形態
( 4— 1 ) 第 4の実施の形態によるぺッ トロボッ ト 2 0 5の構成
図 1 8においては、 2 0 5は全体と して第 4の実施の形態によるぺッ トロボッ トを示し、 周囲の状況やユーザからの働きかけなどに応じて欲求及び情動の感度 を変化させる点を除いて第 3の実施の形態によるぺッ トロポッ ト 1 1 0と同様に 構成されている。
すなわち第 3の実施の形態のぺッ トロボッ ト 1 1 0においては、 上述のように 感情や本能を更新する際に (4 ) 式や (5 ) 式を用いるようになされているが、 このときの更新に影響を与える外部入力 (各種センサからのセンサデータや、 画 像データ及び音声データなど) はぺッ トロボッ ト 1 1 0がいる環境やユーザの接 し方に大きく依存する。
例えばユーザが頻繁に 「叩く」 が滅多に 「撫でる」 ことをしない場合、 このぺ ッ トロボッ ト 1 1 0はほとんどの時間は 「叩かれた」 ことで 「怒り」 の感情が増
幅された状態にあり、 たまに 「撫でられた」 く らいでは 「喜び」 の感情が行動や 動作として表現されない。 従ってこのような状況におかれたぺットロボット 1 1 0については、 「怒り」 の感度よりも 「喜び」 の感度を上げるようにして、 行動 や動作として表現される感情の数及び種類が偏らないように調整する必要がある そこでこの第 4の実施の形態によるぺットロボッ ト 20 5においては、 長い時 間に渡って各情動及び各欲求のパラメータ値をそれぞれ別々に積算すると共に、 これら積算値をパラメータ間で比較し、 その積算値が全体に占める割合が極端に 大きい場合や小さい場合にはその情動又は欲求の感度を下げ又は上げることによ り、 環境やユーザの接し方に適応して全ての情動及び欲求をまんべんなく行動や 動作として表現させ得るようになされている。
実際上、 ペットロボット 20 5においては、 図 2 2に示すアプリケ一ション . レイヤ 20 6の感情モデル 20 7が所定周期 ΔΤ' (例えば 1〜2分) ごとに、 そのときのその情動のパラメータ値を Ek ( t ) ' 、 最後に電源が投入されてか らそのときまでのその感情のパラメータ値の積算値を Ek ' 、 最後に電源が投入 されてからそのときまでの経過時間を Tall ' として、 次式
Ek " =Ek ' +Ek ( t ΧΔΤ' (7)
Tall " =Tall ' +ΔΤ' (8) により、 最後に電源が投入されてからの各情動それぞれについてのパラメータ値 の積算値 Ek " と、 最後に電源が投入されてからの経過時間 Tall " とを順次算 出する。
また感情モデル 20 7は、 ペッ トロボット 20 5の電源投入の停止時 (システ ムシャツトダウン時) にはこれら各情動の積算値 Ek 〃 及び経過時間の積算値 T all 〃 を、 それぞれ予め用意されたファイル (以下、 これを情動総合積算値ファ
ィル) に保存されている各情動ごとの総合積算値 Ek(t。tal)のうちの対応する総合 積算値 Ek(t。tal)又は経過時間の総合積算値 TalKt。tal)にそれぞれ積算してこれらを保 存する。
そして感情モデル 20 7は、 ペットロボット 20 5の電源が投入される度に情 動総合積算値ファイルから経過時間の総合積算値 Tall(t。tal)を読み出し、 当該総合 積算値 Tall(t。tal)が予め設定された閾値 (例えば 1 0時間) を越えていた場合には 情動総合積算値フアイルに保存されている各情動の総合積算値 E k(t。tal)に対して 評価を行う。 具体的にこの評価は、 各情動の総合積算値 Ek(t。tal)の合計値 (Σ Ε k(total) ) に占めるその情動の総合積算値 E k(total)の割合を算出することにより行わ れる。
そして感情モデル 2 0 7は、 ある情動の総合積算値 Ek(t。tal)の割合がその情動 に対して予め設定された閾値よりも低い場合には、 図 2 8 (A) 〜 (E) につい て上述した感情パラメータファイル 2 00 A〜 200 Eのうちの対応する 「成長 ステージ」 の感情パラメータファイル 200 A〜 200 Eに記述されているその 情動の係数 k。 ' の値を所定量 (例えば 0. 1 ) だけ上げ、 低い場合にはこの係 数 ke ' の値を所定量 (例えば 0. 1 ) だけ下げる。 このようにして感情モデル 20 7は、 その情動の感度を表す係数 ke ' を調整する。
なお閾値は、 個々のペット口ポット 20 5の個性を損なわないように、 各情動 ごとにある程度の幅をもたせて設定することができ、 この実施の形態においては 、 例えば 「喜び」 の情動については各情動の総合積算値 Ek(t。tal)の合計値 (Σ Ε k(total)) に対して 1 0 〔%〕 〜50 〔%〕、 「悲しみ」 については 5 〔%〕 〜 20 〔%〕、 「怒り」 については 1 0 〔%〕 〜6 0 〔%〕 のように設定されている。 さらに感情モデル 20 7は、 全ての情動について同様の処理をし終えると、 情 動総合積算値ファイルに保存された各情動の総合積算値 Ek(t。tal)及び経過時間の 総合積算値 Tall(t。tal)を全て 「0」 に戻し、 この後は新しく決定した各情動ごとの 係数 ke を用いて (4) 式に従って各情動のパラメータ値を変化させる一方、 ( 7) 式に従って新たに各情動のパラメータ値の積算や経過時間の積算を開始し、
この後は上述と同様の処理を繰り返す。
このようにしてこのぺッ トロボット 2 0 5においては、 各情動の感度を変化さ せるようになされ、 これにより環境やユーザの接し方に適応して全ての情動をま んべんなく行動や動作として表現できるようになされている。
これと同様にして、 本能モデル 2 0 8 (図 2 2 ) は、 所定周期 Δ Τ ' (例えば :!〜 2分) ごとに、 そのときのその欲求のパラメータ値を I k ( t ) ' 、 最後に 電源が投入されてからそのときまでのその欲求のパラメータ値の積算値を I k ' として、 次式
I k " = I k ' + I k ( t X Δ Τ ' ( 9 ) により、 最後に電源が投入されてからの各欲求それぞれについてのパラメータ値 の積算値 I k " を順次算出すると共に、 最後に電源が投入されてからの経過時間 の積算値 T all 〃 を (8 ) 式により順次算出する。
また本能モデル 2 0 8は、 ペットロボット 2 0 5の電源投入の停止時にはこれ ら各欲求の積算値 I k " 及び経過時間の積算値 T all " を、 それぞれ予め用意さ れたファイル (以下、 これを欲求積算用ファイル) に保存されている各欲求ごと の総合積算値 I k(t。tal)のうちの対応する総合積算値 I k(t。tal)又は経過時間の総合積 算値 T alut。tal)にそれぞれ積算してこれらを保存する。
そして本能モデル 2 0 8は、 ぺットロボッ ト 2 0 5の電源が投入される度に欲 求総合積算値ファイルから経過時間の総合積算値 T all(t。tal)を読み出し、 当該総合 積算値 T all(t。tal)が予め設定された閾値 (例えば 1 0時間) を越えていた場合には 欲求総合積算値ファイルに保存されている各欲求の総合積算値 I k(t。tal)に対して 評価を行う。 具体的にこの評価は、 各欲求の総合積算値 I k(t。tal)の合計値 (Σ Ι k(total)) に占めるその欲求の総合積算値 I k(t。tal)の割合を算出することにより行わ れる。
そして本能モデル 2 0 8は、 ある欲求の総合積算値 I k(t。tal)の割合がその欲求
に対して予め設定された閾値よりも低い場合には、 図 3 0 (A) 〜 (E) につい て上述した欲求パラメータファイル 2 0 1 A〜20 1 Eのうちの対応する 「成長 ステージ」 の欲求パラメータファイル 20 1 A〜20 1 Eに記述されているその 欲求の係数 ki ' の値を所定量 (例えば 0. 1 ) だけ上げ、 低い場合にはこの係 数 ' の値を所定量 (例えば 0. 1 ) 下げる。 なおこのときの閾値も、 上述と 同様にして各欲求ごとにある程度の幅をもたせて設定されている。
さらに本能モデル 20 8は、 全ての欲求について同様の処理をし終えると、 欲 求総合積算値ファイルに保存された各欲求の総合積算値 I k(t。tal)及び経過時間の 総合積算値 Tall(t。tal)を全て 「0」 に戻し、 この後は新しく決定した各欲求ごとの 係数 1^ ' を用いて (5) 式に従って各欲求のパラメータ値を変化させる一方、
(9) 式に従って新たに各欲求のパラメータ値の積算や経過時間の積算を開始し 、 この後は上述と同様の処理を繰り返す。
このようにしてこのぺッ トロボッ ト 20 5においては、 各欲求の感度を変化さ せるようになされ、 これにより環境やユーザの接し方に適応して全ての欲求をま んべんなく行動や動作として表現できるようになされている。
(4 - 2) 本実施の形態の動作及び効果
以上の構成において、 このぺッ トロボッ ト 20 5では、 各情動及び欲求のパラ メータ値をそれぞれ順次積算すると共に、 この積算結果に基づいて各情動及び欲 求の感度を所定周期 ΔΤ' で変化させる。
従ってこのぺッ トロボッ ト 20 5では、 環境やユーザの接し方に適応して全て の欲求をまんべんなく行動や動作として表現でき、 その分第 3の実施の形態のぺ ッ トロボッ ト 1 1 0に比べてより一層アミーズメント性を向上させることができ る。
以上の構成によれば、 各情動及び欲求のパラメータ値をそれぞれ順次積算する と共に、 この積算結果に基づいて各情動及び欲求の感度を所定周期 ΔΤ' で変化 させるようにしたことにより、 環境やユーザの接し方に適応して全ての欲求をま んべんなく行動や動作として表現し得るようにすることができ、 かく してより一
層アミーズメント性を向上させ得るぺッ トロボッ トを実現できる。
( 4 - 3 ) 他の実施の形態
なお上述の第 4の実施の形態においては、 本発明を 4足歩行型のぺッ トロボッ ト 2 0 5に適用するようにした場合について述べたが、 本発明はこれに限らず、 例えば 2足歩行型のロボッ トゃ、 これ以外のこの他種々のロボッ ト装置に広く適 用することができる。
また上述の第 4の実施の形態においては、 行動生成に使用する情動及び又は欲 求の数を、 段階的に増加させるように制限する制限手段として感情モデル 2 0 7 及び本能モデル 2 0 8を適用するようにした場合について述べたが、 本発明はこ れに限らず、 例えば行動モデルライブラリ 1 8 0や学習モジュール 1 8 2におい て行動生成に使用する情動及ぴ又は欲求の数を、 段階的に増加させるように制限 するようにしても良い。
さらに上述の第 4の実施の形態においては、 外部から与えられる所定の刺激 ( 例えば 「叩く」 や 「撫でる」 など) 及び経過時間に基づいて、 行動生成に使用す る情動及び又は欲求の数を段階的に増加させるように制限するようにした場合に ついて述べたが、 本発明はこれに限らず、 これに加えて又はこれに代えてこれ以 外の条件 (例えば目的とする行動をうまく行えたなど) に基づいて行動生成に使 用する情動及び又は欲求の数を段階的に増加させるように制限するようにしても 良い。
さらに上述の第 4の実施の形態においては、 図 2 9 ( A ) や (B ) に示すよう な順番で情動及び欲求を増加させてゆく ようにした場合について述べたが、 本発 明はこれに限らず、 これ以外の順番で情動及び又は欲求を増加させてゆくように しても良い。
さらに上述の第 4の実施の形態においては、 行動の 「成長」 に合わせて 「誕生 期」、 「幼年期」、 「少年期」、 「青年期」 及び 「成人期」 の 5段階で情動及び欲求の 数を増加させてゆく ようにした場合について述べたが、 本発明はこれに限らず、 これ以外の 「成長ステージ」 を設けるようにしても良い。
さらに上述の第 4の実施の形態においては、 行動生成に使用する情動及び欲求 の数が順次増加してゆく場合について述べたが、 本発明はこれに限らず、 始めか ら又は途中から行動生成に使用する情動及び欲求の数を減少させてゆく (例えば 「成人期」 のあとに 「老年期」 などの 「成長ステージ」 を設けて 「成長ステージ 」 が 「老年期」 に移行する際には感情や欲求を減少させるなど) ようにしても良 レ、。
さらに上述の第 4の実施の形態においては、 情動及び欲求の各パラメータ値並 びに行動モデル 1 8 〜 1 8 O n に基づいて行動を生成する行動生成手段とし ての行動ライブラリ 1 8 0に複数の行動モデル 1 8 0 i 〜 1 8 O n を設けるよう した場合について述べたが、 本発明はこれに限らず、 1つの行動モデルによって 行動を生成するようにしても良く、 行動生成手段の構成としては、 この他種々の 構成を広く適用することかできる。
さらに上述の第 4の実施の形態においては、 所定の刺激 (例えば 「叩く」 や Γ 撫でる」) の累積及び時間経過に基づいて行動モデル 1 8 O k(1)〜 l 8 O k(5) (図 2 6 ) を成長レベルの高い行動モデル 1 8 O k(2)~ 1 8 O k(5)に変更する行動モデル 変更手段を、 学習モジュール 1 8 2及び行動モデルライブラリ 1 8 0により構成 するようにした場合について述べたが、 本発明はこれに限らず、 この他種々の構 成を広く適用することができる。
さらに上述の第 4の実施の形態においては、 情動として 「喜び」、 「悲しみ」、 Γ 怒り」、 「驚き」、 「嫌悪」 及び 「恐れ」 の 6つの情動を設けると共に、 欲求として 「運動欲」、 「愛情欲」、 「食欲」 及び 「好奇心」 の 4つの欲求を設けるようにした 場合について述べたが、 本発明はこれに限らず、 情動及ぴ欲求の数及び種類とし ては、 この他種々の数及び種類を広く適用することができる。
さらに上述の第 4の実施の形態においては、 情動及び又は欲求更新手段として の感情モデル 2 0 7及び本能モデル 2 0 8が、 外部から与えられる刺激及び経過 時間に基づいて各情動及び各欲求のパラメータ値を更新するようにした場合につ いて述べたが、 本発明はこれに限らず、 これ以外の条件に基づいて各情動及び各
欲求のパラメータ値を更新するようにしても良い。
さらに上述の第 4の実施の形態においては、 感度変更手段としての感情モデル 2 0 7及び本能モデル 2 0 8が各情動又は各欲求に対する感度をそれぞれ更新す る手法として、 (4 ) 式又は (9 ) 式の計数 k e ' 、 k i ' の値を変更するよう にした場合について述べたが、 本発明はこれに限らず、 これ以外の手法により各 情動及び各欲求に対する感度をそれぞれ更新するようにしても良い。
さらに上述の第 4の実施の形態においては、 環境を評価する手法として、 順次 更新されるその情動又は欲求のパラメータ値の総合積算値 E k(total)、 I k(total)が全 情動又は全欲求のパラメータ値の総合積算値 E k(t。tal)、 I k(t。tal)の合計値 (Σ Ε k(total), ∑ I k(total)) に占める割合に基づいて評価するようにした場合について述 ベたが、 本発明はこれに限らず、 例えば 「叩かれた」 や 「撫でられた」 などの特 定の外部刺激の回数や頻度に基づいて環境を評価するようにしても良く、 環境を 評価する手法としては、 この他種々の手法を広く適用することができる。
( 5 ) 第 5の実施の形態
次に第 5の実施の形態について図面を用いて詳しく説明する。 本発明は、 四足 動物のように動作するぺッ ト口ボッ トに適用することができる。
ペッ トロボッ トは、 図 3 1に示すように、 他のぺッ トロボッ トの出力を検知す る検知手段 2 1 5と、 検知手段 2 1 5の検知結果に基づいて、 他のぺッ トロボッ 卜の性格を判別する性格判別手段 2 1 6と、 性格判別手段 2 1 6の判別結果に基 づいて、 性格を変化させる性格変化手殳 2 1 7とを備えている。
これにより、 ペッ トロボッ トは、 検知手段 2 1 5が検知した他のペッ トロボッ トの出力の検知結果に基づいて、 他のロボッ ト装置の性格を性格判別手段 2 1 6 により判別する。 そして、 ペッ トロボッ トは、 そのような他のペッ トロボッ トの 性格の判別結果に基づいて、 性格変化手段 2 1 7により自己の性格を変化させる ことができる。
詳しくは後述するが、 検知手段 2 1 5による検知は、 他のペッ トロボッ トの行 動に表出された感情の検知等であり、 性格変化手段 2 1 7による性格の変化は、
感情に起因した自己の行動を決定する感情モデルのパラメータの変更等によるも のである。
このようにぺッ トロボッ トは、 他のぺッ トロボッ トの行動等に基づいて自己の 性格を変化させることができる。
これにより、 ペッ トロボッ トは、 本物のぺッ トと同じように、 性格が形成され 、 その性格に基づいて動作することができるようになる。
以下、 本発明が適用されているぺッ トロボッ トの具体的な構成について説明す る。
(5— 1 ) ペッ トロボッ ト 2 1 0の構成
図 3 2に示すように、 ペッ トロボッ ト 2 1 0は全体が構成されており、 頭に相 当する頭部 2 1 1 と、 胴体に相当する本体部 2 1 2と、 足に相当する足部 2 1 3 A〜 2 1 3 Dと、 尻尾に相当する尻尾部 2 1 4とを連結することによって構成さ れ、 本体部 2 1 2に対して頭部 2 1 1、 足部 2 1 3 A〜 2 1 3 D、 尻尾部 2 1 4 を動かすことによって本物の四足動物のように動作させるようになされている。 頭部 2 1 1には、 目に相当し、 画像を撮像する例えば CCD (C h a r g e C o u p 1 e d D e v i c e ) カメラでなる画像認識部 2 2 0と、 耳に相当し 、 音声を集音するマイク 2 1 1 と、 口に相当し、 音声を発するスピーカ 2 2 2と がそれぞれ所定位置に取り付けられている。 また、 頭部 2 1 1には、 ユーザから リモートコントローラ (図示せず) を介して送信される指令を受信するリモート コントローラ受信部 2 2 3と、 ユーザの手などが接触されたことを検出するため のタツチセンサ 2 24と、 内部で生成された画像を表示するための画像表示部 2 2 5とが取り付けられている。
本体部 2 1 2には、 腹に相当する位置にバッテリ 23 1が取り付けられると共 に、 その内部にぺッ トロボッ ト 2 1 0全体の動作を制御するための電子回路 (図 示せず) 等が収納されている。
足部 2 1 3 A〜 2 1 3 Dの関節部分、 足部 2 1 3 A〜 2 1 3 Dと本体部 2 1 2 の連結部分、 本体部 2 1 2と頭部 2 1 1の連結部分、 本体部 2 1 2と尻尾部 2 1
4の連結部分などは、 それぞれのァクチユエータ 23 3 A〜2 3 3 Nによって連 結されており、 本体部 2 1 2内部に収納される電子回路の制御に基づいて駆動す るようになされている。 このようにペッ トロボッ ト 2 1 0は、 各ァクチユエータ
2 3 3 A〜2 3 3 Nを駆動させることにより、 頭部 2 1 2を上下左右に振らせた り、 尻尾部 2 1 4を振らせたり、 足部 2 1 3 A〜 2 1 3 Dを動かして歩かせたり 走らせたり して、 本物の四足動物のような動作を行わせる。
( 5 - 2 ) ペッ トロボッ ト 2 1 0の回路構成
ここで図 3 3を用いてぺッ トロボッ ト 2 1 0の回路構成について説明する。 頭 部 2 1 2は、 マイク 2 2 1及ぴリモートコントローラ受信部 2 23でなるコマン ド受信部 240と、 画像認識部 2 20及びタツチセンサ 2 24からなる外部セン サ 24 1 と、 スピーカ 2 2 2と、 画像表示部 2 2 5とを有している。 また、 本体 部 2 1 2は、 バッテリ 2 3 1を有すると共に、 その内部にぺッ トロボッ ト 2 1 0 全体の動作を制御するためのコントローラ 24 2と、 バッテリ 2 3 1の残量を検 出するためのバッテリセンサ 24 3及びぺッ トロボッ ト 2 1 0内部で発生する熱 を検出する熱センサ 244でなる内部センサ 24 5とを有している。 さらにぺッ トロボッ ト 2 1 0の所定位置にはァクチユエータ 2 3 3 A〜2 3 3 Nがそれぞれ 設けられている。
コマンド受信部 240は、 ユーザからぺッ トロポッ ト 2 1 0に与えられる指令 、 例えば 「歩け」、 「伏せ」、 「ポールを追いかけろ」 等の指令を受信するためのも のであり、 リモートコントローラ受信部 2 2 3及びマイク 2 2 1によって構成さ れている。 リモートコントローラ (図示せず) は、 ユーザの操作によって所望の 指令が入力されると、 当該入力された指令に応じた赤外線光をリモートコント口 ーラ受信部 2 23に送信する。 リモー トコントローラ受信部 2 23は、 この赤外 線光を受信して受信信号 S 1 Aを生成し、 これをコントローラ 24 2に送出する 。 マイク 2 2 1は、 ユーザが所望の指令に応じた音声を発すると、 当該ユーザの 発した音声を集音して音声信号 S 1 Bを生成し、 これをコントローラ 24 2に送 出する。 このようにコマンド受信部 240は、 ユーザからぺッ トロボッ ト 2 1 0
に与えられる指令に応じて受信信号 S 1 A及び音声信号 S 1 Bでなる指令信号 S 1を生成し、 これをコントローラ 2 4 2に供給する。
外部センサ 2 4 1のタツチセンサ 2 2 4は、 ユーザからぺッ トロボッ ト 2 1 0 への働きかけ、 例えば 「なでる」、 「たたく」 等の働きかけを検出するためのもの であり、 ユーザが当該タツチセンサ 2 2 4を触れることによって所望の働きかけ を行うと、 当該働きかけに応じた接触検出信号 S 2 Aを生成し、 これをコント口 ーラ 2 4 2に送出する。
外部センサ 2 4 1の画像認識部 2 2 0は、 ペッ トロボッ ト 2 1 0の周囲の環境 を識別した結果、 例えば 「暗い」、 「お気に入りのおもちやがある」 等の周囲の環 境情報又は例えば 「他のぺッ トロボッ トが走っている」 等の他のぺッ トロボッ ト の動きを検出するためのものであり、 当該ぺッ トロボッ ト 2 1 0の周囲の画像を 撮影し、 その結果得られる画像信号 S 2 Bをコントローラ 2 4 2に送出する。 こ の画像認識部 2 2 0にて、 他のぺッ トロポッ トによる感情を表出した行動が捕ら えられる。
このように外部センサ 2 4 1は、 ペッ トロボッ ト 2 1 0の外部から与えられる 外部情報に応じて接触検出信号 S 2 A及び画像信号 S 2 Bでなる外部情報信号 S 2を生成し、 これをコントローラ 2 4 2に送出する。
内部センサ 2 4 5は、 ペッ トロボッ ト 2 1 0自身の内部状態、 例えばバッテリ 容量が低下したを意味する 「お腹がすいた」、 「熱がある」 等の内部状態を検出す るためのものであり、 バッテリセンサ 2 4 3及び熱センサ 2 4 4から構成されて いる。
バッテリセンサ 2 4 3は、 ペッ トロボッ ト 2 1 0の各回路に電源を供給するバ ッテリ 2 3 1の残量を検出するためのものであり、 その検出した結果であるバッ テリ容量検出信号 S 3 Aをコントローラ 2 4 2に送出する。 熱センサ 2 4 4は、 ペッ トロボッ ト 2 1 0内部の熱を検出するためのものであり、 その結果した結果 である熱検出信号 S 3 Bをコントローラ 2 4 2に送出する。 このように内部セン サ 2 4 5は、 ペッ トロボッ ト 2 1 0の内部の情報に応じてバッテリ容量検出信号
S 3 A及び熱検出信号 S 3 Bでなる内部情報信号 S 3を生成し、 これをコントロ ーラ 2 4 2に送出する。
コントローラ 2 4 2は、 コマンド受信部 2 4 0から供給される指令信号 S 1 と 、 外部センサ 2 4 1 から供給される外部情報信号 S 2と、 内部センサ 2 4 5から 供給される内部情報信号 S 3 とに基づいて、 各ァクチユエータ 2 3 3 A〜2 3 3 Nを駆動させるための制御信号 S 5 A〜S 5 Nを生成し、 これらをァクチユエ一 タ 2 3 3 A〜 2 3 3 Nにそれぞれ送出して駆動させることによりぺッ トロボッ ト
2 1 0を動作させる。
その際コントローラ 2 4 2は、 外部に出力するための音声信号 S 1 0や画像信 号 S 1 1を必要に応じて生成し、 このうち音声信号 S 1 0をスピーカ 2 2 2を介 して外部に出力したり、 画像信号 S 1 1を画像表示部 2 2 5に送出して所望の画 像を表示させたりすることにより、 ユーザに必要な情報を知らせるようになされ ている。
( 5— 3 ) コントローラ 2 4 2におけるデータ処理
ここでコントローラ 2 4 2におけるデータ処理について説明する。 コント口一 ラ 2 4 2は、 コマンド受信部 2 4 0から供給される指令信号 S 1 と、 外部センサ 2 4 1から供給される外部情報信号 S 2と、 内部センサ 2 4 5から供給される内 部情報信号 S 3とを、 所定の記憶領域に予め格納されているプログラムに基づい てソフトウユア的にデータ処理を施し、 その結果得られる制御信号 S 5をァクチ ユエータ 2 3 3に供給する。
図 3 4に示すように、 コントローラ 2 4 2は、 そのデータ処理の内容を機能的 に分類すると、 感情本能モデル変化手段としての感情 ·本能モデル部 2 5 0と動 作状態決定手段としての行動決定機構部 2 5 1 と姿勢遷移手段としての姿勢遷移 機構部 2 5 2と制御機構部 2 5 3とに分けられ、 外部から供給される指令信号 S 1 と外部情報信号 S 2と内部情報信号 S 3とを感情 ·本能モデル部 2 5 0及び行 動決定機構部 2 5 1に入力する。
図 3 5に示すように、 感情 .本能モデル部 2 5 0は、 複数の独立した感情モデ
ルとしての情動ュニッ ト 2 60 A〜 2 6 0 Cでなる基本情動群 2 6 0と、 複数の 独立した欲求モデルとしての欲求ュニッ ト 26 1 A〜 2 6 1 Cでなる基本欲求群 2 6 1 とを有している。 基本情動群 2 60のうち情動ュニッ ト 260 Aは 「うれ しさ」 という情動を示すものであり、 情動ユニッ ト 2 6 O Bは 「悲しさ」 という 情動を結ぶものであり、 情動ユニッ ト 2 60 Cは 「怒り」 という情動を示すもの である。
情報ュ-ッ ト 260 A〜2 60 Cは、 情動の度合いを例えば 0〜 1 00レベル までの強度によってそれぞれ表し、 供給される指令信号 S l、 外部情報信号 S 2 及び内部情報信号 S 3に基づいて情動の強度をそれぞれ時々刻々と変化させる。 かく して感情 '本能モデル部 2 50は、 時々刻々と変化する情動ュニッ ト 260 A〜 2 6 0 Cの強度を組み合わせることによりペッ ト口ポッ ト 2 1 0の感情の状 態を表現し、 感情の時間変化をモデル化している。
また、 基本欲求群 2 6 1のうち欲求ュニッ ト 26 1 Aは 「食欲」 という欲求を 示すものであり、 欲求ュニッ ト 2 6 1 Bは 「睡眠欲」 という欲求を示すものであ り、 欲求ュニッ ト 26 1 Cは 「運動欲」 という欲求を示すものである。 欲求ュニ ッ ト 2 6 1 A〜 26 1 Cは、 情動ュニッ ト 260 A〜260 Cと同様に、 欲求の 度合いを例えば 0〜 1 00レベルまでの強度によってそれぞれ表し、 供給される 指令信号 S 1 と外部情報信号 S 2と内部情報信号 S 3とに基づいて欲求の強度を それぞれ時々刻々と変化させる。 かく して感情 ·本能モデル群 2 5 0は、 時々刻 々と変化する欲求ュニッ ト 2 6 1 A〜 2 6 1 Cの強度を組み合わせることにより ペッ トロボッ ト 2 1 0の本能の状態を表現し、 本能の時間変化をモデル化してい る。
このようにして感情 ·本能モデル部 2 50は、 指令信号 S 1 と外部情報信号 S 2と内部情報信号 S 3 とでなる入力情報 S 1〜S 3に基づいて情動ュニッ ト 2 6 0 A〜 5 0 C及び欲求ュ-ッ ト 26 1 A〜 2 6 1 Cの強度をそれぞれ変化させる 。 そして感情 '本能モデル部 2 50は、 この変化した情動ユニッ ト 2 6 0 A〜 2 6 0 Cの強度を組合せることにより感情の状態を決定すると共に、 変化した欲求
ユニッ ト 2 6 1 A〜 2 6 1 Cの強度を組み合わせることにより本能の状態を決定 し、 当該決定された感情及び本能の状態を感情 ·本能状態情報 S 1 0として行動 決定機構部 2 5 1に送出する。
ところで、 感情 ·本能モデル部 2 5 0は、 基本情動群 2 6 0のうち所望の情動 ュニッ ト同士を相互抑制的又は相互刺激的に結合し、 当該結合した情動ュ-ッ ト のうち一方の情動ュニッ トの強度を変化させると、 これに応じて他方の情動ュニ ッ トの強度が変化することになり、 自然な感情を有するぺッ トロボッ ト 2 1 0を 実現している。
すなわち図 3 6に示すように、 感情 ·本能モデル部 2 5 0は、 「うれしさ」 情 動ュ-ッ ト 2 6 0 Aと 「悲しさ」 情動ュニッ ト 2 6 0 Bとを相互抑制的に結合す ることにより、 ユーザにほめてもらったときには 「うれしさ」 情動ユニッ ト 2 6 0 Aの強度を大きくすると共に、 その際 「悲しさ」 情動ュニッ ト 2 6 0 Bの強度 を変化させるような入力情報 S 1〜S 3が供給されていなくても、 「うれしさ」 情動ユニッ ト 2 6 O Aの強度が大きくなることに応じて自然に 「悲しさ」 情動ュ ニッ ト 2 6 0 Bの強度を低下させる。 同様に感情 .本能モデル部 2 5 0は、 「悲 しさ」 情動ユニッ ト 2 6 0 Bの強度が大きくなると、 当該 「悲しさ」 情動ュニッ ト 2 6 0 Bの強度が大きくなることに応じて自然に 「うれしさ」 情動ユニッ ト 2 6 0 Aの強度を低下させる。
また、 感情 '本能モデル部 2 5 0は、 「悲しさ」 情動ユニッ ト 2 6 O Bと 「怒 り」 情動ユニッ ト 2 6 0 Cとを相互刺激的に結合することにより、 ユーザにたた かれたときには 「怒り」 情動ュ-ッ ト 2 6 0 Cの強度を大きくすると共に、 その 際 「悲しさ」 情動ュ-ッ ト 2 6 0 Bの強度を変化させるような入力情報 S 1〜S 3が供給されていなくても、 「怒り」 情動ユニッ ト 2 6 0 Cの強度が大きくなる ことに応じて自然に 「悲しさ」 情動ユニッ ト 2 6 0 Bの強度を増大させる。 同様 に感情 ·本能モデル部 2 5 0は、 「悲しさ」 情動ュ-ッ ト 2 6 0 Bの強度が大き くなると、 当該 「悲しさ」 情動ュ-ッ ト 2 6 0 Bの強度が大きくなることに応じ て自然に 「怒り」 情動ュニッ ト 2 6 0 Cの強度を増大させる。
さらに、 感情 ·本能モデル部 2 5 0は、 情動ュニッ ト 2 6 0同士を結合した場 合と同様に、 基本欲求群 2 6 1のうち所望の欲求ュニッ ト同士を相互抑制的又は 相互刺激的に結合し、 当該結合した欲求ュニッ トのうち一方の欲求ュニッ トの強 度を変化させると、 これに応じて他方の欲求ュニッ トの強度が変化することにな り、 自然な本能を有するぺッ トロボッ ト 2 1 0を実現している。
図 3 4に戻って、 感情 .本能モデル部 2 5 0は、 後段の行動決定機構部 2 5 1 からペッ ト口ポッ ト 2 1 0自身の現在又は過去の行動、 例えば 「長時間歩いた」 などの行動の内容を示す行動情報 S 1 2が供給されており、 同一の入力情報 S 1 〜S 3が与えられても、 当該行動情報 S 1 2が示すぺッ トロボッ ト 2 1 0の行動 に応じて異なる感情 ·本能状態情報 S 1 0を生成するようになされている。
具体的には図 3 7に示すように、 感情 ·本能モデル部 2 5 0は、 各情動ュニッ ト 2 6 0 A〜 2 6 0 Cの前段に、 ペッ トロボッ ト 2 1 0の行動を示す行動情報 S
1 2と入力情報 S 1〜S 3 とを基に各情動ュニッ ト 2 6 0 A〜 2 6 0 Cの強度を 増減させるための強度情報 S 1 4 A〜S 1 4 Cを生成する強度増減関数 2 6 5 A 〜2 6 5 Cをそれぞれ設け、 当該強度増減関数 2 6 5 A〜 2 6 5 Cから出力され る強度情報 S 1 4 A〜S 1 4 Cに応じて各情動ュ-ッ ト 2 6 0 A〜 2 6 0 Cの強 度をそれぞれ増減させる。
例えば感情 ·本能モデル部 2 5 0は、 ユーザに挨拶をしたときに頭をなでられ れば、 すなわちユーザに挨拶をしたという行動情報 S 1 2と頭をなでられたとい う入力情報 S 1〜S 3とが強度増減関数 2 6 5 Aに与えられると、 「うれしさ」 情動ュニッ ト 2 6 0 Aの強度を増加させる一方、 何らかの仕事を実行中に頭をな でられても、 すなわち仕事を実行中であるという行動情報 S 1 2と頭をなでられ たという入力情報 S 1 ~ S 3とが強度増減関数 2 6 5 Aに与えられても、 「うれ しさ」 情動ュニッ ト 2 6 0 Aの強度を変化させない。
このように感情 ·本能モデル部 2 5 0は、 入力情報 S :!〜 S 3だけでなく現在 又は過去のぺッ トロボッ ト 2 1 0の行動を示す行動情報 S 1 2も参照しながら各 情動ュニッ ト 2 6 0 A〜 2 6 0 Cの強度を決定することにより、 例えば何らかの
タスクを実行中にユーザがいたずらするつもりで頭をなでたとき、 「うれしさ」 情動ュニッ ト 2 6 O Aの強度を増加させるような不自然な感情を起こさせること を回避することができる。 因みに、 感情 ·本能モデル部 2 5 0は、 欲求ュニッ ト 2 6 1 A〜 2 6 1 Cの場合も同様にして、 供給される入力情報 S 1〜S 3及び行 動情報 S 1 2に基づいて各欲求ュニッ ト 2 6 1 A〜 2 6 1 Cの強度をそれぞれ増 減させるようになされている。
以上、 述べたように強度増減関数 2 6 5 A〜 2 6 5 Cは、 入力情報 S 1〜S 3 及び行動情報 S 1 2が入力されると、 予め設定されているパラメータに応じて強 度情報 S 1 4 A〜S 1 4 Cを生成して出力するような関数であり、 当該パラメ一 タをぺッ トロボッ ト 2 1 0毎に異なる値に設定することにより、 例えば怒りつぼ ぃぺッ トロボッ トゃ明るい'性格のぺッ トロポッ トのように、 当該ぺッ トロボッ ト 2 1 0に個性をもたせることができる。
さらに、 感情モデルについては、 他のロボッ ト装置 (以下、 相手ロボッ トとい う。) の性格に応じて、 そのパラメータを変化させることもできる。 すなわち、 ペッ トロボッ ト 2 1 0の持つ性格を、 相手ロボッ トとの相互作用によって変化さ せ、 いわゆる 「朱に交われば赤くなる」 といったような特性による性格の形成を 行う。 これにより、 自然な性格形成がなされたペッ トロボッ ト 2 1 0を実現する ことができる。 .
具体的には、 図 3 8に示すように、 感情認知機構部 2 7 1、 記憶及び解析機構 部 2 7 2、 並びにパラメ一タ変更機構部 2 7 3を備えることにより、 相手ロボッ ト装置の性格に応じた性格形成が可能になる。
感情認知機構部 2 7 1は、 相手ロボッ トの動作が何らかの感情表出に関するも のであるかどうカ また、 そうである場合には表出している感情の種類を強度を 認知する。 具体的には、 感情認知機構部 2 7 1は、 相手ロボッ トの行動を検知す るセンサーと、 センサーからのセンサ一入力に基づいて相手ロボッ ト装置の感情 を認知する感情認知部とからなり、 相手ロボッ トの動作をセンサで捕らえ、 感情 認知部において、 センサー入力からその相手ロボッ トの感情を認知する。 例えば
、 センサー入力は、.上述した入力信号のうちの外部情報信号 S 2であって、 図 3 3に示すマイク 2 2 1からの音声信号 S 1 Bであったり、 図 3 3に示す画像認知 部 2 2 0からの画像信号 S 2 Bであったりする。
感情の認知については、 感情認知機構部 2 7 1は、 センサー入力とされる、 例 えば、 相手ロボッ トが発している鳴き声や、 行動から、 表出している感情を認知 する。
具体的には、 ペッ トロボッ ト 2 1 0は、 相手ロボッ トの感情に起因した動作の 動作パターンを情報として持っており、 この動作パターンと相手ロボッ トの実際 の動作、 例えば動作部の動きや発した音等とを比較することにより、 相手ロボッ トの動作に表出している感情を得る。 例えば、 ペッ トロボッ ト 2 1 0は、 相手口 ボッ トが怒っている場合の当該相手ロボッ トの足の動きの動作パターンを保持し ており、 画像認識部 2 2 0による得た相手ロボッ トの足の動きがそのような行動 パターンと一致する場合、 相手ロボッ トが怒っていることを検知する。
例えば、 ペッ トロボッ ト 2 1 0は、 予め登録されている感情モデルに基づいて 行動が決定されている。 換言すれば、 ぺッ トロボッ ト 2 1 0の行動は、 感情の表 出の結果でもある。 よって、 相手ロボッ トも同様な感情モデルが構築されている ぺッ トロボッ トであることを前提とすれば、 ぺッ トロボッ ト 2 1 0は、 相手ロボ ッ トの動作パターンから相手ロボッ トの行動がどのような感情を表出した結果か を把握することができる。 このように自己の保持している行動情報と相手ロボッ 卜の動作情報とを比較すれば、 相手ロボッ トの感情を容易に把握することができ るようになる。
このような感情に認知により、 例えば、 怒っている歩き方や怒っている目が行 動が検知された場合に、 相手ロボッ トが怒っている認知することができるように なる。
感情認知機構部 2 7 1は、 このようにして認知した相手ロボッ トの表出してい る感情の情報を、 記憶及び解析機構部 2 7 2に送る。
記憶及び解析機構部 2 7 2は、 感情認知機構部 2 7 1から送られてきた情報に
基づいて、 相手ロボッ トの性格、 例えば、 怒りつぼいと力 、 悲観的であるとかを 判断する。 具体的には、 記憶及び解析機構部 2 7 2は、 感情認知機構部 2 7 1か ら送られてきた情報を記憶しておき、 ある程度の時間内の情報の変化に基づいて 相手ロボッ トの性格を解析する。
具体的には、 記憶及び解析機構部 2 7 2は、 図示しないデータ記憶部に記憶さ れた情報の内のある時間内における情報を取り出して、 感情の表出割合を解析す る。 例えば、 図 3 9に示すような割合で 「怒り」 についての感情の情報を得てい た場合、 記憶及び解析機構部 2 7 2は、 相手ロボッ トが怒りつぼい性格であると 判断する。
記憶及び解析機構部 2 7 2は、 上述のようにして取得した相手ロボッ トの性格 の情報を、 感情パラメータ変更機構部 2 7 3に送る。
感情パラメータ変更機構部 2 7 3は、 感情モデル (具体的には、 感情 .本能モ デル部である。) 2 5 0のパラメータを変化させる。 すなわち、 「怒り」 や 「悲し さ」 等の感情に関する情動ュニッ 卜のパラメータを変更する。
また、 感情に関するパラメータとして、 上述した強度増減関数 2 6 5 A〜 2 6 5 Cのパラメータを変更してもよい。 この場合、 強度増減関数 2 6 5 A〜 2 6 5 Cの変更されたパラメータに応じて、 入力情報 S :!〜 S 3及び行動情報 S 1 2か ら強度情報 S 1 4 A〜S 1 4 Cが生成されるので、 例えば、 おこりつぼく したり 明るい性格としたりすることができる。
感情モデル部 2 5 0は、 入力情報 S 1〜S 3や行動情報 S 1 2であるセンサ入 力が入力されており、 そのように感情パラメータ変更機構部 2 7 3により変更さ れたパラメータ (強度) に応じた感情値とされる感情状態情報 S 1 0 aを決定行 動機構部 2 5 1に出力する。 そして、 後段の行動決定機構部 2 5 1がこの感情値 (感情状態情報 S 1 0 a ) に基づいてぺッ トロボッ ト 2 1 0の行動を決定するこ とで、 行動を介して性格を表出させる。
このように、 ペッ トロボッ ト 2 1 0は、 相手ロボッ トの性格に応じて、 感情モ デルのパラメータ (強度) を変化させ、 自然な性格形成が実現されている。 すな
わち、 例えば、 怒りつぼい他のペッ トロボッ トに接していると、 自分自身の怒り 安さパラメータを増加させて、 自分も起こりつぼくなつたりする。
図 3 4に戻って、 行動決定機構部 2 5 1は、 指令信号 S 1 と外部情報信号 S 2 と内部情報信号 S 3 と感情 ·本能状態情報 S 1 0と行動情報 S 1 2とでなる入力 情報 S 1 4に基づいて次の行動を決定し、 当該決定された行動の内容を行動指令 情報 S 1 6として姿勢遷移機構部 2 5 2に送出する。
具体的には図 4 0に示すように、 行動決定機構部 2 5 1は、 過去に供給された 入力情報 S 1 4の履歴を動作状態 (以下、 ステートという。) で表し、 現在供給 された入力情報 S 1 4とそのときのステートとに基づいて当該ステ一トを別のス テートに遷移させることにより、 次の行動を決定するような有限個のステートを 有する有限ォートマトン 2 6 7と呼ばれるアルゴリズムを用いている。 このよう に行動決定機構部 2 5 1は、 入力情報 S 1 4が供給される毎にステートを遷移さ せ、 当該遷移したステートに応じて行動を決定することにより、 現在の入力情報 S 1 4だけでなく過去の入力情報 S 1 4も参照して行動を決定している。
従って、 例えば 「ボールを追いかけている」 というステー ト S T 1において、 「ボールが見えなくなった」 という入力情報 S 1 4が供給されると、 「立ってい る」 というステート S T 5に遷移する一方、 「寝ている」 というステート S T 2 において、 「起きろ」 という入力情報 S 1 4が供給されると、 「立っている」 とい うステート S T 4に遷移する。 このよ うにこれらステート S T 4及びステー ト S T 5は、 行動は同一であっても過去の入力情報 S 1 4の履歴が異なっていること から、 ステー トも異なっていることが分かる。
実際上、 行動決定機構部 2 5 1は、 所定のトリガーがあったことを検出すると 、 現在のステートを次のステートに遷移させる。 トリガーの具体例としては、 例 えば現在のステートの行動を実行している時間が一定値に達した、 又は特定の入 力情報 S 1 4が入力された、 又は感情 ·本能モデル部 2 5◦から供給される感情 •本能状態情報 S 1 0が示す情動ュ-ッ ト 2 6 0 A〜 2 6 0 C及び欲求ュニッ ト 2 6 1 A〜 2 6 1 Cの強度のうち、 所望のュ-ッ トの強度が所定の閾値を超えた
こと等が挙げられる。
その際、 行動決定機構部 2 5 1は、 感情 ·本能モデル部 2 5 0から供給された 感情 ·本能状態情報 S 1 0が示す情動ュニッ ト 2 6 0 A〜 2 6 0 C及び欲求ュ- ッ ト 2 6 1 A〜 2 6 1 Cの強度のうち、 所望のュ-ッ トの強度が所定の閾値を超 えているか否かに基づいて遷移先のステートを選択する。 これにより行動決定機 構部 2 5 1は、 例えば同一の指令信号 S 1が入力されても、 情動ユニッ ト 2 6 0 A〜 2 6 0 C及び欲求ュニッ ト 2 6 1 A〜 2 6 1 Cの強度に応じて異なるステー トに遷移するようになされている。
従って行動決定機構部 2 5 1は、 供給される外部情報信号 S 2を基に例えば目 の前に手のひらが差し出されたことを検出し、 かつ感情 ·本能状態情報 S 1 0を 基に 「怒り」 情動ユニット 2 6 0 Cの強度が所定の閾値以下であることを検出し 、 かつ内部情報信号 S 3を基に 「お腹がすいていない」、 すなわち電池電圧が所 定の閾値以上であることを検出すると、 目の前に手のひらが差し出されたことに 応じて 「おて」 の動作を行わせるための行動指令情報 S 1 6を生成し、 これを姿 勢遷移機構部 2 5 2に送出する。
また、 行動決定機構部 2 5 1は、 例えば目の前に手のひらが差し出され、 かつ 「怒り」 情動ユニット 2 6 0 Cの強度が所定の閾値以下であり、 かつ 「お腹がす いている」 すなわち電池電圧が所定の閾値未満であることを検出すると、 「手の ひらをぺろぺろなめる」 ような動作を行わせるための行動指令情報 S 1 6を生成 し、 これを姿勢遷移機構部 2 5 2に送出する。
また、 行動決定機構部 2 5 1は、 例えば目の前に手のひらが差し出され、 かつ 「怒り」 情動ュニット 2 6 0 Cの強度が所定の閾値以上であることを検出すると 、 「お腹がすいていない」 すなわち電池電圧が所定の閾値以上であるか否かにか かわらず、 「ぶいと横を向く」 ような動作を行わせるための行動指令情報 S 1 6 を生成する。 例えば、 相手ロボッ トに応じて、 感情モデルのパラメータ (情動ュ ニットの強度) を変化させている場合においては、 一緒にいる相手ロボットが怒 りっぽい性格であるときには、 ペットロボット 2 1 0は、 感情モデルの強度が所
定の閾値以上になる場合が多くなり、 そのような 「ぶいと横を向く」 といった動 作を頻出するようになる。
ところで、 行動決定機構部 2 5 1は、 感情 ·本能モデル部 2 5 0から供給され た感情 ·本能状態情報 S 1 0が示す情動ュニッ ト 2 6 0 A〜 2 6 0 C及び欲求ュ ニッ ト 2 6 1 A〜 2 6 1 Cの強度のうち所望のュ-ッ トの強度に基づいて、 遷移 先のステートで行われる行動のパラメータ、 例えば歩行の速度、 手足を動かす際 の動きの大きさや速度、 音を出す際の音の高さや大きさなどを決定し、 当該行動 のパラメータに応じた行動指令情報 S 1 6を生成して姿勢遷移機構部 2 5 2に送 出するようになされている。
因みに、 指令信号 S 1 と外部情報信号 S 2と内部情報信号 S 3とでなる人力情 報 S 1〜 S 3は、 感情 ·本能モデル部 2 5 0及び行動決定機構部 2 5 1に入力さ れるタイミングに応じて情報の内容が異なるため、 感情 ·本能モデル部 2 5 0と 共に行動決定機構部 2 5 1にも入力されるようになされている。
例えばコントローラ 2 4 2は、 「頭をなでられた」 という外部情報信号 S 2が 供給されると、 感情 ·本能モデル部2 5 0にょって 「うれしい」 という感情 '本 能状態情報 S 1 0を生成し、 当該感情 ·本能状態情報 S 1 0を行動決定機構部 2 5 1に供給するが、 この状態において、 「手が目の前にある」 という外部情報信 号 S 2が供給されると、 行動決定機構部 2 5 1において上述の 「うれしい」 とい う感情 ·本能状態情報 S 1 0と 「手が目の前にある」 という外部情報信号 S 2と に基づいて 「喜んでおてをする」 という行動指令情報 S 1 6を生成させ、 これを 姿勢遷移機構部 2 5 2に送出させるようになされている。
図 3 4に戻って、 姿勢遷移機構部 2 5 2は、 行動決定機構部 2 5 1から供給さ れる行動指令情報 S 1 6に基づいて現在の姿勢から次の姿勢に遷移させるための 姿勢繊維情報 S 1 8を生成し、 これを制御機構部 2 5 3に送出する。 この場合、 現在の姿勢から次に遷移可能な姿勢は、 例えば胴体や手や足の形状、 重さ、 各部 の結合状態のようなぺッ トロボッ ト 2 1 0の物理的形状と、 例えば関節が曲がる 方向や角度のようなァクチユエータ 2 3 3 A〜2 3 3 Nの機構とによって決定さ
れる。
ところでこのような遷移可能な姿勢は、 現在の姿勢から直接遷移可能な姿勢と 直接には遷移できない姿勢とに分類される。 例えば 4本足のぺッ トロボッ ト 2 1 0は、 手足を大きく投げ出して寝転んでいる状態から伏せた状態へ直接遷移する ことはできるが、 立った状態へ直接遷移することはできず、 一旦手足を胴体近く に引き寄せて伏せた姿勢になり、 それから立ち上がるという 2段階の動作が必要 である。 また安全に実行できない姿勢も存在する。 例えば 4本足のペッ トロボッ ト 2 1 0は、 立っている姿勢で両前足を挙げてバンザィをしょうとすると、 簡単 に転倒してしまう場合である。
従って姿勢遷移機構部 2 5 2は、 遷移可能な姿勢を予め登録しておき、 行動決 定機構部 2 5 1から供給された行動指令情報 S 1 6が直接遷移可能な姿勢を示す 場合には、 当該行動指令情報 S 1 6をそのまま姿勢遷移情報 S 1 8として制御機 構部 2 5 3に送出する一方、 直接遷移不可能な姿勢を示す場合には、 遷移可能な 他の姿勢に一旦遷移した後に目的の姿勢まで遷移させるような姿勢遷移情報 S 1 8を生成して制御機構部 2 5 3に送出する。 これによりペッ トロボッ ト 2 1 0は 、 遷移不可能な姿勢を無理に実行しようとする事態や転倒するような自体を回避 することができる。
具体的には姿勢遷移機構部 2 5 2は、 ペッ トロボッ ト 2 1 0がとり得る姿勢を 予め登録すると共に、 遷移可能な 2つの姿勢の間を記録しておく ようになされて いる。 例えば図 4 1に示すように、 姿勢遷移機構部 2 5 2は、 ペッ トロボッ ト 2 1 0がとり得る姿勢をノード N D i 〜N D 5 で表すと共に、 遷移可能な 2つの姿 勢の間すなわちノード 〜N D 5 間を有向アーク a i 〜 a i。で結合した有向 グラフ 2 7 0と呼ばれるアルゴリズムを用いている。
姿勢遷移機構部 2 5 2は、 行動決定機構部 2 5 1から行動指令情報 S 1 6が供 給されると、 現在の姿勢に対応したノード N D 〜N D 5 と、 行動指令情報 S 1 6が示す次に取るべき姿勢に対応するノード 〜N D 5 とを結ぶように、 有 向アーク a i 〜 a 10の向きに従いながら現在のノード N D i 〜N D 5 から次のノ
ード 〜ND5 に至る経路を探索し、 当該探索した経路上にあるノード ND 1 〜ND5 を順番に記録することにより、 姿勢遷移の計画を行うようになされて いる。 これによりペッ トロボッ ト 2 1 0は、 遷移不可能な姿勢を無理に実行しよ うとする事態や転倒するような事態を回避しながら、 行動決定機構部 2 5 1から 指示された行動を実現することができる。
姿勢遷移機構部 2 5 2は、 例えば現在の姿勢が 「ふせる」 という姿勢を示すノ ード ND2 にある場合、 「すわれ」 という行動指令情報 S 1 6が供給されると、 「 ふせる」 という姿勢を示すノード ND2 から 「すわる」 という姿勢を示すノード ND5 へは直接遷移可能であることを利用して、 「すわれ」 という姿勢遷移情報 S 1 8を制御機構部 2 5 3に与える。 これに対して姿勢遷移機構部 2 5 2は、 「 歩け」 という行動指令情報 S 1 6が供給されると、 「ふせる」 というノード ND2 から 「あるく」 とレ、うノード ND4 に至る経路を探索することにより姿勢遷移計 画を行い、 その結果、 「たて」 という指示を出した後に 「歩け」 という指示を出 すような行動指令情報 S 1 8を生成して制御機構部 2 5 3に送出する。
図 3 4に戻って制御機構部 2 5 3は、 行動指令情報 S 1 8を基にァクチユエ一 タ 2 3 3 A〜 23 3 Nを駆動させるための制御信号 S 5を生成し、 これをァクチ ユエ一タ 2 3 3 A〜 2 3 3 Nに送出して当該ァクチユエ一夕 2 3 3 A〜 23 3 N を駆動させることにより、 ペッ トロボッ ト 2 1 0に所望の動作を行わせるように なされている。
( 5 - 4 ) 本実施の形態の動作及び効果
以上の構成において、 コントローラ 24 2の感情 .本能モデル部 2 5 0は、 供 給される入力情報 S 1〜S 3に基づいて、 ぺッ トロボッ ト 2 1 0の感情及び本能 の状態を変化させ、 この感情及び本能の状態の変化をぺッ トロボッ ト 2 1 0の行 動に反映させることにより、 自分の感情や本能の状態に基づいて自律的に行動さ せる。
そして、 感情 ·本能モデル部 (図 3 8に示す感情モデル部) 2 50は、 相手口 ボッ トの性格に応じて変化された性格により行動を決定することができる。 これ
により、 ユーザは、 他のぺッ トロボッ トに応じてぺッ トロポッ ト 2 1 0の性格が 形成されることを楽しく ことができ、 育成のおもしろさを得ることができる。 また、 コントローラ 2 4 2の行動決定機構部 2 5 1は、 順次供給される入力情 報 S 1 4の履歴に応じた現在のステート及び次に供給される入力情報 S 1 4に基 づいて現在のステ一トに続く次のステートを決定することにより、 自分の感情や 本能の状態に基づいて自律的に行動させる。
また、 コントローラ 2 4 2の姿勢遷移機構部 2 5 2は、 ペッ トロボッ ト 2 1 0 の現在の姿勢から予め決められた所定の経路を経て現在の姿勢を変化させて行動 指令情報 S 1 6に応じた姿勢に遷移させることにより、 無理な姿勢をとらせるよ うな事態や転倒するような事態を回避する。
以上の構成によれば、 コン トローラ 2 4 2に対する入力情報 S 1〜S 3に基づ いてぺッ トロボッ ト 2 1 0の感情及び本能の状態を変化させ、 この感情及び本能 の状態の変化を基にぺッ トロボッ ト 2 1 0の行動を決定し、 当該決定した行動に 応じて遷移可能な姿勢を選択してぺッ トロボッ ト 2 1 0を動作させることにより 、 自分の感情や本能の状態に基づいて自律的に行動することができ、 かく して本 物のぺッ トに近い動作を行うぺッ トロボッ ト 2 1 0を実現できる。
( 5 - 5 ) 他の実施の形態
なお上述の第 5の実施の形態においては、 相手ロボッ トの性格に応じた性格の 変化を、 感情パラメータ変更機構部 2 7 3が感情モデルのパラメータを変更する ことにより行っている場合について述べたが、 本発明はこれに限定されず、 図 4 2に示すように、 行動決定機構部 2 5 1のパラメータを変更することにより行う こともできる。 この場合、 行動決定機構部 2 5 1の調整可能なパラメータを変化 させる。 例えば、 有限オートマ トンでは、 入力情報 S 1 4の供給によりステー ト を遷移させているが、 そのステートの遷移確率を変化させる。
また上述の第 5の実施の形態においては、 相手ロボッ トの表出された感情のみ に基づいて性格の状態を変化させているが、 本発明はこれに限定されず、 他の情 報をも参照することができる。 例えば、 図 4 3に示すように、 対話解析機構部 2
7 4を備え、 相手ロボッ トとユーザ (飼い主) との対話を解析することにより、 性格の状態を変化させることができる。
対話解析機構部 2 7 4は、 ユーザと相手ロボッ トとの対話、 例えば、 ユーザが 相手ロボッ トに発している言葉やユーザが相手ロボッ トに対して行っている仕草 を解析する。 例えば、 ユーザが相手ロボッ トをしかっているのか、 叩いているの か等を解析する。 対話解析機構部 2 5 1は、 その解析結果を記憶及び解析機構部 2 7 2に送る。
対話解析機構部 2 7 4は、 感情認知機構部 2 7 1からの相手ロボッ トの表出し ている感情の情報と、 対話解析機構部 2 7 4の解析結果とに基づいて、 相手ロボ ッ トの性格を判別する。
これにより、 例えば、 感情認知機構部 2 7 1からの情報として吠えている情報 だけが単に送られでい場合には相手ロポッ トが怒りっぽい性格と判断されてしま うが、 ユーザとの対話を参照することにより、 ユーザに叩かれた吠えているよう な場合には、 相手ロボッ トを怒りつぼい性格と容易に判断するようなことなく、 環境に応じて複合的な判断をすることができるようになる。
さらに上述の第 5の実施の形態においては、 相手ロボッ トの性格と一致する方 向に変化するように説明したが、 本発明はこれに限定されず、 相手ロボッ トの性 格と反対の性格、 すなわち反対方向の性格に変化させることもできる。
さらに上述の第 5の実施の形態においては、 相手ロボッ トの性格の判断に相手 ロボッ トの行動を参照しているが、 本発明はこれに限定されず、 相手ロボッ トと のデータ通信により当該相手ロボッ トの性格を判断することができる。 データ通 信の形態としては無線通信でもよく、 有線通信でもよい。
さらに上述の第 5の実施の形態においては、 相手ロボッ トが 1体である場合に ついて説明したが、 本発明はこれに限定されず、 相手ロボッ トが複数体ある場合 であってもよレ、。 この場合、 ペッ トロボッ ト 2 1 0は、 ロボッ トを識別して、 複 数体のロボッ 卜から統合的に、 或いは特定のロボッ トから個別的に自己の性格を 変化させることができる。 これにより、 複数の相手ロボッ トがそれぞれ性格が異
なっている場合があるので、 それに応じて自己の性格を変化させることができる ようになる。
さらに、 このように複数体のロボッ トがある状況においては各ロボッ トを識別 する必要がある。 この場合、 例えば、 相手ロボッ トを個別判断できるように、 顔 を所定のパターンとして形成しておく ことにより、 複数のロボッ トを識別できる ようにする。 また、 所定マークとしていわゆるバーコードを相手ロボッ トに付し て、 複数のロボッ トを識別できるようにしてもよい。 また、 データ通信により、 相手ロボッ 卜の性格を判断する場合においては、 性格のデータに識別情報を付し ておくことにより、 複数のロボッ トを識別できるようにしてもよい。 例えば、 識 別情報として、 相手ロボッ トの備える装置の識別番号、 例えば着脱自在とれた記 憶媒体である、 いわゆるメモリスティック (ソニー株式会社 商標) の I D等が 挙げられる。
さらに上述の第 5の実施の形態においては、 相手ロボッ トの動作部の動作から 感情を認知する場合について主に述べたが、 本発明はこれに限らず、 タツチセン サ 1 4に対する相手口ボッ トの接触状態から相手ロボッ トの感情の認知すること もできる。
さらに上述の第 5の実施の形態においては、 リモートコントローラから赤外線 光によって送られてきたユーザの指令を受信するようにした場合について述べた が、 本発明はこれに限らず、 例えば電波や音波によって送られてきたユーザの指 令を受信するようにしても良い。
さらに上述の第 5の実施の形態においては、 ユーザからの指令をリモートコン トローラ受信部 2 2 3及びマイク 2 2 1でなるコマンド受信部 2 4 0を介して入 力するようにした場合について述べたが、 本発明はこれに限らず、 例えばペッ ト ロボッ ト 1にコンピュータを接続し、 当該接続されたコンピュータを介してユー ザの指令を入力するようにしてもよい。
さらに上述の第 5の実施の形態においては、 「うれしさ」、 「悲しさ」、 「怒り」 という情動を示す情動ユニッ ト 2 6 0 A〜 2 6 0 Cと、 「食欲」、 「睡眠欲」、 「運
動欲」 という欲求を示す欲求ュニット 2 6 1 A〜 2 6 1 Cとを用いて感情及び本 能の状態を決定するようにした場合について述べたが、 本発明はこれに限らず、 例えば情動ユニット 2 6 0 A〜 2 6 0 Cに 「寂しさ」 という情動を示す情動ュニ ッ トを追加したり、 欲求ュニット 2 6 1 A〜 2 6 1 Cに 「愛情欲」 という欲求を 示す欲求ュニッ トを追加しても良く、 この他種々の種類や個数の組合わせでなる 情動ュニッ トゃ欲求ュニットを使って感情や本能の状態を決定するようにしても 良い。
さらに上述の第 5の実施の形態においては、 指令信号 S 1と外部情報信号 S 2 と内部情報信号 S 3と感情 ·本能状態情報 S 1 0と行動情報 S 1 2とに基づいて 次の行動を行動決定機構部 2 5 1によって決定した場合について述べたが、 本発 明はこれに限らず、 指令信号 S 1と外部情報信号 S 2と内部情報信号 S 3と感情 •本能状態情報 S 1 0と行動情報 S 1 2 とのうち一部の情報に基づいて次の行動 を決定するようにしても良い。
さらに上述の第 5の実施の形態においては、 有限ォートマトン 2 6 7と呼ばれ るアルゴリズムを用いて次の行動を決定した場合について述べたが、 本発明はこ れに限らず、 ステートの数が有限でないステートマシンと呼ばれるアルゴリズム を用いて行動を決定するようにしても良く、 この場合、 入力情報 S 1 4が供給さ れる毎に新たにステートを生成し、 当該生成したステートに応じて行動を決定す れば良い。
さらに上述の第 5の実施の形態においては、 有限ォートマトン 2 6 7と呼ばれ るアルゴリズムを用いて次の行動を決定した場合について述べたが、 本発明はこ れに限らず、 現在供給された入力情報 S 1 4とそのときのステートとに基づいて 複数のステートを遷移先の候補として選定し、 当該選定された複数のステートの うち遷移先のステ一トを乱数によってランダムに決定するような確率有限ォート マトンと呼ばれるアルゴリズムを用いて行動を決定するようにしても良い。
さらに上述の第 5の実施の形態においては、 行動指令情報 S 1 6が直接遷移可 能な姿勢を示す場合には、 当該行動指令情報 S 1 6をそのまま姿勢遷移情報 S 1
8として制御機構部 2 5 3に送出する一方、 直接遷移不可能な姿勢を示す場合に は、 遷移可能な他の姿勢に一旦遷移した後に目的の姿勢まで遷移させるような姿 勢遷移情報 S 1 8を生成して制御機構部 2 5 3に送出した場合について述べたが 、 本発明はこれに限らず、 行動指令情報 S 1 6が直接遷移可能な姿勢を示す場合 にのみ当該行動指令情報 S 1 6を受け付けて制御機構部 4 3に送出する一方、 直 接遷移不可能な姿勢を示す場合には、 当該行動指令情報 S 1 6を拒否するように しても良い。
さらに上述の第 5の実施の形態においては、 本発明をぺットロボット 2 1 0に 適用した場合について述べたが、 本発明はこれに限らず、 例えばゲームや展示等 のェンタティンメント分野で用いられるロボット装置のように、 他の種々のロボ ット装置に本発明を適用し得る。
さらに本発明が適用されるぺットロボッ ト 1の外観は、 図 3 2に示すような構 成をとることに限定されず、 図 4 4に示すように、 より現実の犬に類似の構成と することもできる。 産業上の利用の可能性
本発明は、 ゲームや展示等のェンタティンメント分野で用いられる口ボットゃ 、 ペッ トとして用いられるペットロボット等に適用することができる。