JP2002049385A

JP2002049385A - 音声合成装置、疑似感情表現装置及び音声合成方法

Info

Publication number: JP2002049385A
Application number: JP2000237853A
Authority: JP
Inventors: Takashi Mizokawa; 隆司溝川
Original assignee: Yamaha Motor Co Ltd
Current assignee: Yamaha Motor Co Ltd
Priority date: 2000-08-07
Filing date: 2000-08-07
Publication date: 2002-02-15
Also published as: US20020019678A1; EP1182645A1

Abstract

(57)【要約】【課題】観察者に対して異なる複数の疑似感情をそれ
ぞれ明確に伝えるのに好適な疑似感情表現装置を提供す
る。【解決手段】ペット型ロボット１は、各疑似感情ごと
に音声データを記憶するための音声データ登録データベ
ース１４と、音声データ登録データベース１４の音声デ
ータを合成する音声データ合成装置１５とを備えてい
る。そして、外部から与えられる刺激を認識し、その認
識結果に基づいて複数の疑似感情を生成し、音声データ
合成装置１５により、生成した疑似感情に対応するそれ
ぞれの音声データを音声データ登録データベース１４か
ら読み出して合成し、合成した音声データに基づいて音
声を出力する。これにより、ユーザに対して、異なる複
数の疑似感情のそれぞれを比較的明確に伝えることがで
きるので、実際のペットにはない面白味やかわいらしさ
を表現することができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、ペット型ロボット
の疑似感情を音声により表現する装置に係り、特に、観
察者に対して異なる複数の疑似感情をそれぞれ明確に伝
えるのに好適な音声合成装置、疑似感情表現装置および
音声合成方法に関する。

【０００２】

【従来の技術】従来、ペット型ロボットの疑似感情を音
声により表現する装置としては、例えば、異なる複数の
疑似感情ごとに音声データを記憶した音声データ記憶部
と、外部からの刺激を検出する複数のセンサと、センサ
の検出結果に基づいて各疑似感情ごとにその強度を生成
する疑似感情生成部と、疑似感情生成部で生成した疑似
感情の強度のうち最も高いものの疑似感情に対応する音
声データを音声データ記憶部から読み出す音声データ読
出部と、音声データ読出部で読み出した音声データに基
づいて音声を出力する音声出力部とで構成されている。

【０００３】

【発明が解決しようとする課題】しかしながら、従来の
疑似感情表現装置にあっては、疑似感情生成部で生成し
た疑似感情の強度のうち最も高いものの疑似感情に対応
する音声データに基づいて音声を出力するようになって
いるため、ペット型ロボットが生成した疑似感情を同時
に一つしか表現することができない。

【０００４】人間や動物の感情表現では、怒ったり喜ん
だりする異なる複数の感情が同時に交錯したときは、そ
れら感情の強度のうち最も高いものの感情を主体的に表
現しているものと観察される。この点で、従来の疑似感
情表現装置は、人間や動物の感情表現に比較的近い表現
を行っているといえる。しかし、ペット型ロボットは、
限りなく実際のペットに近いものを実現しようとする側
面をもつものの、あくまでロボットであり動物ではない
という点でそこには一定の限界がある。そこで、限りな
く実際のペットに近いものを実現しようとしつつも、実
際のペットとは違ったペット型ロボット特有の表現をも
たせることにより、実際のペットにはない面白味やかわ
いらしさを表現しようとすることが試みられている。例
えば、実際のペットは、異なる複数の感情が同時に交錯
したときに観察者に対してそれぞれを明確に伝えること
はできないが、ペット型ロボットが複数の疑似感情をそ
れぞれ明確に伝えられるようになれば、それはそれで実
際のペットにはない面白味やかわいらしさがある。

【０００５】そこで、本発明は、このような従来の技術
の有する未解決の課題に着目してなされたものであっ
て、観察者に対して異なる複数の疑似感情をそれぞれ明
確に伝えるのに好適な音声合成装置、疑似感情表現装置
および音声合成方法を提供することを目的としている。

【０００６】

【課題を解決するための手段】上記目的を達成するため
に、本発明に係る請求項１記載の音声合成装置は、異な
る複数の疑似感情を生成する疑似感情生成手段を利用し
て前記複数の疑似感情を音声により表現する疑似感情表
現装置に適用される装置であって、前記各疑似感情ごと
に音声データを記憶した音声データ記憶手段が与えられ
たときに、前記疑似感情生成手段よって生成された疑似
感情に対応するそれぞれの音声データを前記音声データ
記憶手段から読み出して合成するようになっている。

【０００７】このような構成であれば、音声データ記憶
手段が与えられると、疑似感情生成手段よって生成され
た疑似感情に対応するそれぞれの音声データが音声デー
タ記憶手段から読み出されて合成される。ここで、音声
データには、例えば、人間や動物の発声を録音した発声
データ、音楽を録音した音楽データ、または効果音を録
音した効果音データが含まれる。以下、請求項２記載の
音声合成装置、請求項３および４記載の疑似感情表現装
置、並びに請求項９記載の音声合成方法において同じで
ある。

【０００８】また、請求項１記載の発明は、ペット型ロ
ボットに適用することができるほか、例えば、コンピュ
ータ上でソフトウェアにより実現される仮想的なペット
型ロボットに適用することもできる。前者の場合には、
例えば、外部から与えられる刺激に基づいて複数の疑似
感情を生成する疑似感情生成手段を利用し、後者の場合
には、例えば、ユーザによるコンピュータへの入力内容
に基づいて複数の疑似感情を生成する疑似感情生成手段
を利用すればよい。以下、請求項２記載の音声合成装
置、および請求項９記載の音声合成方法において同じで
ある。

【０００９】さらに、本発明に係る請求項２記載の音声
合成装置は、異なる複数の疑似感情を生成する疑似感情
生成手段を利用して前記複数の疑似感情を音声により表
現する疑似感情表現装置に適用される装置であって、前
記各疑似感情ごとに音声データを記憶するための音声デ
ータ記憶手段と、前記疑似感情生成手段によって生成さ
れた疑似感情に対応するそれぞれの音声データを前記音
声データ記憶手段から読み出して合成する音声データ合
成手段とを備える。

【００１０】このような構成であれば、音声データ合成
手段により、疑似感情生成手段によって生成された疑似
感情に対応するそれぞれの音声データが音声データ記憶
手段から読み出されて合成される。ここで、音声データ
記憶手段は、音声データをあらゆる手段でかつあらゆる
時期に記憶するものであり、音声データをあらかじめ記
憶してあるものであってもよいし、音声データをあらか
じめ記憶することなく、本装置の動作時に外部からの入
力等によって音声データを記憶するようになっていても
よい。以下、請求項３および４記載の疑似感情表現装置
において同じである。

【００１１】一方、上記目的を達成するために、本発明
に係る請求項３記載の疑似感情表現装置は、異なる複数
の疑似感情を音声により表現する装置であって、前記各
疑似感情ごとに音声データを記憶するための音声データ
記憶手段と、前記複数の疑似感情を生成する疑似感情生
成手段と、前記疑似感情生成手段で生成した疑似感情に
対応するそれぞれの音声データを前記音声データ記憶手
段から読み出して合成する音声データ合成手段と、前記
音声データ合成手段で合成した音声データに基づいて音
声を出力する音声出力手段とを備える。

【００１２】このような構成であれば、疑似感情生成手
段により、複数の疑似感情が生成され、音声データ合成
手段により、生成された疑似感情に対応するそれぞれの
音声データが音声データ記憶手段から読み出されて合成
される。そして、音声出力手段により、合成された音声
データに基づいて音声が出力される。ここで、請求項３
記載の発明は、ペット型ロボットに適用することができ
るほか、例えば、コンピュータ上でソフトウェアにより
実現される仮想的なペット型ロボットに適用することも
できる。前者の場合、疑似感情生成手段は、例えば、外
部から与えられる刺激に基づいて複数の疑似感情を生成
するようにし、後者の場合、疑似感情生成手段は、例え
ば、ユーザによるコンピュータへの入力内容に基づいて
複数の疑似感情を生成するようにする。以下、請求項４
記載の疑似感情表現装置において同じである。

【００１３】さらに、本発明に係る請求項４記載の疑似
感情表現装置は、異なる複数の疑似感情を音声により表
現する装置であって、前記各疑似感情ごとに音声データ
を記憶するための音声データ記憶手段と、外部から与え
られる刺激を認識する刺激認識手段と、前記刺激認識手
段の認識結果に基づいて前記複数の疑似感情を生成する
疑似感情生成手段と、前記疑似感情生成手段で生成した
疑似感情に対応するそれぞれの音声データを前記音声デ
ータ記憶手段から読み出して合成する音声データ合成手
段と、前記音声データ合成手段で合成した音声データに
基づいて音声を出力する音声出力手段とを備える。

【００１４】このような構成であれば、外部から刺激が
与えられると、刺激認識手段により、与えられた刺激が
認識され、疑似感情生成手段により、その認識結果に基
づいて複数の疑似感情が生成され、音声データ合成手段
により、生成された疑似感情に対応するそれぞれの音声
データが音声データ記憶手段から読み出されて合成され
る。そして、音声出力手段により、合成された音声デー
タに基づいて音声が出力される。

【００１５】ここで、刺激とは、人間や動物の五感によ
り知覚可能な刺激をいうほか、人間や動物の五感により
知覚不能な刺激であっても検出手段により検出可能な刺
激であればそのような刺激をもいう。刺激認識手段は、
例えば、人間や動物の視覚により知覚可能な刺激を認識
するには、カメラ等の画像取込手段を有していればよい
し、人間や動物の触覚により知覚可能な刺激を認識する
には、圧力センサや触覚センサ等の触覚検出手段を有し
ていればよい。

【００１６】さらに、本発明に係る請求項５記載の疑似
感情表現装置は、請求項３および４のいずれかに記載の
疑似感情表現装置において、さらに、異なる複数の性格
のうちいずれかを形成する性格形成手段を備え、前記音
声データ記憶手段は、前記各疑似感情ごとに前記音声デ
ータを対応付けて登録した音声データ対応テーブルを、
前記各性格ごとに記憶可能となっており、前記音声デー
タ合成手段は、前記性格形成手段で形成した性格に対応
する音声データ対応テーブルを参照して、前記疑似感情
生成手段で生成した疑似感情に対応するそれぞれの音声
データを前記音声データ記憶手段から読み出して合成す
るようになっている。

【００１７】このような構成であれば、性格形成手段に
より、異なる複数の性格のうちいずれかが形成され、音
声データ合成手段により、形成された性格に対応する音
声データ対応テーブルを参照して、疑似感情生成手段で
生成された疑似感情に対応するそれぞれの音声データが
音声データ記憶手段から読み出されて合成される。ここ
で、音声データ記憶手段は、音声データ対応テーブルを
あらゆる手段でかつあらゆる時期に記憶するものであ
り、音声データ対応テーブルをあらかじめ記憶してある
ものであってもよいし、音声データ対応テーブルをあら
かじめ記憶することなく、本装置の動作時に外部からの
入力等によって音声データ対応テーブルを記憶するよう
になっていてもよい。以下、請求項６または７記載の疑
似感情表現装置において同じである。

【００１８】さらに、本発明に係る請求項６記載の疑似
感情表現装置は、請求項３ないし５のいずれかに記載の
疑似感情表現装置において、さらに、成長段階を規定す
る成長段階規定手段を備え、前記音声データ記憶手段
は、前記各疑似感情ごとに前記音声データを対応付けて
登録した音声データ対応テーブルを、前記各成長段階ご
とに記憶可能となっており、前記音声データ合成手段
は、前記成長段階規定手段で規定した成長段階に対応す
る音声データ対応テーブルを参照して、前記疑似感情生
成手段で生成した疑似感情に対応するそれぞれの音声デ
ータを前記音声データ記憶手段から読み出して合成する
ようになっている。

【００１９】このような構成であれば、成長段階規定手
段により、成長段階が規定され、音声データ合成手段に
より、規定された成長段階に対応する音声データ対応テ
ーブルを参照して、疑似感情生成手段で生成された疑似
感情に対応するそれぞれの音声データが音声データ記憶
手段から読み出されて合成される。さらに、本発明に係
る請求項７記載の疑似感情表現装置は、請求項３ないし
６のいずれかに記載の疑似感情表現装置において、前記
音声データ記憶手段は、前記各疑似感情ごとに前記音声
データを対応付けて登録した音声データ対応テーブルを
複数記憶可能となっており、前記複数の音声データ対応
テーブルのうちいずれかを選択するテーブル選択手段を
備え、前記音声データ合成手段は、前記テーブル選択手
段で選択した音声データ対応テーブルを参照して、前記
疑似感情生成手段で生成した疑似感情に対応するそれぞ
れの音声データを前記音声データ記憶手段から読み出し
て合成するようになっている。

【００２０】このような構成であれば、選択手段により
複数の音声データ対応テーブルのうちいずれかが選択さ
れると、音声データ合成手段により、選択された音声デ
ータ対応テーブルを参照して、疑似感情生成手段で生成
された疑似感情に対応するそれぞれの音声データが音声
データ記憶手段から読み出されて合成される。ここで、
選択手段は、人手により音声データ対応テーブルを選択
するようになっていてもよいし、乱数等や所定条件に基
づいて音声データ対応テーブルを選択するようになって
いてもよい。

【００２１】さらに、本発明に係る請求項８記載の疑似
感情表現装置は、請求項３ないし７のいずれかに記載の
疑似感情表現装置において、前記疑似感情生成手段は、
前記各疑似感情ごとにその強度を生成するようになって
おり、前記音声データ合成手段は、前記読み出した各音
声データに対して前記疑似感情生成手段で生成した疑似
感情の強度に応じた量の音響効果を与え、それら音声デ
ータを合成するようになっている。

【００２２】このような構成であれば、疑似感情生成手
段により、各疑似感情ごとにその強度が生成され、音声
データ合成手段により、読み出された各音声データに対
して、生成された疑似感情の強度に応じた量の音響効果
が与えられ、それら音声データが合成される。ここで、
音響効果とは、それを与える前後で音声データに基づい
て出力される音声が変化するように、音声データに変化
を与える効果をいい、これには、例えば、音声ボリュー
ムを変化する効果、音声周波数を変化する効果、または
音声ピッチを変化する効果が含まれる。

【００２３】一方、上記目的を達成するために、本発明
に係る請求項９記載の音声合成方法は、異なる複数の疑
似感情を生成する疑似感情生成手段を利用して前記複数
の疑似感情を音声により表現する疑似感情表現装置に適
用される方法であって、前記各疑似感情ごとに音声デー
タを記憶した音声データ記憶手段が与えられたときに、
前記疑似感情生成手段よって生成された疑似感情に対応
するそれぞれの音声データを前記音声データ記憶手段か
ら読み出して合成する。

【００２４】ここで、上記目的を達成するために、さら
に具体的な方法としては、次に掲げる音声合成方法およ
び疑似感情表現方法を提案することができる。第１の音
声合成方法は、異なる複数の疑似感情を生成する疑似感
情生成手段を利用して前記複数の疑似感情を音声により
表現する疑似感情表現装置に適用される方法であって、
前記各疑似感情ごとに音声データを音声データ記憶手段
に記憶する音声データ記憶ステップと、前記疑似感情生
成手段によって生成された疑似感情に対応するそれぞれ
の音声データを前記音声データ記憶手段から読み出して
合成する音声データ合成ステップとを含む。

【００２５】このような方法によれば、請求項２記載の
音声合成装置と同等の効果が得られる。ここで、第１の
音声合成方法は、ペット型ロボットに適用することがで
きるほか、例えば、コンピュータ上でソフトウェアによ
り実現される仮想的なペット型ロボットに適用すること
もできる。前者の場合には、例えば、外部から与えられ
る刺激に基づいて複数の疑似感情を生成する疑似感情生
成手段を利用し、後者の場合には、例えば、ユーザによ
るコンピュータへの入力内容に基づいて複数の疑似感情
を生成する疑似感情生成手段を利用すればよい。

【００２６】一方、第１の疑似感情表現方法は、異なる
複数の疑似感情を音声により表現する方法であって、前
記各疑似感情ごとに音声データを音声データ記憶手段に
記憶する音声データ記憶ステップと、前記複数の疑似感
情を生成する疑似感情生成ステップと、前記疑似感情生
成ステップで生成した疑似感情に対応するそれぞれの音
声データを前記音声データ記憶手段から読み出して合成
する音声データ合成ステップと、前記音声データ合成ス
テップで合成した音声データに基づいて音声を出力する
音声出力ステップとを含む。

【００２７】このような方法によれば、請求項３記載の
疑似感情表現装置と同等の効果が得られる。ここで、第
１の疑似感情表現方法は、ペット型ロボットに適用する
ことができるほか、例えば、コンピュータ上でソフトウ
ェアにより実現される仮想的なペット型ロボットに適用
することもできる。前者の場合、疑似感情生成ステップ
は、例えば、外部から与えられる刺激に基づいて複数の
疑似感情を生成し、後者の場合、疑似感情生成ステップ
は、例えば、ユーザによるコンピュータへの入力内容に
基づいて複数の疑似感情を生成する。

【００２８】さらに、第２の疑似感情表現方法は、異な
る複数の疑似感情を音声により表現する方法であって、
前記各疑似感情ごとに音声データを音声データ記憶手段
に記憶する音声データ記憶ステップと、外部から与えら
れる刺激を認識する刺激認識ステップと、前記刺激認識
ステップの認識結果に基づいて前記複数の疑似感情を生
成する疑似感情生成ステップと、前記疑似感情生成ステ
ップで生成した疑似感情に対応するそれぞれの音声デー
タを前記音声データ記憶手段から読み出して合成する音
声データ合成ステップと、前記音声データ合成ステップ
で合成した音声データに基づいて音声を出力する音声出
力ステップとを含む。

【００２９】このような方法によれば、請求項４記載の
疑似感情表現装置と同等の効果が得られる。ここで、刺
激については、請求項４記載の疑似感情表現装置におけ
る定義と同義である。さらに、第３の疑似感情表現方法
は、第１および第２の疑似感情表現方法のいずれかにお
いて、さらに、異なる複数の性格のうちいずれかを形成
する性格形成ステップを含み、前記音声データ記憶ステ
ップは、前記各疑似感情ごとに前記音声データを対応付
けて登録した音声データ対応テーブルを、前記各性格ご
とに前記音声データ記憶手段に記憶し、前記音声データ
合成ステップは、前記性格形成ステップで形成した性格
に対応する音声データ対応テーブルを参照して、前記疑
似感情生成ステップで生成した疑似感情に対応するそれ
ぞれの音声データを前記音声データ記憶手段から読み出
して合成する。

【００３０】このような方法によれば、請求項５記載の
疑似感情表現装置と同等の効果が得られる。さらに、第
４の疑似感情表現方法は、第１ないし第３の疑似感情表
現方法のいずれかにおいて、さらに、成長段階を規定す
る成長段階規定ステップを含み、前記音声データ記憶ス
テップは、前記各疑似感情ごとに前記音声データを対応
付けて登録した音声データ対応テーブルを、前記各成長
段階ごとに前記音声データ記憶手段に記憶し、前記音声
データ合成ステップは、前記成長段階規定ステップで規
定した成長段階に対応する音声データ対応テーブルを参
照して、前記疑似感情生成ステップで生成した疑似感情
に対応するそれぞれの音声データを前記音声データ記憶
手段から読み出して合成する。

【００３１】このような方法によれば、請求項６記載の
疑似感情表現装置と同等の効果が得られる。さらに、第
５の疑似感情表現方法は、第１ないし第４の疑似感情表
現方法のいずれかにおいて、前記音声データ記憶ステッ
プは、前記各疑似感情ごとに前記音声データを対応付け
て登録した音声データ対応テーブルを複数前記音声デー
タ記憶手段に記憶し、前記複数の音声データ対応テーブ
ルのうちいずれかを選択するテーブル選択ステップを含
み、前記音声データ合成ステップは、前記テーブル選択
ステップで選択した音声データ対応テーブルを参照し
て、前記疑似感情生成ステップで生成した疑似感情に対
応するそれぞれの音声データを前記音声データ記憶手段
から読み出して合成する。

【００３２】このような方法によれば、請求項７記載の
疑似感情表現装置と同等の効果が得られる。ここで、選
択ステップは、人手により音声データ対応テーブルを選
択してもよいし、乱数等や所定条件に基づいて音声デー
タ対応テーブルを選択してもよい。さらに、第６の疑似
感情表現方法は、第１ないし第５の疑似感情表現方法の
いずれかにおいて、前記疑似感情生成ステップは、前記
各疑似感情ごとにその強度を生成するようになってお
り、前記音声データ合成ステップは、前記読み出した各
音声データに対して前記疑似感情生成ステップで生成し
た疑似感情の強度に応じた量の音響効果を与え、それら
音声データを合成する。

【００３３】このような方法によれば、請求項８記載の
疑似感情表現装置と同等の効果が得られる。ここで、音
響効果については、請求項８記載の疑似感情表現装置に
おける定義と同義である。以上では、上記目的を達成す
るための音声合成装置、疑似感情表現装置および音声合
成方法を提案したが、これに限らず、上記目的を達成す
るために、次に掲げる記憶媒体を提案することもでき
る。

【００３４】この記憶媒体は、異なる複数の疑似感情を
音声により表現する疑似感情表現プログラムを記憶した
記憶媒体であって、前記各疑似感情ごとに音声データを
記憶するための音声データ記憶手段を備えたコンピュー
タに対して、前記複数の疑似感情を生成する疑似感情生
成手段と、前記疑似感情生成手段で生成した疑似感情に
対応するそれぞれの音声データを前記音声データ記憶手
段から読み出して合成する音声データ合成手段と、前記
音声データ合成手段で合成した音声データに基づいて音
声を出力する音声出力手段とで実現される処理を実行さ
せるためのプログラムを記憶したコンピュータ読み取り
可能な記憶媒体である。

【００３５】このような構成であれば、記憶媒体に記憶
された疑似感情表現プログラムがコンピュータによって
読み取られ、読み取られたプログラムに従ってコンピュ
ータが実行したときは、請求項３記載の疑似感情表現装
置と同等の作用および効果が得られる。

【００３６】

【発明の実施の形態】以下、本発明の実施の形態を図面
を参照しながら説明する。図１ないし図５は、本発明に
係る音声合成装置、疑似感情表現装置および音声合成方
法の実施の形態を示す図である。本実施の形態は、本発
明に係る音声合成装置、疑似感情表現装置および音声合
成方法を、図１に示すように、ペット型ロボット１で生
成した異なる複数の疑似感情を音声により表現する場合
について適用したものである。

【００３７】まず、ペット型ロボット１の構成を図１を
参照しながら説明する。図１は、ペット型ロボット１の
構成を示すブロック図である。ペット型ロボット１は、
図１に示すように、外部から与えられる刺激等の外部情
報を入力する外部情報入力部２と、ペット型ロボット１
内で得られる内部情報を入力する内部情報入力部３と、
ペット型ロボット１の疑似感情や行動を制御する制御部
４と、制御部４の制御結果に基づいてペット型ロボット
１の疑似感情や行動を表現する疑似感情表現部５とで構
成されている。

【００３８】外部情報入力部２は、視覚的情報入力装置
として、ユーザ６の顔、ジェスチャ、位置等を検出する
カメラ２ａと、周囲の障害物を検出するＩＲ（赤外線）
センサ２ｂとを備え、さらに、聴覚的情報入力装置とし
て、ユーザ６による発声や周囲の音を検出するマイク２
ｃを備え、さらに、触覚的情報入力装置として、ユーザ
６による撫でや叩きを検出する感圧センサ２ｄと、ペッ
ト型ロボット１の脚や手の力・トルクを検出するトルク
センサ２ｅと、ペット型ロボット１の脚や手の関節位置
を検出するポテンショセンサ４ｆとを備えている。これ
らセンサ等２ａ〜２ｆからの情報は、制御部４に出力さ
れる。

【００３９】内部情報入力部３は、ペット型ロボット１
の飢えの情報を検出するバッテリ残量計３ａと、ペット
型ロボット１の疲れの情報を検出するモータ温度計３ｂ
とを備えている。これらセンサ３ａ，３ｂからの情報
は、制御部４に出力される。制御部４は、カメラ２ａか
らの信号によりユーザ６の顔情報を検出する顔情報検出
装置４ａおよびジェスチャ情報検出装置４ｂと、マイク
２ｃからの信号によりユーザ６の音声情報を検出する音
声情報検出装置４ｃと、感圧センサ２ｄからの信号によ
りユーザ６との接触情報を検出する接触情報検出装置４
ｄと、カメラ２ａ、ＩＲセンサ２ｂ、マイク２ｃおよび
感圧センサ２ｄからの信号により周辺環境を検出する周
辺環境検出装置４ｅと、トルクセンサ２ｅおよびポテン
ショセンサ２ｆからの信号によりペット型ロボット１の
腕等の姿勢動作、抵抗力を検出する動作検出装置４ｆと
を備えている。さらに、内部情報入力部３からの情報に
基づいて内部情報を認識する内部情報認識処理装置４ｇ
と、記憶情報処理装置４ｈと、ユーザ・環境情報認識装
置４ｉと、疑似感情生成装置４ｊと、行動決定装置４ｋ
と、性格形成装置４ｎと、成長段階計算装置４ｐとを備
えている。

【００４０】内部情報認識処理装置４ｇは、バッテリ残
量計３ａおよびモータ温度計３ｂからの信号に基づいて
ペット型ロボット１の内部情報を認識し、その認識結果
を記憶情報処理装置４ｈおよび疑似感情生成装置４ｊに
出力するようになっている。次に、ユーザ・環境情報認
識装置４ｉの構成を図２を参照しながら詳細に説明す
る。図２は、ユーザ・環境情報認識装置４ｉの構成を示
すブロック図である。

【００４１】ユーザ・環境情報認識装置４ｉは、図２に
示すように、ユーザ６を特定するユーザ特定装置７と、
ユーザの状態を識別するユーザ状態識別装置８と、ユー
ザ６からの情報を受け付ける受付装置９と、周囲の環境
を認識する環境認識装置１０とを備えている。ユーザ特
定装置７は、顔情報検出装置４ａおよび音声情報検出装
置４ｃから情報に基づいてユーザ６を特定し、その特定
結果をユーザ状態識別装置８および受付装置９に出力す
るようになっている。

【００４２】ユーザ状態識別装置８は、顔情報検出装置
４ａ、動作検出装置４ｆおよびユーザ特定装置７からの
情報に基づいてユーザ６の状態を識別し、その識別結果
を疑似感情生成装置４ｊに出力するようになっている。
受付装置９は、ジェスチャ情報検出装置４ｂ、音声情報
検出装置４ｃ、接触情報検出装置４ｄおよびユーザ特定
装置７からそれぞれ情報を入力し、入力したそれら情報
を特徴行為記憶装置４ｍに出力するようになっている。

【００４３】環境認識装置１０は、周辺環境検出装置４
ｅからの情報に基づいて周辺の環境を認識し、その認識
結果を行動決定装置４ｋに出力するようになっている。
図１に戻り、疑似感情生成装置４ｊは、ユーザ状態識別
装置８からの情報および記憶情報処理装置４ｈの疑似感
情モデルに基づいて、ペット型ロボット１の異なる複数
の擬似感情を生成し、行動決定装置４ｋおよび特徴行為
記憶処理装置４ｍに出力するようになっている。ここ
で、疑似感情モデルは、ペット型ロボット１の疑似感情
を表す怒り、悲しみ、喜び、恐れ、嫌悪、疲れ、飢え、
眠気等のパラメータを求めるための計算式であり、音声
や画像として検出したユーザ情報（ユーザ６のご機嫌
度、命令など）および環境情報（部屋の明るさや音等）
に応じてペット型ロボット１の疑似感情を生成する。疑
似感情の生成は、各疑似感情ごとにその強度をその強度
を生成することにより行う。例えば、ユーザ６が目の前
に現れたときは、「喜び」の疑似感情の強度を「５」と
して、「怒り」の疑似感情の強度を「０」として生成す
ることにより「喜び」の疑似感情を強調し、逆に他人が
目の前に現れたときは、「喜び」の疑似感情の強度を
「０」として、「怒り」の疑似感情の強度を「５」とし
て生成することにより「怒り」の疑似感情を強調する。

【００４４】性格形成装置４ｎは、ユーザ・環境情報認
識装置４ｉからの情報に基づいて、ペット型ロボット１
の性格を、「怒りっぽい性格」、「陽気な性格」、「陰
気な性格」等異なる複数の性格のうちいずれかに形成
し、形成したペット型ロボット１の性格を性格データと
して疑似感情生成装置４ｊおよび行動決定装置４ｋに出
力するようになっている。

【００４５】成長段階計算装置４ｐは、ユーザ・環境情
報認識装置４ｊからの情報に基づいて、ユーザ６から誉
められたり叱られたりすることにより、ペット型ロボッ
ト１の疑似感情を変化させペット型ロボット１を成長さ
せていき、その成長結果を成長データとして行動決定装
置４ｋに出力するようになっている。また、ペット型ロ
ボット１が赤ん坊の頃は幼稚な動きをするように反応
し、成長するにつれて大人の動きをするように疑似感情
モデルを作成しておく。成長段階は、例えば、「幼年
期」、「青年期」、「老年期」の３段階に規定されてい
る。

【００４６】特徴的行為記憶処理装置４ｍは、ユーザ・
環境情報検出装置４ｉおよび擬似感情生成装置４ｊから
の情報に基づいて、ペット型ロボット１がユーザ６に徐
々になついていく行動とか、ユーザ６のしぐさを学習す
るとかの特徴的行為を記憶、処理し、その処理結果を行
動決定装置４ｋに出力するようになっている。一方、疑
似感情表現部５は、視覚的に疑似感情を表現する視覚的
感情表現装置５ａと、聴覚的に疑似感情を表現する聴覚
的感情表現装置５ｂと、触覚的に疑似感情を表現する触
覚的感情表現装置５ｃとを備えている。

【００４７】視覚的感情表現装置５ａは、後述する行動
セットパラメータ設定装置１２からの行動セットパラメ
ータに基づいて、ペット型ロボット１の顔や腕、体等の
動作機構を駆動するようになっており、これにより、ペ
ット型ロボット１の疑似感情を、アテンション（注意）
やロコモーション（運動）情報（例えば顔の表情、首振
り、おどり）としてユーザ６に伝達する。動作機構とし
ては、例えば、モータ、電磁ソレノイド、エアまたは油
圧シリンダなどのアクチュエータを用いることができ
る。

【００４８】聴覚的感情表現装置５ｂは、後述する音声
データ合成装置１５で合成した音声データに基づいて、
スピーカを駆動して音声を出力するようになっており、
これにより、ペット型ロボット１の疑似感情を、音程、
リズム情報（例えば鳴き声）としてユーザ６に伝達す
る。触覚的感情表現装置５ｃは、後述する行動セットパ
ラメータ設定装置１２からの行動セットパラメータに基
づいて、顔や腕、体等の動作機構を駆動するようになっ
ており、ペット型ロボット１の疑似感情を、抵抗力、リ
ズム情報（例えば「お手」をしたときのユーザ６が受け
る触覚）としてユーザ６に伝達する。動作機構として
は、例えば、モータ、電磁ソレノイド、エアまたは油圧
シリンダなどのアクチュエータを用いることができる。

【００４９】次に、行動決定装置４ｋの構成を図３を参
照しながら説明する。図３は、行動決定装置４ｋの構成
を示すブロック図である。行動決定装置４ｋは、図３に
示すように、行動セット選択装置１１と、行動セットパ
ラメータ設定装置１２と、行動再現装置１３と、各疑似
感情ごとに音声データを記憶した音声データ登録データ
ベース１４と、音声データ登録データベース１４の音声
データを合成する音声データ合成装置１５とを備えてい
る。

【００５０】行動セット選択装置１１は、擬似感情生成
装置４ｊからの情報に基づいて、記憶情報処理装置４ｈ
の行動セット（行動ライブラリ）を参照してペット型ロ
ボット１の基本行動を決定し、決定した基本行動を行動
セットパラメータ設定装置１２に出力するようになって
いる。行動ライブラリには、ペット型ロボット１が特定
の表現をするための動作シーケンスが登録されており、
例えば、行動パターンが「前進」の場合には、「所定の
順序で各脚から動かす」というシーケンス、行動パター
ンが「おどり」の場合には、「後脚をたたんで座姿にな
り、前脚を交互に上げ下げする」というシーケンスが登
録されている。

【００５１】行動再現装置１３は、特徴行為記憶装置４
ｍの行動セットに基づいて、行動セット選択装置１１の
行動セットを補正し、補正後の行動セットを行動セット
パラメータ設定装置１２に出力するようになっている。
行動セットパラメータ設定装置１２は、行動セット選択
装置１１および行動再現装置１３からの行動セットに基
づいて、例えば、ペット型ロボット１がユーザ６の方向
に近づく速度やユーザ６の手を掴む抵抗力等の行動セッ
トパラメータを設定し、設定した行動セットパラメータ
を視覚的感情表現装置５ａおよび触覚的感情表現装置５
ｃに出力するようになっている。

【００５２】音声データ登録データベース１４には、図
４に示すように、複数の音声データを格納しているとと
もに、各疑似感情ごとに音声データを対応付けて登録し
た音声データ対応テーブル１００〜１０４を、各成長段
階ごとに格納している。図４は、音声データ対応テーブ
ルのデータ構造を示す図である。音声データ対応テーブ
ル１００は、図４に示すように、ペット型ロボット１の
成長段階が「幼年期」であるときに参照するテーブルで
あって、各疑似感情ごとに一つのレコードが登録されて
いる。各レコードは、ペット型ロボット１の性格が「怒
りっぽい性格」であるときに出力すべき音声データ１ｉ
（ｉは、レコード番号を示す。）を登録するフィールド
１１０と、ペット型ロボット１の性格が「陽気な性格」
であるときに出力すべき音声データ２ｉを登録するフィ
ールド１１２と、ペット型ロボット１の性格が「陰気な
性格」であるときに出力すべき音声データ３ｉを登録す
るフィールド１１４とを含んで構成されている。

【００５３】音声データ対応テーブル１０２は、ペット
型ロボット１の成長段階が「青年期」であるときに参照
するテーブルであって、各疑似感情ごとに一つのレコー
ドが登録されている。各レコードは、音声データ対応テ
ーブル１００のレコードと同様に、フィールド１１０〜
１１４を含んで構成されている。音声データ対応テーブ
ル１０４は、ペット型ロボット１の成長段階が「老年
期」であるときに参照するテーブルであって、各疑似感
情ごとに一つのレコードが登録されている。各レコード
は、音声データ対応テーブル１００のレコードと同様
に、フィールド１１０〜１１４を含んで構成されてい
る。

【００５４】すなわち、音声データ対応テーブル１００
〜１０４を参照することにより、ペット型ロボット１の
成長段階および性格に応じて、各疑似感情ごとに出力す
べき音声データを特定することができる。図４の例で
は、ペット型ロボット１の成長段階が「幼年期」であ
り、その性格が「陽気な性格」である場合は、「喜び」
の疑似感情については音楽データ１１を読み出し、「悲
しみ」の疑似感情については音楽データ１２を読み出
し、「怒り」の疑似感情については音楽データ１３を読
み出せばよいことが分かる。

【００５５】次に、音声データ合成装置１５の構成を図
５を参照しながら説明する。音声データ合成装置１５
は、ＣＰＵ、ＲＯＭ、ＲＡＭおよびＩ／Ｆ等をバス接続
して構成されており、さらに、複数のチャンネルを有し
かつ各チャンネルごとにプリセットされた音声データを
合成して出力する音声データ合成ＩＣを備えている。

【００５６】音声データ合成装置１５のＣＰＵは、マイ
クロプロセッシングユニットＭＰＵ等からなり、ＲＯＭ
の所定領域に格納されている所定のプログラムを起動さ
せ、そのプログラムに従って、図５のフローチャートに
示す音声データ合成処理を所定周期（例えば、１００
[ｍｓ]）の割込処理により実行するようになっている。
図５は、音声データ合成処理を示すフローチャートであ
る。

【００５７】音声データ合成処理は、ユーザ・環境情報
認識装置４ｉ、疑似感情生成装置４ｊ、性格形成装置４
ｎおよび成長段階計算装置４ｐからの情報に基づいて、
疑似感情生成装置４ｊで生成した疑似感情に対応するそ
れぞれの音声データを音声データ登録データベース１４
から読み出して合成する処理であって、ＣＰＵにおいて
実行されると、まず、図５に示すように、ステップＳ１
００に移行するようになっている。

【００５８】ステップＳ１００では、制御装置４等から
音声停止命令を入力したか否かを判定することにより音
声の出力を停止するか否かを判定し、音声の出力を停止
しないと判定したとき(No)は、ステップＳ１０２に移行
して、音声データを更新するか否かを判定し、音声デー
タを更新すると判定したとき(Yes)は、ステップＳ１０
４に移行する。

【００５９】ステップＳ１０４では、成長段階計算装置
４ｐからの成長データに基づいて音声データ対応テーブ
ル１００〜１０６のうちいずれかを特定し、ステップＳ
１０６に移行して、性格形成装置４ｎからの性格データ
に基づいて、ステップＳ１０４で特定した音声データ対
応テーブルのフィールドのうち音声データを読み出すフ
ィールドを特定し、ステップＳ１０８に移行する。

【００６０】ステップＳ１０８では、音声の出力を開始
してから経過した時間を測定するための音声出力時間を
「０」に設定し、ステップＳ１１０に移行して、ステッ
プＳ１０４で特定した音声データ対応テーブルのフィー
ルドのうちステップＳ１０６で特定したフィールドを参
照して、疑似感情生成装置４ｊで生成した疑似感情に対
応するそれぞれの音声データを音声データ登録データベ
ース１４から読み出し、ステップＳ１１２に移行する。

【００６１】ステップＳ１１２では、読み出した各音声
データが、疑似感情生成装置４ｊで生成した疑似感情の
強度に応じた音声ボリュームとなるように音声ボリュー
ムの音声パラメータを決定し、ステップＳ１１４に移行
して、全体の音量、テンポその他の音響効果を規定する
その他の音声パラメータを決定し、ステップＳ１１６に
移行して、音声出力時間を加算し、ステップＳ１１８に
移行する。

【００６２】ステップＳ１１８では、音声出力時間が所
定値（音声データごとに規定されている出力上限時間）
以上であるか否かを判定し、音声出力時間が所定値未満
であると判定したとき(No)は、ステップＳ１２０に移行
して、音声データ合成ＩＣの各チャンネルごとに、決定
した音声パラメータおよび読み出した音声データをプリ
セットし、一連の処理を終了して元の処理に復帰させ
る。

【００６３】一方、ステップＳ１１８で、音声出力時間
が所定値以上であると判定したとき(Yes)は、ステップ
Ｓ１２２に移行して、音声の出力を停止するか否かを示
す出力停止フラグをセットし、ステップＳ１２４に移行
して、音声の出力を停止する停止コマンドを音声データ
合成ＩＣに出力することにより音声の出力を停止し、一
連の処理を終了して元の処理に復帰させる。

【００６４】一方、ステップＳ１０２で、音声データを
更新しないと判定したとき(No)は、ステップＳ１１０に
移行する。一方、ステップＳ１００で、音声の出力を停
止すると判定したとき(Yes)は、ステップＳ１２６に移
行して、音声の出力を停止する停止コマンドを音声デー
タ合成ＩＣに出力することにより音声の出力を停止し、
一連の処理を終了して元の処理に復帰させる。

【００６５】次に、上記実施の形態の動作を説明する。
ユーザにより、例えば、撫でたり声をかけたりするなど
して、ペット型ロボット１に対して刺激が与えられる
と、各センサ等２ａ〜２ｆ、各検出装置４ａ〜４ｆおよ
びユーザ・環境情報認識装置４ｉにより、与えられた刺
激が認識され、疑似感情生成装置４ｊにより、その認識
結果に基づいて、各疑似感情ごとにその強度が生成され
る。例えば、疑似感情として、「喜び」、「悲しみ」、
「怒り」、「驚き」、「嫌悪」および「恐怖」があると
すると、それぞれの疑似感情の強度が「５」、「４」、
「３」、「２」および「１」として生成される。

【００６６】一方、ユーザ６から誉められたり叱られた
りするなどして、ユーザ６から与えられた刺激量や刺激
パターンを学習していくと、性格形成装置４ｎにより、
ユーザ・環境情報認識装置４ｉからの情報に基づいて、
ペット型ロボット１の性格が、「怒りっぽい性格」、
「陽気な性格」、「陰気な性格」等異なる複数の性格の
うちいずれかに形成され、形成された性格が性格データ
として出力される。また、成長段階計算装置４ｐによ
り、ユーザ・環境情報認識装置４ｊからの情報に基づい
て、ペット型ロボット１の疑似感情が変化してペット型
ロボット１が成長していき、その成長結果が成長データ
として出力される。成長段階は、例えば、「幼年期」、
「青年期」、「老年期」の３段階のうちその順で変化し
ていく。

【００６７】このように、各疑似感情の強度、成長デー
タおよび性格データが生成されると、音声データ合成装
置１５により、ステップＳ１０４，Ｓ１０６を経て、成
長段階計算装置４ｐからの成長データに基づいて、音声
データ対応テーブル１００〜１０６のうちいずれかが特
定され、性格形成装置４ｎからの性格データに基づい
て、特定された音声データ対応テーブルのフィールドの
うち音声データを読み出すフィールドが特定される。例
えば、成長段階が「幼年期」であり、性格が「怒りっぽ
い性格」であれば、音声データ対応テーブルとして音声
データ対応テーブル１００が特定され、音声データを読
み出すフィールドとしてフィールド１１０が特定され
る。

【００６８】次いで、ステップＳ１０８〜Ｓ１１２を経
て、特定された音声データ対応テーブルのフィールドの
うち特定されたフィールドを参照して、疑似感情生成装
置４ｊで生成された疑似感情に対応するそれぞれの音声
データが音声データ登録データベース１４から読み出さ
れ、読み出された各音声データが、疑似感情生成装置４
ｊで生成された疑似感情の強度に応じた音声ボリューム
となるように音声ボリュームの音声パラメータが決定さ
れる。

【００６９】次いで、ステップＳ１０８〜Ｓ１２０を経
て、音声データ合成ＩＣの各チャンネルごとに、決定さ
れた音声パラメータおよび読み出された音声データがプ
リセットされ、音声データ合成ＩＣにより、プリセット
された音声パラメータに基づいて音声データが合成さ
れ、聴覚的感情表現装置５ｃに出力される。そして、聴
覚的感情表現装置５ｃにより、音声データ合成装置１５
で合成された音声データに基づいて音声が出力される。

【００７０】すなわち、ペット型ロボット１では、疑似
感情を表現するときは、各疑似感情の強度に応じた音声
ボリュームで、各疑似感情に対応するそれぞれの音声デ
ータが合成されて音声が出力される。例えば、「喜び」
の疑似感情が強いときは、出力音声のうち「喜び」の疑
似感情に対応する音声が比較的大きなボリュームとな
り、「怒り」の疑似感情が強いときは、出力音声のうち
「怒り」の疑似感情に対応する音声が比較的大きなボリ
ュームとなる。

【００７１】このようにして、本実施の形態では、外部
から与えられる刺激を認識し、その認識結果に基づいて
複数の疑似感情を生成し、生成した疑似感情に対応する
それぞれの音声データを音声データ登録データベース１
４から読み出して合成し、合成した音声データに基づい
て音声を出力するようになっている。これにより、各疑
似感情に対応するそれぞれの音声が合成されて出力され
るので、ユーザに対して、異なる複数の疑似感情のそれ
ぞれを比較的明確に伝えることができる。したがって、
実際のペットにはない面白味やかわいらしさを表現する
ことができる。

【００７２】さらに、本実施の形態では、ペット型ロボ
ット１の性格を異なる複数の性格のうちいずれかに形成
し、音声データ対応テーブルのフィールドのうちその形
成した性格に対応するフィールドを参照して、生成した
疑似感情に対応するそれぞれの音声データを音声データ
登録データベース１４から読み出して合成するようにな
っている。

【００７３】これにより、各性格ごとに異なる合成音声
が出力されるので、ユーザに対して、異なる複数の性格
のそれぞれを比較的明確に伝えることができる。したが
って、実際のペットにはない面白味やかわいらしさをさ
らに表現することができる。さらに、本実施の形態で
は、ペット型ロボット１の成長段階を規定し、規定した
成長段階に対応する音声データ対応テーブルを参照し
て、生成した疑似感情に対応するそれぞれの音声データ
を音声データ登録データベース１４から読み出して合成
するようになっている。

【００７４】これにより、各成長段階ごとに異なる合成
音声が出力されるので、ユーザに対して、複数の成長段
階のそれぞれを比較的明確に伝えることができる。した
がって、実際のペットにはない面白味やかわいらしさを
さらに表現することができる。さらに、本実施の形態で
は、各疑似感情ごとにその強度を生成し、読み出した各
音声データが、生成した疑似感情の強度に応じた音声ボ
リュームとなるように合成するようになっている。

【００７５】これにより、ユーザに対して、異なる複数
の疑似感情のそれぞれの強度を比較的明確に伝えること
ができる。したがって、実際のペットにはない面白味や
かわいらしさをさらに表現することができる。上記実施
の形態において、音声データ登録データベース１４は、
請求項１ないし６、または９記載の音声データ記憶手段
に対応し、疑似感情生成装置４ｊは、請求項１ないし
６、８または９記載の疑似感情生成手段に対応し、音声
データ合成装置１５は、請求項２ないし６、または８記
載の音声データ合成手段に対応し、聴覚的感情表現装置
５ｂは、請求項３または４記載の音声出力手段に対応し
ている。また、各センサ等２ａ〜２ｆ、各検出装置４ａ
〜４ｆおよびユーザ・環境情報認識装置４ｉは、請求項
４記載の刺激認識手段に対応し、性格形成装置４ｎは、
請求項５記載の性格形成手段に対応し、成長段階計算装
置４ｐは、請求項６記載の成長段階規定手段に対応して
いる。

【００７６】なお、上記実施の形態においては、各性格
ごとまたは各成長段階ごとに異なる合成音声を出力する
ように構成したが、これに限らず、音声データ対応テー
ブルを選択するためのスイッチをユーザ切り換え可能な
位置に設け、そのスイッチで選択した音声データ対応テ
ーブルを参照して、生成した疑似感情に対応するそれぞ
れの音声データを音声データ登録データベース１４から
読み出して合成するように構成してもよい。

【００７７】これにより、スイッチの各切換状態ごとに
異なる合成音声が出力されるので、実際のペットにはな
い面白味やかわいらしさをさらに表現することができ
る。また、上記実施の形態においては、音声データを音
声データ登録データベース１４にあらかじめ格納して構
成したが、これに限らず、インターネット等からダウン
ロードした音声データや、持ち運び可能な記憶媒体等か
ら読み出した音声データを音声データ登録データベース
１４に登録可能に構成してもよい。

【００７８】また、上記実施の形態においては、音声デ
ータ対応テーブル１００〜１０２の内容をあらかじめ登
録して構成したが、これに限らず、音声データ対応テー
ブル１００〜１０２の内容をユーザが自由に登録・編集
することができるように構成してもよい。また、上記実
施の形態においては、読み出した各音声データが、生成
した疑似感情の強度に応じた音声ボリュームとなるよう
に合成するように構成したが、これに限らず、例えば、
生成した疑似感情の強度に応じて、音声周波数を変化す
る効果、または音声ピッチを変化する効果を与えるよう
に構成してもよい。

【００７９】また、上記実施の形態においては、音声合
成についてユーザの感情を特に考慮しなかったが、これ
に限らず、ユーザ状態識別装置８からの情報に基づいて
音声データを合成するように構成してもよい。例えば、
ユーザの機嫌がよいと識別したときは、テンポを早くし
て軽快感を演出するとか、逆にユーザの機嫌がよくない
と識別したときは、全体の音声ボリュームを小さくして
静かにする。

【００８０】また、上記実施の形態においては、音声合
成について周囲の環境を特に考慮しなかったが、これに
限らず、環境認識装置１０からの情報に基づいて音声デ
ータを合成するように構成してもよい。例えば、周囲が
明るいと認識したときは、テンポを早くして軽快感を演
出するとか、周囲が静かであると認識したときは、全体
の音声ボリュームを小さくして静かにする。

【００８１】また、上記実施の形態においては、音声出
力を停止する操作については特に説明しなかったが、例
えば、ペット型ロボット１に設けた音声停止スイッチに
より、また外部から与えられた刺激に応じて、音声出力
を停止したり再開したりするように構成してもよい。ま
た、上記実施の形態においては、成長段階を３段階に規
定したが、これに限らず、成長段階を２段階または４段
階以上に規定してもよい。成長段階が多数になったり連
続値をもつようになったりした場合は、音声データ対応
テーブルを多数用意しなければならず、メモリ占有率が
増大してしまうので、そのような場合には、成長段階に
基づいて所定の演算式により音声データを特定するよう
に構成してもよいし、成長段階に基づいて所定の演算式
により合成対象となる音声データに対して所定の音響効
果を与えるように構成してもよい。

【００８２】また、上記実施の形態においては、ペット
型ロボット１の性格を３つに分類したが、これに限ら
ず、ペット型ロボット１の性格を２つまたは４つ以上に
分類してもよい。ペット型ロボット１の性格が多数にな
ったり連続値をもつようになったりした場合は、音声デ
ータ対応テーブルを多数用意しなければならず、メモリ
占有率が増大してしまうので、そのような場合には、ペ
ット型ロボット１の性格に基づいて所定の演算式により
音声データを特定するように構成してもよいし、ペット
型ロボット１の性格に基づいて所定の演算式により合成
対象となる音声データに対して所定の音響効果を与える
ように構成してもよい。

【００８３】また、上記実施の形態においては、音声デ
ータ合成ＩＣは、音声データ合成装置１５に設けて構成
したが、これに限らず、聴覚的感情表現装置５ｂに設け
て構成してもよい。この場合、音声データ合成装置１５
は、音声データ登録データベース１４から読み出した音
声データを、音声データ合成ＩＣの各チャンネルに対し
て出力するように構成する。

【００８４】また、上記実施の形態においては、音声デ
ータ登録データベース１４は、ペット型ロボット１の内
蔵型メモリとして構成したが、これに限らず、ペット型
ロボット１に対して着脱可能なメモリとして構成しても
よい。ユーザは、音声データ登録データベース１４をペ
ット型ロボット１から取り外し、外部のパソコン等で新
たな音声データを書き込んで再びペット型ロボット１に
取り付けることにより、音声データ登録データベース１
４の内容を更新することができる。この場合、音声デー
タとしては、外部のパソコンで独自に編集した音声デー
タを採用することもできるし、外部のパソコンがインタ
ーネット等のネットワークを介して取得した音声データ
を採用することもできる。これにより、ユーザは、ペッ
ト型ロボット１の新しい疑似感情表現を楽しむことがで
きる。

【００８５】その他、音声データの更新に関しては、例
えば、所定のインターフェースと、そのインターフェー
スを介して外部と通信を行う通信装置とをペット型ロボ
ットに設け、インターネット等のネットワークまたは音
声データを蓄積したパソコンとインターフェースとを無
線または有線により通信可能に接続し、通信装置によ
り、ネットワークまたはパソコンから音声データをダウ
ンロードすることによって音声データ登録データベース
１４の音声データを更新するように構成してもよい。

【００８６】また、上記実施の形態においては、音声デ
ータ登録データベース１４、音声データ合成装置１５お
よび聴覚的感情表現装置５ｂを設けて構成したが、これ
に限らず、音声データ登録データベース１４、音声デー
タ合成装置１５および聴覚的感情表現装置５ｂを一体に
モジュール化し、モジュール化したものを、図３の聴覚
的感情表現装置５ｂの部分に着脱可能に設けて構成して
もよい。すなわち、既存のペット型ロボットに対して、
本発明の音声合成による疑似感情表現を行わせたいとき
は、既存の聴覚的感情表現装置５ｂに代えて、上記のよ
うなモジュールを取り付ければよい。このような構成で
あれば、既存のペット型ロボットの構成をさほど変更す
ることなく、本発明の音声合成による感情表現を比較的
容易に行わせることができる。

【００８７】また、上記実施の形態において、図５のフ
ローチャートに示す処理を実行するにあたっては、ＲＯ
Ｍにあらかじめ格納されている制御プログラムを実行す
る場合について説明したが、これに限らず、これらの手
順を示したプログラムが記憶された記憶媒体から、その
プログラムをＲＡＭに読み込んで実行するようにしても
よい。

【００８８】ここで、記憶媒体とは、ＲＡＭ、ＲＯＭ等
の半導体記憶媒体、ＦＤ、ＨＤ等の磁気記憶型記憶媒
体、ＣＤ、ＣＤＶ、ＬＤ、ＤＶＤ等の光学的読取方式記
憶媒体、ＭＯ等の磁気記憶型／光学的読取方式記憶媒体
であって、電子的、磁気的、光学的等の読み取り方法の
いかんにかかわらず、コンピュータで読み取り可能な記
憶媒体であれば、あらゆる記憶媒体を含むものである。

【００８９】また、上記実施の形態においては、本発明
に係る音声合成装置、疑似感情表現装置および音声合成
方法を、図１に示すように、ペット型ロボット１で生成
した異なる複数の疑似感情を音声により表現する場合に
ついて適用したが、これに限らず、本発明の主旨を逸脱
しない範囲で他の場合にも適用可能である。例えば、コ
ンピュータ上でソフトウェアにより実現される仮想的な
ペット型ロボットにおいて、異なる複数の疑似感情を音
声により表現する場合についても適用することができ
る。

【００９０】

【発明の効果】以上説明したように、本発明に係る請求
項１または２記載の音声合成装置によれば、各疑似感情
に対応するそれぞれの音声が合成されるので、観察者に
対して、異なる複数の疑似感情のそれぞれを比較的明確
に伝えることができる。したがって、実際のペットには
ない面白味やかわいらしさを表現することができるとい
う効果が得られる。

【００９１】一方、本発明に係る請求項３ないし８記載
の疑似感情表現装置によれば、各疑似感情に対応するそ
れぞれの音声が合成されて出力されるので、観察者に対
して、異なる複数の疑似感情のそれぞれを比較的明確に
伝えることができる。したがって、実際のペットにはな
い面白味やかわいらしさを表現することができるという
効果が得られる。

【００９２】さらに、本発明に係る請求項５記載の疑似
感情表現装置によれば、各性格ごとに異なる合成音声を
出力することが可能となるので、観察者に対して、異な
る複数の性格のそれぞれを比較的明確に伝えることがで
きる。したがって、実際のペットにはない面白味やかわ
いらしさをさらに表現することができるという効果も得
られる。

【００９３】さらに、本発明に係る請求項６記載の疑似
感情表現装置によれば、各成長段階ごとに異なる合成音
声を出力することが可能となるので、観察者に対して、
複数の成長段階のそれぞれを比較的明確に伝えることが
できる。したがって、実際のペットにはない面白味やか
わいらしさをさらに表現することができるという効果も
得られる。

【００９４】さらに、本発明に係る請求項７記載の疑似
感情表現装置によれば、選択手段の各選択ごとに異なる
合成音声を出力することが可能となるので、実際のペッ
トにはない面白味やかわいらしさをさらに表現すること
ができるという効果も得られる。さらに、本発明に係る
請求項８記載の疑似感情表現装置によれば、観察者に対
して、異なる複数の疑似感情のそれぞれの強度を比較的
明確に伝えることができる。したがって、実際のペット
にはない面白味やかわいらしさをさらに表現することが
できるという効果も得られる。

【００９５】一方、本発明に係る請求項９記載の音声合
成方法によれば、請求項１記載の音声合成装置と同等の
効果が得られる。

【図面の簡単な説明】

【図１】ペット型ロボット１の構成を示すブロック図で
ある。

【図２】ユーザ・環境情報認識装置４ｉの構成を示すブ
ロック図である。

【図３】行動決定装置４ｋの構成を示すブロック図であ
る。

【図４】音声データ合成処理を示すフローチャートであ
る。

【図５】音声データ合成処理を示すフローチャートであ
る。

【符号の説明】

１ペット型ロボット２外部情報入力部３内部情報入力部４制御部４ｈ記憶情報処理装置４ｉユーザ・環境情報認識装置４ｊ疑似感情生成装置４ｋ行動決定装置１１行動セット選択装置１２行動セットパラメータ設定装置１３行動再現装置１４音声データ登録データベース１５音声データ合成装置４ｍ特徴行為記憶処理装置４ｎ性格形成装置４ｐ成長段階計算装置５疑似感情表現部５ａ視覚的感情表現装置５ｂ聴覚的感情表現装置５ｃ触覚的感情表現装置

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 13/00 Ｇ１０Ｌ 3/00 Ｑ

Claims

【特許請求の範囲】

【請求項１】異なる複数の疑似感情を生成する疑似感
情生成手段を利用して前記複数の疑似感情を音声により
表現する疑似感情表現装置に適用される装置であって、前記各疑似感情ごとに音声データを記憶した音声データ
記憶手段が与えられたときに、前記疑似感情生成手段よ
って生成された疑似感情に対応するそれぞれの音声デー
タを前記音声データ記憶手段から読み出して合成するよ
うになっていることを特徴とする音声合成装置。
【請求項２】異なる複数の疑似感情を生成する疑似感
情生成手段を利用して前記複数の疑似感情を音声により
表現する疑似感情表現装置に適用される装置であって、前記各疑似感情ごとに音声データを記憶するための音声
データ記憶手段と、前記疑似感情生成手段によって生成
された疑似感情に対応するそれぞれの音声データを前記
音声データ記憶手段から読み出して合成する音声データ
合成手段とを備えることを特徴とする音声合成装置。
【請求項３】異なる複数の疑似感情を音声により表現
する装置であって、前記各疑似感情ごとに音声データを記憶するための音声
データ記憶手段と、前記複数の疑似感情を生成する疑似
感情生成手段と、前記疑似感情生成手段で生成した疑似
感情に対応するそれぞれの音声データを前記音声データ
記憶手段から読み出して合成する音声データ合成手段
と、前記音声データ合成手段で合成した音声データに基
づいて音声を出力する音声出力手段とを備えることを特
徴とする疑似感情表現装置。
【請求項４】異なる複数の疑似感情を音声により表現
する装置であって、前記各疑似感情ごとに音声データを記憶するための音声
データ記憶手段と、外部から与えられる刺激を認識する
刺激認識手段と、前記刺激認識手段の認識結果に基づい
て前記複数の疑似感情を生成する疑似感情生成手段と、
前記疑似感情生成手段で生成した疑似感情に対応するそ
れぞれの音声データを前記音声データ記憶手段から読み
出して合成する音声データ合成手段と、前記音声データ
合成手段で合成した音声データに基づいて音声を出力す
る音声出力手段とを備えることを特徴とする疑似感情表
現装置。
【請求項５】請求項３及び４のいずれかにおいて、さらに、異なる複数の性格のうちいずれかを形成する性
格形成手段を備え、前記音声データ記憶手段は、前記各疑似感情ごとに前記
音声データを対応付けて登録した音声データ対応テーブ
ルを、前記各性格ごとに記憶可能となっており、前記音声データ合成手段は、前記性格形成手段で形成し
た性格に対応する音声データ対応テーブルを参照して、
前記疑似感情生成手段で生成した疑似感情に対応するそ
れぞれの音声データを前記音声データ記憶手段から読み
出して合成するようになっていることを特徴とする疑似
感情表現装置。
【請求項６】請求項３乃至５のいずれかにおいて、さらに、成長段階を規定する成長段階規定手段を備え、前記音声データ記憶手段は、前記各疑似感情ごとに前記
音声データを対応付けて登録した音声データ対応テーブ
ルを、前記各成長段階ごとに記憶可能となっており、前記音声データ合成手段は、前記成長段階規定手段で規
定した成長段階に対応する音声データ対応テーブルを参
照して、前記疑似感情生成手段で生成した疑似感情に対
応するそれぞれの音声データを前記音声データ記憶手段
から読み出して合成するようになっていることを特徴と
する疑似感情表現装置。
【請求項７】請求項３乃至６のいずれかにおいて、前記音声データ記憶手段は、前記各疑似感情ごとに前記
音声データを対応付けて登録した音声データ対応テーブ
ルを複数記憶可能となっており、前記複数の音声データ対応テーブルのうちいずれかを選
択するテーブル選択手段を備え、前記音声データ合成手段は、前記テーブル選択手段で選
択した音声データ対応テーブルを参照して、前記疑似感
情生成手段で生成した疑似感情に対応するそれぞれの音
声データを前記音声データ記憶手段から読み出して合成
するようになっていることを特徴とする疑似感情表現装
置。
【請求項８】請求項３乃至７のいずれかにおいて、前記疑似感情生成手段は、前記各疑似感情ごとにその強
度を生成するようになっており、前記音声データ合成手段は、前記読み出した各音声デー
タに対して前記疑似感情生成手段で生成した疑似感情の
強度に応じた量の音響効果を与え、それら音声データを
合成するようになっていることを特徴とする疑似感情表
現装置。
【請求項９】異なる複数の疑似感情を生成する疑似感
情生成手段を利用して前記複数の疑似感情を音声により
表現する疑似感情表現装置に適用される方法であって、前記各疑似感情ごとに音声データを記憶した音声データ
記憶手段が与えられたときに、前記疑似感情生成手段よ
って生成された疑似感情に対応するそれぞれの音声デー
タを前記音声データ記憶手段から読み出して合成するこ
とを特徴とする音声合成方法。