WO2000038808A1

WO2000038808A1 - Processeur d'informations, dispositif portable, dispositif d'animal de compagnie electronique, support enregistre sur lequel la procedure de traitement des informations est enregistree et procede de traitement des informations

Info

Publication number: WO2000038808A1
Application number: PCT/JP1999/007271
Authority: WO
Inventors: Satoshi Fujimura; Naohiro Yokoo; Yasuhiko Kato
Original assignee: Sony Corporation
Priority date: 1998-12-24
Filing date: 1999-12-24
Publication date: 2000-07-06
Also published as: KR100702645B1; CN1549200A; CN1549201A; CN1253811C; KR100751957B1; US6792406B1; EP1748421B1; CN1549199A; CN1291112A; DE69939755D1; EP1072297B1; EP1072297A4; KR20010040942A; CN1253812C; EP1750252A2; KR20060084455A; DE69935909T2; EP1750252A3; EP1748421A2; DE69935909D1

Description

明田書情報処理装置、携帯機器、電子ぺット装置、情報処理手順を ί己録した記録媒体及び情報処理方法技術分野

本発明は、情報処理装置、携帯機器、電子ぺット装置、情報処理手順を記録した記録媒体及び情報処理方法に関し、例えば携帯電話、パーソナルコンピュータ等の各種情報機器に適用することができる。本発明は、応答の生成に必要な各種データをネットワークを介して交換することにより、また音声にて単語等を登録できるようにすること等により、一段と身近な親しみ易い電子ペット装置、電子ペットを有する情報処理装置、携帯機器、情報処理手順を記録した記録媒体及び情報処理方法を提案する。背景技術

従来、パーソナルコンピュータにおいては、いわゆる育成シユミレ一シヨンゲームソフトが提案されている。この育成シュミレーシヨンゲームは、コンビユータによる仮想現実空間においてペット（いわゆる電子ペットである）を飼育するゲームであり、実際に動物のぺットを飼育する場合に比して簡易にぺットとの交流を図ることができる。

ところで実際のペットにおいては、その日の体調、周囲の環境等により種々に異なる挙動を示す。また飼い主自体についてもこれを認識し、飼い主と飼い主以外とでは異なる挙動を示す。さらに学習により挙動が変化することもある。これら実際のぺッ卜における各種挙動を電子ぺッ卜においても再現することができれば、電子ぺットを一段と身近な親しみ易いものとすることができると考ええられる。発明の開示

本発明は以上の点を考慮してなされたもので、さらに一段と身近な親しみ易いものとすることができる電子ペット装置、電子ペットを有する情報処理装置、携帯機器、情報処理手順を記録した記録媒体及び情報処理方法を提案しようとするものである。

かかる課題を解決するため本発明においては、情報処理装置、携帯機器又は電子ぺット装置に適用して、所定の認識ルールに従って音声認識結果を出力する音声認識手段と、所定の感情パラメータ生成ルールに従って、少なくとも音声認識結果と時間経過とにより変化する、擬似的に感情を示す感情パラメータを生成する感情生成手段と、少なくとも感情パラメータを基準にした所定の応答生成ル一ルに従って、音声認識結果に対応する応答を生成する応答生成手段とに関し、所定のネットワークに接続して、認識ルール、感情パラメータ生成ルール又は応答生成ルールの更新処理を実行する通信手段、又は認識ルール、感情パラメータ生成ルール又は応答生成ルールに必要なデータの更新処理を実行する通信手段を有するようにする。

また情報処理装置、携帯機器又は電子ペット装置に適用して、所定のネットヮークに接続して、少なくとも感情パラメータ又は感情パラメータの生成に必要なデータを取得する通信手段を有するようにし、応答生成手段が、この通信手段により取得した感情パラメータによる応答、又は通信手段により取得したデータより生成した感情パラメータによる応答を出力するようにする。

また情報処理手順を記録した記録媒体に適用して、所定のネットワークに接続して、認識ルール、感情パラメータ生成ルール又は応答生成ルールの更新処理を実行する通信処理、又は認識ルール、感情パラメータ生成ルール又は応答生成ルールに必要なデータの更新処理を実行する通信処理とが記録されてなるようにする。

また情報処理手順を記録した記録媒体に適用して、所定のネットワークに接続して、少なくとも感情パラメータ又は感情パラメータの生成に必要なデータを取得する通信処理が記録され、応答生成処理が、通信処理により取得した感情パラメータによる応答、又は通信処理により取得したデータより生成した感情パラメータによる応答を出力する処理であるようにする。

また情報処理方法に適用して、所定のネットワークに接続して、認識ルール、感情パラメータ生成ルール又は応答生成ルールの更新処理を実行する通信処理、又は認識ルール、感情パラメータ生成ルール又は応答生成ルールに必要なデータの更新処理を実行する通信処理を有するようにする。

また情報処理方法に適用して、所定のネットワークに接続して、少なくとも感情パラメータ又は感情パラメータの生成に必要なデータを取得する通信処理を有するようにし、応答生成処理が、通信処理により取得した感情パラメータによる応答、又は通信処理により取得したデータより生成した感情パラメータによる応答を出力する処理であるようにする。

また情報処理装置、携帯機器又は電子ペット装置に適用して、登録の動作モードにおいて、音声認識結果に基づいて、少なくともデータベースに単語の音声認識結果を登録することにより、音声によりデータベースを変更可能な登録手段を備えるようにする。

また情報処理手順を記録した記録媒体に適用して、登録の動作モードにおいて、音声認識結果に基づいて、少なくともデータベースに単語の音声認識結果を登録することにより、音声によりデータべ一スを変更可能な登録処理を記録するようにする。

また情報処理方法に適用して、登録の動作モードにおいて、音声認識結果に基づいて、少なくともデータベースに単語の音声認識結果を登録することにより、音声によりデータベースを変更可能な登録処理を有するようにする。

また情報処理装置、携帯機器又は電子ペット装置に適用して、音声に基づいて、ユーザーを認証するユーザ一認証手段を備えるようにし、応答生成手段は、ュ

—ザ一認証手段の認証結果に基づいて、音声入力者に応じて応答を異ならせるようにする。また情報処理手順を記録した記録媒体に適用して、音声に基づいて、ユーザ一を認証するユーザ一認証処理が記録され、応答生成処理は、ユーザー認証処理の認証結果に基づいて、音声入力者に応じて応答を異ならせるようにする。

また情報処理方法に適用して、音声に基づいて、ユーザーを認証するユーザー認証処理を有するようにし、応答生成処理が、ユーザー認証処理の認証結果に基づいて、音声入力者に応じて応答を異ならせるようにする。

また情報処理装置、携帯機器又は電子ペット装置に適用して、所定の応答生成ルールに従って、音声認識結果に対応する応答を生成するにつき、音声に基づいて、音声による入力の種類を識別する発話分類手段を備えるようにし、応答生成ルールが、入力の種類に応じて、入力の種類に対応する応答の分類に従って、所定の種類の応答を除く応答を生成するルールであるようにする。

また情報処理手順を記録した記録媒体に適用して、所定の応答生成ルールに従つて、音声認識結果に対応する応答を生成するにつき、音声に基づいて、音声による入力の種類を識別する発話分類処理を記録するようにし、応答生成ルールは、入力の種類に応じて、入力の種類に対応する応答の分類に従って、所定の種類の応答を除く応答を生成するルールであるようにする。

また情報処理方法に適用して、所定の応答生成ルールに従って、音声認識結果に対応する応答を生成する情報処理手順につき、音声に基づいて、音声による入力の種類を識別するようにし、応答生成ルールが、入力の種類に応じて、入力の種類に対応する応答の分類に従って、所定の種類の応答を除く応答を生成するルールであるようにする。

また情報処理装置、携帯機器又は電子ペット装置に適用して、少なくとも音声認識結果と対応する感情パラメータとによる履歴を記録する履歴記録手段を有するようにし、音声認識結果に対する感情パラメータの変化を履歴に応じて変化させるようにする。

また情報処理手順を記録した記録媒体に適用して、少なくとも音声認識結果と対応する感情パラメータとによる履歴を記録する履歴記録処理が記録されてなるようにし、音声認識結果に対する感情パラメータの変化を履歴に応じて変化させるようにする。

また情報処理方法に適用して、少なくとも音声認識結果と対応する感情パラメータとによる履歴を記録する履歴記録処理を有するようにし、音声認識結果に対する感情パラメータの変化を履歴に応じて変化させるようにする。

情報処理装置、携帯機器又は電子ペット装置に適用して、所定の認識ルールに従って音声認識結果を出力する音声認識手段と、所定の感情パラメータ生成ルールに従って、少なくとも音声認識結果と時間経過とにより変化する、擬似的に感情を示す感情パラメータを生成する感情生成手段と、少なくとも感情パラメータを基準にした所定の応答生成ルールに従って、音声認識結果に対応する応答を生成する応答生成手段とに関し、所定のネットワークに接続して、認識ルール、感情パラメータ生成ルール又は応答生成ルールの更新処理を実行する通信手段、又は認識ルール、感情パラメ一タ生成ルール又は応答生成ルールに必要なデータの更新処理を実行する通信手段を有するようにすれば、この通信手段により応答の生成に必要な各種データを送出することができる。従ってこのネットワークに接続された同種の機器において、この情報処理装置等における音声入力に対する応答とほぼ同一の応答を生成でき、これによりあたかも電子ぺットを外部の機器に連れ出したかのように取り扱いをすることができ、動物のぺットを実際に飼育している場合のように電子ぺットを親しみ易いものとすることができる。

また情報処理装置、携帯機器又は電子ぺット装置に適用して、所定のネットヮークに接続して、少なくとも感情パラメ一タ又は感情パラメータの生成に必要なデータを取得する通信手段を有するようにし、応答生成手段が、この通信手段により取得した感情パラメータによる応答、又は通信手段により取得したデータより生成した感情パラメータによる応答を出力すれば、ネットワークに接続された同種の機器における応答とほぼ同一の応答を生成でき、これによりあたかもにこのネットワークに接続された同種の機器より電子ぺットを連れ出したかのように取り扱うことができ、動物のぺットを実際に飼育している場合のように電子ぺットを親しみ易いものとすることができる。また必要に応じて判別可能な単語を増大させる等により知識を増大させることもできる。

また情報処理手順を記録した記録媒体に適用して、所定のネットワークに接続して、認識ルール、感情パラメータ生成ルール又は応答生成ルールの更新処理を実行する通信処理、又は認識ルール、感情パラメ一タ生成ルール又は応答生成ルールに必要なデータの更新処理を実行する通信処理とが記録されてなるようにすれば、ネットワークに接続された同種の機器において、この記録媒体による処理手順を実行する装置の音声入力に対する応答とほぼ同一の応答を生成でき、これによりあたかも電子ぺットを外部の機器に連れ出したかのように取り扱うことができ、動物のぺットを実際に飼育している場合のように電子ぺットを親しみ易いものとすることができる。

また情報処理手順を記録した記録媒体に適用して、所定のネットワークに接続して、少なくとも感情パラメータ又は感情パラメータの生成に必要なデータを取得する通信処理が記録され、応答生成処理が、通信処理により取得した感情パラメータによる応答、又は通信処理により取得したデータより生成した感情パラメ —タによる応答を出力する処理であるようにすれば、この記録媒体による処理手順を実行する装置において、ネットワークに接続された同種の機器の応答とほぼ同一の応答を生成でき、これにより動物のぺットを実際に飼育している場合のように、あたかもにこのネットワークに接続された同種の機器より電子ぺットを連れ出したかのように取り扱うことができ、電子ぺットを親しみ易いものとすることができる。また必要に応じて判別可能な単語を増大させる等により知識を増大させることもできる。

また情報処理方法に適用して、所定のネットワークに接続して、認識ルール、感情パラメータ生成ルール又は応答生成ルールの更新処理を実行する通信処理、又は認識ルール、感情パラメータ生成ルール又は応答生成ルールに必要なデータの更新処理を実行する通信処理を有するようにすれば、ネットワークに接続された同種の機器において、この情報処理方法を実行する装置の音声入力に対する応答とほぼ同一の応答を生成でき、これにより動物のぺットを実際に飼育している場合のように、あたかも電子ぺットを外部の機器に連れ出したかのように取り扱うことができ、電子ぺットを親しみ易いものとすることができる。

また情報処理方法に適用して、所定のネットワークに接続して、少なくとも感情パラメータ又は感情パラメータの生成に必要なデータを取得する通信処理を有するようにし、応答生成処理が、通信処理により取得した感情パラメータによる応答、又は通信処理により取得したデータより生成した感情パラメータによる応答を出力する処理であるようにすれば、この情報処理方法を実行する装置において、ネットワークに接続された同種の機器の応答とほぼ同一の応答を生成でき、これにより動物のぺットを実際に飼育している場合のように、あたかもにこのネットワークに接続された同種の機器より電子ぺットを連れ出したかのように取り扱うことができる。また必要に応じて判別可能な単語の増大等により知識を増大させることもできる。

また情報処理装置、携帯機器又は電子ペット装置に適用して、登録の動作モードにおいて、音声認識結果に基づいて、少なくともデータベースに単語の音声認識結果を登録することにより、音声によりデータベースを変更可能な登録手段を備えるようにすれば、音声により電子ぺットが認識可能な語彙を簡易に増やすことができる。これにより実際に飼育している動物のぺットに鎂けを教えるように電子ぺットを取り扱うことができ、電子ぺットを親しみ易いものとすることがでさる。

また情報処理手順を記録した記録媒体に適用して、登録の動作モードにおいて、音声認識結果に基づいて、少なくともデータベースに単語の音声認識結果を登録することにより、音声によりデータベースを変更可能な登録処理を記録するようにすれば、この記録媒体による処理手順を実行する装置において、電子ペットが認識可能な語彙を音声により簡易に増やすことができる。これにより実際に飼育している動物のぺットに鎂けを教えるように電子ぺットを取り扱うことができ、電子ペットを親しみ易いものとすることができる。また情報処理方法に適用して、登録の動作モードにおいて、音声認識結果に基づいて、少なくともデータベースに単語の音声認識結果を登録することにより、少なくとも音声によりデータベースを変更可能な登録処理を有するようにすれば、この情報処理方法の実行により、電子ペットが認識可能な語彙を音声により簡易に増やすことができる。これにより実際に飼育している動物のぺットに賴けを教えるように電子ぺットを取り扱うことができ、電子ぺットを親しみ易いものとすることができる。

また情報処理装置、携帯機器又は電子ペット装置に適用して、音声に基づいて、ユーザーを認証するユーザー認証手段を備えるようにし、応答生成手段が、ュ一ザ一認証手段の認証結果に基づいて、音声入力者に応じて応答を異ならせるようにすれば、電子ぺットの応答を例えば飼い主とそれ以外の者とで異ならせるようにすることができる。これにより動物のペットのような挙動を実現でき、電子ぺットを一段と身近な親しみ易いものとすることができる。

また情報処理手順を記録した記録媒体に適用して、音声に基づいて、ユーザーを認証するユーザー認証処理が記録され、応答生成処理が、ュ一ザ一認証処理の認証結果に基づいて、音声入力者に応じて応答を異ならせるようにすれば、電子ぺットの応答を例えば飼い主とそれ以外の者とで異ならせるようにすることができ、これにより動物のペットのような挙動を実現して、電子ペットを一段と身近な親しみ易いものとすることができる。

また情報処理方法に適用して、音声に基づいて、ユーザーを認証するユーザー認証処理を有するようにし、応答生成処理が、ユーザー認証処理の認証結果に基づいて、音声入力者に応じて応答を異ならせるようにすれば、電子ペットの応答を例えば飼い主とそれ以外の者とで異ならせるようにすることができ、これにより動物のぺッ卜のような挙動を実現して、電子ぺットを一段と身近な親しみ易いものとすることができる。

また情報処理装置、携帯機器又は電子ペット装置に適用して、所定の応答生成ルールに従って、音声認識結果に対応する応答を生成するにつき、音声に基づいて、音声による入力の種類を識別する発話分類手段を備えるようにし、応答生成ルールが、入力の種類に応じて、入力の種類に対応する応答の分類に従って、所定の種類の応答を除く応答を生成するルールであるようにすれば、例えば問いに対して問いを返すような不自然な応答を防止することができる。これにより電子ぺットの応答を自然な生き生きとしたものとでき、これによつても電子ぺットを一段と身近な親しみ易いものとすることができる。

また情報処理手順を記録した記録媒体に適用して、所定の応答生成ルールに従つて、音声認識結果に対応する応答を生成する情報処理手順について、音声に基づいて、音声による入力の種類を識別する発話分類手段を記録するようにし、応答生成ルールが、入力の種類に応じて、入力の種類に対応する応答の分類に従つて、所定の種類の応答を除く応答を生成するルールであるようにすれば、例えば問いに対して問いを返すような不自然な応答を防止することができる。これにより電子ぺットの応答を自然な生き生きとしたものとでき、これによつても電子べットを一段と身近な親しみ易いものとすることができる。

また情報処理方法に適用して、所定の応答生成ルールに従って、音声認識結果に対応する応答を生成する情報処理するについて、音声に基づいて、音声による入力の種類を識別するようにし、応答生成ルールが、入力の種類に応じて、入力の種類に対応する応答の分類に従って、所定の種類の応答を除く応答を生成するルールであるようにすれば、例えば問いに対して問いを返すような不自然な応答を防止することができる。これにより電子ぺッ卜の応答を自然な生き生きとしたものとでき、これによつても電子ぺットを一段と身近な親しみ易いものとすることができる。

また情報処理装置、携帯機器又は電子ペット装置に適用して、少なくとも音声認識結果と対応する感情パラメータとによる履歴を記録する履歴記録手段を有するようにし、音声認識結果に対する感情パラメータの変化を履歴に応じて変化させるようにすれば、例えば頻繁に発生される音声に対して慣れ、親しみ等の感情のこもった応答を形成できる。これにより電子ぺッ卜の応答を自然な生き生きとしたものとでき、これによつても電子ぺットを一段と身近な親しみ易いものとすることができる。

また情報処理手順を記録した記録媒体に適用して、少なくとも音声認識結果と対応する感情パラメータとによる履歴を記録する履歴記録処理が記録されてなるようにし、音声認識結果に対する感情パラメータの変化を履歴に応じて変化させるようにすれば、例えば頻繁に発生される音声に対して慣れ、親しみ等の感情のこもった応答を形成できる。これにより電子ぺットの応答を自然な生き生きとしたものとでき、これによつても電子ぺットを一段と身近な親しみ易いものとすることができる。

また情報処理方法に適用して、少なくとも音声認識結果と対応する感情パラメータとによる履歴を記録する履歴記録処理を有するようにし、音声認識結果に対する感情パラメータの変化を履歴に応じて変化させるようにしても、例えば頻繁に発生される音声に対して慣れ、親しみ等の感情のこもつた応答を形成できる。これにより電子ぺットの応答を自然な生き生きとしたものとでき、これによつても電子ぺットを一段と身近な親しみ易いものとすることができる。図面の簡単な説明

図 1は、本発明の実施の形態に係る電子ぺット装置を示す機能ブロック図である。

図 2は、図 1の電子ペット装置を示す平面図である。

図 3は、図 1の電子ペット装置のブロック図である。

図 4は、体調データを示す図表である。

図 5は、現在の感情データを示す図表である。

図 6は、性格データを示す図表である。

図 7は、感情データの変化を示す図表である。

図 8は、パターンデータを示す図表である。

図 9は、音声データを示す図表である。図 1 0は、画像データを示す図表である。

図 1 1は、ネットワークとの接続処理手順を示すフローチャートである。図 1 2は、ネットワークに送出するデータの形式を示す図表である。

図 1 3は、認識データの登録に関して電子ぺット装置を詳細に示す機能プロック図である。

図 1 4は、音声認識処理の説明に供する略線図である。

図 1 5は、認識データの登録処理手順を示すフローチャートである。

図 1 6は、ユーザー認証に関して電子ぺット装置を詳細に示す機能ブロック図である。

図 1 7は、パターンデータを示す図表である。

図 1 8は、ユーザー認証の説明に供する図表である。

図 1 9は、図 1 8の質問により取得した単語を基準にしたユーザー認証の説明に供する図表である。

図 2 0は、対話の分類処理に関して電子ぺット装置を詳細に示す機能ブロック図である。

図 2 1は、図 2 0の分類処理に対応するパターンデータを示す図表である。図 2 2は、対話履歴を示す図表である。

図 2 3は、対話履歴の他の例を示す図表である。

図 2 4は、感情の制御に関して電子ぺット装置を詳細に示す機能プロック図である。

図 2 5は、感情変化履歴を示す図表である。

図 2 6は、図 2 5の感情変化履歴により変更された性格データを示す図表である。

図 2 7は、性格データの他の変更例を示す図表である。

図 2 8は、他の実施の形態に係る電子ぺット装置を示すブロック図である。図 2 9は、携帯電話を示す平面図である。発明を実施するための最良の形態

以下図面について、本発明の一実施の形態を詳述する。

( 1 ) 第 1の実施の形態

( 1 - 1 ) 第 1の実施の形態の全体構成

図 2は、本発明の第 1の実施の形態に係る電子ぺット装置を示す平面図である。この電子ペット装置 1は、上端面に引き出し可能にアンテナ 2が配置され、正面上部に液晶表示パネル 3が配置される。電子ペット装置 1は、この液晶表示パネル 3に、電子ペットの姿、電子ペットからのメッセージが表示されるようになされている。また電子ペット装置 1は、この液晶表示パネル 3の下側に、決定、キャンセルの操作子 4 A及び 4 B、カーソルの操作子 5が配匱され、これらの操作により動作モード等を切り換え得るようになされている。

さらに電子ペット装置 1は、決定、キャンセルの操作子 4 A及び 4 Bの下側に、スピーカ 6及びマイク 7が配置され、スピーカ 6及びマイク 7を用いて電子べットと会話できるようになされている。さらに電子ペット装置 1は、 I Cカード 8を装着できるように、背面側にソケットが配置される。

図 3は、この電子ペット装置 1を示すブロック図である。電子ペット装置 1において、アナログディジタル変換回路（AZ D ) 1 0は、図示しない増幅回路を介してマイク 7より得られる音声信号を入力し、この音声信号をアナログデイジタル変換処理して音声データ D Aを生成する。アナログディジタル変換回路 1 0 は、この音声データ D Aを中央処理ユニット（C P U ) 1 1に出力する。これにより電子ぺット装置 1においては、ユーザーの音声を中央処理ュニット 1 1により解析できるようになされている。

ディジタルアナログ変換回路（D _ A ) 1 2は、中央処理ユニット 1 1より出力される音声データ D Bをディジタルアナログ変換回路処理して音声信号を生成し、この音声信号をスピーカ 6より出力する。これにより電子ペット装置 1においては、電子ぺットの応答等を音声により確認することができるようになされている。モニタインターフェース（モニタ I Z F ) 1 3は、中央処理ュニット 1 1の制御によりバスを介して入力される画像データ D Vにより液晶表示パネル 3を駆動し、これにより液晶表示パネル 3に電子ぺッ卜の画像を表示する。

キーインターフェース（キー I / F ) 1 4は、操作子 4 A、 4 B、 5の操作を検出して中央処理ユニット 1 1に通知する。リードオンリメモリ（R OM) 1 5 は、中央処理ユニット 1 1の処理プログラム、マイク 7より取得される音声の解析に必要な各種データ等を格納し、中央処理ユニット 1 1の制御によりこれら保持したデータを出力する。ランダムアクセスメモリ（R AM) 1 6は、中央処理ユニット 1 1のワークエリァを構成し、中央処理ュニット 1 1の処理に必要な各種データを一時保持する。

ネットワーク接続部 1 7は、中央処理ュニット 1 1の制御により電話回線を介して所定のネットワーク 1 8に接続し、このネットワーク 1 8との間で種々のデータ D Tを交換することにより必要に応じてランダムアクセスメモリ 1 6の内容等を更新し、さらにはこのランダムアクセスメモリ 1 6に格納したデータをネットワークを介して所望の端末に送出する。これにより電子ペット装置 1では、電子ぺットの飼育、教育に必要な各種データを必要に応じて取得できるようになされ、さらには電子ペットを種々の環境に連れ出し、またこれとは逆に外部の機器の電子ぺットを飼育することができるようになされている。

I Cカード 8は、着脱可能な外部記憶装置であり、必要に応じてランダムァクセスメモリ 1 6の内容等を更新し、さらにはこのランダムアクセスメモリ 1 6に格納したデータを記録する。これにより電子ペット装置 1では、 I C力一ド 8を他の機器との間で交換して各種データをやり取りすることにより、電子ぺットの飼育、教育に必要な各種データを必要に応じて取得できるようになされ、さらには電子ぺットを種々の環境に連れ出し、またこれとは逆に外部機器の電子ぺットを飼育することができるようになされている。

図 1は、これら電子ぺット装置 1に係る基本的な構成を機能プロックにより示すブロック図である。なおこの図 1に示す機能ブロックにおいて、矩形形状により囲って示す機能プロックは、中央処理ュニット 1 1がリードオンリメモリ 1 5 に記録された処理プログラムを実行して形成される機能プロックであり、磁気デイスクのシンボルにより示す機能ブロックは、リ一ドオンリメモリ 1 5、ランダムアクセスメモリ 1 6、 I Cカード 8により形成される機能プロックである。この電子ペット装置 1において、音声認識部 1 1 Aは、所定の認識ルールに従つて音声データ D Aを音声認識処理し、その音声認識結果を出力する。すなわち音声認識部 1 1 Aは、 HMM (H i d d e n Ma r c o v Mo d e l ) 法により、順次入力される音声データ DAによる音声を音韻により区切り、この音韻の列により認識データ 1 6 Aを参照する。音声認識部 1 1 Aは、この参照結果に基づいて音声データ D Aによる単語、文言が事前に登録された単語、文言の場合、これら単語、文言によるテキストデータを認識結果として出力する。かくするにっき認識データ 1 6 Aは、単語、文言のテキストデータと対応する音韻の列とが対を形成するようにして記録されたデータベースである。これにより電子ぺット装置 1は、例えば、ユーザ一が「いい子だね」とマイク 7に向かって言ったとき、この音声を認識して「いい子だね」という内容のテキスト文字列に変換し、これらにより音声による入力を文字列による入力に変換して処理するようになされている。

タイマー 1 1 Bは、一定の時間間隔により体調変更部 1 1 C及び感情変更部 1 1 D等を起動する。

体調変更部 1 1 Cは、音声認識結果により、またこのタイマ一 1 1 Bの起動により、体調データ 1 6 Bを更新する。ここで体調データ 1 6 Bには、現在の電子ぺットの体調を示す変数が記録されるようになされている。なおこの実施の形態において、体調データ丄 6 Bには、図 4に示すように、現在の体調を「疲れ」、

「飢え」、「渴き」、「病気」、「眠気」の 5つの要素により分類し、各要素に割り当てた値が大きい程、体調に占める各要素が大きくなるようになされている。従って図 4に示す例においては、現在、疲れており、飢えも激しいことになる体調変更部 1 1 Cは、タイマー 1 1 Bの起動により体調データ 1 6 Bを更新する場合、実際のぺットを飼育する場合の一般的な例に従った所定のルールにより、例えば「飢え」、「渴き」、「眠気」の変数を順次増大させ、これにより時間が経過すると電子ぺットが空腹になるようにする。また音声認識結果により体調データ 1 6 Bを更新する場合、例えば音声認識結果により食べ物が与えられた場合、「飢え」の変数を低減させ、また音声認識結果により飲み物が与えられた場合、「渴き」の変数を低減させる。さらに音声認識結果によりユーザーと遊ぶ場合には、徐々に「疲れ」の変数を増大させ、ユーザーにより睡眠が指示されるとタイマーとの連動により「眠気」の変数を徐々に低減する。

感情変更部 1 1 Dは、音声認識結果により、またタイマー 1 1 Bの起動により、現在の感情データ 1 6 Cを更新する。ここで現在の感情データ 1 6 Cには、現在の電子ペットについて、擬似的に感情を示す変数（擬似感情パラメータ）が記録されるようになされている。なおこの実施の形態においては、図 5に示すように、現在の感情を「怒り」、「悲しみ」、「喜び」、「恐れ」、「驚き」、「嫌悪」の 6つの要素により表し、各要素に割り当てた値が大きい程、現在の感情を示すようになされている。従って図 5に示す例においては、現在、電子ペットは、喜びと怒りにあふれていることになる。

感情変更部 1 1 Dは、実際のペットを飼育する場合の一般的な例に従った感情パラメータ生成ルールに従ってこの感情データ 1 6 Cを更新する。すなわち感情変更部 1 1 Dは、タイマー 1 1 Bの起動により感情データ 1 6 Cを更新する場合、これら「怒り」、「悲しみ」、「喜び」、「恐れ」、「驚き」、「嫌悪」の 6 つの要素が徐々に所定の基準値に近づくように各要素の変数を更新し、これにより図 5に示す場合では、「怒り」、「悲しみ」等の感情が徐々に納まるようにする。

これに対して感情変更部 1 1 Dは、音声認識結果により感情データ 1 6 Cを更新する場合、音声認識結果により性格データ 1 6 Dを検索し、この検索結果に従つて感情データ 1 6 Cを更新する。ここで性格データ 1 6 Dは、図 6に示すように、音声認識結果に含まれる文言をキーヮードにして感情データ 1 6 Cの値を変更するデータが割り当てられて形成されるようになされている。なお図 6においては、例えばユーザーの発生した音声に「いい」と言う文言が含まれていた場合、「怒り」、「悲しみ」、「喜び」、「恐れ」、「驚き」、「嫌悪」の各変数を値— 1、 + 2、 + 2 0、一 5、 + 5、一 1だけ変更する旨、「いい」のキーワードに対して感情データ 1 6 Cの値を変更するデータが割り当てられていることになる。

これにより感情変更部 1 1 Dは、例えばユーザーが「いい子だね」と発声した場合、図 5について上述した感情データを図 7に示すように更新することになる。これにより感情変更部 1 1 Dは、所定の感情パラメータ生成ルールに従って、少なくとも音声認識結果と時間経過とにより変化する、擬似的に感情を示す擬似感情パラメータを生成する感情生成手段を構成する。

応答文作成部 1 1 Eは、感情データを基準にした所定の応答生成ルールに従つて、音声認識結果に対応する応答を生成する。パターンデータ 1 6 Eは、この応答を生成するルールの集合である。ここでこれらのルールは、図 8に示すように、それぞれ音声認識結果に含まれる単語をキ一フレーズに対して、各キーフレーズが音声入力された場合にはどのような応答を示すかがそれぞれ記述されて形成される。またこのときキーフレーズによっては、感情データ 1 6 C、体調データ 1 6 Bに応じて異なる応答を示すように記述される。なおこの図 8においては、説明を簡略化するために、必要最低限度のルールを示し、実際のルールにおいては、この図 8に示す条件以外（後述する属性等）の条件が記述される。なお体調データ 1 6 Bについても、この図 8のル一ル 2のように体調データ 1 6 Bだけの条件により、また感情データ 1 6 Cとの組み合わせによりルールが記述される。すなわち図 8におけるルール 1においては、「愛してる」又は「お前が好き」との文言が入力された場合には、ユーザ一認証された音声入力に対しては「ぼくも愛してるよ」又は「おわつ、ボ、ポクはォスなんですけど」の文言を無作為に出力することを、またユーザー認証されていない音声入力に対しては「変な人」又は「あなた誰？」の文言を無作為に出力することを示している。またルール 2においては、「こんにちわ」又は「ハ口一」との文言が入力された場合には、感情データの各要素「怒り」、「悲しみ」、「喜び」、「恐れ」、「驚き」、「嫌悪」に応じてそれぞれ割り当てられた「うるさいなあ」、「なあに？」、「こにやにやちわ」、「わお驚いた」、「あらどうも」、「呼んだ？」の文言のうちから、最も値の大きな変数が一定値を越えている場合に、この変数に対応する文言を選択的に出力することを示している。

なおここで図 8に示す「 a u t h e n t i c a t e d (A) ； (B) 」は、後述するユーザー認証等により「TRUE」がセットされている場合には（A) を、「TRUE」がセットされていない場合には（B) を実行する意であり、「 r a n d om ( "A"， "B" 」は、無作為に A又は Bを実行する意である。ちなみに図 7について上述した感情データにおいては、「喜び」の変数が最も値が大きいことにより、ルール 2においては、喜びに対応する応答「こにやにやちわ」が選択されることになる。

さらに応答文作成部 1 1 Eは、このような感情データ 1 6 Cによる応答と同様にして、キーフレーズによっては体調データ 1 6 Bに応じて、さらには感情データ 1 6 C及び体調データ 1 6 Bに応じて応答を生成し、これにより例えば電子ぺットの体調が思わしくない場合には、相当の応答を生成するようになされているまた応答文作成部 1 1 Eは、このような音声認識結果に対する応答を対話履歴 1 6 Fに記録し、必要に応じてこの対話履歴 1 6 Fを参考して応答を生成し、これによりュ一ザ一との間の不自然な会話を防止するようになされている。また同様にして知識 1 6 Gを参考にして応答を生成し、これにより例えばユーザーによつて応答を切り換え、ユーザ一認証等の処理を実行できるようになされている。音声合成部 1 1 Fは、応答文作成部 1 1 Eより出力される応答に従って、音声データ 1 6 Hを検索し、検索結果より応答に対応する音声データ DBを出力する。ここで図 9に示すように、音声データ 1 6 Hは、各応答に対応する音声フアイルであり、例えば「こにやにやちわ」という応答文が作成されたとすると「 v o i c e 0005. wa v」という音声ファイルを選択し、この音声ファイルによる音声データ DBを出力する。

画像合成部 1 1 Gは、応答文作成部 1 1 Eより出力される応答に従って、画像データ 1 6 Iを検索し、検索結果より応答に対応する画像データ DVを出力する。ここで図 1 0に示すように、画像データ 1 6 Iは、各応答に対応する画像データファイルであり、例えば「こにやにやちわ」という応答文が作成されたとすると「f i g 0005. bmp」というビットマップ形成の画像ファイルを選択し、この画像ファイルによる画像データ DVを出力する。

(1 - 2) ネットワークとの接続

中央処理ュニット 1 1は、図 1 1に示す処理手順を実行することによりネットワーク接続部 1 7を介してネットワーク 1 8に接続し、体調データ 1 6 B、感情データ 1 6 C、対話履歴 1 6 Fを所望の機器に送出する。これによりこの電子ぺット装置 1においては、これらのデータを送出した機器において、この電子ぺット装置 1における電子ぺットを再現できるようになされ、電子ぺットを種々の環境に連れ出すことができるようになされている。

またこれとは逆に、中央ュニット 1 1は、ネットワーク 1 8より体調データ 1 6 B、感情データ 1 6 C、対話履歴 1 6 Fを取得し、これにより他の電子ペット装置で飼育されている電子ぺットをこの電子ぺット装置 1に連れ出すことができるようになされている。この場合、電子ペット装置 1において、このようにして取得した体調データ 1 6 B、感情データ 1 6 C、対話履歴 1 6 Fによる処理においては、上述した各機能ブロックがそれぞれこの電子ぺット装置 1で飼育されている電子ペットと、外部の機器で飼育されている電子ペットとについて、同時並列的に上述した処理を実行することにより、あたかもこの電子ぺット装置 1に外部より他の電子ぺットが訪問したように応答を作成する。なお図 1に示す機能ブロックにおいては、このようにして取得した体調データ 1 6 B、感情データ 1 6 C、対話履歴 1 6 Fによる処理については、データの流れを省略して示す。さらに電子ペット装置 1は、認識データ 1 6 A、パターンデータ 1 6 E、知識 1 6 G、音声データ 1 6 H、画像データ 1 6 Iをネットワーク 1 8より取得し、これにより音声認識可能な語彙を増強し、さらには応答の種類を増大できるようになされている。これにより電子ペット装置 1は、いわゆる電子ペットを育てて学習させることができるようになされている。

すなわち中央処理ュニット 1 1は、接続要求に応動してステップ S P 1からステツプ S P 2に移り、この接続要求を受け付ける。なおここで接続要求は、タイマー 1 1 Bにより一定時間毎に定期的に発生され、またユーザーによる操作子の操作により、さらにはネットワーク 1 8からの呼により発生する。

中央処理ュニット 1 1は、続いてステップ S P 3に移り、ここで所定の回線接続処理を実行して通信を確立する。続いて中央処理ユニット 1 1は、ステップ S P 4に移り、接続要求の内容に応じて対応する各種データを送受する。続いて中央処理ユニット l iは、ステップ S P 5に移り、通信を切断した後、ステップ S P 6に移ってこの処理手順を終了する。

図 1 2は、このデータ転送のフォーマットを示す図表である。電子ペット装置 1においては、ネットワーク接続部 1 7に配置されたインタ一フェースにより、また通話対象のィンターフェースにより、このフォーマツトにより伝送に供するデータが送受される。ここで各データ D Tには、ヘッダが配置され、このヘッダ内に各データのアドレス、種類等が記述され、ヘッダ続いて伝送に供するパターンデータ 1 6 E、認識データ 1 6 A、音声データ 1 6 H、画像データ 1 6 I等が順次必要に応じて割り当てられる。

( 1 - 3 ) 認識データの登録

図 1 3は、認識データの登録に関して電子ぺット装置 1を更に詳細に示す機能ブロック図である。この機能ブロック図において、登録部 1 1 Iは、音声認識結果より認識データ 1 6 Aを登録し、これによりキ一ボード等により単語を入力しなくても音声により種々の単語を電子ぺットに覚え込ませることができるようになされている。このため音声認識部 1 1 Aにおいては、上述したように、 HMM法により音声データ DAを処理し、これにより音韻列による認識結果を出力する。すなわち音声認識部 1 1 Aは、日本語による音声を音韻により識別し、各音韻を示す識別子の列により日本語の発音を記述する。ここでこれら識別子は、「b」、「d」、

「g」、「P」、「 t」、 [k」、「mj 、「n」、「r」、「z」、「c h」、「t s」、「y」、「wj 、「h」、「 i j 、「e」、「aj 、「oJ 、「u J 、「N」、「e i」、「o u」、「 s」、「 s h」、「x y」、「j」、「 f 」、「s i 1」とにより構成され、「s i 1」は無音である。

これにより音声認識部 1 1 Aは、例えばユーザーが「みかん」と入力すると、

「 s i 1 m i k a N s i 1」の識別子で記述される音韻列により音声入力を認識する。このため音声認識部 1 1 Aは、順次入力される音声データ D Aを順次処理して音韻を識別すると共に、この識別結果を図 1 4に示す文法により処理し、これにより識別子の連続してなる音韻列を検出する。なおこの図 1 4 は、上述した全ての音韻の接続を許す文法である。

音声認識部 1 1 Aは、通常の動作モードにおいては、このようにして検出した識別子の列により認識データ 1 6 Aを検索し、この検索結果より単語、文言のテキストデータにより認識結果を出力する。これによりこの実施の形態において、認識データ 1 6 Aに未登録の単語が音声入力された場合、対応するテキストデータを生成することが困難になり、ユーザ一の問い掛けに正しく応答することが困難になる。

このためこの実施の形態において、電子ペット装置 1は、ネットワーク接続部 1 7を介してネットワークに接続し、ネットワークより認識データ 1 6 Aをダウンロードし、これにより電子ぺットを学習させてユーザーからの種々の問い掛けに応答できるようになされている。

さらにこの実施の形態において、中央処理ユニット 1 1は、操作子 4A、 4 B の操作により登録モードが選択されると、図 1 5に示す処理手順を実行し、これによりュ一ザ一が音声により入力した単語を認識データ 1 ₆ Aに登録する。すなわち中央処理ユニット 1 1は、操作子の操作に応動してステップ S P 1 1 からステップ S P 1 2に移り、登録モードに入る。続いて中央処理ュニット 1 1 は、ステップ S P 1 2に移り、画像合成部 1 1 Gを駆動して液晶表示パネル 3に所定のメッセージを表示し、これによりユーザーに単語の発声を促す。

続いて中央処理ュニット 1 1は、ステップ S P 1 4に移り、順次入力される音声データ D Aを順次音韻列により識別して音声認識し、ユーザーが所定の操作子を操作して音声入力の終了を指示するとステップ S P 1 5に移る。

ここで中央処理ユニット 1 1は、音声認識結果である音韻列により音声合成部 1 1 Fを駆動してユーザーの入力した音声を発声し、これによりユーザーに認識結果を提示する。すなわち中央処理ユニット 1 1は、例えばユーザ一が「ミカン」の単語を発生し、認識結果として「s i l m i k a N s i l」が得られると、この場合「みかんですか？」との音声を発生する。続いて中央処理ュニット 1 1は、ステップ S P 1 6に移り、確認の操作子 4 A又はキャンセルの操作子 4 Bの操作を検出することにより、確認の入力を受け付ける。

続いて中央処理ユニット 1 1は、ステップ S P 1 7に移り、キャンセルの操作子 4 Bが操作された場合、提示した認識結果がユーザーにより否定されたと判断してステップ S P 1 3に戻り、再び音声入力を受け付ける。これに対して確認の操作子 4 Aがユーザーにより操作された場合、ユーザ一により認識結果が肯定されたと判断し、ステップ S P 1 8に移る。

ここで中央処理ュニット 1 1は、続いて画像合成部 1 1 Gを駆動して液晶表示パネル 3に所定のメッセージを表示し、これによりユーザーに音声入力した単語について、属性の発声を促す。ここで属性は、単語により特定される対象を分類するための、この対象の性質を示すキーワードであり、この実施の形態において例えば「ミカン」は、属性が「果物」に分類される。

続いて中央処理ュニット 1 1は、ステップ S P 1 9に移り、順次入力される音声データ D Aを順次音韻列により識別して音声認識し、ユーザーが所定の操作子を操作して音声入力の終了を指示するとステップ S P 2 0に移る。ここで中央処理ユニット 1 1は、音声認識結果である音韻列により音声合成部 1 1 Fを駆動してユーザーの入力した音声を発声し、これによりユーザーに属性の認識結果を提示する。すなわち中央処理ュニット 1 1は、例えばユーザ一が「ミカン」の単語を発生した後、属性として「果物」を入力すると、この場合「くだものですか？」との音声を発生する。続いて中央処理ユニット 1 1は、ステツプ S P 2 1に移り、確認の操作子 4 A又はキャンセルの操作子 4 Bの操作を検出することにより、確認の入力を受け付ける。

続いて中央処理ユニット 1 1は、ステップ S P 2 2に移り、キャンセルの操作子 4 Bが操作された場合、提示した認識結果がユーザ一により否定されたと判断してステップ S P 1 8に戻り、属性について再び音声入力を受け付ける。これに対して確認の操作子 4 Aがユーザーにより操作された場合、ユーザーにより認識結果が肯定されたと判断し、ステップ S P 2 3に移る。

ここで中央処理ュニット 1 1は、単語については認識データ 1 6 Aに登録し、属性については知識 1 6 Gに登録した後、ステップ S P 2 4に移ってこの処理手順を終了する。

ここで知識 1 6 Gは、認識データ 1 6 Aに登録された各単語、文言について、果物、飲み物等の分類を示す属性のデータが記録されるようになされている。これにより中央処理ュ-ット 1 1においては、パターンデータ 1 6 Eに属性の記述を含めることにより、例えばユーザーに対して「好きな食べ物は何ですか」と問い掛け、この問い掛けに対するユーザーからの「みかんが好きだよ」の返答に対し、「私はみかんは嫌いです」との応答を発生できるようになされている。

なお知識 1 6 Gは、これら属性の他に、電子ぺット装置 1の持ち主である飼い主の名前、好み、ネットワーク 1 8よりもたらされる天気予報等の各種データが記録され、必要に応じてこれらの情報をユーザーとの対話に利用できるようになされている。すなわち例えなユーザが「今日の天気は？」と問いかけた場合、「今日」、「天気」をキーフレーズにしたルールにより「晴れです」等の応答を発生できるようになされている。また電子ぺット装置 1においては、このようにして音声入力により認識データ 1 6 Aを登録した場合、この音声入力に対応する正しいテキスト（上述の例では

「みかん」を記述したテキスト）が存在しないことにより、認証結果であるテキストデータにおいて、対応する単語、文言については音韻列の識別子であるアルファベットの標記（上述の例では「s i l m i k a N s i l」の標記）によりこれら認識データ 1 6 Aの単語、文言を記述して処理するようになされている。またネットワーク 1 8からのダウンロードにより必要に応じてこのテキストを補い、補った後においては、音韻列の識別子に代えて本来のテキストにより認証結果を処理するようになされている。

これにより電子ペット装置 1においては、音声入力により登録した単語、文言による認識データ 1 6 Aについても、ネットヮ一ク 1 8よりダウン口一ドした単語、文言による認識データ 1 6 A、事前に登録されている単語、文言による認識データ 1 6Aと同様に処理してユーザーと対話できるようになされている。

(1 -4) ユーザー認証

図 1 6は、ユーザ一認証に関して電子ぺット装置 1を更に詳細に示す機能プロック図である。この機能ブロック図において、認証データ 1 6 Kは、事前の設定によりユーザー名が記録される。なおこの記録は、音声認識結果により、又は購入時に実行される初期設定処理における外部機器からのキーボード入力等により実行される。

応答文作成部 1 1 Eは、例えば図 1 7に示すパターンデータ 1 6 Eのルール 1 に従って、「がお一」の音声が入力された場合、「あなたは本当にご主人様？」との応答を返す。

音声認証部 1 1 Jは、ルール 2に従って「$ US ER」により定義される事前に登録されたユーザー名が音声入力された場合であって（my L a s t— U t t e r) 、直前の応答文作成部 1 1 Eにより「あなたは本当にご主人様？」の文言を含む応答がなされている場合、関数「 a u t h e n t i c a t e dによる変数を「TRUE」にセットする（s e t a u t h e n t i c a t e d ( T R U E ) ) 。

かくするにっき音声認証部 1 1 Jは、音声認識結果より認証データ 1 6 Kを検索し、このような条件が満足される場合に、音声入力した者がユーザーと認証し、認証状態 1 6 Jをユーザー認証した状態にセットする。また上述の条件が満足されない場合には認証状態 1 6 Jをユーザー認証していない状態にセッ卜する。なおこの場合において、ユーザー認証された場合には、ルール 2に従って応答文作成部 1 1 Eにより「ははあ、ご主人様。」との応答が発生されることになる。これにより電子ペット装置 1においては、音声に基づいて、ユーザーを認証すると共に、図 8について上述したルール 1のようにして、飼い主とそれ以外の人間とで応答を異ならせることができるようになされ、例えば飼い主に特有の挙動を示して実際のぺットに近い挙動を示すようになされている。

またこの音声によるユーザー認証において、事前に登録した単語の有無により、音声に基づいてユーザーを認証するようになされている。

さらに音声認証部 1 1 Jは、図 1 8に示すように、ユーザー認証した音声入力者との対話の中で、知識 1 6 Gに記録したユーザーの嗜好、趣味等を問い掛ける応答の出力を応答文作成部 1 1 Eに指示する。なお図 1 8においては、「ご主人さまの好きな食べ物は？」との問い掛けによりユーザー認証した音声入力者の嗜好を問い掛けていることになる。

音声認証部 1 1 Jは、図 1 7について説明したルール 2と同様の処理により、続いてユーザーの音声入力より嗜好の問い掛けに対する応答を判断し、この応答の音声認識結果よりこの場合「ピ一ナッツ」の単語を認証データ 1 6 Kに登録する。

応答文作成部 1 1 Eは、音声入力者との対話の中で、タイマー 1 1 Bの起動により、例えば図 1 9に示すように、認証データ 1 6 Kに登録した嗜好、趣味等に関する問い掛けを発生する。なおこの図 1 9に示す例にあっては、図 1 8について上述した嗜好の問い掛けに対応して、「あなた本当にご主人様？好きな食べ物は？」と問い掛けた場合である。音声認証部 1 1 Jにおいては、図 1 7について説明したルール 2と同様の処理により、続いてユーザーの音声入力より嗜好の問い掛けに対する応答を判断し、この場合飼い主にあっては「ピーナッツ」の応答が得られることにより、この応答の音声認識結果より認証状態を「T R U E」にセットする。また応答文作成部 1 1 Eにあっては、「本当にご主人様だ！」との応答を発生する。

これにより電子ぺット装置 1は、過去の音声認識結果を基準にして音声認識結果を判定することにより、音声に基づいてユーザ一を認証するようになされ、さらに詳しくは過去の音声認識結果に対応する質問を応答として出力し、この応答に対する音声認識結果を判定してユーザー認証するようになされている。

さらに音声認証部 1 1 Jは、タイマー 1 1 Bにより一定時間以上音声が入力されない場合、この場合ユーザーが立ち去った場合等であることにより、認証状態をリセットする。

( 1 - 5 ) 対話の分類処理

図 2 0は、対話の分類処理に関して電子ぺット装置 1を更に詳細に示す機能ブロック図である。この機能ブロック図において、発話分類部 1 1 Mは、所定の分類ルール 1 6 Mに従って、音声認識結果を識別することにより、音声入力による会話を分類し、その分類結果である分類コードを応答文作成部 1 1 Eに出力するここで発話分類部 1 1 Mは、例えば「おはよう」、「こんにちは」等の挨拶一般の音声入力については、「挨拶」に分類する。また「調子はどう」、「……は好き」等の問い掛けの音声入力については、「質問」に分類し、「元気だよ」、「つまらない」等の感想を述べた音声入力については、「感想」に分類する。応答文作成部 1 1 Eは、パターンデータ i 6 Eに従って応答文を作成する際に、パターンデータ 1 6 Eに記録された応答文の分類と、この発話分類部 1 1 Mで分類された分類パターンに従って応答を作成する。さらにこのとき必要に応じて対話履歴 1 6 Fに記録された過去の対話記録に従って、応答を作成する。

すなわちパターンデータ 1 6 Eにおいて、ルールによっては図 8との対比により図 2 1に示すように、各応答文の分類が設定されるようになされている。なおこの分類は、発話分類部 1 1 Mにおける分類に対応するように設定される。因みに、図 2 1のルール 1においては、「ボクも愛しているよ」、「おわつ、ボ、ポクはォスなんですけど」の応答文には「状態」の分類が設定され、「変な人」には「感想」、「あなた誰？」には「質問」の分類が設定されるようになされている。またルール 2においては、「うるさいなあ」には「感想」、「なあに？ J には「質問」、「こにやにやちわ」には「挨拶」、「わお驚いた」には「感想」、「あらどうも」には「挨拶」、「呼んだ？」には「質問」の分類が設定されるようになされている。

さらにパターンデータ 1 6 Eには、特定の分類による会話の連続を禁止する種別制約が規定されるようになされている。具体的には、ユーザーからの質問に対しては質問を返さないように、種別制約が設定される。また「挨拶」、「挨拶」のやり取が続いた場合には、続いて「挨拶」の応答をしないよう種別制約が設定されるようになされている（図 2 1の場合）。

これに対して対話履歴 1 6 Fは、図 2 2及び図 2 3に示すように、応答文作成部 1 1 Eによりユーザーと電子ぺットとの対話が記録されるようになされている。ここでこの記録は、音声を発生した行為者、その音声の分類、音声の内容が記録されるようになされている。図 2 2の例においては、ユーザーによる分類「挨拶」の「こんにちわ」の音声入力に続いて、電子ペットが分類「挨拶」の「どうも」の応答をし、続いてユーザ一による分類「質問」の「調子はどう」、電子べットによる分類「状態」の「元気だよ」が続いたことが記録されていることになる。

応答文作成部 1 1 Eは、パターンデータ 1 6 Eに従って感情データ 1 6 Cにより応答を作成する際に、この制約条件に従って対話履歴 1 6 Fを参照して、対話履歴 1 6 Fに従って応答を作成する。すなわち応答文作成部 1 1 Eは、種別制約に該当する場合、すなわち図 2 1においては、直前に「挨拶」のやり取りが続いた場合、例えば喜びの変数が最も大きい場合でもこのルール 2を適用しないようにする。また同様にして「質問」には「質問」を返さないようにする。これにより電子ペット装置 1においては、「挨拶」に対して「挨拶」を返すような第 1のルールと、種々の問い掛けに対して「挨拶」を返すような第 2のル一ルが規定されているような場合でも、第 2及び第 1のルールの繰り返しの適用により、ユーザ—との間で「挨拶」を何度も繰り返すような不自然な会話を防止するようになされている。

( 1 - 6 ) 感情の制御

図 2 4は、感情の制御に関して電子ぺット装置 1を更に詳細に示す機能プロック図である。この機能ブロック図において、感情変更部 1 1 Dは、上述したようにタイマ一 1 1 Bの起動により、また音声認識結果に含まれる文言をキーワードにした性格データ 1 6 Dの検索により、感情データ 1 6 Cを更新する。

この処理において感情変更部 1 1 Dは、図 2 5に示すように、感情変化履歴 1 6 Nとして、感情データ 1 6 Cを構成する各変数の変化量、音声認識結果より検出して各変数の変化に使用したキーヮード、音声認識結果によるテキストデータを記録する。さらに例えば応答を出力した後等の所定のタイミングで、この感情変化履歴 1 6 Nを検索し、特定のキーワードと対により所定の単語が頻繁に使用されている場合、図 6との対比により図 2 6に示すように、この単語をキーヮ一ドとして性格データ 1 6 Dに登録し、この単語が単独で入力された場合等にあつても、同様に各変数を変化させることができるようにする。

すなわち感情変更部 1 1 Dは、例えば変数を変化させるキ一ワードである「汚い」の単語と、「カレーパン」の単語とが対になって頻繁に使用され、その使用頻度が所定値以上になると、「カレ一パン」の単語をキーワードとして性格デ一タ 1 6 Dに登録する。またこのときこの「カレーパン」によって、「汚い」の単語が入力された場合と同じように各変数を変化させるように、各変数の変化量を設定する。

これにより電子ぺット装置 1は、いわゆる連想により特定の感情が生まれるように設定され、この感情による応答を発生できるようになされている。さらに感情変更部 1 1 Dは、このようにして所定のタイミングで感情変化履歴を検索する際に、併せて変数の変化に使用する各キーヮ一ドの使用頻度を検出する。ここで一定の頻度以上で特定のキーワードが使用されている場合、感情変更部 1 1 Dは、図 6との対比により図 2 7に示すように、このキ一ヮ一ドによる変数の変化量を低减する。なお図 2 7においては、「汚い」のキーワードが頻繁に使用された結果、この「汚い」のキ一ワードによる変数の変化量を低減した場合であり、「怒り」、「悲しみ」、「喜び」、「恐れ」、「驚き」、「嫌悪」の 6 つの要素について、それぞれ変化量を一 1、ー 1、 + 2、 + 1、 — 1、 —4だけ変化させた場合である。

これにより電子ぺット装置 1においては、いわゆる慣れの感覚を形成できるようになされている。

さらに感情変更部 1 1 Dは、このようにして性格データ 1 6 Dに加えた単語の音声入力頻度が低下した場合、この単語を性格データ 1 6 Dより消去する。また同様に、変数の変化量を変更した単語について、音声入力頻度が低下した場合、徐々に元の変化量に戻す。

これにより電子ぺット装置 1においては、いわゆる忘れ去る状況をも作り出すことができるようになされている。

( 1 - 7 ) 第 1の実施の形態の動作

以上の構成において、電子ペット装置 1は（図 1〜図 3 ) 、ユーザ一がマイク 7より音声を入力すると、中央処理ュニット 1 1の処理により構成される機能ブロックである音声認識部 1 1 Aにおいて、 HMM法によりこの音声が音声認識処理される。この音声認識処理において、音声は、音韻列に変換された後、認識データ 1 6 Aとの照合によりテキストデータに変換される。

電子ぺット装置 1においては、このようにして生成された音声認識結果であるテキストデータが、体調変更部 1 1 Cに入力され、ここでこの体調変更部 1 1 C により、現在の体調を示す 5つの要素「疲れ」、「飢え」、「渴き」、「病気」、「眠気」（図 4 ) により構成される体調データ 1 6 Bが音声に含まれる単語に応じて変更される。すなわち例えば音声認識結果により食べ物が与えられた場合、「飢え」の変数が低減され、また音声認識結果により飲み物が与えられた場合、「渴き」の変数が低減される。

これにより電子ぺット装置 1においては、ユーザ一の音声入力により体調が変化するようになされている。さらにタイマ一 1 1 Bを基準にした体調変更部 1 1 Cの処理によっても、これら 5つの要素に徐々に変更が加えられる。これにより電子ぺット装置 1においては、これら 5つの要素による体調がユーザーからの音声入力により、また時間経過により変化し、この 5つの要素を基準にして音声入力に対して応答を生成することにより、ユーザーの音声に対する応答に電子ぺッ卜の体調が反映されるようになされている。

これとは別に、音声認識結果は、感情変更部 1 1 Dに与えられ、ここでこの音声認識結果に含まれる単語に応じて現在の感情データ 1 6 Cが変更される（図 5 ) 。ここでこの感情データ 1 6 Cの変更においては、感情を変化させるキーヮ一ドと、このキーワードに対して感情の変化を記述した性格データ 1 6 Dに従って (図 6 ) 、感情を示す 6つの要素「怒り」、「悲しみ」、「喜び」、「恐れ」、「驚き」、「嫌悪」による変数が、音声に含まれる感情を変化させる単語に応じて更新され、これによりこれら 6つの変数により感情が表されて、この感情がュ一ザ一の問い掛けに応じて変化する。

これにより電子ぺット装置 1においては、ユーザーの音声入力に応じて電子ぺットの感情が変化するようになされている。また電子ぺット装置 1においては、先の体調データ 1 6 B、この感情データ 1 6 Cを参考にして音声認識結果に応じて応答を作成することにより、電子ペットの反応に、電子ペットの体調、感情が反映される。

すなわち電子ぺット装置 1において、音声認識結果は、応答文作成部 1 1 Eに入力され、この応答文作成部 1 1 Eにおいて、パターンデータ 1 6 Eに記述されたルールに従って音声認識結果に対応する応答文が作成される（図 8 ) 。すなわち電子ぺット装置 1においては、音声に含まれるキ一フレーズに対してそれぞれ応答文が記述されてパターンデータ 1 6 Eが生成されており、応答文作成部 1 1 Eにおいては、音声認識結果によりパターンデータ 1 6 Eを検索して対応する応答文を出力する。

電子ペット装置 1においては、この応答文による応答に対して、対応する音声による応答が音声合成部 1 1 Fにより生成されてスピーカ 6より出力され（図 9 ) 、また同様に応答に対応する画像が画像合成部 1 1 Gにより作成されて液晶表示パネル 3に表示され（図 1 0 ) 、これによりユーザーの音声入力による応答が音声及び画像により提供される。

このようにしてパターンデータ 1 6 Eにより応答を作成する際に、パターンデータ 1 6 Eにおいては、体調データ 1 6 B、感情データ 1 6 Cに応じて異なる応答を発生するようにルールが記述され、電子ペット装置 1においては、このルールに従って応答を生成し、これによりユーザーへの応答に電子ペットの体調、感情が反映される。

このような一連の処理において、電子ペット装置 1は、ユーザーが所定の操作子を操作すると、登録の動作モードに切り換わり、認識データ 1 6 Aにより音声認識可能な単語、文言が音声入力により登録可能となる。

すなわちこの登録のモードにおいて、電子ペット装置 1は（図 1 3及び図 1 5 ) 、ユーザーが登録する単語等の音声を音声入力すると、通常の動作モードにおける処理と同様にしてこの音声入力が音韻列に変換され（図 1 4 ) 、この音韻列による音声が音声合成部 1 1 Fより発声され、この発声によりュ一ザ一からの確認が得られると、続いて先に入力された単語等の属性について音声入力が受け付けられる。

この属性の音声入力においても、電子ペット装置 1においては、音声入力が音韻列に変換され、この音韻列の発声によりユーザ一からの確認が得られると、先に入力された単語等の音韻列が認識データ 1 6 Aに登録されるのに対し、この認識データ 1 6 Aに対応するようにして属性のデータが知識 1 6 Gとして登録される。これにより電子ぺット装置 1においては、キーボード等の煩雑な操作によらなくても音声により単語等を登録でき、その分使い勝手を向上することができるようになされている。また実際に動物のぺットに鎂けを教えるように電子ぺットを取り扱って語彙を増大させることができ、その分電子ぺットを身近な親しみ易いものとすることができるようになされている。

かくするにっきこのようにして登録された単語等にあっては、通常の音声認識処理においては、音声認識処理における音韻列により認識データ 1 6 Aが検索されて対応するテキストデータにより音声認識結果が出力されるのに対し、このテキストデータに代えて音韻列により表記されたテキストデータが出力されて同様に応答文が作成され、このとき知識 1 6 Gに記録された属性に従って応答文が作成され、これにより例えば体調データ 1 6 Bによる空腹時、食べ物の属性による問い掛けに対して、「食べる」、「欲しい」等の応答を発生することが可能となる。

またこのようにして単語と属性とを音声入力により登録するにつき、単語と属性とを区切って、それぞれ音声認識結果を発声して確認を得ることにより、簡易かつ確実に音声入力により単語を登録することができる。

これに対して所定のキーワード（がお一）をユーザーが音声入力すると、電子ぺット装置 1においては（図 1 6及び図 1 7 ) 、事前に登録された例えばユーザ一名等の入力を促すルール 1により音声が発声され、この音声に応答するユーザ —の音声入力が音声認識処理される。電子ペット装置 1においては、この音声認識結果が音声認証部 1 1 Jにおいて、事前に登録された例えばユーザー等による認証データ 1 6 Kと照合され、ここでユーザ一認証されれば認証状態 1 6 Jに音声入力者がユーザーである旨セットされる。

これにより電子ペット装置 1においては、音声入力者がユーザーの場合と、ュ一ザ一でない場合とで区別するパターンデータ 1 6 Eにおけるルールの記述に従つて（図 8、ルール 1 ) 、応答文作成部 1 1 Eにおいて応答文を作成する際に、この認証状態 1 6 Jが参照され、認証状態 1 6 Jの設定に応じて異なる応答が作成される。

これにより電子ペット装置 1においては、動物のペットのように、飼い主に対してだけ特定の挙動を示すように応答することが可能となり、その分電子ぺットを親しみ易いものとすることができるようになされている。

さらに電子ぺット装置 1においては、タイマー 1 1 Bにより音声認証部 1 1 J が起動されて、一定の時間間隔でユーザー認証処理が実行される。この一定の時間間隔によるユーザー認証処理においては、知識 1 6 Gに記録したユーザーの嗜好、趣味等の問い掛けに対する応答によりユーザーか否か判断され、これによりユーザー認証の処理が実行される（図 1 8及び図 1 9 ) 。

これにより電子ぺット装置 1においては、会話の途中でも必要に応じて会話の相手を確かめて飼い主に対してだけ特定の挙動を示すように応答を作成することが可能となる。

このようにしてユーザーと会話するにつき、電子ペット装置 1においては（図 2 0、図 2 2及び図 2 3 ) 、発話分類ルール 1 6 Mに従って発話分類部 1 1 ににより音声入力による会話が「挨拶」、「質問」等に分類される。さらにユーザ一による音声入力に対して応答を作成する際に、パターンデータ 1 6 Eに記述された種別制約（図 2 1 ) により、例えばユーザ一の音声入力が「質問」の場合には、特定のキーフレーズにより応答として「質問」がルールにより特定される場合でも、このルールによっては応答を生成しないようになされる。

これにより電子ペット装置 1においては、「質問」に「質問」を返すような不自然な会話が防止される。

また電子ぺット装置 1においては、連続する会話の分類が逐次対話履歴 1 6 F に記録され、ユーザーによる音声入力に対して応答を作成する際に、この対話履歴 1 6 Fに記録した分類を参照してパターンデータ 1 6 Eに記述された種別制約 (図 2 1 ) に従って応答を作成することにより、「挨拶」に対して「挨拶」を返すようにルールが設定されている場合でも、例えば電子ペット装置による「挨拶」、ユーザーによる「挨拶」が続いた場合には、この「挨拶」に対して「挨拶」を返すルールによっては応答を生成しないようになされる。

これによつても何度も「挨拶」をやりとりするような不自然な会話が防止され、電子ペットを身近なものとすることができる。

さらに電子ペット装置 1においては（図 2 4及び図 2 5 ) 、感情を変化させるキーヮ一ドが同時に使用された単語、キーヮードによる感情の変化と共に感情変化履歴 1 6 Nに順次記録される。電子ペット装置 1においては、一定の時間間隔等によりこの感情変化履歴 1 6 Nが検査され、各キ一ワードについて、同時に使用される頻度の高い単語については、この単語によっても感情が変化するように性格データ 1 6 Dにこの単語が登録される（図 2 6 ) 。

これにより電子ペット装置 1においては、例えば「汚いカレ一パン」とのフレーズが繰り返された場合には、「カレーパン」の文言の音声入力だけで、「汚い」の文言による音声が入力された場合と同様に感情を変化させて応答を生成することになる。

これにより電子ぺット装置 1においては、動物に例えるならば条件反射するように、また人間に例えると連想により、種々に感情を変化させることができ、またこの感情の変化を応答に反映させることができるようになされている。

さらに電子ペット装置 1においては、同様の感情変化履歴 1 6 Nの検査により、頻繁に使用されている感情を変化させるキーワードについては、感情の変化量が低減するように（図 2 7 ) 、性格データ 1 6 Dが更新される。これによりいわゆる慣れの状態を形成し、この慣れの状態を応答に反映させることが可能となるこのようにして使用される電子ぺット装置 1においては、ユーザーの操作によりネットワーク接続部 1 7 (図 1及び図 2 ) を介して、ネットワーク 1 8に接続され、認識データ 1 6 A、知識 1 6 G、パターンデータ 1 6 E等の音声認識処理、応答生成処理に必要なルールであるこれらのデータ、知識をダウンロードすることが可能となる。これによりこれら認識データ 1 6 A、知識 1 6 Gを更新して、一段と高度な会話を楽しむことが可能となる。また応答の具体的な出力である音声データ 1 6 H、画像データ 1 6 Iをダウンロードして、同様に応答の表現を向上することができる。

また同様にしてネットワーク 1 8を介して体調データ 1 6 B、感情データ 1 6 C、対話履歴 1 6 Fを所望の機器に送出することができるようになされ、これによりこれらのデータを送出した機器において、この電子ぺット装置 1における電子ぺットを再現できるようになされ、電子ぺットを種々の環境に連れ出すことが可能となる。

またこれとは逆に、ネットワーク 1 8より体調データ 1 6 B、感情データ 1 6 C、対話履歴 1 6 Fを取得し、これによりあたかもこの電子ペット装置 1に外部より他の電子ぺットが訪問したように応答を作成して、他の電子ぺット装置で飼育されている電子ぺットをこの電子ぺット装置 1に連れ出すことができるようになされている。

( 1 - 8 ) 第 1の実施の形態の効果

以上の構成によれば、音声認識処理のルールである認識データ、応答生成のルールであるパターンデータ、感情生成のルールである感情データ、体調データ、音声データ、画像データをネットワークを介して更新できるようにすることにより、ネットワークに接続された同種の機器における応答とほぼ同一の応答を生成でき、これによりあたかもにこのネットワークに接続された同種の機器より電子ぺットを連れ出したかのように取り扱うことができ、動物のぺットを実際に飼育している場合のように電子ぺットを親しみ易いものとすることができる。また必要に応じて判別可能な単語を増大させる等により知識を増大させることもできるまた定期的にネットワークに接続して認識データ等を更新するすることにより、ユーザ一を何ら煩わすことなく、知識を増大させることができる。

またこれとは逆に、体調データ、感情データ、対話履歴をネットワークにより送出することにより、このネットワークに接続された同種の機器において、この情報処理装置等における音声入力に対する応答とほぼ同一の応答を生成でき、これによりあたかも電子ぺットを外部の機器に連れ出したかのように取り扱うことができ、動物のぺットを実際に飼育している場合のように電子ぺットを親しみ易いものとすることができる。

またこれらデータの更新、データの送出を交換可能な記憶媒体である I Cカードを介して実行できるようにしたことにより、通信機能を備えていない種々の機器との間でもこれらの処理を実行することができる。

また登録の動作モードにおいて、音声認識結果に基づいて、単語の音声認識結果と単語の分類とを登録することにより、電子ぺットが認識可能な語彙を音声により簡易に増やすことができる。これにより実際に飼育している動物のぺットに賴けを教えるように電子ぺットを取り扱うことができ、電子ぺットを親しみ易いものとすることができる。

またこのとき、音声の音韻列による音声認識結果に従つて単語の音声認識結果と分類とを記録することにより、単に音声を入力するだけで他の操作を何ら必要とすることなく登録することができる。

またこのとき通常の処理においては、音声認識結果をテキストデータとして出力し、登録においては音韻列の記述により登録することにより、ルール等の記述を簡略化することができる。

また単語と属性とを区切って入力して登録を受け付けることにより、簡易にこれらの登録の処理を実行することができる。

さらに音声に基づいたユーザー認証の認証結果に基づいて、音声入力者に応じて応答を異ならせることにより、電子ぺットの応答を例えば飼い主とそれ以外の者とで異ならせるようにすることができる。これにより動物のぺットのような挙動を実現でき、電子ぺットを一段と身近な親しみ易いものとすることができる。またこのとき過去の音声認識結果を基準にして音声認識結果を判定してユーザ —を認証することにより、例えばパスワード等の入力を求めることなく、会話を通じてユーザー認証することができ、その分使い勝手を向上することができる。さらにこのとき過去の音声認識結果を基準にした質問に対する答えを判定してユーザー認証することによつても、また所定の単語の発声によりユーザー認証することによつても、自然な会話を通じてユーザー認証することができ、その分使い勝手を向上することができる。

また音声入力の種類を識別すると共に入力の種類に対応する応答の分類に従つて、所定の種類の応答を除く応答を生成することにより、例えば問いに対して問いを返すような不自然な会話を防止することができる。これにより電子ぺットの応答を自然な生き生きとしたものとでき、これによつても電子ぺットを一段と身近な親しみ易いものとすることができる。

またこのときこの入力の種類と応答の分類とによる履歴を参照して応答を生成することにより、挨拶を繰り返しやり取りするような不自然な会話を防止することができる。これにより電子ぺットの応答を自然な生き生きとしたものとでき、これによつても電子ぺットを一段と身近な親しみ易いものとすることができる。さらに音声認識結果と対応する感情パラメータとによる履歴に応じて感情パラメータの変化量を変化させることにより、例えば頻繁に発生される音声に対して慣れ、親しみ等の感情のこもった応答を形成することができる。これにより電子ぺットの応答を自然な生き生きとしたものとでき、これによつても電子ぺットを一段と身近な親しみ易いものとすることができる。

すなわち感情を刺激する単語以外の単語が、この感情を刺激する単語を同時に頻繁に使用される場合、該単語によっても感情パラメータを変化させることにより、繰り返し対により使用される単語にも感情を変化させて応答することができる。

また、感情を刺激する単語のうちの所定の単語が頻繁に使用される場合、該感情を刺激する単語により感情パラメータの変化量を低減することにより、いわゆる慣れの感情を生成することができる。

( 2 ) 他の実施の形態の効果

なお上述の実施の形態においては、ネットワークに接続して電子ぺットを外出させ、また外部機器の電子ペットの応答を出力し、さらには各種ルール等を学習させる場合について述べたが、本発明はこれに限らず、必要に応じてこれら何れかの処理のみ実行するようにしてもよい。また定期的なアクセス、ユーザーの操作によるアクセス、外部機器からの呼によるアクセスの何れかによりネットヮークにアクセスするようにしてもよい。

また上述の実施の形態においては、電話回線によりネットワークに接続する場合について述べたが、本発明はこれに限らず、モデム、パーソナルコンピュータ等の他の機器を介してネットワークに接続する場合にも広く適用することができる。

さらに上述の実施の形態においては、認識データ、パターンデータ、音声データ、画像データのダウンロードによりいわゆる電子ぺットを学習させる場合について述べたが、本発明はこれに限らず、必要に応じてこれらの何れかのデータのダウンロードにより学習させるようにしてもよい。また音声認識処理の手法、音声データの生成手法、画像データの生成手法である制御プログラム自体のダウンロードによりこれらの生成手法自体変更するようにしてもよく、さらには感情データの生成手法、応答文作成部の処理等についても変更するようにしてもよい。また上述の実施の形態においては、電子ぺットを外部の機器に連れ出すにっき、体調データ、感情データ、対話履歴を送出する場合について述べたが、本発明はこれに限らず、必要に応じてこれらの何れかのデータの送出によりこの処理を実行してよく、さらにはこれらのデータに加えて例えば知識等を送出するようにしてもよい。またこのようなデータの送出に代えて、外部機器かちの音声認識結果の入力に対して応答を送出するようにしてもよい。

また上述の実施の形態においては、外部機器の電子ぺットをこの電子ぺット装置 1に連れ出すにっき、各種データを入力する場合について述べたが、本発明はこれに限らず、上述した各種データの何れかのデータの受信によりこの処理を実行してもよく、さらにはこれらのデータに加えて例えば知識等を受信してこれらの処理を実行してもよい。またこのようなデータを受信した内部処理に代えて、外部機器に対して音声認識結果を出力し、外部機器より応答を入力するようにしてもよい。

また上述の実施の形態においては、音声を音韻列により判定して音声認識する場合について述べたが、本発明はこれに限らず、必要に応じて種々の音声認識手法を広く適用することができる。

また上述の実施の形態においては、単語と共に属性についても音声入力により発録する場合について述べたが、本発明はこれに限らず、属性については操作子の操作により選択入力するようにしてもよい。この場合ユーザーにメニューの選択を促す方法等が考えられる。

また上述の実施の形態においては、音声入力により登録した認証データについては、音韻列により音声を表記したテキストデータにより音声認識結果を出力し、一般の音声認識結果については、通常のテキストデータを出力する場合について述べたが、本発明はこれに限らず、一般の音声認識結果においても、音韻列により音声認識結果を表示するようにしてもよい。

また上述の実施の形態においては、ユーザー名、ユーザーの嗜好によりユーザ一認証する場合について述べたが、本発明はこれに限らず、例えば合言葉、過去に会話を交わした日時等を確認してユーザー認証する場合等、過去の音声認識結果によりユーザ一認証する場合に広く適用することができる。

また上述の実施の形態においては、ユーザーが特定の文言を発声した場合と、一定の周期でユーザー認証する場合について述べたが、本発明はこれに限らず、必要に応じてこれら何れかによりユーザー認証するようにしてもよレ、。

また上述の実施の形態においては、音韻列による音声認識処理において、特定の単語の発声を確認してユーザー認証する場合について述べたが、本発明はこれに限らず、例えば音声の高低、周波数スぺクトラム等、音声の特徴を示す種々の特徴量によりユーザー認証して上述の実施の形態と同様の効果を得ることができる。

また上述の実施の形態においては、電子ぺッ卜の応答を例えば飼い主とそれ以外の者とで異ならせる場合について述べたが、本発明はこれに限らず、さらに詳細に音声入力者を識別して、例えば家族と家族以外で応答を異ならせるようにしてもよく、さらには家族の個人でも応答を異ならせても良い。

また上述の実施の形態においては、入力の種類と応答の分類とにより、単純に問いに対しては問いを返さないようにする場合について述べたが、本発明はこれに限らず、例えば感情によっては問いに対して問いを返すようにしてもよい。この場合、電子ペットがひねくれている状況が形成される。

また上述の実施の形態においては、感情の制御において、性格データを操作する場合について述べたが、本発明はこれに限らず性格データの操作に代えて直接感情データを操作するようにしても良い。

また上述の実施の形態においては、音声データ、画像データを出力する場合について述べたが、本発明はこれに限らず、音声合成、画像合成により音声、画像を出力するようにしてもよレ、。

また上述の実施の形態においては、中央処理ュニットの処理により音声認識処理、画像合成処理する場合について述べたが、本発明はこれに限らず、図 3との対比により図 2 8に示すように、音声認識処理、画像合成処理を専用の処理回路により構成してもよい。

また上述の実施の形態においては、応答として音声及び画像を出力する電子べット装置に本発明を適用する場合について述べたが、本発明はこれに限らず、例えば動物の動作をするロボットに適用して鳴き声と動作により応答を出力する電子ぺット装置等、種々の形態により応答を出力する電子ぺット装置に広く適用することができる。

また上述の実施の形態においては、電子ぺッ卜の専用装置である電子ぺット装置に本発明を適用する場合について述べたが、本発明はこれに限らず、図 2との対比により図 2 8に示すように、携帯電話に適用してもよく、さらには G P S、携帯型のテープレコーダ、光ディスク装置等、種々の携帯機器に広く適用することができる。また携帯機器に限らず、例えばパーソナルコンピュータ等の情報処理装置、さらにはこのパーソナルコンピュータ上で動作する各種キャラクタ一等に適用することができる。産業上の利用可能性

本発明は、エンターテイメントロボッ卜に利用することができる。

Claims

on 求の範囲

1 . ユーザーの音声を入力する音声入力手段と、

所定の認識ルールに従って上記音声入力手段より入力した上記音声を音声認識処理して音声認識結果を出力する音声認識手段と、

所定の感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す感情パラメータを生成する感情生成手段と、

少なくとも上記感情パラメータを基準にした所定の応答生成ルールに従って、上記音声認識結果に対応する応答を生成する応答生成手段と、

上記応答を出力する応答出力手段とを具え、

所定のネットワークに接続して、上記認識ルール、上記感情パラメータ生成ルール又は上記応答生成ルールの更新処理を実行する通信手段、又は上記認識ルール、上記感情パラメータ生成ルール又は上記応答生成ルールに必要なデータの更新処理を実行する通信手段を有する

ことを特徴とする情報処理装置。

2 . 上記通信手段は、

定期的に上記ネットワークに接続して上記更新処理を実行する

ことを特徴とする請求の範囲第 1項に記載の情報処理装置。

3 . 交換可能な記憶媒体を介して、少なくとも上記感情パラメータ、又は上記感情パラメータの生成に必要なデータとを更新できるようにした

4 . ユーザーの音声を入力する音声入力手段と、

上記応答を出力する応答出力手段とを具え、

所定のネットワークに接続して、少なくとも上記感情パラメータ又は上記感情パラメータの生成に必要なデータを取得する通信手段を有し、

上記応答生成手段は、

上記通信手段により取得した上記感情パラメータによる応答、又は上記通信手段により取得した上記データより生成した上記感情パラメータによる応答を出力する

ことを特徴とする情報処理装置。

5 . 交換可能な記憶媒体を介して、少なくとも上記感情パラメータ又は上記感情パラメータの生成に必要なデータを交換できるようにした

ことを特徴とする請求の範囲第 4項に記載の情報処理装置。

6 . ユーザーの音声を入力する音声入力手段と、

少なくとも上記感情パラメータを基準にした所定の応答生成ルールに従って、上記音声認識結果に対応する応答を生成する応答生成手段と、上記応答を出力する応答出力手段とを具え、

所定のネットワークに接続して、上記認識ルール、上記感情パラメータ生成ルール又は上記応答生! ¾ルールの更新処理を実行する通信手段、又は上記認識ルール、上記感情パラメータ生成ルール又は上記応答生成ルールに必要なデータの更新処理を実行する通信手段を有する

ことを特徴とする携帯機器。

7 . 上記通信手段は、

ことを特徴とする請求の範囲第 6項に記載の携帯機器。

8 . 交換可能な記憶媒体を介して、少なくとも上記感情パラメータ又は上記感情パラメータの生成に必要なデータを交換できるようにした

ことを特徴とする請求の範囲第 6項に記載の携帯機器。

9 . ユーザーの音声を入力する音声入力手段と、

所定の感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す感情パラメ一タを生成する感情生成手段と、

上記応答を出力する応答出力手段とを具え、

所定のネットワークに接続して、少なくとも上記感情パラメ一タ又は上記感情パラメータの生成に必要なデータを取得する通信手段を有し、

上記応答生成手段は、上記通信手段により取得した上記感情パラメータによる応答、又は上記通信手段により取得した上記データより生成した上記感情パラメ一タによる応答を出力する

ことを特徴とする携帯機器。

1 0 . 交換可能な記憶媒体を介して、少なくとも上記感情パラメータ又は上記感情パラメータの生成に必要なデータを交換できるようにした

ことを特徴とする請求の範囲第 9項に記載の携帯機器。

1 1 . ユーザーの音声を入力する音声入力手段と、

少なくとも上記感情パラメ一タを基準にした所定の応答生成ルールに従って、上記音声認識結果に対応する応答を生成する応答生成手段と、

上記応答を出力する応答出力手段とを具え、

ことを特徴とする電子ぺット装置。

1 2 . 上記通信手段は、

ことを特徴とする請求の範囲第 1 1項に記載の電子ぺット装置。

1 3 . 交換可能な記憶媒体を介して、少なくとも上記感情パラメータ又は上記感情パラメータの生成に必要なデータとを交換できるようにした

1 4 . ユーザーの音声を入力する音声入力手段と、

上記応答を出力する応答出力手段とを具え、

上記応答生成手段は、

上記通信手段により取得した上記感情パラメ一タによる応答、又は上記通信手段により取得した上記データより生成した上記感情パラメータによる応答を出力する

ことを特徴とする電子ぺット装置。

1 5 . 交換可能な記憶媒体を介して、少なくとも上記感情パラメータ又は上記感情パラメータの生成に必要なデータを交換できるようにした

ことを特徴とする請求の範囲第 1 4項に記載の電子ぺット装置。

1 6 . ユーザーの音声を入力する音声入力処理と、

所定の認識ルールに従って上記音声入力処理で取得された上記音声を音声認識処理して音声認識結果を出力する音声認識処理と、

所定の感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す感情パラメータを生成する感情生成処理と、

少なくとも上記感情パラメータを基準にした所定の応答生成ルールに従って、上記音声認識結果に対応する応答を生成する応答生成処理と、

上記応答を出力する応答出力処理と、

所定のネットワークに接続して、上記認識ルール、上記感情パラメータ生成ルール又は上記応答生成ルールの更新処理を実行する通信処理、又は上記認識ルール、上記感情パラメ一タ生成ルール又は上記応答生成ルールに必要なデータの更新処理を実行する通信処理とが記録された

ことを特徴とする情報処理手順を記録した記録媒体。

1 7 . 上記通信処理は、

ことを特徴とする請求の範囲第 1 6項に記載の情報処理手順を記録した記録媒体。

1 8 . ユーザーの音声を入力する音声入力処理と、

所定の認識ルールに従って上記音声入力処理より入力した上記音声を音声認識処理して音声認識結果を出力する音声認識処理と、

少なくとも上記感情パラメ一タを基準にした所定の応答生成ルールに従って、上記音声認識結果に対応する応答を生成する応答生成処理と、

上記応答を出力する応答出力処理と、所定のネットワークに接続して、少なくとも上記感情パラメータ又は上記感情パラメータの生成に必要なデータを取得する通信処理とが記録され、

上記応答生成処理が、

上記通信処理により取得した上記感情パラメ一タによる応答、又は上記通信処理により取得した上記データより生成した上記感情パラメータによる応答を出力する処理である

ことを特徴とする情報処理手順を記録した記録媒体。

1 9 . ユーザーの音声を入力する音声入力処理と、

所定の感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す感情パラメ一タを生成する感情生成処理と、

上記応答を出力する応答出力処理と、

所定のネットワークに接続して、上記認識ルール、上記感情パラメータ生成ル —ル又は上記応答生成ルールの更新処理を実行する通信処理、又は上記認識ルール、上記感情パラメータ生成ルール又は上記応答生成ルールに必要なデータの更新処理を実行する通信処理とを有する

ことを特徴とする情報処理方法。

2 0 . 上記通信処理は、

ことを特徴とする請求の範囲第 1 9項に記載の情報処理方法。

2 1 . ユーザーの音声を入力する音声入力処理と、

上記応答を出力する応答出力処理と、

所定のネットワークに接続して、少なくとも上記感情パラメータ又は上記感情パラメータの生成に必要なデータを取得する通信処理とを有し、

上記応答生成処理が、

ことを特徴とする情報処理方法。

2 2 . ユーザーの音声を入力する音声入力手段と、

上記音声入力手段より入力した音声を音声認識処理して音声認識結果を出力する音声認識手段と、

上記音声に含まれる単語の上記音声認識結果と、対応する単語の分類とを保持する音声認識結果のデータべ一スと、

上記音声認識結果を基準にして上記データベースを検索し、上記音声認識結果の音声に含まれる単語の分類に従って、上記音声認識結果に対応する応答を生成する応答生成手段と、

上記応答を出力する応答出力手段と、

登録の動作モードにおいて、上記音声認識結果に基づいて、少なくとも上記データベースに上記単語の音声認識結果を登録することにより、音声により上記データベースを変更可能な登録手段と

を具えることを特徴とする情報処理装置。

2 3 . 上記音声入力手段は、

音韻列により上記音声を識別して上記音声認識結果を出力し、

上記データベースは、

上記音声の音韻列による音声認識結果に従って上記単語の音声認識結果と上記分類とを記録する

ことを特徴とする請求の範囲第 2 2項に記載の情報処理装置。

2 4 . 上記音声認識手段は、

上記音声を変換したテキストデータにより上記音声認識結果を出力することを特徴とする請求の範囲第 2 2項に記載の情報処理装置。

2 5 . 上記音声認識手段は、

上記登録の動作モードにおいて、所定の区切りに従って上記音声を区切って音声認識処理する

2 6 . 所定の擬似感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す擬似感情パラメ一タを生成する感情生成手段を有し、

上記応答生成手段は、

少なくとも上記擬似感情パラメータを基準にした所定の応答生成ルールに従つて、上記音声認識結果に対応する応答を生成する

2 7 . 交換可能な記憶媒体を介して、少なくとも上記擬似感情パラメータ又は上記擬似感情パラメータの生成に必要なデータを交換できるようにした

2 8 . ユーザーの音声を入力する音声入力手段と、

上記音声に含まれる単語の上記音声認識結果と、対応する単語の分類とを保持する音声認識結果のデータベースと、

上記応答を出力する応答出力手段と、

を具えることを特徴とする携帯機器。

2 9 . 上記音声入力手段は、

上記データベースは、

ことを特徴とする請求の範囲第 2 8項に記載の携帯機器。

3 0 . 上記音声認識手段は、

上記音声を変換したテキストデータにより上記音声認識結果を出力することを特徴とする請求の範囲第 2 8項に記載の携帯機器。

3 1 . 上記音声認識手段は、

上記登録の動作モ一ドにおいて、所定の区切りに従って上記音声を区切って音声認識処理する

ことを特徴とする請求の範囲第 2 8項に記載の携帯機器。

3 2 . 所定の擬似感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す擬似感情パラメータを生成する感情生成手段を有し、

上記応答生成手段は、

ことを特徴とする請求の範囲第 2 8項に記載の携帯機器。

3 3 . 交換可能な記憶媒体を介して、少なくとも上記擬似感情パラメータ又は上記擬似感情パラメータの生成に必要なデータを交換できるようにした

ことを特徴とする請求の範囲第 2 8項に記載の携帯機器。

3 4 . ユーザーの音声を入力する音声入力手段と、

上記音声認識結果を基準にして上記デ一タベースを検索し、上記音声認識結果の音声に含まれる単語の分類に従って、上記音声認識結果に対応する応答を生成する応答生成手段と、上記応答を出力する応答出力手段と、

登録の動作モードにおいて、上記音声認識結果に基づいて、少なくとも上記デ —タベースに上記単語の音声認識結果を登録することにより、音声により上記デ —タベースを変更可能な登録手段と

を具えることを特徴とする電子ぺット装置。

3 5 . 上記音声入力手段は、

上記データベースは、

上記音声の音韻列による音声認識結果に従つて上記単語の音声認識結果と上記分類とを記録する

ことを特徴とする請求の範囲第 3 4項に記載の電子ぺット装置。

3 6 . 上記音声認識手段は、

上記音声を変換したテキストデータにより上記音声認識結果を出力することを特徴とする請求の範囲第 3 4項に記載の電子ぺット装置。

3 7 . 上記音声認識手段は、

3 8 . 所定の擬似感情パラメ一タ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す擬似感情パラメ一タを生成する感情生成手段を有し、

上記応答生成手段は、

3 9 . 交換可能な記憶媒体を介して、少なくとも上記擬似感情パラメータ又は上記擬似感情パラメータの生成に必要なデータを交換できるようにした

4 0 . ユーザーの音声を入力する音声入力処理と、

上記音声入力処理より入力した音声を音声認識処理して音声認識結果を出力する音声認識処理と、

上記音声認識結果を基準にして上記音声に含まれる単語の上記音声認識結果と、対応する単語の分類とを保持する音声認識結果のデータベースを検索し、上記音声認識結果の音声に含まれる単語の分類に従って、上記音声認識結果に対応する応答を生成する応答生成処理と、

上記応答を出力する応答出力処理と、

登録の動作モードにおいて、上記音声認識結果に基づいて、少なくとも上記データベースに上記単語の音声認識結果を登録することにより、音声により上記データベースを変更可能な登録処理とを記録した

ことを特徴とする情報処理手順を記録した記録媒体。

4 1 . 上記音声入力処理は、

上記データベースは、

上記音声の音韻列による音声認識結果に従って上記単語の音声認識結果と上記分類とを記録して形成された

ことを特徴とする請求の範囲第 4 0項に記載の情報処理手順を記録した記録媒体。

4 2 . 上記音声認識処理は、

上記音声を変換したテキストデータにより上記音声認識結果を出力することを特徴とする請求の範囲第 4 0項に記載の情報処理手順を記録した記録媒体。

4 3 . 上記音声認識処理は、

4 4 . 所定の擬似感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す擬似感情パラメ一タを生成する感情生成処理が記録され、

上記応答生成処理は、

4 5 . ユーザーの音声を入力する音声入力処理と、

上記音声認識結果を基準にして、上記音声に含まれる単語の上記音声認識結果と、対応する単語の分類とを保持する音声認識結果のデータベースを検索し、上記音声認識結果の音声に含まれる単語の分類に従って、上記音声認識結果に対応する応答を生成する応答生成処理と、上記応答を出力する応答出力処理と、

登録の動作モードにおいて、上記音声認識結果に基づいて、少なくとも上記データベースに上記単語の音声認識結果を登録することにより、音声により上記データベースを変更可能な登録処理とを有する

ことを特徴とする情報処理方法。

4 6 . 上記音声入力処理は、

上記音韻列により上記音声を識別して上記音声認識結果を出力し、

上記データベースは、

上記音声の音韻列による音声認識結果に従つて上記単語の音声認識結果と上記分類とを記録して形成される

ことを特徴とする請求の範囲第 4 5項に記載の情報処理方法。

4 7 . 上記音声認識処理は、

上記音声を変換したテキストデータにより上記音声認識結果を出力することを特徴とする請求の範囲第 4 5項に記載の情報処理方法。

4 8 . 上記音声認識処理は、

4 9 . 所定の擬似感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す擬似感情パラメ一タを生成する感情生成処理を有し、

上記応答生成処理は、

5 0 . ユーザーの音声を入力する音声入力手段と、

上記音声入力手段をより入力した音声を音声認識処理して音声認識結果を出力する音声認識手段と、

所定の応答生成ルールに従って、上記音声認識結果に対応する応答を生成する応答生成手段と、

上記応答を出力する応答出力手段と、

上記音声に基づいて、上記ユーザーを認証するユーザー認証手段とを具え、上記応答生成手段は、

上記ユーザ一認証手段の認証結果に基づいて、音声入力者に応じて上記応答を異ならせる

ことを特徴とする情報処理装置。

5 1 . 上記ユーザー認証手段は、

過去の音声認識結果を基準にして上記音声認識結果を判定することにより、上記音声に基づいて上記ユーザ一を認証する

ことを特徴とする請求の範囲第 5 0項に記載の情報処理装置。

5 2 . 上記応答生成手段は、

過去の音声認識結果に対応する質問を上記応答として出力し、

上記ユーザ一認証手段は、

該質問の応答に対する音声認識結果を判定してユーザーを認証する

ことを特徴とする請求の範囲第 5 1項に記載の情報処理装置。

5 3 . 上記過去の音声認識結果が所定の単語であることを特徴とする請求の範囲第 5 1項に記載の情報処理装置。

5 4 . 上記ユーザー認証手段は、

上記音声認識結果より上記音声の特徴を示す特徴量を検出し、上記特徴量に基づいて上記ユーザーを認証することにより、上記音声に基づいて上記ユーザーを認証する

5 5 . 所定の擬似感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す擬似感情パラメータを生成する感情生成手段を有し、

上記応答生成手段は、

少なくとも上記擬似感情パラメータを基準にして上記応答生成ルールに従って、上記音声認識結果に対応する応答を生成する

5 6 . ユーザーの音声を入力する音声入力手段と、

上記応答を出力する応答出力手段と、

上記音声に基づいて、上記ユーザ一を認証するユーザ一認証手段とを具え、上記応答生成手段は、

ことを特徴とする携帯機器。

5 7 . 上記ユーザ一認証手段は、

過去の音声認識結果を基準にして上記音声認識結果を判定することにより、上記音声に基づいて上記ユーザーを認証する

ことを特徴とする請求の範囲第 5 6項に記載の携帯機器。

5 8 . 上記応答生成手段は、

上記ユーザー認証手段は、

ことを特徴とする請求の範囲第 5 7項に記載の携帯機器。

5 9 . 上記過去の音声認識結果が所定の単語である

ことを特徴とする請求の範囲第 5 7項に記載の携帯機器。

6 0 . 上記ユーザー認証手段は、

上記音声認識結果より上記音声の特徴を示す特徴量を検出し、上記特徴量に基づいて上記ユーザーを認証することにより、上記音声に基づいて上記ユーザ一を認証する

ことを特徴とする請求の範囲第 5 6項に記載の携帯機器。

6 1 . 所定の擬似感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す擬似感情パラメータを生成する感情生成手段を有し、

上記応答生成手段は、

少なくとも上記擬似感情パラメ一タを基準にして上記応答生成ルールに従って、上記音声認識結果に対応する応答を生成する

ことを特徴とする請求の範囲第 5 6項に記載の携帯機器。

6 2 . ユーザーの音声を入力する音声入力手段と、

上記応答を出力する応答出力手段と、

上記ユーザー認証手段の認証結果に基づいて、音声入力者に応じて上記応答を異ならせる

ことを特徴とする電子ぺット装置。

6 3 . 上記ユーザ一認証手段は、

ことを特徴とする請求の範囲第 6 2項に記載の電子ぺット装置。

6 4 . 上記応答生成手段は、

上記ユーザ一認証手段は、

該質問の応答に対する音声認識結果を判定してユーザ一を認証する

ことを特徴とする請求の範囲第 6 3項に記載の電子ぺット装置。

6 5 . 上記過去の音声認識結果が所定の単語である

6 6 . 上記ユーザー認証手段は、上記音声認識結果より上記音声の特徴を示す特徴量を検出し、上記特徴量に基づいて上記ユーザーを認証することにより、上記音声に基づいて上記ユーザーを認証する

6 7 . 所定の擬似感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す擬似感情パラメ一タを生成する感情生成手段を有し、

上記応答生成手段は、

6 8 . ユーザーの音声を入力する音声入力処理と、

所定の応答生成ルールに従って、上記音声認識結果に対応する応答を生成する応答生成処理と、

上記応答を出力する応答出力処理と、

上記音声に基づいて、上記ユーザーを認証するユーザ一認証処理とが記録され上記応答生成処理は、

上記ユーザー認証処理の認証結果に基づいて、音声入力者に応じて上記応答を異ならせる

ことを特徴とする情報処理手順を記録した記録媒体。

6 9 . 上記ユーザー認証処理は、過去の音声認識結果を基準にして上記音声認識結果を判定することにより、上記音声に基づいて上記ユーザーを認証する

ことを特徴とする請求の範囲第 6 8項に記載の情報処理手順を記録した記録媒体。

7 0 . 上記応答生成処理は、

上記ユーザ一認証処理は、

該質問の応答に対する音声認識結果を判定してユーザ一を認証する処理であることを特徴とする請求の範囲第 6 9項に記載の情報処理手順を記録した記録媒体

7 1 . 上記過去の音声認識結果が所定の単語である

ことを特徴とする請求の範囲第 6 9項に記載の情報処理手順を記録した記録媒体。

7 2 . 上記ユーザー認証処理は、

7 3 . 所定の擬似感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す擬似感情パラメータを生成する感情生成処理が記録され、

上記応答生成処理は、少なくとも上記擬似感情パラメータを基準にして上記応答生成ルールに従って、上記音声認識結果に対応する応答を生成する

7 4 . ユーザーの音声を入力する音声入力処理と、

上記応答を出力する応答出力処理と、

上記音声に基づいて、上記ユーザーを認証するユーザー認証処理とを有し、上記応答生成処理は、

ことを特徴とする情報処理方法。

7 5 . 上記ユーザー認証処理は、

ことを特徴とする請求の範囲第 7 4項に記載の情報処理方法。

7 6 . 上記応答生成処理は、

上記ユーザ一認証処理は、

該質問の応答に対する音声認識結果を判定してュ一ザ一を認証する

ことを特徴とする請求の範囲第 7 5項に記載の情報処理方法。

7 7 . 上記過去の音声認識結果が所定の単語である

7 8 . 上記ユーザー認証処理は、

7 9 . 所定の擬似感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す擬似感情パラメータを生成する感情生成処理が記録され、

上記応答生成処理は、

8 0 . ユーザーの音声を入力する音声入力手段と、

上記応答を出力する応答出力手段と、

上記音声に基づいて、上記音声による入力の種類を識別する発話分類手段とを具え、

上記応答生成ルールが、

上記入力の種類に応じて、上記入力の種類に対応する応答の分類に従って、所定の種類の応答を除く応答を生成するルールである

ことを特徴とする情報処理装置。

8 1 . 少なくとも上記音声による入力の種類と、上記応答生成手段により生成された上記応答の分類とによる履歴を記録する履歴記録手段を有し、

上記応答出力手段は、

上記履歴記録手段に記録された履歴を参照して上記応答を生成する

ことを特徴とする請求の範囲第 8 0項に記載の情報処理装置。

8 2 . 所定の擬似感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す擬似感情パラメ一タを生成する感情生成手段を有し、

上記応答生成手段は、

少なくとも上記擬似感情パラメータを基準にして上記応答生成ルールに従つて、上記音声認識結果に対応する応答を生成する

8 3 . ユーザ一の音声を入力する音声入力手段と、

上記応答を出力する応答出力手段と、

上記応答生成ルールが、

ことを特徴とする携帯機器。

8 4 . 少なくとも上記音声による入力の種類と、上記応答生成手段により生成された上記応答の分類とによる履歴を記録する履歴記録手段を有し、

上記応答出力手段は、

ことを特徴とする請求の範囲第 8 3項に記載の携帯機器。

8 5 . 所定の擬似感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す擬似感情パラメータを生成する感情生成手段を有し、

上記応答生成手段は、

ことを特徴とする請求の範囲第 8 3項に記載の携帯機器。

8 6 . ユーザーの音声を入力する音声入力手段と、

上記応答を出力する応答出力手段と、

上記応答生成ルールが、

ことを特徴とする電子ぺット装置。

8 7 . 少なくとも上記音声による入力の種類と、上記応答生成手段により生成された上記応答の分類とによる履歴を記録する履歴記録手段を有し、

上記応答出力手段は、

ことを特徴とする請求の範囲第 8 6項に記載の電子ぺット装置。

8 8 . 所定の擬似感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す擬似感情パラメ一タを生成する感情生成手段を有し、

上記応答生成手段は、

8 9 . ユーザ一の音声を入力する音声入力処理と、

上記応答を出力する応答出力処理と、

上記音声に基づいて、上記音声による入力の種類を識別する発話分類処理とが記録され、

上記応答生成ルールは、

上記入力の種類に応じて、上記入力の種類に対応する応答の分類に従って、所定の種類の応答を除く応答を生成する

ことを特徴とする情報処理手順を記録した記録媒体。

9 0 . 少なくとも上記音声による入力の種類と、上記応答生成処理により生成された上記応答の分類とによる履歴を記録する履歴記録処理が記録され、

上記応答出力処理は、

上記履歴記録処理に記録された履歴を参照して上記応答を生成する

ことを特徴とする請求の範囲第 8 9項に記載の情報処理手順を記録した記録媒体。

9 1 . 所定の擬似感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す擬似感情パラメータを生成する感情生成処理が記録され、

上記応答生成処理は、

9 2 . ユーザーの音声を入力する音声入力処理と、

上記応答を出力する応答出力処理と、

上記音声に基づいて、上記音声による入力の種類を識別する発話分類処理を有し、上記応答生成ルールは、

ことを特徴とする情報処理方法。

9 3 . 少なくとも上記音声による入力の種類と、上記応答生成処理により生成された上記応答の分類とによる履歴を記録する履歴記録処理を有し、

上記応答出力処理は、

ことを特徴とする請求の範囲第 9 2項に記載の情報処理方法。

9 4 . 所定の擬似感情パラメータ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す擬似感情パラメ一タを生成する感情生成処理を有し、

上記応答生成処理は、

9 5 . ユーザーの音声を入力する音声入力手段と、

少なくとも上記感情パラメ一タを基準にした所定の応答生成ルールに従って、上記音声認識結果に対応する応答を生成する応答生成手段と、上記応答を出力する応答出力手段とを具え、

上記感情生成手段は、

少なくとも上記音声認識結果と対応する感情パラメータとによる履歴を記録する履歴記録手段を有し、

上記音声認識結果に対する上記感情パラメータの変化を上記履歴に応じて変化させる

ことを特徴とする情報処理装置。

9 6 . 上記感情生成手段は、

上記音声に含まれる感情を刺激する単語に応じて上記感情パラメータを変化させ、

上記感情を刺激する単語以外の単語が、上記感情を刺激する単語を同時に頻繁に使用される場合、該単語によっても、同時に使用される頻度の高い上記感情を刺激する単語による場合と同様に、上記感情パラメータを変化させる

ことを特徴とする請求の範囲第 9 5項に記載の情報処理装置。

9 7 . 上記感情生成手段は、

上記感情を刺激する単語のうちの所定の単語が頻繁に使用される場合、該感情を刺激する単語により上記感情パラメータの変化量を低減する

9 8 . ユーザーの音声を入力する音声入力手段と、

所定の感情パラメ一タ生成ルールに従って、少なくとも上記音声認識結果と時間経過とにより変化する、擬似的に感情を示す感情パラメ一タを生成する感情生成手段と、

上記応答を出力する応答出力手段とを具え、

上記感情生成手段は、

ことを特徴とする携帯機器。

9 9 . 上記感情生成手段は、

ことを特徴とする請求の範囲第 9 8項に記載の携帯機器。

1 0 0 . 上記感情生成手段は、

ことを特徴とする請求の範囲第 9 8項に記載の携帯機器。

1 0 1 . ユーザ一の音声を入力する音声入力手段と、所定の認識ルールに従って上記音声入力手段より入力した上記音声を音声認識処理して音声認識結果を出力する音声認識手段と、

上記応答を出力する応答出力手段とを具え、

上記感情生成手段は、

少なくとも上記音声認識結果と対応する感情パラメ一タとによる履歴を記録する履歴記録手段を有し、

ことを特徴とする電子ぺット装置。

1 0 2 . 上記感情生成手段は、

上記感情を刺激する単語以外の単語が、上記感情を刺激する単語を同時に頻繁に使用される場合、該単語によっても、同時に使用される頻度の高い上記感情を刺激する単語による場合と同様に、上記感情パラメ一タを変化させる

ことを特徴とする請求の範囲第 1 0 1項に記載の電子ぺット装置。

1 0 3 . 上記感情生成手段は、

1 0 4 . ユーザーの音声を入力する音声入力処理と、

上記応答を出力する応答出力処理とが記録され、

上記感情生成処理は、

少なくとも上記音声認識結果と対応する感情パラメータとによる履歴を記録する履歴記録処理を有し、

上記音声認識結果に対する上記感情パラメータの変化を上記履歴に応じて変化させる処理である

ことを特徴とする情報処理手順を記録した記録媒体。

1 0 5 . 上記感情生成処理は、

上記感情を刺激する単語以外の単語が、上記感情を刺激する単語を同時に頻繁に使用される場合、該単語によっても、同時に使用される頻度の高い上記感情を刺激する単語による場合と同様に、上記感情パラメ一タを変化させる処理であることを特徴とする請求の範囲第 1 0 4項に記載の情報処理手順を記録した記録媒体。

1 0 6 . 上記感情生成処理は、

上記感情を刺激する単語のうちの所定の単語が頻繁に使用される場合、該感情を刺激する単語により上記感情パラメ一タの変化量を低減する処理であることを特徴とする請求の範囲第 1 0 4項に記載の情報処理手順を記録した記録媒体。

1 0 7 . ユーザーの音声を入力する音声入力処理と、

上記応答を出力する応答出力処理とを有し、

上記感情生成処理が、

ことを特徴とする情報処理方法。

1 0 8 . 上記感情生成処理は、

上記音声に含まれる感情を刺激する単語に応じて上記感情パラメータを変化させ、上記感情を刺激する単語以外の単語が、上記感情を刺激する単語を同時に頻繁に使用される場合、該単語によっても、同時に使用される頻度の高い上記感情を刺激する単語による場合と同様に、上記感情パラメータを変化させる処理であることを特徴とする請求の範囲第 1 0 7項に記載の情報処理方法。

1 0 9 . 上記感情生成処理は、

上記感情を刺激する単語のうちの所定の単語が頻繁に使用される場合、該感情を刺激する単語により上記感情パラメータの変化量を低減する処理であることを特徴とする請求の範囲第 1 0 7項に記載の情報処理方法。