JP2020173342A

JP2020173342A - 猫型会話ロボット

Info

Publication number: JP2020173342A
Application number: JP2019075152A
Authority: JP
Inventors: 大西　忠治; Tadaharu Onishi; 忠治大西; 譲治岩坪; Joji Iwatsubo; 忠吉原; Tadashi Yoshihara; 慈子齋藤; Shigeko Saito
Original assignee: It Shindan Shien Center Kitakyushu
Current assignee: It Shindan Shien Center Kitakyushu
Priority date: 2019-04-10
Filing date: 2019-04-10
Publication date: 2020-10-22
Anticipated expiration: 2039-04-10
Also published as: JP6598227B1

Abstract

【課題】疑似的な自我と、発話音声を受信する度に対話態度を変化させる猫の性格を持ち、対話内容に応じて表情を変化させる猫型会話ロボットを提供する。【解決手段】猫型会話ロボット１０は、発話音声を受信して受信信号を出力する音声入力手段１１と、ロボット側の対話者として設定されたキャラクターの対話時の顔画像を表示する表示手段１２と、発話者に対して対話音声を発生する音声出力手段１３と、受信信号を受けて設定される対話態度に基づく対話音声を形成する音声データを作成して音声出力手段１３に入力しながら、キャラクターの顔画像を形成する顔画像合成データ及びキャラクターの対話時の顔表情を変化させる顔表情データをそれぞれ作成し、顔画像合成データと顔表情データを組合せて画像表示データとして表示手段１２に入力する制御装置１４とを有する。【選択図】図１

Description

本発明は、猫型会話ロボットに係り、詳細には、猫型会話ロボットがペットのように疑似的に自我を持った対応をすることで、猫型会話ロボットと対話（会話）を行う発話者（猫型会話ロボットのユーザ、以下、単にユーザともいう）が猫型会話ロボットとの会話を楽しむ環境を構築するものである。
すなわちアバウトな生活スケジュール（例えば９時頃まで睡眠、１４時頃まで音楽を楽しむ、１８時頃まで趣味を実行して睡眠等のスケジュールで、ユーザに合わせて趣味を変えることも可）を持って猫型会話ロボットが生活している状況を構築し、ユーザが猫型会話ロボットの生活に関与して話しかけることや、ユーザに手間をかけさせること、例えば擬似的に食事の要求や排泄物の処理要求等の要求行動をして、その対応に応じて会話内容が変化することも含め、ユーザの興味に応じてお互いの生活の接点を持ち、会話を充実したものにすることを目指している。
加えてユーザからの発話音声を受信する度に対話態度を変化させる猫の性格を持つと共に、猫型会話ロボットがユーザの発話音声に応答する際に、猫型会話ロボット側（以下、単にロボット側ともいう）の対話者として設定されたキャラクターの対話時の顔画像を表示しながら、対話内容に応じてキャラクターの顔の表情を変化させる猫型会話ロボットに関する。

ここで、「猫の性格を持つ」とは、例えば、１）猫がすり寄り甘えるように、ユーザに自発的に話しかけたり何かを要求する発話を行う対話パターン、２）猫が、自立性が高く必ずしも飼い主に従順性を常に示さないように、ユーザが話しかけても無視する対話パターン、３）猫が意外性のある行動を示すように、ユーザが話しかけた話題とは別の話題で対話する対話パターン、及び４）猫が時に飼い主に対して威嚇的な態度を示すことがあるように、ユーザに対して対話を拒絶する対話パターン等の対話態度を有することをいう。

従来の会話型ロボットとの対話（会話）では、マニュアルに基づく接客対応に代表されるような反復的かつ画一的な対話（いわゆる不自然な対話）が行われ易く、対話に面白味がなく対話の継続が困難で、かつ雑談のような対話ができないといった問題点が指摘されている。このため、会話型ロボットがユーザを識別して予め入手しているユーザのプロファイルに基づいて応答文を作成することにより、あるいは対話を行いながらユーザの新たな情報を入手し、得られた情報を応答文の作成に適宜反映させることにより、対話が不自然になることを回避する提案が行われている（例えば、特許文献１参照）。

更に、従来の会話型ロボットは表情を変化させながら会話を行うことはできないため、ユーザは会話型ロボットとコミュニケーションが取り難いという問題があった。そこで、ユーザの音声からユーザの感情を怒り、喜び、及びストレス等の各項目別に数値化して感情パラメータを算出し、感情パラメータ毎に予め作成されている発話シナリオ、表情シナリオ、及び動作シナリオに基づいて、所定の音声（発話内容）を出力し、所定の表情を創出し、所定の動作を実現する会話ロボットシステムが提案されている（例えば、特許文献２参照）。

特表２０１６−５３６６３０号公報特開２００８−１２５８１５号公報

特許文献１の発明では、ユーザの情報に基づいて応答文が作成されるため対話の話題に変化が生じ難く、会話型ロボットとの対話を続けることがいずれは困難になるという問題がある。また、ユーザが雑談の目的で会話を始めた場合、雑談の話題が思い付きから生じたものであると、会話型ロボットが雑談の話題に関するユーザの情報を入手することは略不可能であるため、対話を無理に継続させようとすると対話が不自然となり易く、会話型ロボットとの対話の継続が困難になるという問題が生じる。
また、特許文献２に開示された会話型ロボットは、会話型ロボットが推定したユーザの感情と予め作成された発話シナリオ、表情シナリオ、及び動作シナリオに基づいて発話内容、表情、動作を決定することができるが、会話型ロボットが会話を行いながら応答内容に基づいて会話型ロボットの表情を適宜変えることはできない。このため、ユーザは会話型ロボットとコミュニケーションが取り難いという問題は解消されない。

加えて、従来の会話型ロボットにユーザの異常状態を検出する監視カメラや人感センサ等の見守り用のセンサを取り付けることにより、会話型ロボットに「見守り機能」を付加することが行われている。しかしながら、見守り用のセンサを用いたユーザの異常状態の監視では、明らかな異常が生じないと（例えば、「ユーザが転倒して動けない」、「ユーザが気絶して倒れている」ことが監視カメラの映像として得られないと）異常が認識できない。このため、見守り用のセンサを設けてもユーザが重篤な状態になるまで放置される危険性が高いという問題がある。

本発明はかかる事情に鑑みてなされたもので、ユーザが猫型会話ロボットの生活に関与することで、自然に相互の会話を促し、加えて発話音声を受信する度に対話態度を変化させる猫の性格を有することにより対話に変化を生じさせることが可能であると共に、ロボット側の対話者として設定されたキャラクターの対話時の顔画像を表示しながら対話内容に応じて顔の表情を変化させることによりコミュニケーションを取り易くし、更に発話者の対話中の対話状態の変化や質問に対する回答内容の変化から発話者の異常を早期に発見して関係者に知らせることが可能な猫型会話ロボットを提供することを目的とする。

前記目的に沿う本発明に係る猫型会話ロボットは、疑似的な自我を持ち、発話者の発話音声を受信する度に対話態度を変化させる猫の性格を持つ猫型会話ロボットであって、
前記発話音声を受信して受信信号を出力する音声入力手段と、
ロボット側の対話者として設定されたキャラクターの対話時の顔画像を表示する表示手段と、
前記発話者に対して対話音声を発生する音声出力手段と、
前記受信信号を受けて設定される前記対話態度に基づく前記対話音声を形成する音声データを作成して前記音声出力手段に入力しながら、前記キャラクターの顔画像の表情を対話時に変化させる画像表示データを作成して前記表示手段に入力する制御装置とを有する。

本発明に係る猫型会話ロボットにおいて、更に、前記発話者を撮影する撮像手段を有し、前記制御装置には、前記撮像手段で得られた前記発話者の画像を用いて、前記表示手段の表示面の方向を調節し、該表示面に表示された前記キャラクターの顔画像を前記発話者に対向させる表示位置調整部が設けられていることが好ましい。
これによって、発話者（ユーザ）は、キャラクターの対話時の顔表情の変化を容易に捉えることができる。

本発明に係る猫型会話ロボットにおいて、前記キャラクターの顔画像は猫のアニメ顔画像とすることができる。
これによって、発話者は、キャラクターの顔を好みに合わせて設定することができる。なお、キャラクターの顔画像は、発話者の要求に合わせて作成することも、予め準備された複数の顔画像候補の中から発話者に選択させることも可能である。

本発明に係る猫型会話ロボットにおいて、前記制御装置は、
（１）前記音声入力手段から出力される前記受信信号を発話音声ファイルに変換し、該発話音声ファイルから発話文字ファイルを作成して出力する音声入力処理部と、
（２）前記発話文字ファイルの入力を受けて前記対話音声の基となる対話文字ファイルを作成して出力する対話管理部と、
（３）前記対話文字ファイルの入力を受けて該対話文字ファイルから前記音声データを形成し音声信号に変換して前記音声出力手段に入力する音声出力処理部と、
（４）前記キャラクターの顔画像を形成する顔画像合成データと、前記対話文字ファイルの入力を受けて該対話文字ファイルから前記キャラクターの感情を推定し、該感情に応じた表情を形成する顔表情データをそれぞれ作成し、該顔画像合成データと該顔表情データを組合せて前記画像表示データとして前記表示手段に入力するキャラクター表情処理部
とを有する構成とすることができる。
このような構成とすることで、制御装置を構成する各処理部毎にメンテナンスや更新を行うことができる。

本発明に係る猫型会話ロボットにおいて、前記対話管理部には、前記発話文字ファイルが入力される度に、予め設定された複数の対話パターンの中から前記対話態度として対話パターンＳを任意に選定し、該対話パターンＳに対応する前記対話文字ファイルを出力する応答対話系統を設けることができる。
発話音声から作成される発話文字ファイルが対話管理部に入力される度に、対話管理部では対話態度として対話パターンＳが選定されるので、猫型会話ロボットは発話音声を受信する度に対話態度を変化させた応答を行うことができる。

本発明に係る猫型会話ロボットにおいて、前記複数の対話パターンは、
（１）前記発話文字ファイルが有する話題に応答する前記対話態度を示す通常対話パターンと、
（２）前記発話文字ファイルが有する話題とは別の話題で応答する前記対話態度を示す変更話題対話パターンと、
（３）前記発話文字ファイルの入力に対し無応答となる前記対話態度を示す無視対話パターンと、
（４）前記発話文字ファイルの入力に対し対話拒絶となる前記対話態度を示す拒絶対話パターン
とを有することができる。

対話態度として通常対話パターンが選定されると、発話文字ファイル（発話音声ファイル）が有する話題に応答することになって、猫型会話ロボットに猫の従順な一面を生じさせることができ、対話態度として変更話題対話パターンが選定されると、発話文字ファイルが有する話題とは別の話題に応答することになって、猫型会話ロボットに猫の意外な一面を生じさせることができる。また、対話態度として無視対話パターンが選定されると、話しかけても応答がなく、猫型会話ロボットに猫の自立性が高い一面を生じさせることができ、対話態度として拒絶対話パターンが選定されると、対話が拒絶され、猫型会話ロボットに猫の威嚇的な（非従順な）一面を生じさせることができる。これにより、発話者は、猫型会話ロボットとの間に適度な距離感を有するコミュニケーションを図ることができる。

「発話文字ファイルが有する話題とは別の話題」とは、発話文字ファイルが有する話題とは異なる話題と、発話文字ファイルが有する話題と関連性が弱い話題をそれぞれ有することを指す。異なる話題で応答させる頻度を高くすると意外性が強い性格の猫を、関連性の弱い話題で応答させる頻度を高くすると意外性が弱い性格の猫を猫型会話ロボットにおいてそれぞれ実現させることができる。
ここで、発話文字ファイルが有する話題と関連性の弱い話題とは、話題の分野は同じであるが対象が異なる場合を指し、例えば、話題が和食である場合に、アジア、アフリカ、欧州等の他国料理を話題にすることを指す。

本発明に係る猫型会話ロボットにおいて、前記通常対話パターン、前記変更話題対話パターン、前記無視対話パターン、及び前記拒絶対話パターンに対してそれぞれ猫の性格に基づいた選定確率が予め設定されていることが好ましい。
各対話パターンを猫の性格に基づいた選定確率で生起させるため、通常対話パターン（猫の従順性）、変更話題対話パターン（猫の意外性）、無視対話パターン(猫の自立性）、拒絶対話パターン（猫の威嚇性）を猫型会話ロボットに違和感なく生じさせることができる。なお、各対話パターンの選定確率を調節することで、従順性、意外性、自立性、及び威嚇性の比率を変えることができ、猫の性格の特徴付け（猫の個性の形成）が可能になる。

本発明に係る猫型会話ロボットにおいて、前記発話文字ファイルには予め登録された特定文言が存在し、該特定文言が存在する該発話文字ファイルが入力された際は、前記通常対話パターンの前記選定確率が５０％より高く設定されることが好ましい。
これによって、飼い主が猫の相手をしたい場合に飼い主は猫が好むこと（例えば、猫じゃらし）を行うように、発話内に猫じゃらし型特定文言を入れることにより、通常対話パターンの機会が高くなって猫型会話ロボットとの対話を楽しむことができる。

本発明に係る猫型会話ロボットにおいて、前記応答対話系統には、
（１）入力された前記発話文字ファイルが有する話題とは別の話題を有する複数の別文字ファイル、対話無視に対応する複数の無視文字ファイル、及び対話拒絶に対応する複数の拒絶文字ファイルをそれぞれ格納し、要求に応じて出力する文字ファイルデータベースと、
（２）前記発話文字ファイル及び前記別文字ファイルの入力によりそれぞれ複数の応答文字ファイルを作成して出力する対話応答処理手段と、
（３）前記発話文字ファイルの入力により前記対話応答処理手段から出力された前記複数の応答文字ファイルの中から応答文字ファイルＡを選択し前記対話文字ファイルとして出力する通常型対話手段と、
（４）前記文字ファイルデータベースに格納された前記複数の別文字ファイルの中から別文字ファイルＷを選択して前記対話応答処理手段に入力し、該対話応答処理手段から出力された前記複数の応答文字ファイルの中から応答文字ファイルＢを選択し前記対話文字ファイルとして出力する変更話題型対話手段と、
（５）前記文字ファイルデータベースに格納された前記複数の無視文字ファイルの中から無視文字ファイルＣを選択し前記対話文字ファイルとして出力する無視型対話手段と、
（６）前記文字ファイルデータベースに格納された前記複数の拒絶文字ファイルの中から拒絶文字ファイルＤを選択し前記対話文字ファイルとして出力する拒絶型対話手段
とを設けることができる。
これにより、猫の性格を具体的に発現させた対話態度を猫型会話ロボットに実現させることができる。

本発明に係る猫型会話ロボットにおいて、前記音声入力処理部は、前記発話音声から前記発話音声ファイルを作成する音声検出手段と、該発話音声ファイルから前記発話文字ファイルを作成し出力する音声認識処理手段とを有し、
前記音声認識処理手段及び前記対話応答処理手段はクラウド上にそれぞれ設けられ、前記発話音声ファイルの前記音声認識処理手段への入力、該音声認識処理手段からの前記発話文字ファイルの出力、該発話文字ファイル及び前記別文字ファイルＷの前記対話応答処理手段への入力、該対話応答処理手段から前記通常型対話手段及び前記変更話題型対話手段への前記応答文字ファイルの出力はそれぞれ情報通信回線を介して行ことが好ましい。

クラウド上に音声認識処理手段及び対話応答処理手段を設けると、大規模なデータベースを接続することができ、ハードウェアの更新と、アプリケーションソフトウェアの更新及び改善を適宜行うことができる。このため、音声認識処理手段では発話音声ファイルから発話文字ファイルへの変換を迅速かつ正確に行うことができ、対話応答処理手段では発話文字ファイルの内容に応答する的確な内容を有する応答文字ファイルを容易に作成することができる。

本発明に係る猫型会話ロボットにおいて、前記応答文字ファイルＡには前記発話文字ファイルの話題に関連する質問が含まれることが好ましい。
これによって、質問に回答する形で対話が続けられるため、ロボット側では話題の絞り込みを行うことが容易となり、対話を継続させ易くなる。

本発明に係る猫型会話ロボットにおいて、
前記対話管理部は、更に自発発話系統を有し、前記自発発話系統には、
（１）前記発話者の趣味、猫独自の行動を折り込んだ生活パターン、及び前記発話者が応答することを意識した該猫型会話ロボットの要求行動のいずれか１以上を含む自発発話条件を予め設定する自発発話条件設定手段と、
（２）該自発発話条件設定手段で設定された前記自発発話条件が成立した際に条件成立信号を出力する条件成立判定手段と、
（３）前記条件成立信号を受けて、該条件成立信号に対応する前記自発発話条件に設定された自発発話文字ファイルを前記対話文字ファイルとして出力する自発発話手段
とが設けられていることが好ましい。

自発発話手段を設けることにより、発話者からの発話に猫型会話ロボットが答えるという一方的な会話から双方向（発話者から猫型会話ロボットへの発話、猫型会話ロボットから発話者への発話）の会話が可能になる。また、猫が飼い主に対してすり寄ったり甘えたりするように、猫型会話ロボットから発話者に対して話しかけを行わせることや、猫が一人遊びを行うように、猫型会話ロボットに独り言を言わせることができる。
ここで、猫型会話ロボットから発話者に対する話しかけの頻度や、猫型会話ロボットが独り言を言う頻度は、自発発話条件により決めることができる。また、猫型会話ロボットが発話者に対して話しかける話題や独り言の話題は、自発発話文字ファイルにより設定することができる。

本発明に係る猫型会話ロボットにおいて、前記自発発話条件は前記発話者の見守りを実行する見守り開始条件であって、前記自発発話文字ファイルは前記発話者の個人情報に基づいた特定質問を構成するものであり、
前記制御装置には、前記特定質問に対する前記発話者の回答の正誤を判定し、誤回答が生じた際に第１の異常信号を出力する第１の警報部が設けられていることが好ましい。
ここで、発話者の個人情報に基づいた特定質問は、例えば、発話者の名前、生年月日、親、兄弟、又は子供の名前、予め確認し合った合言葉等のように、発話者にとっては容易に正答でき、第３者にとっては正答することが困難となる質問である。従って、発話者の正答率は通常では１００％であり、誤回答が生じることは発話者に体調の変化（異常）が生じている可能性が高いことを示している。

本発明に係る猫型会話ロボットにおいて、前記自発発話文字ファイルは、前記自発発話条件毎に予め作成され、前記自発発話系統に設けられた自発発話文字ファイルデータベースに格納されていることが好ましい。
これにより、発話者の好みや趣向に合致した話題に関する話しかけを猫型会話ロボットに行わせたり、猫型会話ロボット（猫）に何かを要求する発言を行わせることができ、猫型会話ロボットとの会話の機会や猫型会話ロボットの世話を行う機会を容易に作ることができる。

本発明に係る猫型会話ロボットにおいて、前記対話文字ファイルに含まれる文は、該文の語尾に「にゃん」を付加する語尾加工を施す語尾加工手段を介して前記音声出力処理部に出力されることが好ましい。
これにより、文の語尾に「にゃん」が発話されることになって、猫としてのイメージを向上させることができる。

本発明に係る猫型会話ロボットにおいて、前記制御装置には、予め設定された時間帯で前記対話音声が発せられる度に該対話音声が発せられてから前記音声入力手段で前記発話音声が受信されるまでの待機時間を測定し、予め求めておいた前記発話者の基準待機時間と該待機時間との偏差が設定した許容値を超える応答状態変化の発生有無を検知し、前記発話者との間で最初の対話が成立して以降の該応答状態変化の発生の累積回数が予め設定した異常応答判定値に到達した際に第２の異常信号を出力する第２の警報部が設けられていることが好ましい。

ここで、基準待機時間とは、発話者の平常状態の待機時間を複数回測定し統計処理して得られる統計量で、例えば、待機時間分布の平均値、中央値、又は最頻値である。また、偏差は待機時間と基準待機時間との差であり、許容値は、例えば、待機時間分布の標準偏差σを用いて、σ、２σ、又は3σのいずれか１に設定することができる。
猫型会話ロボットの音声出力手段より対話音声が発せられてから猫型会話ロボットの音声入力手段で発話者の発話音声が受信されるまでの待機時間（発話者が話しかけられてから応答するまでの時間）は、発話者の体調に影響される対話処理能力を反映する測定値と考えられる。このため、偏差が許容値を超えることは、発話者の対話時の応答状態が変化していることを示している。そして、応答状態変化の発生の累積回数が異常応答判定値に到達したことは、発話者に新たな（異常な）対話応答状態が生じていることを示しており、発話者に体調の変化（異常）が生じている可能性が高いと判断できる。

本発明に係る猫型会話ロボットにおいて、前記制御装置には、前記音声入力処理部から前記対話管理部に出力される前記発話文字ファイルの前記発話音声ファイルに対する確からしさを定量的に示す確信度を取得し、該確信度が予め設定された異常確信度以下となる低確信度状態の発生有無を検知し、該低確信度状態の発生の累積回数が予め設定した異常累積回数に到達した際に第３の異常信号を出力する第３の警報部が設けられていることが好ましい。

音声入力処理部では、受信信号から作成した発話音声ファイルを発話文字ファイルに変換する際、音声に対して文（文字）が一義的に決定できない場合（変換時の確信度（発話音声ファイル（発話音声）の認識の確からしさを確率的に評価した数値）が１００％でない場合）、確信度の高い順に複数の発話文字ファイルが候補として提供され、通常は、第１候補（確信度が最大の）発話文字ファイルが対話管理部に入力される。
ここで、音声入力処理部での発話文字ファイルの作成方法を固定すると、同一の発話音声ファイル（発話音声）に対しては常に同一の確信度で同一の発話文字ファイルが得られる。従って、平常状態の発話者の種々の発話音声ファイル（発話音声）に対して音声入力処理部で評価される確信度を求めると、確信度の分布は平常状態の発話者の対話状態を定量的に評価する尺度の一つとなる。このため、確信度の分布の最小値より小さい値に異常確信度を設定しておくと、発話文字ファイルの作成時の異常度が異常確信度以下となる低確信度状態が発生することは、発話者の対話状態に変化が生じている、即ち、発話者が平常状態でないことを示している。そして、低確信度状態の発生の累積回数が異常累積回数に到達したことは、発話者に対話状態を変化させるほどに体調の変化（異常）が生じている可能性が高いことを示している。
なお、平常状態の発話者の発話音声ファイル（発話音声）に対する確信度は、一般的に９０％程度の値となるため、例えば、異常確信度は確信度７０％程度の値に設定できる。また、異常累積回数は、例えば、５回程度の値に設定することができる。

本発明に係る猫型会話ロボットにおいては、疑似的な自我を持ち、猫の性格のように発話音声を受信する度に対話態度を変化させるので、意外性のある対話音声が出力されることになって対話に変化が生じ易くなる。
また、猫型会話ロボットとの会話時に、ロボット側の対話者として設定されたキャラクターの顔画像を表示手段に表示し、対話内容に応じてキャラクターの対話時の顔表情を微妙に変化させることができるので、発話者は猫型会話ロボットとのコミュニケーションが取り易くなる。

制御装置の対話管理部に自発発話手段を設けた場合、発話者と猫型会話ロボットとの間で双方向の会話（発話者から猫型会話ロボットへの発話から始まる会話、猫型会話ロボットから発話者への発話から始まる会話）を成立させることができ、会話の機会を向上させることが可能になる。その結果、猫型会話ロボットと発話者が永く付き合う状況を形成することができ、例えば、話し相手がいないという孤独感の解消や、猫型会話ロボット（機械）と付き合うというストレスの軽減を図ることが可能になる。
また、制御装置に、第１〜第３の警報部のいずれか１又は２以上を設けた場合、発話者が猫型会話ロボットとの対話の中で、発話者に通常とは違う軽度の異常状態が生じていることを早期に発見することができ、発話者の安心及び安全のレベルを高めることが可能になる。

本発明の第１の実施の形態に係る猫型会話ロボットの構成を示すブロック図である。同猫型会話ロボットの制御装置の構成を示すブロック図である。同猫型会話ロボットの音声入力処理部の構成を示すブロック図である。同猫型会話ロボットの対話管理部の応答対話系統の構成を示すブロック図である。同猫型会話ロボットの対話管理部の構成を示すブロック図である。同猫型会話ロボットの対話管理部の自発発話系統の構成を示すブロック図である。同猫型会話ロボットの音声出力処理部の構成を示すブロック図である。同猫型会話ロボットのキャラクター表情処理部の構成を示すブロック図である。同猫型会話ロボットの付帯装置の説明図である。同猫型会話ロボットの対話処理の流れ図である。対話処理の対話ステップ３における応答対話処理の流れ図である。対話処理の対話ステップ３における自発発話処理の流れ図である。本発明の第２の実施の形態に係る猫型会話ロボットの構成を示すブロック図である。同猫型会話ロボットの制御装置の構成を示すブロック図である。

続いて、添付した図面を参照しつつ、本発明を具体化した実施の形態につき説明し、本発明の理解に供する。
図１に示すように、本発明の第１の実施の形態に係る猫型会話ロボット１０は、疑似的な自我を持ち、猫型会話ロボット１０のユーザ（発話者）の発話音声を受信する度に対話態度を変化させる猫の性格を持つ会話ロボットであって、ユーザの発話音声を受信して受信信号を出力するマイクロフォン１１（音声入力手段の一例）と、ロボット側の対話者として設定されたキャラクターの対話時の顔画像を表示するディスプレイ１２（表示手段の一例）と、ユーザに対して対話音声を発生するスピーカ１３（音声出力手段の一例）と、受信信号を受けて設定される対話態度に基づく対話音声を形成する音声データを作成してスピーカ１３に入力しながら、キャラクターの顔画像の表情を対話時に変化させる画像表示データを作成してディスプレイ１２に入力する制御装置１４とを有する。
ここで、キャラクターの顔画像は、予め準備された複数の猫のアニメ顔画像の中から一つを選択して設定する。なお、キャラクターの顔画像は、ユーザの要求に合わせて任意に作製することもできる。

更に、猫型会話ロボット１０はユーザを撮影するカメラ１５（撮像手段の一例）を有し、制御装置１４には、カメラ１５で得られたユーザの画像を用いて、ディスプレイ１２の表示面の方向を調節し、ディスプレイ１２に表示されたキャラクターの顔画像をユーザに対向させる表示位置調整部１６が設けられている。ここで、表示位置調整部１６は、ユーザの画像からディスプレイ１２（例えば、表示面の中心位置）に対するユーザの三次元位置を求めてディスプレイ１２の表示面の方向（例えば、表示面の中心位置に立てた法線の方向）を調節する修正データを演算する修正データ演算器１７と、ディスプレイ１２を載置し、修正データに基づいてディスプレイ１２の表示面の方向を変化させる可動保持台１８とを有している。

図２に示すように、制御装置１４は、マイクロフォン１１から出力される受信信号を発話音声ファイルに変換する音声検出手段２５と、発話音声ファイルから発話文字ファイルを作成して出力する音声認識処理手段１９とを備えた音声入力処理部２０と、発話文字ファイルの入力を受けて起動し、発話文字ファイルが入力される度に、予め設定された複数の対話パターンの中から対話態度として対話パターンＳを任意に選定して、対話パターンＳに対応する対話音声の基となる対話文字ファイルを作成して出力する応答対話系統２１を備えた対話管理部２２とを有する。

更に、制御装置１４は、対話文字ファイルの入力を受けて対話文字ファイルから音声データを作成し音声信号に変換してスピーカ１３に入力する音声出力処理部２３と、キャラクターの顔画像を形成する顔画像合成データと、対話文字ファイルの入力を受けて対話文字ファイルからキャラクターの感情を推定し、感情に応じた表情を形成する顔表情データをそれぞれ作成し、顔画像合成データと顔表情データを組合せて画像表示データとしてディスプレイ１２に入力するキャラクター表情処理部２４とを有する。

図３に示すように、音声入力処理部２０は、マイクロフォン１１から出力される受信信号から音声が含まれている時間区間を音声区間として検出して発話音声ファイルとして出力する音声検出手段２５と、発話音声ファイルを情報通信回線２６（例えば、光回線、ＡＤＳＬ回線、ケーブルテレビ回線等）を介して音声認識処理手段１９に入力（送信）する送信手段２７と、音声認識処理手段１９から情報通信回線２６を介して出力（送信）された発話文字ファイルを受信して出力する受信手段２８とを有している。
ここで、音声認識処理手段１９からは、発話音声ファイル（発話音声）を発話文字ファイルに変換する際、音声に対して文（文字）が一義的に決定できない場合、確信度（発話文字ファイルの発話音声ファイルに対する確からしさを定量的に示したもの）の高い順に複数の発話文字ファイルが候補として提供（出力）される。従って、受信手段２８では、出力された複数の発話文字ファイルの中から確信度が最大の発話文字ファイルを発話音声ファイルに対応する発話文字ファイルとして対話管理部２２に向けて出力する。
なお、音声認識処理手段１９をクラウド（インターネット）上に設けることで、音声認識処理手段１９に大規模なデータベースを接続することができ、ハードウェアの更新、アプリケーションソフトウェアの更新や改善を適宜行うことができる。このため、音声認識処理手段１９では発話音声ファイルから発話文字ファイルへの正確かつ迅速な変換を行うことができる。

図４に示すように、応答対話系統２１には、猫型会話ロボット１０の対話態度を選定する上で重要となる特定文言を登録させて格納する特定文言登録手段２９と、発話文字ファイル中に特定文言が存在するか否かを判定し、特定文言が存在しない場合は発話文字ファイルの意図が特定文言と一致するか否かを判定する機能、及び特定文言が存在する又は発話文字ファイルの意図が特定文言と一致する際はその特定文言の情報を出力し、特定文言が存在しない又は発話文字ファイルの意図が特定文言と一致しない際は特定文言無しの情報を出力する機能を備えた特定文言判定手段３０が設けられている。
なお、発話文字ファイルに特定文言が存在する場合又は発話文字ファイルの意図が特定文言と一致する場合を、以下では単に発話文字ファイルに特定文言が存在する場合と記載する。

応答対話系統２１には、猫型会話ロボット１０が有する猫の性格として、複数の対話パターン、例えば、
（１）猫が従順な性格を示すことに対応して、発話文字ファイルが有する話題に応答する対話態度を示す通常対話パターン、
（２）猫が意外性のある行動を示すことに対応して、発話文字ファイルが有する話題とは別の話題で応答する対話態度を示す変更話題対話パターン、
（３）猫が強い自立性を示すことに対応して、話しかけても（発話文字ファイルの入力に対して）無応答となる対話態度を示す無視対話パターン、
（４）猫が威嚇的な態度を示すことに対応して、話しかけても（発話文字ファイルの入力に対して）対話拒絶となる対話態度を示す拒絶対話パターン
の４つの対話パターンを登録させる猫の特性登録手段３１が設けられている。猫の特性登録手段３１に登録する対話パターンにより、猫の性格を反映させた猫型会話ロボット１０の対話態度を実現できる。

応答対話系統２１には、猫の特性登録手段３１を介して登録された通常対話パターン、変更話題対話パターン、無視対話パターン、拒絶対話パターンについて猫の性格に基づいた選定確率をそれぞれ登録する選定確率登録手段３２が設けられている。
選定確率登録手段３２では、発話文字ファイルに特定文言が存在しない場合に、猫型会話ロボット１０において想定される猫の性格に応じて各対話パターンの選定確率の比率を決定すると共に、各対話パターンの選定確率の総和が１００％となるように各対話パターンの選定確率を調整した猫特性を設定する。更に、選定確率登録手段３２では、発話文字ファイルに特定文言が存在する際は、通常対話パターンの選定確率を他の対話パターンの選定確率より大きくし、変更話題対話パターン、無視対話パターン、及び拒絶対話パターンの各選定確率の比率を小さくした特定文言用猫特性を設定する。例えば、猫特性の選定確率では通常対話パターンを５０％未満に、特定文言用猫特性の選定確率では通常対話パターンを５０％より高く、好ましくは７０％以上とする。
なお、特定文言用猫特性は、複数の特定文言に対して一つ設定しても、複数の特定文言を複数のグループ（例えば、猫型会話ロボット１０に対話態度の選択権を認めない絶対服従型特定文言のグループと、猫じゃらし型特定文言のグループ）に分けてグループ毎に設定しても、特定文言毎に設定してもよい。

応答対話系統２１には、特定文言無しの情報が出力された際に、選定確率登録手段３２に登録された猫特性を取得し、特定文言判定手段３０から特定文言の情報が出力された際に、選定確率登録手段３２に登録された特定文言用猫特性を取得する選定確率取得手段３３と、選定確率取得手段３３で取得された猫特性又は特定文言用猫特性が有する各対話パターンの選定確率に基づいて、発話文字ファイルが応答対話系統２１に入力された際の対話パターンＳを選定する対話パターン選定手段３４が設けられている。
なお、対話パターン選定手段３４では、例えば、発話文字ファイルが入力された際に発生させた乱数と選定確率取得手段３３で取得された各対話パターンの選定確率から対話パターンＳを決定することができる。

例えば、猫特性が有する各対話パターンの選定確率として、通常対話パターンの選定確率を４０％、変更話題対話パターンの選定確率を２５％、無視対話パターンの選定確率を１５％、拒絶対話パターンの選定確率を２０％に設定する（猫の行動パターンの分析結果による）。
また、特定文言「電話をかけて」を絶対服従型特定文言として、通常対話パターンの選定確率を１００％、変更話題対話パターンの選定確率を０％、無視対話パターンの選定確率を０％、及び拒絶対話パターンの選定確率を０％に設定する。
更に、特定文言「遊ぼう」と「話をしよう」を猫じゃらし型特定文言として、通常対話パターンの選定確率を８０％、変更話題対話パターンの選定確率を８％、無視対話パターンの選定確率を５％、拒絶対話パターンの選定確率を７％に設定する。

このように設定することで、発話音声から作成された発話文字ファイル中に「○○さんに電話をかけて」が存在する場合は、対話パターンＳとして通常対話パターンが必ず選定されることになって電話をかける対話が成立し、猫型会話ロボット１０に電話機能が設けられていると、猫型会話ロボット１０を介して○○さんに電話をかけることができる。
また、発話音声から作成された発話文字ファイル中に「遊ぼう」「話をしよう」が存在する場合は、対話パターンＳに選ばれる通常対話パターンの選定確率が８０％となり、猫型会話ロボット１０との対話を楽しむ機会が高くなる。
一方、猫型会話ロボット１０の持ち主の発話音声から作成された発話文字ファイル中に「電話をかけて」「遊ぼう」「話をしよう」が存在しない場合は、対話パターンＳに選ばれる通常対話パターンの選定確率は４０％となり、猫型会話ロボット１０との対話が実現できないことがある（意外性を示す、自立性を示す、威嚇的な態度を示す猫の性格が表れる）。

応答対話系統２１には、入力された発話文字ファイルが有する話題とは別の話題を有する複数の別文字ファイル、対話無視に対応する複数の無視文字ファイル、及び対話拒絶に対応する複数の拒絶文字ファイルをそれぞれ格納し、要求に応じて出力する（変更話題対話パターンが選定された際に別文字ファイル、無視対話パターンが選定された際に無視文字ファイル、拒絶対話パターンが選定された際に拒絶文字ファイルをそれぞれ出力する）文字ファイルデータベース３５と、発話文字ファイル及び別文字ファイルの入力によりそれぞれ複数の応答文字ファイルを作成して出力する対話応答処理手段３６とが設けられている。
なお、対話応答処理手段３６は、情報通信回線２６を介してクラウド（インターネット）上に配置されている。対話応答処理手段３６をクラウド上に設けることで、対話応答処理手段３６に大規模なデータベースを接続することができ、ハードウェアの更新、アプリケーションソフトウェアの更新や改善を適宜行うことができる。このため、対話応答処理手段３６では発話文字ファイルの内容に応答する的確な内容を有する対話文字ファイルを作成することができる。

また、応答対話系統２１には、対話パターンＳに通常対話パターンが選定されたことを受けて起動し、発話文字ファイルをクラウド上の対話応答処理手段３６に情報通信回線２６を介して入力し、対話応答処理手段３６から出力された複数の応答文字ファイルを情報通信回線２６を介して取得して、複数の応答文字ファイルの中から応答文字ファイルＡを選択し対話文字ファイルとして出力する通常型対話手段３７と、対話パターンＳに変更話題対話パターンが選定されたことを受けて起動し、文字ファイルデータベース３５に格納された複数の別文字ファイルの中から別文字ファイルＷを選択して対話応答処理手段３６に入力し、対話応答処理手段３６から出力された複数の応答文字ファイルの中から応答文字ファイルＢを選択し対話文字ファイルとして出力する変更話題型対話手段３８が設けられている。

ここで、対話応答処理手段３６は、発話文字ファイルの入力に対して、発話文字ファイルの話題に関連する質問が含まれる応答文字ファイルを複数出力する特性を有するものが好ましい。これにより、応答文字ファイルＡには発話文字ファイルの話題に関連する質問が含まれることになって、質問に回答する形で対話が続けられることになる。その結果、猫型会話ロボット１０では話題の絞り込みを行うことが容易となり、対話を継続させ易くなる。
なお、通常型対話手段３７に、対話応答処理手段３６から出力される応答文字ファイルＡに発話文字ファイルの話題に関連する質問が含まれるように、発話文字ファイルを編集して対話応答処理手段３６に入力する編集機能を設けてもよい。

更に、応答対話系統２１には、対話パターンＳに無視対話パターンが選定されたことを受けて起動し、文字ファイルデータベース３５に格納された複数の無視文字ファイルの中から無視文字ファイルＣを選択し対話文字ファイルとして出力する無視型対話手段３９と、対話パターンＳに拒絶対話パターンが選定されたことを受けて起動し、文字ファイルデータベース３５に格納された複数の拒絶文字ファイルの中から拒絶文字ファイルＤを選択し対話文字ファイルとして出力する拒絶型対話手段４０が設けられている。
そして、通常型対話手段３７、変更話題型対話手段３８、無視型対話手段３１、及び拒絶型対話手段４０からそれぞれ出力される対話文字ファイルに含まれる文は、図５に示すように、文の語尾に「にゃん」を付加する語尾加工を施す語尾加工手段４１を介して音声出力処理部２３に出力される。

図５に示すように、対話管理部２２は、更に自発発話系統４２を有している。そして、図６に示すように、自発発話系統４２には、ユーザが感心の高い趣味、猫独自の行動を折り込んだ生活パターン、及びユーザが応答することを意識した猫型会話ロボット１０（猫）の要求行動等の自発発話条件を設定する自発発話条件設定手段４３と、自発発話条件が成立したか否かを判定し、条件が成立した際に条件成立信号を出力する条件成立判定手段４４が設けられている。
また、自発発話系統４２には、条件成立信号を受けて（自発発話条件が成立した際に）、条件成立信号に対応する自発発話条件に設定された自発発話文字ファイルを予め登録させて格納する自発発話文字ファイルデータベース４５と、条件成立判定手段４４が自発発話条件が成立したと判定した際に、自発発話系統４２に設けられた自発発話文字ファイルデータベース４５から該当する自発発話文字ファイルを抽出し対話文字ファイルとして出力する自発発話手段４６が設けられている。なお、自発発話手段４６から出力される対話文字ファイルに含まれる文は、図５に示すように、文の語尾に「にゃん」を付加する語尾加工を施す語尾加工手段４１を介して音声出力処理部２３に出力される。

例えば、自発発話条件として、猫型会話ロボット１０の駆動用バッテリの充電残量の下限値を設定し、バッテリの充電残量が下限値に到達した（自発発話条件が成立した）際の自発発話文字ファイルとして「バッテリの残量が残りわずかです」を登録し自発発話文字ファイルデータベース４５に格納する。この場合、バッテリに設けられた充電残量検出器（図示せず）によりバッテリの充電残量が下限値に到達したことが条件成立判定手段４４に伝えられると、自発発話手段４６により自発発話文字ファイルデータベース４５から自発発話文字ファイル「バッテリの残量が残りわずかです」が抽出され、対話文字ファイルとして語尾加工手段４１に入力されて「バッテリの残量が残りわずかですにゃん」に語尾加工されて音声出力処理部２３に出力される。

自発発話条件として猫型会話ロボット１０のメンテナンス項目毎に予定日を設定し、該当日の（自発発話条件が成立した際の）自発発話文字ファイルとしてメンテナンス項目、例えば、「今日は顔を拭いてもらう日です」を自発発話文字ファイルデータベース４５に格納する。この場合、猫型会話ロボット１０に設けられたカレンダー機能によりメンテナンスの予定の該当日には条件成立判定手段４４により条件成立信号が出力され、自発発話手段４６により自発発話文字ファイルデータベース４５から自発発話文字ファイル「今日は顔を拭いてもらう日です」が抽出され、対話文字ファイルとして語尾加工手段４１に入力されて「今日は顔を拭いてもらう日ですにゃん」に語尾加工されて音声出力処理部２３に出力される。

自発発話条件として、音声入力処理部２０への発話音声（マイクロフォン１１からの受信信号）の未入力継続時間の上限値（例えば、８時間）を設定し、未入力継続時間が上限値に到達したことに対応する自発発話文字ファイルとして「今日は８時間話をしていません」を登録し自発発話文字ファイルデータベース４５に格納する。この場合、未入力継続時間が上限値に到達したことが猫型会話ロボット１０に設けられた時計機能により条件成立判定手段４４に伝えられると、自発発話手段４６により自発発話文字ファイルデータベース４５から自発発話文字ファイル「今日は８時間話をしていません」が抽出され、対話文字ファイルとして語尾加工手段４１に入力されて「今日は８時間話をしていませんにゃん」に語尾加工されて音声出力処理部２３に出力される。
以上のように自発発話条件を設定することによって、猫型会話ロボット１０が持ち主に世話を焼かせること（要求行動）に基づいた会話の機会を作ることができる。

自発発話条件を猫型会話ロボット１０に搭載した電話機から出力される電話の着信信号とし、着信信号の受信時（自発発話条件が成立した際）に対応する自発発話文字ファイルとして「××さんから電話です」を自発発話文字ファイルデータベース４５に登録する。また、自発発話手段４６に、電話機能を用いて電話番号から相手の氏名○○を検索させ、自発発話文字ファイルデータベース４５から抽出した「××さんから電話です」の××に検索結果の氏名○○を代入した自発発話文字ファイルを作成して出力させる。この場合、着信信号の出力が条件成立判定手段４４で確認されると、自発発話文字ファイルデータベース４５から自発発話文字ファイル「××さんから電話です」が抽出され、自発発話系統４２からは対話文字ファイルとして「○○さんから電話です」が出力され、語尾加工手段４１で「○○さんから電話ですにゃん」に語尾加工されて音声出力処理部２３に出力される。
なお、迷惑電話の着信拒否等の特殊なサービスも猫型会話ロボット１０に搭載された電話機能を用いて処理させる。

自発発話条件として猫型会話ロボット１０に搭載したコンピュータへの情報通信回線２６を介して送信された電子メールの着信信号の受信を設定し、着信信号の入力時（自発発話条件が成立した際）に対応する自発発話文字ファイルとして「メールが届いています」を自発発話文字ファイルデータベース４５に登録する。なお、迷惑メールの着信拒否等の特殊なサービスは、電子メール機能を用いて処理させる。また、自発発話手段４６に、自発発話文字ファイルデータベース４５から抽出した「メールが届いています」とメール本文を合わせたものを自発発話文字ファイルとして出力させる処理を登録する。
従って、着信信号の受信が条件成立判定手段４４で確認されると、自発発話手段４６により自発発話文字ファイルデータベース４５から自発発話文字ファイル「メールが届いています」が抽出され、自発発話系統４２からは「メールが届いています」とメール本文を合わせたものが自発発話文字ファイルとして作成され、対話文字ファイルとして出力され、語尾加工手段４１で語尾加工されて音声出力処理部２３に出力される。
以上のように自発発話条件を設定することによって、猫型会話ロボット１０の持ち主の日常生活の利便性が向上されると共に、猫型会話ロボット１０との会話の機会を作ることができる。

自発発話条件を、例えば、特定日の特定時間に設定し、自発発話条件に対応して行われる各種処理、例えば、本の一節を読み上げる、歌い出す、猫型会話ロボットのスケジュール管理機能を利用して本日のスケジュールを抽出して繰り返し読み上げる、猫型会話ロボット１０に独り言を言わせる（猫型会話ロボット１０から過去に発話された内容（音声出力処理部２３に入力された対話文字ファイルの内容）を任意に抽出して読み上げる）等の発話を行わせることを自発発話手段４６に登録する。
従って、猫型会話ロボット１０に設けられたカレンダー機能と時計機能により自発発話条件が成立したことが条件成立判定手段４４に伝えられると、自発発話系統４２からは自発発話に対応する自発発話文字ファイルが作成され、対話文字ファイルとして出力され、語尾加工手段４１で語尾加工されて音声出力処理部２３に出力される。
これによって、猫型会話ロボット１０が一人遊びをしているのを見て楽しむことができると共に、猫型会話ロボット１０との会話の機会を作ることができる。
なお、猫型会話ロボット１０が一人遊びとして、発話の代わりに、例えば、テレビ受像機のリモートコントロール機能を用いてテレビスイッチを入れる等の行為を設定してもよい。

対話管理部２２には、図６に示すように、応答対話系統２１から出力されて語尾加工手段４１に入力される対話文字ファイル及び自発発話系統４２から出力される対話文字ファイルを記録する対話文字ファイルデータベース４７を設ける。更に、猫型会話ロボット１０に独り言を言わせる自発発話条件が成立したことを受けて起動し、対話文字ファイルデータベース４７に格納された対話文字ファイルを任意に選択して自発発話文字ファイルデータベース４５に入力する機能を備えた対話文字ファイル抽出手段４８を設ける。これにより、猫型会話ロボット１０に独り言を言わせる際の自発発話文字ファイルの作成が容易にできる。

図７に示すように、音声出力処理部２３は、対話文字ファイルを対話音声ファイルに変換する音声合成手段４９と、対話音声ファイルから音声データを作成し音声信号に変換してスピーカ１３に出力する音声変換手段５０とを有している。これにより、猫型会話ロボット１０は、ユーザの発話音声を受信して対話音声を発することができると共に、自発発話条件が成立した際に、ユーザに対話音声を発することができる。

図８に示すように、制御装置１４に設けられたキャラクター表情処理部２４は、予め準備された複数の猫のアニメ顔画像及び各アニメ顔画像を形成する画像要素データ群を格納した顔画像データベース５１と、顔画像データベース５１から複数の猫のアニメ顔画像（例えば、猫の平常時の顔表情）を取り出してディスプレイ１２に表示させ、特定のアニメ顔画像Ｒを１つユーザに選択させてキャラクターの顔画像として設定させる顔画像選択手段５２と、特定のアニメ顔画像Ｒについての画像要素データ群を顔画像データベース５１から抽出して顔画像合成データとして出力する画像合成手段５３とを有している。
更に、キャラクター表情処理部２４は、対話管理部２２から出力された対話文字ファイルからキャラクターの感情を推定し、感情に応じた表情を形成する顔表情データを作成する感情推定手段５４と、顔画像合成データと顔表情データを組合せてキャラクターの対話時の顔表情を形成する画像表示データを作成してディスプレイ１２に出力する画像表示手段５５とを有している。

感情推定手段５４には、複数の文Ｐに対してそれぞれ心理状態（快、不快、喜び、怒り、悲しみ等の各種気持ちの強弱関係）を対応させた感情データベースが設けられている。また、感情推定手段５４には、心理状態と顔表情変化量（平常時の顔表情を形成している各部位の位置を基準位置とし、顔の各部位毎における基準位置からの変化方向と変化距離）の対応関係を求めて作成した表情データベースが設けられている。
このため、感情推定手段５４に対話文字ファイルが入力されると、対話文字ファイルに含まれる文Ｔと同趣旨の文Ｐをデータベース内で抽出し、抽出された文Ｐが有する心理状態を文Ｔ（対話文字ファイル）の感情と推定する。なお、文Ｔの趣旨が複数の文Ｐの組合せから構成される場合は、文Ｔの趣旨を構成する各文Ｐを抽出すると共に各文Ｐの寄与率（重み付け率）を算出し、各文Ｐの心理状態を寄与率で調整した修正心理状態の総和を文Ｔ（対話文字ファイル）の感情と推定する。

そして、対話文字ファイルに含まれる文Ｔの感情が推定されると、推定された感情の心理状態（修正心理状態の総和）に一致又は最も類似する顔表情変化量を表情データベース内で抽出し、抽出された顔表情変化量を文Ｔの顔表情データとする。
対話文字ファイルがキャラクター表情処理部２４に入力されない場合、即ち、顔表情データが作成されない場合、画像表示データは顔画像合成データに一致するため、ディスプレイ１２には特定のアニメ顔画像Ｒ（平常時の顔表情）が表示される。
なお、キャラクター表情処理部２４に入力された対話文字ファイルから感情が推定できない場合、例えば、擬声語の場合は、擬声語を発する際の表情状態を顔表情データと設定する。
これにより、猫型会話ロボット１０は、キャラクターの顔表情を変化させながら対話を行うことができる。

図９に示すように、猫型会話ロボット１０には、カメラ５６（別の撮像手段の一例）で得られた画像の処理及び解析から顔認証を行うカメラ装置５７と、カメラ装置５７で得られた画像を表示すると共に猫型会話ロボット１０の各種設定を行う際のタッチパネルとして使用されるモニタ表示装置５８と、ユーザの存在を人感センサ５９を介して確認する人感センサ装置６０が設けられている。
更に、猫型会話ロボット１０には、ユーザやその関係者の情報（例えば、ユーザやその関係者の顔画像、関係者の氏名、電話番号、住所等）を登録する利用者情報データベース６１が設けられている。なお、利用者情報データベース６１は、必要に応じて情報通信回線２６を介して対話応答処理手段３６でも利用される。

猫型会話ロボット１０にカメラ５６とカメラ装置５７が設けられていると、ユーザの関係者が、別途離れた場所に設けた表示装置６２を用いて持ち主の行動認識や部外者の訪問等の監視を行うことができる。
猫型会話ロボット１０に人感センサ装置６０が設けられていると、ユーザの関係者が表示装置６２を用いてユーザの在室確認や見守りを行うことができる。
更に、猫型会話ロボット１０にモニタ表示装置５８が設けられていると、ユーザに、例えば、「バッテリの残量が残りわずかです」等の注意や警報情報を、「××さんから電話です」等の連絡情報を音声に加えて表示して知らせることができる。

ここで、モニタ表示装置５８を制御装置１４の対話管理部２２に接続させると、対話文字ファイルを必要に応じてモニタ表示装置５８に表示させることができ、ユーザは猫型会話ロボット１０からの対話音声を文字として確認することができる。また、モニタ表示装置５８を制御装置１４の音声入力処理部２０に接続させると、発話文字ファイルを必要に応じてモニタ表示装置５８に表示させることができ、ユーザは猫型会話ロボット１０の音声認識を文字として確認することができる。なお、モニタ表示装置５８は音声入力処理部２０及び対話管理部２２にそれぞれ接続することができ、モニタ表示装置５８はディスプレイ１２と兼用させてもよい。

本発明の第１の実施の形態に係る猫型会話ロボット１０の作用について説明する。
猫型会話ロボット１０との対話に先立って、ユーザの発話音声が猫型会話ロボット１０に受信される度に選定される複数の対話態度（通常対話パターン、変更話題対話パターン、無視対話パターン、及び拒絶対話パターン）の各選定確率を設定すると共に、予め準備された複数の猫のアニメ顔画像の中から特定のアニメ顔画像Ｒを１つ選択してキャラクターの顔画像として設定する（以上、対話事前ステップ）。

図１０に示すように、猫型会話ロボット１０を起動させて対話を行う場合、キャラクター表情処理部２４から特定のアニメ顔画像Ｒの顔画像合成データがディスプレイ１２に出力されディスプレイ１２にはキャラクターの顔画像が表示される。そして、ユーザの発話音声が音声入力処理部２０で受信されて発話音声ファイルが作成され、発話音声ファイルが音声認識処理手段１９に入力され発話文字ファイルに変換されて出力される（対話ステップ１）。
なお、図９に示すように、モニタ表示装置５８を制御装置１４の音声入力処理部２０に接続させると、発話文字ファイルをモニタ表示装置５８に表示させることができる。

出力された発話文字ファイルの入力を受けて、予め設定された複数の対話パターンの中から対話パターンＳが選定されて対話態度が決定され（対話ステップ２）、対話パターンＳに対応する応答文字ファイルＡ、Ｂ、無視文字ファイルＣ、及び拒絶文字ファイルＤのいずれか１が対話文字ファイルとして出力される（対話ステップ３）。出力された対話文字ファイルは音声出力処理部２３とキャラクター表情処理部２４にそれぞれ入力され、音声出力処理部２３からは対話文字ファイルから形成された音声データを変換した音声信号がスピーカ１３に出力され、キャラクター表情処理部２４からはキャラクターの感情を推定して感情に応じた顔表情データが作成され、顔画像合成データと組合せてキャラクターの対話時の顔表情を形成する画像表示データとしてディスプレイ１２に出力される（対話ステップ４）。これにより、スピーカ１３から発せられる対話音声と同期して、ディスプレイ１２に表示されるキャラクターの顔画像は対話時の顔表情を変化させることができる。
なお、図９に示すように、モニタ表示装置５８を制御装置１４の対話管理部２２にも接続させると、対話文字ファイルをモニタ表示装置５８に表示させることができる。

対話ステップ２における対話パターンＳの選定では、予め、複数の対話パターンとして、発話文字ファイルが有する話題に応答する対話態度を示す通常対話パターン（猫が従順性を示す場合）と、発話文字ファイルが有する話題とは別の話題で応答する対話態度を示す変更話題対話パターン（猫が意外性のある行動を示す場合）と、発話文字ファイルの入力により無応答となる対話態度を示す無視対話パターン（猫が強い自立性を示す場合）と、発話文字ファイルの入力により対話拒絶となる対話態度を示す拒絶対話パターン（猫が飼い主に対して威嚇的な態度を示す場合）を設定する。そして、通常対話パターン、変更話題対話パターン、無視対話パターン、及び拒絶対話パターンにそれぞれ猫の性格に基づいて選定確率を設定し、対話パターンＳを通常対話パターン、変更話題対話パターン、無視対話パターン、及び拒絶対話パターンの中から確率的に選定させることにより、猫の性格が自然に現れるようにする。

対話ステップ３では、図１１に示すように、通常対話パターンが選定された際は、発話文字ファイルが入力された対話応答処理手段３６から出力される複数の応答文字ファイルの中から選択した応答文字ファイルＡを対話文字ファイルとして出力させる。
変更話題対話パターンが選定された際は、発話文字ファイルが有する話題とは別の話題を有する別文字ファイルＷが文字ファイルデータベース３５の中から選択され、別文字ファイルＷが入力された対話応答処理手段３６から出力される複数の文字ファイルの中から選択した応答文字ファイルＢを対話文字ファイルとして出力させる。
無視対話パターンが選定された際は、文字ファイルデータベース３５の中から選択された対話無視に対応する無視文字ファイルＣを対話文字ファイルとして出力させる。
拒絶対話パターンが選定された際は、文字ファイルデータベース３５の中から選択された対話拒絶に対応する拒絶文字ファイルＤを対話文字ファイルとして出力させる。
これにより、猫の性格を具体的に発現させた対話を実現させることができる。

例えば、ユーザが「今日の天気を教えて」と発話すると、音声入力処理部２０において受信信号から発話音声ファイルが作成され、発話音声ファイルは情報通信回線２６を介して音声認識処理手段１９に入力される。そして、音声認識処理手段１９で作成された発話文字ファイルは情報通信回線２６を介して音声入力処理部２０に出力される。次いで、発話文字ファイルは音声入力処理部２０から対話管理部２２に入力される。

対話管理部２２では、発話文字ファイルが入力されたため応答対話系統２１が起動する。先ず、発話文字ファイル中に登録された特定文言が存在するか否かが判定される。「今日の天気を教えて」には特定文言が存在しないため、対話パターンの選定確率は、通常対話パターンが４０％、変更話題対話パターンが２５％、無視対話パターンが１５％、拒絶対話パターンが２０％となる。

ここで、対話パターンＳとして通常対話パターンが選定されると、発話文字ファイルが情報通信回線２６を介して対話応答処理手段３６に入力され、対話応答処理手段３６では発話文字ファイルが有する意図を解釈して、例えば、インターネットで天気検索を行い、天気検索結果を含んだ複数の応答文字ファイルを作成して情報通信回線２６を介して対話管理部２２に出力する。対話管理部２２では、受け取った複数の応答文字ファイルの中から発話文字ファイルの話題に関連する質問が含まれるもの、例えば、「晴れです。どこかにおでかけしませんか」が応答文字ファイルＡに選択され対話文字ファイルとなる。そして、対話管理部２２から音声出力処理部２３及びキャラクター表情処理部２４へは「晴れですにゃん。どこかにおでかけしませんかにゃん」として出力される。

音声出力処理部２３では、「晴れですにゃん。どこかにおでかけしませんかにゃん。」から対話音声ファイルを形成し、対話音声ファイルから作成した音声データを音声信号に変換しスピーカ１３に出力する。このとき、キャラクター表情処理部２４で対話文字ファイルから推定したキャラクターの感情が物欲しそうな感情である場合、この感情に応じた顔表情データが作成され、顔画像合成データと組合せてキャラクターの対話時の顔表情を形成する画像表示データとしてディスプレイ１２に出力される。これにより、スピーカ１３から発せられる「晴れですにゃん。どこかにおでかけしませんかにゃん。」という対話音声と同期して、ディスプレイ１２に表示されるキャラクターの顔表情を物欲しそうな表情にすることができる。

対話パターンＳとして変更話題対話パターンが選定された場合、発話文字ファイル（今日の天気を教えて）が有する話題とは別の話題の別文字ファイルＷが文字ファイルデータベース３５から選択され、別文字ファイルＷが入力された対話応答処理手段３６から出力される複数の応答文字ファイルから選択された応答文字ファイルＢが、例えば、「おなかが空いた」であると、対話文字ファイルは「おなかが空いた」となる。そして、対話管理部２２から音声出力処理部２３及びキャラクター表情処理部２４へは対話文字ファイルとして「おなかが空いたにゃん」が出力される。

音声出力処理部２３では、「おなかが空いたにゃん」から対話音声ファイルを形成し、対話音声ファイルから作成した音声データを音声信号に変換しスピーカ１３に出力する。このとき、キャラクター表情処理部２４で対話文字ファイルから推定したキャラクターの感情が不機嫌な感情である場合、この感情に応じた顔表情データが作成され、顔画像合成データと組合せてキャラクターの対話時の顔表情を形成する画像表示データとしてディスプレイ１２に出力される。これにより、スピーカ１３から発せられる「おなかが空いたにゃん」という対話音声と同期して、ディスプレイ１２に表示されるキャラクターの顔表情を不機嫌な表情にすることができる。

対話パターンＳとして無視対話パターンが選定された場合、文字ファイルデータベース３５から選択された対話無視に対応する無視文字ファイルＣが、例えば、「知らない」であると、対話文字ファイルは「知らない」となる。そして、対話管理部２２から音声出力処理部２３及びキャラクター表情処理部２４へは対話文字ファイルとして「知らないにゃん」が出力される。

音声出力処理部２３では、「知らないにゃん」から対話音声ファイルを形成し、対話音声ファイルから作成した音声データを音声信号に変換しスピーカ１３に出力する。このとき、キャラクター表情処理部２４で対話文字ファイルから推定したキャラクターの感情がめんどくさい感情である場合、この感情に応じた顔表情データが作成され、顔画像合成データと組合せてキャラクターの対話時の顔表情を形成する画像表示データとしてディスプレイ１２に出力される。これにより、スピーカ１３から発せられる「知らないにゃん」という対話音声と同期して、ディスプレイ１２に表示されるキャラクターの顔表情をめんどくさい表情にすることができる。

対話パターンＳとして拒絶対話パターンが選定された場合、文字ファイルデータベース３５から選択された対話拒絶に対応する拒絶文字ファイルＤが、例えば、「シャー、ミャーオ―ッ」であると、対話文字ファイルは「シャー、ミャーオ―ッ」となる。そして、対話管理部２２から音声出力処理部２３及びキャラクター表情処理部２４へは対話文字ファイルとして「シャー、ミャーオ―ッ」が出力される（「シャー」や「ミャーオ―ッ」は文でないため、語尾加工手段４１は作用しない）。

音声出力処理部２３では、「シャー、ミャーオ―ッ」から対話音声ファイルを形成し、対話音声ファイルから作成した音声データを音声信号に変換しスピーカ１３に出力する。このとき、キャラクター表情処理部２４に入力される対話文字ファイルからはキャラクターの感情を推定することができない。このため、「シャー、ミャーオ―ッ」を発する際の表情状態がキャラクターの顔表情データとなり、顔画像合成データと組合せてキャラクターの対話時の顔表情を形成する画像表示データとしてディスプレイ１２に出力される。これにより、スピーカ１３から発せられる「シャー、ミャーオ―ッ」という対話音声と同期して、ディスプレイ１２に表示されるキャラクターの顔表情を変化させることができる。

図１２に示すように、猫型会話ロボット１０において、複数の自発発話条件（例えば、生活パターンや要求行動）を自発発話条件設定手段４３に設定すると共に、自発発話条件毎に自発発話文字ファイルを予め設定し自発発話文字ファイルデータベース４５に格納しておく。
そして、猫型会話ロボット１０を起動させると、キャラクター表情処理部２４から特定のアニメ顔画像Ｒの顔画像合成データがディスプレイ１２に出力されディスプレイ１２にはキャラクターの顔画像が表示される（自発発話ステップ１）。

条件成立判定手段４４では複数の自発発話条件の中で条件成立の有無の確認が行われ（自発発話ステップ２）、自発発話条件が成立した自発発話条件に対応する自発発話文字ファイルが自発発話手段４６により自発発話文字ファイルデータベース４５から抽出され、対話文字ファイルとして出力される（自発発話ステップ３）。出力された対話文字ファイルは音声出力処理部２３とキャラクター表情処理部２４にそれぞれ入力され、音声出力処理部２３からは、対話文字ファイルを対話音声ファイルに変換して、対話音声ファイルから形成された音声データを変換した音声信号がスピーカ１３に出力され、キャラクター表情処理部２４からはキャラクターの感情を推定して感情に応じた顔表情データが作成され、顔画像合成データと組合せてキャラクターの対話時の顔表情を形成する画像表示データとしてディスプレイ１２に出力される（自発発話ステップ３）。
これにより、スピーカ１３から発せられる対話音声と同期して、ディスプレイ１２に表示されるキャラクターの顔画像は対話時の顔表情を変化させることができる。

自発発話条件を選定することで猫の性格の特徴付けを行うことができ、例えば、猫のすり寄りや甘えに対応するような対話を猫型会話ロボット１０に行わせることができる。
また、利用者情報データベース６１から種々の情報を取得して、猫型会話ロボット１０のユーザの好みや趣向に合致した話題に関する話しかけを猫型会話ロボット１０に行わせたり、猫型会話ロボット１０に何かを要求させる発言を行わせることができ、猫型会話ロボット１０との会話の機会や猫型会話ロボット１０の世話を行う機会を作ることができる。

図１３に示すように、本発明の第２の実施の形態に係る猫型会話ロボット６３は、第１の実施の形態に係る猫型会話ロボット１０と比較して、自発発話条件としてユーザの見守りを実行する見守り開始条件が更に設けられ、見守り開始条件に対して設定された自発発話文字ファイルが、ユーザの個人情報に基づいた特定質問を構成するものであって、制御装置６４には、音声入力処理部２０、対話管理部２２、音声出力処理部２３、キャラクター表情処理部２４に加えて、特定質問に対するユーザの回答の正誤を判定し、誤回答が生じた際に第１の異常信号を予め登録された関係者に出力する第１の警報部６５が設けられていることが特徴となっている。

更に、猫型会話ロボット６３は、第１の実施の形態に係る猫型会話ロボット１０と比較して、制御装置６４に、予め設定された時間帯で対話音声が発せられる度に対話音声が発せられてからマイクロフォン１１で発話音声が受信されるまでの待機時間を測定し、予め求めておいたユーザの基準待機時間と待機時間との偏差が設定した許容値を超える応答状態変化の発生有無を検知し、ユーザとの間で最初の対話が成立して以降の応答状態変化の発生の累積回数が予め設定した異常応答判定値に到達した際に第２の異常信号を出力する第２の警報部６６と、音声入力処理部２０から対話管理部２２に出力される発話文字ファイルの発話音声ファイルに対する確からしさを定量的に示す確信度を取得し、確信度が予め設定された異常確信度以下となる低確信度状態の発生有無を検知し、低確信度状態の発生の累積回数が予め設定した異常累積回数に到達した際に第３の異常信号を出力する第３の警報部６７が設けられていることが特徴となっている。
このため、猫型会話ロボット６３に関しては、猫型会話ロボット１０と同一の構成部及び構成手段には同一の符号を付して説明を省略し、第１〜第３の警報部６５〜６７についてのみ説明する。

図１４に示すように、第１の警報部６５は、見守り開始条件毎に設定された自発発話文字ファイル（特定質問）に対する正答情報を格納した回答情報格納手段６８と、自発発話系統４２に設けられた条件成立判定手段４４で成立が確認された見守り開始条件が成立した際に出力される条件成立信号を受けて起動し、成立が確認された見守り開始条件に対して設定された特定質問の正答情報を回答情報格納手段６８から取得し、ユーザの発話音声（特定質問に関する回答）の受信信号が音声入力処理部２０に入力されて作成された発話文字ファイルの内容と比較して正誤を確認する判定手段６９と、判定手段６９で誤回答と判定された際に第１の異常信号を関係者に出力する第１の異常出力手段７０とを有している。なお、第１の異常信号は、情報通信回線２６を介して関係者に出力される。

ユーザの見守りを実行する見守り開始条件は、例えば、猫型会話ロボット６３との対話が開始されてから（例えば、ユーザが起床する時間帯に設定する開始時刻から）対話が終了するまで（例えば、ユーザが就寝する時間帯に設定する終了時刻まで）の中で少なくとも１回発生するように設定する。
ユーザの個人情報に基づいた特定質問とは、例えば、ユーザの名前、生年月日、親、兄弟、又は子供の名前、予め確認し合った合言葉に関する質問であって予め複数準備され、見守り開始条件が成立した際に自発発話手段４４を介して任意に一つ抽出される。ユーザにとっては特定質問は容易に正答できる内容であるため、通常は正答率は１００％となる。従って、特定質問に対して誤回答が発生すれば、関係者は第１の異常信号を受け取ることになりユーザの体調変化（早期の異常）に気付くことができ、適切な処置をユーザに行うことが可能になる。

図１４に示すように、第２の警報部６６は、音声出力処理部２３から対話音声の音声信号が出力された際の出力時刻と、対話音声に応答したユーザの発話音声の受信信号が音声入力処理部２０に入力された際の入力時刻をそれぞれ検出し、入力時刻と出力時刻の時間差を求めて待機時間とする待機時間検出手段７１を有している。更に、第２の警報部６６は、平常状態のユーザの待機時間を予め複数回測定して待機時間分布を求め、待機時間の平均値と標準偏差σをそれぞれ算出し、待機時間の平均値を基準待機時間、標準偏差σの３倍の値（３σ）を許容値として格納する基準データ形成手段７２と、待機時間検出手段７１から得られる待機時間と基準データ形成手段７２から取得した基準待機時間との偏差を算出し、得られた偏差が許容値を超える応答状態変化の発生有無を検知して応答状態変化の発生の累積回数を求め、ユーザとの間で最初の対話が成立して以降の累積回数を求め、累積回数が設定した異常応答判定値に到達した際に第２の異常信号を関係者に出力する第２の異常出力手段７３とを有している。なお、第２の異常信号は、情報通信回線２６を介して関係者に出力される。

ユーザがロボット側から話しかけられて応答するまでの待機時間は、対話の内容によっても変化するので、平常状態のユーザと種々の内容の対話を行って求めた待機時間分布は、平常状態のユーザの応答状態を定量的に評価する基準になると考えられる。なお、待機時間分布を構成している各待機時間は、基準待機時間−３σを下限値とし、基準待機時間＋３σを上限値とする範囲にほぼ存在する。従って、待機時間検出手段７１から得られる待機時間から求めた偏差が、基準待機時間−３σ〜基準待機時間＋３σの範囲に存在すれば、ユーザに異常は生じていないと判定される。一方、偏差が基準待機時間−３σ〜基準待機時間＋３σの範囲外に存在すれば、ユーザに異常が生じていると判定されて第２の異常信号が出力され、関係者は第２の異常信号を受け取ることにより、ユーザに異常な対話応答状態が生じていること、即ち、ユーザに体調の変化（異常）が生じていることに気付くことができ、適切な処置をユーザに行うことが可能になる。
なお、ユーザに異常が生じた場合、ユーザの対話応答状態は低下状態になっているため、待機時間検出手段７１から得られる待機時間が長くなって、偏差は基準待機時間＋３σを超えることになる。

図１４に示すように、第３の警報部６７は、音声入力処理部２０より対話管理部２２に出力された発話文字ファイルが有する確信度を音声入力処理部２０から取得する確信度取得手段７４を有している。更に、第３の警報部６７は、平常状態のユーザの種々の発話音声ファイル（発話音声）に対して音声入力処理部２０（音声認識処理手段１９）で評価される確信度を予め求め、得られた確信度から確信度の分布を作成して最小値を求めて、最小値より小さい値を異常確信度として設定し保存する異常確信度設定手段７５と、確信度取得手段７４を介して得られる確信度と異常確信度設定手段７５から取得した異常確信度を比較し、確信度が異常確信度以下となる低確信度状態の発生有無を検知して低確信度状態の発生の累積回数を求め、累積回数が異常累積回数に到達した際に第３の異常信号を関係者に出力する第３の異常出力手段７６とを有している。
ここで、最小値より小さい値には、例えば、確信度の分布を複数求めて、各確信度の分布が有する最小値を抽出し、抽出された最小値から構成される最小値分布を求めて、得られた最小値分布から推定される推定最小値を用いることができる。なお、第３の異常信号は、情報通信回線２６を介して関係者に出力される。

音声入力処理部２０での発話文字ファイルの作成方法を固定すると、同一の発話音声ファイル（発話音声）に対しては常に同一の確信度で同一の発話文字ファイルが得られるので、平常状態のユーザが猫型会話ロボット６３と対話する場合、ユーザの発話音声から発話文字ファイルが作成される際の確信度は、異常確信度設定手段７５で作成された確信度の分布の範囲内に存在し、常に異常確信度を超える値となる。
一方、ユーザに異常が発生するとユーザの対話状態に変化が生じるため、ユーザの発話音声から発話文字ファイルが作成される際の確信度が低下し、異常確信度以下となる低確信度状態が発生することになる。そして、ユーザに生じた低確信度状態の発生の累積回数が異常累積回数に達すると第３の異常出力手段７６から第３の異常信号が関係者に出力され、関係者は第３の異常信号を受け取ることによりユーザの体調変化（早期の異常）に気付くことができ、適切な処置をユーザに行うことが可能になる。

以上、本発明を、実施の形態を参照して説明してきたが、本発明は何ら上記した実施の形態に記載した構成に限定されるものではなく、特許請求の範囲に記載されている事項の範囲内で考えられるその他の実施の形態や変形例も含むものである。
更に、本実施の形態とその他の実施の形態や変形例にそれぞれ含まれる構成要素を組合せたものも、本発明に含まれる。
なお、本発明の第２の実施の形態に係る猫型会話ロボットでは、第１〜第３の警報部を設けたが、第１〜第３の警報部のいずれか１、又は任意の２つの組合せを設けてもよい。

１０：猫型会話ロボット、１１：マイクロフォン、１２：ディスプレイ、１３：スピーカ、１４：制御装置、１５：カメラ、１６：表示位置調整部、１７：修正データ演算器、１８：可動保持台、１９：音声認識処理手段、２０：音声入力処理部、２１：応答対話系統、２２：対話管理部、２３：音声出力処理部、２４：キャラクター表情処理部、２５：音声検出手段、２６：情報通信回線、２７：送信手段、２８：受信手段、２９：特定文言登録手段、３０：特定文言判定手段、３１：猫の特性登録手段、３２：選定確率登録手段、３３：選定確率取得手段、３４：対話パターン選定手段、３５：文字ファイルデータベース、３６：対話応答処理手段、３７：通常型対話手段、３８：変更話題型対話手段、３９：無視型対話手段、４０：拒絶型対話手段、４１：語尾加工手段、４２：自発発話系統、４３：自発発話条件設定手段、４４：条件成立判定手段、４５：自発発話文字ファイルデータベース、４６：自発発話手段、４７：対話文字ファイルデータベース、４８：対話文字ファイル抽出手段、４９：音声合成手段、５０：音声変換手段、５１：顔画像データベース、５２：顔画像選択手段、５３：画像合成手段、５４：感情推定手段、５５：画像表示手段、５６：カメラ、５７：カメラ装置、５８：モニタ表示装置、５９：人感センサ、６０：人感センサ装置、６１：利用者情報データベース、６２：表示装置、６３：猫型会話ロボット、６４：制御装置、６５：第１の警報部、６６：第２の警報部、６７：第３の警報部、６８：回答情報格納手段、６９：判定手段、７０：第１の異常出力手段、７１：待機時間検出手段、７２：基準データ形成手段、７３：第２の異常出力手段、７４：確信度取得手段、７５：異常確信度取得手段、７６：第３の異常出力手段

前記目的に沿う本発明に係る猫型会話ロボットは、疑似的にペットのような自我を持ち、発話者の発話音声を受信する度に対話態度を変化させる猫の性格を持つ猫型会話ロボットであって、
前記発話音声を受信して受信信号を出力する音声入力手段と、
ロボット側の対話者として設定されたキャラクターの対話時の顔画像を表示する表示手段と、
前記発話者に対して対話音声を発生する音声出力手段と、
前記受信信号を受けて設定される前記対話態度に基づく前記対話音声を形成する音声データを作成して前記音声出力手段に入力しながら、前記キャラクターの顔画像の表情を対話時に変化させる画像表示データを作成して前記表示手段に入力する制御装置とを有し、
該制御装置は、
（１）前記音声入力手段から出力される前記受信信号を発話音声ファイルに変換し、該発話音声ファイルから発話文字ファイルを作成して出力する音声入力処理部と、
（２）前記発話文字ファイルの入力を受けて前記対話音声の基となる対話文字ファイルを作成して出力する対話管理部と、
（３）前記対話文字ファイルの入力を受けて該対話文字ファイルから前記音声データを形成し音声信号に変換して前記音声出力手段に入力する音声出力処理部と、
（４）前記キャラクターの顔画像を形成する顔画像合成データと、前記対話文字ファイルの入力を受けて該対話文字ファイルから前記キャラクターの感情を推定し、該感情に応じた表情を形成する顔表情データをそれぞれ作成し、該顔画像合成データと該顔表情データを組合せて前記画像表示データとして前記表示手段に入力するキャラクター表情処理部
とを有し、
前記対話管理部は、前記発話文字ファイルが入力される度に、予め設定された複数の対話パターンの中から前記対話態度として対話パターンＳを任意に選定し、該対話パターンＳに対応する前記対話文字ファイルを出力する応答対話系統と、自発発話系統とを有し、
該自発発話系統には、
（１）前記発話者の趣味、猫独自の行動を織り込んだ生活パターン、及び前記発話者が応答することを意識した該猫型会話ロボットの要求行動のいずれか１以上を含む自発発話条件を予め設定する自発発話条件設定手段と、
（２）該自発発話条件設定手段で設定された前記自発発話条件が成立した際に条件成立信号を出力する条件成立判定手段と、
（３）前記条件成立信号を受けて、該条件成立信号に対応する前記自発発話条件に設定された自発発話文字ファイルを前記対話文字ファイルとして出力する自発発話手段
とが設けられ、
前記自発発話条件設定手段には、前記自発発話条件として前記発話者の見守りを実行する見守り開始条件が更に設けられ、該見守り開始条件は、前記発話者が起床する時間帯に設定する開始時刻から前記発話者が就寝する時間帯に設定する終了時刻までの中で少なくとも１回発生するように設定され、該見守り開始条件に対して設定された前記自発発話文字ファイルは前記発話者の個人情報に基づいた特定質問を構成するものである。
このような構成とすることで、制御装置を構成する各処理部毎にメンテナンスや更新を行うことができる。
発話音声から作成される発話文字ファイルが対話管理部に入力される度に、対話管理部の応答対話系統では対話態度として対話パターンＳが選定されるので、猫型会話ロボットは発話音声を受信する度に対話態度を変化させた応答を行うことができる。
自発発話手段を設けることにより、発話者からの発話に猫型会話ロボットが答えるという一方的な会話から双方向（発話者から猫型会話ロボットへの発話、猫型会話ロボットから発話者への発話）の会話が可能になる。また、猫が飼い主に対してすり寄ったり甘えたりするように、猫型会話ロボットから発話者に対して話しかけを行わせることや、猫が一人遊びを行うように、猫型会話ロボットに独り言を言わせることができる。
ここで、猫型会話ロボットから発話者に対する話しかけの頻度や、猫型会話ロボットが独り言を言う頻度は、自発発話条件により決めることができる。また、猫型会話ロボットが発話者に対して話しかける話題や独り言の話題は、自発発話文字ファイルにより設定することができる。
ここで、発話者の個人情報に基づいた特定質問は、例えば、発話者の名前、生年月日、親、兄弟、又は子供の名前、予め確認し合った合言葉等のように、発話者にとっては容易に正答でき、第３者にとっては正答することが困難となる質問である。従って、発話者の正答率は通常では１００％であり、誤回答が生じることは発話者に体調の変化（異常）が生じている可能性が高いことを示している。

本発明に係る猫型会話ロボットにおいて、前記音声入力処理部は、前記受信信号から前記発話音声ファイルを作成する音声検出手段と、該発話音声ファイルから前記発話文字ファイルを作成し出力する音声認識処理手段とを有し、
前記音声認識処理手段及び前記対話応答処理手段はクラウド上にそれぞれ設けられ、前記発話音声ファイルの前記音声認識処理手段への入力、該音声認識処理手段からの前記発話文字ファイルの出力、該発話文字ファイル及び前記別文字ファイルＷの前記対話応答処理手段への入力、該対話応答処理手段から前記通常型対話手段及び前記変更話題型対話手段への前記応答文字ファイルの出力はそれぞれ情報通信回線を介して行ことが好ましい。

本発明に係る猫型会話ロボットにおいて、前記制御装置には、前記特定質問に対する前記発話者の回答の正誤を判定し、誤回答が生じた際に第１の異常信号を出力する第１の警報部が設けられていることが好ましい。

制御装置の対話管理部に自発発話手段を設けたので、発話者と猫型会話ロボットとの間で双方向の会話（発話者から猫型会話ロボットへの発話から始まる会話、猫型会話ロボットから発話者への発話から始まる会話）を成立させることができ、会話の機会を向上させることが可能になる。その結果、猫型会話ロボットと発話者が永く付き合う状況を形成することができ、例えば、話し相手がいないという孤独感の解消や、猫型会話ロボット（機械）と付き合うというストレスの軽減を図ることが可能になる。
また、制御装置に、第１〜第３の警報部のいずれか１又は２以上を設けた場合、発話者が猫型会話ロボットとの対話の中で、発話者に通常とは違う軽度の異常状態が生じていることを早期に発見することができ、発話者の安心及び安全のレベルを高めることが可能になる。

更に、応答対話系統２１には、対話パターンＳに無視対話パターンが選定されたことを受けて起動し、文字ファイルデータベース３５に格納された複数の無視文字ファイルの中から無視文字ファイルＣを選択し対話文字ファイルとして出力する無視型対話手段３９と、対話パターンＳに拒絶対話パターンが選定されたことを受けて起動し、文字ファイルデータベース３５に格納された複数の拒絶文字ファイルの中から拒絶文字ファイルＤを選択し対話文字ファイルとして出力する拒絶型対話手段４０が設けられている。
そして、通常型対話手段３７、変更話題型対話手段３８、無視型対話手段３９、及び拒絶型対話手段４０からそれぞれ出力される対話文字ファイルに含まれる文は、図５に示すように、文の語尾に「にゃん」を付加する語尾加工を施す語尾加工手段４１を介して音声出力処理部２３に出力される。

図５に示すように、対話管理部２２は、更に自発発話系統４２を有している。そして、図６に示すように、自発発話系統４２には、ユーザが感心の高い趣味、猫独自の行動を織り込んだ生活パターン、及びユーザが応答することを意識した猫型会話ロボット１０（猫）の要求行動等の自発発話条件を設定する自発発話条件設定手段４３と、自発発話条件が成立したか否かを判定し、条件が成立した際に条件成立信号を出力する条件成立判定手段４４が設けられている。
また、自発発話系統４２には、条件成立信号を受けて（自発発話条件が成立した際に）、条件成立信号に対応する自発発話条件に設定された自発発話文字ファイルを予め登録させて格納する自発発話文字ファイルデータベース４５と、条件成立判定手段４４が自発発話条件が成立したと判定した際に、自発発話系統４２に設けられた自発発話文字ファイルデータベース４５から該当する自発発話文字ファイルを抽出し対話文字ファイルとして出力する自発発話手段４６が設けられている。なお、自発発話手段４６から出力される対話文字ファイルに含まれる文は、図５に示すように、文の語尾に「にゃん」を付加する語尾加工を施す語尾加工手段４１を介して音声出力処理部２３に出力される。

ユーザの見守りを実行する見守り開始条件は、例えば、猫型会話ロボット６３との対話が開始されてから（例えば、ユーザが起床する時間帯に設定する開始時刻から）対話が終了するまで（例えば、ユーザが就寝する時間帯に設定する終了時刻まで）の中で少なくとも１回発生するように設定する。
ユーザの個人情報に基づいた特定質問とは、例えば、ユーザの名前、生年月日、親、兄弟、又は子供の名前、予め確認し合った合言葉に関する質問であって予め複数準備され、見守り開始条件が成立した際に自発発話手段４６を介して任意に一つ抽出される。ユーザにとっては特定質問は容易に正答できる内容であるため、通常は正答率は１００％となる。従って、特定質問に対して誤回答が発生すれば、関係者は第１の異常信号を受け取ることになりユーザの体調変化（早期の異常）に気付くことができ、適切な処置をユーザに行うことが可能になる。

Claims

疑似的な自我を持ち、発話者の発話音声を受信する度に対話態度を変化させる猫の性格を持つ猫型会話ロボットであって、
前記発話音声を受信して受信信号を出力する音声入力手段と、
ロボット側の対話者として設定されたキャラクターの対話時の顔画像を表示する表示手段と、
前記発話者に対して対話音声を発生する音声出力手段と、
前記受信信号を受けて設定される前記対話態度に基づく前記対話音声を形成する音声データを作成して前記音声出力手段に入力しながら、前記キャラクターの顔画像の表情を対話時に変化させる画像表示データを作成して前記表示手段に入力する制御装置とを有することを特徴とする猫型会話ロボット。
請求項１記載の猫型会話ロボットにおいて、更に、前記発話者を撮影する撮像手段を有し、前記制御装置には、前記撮像手段で得られた前記発話者の画像を用いて、前記表示手段の表示面の方向を調節し、該表示面に表示された前記キャラクターの顔画像を前記発話者に対向させる表示位置調整部が設けられていることを特徴とする猫型会話ロボット。
請求項１又は２記載の猫型会話ロボットにおいて、前記キャラクターの顔画像は猫のアニメ顔画像であることを特徴とする猫型会話ロボット。
請求項１〜３のいずれか１項に記載の猫型会話ロボットにおいて、前記制御装置は、
（１）前記音声入力手段から出力される前記受信信号を発話音声ファイルに変換し、該発話音声ファイルから発話文字ファイルを作成して出力する音声入力処理部と、
（２）前記発話文字ファイルの入力を受けて前記対話音声の基となる対話文字ファイルを作成して出力する対話管理部と、
（３）前記対話文字ファイルの入力を受けて該対話文字ファイルから前記音声データを形成し音声信号に変換して前記音声出力手段に入力する音声出力処理部と、
（４）前記キャラクターの顔画像を形成する顔画像合成データと、前記対話文字ファイルの入力を受けて該対話文字ファイルから前記キャラクターの感情を推定し、該感情に応じた表情を形成する顔表情データをそれぞれ作成し、該顔画像合成データと該顔表情データを組合せて前記画像表示データとして前記表示手段に入力するキャラクター表情処理部
とを有することを特徴とする猫型会話ロボット。
請求項４記載の猫型会話ロボットにおいて、前記対話管理部には、前記発話文字ファイルが入力される度に、予め設定された複数の対話パターンの中から前記対話態度として対話パターンＳを任意に選定し、該対話パターンＳに対応する前記対話文字ファイルを出力する応答対話系統が設けられていることを特徴とする猫型会話ロボット。
請求項５記載の猫型会話ロボットにおいて、前記複数の対話パターンは、
（１）前記発話文字ファイルが有する話題に応答する前記対話態度を示す通常対話パターンと、
（２）前記発話文字ファイルが有する話題とは別の話題で応答する前記対話態度を示す変更話題対話パターンと、
（３）前記発話文字ファイルの入力に対し無応答となる前記対話態度を示す無視対話パターンと、
（４）前記発話文字ファイルの入力に対し対話拒絶となる前記対話態度を示す拒絶対話パターン
とを有することを特徴とする猫型会話ロボット。
請求項６記載の猫型会話ロボットにおいて、前記通常対話パターン、前記変更話題対話パターン、前記無視対話パターン、及び前記拒絶対話パターンに対してそれぞれ猫の性格に基づいた選定確率が予め設定されていることを特徴とする猫型会話ロボット。
請求項７記載の猫型会話ロボットにおいて、前記発話文字ファイルには予め登録された特定文言が存在し、該特定文言が存在する該発話文字ファイルが入力された際は、前記通常対話パターンの前記選定確率が５０％より高く設定されることを特徴とする猫型会話ロボット。
請求項８記載の猫型会話ロボットにおいて、前記応答対話系統には、
（１）入力された前記発話文字ファイルが有する話題とは別の話題を有する複数の別文字ファイル、対話無視に対応する複数の無視文字ファイル、及び対話拒絶に対応する複数の拒絶文字ファイルをそれぞれ格納し、要求に応じて出力する文字ファイルデータベースと、
（２）前記発話文字ファイル及び前記別文字ファイルの入力によりそれぞれ複数の応答文字ファイルを作成して出力する対話応答処理手段と、
（３）前記発話文字ファイルの入力により前記対話応答処理手段から出力された前記複数の応答文字ファイルの中から応答文字ファイルＡを選択し前記対話文字ファイルとして出力する通常型対話手段と、
（４）前記文字ファイルデータベースに格納された前記複数の別文字ファイルの中から別文字ファイルＷを選択して前記対話応答処理手段に入力し、該対話応答処理手段から出力された前記複数の応答文字ファイルの中から応答文字ファイルＢを選択し前記対話文字ファイルとして出力する変更話題型対話手段と、
（５）前記文字ファイルデータベースに格納された前記複数の無視文字ファイルの中から無視文字ファイルＣを選択し前記対話文字ファイルとして出力する無視型対話手段と、
（６）前記文字ファイルデータベースに格納された前記複数の拒絶文字ファイルの中から拒絶文字ファイルＤを選択し前記対話文字ファイルとして出力する拒絶型対話手段
とが設けられていることを特徴とする猫型会話ロボット。
請求項９記載の猫型会話ロボットにおいて、前記音声入力処理部は、前記受信信号から前記発話音声ファイルを作成する音声検出手段と、該発話音声ファイルから前記発話文字ファイルを作成し出力する音声認識処理手段とを有し、
前記音声認識処理手段及び前記対話応答処理手段はクラウド上にそれぞれ設けられ、前記発話音声ファイルの前記音声認識処理手段への入力、該音声認識処理手段からの前記発話文字ファイルの出力、該発話文字ファイル及び前記別文字ファイルＷの前記対話応答処理手段への入力、該対話応答処理手段から前記通常型対話手段及び前記変更話題型対話手段への前記応答文字ファイルの出力はそれぞれ情報通信回線を介して行われることを特徴とする猫型会話ロボット。
請求項１０記載の猫型会話ロボットにおいて、前記応答文字ファイルＡには前記発話文字ファイルの話題に関連する質問が含まれることを特徴とする猫型会話ロボット。
請求項５〜１１のいずれか１項に記載の猫型会話ロボットにおいて、前記対話管理部は、更に自発発話系統を有し、前記自発発話系統には、
（１）前記発話者の趣味、猫独自の行動を折り込んだ生活パターン、及び前記発話者が応答することを意識した該猫型会話ロボットの要求行動のいずれか１以上を含む自発発話条件を予め設定する自発発話条件設定手段と、
（２）該自発発話条件設定手段で設定された前記自発発話条件が成立した際に条件成立信号を出力する条件成立判定手段と、
（３）前記条件成立信号を受けて、該条件成立信号に対応する前記自発発話条件に設定された自発発話文字ファイルを前記対話文字ファイルとして出力する自発発話手段
とが設けられていることを特徴とする猫型会話ロボット。
請求項１２記載の猫型会話ロボットにおいて、前記自発発話条件は前記発話者の見守りを実行する見守り開始条件であって、前記自発発話文字ファイルは前記発話者の個人情報に基づいた特定質問を構成するものであり、
前記制御装置には、前記特定質問に対する前記発話者の回答の正誤を判定し、誤回答が生じた際に第１の異常信号を出力する第１の警報部が設けられていることを特徴とする猫型会話ロボット。
請求項１２又は１３記載の猫型会話ロボットにおいて、前記自発発話文字ファイルは、前記自発発話条件毎に予め作成され、前記自発発話系統に設けられた自発発話文字ファイルデータベースに格納されていることを特徴とする猫型会話ロボット。
請求項４〜１４のいずれか１項に記載の猫型会話ロボットにおいて、前記対話文字ファイルに含まれる文は、該文の語尾に「にゃん」を付加する語尾加工を施す語尾加工手段を介して前記音声出力処理部に出力されることを特徴とする猫型会話ロボット。
請求項４〜１５のいずれか１項に記載の猫型会話ロボットにおいて、前記制御装置には、予め設定された時間帯で前記対話音声が発せられる度に該対話音声が発せられてから前記音声入力手段で前記発話音声が受信されるまでの待機時間を測定し、予め求めておいた前記発話者の基準待機時間と該待機時間との偏差が設定した許容値を超える応答状態変化の発生有無を検知し、前記発話者との間で最初の対話が成立して以降の該応答状態変化の発生の累積回数が予め設定した異常応答判定値に到達した際に第２の異常信号を出力する第２の警報部が設けられていることを特徴とする猫型会話ロボット。
請求項４〜１６のいずれか１項に記載の猫型会話ロボットにおいて、前記制御装置には、前記音声入力処理部から前記対話管理部に出力される前記発話文字ファイルの前記発話音声ファイルに対する確からしさを定量的に示す確信度を取得し、該確信度が予め設定された異常確信度以下となる低確信度状態の発生有無を検知し、該低確信度状態の発生の累積回数が予め設定した異常累積回数に到達した際に第３の異常信号を出力する第３の警報部が設けられていることを特徴とする猫型会話ロボット。