JPWO2004027527A1

JPWO2004027527A1 - 対話型装置

Info

Publication number: JPWO2004027527A1
Application number: JP2004538008A
Authority: JP
Inventors: 山本　真一; 真一山本; 山本　浩司; 浩司山本
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2002-09-20
Filing date: 2003-09-19
Publication date: 2006-01-19
Also published as: WO2004027527A1; CN1701287A; US20060100880A1; EP1542101A1

Abstract

生体センサを人体に装着することなく、ユーザの健康状態に応じた行動パターンを決定することが可能な対話型装置１を提供する。対話型装置１は、ユーザの健康状態を把握する把握手段５０ｂと、ユーザの健康状態に応じた行動パターンを決定する行動パターン決定手段５０ｃと、その行動パターンの実行を指示する実行指示手段５０ｇと、その行動パターンの実行を指示する前に、その行動パターンをユーザに音声で提案する提案手段５０ｅと、提案された行動パターンに対するユーザの返事が提案された行動パターンを受け入れるという返事か否かを判定する提案承諾判定手段５０ｆとを備えている。実行指示手段５０ｇは、ユーザの返事が提案された行動パターンを受け入れるという返事であると判定された場合に、提案された行動パターンの実行を指示する。

Description

本発明は、ユーザとの対話を行うことが可能な対話型装置に関する。

生態情報を監視して逐次居住者の好みのオーディオ信号を当該居住者の現在の生活状態及び体調に応じたレベルに調整して再生する音響装置が開示されている（例えば、特許文献１を参照）。この音響装置は、部屋に設置されたセンサによって居住者の生活状態を把握し、居住者が装着する携帯送受信機（生体センサを含む）からの識別情報、生態情報を監視して逐次居住者の好みのオーディオ信号を当該居住者の現在の生活状態及び体調に応じたレベルに調整して再生する。
特許文献１：特開平１１−２２１１９６号公報
しかし、上記特許文献１に記載の従来技術では、生体情報などを取得するために居住者は携帯送受信機を装着する必要があり、居住者にとって装着の煩わしさのため大変不便であるとともに、部屋に設置されたセンサによって居住者は生活を常々監視されていることになり、不快な思いをするといった課題があった。
本発明は、生体センサを人体に装着することなく、ユーザの健康状態に応じた行動パターンを決定することが可能な対話型装置を提供することを目的とする。

本発明の対話型装置は、ユーザの健康状態を把握する把握手段と、前記把握手段によって把握された前記ユーザの健康状態に応じた行動パターンを決定する決定手段と、前記決定手段によって決定された行動パターンの実行を指示する実行指示手段と、前記決定手段によって決定された行動パターンの実行を指示する前に、前記ユーザに前記行動パターンを音声で提案する提案手段と、前記提案された行動パターンに対する前記ユーザの返事が前記提案された行動パターンを受け入れるという返事か否かを判定する判定手段とを備え、前記実行指示手段は、前記ユーザの返事が前記提案された行動パターンを受け入れるという返事であると判定された場合に、前記提案された行動パターンの実行を指示し、これにより上記目的が達成される。
前記把握手段は、前記ユーザの発話に基づいて前記ユーザの健康状態を把握してもよい。
前記把握手段は、前記ユーザが発するキーワードに基づいて前記ユーザの健康状態を把握してもよい。
前記決定手段によって決定された行動パターンの実行を指示する前に、前記ユーザに前記行動パターンを提案する必要があるか否かを判定する提案要否判定手段をさらに備え、前記提案手段は、前記行動パターンの実行を指示する前に前記ユーザに前記行動パターンを提案する必要があると判定された場合に、前記ユーザに前記行動パターンを音声で提案してもよい。
前記提案要否判定手段は、前記行動パターンに予め割り当てられた提案の要否を示すフラグの値に応じて提案の要否を判定してもよい。
前記提案要否判定手段は、前記行動パターンが実行された実行回数の時間分布に基づいて提案の要否を判定してもよい。
前記決定手段は、優先順位がそれぞれ割り当てられた複数の行動パターンのうちの１つを前記ユーザの健康状態に応じた行動パターンとして決定し、その行動パターンが前記ユーザに受け入れられたか否かに応じて、その行動パターンに割り当てられた優先順位を変動させてもよい。
前記ユーザの健康状態に応じた行動パターンを記憶する記憶手段をさらに備え、前記決定手段は、前記記憶手段に記憶された行動パターンを用いて前記行動パターンを決定してもよい。
前記提案手段によって前記ユーザに提案される行動パターンは、再生機器で再生するコンテンツの選択を含んでもよい。
前記コンテンツは、音声データと映像データと照明制御データとを含み、前記再生機器が照明制御データに基づいて照明装置の光量および光色の少なくとも一方を変化させてもよい。
前記対話型装置は、エージェント機能および移動機能のうちの少なくとも１つの機能を有していてもよい。
前記ユーザの健康状態は、前記ユーザの感情および前記ユーザの体調のうちの少なくとも一方を表してもよい。
本発明の対話型装置は、ユーザが発する音声を音声信号に変換する音声入力部と、前記音声入力部から出力される音声信号に基づいてユーザが発した言葉を認識する音声認識部と、前記ユーザが発すると予想される言葉が予め登録され、前記登録されている言葉と前記ユーザの健康状態との対応関係を保持している対話データベースと、前記音声認識部によって認識された言葉と前記対話データベースに登録されている言葉とを照合し、その照合結果に応じて前記ユーザの健康状態を決定することによって、前記ユーザの健康状態を把握する把握手段と、前記ユーザの健康状態と対話型装置の行動パターンとの対応関係を保持している行動パターンテーブルに基づいて、前記把握手段によって把握された前記ユーザの健康状態に応じた行動パターンを決定する決定手段と、前記決定手段によって決定された行動パターンの実行を指示する実行指示手段と、前記決定手段によって決定された行動パターンの実行を指示する前に、前記把握手段の出力結果と前記決定手段の出力結果とに基づいて提案文を合成し、前記ユーザに前記行動パターンを音声で提案する提案手段と、前記提案された行動パターンに対する前記ユーザの返事が前記提案された行動パターンを受け入れるという返事か否かを判定する判定手段とを備え、前記実行指示手段は、前記ユーザの返事が前記提案された行動パターンを受け入れるという返事であると判定された場合に、前記提案された行動パターンの実行を指示し、これにより上記目的が達成される。
前記提案された行動パターンに対して前記ユーザから逆提案された行動パターンを受け取る手段と、前記逆提案された行動パターンを前記対話型装置が実行可能であるか否かを判定する手段と、前記逆提案された行動パターンを前記対話型装置が実行可能であると判定された場合に、前記行動パターンテーブルに保持されている前記ユーザの健康状態と前記対話型装置の行動パターンとの対応関係を更新する手段とをさらに備えていてもよい。

図１は、本発明の対話型装置の一例としてのロボット１の外観を示す図である。
図２は、ロボット１の内部構成の一例を示す図である。
図３は、対話データベース１４０に格納されているユーザが発するキーワードとユーザの健康状態との関係の一例を示す図である。
図４は、情報データベース１６０に格納されているユーザの健康状態とロボット１の行動パターンとの関係の一例を示す図である。
図５は、ロボット１がユーザの健康状態を把握し、ユーザの健康状態に適合した行動パターンの実行を指示する処理の手順の一例を示すフローチャートである。
図６は、音声データおよび／または映像データと照明制御データとの同期再生を可能にする再生装置２１００の構成の一例を示す図である。
図７は、音声認識部４０の内部構成の一例を示す図である。
図８ａは、図２に示される処理部５０の内部構成の一例を示す図である。
図８ｂは、図２に示される処理部５０の内部構成の他の例を示す図である。
図８ｃは、図２の処理部５０の内部構成の他の例を示す図である。
図９は、提案手段５０ｅによる提案文の作成方法の一例を説明するための図である。
図１０は、提案要否判定手段５０ｄの内部構成の一例を示す図である。
図１１は、行動提案要否テーブル１６２の構造の一例を示す図である。

以下、図面を参照しながら本発明の実施の形態を説明する。
本明細書では、「ユーザの健康状態」とは、ユーザの感情およびユーザの体調のうちの少なくとも一方を表すものとする。「ユーザ」とは、対話型装置の所有者をいうものとする。
図１は、本発明の対話型装置の一例としてのロボット１の外観を示す。ロボット１は、ユーザと対話を行うことが可能なように構成されている。
図１に示されるロボット１は、「目」に相当するカメラ１０と、「口」に相当するスピーカ１１０およびアンテナ６２と、「耳」に相当するマイク３０およびアンテナ６２と、「首」や「腕」に相当する可動部１８０とを有している。
ロボット１は、自らが移動することを可能にする移動部１６０を有する自律走行型ロボット（移動式ロボット）であってもよいし、自らが移動することができないタイプのものであってもよい。
ロボット１が移動することを可能にするメカニズムとしては任意のメカニズムを採用することができる。例えば、ロボット１は、手足に設置されたローラの回転を制御することによって前進、後退するように構成されていてもよいし、タイヤ式や脚式などの移動式ロボットでもよい。ロボット１は、人のような二足直立歩行を行う動物を模倣した人間型ロボットでもよいし、４足歩行の動物を模倣したペット型ロボットでもよい。
なお、対話型装置の一例として、対話型のロボットを説明したが、対話型装置はこれに限定されない。対話型装置は、ユーザと対話を行うことが可能なように構成された任意の装置であり得る。対話型装置は、例えば、対話型の玩具であってもよいし、対話型携帯機器（携帯電話を含む）であってもよいし、対話型のエージェントであってもよい。
対話型のエージェントは、インターネットのような情報空間を動き回り、情報検索、フィルタリング、スケジュール調整などの情報処理を人間の代わりに行ってくれる機能（ソフトウェアエージェントの機能）を有していることが好ましい。対話型のエージェントはあたかも人間であるかのように人間と対話をするため、擬人化エージェントと呼ばれることもある。
対話型装置は、エージェント機能および移動機能のうちの少なくとも１つの機能を有していてもよい。
図２は、ロボット１の内部構成の一例を示す。
画像認識部２０は、カメラ１０（画像入力部）から画像を取り込み、その取り込んだ画像を認識し、その認識結果を処理部５０に出力する。
音声認識部４０は、マイク３０（音声入力部）から音声を取り込み、その取り込んだ音声を認識し、その認識結果を処理部５０に出力する。
図７は、音声認識部４０の内部構成の一例を示す。
音声入力部３０（マイク）によって、音声が音声信号波形に変換される。音声信号波形は、音声認識部４０に出力される。音声認識部４０は、音声検出手段７１と、比較演算手段７２と、認識手段７３と、登録音声データベース７４とを含む。
音声検出手段７１は、音声入力部３０から入力された音声信号波形が一定基準を満たす波形部分を実際にユーザが発声した音声区間として切り出し、その区間の音声信号波形を音声波形として比較演算手段７２に出力する。ここで、音声区間を切り出す一定基準とは、例えば、一般的に人間の音声帯域である１ｋＨｚ以下の周波数帯域における信号波形のパワーが一定レベル以上であるということがあげられる。
登録音声データベース７４には、ユーザが発話すると予測される言葉に対する音声波形とその言葉が予め対応付けられて登録されている。
比較演算手段７２は、音声検出手段７１から入力された音声波形と登録音声データベース７４に登録されている音声波形とを順次、比較し、登録音声データベース７４に登録された音声波形毎に類似度を算出し、その算出結果を認識手段７３に出力する。ここで、２つの音声波形を比較する手法としては、音声波形をフーリエ変換等の周波数分析した後の各周波数におけるパワー成分の差分合計を比較する手法を採用してもよいし、周波数分析した後、さらに極座標変換したケプストラム特徴量やメルケプストラム特徴量において時間的伸縮を考慮したＤＰマッチングを行う手法を採用してもよい。また、比較演算の効率化のために、登録音声データベース７４に登録されている音声波形を比較演算手段７２で用いる比較要素（例えば、各周波数のパワー成分）としてもよい。また、登録音声データベース７４に登録されている音声波形には、ユーザの咳払いやうなり声等、発声を意図しない場合の音声波形を登録し、対応する言葉として「意図しない発声」として登録しておく。これによって、ユーザが意図した発声と意図しない発声とを区別することが可能となる。
認識手段７３は、比較演算手段７２から入力される各音声波形毎の類似度のうち、最も高い類似度を持つ音声波形を検出し、登録音声データベース７４から検出された音声波形に対応する言葉を決定することにより、音声波形を文字に変換し、その文字を処理部５０に出力する。各類似度に大きな差異が見られない場合には、入力音声はノイズであると判断して、音声波形から文字への変換を行わない。あるいは、「ノイズ」という文字に変換してもよい。
図８ａは、図２に示される処理部５０の内部構成の一例を示す。
処理部５０（処理手段５０ａ）は、音声認識部４０による音声認識結果に基づいて対話データベース１４０を検索し、応答文を生成する。この応答文は、音声合成部１００に出力される。音声合成部１００は、応答文を音声に合成する。合成された音声は、スピーカなどの音声出力部１１０から出力される。
対話データベース１４０には、対話のパターンや応答文の生成規則が格納されている。さらに、対話データベース１４０には、ユーザが発する言葉（キーワード）とユーザの健康状態との関係が格納されている。
図３は、対話データベース１４０に格納されているユーザが発するキーワードとユーザの健康状態との関係の一例を示す。
図３に示される例では、ユーザが発するキーワードとユーザの健康状態との関係は表の形式で表現されている。例えば、この表の行３１は、「眠い」、「しんどい」、「食欲がない」というキーワードと「疲れ」というユーザの健康状態（体調）とが対応づけられていることを示す。この表の行３２は、「やった！」、「最高！」というキーワードと「喜び」というユーザの健康状態（感情）とが対応づけられていることを示す。
なお、ユーザが発するキーワードとユーザの健康状態との関係を表現する方法は図３に示される方法に限定されない。ユーザが発するキーワードとユーザの健康状態との関係は任意の方法で表現され得る。
処理部５０（把握手段５０ｂ）は、音声認識部４０による音声認識結果からキーワードを抽出し、そのキーワードを用いて対話データベース１４０を検索する。その結果、処理部５０（把握手段５０ｂ）は、そのキーワードからユーザの健康状態を把握する。例えば、音声認識結果から抽出されたキーワードが「眠い」、「しんどい」、「食欲がない」のうちの１つであった場合には、処理部５０（把握手段５０ｂ）は、図３に示される表を参照してユーザの健康状態が「疲れ」の状態であると判定する。
なお、上述したキーワードを用いる方法に代えて、または、上述したキーワードを用いる方法に加えて、音声認識結果に基づいてユーザの音声の強さまたは張りのレベルを検出することにより、ユーザの健康状態を把握するようにしてもよい。例えば、処理部５０（把握手段５０ｂ）がユーザの音声の強さまたは張りのレベルが所定のレベル以下であることを検出した場合には、処理部５０（把握手段５０ｂ）は、ユーザの健康状態が「疲れ」の状態であると判定する。
なお、音声認識部４０による音声認識結果に加えて、画像認識部２０による画像認識結果を用いてユーザの健康状態を把握するようにしてもよい。あるいは、画像認識部２０による画像認識結果を単独で用いてユーザの健康状態を把握するようにしてもよい。例えば、処理部５０（把握手段５０ｂ）がユーザがまばたきする頻度が多いこと（または、ユーザがあくびをしたこと）を検出した場合には、処理部５０（把握手段５０ｂ）は、ユーザの健康状態が「疲れ」の状態であると判定する。
このように、処理部５０（把握手段５０ｂ）は、ユーザの発話に基づいて、または、画像認識結果に基づいて、ユーザの健康状態を把握する把握手段として機能する。
情報データベース１６０には、今日の天気やニュースなどの情報や、各種一般常識などの知識や、ロボット１のユーザ（所有者）に関する情報（例えば、性別、年齢、名前、職業、性格、趣味、生年月日などの情報）や、ロボット１に関する情報（例えば、型番、内部構成などの情報）が格納されている。今日の天気やニュースなどの情報は、例えば、ロボット１が外部から送受信部６０（通信部）および処理部５０を介して取得され、情報データベース１６０に格納される。さらに、情報データベース１６０には、ユーザの健康状態と行動パターンとの関係が行動パターンテーブル１６１として格納されている。
図４は、情報データベース１６０に格納されている行動パターンテーブル１６１の一例を示す。行動パターンテーブル１６１は、ユーザの健康状態とロボット１の行動パターンとの関係を定義する。
図４に示される例では、ユーザの健康状態とロボット１の行動パターンとの関係は表の形式で表現されている。例えば、この表の行４１は、「疲れ」というユーザの健康状態とロボット１の３つの行動パターンとが対応づけられていることを示す。３つの行動パターンは、以下のとおりである。
１）コンテンツの選択、再生：「癒し」「催眠」効果を発揮するコンテンツ（ソフト）を選択し、その選択されたコンテンツ（ソフト）を再生機器で再生する
２）風呂の準備：ユーザに入浴を勧めるために風呂の準備をする
３）飲食物のレシピの選択、調理：「食欲を増進させる」「滋養の高い」飲食物のレシピを選択し、その選択されたレシピに従って飲食物を調理する
また、この表の行４２は、「喜び」というユーザの健康状態と「バンザイのジェスチャ」というロボット１の行動パターンとが対応づけられていることを示す。
なお、ユーザの健康状態とロボット１の行動パターンとの関係を表現する方法は図４に示される方法に限定されない。ユーザの健康状態とロボット１の行動パターンとの関係は任意の方法で表現され得る。
ロボット１の行動パターンの例としては、ユーザの健康状態に適合したコンテンツ（ソフト）を選択しその選択されたコンテンツ（ソフト）を再生機器で再生すること、ユーザの健康状態に適合した飲食物のレシピを選択しその選択されたレシピに従って飲食物を調理すること、風呂の準備をすること、笑いを取るための小話を実演することなどが挙げられる。
処理部５０（行動パターン決定手段５０ｃ）は、把握手段５０ｂから出力されるタイミング信号ｔ１に応答して対話データベース１４０を検索することによって把握されたユーザの健康状態を用いて情報データベース１６０（行動パターンテーブル１６１）を検索する。その結果、処理部５０（行動パターン決定手段５０ｃ）は、ユーザの健康状態に応じたロボット１の行動パターンを決定する。例えば、ユーザの健康状態が「疲れ」の状態である場合には、処理部５０（行動パターン決定手段５０ｃ）は、図４に示される表（行動パターンテーブル１６１）を参照して、「疲れ」の状態に対応して定義されている３つの行動パターンのうちの１つをロボット１の行動パターンとして決定する。
ここで、処理部５０（行動パターン決定手段５０ｃ）は、様々な態様で、３つの行動パターンのうちの１つをロボット１の行動パターンとして決定することができる。例えば、３つの行動パターンのそれぞれに優先順位が予め割り当てられている場合には、その優先順位の高いものから順にロボット１の行動パターンとして決定することができる。その優先順位を時間帯に応じて変動させるようにしてもよい。例えば、１８：００〜２２：００の時間帯は「風呂の準備」の優先順位を最も高くし、６：００〜８：００、１１：００〜１３：００、１７：００〜１９：００の時間帯は「飲食物のレシピの選択、調理」の優先順位を最も高くし、その他の時間帯は「コンテンツの選択、再生」の優先順位を最も高くするようにしてもよい。
このように、処理部５０（行動パターン決定手段５０ｃ）は、把握手段５０ｂによって把握されたユーザの健康状態に応じた行動パターンを決定する決定手段として機能する。
処理部５０（実行指示手段５０ｇ）は、行動パターン決定手段５０ｃから出力されるタイミング信号ｔ２に応答して、決定された行動パターンに応じた制御信号を生成し、その制御信号を動作制御部１２０に出力する。
動作制御部１２０は、処理部５０（実行指示手段５０ｇ）から出力される制御信号に応じて各種のアクチュエータ１３０を駆動する。これにより、ロボット１を所望の態様で動作させることが可能になる。
例えば、決定された行動パターンが「バンザイのジェスチャ」である場合には、動作制御部１２０は、処理部５０（実行指示手段５０ｇ）から出力される制御信号に従って、ロボット１の「腕」を上下させるアクチュエータ（アクチュエータ１３０の一部）を駆動する。あるいは、決定された行動パターンが「コンテンツの選択、再生」である場合には、動作制御部１２０は、処理部５０（実行指示手段５０ｇ）から出力される制御信号に従って、ディスクを把持し把持したディスクを再生機器にセットするようにロボット１の「手の指」（把持手段）を制御するアクチュエータ（アクチュエータ１３０の一部）を駆動するようにしてもよい。例えば、複数のディスクは所定の順にラックに整理されて収納されているものとする。
このように、処理部５０（実行指示手段５０ｇ）は、行動パターン決定手段５０ｃによって決定された行動パターンの実行を動作制御部１２０に指示する実行指示手段として機能する。
あるいは、決定された行動パターンが「風呂の準備」である場合には、処理部５０（実行指示手段５０ｇ）は、給湯制御装置にリモートコントロール信号を送信するようにリモートコントロール部７０を制御してもよい。給湯制御装置は、リモートコントロール信号に応じて風呂桶に適温の湯を適量だけ供給する（あるいは、風呂桶に適量の水を供給した後、その水が適温の湯になるまで加熱する）。この場合には、処理部５０（実行指示手段５０ｇ）は、行動パターン決定手段５０ｃによって決定された行動パターンの実行をリモートコントロール部７０に指示する実行指示手段として機能する。
あるいは、決定された行動パターンが「コンテンツの選択、再生」である場合には、処理部５０（実行指示手段５０ｇ）は、再生機器にリモートコントロール信号を送信するようにリモートコントロール部７０を制御してもよい。再生機器は、リモートコントロール信号に応じて再生機器にセットされているディスクの中からコンテンツを選択し、再生する。再生機器が複数のディスクをセット可能なディスクチェンジャーに接続されている場合には、その再生機器はリモートコントロール信号に応じてその複数のディスクの中からコンテンツを選択し、再生するようにしてもよい。なお、複数のディスクのすべての曲を含む選曲リストを処理部５０内のメモリに格納しておくようにしてもよいし、再生機器がディスクのヘッダ部からそのディスクの選曲リストを読み取り、送受信部６０経由で処理部５０内のメモリに格納するようにしてもよい。この場合には、処理部５０（実行指示手段５０ｇ）は、行動パターン決定手段５０ｃによって決定された行動パターンの実行をリモートコントロール部７０に指示する実行指示手段として機能する。
図８ｂは、図２に示される処理部５０の内部構成の他の例を示す。図８ｂに示される例では、処理部５０（提案手段５０ｅ）は、決定された行動パターンの実行を指示する前に、ユーザにその行動パターンを音声で提案する。例えば、決定された行動パターンが「風呂の準備」である場合には、行動パターン決定手段５０ｃから出力されるタイミング信号ｔ２に応答して、処理部５０（提案手段５０ｅ）は、対話データベース１４０を参照して、「お疲れのようですね。お風呂の準備をいたしましょうか？」という疑問文（提案文）を生成し、音声合成部１００に出力するようにすればよい。音声合成部１００は、その疑問文を音声に合成する。合成された音声は、音声出力部１１０から出力される。
次に、図９を参照して提案手段５０ｅによる提案文の作成方法を説明する。提案手段５０ｅは内部に提案文合成部を備えている。対話データベース１４０は提案文フォーマットデータベースを内部に備えており、この提案文フォーマットデータベースには、複数の提案表現に対応する複数の提案文フォーマットが記録保持されている。ここで、「提案表現」とは、例えば、図９の例で示すような「Ａですね。Ｂしましょうか？」、「Ａのようですが、Ｂしてもいいですか？」というような、提案する動機となった原因（Ａ）とそれに対する対応（Ｂ）を示す文章表現のことである。
まず、提案手段（提案文合成部）５０ｅは、把握手段５０ｂから入力される「把握された健康状態」と、行動パターン決定手段５０ｃから入力される「決定された行動パターン」とに基づいて、提案文フォーマットデータベースから前記「把握された健康状態」に合う提案文フォーマットを選択する。次に、提案手段（提案文合成部）５０ｅは、「把握された健康状態」を提案文フォーマットのＡに、「決定された行動パターン」を提案文フォーマットのＢに挿入することで提案文を合成する。例えば、「把握された健康状態」が「疲れ」であり、「決定された行動パターン」が「風呂の準備」である場合には、提案手段（提案文合成部）５０ｅは、「お疲れのようですね。お風呂の準備をいたしましょうか？」という提案文を合成する。提案文は、音声合成部１００に出力される。音声合成部１００は、提案文を音声に合成する。合成された音声は音声出力部１１０から出力される。
このように、処理部５０（提案手段５０ｅ）は、対話データベース（提案文フォーマットデータベース）１４０と音声合成部１００と音声出力部１１０とを用いて、行動パターン決定手段５０ｃによって決定された行動パターンの実行を指示する前に、ユーザにその行動パターンを音声で提案する提案手段として機能する。
ユーザは、ロボット１からの提案に対してその提案を受け入れるか、または、受け入れないかの返事をする。例えば、ユーザは、その提案を受け入れる（Ｙｅｓ）という意思表示として「はい」、「そやな」、「そうしてくれ」などの返事をし、その提案を受け入れない（Ｎｏ）という意思表示として「いいえ」、「いらん」、「その必要なし」などの返事をするものとする。このような返事のパターンは対話データベース１４０に予め格納しておくものとする。
処理部５０（提案承諾判定手段５０ｆ）は、提案手段５０ｅから出力されるタイミング信号ｔ５に応答して音声認識部４０による音声認識結果を対話データベース１４０を参照して分析することにより、ユーザからの返事が提案を受け入れる（Ｙｅｓ）という返事なのか、提案を受け入れない（Ｎｏ）という返事なのかを判定する。
このように、処理部５０（提案承諾判定手段５０ｆ）は、音声認識部４０と対話データベース１４０とを用いて、提案された行動パターンに対するユーザの返事がその提案された行動パターンを受け入れるという返事か否かを判定する提案承諾判定手段として機能する。
図８ｃは、図２に示される処理部５０の内部構成の他の例を示す。決定された行動パターンの実行を指示する前に、ユーザにその行動パターンを提案する必要があるか否かを判定するようにしてもよい。例えば、図４に示される表の各行動パターンに提案の要否を示すフラグを予め割り当てた図１１に示す行動提案要否テーブル１６２を予め設定しておくことにより、処理部５０（提案要否判定手段５０ｄ）は、そのフラグの値に応じて提案の要否を判定することができる。例えば、処理部５０（提案要否判定手段５０ｄ）は、行動パターンに割り当てられたフラグの値が”１”である場合には、その行動パターンの実行を指示する前にその行動パターンをユーザに提案し、行動パターンに割り当てられたフラグの値が”０”である場合には、その行動パターンの実行を指示する前にその行動パターンをユーザに提案しない。
例えば、「風呂の準備」という行動パターンについては、ユーザへの事前の提案は要とされることが好ましい。ユーザが風呂に入りたいか否かはそのときの気分に負うところが大きく、ユーザへの事前の提案を不要とするとおしつけがましくなってしまうおそれがあるからである。例えば、「バイザイのジェスチャ」という行動パターンについては、ユーザへの事前の提案は不要とされることが好ましい。ユーザにいちいち断ってから万歳をしたのでは気がぬけてしまうおそれがあるからである。
このように、処理部５０（提案要否判定手段５０ｄ）は、情報データベース１６０（行動提案要否テーブル１６２）を用いて、決定された行動パターンの実行を指示する前に、ユーザにその行動パターンを提案する必要があるか否かを判定する提案要否判定手段として機能する。
行動パターンが実行される時間帯が決まっている場合や、その行動パターンが頻繁に実行される場合には、ユーザにその行動パターンをいちいち提案することは望まれないことが多い。逆に、普段ほとんど実行されないような行動パターンの場合には、その行動パターンの実行を指示する前にその行動パターンをユーザに提案することによってユーザがその行動パターンの実行を望んでいるか否かを確認することが望ましい。
図１０を参照して、上述した機能を実現する提案要否判定手段５０ｄを説明する。時間分布記録保持部９０は、時刻計測部９１と、積算部９２と、時間分布データベース９３とを含む。提案要否判定手段５０ｄは内部に比較決定部を備えている。時刻計測部９１は、実行指示手段５０ｇの入力を受け、行動パターンが実行された時刻を計測し、積算部９２に出力する。時間分布データベース９３は、時刻毎に各行動パターンが実行された回数を記録保持しており、積算部９２は、時刻計測部９１からの入力を受ける毎に、計測された時刻における時間分布データベース９３に記録された実行回数に１回分を積算していく。このようにして時間分布記録保持部９０は、時刻毎に実行された行動パターンの履歴情報を蓄えていく。提案要否判定手段（比較決定部）５０ｄは、予め設定された値を持ち、行動パターン決定手段５０ｃからの入力を受けた際に、その時刻（もしくは時間帯）におけるその行動パターンの過去の実行回数を時間分布記録保持部９０から参照し、前記予め設定された値と比較する。比較決定部は、その行動パターンの過去の実行回数が予め設定された値より小さい場合には、その行動パターンを提案をする必要があると判定し、その行動パターンの過去の実行回数が予め設定された値より大きい場合には、その行動パターンを提案をする必要がないと判定する。その判定結果は、提案要否判定手段５０ｄの判定結果として提案要否判定手段５０ｄから出力する。
このように、提案要否判定手段５０ｄは、行動パターンが実行された実行回数の時間分布に基づいて提案の要否を判定する。
図５は、ロボット１がユーザの健康状態を把握し、ユーザの健康状態に適合した行動パターンの実行を指示する処理の手順を示す。
ステップＳＴ１：ユーザの健康状態が把握される。
例えば、処理部５０（把握手段５０ｂ）は、音声認識部４０による音声認識結果からキーワードを抽出し、そのキーワードを用いて対話データベース１４０を検索する。その結果、処理部５０（把握手段５０ｂ）は、そのキーワードからユーザの健康状態を把握することができる。
以下にユーザとロボット１との対話の例を示す。ここで、Ｕはユーザの発話を示し、Ｓはロボット１の発話を示す。
Ｕ：今日はしんどい〜。
Ｓ：そのようですね。
このように、ユーザが「眠い」、「しんどい」、「食欲がない」といったキーワードを発話した場合には、処理部５０（把握手段５０ｂ）は、ユーザの健康状態を「疲れ」の状態であると判定する。
ステップＳＴ２：ステップＳＴ１において把握されたユーザの健康状態に応じた行動パターンが決定される。
例えば、処理部５０（行動パターン決定手段５０ｃ）は、ユーザの健康状態を用いて情報データベース１６０（行動パターンテーブル１６１）を検索する。その結果、処理部５０（行動パターン決定手段５０ｃ）は、ユーザの健康状態に対応する行動パターンを決定することができる。行動パターンは、ユーザの要望を推定したものとして予め設定されていることが好ましい。
ステップＳＴ３：ステップＳＴ２において決定された行動パターンの実行を指示する前に、提案要否判定手段５０ｄによってその行動パターンをユーザに提案する必要があるか否かが判定される。
ステップＳＴ３の判定結果が「Ｙｅｓ」である場合には処理はステップＳＴ４に進み、ステップＳＴ３の判定結果が「Ｎｏ」である場合には処理はステップＳＴ６に進む。
ステップＳＴ４：提案手段５０ｅによってステップＳＴ２において決定された行動パターンの実行を指示する前に、その行動パターンがユーザに提案される。
以下にユーザとロボット１との対話の例を示す。ここで、Ｕはユーザの発話を示し、Ｓはロボット１の発話を示す。
Ｓ：お疲れのようですね。それでは癒し効果のあるコンテンツ（ソフト）を再生しましょうか？
Ｕ：頼むわ。
ステップＳＴ５：提案承諾判定手段５０ｆによってステップＳＴ４においてロボット１が提案した行動パターンをユーザが受け入れる返答をしたか否かが判定される。
ステップＳＴ５の判定結果が「Ｙｅｓ」である場合には処理はステップＳＴ６に進み、ステップＳＴ５の判定結果が「Ｎｏ」である場合には処理はステップＳＴ７に進む。
ステップＳＴ６：実行指示手段５０ｇによってステップＳＴ２において決定された行動パターンの実行が指示される。
ステップＳＴ７：提案された行動パターンとユーザが提案を受け入れなかった（リジェクトした）こととが履歴情報として情報データベース１６０に格納される。
この履歴情報は、ステップＳＴ２において次回からの行動パターンの内容を決定する際に参照される。ユーザが受け入れなかった行動パターンに割り当てられた優先順位を低くするようにしてもよい。
なお、ステップＳＴ７に代えて、または、ステップＳＴ７に加えて、ステップＳＴ５においてユーザが提案を受け入れた場合に、提案された行動パターンとユーザが提案を受け入れた（アクセプトした）こととを履歴情報として情報データベース１６０に格納するようにしてもよい。この履歴情報は、ステップＳＴ２において次回からの行動パターンの内容を決定する際に参照される。ユーザが受け入れた行動パターンに割り当てられた優先順位を高くするようにしてもよい。
このように、提案された行動パターンがユーザに受け入れられたか否かに応じて、その行動パターンに割り当てられた優先順位を変動させることが好ましい。これにより、ユーザの癖などを行動パターンの決定に反映させることができる。その結果、ロボット１によって決定される行動パターンがユーザの健康状態に実際に適合する割合を向上させることが可能になる。
なお、ステップＳＴ５においてユーザが提案を受け入れなかった場合には、ユーザが逆提案をするようにしてもよい。この場合、ロボット１は、その逆提案を受け取り、その逆提案が実行可能であるか否かを判定する。その逆提案が実行可能であると判定された場合には、ロボット１は、情報データベース１６０に格納されているユーザの健康状態とロボット１の行動パターンとの関係を更新した上で（例えば、図４に示される表の行動パターンの優先順位を変更した上で、または、図４に示される表に新たな行動パターンを追加した上で）、その逆提案の実行を指示する。その逆提案が実行可能でないと判定された場合には、ロボット１は、「その逆提案を実行することはできません」という旨をユーザに通知する。このように、ユーザから逆提案を行うことにより、ユーザの癖などを行動パターンの決定に反映させることができる。その結果、ロボット１によって決定される行動パターンがユーザの健康状態に実際に適合する割合を向上させることが可能になる。
なお、図５においてステップＳＴ３を省略してもよい。この場合には、ユーザの健康状態に応じて決定されたすべての行動パターンについて、その行動パターンの実行を指示する前に、その行動パターンがユーザに提案されることになる。
また、図５においてステップＳＴ３、ＳＴ４、ＳＴ５、ＳＴ７を省略してもよい。この場合には、ユーザの健康状態に応じて決定されたすべての行動パターンがユーザからの返事を待つことなく即時に行動パターンの実行が指示されることになる。
以上のように、本実施の形態によれば、ユーザの健康状態が把握され、ユーザの健康状態に応じた行動パターンが決定される。これにより、ユーザは各種センサを装着する煩わしさから解放される。さらに、ユーザはロボットを自分の健康状態を心配してくれる存在（良き友）と感じるようになる。
さらに、行動パターンの実行を指示する前に、その行動パターンをユーザに提案する形式を採用してもよい。この場合には、ユーザがその提案を受け入れるか否かの最終権限を有することになるため、その提案を受け入れることをロボットから強制されることがなく、ユーザの裁量の自由度が大きい。これにより、ロボットの暴走を抑えることができるとともに、ロボットをユーザフレンドリな存在として身近に感じることが可能になる。
日本能率協会総合研究所が行ったアンケートによれば、コンシューマが描く夢のロボットは「より本物に近いペットロボット」がトップ人気であった。人間と居住空間を共にする生活密着型の共生又はエンターティンメント型のロボットが待望されている。
本発明の対話型装置の一例としてのロボットは、生活密着型のフレンドリでかつ役に立つロボットであることが理解できよう。このようなロボットはユーザの生活を助け、ユーザの良き友になり得る。
なお、再生機器で再生されるコンテンツ（ソフト）は、映像データ、音声データ、照明制御データのうちの少なくとも１つを含んでいてもよい。記録媒体（ＤＶＤなど）に記録されている映像データを再生することに同期して記録媒体に記録されている音声データを再生することが可能である。さらに、記録媒体（ＤＶＤなど）に記録されている音声データおよび／または映像データを再生することに同期して記録媒体に記録されている照明制御データを再生することが可能である。このような同期再生により、「癒し」効果や「催眠」効果の高いコンテンツ（ソフト）を実現することが可能になる。
図６は、音声データおよび／または映像データと照明制御データとの同期再生を可能にする再生装置２１００の構成例を示す。再生装置２１００に音声出力装置（例えば、スピーカ）と映像出力装置（例えば、ＴＶ）と照明装置とを接続することにより、再生装置２１００は、記録媒体によって提供される音楽および／または映像に連動して照明装置の照明パターン（例えば、照明装置の光量および光色の少なくとも一方）を変化させることが可能になる。
再生装置２１００は、コントローラ２２２０と、インタフェースコントローラ（Ｉ／Ｆコントローラ）２２３０と、読み取り部２１２０とを含む。
コントローラ２２２０は、Ｉ／Ｆコントローラ２２３０に入力されるユーザからの操作コマンドや復号化部２１４０から供給される制御信号に基づいて、再生装置２１００の全体の動作を制御する。
Ｉ／Ｆコントローラ２２３０は、ユーザの操作（例えば、リモートコントロール部７０（図２）からのリモートコントロール信号）を検知して、その操作に対応する操作コマンド（例えば、再生コマンド）をコントローラ２２２０に出力する。
読み取り部２１２０は、記録媒体２１１０に記録された情報を読み取る。
記録媒体２１１０は、典型的には、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ）である。しかし、記録媒体２１１０はＤＶＤに限定されない。記録媒体２１１０は、任意のタイプの記録媒体であり得る。ただし、以下の説明では、記録媒体２１１０がＤＶＤである場合を例にとり説明することにする。この場合には、読み取り部２１２０は、例えば、光ピックアップである。
記録媒体２１１０に記録されているデータのフォーマットとして、ＤＶＤ−Ｖｉｄｅｏ規格に準拠したフォーマットを改変したフォーマットが使用される。すなわち、ＶＯＢＵの中に、ライティングパック（Ｌ＿ＰＣＫ：ＬｉｇｈｔｉｎｇＰａｃｋ）が新たに設けられたフォーマットが使用される。Ｌ＿ＰＣＫのデータは、プレゼンテーションデータに同期して照明制御データを出力するためのデータである。
ＭＰＥＧ−２（ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ２）は、広範囲なアプリケーションに対応するために、任意の数の符号化されたストリームを多重化し、それぞれのストリームを同期をとりながら再生するための方式として２種類の方式を規定している。その２種類の方式とは、プログラムストリーム（ＰＳ：ＰｒｏｇｒａｍＳｔｒｅａｍ）方式と、トランスポートストリーム（ＴＳ：ＴｒａｎｓｐｏｒｔＳｔｒｅａｍ）方式とである。ＤＶＤなどのデジタルストレージメディアでは、プログラムストリーム（ＰＳ：ＰｒｏｇｒａｍＳｔｒｅａｍ）方式が採用されている。以下の説明では、ＭＰＥＧ−２に規定されているプログラムストリーム（ＰＳ：ＰｒｏｇｒａｍＳｔｒｅａｍ）方式を「ＭＰＥＧ−ＰＳ方式」と略記し、ＭＰＥＧ−２に規定されているトランスポートストリーム（ＴＳ：ＴｒａｎｓｐｏｒｔＳｔｒｅａｍ）方式を「ＭＰＥＧ−ＴＳ方式」と略記する。
ＮＶ＿ＰＣＫ、Ａ＿ＰＣＫ、Ｖ＿ＰＣＫ、ＳＰ＿ＰＣＫは、いずれも、ＭＰＥＧ−ＰＳ方式に準拠したフォーマットを採用している。従って、Ｌ＿ＰＣＫも、ＭＰＥＧ−ＰＳ方式に準拠したフォーマットを採用することとする。
再生装置２１００は、ストリームデータ生成部２１３０と、復号化部２１４０とをさらに含む。
ストリームデータ生成部２１３０は、読み取り部２１２０の出力に基づいて、符号化されたＡＶデータと符号化された照明制御データとを含むストリームデータを生成する。ここで、「符号化されたＡＶデータ」とは、符号化された音声データおよび符号化された映像データのうちの少なくとも一方を含むデータをいう。
ストリームデータ生成部２１３０によって生成されるストリームデータは、ＭＰＥＧ−ＰＳ方式に準拠したフォーマットを有している。このようなストリームデータは、例えば、ＤＶＤ２１２０に記録されている情報をＲＦ信号の形式で受け取り、そのＲＦ信号をデジタル化して増幅し、ＥＦＭおよび復調処理を施すことにより得られる。ストリームデータ生成部２１３０の構成は公知のものと同一にすることができるので、ここでは詳しい説明を省略する。
復号化部２１４０は、分解部２１５０と、ＡＶデータ復号化部２１６０と、照明制御データ復号化部２１７０と、ＳＴＣ生成部２１８０と、同期コントローラ（制御部）２１９０とを含む。
分解部２１５０は、ストリームデータ生成部２１３０から、ＭＰＥＧ−ＰＳ方式に準拠したフォーマットを有するストリームデータを受け取り、そのストリームデータを符号化されたＡＶデータと符号化された照明制御データとに分解する。このような分解は、ＰＥＳパケットヘッダ中の識別コード（ｓｔｒｅａｍ＿ｉｄ）を参照することによって行われる。分解部２１５０は、例えば、デマルチプレクサである。
ＡＶデータ復号化部２１６０は、符号化されたＡＶデータを復号化することによりＡＶデータを出力する。ここで、「ＡＶデータ」とは、音声データおよび映像データのうちの少なくとも一方を含むデータをいう。
ＡＶデータ復号化部２１６０は、分解部２１５０から出力される符号化された映像データを一時的に格納するビデオバッファ２１６１と、符号化された映像データを復号化することにより、映像データを出力するビデオデコーダ２１６２と、分解部２１５０から出力される符号化された音声データを一時的に格納するオーディオバッファ２１６３と、符号化された音声データを復号化することにより、音声データを出力するオーディオデコーダ２１６４とを含む。
照明制御データ復号化部２１７０は、符号化された照明制御データを復号化することにより照明制御データを出力する。ここで、「照明制御データ」とは、照明装置に含まれる複数の画素を制御するためのデータである。
照明制御データ復号化部２１７０は、分解部２１５０から出力される符号化された照明制御データを一時的に格納する照明バッファ２１７１と、符号化された照明制御データを復号化することにより、照明制御データを出力する照明デコーダ２１７２とを含む。
ＳＴＣ生成部２１８０は、ＳＴＣ（ＳｙｅｔｅｍＴｉｍｅＣｌｏｃｋ）を生成する。ＳＴＣは、ＳＣＲに基づいて２７ＭＨｚの基準クロックの周波数を調整する（すなわち、増減させる）ことによって得られる。ＳＴＣは、データを符号化したときに用いられた基準時間を符号化データを復号化する際に再現したものである。
同期コントローラ２１９０は、ＡＶデータ復号化部２１６０がＡＶデータを出力するタイミングと照明制御データ復号化部２１７０が照明制御データを出力するタイミングとが同期するように、ＡＶデータ復号化部２１６０と照明制御データ復号化部２１７０とを制御する。
このような同期再生の制御は、例えば、ＳＴＣとＰＴＳとが一致したときにビデオデコーダ２１６２から映像データのアクセスユニットが出力されるようにビデオデコーダ２１６２を制御し、ＳＴＣとＰＴＳとが一致したときにオーディオデコーダ２１６４から音声データのアクセスユニットが出力されるようにオーディオデコーダ２１６４を制御し、ＳＴＣとＰＴＳとが一致したときに照明デコーダ２１７２から照明制御データのアクセスユニットが出力されるように照明デコーダ２１７２を制御することによって達成される。
同期コントローラ２１９０は、ＡＶデータ復号化部２１６０がＡＶデータを復号化するタイミングと照明制御データ復号化部２１７０が照明制御データを復号化するタイミングとが同期するように、ＡＶデータ復号化部２１６０と照明制御データ復号化部２１７０とを制御するようにしてもよい。
このような同期再生の制御は、例えば、ＳＴＣとＤＴＳとが一致したときにビデオデコーダ２１６２によって映像データのアクセスユニットが復号化されるようにビデオデコーダ２１６２を制御し、ＳＴＣとＤＴＳとが一致したときにオーディオデコーダ２１６４によって音声データのアクセスユニットが復号化されるようにオーディオデコーダ２１６４を制御し、ＳＴＣとＤＴＳとが一致したときに照明デコーダ２１７２によって照明制御データのアクセスユニットが復号化されるように照明デコーダ２１７２を制御することによって達成される。
このように、映像データ、音声データ、照明制御データのアクセスユニットを出力するタイミングの制御に加えて、または、映像データ、音声データ、照明制御データのアクセスユニットを出力するタイミングの制御に代えて、映像データ、音声データ、照明制御データのアクセスユニットを復号化するタイミングの制御を行うようにしてもよい。アクセスユニットを出力するタイミング（順序）とアクセスユニットを復号化するタイミング（順序）とが異なる場合があるからである。このような制御により、映像データ、音声データ、照明制御データを同期再生することが可能になる。
ビデオデコーダ２１６２から出力される映像データは、ＮＴＳＣエンコーダ２２００を介して外部機器（例えば、ＴＶ）に出力される。ビデオデコーダ２１６２とＴＶとは、再生装置２１００の出力端子２２４０を介して直接的に接続されてもよいし、ホームＬＡＮを介して間接的に接続されてもよい。
オーディオデコーダ２１６４から出力される音声データは、デジタル／アナログコンバータ（ＤＡＣ）２２１０を介して外部機器（例えば、スピーカ）に出力される。オーディオデコーダ２１６４とスピーカとは、再生装置２１００の出力端子２２５０を介して直接的に接続されてもよいし、ホームＬＡＮを介して間接的に接続されてもよい。
照明デコーダ２１７２から出力される照明制御データは、外部機器（例えば、照明装置）に出力される。照明デコーダ２１７２と照明装置とは、再生装置２１００の出力端子２２６０を介して直接的に接続されてもよいし、ホームＬＡＮを介して間接的に接続されてもよい。
なお、ストリームデータ生成部２１３０によって生成されるストリームデータは、符号化された副映像データを含んでいてもよいし、ナビゲーションデータを含んでいてもよい。例えば、ストリームデータが符号化された副映像データとナビゲーションデータとを含む場合には、分解部２１５０は、そのストリームデータを符号化された副映像データとナビゲーションデータとに分解する。図６には示されていないが、復号化部２１４０は、ナビパック回路と、サブピクチャデコーダと、クローズドキャプションデータデコーダとをさらに含んでいてもよい。ナビパック回路は、ナビゲーションデータを処理することにより制御信号を生成し、その制御信号をコントローラ２２２０に出力する。サブピクチャデコーダは、符号化された副映像データを復号化することにより副映像データをＮＴＳＣエンコーダ２２００に出力する。クローズドキャプションデータデコーダは、符号化された映像データに含まれる符号化されたクローズドキャプションデータを復号化することによりクローズドキャプションデータをＮＴＳＣエンコーダ２２００に出力する。これらの回路の機能は公知であり、本発明の主題には関係しないので詳しい説明を省略する。このように、復号化部２１４０は、図６に示されていない公知の構成を含んでいてもよい。
以上説明したように、図６に示される再生装置２１００によれば、記録媒体に記録されている音声データおよび／または映像データを再生することに同期して、その記録媒体に記録されている照明制御データを再生することが可能な再生装置が提供される。この再生装置に音声出力装置（例えば、スピーカ）と映像出力装置（例えば、ＴＶ）と照明装置とを接続することにより、記録媒体によって提供される音楽および／または映像に連動して照明パターンを変化させることが可能になる。「癒し」効果のある照明パターンの例としては、木漏れ日を表現した照明パターンを挙げることができる。

以上のように、本発明の対話型装置によれば、ユーザの健康状態が把握され、ユーザの健康状態に応じた行動パターンが決定される。これにより、ユーザは各種センサを装着する煩わしさから解放される。さらに、ユーザは対話型装置を自分の健康状態を心配してくれる存在（良き友）と感じるようになる。その結果、対話型装置の価値を高めることになり、ユーザの対話型装置に対する満足感、所有欲を高めることになる。

生態情報を監視して逐次居住者の好みのオーディオ信号を当該居住者の現在の生活状態及び体調に応じたレベルに調整して再生する音響装置が開示されている（例えば、特許文献１を参照）。この音響装置は、部屋に設置されたセンサによって居住者の生活状態を把握し、居住者が装着する携帯送受信機（生体センサを含む）からの識別情報、生態情報を監視して逐次居住者の好みのオーディオ信号を当該居住者の現在の生活状態及び体調に応じたレベルに調整して再生する。
特開平１１−２２１１９６号公報

しかし、上記特許文献１に記載の従来技術では、生体情報などを取得するために居住者は携帯送受信機を装着する必要があり、居住者にとって装着の煩わしさのため大変不便であるとともに、部屋に設置されたセンサによって居住者は生活を常々監視されていることになり、不快な思いをするといった課題があった。

本発明は、生体センサを人体に装着することなく、ユーザの健康状態に応じた行動パターンを決定することが可能な対話型装置を提供することを目的とする。

発明の開示
本発明の対話型装置は、ユーザの健康状態を把握する把握手段と、前記把握手段によって把握された前記ユーザの健康状態に応じた行動パターンを決定する決定手段と、前記決定手段によって決定された行動パターンの実行を指示する実行指示手段と、前記決定手段によって決定された行動パターンの実行を指示する前に、前記ユーザに前記行動パターンを音声で提案する提案手段と、前記提案された行動パターンに対する前記ユーザの返事が前記提案された行動パターンを受け入れるという返事か否かを判定する判定手段とを備え、前記実行指示手段は、前記ユーザの返事が前記提案された行動パターンを受け入れるという返事であると判定された場合に、前記提案された行動パターンの実行を指示し、これにより上記目的が達成される。

前記把握手段は、前記ユーザの発話に基づいて前記ユーザの健康状態を把握してもよい。

前記把握手段は、前記ユーザが発するキーワードに基づいて前記ユーザの健康状態を把握してもよい。

前記決定手段によって決定された行動パターンの実行を指示する前に、前記ユーザに前記行動パターンを提案する必要があるか否かを判定する提案要否判定手段をさらに備え、前記提案手段は、前記行動パターンの実行を指示する前に前記ユーザに前記行動パターンを提案する必要があると判定された場合に、前記ユーザに前記行動パターンを音声で提案してもよい。

前記提案要否判定手段は、前記行動パターンに予め割り当てられた提案の要否を示すフラグの値に応じて提案の要否を判定してもよい。

前記提案要否判定手段は、前記行動パターンが実行された実行回数の時間分布に基づいて提案の要否を判定してもよい。

前記決定手段は、優先順位がそれぞれ割り当てられた複数の行動パターンのうちの１つを前記ユーザの健康状態に応じた行動パターンとして決定し、その行動パターンが前記ユーザに受け入れられたか否かに応じて、その行動パターンに割り当てられた優先順位を変動させてもよい。

前記ユーザの健康状態に応じた行動パターンを記憶する記憶手段をさらに備え、前記決定手段は、前記記憶手段に記憶された行動パターンを用いて前記行動パターンを決定してもよい。

前記提案手段によって前記ユーザに提案される行動パターンは、再生機器で再生するコンテンツの選択を含んでもよい。

前記コンテンツは、音声データと映像データと照明制御データとを含み、前記再生機器が照明制御データに基づいて照明装置の光量および光色の少なくとも一方を変化させてもよい。

前記対話型装置は、エージェント機能および移動機能のうちの少なくとも１つの機能を有していてもよい。

前記ユーザの健康状態は、前記ユーザの感情および前記ユーザの体調のうちの少なくとも一方を表してもよい。

本発明の対話型装置は、ユーザが発する音声を音声信号に変換する音声入力部と、前記音声入力部から出力される音声信号に基づいてユーザが発した言葉を認識する音声認識部と、前記ユーザが発すると予想される言葉が予め登録され、前記登録されている言葉と前記ユーザの健康状態との対応関係を保持している対話データベースと、前記音声認識部によって認識された言葉と前記対話データベースに登録されている言葉とを照合し、その照合結果に応じて前記ユーザの健康状態を決定することによって、前記ユーザの健康状態を把握する把握手段と、前記ユーザの健康状態と対話型装置の行動パターンとの対応関係を保持している行動パターンテーブルに基づいて、前記把握手段によって把握された前記ユーザの健康状態に応じた行動パターンを決定する決定手段と、前記決定手段によって決定された行動パターンの実行を指示する実行指示手段と、前記決定手段によって決定された行動パターンの実行を指示する前に、前記把握手段の出力結果と前記決定手段の出力結果とに基づいて提案文を合成し、前記ユーザに前記行動パターンを音声で提案する提案手段と、前記提案された行動パターンに対する前記ユーザの返事が前記提案された行動パターンを受け入れるという返事か否かを判定する判定手段とを備え、前記実行指示手段は、前記ユーザの返事が前記提案された行動パターンを受け入れるという返事であると判定された場合に、前記提案された行動パターンの実行を指示し、これにより上記目的が達成される。

前記提案された行動パターンに対して前記ユーザから逆提案された行動パターンを受け取る手段と、前記逆提案された行動パターンを前記対話型装置が実行可能であるか否かを判定する手段と、前記逆提案された行動パターンを前記対話型装置が実行可能であると判定された場合に、前記行動パターンテーブルに保持されている前記ユーザの健康状態と前記対話型装置の行動パターンとの対応関係を更新する手段とをさらに備えていてもよい。

以下、図面を参照しながら本発明の実施の形態を説明する。

本明細書では、「ユーザの健康状態」とは、ユーザの感情およびユーザの体調のうちの少なくとも一方を表すものとする。「ユーザ」とは、対話型装置の所有者をいうものとする。

図１は、本発明の対話型装置の一例としてのロボット１の外観を示す。ロボット１は、ユーザと対話を行うことが可能なように構成されている。

図１に示されるロボット１は、「目」に相当するカメラ１０と、「口」に相当するスピーカ１１０およびアンテナ６２と、「耳」に相当するマイク３０およびアンテナ６２と、「首」や「腕」に相当する可動部１８０とを有している。

ロボット１は、自らが移動することを可能にする移動部１６０を有する自律走行型ロボット（移動式ロボット）であってもよいし、自らが移動することができないタイプのものであってもよい。

ロボット１が移動することを可能にするメカニズムとしては任意のメカニズムを採用することができる。例えば、ロボット１は、手足に設置されたローラの回転を制御することによって前進、後退するように構成されていてもよいし、タイヤ式や脚式などの移動式ロボットでもよい。ロボット１は、人のような二足直立歩行を行う動物を模倣した人間型ロボットでもよいし、４足歩行の動物を模倣したペット型ロボットでもよい。

なお、対話型装置の一例として、対話型のロボットを説明したが、対話型装置はこれに限定されない。対話型装置は、ユーザと対話を行うことが可能なように構成された任意の装置であり得る。対話型装置は、例えば、対話型の玩具であってもよいし、対話型携帯機器（携帯電話を含む）であってもよいし、対話型のエージェントであってもよい。

対話型のエージェントは、インターネットのような情報空間を動き回り、情報検索、フィルタリング、スケジュール調整などの情報処理を人間の代わりに行ってくれる機能（ソフトウェアエージェントの機能）を有していることが好ましい。対話型のエージェントはあたかも人間であるかのように人間と対話をするため、擬人化エージェントと呼ばれることもある。

対話型装置は、エージェント機能および移動機能のうちの少なくとも１つの機能を有していてもよい。

図２は、ロボット１の内部構成の一例を示す。

画像認識部２０は、カメラ１０（画像入力部）から画像を取り込み、その取り込んだ画像を認識し、その認識結果を処理部５０に出力する。

音声認識部４０は、マイク３０（音声入力部）から音声を取り込み、その取り込んだ音声を認識し、その認識結果を処理部５０に出力する。

図７は、音声認識部４０の内部構成の一例を示す。

音声入力部３０（マイク）によって、音声が音声信号波形に変換される。音声信号波形は、音声認識部４０に出力される。音声認識部４０は、音声検出手段７１と、比較演算手段７２と、認識手段７３と、登録音声データベース７４とを含む。

音声検出手段７１は、音声入力部３０から入力された音声信号波形が一定基準を満たす波形部分を実際にユーザが発声した音声区間として切り出し、その区間の音声信号波形を音声波形として比較演算手段７２に出力する。ここで、音声区間を切り出す一定基準とは、例えば、一般的に人間の音声帯域である１ｋＨｚ以下の周波数帯域における信号波形のパワーが一定レベル以上であるということがあげられる。

登録音声データベース７４には、ユーザが発話すると予測される言葉に対する音声波形とその言葉が予め対応付けられて登録されている。

比較演算手段７２は、音声検出手段７１から入力された音声波形と登録音声データベース７４に登録されている音声波形とを順次、比較し、登録音声データベース７４に登録された音声波形毎に類似度を算出し、その算出結果を認識手段７３に出力する。ここで、２つの音声波形を比較する手法としては、音声波形をフーリエ変換等の周波数分析した後の各周波数におけるパワー成分の差分合計を比較する手法を採用してもよいし、周波数分析した後、さらに極座標変換したケプストラム特徴量やメルケプストラム特徴量において時間的伸縮を考慮したＤＰマッチングを行う手法を採用してもよい。また、比較演算の効率化のために、登録音声データベース７４に登録されている音声波形を比較演算手段７２で用いる比較要素（例えば、各周波数のパワー成分）としてもよい。また、登録音声データベース７４に登録されている音声波形には、ユーザの咳払いやうなり声等、発声を意図しない場合の音声波形を登録し、対応する言葉として「意図しない発声」として登録しておく。これによって、ユーザが意図した発声と意図しない発声とを区別することが可能となる。

認識手段７３は、比較演算手段７２から入力される各音声波形毎の類似度のうち、最も高い類似度を持つ音声波形を検出し、登録音声データベース７４から検出された音声波形に対応する言葉を決定することにより、音声波形を文字に変換し、その文字を処理部５０に出力する。各類似度に大きな差異が見られない場合には、入力音声はノイズであると判断して、音声波形から文字への変換を行わない。あるいは、「ノイズ」という文字に変換してもよい。

図８ａは、図２に示される処理部５０の内部構成の一例を示す。

処理部５０（処理手段５０ａ）は、音声認識部４０による音声認識結果に基づいて対話データベース１４０を検索し、応答文を生成する。この応答文は、音声合成部１００に出力される。音声合成部１００は、応答文を音声に合成する。合成された音声は、スピーカなどの音声出力部１１０から出力される。

対話データベース１４０には、対話のパターンや応答文の生成規則が格納されている。さらに、対話データベース１４０には、ユーザが発する言葉（キーワード）とユーザの健康状態との関係が格納されている。

図３は、対話データベース１４０に格納されているユーザが発するキーワードとユーザの健康状態との関係の一例を示す。

図３に示される例では、ユーザが発するキーワードとユーザの健康状態との関係は表の形式で表現されている。例えば、この表の行３１は、「眠い」、「しんどい」、「食欲がない」というキーワードと「疲れ」というユーザの健康状態（体調）とが対応づけられていることを示す。この表の行３２は、「やった！」、「最高！」というキーワードと「喜び」というユーザの健康状態（感情）とが対応づけられていることを示す。

なお、ユーザが発するキーワードとユーザの健康状態との関係を表現する方法は図３に示される方法に限定されない。ユーザが発するキーワードとユーザの健康状態との関係は任意の方法で表現され得る。

処理部５０（把握手段５０ｂ）は、音声認識部４０による音声認識結果からキーワードを抽出し、そのキーワードを用いて対話データベース１４０を検索する。その結果、処理部５０（把握手段５０ｂ）は、そのキーワードからユーザの健康状態を把握する。例えば、音声認識結果から抽出されたキーワードが「眠い」、「しんどい」、「食欲がない」のうちの１つであった場合には、処理部５０（把握手段５０ｂ）は、図３に示される表を参照してユーザの健康状態が「疲れ」の状態であると判定する。

なお、上述したキーワードを用いる方法に代えて、または、上述したキーワードを用いる方法に加えて、音声認識結果に基づいてユーザの音声の強さまたは張りのレベルを検出することにより、ユーザの健康状態を把握するようにしてもよい。例えば、処理部５０（把握手段５０ｂ）がユーザの音声の強さまたは張りのレベルが所定のレベル以下であることを検出した場合には、処理部５０（把握手段５０ｂ）は、ユーザの健康状態が「疲れ」の状態であると判定する。

なお、音声認識部４０による音声認識結果に加えて、画像認識部２０による画像認識結果を用いてユーザの健康状態を把握するようにしてもよい。あるいは、画像認識部２０による画像認識結果を単独で用いてユーザの健康状態を把握するようにしてもよい。例えば、処理部５０（把握手段５０ｂ）がユーザがまばたきする頻度が多いこと（または、ユーザがあくびをしたこと）を検出した場合には、処理部５０（把握手段５０ｂ）は、ユーザの健康状態が「疲れ」の状態であると判定する。

このように、処理部５０（把握手段５０ｂ）は、ユーザの発話に基づいて、または、画像認識結果に基づいて、ユーザの健康状態を把握する把握手段として機能する。

情報データベース１６０には、今日の天気やニュースなどの情報や、各種一般常識などの知識や、ロボット１のユーザ（所有者）に関する情報（例えば、性別、年齢、名前、職業、性格、趣味、生年月日などの情報）や、ロボット１に関する情報（例えば、型番、内部構成などの情報）が格納されている。今日の天気やニュースなどの情報は、例えば、ロボット１が外部から送受信部６０（通信部）および処理部５０を介して取得され、情報データベース１６０に格納される。さらに、情報データベース１６０には、ユーザの健康状態と行動パターンとの関係が行動パターンテーブル１６１として格納されている。

図４は、情報データベース１６０に格納されている行動パターンテーブル１６１の一例を示す。行動パターンテーブル１６１は、ユーザの健康状態とロボット１の行動パターンとの関係を定義する。

図４に示される例では、ユーザの健康状態とロボット１の行動パターンとの関係は表の形式で表現されている。例えば、この表の行４１は、「疲れ」というユーザの健康状態とロボット１の３つの行動パターンとが対応づけられていることを示す。３つの行動パターンは、以下のとおりである。

１）コンテンツの選択、再生：「癒し」「催眠」効果を発揮するコンテンツ（ソフト）を選択し、その選択されたコンテンツ（ソフト）を再生機器で再生する
２）風呂の準備：ユーザに入浴を勧めるために風呂の準備をする
３）飲食物のレシピの選択、調理：「食欲を増進させる」「滋養の高い」飲食物のレシピを選択し、その選択されたレシピに従って飲食物を調理する
また、この表の行４２は、「喜び」というユーザの健康状態と「バンザイのジェスチャ」というロボット１の行動パターンとが対応づけられていることを示す。

なお、ユーザの健康状態とロボット１の行動パターンとの関係を表現する方法は図４に示される方法に限定されない。ユーザの健康状態とロボット１の行動パターンとの関係は任意の方法で表現され得る。

ロボット１の行動パターンの例としては、ユーザの健康状態に適合したコンテンツ（ソフト）を選択しその選択されたコンテンツ（ソフト）を再生機器で再生すること、ユーザの健康状態に適合した飲食物のレシピを選択しその選択されたレシピに従って飲食物を調理すること、風呂の準備をすること、笑いを取るための小話を実演することなどが挙げられる。

処理部５０（行動パターン決定手段５０ｃ）は、把握手段５０ｂから出力されるタイミング信号ｔ１に応答して対話データベース１４０を検索することによって把握されたユーザの健康状態を用いて情報データベース１６０（行動パターンテーブル１６１）を検索する。その結果、処理部５０（行動パターン決定手段５０ｃ）は、ユーザの健康状態に応じたロボット１の行動パターンを決定する。例えば、ユーザの健康状態が「疲れ」の状態である場合には、処理部５０（行動パターン決定手段５０ｃ）は、図４に示される表（行動パターンテーブル１６１）を参照して、「疲れ」の状態に対応して定義されている３つの行動パターンのうちの１つをロボット１の行動パターンとして決定する。

ここで、処理部５０（行動パターン決定手段５０ｃ）は、様々な態様で、３つの行動パターンのうちの１つをロボット１の行動パターンとして決定することができる。例えば、３つの行動パターンのそれぞれに優先順位が予め割り当てられている場合には、その優先順位の高いものから順にロボット１の行動パターンとして決定することができる。その優先順位を時間帯に応じて変動させるようにしてもよい。例えば、１８：００〜２２：００の時間帯は「風呂の準備」の優先順位を最も高くし、６：００〜８：００、１１：００〜１３：００、１７：００〜１９：００の時間帯は「飲食物のレシピの選択、調理」の優先順位を最も高くし、その他の時間帯は「コンテンツの選択、再生」の優先順位を最も高くするようにしてもよい。

このように、処理部５０（行動パターン決定手段５０ｃ）は、把握手段５０ｂによって把握されたユーザの健康状態に応じた行動パターンを決定する決定手段として機能する。

処理部５０（実行指示手段５０ｇ）は、行動パターン決定手段５０ｃから出力されるタイミング信号ｔ２に応答して、決定された行動パターンに応じた制御信号を生成し、その制御信号を動作制御部１２０に出力する。

動作制御部１２０は、処理部５０（実行指示手段５０ｇ）から出力される制御信号に応じて各種のアクチュエータ１３０を駆動する。これにより、ロボット１を所望の態様で動作させることが可能になる。

例えば、決定された行動パターンが「バンザイのジェスチャ」である場合には、動作制御部１２０は、処理部５０（実行指示手段５０ｇ）から出力される制御信号に従って、ロボット１の「腕」を上下させるアクチュエータ（アクチュエータ１３０の一部）を駆動する。あるいは、決定された行動パターンが「コンテンツの選択、再生」である場合には、動作制御部１２０は、処理部５０（実行指示手段５０ｇ）から出力される制御信号に従って、ディスクを把持し把持したディスクを再生機器にセットするようにロボット１の「手の指」（把持手段）を制御するアクチュエータ（アクチュエータ１３０の一部）を駆動するようにしてもよい。例えば、複数のディスクは所定の順にラックに整理されて収納されているものとする。

このように、処理部５０（実行指示手段５０ｇ）は、行動パターン決定手段５０ｃによって決定された行動パターンの実行を動作制御部１２０に指示する実行指示手段として機能する。

あるいは、決定された行動パターンが「風呂の準備」である場合には、処理部５０（実行指示手段５０ｇ）は、給湯制御装置にリモートコントロール信号を送信するようにリモートコントロール部７０を制御してもよい。給湯制御装置は、リモートコントロール信号に応じて風呂桶に適温の湯を適量だけ供給する（あるいは、風呂桶に適量の水を供給した後、その水が適温の湯になるまで加熱する）。この場合には、処理部５０（実行指示手段５０ｇ）は、行動パターン決定手段５０ｃによって決定された行動パターンの実行をリモートコントロール部７０に指示する実行指示手段として機能する。

あるいは、決定された行動パターンが「コンテンツの選択、再生」である場合には、処理部５０（実行指示手段５０ｇ）は、再生機器にリモートコントロール信号を送信するようにリモートコントロール部７０を制御してもよい。再生機器は、リモートコントロール信号に応じて再生機器にセットされているディスクの中からコンテンツを選択し、再生する。再生機器が複数のディスクをセット可能なディスクチェンジャーに接続されている場合には、その再生機器はリモートコントロール信号に応じてその複数のディスクの中からコンテンツを選択し、再生するようにしてもよい。なお、複数のディスクのすべての曲を含む選曲リストを処理部５０内のメモリに格納しておくようにしてもよいし、再生機器がディスクのヘッダ部からそのディスクの選曲リストを読み取り、送受信部６０経由で処理部５０内のメモリに格納するようにしてもよい。この場合には、処理部５０（実行指示手段５０ｇ）は、行動パターン決定手段５０ｃによって決定された行動パターンの実行をリモートコントロール部７０に指示する実行指示手段として機能する。

図８ｂは、図２に示される処理部５０の内部構成の他の例を示す。図８ｂに示される例では、処理部５０（提案手段５０ｅ）は、決定された行動パターンの実行を指示する前に、ユーザにその行動パターンを音声で提案する。例えば、決定された行動パターンが「風呂の準備」である場合には、行動パターン決定手段５０ｃから出力されるタイミング信号ｔ２に応答して、処理部５０（提案手段５０ｅ）は、対話データベース１４０を参照して、「お疲れのようですね。お風呂の準備をいたしましょうか？」という疑問文（提案文）を生成し、音声合成部１００に出力するようにすればよい。音声合成部１００は、その疑問文を音声に合成する。合成された音声は、音声出力部１１０から出力される。

次に、図９を参照して提案手段５０ｅによる提案文の作成方法を説明する。提案手段５０ｅは内部に提案文合成部を備えている。対話データベース１４０は提案文フォーマットデータベースを内部に備えており、この提案文フォーマットデータベースには、複数の提案表現に対応する複数の提案文フォーマットが記録保持されている。ここで、「提案表現」とは、例えば、図９の例で示すような「Ａですね。Ｂしましょうか？」、「Ａのようですが、Ｂしてもいいですか？」というような、提案する動機となった原因（Ａ）とそれに対する対応（Ｂ）を示す文章表現のことである。

まず、提案手段（提案文合成部）５０ｅは、把握手段５０ｂから入力される「把握された健康状態」と、行動パターン決定手段５０ｃから入力される「決定された行動パターン」とに基づいて、提案文フォーマットデータベースから前記「把握された健康状態」に合う提案文フォーマットを選択する。次に、提案手段（提案文合成部）５０ｅは、「把握された健康状態」を提案文フォーマットのＡに、「決定された行動パターン」を提案文フォーマットのＢに挿入することで提案文を合成する。例えば、「把握された健康状態」が「疲れ」であり、「決定された行動パターン」が「風呂の準備」である場合には、提案手段（提案文合成部）５０ｅは、「お疲れのようですね。お風呂の準備をいたしましょうか？」という提案文を合成する。提案文は、音声合成部１００に出力される。音声合成部１００は、提案文を音声に合成する。合成された音声は音声出力部１１０から出力される。

このように、処理部５０（提案手段５０ｅ）は、対話データベース（提案文フォーマットデータベース）１４０と音声合成部１００と音声出力部１１０とを用いて、行動パターン決定手段５０ｃによって決定された行動パターンの実行を指示する前に、ユーザにその行動パターンを音声で提案する提案手段として機能する。

ユーザは、ロボット１からの提案に対してその提案を受け入れるか、または、受け入れないかの返事をする。例えば、ユーザは、その提案を受け入れる（Ｙｅｓ）という意思表示として「はい」、「そやな」、「そうしてくれ」などの返事をし、その提案を受け入れない（Ｎｏ）という意思表示として「いいえ」、「いらん」、「その必要なし」などの返事をするものとする。このような返事のパターンは対話データベース１４０に予め格納しておくものとする。

処理部５０（提案承諾判定手段５０ｆ）は、提案手段５０ｅから出力されるタイミング信号ｔ５に応答して音声認識部４０による音声認識結果を対話データベース１４０を参照して分析することにより、ユーザからの返事が提案を受け入れる（Ｙｅｓ）という返事なのか、提案を受け入れない（Ｎｏ）という返事なのかを判定する。

このように、処理部５０（提案承諾判定手段５０ｆ）は、音声認識部４０と対話データベース１４０とを用いて、提案された行動パターンに対するユーザの返事がその提案された行動パターンを受け入れるという返事か否かを判定する提案承諾判定手段として機能する。

図８ｃは、図２に示される処理部５０の内部構成の他の例を示す。決定された行動パターンの実行を指示する前に、ユーザにその行動パターンを提案する必要があるか否かを判定するようにしてもよい。例えば、図４に示される表の各行動パターンに提案の要否を示すフラグを予め割り当てた図１１に示す行動提案要否テーブル１６２を予め設定しておくことにより、処理部５０（提案要否判定手段５０ｄ）は、そのフラグの値に応じて提案の要否を判定することができる。例えば、処理部５０（提案要否判定手段５０ｄ）は、行動パターンに割り当てられたフラグの値が”１”である場合には、その行動パターンの実行を指示する前にその行動パターンをユーザに提案し、行動パターンに割り当てられたフラグの値が”０”である場合には、その行動パターンの実行を指示する前にその行動パターンをユーザに提案しない。

例えば、「風呂の準備」という行動パターンについては、ユーザへの事前の提案は要とされることが好ましい。ユーザが風呂に入りたいか否かはそのときの気分に負うところが大きく、ユーザへの事前の提案を不要とするとおしつけがましくなってしまうおそれがあるからである。例えば、「バイザイのジェスチャ」という行動パターンについては、ユーザへの事前の提案は不要とされることが好ましい。ユーザにいちいち断ってから万歳をしたのでは気がぬけてしまうおそれがあるからである。

このように、処理部５０（提案要否判定手段５０ｄ）は、情報データベース１６０（行動提案要否テーブル１６２）を用いて、決定された行動パターンの実行を指示する前に、ユーザにその行動パターンを提案する必要があるか否かを判定する提案要否判定手段として機能する。

行動パターンが実行される時間帯が決まっている場合や、その行動パターンが頻繁に実行される場合には、ユーザにその行動パターンをいちいち提案することは望まれないことが多い。逆に、普段ほとんど実行されないような行動パターンの場合には、その行動パターンの実行を指示する前にその行動パターンをユーザに提案することによってユーザがその行動パターンの実行を望んでいるか否かを確認することが望ましい。

図１０を参照して、上述した機能を実現する提案要否判定手段５０ｄを説明する。時間分布記録保持部９０は、時刻計測部９１と、積算部９２と、時間分布データベース９３とを含む。提案要否判定手段５０ｄは内部に比較決定部を備えている。時刻計測部９１は、実行指示手段５０ｇの入力を受け、行動パターンが実行された時刻を計測し、積算部９２に出力する。時間分布データベース９３は、時刻毎に各行動パターンが実行された回数を記録保持しており、積算部９２は、時刻計測部９１からの入力を受ける毎に、計測された時刻における時間分布データベース９３に記録された実行回数に１回分を積算していく。このようにして時間分布記録保持部９０は、時刻毎に実行された行動パターンの履歴情報を蓄えていく。提案要否判定手段（比較決定部）５０ｄは、予め設定された値を持ち、行動パターン決定手段５０ｃからの入力を受けた際に、その時刻（もしくは時間帯）におけるその行動パターンの過去の実行回数を時間分布記録保持部９０から参照し、前記予め設定された値と比較する。比較決定部は、その行動パターンの過去の実行回数が予め設定された値より小さい場合には、その行動パターンを提案をする必要があると判定し、その行動パターンの過去の実行回数が予め設定された値より大きい場合には、その行動パターンを提案をする必要がないと判定する。その判定結果は、提案要否判定手段５０ｄの判定結果として提案要否判定手段５０ｄから出力する。

このように、提案要否判定手段５０ｄは、行動パターンが実行された実行回数の時間分布に基づいて提案の要否を判定する。

図５は、ロボット１がユーザの健康状態を把握し、ユーザの健康状態に適合した行動パターンの実行を指示する処理の手順を示す。

ステップＳＴ１：ユーザの健康状態が把握される。

例えば、処理部５０（把握手段５０ｂ）は、音声認識部４０による音声認識結果からキーワードを抽出し、そのキーワードを用いて対話データベース１４０を検索する。その結果、処理部５０（把握手段５０ｂ）は、そのキーワードからユーザの健康状態を把握することができる。

以下にユーザとロボット１との対話の例を示す。ここで、Ｕはユーザの発話を示し、Ｓはロボット１の発話を示す。

Ｕ：今日はしんどい〜。

Ｓ：そのようですね。

このように、ユーザが「眠い」、「しんどい」、「食欲がない」といったキーワードを発話した場合には、処理部５０（把握手段５０ｂ）は、ユーザの健康状態を「疲れ」の状態であると判定する。

ステップＳＴ２：ステップＳＴ１において把握されたユーザの健康状態に応じた行動パターンが決定される。

例えば、処理部５０（行動パターン決定手段５０ｃ）は、ユーザの健康状態を用いて情報データベース１６０（行動パターンテーブル１６１）を検索する。その結果、処理部５０（行動パターン決定手段５０ｃ）は、ユーザの健康状態に対応する行動パターンを決定することができる。行動パターンは、ユーザの要望を推定したものとして予め設定されていることが好ましい。

ステップＳＴ３：ステップＳＴ２において決定された行動パターンの実行を指示する前に、提案要否判定手段５０ｄによってその行動パターンをユーザに提案する必要があるか否かが判定される。

ステップＳＴ３の判定結果が「Ｙｅｓ」である場合には処理はステップＳＴ４に進み、ステップＳＴ３の判定結果が「Ｎｏ」である場合には処理はステップＳＴ６に進む。

ステップＳＴ４：提案手段５０ｅによってステップＳＴ２において決定された行動パターンの実行を指示する前に、その行動パターンがユーザに提案される。

Ｓ：お疲れのようですね。それでは癒し効果のあるコンテンツ（ソフト）を再生しましょうか？
Ｕ：頼むわ。

ステップＳＴ５：提案承諾判定手段５０ｆによってステップＳＴ４においてロボット１が提案した行動パターンをユーザが受け入れる返答をしたか否かが判定される。

ステップＳＴ５の判定結果が「Ｙｅｓ」である場合には処理はステップＳＴ６に進み、ステップＳＴ５の判定結果が「Ｎｏ」である場合には処理はステップＳＴ７に進む。

ステップＳＴ６：実行指示手段５０ｇによってステップＳＴ２において決定された行動パターンの実行が指示される。

ステップＳＴ７：提案された行動パターンとユーザが提案を受け入れなかった（リジェクトした）こととが履歴情報として情報データベース１６０に格納される。

この履歴情報は、ステップＳＴ２において次回からの行動パターンの内容を決定する際に参照される。ユーザが受け入れなかった行動パターンに割り当てられた優先順位を低くするようにしてもよい。

なお、ステップＳＴ７に代えて、または、ステップＳＴ７に加えて、ステップＳＴ５においてユーザが提案を受け入れた場合に、提案された行動パターンとユーザが提案を受け入れた（アクセプトした）こととを履歴情報として情報データベース１６０に格納するようにしてもよい。この履歴情報は、ステップＳＴ２において次回からの行動パターンの内容を決定する際に参照される。ユーザが受け入れた行動パターンに割り当てられた優先順位を高くするようにしてもよい。

このように、提案された行動パターンがユーザに受け入れられたか否かに応じて、その行動パターンに割り当てられた優先順位を変動させることが好ましい。これにより、ユーザの癖などを行動パターンの決定に反映させることができる。その結果、ロボット１によって決定される行動パターンがユーザの健康状態に実際に適合する割合を向上させることが可能になる。

なお、ステップＳＴ５においてユーザが提案を受け入れなかった場合には、ユーザが逆提案をするようにしてもよい。この場合、ロボット１は、その逆提案を受け取り、その逆提案が実行可能であるか否かを判定する。その逆提案が実行可能であると判定された場合には、ロボット１は、情報データベース１６０に格納されているユーザの健康状態とロボット１の行動パターンとの関係を更新した上で（例えば、図４に示される表の行動パターンの優先順位を変更した上で、または、図４に示される表に新たな行動パターンを追加した上で）、その逆提案の実行を指示する。その逆提案が実行可能でないと判定された場合には、ロボット１は、「その逆提案を実行することはできません」という旨をユーザに通知する。このように、ユーザから逆提案を行うことにより、ユーザの癖などを行動パターンの決定に反映させることができる。その結果、ロボット１によって決定される行動パターンがユーザの健康状態に実際に適合する割合を向上させることが可能になる。

なお、図５においてステップＳＴ３を省略してもよい。この場合には、ユーザの健康状態に応じて決定されたすべての行動パターンについて、その行動パターンの実行を指示する前に、その行動パターンがユーザに提案されることになる。

また、図５においてステップＳＴ３、ＳＴ４、ＳＴ５、ＳＴ７を省略してもよい。この場合には、ユーザの健康状態に応じて決定されたすべての行動パターンがユーザからの返事を待つことなく即時に行動パターンの実行が指示されることになる。

以上のように、本実施の形態によれば、ユーザの健康状態が把握され、ユーザの健康状態に応じた行動パターンが決定される。これにより、ユーザは各種センサを装着する煩わしさから解放される。さらに、ユーザはロボットを自分の健康状態を心配してくれる存在（良き友）と感じるようになる。

さらに、行動パターンの実行を指示する前に、その行動パターンをユーザに提案する形式を採用してもよい。この場合には、ユーザがその提案を受け入れるか否かの最終権限を有することになるため、その提案を受け入れることをロボットから強制されることがなく、ユーザの裁量の自由度が大きい。これにより、ロボットの暴走を抑えることができるとともに、ロボットをユーザフレンドリな存在として身近に感じることが可能になる。

日本能率協会総合研究所が行ったアンケートによれば、コンシューマが描く夢のロボットは「より本物に近いペットロボット」がトップ人気であった。人間と居住空間を共にする生活密着型の共生又はエンターテインメント型のロボットが待望されている。

本発明の対話型装置の一例としてのロボットは、生活密着型のフレンドリでかつ役に立つロボットであることが理解できよう。このようなロボットはユーザの生活を助け、ユーザの良き友になり得る。

なお、再生機器で再生されるコンテンツ（ソフト）は、映像データ、音声データ、照明制御データのうちの少なくとも１つを含んでいてもよい。記録媒体（ＤＶＤなど）に記録されている映像データを再生することに同期して記録媒体に記録されている音声データを再生することが可能である。さらに、記録媒体（ＤＶＤなど）に記録されている音声データおよび／または映像データを再生することに同期して記録媒体に記録されている照明制御データを再生することが可能である。このような同期再生により、「癒し」効果や「催眠」効果の高いコンテンツ（ソフト）を実現することが可能になる。

図６は、音声データおよび／または映像データと照明制御データとの同期再生を可能にする再生装置２１００の構成例を示す。再生装置２１００に音声出力装置（例えば、スピーカ）と映像出力装置（例えば、ＴＶ）と照明装置とを接続することにより、再生装置２１００は、記録媒体によって提供される音楽および／または映像に連動して照明装置の照明パターン（例えば、照明装置の光量および光色の少なくとも一方）を変化させることが可能になる。

再生装置２１００は、コントローラ２２２０と、インタフェースコントローラ（Ｉ／Ｆコントローラ）２２３０と、読み取り部２１２０とを含む。

コントローラ２２２０は、Ｉ／Ｆコントローラ２２３０に入力されるユーザからの操作コマンドや復号化部２１４０から供給される制御信号に基づいて、再生装置２１００の全体の動作を制御する。

Ｉ／Ｆコントローラ２２３０は、ユーザの操作（例えば、リモートコントロール部７０（図２）からのリモートコントロール信号）を検知して、その操作に対応する操作コマンド（例えば、再生コマンド）をコントローラ２２２０に出力する。

読み取り部２１２０は、記録媒体２１１０に記録された情報を読み取る。

記録媒体２１１０は、典型的には、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ）である。しかし、記録媒体２１１０はＤＶＤに限定されない。記録媒体２１１０は、任意のタイプの記録媒体であり得る。ただし、以下の説明では、記録媒体２１１０がＤＶＤである場合を例にとり説明することにする。この場合には、読み取り部２１２０は、例えば、光ピックアップである。

記録媒体２１１０に記録されているデータのフォーマットとして、ＤＶＤ−Ｖｉｄｅｏ規格に準拠したフォーマットを改変したフォーマットが使用される。すなわち、ＶＯＢＵの中に、ライティングパック（Ｌ＿ＰＣＫ：ＬｉｇｈｔｉｎｇＰａｃｋ）が新たに設けられたフォーマットが使用される。Ｌ＿ＰＣＫのデータは、プレゼンテーションデータに同期して照明制御データを出力するためのデータである。

ＭＰＥＧ−２（ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ２）は、広範囲なアプリケーションに対応するために、任意の数の符号化されたストリームを多重化し、それぞれのストリームを同期をとりながら再生するための方式として２種類の方式を規定している。その２種類の方式とは、プログラムストリーム（ＰＳ：ＰｒｏｇｒａｍＳｔｒｅａｍ）方式と、トランスポートストリーム（ＴＳ：ＴｒａｎｓｐｏｒｔＳｔｒｅａｍ）方式とである。ＤＶＤなどのデジタルストレージメディアでは、プログラムストリーム（ＰＳ：ＰｒｏｇｒａｍＳｔｒｅａｍ）方式が採用されている。以下の説明では、ＭＰＥＧ−２に規定されているプログラムストリーム（ＰＳ：ＰｒｏｇｒａｍＳｔｒｅａｍ）方式を「ＭＰＥＧ−ＰＳ方式」と略記し、ＭＰＥＧ−２に規定されているトランスポートストリーム（ＴＳ：ＴｒａｎｓｐｏｒｔＳｔｒｅａｍ）方式を「ＭＰＥＧ−ＴＳ方式」と略記する。

ＮＶ＿ＰＣＫ、Ａ＿ＰＣＫ、Ｖ＿ＰＣＫ、ＳＰ＿ＰＣＫは、いずれも、ＭＰＥＧ−ＰＳ方式に準拠したフォーマットを採用している。従って、Ｌ＿ＰＣＫも、ＭＰＥＧ−ＰＳ方式に準拠したフォーマットを採用することとする。

再生装置２１００は、ストリームデータ生成部２１３０と、復号化部２１４０とをさらに含む。

ストリームデータ生成部２１３０は、読み取り部２１２０の出力に基づいて、符号化されたＡＶデータと符号化された照明制御データとを含むストリームデータを生成する。ここで、「符号化されたＡＶデータ」とは、符号化された音声データおよび符号化された映像データのうちの少なくとも一方を含むデータをいう。

ストリームデータ生成部２１３０によって生成されるストリームデータは、ＭＰＥＧ−ＰＳ方式に準拠したフォーマットを有している。このようなストリームデータは、例えば、ＤＶＤ２１２０に記録されている情報をＲＦ信号の形式で受け取り、そのＲＦ信号をデジタル化して増幅し、ＥＦＭおよび復調処理を施すことにより得られる。ストリームデータ生成部２１３０の構成は公知のものと同一にすることができるので、ここでは詳しい説明を省略する。

復号化部２１４０は、分解部２１５０と、ＡＶデータ復号化部２１６０と、照明制御データ復号化部２１７０と、ＳＴＣ生成部２１８０と、同期コントローラ（制御部）２１９０とを含む。

分解部２１５０は、ストリームデータ生成部２１３０から、ＭＰＥＧ−ＰＳ方式に準拠したフォーマットを有するストリームデータを受け取り、そのストリームデータを符号化されたＡＶデータと符号化された照明制御データとに分解する。このような分解は、ＰＥＳパケットヘッダ中の識別コード（ｓｔｒｅａｍ＿ｉｄ）を参照することによって行われる。分解部２１５０は、例えば、デマルチプレクサである。

ＡＶデータ復号化部２１６０は、符号化されたＡＶデータを復号化することによりＡＶデータを出力する。ここで、「ＡＶデータ」とは、音声データおよび映像データのうちの少なくとも一方を含むデータをいう。

ＡＶデータ復号化部２１６０は、分解部２１５０から出力される符号化された映像データを一時的に格納するビデオバッファ２１６１と、符号化された映像データを復号化することにより、映像データを出力するビデオデコーダ２１６２と、分解部２１５０から出力される符号化された音声データを一時的に格納するオーディオバッファ２１６３と、符号化された音声データを復号化することにより、音声データを出力するオーディオデコーダ２１６４とを含む。

照明制御データ復号化部２１７０は、符号化された照明制御データを復号化することにより照明制御データを出力する。ここで、「照明制御データ」とは、照明装置に含まれる複数の画素を制御するためのデータである。

照明制御データ復号化部２１７０は、分解部２１５０から出力される符号化された照明制御データを一時的に格納する照明バッファ２１７１と、符号化された照明制御データを復号化することにより、照明制御データを出力する照明デコーダ２１７２とを含む。

ＳＴＣ生成部２１８０は、ＳＴＣ（ＳｙｅｔｅｍＴｉｍｅＣｌｏｃｋ）を生成する。ＳＴＣは、ＳＣＲに基づいて２７ＭＨｚの基準クロックの周波数を調整する（すなわち、増減させる）ことによって得られる。ＳＴＣは、データを符号化したときに用いられた基準時間を符号化データを復号化する際に再現したものである。

同期コントローラ２１９０は、ＡＶデータ復号化部２１６０がＡＶデータを出力するタイミングと照明制御データ復号化部２１７０が照明制御データを出力するタイミングとが同期するように、ＡＶデータ復号化部２１６０と照明制御データ復号化部２１７０とを制御する。

このような同期再生の制御は、例えば、ＳＴＣとＰＴＳとが一致したときにビデオデコーダ２１６２から映像データのアクセスユニットが出力されるようにビデオデコーダ２１６２を制御し、ＳＴＣとＰＴＳとが一致したときにオーディオデコーダ２１６４から音声データのアクセスユニットが出力されるようにオーディオデコーダ２１６４を制御し、ＳＴＣとＰＴＳとが一致したときに照明デコーダ２１７２から照明制御データのアクセスユニットが出力されるように照明デコーダ２１７２を制御することによって達成される。

同期コントローラ２１９０は、ＡＶデータ復号化部２１６０がＡＶデータを復号化するタイミングと照明制御データ復号化部２１７０が照明制御データを復号化するタイミングとが同期するように、ＡＶデータ復号化部２１６０と照明制御データ復号化部２１７０とを制御するようにしてもよい。

このような同期再生の制御は、例えば、ＳＴＣとＤＴＳとが一致したときにビデオデコーダ２１６２によって映像データのアクセスユニットが復号化されるようにビデオデコーダ２１６２を制御し、ＳＴＣとＤＴＳとが一致したときにオーディオデコーダ２１６４によって音声データのアクセスユニットが復号化されるようにオーディオデコーダ２１６４を制御し、ＳＴＣとＤＴＳとが一致したときに照明デコーダ２１７２によって照明制御データのアクセスユニットが復号化されるように照明デコーダ２１７２を制御することによって達成される。

このように、映像データ、音声データ、照明制御データのアクセスユニットを出力するタイミングの制御に加えて、または、映像データ、音声データ、照明制御データのアクセスユニットを出力するタイミングの制御に代えて、映像データ、音声データ、照明制御データのアクセスユニットを復号化するタイミングの制御を行うようにしてもよい。アクセスユニットを出力するタイミング（順序）とアクセスユニットを復号化するタイミング（順序）とが異なる場合があるからである。このような制御により、映像データ、音声データ、照明制御データを同期再生することが可能になる。

ビデオデコーダ２１６２から出力される映像データは、ＮＴＳＣエンコーダ２２００を介して外部機器（例えば、ＴＶ）に出力される。ビデオデコーダ２１６２とＴＶとは、再生装置２１００の出力端子２２４０を介して直接的に接続されてもよいし、ホームＬＡＮを介して間接的に接続されてもよい。

オーディオデコーダ２１６４から出力される音声データは、デジタル／アナログコンバータ（ＤＡＣ）２２１０を介して外部機器（例えば、スピーカ）に出力される。オーディオデコーダ２１６４とスピーカとは、再生装置２１００の出力端子２２５０を介して直接的に接続されてもよいし、ホームＬＡＮを介して間接的に接続されてもよい。

照明デコーダ２１７２から出力される照明制御データは、外部機器（例えば、照明装置）に出力される。照明デコーダ２１７２と照明装置とは、再生装置２１００の出力端子２２６０を介して直接的に接続されてもよいし、ホームＬＡＮを介して間接的に接続されてもよい。

なお、ストリームデータ生成部２１３０によって生成されるストリームデータは、符号化された副映像データを含んでいてもよいし、ナビゲーションデータを含んでいてもよい。例えば、ストリームデータが符号化された副映像データとナビゲーションデータとを含む場合には、分解部２１５０は、そのストリームデータを符号化された副映像データとナビゲーションデータとに分解する。図６には示されていないが、復号化部２１４０は、ナビパック回路と、サブピクチャデコーダと、クローズドキャプションデータデコーダとをさらに含んでいてもよい。ナビパック回路は、ナビゲーションデータを処理することにより制御信号を生成し、その制御信号をコントローラ２２２０に出力する。サブピクチャデコーダは、符号化された副映像データを復号化することにより副映像データをＮＴＳＣエンコーダ２２００に出力する。クローズドキャプションデータデコーダは、符号化された映像データに含まれる符号化されたクローズドキャプションデータを復号化することによりクローズドキャプションデータをＮＴＳＣエンコーダ２２００に出力する。これらの回路の機能は公知であり、本発明の主題には関係しないので詳しい説明を省略する。このように、復号化部２１４０は、図６に示されていない公知の構成を含んでいてもよい。

以上説明したように、図６に示される再生装置２１００によれば、記録媒体に記録されている音声データおよび／または映像データを再生することに同期して、その記録媒体に記録されている照明制御データを再生することが可能な再生装置が提供される。この再生装置に音声出力装置（例えば、スピーカ）と映像出力装置（例えば、ＴＶ）と照明装置とを接続することにより、記録媒体によって提供される音楽および／または映像に連動して照明パターンを変化させることが可能になる。「癒し」効果のある照明パターンの例としては、木漏れ日を表現した照明パターンを挙げることができる。

図１は、本発明の対話型装置の一例としてのロボット１の外観を示す図である。図２は、ロボット１の内部構成の一例を示す図である。図３は、対話データベース１４０に格納されているユーザが発するキーワードとユーザの健康状態との関係の一例を示す図である。図４は、情報データベース１６０に格納されているユーザの健康状態とロボット１の行動パターンとの関係の一例を示す図である。図５は、ロボット１がユーザの健康状態を把握し、ユーザの健康状態に適合した行動パターンの実行を指示する処理の手順の一例を示すフローチャートである。図６は、音声データおよび／または映像データと照明制御データとの同期再生を可能にする再生装置２１００の構成の一例を示す図である。図７は、音声認識部４０の内部構成の一例を示す図である。図８ａは、図２に示される処理部５０の内部構成の一例を示す図である。図８ｂは、図２に示される処理部５０の内部構成の他の例を示す図である。図８ｃは、図２の処理部５０の内部構成の他の例を示す図である。図９は、提案手段５０ｅによる提案文の作成方法の一例を説明するための図である。図１０は、提案要否判定手段５０ｄの内部構成の一例を示す図である。図１１は、行動提案要否テーブル１６２の構造の一例を示す図である。

Claims

ユーザの健康状態を把握する把握手段と、
前記把握手段によって把握された前記ユーザの健康状態に応じた行動パターンを決定する決定手段と、
前記決定手段によって決定された行動パターンの実行を指示する実行指示手段と、
前記決定手段によって決定された行動パターンの実行を指示する前に、前記ユーザに前記行動パターンを音声で提案する提案手段と、
前記提案された行動パターンに対する前記ユーザの返事が前記提案された行動パターンを受け入れるという返事か否かを判定する判定手段と
を備え、
前記実行指示手段は、前記ユーザの返事が前記提案された行動パターンを受け入れるという返事であると判定された場合に、前記提案された行動パターンの実行を指示する、対話型装置。
前記把握手段は、前記ユーザの発話に基づいて前記ユーザの健康状態を把握する、請求の範囲第１項に記載の対話型装置。
前記把握手段は、前記ユーザが発するキーワードに基づいて前記ユーザの健康状態を把握する、請求の範囲第２項に記載の対話型装置。
前記決定手段によって決定された行動パターンの実行を指示する前に、前記ユーザに前記行動パターンを提案する必要があるか否かを判定する提案要否判定手段をさらに備え、
前記提案手段は、前記行動パターンの実行を指示する前に前記ユーザに前記行動パターンを提案する必要があると判定された場合に、前記ユーザに前記行動パターンを音声で提案する、請求の範囲第１項に記載の対話型装置。
前記提案要否判定手段は、前記行動パターンに予め割り当てられた提案の要否を示すフラグの値に応じて提案の要否を判定する、請求の範囲第４項に記載の対話型装置。
前記提案要否判定手段は、前記行動パターンが実行された実行回数の時間分布に基づいて提案の要否を判定する、請求の範囲第４項に記載の対話型装置。
前記決定手段は、優先順位がそれぞれ割り当てられた複数の行動パターンのうちの１つを前記ユーザの健康状態に応じた行動パターンとして決定し、その行動パターンが前記ユーザに受け入れられたか否かに応じて、その行動パターンに割り当てられた優先順位を変動させる、請求の範囲第１項に記載の対話型装置。
前記ユーザの健康状態に応じた行動パターンを記憶する記憶手段をさらに備え、
前記決定手段は、前記記憶手段に記憶された行動パターンを用いて前記行動パターンを決定する、請求の範囲第１項に記載の対話型装置。
前記提案手段によって前記ユーザに提案される行動パターンは、再生機器で再生するコンテンツの選択を含む、請求の範囲第１項に記載の対話型装置。
前記コンテンツは、音声データと映像データと照明制御データとを含み、前記再生機器が照明制御データに基づいて照明装置の光量および光色の少なくとも一方を変化させる、請求の範囲第９項に記載の対話型装置。
前記対話型装置は、エージェント機能および移動機能のうちの少なくとも１つの機能を有している、請求の範囲第１項に記載の対話型装置。
前記ユーザの健康状態は、前記ユーザの感情および前記ユーザの体調のうちの少なくとも一方を表す、請求の範囲第１項に記載の対話型装置。
ユーザが発する音声を音声信号に変換する音声入力部と、
前記音声入力部から出力される音声信号に基づいてユーザが発した言葉を認識する音声認識部と、
前記ユーザが発すると予想される言葉が予め登録され、前記登録されている言葉と前記ユーザの健康状態との対応関係を保持している対話データベースと、
前記音声認識部によって認識された言葉と前記対話データベースに登録されている言葉とを照合し、その照合結果に応じて前記ユーザの健康状態を決定することによって、前記ユーザの健康状態を把握する把握手段と、
前記ユーザの健康状態と対話型装置の行動パターンとの対応関係を保持している行動パターンテーブルに基づいて、前記把握手段によって把握された前記ユーザの健康状態に応じた行動パターンを決定する決定手段と、
前記決定手段によって決定された行動パターンの実行を指示する実行指示手段と、
前記決定手段によって決定された行動パターンの実行を指示する前に、前記把握手段の出力結果と前記決定手段の出力結果とに基づいて提案文を合成し、前記ユーザに前記行動パターンを音声で提案する提案手段と、
前記提案された行動パターンに対する前記ユーザの返事が前記提案された行動パターンを受け入れるという返事か否かを判定する判定手段と
を備え、
前記実行指示手段は、前記ユーザの返事が前記提案された行動パターンを受け入れるという返事であると判定された場合に、前記提案された行動パターンの実行を指示する、対話型装置。
前記提案された行動パターンに対して前記ユーザから逆提案された行動パターンを受け取る手段と、
前記逆提案された行動パターンを前記対話型装置が実行可能であるか否かを判定する手段と、
前記逆提案された行動パターンを前記対話型装置が実行可能であると判定された場合に、前記行動パターンテーブルに保持されている前記ユーザの健康状態と前記対話型装置の行動パターンとの対応関係を更新する手段と
をさらに備えた、請求の範囲第１３項に記載の対話型装置。