JP4062591B2 - 対話処理装置及び方法並びにロボット装置 - Google Patents

対話処理装置及び方法並びにロボット装置 Download PDF

Info

Publication number
JP4062591B2
JP4062591B2 JP2002060427A JP2002060427A JP4062591B2 JP 4062591 B2 JP4062591 B2 JP 4062591B2 JP 2002060427 A JP2002060427 A JP 2002060427A JP 2002060427 A JP2002060427 A JP 2002060427A JP 4062591 B2 JP4062591 B2 JP 4062591B2
Authority
JP
Japan
Prior art keywords
response
character string
response generation
generating
candidate character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002060427A
Other languages
English (en)
Other versions
JP2003255990A (ja
JP2003255990A5 (ja
Inventor
一美 青山
秀樹 下村
敬一 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2002060427A priority Critical patent/JP4062591B2/ja
Publication of JP2003255990A publication Critical patent/JP2003255990A/ja
Publication of JP2003255990A5 publication Critical patent/JP2003255990A5/ja
Application granted granted Critical
Publication of JP4062591B2 publication Critical patent/JP4062591B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、対話処理装置及び方法並びにロボット装置に関し、例えばエンターテインメントロボットに適用して好適なものである。
【0002】
【従来の技術】
従来の音声対話システムとしては、例えばテレフォンショッピングの受け付けや、電話番号案内など、あるタスクの達成を目的としたものがほとんどである。かかるタスク指向の対話は、ユーザに何を聞けばよいのかが所定の一連の流れに従ってある程度決まっているので、通常は、シナリオが予め定められた対話の記述に適した状態遷移図やスロットフィリングによって対話が記述される。
【0003】
【発明が解決しようとする課題】
ところで、近年、一般家庭向けのエンターテインメントロボットが数多く商品化されている。このようなエンターテインメントロボットに対し、例えば人間同士が日常的に行う対話と同様の対話をユーザとの間で行い得るような音声対話機能を搭載することができれば、当該エンターテインメントロボットに対するユーザの親近感を向上させてエンターテインメント性を格段的に向上させ得、さらには一人暮らしの老人の話し相手にもなり得る等、その有用性を格段的に向上させ得るものと考えられる。
【0004】
しかしながら、人間同士の対話の中には、上述のようなある一定の目的を達成するための対話以外に対話そのものが目的となる雑談がある。そして雑談時には、ユーザが何を喋るのかを予測することが難しく、例えば状態遷移図やスロットフィリングによって、全てのユーザ発話を予測してシステムの応答を記述しておくことは大変困難であり、従来提案されている手法では実用上十分には対応し得ない問題がある。
【0005】
またユーザとの対話では、カウンセリングを例とするような受動的に聞くというインタラクションも必要となってくるが、この際のロボットの応答の仕方にも工夫が必要であり、単にロボットが機械的にうなずいているだけでは対話が成立せず、不自然さをユーザに感じさせる問題がある。
【0006】
本発明は以上の点を考慮してなされたもので、自然な対話を行い得る簡易な構成の対話処理装置及びロボット装置、並びに装置構成を簡易化させながら、自然な対話を行い得るようにすることができる対話処理方法を提案しようとするものである。
【0007】
【課題を解決するための手段】
かかる課題を解決するため本発明においては、対話処理装置において、対話相手の発話を音声認識し認識文字列を生成する音声認識手段と、対話相手の発話内容を表す文字列に対し互いに異なるカテゴリの応答候補を表す文字列が対応付けられた別個の応答生成ルールに従って、認識文字列に対する応答候補文字列を生成可能な場合に当該応答候補文字列それぞれ生成する複数の応答生成手段と、カテゴリごとに選択されるべき割合がそれぞれ割り当てられた評価関数に基づき、各応答生成手段によりそれぞれ生成された応答候補文字列の中から1つの応答候補文字列応答文字列として選択する選択手段と、応答文字列基に応答音声を生成し外部に音声出力する音声出力手段とを設けるようにした。
【0008】
この結果、この対話処理装置においては、例えば雑談等の目的のない対話にも実用上十分に対応することができ、また例えば状態遷移図やスロットフィリングによって全てのユーザ発話を予測してシステムの応答を記述しておく場合に比べて設計や構成を格段的に容易化及び簡易化させることができる。
【0009】
また本発明においては、対話処理方法において、対話相手の発話を音声認識し認識文字列を生成する第1のステップと、認識文字列に対する応答候補文字列をそれぞれ生成する複数の応答手段が、対話相手の発話内容を表す文字列に対し互いに異なるカテゴリの応答候補を表す文字列が対応付けられた別個の応答生成ルールに従って、認識文字列に対する応答候補文字列を生成可能な場合に当該応答候補文字列をそれぞれ生成する第2のステップと、応答文字列を選択する選択手段が、カテゴリごとに選択されるべき割合がそれぞれ割り当てられた評価関数に基づき、各応答候補文字列の中から1つの応答候補文字列を応答文字列として選択する第3のステップと、応答文字列を基に応答音声を生成し外部に音声出力する第4のステップとを設けるようにした。
【0010】
この結果、この対話処理方法によれば、例えば雑談等の目的のない対話にも実用上十分に対応することができ、また例えば状態遷移図やスロットフィリングによって全てのユーザ発話を予測してシステムの応答を記述しておく場合に比べて装置の設計や構成を格段的に容易化及び簡易化させることができる。
【0011】
さらに本発明においては、ロボット装置において、対話相手の発話を音声認識し認識文字列を生成する音声認識手段と、対話相手の発話内容を表す文字列に対し互いに異なるカテゴリの応答候補を表す文字列が対応付けられた別個の応答生成ルールに従って、認識文字列に対する応答候補文字列を生成可能な場合に当該応答候補文字列それぞれ生成する複数の応答生成手段と、カテゴリごとに選択されるべき割合がそれぞれ割り当てられた評価関数に基づき、各応答生成手段によりそれぞれ生成された各応答候補文字列の中から1つの応答候補文字列応答文字列として選択する選択手段と、応答文字列基に応答音声を生成し外部に音声出力する音声出力手段とを設けるようにした。
【0012】
この結果、このロボット装置においては、例えば雑談等の目的のない対話にも実用上十分に対応することができ、また例えば状態遷移図やスロットフィリングによって全てのユーザ発話を予測してシステムの応答を記述しておく場合に比べて設計や構成を格段的に容易化及び簡易化させることができる。
【0013】
【発明の実施の形態】
以下図面について、本発明の一実施の形態を詳述する。
【0014】
(1)本実施の形態によるロボット1の構成
図1及び図2において、1は全体として本実施の形態による2足歩行型のロボットを示し、胴体部ユニット2の上部に頭部ユニット3が配設されると共に、当該胴体部ユニット2の上部左右にそれぞれ同じ構成の腕部ユニット4A、4Bがそれぞれ配設され、かつ胴体部ユニット2の下部左右にそれぞれ同じ構成の脚部ユニット5A、5Bがそれぞれ所定位置に取り付けられることにより構成されている。
【0015】
胴体部ユニット2においては、体幹上部を形成するフレーム10及び体幹下部を形成する腰ベース11が腰関節機構12を介して連結することにより構成されており、体幹下部の腰ベース11に固定された腰関節機構12の各アクチュエータA、Aをそれぞれ駆動することによって、体幹上部を図3に示す直交するロール軸13及びピッチ軸14の回りにそれぞれ独立に回転させることができるようになされている。
【0016】
また頭部ユニット3は、フレーム10の上端に固定された肩ベース15の上面中央部に首関節機構16を介して取り付けられており、当該首関節機構16の各アクチュエータA、Aをそれぞれ駆動することによって、図3に示す直交するピッチ軸17及びヨー軸18の回りにそれぞれ独立に回転させることができるようになされている。
【0017】
さらに各腕部ユニット4A、4Bは、それぞれ肩関節機構19を介して肩ベース15の左右に取り付けられており、対応する肩関節機構19の各アクチュエータA、Aをそれぞれ駆動することによって図3に示す直交するピッチ軸20及びロール軸21の回りにそれぞれ独立に回転させることができるようになされている。
【0018】
この場合、各腕部ユニット4A、4Bは、それぞれ上腕部を形成するアクチュエータAの出力軸に肘関節機構22を介して前腕部を形成するアクチュエータAが連結され、当該前腕部の先端に手部23が取り付けられることにより構成されている。
【0019】
そして各腕部ユニット4A、4Bでは、アクチュエータAを駆動することによって前腕部を図3に示すヨー軸24の回りに回転させ、アクチュエータAを駆動することによって前腕部を図3に示すピッチ軸25の回りにそれぞれ回転させることができるようになされている。
【0020】
これに対して各脚部ユニット5A、5Bにおいては、それぞれ股関節機構26を介して体幹下部の腰ベース11にそれぞれ取り付けられており、それぞれ対応する股関節機構26の各アクチュエータをA〜A11それぞれ駆動することによって、図3に示す互いに直交するヨー軸27、ロール軸28及びピッチ軸29の回りにそれぞれ独立に回転させることができるようになされている。
【0021】
この場合各脚部ユニット5A、5Bは、それぞれ大腿部を形成するフレーム30の下端に膝関節機構31を介して下腿部を形成するフレーム32が連結されると共に、当該フレーム32の下端に足首関節機構33を介して足部34が連結されることにより構成されている。
【0022】
これにより各脚部ユニット5A、5Bにおいては、膝関節機構31を形成するアクチュエータA12を駆動することによって、下腿部を図3に示すピッチ軸35の回りに回転させることができ、また足首関節機構33のアクチュエータA13、A14をそれぞれ駆動することによって、足部34を図3に示す直交するピッチ軸36及びロール軸37の回りにそれぞれ独立に回転させることができるようになされている。
【0023】
一方、胴体部ユニット2の体幹下部を形成する腰ベース11の背面側には、図4に示すように、当該ロボット1全体の動作制御を司るメイン制御部40と、電源回路及び通信回路などの周辺回路41と、バッテリ45(図5)となどがボックスに収納されてなる制御ユニット42が配設されている。
【0024】
そしてこの制御ユニット42は、各構成ユニット(胴体部ユニット2、頭部ユニット3、各腕部ユニット4A、4B及び各脚部ユニット5A、5B)内にそれぞれ配設された各サブ制御部43A〜43Dと接続されており、これらサブ制御部43A〜43Dに対して必要な電源電圧を供給したり、これらサブ制御部43A〜43Dと通信を行ったりすることができるようになされている。
【0025】
また各サブ制御部43A〜43Dは、それぞれ対応する構成ユニット内の各アクチュエータA〜A14と接続されており、当該構成ユニット内の各アクチュエータA〜A14をメイン制御部40から与えられる各種制御コマンドに基づいて指定された状態に駆動し得るようになされている。
【0026】
さらに頭部ユニット3には、図5に示すように、このロボット1の「目」として機能するCCD(Charge Coupled Device )カメラ50及び「耳」として機能するマイクロホン51及びタッチセンサ52などからなる外部センサ部53と、「口」として機能するスピーカ54となどがそれぞれ所定位置に配設され、制御ユニット42内には、バッテリセンサ55及び加速度センサ56などからなる内部センサ部57が配設されている。
【0027】
そして外部センサ部53のCCDカメラ50は、周囲の状況を撮像し、得られた画像信号S1Aをメイン制御部に送出する一方、マイクロホン51は、ユーザから音声入力として与えられる「歩け」、「伏せ」又は「ボールを追いかけろ」等の各種命令音声を集音し、かくして得られた音声信号S1Bをメイン制御部40に送出するようになされている。
【0028】
またタッチセンサ52は、図1及び図2において明らかなように頭部ユニット3の上部に設けられており、ユーザからの「撫でる」や「叩く」といった物理的な働きかけにより受けた圧力を検出し、検出結果を圧力検出信号S1Cとしてメイン制御部40に送出する。
【0029】
さらに内部センサ部57のバッテリセンサ55は、バッテリ45のエネルギ残量を所定周期で検出し、検出結果をバッテリ残量検出信号S2Aとしてメイン制御部40に送出する一方、加速度センサ56は、3軸方向(x軸、y軸及びz軸)の加速度を所定周期で検出し、検出結果を加速度検出信号S2Bとしてメイン制御部40に送出する。
【0030】
メイン制御部40は、外部センサ部53のCCDカメラ50、マイクロホン51及びタッチセンサ52等からそれぞれ供給される画像信号S1A、音声信号S1B及び圧力検出信号S1C等(以下、これらをまとめて外部センサ信号S1と呼ぶ)と、内部センサ部57のバッテリセンサ55及び加速度センサ等からそれぞれ供給されるバッテリ残量検出信号S2A及び加速度検出信号S2B等(以下、これらをまとめて内部センサ信号S2と呼ぶ)に基づいて、ロボット1の周囲及び内部の状況や、ユーザからの指令、ユーザからの働きかけの有無などを判断する。
【0031】
そしてメイン制御部40は、この判断結果と、予め内部メモリ40Aに格納されている制御プログラムと、そのとき装填されている外部メモリ58に格納されている各種制御パラメータとに基づいて続く行動を決定し、決定結果に基づく制御コマンドを対応するサブ制御部43A〜43Dに送出する。この結果、この制御コマンドに基づき、そのサブ制御部43A〜43Dの制御のもとに、対応するアクチュエータA〜A14が駆動され、かくして頭部ユニット3を上下左右に揺動させたり、腕部ユニット4A、4Bを上にあげたり、歩行するなどの行動がロボット1により発現されることとなる。
【0032】
またこの際メイン制御部40は、必要に応じて所定の音声信号S3をスピーカ54に与えることにより当該音声信号S3に基づく音声を外部に出力させたり、外見上の「目」として機能する頭部ユニット3の所定位置に設けられたLEDに駆動信号を出力することによりこれを点滅させる。
【0033】
このようにしてこのロボット1においては、周囲及び内部の状況や、ユーザからの指令及び働きかけの有無などに基づいて自律的に行動することができるようになされている。
【0034】
(2)音声対話機能に関するメイン制御部40の処理
次にこのロボット1に搭載された音声対話機能について説明する。
【0035】
このロボット1には、ユーザの発話に対して複数種類の応答を順次生成し、その中から1つの応答を所定の規則に従って選択して音声出力することにより、雑談等の目的のない対話にも実用上十分に対応しながら、ユーザに不自然さを感じさせずに当該対話を行わせ得る音声対話機能が搭載されている。そしてこの音声対話機能は、メイン制御部40におけるソフトウェア処理により実現されている。
【0036】
ここで、かかる音声対話機能に関するメイン制御部40の処理内容を機能的に分類すると、図6に示すように、ユーザの発話を音声認識する音声認識部60と、当該音声認識部60の認識結果に基づいて、複数種類の応答を生成する応答生成部61と、応答生成部61が生成した複数種類の応答の中から1つの応答を選択する対話制御部62と、対話制御部62により選択された応答の音声信号を生成する音声合成部63とに分けることができる。以下、これら音声認識部60、応答生成部61、対話制御部62及び音声合成部63の処理について説明する。
【0037】
(2−1)音声認識部60の処理
音声認識部60においては、マイクロホン51(図5)から与えられる音声信号S1Bに基づいてユーザの発話内容を音声認識し、当該認識結果を文字列のデータ(以下、これを認識文字列データと呼ぶ)D1として対話制御部62を介して応答生成部61に送出する。なお、認識文字列データD1には、かかる認識処理時に得られたイントネーションやアクセント等の韻律情報などのパラ言語も含まれ、例えばユーザ発話の語尾の韻律が何らかの質問をするときの韻律であると判断された場合には、「?」という文字がその発話に対する一連の文字列の最後尾に付加される。
【0038】
(2−2)応答生成部61の処理
応答生成部61においては、ユーザの発話に対して相槌を打つような応答を生成する「あいづち」用の応答生成モジュール61Aと、ユーザの発話内容に応じて当該ユーザに次の発話を促すような応答を生成する「発話を促す」用の応答生成モジュール61Bと、ユーザの発話を繰り返した応答を生成する「繰り返し」用の応答生成モジュール61Cと、ユーザの発話内容に共感した応答を生成する「共感」用の応答生成モジュール61Dと、ユーザからの明らかな質問に対して答えるための応答を生成する「質問応答」用の応答生成モジュール61Eとから構成される。
【0039】
この場合、各応答生成モジュール61A〜61Eは、それぞれユーザの発話内容に応じてどのような応答を返すべきかを予め規定したルールのデータ(以下、このルールを応答生成ルールと呼び、そのデータを応答生成ルールデータと呼ぶ)を例えば外部メモリ58(図5)内に有しており、音声認識部60から認識文字列データD1が与えられると、対応する応答生成ルールに従って、この文認識字列データD1に基づき得られるユーザの発話内容に対する応答を生成し、その文字列データ(以下、これを応答文字列データと呼ぶ)D2A〜D2Eを対話制御部62に送出する。
【0040】
具体的には、応答生成ルールは、例えば図7に示すように、音声認識部からの認識文字列データD1に基づき得られる一連の文字列内に含まれると予想される(すなわちユーザが発話すると予想される)予め登録された文字列(以下、これを登録文字列と呼ぶ)と、これに対するロボットの予め定められた応答の候補(以下、これを単に応答候補と呼ぶ)との対応付けとして規定されている。
【0041】
この図7において、「→」の記号は登録文字列と応答候補との対応付けを意味し、これよりも上側に記述された「″″」内の「|」で区切られた各文字列がそれぞれ登録文字列を示し、下側に記述された「″″」内の「|」で区切られた各文字列が、それぞれ「→」によりその登録文字列に対応付けられた応答候補を示す。
【0042】
そして各応答生成モジュール61A〜61Eには、それぞれ生成すべき応答のカテゴリ(「あいづち」、「発話を促す」、「繰り返し」、「共感」又は「質問応答」)に対応させた、このような応答生成ルールがそれぞれ別個に1又は複数予め用意され、これらのデータが応答生成ルールデータとして外部メモリ58に格納されている。
【0043】
そして各応答生成モジュール61A〜61Eは、音声認識部60から与えられる認識文字列データD1に基づき得られる一連の文字列(以下、これを入力文字列と呼ぶ)内に、対応するいずれかの応答生成ルールのいずれかの登録文字列と一致する文字列が存在するか否かを、当該入力文字列と、対応する全ての登録入力文字列との文字列マッチング処理により常時監視する。さらに各応答生成モジュール61A〜61Eは、この文字列マッチング処理により入力文字列内に登録文字列を検出すると、その登録文字列に対応する応答生成ルールに従って、対応する1又は複数の応答候補の中から1つの応答候補をランダムに選択し、当該選択した応答候補に基づいて応答の認識文字列データD2A〜D2Eを生成して、これを対話制御部62に送出する。
【0044】
従って、例えば図7に示す場合において、入力文字列内に『こんにちは』又は『おっす』が含まれることを文字列マッチング処理により検出したときには、『こんにちは』又は『やあ』という応答候補の中から1つの応答候補が選択され、その文字列データが生成されて、これが応答文字列データD2A〜D2Eとして対話制御部62に送出されることとなる。
【0045】
また登録文字列及び応答候補については正規表現が利用でき、例えば図8に示すように応答生成ルールが記述されている場合には、入力文字列内に『ごめん』、『ごめんね』、『ごめんなさい』、『ごめんよ』という文字列が含まれていることを文字列マッチング処理により検出したときには、『いや、そういうつもりじゃなかったんだ』、『そんな、あやまらなくてもいいよ』という応答候補の中から1つの応答候補が選択され、その文字列データが生成されて、応答文字列データD2A〜D2Eとして対話制御部62に送出されることとなる。
【0046】
さらに応答生成ルールはユーザの発話を応答で引用することが可能であり、例えば図9のように応答生成ルールが記述されている場合には、「<.+>」でマッチした文字列が「$ADJ$」という変数に格納され、次のロボットの応答における「$ADJ$」の部分で利用される。なお、「<.+>」は、予め登録されたいずれかの1文字以上の文字列(以下、繰返し用登録文字列)とマッチすることを意味する。従って、入力文字列内に例えば『明日は晴れないかなあ』、『明日は晴れないかなぁ』という文字列が含まれていることを文字列マッチング処理により検出した場合において、『明日は晴れな』という文字列が繰返し用文字列として登録されていたときには、この応答生成ルールが発火して、『明日は晴れないと思っているんだ』という応答文字列データD2A〜D2Eが生成されて対話制御部63に送出されることとなる。
【0047】
なお、各応答生成モジュールD2A〜D2Eに対するいくつかの応答生成ルールの例を図10〜図14にそれぞれ示す。
【0048】
この場合、図10は、「あいづち」用の応答生成モジュール61Aに対して用意された応答生成ルールの一例であり、「<.+>$UNKNOWN ANY$」は「全ての入力文字列」を意味する。従って、「あいづち」用の応答生成モジュール61Aは、音声認識部からの文字列データに基づいてどのような文字列の入力があった場合においても、『へぇ』、『ふーん』、『なるほどなるほど』等の応答候補の中から1つの応答候補を選択し、その文字列データを生成して応答文字列データD2Aとして対話制御部62に送出することとなる。
【0049】
また図11は、「発話を促す」用の応答生成モジュール61Bに対して用意される一部の応答生成ルールを例示したものであり、当該応答生成モジュール61Bは、例えば入力文字列の最後(すなわちユーザが発話の語尾に相当する部分であり、「 END 」がこれを示す)に『るし』、『だし』、『ないし』という文字列を検出したときには、『うんうん。』『それで?』、『それから?』という3種類の応答候補の中から1つの応答候補をランダムに選択し、当該選択した応答候補の文字列データを生成して、これを応答文字列データD2Bとして対話制御部62に送出することとなる。
【0050】
さらに図12〜図14は、それぞれ「繰り返し」、「共感」又は「質問応答」用の各応答生成モジュール61C〜61Eに対するものであり、これら応答生成ルールに基づく各応答生成モジュール61C〜61Eの処理は上述と同様であるので、説明は省略する。
【0051】
因みに、各応答生成モジュール61A〜61Eは、入力文字列と、対応する全ての登録文字列との文字列マッチング処理によりマッチングがとれなかった(すなわち入力文字列内に、対応する全ての応答生成ルールで規定された全ての登録文字列が含まれていなかった)場合には、応答文字列データD2A〜D2Eを生成することができず、この場合には「失敗」した旨の情報を対話制御部62に通知する。
【0052】
従って、例えば全ての応答生成モジュール61A〜61Eが応答生成に失敗してしまった場合には、ロボット1が応答が返せないという事態が発生することとなるが、本実施の形態によるロボット1においては、上述のように「あいづち」用の応答生成モジュール61Aが音声認識部60からの認識文字列データD1に基づいてどのような文字列の入力があった場合にも必ず何らかの応答文字列データD2Aを対話制御部62に送出するため、対話が不自然に途切れるのを防止することができる。
【0053】
(2−3)対話制御部62の処理
一方、対話制御部62においては、全ての応答生成モジュール61A〜61Eから上述のように応答文字列データD2A〜D2E又は応答生成に失敗した旨の通知が与えられると、そのうち応答生成に成功した各応答生成モジュール61A〜61Eから与えられた応答文字列データD2A〜D2Eのうちの1つを選択し、これを応答データD3として音声合成部63に送出する。
【0054】
ここで、この実施の形態においては、カウンセリング分野における相手の話を聞く際のテクニックを利用して、ユーザとの対話が自然なかたちで円滑に行い得るように、対話制御部62が応答生成に成功した各応答生成モジュール61A〜61Dの出力の中から1つを選択するような工夫がなされている。
【0055】
すなわちカウンセリング分野においては、相手の話の聞き方として、「うなずく」、「沈黙する」等のように、受動的に相手の話を聞くパッシブリスニングと呼ばれる聞き方と、相手の話を「繰り返す」、「まとめる」、「発話を促す」等のように、積極的に相手の話を聞くアクティブリスニングと呼ばれる聞き方の2種類があるとされ、これらパッシブリスニング及びアクティブリスニングを3:6の割合で行い、残り1割を相手からの明らかな質問に対する答えとする聞き方が良いとされている。
【0056】
そこで本実施の形態においては、パッシブリスニングに該当する応答を出力する「あいづち」用の応答生成モジュール61Aにより生成された応答が最終的にロボット1の応答として出力される割合(以下、これを出力割合と呼ぶ)として0.3を割り当て、アクティブリスニングに該当する応答を出力する「発話を促す」用の応答生成モジュール61B及び「繰り返し」用の応答生成モジュール61Cにより生成された応答の出力割合としてそれぞれ0.35及び0.25を割り当て、残りの0.1を「共感」用の応答生成モジュール61Dから出力される応答の出力割合に割り当てている。
【0057】
そして対話制御部62は、ユーザの発話に対して応答生成に成功した各応答生成モジュール61A〜61Eからそれぞれ応答文字列データD2A〜D2Eが与えられると、「質問応答」用の応答生成モジュール61Eを除く残りの各応答生成モジュール61A〜61Dについて、それぞれ事前設定された上述の出力割合に対する実際の出力割合を所定の評価関数を用いて評価し、この評価結果に基づいて、これら与えられた各応答文字列データD2A〜D2Dの中から1つを選択するようになされている。
【0058】
この場合、かかる評価関数としては種々のものを利用することができるが、この実施の形態においては、最小二乗誤差を利用するようになされており、例えば「あいづち」用の応答生成モジュール61Aについての最小二乗誤差は、そのときの応答を含めたロボット1全体としての応答回数をn、「あいづち」用、「発話を促す」用、「繰り返し」用又は「共感」用の各応答生成モジュール61A〜61Dに対して予め設定された出力割合をそれぞれpm1、pm2、pm33、pm4、これら各応答生成モジュール61A〜61Eのそのときまでの実際の出力割合をそれぞれpm1(n)、pm2(n)、pm3(n)、pm4(n)として、次式
【0059】
【数1】
Figure 0004062591
【0060】
により算出することとしている。また他の応答生成モジュール61B〜61Dについても同様である。
【0061】
そして対話制御部62は、このようにして得られた「質問応答」用の応答生成モジュール61E以外の応答生成に成功した各応答生成モジュール61A〜61Dについての評価結果(算出された最小二乗誤差)に基づいて、最小二乗誤差が最も小さい応答生成モジュール61A〜61Dからの応答文字列データD2A〜D2Dを選択し、これを応答データD3として音声合成部63に送出する。なお、対話制御部62は、応答生成に成功した応答生成モジュールが「あいづち」用の応答生成モジュール61Aだけであった場合には、上述のような評価を行わず、当該応答生成モジュール61Aからの応答文字列データD2Aを応答データD3として音声合成部63に送出する。
【0062】
ただし、このような所定の評価関数を用いた評価による選択だけでは、例えばユーザからの明らかな質問に対してその質問に対する答え以外の応答が出力されると会話が不自然となる問題がある。
【0063】
そこでこの実施の形態においては、「質問応答」用の応答生成モジュール61Eを特別の応答生成モジュールとし、この応答生成モジュール61Eから応答文字列データD2Eが出力された場合には、他の応答生成モジュール61A〜61Dからの応答文字列データD2A〜D2Dの出力の有無に拘わりなく、対話制御部62がこれを優先的に選択して、音声合成部63に応答データD3として出力するようになされている。これによりこのロボット1においては、ユーザとより自然なかたちでの対話を行い得るようになされている。
【0064】
なお図15に、このような応答選択処理の具体例を示す。この図15において、例えば『ねえ、聞いてよ。』というユーザの発話に対して「あいづち」用及び「発話を促す」用の応答生成モジュール61A、61Bが応答生成に成功しており、このとき対話制御部62は、これら「あいづち」用及び「発話を促す」用の応答生成モジュール61A、61Bについて、そのときの評価値を上述のように最小二乗誤差を利用して演算する。そしてこれら応答生成モジュール61A、61Bに対する評価値がそれぞれ「0.685」及び「0.585」であったので、対話制御部62は、評価値が小さい「発話を促す」用の応答生成モジュール61Bからの応答文字列データD2Bを選択し、これを応答データD3として音声合成部63に送出する。なおこの図15においては、各ユーザ発話に対応する欄が空白の応答生成モジュール61A〜61Eは、応答生成に失敗したことを意味する。
【0065】
またこれに続く『昨日彼とデートしたんだけどね。』というユーザの発話に対して「あいづち」用の応答生成モジュール61Aのみが応答生成に成功しており、このため対話制御部62は、この応答生成モジュール61Aからの応答文字列データD2Aを応答データD3として音声合成部63に送出する。
【0066】
さらにこの後、『デートでけんかしちゃうなんて最悪だと思わない?』というユーザの発話に対して「質問応答」用の応答生成モジュール61Eが応答生成に成功しており、このため対話制御部62は、他の応答生成に成功した応答生成モジュール61A、61Dに対する評価を行うことなく、「質問応答」用の応答生成モジュール61Eからの応答文字列データD2Eを応答データD3として音声合成部63に送出する。
【0067】
この結果、このような対話制御部62の制御により、ユーザ及びロボット1間で図16に示すような対話が行われることとなる。
【0068】
(2−4)音声合成部63の処理
音声合成部63においては、対話制御部62から与えられる応答データD3に基づいて音声合成処理を行うことにより音声信号S3を生成し、これをスピーカ54(図5)に出力する。この結果、この音声信号S3に基づいて、かかる応答データD3に応じた応答がロボット1から外部に出力される。
【0069】
(3)応答生成に関する対話制御部62の処理
ここで対話制御部62は、図17に示す応答処理手順RT1に従って上述のような各種処理を実行する。
【0070】
すなわち対話制御部62は、ロボット1の電源が投入されると、図17に示す応答処理手順RT1をステップSP0において開始し、続くステップSP1において、外部メモリ58(図5)に格納された応答生成モジュール61A〜61Eごとの事前設定された出力割合のデータを読み込んだ後、ステップSP2に進んで、「あいづち」用、「発話を促す」用、「繰り返し」用、「共感」用及び「質問応答」用の各対話生成モジュール61A〜61Eを起動し、この後ステップSP3に進んで、音声認識部60からユーザ発話の音声認識結果(すなわち認識文字列データD1)が与えられるのを待ち受ける。
【0071】
そして対話制御部62は、やがてユーザがロボット1に話し掛けることにより音声認識部60から認識文字列データD1が与えられると、ステップSP4に進んで、この認識文字列データD1を各応答生成モジュール61A〜61Eに送出し、この後ステップSP5に進んで、これら全ての応答生成モジュール61A〜61Eから応答文字列データD2A〜D2E又は応答生成が失敗した旨の情報が与えられるのを待ち受ける。
【0072】
また対話制御部62は、やがて全ての応答生成モジュール61A〜61Eから応答文字列データD2A〜D2E又は応答生成が失敗した旨の情報が供給されると、ステップSP6に進んで、「質問応答」用の応答生成モジュール61Eから応答文字列データD2Eが供給されたか否かを判断する。
【0073】
そして対話制御部62は、このステップSP6において肯定結果を得ると、ステップSP7に進んで、応答データD3として出力すべき応答文字列データとして「質問応答」用の応答生成モジュール61Eから与えられた応答文字列データD2Eを選択し、これを音声合成部63に送出する。また対話制御部62は、この後ステップSP3に戻って、音声認識部60から次の認識文字列データD1が供給されるのを待ち受ける。
【0074】
これに対して対話制御部62は、ステップSP6において否定結果を得ると、ステップSP7に進んで、「質問応答」用の応答生成モジュール61E以外の応答生成に成功した各応答生成モジュール61A〜61Dについて、上述の(1)式で与えられる評価関数f(n)を用いた評価値の演算処理を実行する。
【0075】
次いで、対数制御部62は、ステップSP9に進み、ステップSP8において算出した各応答生成モジュール61A〜61Dの評価値に基づいて、これら応答生成に成功した各応答生成モジュール61A〜61Dの中から当該評価値が最も小さい応答生成モジュール61A〜61Dから与えられた応答文字列データD2A〜D2Dを応答データD3として音声合成部63に送出する。
【0076】
さらに対話制御部62は、ステップSP10に進んで、当該応答文字列データD2を出力した(すなわち、そのとき最も評価値が小さかった)応答生成モジュール61A〜61Dに対応するカウンタのカウント値を1つ増加させた後、ステップSP3に戻って、この後は上述と同様の処理を繰り返す。
【0077】
このようにしてこのロボット1においては、対話制御部62の制御のもとに、ユーザとの自然なかたちでの円滑な対話を行い得るようになされている。
【0078】
(4)本実施の形態の動作及び効果
以上の構成において、このロボット1では、ユーザが発話すると、その音声認識結果が各応答生成ジュール61A〜61Eに与えられ、これら各応答生成ジュール61A〜61Eによりそのユーザの発話内容に応じた応答が一斉に生成される。
【0079】
そしてこれら各応答生成ジュール61A〜61Eにより生成された応答の中から1つの応答が対話制御部62によって選択され、その選択された応答がスピーカ54から音声出力される。
【0080】
従ってこのロボット1では、例えば状態遷移図やスロットフィリングによって全てのユーザ発話を予測してシステムの応答を記述しておく場合に比べて設計や構成を格段的に容易化及び簡易化させることができ、また雑談等の目的のない対話にも実用上十分に対応することができる。
【0081】
さらにこのロボット1では、この際「あいづち」用の応答生成ジュール61Aが必ず応答を生成するようにしているためロボット1が応答できないという事態の発生を防止することができ、その分ユーザとより自然な対話を行うことができる。
【0082】
さらにこのロボット1では、所定の評価関数を用いてロボット1の応答全体としてシステム作成者が意図した割合で各種カテゴリ(「あいづち」、「発話を促す」等)の応答を出力させることができるため、その割合を調整することによって種種の個性を有するロボット1を容易に作製できる。
【0083】
以上の構成によれば、ユーザ発話に対する応答を生成する応答生成モジュール61A〜61Eを複数設け、これら応答生成モジュール61A〜61Eが生成した応答の中から1つの応答を選択して出力するようにしたことにより、雑談等の目的のない対話にも実用上十分に対応することができ、また例えば状態遷移図やスロットフィリングによって全てのユーザ発話を予測してシステムの応答を記述しておく場合に比べて設計や構成を格段的に容易化及び簡易化させることができ、かくして自然な対話を行い得る簡易な構成のロボット1を実現できる。
【0084】
(5)他の実施の形態
なお上述の実施の形態においては、本発明を図1〜図5のように構成されたヒューマノイド型のロボット1に適用するようにした場合について述べたが、本発明はこれに限らず、この他種々の構成の装置に広く適用することができる。
【0085】
また上述の実施の形態においては、音声認識部60の認識結果に基づき、別個の応答生成ルールに従って、対話相手の発話に対する応答を生成する複数の応答生成手段として、ユーザの発話に対して相槌を打つような応答を生成する「あいづち」用の応答生成モジュール61Aと、ユーザの発話内容に応じて当該ユーザに次の発話を促すような応答を生成する「発話を促す」用の応答生成モジュール61Bと、ユーザの発話を繰り返した応答を生成する「繰り返し」用の応答生成モジュール61Cと、ユーザの発話内容に共感した応答を生成する「共感」用の応答生成モジュール61Dと、ユーザからの明らかな質問に対して答えるための応答を生成する「質問応答」用の応答生成モジュール61Eとの5つの応答生成モジュール61A〜61Eを設けるようにした場合について述べたが、本発明はこれに限らず、応答生成手段の数及びこれら応答生成手段がそれぞれ生成する応答のカテゴリ(「あいづち」、「発話を促す」、「繰り返し」、「共感」及び「質問応答」)として、これ以外の数及びカテゴリを適用するようにしても良い。この場合において、「冗談」というカテゴリを設け、ロボット1に適当な割合で冗談を音声出力させるようにしても良く、このようにすることによってロボット1のエンターテインメント性を向上させることができる。
【0086】
さらに上述の実施の形態においては、応答生成ルールを図7〜図9について説明したように規定するようにした場合について述べたが、本発明はこれに限らず、これ以外の種々のルールを適用するようにしても良い。
【0087】
さらに上述の実施の形態においては、各応答生成モジュール61A〜61Eによりそれぞれ生成された応答の中から1つの応答を所定の評価関数を用いた評価結果に基づいて選択する選択手段としての対話制御部62が、当該評価関数として最小二乗誤差の演算関数を用いる(すなわち最小二乗誤差を用いて1つの応答を選択する)ようにした場合について述べたが、本発明はこれに限らず、この他種々の評価関数を用いることができる。
【0088】
さらに上述の実施の形態においては、対話制御部62により選択された応答を外部に音声出力する音声出力手段を、音声合成部63及びスピーカから構成するようにした場合について述べたが、本発明はこれに限らず、この他種々の構成を広く適用することができる。
【0089】
さらに上述の実施の形態においては、各応答生成モジュール61A〜61Eによりそれぞれ生成された応答の中から1つの応答を選択する際に利用する評価関数を1つのみしか用いないようにした場合について述べたが、本発明はこれに限らず、例えば評価関数を複数種類用意し、対話相手の話し方の特徴を踏まえた上で、その特徴に合わせた評価関数を用いたり、又は1つの評価関数のパラメータを対話相手に応じて変化させるようにしても良い。このようにすることによって、例えばロボット1と初対面の人との会話は、なるべく自分のことを多く話すように、またロボット1自身のことをよく知っていて、自分のことを話すことが好きな人との会話では、なるべくその人の話を聞くような応答を返すといった対話相手に応じた応答を返すことができるようになる。
【0090】
さらに上述の実施の形態においては、応答として音声出力を行うだけの場合について述べたが、本発明はこれに限らず、例えば『うんうん』という応答に併せてうなずきながら首を縦に振るというように、音声による応答と共にこの内容に応じた動作をロボット1に発現させるようにしても良い。
【0091】
さらに上述の実施の形態においては、音声認識部60からの認識文字列データD1に基づいてどのような文字列の入力があった場合にも必ず何らかの応答文字列データD2Aを対話制御部62に送出する応答生成モジュールを1つ(「あいづち」用の応答生成モジュール61)設けるようにした場合について述べたが、本発明はこれに限らず、このような応答生成モジュールを複数設けるようにしても良い。
【0092】
さらに上述の実施の形態においては、「質問応答」用の応答生成モジュール61Eを、その出力を優先的に出力する特別の応答生成モジュールとするようにした場合について述べたが、本発明はこれに限らず、これ以外の例えば「あいさつ」用の応答生成モジュールを設けて、これを特別の応答生成モジュールとするようにしても良い。またこのような特別の応答生成モジュールを複数種類設けるようにしても良く、このようにすることによってロボット1により自然な対話を行わせるようにすることができる。
【0093】
さらに上述の実施の形態においては、本発明を、エンターテインメント用のロボット1に適用するようにした場合について述べたが、本発明はこれに限らず、例えば医療現場におけるカウンセリング用のロボット等にも適用することができる。
【0094】
【発明の効果】
以上のように本発明によれば、対話処理装置において、対話相手の発話を音声認識し認識文字列を生成する音声認識手段と、対話相手の発話内容を表す文字列に対し互いに異なるカテゴリの応答候補を表す文字列が対応付けられた別個の応答生成ルールに従って、認識文字列に対する応答候補文字列を生成可能な場合に当該応答候補文字列それぞれ生成する複数の応答生成手段と、カテゴリごとに選択されるべき割合がそれぞれ割り当てられた評価関数に基づき、各応答生成手段によりそれぞれ生成された応答候補文字列の中から1つの応答候補文字列応答文字列として選択する選択手段と、応答文字列基に応答音声を生成し外部に音声出力する音声出力手段とを設けるようにしたことにより、雑談等の目的のない対話にも実用上十分に対応することができ、また例えば状態遷移図やスロットフィリングによって全てのユーザ発話を予測してシステムの応答を記述しておく場合に比べて設計や構成を格段的に容易化及び簡易化させることができ、かくして自然な対話を行い得る簡易な構成の対話処理装置を実現できる。
【0095】
また本発明によれば、対話処理方法において、対話相手の発話を音声認識し認識文字列を生成する第1のステップと、認識文字列に対する応答候補文字列をそれぞれ生成する複数の応答手段が、対話相手の発話内容を表す文字列に対し互いに異なるカテゴリの応答候補を表す文字列が対応付けられた別個の応答生成ルールに従って、認識文字列に対する応答候補文字列を生成可能な場合に当該応答候補文字列をそれぞれ生成する第2のステップと、応答文字列を選択する選択手段が、カテゴリごとに選択されるべき割合がそれぞれ割り当てられた評価関数に基づき、各応答候補文字列の中から1つの応答候補文字列を応答文字列として選択する第3のステップと、応答文字列を基に応答音声を生成し外部に音声出力する第4のステップとを設けるようにしたことにより、雑談等の目的のない対話にも実用上十分に対応することができ、また例えば状態遷移図やスロットフィリングによって全てのユーザ発話を予測してシステムの応答を記述しておく場合に比べて装置の設計や構成を格段的に容易化及び簡易化させることができ、かくして装置構成を簡易化させながら、自然な対話を行い得るようにすることができる対話処理方法を実現できる。
【0096】
さらに本発明によれば、ロボット装置において、対話相手の発話を音声認識し認識文字列を生成する音声認識手段と、対話相手の発話内容を表す文字列に対し互いに異なるカテゴリの応答候補を表す文字列が対応付けられた別個の応答生成ルールに従って、認識文字列に対する応答候補文字列を生成可能な場合に当該応答候補文字列それぞれ生成する複数の応答生成手段と、カテゴリごとに選択されるべき割合がそれぞれ割り当てられた評価関数に基づき、各応答生成手段によりそれぞれ生成された各応答候補文字列の中から1つの応答候補文字列応答文字列として選択する選択手段と、応答文字列基に応答音声を生成し外部に音声出力する音声出力手段とを設けるようにしたことにより、雑談等の目的のない対話にも実用上十分に対応することができ、また例えば状態遷移図やスロットフィリングによって全てのユーザ発話を予測してシステムの応答を記述しておく場合に比べて設計や構成を格段的に容易化及び簡易化させることができ、かくして自然な対話を行い得る簡易な構成のロボット装置を実現できる。
【0097】
【図面の簡単な説明】
【図1】本実施の形態によるロボットの外部構成を示す斜視図である。
【図2】ロボットの外部構成を示す斜視図である。
【図3】ロボットの外部構成の説明に供する略線図である。
【図4】ロボットの内部構成の説明に供するブロック図である。
【図5】ロボットの内部構成の説明に供するブロック図である。
【図6】メイン制御部の処理内容の説明に供するブロック図である。
【図7】応答生成ルールの説明に供する概念図である。
【図8】応答生成ルールの説明に供する概念図である。
【図9】応答生成ルールの説明に供する概念図である。
【図10】「あいづち」用の応答生成ルール例を示す概念図である。
【図11】「発話を促す」用の応答生成ルール例を示す概念図である。
【図12】「繰り返し」用の応答生成ルール例を示す概念図である。
【図13】「共感」用の応答生成ルール例を示す概念図である。
【図14】「質問応答」用の応答生成ルール例を示す概念図である。
【図15】対話制御の具体例の説明に供する図表である。
【図16】ユーザ及びロボットの対話例を示す概念図である。
【図17】応答処理手順を示すフローチャートである。
【符号の説明】
1……ロボット、40……メイン制御部、51……マイクロホン、54……スピーカ、58……外部メモリ、60……音声認識部、61……応答生成部、61A〜61E……応答生成モジュール、62……対話制御部、63……音声合成部、D1……認識文字列データ、D2A〜D2E……応答文字列データ、D3……応答データ、S1B、S3……音声信号、RT1……応答処理手順。

Claims (7)

  1. 対話相手の発話を音声認識し認識文字列を生成する音声認識手段と、
    上記対話相手の発話内容を表す文字列に対し互いに異なるカテゴリの応答候補を表す文字列が対応付けられた別個の応答生成ルールに従って、上記認識文字列に対する応答候補文字列を生成可能な場合に当該応答候補文字列をそれぞれ生成する複数の応答生成手段と、
    上記カテゴリごとに選択されるべき割合がそれぞれ割り当てられた評価関数に基づき、各上記応答生成手段によりそれぞれ生成された上記応答候補文字列の中から1つの上記応答候補文字列を応答文字列として選択する選択手段と、
    上記応答文字列を基に応答音声を生成し外部に音声出力する音声出力手段と
    を具えることを特徴とする対話処理装置。
  2. 上記複数の応答生成手段のうちの少なくとも1つの上記応答生成手段が、上記対話相手の上記発話の内容に拘わりなく、必ず上記応答候補文字列を生成する
    ことを特徴とする請求項1に記載の対話処理装置。
  3. 上記選択手段は、
    各上記応答生成手段に対してそれぞれ予め設定された、上記応答候補文字列が最終的に上記応答文字列として選択されるべき割合と、各上記応答生成手段の上記応答候補文字列が上記応答文字列として実際に選択された割合との誤差を縮小するよう、各上記応答生成手段によりそれぞれ生成された上記応答の中から1つの応答を選択する
    ことを特徴とする請求項1に記載の対話処理装置。
  4. 上記選択手段は、
    上記複数の応答生成手段のうちの特定の上記応答生成手段が上記応答候補文字列を生成したときには、上記評価関数による評価結果に拘わらず当該応答候補文字列を優先的に上記応答文字列として選択する
    ことを特徴とする請求項1に記載の対話処理装置。
  5. 上記選択手段は、
    上記対話相手ごとに上記評価関数を変更する
    ことを特徴とする請求項1に記載の対話処理装置。
  6. 対話相手の発話を音声認識し認識文字列を生成する第1のステップと、
    上記認識文字列に対する応答候補文字列をそれぞれ生成する複数の応答手段が、上記対話相手の発話内容を表す文字列に対し互いに異なるカテゴリの応答候補を表す文字列が対応付けられた別個の応答生成ルールに従って、上記認識文字列に対する応答候補文字列を生成可能な場合に当該応答候補文字列をそれぞれ生成する第2のステップと、
    応答文字列を選択する選択手段が、上記カテゴリごとに選択されるべき割合がそれぞれ割り当てられた評価関数に基づき、各上記応答候補文字列の中から1つの上記応答候補文字列を上記応答文字列として選択する第3のステップと、
    上記応答文字列を基に応答音声を生成し外部に音声出力する第4のステップと
    を具えることを特徴とする対話処理方法。
  7. 対話相手の発話を音声認識し認識文字列を生成する音声認識手段と、
    上記対話相手の発話内容を表す文字列に対し互いに異なるカテゴリの応答候補を表す文字列が対応付けられた別個の応答生成ルールに従って、上記認識文字列に対する応答候補文字列を生成可能な場合に当該応答候補文字列をそれぞれ生成する複数の応答生成手段と、
    上記カテゴリごとに選択されるべき割合がそれぞれ割り当てられた評価関数に基づき、各上記応答生成手段によりそれぞれ生成された各上記応答候補文字列の中から1つの上記応答候補文字列を応答文字列として選択する選択手段と、
    上記応答文字列を基に応答音声を生成し外部に音声出力する音声出力手段と
    を具えることを特徴とするロボット装置。
JP2002060427A 2002-03-06 2002-03-06 対話処理装置及び方法並びにロボット装置 Expired - Fee Related JP4062591B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002060427A JP4062591B2 (ja) 2002-03-06 2002-03-06 対話処理装置及び方法並びにロボット装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002060427A JP4062591B2 (ja) 2002-03-06 2002-03-06 対話処理装置及び方法並びにロボット装置

Publications (3)

Publication Number Publication Date
JP2003255990A JP2003255990A (ja) 2003-09-10
JP2003255990A5 JP2003255990A5 (ja) 2005-09-02
JP4062591B2 true JP4062591B2 (ja) 2008-03-19

Family

ID=28669791

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002060427A Expired - Fee Related JP4062591B2 (ja) 2002-03-06 2002-03-06 対話処理装置及び方法並びにロボット装置

Country Status (1)

Country Link
JP (1) JP4062591B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4826275B2 (ja) * 2006-02-16 2011-11-30 株式会社豊田中央研究所 応答生成装置、方法及びプログラム
JP5251132B2 (ja) * 2008-01-09 2013-07-31 株式会社豊田中央研究所 応答生成装置、及び応答生成プログラム
JP5045486B2 (ja) * 2008-02-19 2012-10-10 トヨタ自動車株式会社 対話装置及びプログラム
JP2008186027A (ja) * 2008-04-03 2008-08-14 Toyota Central R&D Labs Inc 対話処理装置
JP5286062B2 (ja) * 2008-12-11 2013-09-11 日本電信電話株式会社 対話装置、対話方法、対話プログラムおよび記録媒体
JP2015127758A (ja) * 2013-12-27 2015-07-09 シャープ株式会社 応答制御装置、制御プログラム
JP2018067100A (ja) * 2016-10-18 2018-04-26 株式会社日立製作所 ロボット対話システム
JP7117951B2 (ja) * 2018-09-11 2022-08-15 株式会社デンソーアイティーラボラトリ 対話プラン作成支援装置、対話プラン作成支援方法、及びプログラム
JP7063230B2 (ja) * 2018-10-25 2022-05-09 トヨタ自動車株式会社 コミュニケーション装置およびコミュニケーション装置の制御プログラム
JPWO2021059771A1 (ja) * 2019-09-25 2021-04-01

Also Published As

Publication number Publication date
JP2003255990A (ja) 2003-09-10

Similar Documents

Publication Publication Date Title
JP6505748B2 (ja) 人間型ロボットとユーザーの間におけるマルチモード会話を実行する方法、前記方法を実装するコンピュータプログラム及び人間型ロボット
US11358285B2 (en) Robot and method of recognizing mood using the same
US7526363B2 (en) Robot for participating in a joint performance with a human partner
US7251606B2 (en) Robot device with changing dialogue and control method therefor and storage medium
EP1256931A1 (en) Method and apparatus for voice synthesis and robot apparatus
JP2003255991A (ja) 対話制御システム、対話制御方法及びロボット装置
JP2003271174A (ja) 音声合成方法、音声合成装置、プログラム及び記録媒体、制約情報生成方法及び装置、並びにロボット装置
JP2004090109A (ja) ロボット装置およびロボット装置の対話方法
JP4062591B2 (ja) 対話処理装置及び方法並びにロボット装置
Pulasinghe et al. Modular fuzzy-neuro controller driven by spoken language commands
Lison et al. Spoken dialogue systems: the new frontier in human-computer interaction
US20060177802A1 (en) Audio conversation device, method, and robot device
JP2006123136A (ja) コミュニケーションロボット
Miura et al. Unconscious anchoring in maternal imitation that helps find the correspondence of a caregiver's vowel categories
JP4433273B2 (ja) ロボット装置及びロボット装置の制御方法
John et al. Assistive device for physically challenged persons using voice controlled intelligent robotic arm
Ktistakis et al. A multimodal human-machine interaction scheme for an intelligent robotic nurse
Yoshikawa et al. Primary vowel imitation between agents with different articulation parameters by parrot-like teaching
Geiger et al. The robot ALIAS as a gaming platform for elderly persons
Kanda et al. A tension-moderating mechanism for promoting speech-based human-robot interaction
Yoshikawa et al. Multimodal joint attention through cross facilitative learning based on μx principle
Kanda et al. 7.2 Moderating Users’ Tension to Enable Them to Exhibit Other Emotions
Lin et al. Nonverbal acoustic communication in human-computer interaction
Komatani et al. Recognition of emotional states in spoken dialogue with a robot
KR102147835B1 (ko) 인터랙티브 로봇의 발화 및 제스처 속성 결정 장치 및 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050304

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070717

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070727

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071220

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110111

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120111

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees