JP5045486B2 - 対話装置及びプログラム - Google Patents

対話装置及びプログラム Download PDF

Info

Publication number
JP5045486B2
JP5045486B2 JP2008038069A JP2008038069A JP5045486B2 JP 5045486 B2 JP5045486 B2 JP 5045486B2 JP 2008038069 A JP2008038069 A JP 2008038069A JP 2008038069 A JP2008038069 A JP 2008038069A JP 5045486 B2 JP5045486 B2 JP 5045486B2
Authority
JP
Japan
Prior art keywords
user
question
input
sentence
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008038069A
Other languages
English (en)
Other versions
JP2009198614A (ja
Inventor
貴克 吉村
和也 下岡
良子 堀田
博之 星野
雄介 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2008038069A priority Critical patent/JP5045486B2/ja
Publication of JP2009198614A publication Critical patent/JP2009198614A/ja
Application granted granted Critical
Publication of JP5045486B2 publication Critical patent/JP5045486B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、対話装置及びプログラムに係り、特に、ユーザによる発話又は入力文に応答して対話する対話装置及びプログラムに関する。
従来より、利用者の音声に対する制限を行わずとも、精度よく利用者の要求内容を把握して、利用者とのやりとりをスムーズに行えるようにする音声対話装置が知られている(特許文献1)。この音声対話装置は、システム主導型の対話システムとユーザ主導型の対話システムとを混在させ、認識結果や対話履歴に応じて、2種類の対話システムを適切に切り替えることで、システム主導型対話の頑健性を保ちつつ、ユーザ主導型対話の柔軟性を有している。
特開2003−228393号公報
しかしながら、上記の特許文献1に記載の技術では、想定外の入力に対しては、適切に応答することができない、という問題がある。例えば、音声認識の認識結果と共に出力される信頼度などを利用して、想定外の入力らしい時は、「もう一度言って下さい」などの定型文を応答することができるが、ユーザがシステムとは対話ができないと判断し、対話を中断してしまうため、対話を継続させることができない。
本発明は、上記の問題点を解決するためになされたもので、任意の入力に対して適切に応答することができ、対話を継続させることができる対話装置及びプログラムを提供することを目的とする。
の発明に係る対話装置は、ユーザによる発話及び入力文の少なくとも一方を入力する入力手段と、前記入力手段への入力がない状態が継続する時間を計測する無入力時間計測手段と、前記入力手段に入力された前記発話及び入力文の少なくとも一方が、前記ユーザの要求又は質問を表わしているか否かを判定する要求質問判定手段と、ユーザと自装置との対話における、自装置が自発的に情報を提供する情報提供型、自装置が自発的に質問する情報獲得型、ユーザの要求又は質問に対して自装置が回答する質問応答型、及びユーザが自発的に提供する情報を自装置が受理する情報受理型からなる対話型分類の遷移履歴を記憶する遷移履歴記憶手段と、前記無入力時間計測手段によって計測された時間が所定時間以上である場合には、過去の判別結果及び前記遷移履歴に基づいて、前記ユーザとの対話が、前記情報提供型及び情報獲得型の何れかであると判別し、前記要求質問判定手段によって前記ユーザの要求又は質問を表わしていると判定された場合には、前記ユーザとの対話が、前記質問応答型であると判別し、前記要求質問判定手段によって前記ユーザの要求又は質問を表わしていないと判定された場合には、前記ユーザとの対話が、前記情報受理型であると判別する対話型判別手段と、前記発話及び入力文の少なくとも一方に対して、前記対話型判別手段による判別結果に応じた応答文を生成する応答生成手段と、前記応答生成手段によって生成された応答文を出力する出力手段とを含んで構成されている。
の発明に係るプログラムは、コンピュータを、ユーザによる発話及び入力文の少なくとも一方を入力する入力手段への入力がない状態が継続する時間を計測する無入力時間計測手段、前記入力手段に入力された前記発話及び入力文の少なくとも一方が、前記ユーザの要求又は質問を表わしているか否かを判定する要求質問判定手段、ユーザと自装置との対話における、自装置が自発的に情報を提供する情報提供型、自装置が自発的に質問する情報獲得型、ユーザの要求又は質問に対して自装置が回答する質問応答型、及びユーザが自発的に提供する情報を自装置が受理する情報受理型からなる対話型分類の遷移履歴を記憶する遷移履歴記憶手段、前記無入力時間計測手段によって計測された時間が所定時間以上である場合には、過去の判別結果及び前記遷移履歴に基づいて、前記ユーザとの対話が、前記情報提供型及び情報獲得型の何れかであると判別し、前記要求質問判定手段によって前記ユーザの要求又は質問を表わしていると判定された場合には、前記ユーザとの対話が、前記質問応答型であると判別し、前記要求質問判定手段によって前記ユーザの要求又は質問を表わしていないと判定された場合には、前記ユーザとの対話が、前記情報受理型であると判別する対話型判別手段、及び前記発話及び入力文の少なくとも一方に対して、前記対話型判別手段による判別結果に応じた応答文を生成する応答生成手段として機能させるためのプログラムである。
の発明及び第の発明によれば、入力手段に、ユーザによる発話及び入力文の少なくとも一方が入力される。また、無入力時間計測手段によって、入力手段への入力がない状態が継続する時間を計測する。
また、要求質問判定手段によって、入力手段に入力された発話及び入力文の少なくとも一方が、ユーザの要求又は質問を表わしているか否かを判定する。
そして、対話型判別手段によって、無入力時間計測手段によって計測された時間が所定時間以上である場合には、過去の判別結果及び遷移履歴に基づいて、ユーザとの対話が、情報提供型及び情報獲得型の何れかであると判別する。また、要求質問判定手段によってユーザの要求又は質問を表わしていると判定された場合には、ユーザとの対話が、質問応答型であると判別する。また、要求質問判定手段によってユーザからの要求又は質問を表わしていないと判定された場合には、ユーザとの対話が、情報受理型であると判別する。
そして、応答生成手段によって、発話及び入力文の少なくとも一方に対して、対話型判別手段による判別結果に応じた応答文を生成する。出力手段によって、応答生成手段によって生成された応答文を出力する。
このように、無入力時間、対話型分類の遷移履歴、及び入力された発話又は入力文が要求又は質問を表わしているか否かに基づいて、ユーザとの対話の対話型分類が、情報提供型、情報獲得型、質問応答型、及び情報受理型の何れであるかを判別し、応答文を生成することにより、任意の入力に対して適切に応答することができ、対話を継続させることができる。
の発明に係る対話型判別手段は、要求質問判定手段によってユーザの要求又は質問を表わしていないと判定された場合には、過去の判別結果及び遷移履歴に基づいて、ユーザとの対話が、情報受理型及び情報獲得型の何れかであると判別することができる。これによって、入力された発話又は入力文が要求又は質問を表わしていない場合に、情報受理型及び情報獲得型の何れかであるかを更に判別することにより、任意の入力に対してより適切に応答することができる。
第1の発明に係る応答生成手段は、情報提供型であると判別された場合、ユーザに提供するための情報を複数記憶した情報データベースに記憶された複数の情報から選択した情報を用いて、応答文を生成することができる。
上記の応答生成手段は、質問応答型であると判別された場合、質問文又は要求文と質問文又は要求文に対する回答文とを対応させて記憶した質問回答データベースに記憶された質問文又は要求文から、発話及び入力文の少なくとも一方が表わす要求又は質問に対応する質問文又は要求文を検索し、検索された前記質問文又は要求文に対する回答文を用いて、応答文を生成することができる。
上記の対応装置は、入力手段によって入力された発話及び入力文の少なくとも一方の構造を解析する解析手段を更に含み、応答生成手段は、情報受理型であると判別された場合、構造と構造に対する応答文とを対応させて記憶した応答データベースに記憶され、かつ、解析手段によって解析された構造に対応する応答文を用いて、応答文を生成することができる。
の発明に係る応答生成手段は、情報獲得型であると判別された場合、ユーザへの質問文又は要求文を複数記憶した質問要求データベースに記憶された複数の質問文から選択した質問文を用いて、応答文を生成することができる。
上記の入力手段は、ユーザによる発話を入力し、要求質問判定手段は、入力手段から入力された発話について、音声の特徴量を抽出し、抽出した特徴量と、予め求められた質問又は要求を表わす発話の特徴量とを比較して、発話及び入力文の少なくとも一方が、ユーザの要求又は質問を表わしているか否かを判定することができる。
以上説明したように、本発明の対話装置及びプログラムによれば、無入力時間、及び入力された発話又は入力文が要求又は質問を表わしているか否かに基づいて、ユーザとの対話の対話型分類を判別し、応答文を生成することにより、任意の入力に対して適切に応答することができ、対話を継続させることができる、という効果が得られる。
以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、本実施の形態では、ユーザの発話に対して音声を利用して応答する対話装置に本発明を適用した場合について説明する。
図1に示すように、第1の実施の形態に係る対話装置10は、マイクロホンで構成され、かつ、ユーザ発話を集音して音声信号を生成する入力部12と、入力部12によって入力された音声信号に基づいて、応答発話を生成するコンピュータ14と、スピーカで構成され、かつ、生成された応答発話を音声出力する音声出力部16とを備えている。
コンピュータ14は、CPUと、RAMと、後述する応答生成処理ルーチンを実行するためのプログラムを記憶したROMとを備え、機能的には次に示すように構成されている。コンピュータ14は、入力部12から入力された信号から、入力音声を示す音声信号を切り出す音声切り出し部20と、入力部12から入力される信号に基づいて、入力音声が入力されない状態が継続している無入力時間を計測する無入力時間カウンタ22と、認識用辞書データベース(図示省略)に登録された単語を参照して、音声信号に基づいて、ユーザ発話を認識する音声認識部24と、音声信号に基づいて、音声の特徴量(例えば、継続長や基本周波数など)を抽出する特徴量抽出部26と、遷移履歴として、ユーザとの対話における後述する4種類の対話型分類の遷移確率を記憶した遷移確率記憶部28と、後述する対話型分類判別部34によって前回判別された結果を記憶する判別結果記憶部30と、記憶された遷移確率と前回の判別結果とに基づいて、現在の対話が各対話型分類である確率を算出する確率算出部32と、無入力時間カウンタ22によって計測された無入力時間、音声認識部24による認識結果、特徴量抽出部26によって抽出された特徴量、及び確率算出部32によって算出された確率に基づいて、ユーザとの対話を、4種類の対話型分類の何れかに判別する対話型分類判別部34とを備えている。
ここで、4種類の対話型分類について説明する。ユーザとの対話は、対話装置10がユーザに対して自発的に情報を提供する情報提供型対話、対話装置10がユーザに対して自発的に質問する情報獲得型対話、ユーザの要求又は質問に対して対話装置10が回答する質問応答型対話、及びユーザが自発的に提供する情報を対話装置10が受理する情報受理型対話の4種類の対話型分類に分類される。
情報提供型対話は、対話装置10側に対話の主導権があり、かつ、対話装置10が情報を提供することを想定した対話であり、対話装置10の状態や対話装置10に記憶された情報を、対話装置10が自発的にユーザに提供する対話である。例えば、ユーザが対話装置10に接近した場合や、対話装置10の前でユーザが無言でいる場合に、対話装置10が保持している情報(ニュースや、天気情報、対話装置10の扱い方に関する情報など)をユーザに提供する。
情報獲得型対話は、対話装置10側に対話の主導権があり、かつ、ユーザが対話装置10に対して情報を提供することを想定した対話であり、ユーザ自身の情報や要求、あるいは、ユーザが知っている情報に関して、対話装置10が自発的に質問する対話である。例えば、対話装置10が、ユーザに提供すべき情報を絞り込むために必要なユーザ情報を取得するための対話(「何について知りたい?」や「今日は何見に来たの?」など)をしたり、対話を継続させるための対話をしたりする。
質問応答型対話は、ユーザ側に対話の主導権があり、かつ、対話装置10がユーザに対して情報を提供することを想定した対話であり、対話装置10が、ユーザからの質問に対する回答を検索して回答する対話である。例えば、ユーザからの質問又は要求(「トイレはどこ?」や「何時までやってるの?」など)に対し、質問や要求の答えとなる情報をデータベースから検索して、ユーザに提供する。
情報受理型対話は、ユーザ側に対話の主導権があり、かつ、ユーザが対話装置10に対して情報を提供することを想定した対話であり、ユーザ自身の情報やユーザが知っている情報など、ユーザが自発的に提供する情報を、対話装置10が受理する対話である。例えば、ユーザからの質問又は要求以外の入力に対し、相槌を返したり(例えば、「僕、あっくんです。」に対して「へぇそうなんだ。」と応答する。)、問い返したり(例えば、「遊びに来たよ。」に対して「誰と来たの?」と応答する。)、話題を広げたり(例えば、「今日は天気がいいね。」に対して「洗濯物が良く乾くね。」と応答する。)して、上記の情報提供型対話、情報獲得型対話、及び質問応答型対話では想定していない入力に対して、可能な限り広く待ち受け、対話を継続させるための対話をする。
音声認識部24は、入力音声に基づいて、ユーザ発話を認識すると共に、各認識結果に対する信頼度を出力する。例えば、入力された発話が「今日の天気は?」であるとき、認識結果として、「今日の天気は?」、「今日天気。」、及び「今日天気がいい。」が得られると共に、「今日の天気は?」に対する信頼度「0.8」、「今日天気。」に対する信頼度「0.5」、及び「今日天気がいい。」に対する信頼度「0.3」が得られる。
特徴量抽出部25は、入力された音声信号から、音声の特徴量として基本周波数を抽出する。特徴量抽出部25により抽出される基本周波数に基づいて、音声の韻律が上がっているか否かを判断することができる。
遷移確率記憶部28は、図2に示すような、上記の4種類の対話型分類の遷移確率が遷移履歴を示す情報として記憶されている。ここで、遷移確率a_xyは、以下のように算出される。
まず、WOZ(Wizard of OZ)実験などで、以下に示すような正解の対話遷移履歴データを作成する。
ユーザ:遊びに来たよ。
対話装置:こんにちは、誰と来たの?(情報受理型対話)
ユーザ:友達と来たよ。
対話装置:へぇそうなんだ。(情報受理型対話)
対話装置:今日は○○が展示してあるよ。(情報提供型対話)
ユーザ:○○って何?
対話装置:今話題の××だよ。あの有名な△△が製作したものだよ。(質問応答型対話)
対話装置:○○に興味ある?(情報獲得型対話)
そして、上記のような対話遷移履歴データ(初期状態→情報受理型対話→情報受理型対話→情報提供型対話→質問応答型対話→情報獲得型対話)から、以下に(1)式に従って、対話型分類x→対話型分類yに遷移する遷移確率a_xyを計算する。
a_xy=
(対話型分類xから対話型分類yに遷移した回数)/(対話型分類xにいた回数)
・・・(1)
ただし、情報提供型対話を対話型分類1とし、情報獲得型対話を対話型分類2とし、質問応答型対話を対話型分類3とし、情報受理型対話を対話型分類4とする。
複数の対話遷移履歴データから、上記(1)式を用いて、4種類の対話型分類の遷移の全組み合わせについて遷移確率を算出して、遷移確率記憶部28に記憶する。
確率算出部32は、遷移確率記憶部28に記憶された遷移確率と、判別結果記憶部30に記憶された前回の判別結果としての対話型分類とに基づいて、前回の判別結果の対話型分類から所定の対話型分類への遷移確率を、現在の判別対象の対話の対話型分類が所定の対話型分類である確率として算出する。
対話型分類判別部34は、無入力時間カウンタ22によって計測された無入力時間が、5秒以上であると、確率算出部32によって算出された情報提供型対話である確率及び情報獲得型対話である確率に基づいて、現在のユーザとの対話が、情報提供型対話及び情報獲得型対話の何れかであると判別する。また、音声切り出し部20によって入力音声が切り出された場合には、音声認識部24の結果及び特徴量抽出部26によって抽出された音声の特徴量に基づいて、ユーザからの発話が、質問又は要求であるか否かを判定する。
質問又は要求であるか否かの判定では、音声認識部24で得られた信頼度が最も高い音声認識結果の文末の構造が、質問文又は要求文の構造(例えば、「〜か?」、「〜教えて」、又は「〜したい」)と同一であれば、ユーザからの発話が、質問又は要求であると判定する。また、音声の特徴量としての基本周波数を、予め求められた質問又は要求であるときの基本周波数(音声の最後で右上りになる基本周波数)と比較して、抽出された基本周波数と、質問又は要求であるときの予め求められた基本周波数とが類似していれば、ユーザからの発話が、質問又は要求であると判定する。
上記のように、ユーザからの発話が、質問又は要求であると判定された場合には、現在のユーザとの対話が、質問応答型対話であると判別し、質問又は要求でないと判定された場合には、確率算出部32によって算出された情報獲得型対話である確率及び情報受理型対話である確率に基づいて、現在のユーザとの対話が、情報獲得型対話及び情報受理型対話の何れかであると判別する。
また、対話装置10のコンピュータ14は、音声認識部24によって認識されたユーザからの発話、及び後述する応答生成部38によって生成された応答文を対話履歴として記憶する対話履歴記憶部36と、対話型分類判別部34によって判別された対話型分類、音声認識部24によって認識されたユーザからの発話、及び対話履歴記憶部36に記憶された対話履歴に基づいて、ユーザからの発話に対する応答文を生成する応答生成部38とを備えている。
応答生成部38は、図3に示すように、対話型分類判別部34により情報提供型対話であると判別されたときに、情報提供型対話に応じた応答文を生成する情報提供型応答生成部42と、対話型分類判別部34により情報獲得型対話であると判別されたときに、情報獲得型対話に応じた応答文を生成する情報獲得型応答生成部44と、対話型分類判別部34により質問応答型対話であると判別されたときに、質問応答型対話に応じた応答文を生成する質問応答型応答生成部46と、対話型分類判別部34により情報受理型対話であると判別されたときに、情報受理型対話に応じた応答文を生成する情報受理型応答生成部48とを備えている。
情報提供型応答生成部42は、ユーザに提供する情報を複数記憶した情報データベース42Aと、対話履歴記憶部36に記憶された対話履歴と情報データベース42Aの情報とに基づいて、情報提供型対話に応じた応答文を生成する応答文生成部42Bとを備えている。応答文生成部42Bは、対話履歴を利用して、情報データベース42Aからまだ出力されていない情報を選出し、選出された情報から、対話履歴から得られる前回のユーザからの発話に含まれる単語と最も関連深い情報を選択し、選択された情報を用いて応答文を生成する。
例えば、まだ出力されていない情報が、「今日は天気がいいね」や「今日は○○○が展示してあるよ」などであり、前回のユーザからの発話が「こんにちは」である場合には、「今日は天気がいいね」を選択して応答文を生成する。
情報獲得型応答生成部44は、ユーザへの質問文を複数記憶した質問データベース44Aと、対話履歴記憶部36に記憶された対話履歴と質問データベース44Aの質問文とに基づいて、情報獲得型対話に応じた応答文を生成する応答文生成部44Bとを備えている。応答文生成部44Bは、対話履歴を利用して、質問データベース44Aからまだ出力されていない質問文を選出し、選出された質問文から、対話履歴から得られる前回のユーザからの発話に含まれる単語と最も関連深い質問文を選択し、選択された質問文を用いて応答文を生成する。また、質問データベース44Aの中に、対話装置10が最も知りたい質問を示す質問文が存在する場合には、最も知りたい質問を示す質問文を選択し、選択された質問文を用いて応答文を生成する。
例えば、まだ出力されていない質問文が、「何について知りたい?」や「○○○(例えば、展示物の名称)に興味ある?」などであり、最も知りたい質問を示す質問文が「○○○(展示物の名称)に興味ある?」である場合には、「○○○(展示物の名称)に興味ある?」を選択して応答文を生成する。
質問応答型応答生成部46は、ユーザからの質問文又は要求文と質問文又は要求文に対する回答文とを対応させて複数記憶した質問回答データベース46Aと、対話履歴記憶部36に記憶された対話履歴と質問回答データベース46Aの回答文とに基づいて、質問応答型対話に応じた応答文を生成する応答文生成部46Bとを備えている。応答文生成部46Bは、対話履歴を利用して、質問回答データベース46Aからまだ出力されていない回答文を選出し、選出された回答文に対応する質問文から、音声認識部24から得られたユーザからの発話に最も一致する質問文を選択し、選択された質問文に対する回答文を用いて応答文を生成する。
例えば、まだ出力されていない回答文が、「案内カウンタの右奥にあるよ」や「2F特別展示室にあるよ」であり、これらの回答文に対する質問文「トイレはどこ?」及び「○○(展示物の名称)はどこにある?」から、音声認識結果である「トイレは?」に最も類似する質問文「トイレはどこ?」を選択し、選択された質問文に対応する回答文「案内カウンタの右奥にあるよ」を用いて応答文を生成する。
情報受理型応答生成部48は、文構造と文構造に対する応答文とを対応させて複数記憶した応答データベース48Aと、音声認識部24から得られたユーザからの発話の構造を解析する構造解析部48Cと、構造解析部48Cによって解析されたユーザからの発話の構造と応答データベース48Aの応答文とに基づいて、情報受理型対話に応じた応答文を生成する応答文生成部48Bとを備えている。
構造解析部48Cは、音声認識部24から得られたユーザからの発話に対して形態素解析を行い、また、単語辞書を用いて、ユーザからの発話の構造(品詞や意味)を解析する。応答文生成部48Bは、応答データベース48Aを利用して、構造解析部48Cにより解析された構造に対する応答文の候補を複数生成し、対話履歴を利用して、最も自然な応答文の候補を選択して、ユーザ発話に対する応答文を生成する。
例えば、「○○(人名)」というキーワードに対する応答文が「へぇそうなんだ。」であり、「天気」や「良い」というキーワードに対する応答文が「選択物がよく乾くね」であり、「来たよ」という述語に対する応答文が「誰と来たの?」であり、「見たよ」という述語に対する応答文が「いつ見たの?」である場合、音声認識結果であるユーザ発話「あっくんと遊びに来たよ」から、「あっくん」という人名と、「来たよ」という述語とが構造として得られると、応答文の候補として「誰と来たの?」及び「へぇそうなんだ。」が生成される。そして、対話履歴を利用して、最も自然な応答文として、「へぇそうなんだ。」が選択され、応答文が生成される。
次に、本実施の形態の原理について説明する。ユーザと対話装置との対話には、対話の主導権がユーザ側及び対話装置型の何れにあるかで、対話装置主導型の対話とユーザ主導型の対話の2種類がある。対話装置主導型の対話装置は、対話装置が応答できる応答をユーザに示すことができるが、ユーザが入力したいことを直接入力することができない、という問題がある。そこで、本実施の形態に係る対話装置10では、ユーザが入力したいことを直接入力した場合に、質問応答型対話に応じた応答文を生成して、ユーザの発話に対して応答する。
また、ユーザ主導型の対話装置は、ユーザの入力を待ち受け、入力に応じた応答を返すことができるが、ユーザの入力がない場合には、対話が成立しない、という問題がある。そこで、本実施の形態では、情報提供型対話に応じた応答文を生成して、ユーザの入力がない場合であっても対話を成立させる。
また、対話装置主導型及びユーザ主導型のどちらの対話装置においても、擬人化された対話装置(2次元キャラクタ、動物・人型ロボットなどの形状をしていて、人間的な言葉を発する対話装置)を用いた場合には、対話装置として任意の入力を受け付けることができないにもかかわらず、ユーザは対人と同等の入力を対話装置に対して行なうことがある。例えば、展示場などに設置された音声入力可能な館内案内システム(展示場に関する発声「トイレはどこ?」や「何時までやってるの?」などを待ち受けている)に、館内案内システムとしては受け付けていない入力(例えば、「僕は、あっくんです。」、「遊びに来たよ。」、及び「今日は天気がいいね。」)があると(人間の心理的傾向で志向姿勢と呼ばれる。)、想定外の入力により、システムが誤応答したり、受け付けない発話として破棄(リジェクション)してしまう、という問題がある。システムが誤応答したり、「別の言い方で言って下さい。」などのリジェクション時の定型文を返すと、ユーザは、対話装置とは対話ができないと判断して、対話をやめてしまう。
想定外発話の多くがユーザからの情報提供である場合が多いため、本実施の形態の対話装置10では、ユーザから任意の入力が行なわれる場合に、情報獲得型対話又は情報受理型対話に応じた応答文を生成して、ユーザからの発話に応答する。
上記のように、本実施の形態では、任意の入力に対し、ユーザとの対話を対話型分類に判別し、判別された対話型分類に応じた応答生成を行ことにより、想定外発話に対しても適切に受け付けることができる。
以下、上記のコンピュータ22で実行される応答生成処理ルーチンについて図4を用いて説明する。まず、ステップ100において、無入力時間の測定を開始し、次のステップ102において、入力部12から入力された信号から、入力音声を示す音声信号が切り出されたか否かを判定する。入力部12によってユーザによる発話に応じた音声信号が生成され、入力音声を示す音声信号が切り出されると、ステップ104において、認識用辞書データベースに登録された単語を参照して、入力された音声信号に基づいて、ユーザ発話を認識すると共に、認識されたユーザ発話の各々について信頼度を算出する。
そして、ステップ106では、音声の特徴量として、入力された音声信号の基本周波数を抽出し、ステップ108において、上記ステップ104で認識された信頼度が最も高いユーザ発話、及び上記ステップ106で抽出された音声信号の基本周波数に基づいて、ユーザからの発話が、質問又は要求を表わしているか否かを判定する。
上記ステップ108で、ユーザからの発話が、質問又は要求を表わしていると判定されると、ユーザとの対話が質問応答型対話であると判別し、ステップ110において、上記ステップ104で認識されたユーザからの発話、及び質問回答データベース46Aに基づいて、ユーザからの発話に対して、質問応答型対話に応じた応答文を生成して、音声出力部16に出力して、応答生成処理ルーチンを終了する。
また、上記ステップ108で、ユーザからの発話が、質問又は要求を表わしていないと判定されると、ステップ112において、遷移確率記憶部28に記憶された遷移確率と前回の判別結果とに基づいて、現在のユーザとの対話が情報獲得型対話である確率及び情報受理型対話である確率の各々を算出する。そして、ステップ114で、上記ステップ112で算出された情報受理型対話である確率が情報獲得型対話である確率より大きいか否かを判定する。上記ステップ114で、情報受理型対話である確率が情報獲得型対話である確率より大きい場合には、ユーザとの対話が情報受理型対話であると判別し、ステップ116において、上記ステップ104で認識されたユーザからの発話の構造を解析し、解析されたユーザからの発話の構造及び応答データベース48Aに基づいて、ユーザからの発話に対して、情報受理型対話に応じた応答文を生成して、生成された応答文を音声合成し、音声出力部16に出力して、応答生成処理ルーチンを終了する。
上記ステップ114で、情報獲得型対話である確率が情報受理型対話である確率以下である場合には、ユーザとの対話が情報獲得型対話であると判別し、ステップ118において、記憶された対話履歴及び前回のユーザの発話に基づいて、情報獲得型対話に応じた応答文を生成して、生成された応答文を音声合成し、音声出力部16に出力して、応答生成処理ルーチンを終了する。
上記ステップ102で、入力部12から入力された信号から、音声信号が切り出されなかった場合には、ステップ120において、測定された無入力時間が、5秒以上であるか否かを判定し、ユーザから音声が入力されない時間が5秒未満である場合には、ステップ102へ戻る。一方、上記ステップ120において、測定された無入力時間が、5秒以上であると判定されると、ステップ122において、遷移確率記憶部28に記憶された遷移確率と前回の判別結果とに基づいて、現在のユーザとの対話が情報提供型対話である確率及び情報獲得型対話である確率の各々を算出する。そして、ステップ124で、上記ステップ122で算出された情報提供型対話である確率が、情報獲得型対話である確率より大きいか否かを判定する。上記ステップ124で、情報提供型対話である確率が情報獲得型対話である確率より大きい場合には、ユーザとの対話が情報提供型対話であると判別し、ステップ126において、記憶された対話履歴、前回のユーザからの発話、及び情報データベース42Aに基づいて、ユーザからの発話に対して、情報提供型対話に応じた応答文を生成して、生成された応答文を音声合成し、音声出力部16に出力して、応答生成処理ルーチンを終了する。
一方、上記ステップ124で、情報獲得型対話である確率が情報提供型対話である確率以上である場合には、ユーザとの対話が情報獲得型対話であると判別し、上記ステップ118へ移行し、情報獲得型対話に応じた応答文を生成して、生成された応答文を音声合成し、音声出力部16に出力して、応答生成処理ルーチンを終了する。
そして、上記のように生成された応答文が、音声出力部16によって音声出力される。
以上説明したように、第1の実施の形態に係る対話装置によれば、無入力時間、対話型分類の遷移確率、及びユーザからの発話が要求又は質問を表わしているか否かに基づいて、ユーザとの対話の対話型分類が、情報提供型対話、情報獲得型対話、質問応答型対話、及び情報受理型対話の何れであるかを判別し、判別された対話型分類に応じて応答文を生成することにより、任意の入力に対して適切に応答することができ、対話を継続させることができる。
また、判別された対話型分類に応じて、応答文の生成方法を切り替えることで、ユーザからのあらゆる入力を受け付け、破綻しない対話を実現することができる。
次に、第2の実施の形態について説明する。なお、第1の実施の形態と同様の構成になっている部分については、同一符号を付して説明を省略する。
第2の実施の形態では、対話装置の前を撮像部によって撮像し、対話装置の前に存在するユーザが、対話装置を見ているか否かを判定している点と、ユーザが対話装置を見ていると判定されると無入力時間の測定を開始している点とが第1の実施の形態と異なっている。
図5に示すように、第2の実施の形態に係る対話装置210は、入力部12と、自装置の前を撮像する撮像部212と、入力部12によって入力された信号、及び撮像装置212によって撮像された画像に基づいて、応答発話を生成するコンピュータ214と、音声出力部16とを備えている。
撮像部212は、自装置の前にユーザが存在する場合に、ユーザの顔を含む領域を撮像するように配置されている。ユーザが自装置の前で自装置を見ている場合には、ユーザの顔が正面を向いている正面顔画像が撮像される。
コンピュータ214は、音声切り出し部20と、撮像部212によって撮像された画像から、ユーザの正面顔画像を検出する正面顔検出部220と、正面顔検出部220によって正面顔画像が検出された時から、入力音声の無入力時間を計測する無入力時間カウンタ222と、音声認識部24と、特徴量抽出部26と、遷移確率記憶部28と、判別結果記憶部30と、確率算出部32と、対話型分類判別部34と、対話履歴記憶部36と、応答生成部38とを備えている。
正面顔検出部220は、撮像部212により撮像された画像から、正面を向いている顔画像の学習パターンを用いて、自装置の前に存在するユーザの正面顔画像を検出する。
無入力時間カウンタ222は、正面顔検出部220によってユーザの正面顔画像が検出されると、ユーザが対話装置210に目を向けていると判断して、ユーザから音声が入力されない状態が継続する時間の計測を開始する。
第2の実施の形態に係る応答生成処理ルーチンでは、撮像された画像からユーザの正面顔画像が検出されたか否かを判定し、正面顔画像が検出されると、無入力時間の測定を開始する。そして、入力部12から入力された信号から、音声信号が切り出されたか否かを判定し、入力された信号から、音声信号が切り出されなかった場合には、測定された無入力時間が、5秒以上であるか否かを判定する。測定された無入力時間が、5秒以上であると判定されると、ユーザが対話装置210を見ているにもかかわらず、音声入力が中断している時間が長いと判断し、現在の対話が情報提供型対話である確率及び情報獲得型対話である確率に基づいて、ユーザとの対話の対話型分類が、情報提供型対話及び情報獲得型対話の何れかであるかを判別し、判別された対話型分類に応じて、応答文を生成する。
一方、入力された信号から音声信号が切り出されると、音声認識結果及び音声信号の基本周波数に基づいて、ユーザからの発話が、質問又は要求を表わしているか否かを判定し、ユーザからの発話が、質問又は要求を表わしていると判定されると、ユーザとの対話が質問応答型対話であると判別し、質問応答型対話に応じた応答文を生成する。また、ユーザからの発話が、質問又は要求を表わしていないと判定されると、情報獲得型対話である確率及び情報受理型対話である確率に基づいて、ユーザとの対話の対話型分類が、情報受理型対話及び情報獲得型対話の何れであるかを判別し、判別された対話型分類に応じて、応答文を生成する。
このように、ユーザが対話装置を見ていると判断されたときから、無入力時間の測定を開始することにより、ユーザからの入力がない状態が継続している時間を精度よく測定することができ、測定された無入力時間に基づいて、ユーザとの対話が情報提供型対話であると精度よく判別することができる。
なお、上記の実施の形態では、ユーザからの発話に対する応答を、スピーカによる音声出力によって行う場合を例に説明したが、これに限定されるものではなく、ディスプレイに応答文を表示するようにしてもよい。
次に、第3の実施の形態について説明する。なお、第1の実施の形態と同様の構成になっている部分については、同一符号を付して説明を省略する。
第3の実施の形態では、ユーザからテキストデータが入力される点が第1の実施の形態と主に異なっている。
図6に示すように、第3の実施の形態に係る対話装置310は、キーボードで構成され、かつ、ユーザからの入力文をテキストデータで入力する入力部312と、入力部312によって入力されたテキストデータに基づいて、応答文を生成するコンピュータ314と、ディスプレイで構成され、かつ、生成された応答文を表示する表示部316とを備えている。
コンピュータ314は、入力部312からの入力に基づいて、無入力時間を計測する無入力時間カウンタ322と、遷移確率記憶部28と、判別結果記憶部30と、確率算出部32と、無入力時間カウンタ322によって計測された無入力時間、入力部312から入力されたテキストデータ、及び確率算出部32によって算出された確率に基づいて、ユーザとの対話を、4種類の対話型分類の何れかに判別する対話型分類判別部334と、対話履歴記憶部36と、応答生成部38とを備えている。
次に、第3の実施の形態に係る応答生成処理ルーチンについて図7を用いて説明する。なお、第1の実施の形態と同様の処理については、同一符号を付して詳細な説明を省略する。
まず、ステップ100において、無入力時間の測定を開始し、次のステップ350において、入力部312からテキストデータとして入力文が入力されたか否かを判定する。ユーザが入力部312によって入力文を入力すると、ステップ352において、上記ステップ350で入力された入力文が、質問又は要求を表わしているか否かを判定する。
上記ステップ352で、ユーザからの入力文が、質問又は要求を表わしていると判定されると、ユーザとの対話が質問応答型対話であると判別し、ステップ110において、ユーザからの入力文に対して、質問応答型対話に応じた応答文を生成して、表示部316に出力して、応答生成処理ルーチンを終了する。
また、上記ステップ352で、ユーザからの入力文が、質問又は要求を表わしていないと判定されると、ステップ112において、情報獲得型対話である確率及び情報受理型対話である確率の各々を算出する。そして、ステップ114で、情報受理型対話である確率が情報獲得型対話である確率より大きいか否かを判定し、情報受理型対話である確率が情報獲得型対話である確率より大きい場合には、ユーザとの対話が情報受理型対話であると判別し、ステップ116において、ユーザからの入力文の構造、及び応答データベース48Aに基づいて、ユーザからの入力文に対して、情報受理型対話に応じた応答文を生成して、表示部316に出力し、応答生成処理ルーチンを終了する。
上記ステップ114で、情報獲得型対話である確率が情報受理型対話である確率以下である場合には、ユーザとの対話が情報獲得型対話であると判別し、ステップ118において、記憶された対話履歴及び前回のユーザの入力文に基づいて、情報獲得型対話に応じた応答文を生成して、表示部316に出力し、応答生成処理ルーチンを終了する。
上記ステップ350で、入力部312から入力がなかった場合には、ステップ120において、測定された無入力時間が、5秒以上であるか否かを判定し、ユーザから入力文が入力されない状態が継続している時間が5秒未満である場合には、ステップ350へ戻る。一方、上記ステップ120において、測定された無入力時間が、5秒以上であると判定されると、ステップ122において、情報提供型対話である確率及び情報獲得型対話である確率の各々を算出する。そして、ステップ124で、情報提供型対話である確率が情報獲得型対話である確率より大きいか否かを判定し、情報提供型対話である確率が情報獲得型対話である確率より大きい場合には、ユーザとの対話が情報提供型対話であると判別し、ステップ126において、対話履歴、前回のユーザからの入力文、及び情報データベース42Aに基づいて、ユーザからの入力文に対して、情報提供型対話に応じた応答文を生成して、表示部316に出力し、応答生成処理ルーチンを終了する。
一方、上記ステップ124で、情報獲得型対話である確率が情報提供型対話である確率以上である場合には、ユーザとの対話が情報獲得型対話であると判別し、上記ステップ118へ移行し、情報獲得型対話に応じた応答文を生成して、表示部16に出力し、応答生成処理ルーチンを終了する。
そして、上記のように生成された応答文が、表示部16によって表示される。
このように、無入力時間、対話型分類の遷移確率、及びユーザからの入力文が要求又は質問を表わしているか否かに基づいて、ユーザとの対話の対話型分類が、情報提供型対話、情報獲得型対話、質問応答型対話、及び情報受理型対話の何れであるかを判別し、判別された対話型分類に応じて応答文を生成することにより、任意の入力に対して適切に応答することができ、対話を継続させることができる。
なお、上記の第1の実施の形態〜第3の実施の形態では、ユーザとの対話を4種類の対話型分類の中から判別する場合を例に説明したが、これに限定されるものではなく、情報提供型対話、質問応答型対話、及び情報受理型対話の3種類の対話型分類の中から判別するようにしてもよい。この場合には、無入力時間が所定時間以上である場合には、情報提供型対話であると判別し、ユーザからの発話が質問又は要求でないと判定された場合には、情報受理型対話であると判別すればよい。また、情報獲得型対話、質問応答型対話、及び情報受理型対話の3種類の対話型分類の中から判別するようにしてもよい。この場合には、無入力時間が所定時間以上である場合には、情報獲得型対話であると判別し、ユーザからの発話が質問又は要求でないと判定された場合には、算出された情報獲得型対話の確率及び情報受理型対話の確率に基づいて、情報獲得型対話及び情報受理型対話の何れかであると判別すればよい。
また、前回の判別結果と遷移確率とを用いて、各対話型分類である確率を算出する場合を例に説明したが、これに限定されるものではなく、前回以前の複数の判別結果と遷移確率とを用いて、各対話型分類の確率を算出するようにしてもよい。
また、情報データベース、質問データベース、質問回答データベース、及び応答データベースが、対話装置の内部に設けられている場合を例に説明したが、これに限定するものではなく、情報データベース、質問データベース、質問回答データベース、及び応答データベースを対話装置の外部に設け、これらのデータベースと対話装置とをネットワークで接続し、対話装置がネットワークを介してこれらのデータベースにアクセスするようにしてもよい。
本発明の第1の実施の形態に係る対話装置の構成を示す概略図である。 対話型分類の状態遷移図である。 本発明の第1の実施の形態に係る対話装置の応答生成部の構成を示すブロック図である。 本発明の第1の実施の形態に係る対話装置の応答生成処理ルーチンの内容を示すフローチャートである。 本発明の第2の実施の形態に係る対話装置の構成を示す概略図である。 本発明の第3の実施の形態に係る対話装置の構成を示す概略図である。 本発明の第3の実施の形態に係る対話装置の応答生成処理ルーチンの内容を示すフローチャートである。
符号の説明
10、210 対話装置
12 マイクロホン
14 スピーカ
16 認識用辞書データベース
18 概念語辞書データベース
20、220 概念表現データベース
21 不明応答データベース
22、222 コンピュータ
218 形容語辞書データベース

Claims (8)

  1. ユーザによる発話及び入力文の少なくとも一方を入力する入力手段と、
    前記入力手段への入力がない状態が継続する時間を計測する無入力時間計測手段と、
    前記入力手段に入力された前記発話及び入力文の少なくとも一方が、前記ユーザの要求又は質問を表わしているか否かを判定する要求質問判定手段と、
    ユーザと自装置との対話における、自装置が自発的に情報を提供する情報提供型、自装置が自発的に質問する情報獲得型、ユーザの要求又は質問に対して自装置が回答する質問応答型、及びユーザが自発的に提供する情報を自装置が受理する情報受理型からなる対話型分類の遷移履歴を記憶する遷移履歴記憶手段と、
    前記無入力時間計測手段によって計測された時間が所定時間以上である場合には、過去の判別結果及び前記遷移履歴に基づいて、前記ユーザとの対話が、前記情報提供型及び情報獲得型の何れかであると判別し、前記要求質問判定手段によって前記ユーザの要求又は質問を表わしていると判定された場合には、前記ユーザとの対話が、前記質問応答型であると判別し、前記要求質問判定手段によって前記ユーザの要求又は質問を表わしていないと判定された場合には、前記ユーザとの対話が、前記情報受理型であると判別する対話型判別手段と、
    前記発話及び入力文の少なくとも一方に対して、前記対話型判別手段による判別結果に応じた応答文を生成する応答生成手段と、
    前記応答生成手段によって生成された応答文を出力する出力手段と、
    を含む対話装置。
  2. 前記対話型判別手段は、前記要求質問判定手段によって前記ユーザの要求又は質問を表わしていないと判定された場合には、過去の判別結果及び前記遷移履歴に基づいて、前記ユーザとの対話が、前記情報受理型及び前記情報獲得型の何れかであると判別する請求項記載の対話装置。
  3. 前記応答生成手段は、前記情報提供型であると判別された場合、ユーザに提供するための情報を複数記憶した情報データベースに記憶された前記複数の情報から選択した情報を用いて、前記応答文を生成する請求項、又は記載の対話装置。
  4. 前記応答生成手段は、前記質問応答型であると判別された場合、質問文又は要求文と前記質問文又は要求文に対する回答文とを対応させて記憶した質問回答データベースに記憶された前記質問文又は要求文から、前記発話及び入力文の少なくとも一方が表わす前記要求又は質問に対応する質問文又は要求文を検索し、検索された前記質問文又は要求文に対する回答文を用いて、前記応答文を生成する請求項1〜請求項の何れか1項記載の対話装置。
  5. 前記入力手段によって入力された前記発話及び入力文の少なくとも一方の構造を解析する解析手段を更に含み、
    前記応答生成手段は、前記情報受理型であると判別された場合、前記構造と前記構造に対する応答文とを対応させて記憶した応答データベースに記憶され、かつ、前記解析手段によって解析された前記構造に対応する応答文を用いて、前記応答文を生成する請求項1〜請求項のいずれか1項記載の対話装置。
  6. 前記応答生成手段は、前記情報獲得型であると判別された場合、ユーザへの質問文又は要求文を複数記憶した質問要求データベースに記憶された前記複数の質問文から選択した質問文を用いて、前記応答文を生成する請求項1又は2記載の対話装置。
  7. 前記入力手段は、ユーザによる発話を入力し、
    前記要求質問判定手段は、前記入力手段から入力された前記発話について、音声の特徴量を抽出し、前記抽出した前記特徴量と、予め求められた質問又は要求を表わす発話の前記特徴量とを比較して、前記発話及び入力文の少なくとも一方が、ユーザの要求又は質問を表わしているか否かを判定する請求項1〜請求項の何れか1項記載の対話装置。
  8. コンピュータを、
    ユーザによる発話及び入力文の少なくとも一方を入力する入力手段への入力がない状態が継続する時間を計測する無入力時間計測手段、
    前記入力手段に入力された前記発話及び入力文の少なくとも一方が、前記ユーザの要求又は質問を表わしているか否かを判定する要求質問判定手段、
    ユーザと自装置との対話における、自装置が自発的に情報を提供する情報提供型、自装置が自発的に質問する情報獲得型、ユーザの要求又は質問に対して自装置が回答する質問応答型、及びユーザが自発的に提供する情報を自装置が受理する情報受理型からなる対話型分類の遷移履歴を記憶する遷移履歴記憶手段、
    前記無入力時間計測手段によって計測された時間が所定時間以上である場合には、過去の判別結果及び前記遷移履歴に基づいて、前記ユーザとの対話が、前記情報提供型及び情報獲得型の何れかであると判別し、前記要求質問判定手段によって前記ユーザの要求又は質問を表わしていると判定された場合には、前記ユーザとの対話が、前記質問応答型であると判別し、前記要求質問判定手段によって前記ユーザの要求又は質問を表わしていないと判定された場合には、前記ユーザとの対話が、前記情報受理型であると判別する対話型判別手段、及び
    前記発話及び入力文の少なくとも一方に対して、前記対話型判別手段による判別結果に応じた応答文を生成する応答生成手段
    として機能させるためのプログラム。
JP2008038069A 2008-02-19 2008-02-19 対話装置及びプログラム Expired - Fee Related JP5045486B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008038069A JP5045486B2 (ja) 2008-02-19 2008-02-19 対話装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008038069A JP5045486B2 (ja) 2008-02-19 2008-02-19 対話装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2009198614A JP2009198614A (ja) 2009-09-03
JP5045486B2 true JP5045486B2 (ja) 2012-10-10

Family

ID=41142190

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008038069A Expired - Fee Related JP5045486B2 (ja) 2008-02-19 2008-02-19 対話装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5045486B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107003723A (zh) * 2014-10-21 2017-08-01 罗伯特·博世有限公司 用于会话系统中的响应选择和组成的自动化的方法和系统

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5166503B2 (ja) * 2010-10-28 2013-03-21 株式会社東芝 対話装置
JP6166889B2 (ja) * 2012-11-15 2017-07-19 株式会社Nttドコモ 対話支援装置、対話システム、対話支援方法及びプログラム
JP6027476B2 (ja) * 2013-03-28 2016-11-16 Kddi株式会社 対話シナリオに動的対話ノードを挿入する対話プログラム、サーバ及び方法
KR102193559B1 (ko) 2014-02-18 2020-12-22 삼성전자주식회사 대화형 서버 및 이의 제어 방법
JP6147836B2 (ja) * 2015-11-24 2017-06-14 株式会社東芝 対話装置
JP6833209B2 (ja) * 2016-06-05 2021-02-24 国立大学法人千葉大学 発話促進装置
WO2018097181A1 (ja) * 2016-11-25 2018-05-31 株式会社 東芝 知識構築活用システムおよびプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0769709B2 (ja) * 1993-01-08 1995-07-31 株式会社エイ・ティ・アール自動翻訳電話研究所 対話音声認識装置
JP3178426B2 (ja) * 1998-07-29 2001-06-18 日本電気株式会社 自然言語対話システム及び自然言語対話プログラム記録媒体
US6731307B1 (en) * 2000-10-30 2004-05-04 Koninklije Philips Electronics N.V. User interface/entertainment device that simulates personal interaction and responds to user's mental state and/or personality
JP4162074B2 (ja) * 2001-09-27 2008-10-08 三菱電機株式会社 対話型情報検索装置
JP4062591B2 (ja) * 2002-03-06 2008-03-19 ソニー株式会社 対話処理装置及び方法並びにロボット装置
JP2004226881A (ja) * 2003-01-27 2004-08-12 Casio Comput Co Ltd 会話システム及び会話処理プログラム
JP4755478B2 (ja) * 2005-10-07 2011-08-24 日本電信電話株式会社 応答文生成装置、応答文生成方法、そのプログラムおよび記憶媒体
JP4186992B2 (ja) * 2006-01-31 2008-11-26 株式会社豊田中央研究所 応答生成装置、方法及びプログラム
JP4984708B2 (ja) * 2006-07-21 2012-07-25 富士通株式会社 音声対話機能を有する情報処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107003723A (zh) * 2014-10-21 2017-08-01 罗伯特·博世有限公司 用于会话系统中的响应选择和组成的自动化的方法和系统

Also Published As

Publication number Publication date
JP2009198614A (ja) 2009-09-03

Similar Documents

Publication Publication Date Title
CN112262430B (zh) 自动确定经由自动助理界面接收到的口头话语的语音识别的语言
JP5045486B2 (ja) 対話装置及びプログラム
US11037553B2 (en) Learning-type interactive device
JP3472194B2 (ja) 自動応答方法及びその装置並びにそのプログラムを記録した媒体
JP3454897B2 (ja) 音声対話システム
JP5377430B2 (ja) 質問応答データベース拡張装置および質問応答データベース拡張方法
KR101309042B1 (ko) 다중 도메인 음성 대화 장치 및 이를 이용한 다중 도메인 음성 대화 방법
KR100772660B1 (ko) 대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법
KR20080086791A (ko) 음성 기반 감정 인식 시스템
KR20130128716A (ko) 어학 학습 시스템 및 학습 방법
JP7132090B2 (ja) 対話システム、対話装置、対話方法、及びプログラム
JP4729902B2 (ja) 音声対話システム
CN111179935B (zh) 一种语音质检的方法和设备
US11615787B2 (en) Dialogue system and method of controlling the same
CN109754793A (zh) 用于推荐车辆的功能的装置和方法
CN109086455B (zh) 一种语音识别库的构建方法及学习设备
CN110808038A (zh) 普通话评测方法、装置、设备及存储介质
CN108710653A (zh) 一种绘本朗读点播方法、装置及系统
JP4634156B2 (ja) 音声対話方法および音声対話装置
JP7160778B2 (ja) 評価システム、評価方法、及びコンピュータプログラム。
CN110099332B (zh) 一种音频环境展示方法及装置
JP2005275348A (ja) 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体
JP4042435B2 (ja) 音声自動質問応答装置
WO2021254838A1 (en) Driving companion comprising a natural language understanding system and method for training the natural language understanding system
JP2020160336A (ja) 評価システム、評価方法、及びコンピュータプログラム。

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101019

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20101029

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20101029

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120619

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120702

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150727

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5045486

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees