JP2006018028A - 対話方法、対話装置、音声対話装置、対話プログラム、音声対話プログラム及び記録媒体 - Google Patents
対話方法、対話装置、音声対話装置、対話プログラム、音声対話プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2006018028A JP2006018028A JP2004195819A JP2004195819A JP2006018028A JP 2006018028 A JP2006018028 A JP 2006018028A JP 2004195819 A JP2004195819 A JP 2004195819A JP 2004195819 A JP2004195819 A JP 2004195819A JP 2006018028 A JP2006018028 A JP 2006018028A
- Authority
- JP
- Japan
- Prior art keywords
- response
- type
- wording
- dialogue
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】 入力情報に含まれるパラメータを抽出する言語理解処理と、入力情報を言い回しパターンデータベースと照合して入力情報の言い回しタイプを抽出する言い回しタイプ抽出処理と、応答内容を決定する応答内容決定処理と、応答文の言い回しタイプを決定する応答文の言い回しタイプ決定処理と、応答内容と、応答文の言い回しタイプを参照して応答文を生成する応答文生成処理と、入力情報から抽出したパラメータと、入力情報から抽出された言い回しタイプと、応答内容と、応答文の言い回しタイプと、応答文とからなる履歴情報を記憶する履歴情報記憶処理とを実行させ、応答内容決定処理は言い換え応答出力判定処理を有し、対話の状況によっては一つの応答の中においてある概念について重複させて言及するような応答内容を決定し、異なる種類の言い回しタイプをそれぞれの言及に用いるように決定する。
【選択図】 図1
Description
特許文献1においては、入力音声の認識結果に対応した応答を出力する際に、認識結果の一部を連想語に置き換えて出力することにより、単調な応答出力を排除している。
また、現在用いられている一般的な音声対話システムにおいては、入力音声はユーザの要求や対話の状態を表わす内部パラメータにいったん変換し、内部パラメータに応じて応答の言語表現を決定する、という手続きが用いられている(このような手続きを、これ以降従来技術1と呼ぶ)。
また、特許文献3で提案された音声対話方法は、事前に複数の応答言語表現を生成しておき、応答音声とユーザの入力音声がぶつかった場合には、より短い応答を再度出力するような方法である。また、この特許文献3にはユーザの発話した語句や表現パターンを使って応答文を生成する方法も含んでいる。
しかし、システムを構築する際にさまざまな言い回しを受け付けられるよう設計していたとしても、ユーザはシステムが受け付けられる言い回しの種類を全て知っているとは限らないため、認識誤りによる対話の停滞が発生した場合に、適切に言い回しを変化させて停滞を回避することができない可能性がある。
特許文献1や2で提案された技術を用いて応答例2を出力するためには、「4月3日」と「来週の月曜日」をそれぞれ一つの単語として扱い、そのような単語の対応表を類語辞書や連想語辞書として作成する必要がある。
しかし、「4月3日」という表現が「来週の月曜日」と対応するのは、たかだか1週間程度の期間のみであり、次の週になってしまえば類似語辞書や連想語辞書を新たに構築しなくてはならないため、システム運用上の負担が大きく、非効率である。
以上のように、従来技術を用いた場合、音声認識の誤りによる対話の停滞が発生した場合に、適切なタイミングで異なる言い回しが受け付け可能であることをユーザに気づかせ、ユーザの入力における言い回しを変化させて対話の停滞を回避する可能性を高めることはできなかった。結果として、対話の停滞は入力例2が正しく認識されるまでユーザが入力例2を繰り返すか、乱数によってたまたま応答に異なる言い回しが表れることによってユーザが異なる言い回しの有効性に気づくまでは回避される可能性が低く、システム全体の使い勝手を下げる原因となっていた。
本発明の請求項4による対話方法は、ユーザが同一の言い回しを使い続けていて、且つ音声認識の誤りによる対話の停滞が起きている場合を検出し、ユーザが用いている言い回しタイプとは異なる言い回しタイプを用いた応答を出力することを可能とする。
図中100は本発明の請求項5乃至8で提案する対話装置、200は本発明の請求項9で提案する音声対話装置を示す。
対話装置100は言語理解処理手段101と、内部パラメータ記憶部102と、言い回しパターンデータベース103と、言い回しタイプ抽出手段104と、応答内容決定手段105と、言い回しタイプ決定手段106と、応答文生成手段107と、履歴情報書込手段108とによって構成される。
対話装置100は入力された入力情報を理解し、入力情報に適合した応答文を生成し、その応答文を例えばテキストデータの形態で音声合成装置202に入力する。音声合成装置202は入力された応答文を音声に合成し、音声対話装置200の応答出力として応答音声を出力する。応答音声の出力により利用者が再度音声で発話すると、その発話が再び音声認識され、発話内容が対話装置100で処理され、その発話内容に適合した応答文を生成し、その応答文を音声合成装置202に入力し、音声合成装置202から音声で応答する。この繰返しにより対話が実現される。
また入力情報は言い回しタイプ抽出手段104に引き渡され、語の並びから言い回しタイプを抽出する。この抽出処理は言い回しパターンデータベース103に格納されている言い回しパターンデータを参照して行われる。図3に言い回しパターンデータの一例を示す。図3に示す言い回しデータは日付言い回しデータベースを例示している。図3において、%y、%m、%dはそれぞれ西暦年、月、日を表し、%wは曜日の名を表している。また、この例では「〜年〜月〜日」といったパターンの言い回しは「年月日タイプ」というタイプ名が対応付けされる。また、「今週の木曜日」といったパターンの言い回しは「週曜タイプ」というタイプ名が対応付けされ、更に、「今週の20日」といったパターンの言い回しは「週日タイプ」というタイプ名が対応付けられる。
図5に言語理解処理手段101と言い回しタイプ抽出手段104の動作状況を示す。ステップSP51で入力情報からパラメータの抽出処理を実行し、ステップSP52で言い回しタイプを抽出する。ステップSP53では入力情報から抽出したパラメータと言い回しタイプを言語理解結果として内部パラメータ記憶部102への書き込みを行う。
ステップSP61では、例えば予約に必要なパラメータが全てそろっておりこれに対する確認が成功したことを示す確認フラグが「済」であるといったような、対話の終了条件が満たされているかを判定する。対話の終了条件が満たされていれば応答内容は「対話終了型」となる。
ステップSP63においては、例えば予約に必要なパラメータが全て揃っているか否かといった、パラメータが充足しているか否かを判定する。不足するパラメータが存在している場合は、その不足しているパラメータの補充を促す「情報要求型」の内容に決定する。一方、予約に必要な全てのパラメータが揃っている場合は、この内容で良いか否かを確認する「確認型」の内容に決定する。
応答内容決定手段105で応答文のテンプレートが決定されると、そのテンプレートが言い回しタイプ決定手段106に引き渡され、応答文の言い回しタイプを決定する。言い回しタイプの決定は内部パラメータ記憶部102から読み込んだ内部パラメータに付加されている履歴情報を参照し、決定する。つまり、ユーザの入力に用いられていた言い回しタイプと同一タイプの応答文の言い回しタイプを選択するなどの処理を行う。
ステップSP71では履歴情報参照手段105Aにより内部パラメータ記憶部102に書き込んだ内部パラメータを読み込む。
ステップSP72では応答内容を決定し、ステップSP73でテンプレートを決定する。テンプレートが決定されると、ステップSP74で言い回しタイプを決定し、ステップSP75でテンプレートの該当部分に、言い回しタイプ決定ステップSP74で決定した言い回しタイプに対応する単語列を代入し、応答文を生成する。ステップSP76で履歴情報を内部パターン記憶部102に書き込みを行い、ステップSP71に戻り、次の対話の待ち状態に入る。
以下に具体的な実施例を説明する。
以下に図8と図9に示す各ステップの動作状況を説明する。
パラメータ抽出ステップSP81では「4月4日」から月パラメータとして「4」、日パラメータとして「4」が抽出される。
内部パラメータ書き込みステップSP83ではこれら抽出したパラメータを内部パラメータ記憶部102に書き込む。
入力情報に関連するパラメータが内部パラメータ記憶部102に書き込まれると、内部パラメータ読み込みステップ84が起動し、前の内部パラメータ書き込みステップSP83で書き込まれたパラメータと同じ内部パラメータが読み込まれる。
応答テンプレート決定ステップSP92(図9)ではテンプレートとして「%dateということは%dateですね?」を選択し、決定する。
応答文生成ステップSP94(図9)では「年月日」および「週曜」タイプの言語表現である「4月4日」および「来週の火曜日」をテンプレートの「%date」の部分にそれぞれ代入し、「4月4日ということは来週の火曜日ですね?」とする応答文を生成する。
以上により対話が終了するが、この発明によれば対話に停滞が発生した場合は、直ちに「言い換え確認型」の応答文を生成し、ユーザに異なる言い回しを提示することができる。従って、ユーザは応答の言い回しに従って、入力する言い回しを変更し、この入力する言い回しの変更によって対話の停滞を解消することができ、その効果は実用に供して頗る大である。
102 内部パラメータ記憶部 103 言い回しパターンデータベース
104 言い回しタイプ抽出手段 105 応答内容決定手段
105A 履歴情報参照手段 105B 言い換え応答出力判定手段
106 言い回しタイプ決定手段 107 応答文生成手段
108 履歴情報書込手段 200 音声対話装置
201 音声認識装置 202 音声合成装置
Claims (12)
- コンピュータに、
入力情報に含まれるパラメータを抽出する言語理解処理と、
入力情報を言い回しパターンデータベースと照合して入力情報の言い回しタイプを抽出する言い回しタイプ抽出処理と、
応答内容を決定する応答内容決定処理と、
応答文の言い回しタイプを決定する応答文の言い回しタイプ決定処理と、
前記応答内容と、前記応答文の言い回しタイプを参照して応答文を生成する応答文生成処理と、
前記入力情報から抽出したパラメータと、入力情報から抽出された言い回しタイプと、応答内容と、応答文の言い回しタイプと、応答文とを履歴情報として記憶する履歴情報記憶処理と、
を実行させることを特徴とする対話方法。 - 請求項1記載の対話方法において、
前記応答内容決定処理及び前記応答文の言い回しタイプ決定処理は、それぞれ前記履歴情報記憶処理で記憶した履歴情報を参照し、対話の履歴に応じて応答内容の決定処理及び応答文の言い回しタイプ決定処理とを実行することを特徴とする対話方法。 - 請求項1又は2記載の対話方法の何れかにおいて、
前記応答内容決定処理は、言い換え応答出力判定処理を有し、言い換え応答出力判定処理において言い換え応答を出力するよう判定された場合、ひとつの応答の中において、同一の概念について重複して言及する応答内容を決定し、前記応答文の言い回しタイプ決定処理は、異なる言い回しタイプを、それぞれの言及に用いるように決定することを特徴とする対話方法。 - 請求項3記載の対話方法において、
前記言い換え応答出力判定処理は、前記履歴情報記憶処理で記憶した履歴情報を参照し、所定の回数以上の回数で、応答内容が確認もしくは新規の情報を要求する内容であり且つこれに対する入力情報の言い回しタイプに同一のものが出現している場合に、言い換え応答を出力するよう判定し、前記応答文の言い回しタイプ決定処理は、履歴情報を参照し、入力情報の言い回しタイプと、これと異なる言い回しタイプとを用いるように決定することを特徴とする対話方法。 - 入力情報で与えられる言い回しパターンを言い回しタイプに対応付けする言い回しデータベースと、
入力情報を参照し、入力情報に含まれるパラメータを抽出する言語理解処理手段と、
入力情報と前記言い回しデータベースを参照し、入力情報の言い回しタイプを抽出する言い回しタイプ抽出手段と、
応答内容を決定する応答内容決定手段と、
応答文の言い回しタイプを決定する応答文の言い回しタイプ決定手段と、
前記応答文の言い回しタイプと、前記応答内容を参照して、応答文を生成する応答文生成手段と、
前記入力情報で与えられるパラメータと各パラメータの属性とを対応付けしたものと、入力情報で与えられる言い回しタイプと、応答内容と、応答文の言い回しタイプと、応答文の履歴を履歴情報として記憶した内部パラメータ記憶部と、
を備えることを特徴とする対話装置。 - 請求項5記載の対話装置において、
前記応答内容決定手段及び前記言い回しタイプ決定手段は、それぞれに前記内部パラメータ記憶部に記憶された履歴情報を参照する履歴情報参照手段を備え、応答内容決定手段は対話の履歴に応じて応答内容を決定し、言い回しタイプ決定手段は対話の履歴に応じて言い回しタイプを決定することを特徴とする対話装置。 - 請求項5又は6記載の対話装置の何れかにおいて、
前記応答内容決定手段は、言い換え応答出力判定手段を備え、言い換え応答出力判定手段において言い換え応答を出力するよう判定された場合、ひとつの応答において、同一の概念について重複して言及する応答内容を決定し、前記応答文の言い回しタイプ決定手段は、異なる言い回しタイプを、それぞれの言及に用いるように決定することを特徴とする対話装置。 - 請求項7記載の対話装置において、
前記言い換え応答出力判定手段は、内部パラメータに記憶された履歴情報を参照し、所定の回数以上の回数で、応答内容が確認もしくは新規の情報を要求する内容であり且つこれに対する入力情報の言い回しタイプに同一のものが出現している場合に、言い換え応答を出力するよう判定し、前記応答文の言い回しタイプ決定手段は、履歴情報を参照し、入力情報の言い回しタイプと、これと異なる言い回しタイプとを用いるように決定することを特徴とする対話装置。 - 入力音声を音声認識し音声認識結果を請求項5乃至8記載の対話装置に入力情報として出力する音声認識装置と、前記対話装置が生成した応答文を音声信号に変換する音声合成装置を付加したことを特徴とする音声対話装置。
- コンピュータが解読可能なプログラム言語によって記述され、コンピュータに少なくとも請求項5乃至8の何れかに記載の対話装置として機能させる対話プログラム。
- コンピュータが解読可能なプログラム言語によって記述され、コンピュータに請求項9記載の音声対話装置として機能させる音声対話プログラム。
- コンピュータが読み取り可能な記録媒体で構成され、請求項10又は請求項11の何れかに記載の対話プログラム又は音声対話プログラムの少なくとも一方を記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004195819A JP2006018028A (ja) | 2004-07-01 | 2004-07-01 | 対話方法、対話装置、音声対話装置、対話プログラム、音声対話プログラム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004195819A JP2006018028A (ja) | 2004-07-01 | 2004-07-01 | 対話方法、対話装置、音声対話装置、対話プログラム、音声対話プログラム及び記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006018028A true JP2006018028A (ja) | 2006-01-19 |
Family
ID=35792363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004195819A Pending JP2006018028A (ja) | 2004-07-01 | 2004-07-01 | 対話方法、対話装置、音声対話装置、対話プログラム、音声対話プログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006018028A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007041319A (ja) * | 2005-08-03 | 2007-02-15 | Matsushita Electric Ind Co Ltd | 音声認識装置および音声認識方法 |
JP2009230068A (ja) * | 2008-03-25 | 2009-10-08 | Denso Corp | 音声認識装置及びナビゲーションシステム |
JP2018041155A (ja) * | 2016-09-05 | 2018-03-15 | 株式会社野村総合研究所 | 音声注文受付システム |
WO2019123775A1 (ja) * | 2017-12-22 | 2019-06-27 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
JP2020154378A (ja) * | 2019-03-18 | 2020-09-24 | 本田技研工業株式会社 | 自己との対話装置、チャットボット、およびロボット |
US11290613B2 (en) | 2019-11-28 | 2022-03-29 | Ricoh Company, Ltd. | Information processing system, information processing method, and information processing apparatus |
-
2004
- 2004-07-01 JP JP2004195819A patent/JP2006018028A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007041319A (ja) * | 2005-08-03 | 2007-02-15 | Matsushita Electric Ind Co Ltd | 音声認識装置および音声認識方法 |
JP4680714B2 (ja) * | 2005-08-03 | 2011-05-11 | パナソニック株式会社 | 音声認識装置および音声認識方法 |
JP2009230068A (ja) * | 2008-03-25 | 2009-10-08 | Denso Corp | 音声認識装置及びナビゲーションシステム |
JP2018041155A (ja) * | 2016-09-05 | 2018-03-15 | 株式会社野村総合研究所 | 音声注文受付システム |
WO2019123775A1 (ja) * | 2017-12-22 | 2019-06-27 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
JPWO2019123775A1 (ja) * | 2017-12-22 | 2020-10-22 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
JP7276129B2 (ja) | 2017-12-22 | 2023-05-18 | ソニーグループ株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
JP2020154378A (ja) * | 2019-03-18 | 2020-09-24 | 本田技研工業株式会社 | 自己との対話装置、チャットボット、およびロボット |
US11290613B2 (en) | 2019-11-28 | 2022-03-29 | Ricoh Company, Ltd. | Information processing system, information processing method, and information processing apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7277851B1 (en) | Automated creation of phonemic variations | |
US6535849B1 (en) | Method and system for generating semi-literal transcripts for speech recognition systems | |
US6418410B1 (en) | Smart correction of dictated speech | |
US9424833B2 (en) | Method and apparatus for providing speech output for speech-enabled applications | |
US9070368B2 (en) | Method and system for providing an automated web transcription service | |
US8155958B2 (en) | Speech-to-text system, speech-to-text method, and speech-to-text program | |
US20020123894A1 (en) | Processing speech recognition errors in an embedded speech recognition system | |
JP2001188777A (ja) | 音声をテキストに関連付ける方法、音声をテキストに関連付けるコンピュータ、コンピュータで文書を生成し読み上げる方法、文書を生成し読み上げるコンピュータ、コンピュータでテキスト文書の音声再生を行う方法、テキスト文書の音声再生を行うコンピュータ、及び、文書内のテキストを編集し評価する方法 | |
JP4729902B2 (ja) | 音声対話システム | |
JP2007041319A (ja) | 音声認識装置および音声認識方法 | |
JP2001312296A (ja) | 音声認識システム、音声認識方法およびコンピュータ可読な記録媒体 | |
WO2007066304A1 (en) | Method and system for dynamic creation of contexts | |
AU2022263497A1 (en) | Systems and methods for adaptive proper name entity recognition and understanding | |
JP2002132287A (ja) | 音声収録方法および音声収録装置および記憶媒体 | |
JP7007617B2 (ja) | 話し終わり判定装置、話し終わり判定方法およびプログラム | |
JP2010197644A (ja) | 音声認識システム | |
JP2006018028A (ja) | 対話方法、対話装置、音声対話装置、対話プログラム、音声対話プログラム及び記録媒体 | |
JP4220151B2 (ja) | 音声対話装置 | |
JP4296290B2 (ja) | 音声認識装置、音声認識方法及びプログラム | |
JPH07261793A (ja) | 対話処理装置 | |
JP2004333641A (ja) | 音声入力処理方法、音声対話用表示制御方法、音声入力処理装置、音声対話用表示制御装置、音声入力処理プログラム、音声対話用表示制御プログラム | |
JP6879521B1 (ja) | 多言語音声認識およびテーマ−意義素解析方法および装置 | |
JP4990822B2 (ja) | 辞書修正装置、システム、およびコンピュータプログラム | |
JP4095577B2 (ja) | 対話装置、音声対話装置、対話プログラム、音声対話プログラムおよび記録媒体 | |
CA3103820A1 (en) | Systems and methods for improving content discovery in response to a voice query |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060726 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20060726 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090311 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100202 |