JP2008116560A - 音声対話装置及び音声理解結果生成方法 - Google Patents
音声対話装置及び音声理解結果生成方法 Download PDFInfo
- Publication number
- JP2008116560A JP2008116560A JP2006297940A JP2006297940A JP2008116560A JP 2008116560 A JP2008116560 A JP 2008116560A JP 2006297940 A JP2006297940 A JP 2006297940A JP 2006297940 A JP2006297940 A JP 2006297940A JP 2008116560 A JP2008116560 A JP 2008116560A
- Authority
- JP
- Japan
- Prior art keywords
- understanding result
- result
- understanding
- score
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】音声対話装置100は、音声認識処理部111による認識結果である複数の認識結果候補から、各認識結果候補に与えられた所定の選択基準値に基づき選択された認識結果候補を用いて、発話された音声に対する応答となる理解結果を生成する理解結果生成部113を備える。理解結果生成部113は、過去に訂正を指示された理解結果に対応する認識結果候補に与えられた所定の選択基準値を、過去に訂正を指示された理解結果と同一の発話を再度入力した場合の認識結果候補には影響を与えない程度に、過去に訂正を指示された理解結果が選択されにくくなる方向に修正する。
【選択図】図1
Description
第1のユーザ発話U1 :「神奈川県」
第1のシステム応答SR1:「神奈川県のどちらですか?」
第2のユーザ発話U2 :「横浜駅」
第2のシステム応答SR2:「横須賀駅でよろしいですか?」
第1のユーザ操作U3 :取り消し指示ボタン140押下
第3のシステム応答SR3:「神奈川県のどちらですか?」
第3のユーザ発話U4 :「横浜駅」
すなわち、ユーザは、目的地を設定するために第1のユーザ発話として「神奈川県」(U1)を発話した。
110 制御装置
111 音声認識処理部
112 音声認識用辞書・文法
113 理解結果生成部
114 過去理解結果リスト
115 キャンセル情報リスト
116 応答生成部
117 GUI表示制御部
118 音声合成部
120 マイク
121 A/Dコンバータ
130 音声認識開始ボタン
140 取り消し指示ボタン
150 ディスク読み取り装置
151 ディスク
160 モニタ
170 スピーカ
171 D/Aコンバータ
Claims (17)
- 発話された音声を入力する入力手段と、
前記入力手段によって入力された音声を認識対象語に基づき認識する音声認識手段と、
前記音声認識手段による認識結果である複数の認識結果候補から、各認識結果候補に与えられた所定の選択基準値に基づき選択された前記認識結果候補を用いて、前記発話された音声に対する応答となる理解結果を生成する理解結果生成手段と、
前記理解結果生成手段によって生成された前記理解結果に対して訂正を指示する訂正指示手段と、
前記理解結果生成手段によって前記理解結果を生成する際に、前記訂正指示手段によって過去に訂正を指示された理解結果に対応する前記認識結果候補に与えられた前記所定の選択基準値を、前記過去に訂正を指示された理解結果と同一の発話を再度入力した場合の認識結果候補には影響を与えない程度に、過去に訂正を指示された理解結果が選択されにくくなる方向に修正する選択基準値修正手段とを備えること
を特徴とする音声対話装置。 - 前記理解結果の確からしさをスコアとして計算するスコア計算手段を備え、
前記選択基準値修正手段は、任意の理解結果が正解である場合における当該理解結果のスコアと、前記正解の理解結果よりもスコアが低く且つ不正解の理解結果のうち最も高い理解結果のスコアとの関係性の出現傾向に基づいて、前記選択基準値を修正するための修正係数を決定すること
を特徴とする請求項1記載の音声対話装置。 - 前記理解結果の確からしさをスコアとして計算するスコア計算手段を備え、
前記選択基準値修正手段は、任意の理解結果が不正解である場合における正解の理解結果のスコアと、前記不正解の理解結果よりもスコアが低く且つ前記不正解の理解結果とは異なる理解結果のうち最も高い理解結果のスコアとの関係性の出現傾向に基づいて、前記選択基準値を修正するための修正係数を決定すること
を特徴とする請求項1記載の音声対話装置。 - 前記選択基準値修正手段は、任意の理解結果が不正解である場合における正解の理解結果のスコアと、前記不正解の理解結果よりもスコアが低く且つ正解の理解結果のうち最も高い理解結果のスコアとの関係性の出現傾向に基づいて、前記修正係数を決定すること
を特徴とする請求項3記載の音声対話装置。 - 前記理解結果生成手段は、前記認識結果候補のうちのいずれかひとつから前記理解結果を生成し、
前記スコア計算手段は、前記理解結果に対応する前記認識結果候補の前記認識対象語との音響的な近さ示す尤度を、当該理解結果のスコアとすること
を特徴とする請求項2乃至請求項4のうちいずれか1項記載の音声対話装置。 - 前記認識結果候補に含まれる単語に対して、発話された可能性を示し、前記所定の選択基準値となる単語信頼度を算出する単語信頼度算出手段を備え、
前記スコア計算手段は、前記理解結果に含まれる単語が有する前記単語信頼度の合計を、当該理解結果のスコアとすること
を特徴とする請求項2乃至請求項4のうちいずれか1項記載の音声対話装置。 - 前記理解結果生成手段は、任意の理解結果のスコアと、前記理解結果の次に大きいスコアを有する理解結果のスコアとの関係性をこれら2つのスコアの差分とし、この差分が所定の閾値を超えない場合に、前記過去に訂正を指示された理解結果を理解結果として選択しないこと
を特徴とする請求項2乃至請求項6のうちいずれか1項記載の音声対話装置。 - 前記理解結果生成手段は、任意の理解結果のスコアと、前記理解結果の次に大きいスコアを有する理解結果のスコアとの関係性をこれら2つのスコアの比とし、一方のスコアに対する他方のスコアの比が所定の閾値を超えない場合に、前記過去に訂正を指示された理解結果を理解結果として選択しないこと
を特徴とする請求項2乃至請求項6のうちいずれか1項記載の音声対話装置。 - 前記理解結果生成手段は、任意の不正解の理解結果のスコアと、前記不正解の理解結果の次に大きいスコアを有する理解結果のスコアとの関係性の複数サンプルの頻度分布を調べ、全体の一定割合以上の不正解サンプルが、理解結果として選択されなくなる値を前記閾値とすること
を特徴とする請求項7又は請求項8記載の音声対話装置。 - 前記理解結果生成手段は、任意の正解の理解結果のスコアと、前記正解の理解結果の次に大きいスコアを有する理解結果のスコアとの関係性の複数サンプルの頻度分布を調べ、全体の一定割合以上の正解サンプルが、理解結果として選択される値を前記閾値とすること
を特徴とする請求項7又は請求項8記載の音声対話装置。 - 前記理解結果生成手段は、任意の不正解の理解結果のスコアと、前記不正解の理解結果の次に大きいスコアを有する理解結果のスコアとの関係性の複数サンプルの頻度分布を調べ、さらに、他の正解の理解結果のスコアと、前記正解の理解結果の次に大きいスコアを有する理解結果のスコアとの関係性の複数サンプルを調べ、それぞれの出現頻度割合が同じになるスコア値を前記閾値とすること
を特徴とする請求項7又は請求項8記載の音声対話装置。 - 前記選択基準値修正手段は、音声認識の待ち受け語彙に応じて、前記選択基準値を修正するための修正係数を決定すること
を特徴とする請求項1記載の音声対話装置。 - 前記選択基準値修正手段は、音声入力時の周辺雑音環境に応じて、前記選択基準値を修正するための修正係数を決定すること
を特徴とする請求項1記載の音声対話装置。 - 前記選択基準値修正手段は、発話時間に応じて、前記選択基準値を修正するための修正係数を決定すること
を特徴とする請求項1記載の音声対話装置。 - 前記選択基準値修正手段は、発話者に応じて、前記選択基準値を修正するための修正係数を決定すること
を特徴とする請求項1記載の音声対話装置。 - 前記選択基準値修正手段は、音声認識結果の内容に応じて、前記選択基準値を修正するための修正係数を決定すること
を特徴とする請求項1記載の音声対話装置。 - 発話された音声を入力する入力工程と、
前記入力工程によって入力された音声を認識対象語に基づき認識する音声認識工程と、
前記音声認識工程による認識結果である複数の認識結果候補から、各認識結果候補に与えられた所定の選択基準値に基づき選択された前記認識結果候補を用いて、前記発話された音声に対する応答となる理解結果を生成する理解結果生成工程と、
前記理解結果生成工程によって生成された前記理解結果に対して訂正を指示する訂正指示工程と、
前記理解結果生成工程によって前記理解結果を生成する際に、前記訂正指示工程によって過去に訂正を指示された理解結果に対応する前記認識結果候補に与えられた前記所定の選択基準値を、前記過去に訂正を指示された理解結果と同一の発話を再度入力した場合の認識結果候補には影響を与えない程度に、過去に訂正を指示された理解結果が選択されにくくなる方向に修正する選択基準値修正工程とを備えること
を特徴とする音声理解結果生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006297940A JP4946358B2 (ja) | 2006-11-01 | 2006-11-01 | 音声対話装置及び音声理解結果生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006297940A JP4946358B2 (ja) | 2006-11-01 | 2006-11-01 | 音声対話装置及び音声理解結果生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008116560A true JP2008116560A (ja) | 2008-05-22 |
JP4946358B2 JP4946358B2 (ja) | 2012-06-06 |
Family
ID=39502558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006297940A Active JP4946358B2 (ja) | 2006-11-01 | 2006-11-01 | 音声対話装置及び音声理解結果生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4946358B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101404246B1 (ko) * | 2012-10-29 | 2014-06-05 | 포항공과대학교 산학협력단 | 발화 인식 성능 향상 시스템 및 방법 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01154098A (ja) * | 1987-12-10 | 1989-06-16 | Ricoh Co Ltd | 音声認識装置 |
JPH09198087A (ja) * | 1996-01-12 | 1997-07-31 | N T T Data Tsushin Kk | 音声認識装置及び方法 |
JPH1063295A (ja) * | 1996-08-14 | 1998-03-06 | Nippon Telegr & Teleph Corp <Ntt> | 認識結果を自動訂正する単語音声認識方法およびこの方法を実施する装置 |
JPH10282989A (ja) * | 1997-04-01 | 1998-10-23 | Nippon Telegr & Teleph Corp <Ntt> | 正解認識候補絞り込み方法 |
JP2001075589A (ja) * | 1999-09-02 | 2001-03-23 | Denso Corp | 音声認識方法及び音声認識装置 |
JP2001100786A (ja) * | 1999-09-28 | 2001-04-13 | Canon Inc | 音声認識方法、装置及び記憶媒体 |
-
2006
- 2006-11-01 JP JP2006297940A patent/JP4946358B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01154098A (ja) * | 1987-12-10 | 1989-06-16 | Ricoh Co Ltd | 音声認識装置 |
JPH09198087A (ja) * | 1996-01-12 | 1997-07-31 | N T T Data Tsushin Kk | 音声認識装置及び方法 |
JPH1063295A (ja) * | 1996-08-14 | 1998-03-06 | Nippon Telegr & Teleph Corp <Ntt> | 認識結果を自動訂正する単語音声認識方法およびこの方法を実施する装置 |
JPH10282989A (ja) * | 1997-04-01 | 1998-10-23 | Nippon Telegr & Teleph Corp <Ntt> | 正解認識候補絞り込み方法 |
JP2001075589A (ja) * | 1999-09-02 | 2001-03-23 | Denso Corp | 音声認識方法及び音声認識装置 |
JP2001100786A (ja) * | 1999-09-28 | 2001-04-13 | Canon Inc | 音声認識方法、装置及び記憶媒体 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101404246B1 (ko) * | 2012-10-29 | 2014-06-05 | 포항공과대학교 산학협력단 | 발화 인식 성능 향상 시스템 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP4946358B2 (ja) | 2012-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0840289B1 (en) | Method and system for selecting alternative words during speech recognition | |
EP0840288B1 (en) | Method and system for editing phrases during continuous speech recognition | |
US5950160A (en) | Method and system for displaying a variable number of alternative words during speech recognition | |
CN106663424B (zh) | 意图理解装置以及方法 | |
US5933804A (en) | Extensible speech recognition system that provides a user with audio feedback | |
US8612225B2 (en) | Voice recognition device, voice recognition method, and voice recognition program | |
US10176806B2 (en) | Motor vehicle operating device with a correction strategy for voice recognition | |
EP0965978A1 (en) | Non-interactive enrollment in speech recognition | |
EP1321926A1 (en) | Speech recognition correction | |
EP0841655A2 (en) | Method and system for buffering recognized words during speech recognition | |
US20150046163A1 (en) | Leveraging interaction context to improve recognition confidence scores | |
JP2008009153A (ja) | 音声対話システム | |
KR101836430B1 (ko) | 음성 인식과 번역 방법 및 그를 위한 단말 장치와 서버 | |
JP2021105736A (ja) | 情報処理装置、方法及びプログラム | |
WO2006093092A1 (ja) | 会話システムおよび会話ソフトウェア | |
JP2006189730A (ja) | 音声対話方法および音声対話装置 | |
JP6723907B2 (ja) | 言語認識システム、言語認識方法、及び言語認識プログラム | |
JP4661239B2 (ja) | 音声対話装置及び音声対話方法 | |
JP4639990B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
JP4946358B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
EP0840287A2 (en) | Method and system for selecting recognized words when correcting recognized speech | |
JP2009116075A (ja) | 音声認識装置 | |
JP4635743B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
KR100622019B1 (ko) | 음성 인터페이스 시스템 및 방법 | |
JP6325770B2 (ja) | 音声認識誤り修正装置及びそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090928 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100203 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110411 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110419 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120207 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120220 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150316 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4946358 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |