JP4661239B2 - 音声対話装置及び音声対話方法 - Google Patents
音声対話装置及び音声対話方法 Download PDFInfo
- Publication number
- JP4661239B2 JP4661239B2 JP2005022704A JP2005022704A JP4661239B2 JP 4661239 B2 JP4661239 B2 JP 4661239B2 JP 2005022704 A JP2005022704 A JP 2005022704A JP 2005022704 A JP2005022704 A JP 2005022704A JP 4661239 B2 JP4661239 B2 JP 4661239B2
- Authority
- JP
- Japan
- Prior art keywords
- candidate
- understanding result
- category
- understanding
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
路線名カテゴリのカテゴリスコア 0.2 < 路線名カテゴリ閾値 0.4、したがって、路線名カテゴリを選択せず、
施設名カテゴリのカテゴリスコア 0.5 > 施設名カテゴリ閾値 0.4、したがって、施設名カテゴリを選択、
これによって、理解結果として採用するべきカテゴリは県カテゴリと施設名カテゴリとなる。
図2に示した実施の形態例では、カテゴリ選択の後、採用する単語の組み合わせを検討し、適当な組み合わせが見つからなければカテゴリ選択を再度やり直す(S8→S6)。本実施の形態例では、選択されたN個の候補カテゴリにあてはまる(すなわち、意味上の整合性がとれる)適当な組み合わせの単語が存在しない場合、N未満の候補カテゴリを選択する。N個の候補カテゴリからN−1個の候補カテゴリを選択する方法としては、まず、N個の候補カテゴリの中で最もカテゴリスコアが低いカテゴリを除いたものを候補カテゴリ選択の結果とする方法がある。
選択されたN個のカテゴリにあてはまる適当な組み合わせの単語が存在しない場合に、N個のカテゴリからN未満のカテゴリを選択するその他の方法としては、選択されたN個のカテゴリから1つをはずしたN−1個のカテゴリの組み合わせ(候補カテゴリの集合)N個の全てに関して、理解結果候補として適当な単語を調べ、理解結果のスコアを求め、理解結果のスコアが最も高くなるものを選択する方法もある。
次に、選択されたカテゴリにあてはまる単語の組み合わせが見つかりはしたが、これが最適な結果ではない場合について説明する。
理解結果の生成精度を上げるためのその他の方法として、理解結果に選択する単語間の関係を考慮することもあげられる。具体的には、理解結果候補探索処理によって複数の理解結果候補が得られ、該理解結果候補のすべてが同一複数の単語からなる場合に、該理解結果候補の各々について、単語の単語信頼度の合計に、該理解結果候補中のカテゴリの組み合わせが1つの発話中で発話される確率が高いほど大きくなる数を乗じて得られる値を該理解結果候補のスコアとし、該理解結果候補の中で該スコアが最も高い理解結果候補を理解結果とする方法がある。
また、図7の例のような場合、それぞれの単語がどの認識結果に含まれていたかという情報を利用することもできる。具体的には、理解結果候補探索処理によって複数の理解結果候補が得られ、該理解結果候補のすべてが同一複数の単語からなる場合に、該理解結果候補の各々について、同一認識結果の同一候補内において認識された単語の組み合わせが該理解結果候補内にある場合に、1よりも大きい数を該単語の単語信頼度に乗じ、該乗算後の単語信頼度の合計を該理解結果候補のスコアとし、該理解結果候補の中で該スコアが最も高い理解結果候補を理解結果として採用する。つまり、同一の認識結果に含まれていた単語同士の組み合わせはスコアを高くすることで、認識部112の計算した単語同士の組み合わせ確率を利用することができる。
東京都の単語信頼度+品川駅の単語信頼度
=(0.30+0.20+0.10)+0.30=0.90
(ここで、(0.30+0.20+0.10)は東京都の単語信頼度であり、 0.30は品川駅の単語信頼度である)
と求められるのに対して、本実施の形態例は下記のようになる。
=(0.30×1.2+0.20+0.10)+0.30×1.2
=1.02
(ここで、2つの0.30×1.2は共に第1発話の第2認識結果中で認識された単語分の単語信頼度の値である)
これらは、理解結果として採用された組み合わせで同じ認識結果中で認識された単語であるため、重みをつけている。すなわち、同一認識結果の同一候補内において認識された単語である「東京都」と「品川駅」とには、値は相異なるが、それぞれ、1よりも大きい数が(重みとして)乗じられている。これに対して理解結果「東京都+東横線」は同一認識結果中での認識がないため、前記の例と同様に、理解結果スコアは0.90となり、同一認識結果中での認識がなかった「東京都+東横線」よりも同一認識結果中での認識結果が得られた「東京都+品川駅」のスコアのほうが高くなるため、これを理解結果として採用する。
また、同様の方法で、音声認識部112による音声波形上の単語の認識箇所に重なりがあるもののスコアを下げることで認識箇所に重なりがある理解結果のスコアを下げることができる。具体的には、理解結果候補探索処理によって複数の理解結果候補が得られ、該理解結果候補のすべてが同一複数の単語からなる場合に、該理解結果候補の各々について、単語信頼度の合計に、同一認識結果内での音声波形中の単語認識区間に重なりがある単語が該理解結果候補内にある場合に、重なりが大きいほど1より小さくなる数を乗じて得られる値を該理解結果候補のスコアとし、該理解結果候補の中で該スコアが最も高い理解結果候補を理解結果として採用する。
ここまでの方法を使えば、カテゴリ数がいくつでも対応できる。カテゴリ選択において多数のカテゴリが選択された例を図11に示した。
1.「東京都+品川駅」・・・スコア0.90
2.「東京都」・・・スコア0.50
理解結果Nに含まれる全ての単語が理解結果Mに含まれる場合、それぞれのスコアは必ず、理解結果Nのスコア<理解結果Mのスコアとなる。
1.「東京都+品川駅」・・・正規化済スコア0.56
2.「東京都」・・・正規化済スコア0.50
よって、理解結果「東京都+品川駅」のほうが正規化済のスコアが高いため、この理解結果は信頼できると判断し、これを理解結果として採用する。
Claims (16)
- 入力される音声を音声信号に変換して出力する音声入力手段と、該音声信号を候補単語に変換して出力する音声認識手段と、該候補単語が発話された可能性の高さを示す単語信頼度を求める単語信頼度演算手段と、該候補単語と該単語信頼度とから該音声入力手段に入力された音声言語を理解する言語理解部とを有する音声対話装置であって、
前記言語理解部は、ユーザの発話が前記音声入力手段に入力された場合に、前記音声認識手段が出力する候補単語の全てをカテゴリに分類し、該カテゴリの各々について、該カテゴリに属する候補単語の単語信頼度を用いて該カテゴリに属する候補単語が発話された可能性の高さを示すカテゴリスコアを求め、該カテゴリスコアが該カテゴリに対して予め定められた閾値以上であるカテゴリの全部または一部を候補カテゴリとして選択するカテゴリ選択処理と、該候補カテゴリに属する候補単語の中から意味上の整合性がとれる単語または単語の組み合わせである理解結果候補を探索する理解結果候補探索処理とを行い、該理解結果候補探索処理によって理解結果候補が発見されない場合には、該候補カテゴリの集合から1つ以上のカテゴリを除いてなる集合を新しい候補カテゴリの集合として選択するカテゴリ選択処理を行った後に該理解結果候補探索処理を再び行って、理解結果を生成し、
応答文生成部は、前記言語理解部が生成した前記理解結果をもとに応答文を作成する
ことを特徴とする音声対話装置。 - 前記理解結果候補探索処理において理解結果候補が発見されない場合には、前記候補カテゴリの集合からカテゴリスコアが最も低い候補カテゴリ1つを除いてなる集合を新しい候補カテゴリの集合として選択するカテゴリ選択処理を行った後に前記理解結果候補探索処理を再び行うことを特徴とする請求項1記載の音声対話装置。
- 前記理解結果候補探索処理において理解結果候補が発見されない場合には、前記候補カテゴリの集合から1つの候補カテゴリを除いてなる複数の集合を新しい候補カテゴリの集合として選択するカテゴリ選択処理を行った後に、該候補カテゴリの集合の各々について前記理解結果候補探索処理を再び行うことを特徴とする請求項1記載の音声対話装置。
- 前記理解結果候補が1つの単語からなり、該単語の単語信頼度が予め定められた閾値以下ならば、該理解結果候補を理解結果として採用しないことを特徴とする請求項1、2または3記載の音声対話装置。
- 前記理解結果候補が複数の単語からなり、該単語の単語信頼度の合計が予め定められた閾値以下ならば、該理解結果候補を理解結果として採用しないことを特徴とする請求項1、2または3記載の音声対話装置。
- 前記理解結果候補探索処理によって複数の理解結果候補が得られ、該理解結果候補のすべてが同一複数の単語からなる場合に、該理解結果候補の各々について、単語信頼度の合計に、該理解結果候補中のカテゴリの組み合わせが1つの発話中で発話される確率が高いほど大きくなる数を乗じて得られる値を該理解結果候補のスコアとし、該理解結果候補の中で該スコアが最も高い理解結果候補を理解結果として採用することを特徴とする請求項1、2または3記載の音声対話装置。
- 前記理解結果候補探索処理によって複数の理解結果候補が得られ、該理解結果候補のすべてが同一複数の単語からなる場合に、該理解結果候補の各々について、同一認識結果の同一候補内において認識された単語の組み合わせが該理解結果候補内にある場合に、1よりも大きい数を該単語の単語信頼度に乗じ、該乗算後の単語信頼度の合計を該理解結果候補のスコアとし、該理解結果候補の中で該スコアが最も高い理解結果候補を理解結果として採用することを特徴とする請求項1、2または3記載の音声対話装置。
- 前記理解結果候補探索処理によって複数の理解結果候補が得られ、該理解結果候補のすべてが同一複数の単語からなる場合に、該理解結果候補の各々について、単語信頼度の合計に、同一認識結果内での音声波形中の単語認識区間に重なりがある単語が該理解結果候補内にある場合に該重なりが大きいほど1より小さくなる数を乗じて得られる値を該理解結果候補のスコアとし、該理解結果候補の中で該スコアが最も高い理解結果候補を理解結果として採用することを特徴とする請求項1、2または3記載の音声対話装置。
- 入力される音声を音声信号に変換して出力する音声入力手段と、該音声信号を候補単語に変換して出力する音声認識手段と、該候補単語が発話された可能性の高さを示す単語信頼度を求める単語信頼度演算手段と、該候補単語と該単語信頼度とから該音声入力手段に入力された音声言語を理解する言語理解部とを用いる音声対話方法であって、
前記言語理解部は、ユーザの発話が前記音声入力手段に入力された場合に、前記音声認識手段が出力する候補単語の全てをカテゴリに分類し、該カテゴリの各々について、該カテゴリに属する候補単語の単語信頼度を用いて該カテゴリに属する候補単語が発話された可能性の高さを示すカテゴリスコアを求め、該カテゴリスコアが該カテゴリに対して予め定められた閾値以上であるカテゴリの全部または一部を候補カテゴリとして選択するカテゴリ選択処理と、該候補カテゴリに属する候補単語の中から意味上の整合性がとれる単語または単語の組み合わせである理解結果候補を探索する理解結果候補探索処理とを行い、該理解結果候補探索処理によって理解結果候補が発見されない場合には、該候補カテゴリの集合から1つ以上のカテゴリを除いてなる集合を新しい候補カテゴリの集合として選択するカテゴリ選択処理を行った後に該理解結果候補探索処理を再び行って、理解結果を生成し、
応答文生成部は、前記言語理解部が生成した前記理解結果をもとに応答文を作成する
ことを特徴とする音声対話方法。 - 前記理解結果候補探索処理において理解結果候補が発見されない場合には、前記候補カテゴリの集合からカテゴリスコアが最も低い候補カテゴリ1つを除いてなる集合を新しい候補カテゴリの集合として選択するカテゴリ選択処理を行った後に前記理解結果候補探索処理を再び行うことを特徴とする請求項9記載の音声対話方法。
- 前記理解結果候補探索処理において理解結果候補が発見されない場合には、前記候補カテゴリの集合から1つの候補カテゴリを除いてなる複数の集合を新しい候補カテゴリの集合として選択するカテゴリ選択処理を行った後に、該候補カテゴリの集合の各々について前記理解結果候補探索処理を再び行うことを特徴とする請求項9記載の音声対話方法。
- 前記理解結果候補が1つの単語からなり、該単語の単語信頼度が予め定められた閾値以下ならば、該理解結果候補を理解結果として採用しないことを特徴とする請求項9、10または11記載の音声対話方法。
- 前記理解結果候補が複数の単語からなり、該単語の単語信頼度の合計が予め定められた閾値以下ならば、該理解結果候補を理解結果として採用しないことを特徴とする請求項9、10または11記載の音声対話方法。
- 前記理解結果候補探索処理によって複数の理解結果候補が得られ、該理解結果候補のすべてが同一複数の単語からなる場合に、該理解結果候補の各々について、単語信頼度の合計に、該理解結果候補中のカテゴリの組み合わせが1つの発話中で発話される確率が高いほど大きくなる数を乗じて得られる値を該理解結果候補のスコアとし、該理解結果候補の中で該スコアが最も高い理解結果候補を理解結果として採用することを特徴とする請求項9、10または11記載の音声対話方法。
- 前記理解結果候補探索処理によって複数の理解結果候補が得られ、該理解結果候補のすべてが同一複数の単語からなる場合に、該理解結果候補の各々について、同一認識結果の同一候補内において認識された単語の組み合わせが該理解結果候補内にある場合に、1よりも大きい数を該単語の単語信頼度に乗じ、該乗算後の単語信頼度の合計を該理解結果候補のスコアとし、該理解結果候補の中で該スコアが最も高い理解結果候補を理解結果として採用することを特徴とする請求項9、10または11記載の音声対話方法。
- 前記理解結果候補探索処理によって複数の理解結果候補が得られ、該理解結果候補のすべてが同一複数の単語からなる場合に、該理解結果候補の各々について、単語信頼度の合計に、同一認識結果内での音声波形中の単語認識区間に重なりがある単語が該理解結果候補内にある場合に該重なりが大きいほど1より小さくなる数を乗じて得られる値を該理解結果候補のスコアとし、該理解結果候補の中で該スコアが最も高い理解結果候補を理解結果として採用することを特徴とする請求項9、10または11記載の音声対話方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005022704A JP4661239B2 (ja) | 2005-01-31 | 2005-01-31 | 音声対話装置及び音声対話方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005022704A JP4661239B2 (ja) | 2005-01-31 | 2005-01-31 | 音声対話装置及び音声対話方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006208905A JP2006208905A (ja) | 2006-08-10 |
JP4661239B2 true JP4661239B2 (ja) | 2011-03-30 |
Family
ID=36965818
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005022704A Expired - Fee Related JP4661239B2 (ja) | 2005-01-31 | 2005-01-31 | 音声対話装置及び音声対話方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4661239B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080091426A1 (en) * | 2006-10-12 | 2008-04-17 | Rod Rempel | Adaptive context for automatic speech recognition systems |
CN101075435B (zh) * | 2007-04-19 | 2011-05-18 | 深圳先进技术研究院 | 一种智能聊天系统及其实现方法 |
EP2003572B1 (en) * | 2007-05-22 | 2010-08-04 | Honda Motor Co., Ltd. | Language understanding device |
JP5846014B2 (ja) * | 2012-03-30 | 2016-01-20 | アイシン・エィ・ダブリュ株式会社 | プローブ情報統計システム、プローブ情報統計方法およびプローブ情報統計プログラム |
KR102420280B1 (ko) * | 2017-10-30 | 2022-07-13 | 엘지전자 주식회사 | 이동 단말기 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002149188A (ja) * | 2000-11-15 | 2002-05-24 | Sony Corp | 自然言語処理装置および自然言語処理方法、並びに記録媒体 |
JP2003029782A (ja) * | 2001-07-19 | 2003-01-31 | Mitsubishi Electric Corp | 対話処理装置及び対話処理方法並びにプログラム |
JP2004251998A (ja) * | 2003-02-18 | 2004-09-09 | Yukihiro Ito | 対話理解装置 |
JP2006030282A (ja) * | 2004-07-12 | 2006-02-02 | Nissan Motor Co Ltd | 対話理解装置 |
-
2005
- 2005-01-31 JP JP2005022704A patent/JP4661239B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002149188A (ja) * | 2000-11-15 | 2002-05-24 | Sony Corp | 自然言語処理装置および自然言語処理方法、並びに記録媒体 |
JP2003029782A (ja) * | 2001-07-19 | 2003-01-31 | Mitsubishi Electric Corp | 対話処理装置及び対話処理方法並びにプログラム |
JP2004251998A (ja) * | 2003-02-18 | 2004-09-09 | Yukihiro Ito | 対話理解装置 |
JP2006030282A (ja) * | 2004-07-12 | 2006-02-02 | Nissan Motor Co Ltd | 対話理解装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2006208905A (ja) | 2006-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7949524B2 (en) | Speech recognition correction with standby-word dictionary | |
US7996218B2 (en) | User adaptive speech recognition method and apparatus | |
JP4680714B2 (ja) | 音声認識装置および音声認識方法 | |
US8200491B2 (en) | Method and system for automatically detecting morphemes in a task classification system using lattices | |
JP4812029B2 (ja) | 音声認識システム、および、音声認識プログラム | |
US5797116A (en) | Method and apparatus for recognizing previously unrecognized speech by requesting a predicted-category-related domain-dictionary-linking word | |
US20180137109A1 (en) | Methodology for automatic multilingual speech recognition | |
JP5072415B2 (ja) | 音声検索装置 | |
EP1617409B1 (en) | Multimodal method to provide input to a computing device | |
JP5824829B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP2007047412A (ja) | 認識文法モデル作成装置、認識文法モデル作成方法、および、音声認識装置 | |
KR20080088490A (ko) | 다언어 이국 음성 인식 | |
JP4661239B2 (ja) | 音声対話装置及び音声対話方法 | |
JP4634156B2 (ja) | 音声対話方法および音声対話装置 | |
JP5034323B2 (ja) | 音声対話装置 | |
JP4293340B2 (ja) | 対話理解装置 | |
JP4639990B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
JP4684583B2 (ja) | 対話装置 | |
JP3472101B2 (ja) | 音声入力解釈装置及び音声入力解釈方法 | |
JP2003271183A (ja) | 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体 | |
JP3790038B2 (ja) | サブワード型不特定話者音声認識装置 | |
JP4930014B2 (ja) | 音声認識装置、および音声認識方法 | |
JP4635743B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
WO2009147745A1 (ja) | 検索装置 | |
JPH09114482A (ja) | 音声認識のための話者適応化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100702 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100727 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100921 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20101001 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20101028 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101207 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101220 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140114 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |