JP2009116075A - 音声認識装置 - Google Patents
音声認識装置 Download PDFInfo
- Publication number
- JP2009116075A JP2009116075A JP2007289525A JP2007289525A JP2009116075A JP 2009116075 A JP2009116075 A JP 2009116075A JP 2007289525 A JP2007289525 A JP 2007289525A JP 2007289525 A JP2007289525 A JP 2007289525A JP 2009116075 A JP2009116075 A JP 2009116075A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- recognition
- speech recognition
- correct candidate
- conversion table
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】キーワードを認識した際に、その誤認識傾向を記録した変換表を用意し、その変換表によって展開した正解候補キーワードを用意する。この正解候補キーワードを含む語彙を登録した認識文法を再び読み込み、再認識を実行する。例えば「○○公園」という音声データに対して「ホケン」というキーワードが得られることが多いのであれば認識キーワード「ホケン」と正解候補キーワード「コウエン」の関係度を高く設定する。
【選択図】図1
Description
図1は、本実施形態にかかる音声認識システム1の構成を示す図である。
図4のキーワード認識文法は、キーワードの前後がガーベージモデルでつながれており、想定されるユーザの発話に合わせ、「です」「に行きたい」といった単語を持っている。この文法によって認識できる単語列の例としては、「(ガーベージ)/エキ/です」「ホテル/(ガーベージ)/に行きたい」「(ガーベージ)/ホケン/(ガーベージ)」などが挙げられる。
図9に、例として、図4のキーワード認識文法を使用したときの音声認識部15による認識結果150の例を示す。認識結果150には、スコア153の高い順番で認識文152が出力されている。
(正解候補キーワード「コウエン」の信頼度)=(認識キーワード「コウエン」の信頼度)×(認識キーワード「コウエン」と正解候補キーワード「コウエン」との関係度)
+(認識キーワード「エキ」の信頼度)×(認識キーワード「エキ」と正解候補キーワード「コウエン」との関係度)
+(認識キーワード「ホケン」の信頼度)×(認識キーワード「ホケン」と正解候補キーワード「コウエン」との関係度)
+(認識キーワード「シゼン」の信頼度)×(認識キーワード「シゼン」と正解候補キーワード「コウエン」との関係度)
=0.0×0.8+0.1×0.0+0.9×0.4+0.0×0.2
=0.36
なお、上記式の通り、S101で認識キーワードとして得られなかったものは、その信頼度を「0」として計算式にあてはめる。
第2の実施形態は、上記第1の実施形態と似た構成を備えているので、共通する部分については説明を省略する。
第3の実施形態は、上記第1の実施形態と似た構成を備えているので、共通する部分については説明を省略する。
(キーワードの組み合わせの信頼度)=(含まれているキーワードの信頼度の総和)÷(キーワードの数)
具体的には、音声認識部15は、下記のように信頼度を計算できる。
ホケン−シゼン(異順位文間中):(0.9(ホケン)+0.1(シゼン))/2(単語数)=0.5
エキ−シゼン(異順位文間中):(0.9(エキ)+0.1(シゼン))/2(単語数)=0.5
こうして認識キーワード(「認識キーワードの組み合わせ」を含む)の信頼度が計算されると、次に、認識結果変換部16は、変換表を用いて、キーワード変換処理(図13のS202)を行う。
0.9(ホケン)×0.6(T1)
+0.9(ホケン−エキ(同一順位文中))×0.3(T2)
+0.5(ホケン−シゼン(異順位文間))×0.05(T3)
+0.1(シゼン)×0.05(T4 )
=0.84
同様に計算すると、正解候補キーワード「エキ」、「ホケン」、及び「シゼン」について、信頼度は、「0.795」、「0.84」、及び「0.17」となる。
第4の実施形態は、上記第1の実施形態と似た構成を備えているので、共通する部分については説明を省略する。
第5の実施形態は、上記第1の実施形態と似た構成を備えているので、共通する部分については説明を省略する。
第6の実施形態は、上記第1の実施形態と似た構成を備えているので、共通する部分については説明を省略する。
11・・・分析部、12・・・音声データ記憶部、13・・・音響モデル記憶部、14・・・言語モデル記憶部、15・・・音声認識部、16・・・認識結果変換部、17・・・変換表記憶部、18・・・再認識指令部
Claims (9)
- 音声認識装置であって、
ユーザが発話した音声に基づいて音声データを取得する手段と、
頻出単語であるキーワードを含む第1の文法を用いて前記音声データに含まれるキーワードを認識する第1の音声認識手段と、
前記第1の音声認識手段で認識したキーワードに対して、予め定められた変換表を用いて、正解候補キーワードを求めるキーワード変換手段と、
前記キーワード変換手段で求めた正解候補キーワードを含む第2の文法を用いて前記音声データに含まれる単語を認識する第2の音声認識手段と
を備えることを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
前記変換表には、前記第1の音声認識手段でキーワードが認識されなかった場合及び/又はキーワードが誤って認識された場合のための正解候補キーワードが記述されている
ことを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
前記変換表には、複数のキーワードの組合せに対して、正解候補キーワードが対応付けられており、
前記キーワード変換手段は、
前記第1の音声認識手段で認識されたキーワードから、キーワードの組み合わせを生成し、生成したキーワードの組み合わせに対して、前記変換表を用いて、正解候補キーワードを求める
ことを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
前記第2の音声認識手段は、
前記キーワード変換手段により求められた前記正解候補キーワードの中から、所定の数以下の正解候補キーワードを選定し、
選定した正解候補キーワードを含む前記第2の文法を読み込んで前記音声データに含まれる単語を認識する
ことを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
前記第2の音声認識手段は、
前記正解候補キーワードを含む前記第2の文法の中から、所定量の第2の文法を選定し、選定した第2の文法を読み込んで前記音声データに含まれる単語を認識する
ことを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
前記音声認識部は、
前記正解候補キーワードの中から、所定の方法で計算した信頼度が所定の値以上である正解候補のキーワードを選定し、
選定した正解候補キーワードを含む第2の文法を読み込んで前記音声データに含まれる単語を認識する
ことを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
前記第1の音声認識手段は、前記音声データに含まれているキーワードとともにその出現位置を認識し、
前記変換表には、前記第1の音声認識手段により認識されるキーワードについて、出現位置に対応して、正解候補キーワードが記述されており、
前記キーワード変換手段は、
前記変換表を用いて前記第1の音声認識手段で認識したキーワードとその出現位置に対応する正解候補キーワードを求める
ことを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
ユーザから取得した情報を用いて、前記キーワード変換手段で用いられる変換表を選択する変換表選択手段を備えている
ことを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
環境情報を取得する環境情報取得手段と、
前記環境情報を用いて、前記キーワード変換手段で用いられる変換表を選択する変換表選択手段を備えている
ことを特徴とする音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007289525A JP2009116075A (ja) | 2007-11-07 | 2007-11-07 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007289525A JP2009116075A (ja) | 2007-11-07 | 2007-11-07 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009116075A true JP2009116075A (ja) | 2009-05-28 |
Family
ID=40783278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007289525A Pending JP2009116075A (ja) | 2007-11-07 | 2007-11-07 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009116075A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013006215A1 (en) * | 2011-07-01 | 2013-01-10 | Nec Corporation | Method and apparatus of confidence measure calculation |
JP2015520410A (ja) * | 2012-04-27 | 2015-07-16 | インタラクティブ・インテリジェンス・インコーポレイテッド | 音声認識に対する負例(アンチワード)に基づく性能改善 |
JP6462936B1 (ja) * | 2018-06-18 | 2019-01-30 | 菱洋エレクトロ株式会社 | 音声認識システム、及び音声認識装置 |
CN112259077A (zh) * | 2020-10-20 | 2021-01-22 | 网易(杭州)网络有限公司 | 语音识别方法、装置、终端和存储介质 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0481898A (ja) * | 1990-07-25 | 1992-03-16 | Nec Corp | 音声認識装置 |
JPH10274996A (ja) * | 1997-03-31 | 1998-10-13 | Toshiba Corp | 音声認識装置 |
JPH11202890A (ja) * | 1998-01-20 | 1999-07-30 | Ricoh Co Ltd | 音声検索装置 |
JP2000322085A (ja) * | 1999-05-14 | 2000-11-24 | Nec Corp | 音声認識装置及び音声認識方法 |
JP2001147698A (ja) * | 1999-11-22 | 2001-05-29 | Hitachi Ltd | 音声認識用疑似単語生成方法及び音声認識装置 |
JP2003345384A (ja) * | 2002-05-27 | 2003-12-03 | Pioneer Electronic Corp | 音声認識装置、音声認識方法および音声認識プログラム |
JP2004334228A (ja) * | 2004-06-07 | 2004-11-25 | Denso Corp | 単語列認識装置 |
JP2005092310A (ja) * | 2003-09-12 | 2005-04-07 | Kddi Corp | 音声キーワード認識装置 |
JP2006039383A (ja) * | 2004-07-29 | 2006-02-09 | Nissan Motor Co Ltd | 音声認識装置 |
JP2006039382A (ja) * | 2004-07-29 | 2006-02-09 | Nissan Motor Co Ltd | 音声認識装置 |
JP2006521578A (ja) * | 2003-03-26 | 2006-09-21 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声認識システム |
JP2007187975A (ja) * | 2006-01-16 | 2007-07-26 | Nissan Motor Co Ltd | 音声認識装置および音声認識方法 |
JP2008083165A (ja) * | 2006-09-26 | 2008-04-10 | Xanavi Informatics Corp | 音声認識処理プログラム及び音声認識処理方法 |
-
2007
- 2007-11-07 JP JP2007289525A patent/JP2009116075A/ja active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0481898A (ja) * | 1990-07-25 | 1992-03-16 | Nec Corp | 音声認識装置 |
JPH10274996A (ja) * | 1997-03-31 | 1998-10-13 | Toshiba Corp | 音声認識装置 |
JPH11202890A (ja) * | 1998-01-20 | 1999-07-30 | Ricoh Co Ltd | 音声検索装置 |
JP2000322085A (ja) * | 1999-05-14 | 2000-11-24 | Nec Corp | 音声認識装置及び音声認識方法 |
JP2001147698A (ja) * | 1999-11-22 | 2001-05-29 | Hitachi Ltd | 音声認識用疑似単語生成方法及び音声認識装置 |
JP2003345384A (ja) * | 2002-05-27 | 2003-12-03 | Pioneer Electronic Corp | 音声認識装置、音声認識方法および音声認識プログラム |
JP2006521578A (ja) * | 2003-03-26 | 2006-09-21 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声認識システム |
JP2005092310A (ja) * | 2003-09-12 | 2005-04-07 | Kddi Corp | 音声キーワード認識装置 |
JP2004334228A (ja) * | 2004-06-07 | 2004-11-25 | Denso Corp | 単語列認識装置 |
JP2006039382A (ja) * | 2004-07-29 | 2006-02-09 | Nissan Motor Co Ltd | 音声認識装置 |
JP2006039383A (ja) * | 2004-07-29 | 2006-02-09 | Nissan Motor Co Ltd | 音声認識装置 |
JP2007187975A (ja) * | 2006-01-16 | 2007-07-26 | Nissan Motor Co Ltd | 音声認識装置および音声認識方法 |
JP2008083165A (ja) * | 2006-09-26 | 2008-04-10 | Xanavi Informatics Corp | 音声認識処理プログラム及び音声認識処理方法 |
Non-Patent Citations (2)
Title |
---|
CSNG200600845074; 山田 誠: 'リジェクションのための非キーワードモデル設計法の検討' 日本音響学会2003年秋季研究発表会講演論文集-I- , 200309, 社団法人日本音響学会 * |
JPN6011069755; 山田 誠: 'リジェクションのための非キーワードモデル設計法の検討' 日本音響学会2003年秋季研究発表会講演論文集-I- , 200309, 社団法人日本音響学会 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013006215A1 (en) * | 2011-07-01 | 2013-01-10 | Nec Corporation | Method and apparatus of confidence measure calculation |
US9336769B2 (en) | 2011-07-01 | 2016-05-10 | Nec Corporation | Relative semantic confidence measure for error detection in ASR |
JP2015520410A (ja) * | 2012-04-27 | 2015-07-16 | インタラクティブ・インテリジェンス・インコーポレイテッド | 音声認識に対する負例(アンチワード)に基づく性能改善 |
JP6462936B1 (ja) * | 2018-06-18 | 2019-01-30 | 菱洋エレクトロ株式会社 | 音声認識システム、及び音声認識装置 |
WO2019244385A1 (ja) * | 2018-06-18 | 2019-12-26 | 菱洋エレクトロ株式会社 | 音声認識システム、及び音声認識装置 |
CN112259077A (zh) * | 2020-10-20 | 2021-01-22 | 网易(杭州)网络有限公司 | 语音识别方法、装置、终端和存储介质 |
CN112259077B (zh) * | 2020-10-20 | 2024-04-09 | 网易(杭州)网络有限公司 | 语音识别方法、装置、终端和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100755677B1 (ko) | 주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 | |
JP6188831B2 (ja) | 音声検索装置および音声検索方法 | |
JP4301102B2 (ja) | 音声処理装置および音声処理方法、プログラム、並びに記録媒体 | |
EP1575030B1 (en) | New-word pronunciation learning using a pronunciation graph | |
KR101153078B1 (ko) | 음성 분류 및 음성 인식을 위한 은닉 조건부 랜덤 필드모델 | |
WO2015151157A1 (ja) | 意図理解装置および方法 | |
JP5310563B2 (ja) | 音声認識システム、音声認識方法、および音声認識用プログラム | |
US20070239444A1 (en) | Voice signal perturbation for speech recognition | |
US7409345B2 (en) | Methods for reducing spurious insertions in speech recognition | |
JP4340685B2 (ja) | 音声認識装置及び音声認識方法 | |
JP6699748B2 (ja) | 対話装置、対話方法及び対話用コンピュータプログラム | |
JP2007047412A (ja) | 認識文法モデル作成装置、認識文法モデル作成方法、および、音声認識装置 | |
CN112562676B (zh) | 一种语音解码方法、装置、设备及存储介质 | |
JP4836076B2 (ja) | 音声認識システム及びコンピュータプログラム | |
JP2004226982A (ja) | 隠れ軌跡隠れマルコフモデルを使用した音声認識の方法 | |
WO2004047075A1 (ja) | 音声処理装置および方法、記録媒体並びにプログラム | |
Nakagawa | A survey on automatic speech recognition | |
JP2009116075A (ja) | 音声認識装置 | |
US20040006469A1 (en) | Apparatus and method for updating lexicon | |
JP2008026721A (ja) | 音声認識装置、音声認識方法、および音声認識用プログラム | |
JP2005283646A (ja) | 音声認識率推定装置 | |
Wang et al. | Posterior-based confidence measures for spoken term detection | |
JP2005250071A (ja) | 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 | |
JPH1195793A (ja) | 音声入力解釈装置及び音声入力解釈方法 | |
JP4236502B2 (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20100215 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20101018 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101019 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20101018 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120312 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120529 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20121002 |