JP4736962B2 - キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置 - Google Patents
キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置 Download PDFInfo
- Publication number
- JP4736962B2 JP4736962B2 JP2006153071A JP2006153071A JP4736962B2 JP 4736962 B2 JP4736962 B2 JP 4736962B2 JP 2006153071 A JP2006153071 A JP 2006153071A JP 2006153071 A JP2006153071 A JP 2006153071A JP 4736962 B2 JP4736962 B2 JP 4736962B2
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- speech recognition
- speech
- word
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明による音声認識方法は、音声認識用辞書に記録された音声認識対象単語の中から、上記のキーワード選択方法を使用して、音声認識対象単語の音響的な共通部分をキーワードとして選択し、音声認識対象単語の中から、キーワードおよびキーワードを含まない音声認識対象単語を音声認識実行時の待ち受け単語として読み込み、待ち受け単語と、発話音声とをマッチング処理して発話音声を認識することを特徴とする。
本発明によるキーワード選択システムは、音声認識対象単語を記録した音声認識用辞書を有するサーバ、およびサーバから音声認識対象単語を取得する取得手段と、上記のキーワード選択方法を実行して、音声認識対象単語の音響的な共通部分をキーワードとして選択するキーワード選択手段とを備えるキーワード選択装置を所定の通信回線で接続することを特徴とする。
本発明によるキーワード選択装置は、上記のキーワード選択装置であること特徴とする。
(基準1)各キーワードを含む単語の数が、同時認識可能な範囲でなるべく多くなること。
(基準2)キーワードを含まない認識対象語句とキーワードを併せた数が同時認識可能な範囲に納まること。
(1)音声認識用辞書・文法からキーワードを選択して待ち受け単語とするようにしたので、より多くの認識対象語句をカバーし、より検出しやすいキーワードを設定することができる。このため、どの認識対象語句が発話されてもキーワードを検出しやすくすることができる。
―変形例―
なお、上述した実施の形態の音声認識装置は、以下のように変形することもできる。
(1)上述した実施の形態では、音声認識を行うに当たっては、初回認識時にキーワードとキーワードを含まない単語の両方が認識結果の候補とされた場合、すなわちN−best中にキーワードが含まれている場合には、キーワードの中で最も信頼度が高いものに関しては必ず再認識を行なうこととした。しかしながら、キーワードの信頼度が、キーワード外文法で認識した結果の信頼度と比較して明らかに低い場合には、再認識を行なわず、キーワード外文法で認識した結果を最終的な発話理解結果としてもよい。これによって、キーワードとキーワードを含まない単語の両方が認識結果候補として得られた場合には、一般的にキーワード認識よりも認識尤度が低くなりがちな認識対象語句そのものの認識であるキーワードを含まない単語を認識結果とすることができる。
110 制御装置
111 入力制御部
112 音声認識部
113 理解結果生成部
114 対話制御部
115 GUI表示制御部
116 声合成部
120 音声認識開始スイッチ
130 マイク
140 メモリ
141 音声認識用辞書・文法
142 発話理解結果
150 ディスク読み取り装置
151 ディスク
160 モニタ
170 スピーカ
180 通信装置
200 サーバ
Claims (22)
- 音声認識用辞書に記録された音声認識対象単語の中から選択したキーワードを用いて、音声入力手段を介して入力された発話音声を認識する音声認識装置で使用するキーワード選択方法であって、
前記音声認識対象単語は、3つ以上の音素からなる音素列で構成され、その音素列の内数である特定の複数の音素列をモーラ音素列とし、前記モーラ音素列の音響的な共通部分を前記キーワードとして選択することを特徴とするキーワード選択方法。 - 請求項1に記載のキーワード選択方法において、
前記キーワードは、モーラ音素列の音素数の多い語を優先して選択することを特徴とするキーワード選択方法。 - 請求項1に記載のキーワード選択方法において、
前記キーワードは、母音を含むモーラ音素列を優先して選択することを特徴とするキーワード選択方法。 - 請求項1に記載のキーワード選択方法において、
前記キーワードは、前記音声認識対象単語の先頭に近いモーラ音素列を優先して選択することを特徴とするキーワード選択方法。 - 請求項1に記載のキーワード選択方法において、
前記キーワードは、前記音声認識対象単語内に含まれるキーワードの数が1に近い語を優先して選択することを特徴とするキーワード選択方法。 - 請求項1〜5のいずれか一項に記載のキーワード選択方法において、
前記キーワードは、前記音声認識用辞書から読み込む前記キーワードを含む前記音声認識対象単語の数が、前記音声認識装置における音声認識時の同時認識可能な単語数以内となるように選択することを特徴とするキーワード選択方法。 - 請求項6に記載のキーワード選択方法において、
前記音声認識用辞書から読み込む前記キーワードを含む前記音声認識対象単語の数が前記音声認識時の同時認識可能な単語数より多い場合には、前記キーワードの長さを長くして、前記音声認識用辞書から読み込む前記キーワードを含む前記音声認識対象単語の数を減少させて、前記キーワードを含む前記音声認識対象単語の数が前記音声認識時の同時認識可能な単語数以内になるようにすることを特徴とするキーワード選択方法。 - 請求項1〜7のいずれか一項に記載のキーワード選択方法において、
前記キーワードは、各キーワードが音響的に遠いものとなるように選択することを特徴とするキーワード選択方法。 - 音声認識用辞書に記録された音声認識対象単語の中から、請求項1〜8のいずれか一項に記載のキーワード選択方法を使用して、前記音声認識対象単語の音響的な共通部分をキーワードとして選択し、
前記音声認識対象単語の中から、前記キーワードおよび前記キーワードを含まない音声認識対象単語を音声認識実行時の待ち受け単語として読み込み、
前記待ち受け単語と、前記発話音声とをマッチング処理して前記発話音声を認識することを特徴とする音声認識方法。 - 請求項9に記載の音声認識方法において、
前記発話音声と前記待ち受け単語とをマッチング処理した結果、前記キーワードが音声認識結果の候補として認識された場合には、認識されたキーワードを含む音声認識対象単語を待ち受け単語として、前記発話音声を再認識することを特徴とする音声認識方法。 - 請求項9に記載の音声認識方法において、
前記発話音声と前記待ち受け単語とをマッチング処理した結果、前記キーワードと前記キーワードを含まない音声認識対象単語のそれぞれが音声認識結果の候補として認識された場合には、認識尤度が高いものを音声認識結果とすることを特徴とする音声認識方法。 - 請求項9に記載の音声認識方法において、
前記発話音声と前記待ち受け単語とをマッチング処理した結果、前記キーワードと前記キーワードを含まない音声認識対象単語のそれぞれが音声認識結果の候補として認識された場合には、認識されたキーワードを含む音声認識対象単語を待ち受け単語として再マッチング処理を行い、前記キーワードを含む音声認識対象単語の認識尤度と、前記キーワードを含まない音声認識対象単語の認識尤度とを比較して、前記認識尤度が高い方を音声認識結果とすることを特徴とする音声認識方法。 - 請求項9に記載の音声認識方法において、
前記発話音声と前記待ち受け単語とをマッチング処理した結果、複数の前記キーワードが音声認識結果の候補として認識された場合には、認識された複数のキーワードの含む全ての音声認識対象単語を待ち受け単語として、前記発話音声を再認識することを特徴とする音声認識方法。 - 請求項9に記載の音声認識方法において、
前記発話音声と前記待ち受け単語とをマッチング処理した結果、複数の前記キーワードが音声認識結果の候補として認識された場合には、認識された複数のキーワードのうち、認識尤度が高いものから所定数のキーワードを含む音声認識対象単語を待ち受け単語として、前記発話音声を再認識することを特徴とする音声認識方法。 - 請求項9に記載の音声認識方法において、
前記発話音声と前記待ち受け単語とをマッチング処理した結果、複数の前記キーワードが音声認識結果の候補として認識された場合には、認識された複数のキーワードの音声認識に対する信頼度を算出し、前記信頼度が所定値以上のキーワードを含む音声認識対象単語を待ち受け単語として、前記発話音声を再認識することを特徴とする音声認識方法。 - 請求項9に記載の音声認識方法において、
前記発話音声と前記待ち受け単語とをマッチング処理した結果、複数の前記キーワードが音声認識結果の候補として認識された場合には、認識尤度が高いものから、認識された各キーワードを含む単語の総和が所定数以下となるように設定した数のキーワードを含む音声認識対象単語を待ち受け単語として、前記発話音声を再認識することを特徴とする音声認識方法。 - 音声認識対象単語を記録した音声認識用辞書を有するサーバ、および
前記サーバから前記音声認識対象単語を取得する取得手段と、
請求項1〜8のいずれか一項に記載のキーワード選択方法を実行して、前記音声認識対象単語の音響的な共通部分をキーワードとして選択するキーワード選択手段とを備えるキーワード選択装置を所定の通信回線で接続したキーワード選択システム。 - 請求項17に記載のキーワード選択システムにおいて、
前記サーバ側で前記音声認識対象単語が更新された場合には、前記取得手段は、前記サーバから更新された音声認識対象単語を再取得し、
前記キーワード選択手段は、再取得した音声認識対象単語に基づいて前記キーワードを再選択することを特徴とするキーワード選択システム。 - 請求項18に記載のキーワード選択システムにおいて、
前記キーワード選択装置は、前記キーワード選択手段によって前記キーワードを再選択した結果、前記音声認識対象単語内に存在する再選択したキーワードを含む単語が所定数以下になった場合には、前記待ち受け単語の中から再選択したキーワードを削除する削除手段をさらに備えることを特徴とするキーワード選択システム。 - 請求項18に記載のキーワード選択システムにおいて、
前記キーワード選択装置は、前記キーワード選択手段によって前記キーワードを再選択した結果、前記再選択したキーワードが示す情報が新しい情報に変化した場合には、前記待ち受け単語の中から再選択したキーワードが示す古い情報を削除する削除手段をさらに備えることを特徴とするキーワード選択システム。 - 請求項18に記載のキーワード選択システムにおいて、
前記キーワード選択装置は、前記キーワード選択手段によって前記キーワードを再選択した結果、再選択したキーワードを含む音声認識対象単語内に、同一の組み合わせで同一のキーワードが多く含まれるようになった場合には、前記待ち受け単語の中から前記単語内に含まれるいずれかのキーワードを削除する削除手段をさらに備えることを特徴とするキーワード選択システム。 - 請求項17〜21のいずれか一項に記載のキーワード選択装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006153071A JP4736962B2 (ja) | 2006-06-01 | 2006-06-01 | キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006153071A JP4736962B2 (ja) | 2006-06-01 | 2006-06-01 | キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007322758A JP2007322758A (ja) | 2007-12-13 |
JP4736962B2 true JP4736962B2 (ja) | 2011-07-27 |
Family
ID=38855622
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006153071A Expired - Fee Related JP4736962B2 (ja) | 2006-06-01 | 2006-06-01 | キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4736962B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4845955B2 (ja) * | 2008-12-11 | 2011-12-28 | 株式会社エヌ・ティ・ティ・ドコモ | 音声認識結果訂正装置および音声認識結果訂正方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04365100A (ja) * | 1991-06-11 | 1992-12-17 | Asahi Onkyo Kk | 音声認識に使用する子音の認識方法 |
JP2000259653A (ja) * | 1999-03-09 | 2000-09-22 | Mitsubishi Electric Corp | 音声認識装置及び音声認識方法 |
JP2002215186A (ja) * | 2001-01-12 | 2002-07-31 | Auto Network Gijutsu Kenkyusho:Kk | 音声認識システム |
JP2004157748A (ja) * | 2002-11-06 | 2004-06-03 | Nippon Telegr & Teleph Corp <Ntt> | 音声入力型複合名詞の検索装置および音声入力型複合名詞の検索方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0233200A (ja) * | 1988-07-22 | 1990-02-02 | Mitsubishi Electric Corp | データベース検索方式 |
JP3560590B2 (ja) * | 2001-03-08 | 2004-09-02 | 松下電器産業株式会社 | 韻律生成装置および韻律生成方法並びにプログラム |
JP2005309164A (ja) * | 2004-04-23 | 2005-11-04 | Nippon Hoso Kyokai <Nhk> | 読み上げ用データ符号化装置および読み上げ用データ符号化プログラム |
-
2006
- 2006-06-01 JP JP2006153071A patent/JP4736962B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04365100A (ja) * | 1991-06-11 | 1992-12-17 | Asahi Onkyo Kk | 音声認識に使用する子音の認識方法 |
JP2000259653A (ja) * | 1999-03-09 | 2000-09-22 | Mitsubishi Electric Corp | 音声認識装置及び音声認識方法 |
JP2002215186A (ja) * | 2001-01-12 | 2002-07-31 | Auto Network Gijutsu Kenkyusho:Kk | 音声認識システム |
JP2004157748A (ja) * | 2002-11-06 | 2004-06-03 | Nippon Telegr & Teleph Corp <Ntt> | 音声入力型複合名詞の検索装置および音声入力型複合名詞の検索方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2007322758A (ja) | 2007-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7949524B2 (en) | Speech recognition correction with standby-word dictionary | |
EP1936606B1 (en) | Multi-stage speech recognition | |
KR100679042B1 (ko) | 음성인식 방법 및 장치, 이를 이용한 네비게이션 시스템 | |
US7672846B2 (en) | Speech recognition system finding self-repair utterance in misrecognized speech without using recognized words | |
CN106663424B (zh) | 意图理解装置以及方法 | |
US7162423B2 (en) | Method and apparatus for generating and displaying N-Best alternatives in a speech recognition system | |
US8380505B2 (en) | System for recognizing speech for searching a database | |
EP1162602A1 (en) | Two pass speech recognition with active vocabulary restriction | |
US20060206331A1 (en) | Multilingual speech recognition | |
JP4867622B2 (ja) | 音声認識装置、および音声認識方法 | |
JP2008097082A (ja) | 音声対話装置 | |
JP2015520410A (ja) | 音声認識に対する負例(アンチワード)に基づく性能改善 | |
KR20080088490A (ko) | 다언어 이국 음성 인식 | |
US20070016420A1 (en) | Dictionary lookup for mobile devices using spelling recognition | |
JP2005227686A (ja) | 音声認識装置、音声認識プログラムおよび記録媒体。 | |
JP4661239B2 (ja) | 音声対話装置及び音声対話方法 | |
JP4736962B2 (ja) | キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置 | |
JP4639990B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
JP4930014B2 (ja) | 音声認識装置、および音声認識方法 | |
JP2871420B2 (ja) | 音声対話システム | |
JP4528540B2 (ja) | 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 | |
JP2009116075A (ja) | 音声認識装置 | |
JP2000056795A (ja) | 音声認識装置 | |
Hanazawa et al. | An efficient search method for large-vocabulary continuous-speech recognition | |
JP5201973B2 (ja) | 音声検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090325 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110221 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110418 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140513 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |