JP2006184670A - 音声認識装置、方法、およびシステム - Google Patents
音声認識装置、方法、およびシステム Download PDFInfo
- Publication number
- JP2006184670A JP2006184670A JP2004379195A JP2004379195A JP2006184670A JP 2006184670 A JP2006184670 A JP 2006184670A JP 2004379195 A JP2004379195 A JP 2004379195A JP 2004379195 A JP2004379195 A JP 2004379195A JP 2006184670 A JP2006184670 A JP 2006184670A
- Authority
- JP
- Japan
- Prior art keywords
- speech recognition
- standby
- hierarchy
- belonging
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】 制御装置107は、マイク101を介して入力された発話内容を、音声認識用辞書103に階層構造のデータ形式で格納された上位階層に属する待ち受け単語と照合処理して音声認識し、上位階層から派生する最下位階層に属する待ち受け単語の絞込みを行う。この絞込み結果に基づいて、最下位階層に属する待ち受け単語の絞込みがさらに必要であるか否かを判定し、必要である場合には、中間階層に属する待ち受け単語と、発話内容とを照合処理して音声認識し、当該階層から派生する最下位階層に属する待ち受け単語の絞込みを行って音声認識する。
【選択図】 図1
Description
図1は、第1の実施の形態における音声認識装置を車両に搭載したナビゲーション装置に適用した場合の一実施の形態の構成を示すブロック図である。運転者(発話者)が発話したナビゲーション装置200を操作するための各種操作コマンドの音声データは、音声認識装置100で音声認識が実行され、ナビゲーション装置200へ出力される。ナビゲーション装置200は、音声認識装置100から出力された音声データを操作コマンドに変換して処理を実行する。
(1)「カテゴリ名称」2aに属する待ち受け単語に基づいて音声認識した結果、下位に派生する「詳細名称」2cに属する待ち受け単語の候補が所定数以上存在する場合には、中間階層である「サブカテゴリ名称」2bを待ち受け単語とした音声認識を行って、下位に派生する「詳細名称」2cに属する待ち受け単語の候補数を絞り込むようにした。これによって、「詳細名称」2cで待ち受ける待ち受け単語の数を減らすことができ、音声認識処理時間の短縮、および誤認識率の低下を実現することができる。
「サブカテゴリ名称」2bを待ち受け単語とした音声認識を行わず、「詳細名称」2cに属する待ち受け単語で音声認識するようにした。これによって、「カテゴリ名称」2aが決定すれば、候補となる「詳細名称」2cを限定して絞り込めることを加味して、発話者に「サブカテゴリ名称」2bを発話させることなく、少ない発話回数で音声認識を完了することが可能となる。
第2の実施の形態では、第1の実施の形態で上述した音声認識装置を搭載したナビゲーション装置において、音声入力により自車両周辺の施設を検索する場合について説明する。なお、図1に示した音声認識装置100のブロック図については、第1の実施の形態と同様のため、説明を省略する。
(1)発話者によって周辺施設の検索が指示された場合には、ナビゲーション装置200から取得した詳細名称の候補が所定数以上であるか否かを判断して、詳細名称の候補が所定数以上であると判断した場合には、「サブカテゴリ名称」2bに属する待ち受け単語のうち、ナビゲーション装置200から取得した施設分類と一致する単語のみを音声認識用情報データベース103aから抽出して音声認識用辞書103へ格納するようにした。これによって、自車両の現在位置周辺に実際に存在する施設の数が多い場合には、発話者の発話内容を「サブカテゴリ名称」2bに含まれる待ち受け単語でさらに絞り込んで、「詳細名称」2cで待ち受ける待ち受け単語の数を減らすことができ、音声認識処理時間の短縮、および誤認識率の低下を実現することができる。
なお、上述した実施の形態の音声認識装置は、以下のように変形することもできる。
(1)上述した第1および第2の実施の形態では、音声認識用情報データベース103aに格納する待ち受け単語を、「カテゴリ名称」2a、「サブカテゴリ名称」2b、および「詳細名称」2cの3階層とする例について説明したが、これに限定されず、「カテゴリ名称」2aに相当する最上位のカテゴリと、「詳細名称」2cに相当する最下位のカテゴリとを備え、さらに「サブカテゴリ名称」2bに相当する中間階層のカテゴリを複数備える4階層以上としてもよい。
101 マイク
102 音声入力操作スイッチ
103 音声認識用辞書
103a 音声認識用情報データベース
104 スピーカー
105 モニタ
106 メモリ
107 制御装置
Claims (5)
- 発話者の発話音声を入力する音声入力手段と、
複数の階層からなる音声認識実行時の待ち受け単語を格納する格納手段と、
前記音声入力手段を介して入力された発話者の発話音声と、前記格納手段に格納された上位階層に属する待ち受け単語とを照合処理して音声認識し、音声認識結果から派生する最下位階層の待ち受け単語を抽出する第1の抽出手段と、
前記第1の抽出手段による抽出結果に基づいて、前記最下位階層に属する待ち受け単語の絞り込みが必要であるか否かを判定する判定手段と、
前記判定手段によって前記最下位階層に属する待ち受け単語の絞り込みが必要であると判定した場合には、絞り込みに必要な情報の音声入力を発話者に促して、その結果入力された発話内容と、前記上位階層と前記最下位階層の間に存在する中間階層に属する待ち受け単語とを照合処理して音声認識し、音声認識結果から派生する最下位階層の待ち受け単語を抽出する第2の抽出手段と、
前記第1の抽出手段で抽出した前記上位階層に属する待ち受け単語から派生する最下位の階層に属する待ち受け単語、および前記第2の抽出手段で抽出した前記中間階層から派生する最下位の階層に属する待ち受け単語のいずれか一方の待ち受け単語と、発話者の発話内容とを照合処理して音声認識する発話音声認識手段とを備えることを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
前記音声入力手段を介して入力された最初の発話者の発話内容を記憶して保持する発話内容保持手段をさらに備え、
前記発話音声認識手段は、前記第1の抽出手段で抽出した前記上位階層に属する待ち受け単語から派生する最下位の階層に属する待ち受け単語、または前記第2の抽出手段で抽出した前記中間階層から派生する最下位の階層に属する待ち受け単語と、前記発話内容保持手段に保持した前記最初の発話者の発話内容とを照合処理して音声認識することを特徴とする音声認識装置。 - 請求項1または2に記載の音声認識装置において、
前記判定手段は、前記第1の抽出手段で抽出した前記上位階層に属する待ち受け単語から派生する最下位の階層に属する待ち受け単語の数に基づいて、前記最下位階層に属する待ち受け単語の絞り込みが必要であるか否かを判定することを特徴とする音声認識装置。 - 複数の階層からなる音声認識実行時の待ち受け単語を格納し、
入力された発話者の発話音声と、格納された上位階層に属する待ち受け単語とを照合処理して音声認識し、音声認識結果から派生する最下位階層の待ち受け単語を抽出し、
抽出結果に基づいて、前記最下位階層に属する待ち受け単語の絞り込みが必要であるか否かを判定し、
前記最下位階層に属する待ち受け単語の絞り込みが必要であると判定した場合には、絞り込みに必要な情報の音声入力を発話者に促して、その結果入力された発話内容と、前記上位階層と前記最下位階層の間に存在する中間階層に属する待ち受け単語とを照合処理して音声認識し、音声認識結果から派生する最下位階層の待ち受け単語を抽出し、
抽出した前記上位階層に属する待ち受け単語から派生する最下位の階層に属する待ち受け単語、および前記中間階層から派生する最下位の階層に属する待ち受け単語のいずれか一方の待ち受け単語と、発話者の発話内容とを照合処理して音声認識することを特徴とする音声認識方法。 - 請求項1〜3に記載の音声認識装置と、前記音声認識装置によって操作される情報機器とを備える音声認識システムであって、
前記音声認識装置は、発話者の発話内容の音声認識結果を前記情報機器へ出力し、
前記情報機器は、前記音声認識装置から出力された音声認識結果に基づいて、処理を実行することを特徴とする音声認識システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004379195A JP4661216B2 (ja) | 2004-12-28 | 2004-12-28 | 音声認識装置、方法、およびシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004379195A JP4661216B2 (ja) | 2004-12-28 | 2004-12-28 | 音声認識装置、方法、およびシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006184670A true JP2006184670A (ja) | 2006-07-13 |
JP4661216B2 JP4661216B2 (ja) | 2011-03-30 |
Family
ID=36737820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004379195A Expired - Fee Related JP4661216B2 (ja) | 2004-12-28 | 2004-12-28 | 音声認識装置、方法、およびシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4661216B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008134503A (ja) * | 2006-11-29 | 2008-06-12 | Nissan Motor Co Ltd | 音声認識装置、および音声認識方法 |
JP2008134502A (ja) * | 2006-11-29 | 2008-06-12 | Nissan Motor Co Ltd | 音声認識装置、および音声認識方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000315096A (ja) * | 1999-05-03 | 2000-11-14 | Pioneer Electronic Corp | 音声認識装置を備えたマンマシンシステム |
JP2001109492A (ja) * | 1999-10-07 | 2001-04-20 | Alpine Electronics Inc | 音声認識方法 |
-
2004
- 2004-12-28 JP JP2004379195A patent/JP4661216B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000315096A (ja) * | 1999-05-03 | 2000-11-14 | Pioneer Electronic Corp | 音声認識装置を備えたマンマシンシステム |
JP2001109492A (ja) * | 1999-10-07 | 2001-04-20 | Alpine Electronics Inc | 音声認識方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008134503A (ja) * | 2006-11-29 | 2008-06-12 | Nissan Motor Co Ltd | 音声認識装置、および音声認識方法 |
JP2008134502A (ja) * | 2006-11-29 | 2008-06-12 | Nissan Motor Co Ltd | 音声認識装置、および音声認識方法 |
US8108215B2 (en) | 2006-11-29 | 2012-01-31 | Nissan Motor Co., Ltd. | Speech recognition apparatus and method |
Also Published As
Publication number | Publication date |
---|---|
JP4661216B2 (ja) | 2011-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7974843B2 (en) | Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer | |
JP5334178B2 (ja) | 音声認識装置およびデータ更新方法 | |
EP1936606B1 (en) | Multi-stage speech recognition | |
US7996218B2 (en) | User adaptive speech recognition method and apparatus | |
US5712957A (en) | Locating and correcting erroneously recognized portions of utterances by rescoring based on two n-best lists | |
US7949524B2 (en) | Speech recognition correction with standby-word dictionary | |
US8380505B2 (en) | System for recognizing speech for searching a database | |
JP2008009153A (ja) | 音声対話システム | |
JP4283984B2 (ja) | 音声認識装置ならびに方法 | |
JP2000122691A (ja) | 綴り字読み式音声発話の自動認識方法 | |
EP2221806B1 (en) | Speech recognition of a list entry | |
CN111916088B (zh) | 一种语音语料的生成方法、设备及计算机可读存储介质 | |
KR20080088490A (ko) | 다언어 이국 음성 인식 | |
US20170270923A1 (en) | Voice processing device and voice processing method | |
JPH04182000A (ja) | 連続音声認識装置 | |
JP4639990B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
JP4661216B2 (ja) | 音声認識装置、方法、およびシステム | |
KR101063159B1 (ko) | 명령횟수를 줄일 수 있는 음성 인식을 이용한 주소 검색 방법 | |
JP2871557B2 (ja) | 音声認識装置 | |
JP4736962B2 (ja) | キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置 | |
JP5201973B2 (ja) | 音声検索装置 | |
JP2006184669A (ja) | 音声認識装置、方法、およびシステム | |
JP4930014B2 (ja) | 音声認識装置、および音声認識方法 | |
JP4635743B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
JPWO2009147745A1 (ja) | 検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100702 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100727 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100922 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101207 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101220 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140114 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |