JP2005292346A - 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム - Google Patents
音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム Download PDFInfo
- Publication number
- JP2005292346A JP2005292346A JP2004105432A JP2004105432A JP2005292346A JP 2005292346 A JP2005292346 A JP 2005292346A JP 2004105432 A JP2004105432 A JP 2004105432A JP 2004105432 A JP2004105432 A JP 2004105432A JP 2005292346 A JP2005292346 A JP 2005292346A
- Authority
- JP
- Japan
- Prior art keywords
- vocabulary
- speech recognition
- rejection
- dictionary
- similar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000006243 chemical reaction Methods 0.000 claims abstract description 77
- 238000001514 detection method Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 7
- 230000007257 malfunction Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 230000002411 adverse Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Abstract
【解決手段】 音声認識語彙格納部101より出力された音声認識語彙は音素変換部102であらかじめ定められた音素変換手順により音素変換される。変換された変換語彙は、変換元の音声認識語彙と比較され、変換箇所が1箇所以上存在するなどのある一定以上の条件を満たす場合に棄却単語出力部103へ出力される。
【選択図】 図1
Description
図2の音素変換部102の動作例について音素変換手順の例を挙げ説明する。ここでは音声認識語彙の子音をhに変換する音素変換手順を音声認識語彙「こんにちわ」に適用する例に基づいて音素変換部の動作について説明する。
・子音の類似度に応じ、子音音素ごとに変換音素を規定した音素変換手順を作成する方法。例えば、「音声認識語彙中の子音sを子音tに置き換える」など。
・母音を変換対象とする方法
などさまざまな変換方法が考えられる。
102 音素変換部
103 棄却単語出力部
104 類似単語出力部
105 ペナルティ付与部
106 音声認識辞書格納部
107 辞書解析部
Claims (18)
- 音声を認識することで得られる音声認識語彙を格納する音声認識語彙格納部と、
前記音声認識語彙に対し音素変換を行い変換語彙として出力する音素変換部と、
前記変換語彙を棄却単語として出力する棄却単語出力部と、
を備えることを特徴とする音声認識用棄却辞書生成システム。 - 前記変換語彙を前記音声認識語彙と類似するか否かを判定し、当該判定の結果類似でないと判定された場合、前記変換語彙を前記棄却単語出力部へ出力する類似単語検出部をさらに備え、ここで、
前記棄却単語出力部が前記類似単語検出部から受け渡された変換語彙を棄却単語として出力することを特徴とする請求項1記載の音声認識用棄却辞書生成システム。 - 前記類似単語検出部による判定の結果、類似と判定された前記変換語彙と、類似でないと判定された前記変換語彙とを分離して出力し、
前記類似単語検出部によって類似と判定された前記変換語彙に対し音声認識時にペナルティをかける情報を付与し出力するペナルティ付与部をさらに備えることを特徴とする請求項2記載の音声認識用棄却辞書生成システム。 - 前記音声認識語彙が記述された辞書を格納する音声認識辞書格納部と、
当該辞書から音声認識語彙を抽出し前記音声認識語彙格納部に受け渡す辞書解析部と、
をさらに備えることを特徴とする請求項1から3のいずれか1項記載の音声認識用棄却辞書生成システム。 - 前記辞書解析部が、音声認識語彙抽出時にある意味づけがされたキーワードのみを取得し前記音声認識語彙格納部へ出力することを特徴とする請求項4記載の音声認識用棄却辞書生成システム。
- 前記辞書解析部が、音声認識語彙取得時に音声認識辞書の文法記述構造を解析し、棄却辞書生成箇所を特定した上で該当箇所の音声認識語彙を取得することを特徴とする請求項4又は5記載の音声認識用棄却辞書生成システム。
- 前記棄却単語出力部が、棄却単語を前記棄却辞書生成箇所により特定された箇所に前記棄却語彙を挿入した音声認識辞書を出力することを特徴とする請求項6記載の音声認識用棄却辞書生成システム。
- 請求項1から6のいずれか1項記載の音声認識用棄却辞書生成システムにより生成された前記棄却単語を組み込んだ音声認識辞書を利用し動作することを特徴とする音声認識システム。
- 請求項7記載の音声認識用棄却辞書生成システムにより生成された前記音声認識辞書を利用し動作することを特徴とする音声認識システム。
- 請求項1から6のいずれか1項記載の音声認識用棄却辞書生成システムにより生成された前記棄却単語を組み込んだ音声認識辞書を利用し動作することを特徴とする音声対話ロボット。
- 請求項7記載の音声認識用棄却辞書生成システムにより生成された前記音声認識辞書を利用し動作することを特徴とする音声対話ロボット。
- 請求項1から6のいずれか1項記載の音声認識用棄却辞書生成システムにより生成された棄却単語を適用することを特徴とする音声対話ロボット。
- 音声を認識することで得られる音声認識語彙を、当該音声認識語彙を格納するための音声認識語彙格納部に記憶させておき、前記音声認識語彙に対し音素変換を行い、得られた結果を棄却単語として出力することを特徴とする音声認識用棄却語彙生成方法。
- 前記変換語彙を前記音声認識語彙と類似するか否かを判定し、当該判定の結果類似でないと判定された場合、前記変換語彙を前記棄却単語出力部へ出力する類似語彙判定部で、前記変換語彙と前記音声認識語彙の類似判定し、類似でないと判定された前記変換語彙を棄却単語として出力することを特徴とする請求項13記載の音声認識用棄却語彙生成方法。
- 前記類似語彙判定部による類似判定の結果、類似と判定された前記変換語彙と、類似でないと判定された前記変換語彙とを分離して出力し、類似と判定された前記変換語彙にはペナルティ付与部において音声認識時にペナルティを付与する情報を付与することを特徴とする請求項14記載の音声認識用棄却語彙生成方法。
- 音声を認識することで得られる音声認識語彙を、当該音声認識語彙を格納するための音声認識語彙格納部に記憶させておき、前記音声認識語彙に対し音素変換を行い、得られた結果を棄却単語として出力することを特徴とする音声認識用棄却語彙生成プログラム。
- 前記変換語彙を前記音声認識語彙と類似するか否かを判定し、当該判定の結果類似でないと判定された場合、前記変換語彙を前記棄却単語出力部へ出力する類似語彙判定部で、前記変換語彙と前記音声認識語彙の類似判定し、類似でないと判定された前記変換語彙を棄却単語として出力することを特徴とする請求項16記載の音声認識用棄却語彙生成プログラム。
- 前記類似語彙判定部による類似判定の結果、類似と判定された前記変換語彙と、類似でないと判定された前記変換語彙とを分離して出力し、類似と判定された前記変換語彙にはペナルティ付与部において音声認識時にペナルティを付与する情報を付与することを特徴とする請求項17記載の音声認識用棄却語彙生成プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004105432A JP2005292346A (ja) | 2004-03-31 | 2004-03-31 | 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004105432A JP2005292346A (ja) | 2004-03-31 | 2004-03-31 | 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2005292346A true JP2005292346A (ja) | 2005-10-20 |
Family
ID=35325358
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004105432A Pending JP2005292346A (ja) | 2004-03-31 | 2004-03-31 | 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2005292346A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007226091A (ja) * | 2006-02-27 | 2007-09-06 | Nippon Hoso Kyokai <Nhk> | 音声認識装置及び音声認識プログラム |
| JP2010230852A (ja) * | 2009-03-26 | 2010-10-14 | Yamaha Corp | コマンド認識装置 |
| JP2016206580A (ja) * | 2015-04-28 | 2016-12-08 | 四郎丸 功 | 音声認識装置及び音声認識システム |
| CN111583907A (zh) * | 2020-04-15 | 2020-08-25 | 北京小米松果电子有限公司 | 信息处理方法、装置及存储介质 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS62113197A (ja) * | 1985-11-13 | 1987-05-25 | ソニー株式会社 | 音声認識装置 |
| JPH09244691A (ja) * | 1996-03-07 | 1997-09-19 | Nippon Telegr & Teleph Corp <Ntt> | 入力音声リジェクト方法およびこの方法を実施する装置 |
| JP2002372988A (ja) * | 2001-06-14 | 2002-12-26 | Nec Corp | 認識辞書作成装置及び棄却辞書及び棄却辞書の生成方法 |
| JP2003330491A (ja) * | 2002-05-10 | 2003-11-19 | Nec Corp | 音声認識装置および音声認識方法ならびにプログラム |
-
2004
- 2004-03-31 JP JP2004105432A patent/JP2005292346A/ja active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS62113197A (ja) * | 1985-11-13 | 1987-05-25 | ソニー株式会社 | 音声認識装置 |
| JPH09244691A (ja) * | 1996-03-07 | 1997-09-19 | Nippon Telegr & Teleph Corp <Ntt> | 入力音声リジェクト方法およびこの方法を実施する装置 |
| JP2002372988A (ja) * | 2001-06-14 | 2002-12-26 | Nec Corp | 認識辞書作成装置及び棄却辞書及び棄却辞書の生成方法 |
| JP2003330491A (ja) * | 2002-05-10 | 2003-11-19 | Nec Corp | 音声認識装置および音声認識方法ならびにプログラム |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007226091A (ja) * | 2006-02-27 | 2007-09-06 | Nippon Hoso Kyokai <Nhk> | 音声認識装置及び音声認識プログラム |
| JP2010230852A (ja) * | 2009-03-26 | 2010-10-14 | Yamaha Corp | コマンド認識装置 |
| JP2016206580A (ja) * | 2015-04-28 | 2016-12-08 | 四郎丸 功 | 音声認識装置及び音声認識システム |
| CN111583907A (zh) * | 2020-04-15 | 2020-08-25 | 北京小米松果电子有限公司 | 信息处理方法、装置及存储介质 |
| CN111583907B (zh) * | 2020-04-15 | 2023-08-15 | 北京小米松果电子有限公司 | 信息处理方法、装置及存储介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20180137109A1 (en) | Methodology for automatic multilingual speech recognition | |
| US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
| Ali et al. | A complete KALDI recipe for building Arabic speech recognition systems | |
| US11037553B2 (en) | Learning-type interactive device | |
| JP6066354B2 (ja) | 信頼度計算の方法及び装置 | |
| JP6251958B2 (ja) | 発話解析装置、音声対話制御装置、方法、及びプログラム | |
| JP5480760B2 (ja) | 端末装置、音声認識方法および音声認識プログラム | |
| KR101590724B1 (ko) | 음성 인식 오류 수정 방법 및 이를 수행하는 장치 | |
| US10319373B2 (en) | Information processing device, information processing method, computer program product, and recognition system | |
| US10535339B2 (en) | Recognition result output device, recognition result output method, and computer program product | |
| JP5703491B2 (ja) | 言語モデル・音声認識辞書作成装置及びそれらにより作成された言語モデル・音声認識辞書を用いた情報処理装置 | |
| EP2645364A1 (en) | Spoken dialog system using prominence | |
| US20180137863A1 (en) | Speech recognition apparatus, speech recognition method, and computer program product | |
| JP2010078877A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
| KR100930714B1 (ko) | 음성인식 장치 및 방법 | |
| JP5611270B2 (ja) | 単語分割装置、及び単語分割方法 | |
| KR100480790B1 (ko) | 양방향 n-그램 언어모델을 이용한 연속 음성인식방법 및장치 | |
| US20110224985A1 (en) | Model adaptation device, method thereof, and program thereof | |
| JP5243325B2 (ja) | 音声認識に仮名漢字変換システムを用いた端末、方法及びプログラム | |
| JP2000172294A (ja) | 音声認識方法、その装置及びプログラム記録媒体 | |
| US6963832B2 (en) | Meaning token dictionary for automatic speech recognition | |
| JP4269625B2 (ja) | 音声認識辞書作成方法及びその装置と音声認識装置 | |
| JP2005292346A (ja) | 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム | |
| JP4987530B2 (ja) | 音声認識辞書作成装置および音声認識装置 | |
| JP2965529B2 (ja) | 音声認識装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070213 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080508 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100201 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100208 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100701 |