JP2005084653A - 背景雑音歪みの補正処理方法及びそれを用いた音声認識システム - Google Patents
背景雑音歪みの補正処理方法及びそれを用いた音声認識システム Download PDFInfo
- Publication number
- JP2005084653A JP2005084653A JP2003320183A JP2003320183A JP2005084653A JP 2005084653 A JP2005084653 A JP 2005084653A JP 2003320183 A JP2003320183 A JP 2003320183A JP 2003320183 A JP2003320183 A JP 2003320183A JP 2005084653 A JP2005084653 A JP 2005084653A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- hmm
- noise
- speech recognition
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012937 correction Methods 0.000 title claims abstract description 28
- 238000003672 processing method Methods 0.000 title claims abstract description 6
- 238000009826 distribution Methods 0.000 claims abstract description 26
- 238000004364 calculation method Methods 0.000 claims abstract description 17
- 230000001186 cumulative effect Effects 0.000 claims abstract description 14
- 230000001629 suppression Effects 0.000 claims abstract description 7
- 230000005236 sound signal Effects 0.000 claims description 2
- 230000010365 information processing Effects 0.000 abstract description 10
- 238000001514 detection method Methods 0.000 abstract description 5
- 238000000034 method Methods 0.000 description 19
- 238000002474 experimental method Methods 0.000 description 12
- 239000013598 vector Substances 0.000 description 11
- 230000006978 adaptation Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 6
- 102000004000 Aurora Kinase A Human genes 0.000 description 4
- 108090000461 Aurora Kinase A Proteins 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 241000167854 Bourreria succulenta Species 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 240000002871 Tectona grandis Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 235000019693 cherries Nutrition 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Abstract
【解決手段】 マイクロホン(A/D変換器を内蔵)1から入力された雑音信号を含む音声信号は、音声情報処理部2に取り込まれる。この音声情報処理部2は、入力信号のパワーに基づく区間(フレーム)検出部3、入力特徴量時系列の算出部4、ビタビアルゴリズムにより算出したHMMの累積出力確率の算出部5、入力特徴量時系列とHMMの累積出力確率をフレーム数で除算し、真数値に換算した値により重み付けするHMMの分布の事後確率算出部6、雑音信号を含む音声特徴量の歪み抑圧部7、音声認識部8を備えている。
【選択図】図1
Description
〔1〕背景雑音歪みの補正処理方法において、隠れマルコフモデル(HMM)を音響モデルとする音声認識システムを用いて、ビタビ(Viterbi)アルゴリズムにより算出される入力特徴量時系列と隠れマルコフモデル(HMM)の累積出力確率を、フレーム数で除算し、真数値に換算した値により重み付けした隠れマルコフモデル(HMM)の分布の事後確率を用いて、背景雑音による音声特徴量の歪みを抑圧することを特徴とする。
2 音声情報処理部
3 入力信号のパワーに基づく区間(フレーム)検出部
4 入力特徴量時系列の算出部
5 ビタビアルゴリズムにより算出したHMMの累積出力確率の算出部
6 HMMの分布の事後確率算出部
7 雑音信号を含む音声特徴量の歪み抑圧部
8 音声認識部
Claims (2)
- 隠れマルコフモデル(HMM)を音響モデルとする音声認識システムを用いて、ビタビ(Viterbi)アルゴリズムにより算出される入力特徴量時系列と隠れマルコフモデル(HMM)の累積出力確率を、フレーム数で除算し、真数値に換算した値により重み付けした隠れマルコフモデル(HMM)の分布の事後確率を用いて、背景雑音による音声特徴量の歪みを抑圧することを特徴とする背景雑音歪みの補正処理方法。
- 隠れマルコフモデル(HMM)を音響モデルとする音声認識システムにおいて、
(a)雑音信号を含む音声信号を入力する入力部と、
(b)入力信号のパワーに基づく区間(フレーム)検出部と、
(c)入力特徴量時系列の算出部と、
(d)ビタビアルゴリズムにより算出した前記入力特徴量時系列とHMMの累積出力確率をフレーム数で除算し、真数値に換算した値により重み付けされるHMMの分布の事後確率の算出部と、
(e)雑音信号を含む音声特徴量の歪み抑圧部と、
(f)該抑圧部に接続される音声認識部とを具備することを特徴とする音声認識システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003320183A JP4058521B2 (ja) | 2003-09-11 | 2003-09-11 | 背景雑音歪みの補正処理方法及びそれを用いた音声認識システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003320183A JP4058521B2 (ja) | 2003-09-11 | 2003-09-11 | 背景雑音歪みの補正処理方法及びそれを用いた音声認識システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005084653A true JP2005084653A (ja) | 2005-03-31 |
JP4058521B2 JP4058521B2 (ja) | 2008-03-12 |
Family
ID=34418901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003320183A Expired - Lifetime JP4058521B2 (ja) | 2003-09-11 | 2003-09-11 | 背景雑音歪みの補正処理方法及びそれを用いた音声認識システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4058521B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006201287A (ja) * | 2005-01-18 | 2006-08-03 | Advanced Telecommunication Research Institute International | 雑音抑圧装置及び音声認識システム |
JP2007033920A (ja) * | 2005-07-27 | 2007-02-08 | Nec Corp | 雑音抑圧システムと方法及びプログラム |
JP2008064892A (ja) * | 2006-09-05 | 2008-03-21 | National Institute Of Advanced Industrial & Technology | 音声認識方法およびそれを用いた音声認識装置 |
CN102298652A (zh) * | 2010-06-23 | 2011-12-28 | 成都理工大学 | 放射性测量中能谱漂移的模拟方法 |
CN112420020A (zh) * | 2019-08-23 | 2021-02-26 | 株式会社东芝 | 信息处理装置及信息处理方法 |
-
2003
- 2003-09-11 JP JP2003320183A patent/JP4058521B2/ja not_active Expired - Lifetime
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006201287A (ja) * | 2005-01-18 | 2006-08-03 | Advanced Telecommunication Research Institute International | 雑音抑圧装置及び音声認識システム |
JP4512848B2 (ja) * | 2005-01-18 | 2010-07-28 | 株式会社国際電気通信基礎技術研究所 | 雑音抑圧装置及び音声認識システム |
JP2007033920A (ja) * | 2005-07-27 | 2007-02-08 | Nec Corp | 雑音抑圧システムと方法及びプログラム |
US9613631B2 (en) | 2005-07-27 | 2017-04-04 | Nec Corporation | Noise suppression system, method and program |
JP2008064892A (ja) * | 2006-09-05 | 2008-03-21 | National Institute Of Advanced Industrial & Technology | 音声認識方法およびそれを用いた音声認識装置 |
CN102298652A (zh) * | 2010-06-23 | 2011-12-28 | 成都理工大学 | 放射性测量中能谱漂移的模拟方法 |
CN112420020A (zh) * | 2019-08-23 | 2021-02-26 | 株式会社东芝 | 信息处理装置及信息处理方法 |
CN112420020B (zh) * | 2019-08-23 | 2024-05-03 | 株式会社东芝 | 信息处理装置及信息处理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4058521B2 (ja) | 2008-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ephraim et al. | On second-order statistics and linear estimation of cepstral coefficients | |
Wang et al. | Speaker and noise factorization for robust speech recognition | |
JP2007033920A (ja) | 雑音抑圧システムと方法及びプログラム | |
US20060165202A1 (en) | Signal processor for robust pattern recognition | |
JP5242782B2 (ja) | 音声認識方法 | |
JP3451146B2 (ja) | スペクトルサブトラクションを用いた雑音除去システムおよび方法 | |
JP4705414B2 (ja) | 音声認識装置、音声認識方法、音声認識プログラムおよび記録媒体 | |
Nakamura et al. | A mel-cepstral analysis technique restoring high frequency components from low-sampling-rate speech. | |
JP4058521B2 (ja) | 背景雑音歪みの補正処理方法及びそれを用いた音声認識システム | |
Abe et al. | Robust speech recognition using DNN-HMM acoustic model combining noise-aware training with spectral subtraction. | |
JPH10149191A (ja) | モデル適応方法、装置およびその記憶媒体 | |
US9311916B2 (en) | Apparatus and method for improving voice recognition | |
Vuppala et al. | Recognition of consonant-vowel (CV) units under background noise using combined temporal and spectral preprocessing | |
Yapanel et al. | Robust digit recognition in noise: an evaluation using the AURORA corpus. | |
Kato et al. | Using hidden Markov models for speech enhancement | |
Hizlisoy et al. | Noise robust speech recognition using parallel model compensation and voice activity detection methods | |
Kato et al. | HMM-based speech enhancement using sub-word models and noise adaptation | |
Kim et al. | Feature compensation employing online GMM adaptation for speech recognition in unknown severely adverse environments | |
Chen et al. | Improving speaker verification in reverberant environments | |
Yan et al. | Word graph based feature enhancement for noisy speech recognition | |
Alam et al. | Noise spectrum estimation using Gaussian mixture model-based speech presence probability for robust speech recognition | |
Delcroix et al. | Combined static and dynamic variance adaptation for efficient interconnection of speech enhancement pre-processor with speech recognizer | |
Betkowska et al. | Speech recognition using FHMMs robust against nonstationary noise | |
Giuliani et al. | On-line speaker adaptation on telephony speech data with adaptively trained acoustic models | |
Breithaupt et al. | Statistical analysis and performance of DFT domain noise reduction filters for robust speech recognition. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050315 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071120 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4058521 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |