JP5230103B2 - 自動音声認識器のためのトレーニングデータを生成する方法およびシステム - Google Patents
自動音声認識器のためのトレーニングデータを生成する方法およびシステム Download PDFInfo
- Publication number
- JP5230103B2 JP5230103B2 JP2006553731A JP2006553731A JP5230103B2 JP 5230103 B2 JP5230103 B2 JP 5230103B2 JP 2006553731 A JP2006553731 A JP 2006553731A JP 2006553731 A JP2006553731 A JP 2006553731A JP 5230103 B2 JP5230103 B2 JP 5230103B2
- Authority
- JP
- Japan
- Prior art keywords
- spectral characteristics
- audio data
- sampling frequency
- spectral
- codebook
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012549 training Methods 0.000 title claims description 53
- 238000000034 method Methods 0.000 title claims description 33
- 230000003595 spectral effect Effects 0.000 claims description 120
- 238000005070 sampling Methods 0.000 claims description 70
- 238000001228 spectrum Methods 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 23
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 230000003190 augmentative effect Effects 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 2
- 238000009795 derivation Methods 0.000 claims 2
- 239000000284 extract Substances 0.000 claims 1
- 239000013598 vector Substances 0.000 description 15
- 230000000694 effects Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 4
- 239000000654 additive Substances 0.000 description 3
- 230000000996 additive effect Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000002411 adverse Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 210000003477 cochlea Anatomy 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Electrically Operated Instructional Devices (AREA)
- Synchronisation In Digital Transmission Systems (AREA)
- Telephonic Communication Services (AREA)
Description
1.ガウス混合モデル。これは各モードについてガウス分布を使用する。
2.単位行列を共分散行列としてガウス型を使用。これらは手段によってのみ表現される。確率密度計算は入力ベクトルと平均との間の「距離」を計算することになる。
3.各入力ベクトルについて計算された確率を、最高確率のモード(「最も近いモード」)について1.0、その他すべてについて0.0と設定することによって近似する。
Claims (14)
- ある特定の第一のサンプリング周波数で動作するための自動音声認識器のためのトレーニングデータを生成する方法であって:
・前記第一のサンプリング周波数よりも低いある第二の周波数でサンプリングされたオーディオデータからスペクトル特性を導出し、
・前記スペクトル特性の帯域幅を、前記第二の周波数のデータに対応する帯域幅拡張情報を与える単一のコードブックから帯域幅拡張情報を取得することで拡張し、
・帯域幅拡張されたスペクトル特性を処理して必要とされるトレーニングデータを与える、
ステップを有し、
前記コードブックの各項目は:
・前記第一のサンプリング周波数でサンプリングされたオーディオデータからスペクトル特性の第一の組を導出し、
・前記オーディオデータに対して第二のサンプリング周波数へのサンプリングレート変換を実行し、対応するスペクトル特性の第二の組を導出し、
・前記スペクトル特性の第二の組からの情報を、前記スペクトル特性の第一の組から抽出された追加的な帯域幅拡張情報とともに含むコードブック項目を生成することによって生成される、
ことを特徴とする方法。 - オーディオデータのスペクトル特性の組への変換が、オーディオデータのFFTを計算してフーリエ係数の組を与え、FFTの出力をフィルタバンクでフィルタ処理してフィルタバンクパワー値の組を与えることを含むことを特徴とする、請求項1記載の方法。
- 請求項2記載の方法であって、オーディオデータのスペクトル特性の組への変換が、FFT係数またはフィルタバンクパワー値を処理して対数スペクトル係数を与えることを含むことを特徴とする方法。
- 請求項1ないし3のうちいずれか一項記載の方法であって、帯域幅拡張されたスペクトル特性の処理が、オーディオデータの信号属性を調整するために該スペクトルを変更するステップを有することを特徴とする方法。
- 請求項4記載の方法であって、オーディオデータの信号属性を調整するために前記スペクトルを変更するステップが線形領域において実行されることを特徴とする方法。
- 請求項1ないし5のうちいずれか一項記載の方法であって、オーディオデータからのスペクトル特性の導出に続いて、該スペクトル特性から平均スペクトルを差し引くステップがあることを特徴とする方法。
- 自動音声認識システムをトレーニングする方法であって、トレーニングに使用されるデータが少なくとも部分的に請求項1ないし6のうちいずれか一項記載の方法を使って生成されることを特徴とする方法。
- ある第二のサンプリング周波数でサンプリングされたオーディオデータのスペクトル特性の帯域幅を該第二のサンプリング周波数よりも高いある第一のサンプリング周波数のスペクトル特性に拡張するための単一のコードブックを生成する方法であって、コードブックの各項目について:
・前記第一のサンプリング周波数でサンプリングされたオーディオデータからスペクトル特性の第一の組を導出し、
・前記オーディオデータに対して第二のサンプリング周波数へのサンプリングレート変換を実行し、対応するスペクトル特性の第二の組を導出し、
・前記スペクトル特性の第二の組からの情報を前記スペクトル特性の第一の組から抽出された追加的な帯域幅拡張情報とともに含むコードブック項目を生成する、
ステップを含むことを特徴とする方法。 - 請求項8記載の方法であって、コードブック項目を増強することが、前記第二のサンプリング周波数より高い周波数に関係する、対応するスペクトル特性の第一の組から情報を抽出し、この情報をコードブック中の前記コードブック項目に付属させることを含むことを特徴とする方法。
- 請求項8または9記載の方法であって、スペクトル特性の第二の組の導出に続いて、背景ノイズ削減および/またはチャネル正規化ステップがあることを特徴とする方法。
- 請求項10記載の方法であって、前記スペクトル特性が対数スペクトル表現を有しており、前記チャネル正規化が前記対数スペクトル特性から平均対数スペクトルを差し引くことによって実行されることを特徴とする方法。
- 請求項10記載の方法であって、前記スペクトル特性が線形スペクトル表現を有しており、前記背景ノイズ削減が前記線形スペクトル特性から背景ノイズスペクトルを差し引くことによって実行されることを特徴とする方法。
- ある特定の第一のサンプリング周波数で動作する自動音声認識器のためのトレーニングデータを生成するシステムであって:
・前記第一のサンプリング周波数よりも低いある第二の周波数でサンプリングされたオーディオデータからスペクトル特性を導出するコンバータと、
・前記スペクトル特性のための帯域幅拡張情報を、前記第二の周波数のデータに対応する帯域幅拡張情報を与える単一のコードブックから取得する取得ユニットと、
・帯域幅拡張されたスペクトル特性を処理して必要とされるトレーニングデータを与える処理モジュール、
とを有し、
前記コードブックの各項目は:
・前記第一のサンプリング周波数でサンプリングされたオーディオデータからスペクトル特性の第一の組を導出し、
・前記オーディオデータに対して第二のサンプリング周波数へのサンプリングレート変換を実行し、対応するスペクトル特性の第二の組を導出し、
・前記スペクトル特性の第二の組からの情報を、前記スペクトル特性の第一の組から抽出された追加的な帯域幅拡張情報とともに含むコードブック項目を生成することによって生成される、
ことを特徴とするシステム。 - ある第二のサンプリング周波数でサンプリングされたオーディオデータのスペクトル特性の組の帯域幅を該第二のサンプリング周波数よりも高いある第一のサンプリング周波数のスペクトル特性の組に拡張するための単一のコードブックを生成するシステムであって:
・第一のサンプリング周波数でサンプリングされたオーディオデータからスペクトル特性の第一の組を導出するコンバータと、
・前記オーディオデータに対して第二のサンプリング周波数へのサンプリングレート変換を実行し、前記第二のサンプリング周波数について対応するスペクトル特性の第二の組を導出するモジュールと、
・スペクトル特性の第二の組からの情報を前記スペクトル特性の第一の組から抽出された追加的な帯域幅拡張情報とともに含むコードブック項目を生成するコードブック項目生成器、
とを有することを特徴とするシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP04100646.1 | 2004-02-18 | ||
EP04100646 | 2004-02-18 | ||
PCT/IB2005/050518 WO2005083677A2 (en) | 2004-02-18 | 2005-02-10 | Method and system for generating training data for an automatic speech recogniser |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007523374A JP2007523374A (ja) | 2007-08-16 |
JP5230103B2 true JP5230103B2 (ja) | 2013-07-10 |
Family
ID=34896083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006553731A Expired - Fee Related JP5230103B2 (ja) | 2004-02-18 | 2005-02-10 | 自動音声認識器のためのトレーニングデータを生成する方法およびシステム |
Country Status (5)
Country | Link |
---|---|
US (1) | US8438026B2 (ja) |
EP (1) | EP1719114A2 (ja) |
JP (1) | JP5230103B2 (ja) |
CN (1) | CN101014997B (ja) |
WO (1) | WO2005083677A2 (ja) |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60214027T2 (de) * | 2001-11-14 | 2007-02-15 | Matsushita Electric Industrial Co., Ltd., Kadoma | Kodiervorrichtung und dekodiervorrichtung |
US7983916B2 (en) * | 2007-07-03 | 2011-07-19 | General Motors Llc | Sampling rate independent speech recognition |
JP5326892B2 (ja) * | 2008-12-26 | 2013-10-30 | 富士通株式会社 | 情報処理装置、プログラム、および音響モデルを生成する方法 |
JP5326714B2 (ja) * | 2009-03-23 | 2013-10-30 | 沖電気工業株式会社 | 帯域拡張装置、方法及びプログラム、並びに、量子化雑音学習装置、方法及びプログラム |
US8930185B2 (en) | 2009-08-28 | 2015-01-06 | International Business Machines Corporation | Speech feature extraction apparatus, speech feature extraction method, and speech feature extraction program |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US8781137B1 (en) | 2010-04-27 | 2014-07-15 | Audience, Inc. | Wind noise detection and suppression |
US9245538B1 (en) * | 2010-05-20 | 2016-01-26 | Audience, Inc. | Bandwidth enhancement of speech signals assisted by noise reduction |
US8447596B2 (en) | 2010-07-12 | 2013-05-21 | Audience, Inc. | Monaural noise suppression based on computational auditory scene analysis |
ES2540995T3 (es) * | 2010-08-24 | 2015-07-15 | Veovox Sa | Sistema y método para reconocer un comando de voz de usuario en un entorno con ruido |
US9076446B2 (en) * | 2012-03-22 | 2015-07-07 | Qiguang Lin | Method and apparatus for robust speaker and speech recognition |
US9319510B2 (en) * | 2013-02-15 | 2016-04-19 | Qualcomm Incorporated | Personalized bandwidth extension |
CA2995530C (en) | 2013-09-12 | 2018-07-24 | Saudi Arabian Oil Company | Dynamic threshold methods, systems, computer readable media, and program code for filtering noise and restoring attenuated high-frequency components of acoustic signals |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
US9842608B2 (en) * | 2014-10-03 | 2017-12-12 | Google Inc. | Automatic selective gain control of audio data for speech recognition |
CN104468001B (zh) * | 2014-11-26 | 2017-04-19 | 北京邮电大学 | 基于无线电信号频谱特征模板的信号识别方法及系统 |
EP3265919B1 (en) * | 2015-03-06 | 2021-09-29 | Georgia Tech Research Corporation | Device fingerprinting for cyber-physical systems |
CN105989849B (zh) * | 2015-06-03 | 2019-12-03 | 乐融致新电子科技(天津)有限公司 | 一种语音增强方法、语音识别方法、聚类方法及装置 |
CN105513590A (zh) * | 2015-11-23 | 2016-04-20 | 百度在线网络技术(北京)有限公司 | 语音识别的方法和装置 |
CN108510979B (zh) | 2017-02-27 | 2020-12-15 | 芋头科技(杭州)有限公司 | 一种混合频率声学识别模型的训练方法及语音识别方法 |
US10984795B2 (en) | 2018-04-12 | 2021-04-20 | Samsung Electronics Co., Ltd. | Electronic apparatus and operation method thereof |
CN109147806B (zh) * | 2018-06-05 | 2021-11-12 | 安克创新科技股份有限公司 | 基于深度学习的语音音质增强方法、装置和系统 |
US11392794B2 (en) | 2018-09-10 | 2022-07-19 | Ca, Inc. | Amplification of initial training data |
US11295726B2 (en) | 2019-04-08 | 2022-04-05 | International Business Machines Corporation | Synthetic narrowband data generation for narrowband automatic speech recognition systems |
US11335329B2 (en) * | 2019-08-28 | 2022-05-17 | Tata Consultancy Services Limited | Method and system for generating synthetic multi-conditioned data sets for robust automatic speech recognition |
CN110459205B (zh) * | 2019-09-24 | 2022-04-12 | 京东科技控股股份有限公司 | 语音识别方法及装置、计算机可存储介质 |
US11749281B2 (en) | 2019-12-04 | 2023-09-05 | Soundhound Ai Ip, Llc | Neural speech-to-meaning |
US11308938B2 (en) | 2019-12-05 | 2022-04-19 | Soundhound, Inc. | Synthesizing speech recognition training data |
CN111916103B (zh) * | 2020-08-11 | 2024-02-20 | 南京拓灵智能科技有限公司 | 一种音频降噪方法和装置 |
CN112116903B (zh) * | 2020-08-17 | 2024-09-13 | 北京大米科技有限公司 | 语音合成模型的生成方法、装置、存储介质及电子设备 |
CN112131865B (zh) * | 2020-09-11 | 2023-12-08 | 成都运达科技股份有限公司 | 一种轨道交通报文数字压缩处理方法、装置及存储介质 |
CN113708863B (zh) * | 2021-09-10 | 2023-08-01 | 中国人民解放军63891部队 | 频谱感知训练数据集的构建方法及装置 |
US20230186925A1 (en) * | 2021-12-10 | 2023-06-15 | Nuance Communications, Inc. | Feature domain bandwidth extension and spectral rebalance for asr data augmentation |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2524472B2 (ja) * | 1992-09-21 | 1996-08-14 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 電話回線利用の音声認識システムを訓練する方法 |
JP2779886B2 (ja) * | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
CN1061205C (zh) * | 1997-07-24 | 2001-01-24 | 北京信威通信技术有限公司 | 扩频通信系统中载波恢复和补偿的方法及其装置 |
US6381571B1 (en) * | 1998-05-01 | 2002-04-30 | Texas Instruments Incorporated | Sequential determination of utterance log-spectral mean by maximum a posteriori probability estimation |
US6199041B1 (en) * | 1998-11-20 | 2001-03-06 | International Business Machines Corporation | System and method for sampling rate transformation in speech recognition |
CZ299508B6 (cs) | 1999-02-19 | 2008-08-20 | Custom Speech Usa, Inc. | Systém automatické transkripce a zpusob užití dvou stupnu konverze reci a pocítacem podporovaná korekce |
JP4244514B2 (ja) * | 2000-10-23 | 2009-03-25 | セイコーエプソン株式会社 | 音声認識方法および音声認識装置 |
JP4577543B2 (ja) * | 2000-11-21 | 2010-11-10 | ソニー株式会社 | モデル適応装置およびモデル適応方法、記録媒体、並びに音声認識装置 |
JP2002189487A (ja) * | 2000-12-20 | 2002-07-05 | Mitsubishi Electric Corp | 音声認識装置および音声認識方法 |
JP2002268698A (ja) * | 2001-03-08 | 2002-09-20 | Nec Corp | 音声認識装置と標準パターン作成装置及び方法並びにプログラム |
US6990447B2 (en) * | 2001-11-15 | 2006-01-24 | Microsoft Corportion | Method and apparatus for denoising and deverberation using variational inference and strong speech models |
CA2454296A1 (en) * | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
US7454338B2 (en) * | 2005-02-08 | 2008-11-18 | Microsoft Corporation | Training wideband acoustic models in the cepstral domain using mixed-bandwidth training data and extended vectors for speech recognition |
-
2005
- 2005-02-10 EP EP05702937A patent/EP1719114A2/en not_active Withdrawn
- 2005-02-10 US US10/597,983 patent/US8438026B2/en active Active
- 2005-02-10 WO PCT/IB2005/050518 patent/WO2005083677A2/en active Application Filing
- 2005-02-10 CN CN200580005136.0A patent/CN101014997B/zh active Active
- 2005-02-10 JP JP2006553731A patent/JP5230103B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101014997B (zh) | 2012-04-04 |
WO2005083677A3 (en) | 2006-12-21 |
CN101014997A (zh) | 2007-08-08 |
WO2005083677A2 (en) | 2005-09-09 |
JP2007523374A (ja) | 2007-08-16 |
EP1719114A2 (en) | 2006-11-08 |
US8438026B2 (en) | 2013-05-07 |
US20080215322A1 (en) | 2008-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5230103B2 (ja) | 自動音声認識器のためのトレーニングデータを生成する方法およびシステム | |
Shrawankar et al. | Techniques for feature extraction in speech recognition system: A comparative study | |
CN106971741B (zh) | 实时将语音进行分离的语音降噪的方法及系统 | |
US6173258B1 (en) | Method for reducing noise distortions in a speech recognition system | |
Hirsch et al. | A new approach for the adaptation of HMMs to reverberation and background noise | |
Xiao et al. | Normalization of the speech modulation spectra for robust speech recognition | |
WO2011024572A1 (ja) | 音声特徴量抽出装置、音声特徴量抽出方法、及び音声特徴量抽出プログラム | |
JP2011530091A (ja) | 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 | |
CN108198545A (zh) | 一种基于小波变换的语音识别方法 | |
Siam et al. | A novel speech enhancement method using Fourier series decomposition and spectral subtraction for robust speaker identification | |
Alam et al. | Robust feature extraction based on an asymmetric level-dependent auditory filterbank and a subband spectrum enhancement technique | |
Alam et al. | Robust feature extraction for speech recognition by enhancing auditory spectrum | |
Marković et al. | Application of teager energy operator on linear and mel scales for whispered speech recognition | |
JPH10149191A (ja) | モデル適応方法、装置およびその記憶媒体 | |
CN107919115B (zh) | 一种基于非线性谱变换的特征补偿方法 | |
Makhijani et al. | Speech enhancement using pitch detection approach for noisy environment | |
Hsieh et al. | Employing median filtering to enhance the complex-valued acoustic spectrograms in modulation domain for noise-robust speech recognition | |
Upadhyay et al. | Robust recognition of English speech in noisy environments using frequency warped signal processing | |
Hurmalainen et al. | Modelling spectro-temporal dynamics in factorisation-based noise-robust automatic speech recognition | |
Kumar et al. | Effective preprocessing of speech and acoustic features extraction for spoken language identification | |
Tzudir et al. | Low-resource dialect identification in Ao using noise robust mean Hilbert envelope coefficients | |
Maged et al. | Improving speaker identification system using discrete wavelet transform and AWGN | |
JPH07121197A (ja) | 学習式音声認識方法 | |
Singh et al. | A comparative study of recognition of speech using improved MFCC algorithms and Rasta filters | |
Upadhyay et al. | Bark scaled oversampled WPT based speech recognition enhancement in noisy environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101005 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20101227 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110404 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110929 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20111007 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20111222 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120406 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120411 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20120706 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20121120 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130319 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160329 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5230103 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |