JP2004341532A - 圧縮音響モデルの適応 - Google Patents
圧縮音響モデルの適応 Download PDFInfo
- Publication number
- JP2004341532A JP2004341532A JP2004145307A JP2004145307A JP2004341532A JP 2004341532 A JP2004341532 A JP 2004341532A JP 2004145307 A JP2004145307 A JP 2004145307A JP 2004145307 A JP2004145307 A JP 2004145307A JP 2004341532 A JP2004341532 A JP 2004341532A
- Authority
- JP
- Japan
- Prior art keywords
- codebook
- computer
- codeword
- regression
- codewords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006978 adaptation Effects 0.000 title claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 19
- 238000000034 method Methods 0.000 claims description 46
- 230000003044 adaptive effect Effects 0.000 claims description 11
- 230000009466 transformation Effects 0.000 claims description 11
- 238000009826 distribution Methods 0.000 description 22
- 239000013598 vector Substances 0.000 description 19
- 238000010586 diagram Methods 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000012417 linear regression Methods 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- CDFKCKUONRRKJD-UHFFFAOYSA-N 1-(3-chlorophenoxy)-3-[2-[[3-(3-chlorophenoxy)-2-hydroxypropyl]amino]ethylamino]propan-2-ol;methanesulfonic acid Chemical compound CS(O)(=O)=O.CS(O)(=O)=O.C=1C=CC(Cl)=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC(Cl)=C1 CDFKCKUONRRKJD-UHFFFAOYSA-N 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000011295 pitch Substances 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F1/00—Room units for air-conditioning, e.g. separate or self-contained units or units receiving primary air from a central station
- F24F1/06—Separate outdoor units, e.g. outdoor unit to be linked to a separate room comprising a compressor and a heat exchanger
- F24F1/56—Casing or covers of separate outdoor units, e.g. fan guards
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F13/00—Details common to, or for air-conditioning, air-humidification, ventilation or use of air currents for screening
- F24F13/20—Casings or covers
- F24F2013/207—Casings or covers with control knobs; Mounting controlling members or control units therein
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
- G10L15/142—Hidden Markov Models [HMMs]
- G10L15/144—Training of HMMs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/285—Memory allocation or algorithm optimisation to reduce hardware requirements
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Mechanical Engineering (AREA)
- General Engineering & Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 本発明は、(特定話者トレーニング・データなどの)適応トレーニング・データを使用して部分空間で量子化された音響モデルを適応させるために使用される。音響モデルは多次元部分空間に圧縮される。部分空間ごとにコードブックが生成される。適応変形が推定され、平均値自体にではなくコードブックのコードワードに適用される。
【選択図】 図1
Description
等式1
マージのコスト=コスト[AおよびB]−コスト[A]−コスト[B]
グループAおよびグループB
最初の反復でAとBはそれぞれ1つの次元を表している(例えば、0、1、2、など)。しかしその後の反復では、AとBは既にマージされた次元も表す場合がある(例えば、1と26、2と13、など)。
等式2
等式3
等式4
等式5
等式6
等式7
等式8
等式9
等式11
等式12
γ=前進/後進確率カウント
r=回帰クラス
m=混合コンポーネント
s=状態
l=フレーム数
s,m=コードブック内のコードワードを識別する状態混合コンポーネントの組合せ
したがって、等式12は、所与の回帰クラスriの要素であるs、mで表されるすべてのコードワードに関して、そのコードワードに関連付けられたカウントの積、コードブックiでs、mにより示されるコードワードに対する分散、コードブックiの回帰riに関連付けられた変形、およびそのコードワードに対する平均値に適用された際にs、mにより示されるコードワードを合計するということが分かる。
130 システム・メモリ
134 オペレーティング・システム
135 アプリケーション・プログラム
136 他のプログラム・モジュール
137 プログラム・データ
140 取外し不可能な不揮発性メモリ・インターフェース
150 取外し可能な不揮発性メモリ・インターフェース
160 ユーザ入力インターフェース
161 ポインティング・デバイス
162 キーボード
163 マイクロフォン
170 ネットワーク・インターフェース
171 ローカル・エリア・ネットワーク
172 モデム
173 ワイド・エリア・ネットワーク
180 遠隔コンピュータ
185 遠隔アプリケーション・プログラム
190 ビデオ・インターフェース
191 モニタ
195 出力周辺インターフェース
196 プリンタ
197 スピーカ
Claims (19)
- 音声認識エンジンで使用するための音響モデルを適応させる方法において、
前記音響モデルを部分空間符号化して、それぞれが複数のコードワードを含み、1つの部分空間あたり少なくとも1つのコードブックを含む、コードブックの複数を獲得すること、および
適応トレーニング・データに基づいて前記コードブック内の前記コードワードを適応させること
を備えることを特徴とする方法。 - 前記適応させることの前に、各コードブック内の前記コードワードを複数の異なるクラスに分割することをさらに備えることを特徴とする請求項1に記載の方法。
- 前記適応させることは、
前記コードワードが前記複数のクラスのどれに属するかに基づいて前記コードワードに適応変形を適用すること
を備えることを特徴とする請求項2に記載の方法。 - 前記コードワードを分割することは、
各コードブックに対応する回帰木を構築すること、および
前記所与のコードブックに対応する回帰木をトラバースすることによって複数の回帰クラスの1つに、所与のコードブック内の前記コードワードをグループ化すること
を備えることを特徴とする請求項3に記載の方法。 - 前記回帰木を構築することは、
言語回帰木を構築すること
を備えることを特徴とする請求項4に記載の方法。 - 前記回帰木を構築することは、
前記コードワードのクラスタ化することを反復することによって回帰木を構築すること
を備えることを特徴とする請求項4に記載の方法。 - 前記適応変形を適用することは、
前記複数のクラスのそれぞれに対応する適応変形を推定すること
を備えることを特徴とする請求項3に記載の方法。 - 前記各コードワードが少なくとも1つのガウス平均値を表し、前記コードワードを適応させることは前記ガウス平均値を適応させることを備えることを特徴とする請求項1に記載の方法。
- 前記各コードワードが少なくとも1つのガウス分散を表し、前記コードワードを適応させることは前記ガウス分散を適応させることを備えることを特徴とする請求項8に記載の方法。
- 前記適応させることは、
特定話者適応トレーニング・データに基づいて前記コードワードを適応させること
を備えることを特徴とする請求項1に記載の方法。 - 音声レコグナイザで音響モデルをトレーニングするコンピュータに実装される方法において、
1つのコードブックは前記音響モデルが符号化されている各音響部分空間に対応し、各コードブックはその中に複数のコードワードを有しており、各コードワードはモデル化された音声単位の音響特性の少なくとも1つのコンポーネントを表している、複数のコードブックを有する部分空間符号化された音響モデルを生成すること、および
適応トレーニング・データに基づいて前記コードワードを修正すること
を備えることを特徴とするコンピュータに実装される方法。 - 前記修正することは、
前記適応トレーニング・データを受信すること、および
前記適応トレーニング・データに基づいて変形を推定すること
を備えることを特徴とする請求項11に記載のコンピュータに実装される方法。 - 前記修正することは、
前記各コードブック内の前記コードワードを複数のクラスの1つにグループ化すること
を備えることを特徴とする請求項12に記載のコンピュータに実装される方法。 - 前記変形を推定することは、
前記複数のクラスのそれぞれに対する変形を推定すること
を備えることを特徴とする請求項13に記載のコンピュータに実装される方法。 - 前記グループ化することは、
前記各コードブックに対応する回帰木を構築すること
を備えることを特徴とする請求項14に記載のコンピュータに実装される方法。 - 前記グループ化することは、
前記回帰木をトラバースして、前記対応するコードブック内の前記コードワードを回帰クラスにグループ化すること
を備えることを特徴とする請求項15に記載のコンピュータに実装される方法。 - 前記変形を推定することは、
回帰クラスごとに変形を推定すること
を備えることを特徴とする請求項16に記載のコンピュータに実装される方法。 - 前記コードワードを修正することは、
所与のコードワードに、前記所与のコードワードが常駐する回帰クラスに対応する変形を適用すること
を備えることを特徴とする請求項17に記載のコンピュータに実装される方法。 - コンピュータ可読媒体であって、実行されると、
各部分空間に対応するコードブックと各コードブック内の複数のコードワードとを含む部分空間符号化された音響モデルを受信すること、
トレーニング・データを受信すること、および
前記トレーニング・データに基づいて前記コードブック内の前記コードワードを適応させること
をコンピュータに実行させる命令を記憶していることを特徴とするコンピュータ可読媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/438,498 US7499857B2 (en) | 2003-05-15 | 2003-05-15 | Adaptation of compressed acoustic models |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004341532A true JP2004341532A (ja) | 2004-12-02 |
Family
ID=33029806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004145307A Pending JP2004341532A (ja) | 2003-05-15 | 2004-05-14 | 圧縮音響モデルの適応 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7499857B2 (ja) |
EP (1) | EP1477966B1 (ja) |
JP (1) | JP2004341532A (ja) |
KR (1) | KR101036712B1 (ja) |
CN (1) | CN1551101B (ja) |
AT (1) | ATE531032T1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009527801A (ja) * | 2006-02-21 | 2009-07-30 | 株式会社ソニー・コンピュータエンタテインメント | 話者適応を用いた音声認識とピッチによる登録 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102004045979A1 (de) * | 2004-09-22 | 2006-03-30 | Siemens Ag | Verfahren zur Sprecheradaption für ein Hidden-Markov-Modell basiertes Spracherkennungssystem |
US20060136210A1 (en) * | 2004-12-16 | 2006-06-22 | Sony Corporation | System and method for tying variance vectors for speech recognition |
CA2599168A1 (en) * | 2005-02-24 | 2006-08-31 | Ernest E. Braxton | Apparatus and method for non-invasive measurement of intracranial pressure |
US7729909B2 (en) * | 2005-03-04 | 2010-06-01 | Panasonic Corporation | Block-diagonal covariance joint subspace tying and model compensation for noise robust automatic speech recognition |
US20070088552A1 (en) * | 2005-10-17 | 2007-04-19 | Nokia Corporation | Method and a device for speech recognition |
KR20090008466A (ko) * | 2006-05-09 | 2009-01-21 | 인터디지탈 테크날러지 코포레이션 | 범용 지상 무선 액세스를 위한 가변 피드백 |
US8239195B2 (en) * | 2008-09-23 | 2012-08-07 | Microsoft Corporation | Adapting a compressed model for use in speech recognition |
US8145483B2 (en) * | 2009-08-05 | 2012-03-27 | Tze Fen Li | Speech recognition method for all languages without using samples |
US20120116764A1 (en) * | 2010-11-09 | 2012-05-10 | Tze Fen Li | Speech recognition method on sentences in all languages |
US9367612B1 (en) * | 2011-11-18 | 2016-06-14 | Google Inc. | Correlation-based method for representing long-timescale structure in time-series data |
US8543398B1 (en) | 2012-02-29 | 2013-09-24 | Google Inc. | Training an automatic speech recognition system using compressed word frequencies |
US8374865B1 (en) | 2012-04-26 | 2013-02-12 | Google Inc. | Sampling training data for an automatic speech recognition system based on a benchmark classification distribution |
US8571859B1 (en) | 2012-05-31 | 2013-10-29 | Google Inc. | Multi-stage speaker adaptation |
US8805684B1 (en) * | 2012-05-31 | 2014-08-12 | Google Inc. | Distributed speaker adaptation |
US8880398B1 (en) | 2012-07-13 | 2014-11-04 | Google Inc. | Localized speech recognition with offload |
US9123333B2 (en) | 2012-09-12 | 2015-09-01 | Google Inc. | Minimum bayesian risk methods for automatic speech recognition |
US9093069B2 (en) * | 2012-11-05 | 2015-07-28 | Nuance Communications, Inc. | Privacy-sensitive speech model creation via aggregation of multiple user models |
US9378729B1 (en) * | 2013-03-12 | 2016-06-28 | Amazon Technologies, Inc. | Maximum likelihood channel normalization |
US9858922B2 (en) | 2014-06-23 | 2018-01-02 | Google Inc. | Caching speech recognition scores |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
US9299347B1 (en) | 2014-10-22 | 2016-03-29 | Google Inc. | Speech recognition using associative mapping |
US10511695B2 (en) * | 2015-06-23 | 2019-12-17 | Georgia Tech Research Corporation | Packet-level clustering for memory-assisted compression of network traffic |
US9786270B2 (en) | 2015-07-09 | 2017-10-10 | Google Inc. | Generating acoustic models |
KR102492318B1 (ko) | 2015-09-18 | 2023-01-26 | 삼성전자주식회사 | 모델 학습 방법 및 장치, 및 데이터 인식 방법 |
US10229672B1 (en) | 2015-12-31 | 2019-03-12 | Google Llc | Training acoustic models using connectionist temporal classification |
US20180018973A1 (en) | 2016-07-15 | 2018-01-18 | Google Inc. | Speaker verification |
US10593346B2 (en) * | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10706840B2 (en) | 2017-08-18 | 2020-07-07 | Google Llc | Encoder-decoder models for sequence to sequence mapping |
JP7223775B2 (ja) * | 2018-05-18 | 2023-02-16 | ジェネシス クラウド サービシーズ ホールディングス セカンド エルエルシー | 自動音声認識システムにおける信頼モデリングのためのマルチクラスアプローチのためのシステム及び方法 |
US11620263B2 (en) * | 2020-12-17 | 2023-04-04 | EMC IP Holding Company LLC | Data compression using dictionaries |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001195084A (ja) * | 1999-11-29 | 2001-07-19 | Matsushita Electric Ind Co Ltd | 音声認識のための文脈依存モデルの作成方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5535305A (en) * | 1992-12-31 | 1996-07-09 | Apple Computer, Inc. | Sub-partitioned vector quantization of probability density functions |
JPH08116972A (ja) * | 1994-10-28 | 1996-05-14 | Kyowa Hakko Kogyo Co Ltd | ヒト26sプロテアソーム構成成分蛋白質 |
US5864810A (en) * | 1995-01-20 | 1999-01-26 | Sri International | Method and apparatus for speech recognition adapted to an individual speaker |
US5806029A (en) * | 1995-09-15 | 1998-09-08 | At&T Corp | Signal conditioned minimum error rate training for continuous speech recognition |
US5897616A (en) * | 1997-06-11 | 1999-04-27 | International Business Machines Corporation | Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases |
DE19912405A1 (de) * | 1999-03-19 | 2000-09-21 | Philips Corp Intellectual Pty | Bestimmung einer Regressionsklassen-Baumstruktur für Spracherkenner |
US6442519B1 (en) * | 1999-11-10 | 2002-08-27 | International Business Machines Corp. | Speaker model adaptation via network of similar users |
US7571097B2 (en) * | 2003-03-13 | 2009-08-04 | Microsoft Corporation | Method for training of subspace coded gaussian models |
-
2003
- 2003-05-15 US US10/438,498 patent/US7499857B2/en not_active Expired - Fee Related
-
2004
- 2004-04-23 AT AT04009734T patent/ATE531032T1/de not_active IP Right Cessation
- 2004-04-23 EP EP04009734A patent/EP1477966B1/en not_active Expired - Lifetime
- 2004-05-14 KR KR1020040034101A patent/KR101036712B1/ko not_active IP Right Cessation
- 2004-05-14 JP JP2004145307A patent/JP2004341532A/ja active Pending
- 2004-05-17 CN CN2004100435508A patent/CN1551101B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001195084A (ja) * | 1999-11-29 | 2001-07-19 | Matsushita Electric Ind Co Ltd | 音声認識のための文脈依存モデルの作成方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009527801A (ja) * | 2006-02-21 | 2009-07-30 | 株式会社ソニー・コンピュータエンタテインメント | 話者適応を用いた音声認識とピッチによる登録 |
Also Published As
Publication number | Publication date |
---|---|
ATE531032T1 (de) | 2011-11-15 |
CN1551101A (zh) | 2004-12-01 |
EP1477966B1 (en) | 2011-10-26 |
KR101036712B1 (ko) | 2011-05-24 |
US7499857B2 (en) | 2009-03-03 |
US20040230424A1 (en) | 2004-11-18 |
EP1477966A3 (en) | 2005-01-12 |
KR20040098589A (ko) | 2004-11-20 |
CN1551101B (zh) | 2012-04-11 |
EP1477966A2 (en) | 2004-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1477966B1 (en) | Adaptation of compressed acoustic models | |
EP1457967B1 (en) | Compression of gaussian models | |
US7275034B2 (en) | Word-specific acoustic models in a speech recognition system | |
US8019602B2 (en) | Automatic speech recognition learning using user corrections | |
Lari et al. | Applications of stochastic context-free grammars using the inside-outside algorithm | |
Guglani et al. | Continuous Punjabi speech recognition model based on Kaldi ASR toolkit | |
US5937384A (en) | Method and system for speech recognition using continuous density hidden Markov models | |
US6064958A (en) | Pattern recognition scheme using probabilistic models based on mixtures distribution of discrete distribution | |
US6256607B1 (en) | Method and apparatus for automatic recognition using features encoded with product-space vector quantization | |
US7299179B2 (en) | Three-stage individual word recognition | |
US20050273325A1 (en) | Removing noise from feature vectors | |
US7418386B2 (en) | Method, apparatus and system for building a compact language model for large vocabulary continuous speech recognition (LVCSR) system | |
Bahl et al. | A method for the construction of acoustic Markov models for words | |
JP2007047818A (ja) | 最適化された部分的確率混合共通化を用いる音声認識のための方法および装置 | |
JPH0555040B2 (ja) | ||
Bacchiani et al. | Joint lexicon, acoustic unit inventory and model design | |
Anoop et al. | Automatic speech recognition for Sanskrit | |
US7454341B1 (en) | Method, apparatus, and system for building a compact model for large vocabulary continuous speech recognition (LVCSR) system | |
Hadwan et al. | An End-to-End Transformer-Based Automatic Speech Recognition for Qur'an Reciters. | |
Thalengala et al. | Study of sub-word acoustical models for Kannada isolated word recognition system | |
WO2007129802A1 (en) | Method for selecting training data based on non-uniform sampling for speech recognition vector quantization | |
Li et al. | Optimal clustering and non-uniform allocation of Gaussian kernels in scalar dimension for HMM compression [speech recognition applications] | |
JP2000075886A (ja) | 統計的言語モデル生成装置及び音声認識装置 | |
Li | Speech recognition of mandarin monosyllables | |
Agenbag et al. | Refining sparse coding sub-word unit inventories with lattice-constrained Viterbi training |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070514 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100903 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101228 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110324 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110426 |