JP5240457B2 - 拡張認識辞書学習装置と音声認識システム - Google Patents
拡張認識辞書学習装置と音声認識システム Download PDFInfo
- Publication number
- JP5240457B2 JP5240457B2 JP2008554032A JP2008554032A JP5240457B2 JP 5240457 B2 JP5240457 B2 JP 5240457B2 JP 2008554032 A JP2008554032 A JP 2008554032A JP 2008554032 A JP2008554032 A JP 2008554032A JP 5240457 B2 JP5240457 B2 JP 5240457B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- recognition dictionary
- deformation
- recognition
- utterance deformation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013598 vector Substances 0.000 claims description 45
- 230000004048 modification Effects 0.000 claims description 25
- 238000012986 modification Methods 0.000 claims description 25
- 238000004364 calculation method Methods 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 20
- 238000013500 data storage Methods 0.000 description 15
- 230000009466 transformation Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000002940 repellent Effects 0.000 description 2
- 239000005871 repellent Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0635—Training updating or merging of old and new templates; Mean values; Weighting
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Image Analysis (AREA)
Description
110 音声入力部
111 発声ラベル入力部
112 音響モデル記憶部
113 認識辞書記憶部
114 音声認識手段
115 発声変形データ算出手段
116 発声変形データ記憶部
117 発声変形データ分類手段
118 認識辞書拡張手段
119 拡張認識辞書記憶部
120 音声認識装置
121 音声入力部
122 音声認識手段
123 認識結果出力部
131 idf値・tfidf値算出手段
132 発声変形ベクトル
133 発声変形ベクトルクラスタリング手段
141 idf発声変形ベクトル
142 クラスタ発声変形ベクトル
151 発声変形ベクトル統合手段
152 発声変形集合
153 認識辞書拡張手段
154 認識辞書拡張規則
501 音声入力部
502 発声ラベル入力部
503 音響モデル記憶部
504 認識辞書記憶部
505 音声認識手段
506 発声変形データ算出手段
507 発声変形データ記憶部
508 認識辞書拡張手段
509 拡張認識辞書記憶部
510 音声入力部
511 音声認識手段
512 認識結果出力部
Claims (11)
- 音声認識結果から出力される音響モデル系列と、入力される正解音響モデル系列とを比較して、それらモデルの対応を発声変形データとして算出する発声変形データ算出手段と、
算出された発声変形データにおいて広く出現する発声変形および偏って出現する発声変形を分類する発声変形データ分類手段と、
分類された発声変形を組み合わせて、複数の発声変形集合とし、それぞれの発声変形集合に含まれる発声変形により、発声変形集合ごとに認識辞書を拡張する認識辞書拡張手段と、
を有することを特徴とする拡張認識辞書学習装置。 - 請求項1に記載の拡張認識辞書学習装置において、
前記発声変形データ分類手段は、
前記発声変形データのidf値を用いて、前記発声変形データにおいて前記広く出現する発声変形をidf発声変形ベクトルとして算出する第1の算出手段と、
前記発声変形データのtf値と前記idf値とで計算されるtfidf値を用いて、前記発声変形データにおいて前記偏って出現する発声変形をクラスタリングして、クラスタ発声変形ベクトルとして算出する第2の算出手段とを有し、
前記認識辞書拡張手段は、前記idf発声変形ベクトルの値が所定値よりも小さい発声変形のみ、あるいはそれぞれの前記クラスタ発声変形ベクトルの値が所定値よりも大きい発声変形を組み合わせて、複数の発声変形集合を構成することを特徴とする拡張認識辞書学習装置。 - 請求項2に記載の拡張認識辞書学習装置において、
前記認識辞書拡張手段は、前記idf発声変形ベクトルの値が所定値よりも小さい発声変形と、それぞれの前記クラスタ発声変形ベクトルの値が所定値よりも大きい発声変形を共に含ませて、クラスタ個数と同じ数の発声変形集合を構成することを特徴とする拡張認識辞書学習装置。 - 請求項3に記載の拡張認識辞書学習装置において、
前記認識辞書拡張手段は、クラスタ個数と同じ発声変形集合に、前記idf発声変形ベクトルの値が所定値よりも小さい発声変形を発声変形集合を加えて、クラスタ個数より一つ多い、発声変形集合を構成することを特徴とする拡張認識辞書学習装置。 - 請求項1から4のいずれか1項に記載の拡張認識辞書学習装置において、
前記認識辞書拡張手段は、認識辞書拡張規則として予め設定された、認識対象言語の音声として成立しうる発声変形に制約する規則のもとで、認識辞書の標準発声を、発声変形集合それぞれにおいて含まれる発声変形で置き換えた項目を追加することにより、認識辞書を拡張して、発声変形集合ごとの拡張認識辞書を構成することを特徴とする拡張認識辞書学習装置。 - 請求項2に記載の拡張認識辞書学習装置において、
前記第1の算出手段は、
前記発声変形をXとし、話者数をNとし、前記発声変形XがN個の話者の各発声変形データのうち幾つに現れたかをdnum(X)としたとき、
前記第2の算出手段は、
話者pの発声変形データにおいて発声変形Xが出現したフレームのカウント数をtnum(X,p)とし、話者pの学習発声のフレーム数をframe(p)としたとき、
- 請求項1から6のいずれか1項に記載の拡張認識辞書学習装置によって学習された、発声変形集合ごとの認識辞書を用いて、入力音声に対し音声認識を行う音声認識手段を有することを特徴とする音声認識装置。
- 請求項7に記載の音声認識装置において、
前記音声認識手段は、得られた拡張認識辞書ごとの認識結果を仮説として多数決法で選別して最終認識結果を出力することを特徴とする音声認識装置。 - 請求項1から6のいずれか1項に記載の拡張認識辞書学習装置を利用したことを特徴とする音声認識システム。
- 音声認識結果から出力される音響モデル系列と、入力される正解音響モデル系列とを比較して、それらモデルの対応を算出するステップと、
算出された発声変形データにおいて広く出現する発声変形および偏って出現する発声変形を分類するステップと、
分類された発声変形を組み合わせて、複数の発声変形集合とし、それぞれの発声変形集合に含まれる発声変形により、発声変形集合ごとに認識辞書を拡張するステップと、
を有することを特徴とする拡張認識辞書学習方法。 - コンピュータに、
音声認識結果から出力される音響モデル系列と、入力される正解音響モデル系列とを比較して、それらモデルの対応を算出する手順と、
算出された発声変形データにおいて広く出現する発声変形および偏って出現する発声変形を分類する手順と、
分類された発声変形を組み合わせて、複数の発声変形集合とし、それぞれの発声変形集合に含まれる発声変形により、発声変形集合ごとに認識辞書を拡張する手順とを実行させるための拡張認識辞書学習プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008554032A JP5240457B2 (ja) | 2007-01-16 | 2008-01-15 | 拡張認識辞書学習装置と音声認識システム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007006977 | 2007-01-16 | ||
JP2007006977 | 2007-01-16 | ||
JP2008554032A JP5240457B2 (ja) | 2007-01-16 | 2008-01-15 | 拡張認識辞書学習装置と音声認識システム |
PCT/JP2008/050346 WO2008087934A1 (ja) | 2007-01-16 | 2008-01-15 | 拡張認識辞書学習装置と音声認識システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008087934A1 JPWO2008087934A1 (ja) | 2010-05-06 |
JP5240457B2 true JP5240457B2 (ja) | 2013-07-17 |
Family
ID=39635938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008554032A Active JP5240457B2 (ja) | 2007-01-16 | 2008-01-15 | 拡張認識辞書学習装置と音声認識システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8918318B2 (ja) |
JP (1) | JP5240457B2 (ja) |
WO (1) | WO2008087934A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190019661A (ko) * | 2017-08-18 | 2019-02-27 | 동아대학교 산학협력단 | 언어 분석기별 정답 레이블 분포를 이용한 자연어 이해 방법 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009078256A1 (ja) * | 2007-12-18 | 2009-06-25 | Nec Corporation | 発音変動規則抽出装置、発音変動規則抽出方法、および発音変動規則抽出用プログラム |
JP5454469B2 (ja) * | 2008-05-09 | 2014-03-26 | 富士通株式会社 | 音声認識辞書作成支援装置,処理プログラム,および処理方法 |
JP5104732B2 (ja) * | 2008-11-14 | 2012-12-19 | 日本電気株式会社 | 拡張認識辞書学習装置、これを用いた音声認識システム、その方法及びそのプログラム |
JP5315976B2 (ja) * | 2008-12-19 | 2013-10-16 | カシオ計算機株式会社 | 音声認識装置、音声認識方法、および、プログラム |
JP4981076B2 (ja) * | 2009-02-02 | 2012-07-18 | 日本放送協会 | 発音辞書修正装置、音声認識装置、およびコンピュータプログラム |
JP5152020B2 (ja) * | 2009-02-02 | 2013-02-27 | 富士通株式会社 | 音声認識装置及び音声認識方法 |
JP5184467B2 (ja) * | 2009-08-31 | 2013-04-17 | 日本放送協会 | 適応化音響モデル生成装置及びプログラム |
US9634855B2 (en) | 2010-05-13 | 2017-04-25 | Alexander Poltorak | Electronic personal interactive device that determines topics of interest using a conversational agent |
US10811004B2 (en) * | 2013-03-28 | 2020-10-20 | Nuance Communications, Inc. | Auto-generation of parsing grammars from a concept ontology |
JP6410491B2 (ja) * | 2014-06-27 | 2018-10-24 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 発音辞書の拡張システム、拡張プログラム、拡張方法、該拡張方法により得られた拡張発音辞書を用いた音響モデルの学習方法、学習プログラム、および学習システム |
JP6390264B2 (ja) * | 2014-08-21 | 2018-09-19 | トヨタ自動車株式会社 | 応答生成方法、応答生成装置及び応答生成プログラム |
JP6475517B2 (ja) * | 2015-03-02 | 2019-02-27 | 日本放送協会 | 発音系列拡張装置およびそのプログラム |
US10332505B2 (en) * | 2017-03-09 | 2019-06-25 | Capital One Services, Llc | Systems and methods for providing automated natural language dialogue with customers |
US9741337B1 (en) * | 2017-04-03 | 2017-08-22 | Green Key Technologies Llc | Adaptive self-trained computer engines with associated databases and methods of use thereof |
US20190295541A1 (en) * | 2018-03-23 | 2019-09-26 | Polycom, Inc. | Modifying spoken commands |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6153699A (ja) * | 1984-08-24 | 1986-03-17 | 松下電器産業株式会社 | 音声認識装置 |
JPS62235992A (ja) * | 1986-04-05 | 1987-10-16 | シャープ株式会社 | 音声認識方式 |
WO2006126649A1 (ja) * | 2005-05-27 | 2006-11-30 | Matsushita Electric Industrial Co., Ltd. | 音声編集装置、音声編集方法、および、音声編集プログラム |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4843389A (en) * | 1986-12-04 | 1989-06-27 | International Business Machines Corp. | Text compression and expansion method and apparatus |
JP2701500B2 (ja) | 1990-01-17 | 1998-01-21 | 日本電気株式会社 | 音声認識装置のための標準パターン学習方式 |
JP2596869B2 (ja) * | 1992-04-30 | 1997-04-02 | 松下電器産業株式会社 | 概念辞書管理装置 |
JPH0720889A (ja) | 1993-06-30 | 1995-01-24 | Omron Corp | 不特定話者の音声認識装置および方法 |
JPH08123470A (ja) | 1994-10-25 | 1996-05-17 | Nippon Hoso Kyokai <Nhk> | 音声認識装置 |
US5875443A (en) * | 1996-01-30 | 1999-02-23 | Sun Microsystems, Inc. | Internet-based spelling checker dictionary system with automatic updating |
JP2974621B2 (ja) | 1996-09-19 | 1999-11-10 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 音声認識用単語辞書作成装置及び連続音声認識装置 |
JP3466857B2 (ja) * | 1997-03-06 | 2003-11-17 | 株式会社東芝 | 辞書更新方法および辞書更新システム |
US6078886A (en) * | 1997-04-14 | 2000-06-20 | At&T Corporation | System and method for providing remote automatic speech recognition services via a packet network |
US6061646A (en) * | 1997-12-18 | 2000-05-09 | International Business Machines Corp. | Kiosk for multiple spoken languages |
JPH11344992A (ja) | 1998-06-01 | 1999-12-14 | Ntt Data Corp | 音声辞書作成方法、個人認証装置および記録媒体 |
US6744860B1 (en) * | 1998-12-31 | 2004-06-01 | Bell Atlantic Network Services | Methods and apparatus for initiating a voice-dialing operation |
JP4732593B2 (ja) * | 1999-05-05 | 2011-07-27 | ウエスト パブリッシング カンパニー | ドキュメント分類システム、ドキュメント分類方法およびドキュメント分類ソフトウェア |
JP2001101185A (ja) * | 1999-09-24 | 2001-04-13 | Internatl Business Mach Corp <Ibm> | 辞書の自動切り換えが可能な機械翻訳方法および装置並びにそのような機械翻訳方法を実行するためのプログラムを記憶したプログラム記憶媒体 |
US7392185B2 (en) * | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US7725307B2 (en) * | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US6456975B1 (en) * | 2000-01-13 | 2002-09-24 | Microsoft Corporation | Automated centralized updating of speech recognition systems |
US7113910B1 (en) * | 2000-02-18 | 2006-09-26 | At&T Corp. | Document expansion in speech retrieval |
US6272464B1 (en) * | 2000-03-27 | 2001-08-07 | Lucent Technologies Inc. | Method and apparatus for assembling a prediction list of name pronunciation variations for use during speech recognition |
WO2001084535A2 (en) * | 2000-05-02 | 2001-11-08 | Dragon Systems, Inc. | Error correction in speech recognition |
US7031908B1 (en) * | 2000-06-01 | 2006-04-18 | Microsoft Corporation | Creating a language model for a language processing system |
US6810376B1 (en) * | 2000-07-11 | 2004-10-26 | Nusuara Technologies Sdn Bhd | System and methods for determining semantic similarity of sentences |
US7042443B2 (en) * | 2001-10-11 | 2006-05-09 | Woodard Scott E | Speed Writer program and device with Speed Writer program installed |
US7567953B2 (en) * | 2002-03-01 | 2009-07-28 | Business Objects Americas | System and method for retrieving and organizing information from disparate computer network information sources |
US7257531B2 (en) * | 2002-04-19 | 2007-08-14 | Medcom Information Systems, Inc. | Speech to text system using controlled vocabulary indices |
US7197460B1 (en) * | 2002-04-23 | 2007-03-27 | At&T Corp. | System for handling frequently asked questions in a natural language dialog service |
US7606714B2 (en) * | 2003-02-11 | 2009-10-20 | Microsoft Corporation | Natural language classification within an automated response system |
US7283997B1 (en) * | 2003-05-14 | 2007-10-16 | Apple Inc. | System and method for ranking the relevance of documents retrieved by a query |
CN1922605A (zh) * | 2003-12-26 | 2007-02-28 | 松下电器产业株式会社 | 辞典制作装置以及辞典制作方法 |
JP4218758B2 (ja) * | 2004-12-21 | 2009-02-04 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 字幕生成装置、字幕生成方法、及びプログラム |
US7693267B2 (en) * | 2005-12-30 | 2010-04-06 | Microsoft Corporation | Personalized user specific grammars |
-
2008
- 2008-01-15 US US12/523,302 patent/US8918318B2/en not_active Expired - Fee Related
- 2008-01-15 JP JP2008554032A patent/JP5240457B2/ja active Active
- 2008-01-15 WO PCT/JP2008/050346 patent/WO2008087934A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6153699A (ja) * | 1984-08-24 | 1986-03-17 | 松下電器産業株式会社 | 音声認識装置 |
JPS62235992A (ja) * | 1986-04-05 | 1987-10-16 | シャープ株式会社 | 音声認識方式 |
WO2006126649A1 (ja) * | 2005-05-27 | 2006-11-30 | Matsushita Electric Industrial Co., Ltd. | 音声編集装置、音声編集方法、および、音声編集プログラム |
Non-Patent Citations (6)
Title |
---|
CSNG200500672004; 南條 浩輝: '講演音声認識のための教師なし言語モデル適応と発話速度に適応したデコーディング' 電子情報通信学会論文誌 第J87-D-II巻,第8号, 2004, 社団法人電子情報通信学会 THE INSTITUTE OF ELECTRO * |
CSNG200700044048; 鮫島 充: '子供音声に対する十分統計量に基づく教師なし話者適応の検討' 日本音響学会2004年秋季研究発表会講演論文集-I- , 社団法人日本音響学会 * |
CSNG200700334005; 佐藤 庄衛: '実況・対談における発声変形を考慮した音響モデルの検討' 電子情報通信学会技術研究報告 Vol.105 No.495, 2005, 社団法人電子情報通信学会 * |
JPN6013010399; 佐藤 庄衛: '実況・対談における発声変形を考慮した音響モデルの検討' 電子情報通信学会技術研究報告 Vol.105 No.495, 2005, 社団法人電子情報通信学会 * |
JPN6013010402; 鮫島 充: '子供音声に対する十分統計量に基づく教師なし話者適応の検討' 日本音響学会2004年秋季研究発表会講演論文集-I- , 社団法人日本音響学会 * |
JPN6013010406; 南條 浩輝: '講演音声認識のための教師なし言語モデル適応と発話速度に適応したデコーディング' 電子情報通信学会論文誌 第J87-D-II巻,第8号, 2004, 社団法人電子情報通信学会 THE INSTITUTE OF ELECTRO * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190019661A (ko) * | 2017-08-18 | 2019-02-27 | 동아대학교 산학협력단 | 언어 분석기별 정답 레이블 분포를 이용한 자연어 이해 방법 |
KR102012404B1 (ko) | 2017-08-18 | 2019-08-20 | 동아대학교 산학협력단 | 언어 분석기별 정답 레이블 분포를 이용한 자연어 이해 방법 |
Also Published As
Publication number | Publication date |
---|---|
US20100023329A1 (en) | 2010-01-28 |
JPWO2008087934A1 (ja) | 2010-05-06 |
WO2008087934A1 (ja) | 2008-07-24 |
US8918318B2 (en) | 2014-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5240457B2 (ja) | 拡張認識辞書学習装置と音声認識システム | |
De Wachter et al. | Template-based continuous speech recognition | |
Zeinali et al. | HMM-based phrase-independent i-vector extractor for text-dependent speaker verification | |
Sainath et al. | Exemplar-based sparse representation features: From TIMIT to LVCSR | |
EP2192575B1 (en) | Speech recognition based on a multilingual acoustic model | |
US8515758B2 (en) | Speech recognition including removal of irrelevant information | |
JP2007047818A (ja) | 最適化された部分的確率混合共通化を用いる音声認識のための方法および装置 | |
De Wachter et al. | Data driven example based continuous speech recognition | |
Chen et al. | Strategies for Vietnamese keyword search | |
KR20050082253A (ko) | 모델 변이 기반의 화자 클러스터링 방법, 화자 적응 방법및 이들을 이용한 음성 인식 장치 | |
US20100100379A1 (en) | Voice recognition correlation rule learning system, voice recognition correlation rule learning program, and voice recognition correlation rule learning method | |
Morris et al. | Combining phonetic attributes using conditional random fields. | |
US8078462B2 (en) | Apparatus for creating speaker model, and computer program product | |
Chao et al. | Improved tone modeling by exploiting articulatory features for Mandarin speech recognition | |
KR101483947B1 (ko) | 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
KR101424496B1 (ko) | 음향 모델 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
Batista et al. | Baseline Acoustic Models for Brazilian Portuguese Using Kaldi Tools. | |
JP2007078943A (ja) | 音響スコア計算プログラム | |
Ko et al. | Eigentriphones for context-dependent acoustic modeling | |
JP2001312293A (ja) | 音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体 | |
JP2006031278A (ja) | 音声検索システムおよび方法ならびにプログラム | |
JP5104732B2 (ja) | 拡張認識辞書学習装置、これを用いた音声認識システム、その方法及びそのプログラム | |
Breslin | Generation and combination of complementary systems for automatic speech recognition | |
Zhang et al. | Application of pronunciation knowledge on phoneme recognition by lstm neural network | |
Matton et al. | A discriminative locally weighted distance measure for speaker independent template based speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20101022 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20101022 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130306 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130319 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160412 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5240457 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |