DE69725106D1 - Verfahren und Vorrichtung zur Spracherkennung mit Rauschadaptierung - Google Patents

Verfahren und Vorrichtung zur Spracherkennung mit Rauschadaptierung

Info

Publication number
DE69725106D1
DE69725106D1 DE69725106T DE69725106T DE69725106D1 DE 69725106 D1 DE69725106 D1 DE 69725106D1 DE 69725106 T DE69725106 T DE 69725106T DE 69725106 T DE69725106 T DE 69725106T DE 69725106 D1 DE69725106 D1 DE 69725106D1
Authority
DE
Germany
Prior art keywords
speech recognition
noise adaptation
adaptation
noise
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69725106T
Other languages
English (en)
Other versions
DE69725106T2 (de
Inventor
Yasuhiro Komori
Hiroki Yamamoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Application granted granted Critical
Publication of DE69725106D1 publication Critical patent/DE69725106D1/de
Publication of DE69725106T2 publication Critical patent/DE69725106T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • G10L15/142Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • G10L15/142Hidden Markov Models [HMMs]
    • G10L15/144Training of HMMs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
DE69725106T 1996-12-03 1997-12-02 Verfahren und Vorrichtung zur Spracherkennung mit Rauschadaptierung Expired - Fee Related DE69725106T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP8336291A JPH10161692A (ja) 1996-12-03 1996-12-03 音声認識装置及び音声認識方法
JP33629196 1996-12-03

Publications (2)

Publication Number Publication Date
DE69725106D1 true DE69725106D1 (de) 2003-10-30
DE69725106T2 DE69725106T2 (de) 2004-04-29

Family

ID=18297591

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69725106T Expired - Fee Related DE69725106T2 (de) 1996-12-03 1997-12-02 Verfahren und Vorrichtung zur Spracherkennung mit Rauschadaptierung

Country Status (4)

Country Link
US (1) US5956679A (de)
EP (1) EP0847041B1 (de)
JP (1) JPH10161692A (de)
DE (1) DE69725106T2 (de)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10254486A (ja) 1997-03-13 1998-09-25 Canon Inc 音声認識装置および方法
JP2000047696A (ja) 1998-07-29 2000-02-18 Canon Inc 情報処理方法及び装置、その記憶媒体
JP3969908B2 (ja) 1999-09-14 2007-09-05 キヤノン株式会社 音声入力端末器、音声認識装置、音声通信システム及び音声通信方法
JP2001282278A (ja) * 2000-03-31 2001-10-12 Canon Inc 音声情報処理装置及びその方法と記憶媒体
JP4632384B2 (ja) * 2000-03-31 2011-02-16 キヤノン株式会社 音声情報処理装置及びその方法と記憶媒体
JP3814459B2 (ja) 2000-03-31 2006-08-30 キヤノン株式会社 音声認識方法及び装置と記憶媒体
JP3728172B2 (ja) 2000-03-31 2005-12-21 キヤノン株式会社 音声合成方法および装置
US7039588B2 (en) * 2000-03-31 2006-05-02 Canon Kabushiki Kaisha Synthesis unit selection apparatus and method, and storage medium
JP3728177B2 (ja) * 2000-05-24 2005-12-21 キヤノン株式会社 音声処理システム、装置、方法及び記憶媒体
JP2002091478A (ja) * 2000-09-18 2002-03-27 Pioneer Electronic Corp 音声認識システム
JP4297602B2 (ja) * 2000-09-18 2009-07-15 パイオニア株式会社 音声認識システム
AU2001294222A1 (en) 2000-10-11 2002-04-22 Canon Kabushiki Kaisha Information processing device, information processing method, and storage medium
US7219058B1 (en) * 2000-10-13 2007-05-15 At&T Corp. System and method for processing speech recognition results
JP2002236494A (ja) * 2001-02-09 2002-08-23 Denso Corp 音声区間判別装置、音声認識装置、プログラム及び記録媒体
JP2002268681A (ja) * 2001-03-08 2002-09-20 Canon Inc 音声認識システム及び方法及び該システムに用いる情報処理装置とその方法
US7319954B2 (en) * 2001-03-14 2008-01-15 International Business Machines Corporation Multi-channel codebook dependent compensation
US6985858B2 (en) * 2001-03-20 2006-01-10 Microsoft Corporation Method and apparatus for removing noise from feature vectors
US20030033143A1 (en) * 2001-08-13 2003-02-13 Hagai Aronowitz Decreasing noise sensitivity in speech processing under adverse conditions
US7120580B2 (en) * 2001-08-15 2006-10-10 Sri International Method and apparatus for recognizing speech in a noisy environment
US6998068B2 (en) * 2003-08-15 2006-02-14 3M Innovative Properties Company Acene-thiophene semiconductors
US6950796B2 (en) * 2001-11-05 2005-09-27 Motorola, Inc. Speech recognition by dynamical noise model adaptation
JP3542578B2 (ja) * 2001-11-22 2004-07-14 キヤノン株式会社 音声認識装置及びその方法、プログラム
US7209881B2 (en) 2001-12-20 2007-04-24 Matsushita Electric Industrial Co., Ltd. Preparing acoustic models by sufficient statistics and noise-superimposed speech data
JP4061094B2 (ja) * 2002-03-15 2008-03-12 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声認識装置、その音声認識方法及びプログラム
JP3885002B2 (ja) * 2002-06-28 2007-02-21 キヤノン株式会社 情報処理装置およびその方法
JP4109063B2 (ja) * 2002-09-18 2008-06-25 パイオニア株式会社 音声認識装置及び音声認識方法
US20040064314A1 (en) * 2002-09-27 2004-04-01 Aubert Nicolas De Saint Methods and apparatus for speech end-point detection
JP4217495B2 (ja) * 2003-01-29 2009-02-04 キヤノン株式会社 音声認識辞書作成方法、音声認識辞書作成装置及びプログラム、記録媒体
JP4357867B2 (ja) * 2003-04-25 2009-11-04 パイオニア株式会社 音声認識装置、音声認識方法、並びに、音声認識プログラムおよびそれを記録した記録媒体
JP3836815B2 (ja) * 2003-05-21 2006-10-25 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声認識装置、音声認識方法、該音声認識方法をコンピュータに対して実行させるためのコンピュータ実行可能なプログラムおよび記憶媒体
US7109519B2 (en) * 2003-07-15 2006-09-19 3M Innovative Properties Company Bis(2-acenyl)acetylene semiconductors
US20070124143A1 (en) * 2003-10-08 2007-05-31 Koninkijkle Phillips Electronics, N.V. Adaptation of environment mismatch for speech recognition systems
JP2005249816A (ja) * 2004-03-01 2005-09-15 Internatl Business Mach Corp <Ibm> 信号強調装置、方法及びプログラム、並びに音声認識装置、方法及びプログラム
DE102004012209A1 (de) * 2004-03-12 2005-10-06 Siemens Ag Durch einen Benutzer steuerbare oder durch externe Parameter beeinflussbare Geräuschreduktion
JP4587160B2 (ja) * 2004-03-26 2010-11-24 キヤノン株式会社 信号処理装置および方法
JP4340686B2 (ja) 2004-03-31 2009-10-07 パイオニア株式会社 音声認識装置及び音声認識方法
JP4510517B2 (ja) * 2004-05-26 2010-07-28 日本電信電話株式会社 音響モデル雑音適応化方法およびこの方法を実施する装置
JP5992133B2 (ja) * 2004-10-01 2016-09-14 メルク パテント ゲーエムベーハー 有機半導体を含む電子デバイス
JP4822829B2 (ja) * 2005-12-14 2011-11-24 キヤノン株式会社 音声認識装置および方法
JP5286667B2 (ja) * 2006-02-22 2013-09-11 コニカミノルタ株式会社 映像表示装置、及び映像表示方法
JP4245617B2 (ja) * 2006-04-06 2009-03-25 株式会社東芝 特徴量補正装置、特徴量補正方法および特徴量補正プログラム
US8615393B2 (en) * 2006-11-15 2013-12-24 Microsoft Corporation Noise suppressor for speech recognition
CN101887725A (zh) * 2010-04-30 2010-11-17 中国科学院声学研究所 一种基于音素混淆网络的音素后验概率计算方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3397372B2 (ja) * 1993-06-16 2003-04-14 キヤノン株式会社 音声認識方法及び装置
JP3581401B2 (ja) * 1994-10-07 2004-10-27 キヤノン株式会社 音声認識方法
JP3453456B2 (ja) * 1995-06-19 2003-10-06 キヤノン株式会社 状態共有モデルの設計方法及び装置ならびにその状態共有モデルを用いた音声認識方法および装置

Also Published As

Publication number Publication date
DE69725106T2 (de) 2004-04-29
EP0847041A2 (de) 1998-06-10
US5956679A (en) 1999-09-21
EP0847041A3 (de) 1999-02-03
JPH10161692A (ja) 1998-06-19
EP0847041B1 (de) 2003-09-24

Similar Documents

Publication Publication Date Title
DE69725106D1 (de) Verfahren und Vorrichtung zur Spracherkennung mit Rauschadaptierung
DE69717899T2 (de) Verfahren und Vorrichtung zur Spracherkennung
DE69726235D1 (de) Verfahren und Vorrichtung zur Spracherkennung
DE59707384D1 (de) Verfahren und Vorrichtung zur Spracherkennung
DE69518705D1 (de) Verfahren und Vorrichtung zur Spracherkennung
DE69524829T2 (de) Verfahren und Vorrichtung zur Spracherkennung
DE69923253D1 (de) Verfahren und Vorrichtung zur Spracherkennung
DE69828141D1 (de) Verfahren und Vorrichtung zur Spracherkennung
DE69806557T2 (de) Verfahren und Vorrichtung zur Spracherkennung
DE69531710D1 (de) Verfahren und Vorrichtung zur Verminderung von Rauschen bei Sprachsignalen
DE69727895D1 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69519840T2 (de) Einrichtung und Verfahren zur Spracherkennung
DE69707876D1 (de) Verfahren und vorrichtung fuer dynamisch eingestelltes training zur spracherkennung
DE69730930D1 (de) Verfahren und Gerät zur Zeichenerkennung
DE69830017D1 (de) Verfahren und Vorrichtung zur Spracherkennung
DE69625950D1 (de) Verfahren und Vorrichtung zur Spracherkennung und Übersetzungssystem
DE69324629D1 (de) Verfahren und Vorrichtung zur Spracherkennung
DE69631728D1 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69428475T2 (de) Verfahren und Gerät zur automatischen Spracherkennung
DE69732156D1 (de) Verfahren und Gerät zur Zeichenerkennung
DE69715071D1 (de) Verfahren und Vorrichtung zur Sprachverarbeitung
DE69618408T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE69517829D1 (de) Vorrichtung und Verfahren zur Spracherkennung
DE69715281D1 (de) Verfahren und Vorrichtung zur Spracherkennung
DE69620304T2 (de) Vorrichtung und Verfahren zur Spracherkennung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee