DE602004000716D1 - Rauschadaptierungssystem für ein Sprachmodell, Verfahren zur Rauschadaptierung und Programm zur Rauschadaptierung für Spracherkennung - Google Patents

Rauschadaptierungssystem für ein Sprachmodell, Verfahren zur Rauschadaptierung und Programm zur Rauschadaptierung für Spracherkennung

Info

Publication number
DE602004000716D1
DE602004000716D1 DE602004000716T DE602004000716T DE602004000716D1 DE 602004000716 D1 DE602004000716 D1 DE 602004000716D1 DE 602004000716 T DE602004000716 T DE 602004000716T DE 602004000716 T DE602004000716 T DE 602004000716T DE 602004000716 D1 DE602004000716 D1 DE 602004000716D1
Authority
DE
Germany
Prior art keywords
noise adaptation
program
speech
noise
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE602004000716T
Other languages
English (en)
Other versions
DE602004000716T2 (de
Inventor
Zhipeng Zhang
Kiyotaka Otsuji
Toshiaki Sugimura
Sadaoki Furui
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Publication of DE602004000716D1 publication Critical patent/DE602004000716D1/de
Application granted granted Critical
Publication of DE602004000716T2 publication Critical patent/DE602004000716T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Machine Translation (AREA)
DE602004000716T 2003-03-12 2004-03-04 Rauschadaptierungssystem für ein Sprachmodell, Verfahren zur Rauschadaptierung und Programm zur Rauschadaptierung für Spracherkennung Expired - Lifetime DE602004000716T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003066933A JP4033299B2 (ja) 2003-03-12 2003-03-12 音声モデルの雑音適応化システム、雑音適応化方法、及び、音声認識雑音適応化プログラム
JP2003066933 2003-03-12

Publications (2)

Publication Number Publication Date
DE602004000716D1 true DE602004000716D1 (de) 2006-06-01
DE602004000716T2 DE602004000716T2 (de) 2007-05-03

Family

ID=32767942

Family Applications (1)

Application Number Title Priority Date Filing Date
DE602004000716T Expired - Lifetime DE602004000716T2 (de) 2003-03-12 2004-03-04 Rauschadaptierungssystem für ein Sprachmodell, Verfahren zur Rauschadaptierung und Programm zur Rauschadaptierung für Spracherkennung

Country Status (5)

Country Link
US (1) US7552049B2 (de)
EP (1) EP1457968B1 (de)
JP (1) JP4033299B2 (de)
CN (1) CN1234110C (de)
DE (1) DE602004000716T2 (de)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4548646B2 (ja) * 2003-09-12 2010-09-22 株式会社エヌ・ティ・ティ・ドコモ 音声モデルの雑音適応化システム、雑音適応化方法、及び、音声認識雑音適応化プログラム
JP2006171096A (ja) * 2004-12-13 2006-06-29 Ntt Docomo Inc 連続入力音声認識装置および連続入力音声認識方法
US8175877B2 (en) * 2005-02-02 2012-05-08 At&T Intellectual Property Ii, L.P. Method and apparatus for predicting word accuracy in automatic speech recognition systems
US7729908B2 (en) * 2005-03-04 2010-06-01 Panasonic Corporation Joint signal and model based noise matching noise robustness method for automatic speech recognition
GB2451371B (en) * 2006-04-17 2011-02-23 Vovision Llc Method and systems for correcting transcribed audio files
CN101416237B (zh) * 2006-05-01 2012-05-30 日本电信电话株式会社 基于源和室内声学的概率模型的语音去混响方法和设备
US20080300875A1 (en) * 2007-06-04 2008-12-04 Texas Instruments Incorporated Efficient Speech Recognition with Cluster Methods
JP4950930B2 (ja) * 2008-04-03 2012-06-13 株式会社東芝 音声/非音声を判定する装置、方法およびプログラム
KR101047104B1 (ko) 2009-03-26 2011-07-07 고려대학교 산학협력단 최대 우도 선형 스펙트럴 변환을 이용한 음향 모델 적응 방법 및 그 장치, 잡음 음성 모델을 이용한 음성 인식 방법및 그 장치
CN102237082B (zh) * 2010-05-05 2015-04-01 三星电子株式会社 语音识别系统的自适应方法
CN102280106A (zh) * 2010-06-12 2011-12-14 三星电子株式会社 用于移动通信终端的语音网络搜索方法及其装置
JP6024180B2 (ja) * 2012-04-27 2016-11-09 富士通株式会社 音声認識装置、音声認識方法、及びプログラム
CN103077708B (zh) * 2012-12-27 2015-04-01 安徽科大讯飞信息科技股份有限公司 一种语音识别系统中拒识能力提升方法
CN104143329B (zh) * 2013-08-19 2015-10-21 腾讯科技(深圳)有限公司 进行语音关键词检索的方法及装置
GB2546981B (en) * 2016-02-02 2019-06-19 Toshiba Res Europe Limited Noise compensation in speaker-adaptive systems
CN106409289B (zh) * 2016-09-23 2019-06-28 合肥美的智能科技有限公司 语音识别的环境自适应方法、语音识别装置和家用电器
CN109087659A (zh) * 2018-08-03 2018-12-25 三星电子(中国)研发中心 音频优化方法及设备
CN108933703B (zh) * 2018-08-14 2020-06-02 西安交通大学 基于误差建模的环境自适应感知无线通信信道估计方法
CN112201270B (zh) * 2020-10-26 2023-05-23 平安科技(深圳)有限公司 语音噪声的处理方法、装置、计算机设备及存储介质
CN112348068A (zh) * 2020-10-28 2021-02-09 东南大学 一种基于降噪编码器和注意力机制的时序数据聚类方法
CN112652304B (zh) * 2020-12-02 2022-02-01 北京百度网讯科技有限公司 智能设备的语音交互方法、装置和电子设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5860062A (en) * 1996-06-21 1999-01-12 Matsushita Electric Industrial Co., Ltd. Speech recognition apparatus and speech recognition method
US6026359A (en) * 1996-09-20 2000-02-15 Nippon Telegraph And Telephone Corporation Scheme for model adaptation in pattern recognition based on Taylor expansion
US6182270B1 (en) * 1996-12-04 2001-01-30 Lucent Technologies Inc. Low-displacement rank preconditioners for simplified non-linear analysis of circuits and other devices
US5960397A (en) * 1997-05-27 1999-09-28 At&T Corp System and method of recognizing an acoustic environment to adapt a set of based recognition models to the current acoustic environment for subsequent speech recognition
US6529872B1 (en) * 2000-04-18 2003-03-04 Matsushita Electric Industrial Co., Ltd. Method for noise adaptation in automatic speech recognition using transformed matrices
US7089183B2 (en) * 2000-08-02 2006-08-08 Texas Instruments Incorporated Accumulating transformations for hierarchical linear regression HMM adaptation
JP4109063B2 (ja) * 2002-09-18 2008-06-25 パイオニア株式会社 音声認識装置及び音声認識方法
US7457745B2 (en) * 2002-12-03 2008-11-25 Hrl Laboratories, Llc Method and apparatus for fast on-line automatic speaker/environment adaptation for speech/speaker recognition in the presence of changing environments
JP4548646B2 (ja) * 2003-09-12 2010-09-22 株式会社エヌ・ティ・ティ・ドコモ 音声モデルの雑音適応化システム、雑音適応化方法、及び、音声認識雑音適応化プログラム

Also Published As

Publication number Publication date
JP4033299B2 (ja) 2008-01-16
CN1542737A (zh) 2004-11-03
EP1457968A1 (de) 2004-09-15
EP1457968B1 (de) 2006-04-26
US20040204937A1 (en) 2004-10-14
US7552049B2 (en) 2009-06-23
DE602004000716T2 (de) 2007-05-03
JP2004279466A (ja) 2004-10-07
CN1234110C (zh) 2005-12-28

Similar Documents

Publication Publication Date Title
DE602004000716D1 (de) Rauschadaptierungssystem für ein Sprachmodell, Verfahren zur Rauschadaptierung und Programm zur Rauschadaptierung für Spracherkennung
DE602004028322D1 (de) System und Verfahren zur Meta-datenabhängigen Sprachmodellierung für automatische Spracherkennung
DE502005007894D1 (de) Anti-kollisionssystem für ein fahrzeug sowie hierauf bezogenes verfahren
DE60213195D1 (de) Verfahren, System und Computer Programm zur Sprach-/Sprechererkennung unter Verwendung einer Emotionszustandsänderung für die unüberwachte Anpassung des Erkennungsverfahren
DE60309822D1 (de) Verfahren und Vorrichtung zur Spracherkennung
DE602005000628D1 (de) Verfahren und Vorrichtung für die mehrschichtige verteilte Spracherkennung
DE602004000382D1 (de) Rauschadaptierung zur Spracherkennung
DE602004012470D1 (de) System und Verfahren zur Dienstinteraktion für einen Anwender
DE60316912D1 (de) Verfahren zur Spracherkennung
DE602006021755D1 (de) System und verfahren zur erkennung einer änderung
DE602004006190T8 (de) Vorrichtung, Verfahren und Programm zur Gestenerkennung
DE60315947D1 (de) Verfahren zur Sprachmodellierung
DE602004022130D1 (de) Verfahren zur Zeichenerkennung
DE602004023364D1 (de) Vorrichtung und Verfahren zur Spracherkennung
DE50303232D1 (de) Verfahren zur ansteuerung eines zweistufigen gurtstraffers
DE602004016508D1 (de) Kautschukbahn und verfahren zur herstellung von kernmetall für kautschukbahn
DE60317451D1 (de) Verfahren und Vorrichtung für ein Fahrzeugstabilitäts- Verbesserungssystem
DE60208867D1 (de) Ventil und ein Verfahren zu dessen Herstellung
DE602004028008D1 (de) Verfahren zur statistischen sprachmodellierung bei der spracherkennung
DE602005021357D1 (de) Vorrichtung und verfahren zur herstellung einer siebeinheit für eine siebanordnung
DE60322160D1 (de) Steuerungseinrichtung zur Differentialbegrenzung für ein Fahrzeug und Verfahren dafür
DE60212725D1 (de) Verfahren zur automatischen spracherkennung
DE602004014675D1 (de) Verfahren und Vorrichtung zur Spracherkennung
DE602004015189D1 (de) Vorrichtung und Verfahren für Spracherkennung mit Modellen, die an die aktuellen Geräuschbedingungen adaptiert werden
DE502005000775D1 (de) Verfahren zur Sprecheradaption für ein Hidden-Markov-Modell basiertes Spracherkennungssystem

Legal Events

Date Code Title Description
8364 No opposition during term of opposition