ES2179624T3 - Procedimiento y dispositivo para aumentar la probabilidad de reconocimiento de los sistemas de reconocimiento de voz. - Google Patents

Procedimiento y dispositivo para aumentar la probabilidad de reconocimiento de los sistemas de reconocimiento de voz.

Info

Publication number
ES2179624T3
ES2179624T3 ES99908743T ES99908743T ES2179624T3 ES 2179624 T3 ES2179624 T3 ES 2179624T3 ES 99908743 T ES99908743 T ES 99908743T ES 99908743 T ES99908743 T ES 99908743T ES 2179624 T3 ES2179624 T3 ES 2179624T3
Authority
ES
Spain
Prior art keywords
recognition
likelihood
procedure
increasing
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES99908743T
Other languages
English (en)
Inventor
Ulrich Kauschke
Herbert Roland Rast
Fred Runge
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deutsche Telekom AG
Telekom Deutschland GmbH
Original Assignee
Deutsche Telekom AG
T Mobile Deutschland GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deutsche Telekom AG, T Mobile Deutschland GmbH filed Critical Deutsche Telekom AG
Application granted granted Critical
Publication of ES2179624T3 publication Critical patent/ES2179624T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0635Training updating or merging of old and new templates; Mean values; Weighting

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Radio Relay Systems (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)
  • Machine Translation (AREA)

Abstract

Procedimiento para incrementar la probabilidad de reconocimiento de los sistemas de reconocimiento de voz, en el que tras la introducción de un concepto que se trata de reconocer, tiene lugar un entrenamiento posterior del concepto similar ya registrado, sirviéndose del concepto introducido, caracterizado por a) la introducción del concepto que se trata de reconocer; b) la comparación del concepto introducido con los conceptos ya registrados en el sistema de reconocimiento de voz; c) en el caso de que el concepto haya sido reconocido unívocamente: c.1) la ejecución de la acción deseada; c.2) el entrenamiento posterior del correspondiente concepto registrado en el sistema de reconocimiento de voz, con el concepto introducido inicialmente, y c.3) la conclusión del proceso; d) en el caso de que la comparación ofrezca una probabilidad parecida y poco diferenciada del reconocimiento para varios de los conceptos ya registrados: d.1) la información al usuario del sistema e indicación y presentación a éste de otros conceptos parecidos al concepto introducido, d.2) la petición al usuario del sistema para que introduzca otra vez el concepto introducido inicialmente, e) continuación con el paso b) del proceso.
ES99908743T 1998-02-03 1999-01-20 Procedimiento y dispositivo para aumentar la probabilidad de reconocimiento de los sistemas de reconocimiento de voz. Expired - Lifetime ES2179624T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19804047A DE19804047C2 (de) 1998-02-03 1998-02-03 Verfahren und Einrichtung zur Erhöhung der Erkennungswahrscheinlichkeit von Spracherkennungssystemen

Publications (1)

Publication Number Publication Date
ES2179624T3 true ES2179624T3 (es) 2003-01-16

Family

ID=7856410

Family Applications (1)

Application Number Title Priority Date Filing Date
ES99908743T Expired - Lifetime ES2179624T3 (es) 1998-02-03 1999-01-20 Procedimiento y dispositivo para aumentar la probabilidad de reconocimiento de los sistemas de reconocimiento de voz.

Country Status (9)

Country Link
US (1) US6801890B1 (es)
EP (1) EP1051702B1 (es)
JP (1) JP2002502992A (es)
AT (1) ATE217437T1 (es)
CZ (1) CZ297095B6 (es)
DE (2) DE19804047C2 (es)
ES (1) ES2179624T3 (es)
PL (1) PL342208A1 (es)
WO (1) WO1999040570A1 (es)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9822931D0 (en) 1998-10-20 1998-12-16 Canon Kk Speech processing apparatus and method
DE19933323C2 (de) * 1999-07-16 2003-05-22 Bayerische Motoren Werke Ag Spracherkennungssystem und Verfahren zur Spracherkennung vorgegebener Sprachmuster, insbesondere zur Sprachsteuerung von Kraftfahrzeugsystemen
US20060009974A1 (en) * 2004-07-09 2006-01-12 Matsushita Electric Industrial Co., Ltd. Hands-free voice dialing for portable and remote devices
US8787535B2 (en) 2008-01-30 2014-07-22 At&T Intellectual Property I, L.P. Caller authentication system
US8417526B2 (en) * 2009-03-13 2013-04-09 Adacel, Inc. Speech recognition learning system and method

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3548202A (en) * 1968-11-29 1970-12-15 Ibm Adaptive logic system for unsupervised learning
US4087630A (en) * 1977-05-12 1978-05-02 Centigram Corporation Continuous speech recognition apparatus
US4489434A (en) * 1981-10-05 1984-12-18 Exxon Corporation Speech recognition method and apparatus
US4489435A (en) * 1981-10-05 1984-12-18 Exxon Corporation Method and apparatus for continuous word string recognition
JPS58178396A (ja) * 1982-04-12 1983-10-19 株式会社日立製作所 音声認識用標準パタ−ン登録方式
JPS59109099A (ja) * 1982-12-14 1984-06-23 三菱自動車工業株式会社 登録型音声認識装置
JPS61148497A (ja) * 1984-12-21 1986-07-07 松下電器産業株式会社 標準パタン作成装置
CA1311059C (en) * 1986-03-25 1992-12-01 Bruce Allen Dautrich Speaker-trained speech recognizer having the capability of detecting confusingly similar vocabulary words
JPS62260194A (ja) * 1986-05-06 1987-11-12 株式会社リコー 特定話者認識装置の辞書登録方法
JPH02198499A (ja) * 1989-01-27 1990-08-06 Ricoh Co Ltd 音声認識装置の辞書の自動更新システム
US5040213A (en) * 1989-01-27 1991-08-13 Ricoh Company, Ltd. Method of renewing reference pattern stored in dictionary
JPH02265000A (ja) * 1989-04-06 1990-10-29 Canon Inc 音声対話装置
JPH0310298A (ja) * 1989-06-08 1991-01-17 Oki Electric Ind Co Ltd 音声認識装置
JP2543603B2 (ja) * 1989-11-16 1996-10-16 積水化学工業株式会社 単語認識システム
US5329609A (en) * 1990-07-31 1994-07-12 Fujitsu Limited Recognition apparatus with function of displaying plural recognition candidates
DE4024890A1 (de) * 1990-08-06 1992-02-13 Standard Elektrik Lorenz Ag Anpassung von referenzsprachmustern an umgebungsbedingte aussprachevarianten
JP2975772B2 (ja) * 1992-06-30 1999-11-10 三洋電機株式会社 音声認識装置
WO1995009416A1 (en) * 1993-09-30 1995-04-06 Apple Computer, Inc. Continuous reference adaptation in a pattern recognition system
JP3267047B2 (ja) * 1994-04-25 2002-03-18 株式会社日立製作所 音声による情報処理装置
US5749066A (en) * 1995-04-24 1998-05-05 Ericsson Messaging Systems Inc. Method and apparatus for developing a neural network for phoneme recognition
US6044343A (en) * 1997-06-27 2000-03-28 Advanced Micro Devices, Inc. Adaptive speech recognition with selective input data to a speech classifier
US6347297B1 (en) * 1998-10-05 2002-02-12 Legerity, Inc. Matrix quantization with vector quantization error compensation and neural network postprocessing for robust speech recognition
US6178404B1 (en) * 1999-07-23 2001-01-23 Intervoice Limited Partnership System and method to facilitate speech enabled user interfaces by prompting with possible transaction phrases

Also Published As

Publication number Publication date
CZ20002854A3 (en) 2001-05-16
US6801890B1 (en) 2004-10-05
PL342208A1 (en) 2001-05-21
DE19804047C2 (de) 2000-03-16
DE59901392D1 (de) 2002-06-13
EP1051702A1 (de) 2000-11-15
ATE217437T1 (de) 2002-05-15
JP2002502992A (ja) 2002-01-29
WO1999040570A1 (de) 1999-08-12
CZ297095B6 (cs) 2006-09-13
DE19804047A1 (de) 1999-08-05
EP1051702B1 (de) 2002-05-08

Similar Documents

Publication Publication Date Title
DE69822179D1 (de) Verfahren zum lernen von mustern für die sprach- oder die sprechererkennung
ATE349751T1 (de) System und verfahren zur spracherkennung mit einer vielzahl von spracherkennungsvorrichtungen
ATE297588T1 (de) Anpassung des phonetischen kontextes zur verbesserung der spracherkennung
ATE410768T1 (de) System und verfahren zum betrieb eines spracherkennungssystems in einem fahrzeug
ATE407420T1 (de) Verteiltes spracherkennungssystem unter verwendung von akustischer merkmalsvektor- modifizierung
ATE314718T1 (de) Srecherangepasste spracherkennung
IL132449A (en) Speech recognition method and system using compressed speech data
MX9505299A (es) Sistemas, metodos y articulos de fabricacion para realizar la hipotesizacion de n-cadenas optimas de alta resolucion.
NO20024187D0 (no) Fremgangsmåte og system for navigering under vann
ATE344959T1 (de) Kombination von digitaler zeitverschiebung und hmm in sprecherabhängiger- und sprecherunabhängiger weise für die spracherkennung
DE60026637D1 (de) Verfahren zur Erweiterung des Wortschatzes eines Spracherkennungssystems
WO2001031627A3 (en) Pattern matching method and apparatus
ATE531033T1 (de) System und verfahren zur verteilung einer spracherkennungsgrammatik
WO2003019528A1 (fr) Procede de production d'intonation, dispositif de synthese de signaux vocaux fonctionnant selon ledit procede et serveur vocal
EP0834862A3 (en) Method of key-phrase detection and verification for flexible speech understanding
ATE435481T1 (de) Verfahren und vorrichtung zur geräuschunterdrückung
DE60004331D1 (de) Sprecher-erkennung
DE602005009091D1 (de) Erzeugen einer Spracherkennungsgrammatik für alphanumerische Ausdrücke
IT1279171B1 (it) Sistema di riconoscimento di parlato continuo
ATE253763T1 (de) Verfahren zur spracherkennung
ATE355588T1 (de) Pausendetektion für die spracherkennung
ES2179624T3 (es) Procedimiento y dispositivo para aumentar la probabilidad de reconocimiento de los sistemas de reconocimiento de voz.
DK0852867T3 (da) Fremgangsmåde og system til hurtigt at generere og transmittere en tegnsekvens ved hjælp af talefrekvenser
DE50302214D1 (de) Blickrichtungsdetektion mittels Mikrophon
DE50003680D1 (de) Verfahren zur sprachgesteuerten identifizierung des nutzers eines telekommunikationsanschlusses im telekommunikationsnetz beim dialog mit einem sprachgesteuerten dialogsystem