DE19920501A1 - Wiedergabeverfahren für sprachgesteuerte Systeme mit textbasierter Sprachsynthese - Google Patents
Wiedergabeverfahren für sprachgesteuerte Systeme mit textbasierter SprachsyntheseInfo
- Publication number
- DE19920501A1 DE19920501A1 DE19920501A DE19920501A DE19920501A1 DE 19920501 A1 DE19920501 A1 DE 19920501A1 DE 19920501 A DE19920501 A DE 19920501A DE 19920501 A DE19920501 A DE 19920501A DE 19920501 A1 DE19920501 A1 DE 19920501A1
- Authority
- DE
- Germany
- Prior art keywords
- speech
- character string
- variant
- converted
- speech input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000015572 biosynthetic process Effects 0.000 title claims description 29
- 238000003786 synthesis reaction Methods 0.000 title claims description 28
- 230000011218 segmentation Effects 0.000 claims description 18
- 238000013459 approach Methods 0.000 claims description 8
- 230000001755 vocal effect Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000009877 rendering Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000005309 stochastic process Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
Priority Applications (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE19920501A DE19920501A1 (de) | 1999-05-05 | 1999-05-05 | Wiedergabeverfahren für sprachgesteuerte Systeme mit textbasierter Sprachsynthese |
| EP00108486A EP1058235B1 (de) | 1999-05-05 | 2000-04-19 | Wiedergabeverfahren für sprachgesteuerte Systeme mit text-basierter Sprachsynthese |
| AT00108486T ATE253762T1 (de) | 1999-05-05 | 2000-04-19 | Wiedergabeverfahren für sprachgesteuerte systeme mit text-basierter sprachsynthese |
| DE50004296T DE50004296D1 (de) | 1999-05-05 | 2000-04-19 | Wiedergabeverfahren für sprachgesteuerte Systeme mit text-basierter Sprachsynthese |
| JP2000132902A JP4602511B2 (ja) | 1999-05-05 | 2000-04-27 | テキスト・ベースの音声合成を利用した音声制御システム用の再生方法 |
| US09/564,787 US6546369B1 (en) | 1999-05-05 | 2000-05-05 | Text-based speech synthesis method containing synthetic speech comparisons and updates |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE19920501A DE19920501A1 (de) | 1999-05-05 | 1999-05-05 | Wiedergabeverfahren für sprachgesteuerte Systeme mit textbasierter Sprachsynthese |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE19920501A1 true DE19920501A1 (de) | 2000-11-09 |
Family
ID=7906935
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE19920501A Withdrawn DE19920501A1 (de) | 1999-05-05 | 1999-05-05 | Wiedergabeverfahren für sprachgesteuerte Systeme mit textbasierter Sprachsynthese |
| DE50004296T Expired - Lifetime DE50004296D1 (de) | 1999-05-05 | 2000-04-19 | Wiedergabeverfahren für sprachgesteuerte Systeme mit text-basierter Sprachsynthese |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE50004296T Expired - Lifetime DE50004296D1 (de) | 1999-05-05 | 2000-04-19 | Wiedergabeverfahren für sprachgesteuerte Systeme mit text-basierter Sprachsynthese |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US6546369B1 (cg-RX-API-DMAC7.html) |
| EP (1) | EP1058235B1 (cg-RX-API-DMAC7.html) |
| JP (1) | JP4602511B2 (cg-RX-API-DMAC7.html) |
| AT (1) | ATE253762T1 (cg-RX-API-DMAC7.html) |
| DE (2) | DE19920501A1 (cg-RX-API-DMAC7.html) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE10253786A1 (de) * | 2002-11-19 | 2004-06-17 | Detmar Schäfer | Verfahren zur rechnergestützten Ermittlung einer Ähnlichkeit eines elektronisch erfassten ersten Kennzeichens zu mindestens einem elektronisch erfassten zweiten Kennzeichen sowie Vorrichtung und Computerprogramm zur Durchführung desselben |
| WO2007007256A1 (en) * | 2005-07-12 | 2007-01-18 | Nokia Corporation | Correcting a pronunciation of a synthetically generated speech object |
Families Citing this family (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4759827B2 (ja) * | 2001-03-28 | 2011-08-31 | 日本電気株式会社 | 音声セグメンテーション装置及びその方法並びにその制御プログラム |
| US7107215B2 (en) * | 2001-04-16 | 2006-09-12 | Sakhr Software Company | Determining a compact model to transcribe the arabic language acoustically in a well defined basic phonetic study |
| AT6920U1 (de) | 2002-02-14 | 2004-05-25 | Sail Labs Technology Ag | Verfahren zur erzeugung natürlicher sprache in computer-dialogsystemen |
| EP1475611B1 (en) * | 2003-05-07 | 2007-07-11 | Harman/Becker Automotive Systems GmbH | Method and application apparatus for outputting speech, data carrier comprising speech data |
| DE602004018385D1 (de) * | 2003-11-05 | 2009-01-22 | Philips Intellectual Property | Fehlerdetektion für sprach-zu-text-transkriptionssysteme |
| JP2006047866A (ja) * | 2004-08-06 | 2006-02-16 | Canon Inc | 電子辞書装置およびその制御方法 |
| US20060136195A1 (en) * | 2004-12-22 | 2006-06-22 | International Business Machines Corporation | Text grouping for disambiguation in a speech application |
| JP4385949B2 (ja) * | 2005-01-11 | 2009-12-16 | トヨタ自動車株式会社 | 車載チャットシステム |
| US20070129945A1 (en) * | 2005-12-06 | 2007-06-07 | Ma Changxue C | Voice quality control for high quality speech reconstruction |
| US8504365B2 (en) * | 2008-04-11 | 2013-08-06 | At&T Intellectual Property I, L.P. | System and method for detecting synthetic speaker verification |
| US8494854B2 (en) * | 2008-06-23 | 2013-07-23 | John Nicholas and Kristin Gross | CAPTCHA using challenges optimized for distinguishing between humans and machines |
| US8752141B2 (en) | 2008-06-27 | 2014-06-10 | John Nicholas | Methods for presenting and determining the efficacy of progressive pictorial and motion-based CAPTCHAs |
| US9564120B2 (en) * | 2010-05-14 | 2017-02-07 | General Motors Llc | Speech adaptation in speech synthesis |
| KR20170044849A (ko) * | 2015-10-16 | 2017-04-26 | 삼성전자주식회사 | 전자 장치 및 다국어/다화자의 공통 음향 데이터 셋을 활용하는 tts 변환 방법 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE2435654A1 (de) * | 1974-07-24 | 1976-02-05 | Gretag Ag | Verfahren und vorrichtung zur analyse und synthese von menschlicher sprache |
| EP0137532A2 (en) * | 1983-08-26 | 1985-04-17 | Koninklijke Philips Electronics N.V. | Multi-pulse excited linear predictive speech coder |
| US5293449A (en) * | 1990-11-23 | 1994-03-08 | Comsat Corporation | Analysis-by-synthesis 2,4 kbps linear predictive speech codec |
| EP0666558A2 (en) * | 1994-02-08 | 1995-08-09 | Nokia Mobile Phones Ltd. | Parametric speech coding |
| DE69311303T2 (de) * | 1992-11-04 | 1997-10-30 | Secr Defence Brit | Sprachtrainingshilfe für kinder. |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5029200A (en) * | 1989-05-02 | 1991-07-02 | At&T Bell Laboratories | Voice message system using synthetic speech |
| US6005549A (en) * | 1995-07-24 | 1999-12-21 | Forest; Donald K. | User interface method and apparatus |
| US5913193A (en) * | 1996-04-30 | 1999-06-15 | Microsoft Corporation | Method and system of runtime acoustic unit selection for speech synthesis |
| JPH10153998A (ja) * | 1996-09-24 | 1998-06-09 | Nippon Telegr & Teleph Corp <Ntt> | 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置 |
| US6163769A (en) * | 1997-10-02 | 2000-12-19 | Microsoft Corporation | Text-to-speech using clustered context-dependent phoneme-based units |
| US6081780A (en) * | 1998-04-28 | 2000-06-27 | International Business Machines Corporation | TTS and prosody based authoring system |
| US6173263B1 (en) * | 1998-08-31 | 2001-01-09 | At&T Corp. | Method and system for performing concatenative speech synthesis using half-phonemes |
| US6266638B1 (en) * | 1999-03-30 | 2001-07-24 | At&T Corp | Voice quality compensation system for speech synthesis based on unit-selection speech database |
-
1999
- 1999-05-05 DE DE19920501A patent/DE19920501A1/de not_active Withdrawn
-
2000
- 2000-04-19 AT AT00108486T patent/ATE253762T1/de not_active IP Right Cessation
- 2000-04-19 EP EP00108486A patent/EP1058235B1/de not_active Expired - Lifetime
- 2000-04-19 DE DE50004296T patent/DE50004296D1/de not_active Expired - Lifetime
- 2000-04-27 JP JP2000132902A patent/JP4602511B2/ja not_active Expired - Fee Related
- 2000-05-05 US US09/564,787 patent/US6546369B1/en not_active Expired - Lifetime
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE2435654A1 (de) * | 1974-07-24 | 1976-02-05 | Gretag Ag | Verfahren und vorrichtung zur analyse und synthese von menschlicher sprache |
| EP0137532A2 (en) * | 1983-08-26 | 1985-04-17 | Koninklijke Philips Electronics N.V. | Multi-pulse excited linear predictive speech coder |
| US5293449A (en) * | 1990-11-23 | 1994-03-08 | Comsat Corporation | Analysis-by-synthesis 2,4 kbps linear predictive speech codec |
| DE69311303T2 (de) * | 1992-11-04 | 1997-10-30 | Secr Defence Brit | Sprachtrainingshilfe für kinder. |
| EP0666558A2 (en) * | 1994-02-08 | 1995-08-09 | Nokia Mobile Phones Ltd. | Parametric speech coding |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE10253786A1 (de) * | 2002-11-19 | 2004-06-17 | Detmar Schäfer | Verfahren zur rechnergestützten Ermittlung einer Ähnlichkeit eines elektronisch erfassten ersten Kennzeichens zu mindestens einem elektronisch erfassten zweiten Kennzeichen sowie Vorrichtung und Computerprogramm zur Durchführung desselben |
| DE10253786B4 (de) * | 2002-11-19 | 2009-08-06 | Anwaltssozietät BOEHMERT & BOEHMERT GbR (vertretungsberechtigter Gesellschafter: Dr. Carl-Richard Haarmann, 28209 Bremen) | Verfahren zur rechnergestützten Ermittlung einer Ähnlichkeit eines elektronisch erfassten ersten Kennzeichens zu mindestens einem elektronisch erfassten zweiten Kennzeichen sowie Vorrichtung und Computerprogramm zur Durchführung desselben |
| WO2007007256A1 (en) * | 2005-07-12 | 2007-01-18 | Nokia Corporation | Correcting a pronunciation of a synthetically generated speech object |
Also Published As
| Publication number | Publication date |
|---|---|
| US6546369B1 (en) | 2003-04-08 |
| EP1058235A2 (de) | 2000-12-06 |
| EP1058235A3 (de) | 2003-02-05 |
| EP1058235B1 (de) | 2003-11-05 |
| DE50004296D1 (de) | 2003-12-11 |
| ATE253762T1 (de) | 2003-11-15 |
| JP4602511B2 (ja) | 2010-12-22 |
| JP2000347681A (ja) | 2000-12-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69311303T2 (de) | Sprachtrainingshilfe für kinder. | |
| DE60111329T2 (de) | Anpassung des phonetischen Kontextes zur Verbesserung der Spracherkennung | |
| EP1466317B1 (de) | Betriebsverfahren eines automatischen spracherkenners zur sprecherunabhängigen spracherkennung von worten aus verschiedenen sprachen und automatischer spracherkenner | |
| DE69514382T2 (de) | Spracherkennung | |
| DE602004012909T2 (de) | Verfahren und Vorrichtung zur Modellierung eines Spracherkennungssystems und zur Schätzung einer Wort-Fehlerrate basierend auf einem Text | |
| DE60000138T2 (de) | Erzeugung von mehreren Aussprachen eines Eigennames für die Spracherkennung | |
| DE3337353C2 (de) | Sprachanalysator auf der Grundlage eines verborgenen Markov-Modells | |
| DE69719270T2 (de) | Sprachsynthese unter Verwendung von Hilfsinformationen | |
| DE69712277T2 (de) | Verfahren und vorrichtung zur automatischen sprachsegmentierung in phonemartigen einheiten | |
| DE69324428T2 (de) | Verfahren zur Sprachformung und Gerät zur Spracherkennung | |
| DE3876207T2 (de) | Spracherkennungssystem unter verwendung von markov-modellen. | |
| DE69807765T2 (de) | Kombination von Frequenzverzerrung und spektraler Formung in einem HMM - basierten Spracherkenner | |
| EP1058235B1 (de) | Wiedergabeverfahren für sprachgesteuerte Systeme mit text-basierter Sprachsynthese | |
| EP0925578B1 (de) | Sprachverarbeitungssystem und verfahren zur sprachverarbeitung | |
| DE19942178C1 (de) | Verfahren zum Aufbereiten einer Datenbank für die automatische Sprachverarbeitung | |
| EP1264301B1 (de) | Verfahren zur erkennung von sprachäusserungen nicht-muttersprachlicher sprecher in einem sprachverarbeitungssystem | |
| DE60018696T2 (de) | Robuste sprachverarbeitung von verrauschten sprachmodellen | |
| EP3010014A1 (de) | Verfahren zur interpretation von automatischer spracherkennung | |
| EP1282897B1 (de) | Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems | |
| DE10040063A1 (de) | Verfahren zur Zuordnung von Phonemen | |
| DE102010040553A1 (de) | Spracherkennungsverfahren | |
| EP1435087B1 (de) | Verfahren zur erzeugung von sprachbausteine beschreibenden referenzsegmenten und verfahren zur modellierung von spracheinheiten eines gesprochenen testmusters | |
| DE112006000322T5 (de) | Audioerkennungssystem zur Erzeugung von Antwort-Audio unter Verwendung extrahierter Audiodaten | |
| DE4111781A1 (de) | Computersystem zur spracherkennung | |
| DE69908034T2 (de) | Minimierung eines Suchnetzwerks für die Spracherkennung |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| OM8 | Search report available as to paragraph 43 lit. 1 sentence 1 patent law | ||
| 8128 | New person/name/address of the agent |
Representative=s name: BECKER, KURIG, STRAUS, 80336 MUENCHEN |
|
| 8141 | Disposal/no request for examination |