DE10117367A1 - Verfahren und System zur automatischen Umsetzung von Text-Nachrichten in Sprach-Nachrichten - Google Patents

Verfahren und System zur automatischen Umsetzung von Text-Nachrichten in Sprach-Nachrichten

Info

Publication number
DE10117367A1
DE10117367A1 DE10117367A DE10117367A DE10117367A1 DE 10117367 A1 DE10117367 A1 DE 10117367A1 DE 10117367 A DE10117367 A DE 10117367A DE 10117367 A DE10117367 A DE 10117367A DE 10117367 A1 DE10117367 A1 DE 10117367A1
Authority
DE
Germany
Prior art keywords
speech
voice
text
messages
profile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE10117367A
Other languages
English (en)
Other versions
DE10117367B4 (de
Inventor
Volger Luegger
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unify GmbH and Co KG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE10117367A priority Critical patent/DE10117367B4/de
Priority to EP02003909A priority patent/EP1248251A3/de
Priority to US10/117,291 priority patent/US20020169610A1/en
Publication of DE10117367A1 publication Critical patent/DE10117367A1/de
Application granted granted Critical
Publication of DE10117367B4 publication Critical patent/DE10117367B4/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)

Abstract

Die vorliegende Erfindung bezieht sich auf ein Verfahren sowie ein System, das beliebige geschriebene maschinenlesbare Text-Nachrichten (5), beispielsweise E-Mails oder Fax-Nachrichten, über ein geeignetes akustisches Wiedergabesystem (2), (4), (7), beispielsweise über ein Mobiltelephon, auf Grundlage eines zuvor generierten Sprachprofils akustisch ausgibt. Zur automatischen Umsetzung von Text-Nachrichten in Sprach-Nachrichten werden Sprachprobedaten eines Benutzers analysiert (S1) und auf Grundlage dieser Analyse ein Sprachprofil (3) erstellt. Auf Grundlage des erstellten Sprachprofils (3) können beliebige Text-Nachrichtendaten (5) mittels eines Sprachgenerators (4) in Form synthetischer Sprach-Nachrichtendaten (6) umgesetzt werden.

Description

Die vorliegende Erfindung bezieht sich auf ein Verfahren so­ wie ein System, das beliebige geschriebene maschinenlesbare Text-Nachrichten, beispielsweise E-Mails oder Fax-Nachrich­ ten, über ein geeignetes akustisches Wiedergabesystem, bei­ spielsweise über ein Mobiltelephon, auf Grundlage eines zuvor generierten Stimmenprofils akustisch ausgibt.
Nach dem Stand der Technik ist es bekannt, in einer Multi­ media-Umgebung Inhalte von E-Mails, Fax-Nachrichten oder sonstigen Texten mittels fest vorgegebener synthetisch er­ zeugter Stimmen auszugeben. Um die Kommunikation in einer Multimedia-Umgebung (in der Literatur wird in diesem Zusam­ menhang häufig von einem "Unified Message System gesprochen) so natürlich wie möglich erscheinen zu lassen, ist es von In­ teresse, die entsprechende Text-Nachricht mit der Stimme des jeweiligen Autors auszugeben.
Der vorliegenden Erfindung liegt daher die Aufgabe zugrunde, eine Sprachwiedergabe von maschinenlesbaren Texten mit vari­ ierbaren synthetisch erzeugten Stimmen zu erreichen.
Diese Aufgabe wird gemäß der Erfindung durch die Merkmale der unabhängigen Ansprüche gelöst. Die abhängigen Ansprüche bil­ den den zentralen Gedanken in besonders vorteilhafter Weise weiter.
Erfindungsgemäß wird vorgeschlagen, dass zur automatischen Umsetzung von Text-Nachrichten in Sprach-Nachrichten Sprach­ probedaten eines Benutzers analysiert werden und auf Grundla­ ge dieser Analyse ein Sprachprofil erstellt wird. Auf Grund­ lage des erstellten Sprachprofiles können beliebige Text- Nachrichtendaten in synthetische Sprach-Nachrichtendaten um­ gesetzt werden.
Das Erstellen des Sprachprofiles kann dabei beispielsweise durch einen Vergleich eines schriftlichen Referenz-Textes mit einem durch akustische Artikulation eines Sprechers erzeugten Referenz-Text erfolgen.
Erfindungsgemäß wird weiterhin ein System zur Umsetzung von Text-Nachrichten in Sprach-Nachrichten beansprucht. Dieses weist einen Sprachanalysator auf, der auf Grundlage einer A­ nalyse von Sprachprobedaten ein Sprachprofil für eingegebene Sprachprobedaten erzeugt. Außerdem enthält dieses System ei­ nen Sprachgenerator, der auf Grundlage des Sprachprofils eine beliebige Text-Nachricht in synthetische Sprachprobedaten um­ setzt.
Weitere Vorteile, Merkmale und Eigenschaften der vorliegenden Erfindung werden im folgenden anhand eines Ausführungsbei­ spiels unter Bezugnahme auf die begleitende Zeichnung näher erläutert.
Die Figur zeigt schematisch eine Technik zur automatischen Umsetzung von Text-Nachrichten in Sprach-Nachrichten.
In der Figur ist schematisch ein Verfahren bzw. ein System zur automatischen Umsetzung von Text-Nachrichten in Sprach- Nachrichten dargestellt. Ein von einer beliebigen Person ge­ sprochener Text 1 wird in einem Schritt S1 von einem Analysa­ tor 2 analysiert. Dies geschieht in der Regel dadurch, dass die akustischen Signale analog registriert werden und durch einen A/D-Wandler in digitale Sprachdateien umgesetzt werden. Mit einer entsprechenden Software kann in einem Schritt S3 auf Grundlage der erfolgten Analyse der digitalen Sprachda­ teien ein Sprachprofil 3 der Person erzeugt werden. Dabei kann der gesprochene Text 1 ein beliebiger Freitext oder ein Referenztext 8 sein, der in einem Schritt S2 im Rahmen der Analyse mit der schriftlichen Form des Referenztextes 8 ver­ glichen wird.
Auf Grundlage des Sprachprofils 3 lässt sich im folgenden je­ de beliebige Text-Nachricht 5 über einen Sprachgenerator 4 in synthetische Sprachnachrichtendaten 6 übersetzen (Schritt S5 und Schritt S6). Die Textnachricht 5 kann anschließend in ei­ nem Schritt S7 gemäß dem erstellten Sprachprofil 3 akustisch ausgegeben werden.
So kann anhand einer Sprachprobe 1 eines Sprechers über das dadurch gewonnene Sprachprofil 3 ein Sprachgenerator 4 für eine synthetisch erzeugte Sprache so eingestellt werden, dass beliebige Texte 5 mit der Stimme dieses Sprechers akustisch ausgegeben werden können. Natürlich ist es auch denkbar, dass dem Sprachgenerator Sprachproben verschiedener Personen und damit mehrere Sprachprofile zur Verfügung stehen. Damit ist eine Auswahl verschiedener Sprecher möglich.
Dies ist insbesondere innerhalb von Multimediaumgebungen von großem Wert, wenn nämlich die Verknüpfung von synthetisch er­ zeugter Sprache zu Dokumenten des Sprechers automatisch er­ stellt werden kann. Dabei ist es zudem äußerst vorteilhaft, dass die Profilgenerierung für die Ausgabe der Sprache auto­ matisch aus einer beliebigen Sprachprobe innerhalb des Multi­ mediaumfeldes erfolgen kann.
Normalerweise werden innerhalb eines einheitlichen Nachrich­ ten-Systems (Unified Message System) verschiedene Dokumente, wie z. B. Sprachnachrichten (Anrufbeantworter), E-Mails, Fax­ nachrichten usw., des gleichen Autors verwaltet. Um bei­ spielsweise E-Mails innerhalb dieses Systems z. B. auf einem Mobiltelephon auszugeben, wird der E-Mail-Text erfindungsge­ mäß in Sprache übersetzt. Vorteilhafterweise kann dabei mit Hilfe einer in demselben System eingegangenen Sprach-Nach­ richt 1 des gleichen Autors und des daraus generierten Stim­ menprofils 3 die E-Mail-Nachricht mit der Stimme dieses Autors ausgegeben werden. Bei entsprechender Vorlage einer Sprachprobe anderer Personen, wie z. B. prominenter Personen, wäre auch eine Wiedergabe der Dokumente mit deren Stimme mög­ lich.

Claims (6)

1. Verfahren zur automatischen Umsetzung von Text-Nachrichten (5) in Sprach-Nachrichten (6), mit den folgenden Schritten:
  • - Analyse (S1) von Sprachprobedaten (1) eines Benutzers,
  • - Erstellen (S3) eines Sprachprofils (3) für die Sprachprobe­ daten (1) auf Grundlage der vorgenommenen Analyse (S1), und
  • - Umsetzen (4) von eingegebenen Text-Nachrichtendaten (5) in synthetische Sprach-Nachrichtendaten (6) auf Grundlage des erstellten Sprachprofils (3).
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das Erstellen des Sprachprofils (3) auf Grundlage eines Vergleichs (S2) von Referenz-Textdaten (8) mit Referenz- Sprachprobedaten (1) erfolgt, wobei die Referenz-Sprachprobe­ daten (1) durch akustische Wiedergabe der Referenz-Textdaten (8) durch einen Sprecher erzeugt werden.
3. System zur Umsetzung von Text-Nachrichten (5) in Sprach- Nachrichten (6),
mit einem Sprachanalysator (2), der auf Grundlage einer A­ nalyse (S1) von Sprachprobedaten (1) ein Sprachprofil (3) für eingegebene Sprachprobedaten (1) erzeugt, und
mit einem Sprachgenerator (4), der auf Grundlage des Sprachprofils (3) eine beliebige Text-Nachricht (5) in syn­ thetische Sprachprobedaten (6) umsetzt.
4. System nach Anspruch 3, dadurch gekennzeichnet, dass der Sprachgenerator (4) dazu ausgelegt ist, das Sprach­ profil (3) auf Grundlage eines Vergleichs eines schriftlichen Referenz-Textes (8) mit der von einem Benutzer gesprochenen Form (1) dieses Referenz-Textes (8) zu erzeugen.
5. System nach Anspruch 3 oder 4, dadurch gekennzeichnet, dass in Multimediaumgebungen der Sprachanteil von Sprachnach­ richten (1) automatisch analysiert wird (S1) und zur akusti­ schen Wiedergabe (7) von Textnachrichten (5) verwendet wird.
6. Mobiltelephon, aufweisend ein System nach Anspruch 3, 4 oder 5, dadurch gekennzeichnet, dass die Text-Nachrichten (5) Dokumente in einer Multimedia­ umgebung, beispielsweise E-Mail-Texte, sind, die auf dem Mo­ biltelephon in der Sprache gemäß dem zuvor erzeugten Sprach­ profil (3) akustisch ausgegeben werden.
DE10117367A 2001-04-06 2001-04-06 Verfahren und System zur automatischen Umsetzung von Text-Nachrichten in Sprach-Nachrichten Expired - Fee Related DE10117367B4 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE10117367A DE10117367B4 (de) 2001-04-06 2001-04-06 Verfahren und System zur automatischen Umsetzung von Text-Nachrichten in Sprach-Nachrichten
EP02003909A EP1248251A3 (de) 2001-04-06 2002-02-21 Verfahren und System zur automatischen Umsetzung von Textnachrichten in Sprachnachrichten
US10/117,291 US20020169610A1 (en) 2001-04-06 2002-04-05 Method and system for automatically converting text messages into voice messages

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10117367A DE10117367B4 (de) 2001-04-06 2001-04-06 Verfahren und System zur automatischen Umsetzung von Text-Nachrichten in Sprach-Nachrichten

Publications (2)

Publication Number Publication Date
DE10117367A1 true DE10117367A1 (de) 2002-10-17
DE10117367B4 DE10117367B4 (de) 2005-08-18

Family

ID=7680748

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10117367A Expired - Fee Related DE10117367B4 (de) 2001-04-06 2001-04-06 Verfahren und System zur automatischen Umsetzung von Text-Nachrichten in Sprach-Nachrichten

Country Status (3)

Country Link
US (1) US20020169610A1 (de)
EP (1) EP1248251A3 (de)
DE (1) DE10117367B4 (de)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3589216B2 (ja) 2001-11-02 2004-11-17 日本電気株式会社 音声合成システム及び音声合成方法
KR20050118733A (ko) * 2003-04-14 2005-12-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 시청각 스트림상에 자동 더빙을 수행하는 시스템 및 방법
US8005677B2 (en) * 2003-05-09 2011-08-23 Cisco Technology, Inc. Source-dependent text-to-speech system
US8068588B2 (en) * 2007-06-26 2011-11-29 Microsoft Corporation Unified rules for voice and messaging
US8285548B2 (en) 2008-03-10 2012-10-09 Lg Electronics Inc. Communication device processing text message to transform it into speech
KR101566379B1 (ko) * 2009-05-07 2015-11-13 삼성전자주식회사 입력 신호 종류 별 사용자 기능 활성화 방법 및 이를 지원하는 휴대 단말기
CN102117614B (zh) * 2010-01-05 2013-01-02 索尼爱立信移动通讯有限公司 个性化文本语音合成和个性化语音特征提取
US9699632B2 (en) 2011-09-28 2017-07-04 Elwha Llc Multi-modality communication with interceptive conversion
US9002937B2 (en) 2011-09-28 2015-04-07 Elwha Llc Multi-party multi-modality communication
US9906927B2 (en) 2011-09-28 2018-02-27 Elwha Llc Multi-modality communication initiation
US9477943B2 (en) 2011-09-28 2016-10-25 Elwha Llc Multi-modality communication
US20130079029A1 (en) * 2011-09-28 2013-03-28 Royce A. Levien Multi-modality communication network auto-activation
US9762524B2 (en) 2011-09-28 2017-09-12 Elwha Llc Multi-modality communication participation
US9788349B2 (en) * 2011-09-28 2017-10-10 Elwha Llc Multi-modality communication auto-activation
US9503550B2 (en) 2011-09-28 2016-11-22 Elwha Llc Multi-modality communication modification
US10424288B2 (en) 2017-03-31 2019-09-24 Wipro Limited System and method for rendering textual messages using customized natural voice
CN111369966A (zh) * 2018-12-06 2020-07-03 阿里巴巴集团控股有限公司 一种用于个性化语音合成的方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19841683A1 (de) * 1998-09-11 2000-05-11 Hans Kull Vorrichtung und Verfahren zur digitalen Sprachbearbeitung

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4707858A (en) * 1983-05-02 1987-11-17 Motorola, Inc. Utilizing word-to-digital conversion
JPH05260082A (ja) * 1992-03-13 1993-10-08 Toshiba Corp テキスト読み上げ装置
US5774841A (en) * 1995-09-20 1998-06-30 The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration Real-time reconfigurable adaptive speech recognition command and control apparatus and method
US6035273A (en) * 1996-06-26 2000-03-07 Lucent Technologies, Inc. Speaker-specific speech-to-text/text-to-speech communication system with hypertext-indicated speech parameter changes
JP3287281B2 (ja) * 1997-07-31 2002-06-04 トヨタ自動車株式会社 メッセージ処理装置
US6216104B1 (en) * 1998-02-20 2001-04-10 Philips Electronics North America Corporation Computer-based patient record and message delivery system
US6081780A (en) * 1998-04-28 2000-06-27 International Business Machines Corporation TTS and prosody based authoring system
US6243676B1 (en) * 1998-12-23 2001-06-05 Openwave Systems Inc. Searching and retrieving multimedia information
US20020072900A1 (en) * 1999-11-23 2002-06-13 Keough Steven J. System and method of templating specific human voices
US6801931B1 (en) * 2000-07-20 2004-10-05 Ericsson Inc. System and method for personalizing electronic mail messages by rendering the messages in the voice of a predetermined speaker
US6978239B2 (en) * 2000-12-04 2005-12-20 Microsoft Corporation Method and apparatus for speech synthesis without prosody modification

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19841683A1 (de) * 1998-09-11 2000-05-11 Hans Kull Vorrichtung und Verfahren zur digitalen Sprachbearbeitung

Also Published As

Publication number Publication date
EP1248251A3 (de) 2009-10-07
EP1248251A2 (de) 2002-10-09
DE10117367B4 (de) 2005-08-18
US20020169610A1 (en) 2002-11-14

Similar Documents

Publication Publication Date Title
DE10117367A1 (de) Verfahren und System zur automatischen Umsetzung von Text-Nachrichten in Sprach-Nachrichten
DE60214358T2 (de) Zeitskalenmodifikation von signalen mit spezifischem verfahren je nach ermitteltem signaltyp
DE60222093T2 (de) Verfahren, modul, vorrichtung und server zur spracherkennung
DE102019001775A1 (de) Nutzung von Maschinenlernmodellen zur Bestimmung von Mundbewegungen entsprechend Live-Sprache
DE10065572A1 (de) System und Methode zum Registrieren und Suchen in mehreren Beziehungs-Such-Websites
AT6920U1 (de) Verfahren zur erzeugung natürlicher sprache in computer-dialogsystemen
EP1190413A2 (de) Verfahren und vorrichtung zur spracherkennung
DE102013101871A1 (de) Wortwahlbasierte Sprachanalyse und Sprachanalyseeinrichtung
CN104537036B (zh) 一种分析语言特征的方法及装置
DE102006001730A1 (de) Beschallungsanlage, Verfahren zur Verbesserung der Sprachqualität und/oder Verständlichkeit von Sprachdurchsagen sowie Computerprogramm
DE4211945C1 (de)
EP0867074B1 (de) Verfahren zur kompression eines analogen signals
DE19849855C1 (de) Verfahren zur automatischen Generierung einer textlichen Äußerung aus einer Bedeutungsrepräsentation durch ein Computersystem
DE19811879C1 (de) Einrichtung und Verfahren zum Erkennen von Sprache
WO2002076149A1 (de) Verfahren und vorrichtung zum betrieb eines beschallungssystems
EP1251680A1 (de) Sprachgesteuerter Verzeichnisdienst für Verbindung an ein Datennetzwerk
DE102004001863A1 (de) Verfahren und Vorrichtung zur Bearbeitung eines Sprachsignals
DE10249527A1 (de) Konverter für Mobilfunknetze zur Erzeugung von Einheitsformaten
EP0984427B1 (de) Verfahren zum akustischen Ausgeben von Text
DE60025158T2 (de) Verfahren zur Geschwindigkeitsmodifikation von Sprachsignalen, Verwendung des Verfahrens, und Anordnung zur Durchführung des Verfahrens
EP1363271A1 (de) Verfahren und System zur Verarbeitung und Speicherung von Sprachinformationen eines Dialogs
DE3032699A1 (de) Verfahren zur reduktion von signalredundanz und zur synthese der menschlichen sprache
DE10024491C2 (de) Elektronische Vorrichtung und Verfahren zur Sprachausgabe der Sendequelle einer E-Mail
DE202023104446U1 (de) System zur Spracherkennung und Transkription für Exilanten-Testimonio
DE10138059A1 (de) Konvertierungseinrichtung und Konvertierungsverfahren für einen akustischen Zugang zu einem Computernetzwerk

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
R082 Change of representative

Representative=s name: FRITZSCHE, THOMAS MICHAEL, DIPL.-CHEM. DR.RER., DE

R081 Change of applicant/patentee

Owner name: UNIFY GMBH & CO. KG, DE

Free format text: FORMER OWNER: SIEMENS AKTIENGESELLSCHAFT, 80333 MUENCHEN, DE

Effective date: 20121127

Owner name: SIEMENS ENTERPRISE COMMUNICATIONS GMBH & CO. K, DE

Free format text: FORMER OWNER: SIEMENS AKTIENGESELLSCHAFT, 80333 MUENCHEN, DE

Effective date: 20121127

R082 Change of representative

Representative=s name: FRITZSCHE PATENTANWAELTE, DE

Effective date: 20121127

Representative=s name: FRITZSCHE, THOMAS MICHAEL, DIPL.-CHEM. DR.RER., DE

Effective date: 20121127

R082 Change of representative

Representative=s name: FRITZSCHE, THOMAS MICHAEL, DIPL.-CHEM. DR.RER., DE

R081 Change of applicant/patentee

Owner name: UNIFY GMBH & CO. KG, DE

Free format text: FORMER OWNER: SIEMENS ENTERPRISE COMMUNICATIONS GMBH & CO. KG, 81379 MUENCHEN, DE

Effective date: 20131112

R082 Change of representative

Representative=s name: FRITZSCHE, THOMAS MICHAEL, DIPL.-CHEM. DR.RER., DE

Effective date: 20131112

Representative=s name: FRITZSCHE PATENTANWAELTE, DE

Effective date: 20131112

R081 Change of applicant/patentee

Owner name: UNIFY GMBH & CO. KG, DE

Free format text: FORMER OWNER: UNIFY GMBH & CO. KG, 81379 MUENCHEN, DE

R082 Change of representative

Representative=s name: FRITZSCHE PATENTANWAELTE, DE

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee