DE19840890A1 - Verfahren zum akustischen Ausgeben von Text und Sprachausgabesystem - Google Patents

Verfahren zum akustischen Ausgeben von Text und Sprachausgabesystem

Info

Publication number
DE19840890A1
DE19840890A1 DE1998140890 DE19840890A DE19840890A1 DE 19840890 A1 DE19840890 A1 DE 19840890A1 DE 1998140890 DE1998140890 DE 1998140890 DE 19840890 A DE19840890 A DE 19840890A DE 19840890 A1 DE19840890 A1 DE 19840890A1
Authority
DE
Germany
Prior art keywords
text
language
speech
identified
microprocessor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE1998140890
Other languages
English (en)
Inventor
Walter Fehrmann
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE1998140890 priority Critical patent/DE19840890A1/de
Priority to JP24760199A priority patent/JP2000089776A/ja
Priority to EP19990710007 priority patent/EP0984427B1/de
Publication of DE19840890A1 publication Critical patent/DE19840890A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)
  • Document Processing Apparatus (AREA)
  • Navigation (AREA)

Abstract

Bei einem Verfahren zum akustischen Ausgeben von Text und einem Sprachausgabesystem wird ein Text von einem Mikroprozessor (1; 7) auf für eine Sprache charakteristische Wörter- oder Schriftzeichenkombination untersucht, um die Sprache des Textes zu identifizieren. Der Text wird anschließend mit einem Algorithmus, der speziell für die identifizierte Sprache geschaffen ist, in Wortsilben umgerechnet und über einen Lautsprecher wiedergegeben.

Description

Die Erfindung betrifft ein Verfahren zum akustischen Ausgeben von Text und ein Sprachausgabesystem, das eine akustische Ausgabe von Text erlaubt.
Aus der Offenlegungsschrift DE 195 03 419 A1 ist die akusti­ sche Ausgabe von digital codierten Verkehrsmeldungen mittels synthetisch erzeugter Sprache bekannt. Ortsbezogene Wörter werden in derjenigen Sprache an eine Sprachsynthese- Einrichtung weitergeleitet, in der die zugehörigen Sätze aus einem Speicher entnommen wurden. Eine Anpassung von fremd­ sprachigen Wörtern an den Klang der zugehörigen Sätze erfolgt durch eine Prosodie-Konversion.
Aus dem Textverarbeitungsprogramm Nisus® Writer von Nisus Software, Inc. ist eine Sprachausgabe oder ein "Vorlesen" von geschriebenem Text bekannt. Für jede Sprache, in der ein Text akustisch ausgegeben werden kann, steht ein eigener Sprachum­ wandlungs-Algorithmus (Text-to-speach-Algorithmus) zur Verfü­ gung. Ein solcher Algorithmus wandelt Schriftzeichen in auf­ einanderfolgende Phoneme oder Wortsilben um. Der Benutzer kann aus einem Menü für eine bestimmte Sprache den entspre­ chenden Sprachumwandlungs-Algorithmus wählen. Liegt der Text in einer Sprache vor, für die der Sprachumwandlungs- Algorithmus nicht bestimmt ist, so ist die Sprachausgabe nicht verständlich.
Bei verschiedenen Anwendungen ist es unvorteilhaft, wenn eine Benutzeraktion erforderlich ist, um für einen Text in einer bestimmten Sprache den dazugehörigen Sprachumwandlungs- Algorithmus auszuwählen. Insbesondere in einem Kraftfahrzeug wird der Sicherheitsvorteil für einen Fahrzeugführer, der in der akustischen Ausgabe eines Texts liegt, wenigstens teil­ weise zunichte gemacht, wenn der Fahrzeugführer zunächst die Sprache des Textes überprüfen muß und anschließend den ent­ sprechenden Sprachumwandlungs-Algorithmus suchen und auswäh­ len muß.
Es ist ein Ziel der Erfindung, ein Verfahren zum akustischen Ausgeben von Text und ein Sprachausgabesystem bereit zu stel­ len, die eine korrekte Wiedergabe von Texten erlauben, die in unterschiedlichen Sprachen vorliegen können.
Dieses Ziel wird mit einem Verfahren und einem Sprachausgabe­ system erreicht, wie sie in den unabhängigen Patentansprüchen definiert sind. Vorteilhafte Weiterbildungen der Erfindung sind in den Unteransprüchen angegeben.
Vor Beginn der Sprachausgabe wird ein Text auf Wörter oder Schriftzeichenkombinationen untersucht, die für eine Sprache charakteristisch sind, um die Sprache des Textes zu identifi­ zieren. Aufgrund der erkannten Sprache wird ein speziell der erkannten Sprache zugeordneter Algorithmus für die akustische Ausgabe des Textes automatisch gewählt. Dadurch werden die synthetisch erzeugten Phoneme, bzw. die Wortsilben oder Lau­ te, richtig betont.
Trifft beispielsweise ein schriftlicher Text über Rundfunk oder Mobilfunk, z. B. über das Radio-Daten-System (RDS) bzw. beim Mobilfunk über Short Message Service (SMS), in einen Personenkraftwagen ein, so kann der Text ohne Bedienaktion des Fahrzeugführers in der für die Sprache des Textes geeig­ netes Sprechweise wiedergegeben werden. Dies ist insbesondere bedeutsam für Geschäftsreisende, die auch Kontakte mit fremd­ sprachigen Kunden pflegen.
Weitere Vorteile, Merkmale und Anwendungsmöglichkeiten der Erfindung ergeben sich aus der Beschreibung von bevorzugten Ausführungsbeispielen in Verbindung mit den Zeichnungen. Es zeigen:
Fig. 1 ein Sprachausgabesystem, bei dem ein zentraler Mi­ kroprozessor Text in Sprachdaten umwandelt, und
Fig. 2 ein Sprachausgabesystem mit digitalem Signalprozes­ sor.
Das in Fig. 1 veranschaulichte Sprachausgabesystem ist in ein Multifunktions-Bedienteil eines Kraftfahrzeugs inte­ griert, mit dem ein Autoradio, ein Mobiltelefon, ein Naviga­ tionssystem und eine Klimaanlage gesteuert werden.
Ein Mikroprozessor 1 weist einen Textspeicher 2, bei dem es sich um ein RAM handelt, auf. Über ein Telefonmodul oder eine Mobilfunkeinheit 3 kann der Mikroprozessor 1 drahtlos Nach­ richten empfangen, wie beispielsweise ein E-Mail oder ein Te­ lefax.
Ein Benutzer kann durch Betätigung eines einzigen Bedienele­ ments, beispielsweise eines mit dem Buchstaben "E" gekenn­ zeichneten Druckknopfs, den Mikroprozessor 1 veranlassen, ei­ ne Verbindung mit seiner Mailbox beim Internet-Provider auf­ zubauen und eingetroffene E-Mails abzurufen. Der empfangene Text wird dann im Textspeicher 2 gespeichert und ohne weitere Aktion des Benutzers ausgegeben.
Empfängt die Mobilfunkeinheit 3 ein Telefax, so wird der im Telefax als Bildpunkte enthaltene Text von einer Texterken­ nungssoftware in Worte mit definierten Schriftzeichen umge­ setzt, um in dem Textspeicher 2 gespeichert zu werden. Der Mikroprozessor 1 lädt nacheinander die im Textspeicher 2 ge­ speicherte Worte und wandelt diese in digitalisierte Phoneme, also in eine Aufeinanderfolge von Lauten oder Wortsilben um.
Die digitalisierten Phoneme werden an ein Ausgabesystem aus­ gegeben, das aus einem Digital-/Analogwandler 4, einem Audio­ verstärker 5 und mindestens einem Lautsprecher 6 besteht.
Der Digital-/Analogwandler 4 wandelt die digitalisierten Pho­ neme in analoges Sprachsignal um, das vom Audioverstärker 5 auf eine vom Benutzer gewünschte Lautstärke verstärkt und vom Lautsprecher 6 akustisch wiedergegeben wird.
Der Mikroprozessor 1 untersucht einen Text auf das Vorkommen von Schlüsselwörtern und typischen Buchstabenkombinationen in denjenigen Sprachen, in denen er jeweils über einen Sprachum­ wandlungs-Algorithmus verfügt. Solche Schlüsselwörter sind Anreden und Grußformeln, wie beispielsweise "Sehr geehr­ te(r)", "Herr", "Frau", "Dear", "Cher", "Chère", etc. Ferner sind Artikel, Pronomen und Konjunktionen Wörter, anhand denen auf einfache Weise eine Sprache identifizierbar ist. Ähnli­ ches gilt für typische Schriftzeichenkombinationen oder Ab­ kürzungen wie "H.", "Hr.", "F.", "Fr.", "Mr.", "Ms.", "M.", "Mme".
Da manchmal die Anrede und der sich anschließende Text in un­ terschiedlichen Sprachen gehalten sind, führt der Mikropro­ zessor, nachdem er das erste Schlüsselwort oder die erste ty­ pische Schriftzeichenkombination einer konkreten Sprache zu­ ordnen konnte, seine Suche im Text fort. Treten Widersprüche auf, so daß mehr als eine Sprache aufgrund der identifizier­ ten charakteristischen Wörter oder Schriftzeichen erkannt wird, so erfolgt eine Mehrheitsentscheidung. Die Sprachausga­ be wird dann in derjenigen Sprache vorgenommen, die am häu­ figsten im Text erkannt wurde. Damit führen auch Schreibfeh­ ler nicht zu einer Fehlinterpretation der Sprache.
Fig. 2 zeigt ein Sprachausgabesystem, bei dem zusätzlich ein digitaler Signalprozessor 7 und ein Bildschirm 8 zur zusätz­ lichen optischen Informationsausgabe vorgesehen sind.
Die Mobilfunkeinheit 3 empfängt eine Textnachricht und über­ gibt sie an den Mikroprozessor 1. Dieser leitet den Text in den Textspeicher 2 weiter.
Der digitale Signalprozessor 7 untersucht den Text auf cha­ rakteristische Wörter und Zeichenkombinationen in den zur Verfügung stehenden Sprachen und wählt zur Sprachkonversion den zugehörigen Sprachumwandlungs-Algorithmus aus. Die syn­ thetisch erzeugten Phoneme gibt der Signalprozessor 7 an das Ausgabesystem 4, 5, 6 weiter.
Handelt es sich bei der von der Mobilfunkeinheit 3 empfange­ nen Nachricht um ein Telefax, so führt der digitale Signal­ prozessor 7 in einem ersten Schritt eine Texterkennung durch, um erst anschließend die Sprache des Texts zu überprüfen und die erkannten Schriftzeichen in Phoneme zu wandeln.

Claims (7)

1. Verfahren zum akustischen Ausgeben von Text, bei dem
  • 1. ein Text von einem Mikroprozessor (1) auf für eine Sprache charakteristische Wörter oder Schriftzeichenkombinationen untersucht wird, um die Sprache des Texts zu identifizie­ ren, und
  • 2. der Text mit einem Algorithmus, der für die identifizierte Sprache geschaffen ist, in Wortsilben umgerechnet wird, um über einen Lautsprecher wiedergegeben zu werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß bei Identifizierung von Wörtern oder Schriftzeichenkombinationen unterschiedlicher Sprachen diejenige Sprache gewählt wird, die am häufigsten identifiziert wurde.
3. Verfahren nach einem der vorhergehenden Patentansprüche, dadurch gekennzeichnet, daß der Text drahtlos in einem Fahr­ zeug empfangen und an einen Fahrzeugführer ausgegeben wird.
4. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß eine mit einer Mobilfunkeinheit (3) empfangene Telefax- Nachricht in Schriftzeichen aufgelöst und akustisch ausgege­ ben wird.
5. Sprachausgabesystem mit
  • 1. einem Textspeicher (2),
  • 2. einem Mikroprozessor (1; 7), mit dem die für einen in dem Textspeicher (2) gespeicherter Text verwendete Sprache identifizierbar ist und mit dem der Text in digitalisierte Phoneme der identifizierten Sprache umwandelbar ist,
  • 3. ein Ausgabesystem (4, 5, 6) zur Ausgabe der digitalisierten Phoneme als Sprache.
6. Sprachausgabesystem nach dem vorhergehenden Anspruch, ge­ kennzeichnet durch ein E-mail-System, das mit einer Mobilfun­ keinheit (3) gekoppelt ist.
7. Sprachausgabesystem nach dem vorhergehenden Anspruch, da­ durch gekennzeichnet, daß über die Betätigung eines Be­ dienelements automatisch eine Anwahl in eine Internet-Mailbox des Benutzers und ein Laden der eingegangenen E-mails er­ folgt.
DE1998140890 1998-09-03 1998-09-03 Verfahren zum akustischen Ausgeben von Text und Sprachausgabesystem Withdrawn DE19840890A1 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE1998140890 DE19840890A1 (de) 1998-09-03 1998-09-03 Verfahren zum akustischen Ausgeben von Text und Sprachausgabesystem
JP24760199A JP2000089776A (ja) 1998-09-03 1999-09-01 テキストを音声出力する方法、およびeメ―ルシステムのための音声出力装置
EP19990710007 EP0984427B1 (de) 1998-09-03 1999-09-03 Verfahren zum akustischen Ausgeben von Text

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE1998140890 DE19840890A1 (de) 1998-09-03 1998-09-03 Verfahren zum akustischen Ausgeben von Text und Sprachausgabesystem

Publications (1)

Publication Number Publication Date
DE19840890A1 true DE19840890A1 (de) 2000-04-06

Family

ID=7880157

Family Applications (1)

Application Number Title Priority Date Filing Date
DE1998140890 Withdrawn DE19840890A1 (de) 1998-09-03 1998-09-03 Verfahren zum akustischen Ausgeben von Text und Sprachausgabesystem

Country Status (3)

Country Link
EP (1) EP0984427B1 (de)
JP (1) JP2000089776A (de)
DE (1) DE19840890A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19963812A1 (de) * 1999-12-30 2001-07-05 Nokia Mobile Phones Ltd Verfahren zum Erkennen einer Sprache und zum Steuern einer Sprachsyntheseeinheit sowie Kommunikationsvorrichtung
DE10047279A1 (de) * 2000-09-23 2002-04-18 Henryk Bury Gmbh Dipl Ing Kraftfahrzeug mit Autotelefon und Navigationsanlage

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3908437B2 (ja) 2000-04-14 2007-04-25 アルパイン株式会社 ナビゲーションシステム
GB2366940B (en) * 2000-09-06 2004-08-11 Ericsson Telefon Ab L M Text language detection
CN109086026B (zh) * 2018-07-17 2020-07-03 阿里巴巴集团控股有限公司 播报语音的确定方法、装置和设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19503419A1 (de) * 1995-02-03 1996-08-08 Bosch Gmbh Robert Verfahren und Einrichtung zur Ausgabe von digital codierten Verkehrsmeldungen mittels synthetisch erzeugter Sprache
EP0889626A1 (de) * 1997-07-04 1999-01-07 Octel Communications Corporation Einheitliche Benachrichtigungssystem mit automatische Spracherkennung für Text-zu-Sprache Umsetzung

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4829580A (en) * 1986-03-26 1989-05-09 Telephone And Telegraph Company, At&T Bell Laboratories Text analysis system with letter sequence recognition and speech stress assignment arrangement
US5062143A (en) * 1990-02-23 1991-10-29 Harris Corporation Trigram-based method of language identification
CA2116600C (en) * 1993-04-10 1996-11-05 David Jack Ittner Methods and apparatus for inferring orientation of lines of text
IL116103A0 (en) * 1995-11-23 1996-01-31 Wireless Links International L Mobile data terminals with text to speech capability
US6009382A (en) * 1996-08-19 1999-12-28 International Business Machines Corporation Word storage table for natural language determination
US6233318B1 (en) * 1996-11-05 2001-05-15 Comverse Network Systems, Inc. System for accessing multimedia mailboxes and messages over the internet and via telephone
EP0849925A1 (de) * 1996-12-17 1998-06-24 ICO Services Ltd. Verbesserte Nachrichtenzentrale

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19503419A1 (de) * 1995-02-03 1996-08-08 Bosch Gmbh Robert Verfahren und Einrichtung zur Ausgabe von digital codierten Verkehrsmeldungen mittels synthetisch erzeugter Sprache
EP0889626A1 (de) * 1997-07-04 1999-01-07 Octel Communications Corporation Einheitliche Benachrichtigungssystem mit automatische Spracherkennung für Text-zu-Sprache Umsetzung

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19963812A1 (de) * 1999-12-30 2001-07-05 Nokia Mobile Phones Ltd Verfahren zum Erkennen einer Sprache und zum Steuern einer Sprachsyntheseeinheit sowie Kommunikationsvorrichtung
US6711542B2 (en) 1999-12-30 2004-03-23 Nokia Mobile Phones Ltd. Method of identifying a language and of controlling a speech synthesis unit and a communication device
DE10047279A1 (de) * 2000-09-23 2002-04-18 Henryk Bury Gmbh Dipl Ing Kraftfahrzeug mit Autotelefon und Navigationsanlage

Also Published As

Publication number Publication date
EP0984427B1 (de) 2013-01-30
EP0984427A3 (de) 2000-11-02
JP2000089776A (ja) 2000-03-31
EP0984427A2 (de) 2000-03-08

Similar Documents

Publication Publication Date Title
DE60033122T2 (de) Benutzeroberfläche zur Text-zu-Sprache-Umsetzung
DE60036931T2 (de) Anwender-sprachschnittstelle für sprachgesteuerte systeme
DE602004012071T2 (de) Multimedia- und textnachrichten mit sprache-zu-text-hilfe
DE60016722T2 (de) Spracherkennung in zwei Durchgängen mit Restriktion des aktiven Vokabulars
DE112005000924T5 (de) Stimme über Short Message Service
DE10334400A1 (de) Verfahren zur Spracherkennung und Kommunikationsgerät
WO2005022511A1 (de) Unterstützungsverfahren für sprachdialoge zur bedienung von kraftfahrzeugfunktionen
US20060129393A1 (en) System and method for synthesizing dialog-style speech using speech-act information
DE102006029251B4 (de) Verfahren und System für einen Telefonbuchtransfer
DE10117367B4 (de) Verfahren und System zur automatischen Umsetzung von Text-Nachrichten in Sprach-Nachrichten
EP1041362A2 (de) Eingabeverfahren in ein Fahrerinformationssystem
EP1282897B1 (de) Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems
EP1241600A1 (de) Verfahren und Kommunikationssystem zur Generierung von Antwortmeldungen
DE102009021124A1 (de) Bediensystem für ein Fahrzeug
DE19840890A1 (de) Verfahren zum akustischen Ausgeben von Text und Sprachausgabesystem
WO2008009429A1 (de) Verfahren, sprachdialogsystem und telekommunikationsendgerät zur multilingualen sprachausgabe
WO2005106847A2 (de) Verfahren und vorrichtung für einen akustischen zugang zu einem anwendungsrechner
WO2001013362A1 (de) Verfahren zur unterstützung eines dialogs
CN110588524B (zh) 一种信息显示的方法及车载辅助显示系统
EP1251680A1 (de) Sprachgesteuerter Verzeichnisdienst für Verbindung an ein Datennetzwerk
WO1999005681A1 (de) Verfahren zum abspeichern von suchmerkmalen einer bildsequenz und zugriff auf eine bildfolge in der bildsequenz
DE3300053A1 (de) Auf sprache ansprechende mobile statuseinheit
EP1179818B1 (de) Automatische Erkennung von Unternehmensnamen in sprachlichen Äusserungen
Sala et al. Speechdat-Car: Speech databases for voice driven teleservices and control of in-car applications
DE60316136T2 (de) Akustisch und haptisch betätigte Vorrichtung und zugehöriges Verfahren

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8130 Withdrawal