DE102008009445A1 - Verfahren zur Schrift- und Spracherkennung - Google Patents

Verfahren zur Schrift- und Spracherkennung Download PDF

Info

Publication number
DE102008009445A1
DE102008009445A1 DE102008009445A DE102008009445A DE102008009445A1 DE 102008009445 A1 DE102008009445 A1 DE 102008009445A1 DE 102008009445 A DE102008009445 A DE 102008009445A DE 102008009445 A DE102008009445 A DE 102008009445A DE 102008009445 A1 DE102008009445 A1 DE 102008009445A1
Authority
DE
Germany
Prior art keywords
expressions
written
user
expression
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102008009445A
Other languages
English (en)
Inventor
Yongmei Dr. Wu
Peter Dr. Schulenberg
Will Dr. Specks
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Volkswagen AG
Original Assignee
Volkswagen AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Volkswagen AG filed Critical Volkswagen AG
Priority to DE102008009445A priority Critical patent/DE102008009445A1/de
Priority to PCT/EP2009/000448 priority patent/WO2009100811A1/de
Publication of DE102008009445A1 publication Critical patent/DE102008009445A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur Eingabe von Informationen vorzugsweise in einem Fahrzeug. Aufgabe der Erfindung ist es, die Erkennungsgenauigkeit von Ausdrücken zu erhöhen, die vom Benutzer schriftlich oder durch Spracheingabe mitgeteilt werden. Die Aufgabe wird dadurch gelöst, dass die schriftliche Darstellung von Ausdrücken durch die akustische Darstellung ergänzt wird bzw. die akustische Darstellung von Ausdrücken durch die schriftliche Darstellung ergänzt wird.

Description

  • Die Erfindung betrifft ein Verfahren zur Eingabe von Informationen vorzugsweise in einem Fahrzeug.
  • In zunehmendem Maße werden Anweisungen in einem Fahrzeug über Spracheingabe gesteuert. Die Spracheingabe ermöglicht dem Fahrer die Bedienung von Geräten während der Fahrt, ohne dass die Augen von der Fahrbahn genommen werden müssen. Insbesondere das Telefon kann durch Spracheingabe angewählt und die Kommunikation mit einem Partner aufgenommen werden. In der DE 10207895 B4 wird ein derartiges System zur Spracherkennung beschrieben.
  • Es gibt auch Spracheingabesysteme die die gesprochene Information als geschriebenen Text ausgeben. Dabei sind die schriftlich ausgegebenen Worte als Vorschläge zu verstehen, die auf Wunsch über eine Auswahlliste mit sinnvollen alternativen Worten korrigierbar sind.
  • Die schriftliche Eingabe von Daten durch beschreiben eines berührungssensitiven Eingabefeldes (Touch-Panel) ist durch die Offenlegungsschrift DE 10349673 A1 bekannt. Mittels eines Schrifterkennungssystems werden die eingegebenen Daten erkannt und auf einem Head Up Display ausgegeben.
  • Die Spracherkennung arbeitet oft fehlerhaft in dem Sinne, dass nicht die gewünschten Worte richtig erkannt werden und somit keine oder falsche Informationen ausgegeben werden. Ähnliche Probleme ergeben sich bei der handschriftlichen Eingabe von Buchstaben oder Worten. Oft ist eine lange Lernphase der genannten Geräte erforderlich um zu vertretbaren Ergebnissen zu gelangen.
  • Die Erfindung geht von einem Verfahren der sich aus dem Oberbegriff des Anspruchs 1 ergebenen Gattung aus und hat sich zur Aufgabe gestellt, die Erkennungsgenauigkeit derartiger Geräte erheblich zu verbessern.
  • Die Erfindung wird durch die sich aus dem kennzeichnenden Teil des Anspruchs 1 ergebende Merkmalskombination gelöst.
  • Die Erfindung besteht grundsätzlich darin, die Erkennungsgenauigkeit dadurch zu erhöhen, dass die schriftliche Darstellung von Ausdrücken durch die akustische Darstellung ergänzt wird bzw. die akustische Darstellung von Ausdrücken durch die schriftliche Darstellung ergänzt wird.
  • Eine besonders einfache Eingabe von Ausdrücken ergibt sich durch Anwendung der Merkmale nach Anspruch 2. Dabei gibt der Benutzer selbst nicht nur den gewünschten Ausdruck in schriftlicher bzw. sprachlicher Form ein, sondern zusätzlich auch noch in sprachlicher bzw. in schriftlicher Form. Soll ein Fahrzeug gestartet werden, so gibt der Fahrzeugführer diesen Befehl nicht nur schriftlich ein, sondern er gibt auch akustisch den Befehl „Starten".
  • Eine weitere Vereinfachung des erfindungsgemäßen Verfahrens ergibt sich durch die Anwendung der Merkmale nach Anspruch 3. Bei dieser Merkmalskombination wird dem Benutzer des Systems insofern eine Hilfe angeboten, als dass er den eingegebenen Ausdruck nicht in beiden Kombinationsformen (schriftlich oder mündlich) eingeben muss sondern das System gibt den erkannten Ausdruck in schriftlicher oder mündlicher Form aus und der Benutzer kann den ausgegebenen Ausdruck bestätigen oder gegebenenfalls korrigieren.
  • Dabei kann die Bestätigung auch derart bestehen, dass keine Korrektur vorgenommen wird.
  • Eine noch weitergehende Vereinfachung des erfindungsgemäßen Verfahrens gestatten in Weiterbildung der Erfindung die sich aus Anspruch 4 ergebenden Merkmale. Dabei wird dem Benutzer nicht nur von der Erkennungseinrichtung ein möglicherweise zu korrigierender Ausdruck ausgegeben, sondern es werden ihm eine Mehrzahl von Ausdrücken zur Auswahl zur Verfügung gestellt, die die Erkennungseinrichtung aufgrund der Eingabe des Benutzers ermittelt hat. Die Auswahl kann dabei durch Markierung eines Ausdrucks der Mehrzahl von angebotenen Ausdrücken geschehen, gemäß Anspruch 5. Alternativ kann die Auswahl oder Korrektur auch durch eine andere als die zunächst eingegebene Kommunikationsform geschehen.
  • Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Verfahrens gestatten die Merkmale des Anspruchs 6 und 7. Werden die vom Benutzer schriftlich oder mündlich eingegebenen Ausdrücke durch die Erkennungseinrichtung vom Benutzer mündlich oder schriftlich bestätigt, oder die in Frage kommenden Ausdrücke von der Erkennungseinrichtung zur Auswahl gestellt und vom Benutzer bestätigt, so nimmt die Erkennungseinrichtung diese Auswahl auf und speichert sie ab. Auf diese Weise ist die Erkennungseinheit in der Lage, die vom Benutzer eingegebenen Ausdrücke besser zuzuordnen ("Lernkurve").
  • Ein Ausführungsbeispiel der Erfindung wird nachfolgend erläutert:
    In Fahrzeugen ist die Notwendigkeit Informationen abzurufen kontinuierlich gestiegen. Es handelt sich dabei um Informationen, die z. B. die Zieladresse für ein Navigationssystem beinhalten, die Zielperson, die angerufen werden soll, der Musiktitel in einem MP3-Spieler, etc. Es gibt relativ gute Spracherkennung von MANDARIN. MANDARIN benutzt das PINYIN Aussprachesystem. Es verwendet dieselben 26 alphanumerischen Zeichen wie im Englischen. Sie ist verständlich, wenn es in MANDARIN also dem Hochchinesisch ausgesprochen wird. Jedoch benutzen viele Chinesen im alltäglichen Leben einen Dialekt und das PINYIN ist nicht für jeden Chinesen selbstverständlich. In Kombination mit PINYIN sollte die Spracherkennung in Kombination mit Mandarin eigentlich ein probates Mittel sein, eindeutig erkannt zu werden. Jedoch gibt es die Mehrdeutigkeit bei der PINYIN Eingabe. Aufgrund der bereits dargestellten Probleme der Aussprache führt die Spracherkennung besonders für diesen östlichen Teil der Welt zu einem großen Problem. Für Chinesen ist die Eingabe durch geschriebene Zeichen bereits relativ bekannt. Jedoch ist der Umgang mit dieser Technik im Fahrzeug als Mensch-Maschine-Schnittstelle neu und unerprobt.
  • In einem Ausführungsbeispiel wird gezeigt wie die Doppeldeutigkeit von Zeichen oder Aussprache durch die Erfindung gelöst wird.
  • Wenn ein Benutzer das Zeichen
    Figure 00030001
    in ein berührungssensitives Eingabefeld (Touch-Panel) der Eingabeeinheit eingibt, kann die Eingabeeinheit die folgenden Zeichen
    Figure 00030002
    oder weitere daraus identifizieren. Wenn der Benutzer andererseits das Wort „fu" ausspricht kann es als
    Figure 00030003
    oder noch als weiteres Zeichen verstanden werden. Aber wenn sowohl die Spracheingabe als auch die schriftliche Eingabe erfolgt, kann nur die eine Bedeutung, nämlich
    Figure 00030004
    daraus erkannt werden und eine Doppeldeutigkeit wird vermieden.
  • In einem weiteren Ausführungsbeispiel gibt der Benutzer das Wort
    Figure 00030005
    in ein berührungssensitives Eingabefeld (Touch-Panel) der Erkennungseinrichtung ein. Die Erkennungseinrichtung kann den Ausdruck als
    Figure 00030006
    erkennen und bestätigt diesen, z. B. in Form einer Sprachausgabe, als "tian". Der Benutzer kann dann durch die Spracheingabe „fu" das Wort korrigieren. Sollte über ein bestimmtes Zeitintervall keine Bestätigung durch den Benutzer erfolgen, wertet die Erkennungseinrichtung dies als Bestätigung.
  • Es wird darauf hingewiesen, dass der Gegenstand der Erfindung nicht nur in Zusammenhang mit Fahrzeugen vorteilhaft anwendbar ist, sondern für alle Geräte, die interaktiv oder aktiv mit Spracheingabe oder/und Sprachausgabe oder/und schriftlicher Ein- oder/und Ausgabe arbeiten. Beispielsweise sind dies Geräte wie Handies, Diktiergeräte, Spracherkennungssysteme, Computer, Spielekonsolen, etc.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • - DE 10207895 B4 [0002]
    • - DE 10349673 A1 [0004]

Claims (7)

  1. Ein Verfahren zum Erkennen von in einer Erkennungseinrichtung eingegebenen Ausdrücken in einer ersten Kommunikationsform z. B. gesprochener bzw. in einer zweiten Kommunikationsform z. B. geschriebener Form, dadurch gekennzeichnet dass, der gesprochene bzw. geschriebene Ausdruck durch die geschriebene bzw. gesprochene Form dieses Ausdrucks zur größeren Erkennungsgenauigkeit zusätzlich bestätigt wird.
  2. Verfahren nach Anspruch 1 dadurch gekennzeichnet, dass die bestätigte Form des Ausdrucks von dem Benutzer der Erkennungseinrichtung zusätzlich eingegeben wird
  3. Verfahren nach Anspruch 1 oder 2 dadurch gekennzeichnet, dass die Erkennungseinrichtung zur Bestätigung bzw. Korrektur des von dem Benutzer eingegebenen Ausdrucks diesen Ausdruck in schriftlicher und/oder gesprochener Form ausgibt.
  4. Verfahren nach Anspruch 1 oder 2 dadurch gekennzeichnet, dass die Erkennungseinrichtung mehrere in Frage kommende Ausdrücke in geschriebener und/oder gesprochener Form zur Auswahl anbietet.
  5. Verfahren nach Anspruch 3 oder 4 dadurch gekennzeichnet, dass der von der Erkennungseinrichtung ausgegebene einzelne Ausdruck bzw. die von der Erkennungseinrichtung angebotenen Ausdrücke vom Benutzer durch Markieren oder in einer von der ersten Eingabe-Kommunikationsform abweichenden zweiten Eingabe-Kommunikationsform bestätigt wird.
  6. Verfahren nach einem der Ansprüche 1 bis 5 dadurch gekennzeichnet, dass die vom Benutzer in schriftlicher oder mündlicher Form eingegebenen Ausdrücke in Verbindung mit den ausgegebenen und vom Benutzer korrigiert oder bestätigten Ausdrücken in der Eingabeeinheit abgespeichert werden.
  7. Verfahren nach Anspruch 6 dadurch gekennzeichnet, dass die in der Eingabeeinheit abgespeicherten Ausdrücke mit neuerlich eingegebenen Ausdrücken verglichen werden und bei einer hinreichenden Übereinstimmung die zugehörigen bestätigten oder korrigierten Ausdrücke ausgegeben werden.
DE102008009445A 2008-02-15 2008-02-15 Verfahren zur Schrift- und Spracherkennung Withdrawn DE102008009445A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE102008009445A DE102008009445A1 (de) 2008-02-15 2008-02-15 Verfahren zur Schrift- und Spracherkennung
PCT/EP2009/000448 WO2009100811A1 (de) 2008-02-15 2009-01-24 Verfahren zur schrift- und spracherkennung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102008009445A DE102008009445A1 (de) 2008-02-15 2008-02-15 Verfahren zur Schrift- und Spracherkennung

Publications (1)

Publication Number Publication Date
DE102008009445A1 true DE102008009445A1 (de) 2009-08-20

Family

ID=40497659

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102008009445A Withdrawn DE102008009445A1 (de) 2008-02-15 2008-02-15 Verfahren zur Schrift- und Spracherkennung

Country Status (2)

Country Link
DE (1) DE102008009445A1 (de)
WO (1) WO2009100811A1 (de)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10349673A1 (de) 2003-10-24 2005-05-25 Bayerische Motoren Werke Ag Vorrichtung und Verfahren zur Dateneingabe in einem Kraftfahrzeug
DE10207895B4 (de) 2002-02-23 2005-11-03 Harman Becker Automotive Systems Gmbh Verfahren zur Spracherkennung und Spracherkennungssystem
DE102006011288A1 (de) * 2006-03-10 2007-09-13 Siemens Ag Verfahren zur Auswahl von Funktionen mithilfe einer Benutzerschnittstelle und Benutzerschnittstelle
DE102007014485A1 (de) * 2006-03-31 2007-11-22 Volkswagen Ag Kraftfahrzeug und Navigationsanordnung für ein Kraftfahrzeug

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7720682B2 (en) * 1998-12-04 2010-05-18 Tegic Communications, Inc. Method and apparatus utilizing voice input to resolve ambiguous manually entered text input
US7881936B2 (en) * 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
TWI247276B (en) * 2004-03-23 2006-01-11 Delta Electronics Inc Method and system for inputting Chinese character
US8473295B2 (en) * 2005-08-05 2013-06-25 Microsoft Corporation Redictation of misrecognized words using a list of alternatives

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10207895B4 (de) 2002-02-23 2005-11-03 Harman Becker Automotive Systems Gmbh Verfahren zur Spracherkennung und Spracherkennungssystem
DE10349673A1 (de) 2003-10-24 2005-05-25 Bayerische Motoren Werke Ag Vorrichtung und Verfahren zur Dateneingabe in einem Kraftfahrzeug
DE102006011288A1 (de) * 2006-03-10 2007-09-13 Siemens Ag Verfahren zur Auswahl von Funktionen mithilfe einer Benutzerschnittstelle und Benutzerschnittstelle
DE102007014485A1 (de) * 2006-03-31 2007-11-22 Volkswagen Ag Kraftfahrzeug und Navigationsanordnung für ein Kraftfahrzeug

Also Published As

Publication number Publication date
WO2009100811A1 (de) 2009-08-20

Similar Documents

Publication Publication Date Title
DE69811921T2 (de) Vorrichtung und verfahren zur unterscheidung von ähnlich klingenden wörtern in der spracherkennung
DE60215272T2 (de) Verfahren und Vorrichtung zur sprachlichen Dateneingabe bei ungünstigen Bedingungen
DE102006039126A1 (de) Verfahren zur Spracherkennung und Sprachwiedergabe
DE102005030380B4 (de) Verfahren zur Ermittlung einer Hypothesenliste aus einem Vokabular eines Spracherkennungssystems
DE112012002190B4 (de) Informationsgerät
DE102015109379A1 (de) Systeme und Verfahren für ein Navigationssystem, das eine Suche mit Diktieren und Teilübereinstimmung verwendet
DE102009021124A1 (de) Bediensystem für ein Fahrzeug
DE102014017385A1 (de) Kraftfahrzeug-Gerätebedienung mit Bedienkorrektur
DE102012008260A1 (de) Verfahren zum interaktiven Erlernen eines in einem Fahrzeug vorhandenen Fahrerassistenzsystems im Fahrbetrieb
DE112015003357B4 (de) Verfahren und System zum Erkennen einer eine Wortabfolge enthaltenden Sprachansage
DE102018215293A1 (de) Multimodale Kommunikation mit einem Fahrzeug
EP3115886B1 (de) Verfahren zum betreiben eines sprachsteuerungssystems und sprachsteuerungssystem
DE102013219649A1 (de) Verfahren und System zum Erstellen oder Ergänzen eines benutzerspezifischen Sprachmodells in einem mit einem Endgerät verbindbaren lokalen Datenspeicher
DE102008009445A1 (de) Verfahren zur Schrift- und Spracherkennung
EP2006835B1 (de) Verfahren zur Ermittlung einer Hypothesenliste aus einem Vokabular eines Spracherkennungssystems
DE102017211447B4 (de) Verfahren zum Auswählen eines Listeneintrags aus einer Auswahlliste einer Bedienvorrichtung mittels Sprachbedienung sowie Bedienvorrichtung
DE10129005B4 (de) Verfahren zur Spracherkennung und Spracherkennungssystem
DE102016004287A1 (de) Verfahren zur Spracherkennung in einem Kraftfahrzeug
WO2019057580A1 (de) Kraftfahrzeug
DE102008025532B4 (de) Kommunikationssystem und Verfahren zum Durchführen einer Kommunikation zwischen einem Nutzer und einer Kommunikationseinrichtung
EP1194921B1 (de) Verfahren und vorrichtung zur sprachverarbeitung
EP3665619B1 (de) Verfahren zum erzeugen einer sprachansage als rückmeldung zu einer handschriftlichen nutzereingabe sowie entsprechende bedienvorrichtung und kraftfahrzeug
DE102013216427B4 (de) Vorrichtung und Verfahren zur fortbewegungsmittelbasierten Sprachverarbeitung
DE102013019208A1 (de) Kraftfahrzeug-Sprachbedienung
DE102021003343A1 (de) Verfahren zur individuellen Anpassung und Ausgabe fahrzeugseitig optisch und/oder akustisch auszugebender Informationen

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20130903