DE102008009445A1 - Verfahren zur Schrift- und Spracherkennung - Google Patents
Verfahren zur Schrift- und Spracherkennung Download PDFInfo
- Publication number
- DE102008009445A1 DE102008009445A1 DE102008009445A DE102008009445A DE102008009445A1 DE 102008009445 A1 DE102008009445 A1 DE 102008009445A1 DE 102008009445 A DE102008009445 A DE 102008009445A DE 102008009445 A DE102008009445 A DE 102008009445A DE 102008009445 A1 DE102008009445 A1 DE 102008009445A1
- Authority
- DE
- Germany
- Prior art keywords
- expressions
- written
- user
- expression
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 15
- 230000014509 gene expression Effects 0.000 claims abstract description 29
- 238000004891 communication Methods 0.000 claims description 6
- 238000012790 confirmation Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 230000001755 vocal effect Effects 0.000 claims 1
- 241001672694 Citrus reticulata Species 0.000 description 5
- 238000001514 detection method Methods 0.000 description 2
- BUHVIAUBTBOHAG-FOYDDCNASA-N (2r,3r,4s,5r)-2-[6-[[2-(3,5-dimethoxyphenyl)-2-(2-methylphenyl)ethyl]amino]purin-9-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1=CC(OC)=CC(C(CNC=2C=3N=CN(C=3N=CN=2)[C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)C=2C(=CC=CC=2)C)=C1 BUHVIAUBTBOHAG-FOYDDCNASA-N 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Abstract
Die Erfindung betrifft ein Verfahren zur Eingabe von Informationen vorzugsweise in einem Fahrzeug. Aufgabe der Erfindung ist es, die Erkennungsgenauigkeit von Ausdrücken zu erhöhen, die vom Benutzer schriftlich oder durch Spracheingabe mitgeteilt werden. Die Aufgabe wird dadurch gelöst, dass die schriftliche Darstellung von Ausdrücken durch die akustische Darstellung ergänzt wird bzw. die akustische Darstellung von Ausdrücken durch die schriftliche Darstellung ergänzt wird.
Description
- Die Erfindung betrifft ein Verfahren zur Eingabe von Informationen vorzugsweise in einem Fahrzeug.
- In zunehmendem Maße werden Anweisungen in einem Fahrzeug über Spracheingabe gesteuert. Die Spracheingabe ermöglicht dem Fahrer die Bedienung von Geräten während der Fahrt, ohne dass die Augen von der Fahrbahn genommen werden müssen. Insbesondere das Telefon kann durch Spracheingabe angewählt und die Kommunikation mit einem Partner aufgenommen werden. In der
DE 10207895 B4 wird ein derartiges System zur Spracherkennung beschrieben. - Es gibt auch Spracheingabesysteme die die gesprochene Information als geschriebenen Text ausgeben. Dabei sind die schriftlich ausgegebenen Worte als Vorschläge zu verstehen, die auf Wunsch über eine Auswahlliste mit sinnvollen alternativen Worten korrigierbar sind.
- Die schriftliche Eingabe von Daten durch beschreiben eines berührungssensitiven Eingabefeldes (Touch-Panel) ist durch die Offenlegungsschrift
DE 10349673 A1 bekannt. Mittels eines Schrifterkennungssystems werden die eingegebenen Daten erkannt und auf einem Head Up Display ausgegeben. - Die Spracherkennung arbeitet oft fehlerhaft in dem Sinne, dass nicht die gewünschten Worte richtig erkannt werden und somit keine oder falsche Informationen ausgegeben werden. Ähnliche Probleme ergeben sich bei der handschriftlichen Eingabe von Buchstaben oder Worten. Oft ist eine lange Lernphase der genannten Geräte erforderlich um zu vertretbaren Ergebnissen zu gelangen.
- Die Erfindung geht von einem Verfahren der sich aus dem Oberbegriff des Anspruchs 1 ergebenen Gattung aus und hat sich zur Aufgabe gestellt, die Erkennungsgenauigkeit derartiger Geräte erheblich zu verbessern.
- Die Erfindung wird durch die sich aus dem kennzeichnenden Teil des Anspruchs 1 ergebende Merkmalskombination gelöst.
- Die Erfindung besteht grundsätzlich darin, die Erkennungsgenauigkeit dadurch zu erhöhen, dass die schriftliche Darstellung von Ausdrücken durch die akustische Darstellung ergänzt wird bzw. die akustische Darstellung von Ausdrücken durch die schriftliche Darstellung ergänzt wird.
- Eine besonders einfache Eingabe von Ausdrücken ergibt sich durch Anwendung der Merkmale nach Anspruch 2. Dabei gibt der Benutzer selbst nicht nur den gewünschten Ausdruck in schriftlicher bzw. sprachlicher Form ein, sondern zusätzlich auch noch in sprachlicher bzw. in schriftlicher Form. Soll ein Fahrzeug gestartet werden, so gibt der Fahrzeugführer diesen Befehl nicht nur schriftlich ein, sondern er gibt auch akustisch den Befehl „Starten".
- Eine weitere Vereinfachung des erfindungsgemäßen Verfahrens ergibt sich durch die Anwendung der Merkmale nach Anspruch 3. Bei dieser Merkmalskombination wird dem Benutzer des Systems insofern eine Hilfe angeboten, als dass er den eingegebenen Ausdruck nicht in beiden Kombinationsformen (schriftlich oder mündlich) eingeben muss sondern das System gibt den erkannten Ausdruck in schriftlicher oder mündlicher Form aus und der Benutzer kann den ausgegebenen Ausdruck bestätigen oder gegebenenfalls korrigieren.
- Dabei kann die Bestätigung auch derart bestehen, dass keine Korrektur vorgenommen wird.
- Eine noch weitergehende Vereinfachung des erfindungsgemäßen Verfahrens gestatten in Weiterbildung der Erfindung die sich aus Anspruch 4 ergebenden Merkmale. Dabei wird dem Benutzer nicht nur von der Erkennungseinrichtung ein möglicherweise zu korrigierender Ausdruck ausgegeben, sondern es werden ihm eine Mehrzahl von Ausdrücken zur Auswahl zur Verfügung gestellt, die die Erkennungseinrichtung aufgrund der Eingabe des Benutzers ermittelt hat. Die Auswahl kann dabei durch Markierung eines Ausdrucks der Mehrzahl von angebotenen Ausdrücken geschehen, gemäß Anspruch 5. Alternativ kann die Auswahl oder Korrektur auch durch eine andere als die zunächst eingegebene Kommunikationsform geschehen.
- Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Verfahrens gestatten die Merkmale des Anspruchs 6 und 7. Werden die vom Benutzer schriftlich oder mündlich eingegebenen Ausdrücke durch die Erkennungseinrichtung vom Benutzer mündlich oder schriftlich bestätigt, oder die in Frage kommenden Ausdrücke von der Erkennungseinrichtung zur Auswahl gestellt und vom Benutzer bestätigt, so nimmt die Erkennungseinrichtung diese Auswahl auf und speichert sie ab. Auf diese Weise ist die Erkennungseinheit in der Lage, die vom Benutzer eingegebenen Ausdrücke besser zuzuordnen ("Lernkurve").
- Ein Ausführungsbeispiel der Erfindung wird nachfolgend erläutert:
In Fahrzeugen ist die Notwendigkeit Informationen abzurufen kontinuierlich gestiegen. Es handelt sich dabei um Informationen, die z. B. die Zieladresse für ein Navigationssystem beinhalten, die Zielperson, die angerufen werden soll, der Musiktitel in einem MP3-Spieler, etc. Es gibt relativ gute Spracherkennung von MANDARIN. MANDARIN benutzt das PINYIN Aussprachesystem. Es verwendet dieselben 26 alphanumerischen Zeichen wie im Englischen. Sie ist verständlich, wenn es in MANDARIN also dem Hochchinesisch ausgesprochen wird. Jedoch benutzen viele Chinesen im alltäglichen Leben einen Dialekt und das PINYIN ist nicht für jeden Chinesen selbstverständlich. In Kombination mit PINYIN sollte die Spracherkennung in Kombination mit Mandarin eigentlich ein probates Mittel sein, eindeutig erkannt zu werden. Jedoch gibt es die Mehrdeutigkeit bei der PINYIN Eingabe. Aufgrund der bereits dargestellten Probleme der Aussprache führt die Spracherkennung besonders für diesen östlichen Teil der Welt zu einem großen Problem. Für Chinesen ist die Eingabe durch geschriebene Zeichen bereits relativ bekannt. Jedoch ist der Umgang mit dieser Technik im Fahrzeug als Mensch-Maschine-Schnittstelle neu und unerprobt. - In einem Ausführungsbeispiel wird gezeigt wie die Doppeldeutigkeit von Zeichen oder Aussprache durch die Erfindung gelöst wird.
- Wenn ein Benutzer das Zeichen in ein berührungssensitives Eingabefeld (Touch-Panel) der Eingabeeinheit eingibt, kann die Eingabeeinheit die folgenden Zeichen oder weitere daraus identifizieren. Wenn der Benutzer andererseits das Wort „fu" ausspricht kann es als oder noch als weiteres Zeichen verstanden werden. Aber wenn sowohl die Spracheingabe als auch die schriftliche Eingabe erfolgt, kann nur die eine Bedeutung, nämlich daraus erkannt werden und eine Doppeldeutigkeit wird vermieden.
- In einem weiteren Ausführungsbeispiel gibt der Benutzer das Wort in ein berührungssensitives Eingabefeld (Touch-Panel) der Erkennungseinrichtung ein. Die Erkennungseinrichtung kann den Ausdruck als erkennen und bestätigt diesen, z. B. in Form einer Sprachausgabe, als "tian". Der Benutzer kann dann durch die Spracheingabe „fu" das Wort korrigieren. Sollte über ein bestimmtes Zeitintervall keine Bestätigung durch den Benutzer erfolgen, wertet die Erkennungseinrichtung dies als Bestätigung.
- Es wird darauf hingewiesen, dass der Gegenstand der Erfindung nicht nur in Zusammenhang mit Fahrzeugen vorteilhaft anwendbar ist, sondern für alle Geräte, die interaktiv oder aktiv mit Spracheingabe oder/und Sprachausgabe oder/und schriftlicher Ein- oder/und Ausgabe arbeiten. Beispielsweise sind dies Geräte wie Handies, Diktiergeräte, Spracherkennungssysteme, Computer, Spielekonsolen, etc.
- ZITATE ENTHALTEN IN DER BESCHREIBUNG
- Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
- Zitierte Patentliteratur
-
- - DE 10207895 B4 [0002]
- - DE 10349673 A1 [0004]
Claims (7)
- Ein Verfahren zum Erkennen von in einer Erkennungseinrichtung eingegebenen Ausdrücken in einer ersten Kommunikationsform z. B. gesprochener bzw. in einer zweiten Kommunikationsform z. B. geschriebener Form, dadurch gekennzeichnet dass, der gesprochene bzw. geschriebene Ausdruck durch die geschriebene bzw. gesprochene Form dieses Ausdrucks zur größeren Erkennungsgenauigkeit zusätzlich bestätigt wird.
- Verfahren nach Anspruch 1 dadurch gekennzeichnet, dass die bestätigte Form des Ausdrucks von dem Benutzer der Erkennungseinrichtung zusätzlich eingegeben wird
- Verfahren nach Anspruch 1 oder 2 dadurch gekennzeichnet, dass die Erkennungseinrichtung zur Bestätigung bzw. Korrektur des von dem Benutzer eingegebenen Ausdrucks diesen Ausdruck in schriftlicher und/oder gesprochener Form ausgibt.
- Verfahren nach Anspruch 1 oder 2 dadurch gekennzeichnet, dass die Erkennungseinrichtung mehrere in Frage kommende Ausdrücke in geschriebener und/oder gesprochener Form zur Auswahl anbietet.
- Verfahren nach Anspruch 3 oder 4 dadurch gekennzeichnet, dass der von der Erkennungseinrichtung ausgegebene einzelne Ausdruck bzw. die von der Erkennungseinrichtung angebotenen Ausdrücke vom Benutzer durch Markieren oder in einer von der ersten Eingabe-Kommunikationsform abweichenden zweiten Eingabe-Kommunikationsform bestätigt wird.
- Verfahren nach einem der Ansprüche 1 bis 5 dadurch gekennzeichnet, dass die vom Benutzer in schriftlicher oder mündlicher Form eingegebenen Ausdrücke in Verbindung mit den ausgegebenen und vom Benutzer korrigiert oder bestätigten Ausdrücken in der Eingabeeinheit abgespeichert werden.
- Verfahren nach Anspruch 6 dadurch gekennzeichnet, dass die in der Eingabeeinheit abgespeicherten Ausdrücke mit neuerlich eingegebenen Ausdrücken verglichen werden und bei einer hinreichenden Übereinstimmung die zugehörigen bestätigten oder korrigierten Ausdrücke ausgegeben werden.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102008009445A DE102008009445A1 (de) | 2008-02-15 | 2008-02-15 | Verfahren zur Schrift- und Spracherkennung |
PCT/EP2009/000448 WO2009100811A1 (de) | 2008-02-15 | 2009-01-24 | Verfahren zur schrift- und spracherkennung |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102008009445A DE102008009445A1 (de) | 2008-02-15 | 2008-02-15 | Verfahren zur Schrift- und Spracherkennung |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102008009445A1 true DE102008009445A1 (de) | 2009-08-20 |
Family
ID=40497659
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102008009445A Withdrawn DE102008009445A1 (de) | 2008-02-15 | 2008-02-15 | Verfahren zur Schrift- und Spracherkennung |
Country Status (2)
Country | Link |
---|---|
DE (1) | DE102008009445A1 (de) |
WO (1) | WO2009100811A1 (de) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10349673A1 (de) | 2003-10-24 | 2005-05-25 | Bayerische Motoren Werke Ag | Vorrichtung und Verfahren zur Dateneingabe in einem Kraftfahrzeug |
DE10207895B4 (de) | 2002-02-23 | 2005-11-03 | Harman Becker Automotive Systems Gmbh | Verfahren zur Spracherkennung und Spracherkennungssystem |
DE102006011288A1 (de) * | 2006-03-10 | 2007-09-13 | Siemens Ag | Verfahren zur Auswahl von Funktionen mithilfe einer Benutzerschnittstelle und Benutzerschnittstelle |
DE102007014485A1 (de) * | 2006-03-31 | 2007-11-22 | Volkswagen Ag | Kraftfahrzeug und Navigationsanordnung für ein Kraftfahrzeug |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7720682B2 (en) * | 1998-12-04 | 2010-05-18 | Tegic Communications, Inc. | Method and apparatus utilizing voice input to resolve ambiguous manually entered text input |
US7881936B2 (en) * | 1998-12-04 | 2011-02-01 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
TWI247276B (en) * | 2004-03-23 | 2006-01-11 | Delta Electronics Inc | Method and system for inputting Chinese character |
US8473295B2 (en) * | 2005-08-05 | 2013-06-25 | Microsoft Corporation | Redictation of misrecognized words using a list of alternatives |
-
2008
- 2008-02-15 DE DE102008009445A patent/DE102008009445A1/de not_active Withdrawn
-
2009
- 2009-01-24 WO PCT/EP2009/000448 patent/WO2009100811A1/de active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10207895B4 (de) | 2002-02-23 | 2005-11-03 | Harman Becker Automotive Systems Gmbh | Verfahren zur Spracherkennung und Spracherkennungssystem |
DE10349673A1 (de) | 2003-10-24 | 2005-05-25 | Bayerische Motoren Werke Ag | Vorrichtung und Verfahren zur Dateneingabe in einem Kraftfahrzeug |
DE102006011288A1 (de) * | 2006-03-10 | 2007-09-13 | Siemens Ag | Verfahren zur Auswahl von Funktionen mithilfe einer Benutzerschnittstelle und Benutzerschnittstelle |
DE102007014485A1 (de) * | 2006-03-31 | 2007-11-22 | Volkswagen Ag | Kraftfahrzeug und Navigationsanordnung für ein Kraftfahrzeug |
Also Published As
Publication number | Publication date |
---|---|
WO2009100811A1 (de) | 2009-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69811921T2 (de) | Vorrichtung und verfahren zur unterscheidung von ähnlich klingenden wörtern in der spracherkennung | |
DE60215272T2 (de) | Verfahren und Vorrichtung zur sprachlichen Dateneingabe bei ungünstigen Bedingungen | |
DE102006039126A1 (de) | Verfahren zur Spracherkennung und Sprachwiedergabe | |
DE102005030380B4 (de) | Verfahren zur Ermittlung einer Hypothesenliste aus einem Vokabular eines Spracherkennungssystems | |
DE112012002190B4 (de) | Informationsgerät | |
DE102015109379A1 (de) | Systeme und Verfahren für ein Navigationssystem, das eine Suche mit Diktieren und Teilübereinstimmung verwendet | |
DE102009021124A1 (de) | Bediensystem für ein Fahrzeug | |
DE102014017385A1 (de) | Kraftfahrzeug-Gerätebedienung mit Bedienkorrektur | |
DE102012008260A1 (de) | Verfahren zum interaktiven Erlernen eines in einem Fahrzeug vorhandenen Fahrerassistenzsystems im Fahrbetrieb | |
DE112015003357B4 (de) | Verfahren und System zum Erkennen einer eine Wortabfolge enthaltenden Sprachansage | |
DE102018215293A1 (de) | Multimodale Kommunikation mit einem Fahrzeug | |
EP3115886B1 (de) | Verfahren zum betreiben eines sprachsteuerungssystems und sprachsteuerungssystem | |
DE102013219649A1 (de) | Verfahren und System zum Erstellen oder Ergänzen eines benutzerspezifischen Sprachmodells in einem mit einem Endgerät verbindbaren lokalen Datenspeicher | |
DE102008009445A1 (de) | Verfahren zur Schrift- und Spracherkennung | |
EP2006835B1 (de) | Verfahren zur Ermittlung einer Hypothesenliste aus einem Vokabular eines Spracherkennungssystems | |
DE102017211447B4 (de) | Verfahren zum Auswählen eines Listeneintrags aus einer Auswahlliste einer Bedienvorrichtung mittels Sprachbedienung sowie Bedienvorrichtung | |
DE10129005B4 (de) | Verfahren zur Spracherkennung und Spracherkennungssystem | |
DE102016004287A1 (de) | Verfahren zur Spracherkennung in einem Kraftfahrzeug | |
WO2019057580A1 (de) | Kraftfahrzeug | |
DE102008025532B4 (de) | Kommunikationssystem und Verfahren zum Durchführen einer Kommunikation zwischen einem Nutzer und einer Kommunikationseinrichtung | |
EP1194921B1 (de) | Verfahren und vorrichtung zur sprachverarbeitung | |
EP3665619B1 (de) | Verfahren zum erzeugen einer sprachansage als rückmeldung zu einer handschriftlichen nutzereingabe sowie entsprechende bedienvorrichtung und kraftfahrzeug | |
DE102013216427B4 (de) | Vorrichtung und Verfahren zur fortbewegungsmittelbasierten Sprachverarbeitung | |
DE102013019208A1 (de) | Kraftfahrzeug-Sprachbedienung | |
DE102021003343A1 (de) | Verfahren zur individuellen Anpassung und Ausgabe fahrzeugseitig optisch und/oder akustisch auszugebender Informationen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OM8 | Search report available as to paragraph 43 lit. 1 sentence 1 patent law | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |
Effective date: 20130903 |