DE102016225019B4 - Verfahren zur Verbesserung von Spracherkennung in einem Fahrzeug - Google Patents

Verfahren zur Verbesserung von Spracherkennung in einem Fahrzeug Download PDF

Info

Publication number
DE102016225019B4
DE102016225019B4 DE102016225019.1A DE102016225019A DE102016225019B4 DE 102016225019 B4 DE102016225019 B4 DE 102016225019B4 DE 102016225019 A DE102016225019 A DE 102016225019A DE 102016225019 B4 DE102016225019 B4 DE 102016225019B4
Authority
DE
Germany
Prior art keywords
vehicle
road
speech recognition
microphone
bumps
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE102016225019.1A
Other languages
English (en)
Other versions
DE102016225019A1 (de
Inventor
Christoph Arndt
Mohsen Lakehal-ayat
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ford Global Technologies LLC
Original Assignee
Ford Global Technologies LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ford Global Technologies LLC filed Critical Ford Global Technologies LLC
Publication of DE102016225019A1 publication Critical patent/DE102016225019A1/de
Application granted granted Critical
Publication of DE102016225019B4 publication Critical patent/DE102016225019B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/588Recognition of the road, e.g. of lane markings; Recognition of the vehicle driving pattern in relation to the road
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/028Voice signal separating using properties of sound source
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads

Abstract

Verfahren zur Verbesserung von automatischer Spracherkennung in einem fahrenden Fahrzeug (1), wobei- ein in Fahrtrichtung vor dem Fahrzeug (1) liegender Abschnitt der Fahrbahn (2) mit einem im oder am Fahrzeug (1) eingebauten Sensor beobachtet wird (Schritt S1);- anhand der erhaltenen Beobachtungsdaten Ort und Größe von vorausliegenden Fahrbahnunebenheiten (3) bestimmt werden (Schritt S2);- geprüft wird, ob Teile von erkannten Fahrbahnunebenheiten voraussichtlich von einem Reifen des Fahrzeugs (1) überfahren werden (Schritt S3);- während der Dauer des Überfahrens von erkannten Fahrbahnunebenheiten (3) durch ein im Fahrzeug (1) eingebautes Mikrofon ein Tonsignal aufgenommen gelassen wird und anhand der erhaltenen Tonaufnahmen der Einfluss von Fahrbahnunebenheiten auf die Spracherkennung ermittelt und gespeichert wird (Schritt S4); und- von dem Mikrofon aufgenommene Tonsignale von Fahrgeräuschen gereinigt werden, die von Unebenheiten (3) der Fahrbahn herrühren, bevor die Tonsignale einer Spracherkennung unterzogen werden (Schritt S5).

Description

  • Die Erfindung betrifft ein Verfahren zur Verbesserung von automatischer Spracherkennung in einem Fahrzeug.
  • Die JP H06-67 690 A offenbart ein Verfahren zum Entfernen von Fahrgeräuschen eines Kraftfahrzeugs aus dem Mikrofoneingang des bordeigenen Spracherkennungsgeräts mit einem Mikrofon für Sprache, ohne ein Mikrofon für Geräusche in einem geräuschreduzierenden bordeigenen Spracherkennungsgerät zu verwenden. Auf der Grundlage von Informationen aus einer Straßenoberflächenzustands-Einstellvorrichtung wählt eine Geräuschmuster-Auswahlvorrichtung ein dem Stra-ßenzustand während einer aktuellen Fahrt entsprechendes Geräuschspektrum-Muster aus mindestens mehr als zwei gespeicherten, den Straßenoberflächenzuständen entsprechenden Geräuschspektrum-Mustern aus. Ein Spektralmuster-Arithmetikteil entfernt das Spektralmuster des Rauschens aus dem Spektralmuster, das durch Überlagerung der über ein Mikrofon eingegebenen Sprache und des Rauschens entsprechend dem ausgewählten Spektralmuster des Rauschens erhalten wird.
  • Aus der US 2015 / 0 012 267 A1 ist ein Verfahren bekannt, in dem Geräusche in einem Tonsignal, das von einem in einem Fahrzeug befindlichen Mikrofon aufgenommen wird, vorhergesagt und anschließend unterdrückt werden. Dabei sind die erkannten und unterdrückten Geräusche insbesondere kurzzeitig auftretende Geräusche, wie beispielsweise am eigenen Fahrzeug vorbeifahrende Lastwagen, aber auch andere kurzzeitige Geräusche, die in der herkömmlichen Geräuschunterdrückung schwerer zu unterdrücken sind als kontinuierlicher Lärm.
  • Moderne Kraftfahrzeuge besitzen häufig Sprachverarbeitungssysteme, die eine Sprachsteuerung von Fahrzeugfunktionen ermöglichen. Die Güte der Spracherkennung wird durch Fremdgeräusche beeinträchtigt. Eine besondere Herausforderung für die Spracherkennung sind plötzliche Änderungen des Fahrgeräusches, wie sie beim Überfahren von Unebenheiten der Fahrbahn wie z. B. Buckeln oder Schlaglöchern oder bei Änderungen der Oberflächenstruktur der Fahrbahn auftreten.
  • Die US 7 725 315 B2 offenbart ein Verfahren zur Erkennung von Fahrgeräuschen in einem Tonsignal, bei dem von der Fahrbahn herrührende vorübergehende Fahrgeräusche anhand von charakteristischen Signaleigenschaften erkannt werden und von Sprachsignalen unterschieden werden können. Entsprechende Signalcharakteristika sind z. B. Paare zeitlich verknüpfter Schallereignisse, wenn zuerst die Vorderräder und danach die Hinterräder eine Fahrbahnunebenheit passieren, und andere charakteristische zeitliche Verläufe von Signalstärken und -frequenzen. Zur besseren Erkennung von vorübergehenden Fahrgeräuschen werden verschiedene zeitliche und spektrale Charakteristika von vorübergehenden Fahrgeräuschen modelliert und mit dem gerade aufgenommenen Mikrofonsignal verglichen.
  • Aus der US 2014 / 0 303 905 A1 ist es bekannt, einen vor dem Fahrzeug liegenden Abschnitt der Fahrbahn mit einem Sensor zu beobachten und daraus Fahrgeräusche vorherzusagen, die mit Messsignalen eines Mikrofons korreliert werden. Diese Fahrgeräusche werden gemäß diesem Dokument zur allgemeinen zur Kartierung von Fahrbahn-Beschaffenheiten erhoben, so dass das in diesem Dokument beschriebene Verfahren für Messfahrten, und nicht für die Verbesserung des Regel-Fahrzeugbetriebs, insbesondere für eine Verbesserung von Spracherkennung oder Sprachkommunikation, konzipiert ist.
  • Der vorliegenden Erfindung liegt die Aufgabe zu Grunde, von Unebenheiten oder der Oberflächenstruktur der Fahrbahn herrührende Fahrgeräusche noch zuverlässiger von im Fahrzeug aufgezeichneten Mikrofonsignalen unterscheiden zu können, um die Spracherkennung bzw. die Qualität von Telekommunikation (d.h. allgemein Sprachkommunikation) in einem Fahrzeug zu verbessern.
  • Diese Aufgabe wird durch ein Verfahren mit den Merkmalen des Anspruchs 1 gelöst.
  • Vorteilhafte Weiterbildungen der Erfindung sind in den abhängigen Patentansprüchen angegeben.
  • Ein erfindungsgemäßes Verfahren zur Verbesserung von automatischer Spracherkennung in einem fahrenden Fahrzeug umfasst die Schritte, einen in Fahrtrichtung vor dem Fahrzeug liegenden Abschnitt der Fahrbahn mit einem im oder am Fahrzeug eingebauten Sensor zu beobachten; anhand der erhaltenen Beobachtungsdaten Ort und Größe von voraus liegenden Fahrbahnunebenheiten zu bestimmen; zu prüfen, ob Teile von erkannten Fahrbahnunebenheiten voraussichtlich von einem Reifen des Fahrzeugs überfahren werden; während der Dauer des Überfahrens von erkannten Fahrbahnunebenheiten ein im Fahrzeug eingebautes Mikrofon ein Tonsignal aufnehmen zu lassen und anhand der erhaltenen Tonaufnahmen den Einfluss von Fahrbahnunebenheiten auf die Spracherkennung zu ermitteln und zu speichern; und von dem Mikrofon aufgenommene Tonsignale von Fahrgeräuschen zu reinigen, die von Unebenheiten der Fahrbahn herrühren, bevor die Tonsignale der Spracherkennung unterzogen werden.
  • Dabei können anhand der erhaltenen Beobachtungsdaten außerdem Oberflächenstrukturen der voraus liegenden Fahrbahn ermittelt werden; den ermittelten Oberflächenstrukturen werden dann Tonsignale zugeordnet, die aufgenommen werden, während eine entsprechende Oberflächenstruktur überfahren wird; der Einfluss von Oberflächenstrukturen auf das Spracherkennungssystem wird ermittelt; und von dem Mikrofon aufgenommene Tonsignale werden auch von Fahrgeräuschen gereinigt, die von der Oberflächenstruktur der Fahrbahn herrühren, bevor die Tonsignale der Spracherkennung unterzogen werden.
  • Ein in Fahrtrichtung vor dem Fahrzeug liegender Abschnitt der Fahrbahn wird mit dem im oder am Fahrzeug eingebauten Sensor beobachtet, und anhand der erhaltenen Beobachtungsdaten werden Beginn und Dauer von Fahrgeräuschen vorhergesagt, die von Unebenheiten oder von der Oberflächenstruktur der Fahrbahn herrühren, wobei damit die Spracherkennung in dem Fahrzeug oder die Sprachverständlichkeit von Telekommunikation aus dem Fahrzeug verbessert wird.
  • Der Sensor zur Beobachtung des in Fahrtrichtung vor dem Fahrzeug liegenden Abschnitts der Fahrbahn ermöglicht die Gewinnung von Bildern der Fahrbahnoberfläche oder von anderen die Beschaffenheit der Fahrbahn repräsentierenden Daten in irgendeinem Bereich des elektromagnetischen Spektrums wie z. B. sichtbares oder unsichtbares Licht oder Radarwellen. Anhand dieser Bilder oder ähnlicher sensorisch gewonnener Beobachtungsdaten der Fahrbahn kann im Kraftfahrzeug in Echtzeit ermittelt werden, ob und wann sich eine beobachtete Fahrbahnunebenheit auf das Mikrofonsignal auswirken wird, so dass geeignete Gegenmaßnahmen getroffen werden können.
  • Der Sensor kann eine oder mehrere Kameras und/oder Laserscanner umfassen und/oder kann ein Teil eines Radarsystems sein. Nach vorne blickende Kameras, Laserscanner und Radar sind Bilderfassungssysteme, die in modernen Kraftfahrzeugen oft schon serienmäßig eingebaut oder zumindest listenmäßig bestellbar sind. Die Bilderfassungssysteme können entweder zweidimensionale Bilder gewinnen oder die Straßenoberfläche zeilenweise abtasten. Daraus kann eine Messpunktwolke oder ein Höhenprofil erhalten oder errechnet werden, in der bzw. dem sich Fahrbahnunebenheiten besonders leicht auffinden lassen.
  • In einer bevorzugten Ausführungsform werden als der Sensor eine oder mehrere Kameras und/oder oder andere Sensoren für vorausschauende optische Hinderniserkennung verwendet, wie sie z. B. aus der US 2008/0015743 A1 bekannt sind. Wird ein Hindernis wie z. B. ein Buckel auf der Fahrbahn erkannt, kann nicht nur der Fahrer gewarnt werden, sondern auch eine Zwangsbremsung eingeleitet und/oder die Federung und/oder Dämpfung des Fahrzeugchassis vorausschauend angepasst werden.
  • Wird ein Sensor für vorausschauende optische Hinderniserkennung verwendet, kann dessen Auswerteelektronik mit verwendet werden, da sie schon die Zeiten liefert, zu denen Beeinträchtigungen des Mikrofonsignals durch vorübergehende Fahrgeräusche zu erwarten sind.
  • Darüber hinaus kann anhand der Sensorsignale die Fahrbahnbeschaffenheit abgeschätzt werden und wann Beeinträchtigungen des Mikrofonsignals durch starke Abrollgeräusche zu erwarten sind. Irgendwelchen vorausgesagten Beeinträchtigungen des Mikrofonsignals kann dann durch geeignete Maßnahmen entgegengewirkt werden.
  • Die Vorhersage der Fahrgeräusche umfasst neben deren Beginn und Dauer auch Charakteristika der Fahrgeräusche, um den Einfluss der Fahrgeräusche noch gezielter kompensieren zu können. Die Charakteristika der Fahrgeräusche können zuvor aus Mikrofonsignalen ermittelt werden, in denen keine Sprachsignale enthalten sind, d. h. keine Tonsignale, die ein Spracherkennungssystem als Sprache ansieht. Entsprechende Mikrofonsignale stehen in Zeiten zur Verfügung, in denen das Spracherkennungssystem mehr oder weniger inaktiv ist, weil der Fahrer schweigt, und auf ein Aktivierungssignal wartet.
  • Mikrofonsignale, in denen keine Sprachsignale enthalten sind, werden während vorhergesagten Dauern von Fahrgeräuschen aufgenommen, die von Unebenheiten oder der Oberflächenstruktur der Fahrbahn herrühren. Damit erhält man die zugehörigen Fahrgeräusche in einer im Wesentlichen reinen Form, was es ermöglicht, diese aus dem Mikrofonsignal herauszurechnen, wenn das Mikrofon in einem späteren Zeitpunkt Sprache aufnimmt.
  • In einer bevorzugten Ausführungsform wird das Verfahren zur Verbesserung von automatischer Spracherkennung in dem Fahrzeug verwendet, damit Fahrgeräusche, wie sie beim Überfahren von Buckeln oder Schlaglöchern oder bei sich ändernder Oberflächenstruktur der Fahrbahn auftreten, nicht mehr zu Spracherkennungsfehlern führen können, seien es Fehlinterpretationen des Inhalts von Sprachbefehlen, die von dem Mikrofon aufgenommen und durch ein Spracherkennungssystem analysiert werden, oder seien es Fehlinterpretationen von Fahrgeräuschen als Sprache.
  • Das Verfahren kann aber zum Beispiel dazu verwendet werden, die Güte von Telekommunikation des Fahrers mit irgendwelchen menschlichen Gesprächspartnern (sei es im Fahrzeug oder außerhalb, beispielsweise bei GSM-Mobilfunkverbindungen) durch im richtigen Zeitpunkt getroffene Maßnahmen zur Minderung der Fahrgeräuschkomponente in dem vom Mikrofon aufgenommenen und weitergeleiteten Tonsignal zu verbessern.
  • Es folgt eine Beschreibung von Ausführungsbeispielen anhand der Zeichnungen. Darin zeigen:
    • 1 eine schematische Draufsicht auf ein fahrendes Kraftfahrzeug; und
    • 2 ein Flussdiagramm eines Verfahren zur Verbesserung von automatischer Spracherkennung in einem Kraftfahrzeug.
  • Ein in 1 gezeigtes Kraftfahrzeug 1 fährt in der eingezeichneten Pfeilrichtung auf einer Fahrbahn 2 einer Straße.
  • Das Kraftfahrzeug 1 weist eine oder mehrere nicht gezeigte Kameras oder andere Beobachtungsinstrumente wie z. B. Laserscanner oder Radar auf, die zusammen einen Sensor zur Beobachtung eines in Fahrtrichtung liegenden Abschnitts der Fahrbahn 2 bilden. Nach vorne blickende Kameras, Laserscanner und Radar sind Bilderfassungssysteme, die in modernen Kraftfahrzeugen oft schon serienmäßig eingebaut oder zumindest listenmäßig bestellbar sind. Die Bilderfassungssysteme können entweder zweidimensionale Bilder gewinnen oder die Straßenoberfläche zeilenweise abtasten.
  • Zu dem Sensor gehört auch eine Auswerteelektronik, die eine vorausschauende Hinderniserkennung und insbesondere die Erkennung von Unebenheiten und besonderen Oberflächenstrukturen der Fahrbahn 2 ermöglicht. Die Arbeitsweise derartiger Systeme, die dazu verwendet werden, adaptive Feder/Dämpfer-Systeme an die Fahrbahnbeschaffenheit anzupassen, ist dem Fachmann bekannt.
  • In Fahrtrichtung vor dem Kraftfahrzeug 1 befinden sich auf dem Weg, den die Räder des Kraftfahrzeugs 1 voraussichtlich nehmen werden, zwei Buckel 3 auf der Fahrbahn 2, die mittels des Sensors und seiner Auswerteelektronik im Kraftfahrzeug 1 erkannt werden können.
  • Das Kraftfahrzeug 1 besitzt auch ein sog. Infotainmentsystem, welches die Anzeige und Bedienung von z. B. Autoradio, Navigationssystem und verschiedenen Fahrzeugfunktionen zusammenführt und das auch eine Sprachsteuerung über ein im Kraftfahrzeug 1 eingebautes Mikrofon als Teil eines Spracherkennungssystems aufweist.
  • Werden die Buckel 3 auf der Fahrbahn 2 mittels des Sensors am oder im Kraftfahrzeug 1 erkannt, wird anhand der bekannten Geschwindigkeit bzw. deren Verlauf vorausberechnet, in welchem Zeitpunkt die Buckel 3 von welchen Rädern des Kraftfahrzeugs 1 überfahren werden und wie lange der Einfluss der entsprechenden Erschütterung des Kraftfahrzeugs 1 auf das vom Mikrofon aufgenommene Tonsignal andauern wird.
  • Sodann können während der Dauer von vorhergesagten Fahrgeräuschen, die vom Überfahren der Buckel 3 oder anderen erkannten Unebenheiten der Fahrbahn 2 herrühren, Maßnahmen getroffen werden, welche Spracherkennungsfehler, insbesondere Fehlinterpretationen des Inhalts von in dem selben Zeitpunkt gegebenen Sprachbefehlen oder Fehlinterpretationen der Fahrgeräusche als irgendeinen Sprachbefehl, verhindern oder zumindest weniger wahrscheinlich machen.
  • In einem sehr einfachen Ausführungsbeispiel wird während der vorhergesagten Dauern von Fahrgeräuschen einfach das Mikrofon oder das Spracherkennungssystem deaktiviert.
  • Noch besser ist es, den Einfluss der Buckel 3 und von anderen Fahrbahnunebenheiten auf das Tonsignal in Zeiten zu untersuchen, in denen das Mikrofon keine Sprache aufzeichnet. Dies sind Zeiten, in denen das Spracherkennungssystem mehr oder weniger inaktiv ist und auf ein Aktivierungssignal wartet. Dadurch erhält man im Kraftfahrzeug 1 mit der Zeit empirische Daten, die in der Folge Spracherkennungsfehler bei aktivem Spracherkennungssystem verhindern helfen.
  • Insbesondere äußert sich der Einfluss der Buckel 3 und von anderen Fahrbahnunebenheiten auf das vom Mikrofon aufgenommene Tonsignal in charakteristischen Geräuschen im Zeitpunkt des Überfahrens von Fahrbahnunebenheiten. Diese ermöglichen es, eine Impulsantwortfunktion des Einflusses der Fahrbahn auf das Tonsignal aufzustellen, und zwar nicht nur des Einflusses von Fahrbahnunebenheiten wie z. B. den Buckeln 3, sondern auch von Oberflächenstrukturen der Fahrbahn. So verursacht z. B. das Fahren auf sehr rauem Asphalt oder auf Schotter erhebliche Geräusche im Fahrzeuginnenraum, welche die Güte der Spracherkennung verschlechtern können.
  • Ein entsprechendes Ausführungsbeispiel eines Verfahrens zur Verbesserung von automatischer Spracherkennung in einem Kraftfahrzeug wird nun unter weiterer Bezugnahme auf 2 näher erläutert.
  • In einem Schritt S1 werden mit dem im Kraftfahrzeug 1 eingebauten Kamera-Sensor laufend Bilder eines Abschnitts der in Fahrtrichtung liegenden Fahrbahnoberfläche aufgenommen.
  • In einem Schritt S2 werden Ort und Größe von voraus liegenden Buckeln 3 oder Vertiefungen oder anderen Fahrbahnunebenheiten bestimmt, wobei die Größe der Unebenheiten durch deren Länge, Breite und Tiefe gegeben ist. Es kann auch die Form von deren Rändern ermittelt werden, z. B. ob die Ränder von Buckeln 3 ausgefranst sind. Somit werden mittels des Kamera-Sensors Beobachtungsdaten der Fahrbahnbeschaffenheit gewonnen.
  • In einem Schritt S3 werden Fahrzeuggeometriedaten, zu denen insbesondere die Positionen der Reifen am Kraftfahrzeug 1 gehören, und Fahrzeugbewegungsdaten, zu denen insbesondere dessen Geschwindigkeit und Bewegungsrichtung gehören, aber auch Gierwinkel, Lenkwinkel usw. gehören können, gewonnen. Diese Daten können z. B. über einen Fahrzeug-CAN-Bus von einem Fahrzeugsteuermodul abgerufen werden. Sodann wird unter Verwendung der in Schritt S1 erhaltenen Beobachtungsdaten geprüft, ob ein Teil eines erkannten Buckels 3 oder dgl. in Übereinstimmung mit den Fahrzeuggeometriedaten und den Fahrzeugbewegungsdaten voraussichtlich von einem Reifen des Kraftfahrzeugs 1 überfahren werden wird. Dabei können auch Winkel berücksichtigt werden, unter denen Reifen auf einen Buckel treffen, z. B. weil die Stoßreaktion bei Kurvenfahrt anders ist als bei Geradeausfahrt.
  • Wird im Schritt S3 festgestellt, dass ein Teil eines erkannten Buckels 3 oder dgl. voraussichtlich von einem Reifen überfahren werden wird, werden in einem Schritt S4 Beginn und Dauer des dadurch zu erwartenden Stoßes vorausberechnet, und während des Stoßes wird das im Kraftfahrzeug 1 eingebaute Mikrofon aufnehmen gelassen, z. B. indem ein Mikrofoneingang bei inaktiver Spracherkennung geöffnet wird. Anhand der erhaltenen Tonaufnahme wird der Einfluss des Buckels 3 auf das Spracherkennungssystem ermittelt. Dazu kann insbesondere eine Impulsantwortfunktion für das Eintreten in den Buckel 3 und für das Austreten aus dem Buckel 3 berechnet werden, z. B. nach dem ARMA-Modell (Autoregressive-Moving Average) einem Modell für stationäre, zeitdiskrete stochastische Prozesse, oder nach dem ARIMA-Modell (Autoregressive-Integrated-Moving Average).
  • Außerdem werden im Schritt S4 typische Geräuschparameter für Buckel 3 oder dgl. gespeichert, die mit der Zeit von Reifen des Kraftfahrzeugs 1 überfahren werden, und es werden Korrelationen mit den zuvor berechneten Impulsantwortfunktionen gesucht und gefunden, welche von der Größe und insbesondere der Länge, Breite, Tiefe und Fläche der von Reifen getroffenen Buckelteile und auch davon abhängen können, welche Reifen betroffen sind.
  • Fahrgeräusche und deren Charakteristika wie z. B. die im Schritt S4 gewonnenen Geräuschparameter hängen natürlich auch von der Geschwindigkeit und vom Typ des verwendeten Fahrzeugs ab. Die Geschwindigkeit ist im Fahrzeug bekannt und kann leicht berücksichtigt werden. Andere Einflussgrößen wie z. B. der Fahrzeugtyp müssen bei der Erfindung nicht eigens berücksichtigt werden, da ein im Fahrzeug ermitteltes „akustisches Modell“ des Fahrzeug, das die Geräuschantwort auf das Passieren von Fahrbahnunebenheiten voraussagt, die komplette Geräuschübertragungskette durch alle Fahrzeugmaterialien hindurch einschließt.
  • Die im Schritt S4 erhaltenen Geräuschparameter, die zu verschiedenen Fahrbahnunregelmäßigkeiten gehören, und deren Korrelationen mit Impulsantwortfunktionen werden im Schritt S5 dazu verwendet, Tonsignale zu reinigen, die von dem Mikrofon aufgenommen und sprachanalysiert werden, während die Spracherkennung aktiv ist.
  • Die im Schritt S1 von dem Kamera-Sensor aufgenommenen Bilder können in einem Schritt S6 zusätzlich dazu verwendet werden, die Oberflächenstruktur der voraus liegenden Fahrbahn zu bestimmen, insbesondere deren Rauigkeit, aber auch deren Helligkeit und Farbton, welche auf das Fahrbahnmaterial wie z. B. Asphalt oder Beton schließen lassen. Oberflächenstrukturen der Fahrbahn lassen sich möglicherweise leichter erkennen, wenn man die von digitalen Kameras üblicherweise gelieferten RGB-Bilder in andere Farbräume transformiert.
  • Im Schritt S6 ermittelten Oberflächenstrukturen können in einem Schritt S7 Tonsignale zugeordnet werden, die aufgenommen werden, während der zugehörige Fahrbahnabschnitt überfahren wird und die Spracherkennung inaktiv ist.
  • Anhand der erhaltenen Tonaufnahmen wird in einem Schritt S8 der Einfluss von unterschiedlichen Oberflächenstrukturen auf das Spracherkennungssystem ermittelt, und zwar unabhängig von der Ermittlung von Impulsantwortfunktionen im Schritt S4.
  • Dazu können Autokorrelations- und/oder Kreuzkorrelationsverfahren verwendet werden, um Geräuschparameter wie z. B. mittlere Amplitude, Varianz der Störung, Asymmetrie und dgl. zu bestimmen. Es können auch Standardprozeduren zu Analyse von stochastischen Prozessen angewendet werden, welche z. B. als Doob-Meyer- oder Doob-Meyer-Fisk-Zerlegung bekannt sind. Auf diese Weise werden Impulsantwortfunktionen des Einflusses von unterschiedlichen Fahrbahnstrukturen auf das Tonsignal erhalten.
  • Die im Schritt S8 erhaltenen Geräuschparameter, die zu verschiedenen erkannten Fahrbahnoberflächenstrukturen gehören, können im Schritt S5 ebenfalls dazu verwendet, Tonsignale zu reinigen, die von dem Mikrofon aufgenommen und analysiert werden, während die Spracherkennung aktiv ist.

Claims (8)

  1. Verfahren zur Verbesserung von automatischer Spracherkennung in einem fahrenden Fahrzeug (1), wobei - ein in Fahrtrichtung vor dem Fahrzeug (1) liegender Abschnitt der Fahrbahn (2) mit einem im oder am Fahrzeug (1) eingebauten Sensor beobachtet wird (Schritt S1); - anhand der erhaltenen Beobachtungsdaten Ort und Größe von vorausliegenden Fahrbahnunebenheiten (3) bestimmt werden (Schritt S2); - geprüft wird, ob Teile von erkannten Fahrbahnunebenheiten voraussichtlich von einem Reifen des Fahrzeugs (1) überfahren werden (Schritt S3); - während der Dauer des Überfahrens von erkannten Fahrbahnunebenheiten (3) durch ein im Fahrzeug (1) eingebautes Mikrofon ein Tonsignal aufgenommen gelassen wird und anhand der erhaltenen Tonaufnahmen der Einfluss von Fahrbahnunebenheiten auf die Spracherkennung ermittelt und gespeichert wird (Schritt S4); und - von dem Mikrofon aufgenommene Tonsignale von Fahrgeräuschen gereinigt werden, die von Unebenheiten (3) der Fahrbahn herrühren, bevor die Tonsignale einer Spracherkennung unterzogen werden (Schritt S5).
  2. Verfahren nach Anspruch 1, wobei außerdem - anhand der im Schritt S1 erhaltenen Beobachtungsdaten außerdem Oberflächenstrukturen der vorausliegenden Fahrbahn (2) ermittelt werden (Schritt S6); - ermittelten Oberflächenstrukturen Tonsignale zugeordnet werden, die aufgenommen werden, während eine entsprechende Oberflächenstruktur überfahren wird (Schritt S7); - der Einfluss von Oberflächenstrukturen auf das Spracherkennungssystem ermittelt und gespeichert wird (S8); und - von dem Mikrofon aufgenommene Tonsignale auch von Fahrgeräuschen gereinigt werden, die von der Oberflächenstruktur der Fahrbahn (2) herrühren, bevor die Tonsignale einer Spracherkennung unterzogen werden (Schritt S5).
  3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass der Sensor eine oder mehrere Kameras und/oder Laserscanner umfasst und/oder Teil eines Radarsystems ist.
  4. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass der Sensor Teil einer Einrichtung für vorausschauende optische Hinderniserkennung ist, welche Zeiten liefert, zu denen Beeinträchtigungen des Mikrofonsignals durch vorübergehende Fahrgeräusche zu erwarten sind.
  5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass anhand der erhaltenen Beobachtungsdaten die Fahrbahnbeschaffenheit abgeschätzt wird und Zeiten berechnet werden, zu denen Beeinträchtigungen des Mikrofonsignals durch stärkere Abrollgeräusche zu erwarten sind.
  6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Vorhersage der Fahrgeräusche neben deren Beginn und Dauer auch die Vorhersage von Charakteristika der Fahrgeräusche umfasst.
  7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass Charakteristika der Fahrgeräusche aus Mikrofonsignalen ermittelt werden, in denen keine Sprachsignale enthalten sind.
  8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass Mikrofonsignale, in denen keine Sprachsignale enthalten sind, während vorhergesagten Dauern von Fahrgeräuschen aufgenommen werden, die von Unebenheiten (3) oder der Oberflächenstruktur der Fahrbahn (2) herrühren.
DE102016225019.1A 2015-12-29 2016-12-14 Verfahren zur Verbesserung von Spracherkennung in einem Fahrzeug Active DE102016225019B4 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102015226780.6 2015-12-29
DE102015226780 2015-12-29

Publications (2)

Publication Number Publication Date
DE102016225019A1 DE102016225019A1 (de) 2017-06-29
DE102016225019B4 true DE102016225019B4 (de) 2020-12-10

Family

ID=59010740

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102016225019.1A Active DE102016225019B4 (de) 2015-12-29 2016-12-14 Verfahren zur Verbesserung von Spracherkennung in einem Fahrzeug

Country Status (3)

Country Link
US (1) US10283113B2 (de)
CN (1) CN106935245B (de)
DE (1) DE102016225019B4 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180627B (zh) * 2017-06-22 2020-10-09 潍坊歌尔微电子有限公司 去除噪声的方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0667690A (ja) * 1992-08-20 1994-03-11 Ricoh Co Ltd 車載用音声認識装置
US20140303905A1 (en) * 2013-04-05 2014-10-09 Hyundai Motor Company System and method for quantifying correlation between road surface profile and road noise
US20150012267A1 (en) * 2013-07-02 2015-01-08 Audi Ag Countermeasures for voice recognition deterioration due to exterior noise from passing vehicles

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001165647A (ja) * 1999-12-06 2001-06-22 Toyota Central Res & Dev Lab Inc 路面騒音評価装置
US7725315B2 (en) 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
JP4134989B2 (ja) * 2004-03-10 2008-08-20 ヤマハ株式会社 車載用音響機器
EP1732352B1 (de) * 2005-04-29 2015-10-21 Nuance Communications, Inc. Erkennung und Unterdrückung von Windgeräuschen in Mikrofonsignalen
DE102006030178A1 (de) 2006-06-30 2008-01-03 Robert Bosch Gmbh Verfahren und System zur Unterstützung des Fahrers eines Kraftfahrzeugs bei der Erkennung von Bodenschwellen
WO2009064877A1 (en) * 2007-11-13 2009-05-22 Tk Holdings Inc. System and method for receiving audible input in a vehicle
KR101239318B1 (ko) * 2008-12-22 2013-03-05 한국전자통신연구원 음질 향상 장치와 음성 인식 시스템 및 방법
US9230531B2 (en) * 2013-07-29 2016-01-05 GM Global Technology Operations LLC Road noise masking in a vehicle

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0667690A (ja) * 1992-08-20 1994-03-11 Ricoh Co Ltd 車載用音声認識装置
US20140303905A1 (en) * 2013-04-05 2014-10-09 Hyundai Motor Company System and method for quantifying correlation between road surface profile and road noise
US20150012267A1 (en) * 2013-07-02 2015-01-08 Audi Ag Countermeasures for voice recognition deterioration due to exterior noise from passing vehicles

Also Published As

Publication number Publication date
CN106935245B (zh) 2022-01-14
CN106935245A (zh) 2017-07-07
US10283113B2 (en) 2019-05-07
DE102016225019A1 (de) 2017-06-29
US20170186423A1 (en) 2017-06-29

Similar Documents

Publication Publication Date Title
EP3288805B1 (de) Sensoranordnung zum erkennen eines zustands einer fahrbahn mit zumindest zwei beabstandeten ultraschallsensoren, fahrerassistenzsystem, kraftfahrzeug sowie dazugehöriges verfahren
EP3288804A1 (de) Sensoranordnung zum erkennen eines zustands einer fahrbahn mit einem ultraschallsensor, fahrerassistenzsystem, kraftfahrzeug sowie dazugehöriges verfahren
WO2015120953A1 (de) Verfahren zum betrieb eines fahrerassistenzsystems für überholvorgänge und kraftfahrzeug
DE102004045690A1 (de) Vorrichtung zur Bestimmung externer Schallquellen in der Umgebung eines Kraftfahrzeugs und entsprechendes Fahrerassistenzsystem
DE102015106400A1 (de) Sensoranordnung zum Erkennen eines Zustands einer Fahrbahn mit zumindest zwei Ultraschallsensoren, Fahrerassistenzsystem, Kraftfahrzeug sowie dazugehöriges Verfahren
DE102014101550B4 (de) Vorrichtung zur Information über ein sich näherndes Fahrzeug
DE102011080933A1 (de) Verfahren zur Unterstützung eines Fahrers beim Einparken
DE102007030731A1 (de) System und Verfahren zur Stützung einer Längsführung eines Fahrzeugs
DE102015221361A1 (de) Verfahren und Vorrichtung zur Fahrerunterstützung
DE102011118726A1 (de) Verfahren zum Erkennen einer Parklücke für ein Kraftfahrzeug, Parkhilfesystem und Kraftfahrzeug mit einem Parkhilfesystem
DE102012015764A1 (de) Kraftfahrzeug mit einem Überflutungserkennungssystem und entsprechendes Verfahren
EP1484620B1 (de) Vorrichtung und Verfahren zum Erkennen des Konturverlaufes eines Hindernisses
DE102012215014A1 (de) Verfahren zur Überwachung eines toten Winkels und Fahrassistenzsystem
EP1562053B1 (de) Einrichtung und Verfahren für die Überwachung der Umgebung eines Kraftfahrzeugs
DE102005045260A1 (de) Verfahren zur Vermessung von Parklücken
DE102012208302A1 (de) Verfahren zur Bereitstellung von Informationen über eine Umgebung eines Fahrzeugs
DE102016225019B4 (de) Verfahren zur Verbesserung von Spracherkennung in einem Fahrzeug
EP3602119B1 (de) Verfahren zum erfassen eines objekts in einem umgebungsbereich eines kraftfahrzeugs mit klassifizierung des objekts, ultraschallsensorvorrichtung sowie kraftfahrzeug
DE102015122413B4 (de) Verfahren zum Betreiben eines Ultraschallsensors eines Kraftfahrzeugs, Ultraschallsensorvorrichtung, Fahrerassistenzsystem sowie Kraftfahrzeug
DE102019207343A1 (de) Verfahren und Vorrichtung zur Erkennung einer nassen oder feuchten Fahrbahn, Computerproduktprogramm und Speichermedium
DE102018221449A1 (de) Sensorsystem zur Objekterkennung
DE102016118178A1 (de) Verfahren zur Überwachung eines Totwinkelbereichs eines Kraftfahrzeugs mithilfe eines Ultraschallsensors, Fahrerassistenzsystem sowie Kraftfahrzeug
DE102022200154A1 (de) Verfahren zum Erfassen von Informationen zu einer Windschutzscheibe
DE102019203191B3 (de) Verfahren zur Erkennung einer nassen oder feuchten Fahrbahn im Bereich eines Fahrzeugs
DE102017208382B4 (de) Verfahren zur Verbesserung von vorübergehend beeinträchtigter Spracherkennung in einem Fahrzeug

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final
R082 Change of representative

Representative=s name: MARKOWITZ, MARKUS, DR.-ING., DE