DE10058786A1 - Verfahren zum Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts - Google Patents

Verfahren zum Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts

Info

Publication number
DE10058786A1
DE10058786A1 DE10058786A DE10058786A DE10058786A1 DE 10058786 A1 DE10058786 A1 DE 10058786A1 DE 10058786 A DE10058786 A DE 10058786A DE 10058786 A DE10058786 A DE 10058786A DE 10058786 A1 DE10058786 A1 DE 10058786A1
Authority
DE
Germany
Prior art keywords
signal
volume
output
command signal
acoustic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE10058786A
Other languages
English (en)
Inventor
Volker Stahl
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Philips Intellectual Property and Standards GmbH
Original Assignee
Philips Corporate Intellectual Property GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Corporate Intellectual Property GmbH filed Critical Philips Corporate Intellectual Property GmbH
Priority to DE10058786A priority Critical patent/DE10058786A1/de
Priority to EP01991744A priority patent/EP1340224A1/de
Priority to PCT/EP2001/013468 priority patent/WO2002043049A1/de
Priority to CN018042198A priority patent/CN1216364C/zh
Priority to KR1020027009554A priority patent/KR20020071966A/ko
Priority to US10/240,592 priority patent/US20030138118A1/en
Priority to JP2002544708A priority patent/JP2004514926A/ja
Publication of DE10058786A1 publication Critical patent/DE10058786A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

Die Erfindung betrifft ein Verfahren zur Steuerung eines eine akustische Ausgabeeinrichtung (2) aufweisenden Geräts (1) mittels akustischer Befehlssignale (BS). Die Erfindung schlägt vor, dass das Gerät (1) automatisch seine Lautstärke reduziert, wenn das Gerät (1) erkennt, dass ein akustisches Befehlssignal an das Gerät (1) übermittelt wird.

Description

Die Erfindung betrifft ein Verfahren zur Steuerung eines eine akustische Ausgabeein­ richtung aufweisenden Geräts mittels akustischer Befehlssignale. Darüber hinaus betrifft die Erfindung ein Gerät mit einer akustischen Ausgabeeinrichtung, mit einer Empfangsein­ richtung zum Empfang akustischer Befehlssignale, mit einer Erkennungseinrichtung zum Erkennen dieser Befehlssignale und mit einer Steuereinrichtung zum Steuern des Geräts in Abhängigkeit von einem erkannten Befehlssignal.
Um die Benutzerfreundlichkeit und die Einsatzmöglichkeiten von Geräten, insbesondere von Geräten im Bereich der Consumer-Elektronik, zu erhöhen und die Geräte damit attraktiver zu machen, werden immer mehr Geräte derart ausgestattet, dass eine Steuerung des Geräts mittels akustischer Befehlssignale möglich ist. So werden auf dem Markt bereits seit längerem schaltbare Geräte wie beispielsweise Wecker oder Leuchten angeboten, die mittels sehr einfacher akustischer Befehlssignale, beispielsweise Geräusche wie Klatschen oder Pfeifen, ein- bzw. ausgeschaltet oder zwischen verschiedenen Modi hin- und hergeschaltet werden können. Mit zunehmender Entwicklung von Spracherkennungs­ systemen gibt es darüber hinaus auch Geräte, die als Befehlssignale verschiedene Sprach­ befehle erkennen können und akzeptieren, so dass auch kompliziertere Steuerungen solcher Geräte möglich sind. Derartige sprachsteuerbare Geräte sind ausgesprochen komfortabel, da der Bediener das jeweilige Gerät freihändig bedienen kann. Große Vorteile hat dieses Steuerungsverfahren folglich überall dort, wo der Bediener seine Hände für andere Tätig­ keiten benötigt, etwa bei der Steuerung eines Autoradios, bei der der Bediener zur Ver­ änderung der Lautstärke oder zur Einstellung eines neuen Kanals nicht die Hände vom Lenkrad nehmen muss. Darüber hinaus ist dieses Verfahren aber auch allgemein zur Bedienung von Geräten deshalb sehr attraktiv, weil durch eine solche Sprachsteuerung die Schnittstelle zwischen Mensch und Maschine (MMI; Man-Machine-Interface) von der bisher üblichen Kommunikationsebene von Maschinen, nämlich einer Bedienung durch Knöpfe und Regler, auf die dem Menschen eigene Kommunikationsebene, nämlich eine Informationsübermittlung per Sprache, verlagert wird. Eine Schwierigkeit ergibt sich jedoch bei der Steuerung von Geräten, die eine akustische Ausgabeeinrichtung aufweisen und die funktionsgemäß selbst akustische Signale erzeugen, d. h. beispielsweise alle Audio- oder audiovisuellen Geräte wie Radio, CD-Player, Fernseher, Video-Abspielgeräte, Computer etc. Bei derartigen Geräten mit einer Audiofunktion empfängt die Erkennungs­ einrichtung, welche die Befehlssignale identifizieren soll, nicht nur das Befehlssignal allein, sondern auch das vom Gerät selbst erzeugte akustische Ausgangssignal (beispielsweise bei einem CD-Player die abgespielte Musik) als akustisches Echo. Das eigene Ausgangssignal liegt folglich wie ein Hintergrundgeräusch unter dem Befehlssignal. Je nach Lautstärke des Befehlssignals bzw. des eigenen Ausgangssignals führt dies zu erheblichen Problemen bei der Erkennung der Befehlssignale.
Üblicherweise wird zur Verbesserung der Erkennungsleistung bei solchen Geräten das sogenannte "AEC-Verfahren" (Acoustic Echo Cancellation) angewandt. Bei diesem Ansatz wird das vom Gerät selbst generierte Ausgangssignal genutzt, um ein Raumimpuls- Antwortsignal abzuschätzen, d. h. das Signal abzuschätzen, das durch eine Reflexion des Ausgangssignals innerhalb des Raums, in welchem sich das Gerät befindet, von der Auf­ nahmeeinrichtung wieder erfasst wird. Dies geschieht in einem sogenannten "adaptiven Filterverfahren", bei dem iterativ eine Transferfunktion ermittelt wird, mit der das ursprüngliche Ausgangssignal zunächst transformiert wird und dann das so transformierte Ausgangssignal in einem Filter von dem empfangenen Gesamteingangssignal abgezogen wird. Das Verfahren ist insoweit adaptiv, als das Iterationsverfahren permanent weiter­ geführt wird und somit Veränderungen im Raum, welche mit einer Veränderung der Transferfunktion einhergehen, erfasst werden. Beispielsweise könnten sich Veränderungen im akustischen Echo ergeben, wenn innerhalb des Raums eine Gardine auf oder zuge­ zogen wird, eine Tür geöffnet wird oder sich Personen innerhalb des Raums bewegen. Im Allgemeinen ist dieses Verfahren recht erfolgreich. Es ist jedoch beobachtet worden, dass die Genauigkeit von Spracherkennungssystemen signifikant nachlässt, wenn die Lautstärke des Ausgangssignals des Geräts selbst ansteigt. Der Grund hierfür liegt darin, dass der adaptive AEC-Filter die Raumcharakteristika nicht optimal modellieren kann und daher die Störung des Signals nach dem Ausfiltern des akustischen Echos in etwa proportional zur Lautstärke des Geräts selbst ist.
Es ist Aufgabe der vorliegenden Erfindung, ein einfaches und benutzerfreundliches Ver­ fahren zur akustischen Steuerung von Geräten, welche selbst ein akustisches Ausgangs­ signal erzeugen, sowie ein entsprechendes Gerät zu schaffen, bei dem die Erkennungs­ genauigkeit der Befehlssignale gegenüber dem bisherigen Stand der Technik verbessert ist.
Diese Aufgabe wird durch ein Verfahren gemäß Anspruch 1 und ein Gerät gemäß Anspruch 10 gelöst.
Erfindungsgemäß wird von dem Gerät selbst sofort die Lautstärke reduziert, sobald das Gerät erkennt, dass ein mögliches akustisches Befehlssignal an das Gerät übermittelt wird. Durch die automatische Reduzierung der Lautstärke des Geräts ist das Befehlssignal für das Gerät aufgrund des kleineren akustischen Echos leichter und sicherer erkennbar. Außer­ dem ist es für den Benutzer in der Regel angenehmer, ein Sprachkommando zu äußern, wenn das Audiogerät nicht so laut ist. Im übrigen wird durch die Verminderung der Laut­ stärke auch der sogenannte "Lombard-Effekt" vermindert, der bedeutet, dass ein Mensch automatisch anders, beispielsweise lauter und akzentuierter spricht, wenn er gegen Hinter­ grundgeräusche ansprechen muss, was zwangsläufig Auswirkungen auf die Erkennungs­ leistung eines Spracherkennungssystems hat.
Ein entsprechendes erfindungsgemäßes Gerät muss zunächst eine akustische Ausgabe­ einrichtung, eine Empfangseinrichtung zum Empfang der akustischen Befehlssignale, beispielsweise ein übliches Mikrofon, sowie eine Erkennungseinrichtung zum Erkennen dieser Befehlssignale und eine Steuereinrichtung zum Steuern des Geräts in Abhängigkeit von einem erkannten Befehlssignal aufweisen. Darüber hinaus muss das Gerät geeignete Mittel zur Erkennung, dass die Empfangseinrichtung ein mögliches Befehlssignal für das Gerät empfängt, sowie geeignete Mittel aufweisen, mit denen die Lautstärke des von der akustischen Ausgabeeinrichtung ausgegebenen Ausgangssignals reduziert wird, sobald der Empfang eines möglichen Befehlssignals für das Gerät erkannt wird.
Eine solche Erkennung, dass ein Befehlssignal an das Gerät gerichtet ist, ist auf ver­ schiedene Weise möglich. Beispielsweise kann das Gerät so ausgestattet bzw. eingestellt sein, dass ein von einem bestimmten Benutzer in einer definierten Lautstärke und/oder Tonlage und/oder Sprechrichtung gesprochenes Wort als mögliches Befehlssignal erkannt wird und daraufhin die Lautstärke reduziert wird.
Bei einer besonders einfachen, bevorzugten Ausführungsform wird dem eigentlichen Befehlssignal ein Schlüsselbefehlssignal vorausgeschickt, bei dessen Erkennung die Laut­ stärke reduziert wird. Bei diesem Schlüsselbefehlssignal handelt es sich sinnvollerweise um genau das Befehlssignal, welches das Gerät in einen Bereitschaftszustand zum Empfang von weiteren Befehlssignalen versetzt, d. h. welches die Steuereinrichtung des jeweiligen Geräts zunächst aktiviert. Derartige "Aktivierungssignale" sind in vielen Fällen ohnehin notwendig, da auf diese Weise verhindert werden kann, dass unbeabsichtigt vom Nutzer abgegebene Befehlssignale, beispielsweise bestimmte Wörter innerhalb eines Gesprächs oder andere Hintergrundgeräusche, vom Gerät identifiziert und akzeptiert werden und so eine Steuerungsaktion durchgeführt wird, die eigentlich nicht erwünscht ist. Insbesondere sind solche Schlüsselbefehlssignale sinnvoll, wenn in derselben Umgebung mehrere sprachsteuerbare Geräte vorhanden sind, die jeweils ähnliche oder gleiche Befehlssignale akzeptieren. In diesem Fall muss durch ein entsprechendes Schlüsselbefehlssignal das Gerät, für welches ein bestimmtes Befehlssignal gedacht ist, durch ein vorangestelltes Schlüsselbefehlssignal angesprochen werden. So könnten beispielsweise ein sprachge­ steuerter Computer und ein Fernsehgerät unmittelbar nebeneinander angeordnet sein, und den Befehlssignalen für die Geräte wird jeweils das Schlüsselbefehlssignal "Computer" oder "TV" vorangesetzt.
Die automatische Reduzierung der Lautstärke des Ausgangssignals des Geräts bei Erkennen des Schlüsselbefehlssignals hat außerdem den Vorteil, dass dem Benutzer auf diese Weise gleich mitgeteilt wird, dass das jeweilige Gerät sich im Bereitschaftszustand zum Empfang von weiteren Befehlssignalen befindet und sozusagen dem Benutzer "zuhört". Optional kann das Gerät auch noch zusätzlich eine visuelle oder akustische Bestätigung für den Empfang des Schlüsselbefehlssignals abgeben.
Das Heraufsetzen der Lautstärke erfolgt vorzugsweise automatisch dann wieder, nachdem ein - beispielsweise dem Schlüsselbefehl nachfolgendes - Befehlssignal erkannt wurde. Dies bedeutet z. B., dass nach jedem Schlüsselbefehlssignal genau ein Befehlssignal akzeptiert wird. Alternativ dazu ist es möglich, dass nach Ablauf einer bestimmten Zeitspanne nach Erkennung des Schlüsselbefehlssignals bzw. eines Befehlssignals die Lautstärke wieder automatisch auf den zuvor eingestellten Wert zurückgestellt wird. In diesem Fall würde das Gerät nach Erhalt eines Befehlssignals noch eine gewisse Zeit abwarten, ob ein weiteres Befehlssignal kommt. Erst dann würde das Gerät automatisch aus dem Bereitschaftszustand bzw. aktivierten Zustand zurückschalten.
Bei einem besonders bevorzugten Ausführungsbeispiel wird die Lautstärke des Ausgangs­ signals in Abhängigkeit von einer ermittelten Befehlssignalenergie reduziert. Unter Befehls­ signalenergie wird hierbei die Signalenergie der empfangenen Befehlssignale verstanden, wobei das Schlüsselbefehlssignal selbstverständlich auch als ein - besonderes - Befehlssignal in diesem Sinne zu verstehen ist. So könnte beispielsweise die Lautstärke des eigenen Ausgangssignals dieses Geräts nur dann reduziert werden, wenn das eigene Ausgangssignal tatsächlich im Verhältnis zu den Befehlssignalen so laut ist, dass eine zuverlässige Erken­ nung der Befehlssignale nicht mehr gewährleistet werden kann. Dies lässt sich auf einfache Weise dadurch steuern, dass das Verhältnis zwischen der Ausgangssignalenergie oder der Signalenergie des ermittelten bzw. abgeschätzten akustischen Echos des Ausgangssignals und der Befehlssignalenergie ermittelt wird. Nur wenn dieses Verhältnis innerhalb eines bestimmten Wertebereichs bezüglich eines vorgegebenen Schwellwerts liegt, wird die Lautstärke reduziert. Beispielsweise wird, wenn das Verhältnis von der Energie des Aus­ gangssignals bzw. des akustischen Echos zu der Befehlssignalenergie ermittelt wird, nur dann, wenn dieses Verhältnis oberhalb eines vorgegebenen Schwellwerts liegt, die Laut­ stärke reduziert. Andersherum wird, wenn das Verhältnis von der Befehlssignalenergie zu der Ausgangssignalenergie bzw. der Energie des akustischen Echos ermittelt wird, nur dann die Lautstärke reduziert, wenn dieses Verhältnis unterhalb eines vorgegebenen Schwellwerts liegt. Die Befehlssignalenergie kann beispielsweise am Eingang der Empfangseinrichtung bzw. des Mikrofons gemessen werden.
Bei einem besonders bevorzugten Verfahren wird dabei die Lautstärke des Ausgangssignals genau so weit reduziert, bis das Verhältnis der Signalenergien auf einem vorgegebenen Wert liegt. Für den Benutzer bedeutet dies, dass, wenn das vom Gerät selbst ausgegebene akustischen Signal, beispielsweise die Musik eines CD-Players, ohnehin leise ist oder wenn der Benutzer sich nah am Mikrofon des Geräts befindet, die Musiklautstärke nicht reduziert wird, sondern unverändert bleibt. Ansonsten wird die Lautstärke soweit reduziert, dass die Musikenergie und die Energie des Sprachbefehls am Mikrofoneingang ein vor­ bestimmtes Verhältnis haben. Dieses Verhältnis kann vom Benutzer zuvor definiert und eingestellt werden oder kann auch automatisch dadurch definiert sein, dass eine bestimmte Erkennungszuverlässigkeit der Erkennungseinrichtung erreicht wird.
Insbesondere in diesem Fall ist es sinnvoll, wenn das Gerät zusätzliche Mittel zur visuellen oder akustischen Anzeige aufweist, die anzeigen, dass das Schlüsselbefehlssignal erkannt wurde, da der Benutzer sich nicht immer darauf verlassen kann, dass die Lautstärke nach Erkennung des Schlüsselbefehlssignals reduziert wird.
Das Gerät weist vorzugsweise zusätzlich eine Filtereinrichtung zum Ausfiltern eines akustischen Echos des vom Gerät selbst ausgegebenen Ausgangssignals aus dem vom Gerät empfangenen Gesamtsignal auf. Das heißt, das neuartige Verfahren wird zusätzlich zu einem AEC-Verfahren verwendet, um so eine optimale Erkennungsleistung zu erzielen.
Typische Sprachkommandos, welche zur Steuerung von Audiogeräten oder audiovisuellen Geräten verwendet werden, sind Kommandoworte, um die Lautstärke des Geräts zu steuern. Bei derartigen "Lautstärke-Befehlssignalen" kann es sich beispielsweise um die Worte "lauter" oder "leiser" handeln. Da erfindungsgemäß vom Gerät sofort nach Erkennung des Schlüsselbefehlssignals die Lautstärke reduziert wird, kann der Benutzer nicht mehr erkennen, welchen Effekt sein Lautstärke-Befehlssignal selbst hat. Vorzugsweise wird für derartige Lautstärke-Befehlssignale daher vom Gerät selbst, nachdem ein solches Lautstärke-Befehlssignal erkannt wurde, die Lautstärke zunächst wieder auf den vor der Reduzierung eingestellten Wert zurückgestellt. Erst danach wird die Lautstärke auf einen dem Lautstärke-Befehlssignal entsprechenden Wert umgestellt. Das heißt, es wird beispielsweise bei Erkennung des Wortes "leiser" die Lautstärke um eine bestimmte Stufe herabgesetzt bzw. bei Erkennung des Wortes "lauter" um eine bestimmte Stufe herauf­ gesetzt.
Die Erfindung wird nachfolgend unter Bezugnahme auf die beigefügte Figur anhand eines Ausführungsbeispiels näher erläutert.
Die einzige Figur zeigt hierbei ein schematisches Blockschaltbild eines Audiogeräts 1, beispielsweise eines CD-Players, wobei nur die für die Erfindung wesentlichen Komponenten dargestellt sind.
Das Audiogerät 1 weist dabei zunächst eine Audiosignalquelle 6 auf. Bei dieser Audio­ signalquelle 6 handelt es sich bei einem CD-Player beispielsweise um das CD-Laufwerk, die Abtasteinrichtung und die Elektronik zur Umsetzung der erfassten optischen Daten in das Audiosignal. Das von der Audiosignalquelle 6 erzeugte Audiosignal wird dann an einen Verstärker 8, beispielsweise eine übliche Endstufe 8, weitergeleitet und von dort über eine akustische Ausgabeeinrichtung 2, hier einen üblichen Lautsprecher 2, ausgegeben.
Zur Steuerung weist das Gerät 1 eine Steuereinrichtung 5 auf, welche beispielsweise in Form eines Mikrocontrollers oder dergleichen realisiert sein kann. Mittels dieser Steuerein­ richtung 5 kann die Audiosignalquelle 6 angesteuert werden, beispielsweise ein spezieller Titel auf einer CD ausgewählt werden. Diese Steuerungsmöglichkeit ist in der Figur durch die dargestellte Steuerleitung 18 angedeutet. Ebenso kann über die Steuereinrichtung 5 die Lautstärke des Geräts 1 geregelt werden. Dies erfolgt durch Ansteuerung der Endstufe 8. Diese Steuerungsmöglichkeit ist in der Figur durch die Steuerleitung 19 dargestellt.
Die Befehle für die Steuerung erhält das Gerät 1 in Form von akustischen Befehlssignalen BS, hier Sprachbefehlen, die der Benutzer über eine Aufnahmeeinrichtung 3, hier ein Mikrofon 3, eingibt und die über die Leitungen 14, 15 an eine Erkennungseinrichtung 4, hier ein Spracherkennungssystem 4, weitergeleitet werden. Der erkannte Befehl wird dann über die Signalleitung 17 an die Steuereinrichtung 5 weitergeleitet, welche dann ent­ sprechend dem erhaltenen Befehl die einzelnen Komponenten des Geräts 1 steuert.
Wie in der Figur dargestellt, wird vom Mikrofon 3 nicht nur das Befehlssignal BS, sondern auch ein akustisches Echo AE erfasst, welches durch das vom Lautsprecher 2 des Geräts 1 selbst ausgegebene akustische Signal, hier die Musik von der CD, erzeugt wird. Das akustische Echo AE hängt dabei nicht nur vom ausgegebenen Signal, sondern auch von den akustischen Parametern des Raums ab. Um die Störungen durch dieses akustische Echo AE bei der Erkennung der Befehlssignale BS zu verringern, weist das Gerät eine Filtereinrichtung 9 (im folgenden AEC-Einheit genannt) auf, in dem aus dem am Mikrofon 3 empfangenen Gesamtsignal das akustische Echo AE ausgefiltert wird.
Hierzu wird aus dem Signalausgangszweig, welcher von der Audiosignalquelle 6 über die Endstufe 8 zum Lautsprecher 2 verläuft, vor der Endstufe 8 am Abgriffspunkt 21 das Ausgangssignal abgegriffen und über eine Signalleitung 11 der AEC-Einheit 9 zugeführt, welche das abgegriffene Ausgangssignal mit einer Transferfunktion transformiert. Diese Transferfunktion entspricht der geschätzten Raumimpulsantwort. Die jeweils aktuelle Raumimpulsantwort wird mit einem iterativen Verfahren ermittelt, wobei ständig eine Aktualisierung erfolgt und somit eine adaptive Filterung durchgeführt wird, welche Veränderungen im Raum, beispielsweise durch Bewegungen von Personen oder Gegen­ ständen, berücksichtigt. Das mittels der Transferfunktion transformierte Ausgangssignal wird in einem Addierer 10 der AEC-Einheit 9 von dem über die Signalleitung 14 vom Mikrofon 3 kommenden Gesamtsignal abgezogen. Über die Ausgangsleitung 15 wird von der AEC-Einheit 9 dann das Restsignal, welches idealerweise nur noch dem Befehlssignal BS entspricht, an das Spracherkennungssystem 4 weitergeleitet. Die AEC-Einrichtung 9 weist außerdem einen Eingang 12 auf, an dem das über die Steuerleitung 19 von der Steuereinrichtung 5 an die Endstufe 8 ausgegebene Steuersignal zur Regelung der Laut­ stärke anliegt. In der AEC-Einheit 9 können so die Koeffizienten für die Transferfunktion entsprechend der eingestellten Lautstärke skaliert werden.
Erfindungsgemäß weist das Gerät 1 zusätzlich Mittel 7 in Form eines Abschwächers 7 auf, mit dem die Lautstärke des Geräts 1 reduziert werden kann, wenn vom Spracherkennungs­ system 4 ein Schlüsselbefehlssignal SBS erkannt wird. Im vorliegenden Ausführungsbeispiel muss daher als erstes Befehlssignal dieses Schlüsselbefehlssignal SBS vom Benutzer ge­ sprochen werden. Das Spracherkennungssystem 4 ist so ausgelegt, dass es nur auf dieses spezielle Schlüsselbefehlssignal SBS, d. h. hier ein bestimmtes Kennwort wie zum Beispiel das Wort "CD", wartet. Nachdem dieses Kennwort akzeptiert wurde, wird erst das gesamte komplexe Befehlsvokabular des Spracherkennungssystems 4 aktiviert, und das Gerät 1 ist in einem Bereitschaftsmodus, in dem weitere Befehlssignale erkannt und akzeptiert werden, beispielsweise Befehle wie "lauter", "leiser", "nächster Titel", Titel 5" etc. Nachdem das jeweilige, dem Schlüsselbefehlssignal SBS nachfolgende Befehlssignal BS erkannt wurde, schaltet das Gerät 1 zurück in einen Zustand, wo es wieder auf das Schlüsselbefehlssignal SBS wartet.
Bei Erkennung des Schlüsselbefehlssignals SBS wird erfindungsgemäß automatisch von der Steuereinrichtung 5 über die Steuerleitung 20 der Abschwächer 7 aktiviert und somit die Lautstärke des eigenen Ausgangssignals des Geräts 1 herabgesetzt. Dadurch ist das nach­ folgende Befehlssignal BS, d. h. der eigentliche Befehl, für das Spracherkennungssystem 4 leichter zu identifizieren. Diese Herabsetzung der Lautstärke kann beispielsweise um einen bestimmten Wert, z. B. 10 dB, oder auf eine voreingestellte Lautstärkestufe erfolgen. Es ist auch möglich, die Lautstärke ganz auf Null herabzusetzen.
In dem in der Figur dargestellten Ausführungsbeispiel wird jedoch über die Signalleitungen 13, 16 der Steuereinrichtung 5 die am Signaleingangszweig vor und hinter dem Filter 10 anliegenden Signale zugeführt. Aus diesen Signalen vor und hinter dem Filter 10 kann die Steuereinrichtung 5 ermitteln, welche Signalenergie das akustische Echo AE am Mikrofon aufweist und welche Signalenergie das eigentlich gewünschte Befehlssignal BS aufweist. Die Steuereinrichtung 5 ist so ausgebildet, dass sie die Lautstärke des Ausgangssignals mittels des Abschwächers 7 soweit reduziert, dass ein bestimmtes Verhältnis zwischen Signalenergie des akustischen Echos AE und Signalenergie des Befehlssignals BS gegeben ist. Ist das Verhältnis der Signalenergien bereits unterhalb dieses Wertes, so wird die Lautstärke nicht weiter reduziert. Das heißt, dass die Musiklautstärke dann nicht mehr reduziert wird, wenn die Musik ohnehin leise ist oder wenn der Benutzer sich nah am Mikrofon befindet und die Befehlssignale BS gut zu erkennen sind. Ansonsten wird die Musiklautstärke genau soviel reduziert, dass die Energie der Musik und die Energie der Sprachbefehle am Mikrofoneingang ein vorbestimmtes Verhältnis haben.
Mittels eines einfachen Schalters 22 lässt sich bei dem dargestellten Ausführungsbeispiel der Abschwächer 7 im Signalausgangszweig überbrücken und so die erfindungsgemäße Funktion vom Benutzer auf Wunsch außer Kraft setzen.
Der separate Abschwächer 7 ist hier so im Signalausgangszweig angeordnet, dass das Signal bereits vor der Abzweigstelle 21 zum Abgriff des Ausgangssignals für die AEC-Einheit 9 abgeschwächt wird. Dadurch wird automatisch berücksichtigt, dass bei einer Reduzierung der Lautstärke die AEC-Einheit 9 diese Lautstärkereduzierung bei der Abschätzung der Raumimpulsantwort berücksichtigt. Eine Reduzierung der Lautstärke des Ausgangssignals des Geräts 1 ohne Berücksichtigung in der AEC-Einheit 9 würde zu einer zusätzlichen Störung durch die Filterung im Filter 10 führen und die Erkennung des Befehlssignals BS eher erschweren.
Anstelle des separaten Abschwächers 7 könnte die Lautstärke von der Steuereinrichtung 5 nach Erkennung des Schlüsselbefehlssignals SBS auch durch die Regelung der Endstufe 8 herabgesetzt werden.
Bei dem erfindungsgemäßen Gerät 1 bzw. durch das erfindungsgemäße Verfahren wird die Erkennungsgenauigkeit der Sprachsteuerung durch die Reduktion der Verzerrung des Eingangssignals des Spracherkenners erheblich verbessert. Es wird ein sehr benutzer­ freundliches Sprachinterface geschaffen, da der Benutzer durch die Reduzierung der Lautstärke eine Rückmeldung vom Gerät 1 erhält, dass dieses für ein Sprachkommando bereit ist. Optional kann eine zusätzliche Rückmeldung durch ein visuelles oder weiteres akustisches Signal, beispielsweise einen Signalton, folgen.

Claims (15)

1. Verfahren zur Steuerung eines eine akustische Ausgabeeinrichtung (2) aufweisenden Geräts (1) mittels akustischer Befehlssignale (BS), dadurch gekennzeichnet, dass, sobald das Gerät (1) erkennt, dass ein akustisches Befehlssignal an das Gerät (1) übermittelt wird, automatisch die Lautstärke des von der akustischen Ausgabeeinrichtung (2) ausgegeben Ausgangssignals reduziert wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass zunächst ein akustisches Schlüsselbefehlssignal (SBS) an das Gerät (1) übermittelt wird, durch das das Gerät (1) in einen Bereitschaftszustand zum Empfang von weiteren Befehlssignalen (BS) versetzt wird, und bei einer Erkennung dieses Schlüsselbefehlssignals (SBS) durch das Gerät (1) die Lautstärke des von der akustischen Ausgabeeinrichtung (2) ausgegebenen Ausgangssignals reduziert wird.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Lautstärke des Ausgangssignals in Abhängigkeit von einer ermittelten Befehlssignalenergie reduziert wird.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass die Lautstärke des Ausgangssignals nur reduziert wird, wenn das Verhältnis zwischen einer ermittelten Ausgangssignalenergie oder einer Signalenergie eines ermittelten akustischen Echos (AE) des Ausgangssignals und der Befehlssignalenergie in einem bestimmten Wertebereich bezüglich eines vorgegebenen Schwellwerts liegt.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass die Lautstärke des Ausgangssignals soweit reduziert wird, bis das Verhältnis zwischen der Ausgangssignalenergie oder der Signalenergie des akustischen Echos (AE) des Ausgangssignals und der Befehlssignalenergie einem vorgegebenen Wert entspricht.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass nach der Erkennung eines auf das Schlüsselbefehlssignal (SBS) folgenden Befehlssignals (BS) die Lautstärke wieder auf den vor der Reduzierung eingestellten Wert zurückgestellt wird.
7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass nach Ablauf einer bestimmten Zeitspanne nach der Erkennung eines Schlüsselbefehlssignals (SBS) oder eines Befehlssignals (BS) die Lautstärke wieder auf den vor der Reduzierung eingestellten Wert zurückgestellt wird.
8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass nach der Erkennung eines Lautstärke-Befehlssignals, welches zur Veränderung der Lautstärke übermittelt wird, die Lautstärke zunächst wieder auf den vor der Reduzierung eingestellten Wert zurückgestellt wird und dann auf einen dem Lautstärke-Befehlssignal entsprechenden Wert eingestellt wird.
9. Verfahren nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, dass die Erkennung des Schlüsselbefehlssignals einem Nutzer des Geräts visuell oder akustisch angezeigt wird.
10. Gerät (1) mit einer akustischen Ausgabeeinrichtung (2), mit einer Empfangseinrichtung (3) zum Empfang akustischer Befehlssignale (BS), mit einer Erkennungseinrichtung (4) zum Erkennen dieser Befehlssignale (BS) und mit einer Steuereinrichtung (5) zum Steuern des Geräts (1) in Abhängigkeit von einem erkannten Befehlssignal (BS),
gekennzeichnet durch Mittel zur Erkennung, dass die Empfangseinrichtung (3) ein Befehlssignal (BS) für das Gerät (1) empfängt,
und Mittel (7) zur Reduzierung der Lautstärke des von der akustischen Ausgabeeinrichtung (2) ausgegeben Ausgangssignals, sobald der Empfang eines möglichen Befehlssignals (BS) für das Gerät (1) erkannt wird.
11. Gerät nach Anspruch 10, dadurch gekennzeichnet, dass die Mittel zur Erkennung, dass die Empfangseinrichtung (3) ein Befehlssignal (BS) für das Gerät (1) empfängt, Mittel zur Erkennung eines Schlüsselbefehlssignals (SBS), durch welches das Gerät (1) in einen Bereitschaftszustand zum Empfang von weiteren Befehlssignalen (BS) versetzt wird, umfassen.
12. Gerät nach Anspruch 10 oder 11, gekennzeichnet durch eine Filtereinrichtung (9) zum Ausfiltern eines akustischen Echos (AE) des vom Gerät (1) selbst ausgegebenen Ausgangssignals aus einem von der Empfangseinrichtung (3) empfangenen Gesamtsignal.
13. Gerät nach Anspruch 12, dadurch gekennzeichnet, dass die Mittel (7) zur Reduzierung des Ausgangssignals einer Abzweigstelle des Geräts vor einer Abgriffsstelle (21) angeordnet sind, an welcher ein dem Ausgangssignal entsprechendes Signal für die Filtereinrichtung (9) abgegriffen wird.
14. Gerät nach Anspruch 12 oder 13, dadurch gekennzeichnet, dass die Filtereinrichtung (9) einen Eingang (12) zur Übermittlung eines Steuerbefehls zur Reduzierung der Lautstärke des Ausgangssignals des Geräts (1) aufweist.
15. Gerät nach einem der Ansprüche 10 bis 14, gekennzeichnet durch Mittel (5, 13, 16) zur Ermittlung des Verhältnisses zwischen einer Signalenergie des Ausgangssignals und/oder des akustischen Echos (AE) des Ausgangssignals und einer Signalenergie des Befehlssignals (BS).
DE10058786A 2000-11-27 2000-11-27 Verfahren zum Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts Ceased DE10058786A1 (de)

Priority Applications (7)

Application Number Priority Date Filing Date Title
DE10058786A DE10058786A1 (de) 2000-11-27 2000-11-27 Verfahren zum Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts
EP01991744A EP1340224A1 (de) 2000-11-27 2001-11-19 Verfahren zur steuerung eines eine akustische ausgabeeinrichtung aufweisenden geräts
PCT/EP2001/013468 WO2002043049A1 (de) 2000-11-27 2001-11-19 Verfahren zur steuerung eines eine akustische ausgabeeinrichtung aufweisenden geräts
CN018042198A CN1216364C (zh) 2000-11-27 2001-11-19 具有声音输出装置的设备及其控制方法
KR1020027009554A KR20020071966A (ko) 2000-11-27 2001-11-19 음향 출력 디바이스를 포함하는 유닛의 제어 방법
US10/240,592 US20030138118A1 (en) 2000-11-27 2001-11-19 Method for control of a unit comprising an acoustic output device
JP2002544708A JP2004514926A (ja) 2000-11-27 2001-11-19 音響出力手段を備えたデバイスの制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10058786A DE10058786A1 (de) 2000-11-27 2000-11-27 Verfahren zum Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts

Publications (1)

Publication Number Publication Date
DE10058786A1 true DE10058786A1 (de) 2002-06-13

Family

ID=7664796

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10058786A Ceased DE10058786A1 (de) 2000-11-27 2000-11-27 Verfahren zum Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts

Country Status (7)

Country Link
US (1) US20030138118A1 (de)
EP (1) EP1340224A1 (de)
JP (1) JP2004514926A (de)
KR (1) KR20020071966A (de)
CN (1) CN1216364C (de)
DE (1) DE10058786A1 (de)
WO (1) WO2002043049A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004038695A1 (en) * 2002-10-25 2004-05-06 Motorola Inc Directional speech recognition device and method
DE102013012453B3 (de) * 2013-07-26 2014-10-16 Audi Ag Verfahren zum Betreiben eines Infotainment-Systems eines Kraftwagens und Infotainment-System für einen Kraftwagen

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050010927A (ko) * 2002-06-19 2005-01-28 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호 처리 장치
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
US8607281B2 (en) * 2006-09-07 2013-12-10 Porto Vinci Ltd. Limited Liability Company Control of data presentation in multiple zones using a wireless home entertainment hub
US9319741B2 (en) 2006-09-07 2016-04-19 Rateze Remote Mgmt Llc Finding devices in an entertainment system
US8214219B2 (en) * 2006-09-15 2012-07-03 Volkswagen Of America, Inc. Speech communications system for a vehicle and method of operating a speech communications system for a vehicle
JP5380777B2 (ja) * 2007-02-21 2014-01-08 ヤマハ株式会社 音声会議装置
KR101590332B1 (ko) 2012-01-09 2016-02-18 삼성전자주식회사 영상장치 및 그 제어방법
KR101987255B1 (ko) * 2012-08-20 2019-06-11 엘지이노텍 주식회사 음성 인식 장치 및 이의 음성 인식 방법
US9922646B1 (en) 2012-09-21 2018-03-20 Amazon Technologies, Inc. Identifying a location of a voice-input device
CN102945672B (zh) * 2012-09-29 2013-10-16 深圳市国华识别科技开发有限公司 一种多媒体设备语音控制系统及方法
US9165566B2 (en) 2013-01-24 2015-10-20 Microsoft Technology Licensing, Llc Indefinite speech inputs
DK179691B1 (en) 2013-02-05 2019-03-26 Contour Design Improved pointing device
US8874448B1 (en) * 2014-04-01 2014-10-28 Google Inc. Attention-based dynamic audio level adjustment
KR102338041B1 (ko) * 2014-09-29 2021-12-10 현대모비스 주식회사 음성 인식 장치 및 방법
CN104505092B (zh) * 2014-12-10 2017-12-22 广东美的制冷设备有限公司 空调器语音控制方法和系统
US10031591B2 (en) 2015-05-08 2018-07-24 Contour Design, Inc. Pointing device bracket assembly and system
US9691378B1 (en) * 2015-11-05 2017-06-27 Amazon Technologies, Inc. Methods and devices for selectively ignoring captured audio data
CN106297837A (zh) * 2016-08-05 2017-01-04 易晓阳 一种语音控制音乐本地播放方法
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
CN106409294B (zh) * 2016-10-18 2019-07-16 广州视源电子科技股份有限公司 防止语音命令误识别的方法和装置
US11023053B2 (en) 2016-11-11 2021-06-01 Contour Innovations Llc Inner-sensor pointing device system
CN106796790B (zh) * 2016-11-16 2020-11-10 深圳达闼科技控股有限公司 机器人语音指令识别的方法及相关机器人装置
KR102398390B1 (ko) 2017-03-22 2022-05-16 삼성전자주식회사 전자 장치 및 전자 장치의 제어 방법
EP3958112A1 (de) * 2017-12-06 2022-02-23 Google LLC Verminderung und auslöschung von audio-signalen aus nahe gelegenen vorrichtungen
JP6929811B2 (ja) * 2018-03-13 2021-09-01 Tvs Regza株式会社 音声対話端末、および音声対話端末制御方法
CN109658930B (zh) * 2018-12-19 2021-05-18 Oppo广东移动通信有限公司 语音信号处理方法、电子装置及计算机可读存储介质
CN109890573B (zh) * 2019-01-04 2022-05-03 上海阿科伯特机器人有限公司 移动机器人的控制方法、装置、移动机器人及存储介质
US11373686B1 (en) * 2019-12-23 2022-06-28 Gopro, Inc. Systems and methods for removing commands from sound recordings
FR3109050B1 (fr) * 2020-04-01 2022-03-04 Sagemcom Broadband Sas Réduction de la consommation électrique d’un équipement de restitution audio
CN112413859B (zh) * 2020-11-24 2021-11-16 珠海格力电器股份有限公司 空调器控制方法、装置、空调器及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4712231A (en) * 1984-04-06 1987-12-08 Shure Brothers, Inc. Teleconference system
DE69117014T2 (de) * 1990-11-30 1996-06-20 Fujitsu Ten Ltd Methode und Einrichtung zur Spracherkennung

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2150174A5 (de) * 1971-08-18 1973-03-30 Dreyfus Jean
US4378603A (en) * 1980-12-23 1983-03-29 Motorola, Inc. Radiotelephone with hands-free operation
JPS63171071A (ja) * 1987-01-08 1988-07-14 Matsushita Commun Ind Co Ltd 音声制御装置
US5267323A (en) * 1989-12-29 1993-11-30 Pioneer Electronic Corporation Voice-operated remote control system
DE4009900A1 (de) * 1990-03-20 1991-11-07 Blaupunkt Werke Gmbh Kraftfahrzeugkommunikationszentrale
US5457769A (en) * 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5633936A (en) * 1995-01-09 1997-05-27 Texas Instruments Incorporated Method and apparatus for detecting a near-end speech signal
JP3674990B2 (ja) * 1995-08-21 2005-07-27 セイコーエプソン株式会社 音声認識対話装置および音声認識対話処理方法
EP0810502A1 (de) * 1996-05-30 1997-12-03 DIEHL GMBH & CO. Steuereinheit für eine Heizungsanlage
DE19712632A1 (de) * 1997-03-26 1998-10-01 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Sprachfernsteuerung von Geräten
EP1085500B1 (de) * 1999-09-13 2007-01-17 Matsushita Electric Industrial Co., Ltd. Spracherkennung zur Steuerung eines Geräts

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4712231A (en) * 1984-04-06 1987-12-08 Shure Brothers, Inc. Teleconference system
DE69117014T2 (de) * 1990-11-30 1996-06-20 Fujitsu Ten Ltd Methode und Einrichtung zur Spracherkennung

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004038695A1 (en) * 2002-10-25 2004-05-06 Motorola Inc Directional speech recognition device and method
DE102013012453B3 (de) * 2013-07-26 2014-10-16 Audi Ag Verfahren zum Betreiben eines Infotainment-Systems eines Kraftwagens und Infotainment-System für einen Kraftwagen

Also Published As

Publication number Publication date
CN1216364C (zh) 2005-08-24
JP2004514926A (ja) 2004-05-20
KR20020071966A (ko) 2002-09-13
CN1397063A (zh) 2003-02-12
WO2002043049A1 (de) 2002-05-30
EP1340224A1 (de) 2003-09-03
US20030138118A1 (en) 2003-07-24

Similar Documents

Publication Publication Date Title
DE10058786A1 (de) Verfahren zum Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts
DE69636985T2 (de) Sprachanwesenheitdetektor für halbduplex-audiokommunikationssystem
DE112009001303B4 (de) Echokompensator
DE10251113A1 (de) Verfahren zum Betrieb eines Spracherkennungssystems
DE10163213A1 (de) Verfahren zum Betrieb eines Spracherkennungssystems
DE19935808A1 (de) Echounterdrückungseinrichtung zum Unterdrücken von Echos in einer Sender/Empfänger-Einheit
DE4029697A1 (de) Sprachgesteuertes fernbedienungssystem
DE60123803T2 (de) System zur steuerung eines gerätes mittels sprachbefehlen
DE112011105908B4 (de) Verfahren und Gerät zur adaptiven Regelung des Toneffekts
DE69532026T2 (de) Schaltung zum automatischen Variieren des Pegels eines Empfangssprachsignals in einem Fernprechgerät
DE60033826T2 (de) Verstärkungsregelung von audiosignalen in lärmender umgebung mit hilfe einer filterbank
EP0772375A2 (de) Hörgerät und Zusatzgerät
DE102018113112A1 (de) Verfahren zum Betreiben einer Lautsprechereinheit sowie eine Lautsprechereinheit
KR20050005868A (ko) 음성 인식장치 및 방법
DE112019006383T5 (de) Akustische echokompensation mittels niederfrequenz-sprachdetektion am nahen ende
EP0966100B1 (de) Verfahren und Einrichtung zur Beeinflussung der Lautstärke von Audiowiedergabegeräten in Kraftfahrzeugen
DE102011080518A1 (de) Hörer und Verfahren zum Steuern eines Hörers
EP3793218A1 (de) Verfahren zum betrieb eines hörgeräts sowie hörgerät
DE69930109T2 (de) Sprachgesteuerter schalter zur verwendung bei hohem umgebungsgeräusch
EP1062487A1 (de) Mikrophonanordnung für die spracherkennung unter variablen räumlichen bedingungen
DE2919228C2 (de) Akustisch fernbedienbarer Schalter
EP0693849A1 (de) System zum Übertragen von codierten Sprachsignalen
DE112020005717T5 (de) Erkennung von live-sprache
DE3137314A1 (de) Schaltungsanordnung fuer sprachgesteuerte freisprechgeraete
DE19751536C2 (de) Spracherkennungspegelsteuervorrichtung in einem Spracherkennungstelefongerät und zugehöriges Steuerverfahren

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8127 New person/name/address of the applicant

Owner name: PHILIPS INTELLECTUAL PROPERTY & STANDARDS GMBH, 20

8131 Rejection