EP1340224A1 - Verfahren zur steuerung eines eine akustische ausgabeeinrichtung aufweisenden geräts - Google Patents

Verfahren zur steuerung eines eine akustische ausgabeeinrichtung aufweisenden geräts

Info

Publication number
EP1340224A1
EP1340224A1 EP01991744A EP01991744A EP1340224A1 EP 1340224 A1 EP1340224 A1 EP 1340224A1 EP 01991744 A EP01991744 A EP 01991744A EP 01991744 A EP01991744 A EP 01991744A EP 1340224 A1 EP1340224 A1 EP 1340224A1
Authority
EP
European Patent Office
Prior art keywords
signal
volume
output
command signal
acoustic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP01991744A
Other languages
English (en)
French (fr)
Inventor
Volker Stahl
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of EP1340224A1 publication Critical patent/EP1340224A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Definitions

  • the invention relates to a method for controlling a device having an acoustic output device by means of acoustic command signals. Furthermore, the invention relates to a device with an acoustic output device, with a receiving device for receiving acoustic command signals, with a recognition device for recognizing these command signals and with a control device for controlling the device as a function of a recognized command signal.
  • Switchable devices such as alarm clocks or lights have been on the market for a long time, which can be switched on or off or switched back and forth between different modes by means of very simple acoustic command signals, for example noises such as clapping or whistling.
  • voice recognition systems there are also devices that can recognize and accept various voice commands as command signals, so that more complicated controls of such devices are also possible.
  • voice-controllable devices are extremely convenient since the operator can operate the respective device hands-free.
  • This control method therefore has great advantages wherever the operator needs his hands for other activities, for example when controlling a car radio, in which the operator does not have to take his hands off the steering wheel to change the volume or to set a new channel.
  • this method is also very attractive in general for the operation of devices because such a voice control enables the interface between man and machine (MMI; man-machine interface) from the previously common communication level of machines, namely operation using buttons and Regulators to which the person's own communication level, namely the transmission of information by voice, is shifted.
  • MMI man-machine interface
  • the recognition device which is intended to identify the command signals not only receives the command signal alone, but also the acoustic output signal generated by the device itself (for example, the music played on a CD player) as an acoustic echo.
  • the own output signal is therefore like a background noise below the command signal. Depending on the volume of the command signal or the own output signal, this leads to considerable problems in recognizing the command signals.
  • AEC method Acoustic Echo Cancellation
  • the output signal generated by the device itself is used to estimate a room impulse response signal, that is to say to estimate the signal caused by a Reflection of the output signal within the room in which the device is located is detected again by the recording device.
  • This takes place in a so-called “adaptive filter method” in which iteratively determines a transfer function with which the original output signal is first transformed and then that output signal thus transformed is subtracted in a filter from the received total input signal.
  • the method is adaptive insofar as the iteration process is continuously continued and thus changes in space that are associated with a change in the transfer function are recorded.
  • the volume is immediately reduced by the device itself as soon as the device recognizes that a possible acoustic command signal is being transmitted to the device.
  • the command signal for the device can be recognized more easily and reliably due to the smaller acoustic echo.
  • the reduction in volume also reduces the so-called "Lombard effect", which means that a person automatically speaks differently, for example louder and more accentuated, when he has to respond to background noise, which inevitably has an impact on the recognition performance of a speech recognition system.
  • a corresponding device must first have an acoustic output device, a receiving device for receiving the acoustic
  • Command signals for example a conventional microphone, and a detection device for recognizing these command signals and a control device for controlling the device depending on a detected command signal.
  • the device must have suitable means for detecting that the receiving device is receiving a possible command signal for the device, as well as suitable means with which the volume of the output signal output by the acoustic output device is reduced as soon as the reception of a possible command signal for the device is recognized becomes.
  • the device can be equipped or set so that a word spoken by a specific user in a defined volume and / or pitch and / or speaking direction is recognized as a possible command signal and the volume is then reduced.
  • the actual command signal is preceded by a key command signal, the volume of which is reduced when it is detected.
  • This key command signal is expediently the command signal which puts the device into a ready state for receiving further command signals, ie which first activates the control device of the respective device.
  • Such key command signals are particularly useful when there are several voice-controllable devices in the same environment, each of which accepts similar or identical command signals.
  • the device for which a specific command signal is intended must be addressed by a preceding key command signal by means of a corresponding key command signal.
  • a voice-controlled computer and a television set could be arranged directly next to one another, and the command signals for the devices are preceded by the key command signal “computer” or “TV”.
  • the automatic reduction in the volume of the output signal of the device upon detection of the key command signal also has the advantage that the user is immediately informed in this way that the respective device is in the ready state for receiving further command signals and, so to speak, "listening" to the user.
  • the device can also additionally give a visual or acoustic confirmation of the receipt of the key command signal.
  • the volume is preferably increased automatically again after a command signal - for example following the key command - has been recognized.
  • the volume it is possible for the volume to be automatically reset to the previously set value after a certain period of time after the key command signal or a command signal has been detected. In this case the device would still work after receiving a command signal wait a certain time until another command signal comes. Only then would the device automatically switch back from the ready state or activated state.
  • the volume of the output signal is reduced as a function of a determined command signal energy.
  • Command signal energy is understood here to mean the signal energy of the received command signals, the key command signal naturally also being understood as a - special - command signal in this sense.
  • the volume of the own output signal of this device could only be reduced if the own output signal is actually so loud in relation to the command signals that reliable detection of the command signals can no longer be guaranteed. This can be controlled in a simple manner by determining the relationship between the output signal energy or the signal energy of the ascertained or estimated acoustic echo of the output signal and the command signal energy. The volume is only reduced if this ratio lies within a certain value range with respect to a predetermined threshold value.
  • the volume is only reduced if this ratio is above a predetermined threshold value.
  • the ratio of the command signal energy to the output signal energy or the energy of the acoustic echo is determined, the volume is only reduced if this ratio is below a predetermined threshold value.
  • the command signal energy can be measured, for example, at the input of the receiving device or the microphone.
  • Output signal reduced until the ratio of the signal energies is at a predetermined value.
  • This ratio can be defined and set beforehand by the user or can also be defined automatically in that a certain recognition reliability of the recognition device is achieved. In this case in particular, it makes sense if the device has additional means for visual or acoustic display, which indicate that the key command signal has been recognized, since the user cannot always rely on the volume being reduced after the key command signal has been recognized.
  • the device preferably additionally has a filter device for filtering out an acoustic echo of the output signal output by the device itself from the overall signal received by the device. This means that the new method is used in addition to an AEC method in order to achieve optimal detection performance.
  • Typical voice commands that are used to control audio devices or audiovisual devices are command words to control the volume of the device.
  • Such “volume command signals” can, for example, be the words “louder” or “quieter”.
  • the device itself after such a volume command signal has been recognized, initially resets the volume to the value set before the reduction, and only then does the volume return to a value corresponding to the volume command signal This means, for example, that the volume is reduced by a certain level when the word "quieter” is recognized or raised by a certain level when the word "louder” is recognized.
  • the single figure shows a schematic block diagram of an audio device 1, for example a CD player, only the components essential to the invention being shown.
  • the audio device 1 initially has an audio signal source 6.
  • this audio signal source 6 is, for example, the CD Drive, the scanner and the electronics for converting the acquired optical data into the audio signal.
  • the audio signal generated by the audio signal source 6 is then forwarded to an amplifier 8, for example a conventional output stage 8, and from there is output via an acoustic output device 2, here a conventional loudspeaker 2.
  • the device 1 has a control device 5, which can be implemented, for example, in the form of a microcontroller or the like.
  • the audio signal source 6 can be controlled by means of this control device 5, for example a special title on a CD can be selected.
  • This control option is indicated in the figure by the control line 18 shown.
  • Control device 5 the volume of the device 1 can be regulated. This is done by controlling the output stage 8. This control option is shown in the figure by the control line 19.
  • the device 1 receives the commands for the control in the form of acoustic signals
  • Command signals BS here voice commands, which the user inputs via a recording device 3, here a microphone 3, and which are forwarded via lines 14, 15 to a recognition device 4, here a speech recognition system 4.
  • the recognized command is then forwarded via the signal line 17 to the control device 5, which then controls the individual components of the device 1 in accordance with the command received.
  • the microphone 3 not only detects the command signal BS, but also an acoustic echo AE, which is generated by the acoustic signal emitted by the loudspeaker 2 of the device 1 itself, here the music from the CD.
  • the acoustic echo AE depends not only on the output signal, but also on the acoustic parameters of the room.
  • the device has a filter device 9 (hereinafter referred to as AEC unit) in which the acoustic echo AE is filtered out from the overall signal received at the microphone 3.
  • the output signal is tapped from the signal output branch, which runs from the audio signal source 6 via the output stage 8 to the loudspeaker 2, in front of the output stage 8 at the tap point 21 and is connected to the AEC via a signal line 11.
  • This transfer function corresponds to the estimated room impulse response.
  • the current room impulse response is determined using an iterative process, which is constantly updated and therefore adaptive filtering is carried out, which takes into account changes in the room, for example due to movements of people or objects.
  • the output signal transformed by means of the transfer function is subtracted in an adder 10 of the AEC unit 9 from the overall signal coming from the microphone 3 via the signal line 14.
  • the residual signal which ideally only corresponds to the command signal BS, is then forwarded to the speech recognition system 4 via the output line 15 by the AEC unit 9.
  • the AEC device 9 also has an input 12 at which the control signal, which is output via the control line 19 from the control device 5 to the output stage 8, for regulating the volume is present.
  • the coefficients for the transfer function can thus be scaled according to the volume set.
  • the device 1 additionally has means 7 in the form of an attenuator 7, with which the volume of the device 1 can be reduced when a key command signal SBS is recognized by the speech recognition system 4.
  • this key command signal SBS must therefore be spoken by the user as the first command signal.
  • the speech recognition system 4 is designed in such a way that it only responds to this special key command signal SBS, i.e. here a certain password, such as the word "CD", is waiting. After this password has been accepted, the entire complex command vocabulary of the speech recognition system 4 is first activated, and the device 1 is in a standby mode in which further command signals are recognized and accepted, for example commands such as "louder”, “quieter”, “next title”, title 5 "etc. After the respective command signal BS following the key command signal SBS has been recognized, the device 1 switches back to a state where it returns to the key command signal SBS waiting.
  • the attenuator 7 When the key command signal SBS is detected, the attenuator 7 is activated automatically by the control device 5 via the control line 20 and the volume of the device's own output signal is thus reduced. This makes it easier for the speech recognition system 4 to identify the subsequent command signal BS, ie the actual command.
  • This decrease in volume can, for example, by a certain value, e.g. B. 10 dB, or to a preset volume level. It is also possible to reduce the volume to zero.
  • the signals present at the signal input branch upstream and downstream of the filter 10 are fed to the control device 5 via the signal lines 13, 16. From these signals in front of and behind the filter 10, the control device 5 can determine which signal energy the acoustic echo AE has on the microphone and which signal energy has the command signal BS that is actually desired.
  • the control device 5 is designed such that it reduces the volume of the output signal by means of the attenuator 7 to such an extent that there is a certain relationship between the signal energy of the acoustic echo AE and the signal energy of the command signal BS. If the ratio of the signal energies is already below this value, the volume is not reduced any further.
  • the attenuator 7 in the signal output branch can be bridged in the exemplary embodiment shown and the user can, if desired, override the function according to the invention.
  • the separate attenuator 7 is arranged in the signal output branch here in such a way that the signal is attenuated before the branch point 21 for tapping the output signal for the AEC unit 9. As a result, it is automatically taken into account that when the volume is reduced, the AEC unit 9 reduces this volume when
  • the volume could be reduced by the control device 5 after detection of the key command signal SBS by regulating the output stage 8.
  • the recognition accuracy of the speech control is considerably improved by reducing the distortion of the input signal of the speech recognizer.
  • a very user-friendly voice interface is created, since the user receives feedback from the device 1 by reducing the volume that this is ready for a voice command.
  • additional feedback can follow through a visual or further acoustic signal, for example a signal tone.

Abstract

Die Erfindung betrifft ein Verfahren zur Steuerung eines eine akustische Ausgabeeinrichtung (2) aufweisenden Geräts (1) mittels akustischer Befehlssignale (BS). Die Erfindung schlägt vor, dass das Gerät (1) automatisch seine Lautstärke reduziert, wenn das Gerät (1) erkennt, dass ein akustisches Befehlssignal an das Gerät (1) übermittelt wird.

Description

Verfahren zur Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts
Die Erfindung betrifft ein Verfahren zur Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts mittels akustischer Befehlssignale. Darüber hinaus betrifft die Erfindung ein Gerät mit einer akustischen Ausgabeeinrichtung, mit einer Empfangseinrichtung zum Empfang akustischer Befehlssignale, mit einer Erkennungs- einrichtung zum Erkennen dieser Befehlssignale und mit einer Steuereinrichtung zum Steuern des Geräts in Abhängigkeit von einem erkannten Befehlssignal.
Um die Benutzerfreundlichkeit und die Einsatzmöglichkeiten von Geräten, insbesondere von Geräten im Bereich der Consumer-Elektronik, zu erhöhen und die Geräte damit attraktiver zu machen, werden immer mehr Geräte derart ausgestattet, dass eine Steuerung des Geräts mittels akustischer Befehlssignale möglich ist. So werden auf dem Markt bereits seit längerem schaltbare Geräte wie beispielsweise Wecker oder Leuchten angeboten, die mittels sehr einfacher akustischer Befehlssignale, beispielsweise Geräusche wie Klatschen oder Pfeifen, ein- bzw. ausgeschaltet oder zwischen verschiedenen Modi hin- und hergeschaltet werden können. Mit zunehmender Entwicklung von Spracherkennungs- systemen gibt es darüber hinaus auch Geräte, die als Befehlssignale verschiedene Sprachbefehle erkennen können und akzeptieren, so dass auch kompliziertere Steuerungen solcher Geräte möglich sind. Derartige sprachsteuerbare Geräte sind ausgesprochen komfortabel, da der Bediener das jeweilige Gerät freihändig bedienen kann. Große Vorteile hat dieses Steuerungsverfahren folglich überall dort, wo der Bediener seine Hände für andere Tätigkeiten benötigt, etwa bei der Steuerung eines Autoradios, bei der der Bediener zur Veränderung der Lautstärke oder zur Einstellung eines neuen Kanals nicht die Hände vom Lenkrad nehmen muss. Darüber hinaus ist dieses Verfahren aber auch allgemein zur Bedienung von Geräten deshalb sehr attraktiv, weil durch eine solche Sprachsteuerung die Schnittstelle zwischen Mensch und Maschine (MMI; Man-Machine-Interface) von der bisher üblichen Kommunikationsebene von Maschinen, nämlich einer Bedienung durch Knöpfe und Regler, auf die dem Menschen eigene Kommunikationsebene, nämlich eine Informationsübermittlung per Sprache, verlagert wird. Eine Schwierigkeit ergibt sich jedoch bei der Steuerung von Geräten, die eine akustische Ausgabeeinrichtung aufweisen und die funktionsgemäß selbst akustische Signale erzeugen, d.h. beispielsweise alle Audio- oder audiovisuellen Geräte wie Radio, CD-Player, Fernseher, Video-Abspielgeräte, Computer etc. Bei derartigen Geräten mit einer Audiofunktion empfängt die Erkennungseinrichtung- welche die Befehlssignale identifizieren soll, nicht nur das Befehlssignal allein, sondern auch das vom Gerät selbst erzeugte akustische Ausgangssignal (beispielsweise bei einem CD-Player die abgespielte Musik) als akustisches Echo. Das eigene Ausgangssignal liegt folglich wie ein Hintergrundgeräusch unter dem Befehlssignal. Je nach Lautstärke des Befehlssignals bzw. des eigenen Ausgangssignals fuhrt dies zu erheblichen Problemen bei der Erkennung der Befehlssignale.
Üblicherweise wird zur Verbesserung der Erkennungsleistung bei solchen Geräten das sogenannte „AEC-Verfahren" (Acoustic Echo Cancellation) angewandt. Bei diesem Ansatz wird das vom Gerät selbst generierte Ausgangssignal genutzt, um ein Raumimpuls-Antwortsignal abzuschätzen, d.h. das Signal abzuschätzen, das durch eine Reflexion des Ausgangssignals innerhalb des Raums, in welchem sich das Gerät befindet, von der Aufhahmeeinrichtung wieder erfasst wird. Dies geschieht in einem sogenannten „adaptiven Filterverfahren", bei dem iterativ eine Transferfunktion ermittelt wird, mit der das ursprüngliche Ausgangssignal zunächst transformiert wird und dann das so transformierte Ausgangssignal in einem Filter von dem empfangenen Gesamteingangssignal abgezogen wird. Das Verfahren ist insoweit adaptiv, als das Iterationsverfahren permanent weitergeführt wird und somit Veränderungen im Raum, welche mit einer Veränderung der Transferfunktion einhergehen, erfasst werden. Beispielsweise könnten sich Veränderungen im akustischen Echo ergeben, wenn innerhalb des Raums eine Gardine auf- oder zugezogen wird, eine Tür geöffnet wird oder sich Personen innerhalb des Raums bewegen. Im Allgemeinen ist dieses Verfahren recht erfolgreich. Es ist jedoch beobachtet worden, dass die Genauigkeit von Spracherkennungssystemen signifikant nachlässt, wenn die Lautstärke des Ausgangssignals des Geräts selbst ansteigt. Der Grund hierfür liegt darin, dass der adaptive AEC-Filter die Raumcharakteristika nicht optimal modellieren kann und daher die Störung des Signals nach dem Ausfiltern des akustischen Echos in etwa proportional zur Lautstärke des Geräts selbst ist.
Es ist Aufgabe der vorliegenden Erfindung, ein einfaches und benutzerfreundliches Verfahren zur akustischen Steuerung von Geräten, welche selbst ein akustisches Ausgangssignal erzeugen, sowie ein entsprechendes Gerät zu schaffen, bei dem die Erkennungsgenauigkeit der Befehlssignale gegenüber dem bisherigen Stand der Technik verbessert ist.
Diese Aufgabe wird durch ein Verfahren gemäß Anspruch 1 und ein Gerät gemäß Anspruch 10 gelöst.
Erfindungsgemäß wird von dem Gerät selbst sofort die Lautstärke reduziert, sobald das Gerät erkennt, dass ein mögliches akustisches Befehlssignal an das Gerät übermittelt wird. Durch die automatische Reduzierung der Lautstärke des Geräts ist das Befehlssignal für das Gerät aufgrund des kleineren akustischen Echos leichter und sicherer erkennbar. Außerdem ist es für den Benutzer in der Regel angenehmer, ein Sprachkommando zu äußern, wenn das Audiogerät nicht so laut ist. Im übrigen wird durch die Verminderung der Lautstärke auch der sogenannte „Lombard-Effekt" vermindert, der bedeutet, dass ein Mensch automatisch anders, beispielsweise lauter und akzentuierter spricht, wenn er gegen Hintergrundgeräusche ansprechen muss, was zwangsläufig Auswirkungen auf die Erkennungsleistung eines Spracherkennungssystems hat.
Ein entsprechendes erfindungsgemäßes Gerät muss zunächst eine akustische Ausgabeeinrichtung, eine Empfangseinrichtung zum Empfang der akustischen
Befehlssignale, beispielsweise ein übliches Mikrofon, sowie eine Erkennungseinrichtung zum Erkennen dieser Befehlssignale und eine Steuereinrichtung zum Steuern des Geräts in Abhängigkeit von einem erkannten Befehlssignal aufweisen. Darüber hinaus muss das Gerät geeignete Mittel zur Erkennung, dass die Empfangseinrichtung ein mögliches Befehlssignal für das Gerät empfängt, sowie geeignete Mittel aufweisen, mit denen die Lautstärke des von der akustischen Ausgabeeinrichtung ausgegebenen Ausgangssignals reduziert wird, sobald der Empfang eines möglichen Befehlssignals für das Gerät erkannt wird.
Eine solche Erkennung, dass ein Befehlssignal an das Gerät gerichtet ist, ist auf verschiedene Weise möglich. Beispielsweise kann das Gerät so ausgestattet bzw. eingestellt sein, dass ein von einem bestimmten Benutzer in einer definierten Lautstärke und/oder Tonlage und/oder Sprechrichtung gesprochenes Wort als mögliches Befehlssignal erkannt wird und daraufhin die Lautstärke reduziert wird. Bei einer besonders einfachen, bevorzugten Ausführungsform wird dem eigentlichen Befehlssignal ein Schlüsselbefehlssignal vorausgeschickt, bei dessen Erkennung die Lautstärke reduziert wird. Bei diesem Schlüsselbefehlssignal handelt es sich sinnvollerweise um genau das Befehlssignal, welches das Gerät in einen Bereitschaftszustand zum Empfang von weiteren Befehlssignalen versetzt, d.h. welches die Steuereinrichtung des jeweiligen Geräts zunächst aktiviert. Derartige „Aktivierungssignale" sind in vielen Fällen ohnehin notwendig, da auf diese Weise verhindert werden kann, dass unbeabsichtigt vom Nutzer abgegebene Befehlssignale, beispielsweise bestimmte Wörter innerhalb eines Gesprächs oder andere Hintergrundgeräusche, vom Gerät identifiziert und akzeptiert werden und so eine Steuerungsaktion durchgeführt wird, die eigentlich nicht erwünscht ist.
Insbesondere sind solche Schlüsselbefehlssignale sinnvoll, wenn in derselben Umgebung mehrere sprachsteuerbare Geräte vorhanden sind, die jeweils ähnliche oder gleiche Befehlssignale akzeptieren. In diesem Fall muss durch ein entsprechendes Schlüsselbefehlssignal das Gerät, für welches ein bestimmtes Befehlssignal gedacht ist, durch ein vorangestelltes Schlüsselbefehlssignal angesprochen werden. So könnten beispielsweise ein sprachgesteuerter Computer und ein Fernsehgerät unmittelbar nebeneinander angeordnet sein, und den Befehlssignalen für die Geräte wird jeweils das Schlüsselbefehlssignal „Computer" oder „TV" vorangesetzt.
Die automatische Reduzierung der Lautstärke des Ausgangssignals des Geräts bei Erkennen des Schlüsselbefehlssignals hat außerdem den Vorteil, dass dem Benutzer auf diese Weise gleich mitgeteilt wird, dass das jeweilige Gerät sich im Bereitschaftszustand zum Empfang von weiteren Befehlssignalen befindet und sozusagen dem Benutzer „zuhört". Optional kann das Gerät auch noch zusätzlich eine visuelle oder akustische Bestätigung für den Empfang des Schlüsselbefehlssignals abgeben.
Das Heraufsetzen der Lautstärke erfolgt vorzugsweise automatisch dann wieder, nachdem ein - beispielsweise dem Schlüsselbefehl nachfolgendes - Befehlssignal erkannt wurde. Dies bedeutet z. B., dass nach jedem Schlüsselbefehlssignal genau ein Befehlssignal akzeptiert wird. Alternativ dazu ist es möglich, dass nach Ablauf einer bestimmten Zeitspanne nach Erkennung des Schlüsselbefehlssignals bzw. eines Befehlssignals die Lautstärke wieder automatisch auf den zuvor eingestellten Wert zurückgestellt wird. In diesem Fall würde das Gerät nach Erhalt eines Befehlssignals noch eine gewisse Zeit abwarten, ob ein weiteres Befehlssignal kommt. Erst dann würde das Gerät automatisch aus dem Bereitschaftszustand bzw. aktivierten Zustand zurückschalten.
Bei einem besonders bevorzugten Ausfuhrungsbeispiel wird die Lautstärke des Ausgangssignals in Abhängigkeit von einer ermittelten Befehlssignalenergie reduziert. Unter Befehlssignalenergie wird hierbei die Signalenergie der empfangenen Befehlssignale verstanden, wobei das Schlüsselbefehlssignal selbstverständlich auch als ein - besonderes - Befehlssignal in diesem Sinne zu verstehen ist. So könnte beispielsweise die Lautstärke des eigenen Ausgangssignals dieses Geräts nur dann reduziert werden, wenn das eigene Ausgangssignal tatsächlich im Verhältnis zu den Befehlssignalen so laut ist, dass eine zuverlässige Erkennung der Befehlssignale nicht mehr gewährleistet werden kann. Dies lässt sich auf einfache Weise dadurch steuern, dass das Verhältnis zwischen der Ausgangssignalenergie oder der Signalenergie des ermittelten bzw. abgeschätzten akustischen Echos des Ausgangssignals und der Befehlssignalenergie ermittelt wird. Nur wenn dieses Verhältnis innerhalb eines bestimmten Wertebereichs bezüglich eines vorgegebenen Schwellwerts liegt, wird die Lautstärke reduziert. Beispielsweise wird, wenn das Verhältnis von der Energie des Ausgangssignals bzw. des akustischen Echos zu der Befehlssignalenergie ermittelt wird, nur dann, wenn dieses Verhältnis oberhalb eines vorgegebenen Schwellwerts liegt, die Lautstärke reduziert. Andersherum wird, wenn das Verhältnis von der Befehlssignalenergie zu der Ausgangssignalenergie bzw. der Energie des akustischen Echos ermittelt wird, nur dann die Lautstärke reduziert, wenn dieses Verhältnis unterhalb eines vorgegebenen Schwellwerts liegt. Die Befehlssignalenergie kann beispielsweise am Eingang der Empfangseinrichtung bzw. des Mikrofons gemessen werden.
Bei einem besonders bevorzugten Verfahren wird dabei die Lautstärke des
Ausgangssignals genau so weit reduziert, bis das Verhältnis der Signalenergien auf einem vorgegebenen Wert liegt. Für den Benutzer bedeutet dies, dass, wenn das vom Gerät selbst ausgegebene akustischen Signal, beispielsweise die Musik eines CD-Players, ohnehin leise ist oder wenn der Benutzer sich nah am Mikrofon des Geräts befindet, die Musiklautstärke nicht reduziert wird, sondern unverändert bleibt. Ansonsten wird die Lautstärke soweit reduziert, dass die Musikenergie und die Energie des Sprachbefehls am Mikrofoneingang ein vorbestimmtes Verhältnis haben. Dieses Verhältnis kann vom Benutzer zuvor definiert und eingestellt werden oder kann auch automatisch dadurch definiert sein, dass eine bestimmte Erkennungszuverlässigkeit der Erkennungseinrichtung erreicht wird. Insbesondere in diesem Fall ist es sinnvoll, wenn das Gerät zusätzliche Mittel zur visuellen oder akustischen Anzeige aufweist, die anzeigen, dass das Schlüsselbefehlssignal erkannt wurde, da der Benutzer sich nicht immer darauf verlassen kann, dass die Lautstärke nach Erkennung des Schlüsselbefehlssignals reduziert wird.
Das Gerät weist vorzugsweise zusätzlich eine Filtereinrichtung zum Ausfiltern eines akustischen Echos des vom Gerät selbst ausgegebenen Ausgangssignals aus dem vom Gerät empfangenen Gesamtsignal auf. Das heißt, das neuartige Verfahren wird zusätzlich zu einem AEC- Verfahren verwendet, um so eine optimale Erkennungsleistung zu erzielen.
Typische Sprachkommandos, welche zur Steuerung von Audiogeräten oder audiovisuellen Geräten verwendet werden, sind Kommandoworte, um die Lautstärke des Geräts zu steuern. Bei derartigen „Lautstärke-Befehlssignalen" kann es sich beispielsweise um die Worte „lauter" oder „leiser" handeln. Da erfindungsgemäß vom Gerät sofort nach Erkennung des Schlüsselbefehlssignals die Lautstärke reduziert wird, kann der Benutzer nicht mehr erkennen, welchen Effekt sein Lautstärke-Befehlssignal selbst hat. Vorzugsweise wird für derartige Lautstärke-Befehlssignale daher vom Gerät selbst, nachdem ein solches Lautstärke-Befehlssignal erkannt wurde, die Lautstärke zunächst wieder auf den vor der Reduzierung eingestellten Wert zurückgestellt. Erst danach wird die Lautstärke auf einen dem Lautstärke-Befehlssignal entsprechenden Wert umgestellt. Das heißt, es wird beispielsweise bei Erkennung des Wortes „leiser" die Lautstärke um eine bestimmte Stufe herabgesetzt bzw. bei Erkennung des Wortes „lauter" um eine bestimmte Stufe heraufgesetzt.
Die Erfindung wird nachfolgend unter Bezugnahme auf die beigefügte Figur anhand eines Ausfuhrungsbeispiels näher erläutert.
Die einzige Figur zeigt hierbei ein schematisches Blockschaltbild eines Audiogeräts 1, beispielsweise eines CD-Players, wobei nur die für die Erfindung wesentlichen Komponenten dargestellt sind.
Das Audiogerät 1 weist dabei zunächst eine Audiosignalquelle 6 auf. Bei dieser Audiosignalquelle 6 handelt es sich bei einem CD-Player beispielsweise um das CD- Laufwerk, die Abtasteinrichtung und die Elektronik zur Umsetzung der erfassten optischen Daten in das Audiosignal. Das von der Audiosignalquelle 6 erzeugte Audiosignal wird dann an einen Verstärker 8, beispielsweise eine übliche Endstufe 8, weitergeleitet und von dort über eine akustische Ausgabeeinrichtung 2, hier einen üblichen Lautsprecher 2, ausgegeben.
Zur Steuerung weist das Gerät 1 eine Steuereinrichtung 5 auf, welche beispielsweise in Form eines Mikrocontrollers oder dergleichen realisiert sein kann. Mittels dieser Steuereinrichtung 5 kann die Audiosignalquelle 6 angesteuert werden, beispielsweise ein spezieller Titel auf einer CD ausgewählt werden. Diese Steuerungsmöglichkeit ist in der Figur durch die dargestellte Steuerleitung 18 angedeutet. Ebenso kann über die
Steuereinrichtung 5 die Lautstärke des Geräts 1 geregelt werden. Dies erfolgt durch Ansteuerung der Endstufe 8. Diese Steuerungsmöglichkeit ist in der Figur durch die Steuerleitung 19 dargestellt.
Die Befehle für die Steuerung erhält das Gerät 1 in Form von akustischen
Befehlssignalen BS, hier Sprachbefehlen, die der Benutzer über eine Aufnahmeeinrichtung 3, hier ein Mikrofon 3, eingibt und die über die Leitungen 14, 15 an eine Erkennungseinrichtung 4, hier ein Spracherkennungssystem 4, weitergeleitet werden. Der erkannte Befehl wird dann über die Signalleitung 17 an die Steuereinrichtung 5 weitergeleitet, welche dann entsprechend dem erhaltenen Befehl die einzelnen Komponenten des Geräts 1 steuert.
Wie in der Figur dargestellt, wird vom Mikrofon 3 nicht nur das Befehlssignal BS, sondern auch ein akustisches Echo AE erfasst, welches durch das vom Lautsprecher 2 des Geräts 1 selbst ausgegebene akustische Signal, hier die Musik von der CD, erzeugt wird. Das akustische Echo AE hängt dabei nicht nur vom ausgegebenen Signal, sondern auch von den akustischen Parametern des Raums ab. Um die Störungen durch dieses akustische Echo AE bei der Erkennung der Befehlssignale BS zu verringern, weist das Gerät eine Filtereinrichtung 9 (im folgenden AEC-Einheit genannt) auf, in dem aus dem am Mikrofon 3 empfangenen Gesamtsignal das akustische Echo AE ausgefiltert wird.
Hierzu wird aus dem Signalausgangszweig, welcher von der Audiosignalquelle 6 über die Endstufe 8 zum Lautsprecher 2 verläuft, vor der Endstufe 8 am Abgriffspunkt 21 das Ausgangssignal abgegriffen und über eine Signalleitung 11 der AEC- Einheit 9 zugeführt, welche das abgegriffene Ausgangssignal mit einer Transferfunktion transformiert. Diese Transferfunktion entspricht der geschätzten Raumimpulsantwort. Die jeweils aktuelle Raumimpulsantwort wird mit einem iterativen Verfahren ermittelt, wobei ständig eine Aktualisierung erfolgt und somit eine adaptive Filterung durchgeführt wird, welche Veränderungen im Raum, beispielsweise durch Bewegungen von Personen oder Gegenständen, berücksichtigt. Das mittels der Transferfunktion transformierte Ausgangssignal wird in einem Addierer 10 der AEC-Einheit 9 von dem über die Signalleitung 14 vom Mikrofon 3 kommenden Gesamtsignal abgezogen. Über die Ausgangsleitung 15 wird von der AEC-Einheit 9 dann das Restsignal, welches idealerweise nur noch dem Befehlssignal BS entspricht, an das Spracherkennungssystem 4 weitergeleitet. Die AEC-Einrichtung 9 weist außerdem einen Eingang 12 auf, an dem das über die Steuerleitung 19 von der Steuereinrichtung 5 an die Endstufe 8 ausgegebene Steuersignal zur Regelung der Lautstärke anliegt. In der AEC-Einheit 9 können so die Koeffizienten für die Transferfunktion entsprechend der eingestellten Lautstärke skaliert werden.
Erfindungsgemäß weist das Gerät 1 zusätzlich Mittel 7 in Form eines Abschwächers 7 auf, mit dem die Lautstärke des Geräts 1 reduziert werden kann, wenn vom Spracherkennungssystem 4 ein Schlüsselbefehlssignal SBS erkannt wird. Im vorliegenden Ausfuhrungsbeispiel muss daher als erstes Befehlssignal dieses Schlüsselbefehlssignal SBS vom Benutzer gesprochen werden. Das Spracherkennungssystem 4 ist so ausgelegt, dass es nur auf dieses spezielle Schlüsselbefehlssignal SBS, d.h. hier ein bestimmtes Kennwort wie zum Beispiel das Wort „CD", wartet. Nachdem dieses Kennwort akzeptiert wurde, wird erst das gesamte komplexe Befehlsvokabular des Spracherkennungssystems 4 aktiviert, und das Gerät 1 ist in einem Bereitschaftsmodus, in dem weitere Befehlssignale erkannt und akzeptiert werden, beispielsweise Befehle wie „lauter", „leiser", „nächster Titel", Titel 5" etc. Nachdem das jeweilige, dem Schlüsselbefehlssignal SBS nachfolgende Befehlssignal BS erkannt wurde, schaltet das Gerät 1 zurück in einen Zustand, wo es wieder auf das Schlüsselbefehlssignal SBS wartet.
Bei Erkennung des Schlüsselbefehlssignals SBS wird erfindungsgemäß automatisch von der Steuereinrichtung 5 über die Steuerleitung 20 der Abschwächer 7 aktiviert und somit die Lautstärke des eigenen Ausgangssignals des Geräts 1 herabgesetzt. Dadurch ist das nachfolgende Befehlssignal BS, d.h. der eigentliche Befehl, für das Spracherkennungssystem 4 leichter zu identifizieren. Diese Herabsetzung der Lautstärke kann beispielsweise um einen bestimmten Wert, z. B. 10 dB, oder auf eine voreingestellte Lautstärkestufe erfolgen. Es ist auch möglich, die Lautstärke ganz auf Null herabzusetzen.
In dem in der Figur dargestellten Ausfuhrungsbeispiel wird jedoch über die Signalleitungen 13, 16 der Steuereinrichtung 5 die am Signaleingangszweig vor und hinter dem Filter 10 anliegenden Signale zugeführt. Aus diesen Signalen vor und hinter dem Filter 10 kann die Steuereinrichtung 5 ermitteln, welche Signalenergie das akustische Echo AE am Mikrofon aufweist und welche Signalenergie das eigentlich gewünschte Befehlssignal BS aufweist. Die Steuereinrichtung 5 ist so ausgebildet, dass sie die Lautstärke des Ausgangssignals mittels des Abschwächers 7 soweit reduziert, dass ein bestimmtes Verhältnis zwischen Signalenergie des akustischen Echos AE und Signalenergie des Befehlssignals BS gegeben ist. Ist das Verhältnis der Signalenergien bereits unterhalb dieses Wertes, so wird die Lautstärke nicht weiter reduziert. Das heißt, dass die Musiklautstärke dann nicht mehr reduziert wird, wenn die Musik ohnehin leise ist oder wenn der Benutzer sich nah am Mikrofon befindet und die Befehlssignale BS gut zu erkennen sind. Ansonsten wird die Musiklautstärke genau soviel reduziert, dass die Energie der Musik und die Energie der Sprachbefehle am Mikrofoneingang ein vorbestimmtes Verhältnis haben.
Mittels eines einfachen Schalters 22 lässt sich bei dem dargestellten Ausführungsbeispiel der Abschwächer 7 im Signalausgangszweig überbrücken und so die erfindungsgemäße Funktion vom Benutzer auf Wunsch außer Kraft setzen.
Der separate Abschwächer 7 ist hier so im Signalausgangszweig angeordnet, dass das Signal bereits vor der Abzweigstelle 21 zum Abgriff des Ausgangssignals für die AEC- Einheit 9 abgeschwächt wird. Dadurch wird automatisch berücksichtigt, dass bei einer Reduzierung der Lautstärke die AEC-Einheit 9 diese Lautstärkereduzierung bei der
Abschätzung der Raumimpulsantwort berücksichtigt. Eine Reduzierung der Lautstärke des Ausgangssignals des Geräts 1 ohne Berücksichtigung in der AEC-Einheit 9 würde zu einer zusätzlichen Störung durch die Filterung im Filter 10 fuhren und die Erkennung des Befehlssignals BS eher erschweren.
Anstelle des separaten Abschwächers 7 könnte die Lautstärke von der Steuereinrichtung 5 nach Erkennung des Schlüsselbefehlssignals SBS auch durch die Regelung der Endstufe 8 herabgesetzt werden. Bei dem erfindungsgemäßen Gerät 1 bzw. durch das erfindungsgemäße Verfahren wird die Erkennungsgenauigkeit der Sprachsteuerung durch die Reduktion der Verzerrung des Eingangssignals des Spracherkenners erheblich verbessert. Es wird ein sehr benutzerfreundliches Sprachinterface geschaffen, da der Benutzer durch die Reduzierung der Lautstärke eine Rückmeldung vom Gerät 1 erhält, dass dieses für ein Sprachkommando bereit ist. Optional kann eine zusätzliche Rückmeldung durch ein visuelles oder weiteres akustisches Signal, beispielsweise einen Signalton, folgen.

Claims

PATENTANSPRÜCHE:
1. Verfahren zur Steuerung eines eine akustische Ausgabeeinrichtung (2) aufweisenden Geräts (1) mittels akustischer Befehlssignale (BS), dadurch gekennzeichnet, dass, sobald das Gerät (1) erkennt, dass ein akustisches Befehlssignal an das Gerät (1) übermittelt wird, automatisch die Lautstärke des von der akustischen Ausgabeeinrichtung (2) ausgegeben Ausgangssignals reduziert wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass zunächst ein akustisches Schlüsselbefehlssignal (SBS) an das Gerät (1) übermittelt wird, durch das das Gerät (1) in einen Bereitschaftszustand zum Empfang von weiteren Befehlssignalen (BS) versetzt wird, und bei einer Erkennung dieses Schlüsselbefehlssignals (SBS) durch das Gerät (1) die Lautstärke des von der akustischen Ausgabeeinrichtung (2) ausgegebenen Ausgangssignals reduziert wird.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Lautstärke des Ausgangssignals in Abhängigkeit von einer ermittelten Befehlssignalenergie reduziert wird.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass die Lautstärke des Ausgangssignals nur reduziert wird, wenn das Verhältnis zwischen einer ermittelten Ausgangssignalenergie oder einer Signalenergie eines ermittelten akustischen Echos (AE) des Ausgangssignals und der Befehlssignalenergie in einem bestimmten Wertebereich bezüglich eines vorgegebenen Schwellwerts liegt.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass die Lautstärke des Ausgangssignals soweit reduziert wird, bis das Verhältnis zwischen der
Ausgangssignalenergie oder der Signalenergie des akustischen Echos (AE) des Ausgangssignals und der Befehlssignalenergie einem vorgegebenen Wert entspricht.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass nach der Erkennung eines auf das Schlüsselbefehlssignal (SBS) folgenden Befehlssignals (BS) die Lautstärke wieder auf den vor der Reduzierung eingestellten Wert zurückgestellt wird.
7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass nach Ablauf einer bestimmten Zeitspanne nach der Erkennung eines Schlüsselbefehlssignals (SBS) oder eines Befehlssignals (BS) die Lautstärke wieder auf den vor der Reduzierung eingestellten Wert zurückgestellt wird.
8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass nach der Erkennung eines Lautstärke-Befehlssignals, welches zur Veränderung der Lautstärke übermittelt wird, die Lautstärke zunächst wieder auf den vor der Reduzierung eingestellten Wert zurückgestellt wird und dann auf einen dem Lautstärke-Befehlssignal entsprechenden Wert eingestellt wird.
9. Verfahren nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, dass die Erkennung des Schlüsselbefehlssignals einem Nutzer des Geräts visuell oder akustisch angezeigt wird.
10. Gerät (1) mit einer akustischen Ausgabeeinrichtung (2), mit einer Empfangseinrichtung (3) zum Empfang akustischer Befehlssignale (BS), mit einer Erkennungseinrichtung (4) zum Erkennen dieser Befehlssignale (BS) und mit einer Steuereinrichtung (5) zum Steuern des Geräts (1) in Abhängigkeit von einem erkannten Befehlssignal (BS), gekennzeichnet durch
Mittel zur Erkennung, dass die Empfangseinrichtung (3) ein Befehlssignal (BS) für das Gerät (1) empfängt, und Mittel (7) zur Reduzierung der Lautstärke des von der akustischen Ausgabeeinrichtung (2) ausgegeben Ausgangssignals, sobald der Empfang eines möglichen Befehlssignals (BS) für das Gerät (1) erkannt wird.
11. Gerät nach Anspruch 10, dadurch gekennzeichnet, dass die Mittel zur Erkennung, dass die Empfangseinrichtung (3) ein Befehlssignal (BS) für das Gerät (1) empfängt, Mittel zur Erkennung eines Schlüsselbefehlssignals (SBS), durch welches das Gerät (1) in einen Bereitschaftszustand zum Empfang von weiteren Befehlssignalen (BS) versetzt wird, umfassen.
12. Gerät nach Anspruch 10 oder 11, gekennzeichnet durch eine Filtereinrichtung (9) zum Ausfiltern eines akustischen Echos (AE) des vom Gerät (1) selbst ausgegebenen
Ausgangssignals aus einem von der Empfangseinrichtung (3) empfangenen Gesamtsignal.
13. Gerät nach Anspruch 12, dadurch gekennzeichnet, dass die Mittel (7) zur Reduzierung des Ausgangssignals einer Abzweigstelle des Geräts vor einer Abgriffsstelle (21) angeordnet sind, an welcher ein dem Ausgangssignal entsprechendes Signal für die Filtereinrichtung (9) abgegriffen wird.
14. Gerät nach Anspruch 12 oder 13, dadurch gekennzeichnet, dass die Filtereinrichtung (9) einen Eingang (12) zur Übermittlung eines Steuerbefehls zur Reduzierung der Lautstärke des Ausgangssignals des Geräts (1) aufweist.
15. Gerät nach einem der Ansprüche 10 bis 14, gekennzeichnet durch Mittel (5, 13, 16) zur Ermittlung des Verhältnisses zwischen einer Signalenergie.des Ausgangssignals und/oder des akustischen Echos (AE) des Ausgangssignals und einer Signalenergie des Befehlssignals (BS).
EP01991744A 2000-11-27 2001-11-19 Verfahren zur steuerung eines eine akustische ausgabeeinrichtung aufweisenden geräts Withdrawn EP1340224A1 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE10058786A DE10058786A1 (de) 2000-11-27 2000-11-27 Verfahren zum Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts
DE10058786 2000-11-27
PCT/EP2001/013468 WO2002043049A1 (de) 2000-11-27 2001-11-19 Verfahren zur steuerung eines eine akustische ausgabeeinrichtung aufweisenden geräts

Publications (1)

Publication Number Publication Date
EP1340224A1 true EP1340224A1 (de) 2003-09-03

Family

ID=7664796

Family Applications (1)

Application Number Title Priority Date Filing Date
EP01991744A Withdrawn EP1340224A1 (de) 2000-11-27 2001-11-19 Verfahren zur steuerung eines eine akustische ausgabeeinrichtung aufweisenden geräts

Country Status (7)

Country Link
US (1) US20030138118A1 (de)
EP (1) EP1340224A1 (de)
JP (1) JP2004514926A (de)
KR (1) KR20020071966A (de)
CN (1) CN1216364C (de)
DE (1) DE10058786A1 (de)
WO (1) WO2002043049A1 (de)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003263380A1 (en) * 2002-06-19 2004-01-06 Koninklijke Philips Electronics N.V. Audio signal processing apparatus and method
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
GB2394589B (en) * 2002-10-25 2005-05-25 Motorola Inc Speech recognition device and method
US9319741B2 (en) 2006-09-07 2016-04-19 Rateze Remote Mgmt Llc Finding devices in an entertainment system
US8607281B2 (en) * 2006-09-07 2013-12-10 Porto Vinci Ltd. Limited Liability Company Control of data presentation in multiple zones using a wireless home entertainment hub
US8214219B2 (en) * 2006-09-15 2012-07-03 Volkswagen Of America, Inc. Speech communications system for a vehicle and method of operating a speech communications system for a vehicle
JP5380777B2 (ja) * 2007-02-21 2014-01-08 ヤマハ株式会社 音声会議装置
KR101590332B1 (ko) 2012-01-09 2016-02-18 삼성전자주식회사 영상장치 및 그 제어방법
KR101987255B1 (ko) * 2012-08-20 2019-06-11 엘지이노텍 주식회사 음성 인식 장치 및 이의 음성 인식 방법
US9922646B1 (en) 2012-09-21 2018-03-20 Amazon Technologies, Inc. Identifying a location of a voice-input device
CN102945672B (zh) 2012-09-29 2013-10-16 深圳市国华识别科技开发有限公司 一种多媒体设备语音控制系统及方法
US9165566B2 (en) 2013-01-24 2015-10-20 Microsoft Technology Licensing, Llc Indefinite speech inputs
SE541496C2 (en) 2013-02-05 2019-10-22 Contour Design Inc Improved pointing device
DE102013012453B3 (de) * 2013-07-26 2014-10-16 Audi Ag Verfahren zum Betreiben eines Infotainment-Systems eines Kraftwagens und Infotainment-System für einen Kraftwagen
US8874448B1 (en) * 2014-04-01 2014-10-28 Google Inc. Attention-based dynamic audio level adjustment
KR102338041B1 (ko) * 2014-09-29 2021-12-10 현대모비스 주식회사 음성 인식 장치 및 방법
CN104505092B (zh) * 2014-12-10 2017-12-22 广东美的制冷设备有限公司 空调器语音控制方法和系统
US10031591B2 (en) 2015-05-08 2018-07-24 Contour Design, Inc. Pointing device bracket assembly and system
US9691378B1 (en) * 2015-11-05 2017-06-27 Amazon Technologies, Inc. Methods and devices for selectively ignoring captured audio data
CN106297837A (zh) * 2016-08-05 2017-01-04 易晓阳 一种语音控制音乐本地播放方法
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
CN106409294B (zh) * 2016-10-18 2019-07-16 广州视源电子科技股份有限公司 防止语音命令误识别的方法和装置
US11023053B2 (en) 2016-11-11 2021-06-01 Contour Innovations Llc Inner-sensor pointing device system
CN106796790B (zh) * 2016-11-16 2020-11-10 深圳达闼科技控股有限公司 机器人语音指令识别的方法及相关机器人装置
KR102398390B1 (ko) * 2017-03-22 2022-05-16 삼성전자주식회사 전자 장치 및 전자 장치의 제어 방법
EP3610480B1 (de) 2017-12-06 2022-02-16 Google LLC Verminderung und ausloeschung von audio-signalen aus nahe gelegenen vorrichtungen
JP6929811B2 (ja) * 2018-03-13 2021-09-01 Tvs Regza株式会社 音声対話端末、および音声対話端末制御方法
CN109658930B (zh) * 2018-12-19 2021-05-18 Oppo广东移动通信有限公司 语音信号处理方法、电子装置及计算机可读存储介质
CN109890573B (zh) * 2019-01-04 2022-05-03 上海阿科伯特机器人有限公司 移动机器人的控制方法、装置、移动机器人及存储介质
US11373686B1 (en) * 2019-12-23 2022-06-28 Gopro, Inc. Systems and methods for removing commands from sound recordings
FR3109050B1 (fr) * 2020-04-01 2022-03-04 Sagemcom Broadband Sas Réduction de la consommation électrique d’un équipement de restitution audio
CN112413859B (zh) * 2020-11-24 2021-11-16 珠海格力电器股份有限公司 空调器控制方法、装置、空调器及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1085500A2 (de) * 1999-09-13 2001-03-21 Matsushita Electric Industrial Co., Ltd. Zeitliche Verwaltung der Befehle an einem sprachgesteuerten Gerät

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2150174A5 (de) * 1971-08-18 1973-03-30 Dreyfus Jean
US4378603A (en) * 1980-12-23 1983-03-29 Motorola, Inc. Radiotelephone with hands-free operation
US4712231A (en) * 1984-04-06 1987-12-08 Shure Brothers, Inc. Teleconference system
JPS63171071A (ja) * 1987-01-08 1988-07-14 Matsushita Commun Ind Co Ltd 音声制御装置
US5267323A (en) * 1989-12-29 1993-11-30 Pioneer Electronic Corporation Voice-operated remote control system
DE4009900A1 (de) * 1990-03-20 1991-11-07 Blaupunkt Werke Gmbh Kraftfahrzeugkommunikationszentrale
JPH07109560B2 (ja) * 1990-11-30 1995-11-22 富士通テン株式会社 音声認識装置
US5457769A (en) * 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5633936A (en) * 1995-01-09 1997-05-27 Texas Instruments Incorporated Method and apparatus for detecting a near-end speech signal
JP3674990B2 (ja) * 1995-08-21 2005-07-27 セイコーエプソン株式会社 音声認識対話装置および音声認識対話処理方法
EP0810502A1 (de) * 1996-05-30 1997-12-03 DIEHL GMBH & CO. Steuereinheit für eine Heizungsanlage
DE19712632A1 (de) * 1997-03-26 1998-10-01 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Sprachfernsteuerung von Geräten

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1085500A2 (de) * 1999-09-13 2001-03-21 Matsushita Electric Industrial Co., Ltd. Zeitliche Verwaltung der Befehle an einem sprachgesteuerten Gerät

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
See also references of WO0243049A1 *
STRUOM N.; SENEFF S.: "Intelligent barge-in in conversational systems", PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE PROCESSING, 16 October 2000 (2000-10-16), pages 1 - 4, XP007011042 *

Also Published As

Publication number Publication date
WO2002043049A1 (de) 2002-05-30
KR20020071966A (ko) 2002-09-13
JP2004514926A (ja) 2004-05-20
US20030138118A1 (en) 2003-07-24
CN1216364C (zh) 2005-08-24
DE10058786A1 (de) 2002-06-13
CN1397063A (zh) 2003-02-12

Similar Documents

Publication Publication Date Title
EP1340224A1 (de) Verfahren zur steuerung eines eine akustische ausgabeeinrichtung aufweisenden geräts
DE69636985T2 (de) Sprachanwesenheitdetektor für halbduplex-audiokommunikationssystem
DE10251113A1 (de) Verfahren zum Betrieb eines Spracherkennungssystems
DE112009001303B4 (de) Echokompensator
EP2587481A2 (de) Steuerung einer Vorrichtung auf der Basis von Sprache
DE19521258A1 (de) Spracherkennungssystem
DE10163213A1 (de) Verfahren zum Betrieb eines Spracherkennungssystems
DE19712632A1 (de) Verfahren und Vorrichtung zur Sprachfernsteuerung von Geräten
DE19935808A1 (de) Echounterdrückungseinrichtung zum Unterdrücken von Echos in einer Sender/Empfänger-Einheit
DE4029697A1 (de) Sprachgesteuertes fernbedienungssystem
DE112011105908B4 (de) Verfahren und Gerät zur adaptiven Regelung des Toneffekts
DE60123803T2 (de) System zur steuerung eines gerätes mittels sprachbefehlen
EP3375204B1 (de) Audiosignalverarbeitung in einem fahrzeug
EP0693845A2 (de) Digitaler Telefonanrufbeantworter
KR20050005868A (ko) 음성 인식장치 및 방법
DE102006001730A1 (de) Beschallungsanlage, Verfahren zur Verbesserung der Sprachqualität und/oder Verständlichkeit von Sprachdurchsagen sowie Computerprogramm
EP0966100B1 (de) Verfahren und Einrichtung zur Beeinflussung der Lautstärke von Audiowiedergabegeräten in Kraftfahrzeugen
DE69930109T2 (de) Sprachgesteuerter schalter zur verwendung bei hohem umgebungsgeräusch
DE60303278T2 (de) Vorrichtung zur Verbesserung der Spracherkennung
EP0467157A2 (de) Sprachgesteuertes Gerät der Unterhaltungselektronik, insbesondere Videorecorder
WO1999048086A1 (de) Mikrophonanordnung für die spracherkennung unter variablen räumlichen bedingungen
EP0693849A1 (de) System zum Übertragen von codierten Sprachsignalen
DE10016619A1 (de) Verfahren zur Herabsetzung von Störkomponenten in Sprachsignalen
DE19639580C2 (de) Vorrichtung zur Reduktion akustischer Echos
DE19751536C2 (de) Spracherkennungspegelsteuervorrichtung in einem Spracherkennungstelefongerät und zugehöriges Steuerverfahren

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20030627

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

AX Request for extension of the european patent

Extension state: AL LT LV MK RO SI

17Q First examination report despatched

Effective date: 20060822

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20070811