WO2005041615A1 - Method and communication device with means for interference suppression in audio signals - Google Patents

Method and communication device with means for interference suppression in audio signals Download PDF

Info

Publication number
WO2005041615A1
WO2005041615A1 PCT/EP2004/008999 EP2004008999W WO2005041615A1 WO 2005041615 A1 WO2005041615 A1 WO 2005041615A1 EP 2004008999 W EP2004008999 W EP 2004008999W WO 2005041615 A1 WO2005041615 A1 WO 2005041615A1
Authority
WO
WIPO (PCT)
Prior art keywords
communication device
audio signals
reverberation time
algorithm
reverberation
Prior art date
Application number
PCT/EP2004/008999
Other languages
German (de)
French (fr)
Inventor
Frank Lorenz
Christoph Pörschmann
Original Assignee
Siemens Aktiengesellschaft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Aktiengesellschaft filed Critical Siemens Aktiengesellschaft
Publication of WO2005041615A1 publication Critical patent/WO2005041615A1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems

Definitions

  • the invention relates to a method for operating a communication device, wherein the communication device emits audio signals to an environment and, on the one hand, picks up these audio signals including environment-related superimposed interference components, which contain at least echo and reverberation, and, on the other hand, audio signals from an external sound source, preferably a communication device user, including their environment-related Interference, records, and the resumed audio signals are used by a first algorithm to determine a spatial impulse response of the environment.
  • the invention relates to a communication device with means for interference suppression of audio signals, the communication device having at least one loudspeaker, which emits audio signals to an environment and furthermore has at least one microphone with which, on the one hand, these audio signals including environment-related superimposed interference components, which are at least echo and Contain reverberation, be resumed and, on the other hand, audio signals from an external sound source, preferably a communication device user, including their environmental interference components, are recorded, and a first means is provided in the communication device, which has a means for calculating a room impulse response of the environment.
  • audio signals emitted via loudspeakers or generated by a sound source, for example the human voice, in rooms are generally falsified by echoes and reverberation. While the echoes from direct, simple and early reflections of the audio signal on one of the boundary surfaces of the room, such as the walls, floor or ceiling, the reverberation is diffuse and is generated by multiple reflections on the boundary surfaces that can only be estimated using statistical methods.
  • the type and duration of the reverberation are decisively influenced by the geometry of the room and the nature of the walls.
  • the reverberation time has so far been determined using two types of methods, namely statistical estimation methods or a method that uses one or more measurement signals.
  • information about the time and amplitude ratio of speech sections to speech pauses, averaged over many speakers and speech examples, is used in order to obtain information about the reverberation time via the change in this ratio compared to the value in the case of non-reverberated speech.
  • a measurement signal for example white noise
  • the reverberation time T60 can then be estimated via the correlation between the played measurement signal and the signal which is received again via the microphone of the communication device.
  • the inventors have recognized that information contained in the room impulse response can also be used to suppress further audio signals.
  • the room impulse response can be obtained using a known method.
  • the room impulse response calculated by the acoustic echo cancellation method can advantageously also be used to determine the reverberation time of the surroundings, the AEC method already being present in many telephones and using this room impulse response to suppress the resumed audio signals.
  • the audio signal emitted by a first communication device in hands-free mode usually the voice of the communication device user of the second communication device, including the interference components caused by the environment of the first communication device, is picked up again by the microphone of the first communication device, then this can be omitted first determine the spatial impulse response of these audio signals with a first algorithm.
  • the room impulse response implicitly includes the reverberation time T60, i.e. the reverberation time can be calculated from it.
  • the reverberation time of the room is determined from the room impulse response already determined by the first algorithm. This reverberation time can then be used to determine the reverberation in the recorded voice signal of the first communication device user.
  • the inventors also made use of the knowledge that the reverberation time does not change significantly at different positions of the sound source in the room.
  • the inventors propose a method for operating a communication device, the communication device emitting audio signals to an environment and on the one hand picking up these audio signals including environment-related superimposed interference components that contain at least echo and reverberation, and on the other hand audio signals from an external sound source, preferably a communication device user , including their environment-related interference, and a first algorithm determines a room impulse response of the environment to improve the effect that a second interference suppression algorithm is applied to the recorded audio signals from the external sound source, preferably from the communication device user, which reverberation time for interference suppression used, which it determines from the spatial impulse response determined by the first algorithm.
  • the reverberation time for interference suppression of audio signals from an external sound source can be used, which can be calculated from the room impulse response determined by emitting a known audio signal and then recording the audio signal reverberated in the room.
  • This method is more accurate than estimating the reverberation time of audio signals from an external sound source.
  • the method is particularly suitable for communication devices, such as for radio devices, mobile radio devices or landline telephones, since it is precisely here that a known signal can be emitted and subsequently recorded.
  • the method is also suitable for stand-alone devices that output audio signals via a loudspeaker and can also record audio signals via a microphone, using the reverberation time resulting from the environmental conditions of the stand-alone device and correspondingly suppressing it.
  • the reverberation time can be determined much more precisely with this method than with a previous estimate from the reverberated audio signal.
  • the new method can, for example, form the basis for real-time parameterization and real-time adaptation of algorithms for dangling speech signals.
  • the reverberation time is calculated from the energy decay of the reverberation, the information about the speed of this decay being contained in the room impulse response. This enables the reverberation time to be determined more precisely than the statistically based reverberation time estimate.
  • AEC Acoustic Echo Cancelation
  • This AEC algorithm is already available in many telephones and is actually used to suppress the audio signals that have been resumed.
  • the algorithm calculates a room impulse response, which according to the invention can be used to determine the reverberation time.
  • a second interference suppression algorithm is used to suppress the recorded audio signals of the communication device user.
  • Such a second interference suppression algorithm is to utilize the determined or adopted reverberation time to influence the interference components such as echo and reverberation, remove from the recorded audio signal of the communication device user.
  • the spatial impulse response is filtered as a function of the frequency and preferably by means of several bandpasses.
  • the reverberation time which itself is frequency-dependent, can be determined as a function of the frequency.
  • the described method for operating a communication device is based on the loudspeaker of an audio system emitting, for example, in a room and that this reverberates through the room Audio signal is picked up again by the microphone of the audio system.
  • a voice connection is established between the two mobile radio subscribers as proof.
  • the first mobile radio subscriber then disconnects the acoustic connection between the loudspeaker and the microphone while the second mobile radio subscriber speaks, for example by covering the loudspeaker with the hand. If the second mobile radio subscriber notices a significant deterioration in the quality of the audio signal, for example in the form of a reverberated voice when the first mobile radio subscriber speaks, the new method for determining the reverberation time in the device of the first mobile radio subscriber is used. This presupposes that a containment algorithm is used. The interruption of the transmission link in the first mobile radio terminal prevents the "interference suppression algorithm" used from being adapted to the reverberation time of the room.
  • the inventors also propose a known communication device with means for interference suppression of audio signals, the communication device having at least one loudspeaker that emits signals to an environment and furthermore has at least one microphone with which these audio signals, including environment-related superimposed interference components, which contain at least echo and reverberation, are picked up again and, on the other hand, audio signals from an external sound source, preferably a communication device user, including their environment-related interference components, are recorded.
  • the communication device having at least one loudspeaker that emits signals to an environment and furthermore has at least one microphone with which these audio signals, including environment-related superimposed interference components, which contain at least echo and reverberation, are picked up again and, on the other hand, audio signals from an external sound source, preferably a communication device user, including their environment-related interference components, are recorded.
  • a first means is provided in the communication device, which has a means for calculating a room impulse response of the environment, to improve such that a second means is arranged for the recorded audio signals of the external sound source, preferably of the communication device user, including their environmental interference components, the has a means for determining the reverberation time, which determines the reverberation time contained in the room impulse response determined by the first means.
  • This provides a communication device in which the reverberation time, which was determined by utilizing the radiation of a known audio signal and then recording the audio signal reverberated in the room by determining the room impulse response, was determined, which is now also used to suppress the interference of the audio signals of an external one Sound source can be used.
  • the interference suppression can take place more precisely than before, since the reverberation time is determined better and more precisely.
  • the first means has program means and / or program modules that determine the reverberation time.
  • the second means can have program means and / or program modules that determine the reverberation time.
  • the second means have program means and / or program modules which execute an algorithm which, using the reverberation time determined as a function of the environment, removes the interference components, such as echo and reverberation, superimposed on the environment, from the recorded audio signal of the communication device user.
  • the determination of the reverberation time as a function of the frequency and, accordingly, the frequency-dependent interference suppression of the audio signals is advantageously implemented in the communication device if bandpass filters are arranged in the communication device that filter the room impulse response.
  • the new communication device can be a telephone, for example in the form of a mobile radio terminal or a wired telephone, an electrical household appliance or an electrical module of a vehicle with means for voice input and output.
  • Figure 1 Temporal energy distribution of an originally pulsed audio signal in a room
  • Figure 2 Temporal energy distribution of the same audio signal from Figure 1, but in a smaller room
  • Figure 3 Measured room impulse response of a room
  • Figure 4 Two communication devices that exchange signals, the new method being used in a communication device
  • Figure 5 Voice-controlled electrical device in which the new method is used.
  • FIG. 1 shows an example of a diagram of the temporal energy distribution of an audio signal that can be recorded and measured in a room with a microphone when an impulsive audio signal, for example a bang, occurs.
  • This energy distribution can be obtained by forms a square impulse response and logarithmizes it.
  • the logarithmic signal amplitudes, as a measure of the energy of the audio signal, and the time, each in arbitrary units, are plotted on the ordinate of the diagram.
  • the first line on the far left of the diagram shows the so-called direct sound 1, which goes directly from the sound source to the measuring microphone. Then follow, in this example, the energetically weaker echoes 2, which were reflected once or twice on the walls of the room before they reach the measuring microphone.
  • reverberation 3 which consists of quasi-chaotic superimposed reflections of the audio signal in the room and arrives diffusely at the measuring microphone.
  • the new method uses the reverberation time T60 of an audio signal, which was determined from the room impulse response 14, which is characteristic for a specific room.
  • an energy range A60 is determined on the ordinate of the diagram in FIG. 1, which lies in the range of the reverberation 3, in which the energy of the reverberation drops by 60 decibels.
  • the upper and lower limit values of the energy range A60 are first projected onto the reverberation curve 3 and then onto the abscissa, ie the time axis.
  • the projected area on the time axis corresponds to the reverberation time T60.
  • the energy range does not necessarily have to be selected with 60 decibels, but can also be selected to be smaller or larger.
  • a range can also be selected in which the energy of the Reverberation, for example, drops by 30 decibels.
  • the value obtained from the projection on the time axis must be adjusted accordingly by the factor of the reduction / increase in energy. With an energy range of only 30 decibels, the time period is multiplied by a factor of 2 in order to obtain the reverberation time T60.
  • FIG. 2 again shows an example of the temporal energy distribution of a pulse-like audio signal, for example a bang.
  • the audio signal should be recorded in a smaller room. This manifests itself in a lower reverberation 3.
  • the reverberation curve 3 drops more quickly, as a result of which the reverberation time T60 is also shorter than in FIG. 1.
  • the direct sound 1 and the echoes 2 in the diagram in FIG. 2 have been adopted unchanged from the diagram in FIG. When measuring a signal in real terms, however, there could be differences.
  • the reverberation time T60 can be determined from the energetic drop in reverberation 3, ie the negative slope of reverberation curve 3.
  • FIG. 3 now shows a measured room impulse response 14 of a room.
  • the signal amplitudes are plotted on the ordinate and time is plotted on the abscissa.
  • the rate at which the energy in the room impulse response decays over time is characteristic of this particular room. This speed will be obtained regardless of the measurement signal and the position of the sound source and microphone in the room for this particular room.
  • FIG. 4 shows two communication devices 13.1 and 13.2, which exchange signals 4 and 12 via an interface 13.3.
  • the communication devices 13.1 and 13.2 can be, for example, end devices in the mobile radio network.
  • the new method is used in the communication device 13.1.
  • the first communication device 13.1 is to be located in an environment, for example in a church in which reverberation effects occur. This environment is indicated by a rectangle open on one side with the reference symbol 9.
  • the signal 4 is sent via the interface 13.3 from the second communication device 13.2 to the first communication device 13.1 and received by the latter.
  • the signal 12 is to be sent from the first communication device 13.1 to the second communication device 13.2, in this case interference which occurs due to the environment 9 of the first communication device 13.1 is to be suppressed.
  • the first communication device 13.1 has at least one digital-to-analog converter 6, which converts the digital signals 4 sent by the second communication device 13.2 into analog signals and forwards them to a loudspeaker 7.
  • the first communication device 13.1 has a microphone 10, which can record analog signals and digitized via an analog-digital converter 11.
  • the new method is intended to suppress signal 15.1, usually voice signals, which a communication device user 15 emits to microphone 10 of first communication device 13.1.
  • the interference is suppressed by suppressing the unwanted echo 15.2 and the unwanted reverb 15.3 as completely as possible.
  • the reverberation time T60 must be determined.
  • the new procedure makes use of the following: -
  • the reverberation time which is characteristic of this environment 9, is included in the room impulse response.
  • the room impulse response in turn can be determined from the ratio of signals 8.2 and 8.3 to signal 8.1.
  • the reverberation time does not change significantly at different positions of the sound source in the room. That is, the signals 8.1 to 8.3 which reach the microphone 10 from the loudspeaker 7 and the signals 15.1 to 15.3 which reach the microphone 10 by the communication device user 15 have a similar reverberation time.
  • the reverberation time already known is made usable for the suppression of signal 15.1 as follows.
  • the signal 4 sent by the second communication device 13.2 is converted by the digital-to-analog converter 6 and output via the loudspeaker 7 of the first communication device 13.1.
  • Analogous to the diagrams in FIGS. 1 and 2, the signal 4 in the form of direct sound 8.1, echo 8.2 and reverberation 8.3 can reach the microphone 10 of the first communication device 13.1.
  • the direct sound 8.1, the echo 8.2 and the reverberation 8.3 are converted via an analog-digital converter 6 and the room impulse response is determined using an algorithm 5.
  • a so-called AEC algorithm Acoustic Echo Cancellation
  • AEC Acoustic Echo Cancellation
  • This algorithm is used to compensate the echo of the voice signal of the distant subscriber, which is emitted by the loudspeaker 7 and is undesirably picked up again by the microphone 10, in the hands-free mode.
  • an impulse response is calculated by estimating the transmission link loudspeaker 7 and microphone 10.
  • the echo suppression takes place.
  • the signal is suppressed by an interference suppression unit 17.
  • a known algorithm which was first published by "Welch”, can be used to determine the room impulse response.
  • the Welch method (see also Welch, PD [1970], "The Use of Fast Fourier Transform for the Estimation of Power Spectra", IEEE Trans Audio Electroacoustic, Vol AU15, pp70-73) describes the determination of an impulse response by the radiation of a Output signal and the measurement of the input signal. The only requirement for the output signal is the presence of sufficient energy in the frequency ranges to be considered.
  • the reverberation time can be determined from this.
  • This reverberation time can also be used for interference suppression of the signal 15.1 of the communication device user 15, since the reverberation times, which are for the transmission of signals 8.1 to 8.3 from the loudspeaker 7 via the environment 9 to the microphone 10 and for the transmission of signals 15.1 to 15.3 from Communication device user 15 to the microphone 10 are similar.
  • a further algorithm 16 is provided which has access to the data of the algorithm 5, that is to say also to the room impulse response and the reverberation time contained therein. Then the signals 15.1 to 15.3 are suppressed with an interference suppression unit 17 and output as signals 12.
  • FIG. 5 shows a special embodiment of a communication device.
  • the new method is used in a voice-controlled electrical device 13.4.
  • the operator 15 of the voice-controlled electrical device is only in contact with the voice-controlled electrical device 13.4 and not how in Figure 4 with a further communication participant who is located on a second communication device.
  • the voice-controlled electrical device 13.4 has a speech generation module 18 in order to be able to output signals 4.1, for example the menu scope of the electrical device 13.4, via the loudspeaker 7.
  • the voice-controlled electrical device 13.4 has a speech recognition module 19 in order to be able to recognize signals 12.1, for example the language of the operator 15.
  • the signals output via the loudspeaker 7 in the form of direct sound 8.1, echo 8.2 and reverberation 8.3 can be picked up by the microphone 10 unintentionally.
  • an algorithm 5 is executed in the voice-controlled electrical device 13.4, which among other things also determines the room impulse response.
  • this feedback is suppressed by an interference suppression unit 17.
  • the algorithm 5 cannot be used to suppress the signal 15.1 sent by the operator 15 to the microphone 10.
  • the reverberation time which can be calculated from the room impulse response, which was determined in the algorithm 5, but which applies almost equally to the signals 15.1 to 15.3 of the operator 15, can be used by a further algorithm 16, which uses an interference suppression unit 17 to generate the signal 15.1 suppressed.

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Transceivers (AREA)
  • Noise Elimination (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

The invention relates to a method for the operation of a communication device (13.1, 13.2, 13.4) and a communication device (13.1, 13.2, 13.4) with means for interference suppression in audio signals, whereby the communication device (13.1, 13.2, 13.4) broadcasts audio signals (8.1 to 8.3) into an environment (9) and records both said audio signals (8.1 to 8.3), including overlaid interference components caused by the environment, containing at least echoes (8.2) and reverberations (8.3) and audio signals (15.1 to 15.3) from an external noise source, preferably a communication device user (15), including the interference components (15.2 and 15.3) thereof, caused by the environment and a first algorithm (5) determines a spatial impulse reply (14) for the environment (9). The method for operation of a communication device and the communication device with means for interference suppression in audio signals is characterised in that a second interference suppression algorithm (16) is applied to the recorded audio signals (15.1 to 15.3), for the external noise source, preferably for the communication terminal user (15), which uses a reverberation time (T60) in the suppression, determined from the spatial impulse reply (14), provided by the first algorithm (5).

Description

VERFAHREN UND KOMMUNIKATIONSGERÄT MIT MITTELN ZUR ENTSTÖRUNG VON AUDIOSIGNALEN METHOD AND KO M MUNIKATIONSGERÄT WITH MEANS FOR SUPPRESSION OF AUDIO SIGNALS
Die Erfindung betrifft ein Verfahren zum Betrieb eines Kommunikationsgerätes, wobei das Kommunikationsgerät Audiosignale an eine Umgebung abstrahlt und einerseits diese Audiosignale einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo und Nachhall enthalten, wieder aufnimmt und andererseits Audiosignale einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers, einschließlich deren umgebungsbedingter Störanteile, aufnimmt, und die wiederaufgenommenen Audiosignale durch einen ersten Algorithmus benutzt werden, um eine Raumimpulsantwort der Umgebung zu bestimmen.The invention relates to a method for operating a communication device, wherein the communication device emits audio signals to an environment and, on the one hand, picks up these audio signals including environment-related superimposed interference components, which contain at least echo and reverberation, and, on the other hand, audio signals from an external sound source, preferably a communication device user, including their environment-related Interference, records, and the resumed audio signals are used by a first algorithm to determine a spatial impulse response of the environment.
Des weiteren betrifft die Erfindung ein Kommunikationsgerät mit Mitteln zur Entstörung von Audiosignalen, wobei das Kommunikationsgerät über zumindest einen Lautsprecher verfügt, der Audiosignale an eine Umgebung abstrahlt und weiterhin zumindest ein Mikrofon aufweist, mit dem einerseits diese Audiosignale einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo und Nachhall enthalten, wieder aufgenommen werden und andererseits Audiosignale einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers, einschließlich deren umgebungsbedingter Störanteile, aufgenommen werden, und im Kommunikationsgerät ein erstes Mittel vorgesehen ist, das ein Mittel zur Berechnung einer Raumimpulsantwort der Umgebung aufweist.Furthermore, the invention relates to a communication device with means for interference suppression of audio signals, the communication device having at least one loudspeaker, which emits audio signals to an environment and furthermore has at least one microphone with which, on the one hand, these audio signals including environment-related superimposed interference components, which are at least echo and Contain reverberation, be resumed and, on the other hand, audio signals from an external sound source, preferably a communication device user, including their environmental interference components, are recorded, and a first means is provided in the communication device, which has a means for calculating a room impulse response of the environment.
Es ist allgemein bekannt, dass über Lautsprecher abgestrahlte oder von einer Schallquelle, zum Beispiel der menschlichen Stimme, erzeugte Audiosignale in Räumen im Allgemeinen durch Echos und Nachhall verfälscht werden. Während die Echos aus direkten, einfachen und frühen Reflexionen des Audiosignals an einer der Begrenzungsflächen des Raumes, zum Beispiel den Wänden, dem Boden oder der Decke, bestehen, ist der Nachhall diffus und wird durch mehrfache, nur noch nach statistischen Methoden abschätzbare Reflexionen an den Begrenzungsflächen erzeugt .It is generally known that audio signals emitted via loudspeakers or generated by a sound source, for example the human voice, in rooms are generally falsified by echoes and reverberation. While the echoes from direct, simple and early reflections of the audio signal on one of the boundary surfaces of the room, such as the walls, floor or ceiling, the reverberation is diffuse and is generated by multiple reflections on the boundary surfaces that can only be estimated using statistical methods.
Die Art und Dauer des Nachhalls werden von der Geometrie des Raumes und der Beschaffenheit der Wände entscheidend beein- flusst. Verschiedene Algorithmen der digitalen Sprach- und Audiosignalverarbeitung, vor allem solche, welche sich mit dem Problem der Enthallung von Sprachsignalen befassen, benötigen häufig eine Abschätzung der sogenannten Nachhallzeit. Die Nachhallzeit, meist mit T60 abgekürzt, ist eine in der Akustik bekannte wichtige Kenngröße für Räume. Sie kann frequenzabhängig bestimmt werden und beschreibt, in welcher Zeit nach dem Verstummen einer Signalquelle die Energie des Hallsignals um 60 dB [dB = Dezibel], gegebenenfalls noch abhängig von dem jeweiligen Frequenzband, abgefallen ist.The type and duration of the reverberation are decisively influenced by the geometry of the room and the nature of the walls. Different algorithms of digital speech and audio signal processing, especially those that deal with the problem of the reverberation of speech signals, often require an estimate of the so-called reverberation time. The reverberation time, usually abbreviated to T60, is an important parameter for rooms that is known in acoustics. It can be determined as a function of frequency and describes the time after which a signal source has become silent, the energy of the Hall signal has dropped by 60 dB [dB = decibel], possibly also depending on the respective frequency band.
Die Nachhallzeit wird bisher über zwei Verfahrensarten bestimmt, nämlich über statistische Schätzverfahren oder durch ein Verfahren, das sich eines oder mehrerer Messsignale bedient.The reverberation time has so far been determined using two types of methods, namely statistical estimation methods or a method that uses one or more measurement signals.
Im ersten Fall wird zum Beispiel eine über viele Sprecher und Sprachbeispiele gemittelte Information über das Zeit- und Amplitudenverhältnis von Sprachabschnitten zu Sprachpausen herangezogen, um über die Veränderung dieses Verhältnisses im Vergleich zum Wert bei unverhallter Sprache eine Aussage über die Nachhallzeit zu gewinnen.In the first case, information about the time and amplitude ratio of speech sections to speech pauses, averaged over many speakers and speech examples, is used in order to obtain information about the reverberation time via the change in this ratio compared to the value in the case of non-reverberated speech.
Man kann leicht erkennen, dass hier sprecherspezifische Eigenarten, wie zum Beispiel häufige und/oder lange Sprachpausen, diese Abschätzung stark verfälschen können. Es ist zu betonen, dass eine Abschätzung der Nachhallzeit ohne Verwendung eines Messsignals, also zum Beispiel während eines Telefongesprächs, im Allgemeinen sehr problematisch ist, da nicht ohne weiteres feststellbar ist, welche Signalanteile des vom Mikrofon aufgenommenen Schallsignals Direktschall und welche Anteile Echo oder Hall sind. Unter Direktschall versteht man das Signal, welches ohne eine einzige Reflexion direkt vom Sprecher, also von der "Schallquelle" zum Mikrofon gelangt. Eine auf statistischen Merkmalen basierte Schätzung der Nachhallzeit kann höchstens dadurch erfolgen, dass Merkmale typischer unverhallter, "sauberer" Sprache mit den Merkmalen des vorliegenden, aufgenommenen, verhallten Sprachsignals verglichen werden.It is easy to see that speaker-specific idiosyncrasies, such as frequent and / or long language breaks, can greatly falsify this estimate. It should be emphasized that estimating the reverberation time without using a measurement signal, for example during a telephone call, is generally very problematic because it is not It can easily be determined which signal components of the sound signal recorded by the microphone are direct sound and which components are echo or reverb. Direct sound is the signal that goes directly from the speaker, ie from the "sound source" to the microphone, without a single reflection. An estimation of the reverberation time based on statistical features can at most be carried out by comparing features of typical unhallowed, "clean" speech with the features of the present, recorded, reverberated speech signal.
Im zweiten Fall muss über eine externe Schallquelle ein Messsignal, zum Beispiel weißes Rauschen, abgespielt werden, welches dem System bekannt ist. Über die Korrelation zwischen dem abgespielten Messsignal und dem Signal, welches über das Mikrofon des Kommunikationsgeräts wieder empfangen wird, kann dann die Abschätzung der Nachhallzeit T60 erfolgen. Diese Möglichkeit ist höchstens für Versuchsaufbauten praktikabel, da zum Beispiel dem Benutzer eines Telefons nicht zugemutet werden kann, vor oder während jedes Gesprächs erst mit dem Telefon eine solche Messung durchzuführen.In the second case, a measurement signal, for example white noise, must be played back via an external sound source, which is known to the system. The reverberation time T60 can then be estimated via the correlation between the played measurement signal and the signal which is received again via the microphone of the communication device. This option is practicable for experimental setups at the most, since, for example, the user of a telephone cannot be expected to carry out such a measurement before or during each conversation with the telephone.
Je genauer die Nachhallzeit bekannt ist, desto besser lässt sich die Enthallung eines Audiosignals ermöglichen.The more precisely the reverberation time is known, the better it is possible to re-dew an audio signal.
Es ist daher Aufgabe der Erfindung, ein Verfahren zum Betrieb eines Kommunikationsgerätes und ein Kommunikationsgerät mit Mitteln zur Entstörung von Audiosignalen zu finden, welches im Vergleich zu den bisher bekannten Verfahren und Hardwaregeräten mit einer genauer ermittelten Nachhallzeit auch eine bessere Entstörung der Audiosignale zulässt.It is therefore an object of the invention to find a method for operating a communication device and a communication device with means for interference suppression of audio signals which, in comparison with the previously known methods and hardware devices with a more precisely determined reverberation time, also permits better interference suppression of the audio signals.
Diese Aufgaben der Erfindung werden durch das Verfahren mit den Merkmalen des Patentanspruches 1 und gegenständlich durch das Kommunikationsgerät mit den Merkmalen des Patentanspruches 8 gelöst. Vorteilhafte Weiterbildungen der Erfindung sind Gegenstand untergeordneter Patentansprüche. Die Erfinder haben erkannt, dass Informationen, die in der Raumimpulsantwort enthalten sind, auch zur Entstörung weiterer Audiosignale verwendet werden können. Die Raumimpulsantwort kann mit Hilfe eines bekannten Verfahrens gewonnen werden. Vorteilhaft kann die durch das Acoustic Echo Cancelati- on-Verfahren berechnete Raumimpulsantwort, wobei das AEC- Verfahren in vielen Telefonen schon vorhanden ist und welches diese Raumimpulsantwort zur Unterdrückung der wiederaufgenommenen Audiosignale benutzt, auch zur Bestimmung der Nachhallzeit der Umgebung verwendet werden.These objects of the invention are achieved by the method with the features of claim 1 and objectively by the communication device with the features of claim 8. Advantageous developments of the invention are the subject of subordinate claims. The inventors have recognized that information contained in the room impulse response can also be used to suppress further audio signals. The room impulse response can be obtained using a known method. The room impulse response calculated by the acoustic echo cancellation method can advantageously also be used to determine the reverberation time of the surroundings, the AEC method already being present in many telephones and using this room impulse response to suppress the resumed audio signals.
Wird beispielsweise - im Falle von zwei Kommunikationsgeräten - das von einem ersten Kommunikationsgerät im Freisprechmodus abgestrahlte Audiosignal, üblicherweise die Stimme des Kommunikationsgerätenutzers des zweiten Kommunikationsgerätes, inklusive der durch die Umgebung des ersten Kommunikationsgeräts bedingter Störanteile wieder vom Mikrofon des ersten Kommunikationsgeräts aufgenommen, so lässt sich aus diesen Audiosignalen mit einem ersten Algorithmus zunächst die Raumimpulsantwort bestimmen. Die Raumimpulsantwort beinhaltet implizit die Nachhallzeit T60, das heißt die Nachhallzeit kann aus ihr berechnet werden.If, for example, in the case of two communication devices, the audio signal emitted by a first communication device in hands-free mode, usually the voice of the communication device user of the second communication device, including the interference components caused by the environment of the first communication device, is picked up again by the microphone of the first communication device, then this can be omitted first determine the spatial impulse response of these audio signals with a first algorithm. The room impulse response implicitly includes the reverberation time T60, i.e. the reverberation time can be calculated from it.
Soll nun ein weiteres Audiosignal, zum Beispiel die Sprache des Kommunikationsgerätenutzers vom ersten Kommunikationsgerät, aufgenommen werden, welches seinerseits durch die Umgebung störbehaftet ist, so wird aus der bereits vom ersten Algorithmus bestimmten Raumimpulsantwort die Nachhallzeit des Raumes bestimmt. Diese Nachhallzeit kann dann genutzt werden, um den Nachhall im aufgenommenen Sprachsignal des ersten Kommunikationsgerätenutzers zu bestimmen. Hierbei machen sich die Erfinder zusätzlich die Erkenntnis zu nutzte, das sich die Nachhallzeit auch bei verschiedenen Positionen der Schallquelle im Raum nicht signifikant ändert. Entsprechend diesem Erfindungsgedanken schlagen die Erfinder ein Verfahren zum Betrieb eines Kommunikationsgerätes vor, wobei das Kommunikationsgerät Audiosignale an eine Umgebung abstrahlt und einerseits diese Audiosignale einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo und Nachhall enthalten, wieder aufnimmt und andererseits Audiosignale einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers, einschließlich deren umgebungsbedingter Störanteile, aufnimmt, und ein erster Algorithmus eine Raumimpulsantwort der Umgebung bestimmt, dahingehend zu verbessern, dass auf die aufgenommenen Audiosignale der externen Schallquelle, vorzugsweise des Kommunikationsengeräte- nutzers, ein zweiter Entstör-Algorithmus angewendet wird, der zur Entstörung eine Nachhallzeit verwendet, die er aus der durch den ersten Algorithmus bestimmten Raumimpulsantwort ermittelt .If a further audio signal, for example the language of the communication device user from the first communication device, is to be recorded, which in turn is subject to interference from the environment, the reverberation time of the room is determined from the room impulse response already determined by the first algorithm. This reverberation time can then be used to determine the reverberation in the recorded voice signal of the first communication device user. Here, the inventors also made use of the knowledge that the reverberation time does not change significantly at different positions of the sound source in the room. In accordance with this inventive concept, the inventors propose a method for operating a communication device, the communication device emitting audio signals to an environment and on the one hand picking up these audio signals including environment-related superimposed interference components that contain at least echo and reverberation, and on the other hand audio signals from an external sound source, preferably a communication device user , including their environment-related interference, and a first algorithm determines a room impulse response of the environment to improve the effect that a second interference suppression algorithm is applied to the recorded audio signals from the external sound source, preferably from the communication device user, which reverberation time for interference suppression used, which it determines from the spatial impulse response determined by the first algorithm.
Hierdurch lässt sich diejenige Nachhallzeit zur Entstörung von Audiosignalen einer externen Schallquelle nutzen, die aus der durch Abstrahlung eines bekannten Audiosignals und der anschließenden Aufnahme des im Raum verhallten Audiosignals bestimmten Raumimpulsantwort berechnet werden kann. Gegenüber der Schätzung der Nachhallzeit von Audiosignalen einer externen Schallquelle ist dieses Verfahren genauer.In this way, the reverberation time for interference suppression of audio signals from an external sound source can be used, which can be calculated from the room impulse response determined by emitting a known audio signal and then recording the audio signal reverberated in the room. This method is more accurate than estimating the reverberation time of audio signals from an external sound source.
Das Verfahren eignet sich besonders gut für Kommunikationsgeräte, wie zum Beispiel für Funkgeräte, Mobilfunkgeräte oder Festnetztelefone, da gerade hier die Möglichkeit der Abstrahlung eines bekannten Signals und der anschließenden Aufnahme gegeben ist. Aber auch für Stand-Alone-Geräte, die Audiosignale über einen Lautsprecher ausgeben und auch Audiosignale über ein Mikrofon aufnehmen können, ist das Verfahren geeignet, die durch die Umgebungsbedingung des Stand-Alone-Gerätes ergebende Nachhallzeit zu nutzen und entsprechend zu entstören. Außerdem ist die Bestimmung der Nachhallzeit über dieses Verfahren wesentlich genauer möglich, als gegenüber einer bisherigen Abschätzung aus dem verhallten Audiosignal.The method is particularly suitable for communication devices, such as for radio devices, mobile radio devices or landline telephones, since it is precisely here that a known signal can be emitted and subsequently recorded. But the method is also suitable for stand-alone devices that output audio signals via a loudspeaker and can also record audio signals via a microphone, using the reverberation time resulting from the environmental conditions of the stand-alone device and correspondingly suppressing it. In addition, the reverberation time can be determined much more precisely with this method than with a previous estimate from the reverberated audio signal.
Das neue Verfahren kann beispielsweise die Grundlage für eine Echtzeitparametrisierung und eine Echtzeitanpassung von Algorithmen zur Enthallung von Sprachsignalen bilden.The new method can, for example, form the basis for real-time parameterization and real-time adaptation of algorithms for dangling speech signals.
Es ist vorteilhaft, wenn ausschließlich der erste Algorithmus die Nachhallzeit bestimmt.It is advantageous if only the first algorithm determines the reverberation time.
Alternativ dazu ist es möglich, dass ausschließlich der zweite Entstör-Algorithmus die Nachhallzeit bestimmt.Alternatively, it is possible that only the second interference suppression algorithm determines the reverberation time.
Weiterhin ist es günstig, wenn die Nachhallzeit aus dem energetischen Abfall des Nachhalls berechnet wird, wobei die Information über die Geschwindigkeit dieses Abfalls in der Raumimpulsantwort enthalten ist. Hierdurch kann eine genauere Bestimmung der Nachhallzeit gegenüber der statistisch basierten Schätzung der Nachhallzeit erfolgen.Furthermore, it is advantageous if the reverberation time is calculated from the energy decay of the reverberation, the information about the speed of this decay being contained in the room impulse response. This enables the reverberation time to be determined more precisely than the statistically based reverberation time estimate.
Zur Bestimmung der Raumimpulsantwort, aus der dann die Nachhallzeit bestimmt werden kann, kann in dem neuen Verfahren beim ersten Algorithmus ein AEC-Algorithmus (AEC = Acoustic Echo Cancelation) verwendet werden. Dieser AEC-Algorithmus ist in vielen Telefonen schon heute vorhanden und wird eigentlich zur Unterdrückung der wiederaufgenommenen Audiosignale benutzt. Der Algorithmus berechnet eine Raumimpulsantwort, welche sich erfindungsgemäß zur Bestimmung der Nachhallzeit verwenden lässt.To determine the room impulse response, from which the reverberation time can then be determined, an AEC algorithm (AEC = Acoustic Echo Cancelation) can be used in the new algorithm in the new method. This AEC algorithm is already available in many telephones and is actually used to suppress the audio signals that have been resumed. The algorithm calculates a room impulse response, which according to the invention can be used to determine the reverberation time.
Zur Entstörung der aufgenommenen Audiosignale des Kommunikationsgerätenutzers wird ein zweiter Entstör-Algorithmus verwendet. Ein solcher zweiter Entstör-Algorithmus soll unter Ausnutzung der bestimmten oder übernommenen Nachhallzeit die umgebungsbedingt überlagerten Störanteile, wie Echo und Hall, aus dem aufgenommenen Audiosignal des Kommunikationsgerätenutzers entfernen.A second interference suppression algorithm is used to suppress the recorded audio signals of the communication device user. Such a second interference suppression algorithm is to utilize the determined or adopted reverberation time to influence the interference components such as echo and reverberation, remove from the recorded audio signal of the communication device user.
Für das Verfahren ist es ebenfalls vorteilhaft, wenn die Raumimpulsantwort in Abhängigkeit der Frequenz und vorzugsweise durch mehrere Bandpässe gefiltert wird. Hierdurch kann die Nachhallzeit, die selbst frequenzabhängig ist, in Abhängigkeit der Frequenz bestimmt werden.It is also advantageous for the method if the spatial impulse response is filtered as a function of the frequency and preferably by means of several bandpasses. In this way, the reverberation time, which itself is frequency-dependent, can be determined as a function of the frequency.
An dieser Stelle sei erwähnt, dass die Anwendung des neuen Verfahrens sehr einfach bei zwei Kommunikationsgeräten nachgewiesen werden kann: Das beschriebene Verfahren zum Betrieb eines Kommunikationsgerätes basiert darauf, dass der Lautsprecher eines Audiosystems, zum Beispiel in einen Raum abstrahlt und dass das durch den Raum verhallte Audiosignal wieder vom Mikrofon des Audiosystems aufgenommen wird.At this point it should be mentioned that the application of the new method can be demonstrated very easily with two communication devices: The described method for operating a communication device is based on the loudspeaker of an audio system emitting, for example, in a room and that this reverberates through the room Audio signal is picked up again by the microphone of the audio system.
Zum Nachweis wird eine Sprachverbindung zwischen den zwei Mobilfunkteilnehmern aufgebaut. Anschließend trennt der erste Mobilfunkteilnehmer, während der zweite Mobilfunkteilnehmer spricht, die akustische Verbindung zwischen Lautsprecher und Mikrofon, zum Beispiel durch Verdecken des Lautsprechers mit der Hand. Bemerkt nun der zweite Mobilfunkteilnehmer eine deutliche Verschlechterung der Qualität des Audiosignals, zum Beispiel in Form einer verhallten Stimme, wenn der erste Mo- bilfunkendteilnehmer spricht, so wird das neue Verfahren zur Bestimmung der Nachhallzeit im Gerät des ersten Mobilfunkend- teilnehmers angewendet. Dies setzt voraus, dass ein Enthal- lungs-Algorithmus angewendet wird. Die Unterbrechung der Ü- bertragungsstrecke beim ersten Mobilfunkendgerät verhindert eine Adaption des verwendeten "Entstör-Algorithmus" an die Nachhallzeit des Raums.A voice connection is established between the two mobile radio subscribers as proof. The first mobile radio subscriber then disconnects the acoustic connection between the loudspeaker and the microphone while the second mobile radio subscriber speaks, for example by covering the loudspeaker with the hand. If the second mobile radio subscriber notices a significant deterioration in the quality of the audio signal, for example in the form of a reverberated voice when the first mobile radio subscriber speaks, the new method for determining the reverberation time in the device of the first mobile radio subscriber is used. This presupposes that a containment algorithm is used. The interruption of the transmission link in the first mobile radio terminal prevents the "interference suppression algorithm" used from being adapted to the reverberation time of the room.
Zur gegenständlichen Lösung ihrer Aufgabe schlagen die Erfinder auch vor, ein bekanntes Kommunikationsgerät mit Mitteln zur Entstörung von Audiosignalen, wobei das Kommunikationsgerät über zumindest einem Lautsprecher verfügt, der Audiosig- nale an eine Umgebung abstrahlt und weiterhin zumindest ein Mikrofon aufweist, mit dem einerseits diese Audiosignale einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo und Nachhall enthalten, wieder aufgenommen werden und andererseits Audiosignale einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers, einschließlich deren umgebungsbedingter Störanteile aufgenommen werden, und im Kommunikationsgerät ein erstes Mittel vorgesehen ist, das ein Mittel zur Berechnung einer Raumimpulsantwort der Umgebung aufweist, dahingehend zu verbessern, dass ein zweites Mittel für die aufgenommenen Audiosignale der externen Schallquelle, vorzugsweise des Kommunikationsengeräte- nutzers, einschließlich deren umgebungsbedingter Störanteile angeordnet ist, das ein Mittel zur Ermittlung der Nachhallzeit aufweist, das die Nachhallzeit ermittelt, die in der durch das erste Mittel bestimmten Raumimpulsantwort enthalten ist.To achieve the objective solution of the task, the inventors also propose a known communication device with means for interference suppression of audio signals, the communication device having at least one loudspeaker that emits signals to an environment and furthermore has at least one microphone with which these audio signals, including environment-related superimposed interference components, which contain at least echo and reverberation, are picked up again and, on the other hand, audio signals from an external sound source, preferably a communication device user, including their environment-related interference components, are recorded. and a first means is provided in the communication device, which has a means for calculating a room impulse response of the environment, to improve such that a second means is arranged for the recorded audio signals of the external sound source, preferably of the communication device user, including their environmental interference components, the has a means for determining the reverberation time, which determines the reverberation time contained in the room impulse response determined by the first means.
Hierdurch wird ein Kommunikationsgerät zur Verfügung gestellt, in dem die Nachhallzeit, die durch die Ausnutzung der Abstrahlung eines bekannten Audiosignals und der anschließenden Aufnahme des im Raum verhallten Audiosignals über die Bestimmung der Raumimpulsantwort, bestimmt wurde, welches nun auch für die Entstörung der Audiosignale einer externen Schallquelle verwendet werden kann. Die Entstörung kann hierbei genauer als bisher erfolgen, da die Nachhallzeit besser und genauer bestimmt wird.This provides a communication device in which the reverberation time, which was determined by utilizing the radiation of a known audio signal and then recording the audio signal reverberated in the room by determining the room impulse response, was determined, which is now also used to suppress the interference of the audio signals of an external one Sound source can be used. The interference suppression can take place more precisely than before, since the reverberation time is determined better and more precisely.
Es besteht die Möglichkeit, dass ausschließlich das erste Mittel über Programmmittel und/oder Programmmodule verfügt, die die Nachhallzeit bestimmen.There is a possibility that only the first means has program means and / or program modules that determine the reverberation time.
Alternativ dazu kann aber auch ausschließlich das zweite Mittel Programmmittel und/oder Programmmodule aufweisen, die die Nachhallzeit bestimmen. Das erste Mittel kann über Programmmittel und/oder Programmmodule verfügen, die einen AEC-Algorithmus (AEC = Acoustic Echo Cancellation) oder einen Algorithmus, wie in Welch, P.D. [1970], "The Use of Fast Fourier Transform for the Esti- mation of Power Spectra", IEEE Trans Audio Electroacoustic, Vol AU15, pp70-73) , beschrieben, ausführen. Der Inhalt dieses Literaturverweises wird vollinhaltlich übernommen.As an alternative to this, however, only the second means can have program means and / or program modules that determine the reverberation time. The first means can have program means and / or program modules that use an AEC algorithm (AEC = Acoustic Echo Cancellation) or an algorithm as described in Welch, PD [1970], "The Use of Fast Fourier Transform for the Estimation of Power Spectra ", IEEE Trans Audio Electroacoustic, Vol AU15, pp70-73). The content of this literature reference is taken over in full.
Weiterhin ist es vorteilhaft, wenn die zweiten Mittel Programmmittel und/oder Programmmodule aufweisen, die einen Algorithmus ausführen, der unter Ausnutzung der umgebungsabhängig bestimmten Nachhallzeit die umgebungsbedingt überlagerten Störanteile, wie Echo und Hall, aus dem aufgenommenen Audiosignal des Kommunikationsgerätenutzers entfernt.Furthermore, it is advantageous if the second means have program means and / or program modules which execute an algorithm which, using the reverberation time determined as a function of the environment, removes the interference components, such as echo and reverberation, superimposed on the environment, from the recorded audio signal of the communication device user.
Die Bestimmung der Nachhallzeit in Abhängigkeit der Frequenz und entsprechend die frequenzabhängige Entstörung der Audiosignale wird in dem Kommunikationsgerät günstig realisiert, wenn im Kommunikationsgerät Bandpassfilter angeordnet sind, die die Raumimpulsantwort filtern.The determination of the reverberation time as a function of the frequency and, accordingly, the frequency-dependent interference suppression of the audio signals is advantageously implemented in the communication device if bandpass filters are arranged in the communication device that filter the room impulse response.
Bei dem neuen Kommunikationsgerät kann es sich um ein Telefon, zum Beispiel in Form eines Mobilfunkendgerätes oder eines kabelgebundenen Telefons, ein elektrisches Haushaltgerät oder ein elektrisches Modul eines Fahrzeuges mit Mitteln zur Spracheingabe und Sprachausgabe handeln.The new communication device can be a telephone, for example in the form of a mobile radio terminal or a wired telephone, an electrical household appliance or an electrical module of a vehicle with means for voice input and output.
Im Folgenden wird die Erfindung anhand bevorzugter Ausführungsbeispiele mit Hilfe der Figuren 1 bis 5 beschrieben, wobei in den Figuren die folgenden Abkürzungen verwendet werden: 1: Direktschall eines impulsartigen Audiosignals; 2: E- chos; 3: Nachhall/Nachhallkurve; 4: Empfangene Signale vom zweiten Kommunikationsgerät; 4.1: Signale vom Spracherzeu- gungsmodul; 5: Algorithmus zur Bestimmung der Nachhallzeit; 6: Digital-Analog-Wandler; 7: Lautsprecher; 8.1: Signal, das direkt vom Lautsprecher zum Mikrofon gelangt = Direktschall; 8.2: Signal des Lautsprechers, das einfach am Objekt reflek- tiert wird = Echo; 8.3: Signal des Lautsprechers, das mehrfach und diffus am Objekt reflektiert wird = Nachhall; 9: Objekt an dem die Signale reflektiert werden; 10: Mikrofon; 11: Analog-Digital-Wandler; 12: Zu sendende Signale zum zweiten Kommunikationsgerät; 12.1: Signale zum Spracherkennungsmodul; 13.1: Erstes Kommunikationsgerät; 13.2: Zweites Kommunikationsgerät; 13.3: Schnittstelle für Signalübermittlung; 13.4: Sprachgesteuertes Elektrogerät: 14: Raumimpulsantwort; 15: Kommunikationsgerätenutzer/Bediener; 15.1: Signal, das direkt vom Kommunikationsgerätenutzer zum Mikrofon gelangt = Direktschall; 15.2: Signal des Kommunikationsgerätenutzers, das einfach am Objekt reflektiert wird = Echo; 15.3: Signal des Kommunikationsgerätenutzers, das mehrfach und diffus am Objekt reflektiert wird = Nachhall; 16: Algorithmus zur Ent- hallung der Signale 15.1 bis 15.3; 17: Entstöreinheit; 18: Spracherzeugungsmodul; 19: Spracherkennungsmodul; A60: Energiebereich, in dem die Energie um 60 Dezibel abfällt; T60: Nachhallzeit.The invention is described below on the basis of preferred exemplary embodiments with the aid of FIGS. 1 to 5, the following abbreviations being used in the figures: 1: direct sound of a pulse-like audio signal; 2: Echos; 3: reverberation / reverberation curve; 4: Signals received from the second communication device; 4.1: signals from the speech generation module; 5: algorithm for determining the reverberation time; 6: digital-to-analog converter; 7: speaker; 8.1: signal that goes directly from the loudspeaker to the microphone = direct sound; 8.2: Signal from the loudspeaker that simply reflects on the object is = echo; 8.3: signal from the loudspeaker that is reflected repeatedly and diffusely on the object = reverberation; 9: Object on which the signals are reflected; 10: microphone; 11: analog-to-digital converter; 12: signals to be sent to the second communication device; 12.1: signals to the speech recognition module; 13.1: first communication device; 13.2: second communication device; 13.3: Interface for signal transmission; 13.4: Voice-controlled electrical device: 14: Room impulse response; 15: communication device user / operator; 15.1: Signal that reaches the microphone directly from the communication device user = direct sound; 15.2: Signal of the communication device user that is simply reflected on the object = echo; 15.3: Signal of the communication device user that is reflected multiple times and diffusely on the object = reverberation; 16: algorithm for reverberation of signals 15.1 to 15.3; 17: interference suppression unit; 18: speech generation module; 19: speech recognition module; A60: energy range in which the energy drops by 60 decibels; T60: reverberation time.
Es zeigen im Einzelnen:They show in detail:
Figur 1: Zeitliche Energieverteilung eines ursprünglich im- pulsförmigen Audiosignals in einem Raum; Figur 2: Zeitliche Energieverteilung desselben Audiosignals aus Figur 1, jedoch in einem kleineren Raum; Figur 3: Gemessene Raumimpulsantwort eines Raumes; Figur 4: Zwei Kommunikationsgeräte, die Signale austauschen, wobei in einem Kommunikationsgerät das neue Verfahren angewendet wird; Figur 5: Sprachgesteuertes Elektrogerät, in dem das neue Verfahren angewendet wird.Figure 1: Temporal energy distribution of an originally pulsed audio signal in a room; Figure 2: Temporal energy distribution of the same audio signal from Figure 1, but in a smaller room; Figure 3: Measured room impulse response of a room; Figure 4: Two communication devices that exchange signals, the new method being used in a communication device; Figure 5: Voice-controlled electrical device in which the new method is used.
Die Figur 1 zeigt exemplarisch in einem Diagramm die zeitliche Energieverteilung eines Audiosignals, die man in einem Raum mit einem Mikrofon aufnehmen und messen kann, wenn ein impulsartiges Audiosignal, zum Beispiel ein Knall, auftritt. Diese Energieverteilung erhält man, indem man das Betrags- quadrat einer Raumimpulsantwort bildet und dieses logarith- miert .FIG. 1 shows an example of a diagram of the temporal energy distribution of an audio signal that can be recorded and measured in a room with a microphone when an impulsive audio signal, for example a bang, occurs. This energy distribution can be obtained by forms a square impulse response and logarithmizes it.
Auf der Ordinate des Diagramms sind die logarithmierten Signalamplituden, als Maß für die Energie des Audiosignals, und auf der Abszisse die Zeit, jeweils in willkürlichen Einheiten, aufgetragen.The logarithmic signal amplitudes, as a measure of the energy of the audio signal, and the time, each in arbitrary units, are plotted on the ordinate of the diagram.
Man erkennt als erste Linie ganz links im Diagramm den sogenannten Direktschall 1, welcher auf direktem Weg von der Schallquelle zum Messmikrofon gelangt. Dann folgen, die in diesem Beispiel energetisch schwächeren Echos 2, die einmal oder zweimal an Wänden des Raumes reflektiert wurden, bevor sie zum Messmikrofon gelangen.The first line on the far left of the diagram shows the so-called direct sound 1, which goes directly from the sound source to the measuring microphone. Then follow, in this example, the energetically weaker echoes 2, which were reflected once or twice on the walls of the room before they reach the measuring microphone.
Zuletzt folgt, symbolisiert durch ein Dreieck, der Nachhall 3, welcher aus quasi chaotischen überlagerten Reflexionen des Audiosignals im Raum besteht und diffus am Messmikrofon eintrifft.Finally, symbolized by a triangle, is the reverberation 3, which consists of quasi-chaotic superimposed reflections of the audio signal in the room and arrives diffusely at the measuring microphone.
Das neue Verfahren nutzt die Nachhallzeit T60 eines Audiosignals, die aus der Raumimpulsantwort 14, die für einen bestimmten Raum charakteristisch ist, bestimmt wurde.The new method uses the reverberation time T60 of an audio signal, which was determined from the room impulse response 14, which is characteristic for a specific room.
Zur Bestimmung der Nachhallzeit T60 wird in Figur 1 auf der Ordinate des Diagramms ein Energiebereich A60 bestimmt, der im Bereich des Nachhalls 3 liegt, in dem die Energie des Nachhalls um 60 Dezibel abfällt. Der obere und der untere Grenzwert des Energiebereiches A60 werden zuerst auf die Nachhallkurve 3 und danach auf die Abszisse also die Zeitachse projiziert. Der projizierte Bereich auf der Zeitachse entspricht der Nachhallzeit T60.To determine the reverberation time T60, an energy range A60 is determined on the ordinate of the diagram in FIG. 1, which lies in the range of the reverberation 3, in which the energy of the reverberation drops by 60 decibels. The upper and lower limit values of the energy range A60 are first projected onto the reverberation curve 3 and then onto the abscissa, ie the time axis. The projected area on the time axis corresponds to the reverberation time T60.
An dieser Stelle sei erwähnt, dass der Energiebereich nicht notwendigerweise mit 60 Dezibel gewählt werden muss, sondern auch kleiner oder größer gewählt werden kann. Zum Beispiel kann auch ein Bereich gewählt werden, in dem die Energie des Nachhalls, um zum Beispiel 30 Dezibel abfällt. Der Wert, der aus der Projektion auf die Zeitachse erhalten wird, muss entsprechend um den Faktor der Verkleinerung/Vergrößerung der Energie, angepasst werden. Bei einem Energiebereich von nur 30 Dezibel wird entsprechend der Zeitabschnitt mit dem Faktor 2 multipliziert, um die Nachhallzeit T60 zu erhalten.At this point it should be mentioned that the energy range does not necessarily have to be selected with 60 decibels, but can also be selected to be smaller or larger. For example, a range can also be selected in which the energy of the Reverberation, for example, drops by 30 decibels. The value obtained from the projection on the time axis must be adjusted accordingly by the factor of the reduction / increase in energy. With an energy range of only 30 decibels, the time period is multiplied by a factor of 2 in order to obtain the reverberation time T60.
In Figur 2 wird wiederum exemplarisch die zeitliche Energieverteilung eines impulsartigen Audiosignals, zum Beispiel eines Knalles gezeigt. Im Unterschied zu den Randbedingungen, die für die Figur 1 galten, soll das Audiosignal in einem kleineren Raum aufgenommen werden. Dies äußert sich in einem geringeren Nachhall 3. Die Nachhallkurve 3 fällt schneller ab, wodurch auch die Nachhallzeit T60 geringer als in Figur 1 ist. Der Einfachheit halber wurde der Direktschall 1 und die Echos 2 im Diagramm der Figur 2 unverändert aus dem Diagramm der Figur 1 übernommen. Bei einer reellen Messung eines Signals könnten hier jedoch Unterschiede auftreten.FIG. 2 again shows an example of the temporal energy distribution of a pulse-like audio signal, for example a bang. In contrast to the boundary conditions that applied to FIG. 1, the audio signal should be recorded in a smaller room. This manifests itself in a lower reverberation 3. The reverberation curve 3 drops more quickly, as a result of which the reverberation time T60 is also shorter than in FIG. 1. For the sake of simplicity, the direct sound 1 and the echoes 2 in the diagram in FIG. 2 have been adopted unchanged from the diagram in FIG. When measuring a signal in real terms, however, there could be differences.
Man erkennt, dass aus dem energetischen Abfall des Nachhalls 3, also der negativen Steigung der Nachhallkurve 3, die Nachhallzeit T60 bestimmt werden kann.It can be seen that the reverberation time T60 can be determined from the energetic drop in reverberation 3, ie the negative slope of reverberation curve 3.
Die Figur 3 zeigt nun eine gemessene Raumimpulsantwort 14 eines Raumes. Auf der Ordinate sind die Signalamplituden und auf der Abszisse ist die Zeit aufgetragen. Die Geschwindigkeit des Abfalls der Energie in der Raumimpulsantwort über die Zeit ist charakteristisch für diesen bestimmten Raum. Diese Geschwindigkeit wird unabhängig vom Messsignal und der Position von Schallquelle und Mikrofon im Raum für diesen bestimmten Raum erhalten werden.FIG. 3 now shows a measured room impulse response 14 of a room. The signal amplitudes are plotted on the ordinate and time is plotted on the abscissa. The rate at which the energy in the room impulse response decays over time is characteristic of this particular room. This speed will be obtained regardless of the measurement signal and the position of the sound source and microphone in the room for this particular room.
Die Figur 4 zeigt zwei Kommunikationsgeräte 13.1 und 13.2, die Signale 4 und 12 über eine Schnittstelle 13.3 austauschen. Dabei kann es sich bei den Kommunikationsgeräten 13.1 und 13.2 beispielsweise um Endgeräte im Mobilfunknetz handeln. Bei der Schnittstelle 13.3 kann es sich beispielsweise um eine Sende-/Empfangsantenne oder um eine Infrarotschnittstelle handeln.FIG. 4 shows two communication devices 13.1 and 13.2, which exchange signals 4 and 12 via an interface 13.3. The communication devices 13.1 and 13.2 can be, for example, end devices in the mobile radio network. With the interface 13.3, for example be a transmit / receive antenna or an infrared interface.
Im Kommunikationsgerät 13.1 wird das neue Verfahren angewendet.The new method is used in the communication device 13.1.
Das erste Kommunikationsgerät 13.1 soll sich in einer Umgebung befinden, zum Beispiel in einer Kirche, in der Halleffekte auftreten. Diese Umgebung ist durch ein einseitig offenes Rechteck mit dem Bezugszeichen 9 angedeutet.The first communication device 13.1 is to be located in an environment, for example in a church in which reverberation effects occur. This environment is indicated by a rectangle open on one side with the reference symbol 9.
Das Signal 4 wird über die Schnittstelle 13.3 vom zweiten Kommunikationsgerät 13.2 zum ersten Kommunikationsgerät 13.1 gesendet und von diesem empfangen. Das Signal 12 soll vom ersten Kommunikationsgerät 13.1 zum zweiten Kommunikationsgerät 13.2 gesendet werden, dabei sollen Störungen, die durch die Umgebung 9 des ersten Kommunikationsgerätes 13.1 auftreten, unterdrückt werden.The signal 4 is sent via the interface 13.3 from the second communication device 13.2 to the first communication device 13.1 and received by the latter. The signal 12 is to be sent from the first communication device 13.1 to the second communication device 13.2, in this case interference which occurs due to the environment 9 of the first communication device 13.1 is to be suppressed.
Das erste Kommunikationsgerät 13.1 verfügt zumindest über einen Digital-Analog-Wandler 6, der die vom zweiten Kommunikationsgerät 13.2 gesendeten digitalen Signale 4 in analoge Signale umwandelt und an einen Lautsprecher 7 weiterleitet. Außerdem verfügt das erste Kommunikationsgerät 13.1 über ein Mikrofon 10, welches analoge Signale aufnehmen kann und über einen Analog-Digital-Wandler 11 digitalisiert.The first communication device 13.1 has at least one digital-to-analog converter 6, which converts the digital signals 4 sent by the second communication device 13.2 into analog signals and forwards them to a loudspeaker 7. In addition, the first communication device 13.1 has a microphone 10, which can record analog signals and digitized via an analog-digital converter 11.
Durch das neue Verfahren soll das Signal 15.1, in der Regel Sprachesignale, das ein Kommunikationsgerätenutzer 15 an das Mikrofon 10 des ersten Kommunikationsgeräts 13.1 abgibt, entstört werden. Die Entstörung geschieht durch möglichst vollständige Unterdrückung des unerwünschten Echos 15.2 und des unerwünschten Halls 15.3. Um dieses Signal entstören zu können, muss die Nachhallzeit T60 ermittelt werden. Hierbei macht sich das neue Verfahren Folgendes zu nutze: - Die Nachhallzeit, die für diese Umgebung 9 charakteristisch ist, ist in der Raumimpulsantwort enthalten. Die Raumimpulsantwort wiederum lässt sich aus dem Verhältnis der Signale 8.2 und 8.3 zum Signal 8.1 bestimmen.The new method is intended to suppress signal 15.1, usually voice signals, which a communication device user 15 emits to microphone 10 of first communication device 13.1. The interference is suppressed by suppressing the unwanted echo 15.2 and the unwanted reverb 15.3 as completely as possible. To be able to suppress this signal, the reverberation time T60 must be determined. The new procedure makes use of the following: - The reverberation time, which is characteristic of this environment 9, is included in the room impulse response. The room impulse response in turn can be determined from the ratio of signals 8.2 and 8.3 to signal 8.1.
- Die Nachhallzeit ändert sich an verschiedenen Positionen der Schallquelle im Raum nicht signifikant. Das heißt, die Signale 8.1 bis 8.3 die vom Lautsprecher 7 zum Mikrofon 10 gelangen und die Signale 15.1 bis 15.3, die vom Kommunikationsgerätenutzer 15 zum Mikrofon 10 gelangen, haben eine ähnliche Nachhallzeit.- The reverberation time does not change significantly at different positions of the sound source in the room. That is, the signals 8.1 to 8.3 which reach the microphone 10 from the loudspeaker 7 and the signals 15.1 to 15.3 which reach the microphone 10 by the communication device user 15 have a similar reverberation time.
Im neuen Verfahren wird die bereits bekannte Nachhallzeit folgendermaßen für die Entstörung des Signals 15.1 nutzbar gemacht. Das vom zweiten Kommunikationsgerät 13.2 gesendete Signal 4 wird durch den Digital-Analog-Wandler 6 umgewandelt und über den Lautsprecher 7 des ersten Kommunikationsgeräts 13.1 ausgegeben. Analog zu den Diagrammen der Figuren 1 und 2 kann das Signal 4 in Form von Direktschall 8.1, Echo 8.2 und Nachhall 8.3 zum Mikrofon 10 des ersten Kommunikationsgerätes 13.1 gelangen.In the new method, the reverberation time already known is made usable for the suppression of signal 15.1 as follows. The signal 4 sent by the second communication device 13.2 is converted by the digital-to-analog converter 6 and output via the loudspeaker 7 of the first communication device 13.1. Analogous to the diagrams in FIGS. 1 and 2, the signal 4 in the form of direct sound 8.1, echo 8.2 and reverberation 8.3 can reach the microphone 10 of the first communication device 13.1.
Der Direktschall 8.1, das Echo 8.2 und der Nachhall 8.3 werden über einen Analog-Digital-Wandler 6 umgewandelt und über einem Algorithmus 5 wird die Raumimpulsantwort bestimmt.The direct sound 8.1, the echo 8.2 and the reverberation 8.3 are converted via an analog-digital converter 6 and the room impulse response is determined using an algorithm 5.
Zur Bestimmung der Raumimpulsantwort können verschiedene Methoden eingesetzt werden.Various methods can be used to determine the room impulse response.
So kann ein sogenannter AEC-Algorithmus (AEC = Acoustic Echo Cancellation) implementiert werden. Dieser Algorithmus wird verwendet, um im Freisprechmodus das Echo des Sprachsignals des fernen Teilnehmers, welches vom Lautsprecher 7 abgestrahlt und unerwünscht vom Mikrofon 10 wieder aufgenommen wird, zu kompensieren. Hierzu wird mittels Abschätzung der Übertragungsstrecke Lautsprecher 7 und Mikrofon 10 eine Impulsantwort berechnet. Durch Faltung des vom Kommunikations- gerät 13.2 gesendeten Signals 4 mit dieser Impulsantwort und anschließender Subtraktion des so berechneten Signals vom Mikrofonsignal findet die Echo-Unterdrückung statt. Das Signal wird über eine Entstöreinheit 17 entstört.A so-called AEC algorithm (AEC = Acoustic Echo Cancellation) can be implemented. This algorithm is used to compensate the echo of the voice signal of the distant subscriber, which is emitted by the loudspeaker 7 and is undesirably picked up again by the microphone 10, in the hands-free mode. For this purpose, an impulse response is calculated by estimating the transmission link loudspeaker 7 and microphone 10. By folding the 13.2 transmitted signal 4 with this impulse response and subsequent subtraction of the signal thus calculated from the microphone signal, the echo suppression takes place. The signal is suppressed by an interference suppression unit 17.
Alternativ dazu kann zur Bestimmung der Raumimpulsantwort ein bekannter Algorithmus eingesetzt werden, welcher zuerst von "Welch" publiziert wurde. So beschreibt die Welch Methode (siehe auch Welch, P.D. [1970], "The Use of Fast Fourier Transform for the Estimation of Power Spectra", IEEE Trans Audio Electroacoustic, Vol AU15, pp70-73) die Bestimmung einer Impulsantwort durch die Abstrahlung eines Ausgangssignals und der Messung des Eingangssignals. Einzige Anforderung an das Ausgangssignal ist das Vorhandensein von ausreichend E- nergie in den zu betrachtenden Frequenzbereichen.Alternatively, a known algorithm, which was first published by "Welch", can be used to determine the room impulse response. The Welch method (see also Welch, PD [1970], "The Use of Fast Fourier Transform for the Estimation of Power Spectra", IEEE Trans Audio Electroacoustic, Vol AU15, pp70-73) describes the determination of an impulse response by the radiation of a Output signal and the measurement of the input signal. The only requirement for the output signal is the presence of sufficient energy in the frequency ranges to be considered.
Ist die Raumimpulsantwort mit einem Algorithmus 5 bestimmt, so kann hieraus die Nachhallzeit bestimmt werden. Diese Nachhallzeit kann auch für die Entstörung des Signals 15.1 des Kommunikationsgerätenutzers 15 genutzt werden, da die Nachhallzeiten, die sich für die Übertragung von Signalen 8.1 bis 8.3 vom Lautsprecher 7 über die Umgebung 9 zum Mikrofon 10 und für die Übertragung von Signalen 15.1 bis 15.3 vom Kommunikationsgerätenutzers 15 zum Mikrofon 10 ergeben, ähnlich sind. Um diese Nachhallzeit aus der Raumimpulsantwort, die durch den ersten Algorithmus 5 bestimmt wurde, zu ermitteln, ist ein weiterer Algorithmus 16 vorgesehen, der Zugriff auf die Daten des Algorithmus 5 hat, also auch auf die Raumimpulsantwort und die darin enthaltene Nachhallzeit. Dann werden die Signale 15.1 bis 15.3 mit einer Entstöreinheit 17 entstört und als Signale 12 ausgegeben.If the room impulse response is determined with an algorithm 5, the reverberation time can be determined from this. This reverberation time can also be used for interference suppression of the signal 15.1 of the communication device user 15, since the reverberation times, which are for the transmission of signals 8.1 to 8.3 from the loudspeaker 7 via the environment 9 to the microphone 10 and for the transmission of signals 15.1 to 15.3 from Communication device user 15 to the microphone 10 are similar. In order to determine this reverberation time from the room impulse response, which was determined by the first algorithm 5, a further algorithm 16 is provided which has access to the data of the algorithm 5, that is to say also to the room impulse response and the reverberation time contained therein. Then the signals 15.1 to 15.3 are suppressed with an interference suppression unit 17 and output as signals 12.
Die Figur 5 zeigt eine besondere Ausführung eines Kommunikationsgerätes. Hier wird das neue Verfahren in einem sprachgesteuerten Elektrogerät 13.4 angewendet. Dabei steht der Bediener 15 des sprachgesteuerten Elektrogeräts nur mit dem sprachgesteuerten Elektrogerät 13.4 in Kontakt und nicht wie in Figur 4 mit einem weiteren Kommunikationsteilnehmer, der sich an einem zweiten Kommunikationsgerät befindet.FIG. 5 shows a special embodiment of a communication device. Here, the new method is used in a voice-controlled electrical device 13.4. The operator 15 of the voice-controlled electrical device is only in contact with the voice-controlled electrical device 13.4 and not how in Figure 4 with a further communication participant who is located on a second communication device.
Das sprachgesteuerte Elektrogerät 13.4 verfügt über ein Spracherzeugungsmodul 18, um Signale 4.1 zum Beispiel den Menüumfang des Elektrogerätes 13.4, über den Lautsprecher 7 ausgeben zu können. Außerdem verfügt das sprachgesteuerte E- lektrogerät 13.4 über ein Spracherkennungsmodul 19, um Signale 12.1, zum Beispiel die Sprache des Bedieners 15, erkennen zu können.The voice-controlled electrical device 13.4 has a speech generation module 18 in order to be able to output signals 4.1, for example the menu scope of the electrical device 13.4, via the loudspeaker 7. In addition, the voice-controlled electrical device 13.4 has a speech recognition module 19 in order to be able to recognize signals 12.1, for example the language of the operator 15.
Abhängig von der Umgebung 9, können die über den Lautsprecher 7 in Form von Direktschall 8.1, Echo 8.2 und Nachhall 8.3 ausgegebene Signale ungewollt vom Mikrofon 10 aufgenommen werden. Um diese Rückkopplung zu vermeiden, wird im sprachgesteuerten Elektrogerät 13.4 ein Algorithmus 5 ausgeführt, der unter anderem auch die Raumimpulsantwort bestimmt. Außerdem wird diese Rückkopplung mit einer Entstöreinheit 17 unterdrückt .Depending on the environment 9, the signals output via the loudspeaker 7 in the form of direct sound 8.1, echo 8.2 and reverberation 8.3 can be picked up by the microphone 10 unintentionally. In order to avoid this feedback, an algorithm 5 is executed in the voice-controlled electrical device 13.4, which among other things also determines the room impulse response. In addition, this feedback is suppressed by an interference suppression unit 17.
Zur Entstörung des vom Bediener 15 an das Mikrofon 10 geschickten Signals 15.1 kann der Algorithmus 5 nicht verwendet werden. Aber die Nachhallzeit, die sich aus der Raumimpulsantwort berechnen lässt, welche im Algorithmus 5 bestimmt wurde, die aber nahezu gleich für die Signale 15.1 bis 15.3 des Bedieners 15 gilt, kann von einem weiteren Algorithmus 16 verwendet werden, der mit einer Entstöreinheit 17 das Signal 15.1 entstört.The algorithm 5 cannot be used to suppress the signal 15.1 sent by the operator 15 to the microphone 10. However, the reverberation time, which can be calculated from the room impulse response, which was determined in the algorithm 5, but which applies almost equally to the signals 15.1 to 15.3 of the operator 15, can be used by a further algorithm 16, which uses an interference suppression unit 17 to generate the signal 15.1 suppressed.
Es versteht sich, dass die vorstehend genannten Merkmale der Erfindung nicht nur in der jeweils angegebenen Kombination, sondern auch in anderen Kombinationen oder in Alleinstellung verwendbar sind, ohne den Rahmen der Erfindung zu verlassen. It goes without saying that the features of the invention mentioned above can be used not only in the combination specified in each case, but also in other combinations or on their own without departing from the scope of the invention.

Claims

Patentansprüche claims
1. Verfahren zum Betrieb eines Kommunikationsgerätes (13.1, 13.2, 13.4) , wobei das Kommunikationsgerät (13.1, 13.2, 13.4) Audiosignale (8.1 bis 8.3) an eine Umgebung (9) abstrahlt und einerseits diese Audiosignale (8.1 bis 8.3) einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo (8.2) und Nachhall (8.3) enthalten, wieder aufnimmt und andererseits Audiosignale (15.1 bis 15.3) einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers (15), einschließlich deren umgebungsbedingter Störanteile (15.2 und 15.3) aufnimmt, und die wiederaufgenommenen Audiosignale (8.1 bis 8.3) durch einen ersten Algorithmus (5) benutzt werden, um eine Raumimpulsantwort der Umgebung zu bestimmen, "dadurch gekennzeichnet, dass auf die aufgenommenen Audiosignale (15.1 bis 15.3) der externen Schallquelle, vorzugsweise des Kommunikationsgerätenutzers (15), ein zweiter Entstör-Algorithmus (16) angewendet wird, der zur Entstörung eine Nachhallzeit (T60) verwendet, die er aus der durch den ersten Algorithmus (5) bestimmten Raumimpulsantwort (14) ermittelt.1. Method for operating a communication device (13.1, 13.2, 13.4), wherein the communication device (13.1, 13.2, 13.4) emits audio signals (8.1 to 8.3) to an environment (9) and on the one hand these audio signals (8.1 to 8.3) including environment-related superimposed ones Interference components that contain at least echo (8.2) and reverberation (8.3), and on the other hand record audio signals (15.1 to 15.3) from an external sound source, preferably a communication device user (15), including their environmental interference components (15.2 and 15.3), and the recaptured Audio signals (8.1 to 8.3) can be used by a first algorithm (5) to determine a room impulse response of the environment, "characterized in that the recorded audio signals (15.1 to 15.3) from the external sound source, preferably the communication device user (15) second interference suppression algorithm (16) is used, which uses a reverberation time (T60) for interference suppression t, which it determines from the spatial impulse response (14) determined by the first algorithm (5).
2. Verfahren gemäß dem voranstehenden Patentanspruch 1, dadurch gekennzeichnet, dass ausschließlich der erste Algorithmus (5) die Nachhallzeit (T60) bestimmt.2. The method according to the preceding claim 1, characterized in that only the first algorithm (5) determines the reverberation time (T60).
3. Verfahren gemäß dem voranstehenden Patentanspruch 1, dadurch gekennzeichnet, dass ausschließlich der zweite Entstör-Algorithmus (16) die Nachhallzeit (T60) bestimmt. 3. The method according to the preceding claim 1, characterized in that only the second interference suppression algorithm (16) determines the reverberation time (T60).
4. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 3, dadurch gekennzeichnet, dass die Nachhallzeit (T60) aus dem energetischen Abfall des Nachhalls (8.3) in der Raumimpulsantwort (14) berechnet wird.4. The method according to any one of the preceding claims 1 to 3, characterized in that the reverberation time (T60) is calculated from the energetic drop in the reverberation (8.3) in the room impulse response (14).
5. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 4, dadurch gekennzeichnet, dass als erster Algorithmus ein AEC-Algorithmus (5) (AEC = A- coustic Echo Cancellation) verwendet wird.5. The method according to any one of the preceding claims 1 to 4, characterized in that an AEC algorithm (5) (AEC = Acoustic Echo Cancellation) is used as the first algorithm.
6. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 5, dadurch gekennzeichnet, dass der zweite Entstör-Algorithmus (16) unter Ausnutzung der umgebungsabhängig bestimmten oder übernommenen Nachhallzeit (T60) die überlagerten Störanteile (15.2 und 15.3) aus dem aufgenommenen Audiosignal (15.1 bis 15.3) der externen Schallquelle entfernt.6. The method according to any one of the preceding claims 1 to 5, characterized in that the second interference suppression algorithm (16) utilizing the reverberation time (T60) determined or adopted depending on the environment, the superimposed interference components (15.2 and 15.3) from the recorded audio signal (15.1 to 15.3) the external sound source.
7. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 6, dadurch gekennzeichnet, dass zur Bestimmung der Nachhallzeit (T60) in Abhängigkeit der Frequenz die Raumimpulsantwort (14) gefiltert wird, vorzugsweise mit Bandpassfiltern. 7. The method according to any one of the preceding claims 1 to 6, characterized in that to determine the reverberation time (T60) depending on the frequency, the spatial impulse response (14) is filtered, preferably with bandpass filters.
. Kommunikationsgerät (13.1, 13.2, 13.4) mit Mitteln zur Entstörung von Audiosignalen, wobei das Kommunikationsgerät (13.1, 13.2, 13.4) über zumindest einen Lautsprecher (7) verfügt, der Audiosignale (8.1 bis 8.3) an eine Umgebung (9) abstrahlt und weiterhin zumindest ein Mikrofon (10) aufweist, mit dem einerseits diese Audiosignale (8.1 bis 8.3) einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo (8.2) und Nachhall (8.3) enthalten, wieder aufgenommen werden und andererseits Audiosignale (15.1 bis 15.3) einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers (15) , einschließlich deren umgebungsbedingter Störanteile (15.2, 15.3) aufgenommen werden, und im Kommunikationsgerät (13.1, 13.2, 13.4) ein erstes Mittel (5) vorgesehen ist, das ein Mittel zur Berechnung einer Raumimpulsantwort der Umgebung aufweist, dadurch gekennzeichnet, dass ein zweites Mittel (16) für die aufgenommenen Audiosignale (15.1 bis 15.3) der externen Schallquelle, vorzugsweise des Kommunikationsengerätenutzers (15) , einschließlich deren umgebungsbedingter Störanteile (15.2, 15.3) angeordnet ist, das ein Mittel zur Ermittlung der Nachhallzeit (T60) aufweist, das die Nachhallzeit (T60) ermittelt, die in der durch das erste Mittel (5) bestimmen der Raumimpulsantwort (14) enthalten ist., Communication device (13.1, 13.2, 13.4) with means for interference suppression of audio signals, the communication device (13.1, 13.2, 13.4) having at least one loudspeaker (7) which emits audio signals (8.1 to 8.3) to an environment (9) and continues to do so has at least one microphone (10) with which on the one hand these audio signals (8.1 to 8.3) including ambient-related superimposed interference components which contain at least echo (8.2) and reverberation (8.3) are picked up again and on the other hand audio signals (15.1 to 15.3) from an external sound source , preferably a communication device user (15), including their environmental interference components (15.2, 15.3), and a first means (5) is provided in the communication device (13.1, 13.2, 13.4), which has a means for calculating a room impulse response of the environment, characterized in that a second means (16) for the recorded audio signals (15.1 to 15.3) of the external sound q ual, preferably the communication device user (15), including their environmental interference components (15.2, 15.3), which has a means for determining the reverberation time (T60), which determines the reverberation time (T60), which is determined by the first means (5 ) determine the room impulse response (14) is included.
9. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß dem voranstehende Patentanspruch 8, dadurch gekennzeichnet, dass ausschließlich das erste Mittel (5) Programmmittel und/oder Programmmodule aufweist, die die Nachhallzeit (T60) bestimmen. 9. Communication device (13.1, 13.2, 13.4) according to the preceding claim 8, characterized in that only the first means (5) has program means and / or program modules that determine the reverberation time (T60).
10. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß dem voranstehende Patentanspruch 8, dadurch gekennzeichnet, dass ausschließlich das zweite Mittel (16) Programmmittel und/oder Programmmodule aufweist, die die Nachhallzeit (T60) bestimmen.10. Communication device (13.1, 13.2, 13.4) according to the preceding claim 8, characterized in that only the second means (16) has program means and / or program modules that determine the reverberation time (T60).
11. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehende Patentansprüche 8 bis 10, dadurch gekennzeichnet, dass die Programmmittel und/oder Programmmodule des ersten Mittels einen AEC-Algorithmus (5) (AEC = Acoustic Echo Cancelation) beinhalten.11. Communication device (13.1, 13.2, 13.4) according to one of the preceding claims 8 to 10, characterized in that the program means and / or program modules of the first means contain an AEC algorithm (5) (AEC = Acoustic Echo Cancelation).
12. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehende Patentansprüche 8 bis 11, dadurch gekennzeichnet, dass die Progra mmittel und/oder Programmmodule des zweiten Mittels (16) einen Algorithmus beinhalten, der unter Ausnutzung der umgebungsabhängig bestimmten Nachhallzeit die überlagerten Störanteile (15.2 und 15.3) aus dem aufgenommenen Audiosignal (15.1 bis 15.3) der externen Schallquelle (15) entfernt.12. Communication device (13.1, 13.2, 13.4) according to one of the preceding claims 8 to 11, characterized in that the programming means and / or program modules of the second means (16) contain an algorithm which, using the environment-dependent reverberation time, determines the superimposed interference components (15.2 and 15.3) from the recorded audio signal (15.1 to 15.3) of the external sound source (15).
13. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche 8 bis 12, dadurch gekennzeichnet, dass Bandpassfilter vorgesehen sind, die die Raumimpulsantwort (14) filtern und die Bestimmung der Nachhallzeit (T60) in Abhängigkeit der Frequenz ermöglichen.13. Communication device (13.1, 13.2, 13.4) according to one of the preceding claims 8 to 12, characterized in that bandpass filters are provided which filter the room impulse response (14) and enable the reverberation time (T60) to be determined as a function of the frequency.
14. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche 8 bis 13, dadurch gekennzeichnet, dass das Kommunikationsgerät (13.1, 13.2, 13.4) ein Telefon ist . 14. Communication device (13.1, 13.2, 13.4) according to one of the preceding claims 8 to 13, characterized in that the communication device (13.1, 13.2, 13.4) is a telephone.
15. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß dem voranstehenden Patentanspruch 14, dadurch gekennzeichnet, dass das Kommunikationsgerät (13.1, 13.2, 13.4) ein kabelgebundenes Telefon ist.15. Communication device (13.1, 13.2, 13.4) according to the preceding claim 14, characterized in that the communication device (13.1, 13.2, 13.4) is a wired telephone.
16. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche 8 bis 14, dadurch gekennzeichnet, dass das Kommunikationsgerät (13.1, 13.2, 13.4) ein Mobilfunk- endgerät ist.16. Communication device (13.1, 13.2, 13.4) according to one of the preceding claims 8 to 14, characterized in that the communication device (13.1, 13.2, 13.4) is a mobile radio terminal.
17. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche 8 bis 13, dadurch gekennzeichnet, dass das Kommunikationsgerät (13.1, 13.2, 13.4) ein elektrisches Haushaltgerät mit Mittel zur Spracheingabe und Sprachausgabe ist.17. Communication device (13.1, 13.2, 13.4) according to one of the preceding claims 8 to 13, characterized in that the communication device (13.1, 13.2, 13.4) is an electrical household appliance with means for voice input and output.
18. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche 8 bis 17, dadurch gekennzeichnet, dass das Kommunikationsgerät (13.1, 13.2, 13.4) ein elektrisches Modul eines Fahrzeuges mit Mitteln zur Spracheingabe und Sprachausgabe ist. 18. Communication device (13.1, 13.2, 13.4) according to one of the preceding claims 8 to 17, characterized in that the communication device (13.1, 13.2, 13.4) is an electrical module of a vehicle with means for voice input and output.
PCT/EP2004/008999 2003-09-24 2004-08-11 Method and communication device with means for interference suppression in audio signals WO2005041615A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03021578A EP1519618B1 (en) 2003-09-24 2003-09-24 Method and communication equipment with means for audio signals interference suppression
EP03021578.4 2003-09-24

Publications (1)

Publication Number Publication Date
WO2005041615A1 true WO2005041615A1 (en) 2005-05-06

Family

ID=34178488

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2004/008999 WO2005041615A1 (en) 2003-09-24 2004-08-11 Method and communication device with means for interference suppression in audio signals

Country Status (3)

Country Link
EP (1) EP1519618B1 (en)
AT (1) ATE532346T1 (en)
WO (1) WO2005041615A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4066842A (en) * 1977-04-27 1978-01-03 Bell Telephone Laboratories, Incorporated Method and apparatus for cancelling room reverberation and noise pickup
US5263019A (en) * 1991-01-04 1993-11-16 Picturetel Corporation Method and apparatus for estimating the level of acoustic feedback between a loudspeaker and microphone
JPH08247837A (en) * 1995-03-13 1996-09-27 Nippon Hoso Kyokai <Nhk> Reverberation time automatic measuring method and reverberation time automatic measuring device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4066842A (en) * 1977-04-27 1978-01-03 Bell Telephone Laboratories, Incorporated Method and apparatus for cancelling room reverberation and noise pickup
US5263019A (en) * 1991-01-04 1993-11-16 Picturetel Corporation Method and apparatus for estimating the level of acoustic feedback between a loudspeaker and microphone
JPH08247837A (en) * 1995-03-13 1996-09-27 Nippon Hoso Kyokai <Nhk> Reverberation time automatic measuring method and reverberation time automatic measuring device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PATENT ABSTRACTS OF JAPAN vol. 1997, no. 01 31 January 1997 (1997-01-31) *

Also Published As

Publication number Publication date
EP1519618A1 (en) 2005-03-30
ATE532346T1 (en) 2011-11-15
EP1519618B1 (en) 2011-11-02

Similar Documents

Publication Publication Date Title
DE60108401T2 (en) SYSTEM FOR INCREASING LANGUAGE QUALITY
EP1977626B1 (en) Method for recording and reproducing a sound source with time-variable directional characteristics
DE60024815T2 (en) SYSTEM AND METHOD FOR RECOGNIZING A NEAR SPEAKER BY SPECTRUM ANALYSIS
EP3068146B1 (en) Method for operating a hearing device and hearing device
EP1143416A2 (en) Time domain noise reduction
DE2207141B2 (en)
DE19517469A1 (en) Hands-free procedure for a multi-channel transmission system
DE4330143A1 (en) Arrangement for signal processing of acoustic input signals
EP1103956B1 (en) Exponential reduction of echo and noise during speech pauses
EP1189419B1 (en) Method and device for eliminating the loudspeaker interference on microphone signals
EP3454572A1 (en) Method for detection of a defect in a listening instrument
EP3588498B1 (en) Method for suppressing an acoustic reverberation in an audio signal
DE60317368T2 (en) NONLINEAR ACOUSTIC ECHO COMPENSATOR
EP1126687A2 (en) Method for coordinated echo and/or noise reduction
DE69817461T2 (en) Method and device for the optimized processing of an interference signal during a sound recording
DE602004006912T2 (en) A method for processing an acoustic signal and a hearing aid
EP1519618B1 (en) Method and communication equipment with means for audio signals interference suppression
EP0642251B1 (en) Method for the automatic switching of the speech direction and circuit arrangement for implementing the method
DE102019105458B4 (en) System and method for time delay estimation
DE10356063B4 (en) Method for interference suppression of audio signals
DE102019107173A1 (en) Method and apparatus for generating and outputting an audio signal for enhancing the listening experience at live events
EP1359437A1 (en) Method for determining a position of a user of a communication terminal
DE102014100642A1 (en) Arrangement for acquisition of acoustic signal i.e. speech signal, in space of office, has central arrangement designed as central bus that is connected with sensor bus, and bus participant attached with bus and connected with sensors
AT525174B1 (en) Method of eliminating echoes when playing back radio signals transmitted over a radio channel
DE10030926A1 (en) Interference-dependent adaptive echo cancellation

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase