EP1055317A1 - Method for improving acoustic noise attenuation in hand-free devices - Google Patents

Method for improving acoustic noise attenuation in hand-free devices

Info

Publication number
EP1055317A1
EP1055317A1 EP99904718A EP99904718A EP1055317A1 EP 1055317 A1 EP1055317 A1 EP 1055317A1 EP 99904718 A EP99904718 A EP 99904718A EP 99904718 A EP99904718 A EP 99904718A EP 1055317 A1 EP1055317 A1 EP 1055317A1
Authority
EP
European Patent Office
Prior art keywords
filter
echo
adaptive
attenuation
level balance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP99904718A
Other languages
German (de)
French (fr)
Inventor
Gerhard Schmidt
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Infineon Technologies AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of EP1055317A1 publication Critical patent/EP1055317A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic

Definitions

  • the present invention relates to a method for improving the acoustic attenuation in hands-free systems with a level balance and a plurality of adaptive echo compensation filters, each of which processes a subband.
  • a further adaptive filter (shadow filter) of a lower order is connected in parallel to the adaptive echo cancellation filter in at least one subband. Room changes can then be detected by combining a performance evaluation of the two residual echo powers and a correlation analysis of the estimated and the measured microphone signal.
  • the further adaptive filter has a significantly lower order.
  • the echo cancellation is preferably implemented in frequency subbands by means of a filter bank.
  • Both performance evaluations of competing are preferably used for the adaptation or the step size control 3 adaptive filters, as well as correlation-based analyzes used.
  • the echo compensation filters provide estimates for the echo attenuation introduced by them, since these estimates can preferably be used to control the attenuation of the level balance. As a result, the attenuation to be introduced by the level balance can be further reduced and the conversation quality in the case of two-way communication can be further improved.
  • Figure 1 is a simplified model of a hands-free device connected to a digital connection.
  • FIG. 2 shows a simplified block diagram of a hands-free device
  • FIG. 4 shows an overview of the method according to the invention with shadow filter and correlation analysis
  • FIG. 5 shows the control of the power transmission factors in a clear representation
  • FIG. 1 shows a simplified model of a hands-free device 10 connected to a digital connection 12.
  • the A-law coding or decoding used in the European ISDN network is shown in the two left blocks 14, 16.
  • the speaker-room microphone system 18 (LRM system) with the local call participant 20, the user of the hands-free device, is sketched on the right-hand side.
  • the acoustic coupling between loudspeaker and microphone leads to crosstalk via the LRM system.
  • This crosstalk is perceived by the distant subscriber as a disturbing echo.
  • Acoustic waves emerge from the loudspeaker and spread out in the room. Reflection on the walls and other objects in the room creates several paths of propagation, which result in different durations of the loudspeaker signal.
  • the echo signal at the microphone thus consists of the superimposition of a large number of echo components and possibly the useful signal n (t): the local speaker.
  • the connection between the participants can also generate echoes at transitions between different transmission systems.
  • the network operators try to take special measures against such echo sources directly at the critical points, so that these echoes can be disregarded here.
  • Fork echoes which arise in telephones with an analog interface due to mismatching of the line simulation to the line impedance, can also be disregarded when using digital connections.
  • FIG. 2 An overview of a hands-free device is shown in FIG. 2.
  • the central element is a level balance 22, which is shown in the left part of FIG. 2.
  • the level balance 22 guarantees the minimum attenuation prescribed by the ITU or ETSI recommendations by adding attenuation to the transmission and / or reception path depending on the conversation situation.
  • the reception path is activated and the signal from the remote subscriber is output undamped on the loudspeaker.
  • the echoes that occur when the compensators are switched off or poorly balanced are greatly reduced by the damping inserted into the transmission path.
  • the local speaker is active, the situation is reversed.
  • the level balance 22 does not insert any attenuation into the transmission path and the signal of the local speaker is transmitted undamped. Controlling the level balance 22 in the case of two-way communication becomes more difficult.
  • both paths and thus also the subscriber signals) each receive half of the damping to be inserted or, if the control is not optimal, at least one of the two signal paths is damped. Intercom is therefore not possible or only possible to a limited extent.
  • adaptive echo cancellers 28 shown in the right part of FIG. 2. These try to digitally emulate the LRM system in order to then remove the echo component of the distant subscriber from the microphone signal. Depending on how well the compensators manage this, the total attenuation to be inserted by the level balance 22 can be reduced.
  • the echo composition was implemented in frequency subbands, the width of the individual bands being between 250 Hz and 500 Hz at 8 kHz sampling rate or between 500 Hz and 1000 Hz at 16 kHz sampling rate.
  • the use of a frequency 6 selective echo cancellation has several advantages. Firstly, by using undersampling and oversampling, the system can be operated as a multirate system, which reduces the signal processing effort. On the other hand, by dividing the sub-band, the "compensation power" can be distributed differently over the individual frequency ranges and thus an effective adaptation of the "compensation power" to speech signals can be achieved. Subband processing also has a decorrelating effect when the overall tape processing is compared with the individual subband systems. For speech signals, this means an increase in the convergence speed of the adaptive filters. In addition to these advantages, the disadvantage of subband processing must not be ignored. Breaking down a signal into individual frequency ranges always results in a runtime. However, since the method is used for video conferences or in GSM mobile phones, such runtimes are permissible
  • the runtime is mainly determined by the image processing component. Since attempts are generally made to output the image and sound of the distant subscriber lip-synchronized to the local subscriber, the running time of the acoustic echoes can increase to several hundred milliseconds. 3 shows the results of a study in which an attempt was made to find out which echo attenuation is necessary depending on the duration of this echo, so that 90, 70 and 50 percent of the respondents were satisfied with the quality of the call.
  • the echo cancellers are controlled in several stages. All power-based control units 32 work autonomously for each compensator, that is to say independently of the remaining frequency ranges. A separate adaptation and control unit 32 is therefore sketched in FIG. 2 for each compensator.
  • the control stage which is based on correlation analyzes of the estimated and the measured microphone signal, is used for intercom detection and is therefore evaluated equally in all frequency ranges. A further level takes into account the accuracy limited by the fixed point arithmetic and controls the adaptation depending on the modulation.
  • the final intercom detection is also carried out separately with its own unit, which is based on both the level balance detectors and the echo cancellers. This unit causes the level balance to reduce the total attenuation to be inserted again (in accordance with ITU recommendation G.167).
  • a second filter 36 with a significantly reduced order - hereinafter referred to as shadow filter 36 - was connected in parallel to one of the echo cancellers 34.
  • This second filter 36 is dimensioned so that it can only compensate for the direct sound. Due to its shortened length and its adapted control, it can adapt much faster than the actual echo cancellation filter 34.
  • the control of the shadow filter 36 is based only on the excitation by the distant call participant. After room changes, the residual error power (signal e ⁇ k r ),
  • the combination of these two detection methods - the shadow filter and the correlation analysis - allow fast and stable adaptation of the echo cancellers even under the difficult conditions in motor vehicles.
  • the control of the residual damping, which is to be inserted by the level balance, can be carried out permissible with the described method. Control of attenuation reduction in intercom is included.
  • the frequency band analysis and synthesis required for subband processing is implemented as a polyphase filter bank.
  • the subband echo cancellers 28 are controlled by their step sizes a Dk r ).
  • the equation for these quantities is:
  • and ⁇ e ⁇ ( (k r ) ⁇ represent smoothed estimates for the signal power of the remote subscriber and for the error power. Both estimates are determined by first-order non-linear recursive amount smoothing.
  • ß ⁇ ) ( ⁇ ⁇ ⁇ e ⁇ (k r ) ⁇ ⁇ + ⁇ lm ⁇ e ⁇ (k r ) ⁇ ⁇ ) + (l-ß e (k r )) ⁇ e ⁇ (k r -1 )
  • with ß R if
  • Im ⁇ e ⁇ (* r ) ⁇ ⁇ > ⁇ e ⁇ k r - 1) ß ⁇ K) [2.2: ß F , otherwise 13
  • the time constants ß R and ß F are chosen so that an increase in signal power can be followed faster than a decrease in power.
  • the actual calculation of the step sizes uses a DSP-specific log
  • Subbands are estimated if the condition of the speakerphone allows.
  • the quality of these estimates also determines the quality of the entire hands-free system over the long term. Accordingly, the determination of these variables also involves a significantly higher process effort.
  • a second filter is connected in parallel with the actual adaptive filter in the first subband (frequency range 250 Hz - 750 Hz) (FIG. 6).
  • This so-called shadow filter is significantly shorter than the conventional one and is designed in such a way that it can mainly compensate for direct sound and the first reflections. Due to the reduced order, the shadow filter can adjust much faster, if not as far as the longer echo compensation filter.
  • the shadow filter c ⁇ ⁇ k r is, like the subband echo compensators ⁇ ⁇ k r ), with an NLMS algorithm rl K ) ⁇ u (r) ( )
  • the parameter ⁇ ⁇ is adjustable and should be about 1.
  • the size N sf is also adjustable and should be adjusted to the length of the shadow filter.
  • ⁇ (K) ⁇ determines the detector output, which is generated as follows:
  • the correlation coefficient can assume a value range of p ( 0 r) (k r ) e [0 ... l]. Little one
  • the correlation analysis starts from compensated compensators - the signals y ⁇ r) (k r ) and y ⁇ r ⁇ k r ) then have no running time difference. This does not apply to poorly balanced compensators. In order to enable an analysis here, too, the evaluation is also carried out for a time offset in both directions.
  • the correlation coefficients p r) (k r ) are calculated for different values of n:
  • ⁇ j o
  • the values for /? are preferably taken from an integer interval that contains the value 0.
  • P n (r k r ) is preferably calculated for five values of n. 17 To reduce the effort, the sums of the numerator or denominator can be calculated recursively.
  • the detection criterion can thus be specified as follows:
  • the threshold values should be adapted to the statistical properties of the input signal, in particular to the power density spectrum. If sufficient excitation has been detected, the spatial change detection of the shadow filter is evaluated in a second detection stage. Should the shadow filter change to "strong" room changes
  • the determination equation of the transfer factors is in the case of detected strong changes in space:
  • the first stage here is the correlation analysis already mentioned. Will the condition
  • the second level of intercom detection is evaluated with overall band signals.
  • the sizes ⁇ x (k) ⁇ and ⁇ e (k) ⁇ are according to
  • the calculation of the total band power transmission factor p EK (k) is carried out analogously to the subband transmission factors with several detectors. First, the excitation power of the distant participant is checked - if a threshold is not exceeded here, the old estimate is retained. If sufficient excitation has been detected, the error performance of the shadow filter is evaluated and the p EK (k) estimate with a correspondingly short one when the room changes are detected
  • K cs can be used to react to the variance of the variables entering condition 2.27 - it should be chosen so that two-way talk is not recognized even with slight fluctuations in the signal powers.
  • the detection should only recognize two-way communication when the measured error power exceeds the estimated power by a certain value. In such cases, the 21 Estimation of the power transfer factors (Equation 2.17; carried out very slowly, ie

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)

Abstract

The present invention relates to a method for improving acoustic noise attenuation in hand-free devices essentially used in automobiles, wherein said method uses a level balance (22) as well as a plurality of echo-compensation adaptive filters (34) each for processing a given partial band. In at least one partial band, another adaptive filter (shadow filter 36) of a lower order is connected in parallel to an adaptive echo-compensation filter (34). Spatial modifications can thus be determined on the basis of a combined estimation which comprises a correlation analysis as well as a residual-error comparison of the two concurring filters (34, 36).

Description

1 Beschreibung 1 description
Verfahren zur Verbesserung der akustischen Rückhördämpfung in FreisprecheinrichtungenMethods for improving acoustic attenuation in hands-free systems
Die vorliegende Erfindung betrifft ein Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen mit einer Pegelwaage und mehreren adaptiven Echokompensationsfiltem, von denen jedes ein Teilband verarbeitet.The present invention relates to a method for improving the acoustic attenuation in hands-free systems with a level balance and a plurality of adaptive echo compensation filters, each of which processes a subband.
Bei Freisprecheinrichtungen ist es unbedingt erforderlich, die vom Lautsprecher ausgesandten und damit vom Mikrofon wieder aufgenommenen Signale des entfernten Teilnehmers zu unterdrücken, da sonst unangenehme Echos die Verbindung stören. Bisher wurde zur Unterdrückung dieser Echos, also zur akustischen Rückhördämpfung, üblicherweise eine Pegelwaage vorgesehen, die abhängig von der Gesprächssituation den Sende- oder den Empfangspfad stark dämpft. Dadurch wird jedoch ein Gegensprechen (Voll-Duplex-Betrieb) praktisch unmöglich.In the case of hands-free systems, it is absolutely necessary to suppress the signals of the distant subscriber which are emitted by the loudspeaker and thus picked up again by the microphone, since otherwise unpleasant echoes disrupt the connection. Up to now, a level balance has been usually provided to suppress these echoes, that is, for acoustic attenuation, which strongly dampens the transmission or reception path depending on the conversation situation. However, this makes two-way communication (full duplex operation) practically impossible.
Mit der bisherigen Technik wurde bereits versucht, eine ausreichende Rückhördämpfung trotz akzeptabler Gegensprechbe- triebs-eigenschaften zur Verfügung zu stellen. Hierzu wurde zusätzlich zu der Pegelwaage eine frequenzselektive, steuer- bare Echounterdrückung vorgesehen. Diesbezüglic wird auf die noch unveröffentlichte Patentanmeldung DE 197 14 966 der Anmelderin verwiesen. Andere Verfahren sind beispielsweise im Werbeprospekt der Firma NEC "Reflexion™ Acoustic Echo Can- celler on the μPD7701x Family", 1996, oder in der Beschrei- bung des Motorola DSP5600x Digitalprozessors (M. Knox,P. Abbott, C.Cox: A Highly Integrated H.320 Audiosubsystem using the Motorola DSP5600x Digital Processor) beschrieben.With previous technology, attempts have already been made to provide adequate attenuation despite acceptable intercom characteristics. For this purpose, a frequency-selective, controllable echo suppression was provided in addition to the level balance. In this regard, reference is made to the as yet unpublished patent application DE 197 14 966 by the applicant. Other methods are, for example, in the advertising brochure of the NEC company "Reflexion ™ Acoustic Echo Canceller on the μPD7701x Family", 1996, or in the description of the Motorola DSP5600x digital processor (M. Knox, P. Abbott, C. Cox: A Highly Integrated H.320 audio subsystem using the Motorola DSP5600x Digital Processor).
Solche Echounterdrückungsverfahren funktionieren in normalen Räumen zufriedenstellend. Bei der Verwendung von Freisprecheinrichtungen in Kraftfahrzeugen wird die Erkennung von Gegensprechen - abhängig von der Innenraumakustik - deutlich 2 schwieriger als in Büroräumen. Insbesondere ist in Kraftfahrzeugen die Unterscheidung von abrupten Änderungen der Innenraumakustik, beispielsweise durch Bewegungen der Fahrzeuginsassen, gegenüber dem Gegensprechen außerordentlich schwie- rig.Such echo cancellation methods work satisfactorily in normal rooms. When using hands-free devices in motor vehicles, the detection of two-way communication becomes clear - depending on the interior acoustics 2 more difficult than in office space. In motor vehicles in particular, it is extremely difficult to differentiate between abrupt changes in the interior acoustics, for example by movements of the vehicle occupants, with respect to the two-way communication.
Es ist daher Aufgabe der Erfindung, ein Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen anzugeben, bei dem auch in Kraftfahrzeugen eine klare Unterscheidung zwischen Gegensprechen und abrupten Änderungen der Innenraumakustik erkannt und bei der Steuerung der Freisprecheinrichtung berücksichtigt werden kann.It is therefore an object of the invention to provide a method for improving acoustic attenuation in hands-free devices, in which a clear distinction between two-way communication and abrupt changes in the interior acoustics can also be recognized in motor vehicles and taken into account in the control of the hands-free device.
Diese Aufgabe wird gelöst mit einem Verfahren mit den Merk a- len von Patentanspruch 1. Vorteilhafte Ausgestaltungen dieses Verfahrens sind in den Unteransprüchen angegeben.This object is achieved with a method having the features of patent claim 1. Advantageous refinements of this method are specified in the subclaims.
Nach der Erfindung ist in mindestens einem Teilband ein weiteres adaptives Filter (Schattenfilter) geringerer Ordnung dem adaptiven Echokompensationsfilter parallel geschaltet. Raumänderungen können dann durch die Kombination einer Leistungsauswertung der beiden Restecholeistungen und einer Korrelationsanalyse des geschätzten und des gemessenen Mikrophonsignals detektiert werden.According to the invention, a further adaptive filter (shadow filter) of a lower order is connected in parallel to the adaptive echo cancellation filter in at least one subband. Room changes can then be detected by combining a performance evaluation of the two residual echo powers and a correlation analysis of the estimated and the measured microphone signal.
Vorzugsweise können dabei mehrere unterschiedliche Abtastraten verwendet werden. Dadurch kann der Rechenaufwand verringert werden.Several different sampling rates can preferably be used. This can reduce the computational effort.
Ebenso ist es bevorzugt, daß das weitere adaptive Filter eine wesentlich geringere Ordnung aufweist.It is also preferred that the further adaptive filter has a significantly lower order.
Die Echokompensation wird vorzugsweise mittels einer Filterbank in Frequenzteilbändern implementiert.The echo cancellation is preferably implemented in frequency subbands by means of a filter bank.
Vorzugsweise werden für die Adaptions- bzw. die Schrittweitensteuerung sowohl Leistungsauswertungen von konkurrierenden 3 adaptiven Filtern, als auch korrelationsbasierende Analysen verwendet.Both performance evaluations of competing are preferably used for the adaptation or the step size control 3 adaptive filters, as well as correlation-based analyzes used.
Ebenso ist es bevorzugt, zur Schrittweitenbestimmung Lei- stungsübertragungsfaktoren in Teilbändern zu schätzen.It is also preferred to estimate power transmission factors in subbands for determining the step size.
Ebenso ist es bevorzugt, daß die Echokompensationsfilter Schätzwerte für die durch sie eingebrachte Echodämpfung liefern, da diese Schätzwerte bevorzugt zur Steuerung der Dämp- fung der Pegelwaage verwendet werden können. Dadurch kann die von der Pegelwaage einzubringende Dämpfung weiter reduziert und damit die Gesprächsqualität beim Gegensprechen weiter verbessert werden.It is also preferred that the echo compensation filters provide estimates for the echo attenuation introduced by them, since these estimates can preferably be used to control the attenuation of the level balance. As a result, the attenuation to be introduced by the level balance can be further reduced and the conversation quality in the case of two-way communication can be further improved.
Zusätzlich ist es bevorzugt, die gleichzeitige Aktivität beider Gesprächsteilnehmer (Gegensprechen) zu detektieren. Es ist dann beispielsweise möglich, die Gesamtdämpfung der Pegelwaage im Gegensprechfall zu reduzieren, um die Gegen- sprechfähigkeit (Full-Duplex-Betrieb) der Freisprecheinrich- tung weiter zu verbessern.In addition, it is preferred to detect the simultaneous activity of both conversation participants (intercom). It is then possible, for example, to reduce the total attenuation of the level balance in the case of two-way communication in order to further improve the two-way communication capability (full duplex operation) of the hands-free device.
Die vorliegende Erfindung wird im folgenden anhand des in den beigefügten Zeichnungen dargestellten Ausführungsbeispiels näher beschrieben. Es zeigt:The present invention is described below with reference to the embodiment shown in the accompanying drawings. It shows:
Fig. 1 ein vereinfachtes Modell einer Freisprecheinrichtung mit Anschluß an eine digitale Verbindung;Figure 1 is a simplified model of a hands-free device connected to a digital connection.
Fig. 2 ein vereinfachtes Blockschaltbild einer Freisprech- einrichtung;2 shows a simplified block diagram of a hands-free device;
Fig. 3 Kurven für die Dämpfungsanforderungen der Benutzer in Abhängigkeit von der Echolaufzeit;3 curves for the attenuation requirements of the user as a function of the echo run time;
Fig. 4 eine Übersichtsdarstellung des erfindungsgemäßen Verfahrens mit Schattenfilter und Korrelationsanalyse; 4 Fig. 5 die Steuerung der Leistungsübertragungsfaktoren in ei¬ ner übersichtlichen Darstellung;4 shows an overview of the method according to the invention with shadow filter and correlation analysis; 4 FIG. 5 shows the control of the power transmission factors in a clear representation;
Fig. 6 eine Ubersichtsdarstellung zum Schattenfilteransatz.6 shows an overview of the shadow filter approach.
In Fig. 1 ist ein vereinfachtes Modell einer Freisprecheinrichtung 10 mit Anschluß an eine digitale Verbindung 12 dargestellt. Die im europäischen ISDN-Netz verwendete A-Law- Codierung bzw. Decodierung ist in den beiden linken Blöcken 14, 16 dargestellt. Auf der rechten Seite ist das Lautspre- cher-Raum-Mikrophonsystem 18 (LRM-System) mit dem lokalen Ge- sprächsteilnehmer 20, dem Benutzer der Freisprecheinrichtung, skizziert .1 shows a simplified model of a hands-free device 10 connected to a digital connection 12. The A-law coding or decoding used in the European ISDN network is shown in the two left blocks 14, 16. The speaker-room microphone system 18 (LRM system) with the local call participant 20, the user of the hands-free device, is sketched on the right-hand side.
Durch die akustische Kopplung zwischen Lautsprecher und Mikrophon kommt es zum Übersprechen über das LRM-System. Dieses Übersprechen wird vom fernen Teilnehmer als störendes Echo wahrgenommen. Akustische Wellen treten dabei aus dem Lautsprecher aus und breiten sich im Raum aus. Durch Reflexion an den Wänden und anderen sich im Raum befindlichen Gegenständen entstehen mehrere Ausbreitungspfade, durch die unterschiedliche Laufzeiten des Lautsprechersignals entstehen. Das Echosignal am Mikrophon besteht somit aus der Überlagerung einer Vielzahl von Echoanteilen und ggf. dem Nutzsignal n(t) : dem lokalen Sprecher.The acoustic coupling between loudspeaker and microphone leads to crosstalk via the LRM system. This crosstalk is perceived by the distant subscriber as a disturbing echo. Acoustic waves emerge from the loudspeaker and spread out in the room. Reflection on the walls and other objects in the room creates several paths of propagation, which result in different durations of the loudspeaker signal. The echo signal at the microphone thus consists of the superimposition of a large number of echo components and possibly the useful signal n (t): the local speaker.
Auch die Verbindung zwischen den Teilnehmern kann an Übergängen zwischen verschiedenen Übertragungssystemen Echos erzeugen. Die Netzbetreiber versuchen jedoch, direkt an den kriti- sehen Stellen besondere Maßnahmen gegen derartige Echoquellen zu treffen, so daß diese Echos hier außer Acht gelassen werden können. Auch Gabelechos, die in Telefonen mit analogem Interface durch Fehlanpassung der Leitungsnachbildung an die Leitungsimpedanz entstehen, können bei der Verwendung von di- gitalen Verbindungen außer Betracht gelassen werden. 5 In Fig. 2 ist eine Übersicht einer Freisprecheinrichtung dar¬ gestellt. Zentrales Element ist eine Pegelwaage 22, welche im linken Teil der Fig. 2 dargestellt ist. Optional können zwei Verstärkungssteuerungen 24, 26 (Automatic Gain Control = AGC) in den Sende- und den Empfangspfad eingeschaltet werden. Die Pegelwaage 22 garantiert die durch die ITU- bzw. ETSI- Empfehlungen vorgeschriebenen Mindestdämpfungen, indem sie abhängig von der Gesprächssituation Dämpfungen in den Sende- und/oder den Empfangspfad einfügt. Bei Aktivität des fernen Teilnehmers wird der Empfangspfad freigeschaltet und das Signal des fernen Teilnehmers wird ungedämpft auf dem Lautsprecher ausgegeben. Die bei abgeschalteten oder schlecht abgeglichenen Kompensatoren entstehenden Echos werden durch die in den Sendepfad eingefügte Dämpfung stark verringert. Bei Aktivität des lokalen Sprechers kehrt sich die Situation um. Während der Empfangspfad stark bedämpft wird, fügt die Pegelwaage 22 in den Sendepfad keine Dämpfung ein und das Signal des lokalen Sprechers wird ungedämpft übertragen. Schwieriger wird die Steuerung der Pegelwaage 22 im Gegensprechfall . Hier erhalten beide Pfade (und damit auch die Teilnehmersignale) jeweils die Hälfte der einzufügenden Dämpfung oder bei nicht optimaler Steuerung wird zumindest einer der beiden Signalpfade gedämpft. Gegensprechen ist damit nicht oder nur eingeschränkt möglich.The connection between the participants can also generate echoes at transitions between different transmission systems. However, the network operators try to take special measures against such echo sources directly at the critical points, so that these echoes can be disregarded here. Fork echoes, which arise in telephones with an analog interface due to mismatching of the line simulation to the line impedance, can also be disregarded when using digital connections. 5 An overview of a hands-free device is shown in FIG. 2. The central element is a level balance 22, which is shown in the left part of FIG. 2. Optionally, two gain controls 24, 26 (Automatic Gain Control = AGC) can be switched on in the transmit and receive path. The level balance 22 guarantees the minimum attenuation prescribed by the ITU or ETSI recommendations by adding attenuation to the transmission and / or reception path depending on the conversation situation. When the remote subscriber is active, the reception path is activated and the signal from the remote subscriber is output undamped on the loudspeaker. The echoes that occur when the compensators are switched off or poorly balanced are greatly reduced by the damping inserted into the transmission path. When the local speaker is active, the situation is reversed. While the reception path is strongly attenuated, the level balance 22 does not insert any attenuation into the transmission path and the signal of the local speaker is transmitted undamped. Controlling the level balance 22 in the case of two-way communication becomes more difficult. Here, both paths (and thus also the subscriber signals) each receive half of the damping to be inserted or, if the control is not optimal, at least one of the two signal paths is damped. Intercom is therefore not possible or only possible to a limited extent.
Abhilfe schafft hier der Einsatz von adaptiven Echokompensa- toren 28 - dargestellt im rechten Teil der Fig. 2. Diese versuchen das LRM-System digital nachzubilden, um dann den Echoanteil des fernen Teilnehmers aus dem Mikrophonsignal zu ent- fernen. Je nachdem, wie gut die Kompensatoren dies bewerkstelligen, kann die durch die Pegelwaage 22 einzufügende Gesamtdämpfung reduziert werden.This is remedied by the use of adaptive echo cancellers 28 - shown in the right part of FIG. 2. These try to digitally emulate the LRM system in order to then remove the echo component of the distant subscriber from the microphone signal. Depending on how well the compensators manage this, the total attenuation to be inserted by the level balance 22 can be reduced.
Die Echokomponsation wurde in Frequenzteilbändern implemen- tiert, wobei die Breite der einzelnen Bänder zwischen 250 Hz und 500 Hz bei 8 kHz Abtastrate bzw. zwischen 500 Hz und 1000 Hz bei 16 kHz Abtastrate liegt. Der Einsatz einer frequenzse- 6 lektiven Echokompensation hat mehrere Vorteile. Zum einen kann durch Verwendung von Unter- und Überabtastung das System als Multiratensystem betrieben werden, wodurch sich der Signalverarbeitungsaufwand verringert. Zum anderen kann durch die Teilbandzerlegung die "Kompensationsleistung" unterschiedlich auf die einzelnen Frequenzbereiche verteilt werden und somit eine effektive Anpassung der "Kompensationsleistung" an Sprachsignale erreicht werden. Weiter hat die Teilbandverarbeitung eine dekorrelierende Wirkung, wenn die Ge- samtbandverarbeitung mit den einzelnen Teilbandsystemen verglichen wird. Für Sprachsignale bedeutet dies eine Erhöhung der Konvergenzgeschwindigkeit der adaptiven Filter. Neben diesen Vorteilen darf der Nachteil einer Teilbandverarbeitung nicht außer Acht gelassen werden. Die Zerlegung eines Signals in einzelne Frequenzbereiche bewirkt stets eine Laufzeit. Da das Verfahren jedoch für Videokonferenzen bzw. in GSM- Mobiltelefonen eingesetzt wird, sind solche Laufzeiten zulässig.The echo composition was implemented in frequency subbands, the width of the individual bands being between 250 Hz and 500 Hz at 8 kHz sampling rate or between 500 Hz and 1000 Hz at 16 kHz sampling rate. The use of a frequency 6 selective echo cancellation has several advantages. Firstly, by using undersampling and oversampling, the system can be operated as a multirate system, which reduces the signal processing effort. On the other hand, by dividing the sub-band, the "compensation power" can be distributed differently over the individual frequency ranges and thus an effective adaptation of the "compensation power" to speech signals can be achieved. Subband processing also has a decorrelating effect when the overall tape processing is compared with the individual subband systems. For speech signals, this means an increase in the convergence speed of the adaptive filters. In addition to these advantages, the disadvantage of subband processing must not be ignored. Breaking down a signal into individual frequency ranges always results in a runtime. However, since the method is used for video conferences or in GSM mobile phones, such runtimes are permissible.
In Videokonferenzsystemen wird die Laufzeit hauptsächlich von der bildverarbeitenden Komponente bestimmt. Da im allgemeinen versucht wird, dem lokalen Teilnehmer Bild und Ton des fernen Teilnehmers lippensynchron auszugeben, kann sich die Laufzeit der akustischen Echos auf mehrere hundert Millisekunden er- höhen. In Fig. 3 sind die Ergebnisse einer Studie dargestellt, in der versucht wurde, herauszufinden, welche Echodämpfung abhängig von der Laufzeit dieses Echos notwendig ist, damit 90, 70 bzw. 50 Prozent der Befragten mit der Gesprächsqualität zufrieden waren.In video conferencing systems, the runtime is mainly determined by the image processing component. Since attempts are generally made to output the image and sound of the distant subscriber lip-synchronized to the local subscriber, the running time of the acoustic echoes can increase to several hundred milliseconds. 3 shows the results of a study in which an attempt was made to find out which echo attenuation is necessary depending on the duration of this echo, so that 90, 70 and 50 percent of the respondents were satisfied with the quality of the call.
Basierend auf dieser Studie sind bei der reinen Audiolaufzeit von 30 - 40 ms (bei 8 kHz Abtastrate) lediglich 35 dB Echodämpfung notwendig. Bei lippensynchroner Ausstrahlung von Bild und Ton und einer damit verbundenen Laufzeit von bei- spielsweise 300 ms erhöht sich die Anforderung auf 53 dB. Auch in GSM-Verbindungen kann die Laufzeit mehr als 100 ms betragen. Die Anforderungen, die an Echokompensationsverfah- 7 ren in Videokonferenz- und GSM-Systemen gestellt werden, sind somit höher als die Anforderungen an herkömmliche Freisprech- telefone.Based on this study, a pure audio runtime of 30 - 40 ms (at 8 kHz sampling rate) only requires 35 dB echo attenuation. With lip-synchronous broadcasting of image and sound and a related runtime of 300 ms, for example, the requirement increases to 53 dB. The runtime can also be more than 100 ms in GSM connections. The requirements for echo cancellation 7 in videoconferencing and GSM systems are therefore higher than the requirements for conventional hands-free telephones.
Da die Echokompensatoren in ihrer Leistungsfähigkeit begrenzt sind und derart hohe Echodämpfungen mit der zur Verfügung stehenden Hardware nicht erreichen können, wurde ein sog. Postfilter 30 eingeführt. Dieses wertet die Schrittweiten der einzelnen Teilbänder zusammen mit den anderen Detektorergeb- nissen aus und filtert das Synthesefilterausgangssignal nochmals frequenzselektiv. Da der Einstellalgorithmus des Filters 30 gemäß einem Wiener-Ansatz entworfen wurde, wird diese Postfilterung im folgenden auch mit Wiener-Filterung bezeichnet.Since the echo cancellers are limited in their performance and cannot achieve such high echo attenuation with the available hardware, a so-called post filter 30 was introduced. This evaluates the step sizes of the individual subbands together with the other detector results and filters the synthesis filter output signal again frequency-selectively. Since the setting algorithm of the filter 30 was designed according to a Wiener approach, this post-filtering is also referred to below as Wiener filtering.
Die Steuerung der Echokompensatoren erfolgt in mehreren Stufen. Alle leistungsbasierenden Steuereinheiten 32 arbeiten für jeden Kompensator autonom, also unabhängig von den restlichen Frequenzbereichen. In Fig. 2 ist daher für jeden Kom- pensator eine eigene Adaptions- und Steuereinheit 32 skizziert. Die auf Korrelationsanalysen des geschätzten und des gemessenen Mikrophonsignals basierende Stufe der Steuerung wird zur Gegensprechdetektion verwendet und daher in allen Frequenzbereichen gleichermaßen ausgewertet. Eine weitere Stufe trägt der durch die Festkommaarithmetik begrenzten Genauigkeit Rechnung und steuert die Adaption in Abhängigkeit der Aussteuerung.The echo cancellers are controlled in several stages. All power-based control units 32 work autonomously for each compensator, that is to say independently of the remaining frequency ranges. A separate adaptation and control unit 32 is therefore sketched in FIG. 2 for each compensator. The control stage, which is based on correlation analyzes of the estimated and the measured microphone signal, is used for intercom detection and is therefore evaluated equally in all frequency ranges. A further level takes into account the accuracy limited by the fixed point arithmetic and controls the adaptation depending on the modulation.
Die endgültige Gegensprecherkennung erfolgt ebenfalls geson- dert mit einer eigenen Einheit, die sich sowohl auf die Detektoren der Pegelwaage als auch auf die der Echokompensatoren stützt. Diese Einheit veranlaßt die Pegelwaage in Gegen- sprechsituationen die einzufügende Gesamtdämpfung nochmals (gemäß der ITU-Empfehlung G.167) zu reduzieren.The final intercom detection is also carried out separately with its own unit, which is based on both the level balance detectors and the echo cancellers. This unit causes the level balance to reduce the total attenuation to be inserted again (in accordance with ITU recommendation G.167).
Bei der Verwendung der Freisprecheinrichtung in Kraftfahrzeugen wird die Erkennung von Gegensprechen - abhängig von der 8 Innenraumakustik - deutlich schwieriger als in Büroräumen. Im besonderen kann mit bisherigen Verfahren nur eingeschränkt bei einer Erhöhung der Signalleistung im Sendepfad (Signal e(k)) zwischen Gegensprechen und abrupten Raumänderungen un- terschieden werden. Im letzteren Fall führen Bewegungen des Fahrers (Lenkbewegungen, Gestikulieren) zu Veränderungen der Übertragungsstrecke zwischen Lautsprecher und Mikrophon, wodurch die Echokompensatoren nicht mehr auf den Raum abgeglichen sind. Abhängig von der Innenraumakustik erhöht sich da- durch die Signalleistung des Rechtechos bis in Größenordnungen, welche bei Gegensprechen erreicht werden. Um zu vermeiden, daß in solchen Situationen der Gegensprechdetektor die Dämpfungsabsenkung aktiviert, wurde ein sog. Schattenfilter 36 eingesetzt.When using the hands-free device in motor vehicles, the detection of two-way communication is dependent on the 8 Interior acoustics - significantly more difficult than in offices. In particular, previous methods can only make a limited distinction between two-way communication and abrupt changes in space if the signal power in the transmission path (signal e (k)) is increased. In the latter case, movements of the driver (steering movements, gesturing) lead to changes in the transmission path between the loudspeaker and the microphone, as a result of which the echo cancellers are no longer adjusted to the room. Depending on the interior acoustics, the signal power of the right echo increases up to the order of magnitude that can be achieved with two-way communication. In order to prevent the intercom detector from activating the attenuation reduction in such situations, a so-called shadow filter 36 was used.
Herbei wurde einem der Echokompensatoren 34 ein zweites Filter 36 mit deutlich reduzierter Ordnung - im folgenden Schattenfilter 36 genannt - parallel geschaltet. Dieses zweite Filter 36 ist so bemessen, daß es lediglich den Direktschall kompensieren kann. Bedingt durch seine verkürzte Länge und durch seine angepaßte Steuerung kann es wesentlich schneller adaptieren als das eigentliche Echokompensationsfilter 34. Die Steuerung des Schattenfilters 36 basiert lediglich auf der Anregung durch den fernen Gesprächsteilnehmer. Nach Raumänderungen wird die Restfehlerleistung (Signal e^ kr) ,A second filter 36 with a significantly reduced order - hereinafter referred to as shadow filter 36 - was connected in parallel to one of the echo cancellers 34. This second filter 36 is dimensioned so that it can only compensate for the direct sound. Due to its shortened length and its adapted control, it can adapt much faster than the actual echo cancellation filter 34. The control of the shadow filter 36 is based only on the excitation by the distant call participant. After room changes, the residual error power (signal e ^ k r ),
Fig. 4) des Schattenfilters 36 deutlich schneller reduziert als die des langen Echokompensationsfilters 34. Ein Detektor wertet die Fehlerleistungen der beiden konkurrierenden Filter aus und veranlaßt im Fall detektierter Raumänderungen eine schnelle Schätzung des Leistungsübertragungsfaktors zwischen den Signalen x (k) und e (k) . Bei starken Veränderungen des Raums wird dadurch nicht mehr fehlerhaft auf Gegensprechen erkannt und die Pegelwaage 22 unterdrückt das anstehende Restecho. Gleichzeitig wird die Schrittweite aller Echokompen- satoren 28 angepaßt, was zu einer schnellen Neuadaption führt. Eine detaillierte Beschreibung folgt. 9 Die Unterscheidung zwischen Einzel- und Gegensprechphasen wird durch starkes Hintergrundgeräusch in Kraftfahrzeugen (z. B. Motor- und Windgeräusche) erschwert und ist mit den bishe¬ rigen Detektoren nur eingeschränkt möglich. Um dieser Randbe- dingung dennoch Sorge zu tragen, wird eine erweiterte Korre¬ lationsanalyse vorgestellt. Diese Analyse verwendet - im Unterschied zu dem Stand der Technik - das geschätzte und das gemessene Mikrophonsignal eines Teilbandes. Diese Auswahl läßt erheblich höhere Hintergrundgeräuschpegel zu, ohne mess- bar schlechtere Ergebnisse zu liefern. Fehldetektionen bei schlecht abgeglichenen Kompensatoren werden durch die Schattenfilterauswertung abgefangen.4) of the shadow filter 36 is reduced significantly faster than that of the long echo compensation filter 34. A detector evaluates the error powers of the two competing filters and, in the case of detected changes in space, causes a quick estimate of the power transmission factor between the signals x (k) and e (k). . In the case of strong changes in the room, this means that there is no longer an incorrect detection of two-way communication and the level balance 22 suppresses the pending residual echo. At the same time, the step size of all echo cancellers 28 is adapted, which leads to rapid readaptation. A detailed description follows. 9 The distinction between single and intercom phases is strong background noise in motor vehicles (. B. engine and wind noise z) is more difficult and restricted with the Bishe ¬ ring detectors possible. To this Randbe- yet dingung care to wear, an extended Korre ¬ lationsanalyse is presented. In contrast to the prior art, this analysis uses the estimated and the measured microphone signal of a subband. This selection allows significantly higher background noise levels without delivering measurably poorer results. Incorrect detections in poorly balanced compensators are intercepted by the shadow filter evaluation.
Die Kombination dieser beiden Detektionsverfahren - das Schattenfilter und die Korrelationsanalyse - lassen auch unter den erschwerten Bedingungen in Kraftfahrzeugen eine schnelle und stabile Adaption der Echokompensatoren zu. Die Steuerung der Restdämpfung, welche durch die Pegelwaage einzufügen ist, kann mit dem beschriebenen Verfahren zulässig durchgeführt werden. Hierbei ist die Steuerung der Dämpfungsreduktion bei Gegensprechen eingeschlossen.The combination of these two detection methods - the shadow filter and the correlation analysis - allow fast and stable adaptation of the echo cancellers even under the difficult conditions in motor vehicles. The control of the residual damping, which is to be inserted by the level balance, can be carried out permissible with the described method. Control of attenuation reduction in intercom is included.
Der Stand der Technik in bezug auf Schattenfilter ergibt sich beispielsweise aus S.D. Peters: A Self-Tuning NLMS Adaptive Filter Using Parallel Adaption, IEEE Transactions on Circuits and Systems - II, Analog and Digital Signal Processing, Vol. 44, No. 1, Jan. 1997. Hier werden zusätzlich zum eigentlichen adaptiven Gesamtbandfilter zwei Schattenfilter mit gleicher Länge parallel adaptiert. Aus den beiden Fehlersignalen wird dann die Schrittweite für das eigentliche Filter bestimmt.The state of the art in relation to shadow filters results, for example, from S.D. Peters: A Self-Tuning NLMS Adaptive Filter Using Parallel Adaption, IEEE Transactions on Circuits and Systems - II, Analog and Digital Signal Processing, Vol. 44, No. 1, Jan. 1997. In addition to the actual adaptive total band filter, two shadow filters of the same length are adapted in parallel. The step size for the actual filter is then determined from the two error signals.
Erst durch die Verwendung eines einzigen Teilbandschattenfilters - welches deutlich kürzer als das eigentliche Filter ist - können Raumänderungen mit dem in dieser Erfindung vorge- schlagenen Verfahren mit sehr geringem Aufwand detektiert werden. 10 Der Stand der Technik in bezug auf Korrelationsanalysen fin¬ det sich beispielsweise in P. Heitkämper: Ein Korrelationsmaß zur Feststellung von Sprecheraktivitäten, 8. Aachener Kolloquium Signaltheorie, RTWH Aachen, März 1994. Hier wird die Korrelation zwischen dem Mikrophon- und dem Lautsprechersi¬ gnal ausgewertet. Der Nachteil dieses Verfahrens besteht in der mit steigendem Hintergrundgeräuschpegel ebenfalls steigenden Anzahl an Fehldetektionen, so daß die Anwendung in Fahrzeugen nicht oder nur eingeschränkt möglich ist.Only by using a single subband shadow filter - which is significantly shorter than the actual filter - can changes in space be detected with very little effort using the method proposed in this invention. 10 The state of the art in terms of correlation analyzes fin ¬ det for example, in P. Heitkämper: A correlation to detect spokesman activities 8. Aachen Colloquium signal theory RTWH Aachen, March 1994. Here is the correlation between the microphone and the Lautsprechersi ¬ gnal evaluated. The disadvantage of this method is that the number of false detections also increases with increasing background noise level, so that it cannot be used in vehicles, or only to a limited extent.
Die für die Teilbandverarbeitung notwendige Frequenzbandanalyse und -synthese ist als Polyphasenfilterbank implementiert.The frequency band analysis and synthesis required for subband processing is implemented as a polyphase filter bank.
Um ein Freisprechverfahren mit einer Pegelwaage und mehreren adaptiven Echokompensationsfiltern, von denen jeder ein Teilband verarbeitet, auch in Kraftfahrzeugen verwenden zu können, müssen Anpassungen an die veränderten Randbedingungen (im Vergleich zur Verwendung in "normalen" Büroräumen) vorge- nommen werden.In order to be able to use a hands-free method with a level balance and several adaptive echo compensation filters, each of which processes a sub-band, in motor vehicles, adjustments to the changed boundary conditions (compared to the use in "normal" offices) must be made.
So ist bei Freisprechen in Kraftfahrzeugen mit deutlichen - die Adaption störenden - Hintergrundgeräuschen (z. B. Motor- und Fahrtwindgeräusche) zu rechnen. Weiter kann die Leistung dieser Geräusche stark schwanken - als Beispiele können der Betrieb bei schneller Fahrt auf der Autobahn und der Betrieb auf einem ruhigen Parkplatz angeführt werden. Die Nachhallzeiten von Fahrzeuginnenräumen (ca. 50 - 80 ms) sind im Vergleich zu Büroräumen deutlich geringer. Bewegungen des Fah- rers (Lenken, Gestikulieren, etc.) wirken sich damit deutlich stärker auf die Impulsantwort des Lautsprecher-Raum-Mikrophon-Systems (LRM-Systems) aus.In handsfree talking in motor vehicles, for example, significant background noise (e.g. engine and headwind noise) that can interfere with the adaptation can be expected. Furthermore, the performance of these noises can fluctuate greatly - as examples, the operation when driving fast on the highway and the operation in a quiet parking lot can be given. The reverberation times of vehicle interiors (approx. 50 - 80 ms) are significantly lower compared to office rooms. Movements by the driver (steering, gesturing, etc.) thus have a significantly greater impact on the impulse response of the loudspeaker-room-microphone system (LRM system).
Um unter den beschriebenen Randbedingungen eine stabile Adap- tion der Echokompensatoren sowie eine entsprechende Steuerung der Dämpfungsanforderungen an die Pegelwaage zu gewährleisten, wird die kombinierte Anwendung einer Korrelationsanaly- 11 se und eines Schattenfilters vorgestellt. Das weiter unten vorgestellte Verfahren schätzt die in Tabelle 1 aufgeführten Größen.In order to ensure stable adaptation of the echo cancellers and corresponding control of the attenuation requirements for the level balance under the described boundary conditions, the combined use of a correlation analysis 11 se and a shadow filter are presented. The procedure presented below estimates the quantities listed in Table 1.
Die in Tabelle 1 eingeführte Notation der Formelzeichen wird während der gesamten Beschreibung beibehalten. Die hochgestellten (r> bzw. die tiefgestellten r weisen auf die um den den Faktor r reduzierte Abtastrate hin. Geglättete Größen sind durch Überstriche gekennzeichnet. Die Auswahl einzelner Teilbänder erfolgt durch geeignete Wahl des Parameters μ .The notation of the formula symbols introduced in Table 1 is retained throughout the description. The superscript (r> or subscript r indicate the sampling rate reduced by the factor r. Smoothed sizes are indicated by overlines. The selection of individual subbands is made by suitable selection of the parameter μ.
Um eine stabile und schnelle Adaption der Echokompensatoren zu erreichen, werden die Teilbandechokompensatoren 28 durch ihre Schrittweiten a Dkr ) gesteuert. Die Bestimmungsglei- chung für diese Größen lautet:In order to achieve a stable and fast adaptation of the echo cancellers, the subband echo cancellers 28 are controlled by their step sizes a Dk r ). The equation for these quantities is:
Λr) (K ) ΪW(*r>Λr) (K) ΪW (* r>
Die Größen |*J,r(&r )| und \e^( (kr )\ stellen dabei geglättete Schätzwerte für die Signalleistung des fernen Teilnehmers bzw. für die Fehlerleistung dar. Beide Schätzgrößen werden durch nichtlineare rekursive Betragsglättungen erster Ordnung bestimmt. The sizes | * J, r (& r ) | and \ e ^ ( (k r ) \ represent smoothed estimates for the signal power of the remote subscriber and for the error power. Both estimates are determined by first-order non-linear recursive amount smoothing.
1212th
Bezeichnung BedeutungName meaning
<*Ϊ ) Schrittweite des Echokompensators im Teilband μ - Der Wertebereich dieser Größe liegt zwischen Null und Eins. Bei einer Schrittweite a^(kr = 0 wird die alte<* Ϊ ) Step size of the echo canceller in subband μ - The value range of this variable is between zero and one. With a step size a ^ (k r = 0, the old
Raumschätzung beibehalten - bei einer Schrittweite a^)(kr)= 1 wird mit maximalerKeep space estimate - with a step size a ^ ) (k r ) = 1, the maximum
Geschwindigkeit adaptiert.Adapted speed.
PV.EΛK) Leistungsübertragungsfaktor im TeilbandPV.EΛK) Power transmission factor in the subband
p EΛk) Leistungsübertragungsfaktor im Gesamtband bzw. Dämpfungsreduktion der Pegelwaage. p E Λ k) Power transmission factor in the entire band or attenuation reduction of the level balance.
K K)\ Schätzgröße für die Signalleistung des fernen Gesprächsteilnehmers (Anregungsleistung) im Teilband μ.K K) \ Estimated quantity for the signal power of the distant party (excitation power) in the subband μ.
\x(k)\ Schätzgröße für die Signalleistung des fernen Gesprächsteilnehmers (Anregungsleistung) im Gesamtband.\ x (k) \ Estimated quantity for the signal power of the distant call participant (excitation power) in the entire band.
\e;( κ)\ Schätzgröße für die Fehlerleistung im Teilband μ.\ e; ( κ) \ Estimated quantity for the error performance in the subband μ.
\e(k)\ Schätzgröße für die Fehlerleistung im Ge samtband.\ e (k) \ Estimated quantity for the error performance in Ge velvet ribbon.
Tabelle 1: Schätzgrößen und deren BedeutungTable 1: Estimates and their meaning
l*ir( =ßΛ )(\RΦΪ )}\+\Irn{xμ )( )}\) + (l-ßx(kr)) \7?{kr -1)|l * i r (= ßΛ) (\ RΦΪ)} \ + \ Irn {x μ ) ()} \) + (l-ß x (k r )) \ 7? {k r -1) |
Wi )\ =ßΛ )(\^{e^(kr)}\+\lm{e^(kr)}\) + (l-ße(kr)) \e^(kr -1)| mit ßR, falls |Re{xi"(*r)} |+ |Im{x^(*r)} |> \x^(kr -1) ßΛK) ßF , sonst ßR, falls |Re{e^(*r)} |+ |Im{e^(*r)} \> \e^ kr - 1) ßλK) = [2.2: ßF , sonst 13 Die Zeitkonstanten ßR bzw. ßF sind dabei so gewählt, daß einem Anstieg der Signalleistung schneller gefolgt werden kann, als einem Abfall der Leistung. Die eigentliche Berechnung der Schrittweiten verwendet eine DSP-spezifische Logarithmierung bzw. Linearisierung.Wi) \ = ßΛ) (\ ^ {e ^ (k r )} \ + \ lm {e ^ (k r )} \) + (l-ß e (k r )) \ e ^ (k r -1 ) | with ß R if | Re {xi "(* r )} | + | Im {x ^ (* r )} |> \ x ^ (k r -1) ßΛK) ß F , otherwise ß R if | Re {e ^ (* r )} | + | Im {e ^ (* r )} \> \ e ^ k r - 1) ßλK) = [2.2: ß F , otherwise 13 The time constants ß R and ß F are chosen so that an increase in signal power can be followed faster than a decrease in power. The actual calculation of the step sizes uses a DSP-specific logarithmization or linearization.
Die Leistungsübertragungsfaktoren p{^EK (kr ) in den einzelnenThe power transmission factors p { ^ EK (k r ) in each
Teilbändern werden, wenn es der Zustand der Freisprecheinrichtung zuläßt, geschätzt. Die Qualität dieser Schätzungen bestimmt nachhaltig auch die Qualität der gesamten Freisprecheinrichtung, entsprechend wird bei der Bestimmung dieser Größen auch ein deutlich höherer Verfahrensaufwand betrieben.Subbands are estimated if the condition of the speakerphone allows. The quality of these estimates also determines the quality of the entire hands-free system over the long term. Accordingly, the determination of these variables also involves a significantly higher process effort.
In Fig. 5 ist eine Übersicht zur Schätzung der Leistungsübertragungsfaktoren dagerstellt. Grundsätzlich sollten diese Faktoren nur bei Einzelsprechen des fernen Teilnehmers geschätzt werden. Wurde Einzelsprechen detektiert, so kann die Varianz der Schätzung durch verschiedene Zeitkonstanten be- einflusst werden. Sehr träge Schätzverfahren führen in stationären Umgebungen zu sehr guten Ergebnissen. In diesen Fällen erreicht die Freisprecheinrichtung Zustände in denen sie voll-duplex-fähig oder zumindest nahezu voll-duplex-fähig ist, d.h. unter Einhaltung der ITU-Empfehlungen ist Gegen- sprechen ohne merkliche Bedämpfung möglich.5 shows an overview for estimating the power transmission factors. Basically, these factors should only be estimated when the distant participant speaks individually. If single speech was detected, the variance of the estimate can be influenced by different time constants. Very slow estimation methods lead to very good results in stationary environments. In these cases, the hands-free device reaches states in which it is fully duplex-capable or at least almost fully duplex-capable, i.e. in compliance with the ITU recommendations, conversations are possible without noticeable attenuation.
Ändert sich der Zustand der Freisprecheinrichtung, z.B. durch Raumänderungen, so führen träge Schätzverfahren zu Fehldetek- tionen und es kommt zu unerwünschten Reduzierungen der Echo- dämpfung, also zu einer Verminderung der Gesprächsqualität.If the status of the hands-free system changes, e.g. due to changes in space, sluggish estimation methods lead to incorrect detection and undesirable reductions in echo attenuation, that is to say a reduction in the quality of the call.
Besonders kritisch ist die Unterscheidung zwischen Gegensprechen und Raumänderungen. Beides führt zu einem Anstieg der Fehlerleistung. Bei Gegensprechen sollte die Schätzung der Leistungsübertragungsfaktoren angehalten und die Gesamtdämpfung der Pegelwaage gemäß den ITU-T- bzw. ETSI-Empfehlungen 14 reduziert werden. Bei Raumänderungen sollten die Leistungsübertragungsfaktoren möglichst schnell neu geschätzt werden.The distinction between two-way communication and room changes is particularly critical. Both lead to an increase in error performance. In the case of two-way communication, the estimation of the power transmission factors should be stopped and the total attenuation of the level balance according to the ITU-T or ETSI recommendations 14 can be reduced. In the event of room changes, the power transmission factors should be re-estimated as quickly as possible.
Bevor die expliziten Berechnungsformeln für die einzelnen Übertragungsfaktoren angegeben werden, sind in den beiden folgenden Abschnitten die beiden Detektoren, welche Raumänderungen bzw. Gegensprechen erkennen sollen, vorgestellt. Die kombinierte Auswertung, welche zur Bestimmung der Leistungsübertragungsfaktoren benötigt wird, ist ebenfalls in einem eigenen Abschnitt beschrieben.Before the explicit calculation formulas for the individual transmission factors are given, the two detectors, which are supposed to detect room changes or intercom, are presented in the following two sections. The combined evaluation, which is required to determine the power transmission factors, is also described in a separate section.
Um Raumänderungen zu erkennen, wird im ersten Teilband - Frequenzbereich 250 Hz - 750 Hz - dem eigentlichen adaptiven Filter ein zweites Filter parallel geschaltet (Fig. 6) . Die- ses sog. Schattenfilter ist deutlich kürzer als das herkömmliche und ist so entworfen, daß es hauptsächlich den Direktschall und die ersten Reflektionen kompensieren kann. Bedingt durch die verminderte Ordnung kann das Schattenfilter deutlich schneller abgleichen, wenn auch nicht so weit, wie das längere Echokompensationsfilter.In order to recognize changes in space, a second filter is connected in parallel with the actual adaptive filter in the first subband (frequency range 250 Hz - 750 Hz) (FIG. 6). This so-called shadow filter is significantly shorter than the conventional one and is designed in such a way that it can mainly compensate for direct sound and the first reflections. Due to the reduced order, the shadow filter can adjust much faster, if not as far as the longer echo compensation filter.
Das Schattenfilter c^{kr ) wird wie auch die Teilbandechokom- pensatoren ^{ kr ) mit einem NLMS-Algorithmus rl K) χu(r)( ) The shadow filter c ^ {k r ) is, like the subband echo compensators ^ { k r ), with an NLMS algorithm rl K ) χ u (r) ( )
££<*, +!) - ^) + * )^ ^ (2.4 ) XSF r ) XSF V r )££ <*, +!) - ^) + *) ^ ^ ( 2.4 ) X SF r) X SF V r)
adaptiert. Durch Unterstrich sind hierbei Vektoren gekennzeichnet. Die Notation H steht für hermitisch - durch den hochgestellten Stern * ist komplexe Konjugation beschrieben. Der Vektor x^{kr geht durch entsprechende Längenkürzung aus dem Anregungsvektor des ersten Teilbandes x\r} (kr ) hervor. Anders als bei den Echokompensatoren erfolgt die Schrittweitensteuerung des Schattenfilters ausschließlich normgesteuert: 15 α sf falls x^H(kr)x^(kr)>N^ α :2.5; sonstadapted. Vectors are identified by an underscore. The notation H stands for Hermitian - the superscript asterisk * describes complex conjugation. The vector x ^ {k r results from the excitation vector of the first subband x \ r} (k r ) by a corresponding shortening of the length. In contrast to the echo canceller, the step size control of the shadow filter is only standard-controlled: 15 α sf if x ^ H (k r ) x ^ (k r )> N ^ α: 2.5; otherwise
Der Parameter α^ist einstellbar und sollte etwa 1 betragen.The parameter α ^ is adjustable and should be about 1.
Die Größe Nsf ist ebenfalls einstellbar und sollte an die Länge des Schattenfilters angepaßt werden.The size N sf is also adjustable and should be adjusted to the length of the shadow filter.
Um Raumänderungen zu detektieren, werden die Fehlerleistungen des Echokompensationsfilters und des Schattenfilters verglichen. Hierzu werden - wie bereits vorher eingeführt - nicht- lineare, rekursive Betragsglättungen erster Ordnung berechnet:In order to detect spatial changes, the error performances of the echo compensation filter and the shadow filter are compared. For this purpose, as already introduced previously, non-linear, recursive first-order amount smoothing is calculated:
\ev ( K )| = ßv {\Rt{e\r kr )}| + \im{er kr )}| )\ e v ( K) | = ß v {\ Rt {e \ r k r )} | + \ im {e r k r )} | )
(2.6!(2.6!
+(l-ßv) >(kr-i)\+ (l-ß v )> (k r -i) \
\< (K)\ =ßv (\Re{e£(kr)}\ + \lm{e£(kr)})\ <(K) \ = ß v (\ Re {e £ (k r )} \ + \ lm {e £ (k r )})
(2.7)(2.7)
+o-A) i(^-i)+ o-A) i (^ - i)
Der Quotient dieser beiden SchätzerThe quotient of these two estimators
N) N )
'v.SF (*,)'v.SF (*,)
;2.8); 2.8)
<(K)\ bestimmt den Detektorausgang, welcher wie folgt generiert wird:<(K) \ determines the detector output, which is generated as follows:
Bedingung DetektionsergebnisCondition detection result
R(r)(^)>Rσ keine Raumänderungen detek- tiert,R (r) (^)> R σ no changes in space were detected,
Rϋ >R(r kr)>R] schwache Raumänderungen detek- tiert,R ϋ > R (r k r )> R ] detected weak spatial changes,
R]≥R (kr) starke Raumänderungen detek- tiert .R ] ≥ R (k r ) large spatial changes detected animals.
Hierbei gilt R0 > Ri. Die Quotientenberechnung wird wieder durch Verwendung der Logarithmierung bzw. Linearisierung durchgeführt. Die Weiterverwendung der Detektionsergebnisse ist weiter unten beschrieben. 16 Um Gegensprechen zu erkennen, wird die Berechnung einer nor¬ mierten Korrelationsschätzung zwischen dem gemessenen y r)(kr ) und dem geschätzten Mikrophonsignal y\r)(kr ) vorgeschlagen. Zur Vereinfachung der Berechnung wird hierbei allerdings nicht das gesamte Signal, sondern nur der jeweilige Realteil verwendet. Der Korrelationskoeffizient „r)(^r) wird wie folgt berechnet:R 0 > Ri applies here. The quotient calculation is again carried out using logarithmization or linearization. The further use of the detection results is described below. 16 To intercom to realize the calculation of a NOR ¬-programmed correlation estimate between the measured y r) (k r) and the estimated microphone signal y \ r) (k r) is suggested. To simplify the calculation, however, not the entire signal is used, but only the respective real part. The correlation coefficient " r) (^ r ) is calculated as follows:
,.,„ . l∑ ^>(t,-,))Ret '(*,-l)>l ∑." «' lRe«"Λ-'.}Re {?!"(*, -D>|, . , ". l∑ ^> (t, -,)) Ret '(*, - l)> l ∑. " « 'L Re «" Λ -'.} Re {?! "(*, -D> |
Bedingt durch die Betragsbildungen kann der Korrelationskoeffizient einen Wertebereich von p( 0 r) (kr ) e[0...l] annehmen. KleineDue to the amount formation, the correlation coefficient can assume a value range of p ( 0 r) (k r ) e [0 ... l]. Little one
Werte bedeuten dabei nur geringe Korrelation zwischen den Signalen, d.h. Gegensprechen; Werte nahe bei 1 weisen dagegen auf eine hohe Korrelation, d.h. auf Einzelsprechen hin.Values mean only a slight correlation between the signals, i.e. Intercom; Values close to 1, on the other hand, indicate a high correlation, i.e. for individual speaking.
Die Korrelationsanalyse geht von bereits abgeglichenen Kompensatoren aus - die Signale y\r)(kr ) und y\r {kr ) haben dann keine LaufZeitdifferenz . Bei schlecht abgeglichenen Kompensatoren gilt dies nicht. Um dennoch auch hier eine Analyse zu ermöglichen, wird die Auswertung auch für einen zeitlichen Versatz in beide Richtungen durchgeführt. Die Korrelationskoeffizienten p r)(kr ) werden für verschiedene Werte von n berechnet :The correlation analysis starts from compensated compensators - the signals y \ r) (k r ) and y \ r {k r ) then have no running time difference. This does not apply to poorly balanced compensators. In order to enable an analysis here, too, the evaluation is also carried out for a time offset in both directions. The correlation coefficients p r) (k r ) are calculated for different values of n:
(r)/I I∑ RetV.(r)(*r -'+»)} Re {y\' "')} | P kr ) = '-_". (2.10) (r) / I I∑ RetV. (r) (* r - '+ »)} Re {y \'"')} | P k r ) =' -_ ". (2.10)
ι=n iRe 'C*, -i +«)} Re {y\r kr -i)}\ für n > 0ι = n iRe 'C *, -i + «)} Re {y \ r k r -i)} \ for n> 0
I VW"1+" R r)(kr - i + ή)} Re {y r)(k - 1)} IIV W "1+ " R r) (k r - i + ή)} Re {y r) (k - 1)} I
j=o |Re{y,w(*r -i + »)} Re {W(*r - 1)}| für n < 0. Die Werte für /? werden vorzugsweise einem Intervall ganzer Zahlen entnommen, das den Wert 0 enthält. Vorzugsweise wird Pn (r kr ) für fünf Werte von n berechnet. 17 Zur Reduktion des Aufwands können die Summen des Zählers bzw. des Nenners rekursiv berechnet werden. Entscheidend für den Detektorausgang ist das Maximum über die berechneten Korrelationskoeffizienten tii (kr ) = Maxn { pn {r K ) }. (2.12)j = o | Re {y, w (* r -i + »)} Re { W (* r - 1)} | for n <0. The values for /? are preferably taken from an integer interval that contains the value 0. P n (r k r ) is preferably calculated for five values of n. 17 To reduce the effort, the sums of the numerator or denominator can be calculated recursively. The decisive factor for the detector output is the maximum over the calculated correlation coefficients tii (k r ) = Max n {p n {r K)}. (2.12)
Damit kann das Detektionskriterium wie folgt angegeben werden:The detection criterion can thus be specified as follows:
Bedingung Detektionsergebnis mi (kr )> Pg Einzelsprechen (fern) detek- tiert, PnL (kr ) < Pg Gegensprechen detektiert.Condition detection result mi (k r )> P g single speech (distant) detected, PnL (kr) <P g intercom detected.
Mit den oben beschriebenen Detektoren kann die zunächst nur „grobe" Beschreibung (Fig. 5) der Schätzung der Leistungsübertragungsfaktoren konkretisiert werden. Die Anregungsde- tektion des fernen Sprechers wird durch die BedingungWith the detectors described above, the initially only “rough” description (FIG. 5) of the estimate of the power transmission factors can be concretized. The condition detects the excitation detection of the distant speaker
~WÖΛ > X*.M (2 - 13> abgefragt. Überschreitet die Betragsglättung einen Grenzwert, so werden weitere Kriterien abgefragt. Im anderen Fall wird auf ungenügende Anregung detektiert, was zu einem Anhalten der Adaption r)(r) = 0 (2.14) und einem Beibehalten des vorherigen Übertragungsfaktor- Schätzwertes ~ WÖΛ > X * .M (2 - 13 > is queried. If the amount smoothing exceeds a limit value, further criteria are queried. In the other case, an insufficient excitation is detected, which leads to the adaptation r) ( r ) = 0 (2.14 ) and maintaining the previous transfer factor estimate
P^Eκ (kr ) = P^EK(kr - l) (2.15)P ^ Eκ (k r ) = P ^ EK (k r - l) (2.15)
führt. Die Schwellwerte sollten an die statistischen Eigenschaften des Eingangssignals, im besonderen an das Leistungs- dichtspektrum angepaßt werden. Sollte ausreichende Anregung detektiert worden sein, so wird in einer zweiten Detektions- stufe die Raumänderungserkennung des Schattenfilters ausgewertet. Sollte das Schattenfilter auf „starke" Raumänderungenleads. The threshold values should be adapted to the statistical properties of the input signal, in particular to the power density spectrum. If sufficient excitation has been detected, the spatial change detection of the shadow filter is evaluated in a second detection stage. Should the shadow filter change to "strong" room changes
R, > R(r kr ) (2.16) 18 detektieren, so wird eine nichtlineare, rekursive Glättung erster Ordnung der Leistungsübertragungsfaktoren durchgeführt. Diese Glättung verwendet im Vergleich zu den weiter unten durchgeführten Schätzungen die kürzesten Zeitkonstanten. Die Schätzwerte werden also den Momentanwerten sehr schnell nachgeführt. Die Bestimmungsgleichung der Übertragungsfaktoren lautet im Fall von detektierten starken Raumänderungen:R,> R (r k r ) (2.16) 18 detect, a non-linear, recursive first-order smoothing of the power transmission factors is carried out. This smoothing uses the shortest time constants compared to the estimates below. The estimated values are therefore tracked very quickly to the instantaneous values. The determination equation of the transfer factors is in the case of detected strong changes in space:
\4 kZ ß K) (2.17) μj,r)(*,)i + (\-ßL{K))p" {kr-\). Die Zeitkonstante wird dabei wie folgt gesetzt\ 4 k Z ß K) (2.17) μj, r) ( *, ) i + (\ -ß L {K)) p "{k r - \). The time constant is set as follows
KHr)KH r )
PRO* falls ßL(K) = (*,)| >PZΛK- .2.11 ßR0F sonst mit <ßROιFRO <\.PRO * for all ß L (K) = ( *,) | > PZΛK- .2.11 ß R0F otherwise with <ß ROιFRO <\.
Im Fall einer Detektion „schwacher" RaumänderungenIn the case of detection of "weak" changes in space
R, < '> ,)<% (2.19)R, <'> ,) <% (2.19)
wird ebenfalls eine rekursive Glättung gemäß Gleichung 2.17 durchgeführt, allerdings mit den Zeitkonstantena recursive smoothing is also carried out according to equation 2.17, but with the time constants
'(*,)! ßm,R ls ß K) = .o (*,)| >%W(*r-l)- (2.20; ß 'RRΛ\,F π sonst mitO<ßR FRhR<\.' ( *, ) ! ßm, R ls ß K) = .o (*,) | >% W (* rl) - (2.20; ß ' R R Λ \, F π otherwise with O <ß RFRhR <\.
Im Vergleich zur Detektion starker Raumänderungen erfolgt die Neuschätzung der Leistungsübertragungsfaktoren langsamer, d.h. es gilt: ÄI.F > ΛO.F'Compared to the detection of large changes in space, the re-estimation of the power transmission factors takes place more slowly, ie the following applies: ÄI.F > ΛO.F '
(2.21)(2.21)
PR\,F > R0.R-PR \, F > R0.R-
(2.22) 19 Wurden durch das Schattenfilter keine Raumänderungen detektiert(2.22) 19 No room changes were detected by the shadow filter
Ro<R(r)(krX (2.23)R o <R (r) (k r X (2.23)
so werden weitere Kriterien zur Unterscheidung von Einzel- und Gegensprechen ausgewertet. Die erste Stufe bildet hier die bereits erwähnte Korrelationsanalyse. Wird die BedingungIn this way, further criteria for distinguishing between single and two-way communication are evaluated. The first stage here is the correlation analysis already mentioned. Will the condition
P(l(K)<Pg (2.24)P ( l (K) <P g (2.24)
erfüllt, so wird auf Gegensprechen detektiert und die Übertragungsfaktorschätzung wird angehalten, d.h.is met, two-way communication is detected and the transmission factor estimate is stopped, i.e.
P (kr) =p ~ (kr-\). (2.25)P (k r ) = p ~ (k r - \). (2.25)
Im Falle einer Einzelsprechdetektion durch die Korrelationsanalyse pL( )≥Pg- (2.26)In the case of single speech detection by the correlation analysis pL () ≥P g - (2.26)
wird noch ein weiterer Vergleich angestellt, um Gegensprech- situationen weitmöglichst auszuschließen. Sollte die gemessene Gesamtbandfehlerleistung unter der geschätzten liegen, wird endgültig auf Einzelsprechen erkannt. Die Bedingung hierfür lautet:a further comparison is made in order to exclude intercom situations as far as possible. If the measured total band error power is below the estimated one, single speech is finally recognized. The condition for this is:
|*(*)| PEK )KGS< \e(k)\ . (2.27)| * (*) | P EK ) K GS <\ e (k) \. (2.27)
Die zweite Stufe der Gegensprecherkennung wird mit Gesamtbandsignalen ausgewertet. Die Größen \x(k)\ bzw. \e(k)\ werden gemäßThe second level of intercom detection is evaluated with overall band signals. The sizes \ x (k) \ and \ e (k) \ are according to
|*(*)| =ßoB,(k) \x(k~NAS)\ + (l-ßGB k)) \x(k - 1)1| * (*) | = ßo B , (k) \ x (k ~ N AS ) \ + (l-ß GB k)) \ x (k - 1) 1
H*)| = ßos,e(*) I e(k) | + (1 - ßaB,e(*)) \e(k - 1)|H *) | = ß os, e (*) I e (k) | + (1 - ß aB, e (*)) \ e (k - 1) |
mit 20With 20th
PGB,R, Hs \ x (k - NAS) \ > \x(k - l) ß<»*(*) = ßσs.F. sonst ßGB Ä falls \ e (k) \ > \e(k - l) csΛk) ( 2 . 21 ßcB.F, Sθmt P GB, R, Hs \ x (k - N AS ) \> \ x (k - l) ß <» * (*) = ßσs.F. otherwise ß GB Ä if \ e (k) \> \ e (k - l) cs Λk) (2. 21 ßcB.F, Sθmt
bestimmt. Auch bei diesen rekursiven Schätzern sind die Zeit- konstanten ßGB und ßGB F so gewählt, daß einem Anstieg dercertainly. With these recursive estimators, the time constants ß GB and ß GB F are chosen so that an increase in the
Signalleistung schnell gefolgt wird, einem Leistungsabfall dagegen langsamer - d.h. ßGB F > ßGB R • Da zwischen Mikrophon- und Fehlersignal eine Laufzeit durch die Filterbank eingefügt ist, wird das Anregungssignal des fernen Teilneh- mers entsprechend verzögert, die Größe NAS beschreibt daher die Länge des Analyse- bzw. Synthesefilters.Signal power is followed quickly, but a power drop is slower - ie ß GB F > ß GB R • Since a delay time is inserted between the microphone and the error signal through the filter bank, the excitation signal of the remote subscriber is delayed accordingly, the size N AS therefore describes the length of the analysis or synthesis filter.
Die Berechnung des Gesamtbandleistungsübertragungsfaktors pEK(k) erfolgt analog zu den Teilbandübertragungsfaktoren mit mehreren Detektoren. Zunächst wird die Anregungsleistung des fernen Teilnehmers überprüft - wird hier eine Schwelle nicht überschritten, wird die alte Schätzung beibehalten. Sollte ausreichende Anregung detektiert worden sein, wird die Fehlerleistung des Schattenfilters ausgewertet und bei Raumände- rungsdetektion die pEK(k) -Schätzung mit entsprechend kurzenThe calculation of the total band power transmission factor p EK (k) is carried out analogously to the subband transmission factors with several detectors. First, the excitation power of the distant participant is checked - if a threshold is not exceeded here, the old estimate is retained. If sufficient excitation has been detected, the error performance of the shadow filter is evaluated and the p EK (k) estimate with a correspondingly short one when the room changes are detected
Zeitkonstanten durchgeführt. Erkennt der Schattenfilterdetektor keine Raumänderungen, wird die Korrelationsanalyse des ersten Teilbandes als letzte Steuerungsstufe ausgewertet. Sollte hierbei Einzelsprechen detektiert werden (Bedingung 2.26), wird eine rekursiv geglättete Schätzung durchgeführt, ansonsten wird der alte Übertragungsfaktor beibehalten.Time constants performed. If the shadow filter detector does not detect any changes in space, the correlation analysis of the first subband is evaluated as the last control level. If single speech is detected here (condition 2.26), a recursively smoothed estimate is carried out, otherwise the old transmission factor is retained.
Durch die Konstante Kcs kann auf die Varianz der in die Bedingung 2.27 eingehenden Größen reagiert werden - sie sollte so gewählt werden, daß nicht schon bei geringen Schwankungen der Signalleistungen auf Gegensprechen erkannt wird. Die Detektion sollte erst dann auf Gegensprechen erkennen, wenn die gemessene Fehlerleistung die geschätzte Leistung um einen bestimmten Wert überschreitet. In solchen Fällen wird die 21 Schätzung der Leistungsübertragungsfaktoren (Gleichung 2.17; sehr träge durchgeführt, d.h.The constant K cs can be used to react to the variance of the variables entering condition 2.27 - it should be chosen so that two-way talk is not recognized even with slight fluctuations in the signal powers. The detection should only recognize two-way communication when the measured error power exceeds the estimated power by a certain value. In such cases, the 21 Estimation of the power transfer factors (Equation 2.17; carried out very slowly, ie
}(*,)| - } ( *,) | -
'R3.R falls'R3.R falls
}(*,)| >PVEΛK 1) ß K) :2.29) ß R3.F sonst } ( *, ) | > PVEΛK 1) ß K): 2.29) ß R3.F otherwise
mitO<ßR3FR3Ji <1.with O <ß R3FR3Ji <1.
Im anderen Detektionsf all - Erkennung auf Einzelsprechen werden die Zeitkonstanten gemäßIn the other detection case - detection on single speech, the time constants are according to
ι« (*r)i ßR2.R fallS l*i"(*,)l >P K -i) ßL(K) = \ [2.30; ß. R2F sonstι «( * r ) i ß R 2.R f allS l * i" ( *,) l> PK -i) ß L (K) = \ [2.30; ß. R2F otherwise
itO<ßR2FR2R <1itO <ß R2FR2R <1
gesetzt. Damit sind alle möglichen Pfade der Fig. 5 mit expliziten Angaben der Detektionsbedingungen versehen. Für die einzelnen Zeitkonstanten gilt dabei:set. All possible paths of FIG. 5 are thus provided with explicit information about the detection conditions. The following applies to the individual time constants:
0 < ßR0.R < ßR,R < ßR2.R < ßR R < 1>0 <ß R0 .R <ß R , R <ß R 2.R <ß R R <1>
;2.3i: 0 < ßR0.F < ßRX,F < ßR2.F < ßR3.F < l ; 2.3i: 0R 0.F <ß R X, F <ß R 2.F <ß R3 .F < l
(2.32) Die Qualität der Schätzung der Teilband- und des Gesamt- bandübertragungsfaktors bestimmt nachdrücklich die Qualität der gesamten Freisprecheinrichtung. Die Teilbandschätzwerte sind für eine stabile und vor allem schnelle Adaption von großer Bedeutung. Nur wenn die Echokompensatoren hohe Echodämpfungen erzielen, kann die Freisprecheinrichtung aus dem Halb-Duplex-Betrieb "herausgeführt" und nahezu ohne merkliche Dämpfung durch eine Pegelwaage arbeiten. Für den Fall starker Raumänderungen, welcher beim Betrieb in Kraftfahrzuegen häufiger auftritt, ist eine hohe Güte der Dämpfungsschätzung im 22(2.32) The quality of the estimation of the subband and the total band transmission factor strongly determines the quality of the entire hands-free system. The subband estimates are of great importance for a stable and, above all, fast adaptation. Only when the echo cancellers achieve high echo attenuation can the hands-free device be "led out" of half-duplex operation and work with almost no noticeable attenuation by means of a level balance. In the case of large changes in space, which occurs more frequently when operating in motor vehicles, a high quality of the damping estimate is in the 22
Gesamtband ( pEK(k) ) notwendig. Mit dem hier beschriebenen Verfahren können die gesetzten Anforderungen mit niedrigem Rechenaufwand zufriedenstellend erfüllt werden. Total band (p EK (k)) necessary. With the method described here, the requirements set can be satisfactorily met with little computing effort.

Claims

23 Patentansprüche 23 claims
1. Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen mit einer Pegelwaage (22) und meh- reren adaptiven Echokompensationsfiltern (34), von denen jedes ein Teilband verarbeitet, dadurch gekennzeichnet, daß in mindestens einem Teilband ein weiteres adaptives Filter (Schattenfilter (36) ) anderer Ordnung dem adaptiven Echokom- pensationsfilter (34) parallel geschaltet ist, und Raumänderungen anhand einer Korrelationsanalyse und einer Leistungsauswertung des Schattenfilterausgangs erkannt werden.1. A method for improving the acoustic attenuation in hands-free devices with a level balance (22) and several adaptive echo compensation filters (34), each of which processes a subband, characterized in that in at least one subband a further adaptive filter (shadow filter (36) ) of a different order is connected in parallel to the adaptive echo compensation filter (34), and changes in space are recognized on the basis of a correlation analysis and a performance evaluation of the shadow filter output.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß mehrere unterschiedliche Abtastraten verwendet werden.2. The method according to claim 1, characterized in that several different sampling rates are used.
3. Verfahren nach Anspruch 1 oder Anspruch 2, dadurch gekennzeichnet, daß das weitere Filter (36) eine wesentlich geringere Ordnung aus das eigentliche Echokompensationsfilter aufweist.3. The method according to claim 1 or claim 2, characterized in that the further filter (36) has a substantially lower order from the actual echo cancellation filter.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß die Echokompensationsfilter (34) mittels einer Filterbank (28) in Frequenzteilbändern implementiert werden.4. The method according to any one of claims 1 to 3, characterized in that the echo compensation filter (34) by means of a filter bank (28) are implemented in frequency subbands.
5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß zur Steuerung der Adaption und der Schrittweite sowohl Leistungsauswertungen von konkurrierenden adaptiven Filtern (34,36) unterschiedlicher Ordnungen als auch korrelationsba- sierende Analysen verwendet werden.5. The method according to any one of claims 1 to 4, characterized in that both performance evaluations of competing adaptive filters (34, 36) of different orders and correlation-based analyzes are used to control the adaptation and the step size.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß 24 zur Schrittweitenbestimmung Leistungsübertragungsfaktoren in Teilbändern geschätzt werden.6. The method according to any one of claims 1 to 5, characterized in that 24 for determining the step size, power transmission factors in sub-bands are estimated.
7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß die Echokompensationsfilter (34) Schätzwerte für die durch sie eingebrachte Echodämpfung liefern.7. The method according to any one of claims 1 to 6, characterized in that the echo compensation filter (34) provide estimates for the echo attenuation introduced by them.
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß die Schätzwerte für die Dämpfung zur Steuerung der Dämpfung der Pegelwaage (22) verwendet werden.8. The method according to claim 7, characterized in that the estimated values for the damping are used to control the damping of the level balance (22).
9. Verfahren nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, daß die gleichzeitige Aktivität beider Gesprächsteilnehmer (Gegensprechen) detektiert wird.9. The method according to any one of claims 1 to 8, characterized in that the simultaneous activity of both conversation participants (intercom) is detected.
10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, daß die Gesamtdämpfung der Pegelwaage (22) im Gegensprechfall reduziert wird. 10. The method according to claim 9, characterized in that the total attenuation of the level balance (22) is reduced in the opposite case.
EP99904718A 1998-02-13 1999-01-18 Method for improving acoustic noise attenuation in hand-free devices Withdrawn EP1055317A1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE19805942A DE19805942C1 (en) 1998-02-13 1998-02-13 Method for improving the acoustic return loss in hands-free equipment
DE19805942 1998-02-13
PCT/DE1999/000094 WO1999041898A1 (en) 1998-02-13 1999-01-18 Method for improving acoustic noise attenuation in hand-free devices

Publications (1)

Publication Number Publication Date
EP1055317A1 true EP1055317A1 (en) 2000-11-29

Family

ID=7857634

Family Applications (1)

Application Number Title Priority Date Filing Date
EP99904718A Withdrawn EP1055317A1 (en) 1998-02-13 1999-01-18 Method for improving acoustic noise attenuation in hand-free devices

Country Status (5)

Country Link
US (1) US6618481B1 (en)
EP (1) EP1055317A1 (en)
JP (1) JP2002503924A (en)
DE (1) DE19805942C1 (en)
WO (1) WO1999041898A1 (en)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10242700B4 (en) * 2002-09-13 2006-08-03 Siemens Audiologische Technik Gmbh Feedback compensator in an acoustic amplification system, hearing aid, method for feedback compensation and application of the method in a hearing aid
DE10245667B4 (en) 2002-09-30 2004-12-30 Siemens Audiologische Technik Gmbh Feedback compensator in an acoustic amplification system, hearing aid, method for feedback compensation and application of the method in a hearing aid
US6952473B1 (en) * 2002-11-25 2005-10-04 Cisco Technology, Inc. System and method for echo assessment in a communication network
DE10317600B4 (en) * 2003-04-16 2007-10-25 Infineon Technologies Ag Integrated transceiver circuit and compensation method in integrated transceiver circuit
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
US9202456B2 (en) * 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
JP5161838B2 (en) * 2009-05-18 2013-03-13 株式会社日立製作所 Echo canceller and acoustic echo canceling method
US8441515B2 (en) * 2009-09-17 2013-05-14 Sony Corporation Method and apparatus for minimizing acoustic echo in video conferencing
US8983058B2 (en) 2010-04-22 2015-03-17 Telefonaktiebolaget L M Ericsson (Publ) Echo canceller and a method thereof
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
CN103348686B (en) 2011-02-10 2016-04-13 杜比实验室特许公司 For the system and method that wind detects and suppresses
US8600040B2 (en) * 2011-03-14 2013-12-03 Continental Automotive Systems, Inc Apparatus and method for convergence control
US9357080B2 (en) * 2013-06-04 2016-05-31 Broadcom Corporation Spatial quiescence protection for multi-channel acoustic echo cancellation
EP3358857B1 (en) 2016-11-04 2020-04-15 Dolby Laboratories Licensing Corporation Intrinsically safe audio system management for conference rooms

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3728109C1 (en) * 1987-08-22 1989-03-16 Telefonbau & Normalzeit Gmbh Method for voice-controlled attenuation control in telephone transmission circuits
FR2628918B1 (en) * 1988-03-15 1990-08-10 France Etat ECHO CANCELER WITH FREQUENCY SUBBAND FILTERING
DE4227327A1 (en) * 1992-08-18 1994-02-24 Philips Patentverwaltung Subband echo canceller with subband coding device
US5818945A (en) * 1995-04-20 1998-10-06 Nippon Telegraph And Telephone Subband echo cancellation method using projection algorithm
DE69634027T2 (en) * 1995-08-14 2005-12-22 Nippon Telegraph And Telephone Corp. Acoustic subband echo canceller
JP3199155B2 (en) * 1995-10-18 2001-08-13 日本電信電話株式会社 Echo canceller
US6035034A (en) * 1996-12-20 2000-03-07 Telefonaktiebolaget L M Ericsson (Publ) Double talk and echo path change detection in a telephony system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO9941898A1 *

Also Published As

Publication number Publication date
JP2002503924A (en) 2002-02-05
DE19805942C1 (en) 1999-08-12
US6618481B1 (en) 2003-09-09
WO1999041898A1 (en) 1999-08-19

Similar Documents

Publication Publication Date Title
DE69331223T2 (en) NETZWERKECHOKOMPENSATOR
DE69933221T2 (en) ADAPTIVE FILTER AND ACOUSTIC ECHO COMPENSATOR WITH THE SAME
DE69211211T2 (en) Echo canceller
DE69632851T2 (en) Acoustic subband echo canceller
DE69332309T2 (en) FAILURE-PROOF OPERATING PROCEDURE IN A SPEAKER SYSTEM
DE69635500T2 (en) Method and device for detecting a nearby speech signal
EP0742664B1 (en) Method for hand-free talking for a multi-channel transmission system
DE69627359T2 (en) IMPROVED ECHOCOMPENSOR FOR USE IN DIGITAL TELEPHONY
DE19935808A1 (en) Echo suppression device for suppressing echoes in a transmitter / receiver unit
EP1055317A1 (en) Method for improving acoustic noise attenuation in hand-free devices
EP0614304A1 (en) Process for improvement of acoustic feedback suppression in electro-acoustic devices
EP1103956B1 (en) Exponential reduction of echo and noise during speech pauses
DE112012005782T5 (en) Reverberation suppression device
DE19806015C2 (en) Process for improving acoustic attenuation in hands-free systems
EP1155561B1 (en) Method and device for suppressing noise in telephone devices
EP1189419B1 (en) Method and device for eliminating the loudspeaker interference on microphone signals
EP0797339B1 (en) Method and circuit for improving the transmission properties of a transmission link subjected to echo in a telecommunication network
EP0874513A2 (en) Device for feedback suppression
EP1126687A2 (en) Method for coordinated echo and/or noise reduction
DE102018117557A1 (en) ADAPTIVE AFTER-FILTERING
DE19848641B4 (en) Double-talk-insensitive NLMS algorithm
DE102018117556B4 (en) SINGLE CHANNEL NOISE REDUCTION
DE19639580C2 (en) Device for reducing acoustic echoes
DE10016619A1 (en) Interference component lowering method involves using adaptive filter controlled by interference estimated value having estimated component dependent on reverberation of acoustic voice components
EP1282297B1 (en) Method and apparatus for echo and noise suppression

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20000801

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): DE FR GB IT

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: INFINEON TECHNOLOGIES AG

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20030801