EP1055317A1 - Verfahren zur verbesserung der akustischen rückhördämpfung in freisprecheinrichtungen - Google Patents

Verfahren zur verbesserung der akustischen rückhördämpfung in freisprecheinrichtungen

Info

Publication number
EP1055317A1
EP1055317A1 EP99904718A EP99904718A EP1055317A1 EP 1055317 A1 EP1055317 A1 EP 1055317A1 EP 99904718 A EP99904718 A EP 99904718A EP 99904718 A EP99904718 A EP 99904718A EP 1055317 A1 EP1055317 A1 EP 1055317A1
Authority
EP
European Patent Office
Prior art keywords
filter
echo
adaptive
attenuation
level balance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP99904718A
Other languages
English (en)
French (fr)
Inventor
Gerhard Schmidt
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Infineon Technologies AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of EP1055317A1 publication Critical patent/EP1055317A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic

Definitions

  • the present invention relates to a method for improving the acoustic attenuation in hands-free systems with a level balance and a plurality of adaptive echo compensation filters, each of which processes a subband.
  • a further adaptive filter (shadow filter) of a lower order is connected in parallel to the adaptive echo cancellation filter in at least one subband. Room changes can then be detected by combining a performance evaluation of the two residual echo powers and a correlation analysis of the estimated and the measured microphone signal.
  • the further adaptive filter has a significantly lower order.
  • the echo cancellation is preferably implemented in frequency subbands by means of a filter bank.
  • Both performance evaluations of competing are preferably used for the adaptation or the step size control 3 adaptive filters, as well as correlation-based analyzes used.
  • the echo compensation filters provide estimates for the echo attenuation introduced by them, since these estimates can preferably be used to control the attenuation of the level balance. As a result, the attenuation to be introduced by the level balance can be further reduced and the conversation quality in the case of two-way communication can be further improved.
  • Figure 1 is a simplified model of a hands-free device connected to a digital connection.
  • FIG. 2 shows a simplified block diagram of a hands-free device
  • FIG. 4 shows an overview of the method according to the invention with shadow filter and correlation analysis
  • FIG. 5 shows the control of the power transmission factors in a clear representation
  • FIG. 1 shows a simplified model of a hands-free device 10 connected to a digital connection 12.
  • the A-law coding or decoding used in the European ISDN network is shown in the two left blocks 14, 16.
  • the speaker-room microphone system 18 (LRM system) with the local call participant 20, the user of the hands-free device, is sketched on the right-hand side.
  • the acoustic coupling between loudspeaker and microphone leads to crosstalk via the LRM system.
  • This crosstalk is perceived by the distant subscriber as a disturbing echo.
  • Acoustic waves emerge from the loudspeaker and spread out in the room. Reflection on the walls and other objects in the room creates several paths of propagation, which result in different durations of the loudspeaker signal.
  • the echo signal at the microphone thus consists of the superimposition of a large number of echo components and possibly the useful signal n (t): the local speaker.
  • the connection between the participants can also generate echoes at transitions between different transmission systems.
  • the network operators try to take special measures against such echo sources directly at the critical points, so that these echoes can be disregarded here.
  • Fork echoes which arise in telephones with an analog interface due to mismatching of the line simulation to the line impedance, can also be disregarded when using digital connections.
  • FIG. 2 An overview of a hands-free device is shown in FIG. 2.
  • the central element is a level balance 22, which is shown in the left part of FIG. 2.
  • the level balance 22 guarantees the minimum attenuation prescribed by the ITU or ETSI recommendations by adding attenuation to the transmission and / or reception path depending on the conversation situation.
  • the reception path is activated and the signal from the remote subscriber is output undamped on the loudspeaker.
  • the echoes that occur when the compensators are switched off or poorly balanced are greatly reduced by the damping inserted into the transmission path.
  • the local speaker is active, the situation is reversed.
  • the level balance 22 does not insert any attenuation into the transmission path and the signal of the local speaker is transmitted undamped. Controlling the level balance 22 in the case of two-way communication becomes more difficult.
  • both paths and thus also the subscriber signals) each receive half of the damping to be inserted or, if the control is not optimal, at least one of the two signal paths is damped. Intercom is therefore not possible or only possible to a limited extent.
  • adaptive echo cancellers 28 shown in the right part of FIG. 2. These try to digitally emulate the LRM system in order to then remove the echo component of the distant subscriber from the microphone signal. Depending on how well the compensators manage this, the total attenuation to be inserted by the level balance 22 can be reduced.
  • the echo composition was implemented in frequency subbands, the width of the individual bands being between 250 Hz and 500 Hz at 8 kHz sampling rate or between 500 Hz and 1000 Hz at 16 kHz sampling rate.
  • the use of a frequency 6 selective echo cancellation has several advantages. Firstly, by using undersampling and oversampling, the system can be operated as a multirate system, which reduces the signal processing effort. On the other hand, by dividing the sub-band, the "compensation power" can be distributed differently over the individual frequency ranges and thus an effective adaptation of the "compensation power" to speech signals can be achieved. Subband processing also has a decorrelating effect when the overall tape processing is compared with the individual subband systems. For speech signals, this means an increase in the convergence speed of the adaptive filters. In addition to these advantages, the disadvantage of subband processing must not be ignored. Breaking down a signal into individual frequency ranges always results in a runtime. However, since the method is used for video conferences or in GSM mobile phones, such runtimes are permissible
  • the runtime is mainly determined by the image processing component. Since attempts are generally made to output the image and sound of the distant subscriber lip-synchronized to the local subscriber, the running time of the acoustic echoes can increase to several hundred milliseconds. 3 shows the results of a study in which an attempt was made to find out which echo attenuation is necessary depending on the duration of this echo, so that 90, 70 and 50 percent of the respondents were satisfied with the quality of the call.
  • the echo cancellers are controlled in several stages. All power-based control units 32 work autonomously for each compensator, that is to say independently of the remaining frequency ranges. A separate adaptation and control unit 32 is therefore sketched in FIG. 2 for each compensator.
  • the control stage which is based on correlation analyzes of the estimated and the measured microphone signal, is used for intercom detection and is therefore evaluated equally in all frequency ranges. A further level takes into account the accuracy limited by the fixed point arithmetic and controls the adaptation depending on the modulation.
  • the final intercom detection is also carried out separately with its own unit, which is based on both the level balance detectors and the echo cancellers. This unit causes the level balance to reduce the total attenuation to be inserted again (in accordance with ITU recommendation G.167).
  • a second filter 36 with a significantly reduced order - hereinafter referred to as shadow filter 36 - was connected in parallel to one of the echo cancellers 34.
  • This second filter 36 is dimensioned so that it can only compensate for the direct sound. Due to its shortened length and its adapted control, it can adapt much faster than the actual echo cancellation filter 34.
  • the control of the shadow filter 36 is based only on the excitation by the distant call participant. After room changes, the residual error power (signal e ⁇ k r ),
  • the combination of these two detection methods - the shadow filter and the correlation analysis - allow fast and stable adaptation of the echo cancellers even under the difficult conditions in motor vehicles.
  • the control of the residual damping, which is to be inserted by the level balance, can be carried out permissible with the described method. Control of attenuation reduction in intercom is included.
  • the frequency band analysis and synthesis required for subband processing is implemented as a polyphase filter bank.
  • the subband echo cancellers 28 are controlled by their step sizes a Dk r ).
  • the equation for these quantities is:
  • and ⁇ e ⁇ ( (k r ) ⁇ represent smoothed estimates for the signal power of the remote subscriber and for the error power. Both estimates are determined by first-order non-linear recursive amount smoothing.
  • ß ⁇ ) ( ⁇ ⁇ ⁇ e ⁇ (k r ) ⁇ ⁇ + ⁇ lm ⁇ e ⁇ (k r ) ⁇ ⁇ ) + (l-ß e (k r )) ⁇ e ⁇ (k r -1 )
  • with ß R if
  • Im ⁇ e ⁇ (* r ) ⁇ ⁇ > ⁇ e ⁇ k r - 1) ß ⁇ K) [2.2: ß F , otherwise 13
  • the time constants ß R and ß F are chosen so that an increase in signal power can be followed faster than a decrease in power.
  • the actual calculation of the step sizes uses a DSP-specific log
  • Subbands are estimated if the condition of the speakerphone allows.
  • the quality of these estimates also determines the quality of the entire hands-free system over the long term. Accordingly, the determination of these variables also involves a significantly higher process effort.
  • a second filter is connected in parallel with the actual adaptive filter in the first subband (frequency range 250 Hz - 750 Hz) (FIG. 6).
  • This so-called shadow filter is significantly shorter than the conventional one and is designed in such a way that it can mainly compensate for direct sound and the first reflections. Due to the reduced order, the shadow filter can adjust much faster, if not as far as the longer echo compensation filter.
  • the shadow filter c ⁇ ⁇ k r is, like the subband echo compensators ⁇ ⁇ k r ), with an NLMS algorithm rl K ) ⁇ u (r) ( )
  • the parameter ⁇ ⁇ is adjustable and should be about 1.
  • the size N sf is also adjustable and should be adjusted to the length of the shadow filter.
  • ⁇ (K) ⁇ determines the detector output, which is generated as follows:
  • the correlation coefficient can assume a value range of p ( 0 r) (k r ) e [0 ... l]. Little one
  • the correlation analysis starts from compensated compensators - the signals y ⁇ r) (k r ) and y ⁇ r ⁇ k r ) then have no running time difference. This does not apply to poorly balanced compensators. In order to enable an analysis here, too, the evaluation is also carried out for a time offset in both directions.
  • the correlation coefficients p r) (k r ) are calculated for different values of n:
  • ⁇ j o
  • the values for /? are preferably taken from an integer interval that contains the value 0.
  • P n (r k r ) is preferably calculated for five values of n. 17 To reduce the effort, the sums of the numerator or denominator can be calculated recursively.
  • the detection criterion can thus be specified as follows:
  • the threshold values should be adapted to the statistical properties of the input signal, in particular to the power density spectrum. If sufficient excitation has been detected, the spatial change detection of the shadow filter is evaluated in a second detection stage. Should the shadow filter change to "strong" room changes
  • the determination equation of the transfer factors is in the case of detected strong changes in space:
  • the first stage here is the correlation analysis already mentioned. Will the condition
  • the second level of intercom detection is evaluated with overall band signals.
  • the sizes ⁇ x (k) ⁇ and ⁇ e (k) ⁇ are according to
  • the calculation of the total band power transmission factor p EK (k) is carried out analogously to the subband transmission factors with several detectors. First, the excitation power of the distant participant is checked - if a threshold is not exceeded here, the old estimate is retained. If sufficient excitation has been detected, the error performance of the shadow filter is evaluated and the p EK (k) estimate with a correspondingly short one when the room changes are detected
  • K cs can be used to react to the variance of the variables entering condition 2.27 - it should be chosen so that two-way talk is not recognized even with slight fluctuations in the signal powers.
  • the detection should only recognize two-way communication when the measured error power exceeds the estimated power by a certain value. In such cases, the 21 Estimation of the power transfer factors (Equation 2.17; carried out very slowly, ie

Abstract

Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen, insbesondere zur Verwendung in Kraftfahrzeugen, mit einer Pegelwaage (22) und mehreren adaptiven Echokompensationsfiltern (34), von denen jedes ein Teilband verarbeitet, wobei in mindestens einem Teilband ein weiteres adaptives Filter (Schattenfilter (36)) geringerer Ordnung dem adaptiven Echokompensationsfilter (34) parallel geschaltet ist, und Raumänderungen anhand einer kombinierten Auswertung einer Korrelationsanalyse und einem Restfehlervergleich der beiden konkurrierenden, adaptiven filter (34, 36) erkannt werden.

Description

1 Beschreibung
Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen
Die vorliegende Erfindung betrifft ein Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen mit einer Pegelwaage und mehreren adaptiven Echokompensationsfiltem, von denen jedes ein Teilband verarbeitet.
Bei Freisprecheinrichtungen ist es unbedingt erforderlich, die vom Lautsprecher ausgesandten und damit vom Mikrofon wieder aufgenommenen Signale des entfernten Teilnehmers zu unterdrücken, da sonst unangenehme Echos die Verbindung stören. Bisher wurde zur Unterdrückung dieser Echos, also zur akustischen Rückhördämpfung, üblicherweise eine Pegelwaage vorgesehen, die abhängig von der Gesprächssituation den Sende- oder den Empfangspfad stark dämpft. Dadurch wird jedoch ein Gegensprechen (Voll-Duplex-Betrieb) praktisch unmöglich.
Mit der bisherigen Technik wurde bereits versucht, eine ausreichende Rückhördämpfung trotz akzeptabler Gegensprechbe- triebs-eigenschaften zur Verfügung zu stellen. Hierzu wurde zusätzlich zu der Pegelwaage eine frequenzselektive, steuer- bare Echounterdrückung vorgesehen. Diesbezüglic wird auf die noch unveröffentlichte Patentanmeldung DE 197 14 966 der Anmelderin verwiesen. Andere Verfahren sind beispielsweise im Werbeprospekt der Firma NEC "Reflexion™ Acoustic Echo Can- celler on the μPD7701x Family", 1996, oder in der Beschrei- bung des Motorola DSP5600x Digitalprozessors (M. Knox,P. Abbott, C.Cox: A Highly Integrated H.320 Audiosubsystem using the Motorola DSP5600x Digital Processor) beschrieben.
Solche Echounterdrückungsverfahren funktionieren in normalen Räumen zufriedenstellend. Bei der Verwendung von Freisprecheinrichtungen in Kraftfahrzeugen wird die Erkennung von Gegensprechen - abhängig von der Innenraumakustik - deutlich 2 schwieriger als in Büroräumen. Insbesondere ist in Kraftfahrzeugen die Unterscheidung von abrupten Änderungen der Innenraumakustik, beispielsweise durch Bewegungen der Fahrzeuginsassen, gegenüber dem Gegensprechen außerordentlich schwie- rig.
Es ist daher Aufgabe der Erfindung, ein Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen anzugeben, bei dem auch in Kraftfahrzeugen eine klare Unterscheidung zwischen Gegensprechen und abrupten Änderungen der Innenraumakustik erkannt und bei der Steuerung der Freisprecheinrichtung berücksichtigt werden kann.
Diese Aufgabe wird gelöst mit einem Verfahren mit den Merk a- len von Patentanspruch 1. Vorteilhafte Ausgestaltungen dieses Verfahrens sind in den Unteransprüchen angegeben.
Nach der Erfindung ist in mindestens einem Teilband ein weiteres adaptives Filter (Schattenfilter) geringerer Ordnung dem adaptiven Echokompensationsfilter parallel geschaltet. Raumänderungen können dann durch die Kombination einer Leistungsauswertung der beiden Restecholeistungen und einer Korrelationsanalyse des geschätzten und des gemessenen Mikrophonsignals detektiert werden.
Vorzugsweise können dabei mehrere unterschiedliche Abtastraten verwendet werden. Dadurch kann der Rechenaufwand verringert werden.
Ebenso ist es bevorzugt, daß das weitere adaptive Filter eine wesentlich geringere Ordnung aufweist.
Die Echokompensation wird vorzugsweise mittels einer Filterbank in Frequenzteilbändern implementiert.
Vorzugsweise werden für die Adaptions- bzw. die Schrittweitensteuerung sowohl Leistungsauswertungen von konkurrierenden 3 adaptiven Filtern, als auch korrelationsbasierende Analysen verwendet.
Ebenso ist es bevorzugt, zur Schrittweitenbestimmung Lei- stungsübertragungsfaktoren in Teilbändern zu schätzen.
Ebenso ist es bevorzugt, daß die Echokompensationsfilter Schätzwerte für die durch sie eingebrachte Echodämpfung liefern, da diese Schätzwerte bevorzugt zur Steuerung der Dämp- fung der Pegelwaage verwendet werden können. Dadurch kann die von der Pegelwaage einzubringende Dämpfung weiter reduziert und damit die Gesprächsqualität beim Gegensprechen weiter verbessert werden.
Zusätzlich ist es bevorzugt, die gleichzeitige Aktivität beider Gesprächsteilnehmer (Gegensprechen) zu detektieren. Es ist dann beispielsweise möglich, die Gesamtdämpfung der Pegelwaage im Gegensprechfall zu reduzieren, um die Gegen- sprechfähigkeit (Full-Duplex-Betrieb) der Freisprecheinrich- tung weiter zu verbessern.
Die vorliegende Erfindung wird im folgenden anhand des in den beigefügten Zeichnungen dargestellten Ausführungsbeispiels näher beschrieben. Es zeigt:
Fig. 1 ein vereinfachtes Modell einer Freisprecheinrichtung mit Anschluß an eine digitale Verbindung;
Fig. 2 ein vereinfachtes Blockschaltbild einer Freisprech- einrichtung;
Fig. 3 Kurven für die Dämpfungsanforderungen der Benutzer in Abhängigkeit von der Echolaufzeit;
Fig. 4 eine Übersichtsdarstellung des erfindungsgemäßen Verfahrens mit Schattenfilter und Korrelationsanalyse; 4 Fig. 5 die Steuerung der Leistungsübertragungsfaktoren in ei¬ ner übersichtlichen Darstellung;
Fig. 6 eine Ubersichtsdarstellung zum Schattenfilteransatz.
In Fig. 1 ist ein vereinfachtes Modell einer Freisprecheinrichtung 10 mit Anschluß an eine digitale Verbindung 12 dargestellt. Die im europäischen ISDN-Netz verwendete A-Law- Codierung bzw. Decodierung ist in den beiden linken Blöcken 14, 16 dargestellt. Auf der rechten Seite ist das Lautspre- cher-Raum-Mikrophonsystem 18 (LRM-System) mit dem lokalen Ge- sprächsteilnehmer 20, dem Benutzer der Freisprecheinrichtung, skizziert .
Durch die akustische Kopplung zwischen Lautsprecher und Mikrophon kommt es zum Übersprechen über das LRM-System. Dieses Übersprechen wird vom fernen Teilnehmer als störendes Echo wahrgenommen. Akustische Wellen treten dabei aus dem Lautsprecher aus und breiten sich im Raum aus. Durch Reflexion an den Wänden und anderen sich im Raum befindlichen Gegenständen entstehen mehrere Ausbreitungspfade, durch die unterschiedliche Laufzeiten des Lautsprechersignals entstehen. Das Echosignal am Mikrophon besteht somit aus der Überlagerung einer Vielzahl von Echoanteilen und ggf. dem Nutzsignal n(t) : dem lokalen Sprecher.
Auch die Verbindung zwischen den Teilnehmern kann an Übergängen zwischen verschiedenen Übertragungssystemen Echos erzeugen. Die Netzbetreiber versuchen jedoch, direkt an den kriti- sehen Stellen besondere Maßnahmen gegen derartige Echoquellen zu treffen, so daß diese Echos hier außer Acht gelassen werden können. Auch Gabelechos, die in Telefonen mit analogem Interface durch Fehlanpassung der Leitungsnachbildung an die Leitungsimpedanz entstehen, können bei der Verwendung von di- gitalen Verbindungen außer Betracht gelassen werden. 5 In Fig. 2 ist eine Übersicht einer Freisprecheinrichtung dar¬ gestellt. Zentrales Element ist eine Pegelwaage 22, welche im linken Teil der Fig. 2 dargestellt ist. Optional können zwei Verstärkungssteuerungen 24, 26 (Automatic Gain Control = AGC) in den Sende- und den Empfangspfad eingeschaltet werden. Die Pegelwaage 22 garantiert die durch die ITU- bzw. ETSI- Empfehlungen vorgeschriebenen Mindestdämpfungen, indem sie abhängig von der Gesprächssituation Dämpfungen in den Sende- und/oder den Empfangspfad einfügt. Bei Aktivität des fernen Teilnehmers wird der Empfangspfad freigeschaltet und das Signal des fernen Teilnehmers wird ungedämpft auf dem Lautsprecher ausgegeben. Die bei abgeschalteten oder schlecht abgeglichenen Kompensatoren entstehenden Echos werden durch die in den Sendepfad eingefügte Dämpfung stark verringert. Bei Aktivität des lokalen Sprechers kehrt sich die Situation um. Während der Empfangspfad stark bedämpft wird, fügt die Pegelwaage 22 in den Sendepfad keine Dämpfung ein und das Signal des lokalen Sprechers wird ungedämpft übertragen. Schwieriger wird die Steuerung der Pegelwaage 22 im Gegensprechfall . Hier erhalten beide Pfade (und damit auch die Teilnehmersignale) jeweils die Hälfte der einzufügenden Dämpfung oder bei nicht optimaler Steuerung wird zumindest einer der beiden Signalpfade gedämpft. Gegensprechen ist damit nicht oder nur eingeschränkt möglich.
Abhilfe schafft hier der Einsatz von adaptiven Echokompensa- toren 28 - dargestellt im rechten Teil der Fig. 2. Diese versuchen das LRM-System digital nachzubilden, um dann den Echoanteil des fernen Teilnehmers aus dem Mikrophonsignal zu ent- fernen. Je nachdem, wie gut die Kompensatoren dies bewerkstelligen, kann die durch die Pegelwaage 22 einzufügende Gesamtdämpfung reduziert werden.
Die Echokomponsation wurde in Frequenzteilbändern implemen- tiert, wobei die Breite der einzelnen Bänder zwischen 250 Hz und 500 Hz bei 8 kHz Abtastrate bzw. zwischen 500 Hz und 1000 Hz bei 16 kHz Abtastrate liegt. Der Einsatz einer frequenzse- 6 lektiven Echokompensation hat mehrere Vorteile. Zum einen kann durch Verwendung von Unter- und Überabtastung das System als Multiratensystem betrieben werden, wodurch sich der Signalverarbeitungsaufwand verringert. Zum anderen kann durch die Teilbandzerlegung die "Kompensationsleistung" unterschiedlich auf die einzelnen Frequenzbereiche verteilt werden und somit eine effektive Anpassung der "Kompensationsleistung" an Sprachsignale erreicht werden. Weiter hat die Teilbandverarbeitung eine dekorrelierende Wirkung, wenn die Ge- samtbandverarbeitung mit den einzelnen Teilbandsystemen verglichen wird. Für Sprachsignale bedeutet dies eine Erhöhung der Konvergenzgeschwindigkeit der adaptiven Filter. Neben diesen Vorteilen darf der Nachteil einer Teilbandverarbeitung nicht außer Acht gelassen werden. Die Zerlegung eines Signals in einzelne Frequenzbereiche bewirkt stets eine Laufzeit. Da das Verfahren jedoch für Videokonferenzen bzw. in GSM- Mobiltelefonen eingesetzt wird, sind solche Laufzeiten zulässig.
In Videokonferenzsystemen wird die Laufzeit hauptsächlich von der bildverarbeitenden Komponente bestimmt. Da im allgemeinen versucht wird, dem lokalen Teilnehmer Bild und Ton des fernen Teilnehmers lippensynchron auszugeben, kann sich die Laufzeit der akustischen Echos auf mehrere hundert Millisekunden er- höhen. In Fig. 3 sind die Ergebnisse einer Studie dargestellt, in der versucht wurde, herauszufinden, welche Echodämpfung abhängig von der Laufzeit dieses Echos notwendig ist, damit 90, 70 bzw. 50 Prozent der Befragten mit der Gesprächsqualität zufrieden waren.
Basierend auf dieser Studie sind bei der reinen Audiolaufzeit von 30 - 40 ms (bei 8 kHz Abtastrate) lediglich 35 dB Echodämpfung notwendig. Bei lippensynchroner Ausstrahlung von Bild und Ton und einer damit verbundenen Laufzeit von bei- spielsweise 300 ms erhöht sich die Anforderung auf 53 dB. Auch in GSM-Verbindungen kann die Laufzeit mehr als 100 ms betragen. Die Anforderungen, die an Echokompensationsverfah- 7 ren in Videokonferenz- und GSM-Systemen gestellt werden, sind somit höher als die Anforderungen an herkömmliche Freisprech- telefone.
Da die Echokompensatoren in ihrer Leistungsfähigkeit begrenzt sind und derart hohe Echodämpfungen mit der zur Verfügung stehenden Hardware nicht erreichen können, wurde ein sog. Postfilter 30 eingeführt. Dieses wertet die Schrittweiten der einzelnen Teilbänder zusammen mit den anderen Detektorergeb- nissen aus und filtert das Synthesefilterausgangssignal nochmals frequenzselektiv. Da der Einstellalgorithmus des Filters 30 gemäß einem Wiener-Ansatz entworfen wurde, wird diese Postfilterung im folgenden auch mit Wiener-Filterung bezeichnet.
Die Steuerung der Echokompensatoren erfolgt in mehreren Stufen. Alle leistungsbasierenden Steuereinheiten 32 arbeiten für jeden Kompensator autonom, also unabhängig von den restlichen Frequenzbereichen. In Fig. 2 ist daher für jeden Kom- pensator eine eigene Adaptions- und Steuereinheit 32 skizziert. Die auf Korrelationsanalysen des geschätzten und des gemessenen Mikrophonsignals basierende Stufe der Steuerung wird zur Gegensprechdetektion verwendet und daher in allen Frequenzbereichen gleichermaßen ausgewertet. Eine weitere Stufe trägt der durch die Festkommaarithmetik begrenzten Genauigkeit Rechnung und steuert die Adaption in Abhängigkeit der Aussteuerung.
Die endgültige Gegensprecherkennung erfolgt ebenfalls geson- dert mit einer eigenen Einheit, die sich sowohl auf die Detektoren der Pegelwaage als auch auf die der Echokompensatoren stützt. Diese Einheit veranlaßt die Pegelwaage in Gegen- sprechsituationen die einzufügende Gesamtdämpfung nochmals (gemäß der ITU-Empfehlung G.167) zu reduzieren.
Bei der Verwendung der Freisprecheinrichtung in Kraftfahrzeugen wird die Erkennung von Gegensprechen - abhängig von der 8 Innenraumakustik - deutlich schwieriger als in Büroräumen. Im besonderen kann mit bisherigen Verfahren nur eingeschränkt bei einer Erhöhung der Signalleistung im Sendepfad (Signal e(k)) zwischen Gegensprechen und abrupten Raumänderungen un- terschieden werden. Im letzteren Fall führen Bewegungen des Fahrers (Lenkbewegungen, Gestikulieren) zu Veränderungen der Übertragungsstrecke zwischen Lautsprecher und Mikrophon, wodurch die Echokompensatoren nicht mehr auf den Raum abgeglichen sind. Abhängig von der Innenraumakustik erhöht sich da- durch die Signalleistung des Rechtechos bis in Größenordnungen, welche bei Gegensprechen erreicht werden. Um zu vermeiden, daß in solchen Situationen der Gegensprechdetektor die Dämpfungsabsenkung aktiviert, wurde ein sog. Schattenfilter 36 eingesetzt.
Herbei wurde einem der Echokompensatoren 34 ein zweites Filter 36 mit deutlich reduzierter Ordnung - im folgenden Schattenfilter 36 genannt - parallel geschaltet. Dieses zweite Filter 36 ist so bemessen, daß es lediglich den Direktschall kompensieren kann. Bedingt durch seine verkürzte Länge und durch seine angepaßte Steuerung kann es wesentlich schneller adaptieren als das eigentliche Echokompensationsfilter 34. Die Steuerung des Schattenfilters 36 basiert lediglich auf der Anregung durch den fernen Gesprächsteilnehmer. Nach Raumänderungen wird die Restfehlerleistung (Signal e^ kr) ,
Fig. 4) des Schattenfilters 36 deutlich schneller reduziert als die des langen Echokompensationsfilters 34. Ein Detektor wertet die Fehlerleistungen der beiden konkurrierenden Filter aus und veranlaßt im Fall detektierter Raumänderungen eine schnelle Schätzung des Leistungsübertragungsfaktors zwischen den Signalen x (k) und e (k) . Bei starken Veränderungen des Raums wird dadurch nicht mehr fehlerhaft auf Gegensprechen erkannt und die Pegelwaage 22 unterdrückt das anstehende Restecho. Gleichzeitig wird die Schrittweite aller Echokompen- satoren 28 angepaßt, was zu einer schnellen Neuadaption führt. Eine detaillierte Beschreibung folgt. 9 Die Unterscheidung zwischen Einzel- und Gegensprechphasen wird durch starkes Hintergrundgeräusch in Kraftfahrzeugen (z. B. Motor- und Windgeräusche) erschwert und ist mit den bishe¬ rigen Detektoren nur eingeschränkt möglich. Um dieser Randbe- dingung dennoch Sorge zu tragen, wird eine erweiterte Korre¬ lationsanalyse vorgestellt. Diese Analyse verwendet - im Unterschied zu dem Stand der Technik - das geschätzte und das gemessene Mikrophonsignal eines Teilbandes. Diese Auswahl läßt erheblich höhere Hintergrundgeräuschpegel zu, ohne mess- bar schlechtere Ergebnisse zu liefern. Fehldetektionen bei schlecht abgeglichenen Kompensatoren werden durch die Schattenfilterauswertung abgefangen.
Die Kombination dieser beiden Detektionsverfahren - das Schattenfilter und die Korrelationsanalyse - lassen auch unter den erschwerten Bedingungen in Kraftfahrzeugen eine schnelle und stabile Adaption der Echokompensatoren zu. Die Steuerung der Restdämpfung, welche durch die Pegelwaage einzufügen ist, kann mit dem beschriebenen Verfahren zulässig durchgeführt werden. Hierbei ist die Steuerung der Dämpfungsreduktion bei Gegensprechen eingeschlossen.
Der Stand der Technik in bezug auf Schattenfilter ergibt sich beispielsweise aus S.D. Peters: A Self-Tuning NLMS Adaptive Filter Using Parallel Adaption, IEEE Transactions on Circuits and Systems - II, Analog and Digital Signal Processing, Vol. 44, No. 1, Jan. 1997. Hier werden zusätzlich zum eigentlichen adaptiven Gesamtbandfilter zwei Schattenfilter mit gleicher Länge parallel adaptiert. Aus den beiden Fehlersignalen wird dann die Schrittweite für das eigentliche Filter bestimmt.
Erst durch die Verwendung eines einzigen Teilbandschattenfilters - welches deutlich kürzer als das eigentliche Filter ist - können Raumänderungen mit dem in dieser Erfindung vorge- schlagenen Verfahren mit sehr geringem Aufwand detektiert werden. 10 Der Stand der Technik in bezug auf Korrelationsanalysen fin¬ det sich beispielsweise in P. Heitkämper: Ein Korrelationsmaß zur Feststellung von Sprecheraktivitäten, 8. Aachener Kolloquium Signaltheorie, RTWH Aachen, März 1994. Hier wird die Korrelation zwischen dem Mikrophon- und dem Lautsprechersi¬ gnal ausgewertet. Der Nachteil dieses Verfahrens besteht in der mit steigendem Hintergrundgeräuschpegel ebenfalls steigenden Anzahl an Fehldetektionen, so daß die Anwendung in Fahrzeugen nicht oder nur eingeschränkt möglich ist.
Die für die Teilbandverarbeitung notwendige Frequenzbandanalyse und -synthese ist als Polyphasenfilterbank implementiert.
Um ein Freisprechverfahren mit einer Pegelwaage und mehreren adaptiven Echokompensationsfiltern, von denen jeder ein Teilband verarbeitet, auch in Kraftfahrzeugen verwenden zu können, müssen Anpassungen an die veränderten Randbedingungen (im Vergleich zur Verwendung in "normalen" Büroräumen) vorge- nommen werden.
So ist bei Freisprechen in Kraftfahrzeugen mit deutlichen - die Adaption störenden - Hintergrundgeräuschen (z. B. Motor- und Fahrtwindgeräusche) zu rechnen. Weiter kann die Leistung dieser Geräusche stark schwanken - als Beispiele können der Betrieb bei schneller Fahrt auf der Autobahn und der Betrieb auf einem ruhigen Parkplatz angeführt werden. Die Nachhallzeiten von Fahrzeuginnenräumen (ca. 50 - 80 ms) sind im Vergleich zu Büroräumen deutlich geringer. Bewegungen des Fah- rers (Lenken, Gestikulieren, etc.) wirken sich damit deutlich stärker auf die Impulsantwort des Lautsprecher-Raum-Mikrophon-Systems (LRM-Systems) aus.
Um unter den beschriebenen Randbedingungen eine stabile Adap- tion der Echokompensatoren sowie eine entsprechende Steuerung der Dämpfungsanforderungen an die Pegelwaage zu gewährleisten, wird die kombinierte Anwendung einer Korrelationsanaly- 11 se und eines Schattenfilters vorgestellt. Das weiter unten vorgestellte Verfahren schätzt die in Tabelle 1 aufgeführten Größen.
Die in Tabelle 1 eingeführte Notation der Formelzeichen wird während der gesamten Beschreibung beibehalten. Die hochgestellten (r> bzw. die tiefgestellten r weisen auf die um den den Faktor r reduzierte Abtastrate hin. Geglättete Größen sind durch Überstriche gekennzeichnet. Die Auswahl einzelner Teilbänder erfolgt durch geeignete Wahl des Parameters μ .
Um eine stabile und schnelle Adaption der Echokompensatoren zu erreichen, werden die Teilbandechokompensatoren 28 durch ihre Schrittweiten a Dkr ) gesteuert. Die Bestimmungsglei- chung für diese Größen lautet:
Λr) (K ) ΪW(*r>
Die Größen |*J,r(&r )| und \e^( (kr )\ stellen dabei geglättete Schätzwerte für die Signalleistung des fernen Teilnehmers bzw. für die Fehlerleistung dar. Beide Schätzgrößen werden durch nichtlineare rekursive Betragsglättungen erster Ordnung bestimmt.
12
Bezeichnung Bedeutung
<*Ϊ ) Schrittweite des Echokompensators im Teilband μ - Der Wertebereich dieser Größe liegt zwischen Null und Eins. Bei einer Schrittweite a^(kr = 0 wird die alte
Raumschätzung beibehalten - bei einer Schrittweite a^)(kr)= 1 wird mit maximaler
Geschwindigkeit adaptiert.
PV.EΛK) Leistungsübertragungsfaktor im Teilband
p EΛk) Leistungsübertragungsfaktor im Gesamtband bzw. Dämpfungsreduktion der Pegelwaage.
K K)\ Schätzgröße für die Signalleistung des fernen Gesprächsteilnehmers (Anregungsleistung) im Teilband μ.
\x(k)\ Schätzgröße für die Signalleistung des fernen Gesprächsteilnehmers (Anregungsleistung) im Gesamtband.
\e;( κ)\ Schätzgröße für die Fehlerleistung im Teilband μ.
\e(k)\ Schätzgröße für die Fehlerleistung im Ge samtband.
Tabelle 1: Schätzgrößen und deren Bedeutung
l*ir( =ßΛ )(\RΦΪ )}\+\Irn{xμ )( )}\) + (l-ßx(kr)) \7?{kr -1)|
Wi )\ =ßΛ )(\^{e^(kr)}\+\lm{e^(kr)}\) + (l-ße(kr)) \e^(kr -1)| mit ßR, falls |Re{xi"(*r)} |+ |Im{x^(*r)} |> \x^(kr -1) ßΛK) ßF , sonst ßR, falls |Re{e^(*r)} |+ |Im{e^(*r)} \> \e^ kr - 1) ßλK) = [2.2: ßF , sonst 13 Die Zeitkonstanten ßR bzw. ßF sind dabei so gewählt, daß einem Anstieg der Signalleistung schneller gefolgt werden kann, als einem Abfall der Leistung. Die eigentliche Berechnung der Schrittweiten verwendet eine DSP-spezifische Logarithmierung bzw. Linearisierung.
Die Leistungsübertragungsfaktoren p{^EK (kr ) in den einzelnen
Teilbändern werden, wenn es der Zustand der Freisprecheinrichtung zuläßt, geschätzt. Die Qualität dieser Schätzungen bestimmt nachhaltig auch die Qualität der gesamten Freisprecheinrichtung, entsprechend wird bei der Bestimmung dieser Größen auch ein deutlich höherer Verfahrensaufwand betrieben.
In Fig. 5 ist eine Übersicht zur Schätzung der Leistungsübertragungsfaktoren dagerstellt. Grundsätzlich sollten diese Faktoren nur bei Einzelsprechen des fernen Teilnehmers geschätzt werden. Wurde Einzelsprechen detektiert, so kann die Varianz der Schätzung durch verschiedene Zeitkonstanten be- einflusst werden. Sehr träge Schätzverfahren führen in stationären Umgebungen zu sehr guten Ergebnissen. In diesen Fällen erreicht die Freisprecheinrichtung Zustände in denen sie voll-duplex-fähig oder zumindest nahezu voll-duplex-fähig ist, d.h. unter Einhaltung der ITU-Empfehlungen ist Gegen- sprechen ohne merkliche Bedämpfung möglich.
Ändert sich der Zustand der Freisprecheinrichtung, z.B. durch Raumänderungen, so führen träge Schätzverfahren zu Fehldetek- tionen und es kommt zu unerwünschten Reduzierungen der Echo- dämpfung, also zu einer Verminderung der Gesprächsqualität.
Besonders kritisch ist die Unterscheidung zwischen Gegensprechen und Raumänderungen. Beides führt zu einem Anstieg der Fehlerleistung. Bei Gegensprechen sollte die Schätzung der Leistungsübertragungsfaktoren angehalten und die Gesamtdämpfung der Pegelwaage gemäß den ITU-T- bzw. ETSI-Empfehlungen 14 reduziert werden. Bei Raumänderungen sollten die Leistungsübertragungsfaktoren möglichst schnell neu geschätzt werden.
Bevor die expliziten Berechnungsformeln für die einzelnen Übertragungsfaktoren angegeben werden, sind in den beiden folgenden Abschnitten die beiden Detektoren, welche Raumänderungen bzw. Gegensprechen erkennen sollen, vorgestellt. Die kombinierte Auswertung, welche zur Bestimmung der Leistungsübertragungsfaktoren benötigt wird, ist ebenfalls in einem eigenen Abschnitt beschrieben.
Um Raumänderungen zu erkennen, wird im ersten Teilband - Frequenzbereich 250 Hz - 750 Hz - dem eigentlichen adaptiven Filter ein zweites Filter parallel geschaltet (Fig. 6) . Die- ses sog. Schattenfilter ist deutlich kürzer als das herkömmliche und ist so entworfen, daß es hauptsächlich den Direktschall und die ersten Reflektionen kompensieren kann. Bedingt durch die verminderte Ordnung kann das Schattenfilter deutlich schneller abgleichen, wenn auch nicht so weit, wie das längere Echokompensationsfilter.
Das Schattenfilter c^{kr ) wird wie auch die Teilbandechokom- pensatoren ^{ kr ) mit einem NLMS-Algorithmus rl K) χu(r)( )
££<*, +!) - ^) + * )^ ^ (2.4 ) XSF r ) XSF V r )
adaptiert. Durch Unterstrich sind hierbei Vektoren gekennzeichnet. Die Notation H steht für hermitisch - durch den hochgestellten Stern * ist komplexe Konjugation beschrieben. Der Vektor x^{kr geht durch entsprechende Längenkürzung aus dem Anregungsvektor des ersten Teilbandes x\r} (kr ) hervor. Anders als bei den Echokompensatoren erfolgt die Schrittweitensteuerung des Schattenfilters ausschließlich normgesteuert: 15 α sf falls x^H(kr)x^(kr)>N^ α :2.5; sonst
Der Parameter α^ist einstellbar und sollte etwa 1 betragen.
Die Größe Nsf ist ebenfalls einstellbar und sollte an die Länge des Schattenfilters angepaßt werden.
Um Raumänderungen zu detektieren, werden die Fehlerleistungen des Echokompensationsfilters und des Schattenfilters verglichen. Hierzu werden - wie bereits vorher eingeführt - nicht- lineare, rekursive Betragsglättungen erster Ordnung berechnet:
\ev ( K )| = ßv {\Rt{e\r kr )}| + \im{er kr )}| )
(2.6!
+(l-ßv) >(kr-i)\
\< (K)\ =ßv (\Re{e£(kr)}\ + \lm{e£(kr)})
(2.7)
+o-A) i(^-i)
Der Quotient dieser beiden Schätzer
N)
'v.SF (*,)
;2.8)
<(K)\ bestimmt den Detektorausgang, welcher wie folgt generiert wird:
Bedingung Detektionsergebnis
R(r)(^)>Rσ keine Raumänderungen detek- tiert,
Rϋ >R(r kr)>R] schwache Raumänderungen detek- tiert,
R]≥R (kr) starke Raumänderungen detek- tiert .
Hierbei gilt R0 > Ri. Die Quotientenberechnung wird wieder durch Verwendung der Logarithmierung bzw. Linearisierung durchgeführt. Die Weiterverwendung der Detektionsergebnisse ist weiter unten beschrieben. 16 Um Gegensprechen zu erkennen, wird die Berechnung einer nor¬ mierten Korrelationsschätzung zwischen dem gemessenen y r)(kr ) und dem geschätzten Mikrophonsignal y\r)(kr ) vorgeschlagen. Zur Vereinfachung der Berechnung wird hierbei allerdings nicht das gesamte Signal, sondern nur der jeweilige Realteil verwendet. Der Korrelationskoeffizient „r)(^r) wird wie folgt berechnet:
,.,„ . l∑ ^>(t,-,))Ret '(*,-l)>l ∑." «' lRe«"Λ-'.}Re {?!"(*, -D>|
Bedingt durch die Betragsbildungen kann der Korrelationskoeffizient einen Wertebereich von p( 0 r) (kr ) e[0...l] annehmen. Kleine
Werte bedeuten dabei nur geringe Korrelation zwischen den Signalen, d.h. Gegensprechen; Werte nahe bei 1 weisen dagegen auf eine hohe Korrelation, d.h. auf Einzelsprechen hin.
Die Korrelationsanalyse geht von bereits abgeglichenen Kompensatoren aus - die Signale y\r)(kr ) und y\r {kr ) haben dann keine LaufZeitdifferenz . Bei schlecht abgeglichenen Kompensatoren gilt dies nicht. Um dennoch auch hier eine Analyse zu ermöglichen, wird die Auswertung auch für einen zeitlichen Versatz in beide Richtungen durchgeführt. Die Korrelationskoeffizienten p r)(kr ) werden für verschiedene Werte von n berechnet :
(r)/I I∑ RetV.(r)(*r -'+»)} Re {y\' "')} | P kr ) = '-_". (2.10)
ι=n iRe 'C*, -i +«)} Re {y\r kr -i)}\ für n > 0
I VW"1+" R r)(kr - i + ή)} Re {y r)(k - 1)} I
j=o |Re{y,w(*r -i + »)} Re {W(*r - 1)}| für n < 0. Die Werte für /? werden vorzugsweise einem Intervall ganzer Zahlen entnommen, das den Wert 0 enthält. Vorzugsweise wird Pn (r kr ) für fünf Werte von n berechnet. 17 Zur Reduktion des Aufwands können die Summen des Zählers bzw. des Nenners rekursiv berechnet werden. Entscheidend für den Detektorausgang ist das Maximum über die berechneten Korrelationskoeffizienten tii (kr ) = Maxn { pn {r K ) }. (2.12)
Damit kann das Detektionskriterium wie folgt angegeben werden:
Bedingung Detektionsergebnis mi (kr )> Pg Einzelsprechen (fern) detek- tiert, PnL (kr ) < Pg Gegensprechen detektiert.
Mit den oben beschriebenen Detektoren kann die zunächst nur „grobe" Beschreibung (Fig. 5) der Schätzung der Leistungsübertragungsfaktoren konkretisiert werden. Die Anregungsde- tektion des fernen Sprechers wird durch die Bedingung
~WÖΛ > X*.M (2 - 13> abgefragt. Überschreitet die Betragsglättung einen Grenzwert, so werden weitere Kriterien abgefragt. Im anderen Fall wird auf ungenügende Anregung detektiert, was zu einem Anhalten der Adaption r)(r) = 0 (2.14) und einem Beibehalten des vorherigen Übertragungsfaktor- Schätzwertes
P^Eκ (kr ) = P^EK(kr - l) (2.15)
führt. Die Schwellwerte sollten an die statistischen Eigenschaften des Eingangssignals, im besonderen an das Leistungs- dichtspektrum angepaßt werden. Sollte ausreichende Anregung detektiert worden sein, so wird in einer zweiten Detektions- stufe die Raumänderungserkennung des Schattenfilters ausgewertet. Sollte das Schattenfilter auf „starke" Raumänderungen
R, > R(r kr ) (2.16) 18 detektieren, so wird eine nichtlineare, rekursive Glättung erster Ordnung der Leistungsübertragungsfaktoren durchgeführt. Diese Glättung verwendet im Vergleich zu den weiter unten durchgeführten Schätzungen die kürzesten Zeitkonstanten. Die Schätzwerte werden also den Momentanwerten sehr schnell nachgeführt. Die Bestimmungsgleichung der Übertragungsfaktoren lautet im Fall von detektierten starken Raumänderungen:
\4 kZ ß K) (2.17) μj,r)(*,)i + (\-ßL{K))p" {kr-\). Die Zeitkonstante wird dabei wie folgt gesetzt
KHr)
PRO* falls ßL(K) = (*,)| >PZΛK- .2.11 ßR0F sonst mit <ßROιFRO <\.
Im Fall einer Detektion „schwacher" Raumänderungen
R, < '> ,)<% (2.19)
wird ebenfalls eine rekursive Glättung gemäß Gleichung 2.17 durchgeführt, allerdings mit den Zeitkonstanten
'(*,)! ßm,R ls ß K) = .o (*,)| >%W(*r-l)- (2.20; ß 'RRΛ\,F π sonst mitO<ßR FRhR<\.
Im Vergleich zur Detektion starker Raumänderungen erfolgt die Neuschätzung der Leistungsübertragungsfaktoren langsamer, d.h. es gilt: ÄI.F > ΛO.F'
(2.21)
PR\,F > R0.R-
(2.22) 19 Wurden durch das Schattenfilter keine Raumänderungen detektiert
Ro<R(r)(krX (2.23)
so werden weitere Kriterien zur Unterscheidung von Einzel- und Gegensprechen ausgewertet. Die erste Stufe bildet hier die bereits erwähnte Korrelationsanalyse. Wird die Bedingung
P(l(K)<Pg (2.24)
erfüllt, so wird auf Gegensprechen detektiert und die Übertragungsfaktorschätzung wird angehalten, d.h.
P (kr) =p ~ (kr-\). (2.25)
Im Falle einer Einzelsprechdetektion durch die Korrelationsanalyse pL( )≥Pg- (2.26)
wird noch ein weiterer Vergleich angestellt, um Gegensprech- situationen weitmöglichst auszuschließen. Sollte die gemessene Gesamtbandfehlerleistung unter der geschätzten liegen, wird endgültig auf Einzelsprechen erkannt. Die Bedingung hierfür lautet:
|*(*)| PEK )KGS< \e(k)\ . (2.27)
Die zweite Stufe der Gegensprecherkennung wird mit Gesamtbandsignalen ausgewertet. Die Größen \x(k)\ bzw. \e(k)\ werden gemäß
|*(*)| =ßoB,(k) \x(k~NAS)\ + (l-ßGB k)) \x(k - 1)1
H*)| = ßos,e(*) I e(k) | + (1 - ßaB,e(*)) \e(k - 1)|
mit 20
PGB,R, Hs \ x (k - NAS) \ > \x(k - l) ß<»*(*) = ßσs.F. sonst ßGB Ä falls \ e (k) \ > \e(k - l) csΛk) ( 2 . 21 ßcB.F, Sθmt
bestimmt. Auch bei diesen rekursiven Schätzern sind die Zeit- konstanten ßGB und ßGB F so gewählt, daß einem Anstieg der
Signalleistung schnell gefolgt wird, einem Leistungsabfall dagegen langsamer - d.h. ßGB F > ßGB R • Da zwischen Mikrophon- und Fehlersignal eine Laufzeit durch die Filterbank eingefügt ist, wird das Anregungssignal des fernen Teilneh- mers entsprechend verzögert, die Größe NAS beschreibt daher die Länge des Analyse- bzw. Synthesefilters.
Die Berechnung des Gesamtbandleistungsübertragungsfaktors pEK(k) erfolgt analog zu den Teilbandübertragungsfaktoren mit mehreren Detektoren. Zunächst wird die Anregungsleistung des fernen Teilnehmers überprüft - wird hier eine Schwelle nicht überschritten, wird die alte Schätzung beibehalten. Sollte ausreichende Anregung detektiert worden sein, wird die Fehlerleistung des Schattenfilters ausgewertet und bei Raumände- rungsdetektion die pEK(k) -Schätzung mit entsprechend kurzen
Zeitkonstanten durchgeführt. Erkennt der Schattenfilterdetektor keine Raumänderungen, wird die Korrelationsanalyse des ersten Teilbandes als letzte Steuerungsstufe ausgewertet. Sollte hierbei Einzelsprechen detektiert werden (Bedingung 2.26), wird eine rekursiv geglättete Schätzung durchgeführt, ansonsten wird der alte Übertragungsfaktor beibehalten.
Durch die Konstante Kcs kann auf die Varianz der in die Bedingung 2.27 eingehenden Größen reagiert werden - sie sollte so gewählt werden, daß nicht schon bei geringen Schwankungen der Signalleistungen auf Gegensprechen erkannt wird. Die Detektion sollte erst dann auf Gegensprechen erkennen, wenn die gemessene Fehlerleistung die geschätzte Leistung um einen bestimmten Wert überschreitet. In solchen Fällen wird die 21 Schätzung der Leistungsübertragungsfaktoren (Gleichung 2.17; sehr träge durchgeführt, d.h.
}(*,)| -
'R3.R falls
}(*,)| >PVEΛK 1) ß K) :2.29) ß R3.F sonst
mitO<ßR3FR3Ji <1.
Im anderen Detektionsf all - Erkennung auf Einzelsprechen werden die Zeitkonstanten gemäß
ι« (*r)i ßR2.R fallS l*i"(*,)l >P K -i) ßL(K) = \ [2.30; ß. R2F sonst
itO<ßR2FR2R <1
gesetzt. Damit sind alle möglichen Pfade der Fig. 5 mit expliziten Angaben der Detektionsbedingungen versehen. Für die einzelnen Zeitkonstanten gilt dabei:
0 < ßR0.R < ßR,R < ßR2.R < ßR R < 1>
;2.3i: 0 < ßR0.F < ßRX,F < ßR2.F < ßR3.F < l
(2.32) Die Qualität der Schätzung der Teilband- und des Gesamt- bandübertragungsfaktors bestimmt nachdrücklich die Qualität der gesamten Freisprecheinrichtung. Die Teilbandschätzwerte sind für eine stabile und vor allem schnelle Adaption von großer Bedeutung. Nur wenn die Echokompensatoren hohe Echodämpfungen erzielen, kann die Freisprecheinrichtung aus dem Halb-Duplex-Betrieb "herausgeführt" und nahezu ohne merkliche Dämpfung durch eine Pegelwaage arbeiten. Für den Fall starker Raumänderungen, welcher beim Betrieb in Kraftfahrzuegen häufiger auftritt, ist eine hohe Güte der Dämpfungsschätzung im 22
Gesamtband ( pEK(k) ) notwendig. Mit dem hier beschriebenen Verfahren können die gesetzten Anforderungen mit niedrigem Rechenaufwand zufriedenstellend erfüllt werden.

Claims

23 Patentansprüche
1. Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen mit einer Pegelwaage (22) und meh- reren adaptiven Echokompensationsfiltern (34), von denen jedes ein Teilband verarbeitet, dadurch gekennzeichnet, daß in mindestens einem Teilband ein weiteres adaptives Filter (Schattenfilter (36) ) anderer Ordnung dem adaptiven Echokom- pensationsfilter (34) parallel geschaltet ist, und Raumänderungen anhand einer Korrelationsanalyse und einer Leistungsauswertung des Schattenfilterausgangs erkannt werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß mehrere unterschiedliche Abtastraten verwendet werden.
3. Verfahren nach Anspruch 1 oder Anspruch 2, dadurch gekennzeichnet, daß das weitere Filter (36) eine wesentlich geringere Ordnung aus das eigentliche Echokompensationsfilter aufweist.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß die Echokompensationsfilter (34) mittels einer Filterbank (28) in Frequenzteilbändern implementiert werden.
5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß zur Steuerung der Adaption und der Schrittweite sowohl Leistungsauswertungen von konkurrierenden adaptiven Filtern (34,36) unterschiedlicher Ordnungen als auch korrelationsba- sierende Analysen verwendet werden.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß 24 zur Schrittweitenbestimmung Leistungsübertragungsfaktoren in Teilbändern geschätzt werden.
7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß die Echokompensationsfilter (34) Schätzwerte für die durch sie eingebrachte Echodämpfung liefern.
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß die Schätzwerte für die Dämpfung zur Steuerung der Dämpfung der Pegelwaage (22) verwendet werden.
9. Verfahren nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, daß die gleichzeitige Aktivität beider Gesprächsteilnehmer (Gegensprechen) detektiert wird.
10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, daß die Gesamtdämpfung der Pegelwaage (22) im Gegensprechfall reduziert wird.
EP99904718A 1998-02-13 1999-01-18 Verfahren zur verbesserung der akustischen rückhördämpfung in freisprecheinrichtungen Withdrawn EP1055317A1 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE19805942 1998-02-13
DE19805942A DE19805942C1 (de) 1998-02-13 1998-02-13 Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen
PCT/DE1999/000094 WO1999041898A1 (de) 1998-02-13 1999-01-18 Verfahren zur verbesserung der akustischen rückhördämpfung in freisprecheinrichtungen

Publications (1)

Publication Number Publication Date
EP1055317A1 true EP1055317A1 (de) 2000-11-29

Family

ID=7857634

Family Applications (1)

Application Number Title Priority Date Filing Date
EP99904718A Withdrawn EP1055317A1 (de) 1998-02-13 1999-01-18 Verfahren zur verbesserung der akustischen rückhördämpfung in freisprecheinrichtungen

Country Status (5)

Country Link
US (1) US6618481B1 (de)
EP (1) EP1055317A1 (de)
JP (1) JP2002503924A (de)
DE (1) DE19805942C1 (de)
WO (1) WO1999041898A1 (de)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10242700B4 (de) * 2002-09-13 2006-08-03 Siemens Audiologische Technik Gmbh Rückkopplungskompensator in einem akustischen Verstärkungssystem, Hörhilfsgerät, Verfahren zur Rückkopplungskompensation und Anwendung des Verfahrens in einem Hörhilfsgerät
DE10245667B4 (de) 2002-09-30 2004-12-30 Siemens Audiologische Technik Gmbh Rückkopplungkompensator in einem akustischen Verstärkungssystem, Hörhilfsgerät, Verfahren zur Rückkopplungskompensation und Anwendung des Verfahrens in einem Hörhilfsgerät
US6952473B1 (en) * 2002-11-25 2005-10-04 Cisco Technology, Inc. System and method for echo assessment in a communication network
DE10317600B4 (de) * 2003-04-16 2007-10-25 Infineon Technologies Ag Integrierter Transceiverschaltkreis und Kompensationsverfahren im integrierten Transceiverschaltkreis
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
US9202456B2 (en) * 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
JP5161838B2 (ja) * 2009-05-18 2013-03-13 株式会社日立製作所 エコーキャンセラおよび音響エコー消去方法
US8441515B2 (en) * 2009-09-17 2013-05-14 Sony Corporation Method and apparatus for minimizing acoustic echo in video conferencing
EP2561624A4 (de) * 2010-04-22 2013-08-21 Ericsson Telefon Ab L M Echokompensator und verfahren dafür
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
JP5744236B2 (ja) * 2011-02-10 2015-07-08 ドルビー ラボラトリーズ ライセンシング コーポレイション 風の検出及び抑圧のためのシステム及び方法
US8600040B2 (en) * 2011-03-14 2013-12-03 Continental Automotive Systems, Inc Apparatus and method for convergence control
US9357080B2 (en) * 2013-06-04 2016-05-31 Broadcom Corporation Spatial quiescence protection for multi-channel acoustic echo cancellation
EP3358857B1 (de) 2016-11-04 2020-04-15 Dolby Laboratories Licensing Corporation Eigensicheres audiosystemmanagement für konferenzräume

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3728109C1 (de) * 1987-08-22 1989-03-16 Telefonbau & Normalzeit Gmbh Verfahren fuer die sprachgesteuerte Daempfungsregelung in Fernsprechuebertragungskreisen
FR2628918B1 (fr) * 1988-03-15 1990-08-10 France Etat Dispositif annuleur d'echo a filtrage en sous-bandes de frequence
DE4227327A1 (de) * 1992-08-18 1994-02-24 Philips Patentverwaltung Teilbandechokompensator mit Teilbandcodiereinrichtung
CA2174366C (en) * 1995-04-20 2001-03-27 Shoji Makino Subband echo cancellation method using projection algorithm
EP0758830B1 (de) * 1995-08-14 2004-12-15 Nippon Telegraph And Telephone Corporation Akustischer Teilband-Echokompensator
JP3199155B2 (ja) * 1995-10-18 2001-08-13 日本電信電話株式会社 反響消去装置
US6035034A (en) * 1996-12-20 2000-03-07 Telefonaktiebolaget L M Ericsson (Publ) Double talk and echo path change detection in a telephony system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO9941898A1 *

Also Published As

Publication number Publication date
WO1999041898A1 (de) 1999-08-19
US6618481B1 (en) 2003-09-09
JP2002503924A (ja) 2002-02-05
DE19805942C1 (de) 1999-08-12

Similar Documents

Publication Publication Date Title
DE69933221T2 (de) Adaptiver filter und akustischer echokompensator mit demselben
DE69632851T2 (de) Akustischer Teilband-Echokompensator
DE69635500T2 (de) Verfahren und Vorrichtung zur Erkennung eines nahen Sprachsignals
EP0371567B1 (de) Echokompensator
EP0742664B1 (de) Freisprechverfahren für ein mehrkanaliges Übertragungssystem
DE69827911T2 (de) Verfahren und einrichtung zur mehrkanaligen kompensation eines akustischen echos
DE69836240T2 (de) Echounterdrückung unter Verwendung von Vordergrund- und Hintergrundfiltern
DE19935808A1 (de) Echounterdrückungseinrichtung zum Unterdrücken von Echos in einer Sender/Empfänger-Einheit
EP1055317A1 (de) Verfahren zur verbesserung der akustischen rückhördämpfung in freisprecheinrichtungen
EP0614304A1 (de) Verfahren zum Verbessern der akustischen Rückhördämpfung von elektroakustischen Anlagen
DE4330143A1 (de) Anordnung zur Siganlverarbeitung akustischer Eingangssignale
EP1103956B1 (de) Exponentielle Echo- und Geräuschabsenkung in Sprachpausen
DE112012005782T5 (de) Nachhallunterdrückungsvorrichtung
DE19806015C2 (de) Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen
EP1155561B1 (de) Vorrichtung und verfahren zur geräuschunterdrückung in fernsprecheinrichtungen
EP1189419B1 (de) Verfahren und Vorrichtung zur Elimination Lautsprecherinterferenzen aus Mikrofonsignalen
EP0797339B1 (de) Verfahren und Schaltungsanordnung zur Verbesserung der Übertragungseigenschaften einer echobehafteten Übertragungsstrecke in einem Telekommunikationsnetz
EP0874513A2 (de) Vorrichtung zur Rückhördämpfung
EP1126687A2 (de) Verfahren zur koordinierten Echo-und/oder Geräuschabsenkung
DE102018117557A1 (de) Adaptives nachfiltern
DE19848641B4 (de) Doppelsprech-unempfindlicher NLMS Algorithmus
DE102018117556B4 (de) Einzelkanal-rauschreduzierung
DE19639580C2 (de) Vorrichtung zur Reduktion akustischer Echos
DE10016619A1 (de) Verfahren zur Herabsetzung von Störkomponenten in Sprachsignalen
EP1282297B1 (de) Verfahren und Anordnung zur Echo- und Störgeräuschunterdrückung

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20000801

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): DE FR GB IT

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: INFINEON TECHNOLOGIES AG

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20030801