DE102008039329A1 - Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts - Google Patents

Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts Download PDF

Info

Publication number
DE102008039329A1
DE102008039329A1 DE102008039329A DE102008039329A DE102008039329A1 DE 102008039329 A1 DE102008039329 A1 DE 102008039329A1 DE 102008039329 A DE102008039329 A DE 102008039329A DE 102008039329 A DE102008039329 A DE 102008039329A DE 102008039329 A1 DE102008039329 A1 DE 102008039329A1
Authority
DE
Germany
Prior art keywords
signal
value
signals
energy
bandpass
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102008039329A
Other languages
English (en)
Inventor
Fabian Dr. Küch
Markus Dr. Kallinger
Christof Dr. Faller
Alexis Favrot
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority to EP09704696.5A priority Critical patent/EP2235927B1/de
Priority to AU2009207881A priority patent/AU2009207881B2/en
Priority to PCT/EP2009/000123 priority patent/WO2009092522A1/en
Priority to RU2010131421/08A priority patent/RU2495506C2/ru
Priority to CN2009801060473A priority patent/CN101953145B/zh
Priority to JP2010543412A priority patent/JP5102371B2/ja
Priority to KR1020107018658A priority patent/KR101250124B1/ko
Priority to BRPI0905760-9A priority patent/BRPI0905760B1/pt
Priority to US12/864,240 priority patent/US8731207B2/en
Priority to ES09704696.5T priority patent/ES2641770T3/es
Priority to CA2713127A priority patent/CA2713127C/en
Priority to MX2010008034A priority patent/MX2010008034A/es
Priority to TW098101960A priority patent/TWI458331B/zh
Publication of DE102008039329A1 publication Critical patent/DE102008039329A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers

Abstract

Ein Ausführungsbeispiel einer Vorrichtung (200) zur Berechnung von Steuerinformationen für ein Unterdrückungsfilter (210) zur Filterung eines zweiten Audiosignals, um ein Echo zu unterdrücken, welches auf einem ersten Audiosignal beruht, umfasst eine Berechnungseinrichtung (220), die eine Wertebestimmungseinrichtung (230) zur Bestimmung wenigstens eines energiebezogenen Wertes für ein Bandpasssignal von wenigstens zwei zeitlich aufeinander folgenden Datenblöcken von wenigstens einem Signal einer Gruppe von Signalen aufweist. Die Berechnungseinrichtung (220) umfasst ferner eine Mittelwertbestimmungseinrichtung (250) zur Bestimmung wenigstens eines Mittelwertes des wenigstens eines bestimmten energiebezogenen Wertes für das Bandpasssignal. Die Berechnungseinrichtung (220) umfasst ferner eine Modifizierungseinrichtung (260) zum Modifizieren des wenigstens einen energiebezogenen Wertes für das Bandpasssignal basierend auf dem bestimmten Mittelwert für das Bandpasssignal. Die Berechnungseinrichtung (220) umfasst ferner eine Steuerinformationsberechnungseinrichtung (270) zur Berechnung der Steuerinformationen für das Unterdrückungsfilter (210) basierend auf dem wenigstens einen modifizierten energiebezogenen Wert.

Description

  • Ausführungsbeispiele der vorliegenden Erfindung beziehen sich auf Vorrichtungen und Verfahren zur Berechnung von Steuerinformationen für ein Unterdrückungsfilter, Vorrichtungen und Verfahren zur Unterdrückungsfilterung und Vorrichtungen und Verfahren zur Berechnung eines Verzögerungswerts, wie sie beispielsweise im Rahmen von Konferenzsystemen, Kommunikationssystemen und anderen Systemen verwendet werden können, bei denen akustische Echos auftreten können.
  • Hintergrund
  • Akustische Echos entstehen beispielsweise, wenn Töne, Klänge und Geräusche aus einem Lautsprecher von einem Mikrofon in einem gleichen Raum oder einer gleichen akustischen Umgebung aufgenommen werden. Bei Telekommunikationssystemen werden diese als akustische Rückkopplungssignale zurück zu dem Teilnehmer am fernen oder anderen Ende übertragen, der diese als verzögerte Version seiner eigenen Sprache bemerkt. Echosignale stellen hierbei eine ablenkende Störung dar und können gegebenenfalls sogar eine interaktive, bidirektionale Voll-Duplexkommunikation unterbinden. Darüber hinaus können akustische Echos auch zu Pfeifeffekten (howling effects) und anderen Instabilitäten der akustischen Rückkopplungsschleife führen.
  • Hierbei weist das von dem Mikrofon aufgenommene Mikrofonsignal im Vergleich zu dem dem entsprechenden Lautsprecher zugeführten Lautsprechersignal Unterschiede auf, die sich einerseits aus der akustischen Umgebung, in welcher das Mikrofon und der Lautsprecher angeordnet sind, und anderer seits aus Rausch- und Geräuschquellen ergeben, die verschiedensten physikalischen Quellen entstammen können. Neben Rausch- oder Geräuschquellen der akustischen Umgebung können so der Lautsprecher selber, zugeordnete Schaltungen, das Mikrofon und andere diesem zugeordnete Schaltungen Rauschen in das Mikrofonsignal einkoppeln, um nur ein paar der möglichen Quellen zu nennen.
  • Die Präsenz stationären oder quasistationären Rauschens und Geräuschen in dem Mikrofonsignal kann hierbei die erzielbare Audioqualität eines Systems deutlich beeinträchtigen.
  • Die WO 2006/111370 A1 bezieht sich auf ein Verfahren und eine Vorrichtung zur Entfernung eines Echos in einem Multikanalaudiosignal. Akustische Echosteuerung und Rauschunterdrückung ist ein wichtiger Teil eines jeden Freisprechtelekommunikationssystems, wie Telefon-, Audio- oder Videokonferenzsysteme. Bandbreitenbeschränkungen und Beschränkungen hinsichtlich der Berechnungskomplexität sind hierbei ebenfalls zu berücksichtigen. Das in dem Dokument beschriebene Verfahren der Prozessierung von Multikanalaudiolautsprechersignalen und wenigstens einem Mikrofonsignal umfasst hierbei die Schritte des Transformierens des Eingangsmikrofonsignals in Eingangsmikrofonkurzzeitspektren, eine Berechnung eines kombinierten Lautsprechersignalkurzzeitspektrums von den Lautsprechersignalen, eine Berechnung eines kombinierten Mikrofonsignalkurzzeitspektrums von dem Eingangsmikrofonsignal, eine Abschätzung eines Größenspektrums oder eines Leistungsspektrums des Echos in dem kombinierten Mikrofonsignalkurzzeitspektrum, eine Berechnung eines Verstärkungsfilters zur Größenmodifikation des Eingangsmikrofonkurzzeitspektrums, eine Anwendung des Verstärkungsfilters auf wenigstens ein Eingangsmikrofonspektrum und eine Konvertierung des gefilterten Eingangsmikrofonspektrums in die Zeitdomäne.
  • Ausgehend von diesem Stand der Technik besteht so eine Aufgabe der vorliegenden Erfindung darin, die Audioqualität von akustischen Systemen im Rahmen einer Echounterdrückung im Hinblick auf Rauschanteile zu verbessern.
  • Diese Aufgabe wird durch eine Vorrichtung gemäß Patentanspruch 1, ein Unterdrückungsfilter gemäß Patentanspruch 20, ein Verfahren gemäß einem der Patentansprüche 21 oder 22 oder durch ein Programm gemäß Patentanspruch 32 gelöst.
  • Rauschen bewirkt auch bei anderen Signalverarbeitungsschaltungen einen negativen Einfluss auf die Leistungsfähigkeit entsprechender Komponenten, seien es analoge oder digitale, elektrische oder optische Signale, die mit der Signalverarbeitungsschaltung verarbeitet werden. Hierbei sind insbesondere Signalverarbeitungsschaltungen betroffen, die einerseits aus den betreffenden Signalen eine Information gewinnen und auf Basis dieser gewonnen Informationen dann die ursprünglichen Signale beeinflussen.
  • Beispiele für eine solche Signalverarbeitungsschaltung stellen beispielsweise Verzögerungsschaltungen dar, bei denen ein Verzögerungswert aus einem entsprechenden Vergleich zweier Signale abgeleitet wird. Die Präsenz von Rauschanteilen in einem oder mehrerer der betreffenden Signale kann hierbei die Leistungsfähigkeit der betreffenden Signalverarbeitungsschaltung deutlich reduzieren. So kann beispielsweise im Rahmen einer Verzögerungsschaltung eine entsprechende Anpassung eines Verzögerungswerts an den Signalverlauf eines anderen Signals hinsichtlich seiner Qualität oder auch seiner Anpassungsgeschwindigkeit durch das Rauschen negativ beeinflusst werden.
  • Ausgehend von diesem Stand der Technik besteht daher eine weitere Aufgabe der vorliegenden Erfindung darin, eine Verbesserung einer Berechnung eines Verzögerungswerts für eine Verzögerungseinrichtung zu schaffen, die eine verbesserte Verzögerungswertberechnung ermöglicht.
  • Diese Aufgabe wird durch eine Vorrichtung zur Berechnung eines Verzögerungswerts gemäß Patentanspruch 23, ein Verfahren zur Berechnung eines Verzögerungswerts gemäß Patentanspruch 31 oder ein Programm gemäß Patentanspruch 32 gelöst.
  • Zusammenfassung
  • Ein Ausführungsbeispiel einer Vorrichtung zur Berechnung von Steuerinformationen für ein Unterdrückungsfilter zur Filterung eines zweiten Audiosignals, um ein Echo zu unterdrücken, welches auf einem ersten Audiosignal beruht, weist hierbei eine Berechnungseinrichtung auf. Die Berechnungseinrichtung umfasst ihrerseits eine Wertebestimmungseinrichtung zur Bestimmung wenigstens eines energiebezogenen Wertes für ein Bandpasssignal von wenigstens zwei zeitlich aufeinander folgenden Datenblöcken von wenigstens einem Signal einer Gruppe von Signalen. Die Gruppe von Signalen umfasst hierbei das erste Audiosignal, das zweite Audiosignal und ein von dem ersten oder dem zweiten Audiosignal abgeleitetes Signal. Die Berechnungseinrichtung umfasst ferner eine Mittelwertbestimmungseinrichtung zur Bestimmung wenigstens eines Mittelwertes des wenigstens einen bestimmten energiebezogenen Wertes für das Bandpasssignal. Die Berechnungseinrichtung umfasst ferner eine Modifizierungseinrichtung zum Modifizieren des wenigstens einen energiebezogenen Wertes für das Bandpasssignal basierend auf dem bestimmten Mittelwert für das Bandpasssignal. Die Berechnungseinrichtung umfasst darüber hinaus eine Steuerinformationsberechnungseinrichtung zur Berechnung der Steuerinformationen für das Unterdrückungsfilter basierend auf dem wenigstens einen modifizierten energiebezogenen Wert für das Bandpasssignal.
  • Ein Ausführungsbeispiel der vorliegenden Erfindung in Form eines Unterdrückungsfilters zur Filterung eines zweiten Audiosignals, um ein Echo zu unterdrücken, welches auf einem ersten Audiosignal beruht, umfasst eine Berechnungseinrichtung, die ihrerseits eine Wertebestimmungseinrichtung zur Bestimmung wenigstens eines energiebezogenen Wertes für ein Bandpasssignal von wenigstens zwei zeitlich aufeinander folgenden Datenblöcken von wenigstens einem Signal einer Gruppe von Signalen aufweist. Die Gruppe von Signalen umfasst das erste Audiosignal, das zweite Audiosignal und ein von dem ersten oder dem zweiten Audiosignal abgeleitetes Signal. Die Berechnungseinrichtung umfasst ferner eine Mittelwertbestimmungseinrichtung zur Bestimmung wenigstens eines Mittelwertes des wenigstens einen bestimmten energiebezogenen Wertes für das Bandpasssignal. Die Berechnungseinrichtung umfasst ferner eine Modifizierungseinrichtung zum Modifizieren des wenigstens einen energiebezogenen Wertes für das Bandpasssignal basierend auf dem bestimmten Mittelwert für das Bandpasssignal. Darüber hinaus umfasst die Berechnungseinrichtung ferner eine akustische Unterdrückungsfiltereinrichtung zur Filterung des Mikrofonsignals basierend auf Steuerinformationen, die wenigstens auf dem wenigstens einen modifizierten energiebezogenen Wert für das Bandpasssignal basieren.
  • Ein Ausführungsbeispiel der vorliegenden Erfindung in Form einer Vorrichtung zur Berechnung eines Verzögerungswerts für eine Verzögerungseinrichtung zur Verzögerung eines ersten Signals bezogen auf ein zweites Signal umfasst eine Berechnungseinrichtung, die ihrerseits eine Wertebestimmungseinrichtung zur Bestimmung wenigstens eines energiebezogenen Wertes für ein Bandpasssignal des ersten Signals und des zweiten Signals von wenigstens zwei zeitlich aufeinanderfolgenden Datenblöcken des ersten und des zweiten Signals aufweist. Die Berechnungseinrichtung umfasst ferner eine Mittelwertbestimmungseinrichtung zur Bestimmung wenigstens eines Mittelwerts des wenigstens einen bestimmten energiebezogenen Werts für das Bandpasssignal für das erste Signal und für das zweite Signal. Sie umfasst darüber hinaus eine Modifizierungseinrichtung zum Modifizieren des wenigstens einen energiebezogenen Werts für das Bandpass signal des ersten und das Bandpasssignal des zweiten Signals basierend auf dem bestimmten Mittelwert für das Bandpasssignal des ersten und des zweiten Signals. Außerdem umfasst die Berechnungseinrichtung ferner eine Verzögerungswertberechnungseinrichtung, die ausgebildet ist, um die Verzögerungswerte basierend auf den modifizierten energiebezogenen Wert des ersten und des zweiten Signals zu berechnen.
  • Ausführungsbeispiele der vorliegenden Erfindung basieren auf der Erkenntnis, dass eine Verbesserung der Audioqualität hinsichtlich Rausch- oder Geräuschquellen in einem System zur Echounterdrückung dadurch erzielt werden kann, dass wenigstens ein energiebezogener Wert für ein Bandpasssignal bezüglich eines Mittelwerts modifiziert wird, bevor auf Basis des wenigstens einen modifizierten energiebezogenen Wertes Steuerinformationen für das Unterdrückungsfilter bzw. für die Unterdrückungsfilterung bestimmt werden. Nicht zuletzt durch die Mittelung und die Modifizierung eines energiebezogenen Wertes für ein Bandpasssignal ist so eine Berücksichtigung von Rausch- oder Geräuschbeiträgen möglich, die in der Zeitdomäne einen statistischen Mittelwert bezüglich der jeweiligen momentanen Werte (Elongationswerte) von Null, hinsichtlich eines energiebezogenen Wertes für ein Bandpasssignal jedoch einen von Null verschiedenen Mittelwert aufweisen.
  • Durch die Mittelung und die anschließende Modifizierung des energiebezogenen Werte basierend auf dem zugehörigen Mittelwert ist so eine Abspaltung von stationären Störsignalen von denen des eigentlichen Nutzsignals im Vorfeld der Berechnung der Steuerinformationen für das Unterdrückungsfilter bzw. im Vorfeld der eigentlichen Unterdrückungsfilterung möglich. Hierdurch wird nicht zuletzt bei manchen Ausführungsbeispielen der vorliegenden Erfindung eine Konzentration des Unterdrückungsfilters bzw. der zugehörigen Steuerinformationen auf das tatsächliche Nutzsignal im Vergleich zu vorhandenen Rauschkomponenten ermöglicht.
  • Bei Ausführungsbeispielen der vorliegenden Erfindung kann der energiebezogene Wert hierbei proportional zu einer Potenz eines reellen Wertes zu einem positiven, geradzahligen Exponenten der Potenz sein. Ebenso kann der energiebezogene wert proportional zu einer Potenz eines Betrags (absoluter Wert) zu einer positiven reellen Zahl als Exponent sein. So kann bei Ausführungsbeispielen der vorliegenden Erfindung der energiebezogene Wert ein Energiewert (Quadrat eines Betrags) oder ein zu einem Energiewert proportionaler Wert sein. Das erste Audiosignal kann hierbei ein Lautsprechersignal und das zweite Audiosignal ein Mikrofonsignal sein.
  • Bei Ausführungsbeispielen der vorliegenden Erfindung kann so die Werteberechnungseinrichtung ebenfalls ausgebildet sein, um eine Mehrzahl von energiebezogenen Werten für den gleichen Datenblock, jedoch für unterschiedliche Bandpasssignale mit unterschiedlichen charakteristischen Frequenzen zu bestimmen. Bandpasssignale sind hierbei – allgemein gesprochen – spektrale, frequenznahe oder frequenzbezogene Signale, denen jeweils wenigstens eine charakteristische Frequenz zugeordnet ist. Bei diesen charakteristischen Frequenzen kann es sich beispielsweise um eine Mittenfrequenz, eine Anfangsfrequenz, eine Endfrequenz oder eine andere typische Frequenz handeln. Beispiele für Bandpasssignale stellen so Spektralinformationen einer Fourier-Analysefilterbank, Subband- oder Teilbandsignale, Signale aus einem beschränkten Frequenzbereich oder auch QMF-Signale (QMF = quadrature mirror filter = Quadraturfilter) dar.
  • Bei Ausführungsbeispielen der vorliegenden Erfindung kann so nicht nur für ein einzelnes Bandpasssignal, sondern für eine Mehrzahl entsprechender Bandpasssignale oder auch für alle Bandpasssignale jeweils ein entsprechender energiebezogener Wert für das zugehörige Bandpasssignal, ein zugehöriger, über die Zeit gemittelter Mittelwert und unter Berücksichtung der jeweiligen Mittelwerte eine entsprechende Anzahl modifizierter energiebezogener Werte berechnet werden, die dann im Rahmen der Berechnung der Steuerinformationen für das akustische Unterdrückungsfilter oder direkt für die akustische Unterdrückungsfilterung verwendet werden.
  • Bei Ausführungsbeispielen der vorliegenden Erfindung kann die Mittelwertberechnung basierend auf einer gleitenden Mittelung erfolgen. Hierbei kann, je nach konkreter Implementierung von Ausführungsbeispielen, die gleitende Mittelung oder die Mittelung neben dem aktuellen Datenblock der Mittelwert lediglich auf Datenblöcken beruhen, die zeitlich vor dem aktuellen Datenblock liegen. Hierdurch ist beispielsweise eine Echtzeitmittelung implementierbar.
  • Bei weiteren Ausführungsbeispielen der vorliegenden Erfindung kann die Modifikation auf Basis einer Subtraktion des Mittelwerts von dem zugehörigen energiebezogenen Wert durchgeführt werden. Auch können Ausführungsbeispielen der vorliegenden Erfindung ein weiteres Filterelement oder auch eine Verzögerungseinrichtung aufweisen, wobei die Verzögerungseinrichtung ausgebildet ist, um ein Signal, einen Signalverlauf oder eine zeitliche Abfolge von Werten, etwa einer zeitlichen Abfolge der energiebezogenen Werten um einen Verzögerungswert zu verzögern. Der Verzögerungswert selber kann hierbei basieren auf den modifizierten energiebezogenen Werten, den unmodifizierten energiebezogenen Werten oder anderen Werten ermittelt werden.
  • Ausführungsbeispielen der vorliegenden Erfindung liegt hierbei ferner die Erkenntnis zugrunde, dass eine Verbesserung der Berechnung des Verzögerungswerts für eine Verzögerungseinrichtung dadurch erzielt werden kann, dass energiebezogene Werte für wenigstens ein Bandpasssignal des ersten Signals und des zweiten Signals bestimmt werden, diese einer Mittelung zugeführt werden und basierend auf den ermittelten Mittelwerten entsprechend modifiziert werden.
  • Hierdurch kann in einem dem betreffenden Bandpasssignal zugrunde liegenden Frequenzbereich bzw. der dem Bandpasssignal zugrunde liegenden charakteristischen Frequenz ein Rauschanteil oder ein stationärer Signalanteil eliminiert werden, der sich in dem energiebezogenen Wert als nullpunktverschiebenden Einfluss bemerkbar macht. Aufgrund der Durchführung der betreffenden Modifizierung auf Basis eines energiebezogenen Werts und bezogen auf ein Bandpasssignal kann so auch eine im Grunde genommen im zeitlichen Mittel verschwindende Störung in Form eines Rauschsignals bezogen auf die betreffende Frequenz eliminiert werden.
  • Im Hinblick auf die Berechnung des Verzögerungswerts besteht so gegebenenfalls die Möglichkeit, durch Implementierung eines Ausführungsbeispiels der vorliegenden Erfindung schneller, zuverlässiger oder schneller und zuverlässiger einen Verzögerungswert zu bestimmen, mit dessen Hilfe beispielsweise eine Angleichung der Signalverläufe des ersten und des zweiten Signals erzielbar ist.
  • Kurzbeschreibung der Figuren
  • Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend unter Bezugnahme auf die beiliegenden Zeichnungen näher erläutert.
  • 1 zeigt eine Schemazeichnung zur Illustration der grundsätzlichen Problematik der Echobeseitigung;
  • 2 zeigt ein Blockschaltbild einer Vorrichtung zur Berechnung von Steuerinformationen für ein akustisches Unterdrückungsfilter gemäß einem Ausführungsbeispiel der vorliegenden Erfindung;
  • 3 zeigt ein vereinfachtes Blockdiagramm zur näheren Beschreibung der Funktionsweise von Ausführungsbeispielen der vorliegenden Erfindung;
  • 4 zeigt ein Blockschaltbild eines weiteren Ausführungsbeispiels gemäß der vorliegenden Erfindung;
  • 5 zeigt ein Blockschaltbild einer Verzögerungswertberechnungseinrichtung des in 4 dargestellten Ausführungsbeispiels der vorliegenden Erfindung;
  • 6a zeigt einen zeitlichen Verlauf eines Kurzzeitspektrums sowie einen zeitlich gemittelten Wert desselben eines Lautsprechersignals bei 1000 Hz;
  • 6b zeigt einen Vergleich verschiedener Echoabschätzungsfilter;
  • 6c zeigt einen zeitlichen Verlauf eines Faktors, der Echovorhersagbarkeitsverstärkung;
  • 7 zeigt ein Blockdiagramm eines weiteren Ausführungsbeispiel gemäß der vorliegenden Erfindung;
  • 8 zeigt ein Blockdiagramm eines Ausführungsbeispiels gemäß der vorliegenden Erfindung;
  • 9 zeigt ein Blockdiagramm einer Vorrichtung zur Berechnung von Steuerinformationen und eines akustischen Unterdrückungsfilters gemäß einem Ausführungsbeispiel der vorliegenden Erfindung;
  • 10 zeigt ein Blockdiagramm einer Vorrichtung zur Berechnung von Steuerinformationen für ein akustisches Unterdrückungsfilter für mehrere Kanäle gemäß einem Ausführungsbeispiel der vorliegenden Erfindung;
  • 11 zeigt ein Blockdiagramm eines weiteren akustischen Unterdrückungsfilters gemäß einem Ausführungsbeispiel der vorliegenden Erfindung;
  • 12 zeigt eine Gruppierung einer gleichförmigen Kurz zeit-Fourier-Transformationsfilterbank in Gruppen von Frequenzen;
  • 13a zeigt einen Verlauf von Hann-Interpolationsfiltern;
  • 13b zeigt einen Vergleich von Verstärkungsfilterkoeffizienten als Funktion der Frequenz; und
  • 14 zeigt ein Blockschaltbild eine Ausführungsbeispiels einer Vorrichtung zur Berechnung eines Verzögerungswerts.
  • Detaillierte Beschreibung der Ausführungsbeispiele
  • Bevor im Zusammenhang mit den 2 bis 14 verschiedene Ausführungsbeispiele der vorliegenden Erfindung detailliert beschrieben werden, wird zunächst im Zusammenhang mit 1 die grundsätzliche Problematik der Echobeseitigung näher erläutert.
  • Akustische Echos entstehen beispielsweise, wann immer Töne, Klänge oder Geräusche von einem Lautsprecher durch ein Mikrofon in dem gleichen Raum oder der gleichen akustischen Umgebung aufgenommen werden. Bei Telekommunikationssystemen wird dieses als akustisches Rückkopplungssignal zurück an dem am entfernten Ende der Leitung befindlichen Teilnehmer übertragen, der das Echo in Form einer verzögerten Version seiner eigenen Sprache bemerkt. Echosignale repräsentieren in einem solchen Kontext eine sehr ablenkende Störung und können sogar dazu führen, dass eine interaktive, bidirektionale Voll-Duplexkommunikation unterbunden wird. Darüber hinaus können akustische Echos zu Pfeifeffekten (hauling effects) und anderen Instabilitäten der akustischen Rückkoppelschleife führen.
  • In voll-duplextauglichen Freisprechkommunikationssystemen (full-duplex hands free telecommunication system) ist daher häufig eine Kontrolle des Echos ratsam, um die Kopplung zwischen dem Lautsprecher und dem Mikrofon zu unterdrücken, zu dämpfen oder zu beseitigen. 1 illustriert dieses akustische Echoproblem.
  • 1 zeigt eine Anordnung eines Lautsprechers 100 und eines Mikrofons 110 in einer akustischen Umgebung 120, bei der es sich beispielsweise um einen Raum handeln kann. Dem Lautsprecher 100 wird hierbei ein Lautsprechersignal 130, welches in 1 auch als x[n] bezeichnet wird, bereitgestellt, das dieser in akustische Schallwellen verwandelt. Der Index n bezeichnet hierbei einen Zeitindex eines diskreten Verlaufs des Lautsprechersignals x[n]. Der Index n ist hierbei eine ganze Zahl.
  • Das Mikrofon 110 nimmt die auf es eintreffenden Schallwellen auf und verwandelt diese in ein Mikrofonsignal 140, welches in 1 auch als y[n] bezeichnet ist. Hierbei nimmt das Mikrofon 110 insbesondere auch die von dem Lautsprecher 100 stammenden akustischen Wellen des Lautsprechersignals x[n] auf, welches über verschiedene Wege von dem Lautsprecher 100 zu dem Mikrofon 110 gelangt. Neben einem direkten Übertragungsweg 150 sind in 1 schematisch und beispielhaft auch zwei indirekte Übertragungswege 160-1 und 160-2 eingezeichnet, bei denen die Schallwellen des Lautsprechers 100 an der akustischen Umgebung 120 reflektiert werden und somit erst mittelbar zu dem Mikrofon 110 gelangen. Die Übertragungswege 160 werden daher auch als mittelbare Pfade bezeichnet.
  • Handelt es sich also bei dem Lautsprecher 100 zur Verfügung gestellten Lautsprechersignal x[n] um das Sprachsignal eines am entfernten Ende eines Telekommunikationssystems befindlichen Teilnehmers, also um ein so genanntes Signal des anderen Endes, wird dieses ebenfalls von dem Mikrofon 110 aufgenommen. Anders ausgedrückt wandert das Signal des anderen Endes nach dem Ausstoßen durch den Lautsprecher 100 zu dem Mikrofon 110 über direkte und indirekte bzw. reflektierte Pfade oder Übertragungspfade 150, 160. Daher nimmt das Mikrofon 110 nicht nur die lokale Sprache des diesseitigen Endes des Telekommunikationssystems, sondern auch das Echo auf, welches dann zu dem Benutzer am anderen Ende zurückgekoppelt wird.
  • Um dieses Problems Herr zu werden, weisen Kommunikationssysteme häufig eine Echokompensationsprozessschaltung oder eine Echounterdrückungsprozessschaltung auf, die zusammenfassend im Folgenden auch als Echobeseitigungsprozessschaltung bzw. Echobeseitigungsprozesseinheit 170 bezeichnet werden, der sowohl das Mikrofonsignal y[n] als auch das Lautsprechersignal x[n] bereitgestellt wird, wie dies auch in 1 gezeigt ist. Die Echobeseitigungsprozessschaltung 170 gibt dann ein um das Echo beseitigtes oder hinsichtlich des Echos teilweise beseitigtes bzw. teilweise kompensiertes Signal e[n] aus.
  • 1 illustriert so einen grundsätzlichen Aufbau eines akustischen Echobeseitigungsproblems. Das Lautsprechersignal x wird in das Mikrofonsignal y zurück gekoppelt. Ein Echobeseitigungsprozess beseitigt dieses Echo, während idealerweise lokale Sprache, welche an diesem Ende eines Kommunikationssystems erzeugt wird, durchgelassen wird.
  • Ein konventioneller Ansatz, um mit diesen Echos umzugehen, ist die Platzierung eines akustischen Echokompensators (AEC = acoustic echo canceller) parallel zu den Ausbreitungspfaden 150, 160 des Echosignals, wie dies auch in Referenz [1] beschrieben ist. In dem akustischen Echobeseitiger wird eine digitale Kopie des Echosignals abgeschätzt, die dann von dem gemessenen Mikrofonsignal abgezogen wird. Standard ansätze zur Kompensation des akustischen Echos bauen hierbei auf der Annahme auf, dass der Echopfad (Gesamtsystem der Übertragungswege 150, 160) durch ein lineares FIR-Filter (FIR = finite impulse response = endliche Impulsantwort) modelliert werden können, so dass die akustische Echokompensation entsprechenden implementiert ist, wie dies auch in [1] beschrieben ist. FIR-Filter werden auch als Filter mit einer endlichen Länge der Impulsantwort bezeichnet.
  • Der Echopfad ist hierbei durch eine Vielzahl von Parametern gegeben, die die Charakteristiken des Lautsprechers 100, die des Mikrofons 110 sowie die der akustischen Umgebung 120 ebenso umfassen, wie auch Eigenschaften und Merkmale weiterer Objekte. Hierzu können beispielsweise Temperaturschwankungen und Temperaturgradienten der Luft zählen, die durch Sonneneinstrahlung oder andere Wärmequellen hervorgerufen werden, um nur einige mögliche Quellen von Abweichungen zu nennen.
  • Da der Echopfad somit unbekannt ist und darüber hinaus während der Betriebszeit veränderlich ist, ist es ratsam, das lineare Filter der akustischen Echokompensation adaptiv zu realisieren. Um typische Echopfade zu modellieren, werden daher häufig FIR-Filter der Länge von bis zu einigen Hundert Millisekunden implementiert und zum Teil auch benötigt, was eine hohe Berechnungskomplexität impliziert. Als Länge eines FIR-Filters, also eines Filters mit einer endlichen Impulsantwort, wird hierbei die Anzahl der im Rahmen des Filters implementierten Filterkoeffizienten bezeichnet. Wird hierbei und bei anderen entsprechenden Parametern eine entsprechende Anzahl, die eigentlich eine dimensionslose Größe darstellt, oder ein entsprechender Wert in Sekunden, Millisekunden oder einer anderen Zeiteinheit angegeben, bezieht sich dieser auf die verwendete Abtastrate (Samplingfrequenz) der digitalen Signalprozessierung bzw. der entsprechend verwendeten Analog/Digital-Wandler und Digital/Analog-Wandler.
  • In der Praxis ist jedoch die so erzielbare Echodämpfung für diese konventionellen Ansätze nicht hoch genug, was beispielsweise an langen Nachhallzeiten des Echos (Echoschwanz-Effekte, echo tail effects), nicht linearer Echokomponenten und Konvergenzproblemen liegt. Die vorgenannten Echoschwanzeffekte werden häufig durch eine Untermodellierung des Echopfads hervorgerufen, während die nicht linearen Echokomponenten durch Vibrationseffekte oder durch nicht lineares Verhalten vom günstigen oder billigen Audiohardwarekomponenten hervorgerufen werden. Die angesprochenen Konvergenzprobleme treten beispielsweise im Fall zeitlich stark variierender Echopfade auf. Details hierzu sind in der Referenz [2] wiedergegeben.
  • Aus diesem Grund kann es notwendig sein, akustische Echokompensatoren mit einem nicht-linearen, nachgeschalteten Prozessor zu kombinieren, um übrig gebliebene Echos zu entfernen, die der Echokompensator nicht eliminieren konnte. Nähere Einzelheiten sind hierzu in Referenz [3] zu finden. Standardmäßig wird die Unterdrückung der übrig gebliebenen Echos auf eine frequenzselektive Art und Weise durchgeführt, wie dies in Referenz [4] ausgeführt ist. In der Tat verwenden nahezu allen akustischen Echokompensatoren solche nachgeschalteten Prozessoren zugeführt, da sie zu häufig darin versagen, das Echo ausreichend zu reduzieren, so dass dieses unhörbar wird.
  • In der letzten Zeit ist eine Anzahl von akustischen Echounterdrückern, die im Subbandbereich operieren, mit Ähnlichkeiten zu den zuvor erwähnten nicht-linearen nachgeschalteten Prozessoren vorgeschlagen worden, die jedoch ohne die Notwendigkeit eines akustischen Echokompensators und ohne die Notwendigkeit einer Abschätzung einer Impulsantwort des Echopfads auskommen sollen, wie dies in den Referenzen [5] und [6] dargelegt ist. Von diesen Systemen wird behauptet, dass sie eine niedrige Berechnungskomplexität aufweisen und robust sind, während sie einen hohen Grad der Duplexität erreichen.
  • Das Echounterdrückungsschema, das in Referenz [6] vorgeschlagen ist, wendet eine Kurzzeit-Fourier-Transformation (STFT = short time Fourier transform) an, um Spektren von dem Lautsprecher und den Mikrofonsignalen zu berechnen. Eine Verzögerung oder ein Verzögerungswert d zwischen den Resultaten der mittels STFT-transformierten Lautsprechersignale wird so gewählt, dass der größte Teil der Echoimpulsantwort berücksichtigt wird. Dann wird ein reellwertiger Echoabschätzungsfilter abgeschätzt, der den Effekt eines Teils des Echopfades nachbildet. Um eine Abschätzung des Echobetragsspektrums zu erhalten, werden der abgeschätzte Verzögerungswert und das Echoabschätzungsfilter auf das Lautsprechersignalspektrum angewendet. Unter Verwendung der Abschätzung des Echobetragspektrums wird ein reellwertiges Echounterdrückungsfilter berechnet und auf das Mikrofonsignalspektrum angewendet, um das Echo zu unterdrücken.
  • Die Schwäche der zuvor beschriebenen akustischen Echounterdrückungssysteme (AES-Systeme) besteht jedoch darin, dass diese stationäres Rauschen in dem Mikrofonsignal nicht befriedigend behandeln. Wie die nachfolgenden Erläuterungen auch noch zeigen werden, führt stationäres Rauschen oder auch ein stationäres Geräusch zu einem Beitrag (Bias)bezüglich der Echoabschätzung, der die Leistungsfähigkeit solcher Systeme herabsetzt, wenn die Signal-zu-Rausch-Verhältnisse der betreffenden Signale nicht sehr hoch sind. Dieser Beitrag wird – je nach Implementierung oder Modell – auch als Abweichung von einem erwartungstreuen Schätzwert, Nullpunktsverschiebung oder systematische Schätzwertabweichung bezeichnet.
  • 2 zeigt ein Blockschaltbild einer Vorrichtung zur Berechnung von Steuerinformationen 200 für ein akustisches Unterdrückungsfilter 210, welches als optionale Komponente in 2 gestrichelt wiedergegeben ist. Die Vorrichtung 200 umfasst hierbei eine Berechnungseinrichtung 220, die ihrerseits eine Wertebestimmungseinrichtung 230 aufweist, die mit einem Eingang an einem Eingang 240 der Vorrichtung 200 gekoppelt ist. An einen Ausgang der Wertebestimmungseinrichtung 230 ist einerseits eine Mittelwertbestimmungseinrichtung 250 und, parallel hierzu, mit einem ersten Eingang eine Modifizierungseinrichtung 260 gekoppelt. An einen zweiten Eingang der Modifizierungseinrichtung 260 ist ein Ausgang der Mittelwertbestimmungseinrichtung 250 gekoppelt. Die Modifizierungseinrichtung 260 ist über einen Ausgang mit einem Eingang einer Steuerinformationsberechnungseinrichtung 270 gekoppelt, die an einem Ausgang, der zugleich auch ein Ausgang der Vorrichtung 200 ist, die Steuerinformationen für das akustischen Unterdrückungsfilter 210 ausgibt und diesem bereitstellt.
  • Zu diesem Zweck weist das akustische Unterdrückungsfilter 210 einen Eingang für die Steuerinformationen auf. Je nach konkreter Implementierung des Systems, in welchem die Vorrichtung 200 und das akustische Unterdrückungsfilter 210 implementiert sind, kann das dem Eingang 240 bereitgestellte Signal ebenfalls eingangsseitig dem Unterdrückungsfilter 210 bereitgestellt werden. Ergänzend oder alternativ hierzu kann diesem jedoch auch an einem optionalen Eingang 280 ein weiteres Signal bereitgestellt werden. Eines oder beide Signale, die dem akustischen Unterdrückungsfilter 210 auf diese Art und Weise bereitgestellt werden, werden unter Berücksichtung der dem Unterdrückungsfilter 210 bereitgestellten Steuerinformationen gefiltert und an einem Ausgang 290 ausgegeben.
  • Hinsichtlich der Funktionsweise der Vorrichtung 200 zur Berechnung der Steuerinformationen für das akustischen Unterdrückungsfilter 210 wird diesem wenigstens ein Signal an dem Eingang 240 bereitgestellt, bei dem es sich um das zuvor genannte Lautsprechersignal, das zuvor genannte Mikrofonsignal oder ein von einem von diesen oder beiden abgeleiteten Signal handeln. Wie im Nachfolgenden noch näher erläutert wird, kann selbstverständlich der Vorrichtung 200 auch mehr als ein Signal bereitgestellt werden.
  • Die der Vorrichtung 200 bereitgestellten Signale weisen hierbei zeitlich aufeinander folgende Datenblöcke auf, die auch als Frames bezeichnet werden. In Ausführungsbeispielen der vorliegenden Erfindung operieren nun die nachfolgend geschalteten Einrichtungen und Einheiten jeweils auf einem oder mehreren Datenblöcken, wobei im Falle der Operation auf mehreren Datenblöcken, bezogen auf die zeitliche Folge der Datenblöcke, vergangene Datenblöcke zusätzlich berücksichtigt werden. Dies spiegelt ein typisches Anwendungsszenario von Vorrichtungen 200 gemäß Ausführungsbeispielen der vorliegenden Erfindung wider, die häufig eingesetzt werden, um in Echtzeit eine entsprechende Echounterdrückung zu ermöglichen oder auch zu realisieren.
  • Wird nun an dem Eingang 240 ein entsprechendes Signal der Vorrichtung 200 bereitgestellt, so gelangt wenigstens ein entsprechender Datenblock an die Wertebestimmungseinrichtung 230, die wiederum für wenigstens ein Bandpasssignal einen energiebezogenen Wert berechnet. Bei Bandpasssignalen handelt es sich hierbei um frequenzbezogene Signale, wie sie beispielsweise durch eine Analyse-Fourier-Filterbank, eine Subbandanalysefilterbank oder auch eine QMF-Analysefilterbank bereitgestellt werden.
  • Jedem Bandpasssignal ist hierbei eine charakteristische Frequenz zugeordnet, die beispielsweise eine untere Startfrequenz, eine obere Endfrequenz, eine Mittenfrequenz oder eine andere typische Frequenz darstellt. Handelt es sich beispielsweise bei den Bandpasssignalen um Spektralwerte einer Fourier-Analysefilterbank, kann als charakteristische Frequenz beispielsweise die dem betreffenden Spektralwert zugrunde liegende Frequenz angesehen werden. Im Falle von Subband- oder QMF-Signalen, welche Frequenzanteile von einem größeren Frequenzbereich umfassen, kann es sich bei der charakteristischen Frequenz um eine der zuvor genannten typischen Frequenzen handeln.
  • Je nach konkreter Implementierung einer Vorrichtung 200 gemäß einem Ausführungsbeispiel der vorliegenden Erfindung kann die Wertebestimmungseinrichtung 230 auch mehr als einen energiebezogenen Wert für mehr als ein Bandpasssignal basierend auf dem gleichen Datenblock, der durch einen Zeitindex eindeutig identifizierbar ist, ausgeben. So ist es beispielsweise möglich, für eine Mehrzahl oder alle Subbandsignale entsprechende energiebezogene Werte zu bestimmen.
  • Bei den energiebezogenen Werten kann es sich beispielsweise um einen Energiewert des betreffenden Bandpasssignals oder einen dazu proportionalen Wert handeln. Ebenso kann es sich auch um einen Wert handeln, der proportional zu einer Potenz eines Wertes des betreffenden Bandpasssignals zu einem positiven, geradzahligen Exponenten ist, wenn es sich bei dem als Basis dienenden Wert um einen reellen Wert handelt. Alternativ oder ergänzend kann der energiebezogene Wert auch proportional zu einer Potenz eines Betrags (absoluter Wert) des betreffenden Bandpasssignals zu einer positiven reellen Zahl als Exponent sein. Dies ermöglicht beispielsweise auch die Verwendung komplexer Werte als Basis.
  • Der oder die so ermittelten energiebezogene(n) Wert(e) für das wenigstens eine Bandpasssignal werden nun der Mittelwertbestimmungseinrichtung 250 bereitgestellt, die ausgebildet ist, um wenigstens einen entsprechenden Mittelwert zu bestimmen. Bei Ausführungsbeispielen der vorliegenden Erfindung, bei der mehr als ein energiebezogener Wert je Datenblock der Mittelwertbestimmungseinrichtung 250 bereitgestellt wird, kann für jeden oder auch nur für eine Mehrzahl der betreffenden Werte ein solcher Mittelwert bestimmt werden.
  • Wie im weiteren Verlauf noch erläutert wird, kann die Mittelwertbestimmung hierbei basierend auf einer gleitenden Mittelung durchgeführt werden, der beispielsweise neben dem aktuellen Datenblock auch die zeitlich vorangehenden Datenblöcke oder eine Mehrzahl derselben zugrunde liegen. Dies kann beispielsweise durch eine jeweilige Berücksichtigung der betreffenden Werte der verschiedenen Datenblöcke oder in Form einer rekursiven Berechnung durchgeführt werden. Eine konkrete Implementierung wird im weiteren Verlauf noch erläutert.
  • Der wenigstens eine energiebezogene Wert der Wertebestimmungseinrichtung 230 und der wenigstens eine Mittelwert der Mittelwertbestimmungseinrichtung 250 werden nun der Modifizierungseinrichtung 260 bereitgestellt, die den energiebezogenen Wert basierend auf dem bestimmten Mittelwert für das betreffende Bandpasssignal modifiziert. Dies kann bei unterschiedlichen Ausführungsbeispielen der vorliegenden Erfindung beispielsweise durch einfache Subtraktion, durch einfache Division oder eine komplexere, beispielsweise auf einer Subtraktion oder einer Division beruhenden mathematischen Operation erfolgen.
  • Hierdurch erzeugt die Modifizierungseinrichtung 260 einen oder mehrere modifizierte energiebezogene Werte, auf Basis derer die nachgeschaltete Steuerinformationsberechnungseinrichtung 270 nunmehr die Steuerinformationen für das akustische Unterdrückungsfilter 210 berechnet.
  • Je nachdem, um welches Signal es sich handelt, welches an dem Eingang 240 der Vorrichtung 200 bereitgestellt wird, kann es gegebenenfalls ratsam sein, das gleiche Signal oder auch ein anderes Signal über den optionalen, weiteren Eingang 280 dem akustischen Unterdrückungsfilter 210 bereitzustellen. Handelt es sich bei dem dem Eingang 240 zur Verfügung gestellten Signal beispielsweise um das Mikrofonsignal, so kann eine Implementierung des weiteren Eingangs 280 des akustischen Unterdrückungsfilters 210 gegebenen falls entfallen. Handelt es sich hingegen bei dem dem Eingang 240 bereitgestellten Signal um das Lautsprechersignal, so kann eine Implementierung des weiteren Eingangs 280, dem dann das Mikrofonsignal zur Verfügung gestellt wird, durchaus ratsam sein.
  • Eine Schwachstelle der weiter oben genannten, konventionellen akustischen Echounterdrückungssysteme ist, dass diese stationäres Rauschen bzw. ein stationäres Geräusch in dem Mikrofonsignal nicht gut handhaben. Die damit verbundene Schwäche. im Bereich der Audioqualität kann durch den Einsatz von Ausführungsbeispielen der vorliegenden Erfindung wenigstens teilweise, gegebenenfalls auch vollständig verbessert werden. Wie im weiteren Verlauf noch gezeigt werden wird, führt stationäres oder quasistationäres Rauschen zu einer systematischen systematische Schätzwertabweichung bezüglich der Echoabschätzung, welche die Leistungsfähigkeit dieser Systeme in Szenarien verschlechtert, wenn das Signal-zu-Rausch-Verhältnis (SNR = signal to noise ratio) nicht sehr hoch ist.
  • Ausführungsbeispiele der vorliegenden Erfindung eröffnen nun gerade eine neue Technik, um die vorgenannten Schwachstellen entsprechender akustischer Echounterdrückungssysteme aufzugreifen und wenigstens teilweise auszumerzen. Nicht zuletzt das in 2 gezeigte Ausführungsbeispiel der vorliegenden Erfindung ermöglicht so im Grunde eine Umsetzung einer Technik zur Abschätzung eines Echoabschätzungsfilters, bei dem die Problemstellung der systematische Schätzwertabweichung, die durch die Präsenz von Rauschen hervorgerufen ist, reduziert wird.
  • Ausführungsbeispiele der vorliegenden Erfindung beziehen sich somit auf die Berechnung eines Echoabschätzungsfilters. Sie basieren hierbei auf der Abschätzung zeitlicher Fluktuationen des Mikrofonspektrums ausgehend von zeitlichen Fluktuationen der Lautsprecherspektren. Ausführungsbeispiele der vorliegenden Erfindung ermöglichen so eine korrektere Abschätzung der Echoabschätzungsfilter, ohne dass eine systematische Schätzwertabweichung durch möglicherweise additives Rauschen in den Mikrofonkanälen eingeführt wird. Ausführungsbeispiele der vorliegenden Erfindung ermöglichen somit eine Implementierung von Echoabschätzungsfiltern basierend auf spektralen Beitragsfluktuationen.
  • Bevor im weiteren Verlauf der vorliegenden Beschreibung weitere Ausführungsbeispiele der vorliegenden Erfindung näher beschrieben werden und auch diese im Hinblick auf ihre Funktionsweise näher betrachtet werden, bietet es sich an darauf hinzuweisen, dass unter zwei Komponenten, die miteinander gekoppelt sind, solche zu verstehen sind, die mittelbar oder unmittelbar über entsprechende Verbindungseinrichtungen, Signalpfade oder andere Kommunikationsmethoden verbunden sind. So sind die zuvor beschriebenen Einrichtungen 230, 250, 260 und 270 alle im Rahmen der Berechnungseinrichtung 220 implementiert worden.
  • Hierbei ist es nicht notwendig, dass die einzelnen Einrichtungen durch separate Schaltungsblöcke realisiert werden. So können durchaus teilweise oder vollständige Überlappungen schaltungstechnischer Komponenten der Berechnungseinrichtung 220 auftreten, die zu mehr als einer der genannten Einrichtungen gehören. Handelt es sich beispielsweise bei der Berechnungseinrichtung 220 um einen Prozessor, so können zumindest teilweise die gleichen Schaltkreise im Rahmen unterschiedlicher Einrichtungen verwendet werden. So können beispielsweise die gleichen Teile einer ALU (ALU = arithmetic logic unit = arithmetisch logische Einheit) im Rahmen der Wertebestimmungseinrichtung 230, wie auch im Rahmen der Modifizierungseinrichtung 260 zum Einsatz kommen. In einem solchen Fall kann die Kopplung der betreffenden Einrichtungen 230, 260 beispielsweise über eine Speicherstelle in einem Speicher realisiert werden.
  • Darüber hinaus soll an dieser Stelle darauf hingewiesen werden, dass im Folgenden funktionsgleiche oder funktionsähnliche Einrichtungen, Einheiten und Objekte mit ähnlichen oder gleichen Bezugszeichen bezeichnet werden. Auch werden gleiche oder ähnliche Bezugszeichen für Einrichtungen, Objekte und Einheiten verwendet, die gleich, gleichartig, funktionsgleich oder funktionsähnlich sind. Aus diesem Grund können Beschreibungspassagen, die sich auf Objekte, Einrichtungen und Einheiten beziehen, die mit gleichen oder ähnlichen Bezugszeichen bezeichnet sind, zwischen den einzelnen Ausführungsbeispielen der vorliegenden Erfindung übertragen werden, was eine knappere und klarere Darstellung verschiedener Ausführungsbeispiele ermöglicht, ohne dass unnötige Wiederholungen verwendet werden müssen.
  • Zu den ähnlichen Bezugszeichen zählen auch die im weiteren Verlauf der vorliegenden Beschreibung verwendeten zusammenfassenden Bezugszeichen. Treten Einrichtungen, Objekte und Elemente mehrfach in einer Figur, mehrfach in einem Ausführungsbeispiel der vorliegenden Erfindung oder unter anderen Umständen mehrfach auf, werden die einzelnen Objekte, Einrichtungen und Elemente mit individuellen Bezugszeichen bezeichnet, wohingegen bei einer Beschreibung, Erörterung oder Diskussion allgemeiner Merkmale und Eigenschaften aller entsprechender Einrichtungen, Objekte und Einheiten das zugehörige zusammenfassende Bezugszeichen verwendet wird. So ist in 1 beispielsweise das zusammenfassende Bezugszeichen 160 für die beiden indirekten Überlappungswege 160-1 und 160-2 verwendet worden. Die Verwendung zusammenfassender Bezugszeichen deutet darüber hinaus in vielen Fällen darauf hin, dass die betreffenden, so bezeichneten Einrichtungen, Elemente und Einheiten gleiche oder gleichartige funktionale oder strukturelle Merkmale aufweisen, sofern der Beschreibung der betreffenden Einrichtungen, Objekte und Elemente nichts gegenteiliges zu entnehmen ist.
  • Ein wesentlicher Teil eines Echounterdrückungssystems ist die korrekte Abschätzung der Größe oder der Leistungsspekt ren des Echosignals, so dass ein effektives Echounterdrückungsfilter berechenbar ist. In Referenz [6] wird das Echobetragsspektrum durch ein Filtern des korrekt verzögerten Lautsprecherbetragsspektrums mit Hilfe eines Echoabschätzungsfilters abgeschätzt.
  • Zunächst wird jedoch gezeigt, dass die Echoabschätzungsfilterberechnung in Referenz [6] zu einer systematische Schätzwertabweichung führt, sobald Rauschen in dem Mikrofonsignal vorhanden ist. Dann wird ein Verfahren vorgeschlagen, um das Echoabschätzungsfilter (nahezu) immer ohne die systematische Schätzwertabweichung zu berechnen, selbst wenn Rauschen in den Signalen vorhanden ist. Dieses Problem der systematischen Schätzwertabweichung wird dadurch berücksichtigt, indem das Echoabschätzungsfilter basierend auf Fluktuationen der Signalspektren abgeschätzt wird, wie dies in 3 auch gezeigt ist.
  • 3 zeigt ein vereinfachtes Blockschaltbild einer Vorrichtung 200 zur Berechnung von Steuerinformationen für ein akustisches Unterdrückungsfilter zusammen mit einem entsprechenden akustischen Unterdrückungsfilter, welches jedoch in 3 nicht unmittelbar, sondern als Teil einer größeren Schaltung ausgeführt ist. Bei dem in 3 gezeigten Blockschaltbild handelt es sich um ein vereinfachtes Diagramm, bei dem nicht alle Komponenten gezeigt sind. Anhand von 3 soll vielmehr lediglich die grundsätzliche Funktionsweise einer Vorrichtung gemäß einem Ausführungsbeispiel der vorliegenden Erfindung bzw. einem entsprechenden akustischen Unterdrückungsfilter gemäß einem Ausführungsbeispiel der vorliegenden Erfindung erläutert werden.
  • 3 zeigt so wiederum einen Lautsprecher 100, der ein Lautsprechersignal x[n] wiedergibt. Dieses Lautsprechersignal wird einer Einheit 300 bereitgestellt. Darüber hinaus zeigt 3 ebenfalls ein Mikrofon 110, welches ein Mikrofonsignal y[n] der Einheit 300 bereitstellt.
  • Die Einheit 300, die mit Bezug auf das in 2 gezeigte Ausführungsbeispiel die Wertebestimmungseinrichtung 230 und die Mittelwertbestimmungseinrichtung 250 umfasst, ist in 3 leicht unterschiedlich dargestellt. So umfasst die Einheit 300 in 3 zwei Abschätzungseinrichtungen für temporale Fluktuationen 310-1, 310-2, die in 3 auch als ETF (ETF = estimation of temporal fluctuation = Abschätzung von temporalen Fluktuationen) bezeichnet sind. Die Abschätzungseinrichtung 310-1 ist hierbei eingangsseitig mit dem Lautsprecher 100 gekoppelt, während die Abschätzungseinrichtung 310-2 eingangsseitig mit dem Mikrofon 110 gekoppelt ist.
  • Die beiden Abschätzungseinrichtungen 310 führen hierbei wenigstens die im Zusammenhang mit 2 beschriebenen funktionalen Merkmale und Eigenschaften der Wertebestimmungseinrichtung 230 und der Mittelwertbestimmungseinrichtung 250 für die in dem Lautsprechersignal und dem Mikrofonsignal umfassten Bandpasssignale aus. Das in 3 gezeigte Ausführungsbeispiel der Vorrichtung 200 stellt somit ein Ausführungsbeispiel dar, bei dem nicht nur ein einziges Signal der Gruppe von Signalen, sondern wenigstens zwei Signale, nämlich das Lautsprechersignal und das Mikrofonsignal, verarbeitet werden. Die beiden Abschätzungseinrichtungen 310 bestimmen somit bei dem in 3 gezeigten Ausführungsbeispiel für beide Signale die energiebezogenen Werte für die entsprechenden Bandpasssignale und die zugehörigen Mittelwerte.
  • Die beiden Abschätzungseinrichtungen 310 sind mit jeweils einem Ausgang an entsprechende Eingänge eines Echoabschätzungsfilters 320 gekoppelt, der bezogen auf die Beschreibung des in 2 gezeigten Ausführungsbeispiels die Modifizierungseinrichtung 260 und die Steuerinformationsberechnungseinrichtung 270 umfasst. Entsprechend führt das Echoabschätzungsfilter 320 die im Zusammenhang mit 2 beschriebene Funktionalität der beiden Einrichtungen 260 und 270 basierend auf den energiebezogenen Werten und den zugehörigen Mittelwerten beider Signale x[n], y[n] aus.
  • Die Vorrichtung 200 umfasst in 3 ferner eine Echounterdrückungsprozesseinheit bzw. Echounterdrückungsprozessschaltung 325 (ERP = echo removal process = Echounterdrückungsprozess), die in 3 auch als Echounterdrückung bezeichnet wird und die Funktionalität des akustischen Unterdrückungsfilters 210 aus 2 umfasst. Das Echoabschätzungsfilter 320 weist daher ebenfalls einen entsprechenden Eingang für die Steuerinformationen auf, dem die von dem Echoabschätzungsfilter 320 bereitgestellten Steuerinformationen zugeführt werden.
  • Ebenso wie das akustische Unterdrückungsfilter erzeugt auch die Echounterdrückungsprozesseinheit 325 dann auf Basis der ihr zur Verfügung gestellten Signale ein auf dem Mikrofonsignal y[n] basiertes akustisches Signal e[n], welches hinsichtlich des durch den Lautsprecher 100 erzeugten Echos zumindest teilweise korrigiert ist. Dieser Schritt wird häufig auch als spektrale Modifikation bezeichnet, weshalb sowohl das akustische Unterdrückungsfilter 210 (nicht gezeigt in 3) als auch die Echounterdrückungsprozesseinheit 325 als spektrale Modifizierung bezeichnet werden, da diese zumindest bei manchen Ausführungsbeispielen der vorliegenden Erfindung in einer frequenzbasierten Domäne arbeitet. Gerade im Hinblick auf die Echounterdrückungsprozesseinheit 325 wird ergänzend auch auf die Beschreibung von 7 verwiesen.
  • 3 zeigt somit ein Blockschaltbild einer vorgeschlagenen Abschätzung des Echoabschätzungsfilters, wobei die in 3 verwendeten Abkürzungen ETF und EEF für Abschätzung der temporalen Fluktuationen (estimation of temporal fluctuation) und Echoabschätzungsfilter (echo estimation filter) stehen.
  • Um die Funktionsweise von Ausführungsbeispielen der vorliegenden Erfindung besser verstehen zu können, wird nunmehr mit Bezug auf die Zeichnungen die weitere Funktionsweise anhand eines Signalmodells näher beschrieben. Hierbei wird im Folgenden angenommen, dass der akustische Echopfad cn der akustischen Umgebung aus 1 als eine Kombination eines direkten Übertragungspfads oder direkten Ausbreitungspfads und eines Einflusses eines linearen Filters gn ausgedrückt werden kann. Der direkte Ausbreitungspfad entspricht hierbei einer Verzögerung des Lautsprechersignals und des Mikrofonsignals um einen Verzögerungswert von ν Abtastwerten (samples). Das lineare Filter gn modelliert hierbei die akustischen Eigenschaften der Umgebung. Es ergibt sich somit Cn = gn * δ[n – ν], (1)wobei δ[n] einen Einheitsimpuls bezeichnet und * die (mathematische) Faltung bezeichnet. Unter der Annahme, dass nur am anderen Ende der Sprecher aktiv ist, ist das Zeit-Domänenmodell des Mikrofonsignals y[n] durch y[n] = gn * x[n – ν] + w[n] (2)gegeben, wobei n wiederum eine ganze Zahl ist, die einen Zeitindex bezüglich abgetasteter Werte eines diskreten Zeitverlaufs darstellt. Die in den Gleichungen (1) und (2) auftretenden Variablen n sind somit Indizes in der Zeitdomäne.
  • In Gleichung (2) bezeichnet hierbei der Ausdruck gn * x[n – ν] das verzögerte und gefilterte Lautsprechersignal, wie es von dem Mikrofon aufgenommen wurde. Der Beitrag w[n] repräsentiert hierbei ein stationäres Hintergrundrauschen, das in dem Aufnahmebereich präsent ist. Durch eine entsprechende Zeit/Frequenz-Transformation, also beispielsweise eine Kurzzeit-Fourier-Transformation (STFT = short time Fourier transform) auf beiden Seiten von Gleichung (2) ergibt sich so Y[k, m] = G[k, m]Xd[k, m] + W[k, m], (3)wobei k eine ganze Zahl ist und einen Datenblock in Form einer Datenblocknummer (frame number) bezeichnet und wobei m ein Frequenzindex, also ebenfalls eine ganze Zahl ist. Hierbei ist gemäß Xd[k, m] ≔ X[k – d, m] (4)das in der Frequenz- bzw. STFT-Domäne entsprechende, verzögerte Lautsprechersignal x[n – ν], wobei hierbei im vorliegenden Fall angenommen wird, dass ν ein ganzzahliges Vielfaches einer Datenblockverschiebung (frame shift oder sample advance value) K ist. Anders ausgedrückt wird hier angenommen, dass die Gleichung ν = dK (5)gilt, wobei ν, d und K entsprechende ganze Zahlen sind. Gleichung (5) stellt hierbei lediglich eine Annahme dar, welche eine leichte Vereinfachung der Notation ermöglicht, jedoch bei weitem keine strikte Voraussetzung für die Gültigkeit der nachfolgenden Gleichungen oder ihre technische Umsetzung darstellt. Wird im weiteren Verlauf der Beschreibung von einer Verzögerung von Signalen oder Abfolgen von Werten gesprochen, ist eine strikte Berücksichtigung der Gleichung (5) nicht notwendig.
  • Noch anders ausgedrückt wird der kontinuierliche, abgetastete akustische Datenstrom in der Zeitdomäne in Datenblöcke der Länge K bei manchen Ausführungsbeispielen der vorliegenden Erfindung unterteilt. Selbstverständlich können auch bei anderen Ausführungsbeispielen Datenblöcke eine höhere Anzahl von Werten umfassen, als der betreffende Datenstrom verschoben wird. Dies kann beispielsweise durch Überlappungen erzielt werden.
  • Darüber hinaus wird in Gleichung (3) die Bezeichnung G[k, m] als die zugehörige Darstellung des Filters gn bzw. seiner Impulsantwort verwendet. Entsprechend wird mit W[k, m] die Darstellung des stationären Hintergrundrauschens w[n] in der Frequenzdomäne bezeichnet. In der Praxis ist es vernünftig anzunehmen, dass x[n] und w[n] unkorreliert sind, so dass aus Gleichung (3) folgt, dass E{|Y[k, m]|2} = E{|G[k, m]|2·|xd[k, m]|2} + E{|W[k, m]|2}, (6)wobei E{} den mathematischen Erwartungswert oder einen Mittelwert (z. B. arithmetischer Mittelwert) bezeichnet. Als instantane Näherung der Gleichung (6) kann diese in Form von Leistungsspektren |Y[k, m]|2 geschrieben werden als |Y[k, m]|2 ≈ |G[k, m]|2·|Xd[k, m]|2 + |W[k, m]|2. (7)
  • Basierend auf dieser Signalmodellierung werden im Zusammenhang mit den 4 und 5 weitere Ausführungsbeispiele der vorliegenden Erfindung in Form einer Vorrichtung 200 zur Berechnung von Steuerinformationen für ein akustisches Unterdrückungsfilter 210 beschrieben. Die 4 und 5 zeigen hierbei Blockschaltbilder, wobei 5 ein Blockschaltbild einer Verzögerungsberechnungseinrichtung zeigt, die im Rahmen des in 4 gezeigten Ausführungsbeispiels zum Einsatz bringbar ist.
  • 4 zeigt ein Blockschaltbild einer Vorrichtung 200 zur Berechnung von Steuerinformationen für ein akustisches Unterdrückungsfilter 210. Sowohl die Vorrichtung 200 als auch das akustische Unterdrückungsfilter 210 sind hierbei als Teil einer Berechnungseinrichtung 220 ausgeführt, bei der es sich beispielsweise um einen Prozessor oder eine CPU (central processing unit = Zentralprozessor) handeln kann.
  • Die Vorrichtung 200 weist hierbei einen ersten Eingang 240-1 und einen zweiten Eingang 240-2 auf, wobei der erste Eingang 240-1 für ein Lautsprechersignal in der Zeitdomäne und der zweite Eingang 240-2 für ein Mikrofonsignal in der Zeitdomäne vorgesehen sind. An den ersten Eingang 240-1 ist eine Zeit/Frequenz-Transformationseinrichtung 330-1 gekoppelt, bei der es sich beispielsweise um eine Kurzzeit-Fourier-Analysefilterbank, eine Fourier-Analysefilterbank, eine Subbandanalysefilterbank oder auch eine QMF-Filteranalysebank handeln kann. An einen Ausgang der Zeit/Frequenz-Transformationseinrichtung 330-1 ist eine Verzögerungseinrichtung 340 gekoppelt, die ausgebildet ist, um das von der Zeit/Frequenz-Transformationseinrichtung 330-1 bereitgestellte Signal in einer verzögerten Form weiterzuleiten.
  • Ausgangsseitig ist die Verzögerungseinrichtung 340 mit einer Wertebestimmungseinrichtung 230 gekoppelt, die bei dem in 4 gezeigten Ausführungsbeispiel eine erste Wertebestimmungssubeinrichtung 230a für das Lautsprechersignal aufweist. Die Wertebestimmungseinrichtung 230 ist hieran anschließend an eine Mittelwertbestimmungseinrichtung 250 gekoppelt, die ihrerseits wiederum eine Mittelwertbestimmungssubeinrichtung 250a aufweist, die sowohl an den Ausgang der Verzögerungseinrichtung 240 als auch an den Ausgang der Wertebestimmungssubeinrichtung 230a gekoppelt ist. Die Mittelwertbestimmungseinrichtung 250 sowie die Mittelwertbestimmungssubeinrichtung 250a sind mit einem Ausgang an einen Eingang einer Modifizierungssubeinrichtung 260a einer Modifizierungseinrichtung 260 gekoppelt. Über einen weiteren Eingang ist die Modifizierungssubeinrichtung 260a hierbei mit dem Ausgang der Wertebestimmungssubeinrichtung 230a gekoppelt, so dass der Modifizierungssubeinrichtung 260a neben dem ermittelten Mittelwert auch der ursprüngliche Wert zur Verfügung steht.
  • Neben diesem ersten Pfad für das Lautsprechersignal weist die Vorrichtung 200 einen zweiten Pfad auf, der mit dem zweiten Eingang 240-2 für das Mikrofonsignal gekoppelt ist. Genauer gesagt ist hierbei eine zweite Zeit/Frequenz-Transformationseinrichtung 330-2 eingangsseitig mit dem zweiten Eingang 240-2 gekoppelt. Diese ist ausgangsseitig dann mit einer zweiten Wertebestimmungssubeinrichtung 230b gekoppelt, die ebenfalls Teil der Wertebestimmungseinrichtung 230 ausgeführt ist. Die Mittelwertbestimmungseinrichtung 250 weist für das Mikrofonsignal ebenfalls eine Mittelwertbestimmungssubeinrichtung 250b auf, welche eingangsseitig sowohl mit dem Ausgang der Zeit/Frequenz-Transformationseinrichtung 330-2 als auch mit einem Ausgang der zweiten Mittelwertbestimmungssubeinrichtung 230b gekoppelt ist. Die Mittelwertbestimmungssubeinrichtung 250b ist ebenso wie die Mittelwertbestimmungseinrichtung 250a mit einem Eingang der Modifizierungseinrichtung 260 gekoppelt. Die Mittelwertbestimmungssubeinrichtung 250b ist hierbei mit einer zweiten Modifizierungssubeinrichtung 260b gekoppelt, die ebenfalls Teil der Modifizierungseinrichtung 260 ist. Über einen weiteren Eingang ist die Modifizierungssubeinrichtung 260b hierbei mit dem Ausgang der Wertebestimmungssubeinrichtung 230b gekoppelt, so dass der Modifizierungssubeinrichtung 260b neben dem ermittelten Mittelwert auch der ursprüngliche Wert zur Verfügung steht.
  • Die Modifizierungseinrichtung 260 ist mit mittels ihrer beiden Modifizierungssubeinrichtungen 260a, 260b ihrerseits mit einem Eingang einer Steuerinformationsberechnungseinrichtung 270 gekoppelt, die bei dem in 4 gezeigten Ausführungsbeispiel eine Serienschaltung einer Abschätzungseinrichtung 350 und einer Berechnungseinrichtung 360 für die eigentlichen Steuerinformationen umfasst. Bei dem in 4 gezeigten Ausführungsbeispiel der Vorrichtung 200 ist die Berechnungseinrichtung 360 ferner mit den Ausgängen der Wertebestimmungssubeinrichtung 230b und der Verzögerungseinrichtung 340 gekoppelt.
  • Dem akustischen Unterdrückungsfilter 210 wird sowohl das von der Berechnungseinrichtung 360 bereitgestellte Steuer signal, welches die Steuerinformationen umfasst, sowie das an der zweiten Zeit/Frequenz-Transformationseinrichtung 330-2 in die Frequenzdomäne bzw. eine frequenznahe Domäne transferierte Mikrofonsignal bereitgestellt, auf Basis derer das akustische Unterdrückungsfilter 210 in der Frequenzdomäne oder der frequenznahen Domäne ein echounterdrücktes Signal erzeugt und somit die spektrale Modifikation des Signals vornimmt. Das modifizierte Signal in der Frequenzdomäne oder der frequenznahen Domäne wird dann einer Frequenz/Zeit-Transformationseinrichtung 370 übermittelt, die eine Rücktransformation in die Zeitdomäne durchführt. Ausgangsseitig ist diese mit einem Ausgang 290 der Vorrichtung 200 gekoppelt, an dem – im Unterschied zu dem in 2 gezeigten Ausführungsbeispiel – das echounterdrückte bzw. echoreduzierte Mikrofonsignal in der Zeitdomäne bereit steht.
  • Darüber hinaus umfasst das in 4 gezeigte Ausführungsbeispiel einer Vorrichtung 200 ferner eine Verzögerungswertberechnungseinrichtung 380, welche mit einem Ausgang an einen Eingang (Steuereingang) der Verzögerungseinrichtung 340 gekoppelt ist, über den diese der Verzögerungseinrichtung 340 den aktuellen Verzögerungswert oder einen aktuellen Korrekturwert für den Verzögerungswert übermittelt. Die Verzögerungswertberechnungseinrichtung 380 ist hierbei jeweils mit einem Pfad für das Lautsprechersignal und das Mikrofonsignal gekoppelt.
  • Je nach konkreter Implementierung kann diese Kopplung an die beiden Pfade, die erst nach der Modifizierungseinrichtung 260 zusammengeführt werden, an unterschiedlichen Stellen erfolgen. So kann die Verzögerungswertberechnungseinrichtung 380 beispielsweise mit dem Ausgang der ersten Zeit/Frequenz-Transformationseinrichtung 330-1, mit dem Ausgang der Verzögerungseinrichtung 340 oder dem Ausgang der ersten Modifizierungssubeinrichtung 260a der Modifizierungseinrichtung 260 gekoppelt sein. Darüber hinaus kann die Verzögerungswertberechnungseinrichtung 380 bezüglich des Mikrofonsignalpfades mit dem Ausgang der zweiten Zeit/Frequenz-Transformationseinrichtung 330-2 oder mit dem Ausgang der zweiten Modifizierungssubeinrichtung 260b der Modifizierungsseinrichtung 260 gekoppelt sein.
  • 5 zeigt ein Blockschaltbild der Verzögerungswertberechnungseinrichtung 380, wie sie beispielsweise in 4 einsetzbar ist. Die Verzögerungswertberechnungseinrichtung 380 weist hierbei einen ersten Eingang 390-1 und einen zweiten Eingang 390-2 auf, von denen jeweils einer bei dem in 4 gezeigten Ausführungsbeispiel mit dem Lautsprechersignalpfad und der andere mit dem Mikrofonsignalpfad gekoppelt ist. So kann beispielsweise der erste Eingang 390-1 mit dem Ausgang der Verzögerungseinrichtung 340 bezüglich des Lautsprechersignalpfades und der zweite Eingang 390-2 mit dem Ausgang der zweiten Zeit/Frequenz-Transformationseinrichtung 330-2 gekoppelt sein.
  • Die Verzögerungswertberechnungseinrichtung 380 weist eine Kohärenzfunktionsberechnungseinrichtung 400 auf, die mit den beiden Eingängen 390 gekoppelt ist. Diese ist ausgebildet, um eine entsprechende Kohärenzfunktion basierend auf den an den beiden Eingängen 390 eingehenden Signalen zu berechnen. Diese wird ausgangsseitig einer nachgeschalteten Echoprädiktionsgewinnberechnungseinrichtung 410 gekoppelt, die ausgebildet ist, um den entsprechenden Echoprädiktionsgewinn zu berechnen und diese an eine Optimierungseinrichtung 420 auszugeben. Diese Optimierungseinrichtung 420 ist dann mit einem Ausgang 430 der Verzögerungswertberechnungseinrichtung 380 gekoppelt, der seinerseits mit dem Eingang der Verzögerungseinrichtung 340 aus 4 für den entsprechenden Verzögerungswert gekoppelt ist.
  • Der Verzögerungswert d kann so mit Hilfe der in den 4 und 5 gezeigten Einrichtungen über die Verwendung einer Kohärenzfunktion, beispielsweise einer quadrierten Kohärenzfunktion, bezüglich der Lautsprecher- und Mikrofon-Leistungsspektren gemäß
    Figure 00340001
    berechnet oder ermittelt werden, wobei der in Gleichung (8) auftretende Erwartungswert E{} auch als Mittelwert implementiert werden kann. Diese Berechnung wird bei dem in 4 und 5 gezeigten Ausführungsbeispiel durch die Kohärenzfunktionsberechnungseinrichtung 400 der Verzögerungswertberechnungseinrichtung 380 durchgeführt.
  • Grundsätzlich kann der Verzögerungswert d für jedes Frequenzband bzw. für jedes Bandpasssignal berechnet werden, wobei das Bandpasssignal durch einen Index m bestimmt ist, bei dem es sich um eine ganze Zahl handelt. Im Rahmen der in den 4 und 5 beschriebenen Ausführungsbeispiele wird jedoch lediglich die Verwendung eines einzelnen Verzögerungswerts für alle Frequenzen bzw. alle Bandpasssignale berücksichtigt. Aus diesem Grund wird im Rahmen der Echoprädiktionsgewinnberechnungseinrichtung 410 der so genannte Echoprädiktionsgewinn (echo prediction gain) ω[k] als Mittelwert der Kohärenzfunktionen Γd[k, m] über die einzelnen Frequenzen gemäß
    Figure 00340002
    berechnet, wobei M eine ganze Zahl ist, die die Anzahl der Frequenzbänder bzw. der Bandpasssignale angibt. Der Index m der einzelnen Bänder läuft hierbei von 0 bis M – 1. Der eigentliche Verzögerungswert d wird dann über die Optimierungseinrichtung 420 so gewählt, dass der Echoprädiktionsgewinn maximiert wird. Anders ausgedrückt wird dieser durch die Einrichtung 420 gemäß d = argmaxdd[k]} (10) bestimmt, wobei die Funktion argmaxd{} die Bestimmung gerade des maximalen Werts bezüglich des Parameters d bezeichnet.
  • Hierdurch wird, wie in 4 dargestellt ist, über die Verzögerungswertberechnungseinrichtung 380 der Verzögerungseinrichtung 340 der aktuelle Verzögerungswert d in Abhängigkeit der aktuellen Signalverläufe übermittelt. Genauer gesagt handelt es sich bei der hier beschriebenen Verschaltung der Verzögerungswertberechnungseinrichtung 380 um eine Rückkopplungsschaltung, bei der das der Verzögerungseinrichtung 340 zur Verfügung gestellte Signal tendenziell ein Korrektursignal hinsichtlich des Verzögerungswerts d darstellt, da bereits das verzögerte Signal bei der Berechnung der Kohärenzfunktionen berücksichtigt ist. Es ist daher grundsätzlich ebenfalls möglich, den Verzögerungswert, wie er gemäß Gleichung (10) berechnet wird, als Δd zu bezeichnen, das die Abweichung von dem zuvor berechneten Verzögerungswert widerspiegelt. Seine Berücksichtigung kann dann durch die Verzögerungseinrichtung 340 erfolgen, um den absoluten Verzögerungswert d zu erhalten. Im Falle einer Berechnung auf Basis nicht verzögerter Signale kann hingegen über Gleichung (10) direkt der betreffende Verzögerungswert ermittelt werden.
  • Hinsichtlich des Echoabschätzungsfilters wird im Folgenden gezeigt, dass die in Referenz [6] verwendete Abschätzung zu einer um eine systematische Schätzwertabweichung verschobenen Abschätzung führt. In Referenz [6] wird die Abschätzung des Echoabschätzungsfilters direkt basierend auf den Leistungsspektren |Y[k, m]|2 und |Xd[k, m]|2, also auf den direkt gemessenen und detektierten Mikrofon- und Lautsprecherspektren durchgeführt. Für die Echoabschätzungsfilter Ĝbiased[k, m] ergibt sich so in der Energiedomäne
    Figure 00360001
  • Wie in Anhang A gezeigt ist, führt die Verwendung der Gleichung (11) zu einer um einen systematischen Schätzwertabweichung verschobene Abschätzung für das Echoabschätzungsfilter durch den additiven Anteil des stationären Rauschens W[k, m]. Somit ergibt sich basierend auf Gleichung (11) das Echoabschätzungsfilter in der Energiedomäne zu
    Figure 00360002
    wobei σ2w [k, m] die Varianz des stationären Rauschens w[n] innerhalb eines Frequenzbandes mit dem Index m und dem Datenblockindex oder Zeitindex k ist. Hierbei ergibt sich sofort aus (12), dass das um die systematische Schätzwertabweichung verschobene Echoabschätzungsfilter potentiell zu unakzeptablen hohen Abschätzungen für das Echosignal in rauschbehafteten Umgebungen führt. Da eine Überabschätzung von Echosignalen typischerweise in einer zu aggressiven Echounterdrückung mündet, wären die Störungen bei Nahendsprachsignalen unakzeptabel hoch während gleichzeitiger bidirektionaler Kommunikation (double talk situations).
  • Im Rahmen der Verwendung von Ausführungsbeispielen der vorliegenden Erfindung, wie sie beispielsweise. in den 4 und 5 dargestellt sind, wird das Echoabschätzungsfilter G[k, m] bezogen auf temporale Fluktuationen der Lautsprecher- und Mikrofonleistungsspektren abgeschätzt. Die temporalen Fluktuationen der Leistungsspektren werden hierbei als „zentralisierte" oder gemittelte Versionen, also unter Abzug oder – allgemeiner gesprochen – Berücksichtigung der zugehörigen Mittelwerte bestimmt. So wird im Rahmen der Modifizierungseinrichtung 260 durch die zweite Modifizierungseinrichtung 260b ein modifiziertes Leistungs spektrum als modifizierte energiebezogene Werte für das Mikrofonsignal gemäß Ỹ[k, m]| = |Y[k, m]|2 – E{|Y[k, m]|2}. (13)berechnet. Analog wird auch ein modifiziertes Leistungsspektrum durch die Modifizierungseinrichtung 260 in Form der ersten Modifizierungssubeinrichtung 260a gemäß X ~d[k, m] = |Xd[k, m]|2 – E{|Xd[k, m]|2} (14)für das Lautsprechersignal berechnet. Die in die Gleichungen (13) und (14) eingehenden mathematischen Erwartungswerte E{} werden hierbei durch die Mittelwertbestimmungseinrichtung 250 gebildet. Hierbei wird praktischerweise durch die beiden Mittelwertbestimmungssubeinrichtungen 250a und 250b basierend auf den betreffenden leistungsbezogenen Werten der mathematische Erwartungswert E{}, wie sie in den Gleichungen oben verwendet werden, durch einen Kurzzeitmittelwert ersetzt. Ausgehend von dem Beispiel ΦAB[k, m] = E{A[k, m]·B[k, m]}, (15)wobei die Werte A[k, m] und B[k, m] beliebige, auch gleiche Werte darstellen können, ergibt sich der Kurzzeitmittelwert Φ ^AB[k, m] zu dem Wert ΦAB[k, m], indem beispielsweise eine rekursive Glättung gemäß Φ ^AB[k, m] = (1 – αavg)Φ ^AB[k – 1, m] + αavgA[k, m]·B[k, m] (16)durchgeführt wird. Der Faktor αavg bestimmt hierbei den Grad des Glättens über der Zeit und kann angepasst werden an jede gegebene Anforderung.
  • Anders ausgedrückt, zu einer beliebigen Größe A[k, m], bei der k ein Zeitindex ist, kann ein zeitlicher Mittelwert gemäß E(A[k, m]) = (1 – αavg)E(A[k – 1, m]) + αavg·A[k, m] (17)berechnet werden, bei dem die Größe E(A[k, m]) rekursiv basierend auf dem aktuellen Wert A[k, m] und dem zuvor berechneten Mittelwert E(A[k – 1, m]) berechnet werden. Der Faktor αavg gewichtet hierbei den Beitrag der Beimischung des neuen Wertes A[k, m] bezogen auf den zuvor berechneten Mittelwert, der seinerseits mit dem Faktor (1 – αavg) gewichtet wird.
  • Somit kann mit Hilfe der in den Gleichungen (15) bis (17) wiedergegebenen Berechnungsvorschriften im Rahmen der Mittelwertbestimmungseinrichtung 250 und ihrer beiden Mittelwertbestimmungssubeinrichtungen 250a und 250b aus den betreffenden, diesen Einrichtungen zur Verfügung gestellten Daten ein entsprechender Mittelwert bestimmt werden. Implementierung einer Berechnungsvorschrift den Gleichungen (15) bis (17) folgend stellt hierbei eine rekursive, gleitende Mittelung dar, die in Echtzeit ausführbar ist. Es muss hierbei insbesondere nicht auf „zukünftige" Datenblöcke gewartet werden.
  • Die Steuerinformationsberechnungseinrichtung 270 mit der Abschätzungseinrichtung 350 ist nunmehr in der Lage, auf Basis der von der Modifizierungseinrichtung 260 bereitgestellten modifizierten energiebezogenen Werte die Steuerinformationen für das akustische Unterdrückungsfilter 210 zu berechnen. Hierzu wird zunächst durch die Abschätzungseinrichtung 350 ein Echoabschätzungsfilter Ĝ[k, m] gemäß
    Figure 00380001
    unter Berücksichtigung der temporalen Fluktuationen der Leistungsspektren berechnet. Genauer gesagt wird gemäß Gleichung (18) der Betragsfrequenzgang des betreffenden Echoabschätzungsfilters Ĝ[k, m] berechnet, wobei die zugehörigen Phaseninformationen gegebenenfalls mittels verschiedener Verfahren hinzugefügt bzw. abgeschätzt werden können. Sofern es notwendig ist, kann so beispielsweise als Phaseninformation eine konstante Phase für alle Frequenzbänder, Frequenzbereiche oder Bandpasssignale verwendet werden, einer in Abhängigkeit des Verzögerungswerts d für das betreffende Frequenzband bestimmten oder ein aus dem zeitlichen Verlauf oder dem spektralen Verlauf der zugehörigen Beträge ermittelt werden.
  • Durch diese Abschätzung, wie sie in Gleichung (18) durchgeführt wird, werden lediglich spektrale Dynamiken des Lautsprechersignals und des Mikrofonsignals verwendet, um das Echoabschätzungsfilter abzuschätzen. Wie auch in Anhang B dargestellt wird, wird durch die Abschätzung gemäß Gleichung (18) das additive stationäre Rauschsignal w[n] ausgelöscht. Wie auch die Ableitung in Anhang B zeigt, führt die Verwendung von Gleichung (18) zu einer nicht verschobenen Abschätzung der Echoleistungstransferfunktion |G[k, m]|2. Genauer gesagt gilt somit |Ĝ[k, m]|2 =|G[k, m]|2 (19)
  • Darüber hinaus bietet es sich an, an dieser Stelle darauf hinzuweisen, dass alternativ zu der Verwendung von Gleichung (8) die Abschätzung des Verzögerungswerts d auch auf Basis der fluktuierenden Spektren unter Verwendung der Kohärenzfunktion gemäß
    Figure 00390001
    durchgeführt werden kann, wobei X ~[k – d, m] analog zu Gleichung (14) definiert wird. Der wirkliche Verzögerungswert wird dann basierend auf dem Echoprädiktionsgewinn
    Figure 00400001
    derart ausgewählt, dass der Echoprädiktionsgewinn maximiert wird.
  • Anders ausgedrückt kann die Verzögerungswertberechnung auch durch die Verzögerungswertberechnungseinrichtung 380 dadurch durchgeführt werden, dass andere als die im Zusammenhang mit den Gleichungen (8) und (9) bezeichneten Größen verwendet werden. Bezogen auf 4 bedeutet dies, dass der Verzögerungswertberechnungseinrichtung 380 andere Werte über die optional eingezeichneten Pfade bereitgestellt werden, so dass diese an den Eingängen 390 bereit stehen. Die Steuerinformationsberechnungseinrichtung 270 stellt dem akustischen Unterdrückungsfilter 210 die Steuerinformationen in Form von Filterkoeffizienten H[k, m] bereit, die auf Designparametern β, γ und LH beruhen, die im Folgenden genauer eingeführt werde.
  • Bei Ausführungsbeispielen der vorliegenden Erfindung werden Bandpasssignale des Lautsprechersignals oder eines daraus abgeleiteten Signals, die zu unterschiedlichen charakteristischen Frequenzen gehören, gegebenenfalls unterschiedlich stark verzögert. Dies kann beispielsweise dann ratsam sein, wenn die unterschiedlichen Ausbreitungspfade eine frequenzselektive Dämpfung aufweisen, so dass beispielsweise in bestimmten Frequenzbereichen nicht mehr der direkte Ausbreitungsweg den stärksten Signalbeitrag liefert. In einem solchen Fall kann gegebenenfalls die Bestimmung des Verzögerungswerts direkt auf Basis der Kohärenzfunktionen bzw. auf Basis einer über ein beschränktes Frequenzband erfolgten Berechnung der Echoprädiktionsgewinne erfolgen.
  • Die akustische Echounterdrückung wird durch das akustische Unterdrückungsfilter 210 durch eine Gewichtung des Mikrofonsignals mit einem angemessenen Echounterdrückungsfilter gemäß E[k, m] = H[k, m]·Y[k, m] (22)durchgeführt. Das Mikrofonspektrum Y[k, m] wird hierbei dem akustischen Unterdrückungsfilter 210 direkt von dem Ausgang der zweiten Zeit/Frequenz-Transformationseinrichtung 330-2 bereitgestellt. Die Gewichtungsfaktoren bzw. Filterfaktoren H[k, m] stellen hierbei die Steuerinformationen dar, die das akustische Unterdrückungsfilter 210 von der Berechnungseinrichtung 360 für die Steuerinformationen bzw. von der Steuerinformationsberechnungseinrichtung 270 erhält.
  • Der Echoabschätzungsfilter H[k, m] bzw. die Steuerinformationen können hierbei gemäß der spektralen Subtraktionsmethode berechnet werden, wie sie in Referenz [7] beschrieben ist. Die Steuerinformationen können in diesem Fall gegeben werden durch
    Figure 00410001
  • Die Designparameter β, γ und LH werden verwendet, um die angestrebte Leistungsfähigkeit des Echounterdrückungsfilters zu steuern. Typische Werte liegen hierbei bei β = 2, γ = 2 und LH = –60 (entspricht einer maximalen Dämpfung von – 60 dB). Die Abschätzung des Leistungsspektrums des Echos wird hierbei durch das Echoabschätzungsfilter gemäß |[Ŷ[k, m]|2 = |Ĝ[k, m]|2·|Xd[k, m]|2 (24) erhalten. Die Berechnung gemäß Gleichung (24) kann ebenfalls von der Berechnungseinrichtung für die Steuerinformationen 360 durchgeführt werden. Vorzugsweise werden die Echoabschätzung und die Echounterdrückung bezogen auf die Originalspektren des Lautsprechersignals und des Mikrofonsignals durchgeführt.
  • 6 zeigt numerische Resultate auf Basis von Ausführungsbeispielen der vorliegenden Erfindung für eine Frequenz von 1000 Hz. Die Simulationen sind mit Sprachsignalen erzeugt worden, welche durch 1/f-Rauschen (rosa-farbiges Rauschen, pink noise) mit einem Signal-zu-Rausch-Verhältnis (SNR) von 6 dB korrumpiert wurden. Die erste Hälfte der Simulation entspricht hierbei ausschließlich einem Echo, welches durch einen aktiven Sprecher am anderen Ende hervorgerufen wird, während die zweite Hälfte der Simulation einer bidirektionalen Gesprächssituation (double-talk situation) entspricht.
  • Teil a von 6 zeigt ein Kurzzeitleistungsspektrum 430 und diesem als schwarze Linie überlagert, ein kurzzeitgemitteltes Spektrum des Lautsprechersignals für eine Frequenz von 1000 Hz. Anders ausgedrückt zeigt 6a ein Kurzzeitleistungsspektrum 430 und ein zugehöriges kurzzeitgemitteltes Spektrum 440 für ein Lautsprechersignal.
  • Teilabbildung b zeigt hierbei das wahre Echoabschätzungsfilter als gestrichelte Linie, sowie die mit der systematische Schätzwertabweichung behaftete punktiert dargestellte und die ohne systematische Schätzwertabweichung als durchgehende Linie gezeichneten Abschätzungen. Anders ausgedrückt zeigt Teilabbildung in 6b das reale Echoabschätzungsfilter G[k, m] als gestrichelte Linie, die mit systematischer Schätzwertabweichung berechnete Abschätzung Ĝbiased[k, m] als punktierte Linie berechnet gemäß Gleichung (11) sowie die ohne systematische Schätzwertabweichung berechnete Abschätzung Ĝ[k, m] als durchgezogene Linie, berechnet wie im Rahmen von Ausführungsbeispielen der vorliegenden Erfindung und der Beschreibung vorgeschlagen und beschrieben wurde.
  • Teilabbildung 6c zeigt einen zeitlichen Verlauf des Echoprädiktionsgewinns, wobei allen drei Teilabbildungen jeweils eine Zeitskala von 0 Sekunden (0 s) bis 15 Sekunden (15 s) zugrunde liegt. Wie zuvor erläutert wurde, ist hierbei in dem Zeitbereich von 0 s bis etwa 7,5 s lediglich Sprache aus dem Lautsprecher eingebunden, die über das Echo und das Mikrofon wieder aufgenommen wird, während in der zweiten Hälfte, also dem Zeitintervall zwischen etwa 7,5 s bis 15 s, zusätzlich in das Mikrofon Sprache eingekoppelt wird.
  • Teilabbildung 6c entspricht somit der Echoprädiktionsgewinn, die ein Maß für die Zuverlässigkeit des Echoabschätzungsfilters als Funktion der Zeit darstellt. Diese Darstellungen zeigen die systematische Schätzwertabweichung des Echoabschätzungsfilters, der ohne die Berücksichtigung der zentrierten Statistik berechnet wurde, während das Echoabschätzungsfilter basierend auf den temporalen Fluktuationen dem realen Echoabschätzungsfilter G[k, m] entspricht, wenn der Echoprädiktionsgewinn hinreichend groß ist. So illustriert insbesondere, dass unter Berücksichtigung des Mittelwertabzugs das Echoabschätzungsfilter eine deutlich bessere Übereinstimmung mit dem angestrebten Verlauf im Vergleich zu dem ohne Mittelwertabzug aufweist. Insbesondere sind in dem zeitlichen Bereich zwischen 10 und 15 s in Teilabbildung 6b signifikante Unterschiede hinsichtlich der entsprechenden Echoabschätzungsfilterverläufe erkennbar.
  • 7 zeigt ein vereinfachtes Blockschaltbild eines weiteren Ausführungsbeispiels einer Vorrichtung 200 mit einem akustischen Unterdrückungsfilter 210. Bei der in 7 gewählten Darstellung sind zusätzlich zwei Zeitspuren des Mikrofonsignals y[n] und des Lautsprechersignals x[n] über den Zeitindex n gezeigt. Im Vergleich zu dem in 3 gezeigten Ausführungsbeispiel zeigt so 7 ein kompletteres Blockschaltbild des akustischen Echounterdrückungsalgorithmus gemäß einem Ausführungsbeispiel der vorgeschlagenen Erfindung. Aufgrund der Ähnlichkeit zu dem in 3 gezeigten Ausführungsbeispiel wird an dieser Stelle die Beschreibung dieses Ausführungsbeispiels knapper gehalten und im Hinblick auf zusätzliche Details auf die Ausführungen zu 3 verwiesen.
  • Das Lautsprechersignal x[n] wird einer ersten Zeit/Frequenz-Transformationseinrichtung 330-1 in Form einer Kurzzeit-Fourier-Transformation (STFT) zugeführt. Ebenso wird das Mikrofonsignal y[n] einer zweiten Zeit/Frequenz-Transformationseinrichtung 330-2 zugeführt, bei der es sich ebenfalls um eine entsprechende STFT-Einheit handelt. Da, wie ein Vergleich der zeitlichen Signalverläufe x[n] und y[n] der beiden Signalverläufe zeigt, das Lautsprechersignal dem Mikrofonsignal um eine Zeitspanne d vorauseilt, erzeugt die erste Zeit/Frequenz-Transformationseinrichtung 330-1 ein entsprechend zeitlich verzögertes Spektrum des Lautsprechersignals X[k – d, m].
  • Dies ist im Hinblick auf die beiden Zeitspuren im oberen Teil der 7 auch durch die Verwendung der beiden geschwungenen Klammern 450-1 und 450-2 sowie durch den den zeitlichen Abstand d anzeigenden Pfeil 460 wiedergegeben. Die zweite Zeit/Frequenz-Transformationseinrichtung 330-2 liefert hingegen das entsprechende Spektrum des Mikrofonsignals Y[k, m] in einer zeitlich nicht verzögerten Form. Bezogen auf 4 bedeutet dies, dass die Verzögerungseinrichtung 340 ebenfalls bei dem in 7 gezeigten Ausführungsbeispiel in die erste Zeit/Frequenz-Transformationseinrichtung 330-1 integriert ist.
  • Die beiden Zeit/Frequenz-Transformationseinrichtungen 330-1 sind wiederum an einer Einheit 300 gekoppelt, die – wie auch schon das in 3 gezeigte Ausführungsbeispiel gezeigt hat – zwei Abschätzungseinrichtungen 310-1, 310-2 umfasst, die als ETF in 7 bezeichnet sind. Die Abkürzung ETF steht hier für Abschätzung von temporalen Fluktuationen bzw. estimation of temporal fluctuations. Die Abschätzungseinrichtungen 310 umfassen somit die Funktionen der Wertebestimmungseinrichtung 230 und der Mittelwertbestimmungseinrichtung 250 aus 4.
  • Ausgangsseitig ist die Einheit 300 wiederum mit einem Echoabschätzungsfilter 320 gekoppelt, der in 7 wiederum als EEF bezeichnet ist (EEF = echo estimation filter). Das Echoabschätzungsfilter 320 umfasst hierbei die Funktionsweisen der Modifizierungseinrichtung 260 und der Abschätzungseinrichtung 350 der Steuerinformationsberechnungseinrichtung 270. Das Echoabschätzungsfilter 320 übergibt die entsprechende Abschätzung Ĝ[k, m] an eine Echounterdrückungsprozesseinheit 325 (ERP = echo removal process = Echounterdrückungsprozess), die die eigentliche Echoentfernung bzw. Echobeseitigung basierend auf den beiden Spektren X[k – d, m] und Y[k, m] und dem abgeschätzten Filter Ĝ[k, m] durchführt. Hinsichtlich ihrer Funktion entspricht somit die Echounterdrückungsprozesseinheit 325 der Berechnungseinrichtung 360 für die Steuerinformationen sowie dem eigentlichen akustischen Unterdrückungsfilter 210.
  • Die Echounterdrückungsprozesseinheit 325 stellt an ihrem Ausgang ein in der Frequenzdomäne angesiedeltes echounterdrücktes Signal bereit, welches dann durch die Frequenz/Zeit-Transformationseinrichtung 370, bei der es sich im vorliegenden Fall um eine inverse Kurzzeit-Fourier-Transformation (ISTFT = inverse short time Fourier transform) handelt, behandelt wird, so dass an ihrem Ausgang ein entsprechendes Zeitsignal e[n] ausgegeben wird, welches hinsichtlich des Echos reduziert ist.
  • Ein Vergleich der in den 3 und 7 gezeigten Ausführungsbeispielen mit dem in den 4 und 5 gezeigtem Ausführungsbeispiel illustriert sehr schön, dass die einzelnen Einrichtungen und Module hinsichtlich ihrer Funktionalität durchaus unterschiedlich implementiert sein können. So können durch entsprechende mathematische Umformungen einzelne Schritte neu gruppiert werden. So kann beispielsweise im Rahmen der Echounterdrückungsprozesseinheit 325 eine Implementierung der Gleichungen (22) bis (24) auch anders als in der obigen Beschreibung aufgeführt zusammengefasst werden. So können beispielsweise die betreffenden Berechnungen innerhalb von einem Berechnungsvorgang oder aber auch in mehreren, anders aufgeteilten Berechnungen durchgeführt werden.
  • 8 zeigt ein weiteres Ausführungsbeispiel gemäß der vorliegenden Erfindung in Form einer Vorrichtung 200 zur Berechnung von Steuerinformationen für ein akustisches Unterdrückungsfilter 210, welches ebenfalls in der Vorrichtung 200 umfasst ist. Das in 8 gezeigte Ausführungsbeispiel unterstreicht hierbei, dass Ausführungsbeispiele auch im Rahmen anderer akustischer Echounterdrückungsansätze implementiert und eingebettet werden können. Ein weiteres Ausführungsbeispiel, was einen zweiten unterschiedlichen Ansatz hinsichtlich der Einbettung des akustischen Echounterdrückungsansatzes darstellt, wird im Rahmen von 9 beschrieben.
  • 8 zeigt hierbei ein Blockdiagramm eines akustischen Echounterdrückungsansatzes gemäß einem Ausführungsbeispiel der vorliegenden Erfindung, wobei das Echoabschätzungsfilter Ĝ[k, m] auf das Eingangssignalspektrum X[k, m] angewendet wird.
  • Die Vorrichtung 200 weist einen Lautsprecher 100 sowie ein Mikrofon 110 auf. Das Lautsprechersignal x[n] wird einer Zeit/Frequenz-Transformationseinrichtung 330-1 in Form einer diskreten Fourier-Transformationsanalysebank (DFT = discrete Fourier transform = diskrete Fourier-Transformation) zugeführt, welche das Signal in die Frequenzdomäne transferiert. Sie gibt an ihrem Ausgang das Spektrum X[k, m] aus, welches einerseits einer Verzögerungseinrichtung 340 und andererseits einer ersten Wertebestimmungssubeinrichtung 230a einer Wertebestimmungseinrichtung 230 bereitgestellt wird. Das Spektrum X[k, m] kann hierbei reellwertig oder auch komplexwertig sein.
  • Entsprechend wird das Mikrofonsignal y[n] des Mikrofons 110 einer zweiten Zeit/Frequenz-Transformationseinrichtung 330-2 zugeführt, welche an ihrem Ausgang ein entsprechendes reelwertiges oder komplexwertiges Spektrum Y[k, m] ausgibt. Dieses wird einerseits einer zweiten Wertebestimmungssubeinrichtung 230b der Wertebestimmungseinrichtung 230 bereitgestellt und andererseits direkt als Eingangssignal einem akustischen Unterdrückungsfilter 210 zugeführt.
  • Die beiden Wertebestimmungssubeinrichtungen 230a, 230b sind hierbei ausgebildet, um ein Betragsquadrat der betreffenden Spektren zu erzeugen und einer Einheit 470 bereitzustellen, welche eine Abschätzung des Filters Ĝ[k, m] und eine Abschätzung des Verzögerungswerts d(k, m) gemäß einem Ausführungsbeispiel der vorliegenden Erfindung bestimmt. Die Einheit 470 übernimmt somit teilweise die Aufgaben und Funktionen der Mittelwertbestimmungseinrichtung 250, der Modifizierungseinrichtung 260 und der Verzögerungswertberechnungseinrichtung 380. Diese sind somit zumindest teilweise in den betreffenden Schaltkreisen und Elementen der Einheit 470 umfasst. Die Einheit 470 ist aus diesem Grunde mit einem Eingang der Verzögerungseinrichtung 340 gekoppelt, um den aktuellen Verzögerungswert d(k, m) (= d) der Verzögerungseinrichtung 340 bereitzustellen. Hinsichtlich der Bestimmung des Filters Ĝ[k, m] kann dies beispielsweise gemäß Gleichung (18) folgend implementiert sein.
  • Die Verzögerungseinrichtung 340 erzeugt aus dem ihr zugeführten Spektrum X[k, m] eine verzögerte Version X[k – d (k, m), m]. Dieses verzögerte Lautsprecherspektrum wird dann einem Echoabschätzungsfilter 480 zur Verfügung gestellt, der mit der Verzögerungseinrichtung 340 gekoppelt ist.
  • Darüber hinaus ist das Echoabschätzungsfilter 480 ebenfalls mit der Einheit 470 gekoppelt, über die dieser das eigentlichen Echoabschätzungsfilter in Form der zugehörigen Filterkoeffizienten erhält. Das Echoabschätzungsfilter 480 führt somit bei dem in 8 gezeigten Ausführungsbeispiel die Funktionalität der Gleichung (24) durch, und ist somit als Teil der Steuerinformationsberechnungseinrichtung 270 aufzufassen.
  • Hinsichtlich der Phasenlage des Echoabschätzungsfilters Ĝ[k, m] kann diese aus dem spektralen, zeitlichen oder einer Kombination aus beiden abgeschätzt werden. Darüber hinaus besteht selbstverständlich ebenfalls die Möglichkeit, die Phasenlage auf eine andere Art und Weise festzulegen, beispielsweise indem eine feste Phasenlage einem jeden der Koeffizienten zugeordnet wird. So kann beispielsweise eine Phase von 0° jedem einzelnen der Koeffizienten Ĝ[k, m] zugeordnet werden.
  • Das Echoabschätzungsfilter 480 filtert das eingehende Signal, so dass an einem Ausgang das Signal Ŷ[k, m] bereitsteht, welches über eine weitere Wertebestimmungssubeinrichtung 230c einer weiteren Wertebestimmungseinrichtung 230' einer Berechnungseinrichtung für die Steuerinformationen 360 zur Verfügung gestellt wird. Analog werden die von der zweiten Zeit/Frequenz-Transformationseinrichtung 330-2 ausgegebene Mikrofonspektren Y[k, m] ebenfalls einer vierten Wertebestimmungssubeinrichtung 230d der Wertebestimmungseinrichtung 230' bereitgestellt, die ihrerseits ebenfalls mit einem Ausgang an die Berechnungseinrichtung für die Steuerinformationen 360 gekoppelt ist. Die beiden Wertebestimmungssubeinrichtungen 230c und 230d sind wiederum ausgebildet, um ein Betragsquadrat der ihnen zur Verfügung gestellten Spektren zu berechnen. Die weitere Wertebestim mungseinrichtung 230' kann hierbei der in 8 nicht gezeigten Steuerinformationsberechnungseinrichtung 270 funktional zugeschlagen werden.
  • Die Berechnungseinrichtung für die Steuerinformationen 360 ist auch. hier wiederum ausgebildet, um die Echounterdrückungskoeffizienten H[k, m] zu berechnen und diese dem akustischen Unterdrückungsfilter 210 über einen entsprechenden Steuereingang zur Verfügung zu stellen.
  • Da, wie bereits zuvor erläutert wurde, der Ausgang der zweiten Zeit/Frequenz-Transformationseinrichtung 330-2 ebenfalls mit dem Eingang des akustischen Unterdrückungsfilters 210 gekoppelt ist, ist dieser in der Lage, ein hinsichtlich des Echos unterdrücktes Spektrum E[k, m] zu berechnen und einer nachgeschalteten Frequenz/Zeit-Transformationseinrichtung 370 in Form einer inversen diskreten Fourier-Transformationsfilterbank zur Verfügung zu stellen. diese auch als Synthesefilterbank bezeichnete Frequenz/Zeit-Transformationseinrichtung stellt an ihrem Ausgang ein echounterdrücktes Zeitsignal e[n] zur Verfügung.
  • Das in 8 gezeigte Ausführungsbeispiel ermöglicht so eine Echoabschätzung basierend auf dem Lautsprecherspektrum. Wie die 8 zeigt, wird die Verzögerung bzw. der Verzögerungswert d[k, m] und das Echoabschätzungsfilter Ĝ[k, m] auf das Lautsprecherspektrum X[k, m] angewendet, um eine Abschätzung des Echospektrums Ŷ[k, m] zu erhalten. Das Echounterdrückungsfilter H[k, m] wird dann basierend auf der Leistung oder der Größe des Spektrums des abgeschätzten Spektrums |Ŷ[k, m|2 und dem Leistungs- oder Größenspektrum des Mikrofonsignals Y[k, m] berechnet.
  • An dieser Stelle sollte darauf hingewiesen werden, dass in dem Fall, dass das Echoabschätzungsfilter bezüglich eines kritischen Bandes, wie dies im weiteren Verlauf noch erläutert wird, bestimmt wird, eine entsprechende Interpolation gegebenenfalls durchgeführt werden kann, um eine in der STFT-Domäne angesiedelte Version des Echoabschätzungsfilters zu erhalten.
  • 9 zeigt ein weiteres Ausführungsbeispiel der vorliegenden Erfindung in Form einer Vorrichtung 200 zusammen mit einem akustischen Unterdrückungsfilter 210, welcher ebenfalls in der Vorrichtung 200 implementiert ist. Im Unterschied zu dem in 8 gezeigten Ausführungsbeispiel basiert das in 9 gezeigte auf einem Ansatz einer akustischen Echounterdrückung, wobei das Echoabschätzungsfilter Ĝ[k, m] auf das Leistungsspektrum des Eingangssignals |X[k, m]|2 angewendet wird.
  • Darüber hinaus unterscheiden sich die in 9 und 8 gezeigten Ausführungsbeispiele hinsichtlich ihrer strukturellen Merkmale jedoch nur sehr geringfügig. Genauer gesagt unterscheiden sich im Wesentlichen hinsichtlich der Anordnung der Wertebestimmungssubeinrichtungen 230a und 230c. Zur Vereinfachung der Darstellung sind in 9 die Wertebestimmungseinrichtungen 230, 230' nicht eingezeichnet.
  • Genauer gesagt ist die Wertebestimmungssubeinrichtung 230a nunmehr direkt hinter die erste Zeit/Frequenz-Transformationseinrichtung 330-1 geschaltet, so dass nicht nur der Einheit 470, sondern auch der Verzögerungseinrichtung 340 bereits das Leistungsspektrum des Lautsprechersignals X[k, m] bereitgestellt wird. Entsprechend erzeugt die Verzögerungseinrichtung 340 ebenfalls eine verzögerte Form des Leistungsspektrums und das Echoabschätzungsfilter 480 Gleichung (24) folgend einen entsprechenden Betragsfrequenzgang, welche dann der Berechnungseinrichtung für die Steuerinformationen 360 direkt ohne zusätzliche Wertebestimmungssubeinrichtung 230c bereitgestellt wird. Anders ausgedrückt kann durch die Verlagerung der Wertebestimmungssubeinrichtung 230a „vor" die Verzögerungseinrichtung 340 eine Implementierung der dritten Wertebestimmungssubeinrichtung 230c gegebenenfalls entfallen. Ebenso kann hier eine gezielte Definition oder Festlegung der Phasen oder Phasenlagen des Echoabschätzungsfilters Ĝ[k, m] eingespart werden.
  • Darüber hinaus unterscheiden sich die beiden in den 8 und 9 gezeigten Ausführungsbeispiele der vorliegenden Erfindung jedoch nicht signifikant. Lediglich im Bereich einiger funktionaler Merkmale und einiger Berechnungsvorschriften können sich Abweichungen ergeben, die sich aufgrund anderer zugeführter Signale und Informationen der einzelnen Einrichtungen ergeben.
  • 9 zeigt somit eine Echoabschätzung basierend auf dem Lautsprecherleistungsspektrum oder Lautsprechergrößenspektrum. Dies stellt einen alternativen Ansatz dar, bei dem der Verzögerungswert d(k, m) und das Echoabschätzungsfilter Ĝ[k, m] auf das Leistungs- oder Größenspektrum |X[k, m]|2 des Lautsprechersignals angewendet wird, um eine Abschätzung für das Leistungs- oder das Größenspektrum Ŷ[k, m] des Echosignals zu erhalten.
  • Im Vergleich zu dem im Zusammenhang mit 8 erörterten Ansatz wird also das Echounterdrückungsfilter H[k, m] wiederum basierend auf dem Leistungs- oder Größenspektrum des geschätzten Echobetrags |Ŷ[k, m]|2 und dem Leistungs- oder Größenspektrum des Mikrofonsignals |Y[k, m]|2 berechnet.
  • Bei den in den 8 und 9 gezeigten Ausführungsbeispielen können die Verzögerungswerte d(k, m) sowohl hinsichtlich der Zeit als auch hinsichtlich der aktuellen Frequenz variieren. Selbstverständlich können die im Rahmen der Verzögerungseinrichtung 340 verwendeten Verzögerungswerte für die einzelnen Bandpasssignale bzw. Frequenzbereiche identisch gewählt werden.
  • 10 zeigt ein weiteres Ausführungsbeispiel der vorliegenden Erfindung, welches hinsichtlich seiner Struktur dem in 2 gezeigten Ausführungsbeispiel ähnlich ist. Die in den 10 und 2 gezeigten Ausführungsbeispiele unterscheiden sich jedoch dahingehend, dass das in 10 gezeigte Ausführungsbeispiel eine Vorrichtung 200 für eine Multikanalvariante ist. Strukturell unterscheiden sich die in den 2 und 10 gezeigten Ausführungsbeispiele daher nur geringfügig, weshalb wiederum auf die Beschreibung im Zusammenhang mit 2 verwiesen wird.
  • Im Unterschied jedoch zu der in 2 gezeigten Ausführungsform einer Vorrichtung 200 weist die in 10 gezeigte Ausführungsform 200 eine Mehrzahl von Eingängen 240-1, 240-2, ... auf, die es ermöglichen, der Vorrichtung 200 eine Mehrzahl entsprechender Eingangssignale der Gruppe von Signalen zur Verfügung zu stellen, wie sie zuvor definiert wurden. So sind die Eingänge 240-1, 240-2, ... der Mehrzahl von Eingängen mit einer Kombinationseinrichtung 490 gekoppelt, die aus den an den Eingängen 240 eingehenden Signalen ein einziges, kombiniertes Signal erzeugen, welches dann den weiteren Komponenten der Vorrichtung 200 zur Verfügung gestellt wird. Genauer gesagt wird dieses kombinierte Signal der Kombinationseinrichtung 490 wiederum einer Wertebestimmungseinrichtung 230, einer Mittelwertbestimmungseinrichtung 250, einer Modifizierungseinrichtung 260 und einer Steuerinformationsberechnungseinrichtung 270 zur Verfügung gestellt, die wiederum entsprechende Steuerinformationen bereitstellt, wie dies oben beschrieben wurde.
  • Das in 10 gezeigte Ausführungsbeispiel unterscheidet sich von dem in 2 gezeigten ferner darin, dass das akustische Unterdrückungsfilter 210 nunmehr Subfilter 210-1, 210-2, ... umfasst, die je nach konkreter Ausgestaltung des betreffenden Ausführungsbeispiels ebenfalls mit den Eingangssignalen, welche an den Eingängen 240 der Vorrichtung 200 bereitgestellt werden, oder aber mit anderen Signalen, die über optionale zusätzliche Eingänge 280-1, 280-2, ... der Vorrichtung 200 ebenfalls bereitgestellt werden, versorgt werden können. Anders ausgedrückt kann, je nach konkreter Implementierung, jedes einzelne Subfilter 210-1, 210-2 des akustischen Unterdrückungsfilters 210 eines der an den Eingängen 240-1, 240-2, zur Verfügung gestellte Signal oder ein optionales anderes Signal bereitgestellt werden. Ein solches Signal könnte über einen entsprechenden optionalen Eingang 280-1, 280-2, ... an die Filter 210-1, 210-2, ... herangeführt werden.
  • Die Steuerinformationen der Steuerinformationsberechnungseinrichtung 270 werden jedoch allen Subfiltern 210-1, 210-1, ... des akustischen Unterdrückungsfilters 210 parallel zur Verfügung gestellt. Daher sind auch alle Subfilter 210 entsprechend mit dem Ausgang der Steuerinformationsberechnungseinrichtung 270 gekoppelt. Die einzelnen Subfilter 210-1, 210-2, ... stellen die dann echoreduzierten Ausgangssignale an entsprechenden Ausgängen 290-1, 290-2, ..., mit denen diese gekoppelt sind, bereit.
  • Während also bisher Ausführungsbeispiele der vorliegenden Erfindung ausschließlich für einen Einzelkanalfall erörtert wurden, bei dem lediglich ein Lautsprechersignal und ein Mikrofonsignal verfügbar sind, wird nunmehr ebenfalls der Multikanalfall betrachtet. Wie im Weiteren noch beschrieben wird, sind Ausführungsbeispiele der vorliegenden Erfindung nicht auf den Einzelkanalfall beschränkt, sondern können analog auch auf akustische Multikanal-Echounterdrückungssysteme angewendet werden.
  • Bezeichnet Xl[k, m] die STFT-Domänen-Darstellungen eines l-ten Lautsprechersignals, wird zunächst über die Kombinationseinrichtung 490 ein gemeinsames Leistungsspektrum für alle Lautsprecherkanale berechnet, indem die Spektren der einzelnen Lautsprechersignale gemäß
    Figure 00530001
    kombiniert werden. Hierbei bezeichnet L die Anzahl der Lautsprecherkanäle und 1 einen Index der Kanäle im Bereich zwischen 0 und L – 1. Es handelt sich hierbei um eine nicht negative ganze Zahl.
  • Analog wird ein gemeinsames Leistungsspektrum für die Mikrofonkanäle gemäß
    Figure 00540001
    berechnet, wobei Yp[k, m] ein Signal eines p-ten Mikrofons bezeichnet und P als natürliche Zahl die Anzahl der Mikrofone widerspiegelt. Der Index p bezeichnet die einzelnen Mikrofonsignale und liegt im Bereich zwischen 0 und P – 1. Die Indizes l und p, wie der bereits zuvor beschriebene Index m, laufen also jeweils in dem Wertebereich von 0 bis L – 1, P – 1 bzw. M – 1.
  • Kombinationen, wie sie beispielsweise in den Gleichungen (25) und (26) enthalten sind, können durch die entsprechenden Kombinationseinrichtungen auch unter Verwendung anderer Berechnungs- oder Ermittelungsvorschriften implementiert werden. Wird beispielsweise in den Gleichungen (25) und (26) jeweils durch die Parameter L bzw. P dividiert, handelt es sich um eine arithmetische Mittelung. Aus diesem Grund werden die Kombinationseinrichtungen teilweise auch als Mittelungseinrichtungen bezeichnet.
  • Das so beabsichtigte Modell für die Leistungsspektren der Echos wird analog zu Gleichung (7) gegeben durch |Y[k, m]|2 ≈ |G[k, m]|2·|Xd[k, m]|2 + |W[k, m]|2, (27)wobei in dem Multikanalfall die Leistungsspektren |X[k, m]|2 und |Y[k, m]|2 durch Gleichung (25) und (26) gegeben sind.
  • Selbstverständlich werden hierbei ebenfalls entsprechend zeitlich verzögerte Signale wie zuvor beschrieben erzeugt.
  • Zur Bestimmung der Echoabschätzungsfilter |G[k, m]|2 wird, wie zuvor beschrieben wurde, ein entsprechender Ansatz verwendet, bei dem jedoch die gemeinsamen Lautsprecher- und gemeinsamen Mikrofonleistungsspektren verwendet werden, wie sie oben definiert sind. Das gleiche gilt ebenfalls für die Abschätzung der Verzögerungswerte d, die jeweils für die gemeinsamen Leistungsspektren der Lautsprecherkanäle berechnet werden.
  • Die eigentliche Echounterdrückung wird dann für jedes Mikrofonsignal separat durchgeführt, wobei jedoch die gleichen Echounterdrückungssfilter für jedes der Mikrofonkanäle verwendet wird. Es gilt somit Ep[k, m] = H[k, m]·Yp[k, m] (28)mit p = 0, 1, ..., P – 1. Entsprechend werden, wie im Zusammenhang mit 10 beschrieben wurde, für jedes der Mikrofonsignale ein entsprechendes echoreduziertes Signal zunächst in der Frequenzdomäne Ep[k, m] bestimmt, welches dann in die Zeitdomäne überführt werden kann.
  • Bei dem in 10 gezeigten Ausführungsbeispiel können selbstverständlich unterschiedliche Anzahlen von Signalen, die an den Eingängen 240 bereitgestellt werden, und Signalen, die an den Eingängen 280 bereitgestellt werden, verwendet werden. Es bietet sich lediglich an, für jedes der zu verarbeitenden Signale einen entsprechenden separaten akustischen Unterdrückungssubfilter 210 zu implementieren, sofern nicht eine parallele Berechnung Weiterverarbeitung von Kanälen erstrebenswert ist.
  • Auch können selbstverständlich Ausführungsbeispiele der vorliegenden Erfindung derart kombiniert werden, dass lediglich ein Mikrofonsignal mit einer Mehrzahl von Lautsprechersignalen kombiniert wird, so dass lediglich bezüglich der Lautsprechersignale die zusätzlichen Komponenten implementiert werden. Analog kann auch eine Implementierung verwendet werden, bei der lediglich ein Lautsprechersignal einer Mehrzahl von Mikrofonsignalen gegenübersteht. Während die erste Situation beispielsweise bei Autofreisprechanlagen anzutreffen ist, bei denen die Sprache des anderen Endes über die HiFi-Anlage des Fahrzeugs ausgegeben wird, ist das zweite Szenario im Falle eines Konferenzsystems mit einem einzigen zentralen Lautsprecher und einem Mikrofon für jeden Teilnehmer denkbar. Die Anzahlen der Lautsprechersignale und der Mikrofonsignale kann hierbei selbstverständlich identisch sein oder von einander unterschiedlich.
  • Bevor im Zusammenhang mit den 12 und 13 noch die Frequenzauflösung der betreffenden Ausführungsbeispiele der vorliegenden Erfindung erörtert und Alternativen diskutiert werden, soll zunächst im Zusammenhang mit 11 noch ein Ausführungsbeispiel eines Filters 500 beschrieben werden, welches ebenfalls illustriert, dass die einzelnen Einrichtungen auch flexibel hinsichtlich ihrer schaltungstechnischen und prozessoralen Implementierung angepassbar sind.
  • Das akustische Unterdrückungsfilter 500, wie es in 11 gezeigt ist, entspricht hierbei in weiten Teilen der in 2 gezeigten Vorrichtung 200 in Verbindung mit dem akustischen Unterdrückungsfilter 210. So weist auch das akustische Unterdrückungsfilter 500 in 11 einen Eingang 240 auf, welcher eine Berechnungseinrichtung 510 aufweist, die der Berechnungseinrichtung 220 sehr ähnlich ist. Über einen Eingang 240 wird ein Signal der zuvor beschriebenen Gruppe von Signalen einer Wertebestimmungseinrichtung 230 zugeführt, die Teil der Berechnungseinrichtung 510 ist. Ein Ausgang der Wertebestimmungseinrichtung 230 ist einerseits mit einer Mittelwertbestimmungseinrichtung 250 und andererseits einer Modifizierungseinrichtung 260 gekoppelt. Ein Ausgang der Mittelwertbestimmungsein richtung 250 ist ebenfalls mit der Modifizierungseinrichtung 260 gekoppelt. Insofern unterscheiden sich die strukturelle Beschreibung und die funktionalen Zusammenhänge des akustischen Unterdrückungsfilters 500 von denen der Vorrichtung 200 bis zu diesem Zeitpunkt nicht.
  • Ein Ausgang der Modifizierungseinrichtung 260 ist jedoch nunmehr mit einem Eingang einer akustischen Unterdrückungsfiltereinrichtung 520 gekoppelt, die hinsichtlich ihrer Funktionalität dem akustischen Unterdrückungsfilter 210 entspricht. Im Unterschied zu dem akustischen Unterdrückungsfilter 210 aus 2 ist die akustische Unterdrückungsfiltereinheit 520 jedoch ebenfalls direkt mit dem Eingang 240 oder einem optionalen weiteren Eingang 280 gekoppelt, um eines der betreffenden Signale auf Basis der von der Modifizierungseinrichtung 260 empfangenen modifizierten energiebezogenen Werte zu filtern. Entsprechend ist die akustische Unterdrückungsfiltereinrichtung 520 mit einem Ausgang 290 gekoppelt, an dem das echoreduzierte Signal ausgegeben werden kann.
  • Das in 11 gezeigte Ausführungsbeispiel eines akustischen Unterdrückungsfilters 500 unterscheidet sich somit von einem Ausführungsbeispiel einer Vorrichtung 200, wie sie beispielsweise in 2 gezeigt ist, darin, dass Teile der Funktionalität der Vorrichtung 200 dem eigentlichen akustischen Unterdrückungsfilter bzw. der akustischen Unterdrückungsfiltereinrichtung 520 zugeschlagen sind. Anders ausgedrückt bedeutet dies, dass die akustische Unterdrückungsfiltereinrichtung 520 die Funktionalität der in 2 gezeigten Steuerinformationsberechnungseinrichtung 270 umfasst. Wie bereits zuvor erläutert wurde, kann hier eine funktionale bzw. strukturelle Aufweichung hinsichtlich der zuvor beschriebenen Blöcke auftreten.
  • Hinsichtlich der Frequenzauflösung kann es gegebenenfalls ratsam sein, von der spektralen Auflösung eine STFT-Einheit abzuweichen. Die gleichförmige spektrale Auflösung einer STFT ist häufig nicht sehr gut an die menschliche Wahrnehmung angepasst. Daher kann es vorteilhaft sein, die gleichmäßig beabstandeten spektralen Koeffizienten |X[k, m]|2 und |Y[k, m]|2 in eine Anzahl nicht-überlappender Partitionen oder Gruppen zu gruppieren, wie dies in Referenz [8] dargestellt ist, wobei die Bandbreiten die Frequenzauflösung des menschlichen Hörsystems nachbilden. In diesem Zusammenhang wird auch auf Referenz [9] verwiesen.
  • Für eine Abtastrate (sampling rate) von 16 kHz kann die Verwendung einer DFT-Filterbank der Länge 512 und die Verwendung von 15 Partitionen eine geeignete Auswahl darstellen, wobei jede Partition etwa eine Bandbreite aufweist, die etwa dem Zweifachen der äquivalenten rechteckigen Bandbreite (ERB = equivalent rectangular bandwidths) ist, wie in Referenz [9] beschrieben ist. Die Bänder entsprechen den Partitionen, wie dies in 12 dargestellt ist.
  • So zeigt 12, wie die spektralen Koeffizienten eines gleichförmigen STFT-Spektrums in Partitionen gruppiert werden können, die die nicht gleichmäßige Frequenzauflösung des menschlichen Hörsystems nachbilden. So zeigt 12 als Funktion der Frequenz zwischen 0 Hz bis 8000 Hz eine Anordnung von insgesamt 15 bis 16 Frequenzbändern, die über die mittels einer bei 16 kHz arbeitenden Abtasteinrichtung zugänglich sind. 12 zeigt deutlich, wie die entsprechenden Frequenzpartitionen mit zunehmender Frequenz breiter werden.
  • Die unterschiedlichen Verstärkungsfilter werden nur für die zentralen Frequenzen einer jeden Partition berechnet. Dies führt zusätzlich zu einer geringeren Berechnungskomplexität im Vergleich zu dem Fall einer vollspektralen Auflösung eines gleichförmigen STFT-Spektrums. Bevor der letzte Partitionsverstärkungsfilter auf das gleichförmige Signal des STFT-Spektrums angewendet wird, wird das entsprechende Spektrum unter Verwendung von Hann-Interpolationsfiltern interpoliert.
  • 13a zeigt so mögliche Hann-Interpolationsfilter, die zur Glättung der Verstärkungsfilter als Funktion der Frequenz verwendet werden können. 13b zeigt entsprechende Verstärkungsfilterkoeffizienten in Form einer durchgehenden Linie 600, die durch eine Interpolation der Werte für die Verstärkungsfilter in den Partitionen gewonnen werden können, die durch die in 13b fett dargestellten Punkte repräsentiert werden. Hierbei bezieht sich die in 13b dargestellte Frequenzachse auf der Abszisse ebenso auf die in 13a wiedergegebene Darstellung.
  • Anders ausgedrückt illustriert Teilabbildung 13a die Hann-Filter und Teilabbildung 13b zeigt ein Beispiel von Verstärkungsfilterwerten bevor und nach der Anwendung einer entsprechenden Interpolation. Die Werte zuvor werden hierbei durch die Punkte und die Interpolation durch die Linie 600 wiedergegeben. Die Frequenzmittelung der Verstärkungsfilter führt zu einer Mittelung der Variationen des resultierenden Spektrums als Funktion der Frequenz und reduziert daher tonales, musikartiges Rauschen und andere Artefakte.
  • Ausführungsbeispiele der vorliegenden Erfindung können je nach konkreter Implementierung hierbei das Empfangen wenigstens eines Lautsprechersignals, das Empfangen wenigstens eines Mikrofonsignals, eine Konversion des Lautsprecher- und des Mikrofonsignals zu Kurzzeitspektren, eine Berechnung entsprechender Lautsprecher- und Mikrofonsignalleistungsspektren, Filtern der Lautsprecher- und Mikrofonleistungsspektren, um entsprechende Zeitfluktuationsspektren zu erhalten, ein Berechnen eines Echoabschätzungsfilters zur Abschätzung von Mikrofon-Zeitfluktuationsspektren ausgehend von dem Lautsprecher-Zeitfluktuations-Spektrum, ein Verwenden eines Echounterdrückungsfilters zur Beseitigung des Echos in dem Mikrofonsignalspektrum und ein Konvertieren des Mikrofonsignalspektrums mit unterdrücktem Echo zurück in die Zeitdomäne, um ein echobeseitigtes Ausgangssignal zu erzielen.
  • An dieser Stelle bietet es sich erneut an, darauf hinzuweisen, dass die Bandpasssignale im Rahmen von Ausführungsbeispielen der vorliegenden Erfindung beispielsweise durch eine Fourier-Transformation, eine Transformation in die Subband-Domäne oder durch eine Transformation in die QMF-Domäne durch entsprechende Analysefilterbänke geschehene kann. Eine entsprechende Rücktransformation ist durch entsprechende Synthesefilterbänke möglich.
  • Ebenso bietet es sich an darauf hinzuweisen, dass unterschiedliche Vorrichtungen durch vollständig oder teilweise gleiche Schaltungen, Schaltkreise und Objekte gebildet sein können. Ebenso bietet es sich an darauf hinzuweisen, dass die Mikrofonsignale und die Lautsprechersignale im Allgemeinen unterschiedliche Signale sind. Auch sollte an dieser Stelle erneut darauf hingewiesen werden, dass die im Rahmen der oben beschriebenen Ausführungsbeispielen erhaltenen Zwischenergebnisse nicht zwingend als solche erzeugt werden müssen. Es können vielmehr Ausführungsbeispiele der vorliegenden Erfindung auch unter Verwendung von mathematischen Umformungen implementiert werden, bei denen gegebenenfalls andere Zwischenergebnisse oder gegebenenfalls überhaupt keine Zwischenergebnisse unmittelbar zugänglich sind. Ebenso ist es möglich, die energiebezogenen Werte basierend auf einem abgeleiteten Signal im Falle einer Multikanal-Implementierung zu berechnen, während jedoch die weitere Berechnung auf den individuellen Signalen beruht.
  • Auch sollte darauf hingewiesen werden, dass die oben beschriebenen strukturellen Ausführungsbeispiele in Form von Vorrichtungen und Systemen ebenfalls als Flussdiagramme verstanden werden können, die einzelne Berechnungsschritte, Verfahrensschritte und andere Schritte wiedergeben. Inso fern ist eine getrennte Beschreibung von Verfahren und Vorrichtungen an dieser Stelle nicht notwendig.
  • Im Rahmen der vorliegenden Beschreibung sind bisher im Wesentlichen elektrisch digital codierte Audiosignale betrachtet worden, bei denen im Rahmen eines Echokompensationssystems auch Verzögerungswerte berechnet worden, um diese auf das Lautsprechersignal bzw. ein daraus abgeleitetes Signal anzuwenden. Wie bereits eingangs erläutert wurde, besteht jedoch durchaus auch ein Bedarf bei anderen Signalverarbeitungsschaltungen, einen entsprechenden Verzögerungswert für andere Signale zu bestimmen und gegebenenfalls ein Signal um diesen Verzögerungswert zu verzögern.
  • Als mögliche Einsatzgebiete können hier Kompensationsschaltungen und Kompensationsvorrichtungen genannt werden, bei denen unterschiedliche Signale hinsichtlich ihrer Laufzeit, Phasenlage oder anderer Parameter angeglichen werden sollen. Neben den bereits erwähnten elektrisch digital codierten Audiosignalen können auch andere elektrisch digital codierte Signale einer entsprechenden Verzögerung bedürfen. Gleiches gilt ebenfalls für analoge elektrische Signale, optische analoge Signale und optisch digital codierte Signale. Je nach konkreter Implementierung können hierbei die entsprechenden Informationen in Spannungswerten, in Stromwerten, in Frequenzwerten, in Phasenwerten, in Intensitätswerten oder anderen Größen elektrischer oder optischer Signale codiert sein. Neben den bereits erwähnten Audiosignalen können so beispielsweise Videosignale, allgemeine Datensignale, aber auch Synchronisationssignale und andere Signale einer entsprechenden Verzögerung bedürfen.
  • Trotz der Vielzahl verschiedener Implementierungen werden im weiteren Verlauf auch Ausführungsbeispiele der vorliegenden Erfindung in Form einer Vorrichtung zur Bestimmung eines Verzögerungswerts primär basierend auf digital codierten elektrischen Signalen beschrieben, wobei entsprechende Variationen der Ausführungsbeispiele für die anderen erwähnten Anwendungsgebiete im Anschluss erläutert und beschrieben werden.
  • 14 zeigt eine Vorrichtung 700 zur Berechnung eines Verzögerungswerts d für eine Verzögerungseinrichtung 710. Die Verzögerungseinrichtung 710 ist hierbei eine für die Vorrichtung 700 selber optionale Komponente und als solche in 14 gestrichelt gezeichnet.
  • Die Vorrichtung 700 weist hierbei einen ersten Eingang 720-1 und einen zweiten Eingang 720-2 für ein erstes und ein zweites Signal auf. Wie zuvor erläutert wurde, kann es sich bei diesen Signalen um elektrisch digital codierte Audiosignale aber auch um entsprechend andere Signale handeln. Die Verzögerungseinrichtung 710 ist hierbei eingangsseitig mit dem ersten Eingang 720-1 für das erste Signal gekoppelt. Ausgangsseitig ist die Verzögerungseinrichtung 710 mit einem Ausgang 730 der Vorrichtung 700 gekoppelt, an dem das erste Signal in einer verzögerten Form ausgegeben wird. Die Verzögerungseinrichtung 710 weist darüber hinaus einen Eingang 710a auf, an dem in dieser ein Signal bereitgestellt wird, welches eine Information bezüglich eines Verzögerungswerts aufweist, um den das erste Signal zwischen dem Eingang 720-1 und dem Ausgang 730 verzögert werden soll. Die Verzögerungseinrichtung 710 ist entsprechend ausgebildet, das eingehende erste Signal entsprechend um diesen Verzögerungswert zu verzögern.
  • Die Vorrichtung 700 weist darüber hinaus eine optionale Zeit/Frequenz-Wandlungseinrichtung 740 auf, welche mit beiden Eingängen 720 gekoppelt ist. Sie ist mit einem ersten und einem zweiten Ausgang mit einer Wertebestimmungseinrichtung 750 gekoppelt, die ihrerseits wiederum jeweils über einen Ausgang für ein Signal, welches auf dem ersten Signal und ein Signal, welches auf dem zweiten Signal beruht, mit einer Mittelwertbestimmungseinrichtung 760 und einer Modifizierungseinrichtung 770 gekoppelt. Die Modifizierungseinrichtung 770 weist darüber hinaus zwei zusätzliche weitere Eingänge auf, mit der sie an die Mittelwertbestimmungseinrichtung 760 und ihre beiden Ausgänge für Signale bezüglich des ersten Signals und des zweiten Signals gekoppelt ist.
  • Auch die Modifizierungseinrichtung 770 weist zwei entsprechende Ausgänge bei dem in 14 gezeigten Ausführungsbeispiel einer Vorrichtung 700 auf, die mit einer Verzögerungswertberechnungseinrichtung 780 gekoppelt sind. Diese wiederum weist einen Ausgang auf, der mit dem Steuereingang 710a der Verzögerungseinrichtung 710 gekoppelt ist.
  • Wie bereits im Zusammenhang mit den zuvor beschriebenen Ausführungsbeispielen einer Vorrichtung 200 zur Berechnung von Steuerinformationen und eines akustischen Unterdrückungsfilters 500 beschrieben wurde, sind die beschriebenen Einrichtungen gegebenenfalls Teil einer Berechnungseinrichtung 790, die beispielsweise in Form eines Prozessors ausgeführt sein kann. Optional besteht auch die Möglichkeit, dass einzelne Komponenten, beispielsweise die Verzögerungseinrichtung 710 nicht Teil dieser Berechnungseinrichtung 790 sind.
  • Hinsichtlich ihrer Funktionalität entsprechen die einzelnen Einrichtungen den bereits zuvor beschriebenen Einrichtungen. So ist beispielsweise die Zeit/Frequenz-Wandlungseinrichtung 740 ausgebildet, um jeweils einen Datenblock des ersten und des zweiten Signals in entsprechende spektrale Darstellungen zu verwandeln, die dann im Rahmen der weiteren Vorrichtung weiterverarbeitet werden können. Genauer gesagt gibt die Zeit/Frequenz-Wandlungseinrichtung 740 hierbei eines oder mehrere Bandpasssignale für jedes der beiden Signale aus, denen jeweils eine oder mehrere charakteristische Frequenzen zugeordnet sind. Die Bandpasssignale sind hierbei einer frequenzbezogenen Domäne zugeordnet, bei der es sich wiederum um die eigentliche Fregenzdomäne, eine Subbanddomäne oder die QMF-Domäne handeln kann, um nur drei Beispiele zu nennen.
  • Die Wertebestimmungseinrichtung 750 entspricht hinsichtlich ihrer Funktionalität der der Wertebestimmungseinrichtung 230, so dass hinsichtlich dieser auf die vorangegangenen Ausführungsbeispiele an dieser Stelle verwiesen werden kann. Im Unterschied zu der Werteberechnungseinrichtung 230 in ihrer allgemeinsten und einfachsten Form ist die Wertebestimmungseinrichtung 750 des in 14 gezeigten Ausführungsbeispiels einer Vorrichtung 700 jedoch ausgebildet, um für beide Signale wenigstens einen, einem Bandpasssignal zugeordneten energiebezogenen Wert zu berechnen. Bei weiteren Ausführungsbeispielen der vorliegenden Erfindung ist diese ferner ausgebildet, um eine Mehrzahl oder für alle Bandpasssignale entsprechende energiebezogene Werte, also beispielsweise Energiewerte oder auch Betragswerte der entsprechenden Bandpasssignale zu berechnen. Die verschiedenen Bandpasssignale sind hierbei wiederum unterschiedlichen charakteristischen Frequenzen zugeordnet, wobei für die beiden Signale in einem solchen Fall typischerweise Bandpasssignale berücksichtigt werden, die den gleichen charakteristischen Frequenzen entsprechen.
  • Die Mittelwertbestimmungseinrichtung 760 entspricht hinsichtlich ihrer Funktionalität der Mittelwertbestimmungseinrichtung 250 aus den zuvor beschriebenen Ausführungsbeispielen, wobei auch diese wiederum für beide Signale die entsprechenden Mittelwerte bestimmt. Aus diesem Grund kann auch an dieser Stelle wiederum auf die Beschreibung im Hinblick auf die Mittelwertbestimmungseinrichtung 250 verwiesen werden.
  • Gleiches gilt ebenfalls für die Modifizierungseinrichtung 770, die der Modifizierungseinrichtung 260 der vorangegangenen Ausführungsbeispiele entspricht, wobei auch diese für beide Signale die entsprechenden Modifizierungen durchführt.
  • Die Verzögerungswertberechnungseinrichtung 780 entspricht schließlich der Verzögerungswertberechnungseinrichtung 380 und der Einheit 470 im Hinblick auf die Berechnungswerte des Verzögerungswertes d[k, m]. Aus diesem Grund wird hiermit hinsichtlich der Beschreibung auch für die zugehörigen Beschreibungspassagen im Hinblick auf diese Einrichtungen und Einheiten verwiesen.
  • Anders ausgedrückt kann in Ausführungsbeispielen der vorliegenden Erfindung die Verzögerungswertberechnungseinrichtung 780 beispielsweise so ausgebildet sein, um die durch die Gleichungen (8) bis (10) beschriebenen Funktionen auszuführen. Entsprechend kann in Ausführungsbeispielen der vorliegenden Erfindung die Modifizierungseinrichtung 770 entsprechend ausgebildet sein, um die durch die Gleichungen (13) und (14) beschriebenen Funktionen zu implementieren. Auch die Mittelwertbestimmungseinrichtung 760 kann daher im Grunde genommen dahin gehend aufgefasst werden, dass diese die durch die Gleichungen (15) bis (17) definierten Funktionen implementiert. Die Wertebestimmungseinrichtung 750 kann letztendlich als Einrichtung aufgefasst werden, die bezogen auf die eingehenden Werte der entsprechenden Signale die im Zusammenhang mit 2 bereits erläuterten energiebezogenen Werte für diese berechnet.
  • Auch die Verzögerungseinrichtung 710 entspricht hinsichtlich ihrer Funktionalität nicht zuletzt der Verzögerungseinrichtung 340 sowie entsprechend anderer Komponenten, wie etwa der Zeit/Frequenz-Wandlungseinrichtung 330-1 aus 7, die eine entsprechende Funktionalität mit implementiert. Ebenso können die Berechnungseinrichtung 790 und 220 einander entsprechen. Gleiches gilt auch für die Eingänge 720 und die Ausgänge 730 im Hinblick auf die zuvor beschriebenen Eingänge 240, 280 und Ausgänge 290.
  • Wie diese Erörterung zeigt, sind viele der in den 1 bis 13 gezeigten Vorrichtungen und akustischen Unterdrückungsfilter ebenfalls Ausführungsbeispiele der vorliegen den Erfindung in Form einer Vorrichtung 700, auch wenn diese der Einfachheit halber dort nicht als solche bezeichnet sind.
  • Wie bereits zuvor angesprochen wurde, können Ausführungsbeispiele der vorliegenden Erfindung in Form einer Vorrichtung 700, wie diese beispielsweise in 14 gezeigt ist, zu einer schnelleren und gegebenenfalls auch verbesserten Anpassung eines Verzögerungswerts des ersten Signals bezogen auf das zweite Signal führen. Dies kann beispielsweise bei Laufzeitkompensationsproblematiken, bei denen die entsprechende Differenzen zeitlich nicht konstant sind, im höchsten Maße vorteilhaft sein. Dies wird nicht zuletzt dadurch erreicht, das Rauschanteile und andere stationäre, rauschähnliche Beiträge in der frequenzbezogenen Domäne bezüglich energiebezogener Werte als konstante Werte in Form systematischer Schätzwertabweichungen auftreten, die durch eine entsprechende Mittelwertbestimmung bestimmbar sind. Diese Werte können dann im Rahmen der Modifizierungseinrichtung 770 weiter berücksichtigt werden.
  • Wie bereits in 14 auch gezeigt ist, können die so ermittelten Verzögerungswerte beispielsweise zur Verzögerung der entsprechenden Signale eingesetzt werden. Neben der bereits mehrfach erwähnten Laufzeitkompensation können entsprechende. Verzögerungsschaltungen auch im Rahmen von Echobeseitigungssystemen und anderen Synchronisationsschaltungen zum Einsatz kommen.
  • Darüber hinaus ist es ebenfalls bei Ausführungsbeispielen der vorliegenden Erfindung möglich, eine Vorrichtung 700 als Multikanalvariante zu implementieren. In einem solchen Fall weist eine solche Multikanalvariante einer Vorrichtung 700 eine Mehrzahl von Eingängen 720-1 für das erste Signal, eine Mehrzahl von Eingängen 720-2 für das zweite Signal oder beides auf, wobei im letzt genannten Fall die Anzahlen der Eingänge für die ersten und zweiten Signale identisch oder auch voneinander unabhängig sein können.
  • Bei einer solchen Vorrichtung 700 kann, je nach Art der entsprechenden ersten und zweiten Signale, gegebenenfalls für jeweils ein Signal eine optionale Zeit/Frequenztransformationssubeinrichtung im Rahmen der Zeit/Frequenz-Transformationseinrichtung 740 implementiert sein, um eine Transformation in die Frequenz-Domäne vorzunehmen. Zwischen die Zeit/Frequenz-Transformationseinrichtung 740 und die Wertebestimmungseinrichtung 750 bzw. die zugehörigen Eingänge 720 und die Wertebestimmungseinrichtung 750 ist dann eine Kombinationseinrichtung geschaltet, die die eingehenden ersten Signale und die eingehenden zweiten Signale kombiniert, wie dies im Zusammenhang mit der Kombinationseinrichtung 490 bereits zuvor beschrieben wurde. Die weitere Verarbeitung der Signale erfolgt dann, wie dies oben beschrieben wurde.
  • Eine solche Multikanalvariante einer Vorrichtung 700 umfasst darüber hinaus eine Anzahl von Verzögerungseinrichtungen 710, die typischerweise der Anzahl der Eingänge 720-1 für die ersten Signale entspricht. Diese sind mit ihren Steuereingänge, über die sie die Verzögerungswerte enthalten, parallel mit der Verzögerungswertberechnungseinrichtung 780 gekoppelt, so dass jede von diesen den oder die gleichen Verzögerungswerte erhält.
  • Natürlich kann auch hier die Berechnung der Verzögerungswerte für jedes Bandpasssignal mit seiner charakteristischen Frequenz einzeln, für eine Mehrzahl von Bandpasssignalen oder für alle Bandpasssignale erfolgen, wie dies auch bereits oben beschrieben wurde. Dies ist selbstverständlich ebenfalls im Fall der Vorrichtung 700 implementierbar, wie sie in 14 gezeigt ist, also im Rahmen einer nicht multikanaltauglichen Implementierung.
  • Abhängig von den Gegebenheiten können Ausführungsbeispiele der vorliegenden Erfindung in Form von Verfahren in Hardware oder in Software implementiert werden. Die Implemen tierung kann auf einem digitalen Speichermedium, beispielsweise einer Diskette, einer CD, einer DVD oder einem andren computerlesbaren Speichermedium mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem oder Prozessor zusammenwirken können, dass ein Verfahren gemäß einem Ausführungsbeispiel der vorliegenden Erfindung ausgeführt wird. Allgemein bestehen somit Ausführungsbeispiele der vorliegenden Erfindung auch in einem Software-Programm-Produkt bzw. einem Computer-Programm-Programm bzw. einem Programm-Produkt mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung eines Ausführungsbeispiels eines Verfahrens, wenn das Software-Programm-Produkt auf einem Rechner oder einem Prozessor abläuft. Mit anderen Worten ausgedrückt kann ein Ausführungsbeispiel der vorliegenden Erfindung somit als ein Computer-Programm bzw. Software-Programm bzw. Programm mit einem Programmcode zur Durchführung eines Ausführungsbeispiels eines Verfahrens realisiert werden, wenn das Programm auf einem Prozessor abläuft. Ein Prozessor kann hierbei von einem Computer, einer Chipkarte (smart card), einem anwendungsspezifischen integrierten Schaltkreis (ASIC = application specific integrated circuit), einem System-auf-Chip (SOC = system an chip) oder einem anderen integrierten Schaltkreis (IC = integrated circuit) gebildet sein.
  • Referenzen
    • [1] C. Breining, P. Dreiseitel, E. Hänsler, A. Mader, B. Nitsch, H. Puder, T. Schertler, G. Schmidt, and J. Tilp. Acoustic echo control. IEEE Signal Processing Magazine, 16(4): 42–69, Juli 1999.
    • [2] A. N. Birkett and R. A. Goubran. Limitations of handsfree acoustic echo cancellers due to nonlinear loudspeaker distortion and enclosure vibration effects. In Proc. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, Seiten 13–16, New Paltz, Okt. 1995.
    • [3] G. Schmidt and E. Hänsler. Acoustic echo and noise control: a practical approach. Hoboken: Wiley, 2004.
    • [4] W. L. B. Jeannes, P. Scalart, G. Faucon, and C. Beaugeant. Combined noise and echo reduction in hands-free systems: a survey. IEEE Transactions on Speech and Audio Processing, 9(8): 808–820, Nov. 2001.
    • [5] C. Faller and J. Chef. Suppressing acoustic echo in a sampled auditory envelope space. IEEE Trans. on Speech and Audio Proc., 13(5): 1048–1062, Sept. 2005.
    • [6] C. Faller and C. Tournery. Estimating the delay and coloration effect of the acoustic echo path for low complexity echo suppression. In Proc. Intl. Works. on Acoust. Echo and Noise Control (IWAENC), Sept. 2005.
    • [7] W. Etter and G. S. Moschytz. Noise reduction by noiseadaptive spectral magnitude expansion. J. Audio Eng. Soc., 42: 341–349, Mai 1994.
    • [8] C. Faller and F. Baumgarte. Binaural Cue Coding – Part II: Schemes and applications. IEEE Trans. on Speech and Audio Proc., 11(6): 520–531, Nov. 2003.
    • [9] B. R. Glasberg and B. C. J. Moore. Derivation of auditory filter shapes from notched-noise data. Hear. Res., 47: 103–138, 1990.
  • Anhang A
  • Echoabschätzungsfilter mit systematischer Schätzwertabweichung
  • Im Folgenden wird gezeigt, dass die in Referenz [6] vorgeschlagene Gleichung (11) zu einer nullpunktsverschobenen Abschätzung des Echoabschätzungsfilters |G[k, m]|2 führt. Es wird sich zeigen, dass diese Nullpunktsverschiebung durch den Effekt des stationären Rauschens w[n] in dem Mikrofonsignal hervorgerufen wird.
  • Zunächst gilt E{|Y[k, m]|2|Xd[k, m]|2} = E{|G[k, m]2|Xd[k, m]|2 + |W[k, m]|2|Xd[k, m]|2} = |G[k, m]|2E{|Xd[k, m]|4} + σ2W [k, m]E{|Xd[k, m]|2},wobei σ 2 / W[k, m] = {|W[k, m]|2} die Varianz des stationären Rauschens w[n] innerhalb des Frequenzbands mit dem Index m ist. Darüber hinaus gilt E{|Xd[k, m]|2|Xd[k, m]|2} = E{|Xd[k, m]|4}.
  • Der Echoabschätzungsfilter gemäß Gleichung (11) führt daher zu
    Figure 00700001
  • Hieraus folgt, dass das stationäre Rauschsignal w[n] einen Nullpunkts-Term in die Abschätzung des Echoabschätzungsfilters einführt. Ferner impliziert Gleichung (29), dass die Nullpunktsverschiebung in dem Echoabschätzungsfilter mit steigender Rauschvarianz größer wird.
  • Anhang B
  • Echoabschätzungsfilter ohne systematische Schätzwertabweichung
  • In dem Rahmen der vorliegenden Beschreibung vorgeschlagenen Verfahren, um die Nullpunktsverschiebung los zu werden, die in die Abschätzung des Echoabschätzungsfilters eingebracht wird, wird die Abschätzung mit Hilfe einer zentrierten Zentralstatistik |Y[k, m]|2 und |Xd[k, m]2 berechnet. Analog zu dem Vorgehen in Anhang A führt das hier vorgeschlagene Verfahren zu dem folgenden Ausdruck: E{Y ~[k, m]X ~d[k, m]} = E{(|Y[k, m]2 – E{|Y[k, m]|2})(|Xd[k, m]2 – E{|Xd[k, m]|2})} = E{(|G[k, m]|2|Xd[k, m]|2 + |W[k, m]|2 – E{|Y[k, m]|2})·(|Xd[k, m]|2 – E{|Xd[k, m]|2})} = E{(|G[k, m]|2|Xd[k, m]|4 – |G[k, m]2|Xd[k, m]|2E{Xd[k, m]|2} + |W[k, m]|2|Xd[k, m]|2 – |W[k, m|2E{|Xd[k, m]|2} – E{|Y[k, m]|2}E{|Xd[k, m]|2})} = E{(|G[k, m]|2|Xd[k, m]|4 – |G[k, m]|2|Xd[k, m]|2E{|Xd[k, m]2})} = |G[k, m]|2(E{|Xd[k, m]|4} – (E{|Xd[k, m]|2})2)
  • Darüber hinaus gilt E{X ~d[k, m]X ~d[k, m]} = E{(|Xd[k, m]|2 – E{|Xd[k, m]2})2} = E{|Xd[k, m]|4} – (E{|Xd[k, m]|2})2
  • Der Echoabschätzungsfilter gemäß Gleichung (18) führt daher zu
    Figure 00720001
  • Es ergibt sich somit, dass Gleichung (18) zu einer korrekten Abschätzung der Echoleistungstransferfunktion in dem Fall eines stationären Hintergrundgeräuschs diesseitig führt, welches in dem Mikrofonsignal enthalten ist.
  • 100
    Lautsprecher
    110
    Mikrofon
    120
    akustische Umgebung
    130
    Lautsprechersignal
    140
    Mikrofonsignal
    150
    direkter Übertragungsweg
    160
    indirekter Übertragungsweg
    170
    Echobeseitigungsprozessschaltung
    200
    Vorrichtung
    210
    akustisches Unterdrückungsfilter
    220
    Berechnungseinrichtung
    230
    Wertebestimmungseinrichtung
    240
    Eingang
    250
    Mittelwertbestimmungseinrichtung
    260
    Modifizierungseinrichtung
    270
    Steuerinformationsberechnungseinrichtung
    280
    weiterer Eingang
    290
    Ausgang
    300
    Einheit
    310
    Abschätzungseinrichtung
    320
    Echoabschätzungsfilter
    325
    Echounterdrückungsprozessschaltung
    330
    Zeit/Frequenz-Transformationseinrichtung
    340
    Verzögerungseinrichtung
    350
    Abschätzungseinrichtung
    360
    Berechnungseinrichtung für Steuerinformationen
    370
    Frequenz/Zeit-Transformationseinrichtung
    380
    Verzögerungswertberechnungseinrichtung
    390
    Eingang
    400
    Kohärenzfunktionsberechnungseinrichtung
    410
    Echoprädiktionsgewinnberechnungseinrichtung
    420
    Optimierungseinrichtung
    430
    Kurzzeitleistungsspektrum
    440
    gemitteltes Kurzzeitleistungsspektrum
    450
    Klammer
    460
    Pfeil
    470
    Einheit
    480
    Echoabschätzungsfilter
    490
    Kombinationsseinrichtung
    500
    akustisches Unterdrückungsfilter
    510
    Berechnungseinrichtung
    520
    akustisches Unterdrückungsfilter
    600
    Linie
    700
    Vorrichtung
    710
    Verzögerungseinrichtung
    720
    Eingang
    730
    Ausgang
    740
    Zeit/Frequenz-Wandlungseinrichtung
    750
    Wertebestimmungseinrichtung
    760
    Mittelwertbestimmungseinrichtung
    770
    Modifizierungseinrichtung
    780
    Verzögerungswertberechnungseinrichtung
    790
    Berechnungseinrichtung
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • - WO 2006/111370 A1 [0005]

Claims (32)

  1. Vorrichtung (200) zur Berechnung von Steuerinformationen für ein Unterdrückungsfilter (210) zur Filterung eines ersten Audiosignals, um ein Echo zu unterdrücken, welches auf einem zweiten Audiosignal beruht, mit folgenden Merkmalen: einer Berechnungseinrichtung (220), die eine Wertebestimmungseinrichtung (230) zur Bestimmung wenigstens eines energiebezogenen Wertes für ein Bandpasssignal von wenigstens zwei zeitlich aufeinanderfolgender Datenblöcken von wenigstens einem Signal einer Gruppe von Signalen aufweist, wobei die Gruppe von Signalen das erste Audiosignal, das zweite Audiosignal und ein von dem ersten Audiosignal oder dem zweiten Audiosignal abgeleitetes Signal umfasst; wobei die Berechnungseinrichtung (220) ferner eine Mittelwertbestimmungseinrichtung (250) zur Bestimmung wenigstens eines Mittelwertes des wenigstens einen bestimmten energiebezogenen Wertes für das Bandpasssignal umfasst; wobei die Berechnungseinrichtung (220) ferner eine Modifiziereinrichtung (260) zum Modifizieren des wenigstens einen energiebezogenen Wertes für das Bandpasssignal basierend auf dem bestimmten Mittelwert für das Bandpasssignal umfasst; und wobei die Berechnungseinrichtung (220) ferner eine Steuerinformationsberechnungseinrichtung (270) zur Berechnung der Steuerinformationen für das Unterdrückungsfilter (210) basierend auf dem wenigstens einen modifizierten energiebezogenen Wert für das Bandpasssignal umfasst.
  2. Vorrichtung (200) nach Anspruch 1, bei der die Wertebestimmungseinrichtung (230) ausgebildet ist, so dass der energiebezogene Wert proportional zu einer Potenz eines Wertes des Bandpasssignals zu einem positiven, geradzahligen Exponenten ist, oder bei der die Wertebestimmungseinrichtung (230) ausgebildet ist, so dass der energiebezogene Wert proportional zu einer Potenz eines Betrags des Wertes des Bandpasssignals zu einer positiven reellen Zahl als Exponent der Potenz ist.
  3. Vorrichtung (200) nach einem der vorhergehenden Ansprüche, bei der die Wertebestimmungseinrichtung (230) ausgebildet ist, um als energiebezogenen Wert einen Energiewert oder einen zu einem Energiewert proportionalen Wert zu verwenden.
  4. Vorrichtung (200) nach einem der vorhergehenden Ansprüche, bei der die Werteberechnungseinrichtung (230) ausgebildet ist, um eine Mehrzahl von energiebezogenen Werten für den gleichen Datenblock, jedoch für unterschiedliche Bandpasssignale mit unterschiedlichen charakteristischen Frequenzen zu bestimmen.
  5. Vorrichtung (200) nach einem der vorhergehenden Ansprüche, bei der die Werteberechnungseinrichtung (230) ausgebildet ist, um energiebezogene Werte für den gleichen Datenblock, jedoch für alle Bandpasssignale mit unterschiedlichen charakteristischen Frequenzen zu bestimmen.
  6. Vorrichtung (200) nach einem der Ansprüche 4 oder 5, bei der die Mittelwertbestimmungseinrichtung (230) ausgebildet ist, um einen Mittelwert für jeden der bestimmen energiebezogenen Werte der Bandpasssignale zu bestimmen, bei der die Modifizierungseinrichtung (260) ausgebildet ist, um jeden der bestimmten ener giebezogenen Werte basierend auf dem zugehörigen bestimmten Mittelwert zu modifizieren, und bei der die Steuerinformationsberechnungseinrichtung (270) ausgebildet ist, um die Steuerinformationen basierend auf allen modifizierten energiebezogenen Werten zu berechnen.
  7. Vorrichtung (200) nach einem der vorhergehenden Ansprüche, bei der die Mittelwertberechnungseinrichtung (250) ausgebildet ist, um den wenigstens einen Mittelwert basierend auf einer gleitenden Mittelung zu bestimmen.
  8. Vorrichtung (200) nach Anspruch 7, bei der die Mittelwertberechnungseinrichtung (250) ausgebildet ist, um die gleitende Mittelung nur basierend auf einem aktuellen Datenblock des Signals der Gruppe von Signalen und basierend auf Datenblöcken des Signals der Gruppe von Signalen zu berechnen, die zeitlich vor dem aktuellen Datenblock liegen.
  9. Vorrichtung (200) nach einem der vorhergehenden Ansprüche, bei der die Modifiziereinrichtung (260) ausgebildet ist, um den wenigstens einen energiebezogenen Wert basierend auf einer Subtraktion des bestimmten Mittelwertes für das betreffende Bandpasssignal zu modifizieren.
  10. Vorrichtung (200) nach einem der vorhergehenden Ansprüche, bei der die Berechnungseinrichtung (220) ferner eine Zeit/Frequenz-Transformationseinrichtung (330) aufweist, die ausgebildet ist, so dass das wenigstens eine Signal basierend auf dem Datenblock des Signals als Subbandsignal einer frequenzbasierten Domäne angehört.
  11. Vorrichtung (200) nach einem der vorhergehenden Ansprüche, bei der die Berechnungseinrichtung (220) ausgebildet ist, um für wenigstens das erste Audiosignal oder ein auf dem ersten Audiosignal basierendes Signal, sowie das zweite Audiosignal oder ein auf dem zweiten Audiosignal basierendens Signal jeweils wenigstens einen energiebezogenen Wert zu bestimmen, jeweils wenigstens einen Mittelwert zu bestimmen, jeweils die wenigstens einen energiebezogenen Werte basierend auf den jeweiligen Mittelwerten zu modifizieren und die Steuerinformationen basierend auf den jeweils modifizierten energiebezogenen Werten zu berechnen.
  12. Vorrichtung (200) nach einem der vorhergehenden Ansprüche, bei der die Berechnungseinrichtung (220) ausgebildet ist, um basierend auf einer Mehrzahl von ersten Audiosignalen, einer Mehrzahl von zweiten Audiosignalen oder einer Mehrzahl von aus ersten Audiosignalen oder zweiten Audiosignalen abgeleiteter Signalen das wenigstens eine Signal der Gruppe von Signalen durch eine Kombination derselben zu bilden.
  13. Vorrichtung nach Anspruch 12, bei der die Berechnungseinrichtung (220) ausgebildet ist, um die gleichen Steuerinformationen für das Unterdrückungsfilter (210) für jedes Signal der Mehrzahl von ersten Audiosignalen, der Mehrzahl von zweiten Audiosignalen oder der Mehrzahl von aus ersten Audiosignalen oder zweiten Audiosignalen abgeleiteten Signalen zu berechnen.
  14. Vorrichtung (200) nach einem der vorhergehenden Ansprüche, bei der die Berechnungseinrichtung (220) ferner eine Verzögerungseinrichtung (340) für wenigstens eines der Signale der Gruppe der Signale oder für wenigstens einen energiebezogenen Wert eines Bandpasssignals eines Signals der Gruppe von Signalen umfasst, wobei die Verzögerungseinrichtung (340) ausgebildet ist, um das betreffende Signal o der den betreffenden energiebezogenen Wert um einen Verzögerungswert zu verzögern.
  15. Vorrichtung (200) nach Anspruch 14, bei der die Verzögerungseinrichtung (340) ausgebildet ist, so dass der Verzögerungswert auf wenigstens einem modifizierten energiebezogenen Wert beruht.
  16. Vorrichtung (200) nach einem der Ansprüche 14 oder 15, bei der die Verzögerungseinrichtung (340) ausgebildet ist, so dass der Verzögerungswert auf einem maximalen Wert einer Kohärenzfunktion basiert, wobei die Kohärenzfunktion auf wenigstens einem modifizierten energiebezogenen Wert beruht.
  17. Vorrichtung (200) nach einem der Ansprüche 14 bis 16, bei der Verzögerungseinrichtung (340) ausgebildet ist, so dass Verzögerungswerte für unterschiedliche Bandpasssignale zu unterschiedlichen charakteristischen Frequenzen voneinander unabhängig sind.
  18. Vorrichtung (200) nach einem der vorhergehenden Ansprüche, bei der die Vorrichtung (200) oder die Berechnungseinrichtung (200) ferner ein Unterdrückungsfilter (210) zur Filterung des zweiten Audiosignals basierend auf den berechneten Steuerinformationen umfasst.
  19. Vorrichtung (200) nach einem der vorhergehenden Ansprüche, bei der die Vorrichtung (200) so ausgebildet ist, dass das erste Audiosignal ein Lautsprechersignal und das zweite Audiosignal ein Mikrofonsignal ist.
  20. Unterdrückungsfilter (500) zur Filterung eines zweiten Audiosignals, um ein Echo zu unterdrücken, welches auf einem ersten Audiosignal beruht, mit folgenden Merkmalen: einer Berechnungseinrichtung (220), die eine Wertebestimmungseinrichtung (230) zur Bestimmung wenigstens eines energiebezogenen Wertes für ein Bandpasssignal von wenigstens zwei zeitlich aufeinanderfolgender Datenblöcken von wenigstens einem Signal einer Gruppe von Signalen aufweist, wobei die Gruppe von Signalen das erste Audiosignal, das zweite Audiosignal und ein von dem ersten Audiosignal oder dem zweiten Audiosignal abgeleitetes Signal umfasst; wobei die Berechnungseinrichtung (220) ferner eine Mittelwertbestimmungseinrichtung (250) zur Bestimmung wenigstens eines Mittelwertes des wenigstens einen bestimmten energiebezogenen Wertes für das Bandpasssignal umfasst; wobei die Berechnungseinrichtung (220) ferner eine Modifiziereinrichtung (260) zum Modifizieren des wenigstens einen energiebezogenen Wertes für das Bandpasssignal basierend auf dem bestimmten Mittelwert für das Bandpasssignal umfasst; und wobei die Berechnungseinrichtung (220) ferner eine akustische Unterdrückungsfiltereinrichtung (520) zur Filterung des zweiten Audiosignals basierend auf Steuerinformationen umfasst, wobei die Steuerinformationen wenigstens auf dem wenigstens einen modifizierten energiebezogenen Wert für das Bandpasssignal basieren.
  21. Verfahren zur Berechnung von Steuerinformationen eines Unterdrückungsfilters (210) zur Filterung eines zweiten Audiosignals, um ein Echo zu unterdrücken, welches auf einem ersten Audiosignal beruht, umfassend: Bestimmen wenigstens eines energiebezogenen Wertes für ein Bandpasssignal von wenigstens zwei zeitlich aufeinanderfolgenden Datenblöcken von wenigstens einem Signal einer Gruppe von Signalen, wobei die Gruppe von Signalen das erste Audiosignal, das zweite Audiosignal und ein von dem ersten Audiosignal oder dem zweiten Audiosignal abgeleitetes Signal umfasst; Bestimmen wenigstens eines Mittelwertes des wenigstens einen bestimmten energiebezogenen Wertes für das Bandpasssignal; Modifizieren des wenigstens einen energiebezogenen Wertes für das Bandpasssignal basierend auf dem bestimmten Mittelwert für das Bandpasssignal; und Berechnen der Steuerinformationen für das Unterdrückungsfilter basierend auf dem wenigstens einen modifizierten energiebezogenen Wert für das Bandpasssignal.
  22. Verfahren zur Unterdrückungsfilterung eines zweiten Audiosignals, um ein Echo zu unterdrücken, welches auf einem ersten Audiosignal beruht, umfassend: Bestimmen wenigstens eines energiebezogenen Wertes für ein Bandpasssignal von wenigstens zwei zeitlich aufeinanderfolgenden Datenblöcken von wenigstens einem Signal einer Gruppe von Signalen, wobei die Gruppe von Signalen das erste Audiosignal, das zweite Audiosignal und ein von dem ersten Audiosignal oder dem zweiten Audiosignal abgeleitetes Signal umfasst; Bestimmen wenigstens eines Mittelwertes des wenigstens einen bestimmten energiebezogenen Wertes für das Bandpasssignal; Modifizieren des wenigstens einen energiebezogenen Wertes für das Bandpasssignal basierend auf dem bestimmten Mittelwert für das Bandpasssignal; und Filtern des zweiten Audiosignals basierend auf Steuerinformationen, wobei die Steuerinformationen wenigstens auf dem wenigstens einen modifizierten energiebezogenen Wert für das Bandpasssignal basieren.
  23. Vorrichtung (700) zur Berechnung eines Verzögerungswerts für eine Verzögerungseinrichtung (710) zur Verzögerung eines ersten Signals bezogen auf ein zweites Signal, mit folgenden Merkmalen: einer Berechnungseinrichtung (790), die eine Wertebestimmungseinrichtung (750) zur Bestimmung wenigstens eines energiebezogenen Wertes für ein Bandpasssignal des ersten Signals und des zweiten Signals von wenigstens zwei zeitlich aufeinanderfolgender Datenblöcken des ersten und des zweiten Signals aufweist; wobei die Berechnungseinrichtung (790) ferner eine Mittelwertbestimmungseinrichtung (760) zur Bestimmung wenigstens eines Mittelwertes des wenigstens einen bestimmten energiebezogenen Wertes für das Bandpasssignal für das erste Signal und für das zweite Signal umfasst; wobei die Berechnungseinrichtung (790) ferner eine Modifiziereinrichtung (770) zum Modifizieren des wenigstens einen energiebezogenen Wertes für das Bandpasssignal des ersten und das Bandpasssignal des zweiten Signals basierend auf dem bestimmten Mittelwert für das Bandpasssignal des ersten und des zweiten Signals umfasst; und wobei die Berechnungseinrichtung (790) ferner eine Verzögerungswertberechnungseinrichtung (780) umfasst, die ausgebildet ist, um den Verzögerungswert basierend auf den modifizierten energiebezogenen Werten des ersten und des zweiten Signals zu berechnen.
  24. Vorrichtung (700) nach Anspruch 23, bei der die Verzögerungsberechnungseinrichtung (780) ausgebildet ist, so dass der Verzögerungswert auf einem maximalen Wert einer Kohärenzfunktion basiert, wobei die Kohärenzfunktion auf den modifizierten energiebezogenen Werten des ersten und des zweiten Signals beruht.
  25. Vorrichtung (700) nach einem der Ansprüche 23 oder 24, wobei die Vorrichtung (700) oder die Berechnungseinrichtung (790) ferner eine Verzögerungseinrichtung (710) für das erste Signal umfasst, die ausgebildet ist, um das erste Signal um den Verzögerungswert zu verzögern.
  26. Vorrichtung (700) nach einem der Ansprüche 23 bis 25, bei der die Vorrichtung (700) so ausgebildet ist, dass das erste Signal und das zweite Signal jeweils ein Signal einer Gruppe von Signaltypen ist, wobei die Gruppe von Signaltypen ein analoges elektrisches Signal, ein analoges optisches Signal, ein digitales elektrisches Signal und ein digitales optisches Signal umfasst.
  27. Vorrichtung (700) nach einem der Ansprüche 23 bis 26, bei der die Berechnungseinrichtung (790) ferner eine Zeit/Frequenz-Transformationseinrichtung (740) aufweist, die ausgebildet ist, so dass das erste und das zweite Signal basierend auf einem Datenblock als Subbandsignale einer frequenzbasierten Domäne angehören.
  28. Vorrichtung (700) nach einem der Ansprüche 23 bis 27, bei der die Werteberechnungseinrichtung (750) ausgebildet ist, um eine Mehrzahl von energiebezogenen Werten für den gleichen Datenblock, jedoch für unterschiedliche Bandpasssignale mit unterschiedlichen charakteristischen Frequenzen jeweils für das erste und das zweite Signal zu bestimmen und bei der die Mittelwertbestimmungseinrichtung (760) ausgebildet ist, um einen Mittelwert für jeden der bestimmten energiebezogenen Werte der Bandpasssignale zu bestimmen, bei der die Modifizierungseinrichtung (770) ausgebildet ist, um jeden der bestimmten energiebezogenen Werte basierend auf dem zugehörigen bestimmten Mittelwert zu modifizieren und bei der die Verzögerungswertberechnungseinrichtung (780) ausgebildet ist, um den Verzögerungswert basierend auf allen modifizierten energiebezogenen Werten des ersten und des zweiten Signals zu berechnen.
  29. Vorrichtung (700) nach einem der Ansprüche 23 bis 28, bei der die Berechnungseinrichtung (790) ausgebildet ist, um basierend auf einer Mehrzahl von ersten Signalen oder einer Mehrzahl von aus ersten Signalen abgeleiteten Signalen das erste Signal durch eine Kombination zu bilden, oder die Berechnungseinrichtung (790) ausgebildet ist, um basierend auf einer Mehrzahl von zweiten Signalen oder einer Mehrzahl von aus zweiten Signalen abgeleiteten Signalen das zweite Signal durch eine Kombination derselben zu bilden.
  30. Vorrichtung nach Anspruch 29, bei der die Berechnungseinrichtung (790) ausgebildet ist, um die gleichen Steuerinformationen für die Verzögerungseinrichtung (710) für jedes Signal der Mehrzahl von ersten Signalen oder der Mehrzahl von aus den ersten Signalen abgeleiteten Signalen zu berechnen.
  31. Verfahren zur Berechnung eines Verzögerungswerts für eine Verzögerungseinrichtung (710) zur Verzögerung eines ersten Signals bezogen auf ein zweites Signal, umfassend: Bestimmen wenigstens eines energiebezogenen Wertes für ein Bandpasssignal des ersten Signals und des zweiten Signals von wenigstens zwei zeitlich aufeinanderfolgenden Datenblöcken; Bestimmen wenigstens eines Mittelwertes des wenigstens einen bestimmten energiebezogenen Wertes für das Bandpasssignal des ersten Signals und des zweiten Signals; Modifizieren des wenigstens einen energiebezogenen Wertes für das Bandpasssignal des ersten Signals und des zweiten Signals basierend auf dem bestimmten Mittelwert für das Bandpasssignal des ersten und des zweiten Signals; und Berechnen des Verzögerungswerts basierend auf den modifizierten energiebezogenen Werten des ersten und des zweiten Signals.
  32. Programm mit einem Programmcode zum Durchführen eines der Verfahren gemäß den Ansprüchen 21, 22 oder 31 wenn das Programm auf einem Prozessor abläuft.
DE102008039329A 2008-01-25 2008-08-22 Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts Withdrawn DE102008039329A1 (de)

Priority Applications (13)

Application Number Priority Date Filing Date Title
EP09704696.5A EP2235927B1 (de) 2008-01-25 2009-01-12 Vorrichtung, verfahren und programm zur berechnung von steuerinformationen für einen echounterdrückungsfilter
AU2009207881A AU2009207881B2 (en) 2008-01-25 2009-01-12 Apparatus and method for computing control information for an echo suppression filter and apparatus and method for computing a delay value
PCT/EP2009/000123 WO2009092522A1 (en) 2008-01-25 2009-01-12 Apparatus and method for computing control information for an echo suppression filter and apparatus and method for computing a delay value
RU2010131421/08A RU2495506C2 (ru) 2008-01-25 2009-01-12 Устройство и способ расчета параметров управления фильтра эхоподавления и устройство и способ расчета величины задержки
CN2009801060473A CN101953145B (zh) 2008-01-25 2009-01-12 用于计算回声抑制滤波器的控制信息的装置和方法、用于计算延迟值的装置和方法
JP2010543412A JP5102371B2 (ja) 2008-01-25 2009-01-12 エコー抑制フィルタの制御情報を演算する装置および方法、並びに、ディレイ値を演算する装置および方法
KR1020107018658A KR101250124B1 (ko) 2008-01-25 2009-01-12 에코 억제 필터를 위한 제어 정보를 계산하는 장치 및 방법 및 지연 값을 계산하는 장치 및 방법
BRPI0905760-9A BRPI0905760B1 (pt) 2008-01-25 2009-01-12 Equipamento e método para a computação de informações de controle para um filtro de supressão de ecos e equipamento e método para a computação de um valor de retardo
US12/864,240 US8731207B2 (en) 2008-01-25 2009-01-12 Apparatus and method for computing control information for an echo suppression filter and apparatus and method for computing a delay value
ES09704696.5T ES2641770T3 (es) 2008-01-25 2009-01-12 Aparato, procedimiento y programa para computar la información de control para un filtro de supresión de eco
CA2713127A CA2713127C (en) 2008-01-25 2009-01-12 Apparatus and method for computing control information for an echo suppression filter and apparatus and method for computing a delay value
MX2010008034A MX2010008034A (es) 2008-01-25 2009-01-12 Aparato y metodo para calcular informacion de control para un filtro de supresion de eco y aparato y metodo para calcular un valor de retraso.
TW098101960A TWI458331B (zh) 2008-01-25 2009-01-19 用於計算回聲抑制濾波器的控制資訊的裝置和方法,以及用於計算延遲值的裝置和方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US2347208P 2008-01-25 2008-01-25
US61/023,472 2008-01-25

Publications (1)

Publication Number Publication Date
DE102008039329A1 true DE102008039329A1 (de) 2009-07-30

Family

ID=40794586

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102008039329A Withdrawn DE102008039329A1 (de) 2008-01-25 2008-08-22 Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts

Country Status (14)

Country Link
US (1) US8731207B2 (de)
EP (1) EP2235927B1 (de)
JP (1) JP5102371B2 (de)
KR (1) KR101250124B1 (de)
CN (1) CN101953145B (de)
AU (1) AU2009207881B2 (de)
BR (1) BRPI0905760B1 (de)
CA (1) CA2713127C (de)
DE (1) DE102008039329A1 (de)
ES (1) ES2641770T3 (de)
MX (1) MX2010008034A (de)
RU (1) RU2495506C2 (de)
TW (1) TWI458331B (de)
WO (1) WO2009092522A1 (de)

Families Citing this family (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8831936B2 (en) 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
BRPI0924007B1 (pt) 2009-04-15 2021-08-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Unidade de supressão de eco acústico e conferência de front-end
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
NO332437B1 (no) 2010-01-18 2012-09-17 Cisco Systems Int Sarl Apparat og fremgangsmate for a supprimere et akustisk ekko
DE102010029030A1 (de) * 2010-05-17 2012-03-01 Bayerische Motoren Werke Aktiengesellschaft Verfahren und Vorrichtung zur Verarbeitung von Daten in einem Fahrzeug
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US20120263317A1 (en) * 2011-04-13 2012-10-18 Qualcomm Incorporated Systems, methods, apparatus, and computer readable media for equalization
EP2562751B1 (de) * 2011-08-22 2014-06-11 Svox AG Temporäre Interpolation von nebeneinander liegenden Spektren
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
CN103325379A (zh) 2012-03-23 2013-09-25 杜比实验室特许公司 用于声学回声控制的方法与装置
CN103730125B (zh) * 2012-10-12 2016-12-21 华为技术有限公司 一种回声抵消方法和设备
CN102982801B (zh) * 2012-11-12 2014-12-10 中国科学院自动化研究所 一种用于鲁棒语音识别的语音特征提取方法
TWI469650B (zh) * 2012-11-29 2015-01-11 Quanta Comp Inc 回音消除系統
US9495951B2 (en) * 2013-01-17 2016-11-15 Nvidia Corporation Real time audio echo and background noise reduction for a mobile device
US9888316B2 (en) * 2013-03-21 2018-02-06 Nuance Communications, Inc. System and method for identifying suboptimal microphone performance
CN106470284B (zh) * 2015-08-20 2020-02-11 钉钉控股(开曼)有限公司 消除声学回声的方法、装置、系统、服务器及通话装置
US10397190B2 (en) * 2016-02-05 2019-08-27 Huawei Technologies Co., Ltd. System and method for generating an obfuscated optical signal
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US9826306B2 (en) 2016-02-22 2017-11-21 Sonos, Inc. Default playback device designation
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
EP3312838A1 (de) 2016-10-18 2018-04-25 Fraunhofer Gesellschaft zur Förderung der Angewand Vorrichtung und verfahren zur verarbeitung eines audiosignals
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
CN106791244B (zh) * 2016-12-13 2020-03-27 青岛微众在线网络科技有限公司 回声消除方法、装置以及通话设备
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
DE102017212980B4 (de) 2017-07-27 2023-01-19 Volkswagen Aktiengesellschaft Verfahren zur Kompensation von Störgeräuschen bei einer Freisprecheinrichtung in einem Kraftfahrzeug und Freisprecheinrichtung
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10482868B2 (en) * 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
CN109658946A (zh) * 2017-10-12 2019-04-19 深圳前海黑鲸科技有限公司 一种回声处理方法、装置、存储介质及终端设备
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
WO2019152722A1 (en) 2018-01-31 2019-08-08 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
EP3654249A1 (de) 2018-11-15 2020-05-20 Snips Erweiterte konvolutionen und takt zur effizienten schlüsselwortauffindung
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
CN109802719B (zh) * 2019-01-03 2020-07-17 长沙天仪空间科技研究院有限公司 一种基于抑制窄带干扰的卫星通信系统
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US10839821B1 (en) * 2019-07-23 2020-11-17 Bose Corporation Systems and methods for estimating noise
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
CN112530450A (zh) 2019-09-17 2021-03-19 杜比实验室特许公司 频域中的样本精度延迟识别
CN110648679B (zh) * 2019-09-25 2023-07-14 腾讯科技(深圳)有限公司 回声抑制参数的确定方法和装置、存储介质及电子装置
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
CN112803959B (zh) * 2019-11-13 2022-05-10 瑞昱半导体股份有限公司 收发电路与应用于收发电路的信号处理方法
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
EP4199368A4 (de) * 2020-08-12 2024-01-03 Auzdsp Co Ltd Adaptiver verzögerungsdiversitätsfilter, echokompensationsvorrichtung und diese verwendendes verfahren
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006111370A1 (en) 2005-04-19 2006-10-26 Epfl (Ecole Polytechnique Federale De Lausanne) A method and device for removing echo in a multi-channel audio signal

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02291712A (ja) 1989-05-02 1990-12-03 Nec Corp ノイズ除去方法及び装置
JP2842026B2 (ja) 1991-02-20 1998-12-24 日本電気株式会社 適応フィルタの係数制御方法及び装置
JP3277398B2 (ja) * 1992-04-15 2002-04-22 ソニー株式会社 有声音判別方法
ES2141824T3 (es) * 1993-03-25 2000-04-01 British Telecomm Reconocimiento de voz con deteccion de pausas.
US6760451B1 (en) 1993-08-03 2004-07-06 Peter Graham Craven Compensating filters
US5844994A (en) * 1995-08-28 1998-12-01 Intel Corporation Automatic microphone calibration for video teleconferencing
SG71035A1 (en) * 1997-08-01 2000-03-21 Bitwave Pte Ltd Acoustic echo canceller
US5930366A (en) 1997-08-29 1999-07-27 Telefonaktiebolaget L M Ericsson Synchronization to a base station and code acquisition within a spread spectrum communication system
JP3403655B2 (ja) 1998-11-27 2003-05-06 松下電器産業株式会社 サブバンド適応フィルタを用いた未知システムの同定方法および装置
US6590881B1 (en) 1998-12-04 2003-07-08 Qualcomm, Incorporated Method and apparatus for providing wireless communication system synchronization
US6556967B1 (en) * 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
US6622030B1 (en) * 2000-06-29 2003-09-16 Ericsson Inc. Echo suppression using adaptive gain based on residual echo energy
JP3507020B2 (ja) * 2000-09-08 2004-03-15 日本電信電話株式会社 反響抑圧方法、反響抑圧装置及び反響抑圧プログラム記憶媒体
US20020054685A1 (en) * 2000-11-09 2002-05-09 Carlos Avendano System for suppressing acoustic echoes and interferences in multi-channel audio systems
US6961422B2 (en) * 2001-12-28 2005-11-01 Avaya Technology Corp. Gain control method for acoustic echo cancellation and suppression
US7602926B2 (en) * 2002-07-01 2009-10-13 Koninklijke Philips Electronics N.V. Stationary spectral power dependent audio enhancement system
EP1432221A1 (de) * 2002-10-22 2004-06-23 Siemens Aktiengesellschaft Echo-Unterdrückung mit geringer Verzögerung
JP3963850B2 (ja) * 2003-03-11 2007-08-22 富士通株式会社 音声区間検出装置
US7889804B2 (en) 2003-05-30 2011-02-15 Mohammad Jaber Borran Partially coherent constellations for multiple-antenna systems
US7813499B2 (en) * 2005-03-31 2010-10-12 Microsoft Corporation System and process for regression-based residual acoustic echo suppression
EP1715669A1 (de) * 2005-04-19 2006-10-25 Ecole Polytechnique Federale De Lausanne (Epfl) Ein Verfahren zum Unterdrücken eines Echos in einem Audiosignal
JP4395105B2 (ja) 2005-06-13 2010-01-06 日本電信電話株式会社 音響結合量推定方法、音響結合量推定装置、プログラム、記録媒体
US7773743B2 (en) * 2006-04-28 2010-08-10 Microsoft Corporation Integration of a microphone array with acoustic echo cancellation and residual echo suppression

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006111370A1 (en) 2005-04-19 2006-10-26 Epfl (Ecole Polytechnique Federale De Lausanne) A method and device for removing echo in a multi-channel audio signal

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
A. N. Birkett and R. A. Goubran. Limitations of handsfree acoustic echo cancellers due to nonlinear loudspeaker distortion and enclosure vibration effects. In Proc. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, Seiten 13-16, New Paltz, Okt. 1995.
B. R. Glasberg and B. C. J. Moore. Derivation of auditory filter shapes from notched-noise data. Hear. Res., 47: 103-138, 1990.
C. Breining, P. Dreiseitel, E. Hänsler, A. Mader, B. Nitsch, H. Puder, T. Schertler, G. Schmidt, and J. Tilp. Acoustic echo control. IEEE Signal Processing Magazine, 16(4): 42-69, Juli 1999.
C. Faller and C. Tournery. Estimating the delay and coloration effect of the acoustic echo path for low complexity echo suppression. In Proc. Intl. Works. on Acoust. Echo and Noise Control (IWAENC), Sept. 2005.
C. Faller and F. Baumgarte. Binaural Cue Coding - Part II: Schemes and applications. IEEE Trans. on Speech and Audio Proc., 11(6): 520-531, Nov. 2003.
C. Faller and J. Chef. Suppressing acoustic echo in a sampled auditory envelope space. IEEE Trans. on Speech and Audio Proc., 13(5): 1048-1062, Sept. 2005.
G. Schmidt and E. Hänsler. Acoustic echo and noise control: a practical approach. Hoboken: Wiley, 2004.
W. Etter and G. S. Moschytz. Noise reduction by noiseadaptive spectral magnitude expansion. J. Audio Eng. Soc., 42: 341-349, Mai 1994.
W. L. B. Jeannes, P. Scalart, G. Faucon, and C. Beaugeant. Combined noise and echo reduction in hands-free systems: a survey. IEEE Transactions on Speech and Audio Processing, 9(8): 808-820, Nov. 2001.

Also Published As

Publication number Publication date
RU2495506C2 (ru) 2013-10-10
WO2009092522A1 (en) 2009-07-30
BRPI0905760B1 (pt) 2020-09-24
TW200942016A (en) 2009-10-01
ES2641770T3 (es) 2017-11-13
US20110044461A1 (en) 2011-02-24
CA2713127C (en) 2015-03-24
EP2235927B1 (de) 2017-07-12
TWI458331B (zh) 2014-10-21
MX2010008034A (es) 2010-09-22
EP2235927A1 (de) 2010-10-06
CA2713127A1 (en) 2009-07-30
RU2010131421A (ru) 2012-02-10
US8731207B2 (en) 2014-05-20
JP5102371B2 (ja) 2012-12-19
KR20100133365A (ko) 2010-12-21
KR101250124B1 (ko) 2013-04-09
BRPI0905760A8 (pt) 2017-11-28
AU2009207881B2 (en) 2012-07-12
CN101953145A (zh) 2011-01-19
CN101953145B (zh) 2013-03-27
JP2011511522A (ja) 2011-04-07
AU2009207881A1 (en) 2009-07-30

Similar Documents

Publication Publication Date Title
DE102008039329A1 (de) Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts
DE69827911T2 (de) Verfahren und einrichtung zur mehrkanaligen kompensation eines akustischen echos
DE69531136T2 (de) Verfahren und Einrichtung zur mehrkanaligen Kompensation eines akustischen Echos
CN109727604B (zh) 用于语音识别前端的频域回声消除方法及计算机储存介质
DE102008039330A1 (de) Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung
DE112009001003B4 (de) Geräuschunterdrückungssystem mit zwei Mikrophonen
DE69631086T2 (de) Teilbandechokompensationsverfahren unter Verwendung eines Projektionsalgorithmus
DE69908463T2 (de) Verfahren und Einrichtung zur mehrkanaligen Kompensation eines akustischen Echos
DE112012001201B4 (de) Echolöschvorrichtung und Echodetektor
DE2207141C3 (de) Schaltungsanordnung zur Unterdrückung unerwünschter Sprachsignale mittels eines vorhersagenden Filters
DE102008008674B4 (de) Mehrkanalkommunikationsvorrichtung und Verfahren zum Verringern von Echos durch Einsetzen einer Trainingssequenz unter einer Spektralmaske
DE102018127071B3 (de) Audiosignalverarbeitung mit akustischer Echounterdrückung
EP0948237A2 (de) Verfahren zur Störbefreiung eines Mikrophonsignals
DE69926451T2 (de) Verfahren und Vorrichtung zur Unterdrückung von Mehrkanalechos
DE112007003625T5 (de) Echounterdrückungsvorrichtung, echounterdrückungssystem, Echounterdrückungsverfahren und Computerprogramm
DE19956088A1 (de) Einseiten-Unterband-Filter
DE10153188A1 (de) Vorrichtung und Verfahren zur mehrkanaligen akustischen Echokompensation mit variabler Kanalzahl
DE60304147T2 (de) Virtuelle Mikrophonanordnung
DE102015204010B4 (de) Verfahren zur Unterdrückung eines Störgeräusches in einem akustischen System
EP2466864B1 (de) Transparente Dekorrelation der Lautsprechersignale bei mehrkanaligen Echokompensatoren
DE112013007077T5 (de) Echoauslöschungsvorrichtung
EP0855806B1 (de) Echosperre für ein Spracheingabe Dialogsystem
DE102018117558A1 (de) Adaptives nachfiltern
DE102019105458B4 (de) System und Verfahren zur Zeitverzögerungsschätzung
DE102008009214B4 (de) Audiokommunikationsvorrichtung und Verfahren zum Verringern von Echos durch Einfügen einer Trainingssequenz unter einer Spektralmaske

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee