-
TECHNISCHES GEBIET
-
Die vorliegende Erfindung betrifft eine Echolöschtechnik zum Verringern von akustischen Echokomponenten, die in einem durch ein Mikrofon detektierten akustischen Signal enthalten sind, und insbesondere eine Echolöschtechnik zum Verringern einer akustischen Echokomponente unter Verwendung eines adaptiven Filters.
-
ALLGEMEINER STAND DER TECHNIK
-
Wenn bidirektionale Kommunikationen zwischen zwei Sprachtelekommunikationseinrichtungen ausgeführt werden, die jeweils ein Mikrofon und einen Lautsprecher aufweisen, wird ein Ton (z. B. eine Stimme eines Senders oder Hintergrundgeräusch), der durch ein Mikrofon von einer der Sprachtelekommunikationseinrichtungen aufgenommen wird, durch einen Lautsprecher der anderen Sprachtelekommunikationseinrichtung wiedergegeben, nachdem er über ein elektrisches Kommunikationsnetzwerk zu der anderen Sprachtelekommunikationseinrichtung am anderen Ende der Verbindung übertragen wird. Wenn der wiedergegebene Ton jedoch vom Lautsprecher direkt oder indirekt zum Mikrofon geht und aufgenommen wird, wird der wiedergegebene Ton zur Sprachtelekommunikationseinrichtung, die die Übertragungsquelle ist, zurückgeführt. Ein derartiger wiedergegebener Ton, der zur Sprachtelekommunikationseinrichtung, die die Übertragungsquelle ist, zurückgeführt wird, wird das „akustische Echo“ genannt.
-
Als eine Einrichtung, die ein akustisches Echo unterdrückt, wird weitgehend ein Echolöscher verwendet, der ein adaptives Filter einsetzt. In dieser Art von Echolöscher schätzt, d. h. erlernt, ein adaptives Filter sukzessive die Charakteristiken eines Übertragungspfads (nachfolgend auch als ein „Echopfad“ bezeichnet), über den ein akustisches Echo von einem Lautsprecher zu einem Mikrofon läuft, und erzeugt ein Falschechosignal (auch als eine „Echokopie“ bezeichnet) . Indem das Falschechosignal aus dem Sprachübertragungssignal entfernt wird, das zur Sprachtelekommunikationseinrichtung, die die Übertragungsquelle ist, übertragen werden soll, kann die akustische Echokomponente, die im Sprachübertragungssignal enthalten ist, verringert werden. Daher kann gesagt werden, dass die Leistung des adaptiven Filters die Echolöschleistung des Echolöschers bestimmt.
-
Als eine Ursache einer Beeinträchtigung für ein derartiges Erlernen der Echopfadcharakteristiken, das durch das adaptive Filter ausgeführt wird, kann ein Mischen eines Störsignals in ein durch das Mikrofon detektiertes akustisches Signal in Betracht gezogen werden. Für das adaptive Filter ist eine Stimme eines Nahend-Sprechers oder Hintergrundgeräusch, die bzw. das in ein akustisches Echo gemischt ist, ein Störsignal und ist eine Beeinträchtigung für das Erlernen der Echopfadcharakteristiken. Insbesondere wird ein Doppelsprechzustand, bei dem eine Stimme eines Nahend-Sprechers und ein akustisches Echo in das Mikrofon gemischt werden, ein Problem als eine Ursache einer Beeinträchtigung für das Erlernen der Echopfadcharakteristiken.
-
Als eine Maßnahme gegen das oben erwähnte Problem, das aus einem Doppelsprechen hervorgeht, ist ein Echolöscher, der ein adaptives Filter und eine Doppelsprechdetektionsschaltung zum Bestimmen des Vorhandenseins oder Nichtvorhandenseins des Auftretens eines Doppelsprechens beinhaltet, bekannt. Diese Art von Echolöscher wird zum Beispiel durch die unten erwähnte Nicht-Patentliteratur 1 offenbart. Ein durch die Nicht-Patentliteratur 1 offenbarter akustischer Echolöscher beinhaltet eine Doppelsprechdetektionsschaltung, die die Menge an Echolöschung als einen Detektionsparameter überwacht und die, wenn die Menge an Echolöschung gleich oder größer als eine vorbestimmte Menge wird, bestimmt, dass ein Doppelsprechen aufgetreten ist, und ein Aktualisieren eines adaptiven Filterkoeffizienten stoppt.
-
Des Weiteren ist auch ein Echolöscher bekannt, der, um die Robustheit gegenüber einem Störsignal des Lernens der Echopfadcharakteristiken zu verbessern, zwei Arten von Filtern beinhaltet. Diese Art von Echolöscher wird zum Beispiel durch die wie unten aufgelistete Nicht-Patentliteratur 2 offenbart. Der durch die Nicht-Patentliteratur 2 offenbarte Echolöscher beinhaltet ein Hintergrund(BG)-Filter, das die Echopfadcharakteristiken erlernt, und ein Vordergrund(FG)-Filter, in dem ein Ergebnis des Lernens, das durch das BG-Filter ausgeführt wird, über einen bestimmten Zeitraum integriert wird, und verwendet das FG-Filter zur Echolöschung.
-
Ein Echolöscher, der zwei Arten von Filtern und eine Doppelsprechdetektionsschaltung beinhaltet, wird durch die Patentliteratur 1 (Japanische Patentanmeldung Veröffentlichungs-Nr. 1994(H06)-338827) offenbart.
-
Patentliteratur 2 beschreibt ein Audiokonferenzsystem, das ein dynamisches adaptives Filter mit variabler Länge verwendet, um ein akustisches Echo aus einem Audiosignal in einer sich verändernden akustischen Umgebung zu entfernen.
-
ENTGEGENHALTUNGSLISTE
-
PATENTLITERATUR
-
- Patentliteratur 1: Japanische Patentanmeldung JP000H06338827 A (siehe zum Beispiel 1 und Absätze [0014] bis [0020])
- Patentliteratur 2: US 2014 / 0 270 148 A1
-
NICHT-PATENTLITERATUREN
-
Nicht-Patentliteratur 1: Fujii Kensaku, Ohga Juro, „Double-Talk Detection Method with Detecting Echo Path Fluctuation," IEICE Transactions (A), Band J78-A, Nr. 3, Seiten 314-322, März 1995.
-
Nicht-Patentliteratur 2: K. Ochiai, T. Araseki und T. Ogihara, „Echo canceller with two echo path models," IEEE Transactions on Communications, Band COM-25, Nr. 6, Seiten 589-595, Juni 1977.
-
KURZFASSUNG DER ERFINDUNG
-
TECHNISCHES PROBLEM
-
Bei einem herkömmlichen Echolöscher, der eine derartige Doppelsprechdetektionsschaltung wie oben beinhaltet, gibt es einen Fall, bei dem die Menge an Echolöschung erheblich abnimmt, wenn ein adaptives Filter ein fehlerhaftes Erlernen infolge einer fehlerhaften Bestimmung, die durch die Doppelsprecherzeugungsschaltung ausgeführt wird, ausführt. Des Weiteren gibt es bei einem herkömmlichen Echolöscher, der zwei derartige Arten von Filter wie oben beinhaltet, einen Fall, bei dem die Robustheit gegenüber einem Störsignal nicht beibehalten werden kann, wenn die beiden Arten von Filter ein fehlerhaftes Erlernen infolge des Auftretens eines Doppelsprechens ausführen. Daher liefern die oben erwähnten herkömmlichen Echolöscher nicht notwendigerweise eine Echolöschleistung, die unter einer Umgebung, bei der ein Doppelsprechen auftritt, stabil ist.
-
Angesichts des Voranstehenden ist es eine Aufgabe der vorliegenden Erfindung, eine Echolöscheinrichtung und eine Sprachtelekommunikationseinrichtung bereitzustellen, die eine Echounterdrückungsleistung beibehalten können, die unter einer Umgebung, bei der ein Doppelsprechen auftritt, stabil ist.
-
LÖSUNG DES PROBLEMS
-
Gemäß einem ersten Aspekt der vorliegenden Erfindung ist eine Echolöscheinrichtung bereitgestellt, die Folgendes beinhaltet: eine adaptive Filtereinheit, die ausgelegt ist zum Durchführen einer Filteroperation unter Verwendung einer Filterkoeffizientengruppe auf einer Sequenz von in diese eingegebenen Empfangssignalen und zum adaptiven Aktualisieren der Filterkoeffizientengruppe auf Basis eines in diese von einem Tonkollektor eingegebenen Sprachübertragungssignals; einen Falschechokalkulator, der ausgelegt ist zum Erfassen von gegenwärtigen und vorherigen Filterkoeffizientengruppen, die durch die adaptive Filtereinheit verwendet worden sind, und zum Berechnen von Falschechosignalen, indem Filteroperationen unter Verwendung der gegenwärtigen bzw. vorherigen Filterkoeffizientengruppen auf der Sequenz von Empfangssignalen durchgeführt werden; einen Evaluierungswertkalkulator, der ausgelegt ist zum Berechnen von evaluierten Werten einer Echolöschmenge, die den jeweiligen Falschechosignalen entsprechen, auf Basis des Sprachübertragungssignals und der Falschechosignale; einen Falschechoselektor, der ausgelegt ist zum Auswählen, als eine geschätzte Echokomponente, eines Falschechosignals aus den Falschechosignalen auf Basis der evaluierten Werte der Echolöschmenge; und eine Signalausgabeeinheit, die ausgelegt ist zum Ausgeben eines Restsignals, das eine Differenz zwischen der geschätzten Echokomponente und dem Sprachübertragungssignal angibt.
-
Gemäß einem zweiten Aspekt der vorliegenden Erfindung ist eine Echolöscheinrichtung bereitgestellt, die Folgendes beinhaltet: eine adaptive Filtereinheit, die ausgelegt ist zum Durchführen einer Filteroperation unter Verwendung einer Filterkoeffizientengruppe auf einer Sequenz von in diese eingegebenen Empfangssignalen und zum adaptiven Aktualisieren der Filterkoeffizientengruppe auf Basis eines in diese von einem Tonkollektor eingegebenen Sprachübertragungssignals; einen Falschechokalkulator, der ausgelegt ist zum Erfassen von gegenwärtigen und vorherigen Filterkoeffizientengruppen, die durch die adaptive Filtereinheit verwendet worden sind, und zum Berechnen von Falschechosignalen, indem Filteroperationen jeweils unter Verwendung der Filterkoeffizientengruppen auf der Sequenz von Empfangssignalen durchgeführt werden; einen Evaluierungswertkalkulator, der ausgelegt ist zum Berechnen von evaluierten Werten einer Echolöschmenge, die den jeweiligen Falschechosignalen entsprechen, auf Basis des Sprachübertragungssignals und der Falschechosignale; einen Filterselektor, der ausgelegt ist zum Auswählen einer neuen Filterkoeffizientengruppe aus den gegenwärtigen und vorherigen Filterkoeffizientengruppen auf Basis der evaluierten Werte der Echolöschmenge; ein Vordergrundfilter, das ausgelegt ist zum Erzeugen einer geschätzten Echokomponente, indem eine Filteroperation unter Verwendung der neuen Filterkoeffizientengruppe auf der Sequenz von Empfangssignalen durchgeführt wird; und einen Subtrahierer, der ausgelegt ist zum Subtrahieren der geschätzten Echokomponente vom Sprachübertragungssignal, um dadurch ein Restsignal zu erzeugen.
-
Gemäß einem dritten Aspekt der vorliegenden Erfindung ist eine Sprachtelekommunikationseinrichtung bereitgestellt, die Folgendes beinhaltet: eine Kommunikationsfunktionseinheit, die ausgelegt ist zum Kommunizieren mit einer anderen Sprachtelekommunikationseinrichtung über ein elektrisches Kommunikationsnetzwerk; und die Echolöscheinrichtung gemäß dem obigen ersten oder zweiten Aspekt.
-
VORTEILHAFTE EFFEKTE DER ERFINDUNG
-
Gemäß der vorliegenden Erfindung, selbst, wenn ein fehlerhaftes Lernen in der adaptiven Filtereinheit auftritt, kann das fehlerhafte Lernen korrigiert werden und kann eine gute Echolöschleistung beibehalten werden.
-
Figurenliste
-
- 1 ist ein Diagramm, das die schematische Konfiguration eines Kommunikationssystems gemäß Ausführungsform 1 der vorliegenden Erfindung darstellt;
- 2 ist ein Blockdiagramm, das eine schematische Konfiguration eines Echolöschers der Ausführungsform 1 darstellt;
- 3 ist ein Graph, der ein Beispiel für evaluierte Werte einer Echolöschmenge gemäß Ausführungsform 1 darstellt;
- 4 ist ein Flussdiagramm, das ein Beispiel für die Prozedur einer Echolöschverarbeitung gemäß Ausführungsform 1 darstellt;
- 5 ist ein Diagramm, das ein Beispiel für die Hardwarekonfiguration des Echolöschers der Ausführungsform 1 darstellt;
- 6 ist ein Diagramm, das ein anderes Beispiel für die Hardwarekonfiguration des Echolöschers der Ausführungsform 1 darstellt;
- 7 ist ein Blockdiagramm, das die schematische Konfiguration eines Echolöschers der Ausführungsform 2 der vorliegenden Erfindung darstellt; und
- 8 ist ein Flussdiagramm, das ein Beispiel für die Prozedur einer Echolöschverarbeitung gemäß Ausführungsform 2 darstellt.
-
BESCHREIBUNG DER AUSFÜHRUNGSFORMEN
-
Nachfolgend werden verschiedene Ausführungsformen gemäß der vorliegenden Erfindung unter Bezugnahme auf die Zeichnungen ausführlich erläutert. Es wird angenommen, dass Komponenten, die in allen Zeichnungen durch die gleichen Referenzziffern bezeichnet werden, die gleichen Konfigurationen und die gleichen Funktionen aufweisen.
-
Ausführungsform 1.
-
1 ist ein Diagramm, das die schematische Konfiguration eines Kommunikationssystems darstellt, das zwei Sprachtelekommunikationseinrichtungen 1A und 1B aufweist, die jeweils einen Echolöscher 10 der Ausführungsform 1 gemäß der vorliegenden Erfindung aufweisen. Wie in 1 dargestellt, sind die beiden Sprachtelekommunikationseinrichtungen 1A und 1B über ein Kommunikationsleitungsnetzwerk NW miteinander verbunden und weisen die gleiche Konfiguration auf. Jede der Sprachtelekommunikationseinrichtungen 1A und 1B ist mit sowohl einem Tonkollektor MK, der ein Mikrofon beinhaltet, als auch einem Lautsprecher SP, der einen wiedergegebenen Ton ausgibt, der eine akustische Welle ist, verbunden und beinhaltet eine Kommunikationsfunktionseinheit 11, die mit einer Sprachtelekommunikationseinrichtung am anderen Ende der Verbindung kommuniziert, und einen Echolöscher 10, der eine akustische Echokomponente in einem Sprachübertragungssignal, das zur Sprachtelekommunikationseinrichtung am anderen Ende der Verbindung übertragen werden soll, verringert. Wenn der Tonkollektor MK akustisch mit dem Lautsprecher SP gekoppelt ist, genauer gesagt, wenn sich eine akustische Welle, die durch den Lautsprecher SP ausgegeben wird, durch ein Medium, wie etwa Luft, ein Fluid oder einen Festkörper, ausbreitet und zum Tonkollektor MK geht und detektiert wird, kann der Tonkollektor MK die akustische Welle als ein akustisches Echo detektieren. Als das Kommunikationsleitungsnetzwerk NW ist zum Beispiel ein großflächiges Netzwerk, wie etwa ein Telefonnetz, ein Mobilkommunikationsnetz oder das Internet, oder ein kleinmaßstäbiges Kommunikationsnetzwerk, wie etwa ein LAN (Lokalnetzwerk), bereitgestellt.
-
2 ist ein Blockdiagramm, das eine schematische Konfiguration des Echolöschers 10 der Ausführungsform 1 darstellt. Wie in 2 dargestellt, beinhaltet der Echolöscher 10 eine Signaleingabeeinheit Sin , die ein in diese vom Tonkollektor MK eingegebenes akustisches Sensorsignal abtastet, um ein Sprachübertragungssignal y(n) auszugeben, eine leitungsseitige Signalausgabeeinheit Sout , die ein Restsignal e(n), das das Sprachübertragungssignal ist, bei dem eine akustische Echokomponente verringert ist, zur Kommunikationsfunktionseinheit 11 ausgibt, eine leitungsseitige Signaleingabeeinheit Rin , in die ein durch die Kommunikationsfunktionseinheit 11 empfangenes Empfangssignal x(n) eingegeben wird, und eine Signalausgabeeinheit Rout , die das Empfangssignal x (n) zum Lautsprecher SP ausgibt. Sowohl das Sprachübertragungssignal y(n), das Empfangssignal x(n) als auch das Restsignal e(n) sind diskrete Zeitsignale und n ist eine ganze Zahl, die eine diskrete Abtastzeit Tn spezifiziert.
-
Der Echolöscher 10 beinhaltet auch eine adaptive Filtereinheit 20, die eine Filteroperation unter Verwendung einer Filterkoeffizientengruppe w(n) in einem Zeitbereich an einer Sequenz von eingegebenen Empfangssignalen x(n) (nachfolgend auch als eine „Empfangssignalsequenz“ bezeichnet) durchführt. Diese adaptive Filtereinheit 20 besitzt außerdem eine Funktion zum adaptiven Aktualisieren der Filterkoeffizientengruppe w(n) in Abhängigkeit vom Sprachübertragungssignal y(n) gemäß einem wohlbekannten Adaptionsalgorithmus, wie etwa einem LMS(Least Mean Square)-Verfahren oder einem NLMS (Normalized Least Mean Square)-Verfahren.
-
Die adaptive Filtereinheit 20 ist so konfiguriert, dass sie ein adaptives Filter 21, das eine Faltungsoperation an der Empfangssignalsequenz und der Filterkoeffizientengruppe w(n) durchführt, einen Subtrahierer 22, der eine Filterausgabe d(n) dieses adaptiven Filters 21 vom Sprachübertragungssignal y(n) subtrahiert, um ein Fehlersignal δ(n) zu erzeugen, und eine Adaptionsalgorithmuseinheit (AAL) 23, die adaptiv die Filterkoeffizientengruppe w(n) in Abhängigkeit von diesem Fehlersignal δ(n) aktualisiert, beinhaltet, wie in 2 dargestellt.
-
Die Empfangssignalsequenz X(n) kann durch einen N-dimensionalen Vektor ausgedrückt werden, der durch die folgende Gleichung (1) gegeben ist.
-
In dieser Gleichung ist N eine ganze Zahl gleich oder größer als 3 und ein Symbol T zeigt eine Transposition an, die einen Zeilenvektor mit einer Zeile und N Spalten in einen Spaltenvektor mit N Zeilen und einer Spalte transformiert. Die Filterkoeffizientengruppe w(n), die in der Faltungsoperation verwendet wird, kann durch einen N-dimensionalen Vektor ausgedrückt werden, der durch die folgende Gleichung (2) gegeben ist.
-
Das adaptive Filter
21 kann die Filterausgabe d(n) berechnen, indem eine Faltungsoperation an der Empfangssignalsequenz X(n) und der Filterkoeffizientengruppe w(n) gemäß der folgenden Gleichung (3) durchgeführt wird.
-
Des Weiteren berechnet der Subtrahierer
22 das Fehlersignal δ(n), indem die Filterausgabe d(n) vom Sprachübertragungssignal y(n) subtrahiert wird, wie in der folgenden Gleichung gezeigt.
-
Die Adaptionsalgorithmuseinheit
23 korrigiert sukzessive die Filterkoeffizientengruppe w(n) auf eine derartige Weise, dass die Größe des Fehlersignals δ(n) unter einer vorbestimmten Bedingung minimiert wird. In einem Fall, bei dem ein wohlbekanntes NLMS-Verfahren, das auch ein lernendes Identifikationsverfahren genannt wird, angenommen wird, kann die Adaptionsalgorithmuseinheit
23 eine neue Filterkoeffizientengruppe w(n+1) gemäß der folgenden Gleichung (5) ableiten.
-
In dieser Gleichung ist µ(n-1) ein Koeffizient zu einer Abtastzeit T
n-1 und ist zum Beispiel durch die folgende Gleichung (6) gegeben.
-
In dieser Gleichung ist α eine Schrittgröße zum Anpassen des Aktualisierungsbetrags der Filterkoeffizientengruppe und β ist eine sehr kleine Zahl, die verhindert, dass der Nenner des mittleren Ausdrucks der Gleichung (6) null wird. Des Weiteren ist N gleich der Filterlänge des adaptiven Filters 21 und σx ist eine Varianz des Empfangssignals. Zusätzlich dazu kann Nσx durch das Quadrat der Norm einer Empfangssignalsequenz X (n-1) approximiert werden: | |X(n-1) | |2 (= {X (n-1) }T•X(n-1))
-
Die Adaptionsalgorithmuseinheit 23 aktualisiert dann die Filterkoeffizientengruppe w(n), indem die momentane Filterkoeffizientengruppe w(n) im adaptiven Filter 21 mit der neuen Filterkoeffizientengruppe w(n+1) ersetzt wird. Da die Filterkoeffizientengruppe w(n) einen geschätzten Betrag der Charakteristiken eines Echopfads angibt, der sich vom Lautsprecher SP zum Tonkollektor MK erstreckt, bedeutet das anschließende Aktualisieren der Filterkoeffizientengruppe w(n), dass eine anschließende Schätzung der Echopfadcharakteristiken, d. h. ein Erlernen der Echopfadcharakteristiken, ausgeführt wird. Der Adaptionsalgorithmus ist nicht auf ein LMS-Verfahren und ein NLMS-Verfahren beschränkt. Die Konfiguration der adaptiven Filtereinheit 20 kann zum Beispiel zweckmäßig auf eine derartige Weise modifiziert werden, dass die adaptive Filtereinheit gemäß einem anderen Adaptionsalgorithmus, wie etwa einem Affinprojektionsverfahren oder einem RLS (Recursive Least Square)-Verfahren, arbeitet. Des Weiteren, obwohl die adaptive Filtereinheit 20 gemäß der vorliegenden Ausführungsform eine Funktion des sukzessiven Aktualisierens der Filterkoeffizientengruppe w(n) in einem Zeitbereich aufweist, während eine adaptive Filteroperation im Zeitbereich durchgeführt wird, ist die vorliegende Erfindung nicht auf dieses Beispiel beschränkt. Anstelle der adaptiven Filtereinheit 20 kann eine adaptive Filterkonfiguration zum sukzessiven Aktualisieren einer Filterkoeffizientengruppe in einem Frequenzbereich, während eine adaptive Filteroperation in einem Frequenzbereich durchgeführt wird, verwendet werden.
-
Als Nächstes mit Bezug auf 2 beinhaltet der Echolöscher 10 einen Echoschätzer 30, der das Lernen, das durch die oben erwähnte adaptive Filtereinheit 20 ausgeführt wird, stabilisiert und eine geschätzte Echokomponente d(p) (n) berechnet. Dieser Echoschätzer 30 ist so konfiguriert, dass er einen Filterkoeffizientenpuffer 31, einen Falschechokalkulator 32, einen Falschechopuffer 33, einen Evaluierungswertkalkulator 34 und eine Puffersteuerung 35 beinhaltet.
-
Jedes Mal, wenn die Filterkoeffizientengruppe im adaptiven Filter 21 aktualisiert wird, speichert der Filterkoeffizientenpuffer 31 temporär die aktualisierte Filterkoeffizientengruppe, die zu diesem vom adaptiven Filter 21 geliefert wird. Des Weiteren speichert der Filterkoeffizientenpuffer 31 temporär eine feste Anzahl der momentanen und früheren Filterkoeffizientengruppen w(1) (n), w(2) (n), ..., und w(M) (n) (M ist eine ganze Zahl gleich oder größer als 3), die durch die adaptive Filtereinheit 20 verwendet worden sind. Es wird in dieser Beschreibung angenommen, dass „momentan“ die neueste Abtastzeit bedeutet, und „früher“ eine Abtastzeit vor der neuesten Abtastzeit bedeutet.
-
Eine Beziehung zwischen den gegenwärtigen und vorherigen Filterkoeffizientengruppen w
(1) (n), w
(2) (n), ..., und w
(M) (n), die im Filterkoeffizientenpuffer
31 gespeichert sind, und den Filterkoeffizientengruppen, die durch die adaptive Filtereinheit
20 verwendet werden, ist zum Beispiel wie in der folgenden Gleichung (7) gezeigt.
-
Genauer gesagt, ist die k-te Filterkoeffizientengruppe w
(k) (n), die im Filterkoeffizientenpuffer
31 gespeichert ist, die Filterkoeffizientengruppe w (n-k+1) zu der Abtastzeit
Tn-k+1 . Der Filterkoeffizientenpuffer
31 löscht die älteste Filterkoeffizientengruppe aus den gespeicherten Filterkoeffizientengruppen, um die Filterkoeffizientengruppen zu aktualisieren, wenn der neueste Filterkoeffizient w(n+1), der zu diesem von der adaptiven Filtereinheit
20 geliefert wird, empfangen wird, wie in der folgenden Gleichung (8) gezeigt.
-
Obwohl bevorzugt wird, dass die Abtastzeiten Tn und Tn-1 der gegenwärtigen und der vorherigen Filterkoeffizientengruppe w(n) und w(n-1), die im Filterkoeffizientenpuffer 31 gespeichert sind, aufeinanderfolgend sind, wie in der obigen Gleichung (7) angezeigt, ist die vorliegende Erfindung nicht auf dieses Beispiel beschränkt. Die gegenwärtige und die vorherige Filterkoeffizientengruppe bei nicht aufeinanderfolgenden Abtastzeiten können alternativ dazu im Filterkoeffizientenpuffer 31 gespeichert werden und können verwendet werden.
-
Als Nächstes berechnet der Falschechokalkulator
32 M Falschechosignale d
(1) (n) bis d
(M) (n), indem eine Filteroperation unter Verwendung von jeder der Filterkoeffizientengruppen w
(1) (n) bis w
(M) (n), die aus dem Filterkoeffizientenpuffer
31 gelesen werden, an der Empfangssignalsequenz X(n) M Male durchgeführt wird. Das k-te Falschechosignal d
(k) (n) wird berechnet, indem eine Faltungsoperation unter Verwendung der k-ten Filterkoeffizientengruppe w
(k) (n) gemäß der folgenden Gleichung (9) durchgeführt wird.
-
Der Falschechopuffer
33 speichert temporär die Falschechosignale d
(1) (n) bis d
(M) (n), die zu diesem vom Falschechokalkulator
32 geliefert werden. Wie in
2 dargestellt, berechnet der Evaluierungswertkalkulator
34 M evaluierte Werte dEV
1 (n) bis dEV
M (n) einer Echolöschmenge auf Basis von sowohl den Falschechosignalen d
(1) (n) bis d
(M) (n), die aus dem Falschechopuffer
33 gelesen werden, als auch dem gegenwärtigen Sprachübertragungssignal y(n). Genauer gesagt, wie im Folgenden als Gleichung (10) gezeigt, wird der k-te evaluierte Wert dEV
k (n) der Echolöschmenge als das Quadrat des Verhältnisses des Sprachübertragungssignals y(n) zur Differenz zwischen dem Sprachübertragungssignal y(n) und dem k-ten Falschechosignal d
(k) (n) berechnet.
-
Der Evaluierungswertkalkulator
34 berechnet ferner einen evaluierten Wert dEV
k (n) der Echolöschmenge, in Dezibel ausgedrückt, wie im Folgenden als Gleichung (11) gezeigt, und liefert den evaluierten Wert dEV
k (n) der Echolöschmenge zur Puffersteuerung
35.
-
Die Puffersteuerung
35 weist einen Filterselektor
35f und einen Falschechoselektor
35e auf. Der Falschechoselektor
35e wählt, als die geschätzte Echokomponente d
(p) (n), ein optimales Falschechosignal aus den M Falschechosignalen d
(1) (n) bis d
(M) (n) auf Basis der M evaluierten Werte dEV
1 (n) bis dEV
M (n) der Echolöschmenge, die zu diesem vom Evaluierungswertkalkulator
34 geliefert wird, aus und liefert ein Steuersignal Ce, das das Auswahlergebnis anzeigt, zum Falschechopuffer
33. Der Falschechopuffer
33 liefert die geschätzte Echokomponente d
(p) (n) zum Subtrahierer
25 gemäß diesem Steuersignal Ce. Der Subtrahierer
25 empfängt sowohl das Sprachübertragungssignal y(n) als auch die geschätzte Echokomponente d
(p) (n) und subtrahiert die geschätzte Echokomponente d
(p) (n) vom Sprachübertragungssignal y(n), um ein Restsignal e(n) zu erzeugen, wie in der folgenden Gleichung (12) gezeigt.
-
Dieses Restsignal e(n) wird durch die leitungsseitige Signalausgabeeinheit Sout zur Kommunikationsfunktionseinheit 11 ausgegeben.
-
3 ist ein Graph, der ein Beispiel für evaluierte Werte dEV1 bis dEV5 einer Echolöschmenge, in Dezibel ausgedrückt, darstellt. Der Falschechoselektor 35e kann zum Beispiel, als die geschätzte Echokomponente d(p) (n), ein Falschechosignal auswählen, das dem größten evaluierten Wert dEV3 der Echolöschmenge unter den evaluierten Werten dEV1 bis dEV5 der Echolöschmenge entspricht.
-
Andererseits wählt der Filterselektor 35f eine Filterkoeffizientengruppe w(p) (n) aus den Filterkoeffizientengruppen w(1) (n) bis w(M) (n), die im Filterkoeffizientenpuffer 31 gespeichert sind, auf Basis der M Werte dEV1 (n) bis dEVM (n) der Echolöschmenge aus. Der Filterselektor 35f kann zum Beispiel, als eine neue Filterkoeffizientengruppe, eine Filterkoeffizientengruppe w(p) (n), die dem größten evaluierten Wert dEVp (n) der Echolöschmenge unter den evaluierten Werten dEV1 (n) bis dEVM (n) der Echolöschmenge entspricht, aus den Filterkoeffizientengruppen w(1) (n) bis w(M) (n) auswählen.
-
Der Filterselektor 35f liefert dann ein Steuersignal Cf, das das Auswahlergebnis anzeigt, zum Filterkoeffizientenpuffer 31. Der Filterkoeffizientenpuffer 31 liefert die neue Filterkoeffizientengruppe w(p) (n) zum adaptiven Filter 21 gemäß diesem Steuersignal Cf. Dementsprechend aktualisiert das adaptive Filter 21 die gegenwärtig dazu gesetzte Filterkoeffizientengruppe w(n), indem die Filterkoeffizientengruppe w(n) mit der neuen Filterkoeffizientengruppe w(p) (n) ersetzt wird. Daher, selbst wenn der Genauigkeitsgrad der Schätzung der Echopfadcharakteristiken in der adaptiven Filtereinheit 20 abnimmt und ein fehlerhaftes Lernen der Echopfadcharakteristiken auftritt, kann die Filterkoeffizientengruppe w(n) durch eine vorherige Filterkoeffizientengruppe ersetzt werden, die verwendet worden ist, wenn das Lernen normal ausgeführt werden konnte. Infolgedessen wird ein Vorteil des Bereitstellens einer Verbesserung in der Stabilisierung des Lernens der Echopfadcharakteristiken, das durch die adaptive Filtereinheit 20 ausgeführt wird, bereitgestellt. Des Weiteren wird die Robustheit gegenüber einem Störsignal, wie etwa einer Stimme eines Nahend-Sprechers oder Hintergrundgeräusch, die bzw. das in das akustische Echo gemischt wird, auch verbessert.
-
Wenn der Evaluierungswertkalkulator 34 den evaluierten Wert dEVp (n) der Echolöschmenge berechnet, ist die gleiche Signalkomponente (=y (n)-d(p) (n)) wie das Restsignal e(n), das die Ausgabe des Subtrahierers 25 ist, berechnet worden. Daher kann, anstelle des Subtrahierers 25, ein Pufferspeicher verwendet werden, der temporär die Signalkomponenten (y (n)-d(k) (n)) (k=1 bis M) speichert, die durch den Evaluierungswertkalkulator 34 berechnet werden. Dieser Pufferspeicher muss nur, als das Restsignal e(n), die Signalkomponente (y(n)-d(p) (n)), die dem größten evaluierten Wert dEVp (n) der Echolöschmenge entspricht, zur leitungsseitigen Signalausgabeeinheit Sout liefern.
-
Als Nächstes wird ein Beispiel für den Betrieb des oben erwähnten Echolöschers 10 unter Bezugnahme auf 4 erläutert. 4 ist ein Flussdiagramm, das ein Beispiel für die Prozedur einer Echolöschverarbeitung darstellt, die durch den Echolöscher 10 ausgeführt wird.
-
Mit Bezug auf 4 steht die adaptive Filtereinheit 20 bereit, bis eine Empfangssignalsequenz X(n) zu einer Abtastzeit Tn eingegeben wird (wenn NEIN im Schritt ST1). Wenn eine Empfangssignalsequenz X(n) eingegeben wird (wenn JA im Schritt ST1), führt die adaptive Filtereinheit 20 eine Filteroperation, wie oben erwähnt, durch, um die Filterkoeffizientengruppe zu aktualisieren (Schritt ST2). Die aktualisierte Filterkoeffizientengruppe w(n) wird zum Filterkoeffizientenpuffer 31 geliefert. Wenn die zu diesem vom adaptiven Filter 21 gelieferte aktualisierte Filterkoeffizientengruppe w(n) empfangen wird, aktualisiert der Filterkoeffizientenpuffer 31 die in diesem gespeicherten Filterkoeffizientengruppen (Schritt ST3).
-
Als Nächstes setzt der Falschechokalkulator 32 die Filterkoeffizientengruppennummer k zu „1“ (Schritt ST4) und führt eine Filteroperation unter Verwendung der k-ten Filterkoeffizientengruppe w(k) (n) durch, die aus dem Filterkoeffizientenpuffer 31 gelesen wird, um ein Falschechosignal d(k) (n) zu erzeugen (Schritt ST5). Dieses Falschechosignal d(k) (n) wird im Falschechopuffer 33 gespeichert. Als Nächstes berechnet der Evaluierungswertkalkulator 34 einen evaluierten Wert dEVk (n) der Echolöschmenge auf Basis von sowohl dem Falschechosignal d(k) (n) als auch dem gegenwärtigen Sprachübertragungssignal y(n) (Schritt ST6). Dieser evaluierte Wert dEVk (n) der Echolöschmenge wird zur Puffersteuerung 35 geliefert. Danach inkrementiert der Evaluierungswertkalkulator 34 die Nummer k um 1 (Schritt ST7) und, wenn die Nummer k gleich oder kleiner als ein Maximum M ist (wenn JA im Schritt ST8), kehrt die Verarbeitungsprozedur zum Schritt ST5 zurück.
-
Im Gegensatz dazu, wenn die Nummer k nicht gleich oder kleiner als das Maximum M ist (wenn NEIN im Schritt ST8), mit anderen Worten, wenn die M evaluierten Werte dEV1 (n) bis dEVM (n) der Echolöschmenge für alle Falschechosignale d(1) (n) bis d(M) (n) berechnet werden, geht die Verarbeitungsprozedur zu Schritt ST9 über. In dem in 4 dargestellten Beispiel werden die M evaluierten Werte dEV1 (n) bis dEVM (n) der Echolöschmenge in dieser Reihenfolge (Schritte ST4 bis ST8) berechnet. Alternativ dazu können die M evaluierten Werte dEV1 (n) bis dEVM (n) der Echolöschmenge gleichzeitig parallel berechnet werden.
-
Der Falschechoselektor 35e wählt im nächsten Schritt ST9, als die geschätzte Echokomponente d(p) (n), ein optimales Falschechosignal aus den M Falschechosignalen d(1) (n) bis d(M) (n) auf Basis der evaluierten Werte dEV1 (n) bis dEVM (n) der Echolöschmenge aus (Schritt ST9). Ein Steuersignal Ce, das dieses Auswahlergebnis anzeigt, wird zum Falschechopuffer 33 geliefert.
-
Andererseits wählt der Filterselektor 35f eine neue Filterkoeffizientengruppe w(p) (n) aus den Filterkoeffizientengruppen w(1) (n) bis w(M) (n), die im Filterkoeffizientenpuffer 31 gespeichert sind, auf Basis der evaluierten Werte dEV1 (n) bis dEVM (n) der Echolöschmenge aus (Schritt ST10) . Ein Steuersignal Cf, das dieses Auswahlergebnis anzeigt, wird zum Filterkoeffizientenpuffer 31 geliefert.
-
Danach ersetzt der Filterkoeffizientenpuffer 31 die Filterkoeffizientengruppe w(n) in der adaptiven Filtereinheit 20 mit der neuen Filterkoeffizientengruppe w(p) (n), indem die neue Filterkoeffizientengruppe w(p) (n), die durch das Steuersignal Cf spezifiziert wird, zum adaptiven Filter 21 geliefert wird (Schritt ST11).
-
Andererseits bewirkt der Falschechopuffer 33, dass der Subtrahierer 25 ein Restsignal e(n) erzeugt, indem die geschätzte Echokomponente d(p) (n), die durch das Steuersignal Ce spezifiziert wird, zum Subtrahierer 25 geliefert wird (Schritt ST12). Danach gibt die leitungsseitige Signalausgabeeinheit Sout das Restsignal e(n) zur Kommunikationsfunktionseinheit 11 aus (Schritt ST13).
-
Wenn die Echolöschverarbeitung nach dem Schritt ST13 fortgesetzt wird (wenn JA im Schritt ST14), kehrt die Verarbeitungsprozedur zum Schritt ST1 zurück. Im Gegensatz dazu, wenn die Echolöschverarbeitung nicht fortgesetzt wird (wenn NEIN im Schritt ST14), wird die Echolöschverarbeitung beendet.
-
Die oben erwähnten Schritte ST9, ST10, ST11 und ST12 müssen nicht in dieser Reihenfolge verarbeitet werden. Beispielsweise können die Schritte ST9 und ST10 gleichzeitig parallel durchgeführt werden und die Schritte ST11 und ST12 können gleichzeitig parallel durchgeführt werden. Des Weiteren kann der Schritt ST11 durchgeführt werden, bevor der Schritt ST10 durchgeführt wird.
-
Die Hardwarekonfiguration des oben erwähnten Echolöschers 10 kann durch zum Beispiel einen Computer, wie etwa eine Arbeitsstation oder ein Mainframe, in dem eine CPU (Zentralverarbeitungseinheit) enthalten ist, implementiert werden. Als eine Alternative kann die Hardwarekonfiguration des oben erwähnten Echolöschers 10 durch eine LSI (Large Scale Integrated circuit), wie etwa einen DSP (Digitalsignalprozessor), eine ASIC (anwendungsspezifische integrierte Schaltung) oder ein FPGA (feldprogrammierbares Gate-Array), implementiert werden.
-
5 ist ein Blockdiagramm, das ein Beispiel für die Hardwarekonfiguration des Echolöschers 10 darstellt, der unter Verwendung einer LSI, wie etwa eines DSP, einer ASIC oder eines FPGA, konfiguriert wird. In dem in 5 dargestellten Beispiel besteht der Echolöscher 10 aus einer Signalverarbeitungsschaltung 50, einer Audioeingabe-/-ausgabeeinheit 51, einer Eingabe-/Ausgabeeinheit 52 an der Kommunikationsleitungsseite, einem Aufzeichnungsmedium 53 und einem Signalpfad 54, wie etwa einem Bus. Die Audioeingabe-/-ausgabeeinheit 51 ist eine Schnittstellenschaltung, die die Funktionen der Signaleingabeeinheit Sin , und der Signalausgabeeinheit Rout implementiert, und die Eingabe-/Ausgabeeinheit 52 an der Kommunikationsleitungsseite ist eine Schnittstellenschaltung, die die Funktionen der leitungsseitigen Signalausgabeeinheit Sout und der leitungsseitigen Signaleingabeeinheit Rin, implementiert. Die Funktionen der adaptiven Filtereinheit 20, des Echoschätzers 30 und des Subtrahierers 25 können durch die Signalverarbeitungsschaltung 50 und das Aufzeichnungsmedium 53 implementiert werden. Das Aufzeichnungsmedium 53 kann als der Filterkoeffizientenpuffer 31 und der Falschechopuffer 33 verwendet werden. Als das Aufzeichnungsmedium 53 kann zum Beispiel ein flüchtiger Speicher, wie etwa ein SDRAM (Synchroner DRAM), ein HDD (Festplattenlaufwerk) oder ein SSD (Halbleiterlaufwerk), verwendet werden.
-
Andererseits ist 6 ein Blockdiagramm, das ein Beispiel für die Hardwarekonfiguration des Echolöschers 10 darstellt, der unter Verwendung eines Computers konfiguriert wird. In dem in 6 dargestellten Beispiel besteht der Echolöscher 10 aus einem Prozessor 60, in dem eine CPU 60c enthalten ist, einem RAM (Direktzugriffsspeicher) 61, einem ROM (Nurlesespeicher) 62, einer Audioeingabe-/-ausgabeeinheit 63, einer Eingabe-/Ausgabeeinheit 64 an der Kommunikationsleitungsseite, einem Aufzeichnungsmedium 65 und einen Signalpfad 66, wie etwa einem Bus. Die Audioeingabe-/-ausgabeeinheit 63 ist eine Schnittstellenschaltung, die die Funktionen der Signaleingabeeinheit Sin , und der Signalausgabeeinheit Rout implementiert, und die Eingabe-/Ausgabeeinheit 64 an der Kommunikationsleitungsseite ist eine Schnittstellenschaltung, die die Funktionen der leitungsseitigen Signalausgabeeinheit Sout und der leitungsseitigen Signaleingabeeinheit Rin , implementiert. Die Funktionen der adaptiven Filtereinheit 20, des Echoschätzers 30 und des Subtrahierers 25 können durch den Prozessor 60 und das Aufzeichnungsmedium 65 implementiert werden. Das Aufzeichnungsmedium 65 kann als der Filterkoeffizientenpuffer 31 und der Falschechopuffer 33 verwendet werden. Der Prozessor 60 kann die gleiche Signalverarbeitung ausführen, wie die, die durch die adaptive Filtereinheit 20, den Echoschätzer 30 und den Subtrahierer 25 ausgeführt wird, indem der RAM 61 als ein Speicher für Vorgänge verwendet wird und gemäß einem Computerprogramm, das aus dem ROM 62 gelesen wird, gearbeitet wird. Als das Aufzeichnungsmedium 65 kann zum Beispiel ein flüchtiger Speicher, wie etwa ein SDRAM, ein HDD oder ein SSD, verwendet werden.
-
Wie oben erläutert, kann der Echolöscher 10 der Ausführungsform 1 ein Restsignal e(n) erzeugen, indem eine geschätzte Echokomponente d(p) (n) von den Falschechosignalen, die im Falschechopuffer 33 gespeichert sind, selektiv verwendet wird, selbst, wenn die Schätzungsgenauigkeit der Echopfadcharakteristiken in der adaptiven Filtereinheit 20 abnimmt und ein fehlerhaftes Lernen der Echopfadcharakteristiken auftritt. Daher kann eine Echolöschleistung erzielt werden, die unter einer Umgebung, bei der ein Doppelsprechen auftritt, stabil ist. Des Weiteren kann die Filterkoeffizientengruppe w(n) in der adaptiven Filtereinheit 20 auch durch eine vorherige Filterkoeffizientengruppe ersetzt werden, die verwendet worden ist, wenn das Lernen normal ausgeführt werden konnte. Infolgedessen kann das Lernen der Echopfadcharakteristiken, das durch die adaptive Filtereinheit 20 ausgeführt wird, im Vergleich zu herkömmlichen Techniken stabiler sein. Des Weiteren wird die Robustheit gegenüber einem Störsignal, wie etwa einer Stimme eines Nahend-Sprechers oder Hintergrundgeräusch, die bzw. das in das akustische Echo gemischt ist, verbessert. Insbesondere kann die Robustheit gegenüber einem relativ längeren Doppelsprechzustand verbessert werden, indem die oben erwähnte Anzahl M so festgelegt wird, dass sie ein großer Wert bis zu einem gewissen Grad ist.
-
Zusätzlich dazu, da der Betrag der Echolöschung maximiert werden kann, indem die geschätzte Echokomponente d(p) (n) von den Falschechosignalen, die im Falschechopuffer 33 gespeichert sind, selektiv verwendet wird, wenn eine Echopfadvariation aufgrund einer Umgebungsvariation, wie etwa einer Bewegung einer Person, die sich in der Nähe des Lautsprechers SP befindet, auftritt, wird die Hochgeschwindigkeitsfolgefähigkeit gegenüber Echopfadvariationen verbessert. Daher kann der Echolöscher 10 gemäß der vorliegenden Ausführungsform eine Echolöschleistung beibehalten, die selbst unter einer Umgebung stabil ist, bei der ein Doppelsprechen oder eine Echopfadvariation auftritt.
-
Ausführungsform 2.
-
Als Nächstes wird die Ausführungsform 2 gemäß der vorliegenden Erfindung erläutert. 7 ist ein Blockdiagramm, das die schematische Konfiguration eines Echolöschers 10A der Ausführungsform 2 darstellt. Eine Sprachtelekommunikationseinrichtung kann durch eine Kombination dieses Echolöschers 10A und einer in 1 dargestellten Kommunikationsfunktionseinheit 11, wie im Fall des Echolöschers 10 der oben beschriebenen Ausführungsform 1, konfiguriert werden.
-
Wie in 7 dargestellt, beinhaltet der Echolöscher 10A der Ausführungsform 2 eine Signaleingabeeinheit Sin, eine Signalausgabeeinheit Rout , eine leitungsseitige Signalausgabeeinheit Sout und eine leitungsseitige Signaleingabeeinheit Rin und beinhaltet auch eine adaptive Filtereinheit 20 und einen Subtrahierer 25, wie der Echolöscher 10 gemäß der oben beschriebenen Ausführungsform 1.
-
Des Weiteren beinhaltet der Echolöscher 10A einen Echoschätzer 30A. Dieser Echoschätzer 30A weist einen Filterkoeffizientenpuffer 31, einen Falschechokalkulator 32 und einen Evaluierungswertkalkulator 34 auf, wie der Echoschätzer 30 gemäß der oben beschriebenen Ausführungsform 1, und weist ferner eine Puffersteuerung 35A einschließlich eines Filterselektors 35f und ein FG(Vordergrund)-Filter 36 auf.
-
Das FG-Filter
36 erzeugt eine geschätzte Echokomponente d
FG(n), indem eine Filteroperation unter Verwendung einer Filterkoeffizientengruppe w
FG(n) an einer Empfangssignalsequenz X(n) durchgeführt wird. Genauer gesagt, kann das FG-Filter
36 eine geschätzte Echokomponente d
FG(n) erzeugen, indem eine Faltungsoperation an der Empfangssignalsequenz X(n) und der Filterkoeffizientengruppe w
FG(n) gemäß der folgenden Gleichung (13) durchgeführt wird.
-
Der Subtrahierer 25 subtrahiert die geschätzte Echokomponente dFG (n) von einem Sprachübertragungssignal y (n), um ein Restsignal e (n) zu erzeugen. Dieses Restsignal e (n) wird durch die leitungsseitige Signalausgabeeinheit Sout zur Kommunikationsfunktionseinheit 11 ausgegeben.
-
Als Nächstes wird ein Beispiel für den Betrieb des oben erwähnten Echolöschers 10A unter Bezugnahme auf 8 erläutert. 8 ist ein Flussdiagramm, das ein Beispiel für die Prozedur einer Echolöschverarbeitung darstellt, die durch den Echolöscher 10A ausgeführt wird. Da die Einzelheiten der Vorgänge der Schritte ST1 bis ST11 von 8 die gleichen sind wie die der Schritte ST1 bis ST11 von 3 gemäß der oben beschriebenen Ausführungsform 1, wird die Erläuterung der Einzelheiten der Vorgänge nachfolgend weggelassen.
-
Das FG-Filter 36 erzeugt im Schritt ST20 eine geschätzte Echokomponente dFG (n), indem eine Filteroperation unter Verwendung einer neuen Filterkoeffizientengruppe w(p) (n), die vom Filterkoeffizientenpuffer 31 erfasst wird, durchgeführt wird (Schritt ST20). Genauer gesagt, wenn die dahin gelieferte neue Filterkoeffizientengruppe w(p) (n) empfangen wird, aktualisiert das FG-Filter 36 eine vorherige Filterkoeffizientengruppe wFG(n-1) davon zu einer Filterkoeffizientengruppe wFG(n) (=w(p) (n)), indem die Filterkoeffizientengruppe wFG(n-1) mit der neuen Filterkoeffizientengruppe w(p) (n) ersetzt wird. Das FG-Filter 36 kann dann eine geschätzte Echokomponente dFG(n) erzeugen, indem eine Faltungsoperation an der aktualisierten Filterkoeffizientengruppe wFG (n) und der Empfangssignalsequenz X(n) durchgeführt wird.
-
Als eine Alternative kann das FG-Filter
36 eine Kombinationsfilterkoeffizientengruppe erzeugen, indem eine Linearkombination der neuen Filterkoeffizientengruppe w
(p) (n) und der vorherigen Filterkoeffizientengruppe w
FG(n-1), die durch das FG-Filter
36 verwendet worden ist, durchgeführt wird, und kann die vorherige Filterkoeffizientengruppe w
FG (p) (n-1) mit der Kombinationsfilterkoeffizientengruppe w
(p) (n) ersetzen. Das FG-Filter
36 kann dann eine geschätzte Echokomponente d
FG (n) erzeugen, indem eine Filteroperation unter Verwendung dieser Kombinationsfilterkoeffizientengruppe w
FG(n) durchgeführt wird. Wenn ein Gewichtungsfaktor, der der neuen Filterkoeffizientengruppe w
(p) (n) zugewiesen wird, durch γ bezeichnet wird, kann die Kombinationsfilterkoeffizientengruppe w
FG(n) gemäß der folgenden Gleichung (14) berechnet werden.
-
Der Gewichtungsfaktor γ wird ein Vergessenheitskoeffizient genannt. Es wird bevorzugt, den Vergessenheitskoeffizienten γ auf einen Wert nahe Null zu setzen. Es ist zum Beispiel wünschenswert, dass der Vergessenheitskoeffizient größer als null ist und innerhalb eines Bereichs fällt, der kleiner als 0,1 ist. Da die Filterkoeffizientengruppe der adaptiven Filtereinheit 20 in das FG-Filter 36 über einen gewissen Zeitraum integriert wird, indem die derartige Kombinationsfilterkoeffizientengruppe wie oben verwendet wird, kann eine Verbesserung in der Robustheit gegenüber einem Doppelsprechen bereitgestellt werden.
-
Nach dem oben erwähnten Schritt ST20 subtrahiert der Subtrahierer 25 die geschätzte Echokomponente dFG(n) vom Sprachübertragungssignal y(n), um ein Restsignal e(n) zu erzeugen (Schritt ST21), und die leitungsseitige Signalausgabeeinheit Sout gibt das Restsignal e(n) zur Kommunikationsfunktionseinheit 11 aus (Schritt ST22).
-
Danach, wenn die Echolöschverarbeitung fortgesetzt wird (wenn JA im Schritt ST23), kehrt die Verarbeitungsprozedur zum Schritt ST1 zurück. Im Gegensatz dazu, wenn die Echolöschverarbeitung nicht fortgesetzt wird (wenn NEIN im Schritt ST23), wird die Echolöschverarbeitung beendet.
-
Die Hardwarekonfiguration des Echolöschers 10A gemäß der vorliegenden Ausführungsform kann durch zum Beispiel einen Computer, wie etwa eine Arbeitsstation oder ein Mainframe, in dem eine CPU enthalten ist, implementiert werden. Als eine Alternative kann die Hardwarekonfiguration des Echolöschers 10A unter Verwendung einer LSI, wie etwa eines DSP, einer ASIC oder eines FPGA, implementiert werden. Die Hardwarekonfiguration des Echolöschers 10A kann alternativ dazu durch die in 5 oder 6 dargestellte Konfiguration implementiert werden, wie im Fall der Ausführungsform 1.
-
Wie oben erläutert, wird im Echolöscher 10A der Ausführungsform 2 eine optimale Filterkoeffizientengruppe w(p) (n) aus den gegenwärtigen und vorherigen Filterkoeffizientengruppen w(1) (n) bis w(M) (n), die durch die adaptive Filtereinheit 20 verwendet worden sind, ausgewählt und diese Filterkoeffizientengruppe w(p) (n) wird in die Filterkoeffizientengruppe wFG (n) des FG-Filters 36 integriert. Das FG-Filter 36 erzeugt eine geschätzte Echokomponente dFG(n) , indem diese Filterkoeffizientengruppe wFG(n) verwendet wird. Des Weiteren kann die Filterkoeffizientengruppe w(n) in der adaptiven Filtereinheit 20 auch durch eine vorherige Filterkoeffizientengruppe ersetzt werden, die verwendet worden ist, wenn das Lernen normal ausgeführt werden konnte. Daher kann die Robustheit gegenüber einem Störsignal im Vergleich zu herkömmlichen Techniken weiter verbessert werden. Daher kann eine stabile Echolöschleistung erzielt werden.
-
Obwohl die verschiedenen Ausführungsformen der vorliegenden Erfindung unter Bezugnahme auf die Zeichnungen beschrieben werden, wie zuvor erläutert, dienen diese Ausführungsformen als Beispiele für die vorliegende Erfindung und verschiedene Ausführungsformen außer diesen Aus führungs formen können auch angenommen werden. Zum Zwecke der Zweckmäßigkeit der Erläuterung ist der Filterkoeffizientenpuffer 31 gemäß einer beliebigen der Ausführungsformen 1 und 2 zum Beispiel so konfiguriert, dass er drei oder mehr Filterkoeffizientengruppen w(1) (n) bis w(M) (n) speichert. Die vorliegende Erfindung ist jedoch nicht auf dieses Beispiel beschränkt und der Filterkoeffizientenpuffer kann so konfiguriert sein, dass er zwei Filterkoeffizientengruppen w(1) (n) und w(2) (n) speichert. In diesem Fall berechnet der Evaluierungswertkalkulator 34 zwei evaluierte Werte dEV1 (n) und dEV2(n) der Echolöschmenge.
-
Innerhalb des Schutzumfangs der vorliegenden Erfindung kann eine beliebige Kombination der Ausführungsformen 1 und 2 wie oben beschrieben vorgenommen werden, eine Änderung in einer beliebigen Komponente gemäß einer beliebigen der oben erwähnten Ausführungsformen kann vorgenommen werden oder eine beliebige Komponente gemäß einer beliebigen der oben erwähnten Ausführungsformen kann weggelassen werden.
-
INDUSTRIELLE ANWENDBARKEIT
-
Die Echolöscheinrichtung und die Sprachtelekommunikationseinrichtung gemäß der vorliegenden Erfindung können zum Beispiel für ein Festnetztelefon, ein Mobiltelefon mit einer Lautsprecherfunktion, ein Freisprechkommunikationssystem und ein Videokonferenzsystem verwendet werden.
-
Bezugszeichenliste
-
1A, 1B: Sprachtelekommunikationseinrichtungen; 10, 10A: Echolöscher; 11: Kommunikationsfunktionseinheit; 20: adaptive Filtereinheit; 21: adaptives Filter; 22: Subtrahierer; 23: Adaptionsalgorithmuseinheit (AAL); 25: Subtrahierer; 30, 30A: Echoschätzer; 31: Filterkoeffizientenpuffer; 32: Falschechokalkulator; 33: Falschechopuffer; 34: Evaluierungswertkalkulator; 35, 35A: Puffersteuerung; 35e: Falschechoselektor; 35f: Filterselektor; 36: FG(Vordergrund)-Filter; 50: Signalverarbeitungsschaltung; 51: Audioeingabe-/-ausgabeeinheit; 52: Eingabe-/Ausgabeeinheit an der Kommunikationsleitungsseite; 53: Aufzeichnungsmedium; 54:Signalpfad; 60: Prozessor; 60c: CPU; 61: RAM; 62: ROM; 63: Audioeingabe-/-ausgabeeinheit; 64: leitungsseitige Eingabe-/Ausgabeeinheit; 65: Aufzeichnungsmedium; 66: Signalpfad; MK: Tonkollektor; SP: Lautsprecher; Sin: Signaleingabeeinheit; Sout : leitungsseitige Signalausgabeeinheit; Rout : Signalausgabeeinheit und Rin: leitungsseitige Signaleingabeeinheit.