DE112015007019B4

DE112015007019B4 - Echolöscheinrichtung und Sprachtelekommunikationseinrichtung

Info

Publication number: DE112015007019B4
Application number: DE112015007019.2T
Authority: DE
Inventors: Tomoharu Awano; Satoru Furuta; Jun Ishii
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2015-11-16
Filing date: 2015-11-16
Publication date: 2019-07-25
Anticipated expiration: 2035-11-17
Also published as: JP6279172B2; US10367949B2; WO2017085760A1; DE112015007019T5; US20180343345A1; JPWO2017085760A1

Abstract

Echolöscheinrichtung (10), die Folgendes umfasst:
eine adaptive Filtereinheit (20), die ausgelegt ist zum Durchführen einer Filteroperation unter Verwendung einer Filterkoeffizientengruppe auf einer in diese eingegebenen Sequenz von Empfangssignalen und zum adaptiven Aktualisieren der Filterkoeffizientengruppe auf Basis eines in diese von einem Tonkollektor eingegebenen Sprachübertragungssignals;
einen Falschechokalkulator (32), der ausgelegt ist zum Erfassen von gegenwärtigen und vorherigen Filterkoeffizientengruppen, die durch die adaptive Filtereinheit (20) verwendet worden sind, und zum Berechnen von Falschechosignalen, indem Filteroperationen unter Verwendung der gegenwärtigen und vorherigen Filterkoeffizientengruppen auf der Sequenz von Empfangssignalen durchgeführt werden;
einen Evaluierungswertkalkulator (34), der ausgelegt ist zum Berechnen von evaluierten Werten einer Echolöschmenge, die den entsprechenden Falschechosignalen entsprechen, auf Basis des Sprachübertragungssignals und der Falschechosignale;
einen Falschechoselektor (35e), der ausgelegt ist zum Auswählen, als eine geschätzte Echokomponente, eines Falschechosignals aus den Falschechosignalen auf Basis der evaluierten Werte der Echolöschmenge; und
eine Signalausgabeeinheit (S_out), die ausgelegt ist zum Ausgeben eines Restsignals, das eine Differenz zwischen der geschätzten Echokomponente und dem Sprachübertragungssignal angibt.

Description

TECHNISCHES GEBIET
Die vorliegende Erfindung betrifft eine Echolöschtechnik zum Verringern von akustischen Echokomponenten, die in einem durch ein Mikrofon detektierten akustischen Signal enthalten sind, und insbesondere eine Echolöschtechnik zum Verringern einer akustischen Echokomponente unter Verwendung eines adaptiven Filters.
ALLGEMEINER STAND DER TECHNIK
Wenn bidirektionale Kommunikationen zwischen zwei Sprachtelekommunikationseinrichtungen ausgeführt werden, die jeweils ein Mikrofon und einen Lautsprecher aufweisen, wird ein Ton (z. B. eine Stimme eines Senders oder Hintergrundgeräusch), der durch ein Mikrofon von einer der Sprachtelekommunikationseinrichtungen aufgenommen wird, durch einen Lautsprecher der anderen Sprachtelekommunikationseinrichtung wiedergegeben, nachdem er über ein elektrisches Kommunikationsnetzwerk zu der anderen Sprachtelekommunikationseinrichtung am anderen Ende der Verbindung übertragen wird. Wenn der wiedergegebene Ton jedoch vom Lautsprecher direkt oder indirekt zum Mikrofon geht und aufgenommen wird, wird der wiedergegebene Ton zur Sprachtelekommunikationseinrichtung, die die Übertragungsquelle ist, zurückgeführt. Ein derartiger wiedergegebener Ton, der zur Sprachtelekommunikationseinrichtung, die die Übertragungsquelle ist, zurückgeführt wird, wird das „akustische Echo“ genannt.
Als eine Einrichtung, die ein akustisches Echo unterdrückt, wird weitgehend ein Echolöscher verwendet, der ein adaptives Filter einsetzt. In dieser Art von Echolöscher schätzt, d. h. erlernt, ein adaptives Filter sukzessive die Charakteristiken eines Übertragungspfads (nachfolgend auch als ein „Echopfad“ bezeichnet), über den ein akustisches Echo von einem Lautsprecher zu einem Mikrofon läuft, und erzeugt ein Falschechosignal (auch als eine „Echokopie“ bezeichnet) . Indem das Falschechosignal aus dem Sprachübertragungssignal entfernt wird, das zur Sprachtelekommunikationseinrichtung, die die Übertragungsquelle ist, übertragen werden soll, kann die akustische Echokomponente, die im Sprachübertragungssignal enthalten ist, verringert werden. Daher kann gesagt werden, dass die Leistung des adaptiven Filters die Echolöschleistung des Echolöschers bestimmt.
Als eine Ursache einer Beeinträchtigung für ein derartiges Erlernen der Echopfadcharakteristiken, das durch das adaptive Filter ausgeführt wird, kann ein Mischen eines Störsignals in ein durch das Mikrofon detektiertes akustisches Signal in Betracht gezogen werden. Für das adaptive Filter ist eine Stimme eines Nahend-Sprechers oder Hintergrundgeräusch, die bzw. das in ein akustisches Echo gemischt ist, ein Störsignal und ist eine Beeinträchtigung für das Erlernen der Echopfadcharakteristiken. Insbesondere wird ein Doppelsprechzustand, bei dem eine Stimme eines Nahend-Sprechers und ein akustisches Echo in das Mikrofon gemischt werden, ein Problem als eine Ursache einer Beeinträchtigung für das Erlernen der Echopfadcharakteristiken.
Als eine Maßnahme gegen das oben erwähnte Problem, das aus einem Doppelsprechen hervorgeht, ist ein Echolöscher, der ein adaptives Filter und eine Doppelsprechdetektionsschaltung zum Bestimmen des Vorhandenseins oder Nichtvorhandenseins des Auftretens eines Doppelsprechens beinhaltet, bekannt. Diese Art von Echolöscher wird zum Beispiel durch die unten erwähnte Nicht-Patentliteratur 1 offenbart. Ein durch die Nicht-Patentliteratur 1 offenbarter akustischer Echolöscher beinhaltet eine Doppelsprechdetektionsschaltung, die die Menge an Echolöschung als einen Detektionsparameter überwacht und die, wenn die Menge an Echolöschung gleich oder größer als eine vorbestimmte Menge wird, bestimmt, dass ein Doppelsprechen aufgetreten ist, und ein Aktualisieren eines adaptiven Filterkoeffizienten stoppt.
Des Weiteren ist auch ein Echolöscher bekannt, der, um die Robustheit gegenüber einem Störsignal des Lernens der Echopfadcharakteristiken zu verbessern, zwei Arten von Filtern beinhaltet. Diese Art von Echolöscher wird zum Beispiel durch die wie unten aufgelistete Nicht-Patentliteratur 2 offenbart. Der durch die Nicht-Patentliteratur 2 offenbarte Echolöscher beinhaltet ein Hintergrund(BG)-Filter, das die Echopfadcharakteristiken erlernt, und ein Vordergrund(FG)-Filter, in dem ein Ergebnis des Lernens, das durch das BG-Filter ausgeführt wird, über einen bestimmten Zeitraum integriert wird, und verwendet das FG-Filter zur Echolöschung.
Ein Echolöscher, der zwei Arten von Filtern und eine Doppelsprechdetektionsschaltung beinhaltet, wird durch die Patentliteratur 1 (Japanische Patentanmeldung Veröffentlichungs-Nr. 1994(H06)-338827) offenbart.
Patentliteratur 2 beschreibt ein Audiokonferenzsystem, das ein dynamisches adaptives Filter mit variabler Länge verwendet, um ein akustisches Echo aus einem Audiosignal in einer sich verändernden akustischen Umgebung zu entfernen.
ENTGEGENHALTUNGSLISTE
PATENTLITERATUR

Patentliteratur 1: Japanische Patentanmeldung JP000H06338827 A (siehe zum Beispiel 1 und Absätze [0014] bis [0020])
Patentliteratur 2: US 2014 / 0 270 148 A1

NICHT-PATENTLITERATUREN
Nicht-Patentliteratur 1: Fujii Kensaku, Ohga Juro, „Double-Talk Detection Method with Detecting Echo Path Fluctuation," IEICE Transactions (A), Band J78-A, Nr. 3, Seiten 314-322, März 1995.
Nicht-Patentliteratur 2: K. Ochiai, T. Araseki und T. Ogihara, „Echo canceller with two echo path models," IEEE Transactions on Communications, Band COM-25, Nr. 6, Seiten 589-595, Juni 1977.
KURZFASSUNG DER ERFINDUNG
TECHNISCHES PROBLEM
Bei einem herkömmlichen Echolöscher, der eine derartige Doppelsprechdetektionsschaltung wie oben beinhaltet, gibt es einen Fall, bei dem die Menge an Echolöschung erheblich abnimmt, wenn ein adaptives Filter ein fehlerhaftes Erlernen infolge einer fehlerhaften Bestimmung, die durch die Doppelsprecherzeugungsschaltung ausgeführt wird, ausführt. Des Weiteren gibt es bei einem herkömmlichen Echolöscher, der zwei derartige Arten von Filter wie oben beinhaltet, einen Fall, bei dem die Robustheit gegenüber einem Störsignal nicht beibehalten werden kann, wenn die beiden Arten von Filter ein fehlerhaftes Erlernen infolge des Auftretens eines Doppelsprechens ausführen. Daher liefern die oben erwähnten herkömmlichen Echolöscher nicht notwendigerweise eine Echolöschleistung, die unter einer Umgebung, bei der ein Doppelsprechen auftritt, stabil ist.
Angesichts des Voranstehenden ist es eine Aufgabe der vorliegenden Erfindung, eine Echolöscheinrichtung und eine Sprachtelekommunikationseinrichtung bereitzustellen, die eine Echounterdrückungsleistung beibehalten können, die unter einer Umgebung, bei der ein Doppelsprechen auftritt, stabil ist.
LÖSUNG DES PROBLEMS
Gemäß einem ersten Aspekt der vorliegenden Erfindung ist eine Echolöscheinrichtung bereitgestellt, die Folgendes beinhaltet: eine adaptive Filtereinheit, die ausgelegt ist zum Durchführen einer Filteroperation unter Verwendung einer Filterkoeffizientengruppe auf einer Sequenz von in diese eingegebenen Empfangssignalen und zum adaptiven Aktualisieren der Filterkoeffizientengruppe auf Basis eines in diese von einem Tonkollektor eingegebenen Sprachübertragungssignals; einen Falschechokalkulator, der ausgelegt ist zum Erfassen von gegenwärtigen und vorherigen Filterkoeffizientengruppen, die durch die adaptive Filtereinheit verwendet worden sind, und zum Berechnen von Falschechosignalen, indem Filteroperationen unter Verwendung der gegenwärtigen bzw. vorherigen Filterkoeffizientengruppen auf der Sequenz von Empfangssignalen durchgeführt werden; einen Evaluierungswertkalkulator, der ausgelegt ist zum Berechnen von evaluierten Werten einer Echolöschmenge, die den jeweiligen Falschechosignalen entsprechen, auf Basis des Sprachübertragungssignals und der Falschechosignale; einen Falschechoselektor, der ausgelegt ist zum Auswählen, als eine geschätzte Echokomponente, eines Falschechosignals aus den Falschechosignalen auf Basis der evaluierten Werte der Echolöschmenge; und eine Signalausgabeeinheit, die ausgelegt ist zum Ausgeben eines Restsignals, das eine Differenz zwischen der geschätzten Echokomponente und dem Sprachübertragungssignal angibt.
Gemäß einem zweiten Aspekt der vorliegenden Erfindung ist eine Echolöscheinrichtung bereitgestellt, die Folgendes beinhaltet: eine adaptive Filtereinheit, die ausgelegt ist zum Durchführen einer Filteroperation unter Verwendung einer Filterkoeffizientengruppe auf einer Sequenz von in diese eingegebenen Empfangssignalen und zum adaptiven Aktualisieren der Filterkoeffizientengruppe auf Basis eines in diese von einem Tonkollektor eingegebenen Sprachübertragungssignals; einen Falschechokalkulator, der ausgelegt ist zum Erfassen von gegenwärtigen und vorherigen Filterkoeffizientengruppen, die durch die adaptive Filtereinheit verwendet worden sind, und zum Berechnen von Falschechosignalen, indem Filteroperationen jeweils unter Verwendung der Filterkoeffizientengruppen auf der Sequenz von Empfangssignalen durchgeführt werden; einen Evaluierungswertkalkulator, der ausgelegt ist zum Berechnen von evaluierten Werten einer Echolöschmenge, die den jeweiligen Falschechosignalen entsprechen, auf Basis des Sprachübertragungssignals und der Falschechosignale; einen Filterselektor, der ausgelegt ist zum Auswählen einer neuen Filterkoeffizientengruppe aus den gegenwärtigen und vorherigen Filterkoeffizientengruppen auf Basis der evaluierten Werte der Echolöschmenge; ein Vordergrundfilter, das ausgelegt ist zum Erzeugen einer geschätzten Echokomponente, indem eine Filteroperation unter Verwendung der neuen Filterkoeffizientengruppe auf der Sequenz von Empfangssignalen durchgeführt wird; und einen Subtrahierer, der ausgelegt ist zum Subtrahieren der geschätzten Echokomponente vom Sprachübertragungssignal, um dadurch ein Restsignal zu erzeugen.
Gemäß einem dritten Aspekt der vorliegenden Erfindung ist eine Sprachtelekommunikationseinrichtung bereitgestellt, die Folgendes beinhaltet: eine Kommunikationsfunktionseinheit, die ausgelegt ist zum Kommunizieren mit einer anderen Sprachtelekommunikationseinrichtung über ein elektrisches Kommunikationsnetzwerk; und die Echolöscheinrichtung gemäß dem obigen ersten oder zweiten Aspekt.
VORTEILHAFTE EFFEKTE DER ERFINDUNG
Gemäß der vorliegenden Erfindung, selbst, wenn ein fehlerhaftes Lernen in der adaptiven Filtereinheit auftritt, kann das fehlerhafte Lernen korrigiert werden und kann eine gute Echolöschleistung beibehalten werden.
Figurenliste

1 ist ein Diagramm, das die schematische Konfiguration eines Kommunikationssystems gemäß Ausführungsform 1 der vorliegenden Erfindung darstellt;
2 ist ein Blockdiagramm, das eine schematische Konfiguration eines Echolöschers der Ausführungsform 1 darstellt;
3 ist ein Graph, der ein Beispiel für evaluierte Werte einer Echolöschmenge gemäß Ausführungsform 1 darstellt;
4 ist ein Flussdiagramm, das ein Beispiel für die Prozedur einer Echolöschverarbeitung gemäß Ausführungsform 1 darstellt;
5 ist ein Diagramm, das ein Beispiel für die Hardwarekonfiguration des Echolöschers der Ausführungsform 1 darstellt;
6 ist ein Diagramm, das ein anderes Beispiel für die Hardwarekonfiguration des Echolöschers der Ausführungsform 1 darstellt;
7 ist ein Blockdiagramm, das die schematische Konfiguration eines Echolöschers der Ausführungsform 2 der vorliegenden Erfindung darstellt; und
8 ist ein Flussdiagramm, das ein Beispiel für die Prozedur einer Echolöschverarbeitung gemäß Ausführungsform 2 darstellt.

BESCHREIBUNG DER AUSFÜHRUNGSFORMEN
Nachfolgend werden verschiedene Ausführungsformen gemäß der vorliegenden Erfindung unter Bezugnahme auf die Zeichnungen ausführlich erläutert. Es wird angenommen, dass Komponenten, die in allen Zeichnungen durch die gleichen Referenzziffern bezeichnet werden, die gleichen Konfigurationen und die gleichen Funktionen aufweisen.
Ausführungsform 1.
1 ist ein Diagramm, das die schematische Konfiguration eines Kommunikationssystems darstellt, das zwei Sprachtelekommunikationseinrichtungen 1A und 1B aufweist, die jeweils einen Echolöscher 10 der Ausführungsform 1 gemäß der vorliegenden Erfindung aufweisen. Wie in 1 dargestellt, sind die beiden Sprachtelekommunikationseinrichtungen 1A und 1B über ein Kommunikationsleitungsnetzwerk NW miteinander verbunden und weisen die gleiche Konfiguration auf. Jede der Sprachtelekommunikationseinrichtungen 1A und 1B ist mit sowohl einem Tonkollektor MK, der ein Mikrofon beinhaltet, als auch einem Lautsprecher SP, der einen wiedergegebenen Ton ausgibt, der eine akustische Welle ist, verbunden und beinhaltet eine Kommunikationsfunktionseinheit 11, die mit einer Sprachtelekommunikationseinrichtung am anderen Ende der Verbindung kommuniziert, und einen Echolöscher 10, der eine akustische Echokomponente in einem Sprachübertragungssignal, das zur Sprachtelekommunikationseinrichtung am anderen Ende der Verbindung übertragen werden soll, verringert. Wenn der Tonkollektor MK akustisch mit dem Lautsprecher SP gekoppelt ist, genauer gesagt, wenn sich eine akustische Welle, die durch den Lautsprecher SP ausgegeben wird, durch ein Medium, wie etwa Luft, ein Fluid oder einen Festkörper, ausbreitet und zum Tonkollektor MK geht und detektiert wird, kann der Tonkollektor MK die akustische Welle als ein akustisches Echo detektieren. Als das Kommunikationsleitungsnetzwerk NW ist zum Beispiel ein großflächiges Netzwerk, wie etwa ein Telefonnetz, ein Mobilkommunikationsnetz oder das Internet, oder ein kleinmaßstäbiges Kommunikationsnetzwerk, wie etwa ein LAN (Lokalnetzwerk), bereitgestellt.
2 ist ein Blockdiagramm, das eine schematische Konfiguration des Echolöschers 10 der Ausführungsform 1 darstellt. Wie in 2 dargestellt, beinhaltet der Echolöscher 10 eine Signaleingabeeinheit S_in , die ein in diese vom Tonkollektor MK eingegebenes akustisches Sensorsignal abtastet, um ein Sprachübertragungssignal y(n) auszugeben, eine leitungsseitige Signalausgabeeinheit S_out , die ein Restsignal e(n), das das Sprachübertragungssignal ist, bei dem eine akustische Echokomponente verringert ist, zur Kommunikationsfunktionseinheit 11 ausgibt, eine leitungsseitige Signaleingabeeinheit R_in , in die ein durch die Kommunikationsfunktionseinheit 11 empfangenes Empfangssignal x(n) eingegeben wird, und eine Signalausgabeeinheit R_out , die das Empfangssignal x (n) zum Lautsprecher SP ausgibt. Sowohl das Sprachübertragungssignal y(n), das Empfangssignal x(n) als auch das Restsignal e(n) sind diskrete Zeitsignale und n ist eine ganze Zahl, die eine diskrete Abtastzeit T_n spezifiziert.
Der Echolöscher 10 beinhaltet auch eine adaptive Filtereinheit 20, die eine Filteroperation unter Verwendung einer Filterkoeffizientengruppe w(n) in einem Zeitbereich an einer Sequenz von eingegebenen Empfangssignalen x(n) (nachfolgend auch als eine „Empfangssignalsequenz“ bezeichnet) durchführt. Diese adaptive Filtereinheit 20 besitzt außerdem eine Funktion zum adaptiven Aktualisieren der Filterkoeffizientengruppe w(n) in Abhängigkeit vom Sprachübertragungssignal y(n) gemäß einem wohlbekannten Adaptionsalgorithmus, wie etwa einem LMS(Least Mean Square)-Verfahren oder einem NLMS (Normalized Least Mean Square)-Verfahren.
Die adaptive Filtereinheit 20 ist so konfiguriert, dass sie ein adaptives Filter 21, das eine Faltungsoperation an der Empfangssignalsequenz und der Filterkoeffizientengruppe w(n) durchführt, einen Subtrahierer 22, der eine Filterausgabe d(n) dieses adaptiven Filters 21 vom Sprachübertragungssignal y(n) subtrahiert, um ein Fehlersignal δ(n) zu erzeugen, und eine Adaptionsalgorithmuseinheit (AAL) 23, die adaptiv die Filterkoeffizientengruppe w(n) in Abhängigkeit von diesem Fehlersignal δ(n) aktualisiert, beinhaltet, wie in 2 dargestellt.
Die Empfangssignalsequenz X(n) kann durch einen N-dimensionalen Vektor ausgedrückt werden, der durch die folgende Gleichung (1) gegeben ist. $X (n) = {[x (n), x (n - 1), \dots, x (n - N + 1)]}^{T}$
In dieser Gleichung ist N eine ganze Zahl gleich oder größer als 3 und ein Symbol T zeigt eine Transposition an, die einen Zeilenvektor mit einer Zeile und N Spalten in einen Spaltenvektor mit N Zeilen und einer Spalte transformiert. Die Filterkoeffizientengruppe w(n), die in der Faltungsoperation verwendet wird, kann durch einen N-dimensionalen Vektor ausgedrückt werden, der durch die folgende Gleichung (2) gegeben ist. $w (n) = {[w_{0} (n), w_{1} (n), \dots, w_{N - 1} (n)]}^{T}$
Das adaptive Filter 21 kann die Filterausgabe d(n) berechnen, indem eine Faltungsoperation an der Empfangssignalsequenz X(n) und der Filterkoeffizientengruppe w(n) gemäß der folgenden Gleichung (3) durchgeführt wird. $d (n) = {w (n)}^{T} X (n)$
Des Weiteren berechnet der Subtrahierer 22 das Fehlersignal δ(n), indem die Filterausgabe d(n) vom Sprachübertragungssignal y(n) subtrahiert wird, wie in der folgenden Gleichung gezeigt. $δ (n) = y (n) - {w (n)}^{T} X (n)$
Die Adaptionsalgorithmuseinheit 23 korrigiert sukzessive die Filterkoeffizientengruppe w(n) auf eine derartige Weise, dass die Größe des Fehlersignals δ(n) unter einer vorbestimmten Bedingung minimiert wird. In einem Fall, bei dem ein wohlbekanntes NLMS-Verfahren, das auch ein lernendes Identifikationsverfahren genannt wird, angenommen wird, kann die Adaptionsalgorithmuseinheit 23 eine neue Filterkoeffizientengruppe w(n+1) gemäß der folgenden Gleichung (5) ableiten. $w (n + 1) = w (n) + μ (n - 1) \cdot e (n - 1) \cdot X (n - 1)$
In dieser Gleichung ist µ(n-1) ein Koeffizient zu einer Abtastzeit T_n-1 und ist zum Beispiel durch die folgende Gleichung (6) gegeben. $μ (n - 1) = \frac{α}{N σ_{x} + β} ≅ \frac{α}{{X (n - 1)}^{T} X (n - 1) + β}$
In dieser Gleichung ist α eine Schrittgröße zum Anpassen des Aktualisierungsbetrags der Filterkoeffizientengruppe und β ist eine sehr kleine Zahl, die verhindert, dass der Nenner des mittleren Ausdrucks der Gleichung (6) null wird. Des Weiteren ist N gleich der Filterlänge des adaptiven Filters 21 und σ_x ist eine Varianz des Empfangssignals. Zusätzlich dazu kann Nσ_x durch das Quadrat der Norm einer Empfangssignalsequenz X (n-1) approximiert werden: | |X(n-1) | |² (= {X (n-1) }^T•X(n-1))
Die Adaptionsalgorithmuseinheit 23 aktualisiert dann die Filterkoeffizientengruppe w(n), indem die momentane Filterkoeffizientengruppe w(n) im adaptiven Filter 21 mit der neuen Filterkoeffizientengruppe w(n+1) ersetzt wird. Da die Filterkoeffizientengruppe w(n) einen geschätzten Betrag der Charakteristiken eines Echopfads angibt, der sich vom Lautsprecher SP zum Tonkollektor MK erstreckt, bedeutet das anschließende Aktualisieren der Filterkoeffizientengruppe w(n), dass eine anschließende Schätzung der Echopfadcharakteristiken, d. h. ein Erlernen der Echopfadcharakteristiken, ausgeführt wird. Der Adaptionsalgorithmus ist nicht auf ein LMS-Verfahren und ein NLMS-Verfahren beschränkt. Die Konfiguration der adaptiven Filtereinheit 20 kann zum Beispiel zweckmäßig auf eine derartige Weise modifiziert werden, dass die adaptive Filtereinheit gemäß einem anderen Adaptionsalgorithmus, wie etwa einem Affinprojektionsverfahren oder einem RLS (Recursive Least Square)-Verfahren, arbeitet. Des Weiteren, obwohl die adaptive Filtereinheit 20 gemäß der vorliegenden Ausführungsform eine Funktion des sukzessiven Aktualisierens der Filterkoeffizientengruppe w(n) in einem Zeitbereich aufweist, während eine adaptive Filteroperation im Zeitbereich durchgeführt wird, ist die vorliegende Erfindung nicht auf dieses Beispiel beschränkt. Anstelle der adaptiven Filtereinheit 20 kann eine adaptive Filterkonfiguration zum sukzessiven Aktualisieren einer Filterkoeffizientengruppe in einem Frequenzbereich, während eine adaptive Filteroperation in einem Frequenzbereich durchgeführt wird, verwendet werden.
Als Nächstes mit Bezug auf 2 beinhaltet der Echolöscher 10 einen Echoschätzer 30, der das Lernen, das durch die oben erwähnte adaptive Filtereinheit 20 ausgeführt wird, stabilisiert und eine geschätzte Echokomponente d^(p) (n) berechnet. Dieser Echoschätzer 30 ist so konfiguriert, dass er einen Filterkoeffizientenpuffer 31, einen Falschechokalkulator 32, einen Falschechopuffer 33, einen Evaluierungswertkalkulator 34 und eine Puffersteuerung 35 beinhaltet.
Jedes Mal, wenn die Filterkoeffizientengruppe im adaptiven Filter 21 aktualisiert wird, speichert der Filterkoeffizientenpuffer 31 temporär die aktualisierte Filterkoeffizientengruppe, die zu diesem vom adaptiven Filter 21 geliefert wird. Des Weiteren speichert der Filterkoeffizientenpuffer 31 temporär eine feste Anzahl der momentanen und früheren Filterkoeffizientengruppen w⁽¹⁾ (n), w⁽²⁾ (n), ..., und w^(M) (n) (M ist eine ganze Zahl gleich oder größer als 3), die durch die adaptive Filtereinheit 20 verwendet worden sind. Es wird in dieser Beschreibung angenommen, dass „momentan“ die neueste Abtastzeit bedeutet, und „früher“ eine Abtastzeit vor der neuesten Abtastzeit bedeutet.
Eine Beziehung zwischen den gegenwärtigen und vorherigen Filterkoeffizientengruppen w⁽¹⁾ (n), w⁽²⁾ (n), ..., und w^(M) (n), die im Filterkoeffizientenpuffer 31 gespeichert sind, und den Filterkoeffizientengruppen, die durch die adaptive Filtereinheit 20 verwendet werden, ist zum Beispiel wie in der folgenden Gleichung (7) gezeigt. $[w^{(1)} (n), w^{(2)} (n), \dots, w^{(M)} (n)] = [w (n), w (n - 1), \dots, w (n - M + 1)]$
Genauer gesagt, ist die k-te Filterkoeffizientengruppe w^(k) (n), die im Filterkoeffizientenpuffer 31 gespeichert ist, die Filterkoeffizientengruppe w (n-k+1) zu der Abtastzeit T_n-k+1 . Der Filterkoeffizientenpuffer 31 löscht die älteste Filterkoeffizientengruppe aus den gespeicherten Filterkoeffizientengruppen, um die Filterkoeffizientengruppen zu aktualisieren, wenn der neueste Filterkoeffizient w(n+1), der zu diesem von der adaptiven Filtereinheit 20 geliefert wird, empfangen wird, wie in der folgenden Gleichung (8) gezeigt. $[w^{(1)} (n + 1), w^{(2)} (n + 1), \dots, w^{(M)} (n + 1)] = [w (n + 1), w (n), \dots, w (n - M + 2)]$
Obwohl bevorzugt wird, dass die Abtastzeiten T_n und T_n-1 der gegenwärtigen und der vorherigen Filterkoeffizientengruppe w(n) und w(n-1), die im Filterkoeffizientenpuffer 31 gespeichert sind, aufeinanderfolgend sind, wie in der obigen Gleichung (7) angezeigt, ist die vorliegende Erfindung nicht auf dieses Beispiel beschränkt. Die gegenwärtige und die vorherige Filterkoeffizientengruppe bei nicht aufeinanderfolgenden Abtastzeiten können alternativ dazu im Filterkoeffizientenpuffer 31 gespeichert werden und können verwendet werden.
Als Nächstes berechnet der Falschechokalkulator 32 M Falschechosignale d⁽¹⁾ (n) bis d^(M) (n), indem eine Filteroperation unter Verwendung von jeder der Filterkoeffizientengruppen w⁽¹⁾ (n) bis w^(M) (n), die aus dem Filterkoeffizientenpuffer 31 gelesen werden, an der Empfangssignalsequenz X(n) M Male durchgeführt wird. Das k-te Falschechosignal d^(k) (n) wird berechnet, indem eine Faltungsoperation unter Verwendung der k-ten Filterkoeffizientengruppe w^(k) (n) gemäß der folgenden Gleichung (9) durchgeführt wird. $d^{(k)} (n) = {w^{(k)} (n)}^{T} X (n)$
Der Falschechopuffer 33 speichert temporär die Falschechosignale d⁽¹⁾ (n) bis d^(M) (n), die zu diesem vom Falschechokalkulator 32 geliefert werden. Wie in 2 dargestellt, berechnet der Evaluierungswertkalkulator 34 M evaluierte Werte dEV₁ (n) bis dEV_M (n) einer Echolöschmenge auf Basis von sowohl den Falschechosignalen d⁽¹⁾ (n) bis d^(M) (n), die aus dem Falschechopuffer 33 gelesen werden, als auch dem gegenwärtigen Sprachübertragungssignal y(n). Genauer gesagt, wie im Folgenden als Gleichung (10) gezeigt, wird der k-te evaluierte Wert dEV_k (n) der Echolöschmenge als das Quadrat des Verhältnisses des Sprachübertragungssignals y(n) zur Differenz zwischen dem Sprachübertragungssignal y(n) und dem k-ten Falschechosignal d^(k) (n) berechnet. $E V_{k} (n) = {y (n)}^{2} / {y (n) - d^{(k)} (n)}^{2}$
Der Evaluierungswertkalkulator 34 berechnet ferner einen evaluierten Wert dEV_k (n) der Echolöschmenge, in Dezibel ausgedrückt, wie im Folgenden als Gleichung (11) gezeigt, und liefert den evaluierten Wert dEV_k (n) der Echolöschmenge zur Puffersteuerung 35. $\begin{matrix} d E V_{k} (n) = 10 \times {log}_{10} E V_{k} (n) \\ = 10 \times {log}_{10} {y (n)}^{2} - 10 \times {log}_{10} {y (n) - d^{(k)} (n)}^{2} \end{matrix}$
Die Puffersteuerung 35 weist einen Filterselektor 35f und einen Falschechoselektor 35e auf. Der Falschechoselektor 35e wählt, als die geschätzte Echokomponente d^(p) (n), ein optimales Falschechosignal aus den M Falschechosignalen d⁽¹⁾ (n) bis d^(M) (n) auf Basis der M evaluierten Werte dEV₁ (n) bis dEV_M (n) der Echolöschmenge, die zu diesem vom Evaluierungswertkalkulator 34 geliefert wird, aus und liefert ein Steuersignal Ce, das das Auswahlergebnis anzeigt, zum Falschechopuffer 33. Der Falschechopuffer 33 liefert die geschätzte Echokomponente d^(p) (n) zum Subtrahierer 25 gemäß diesem Steuersignal Ce. Der Subtrahierer 25 empfängt sowohl das Sprachübertragungssignal y(n) als auch die geschätzte Echokomponente d^(p) (n) und subtrahiert die geschätzte Echokomponente d^(p) (n) vom Sprachübertragungssignal y(n), um ein Restsignal e(n) zu erzeugen, wie in der folgenden Gleichung (12) gezeigt. $e (n) = y (n) - d^{(p)} (n)$
Dieses Restsignal e(n) wird durch die leitungsseitige Signalausgabeeinheit S_out zur Kommunikationsfunktionseinheit 11 ausgegeben.
3 ist ein Graph, der ein Beispiel für evaluierte Werte dEV₁ bis dEV₅ einer Echolöschmenge, in Dezibel ausgedrückt, darstellt. Der Falschechoselektor 35e kann zum Beispiel, als die geschätzte Echokomponente d^(p) (n), ein Falschechosignal auswählen, das dem größten evaluierten Wert dEV₃ der Echolöschmenge unter den evaluierten Werten dEV₁ bis dEV₅ der Echolöschmenge entspricht.
Andererseits wählt der Filterselektor 35f eine Filterkoeffizientengruppe w^(p) (n) aus den Filterkoeffizientengruppen w⁽¹⁾ (n) bis w^(M) (n), die im Filterkoeffizientenpuffer 31 gespeichert sind, auf Basis der M Werte dEV₁ (n) bis dEV_M (n) der Echolöschmenge aus. Der Filterselektor 35f kann zum Beispiel, als eine neue Filterkoeffizientengruppe, eine Filterkoeffizientengruppe w^(p) (n), die dem größten evaluierten Wert dEV_p (n) der Echolöschmenge unter den evaluierten Werten dEV₁ (n) bis dEV_M (n) der Echolöschmenge entspricht, aus den Filterkoeffizientengruppen w⁽¹⁾ (n) bis w^(M) (n) auswählen.
Der Filterselektor 35f liefert dann ein Steuersignal Cf, das das Auswahlergebnis anzeigt, zum Filterkoeffizientenpuffer 31. Der Filterkoeffizientenpuffer 31 liefert die neue Filterkoeffizientengruppe w^(p) (n) zum adaptiven Filter 21 gemäß diesem Steuersignal Cf. Dementsprechend aktualisiert das adaptive Filter 21 die gegenwärtig dazu gesetzte Filterkoeffizientengruppe w(n), indem die Filterkoeffizientengruppe w(n) mit der neuen Filterkoeffizientengruppe w^(p) (n) ersetzt wird. Daher, selbst wenn der Genauigkeitsgrad der Schätzung der Echopfadcharakteristiken in der adaptiven Filtereinheit 20 abnimmt und ein fehlerhaftes Lernen der Echopfadcharakteristiken auftritt, kann die Filterkoeffizientengruppe w(n) durch eine vorherige Filterkoeffizientengruppe ersetzt werden, die verwendet worden ist, wenn das Lernen normal ausgeführt werden konnte. Infolgedessen wird ein Vorteil des Bereitstellens einer Verbesserung in der Stabilisierung des Lernens der Echopfadcharakteristiken, das durch die adaptive Filtereinheit 20 ausgeführt wird, bereitgestellt. Des Weiteren wird die Robustheit gegenüber einem Störsignal, wie etwa einer Stimme eines Nahend-Sprechers oder Hintergrundgeräusch, die bzw. das in das akustische Echo gemischt wird, auch verbessert.
Wenn der Evaluierungswertkalkulator 34 den evaluierten Wert dEV_p (n) der Echolöschmenge berechnet, ist die gleiche Signalkomponente (=y (n)-d^(p) (n)) wie das Restsignal e(n), das die Ausgabe des Subtrahierers 25 ist, berechnet worden. Daher kann, anstelle des Subtrahierers 25, ein Pufferspeicher verwendet werden, der temporär die Signalkomponenten (y (n)-d^(k) (n)) (k=1 bis M) speichert, die durch den Evaluierungswertkalkulator 34 berechnet werden. Dieser Pufferspeicher muss nur, als das Restsignal e(n), die Signalkomponente (y(n)-d^(p) (n)), die dem größten evaluierten Wert dEV_p (n) der Echolöschmenge entspricht, zur leitungsseitigen Signalausgabeeinheit S_out liefern.
Als Nächstes wird ein Beispiel für den Betrieb des oben erwähnten Echolöschers 10 unter Bezugnahme auf 4 erläutert. 4 ist ein Flussdiagramm, das ein Beispiel für die Prozedur einer Echolöschverarbeitung darstellt, die durch den Echolöscher 10 ausgeführt wird.
Mit Bezug auf 4 steht die adaptive Filtereinheit 20 bereit, bis eine Empfangssignalsequenz X(n) zu einer Abtastzeit T_n eingegeben wird (wenn NEIN im Schritt ST1). Wenn eine Empfangssignalsequenz X(n) eingegeben wird (wenn JA im Schritt ST1), führt die adaptive Filtereinheit 20 eine Filteroperation, wie oben erwähnt, durch, um die Filterkoeffizientengruppe zu aktualisieren (Schritt ST2). Die aktualisierte Filterkoeffizientengruppe w(n) wird zum Filterkoeffizientenpuffer 31 geliefert. Wenn die zu diesem vom adaptiven Filter 21 gelieferte aktualisierte Filterkoeffizientengruppe w(n) empfangen wird, aktualisiert der Filterkoeffizientenpuffer 31 die in diesem gespeicherten Filterkoeffizientengruppen (Schritt ST3).
Als Nächstes setzt der Falschechokalkulator 32 die Filterkoeffizientengruppennummer k zu „1“ (Schritt ST4) und führt eine Filteroperation unter Verwendung der k-ten Filterkoeffizientengruppe w^(k) (n) durch, die aus dem Filterkoeffizientenpuffer 31 gelesen wird, um ein Falschechosignal d^(k) (n) zu erzeugen (Schritt ST5). Dieses Falschechosignal d^(k) (n) wird im Falschechopuffer 33 gespeichert. Als Nächstes berechnet der Evaluierungswertkalkulator 34 einen evaluierten Wert dEV_k (n) der Echolöschmenge auf Basis von sowohl dem Falschechosignal d^(k) (n) als auch dem gegenwärtigen Sprachübertragungssignal y(n) (Schritt ST6). Dieser evaluierte Wert dEV_k (n) der Echolöschmenge wird zur Puffersteuerung 35 geliefert. Danach inkrementiert der Evaluierungswertkalkulator 34 die Nummer k um 1 (Schritt ST7) und, wenn die Nummer k gleich oder kleiner als ein Maximum M ist (wenn JA im Schritt ST8), kehrt die Verarbeitungsprozedur zum Schritt ST5 zurück.
Im Gegensatz dazu, wenn die Nummer k nicht gleich oder kleiner als das Maximum M ist (wenn NEIN im Schritt ST8), mit anderen Worten, wenn die M evaluierten Werte dEV₁ (n) bis dEV_M (n) der Echolöschmenge für alle Falschechosignale d⁽¹⁾ (n) bis d^(M) (n) berechnet werden, geht die Verarbeitungsprozedur zu Schritt ST9 über. In dem in 4 dargestellten Beispiel werden die M evaluierten Werte dEV₁ (n) bis dEV_M (n) der Echolöschmenge in dieser Reihenfolge (Schritte ST4 bis ST8) berechnet. Alternativ dazu können die M evaluierten Werte dEV₁ (n) bis dEV_M (n) der Echolöschmenge gleichzeitig parallel berechnet werden.
Der Falschechoselektor 35e wählt im nächsten Schritt ST9, als die geschätzte Echokomponente d^(p) (n), ein optimales Falschechosignal aus den M Falschechosignalen d⁽¹⁾ (n) bis d^(M) (n) auf Basis der evaluierten Werte dEV₁ (n) bis dEV_M (n) der Echolöschmenge aus (Schritt ST9). Ein Steuersignal Ce, das dieses Auswahlergebnis anzeigt, wird zum Falschechopuffer 33 geliefert.
Andererseits wählt der Filterselektor 35f eine neue Filterkoeffizientengruppe w^(p) (n) aus den Filterkoeffizientengruppen w⁽¹⁾ (n) bis w^(M) (n), die im Filterkoeffizientenpuffer 31 gespeichert sind, auf Basis der evaluierten Werte dEV₁ (n) bis dEV_M (n) der Echolöschmenge aus (Schritt ST10) . Ein Steuersignal Cf, das dieses Auswahlergebnis anzeigt, wird zum Filterkoeffizientenpuffer 31 geliefert.
Danach ersetzt der Filterkoeffizientenpuffer 31 die Filterkoeffizientengruppe w(n) in der adaptiven Filtereinheit 20 mit der neuen Filterkoeffizientengruppe w^(p) (n), indem die neue Filterkoeffizientengruppe w^(p) (n), die durch das Steuersignal Cf spezifiziert wird, zum adaptiven Filter 21 geliefert wird (Schritt ST11).
Andererseits bewirkt der Falschechopuffer 33, dass der Subtrahierer 25 ein Restsignal e(n) erzeugt, indem die geschätzte Echokomponente d^(p) (n), die durch das Steuersignal Ce spezifiziert wird, zum Subtrahierer 25 geliefert wird (Schritt ST12). Danach gibt die leitungsseitige Signalausgabeeinheit S_out das Restsignal e(n) zur Kommunikationsfunktionseinheit 11 aus (Schritt ST13).
Wenn die Echolöschverarbeitung nach dem Schritt ST13 fortgesetzt wird (wenn JA im Schritt ST14), kehrt die Verarbeitungsprozedur zum Schritt ST1 zurück. Im Gegensatz dazu, wenn die Echolöschverarbeitung nicht fortgesetzt wird (wenn NEIN im Schritt ST14), wird die Echolöschverarbeitung beendet.
Die oben erwähnten Schritte ST9, ST10, ST11 und ST12 müssen nicht in dieser Reihenfolge verarbeitet werden. Beispielsweise können die Schritte ST9 und ST10 gleichzeitig parallel durchgeführt werden und die Schritte ST11 und ST12 können gleichzeitig parallel durchgeführt werden. Des Weiteren kann der Schritt ST11 durchgeführt werden, bevor der Schritt ST10 durchgeführt wird.
Die Hardwarekonfiguration des oben erwähnten Echolöschers 10 kann durch zum Beispiel einen Computer, wie etwa eine Arbeitsstation oder ein Mainframe, in dem eine CPU (Zentralverarbeitungseinheit) enthalten ist, implementiert werden. Als eine Alternative kann die Hardwarekonfiguration des oben erwähnten Echolöschers 10 durch eine LSI (Large Scale Integrated circuit), wie etwa einen DSP (Digitalsignalprozessor), eine ASIC (anwendungsspezifische integrierte Schaltung) oder ein FPGA (feldprogrammierbares Gate-Array), implementiert werden.
5 ist ein Blockdiagramm, das ein Beispiel für die Hardwarekonfiguration des Echolöschers 10 darstellt, der unter Verwendung einer LSI, wie etwa eines DSP, einer ASIC oder eines FPGA, konfiguriert wird. In dem in 5 dargestellten Beispiel besteht der Echolöscher 10 aus einer Signalverarbeitungsschaltung 50, einer Audioeingabe-/-ausgabeeinheit 51, einer Eingabe-/Ausgabeeinheit 52 an der Kommunikationsleitungsseite, einem Aufzeichnungsmedium 53 und einem Signalpfad 54, wie etwa einem Bus. Die Audioeingabe-/-ausgabeeinheit 51 ist eine Schnittstellenschaltung, die die Funktionen der Signaleingabeeinheit S_in , und der Signalausgabeeinheit R_out implementiert, und die Eingabe-/Ausgabeeinheit 52 an der Kommunikationsleitungsseite ist eine Schnittstellenschaltung, die die Funktionen der leitungsseitigen Signalausgabeeinheit S_out und der leitungsseitigen Signaleingabeeinheit R_in, implementiert. Die Funktionen der adaptiven Filtereinheit 20, des Echoschätzers 30 und des Subtrahierers 25 können durch die Signalverarbeitungsschaltung 50 und das Aufzeichnungsmedium 53 implementiert werden. Das Aufzeichnungsmedium 53 kann als der Filterkoeffizientenpuffer 31 und der Falschechopuffer 33 verwendet werden. Als das Aufzeichnungsmedium 53 kann zum Beispiel ein flüchtiger Speicher, wie etwa ein SDRAM (Synchroner DRAM), ein HDD (Festplattenlaufwerk) oder ein SSD (Halbleiterlaufwerk), verwendet werden.
Andererseits ist 6 ein Blockdiagramm, das ein Beispiel für die Hardwarekonfiguration des Echolöschers 10 darstellt, der unter Verwendung eines Computers konfiguriert wird. In dem in 6 dargestellten Beispiel besteht der Echolöscher 10 aus einem Prozessor 60, in dem eine CPU 60c enthalten ist, einem RAM (Direktzugriffsspeicher) 61, einem ROM (Nurlesespeicher) 62, einer Audioeingabe-/-ausgabeeinheit 63, einer Eingabe-/Ausgabeeinheit 64 an der Kommunikationsleitungsseite, einem Aufzeichnungsmedium 65 und einen Signalpfad 66, wie etwa einem Bus. Die Audioeingabe-/-ausgabeeinheit 63 ist eine Schnittstellenschaltung, die die Funktionen der Signaleingabeeinheit S_in , und der Signalausgabeeinheit R_out implementiert, und die Eingabe-/Ausgabeeinheit 64 an der Kommunikationsleitungsseite ist eine Schnittstellenschaltung, die die Funktionen der leitungsseitigen Signalausgabeeinheit S_out und der leitungsseitigen Signaleingabeeinheit R_in , implementiert. Die Funktionen der adaptiven Filtereinheit 20, des Echoschätzers 30 und des Subtrahierers 25 können durch den Prozessor 60 und das Aufzeichnungsmedium 65 implementiert werden. Das Aufzeichnungsmedium 65 kann als der Filterkoeffizientenpuffer 31 und der Falschechopuffer 33 verwendet werden. Der Prozessor 60 kann die gleiche Signalverarbeitung ausführen, wie die, die durch die adaptive Filtereinheit 20, den Echoschätzer 30 und den Subtrahierer 25 ausgeführt wird, indem der RAM 61 als ein Speicher für Vorgänge verwendet wird und gemäß einem Computerprogramm, das aus dem ROM 62 gelesen wird, gearbeitet wird. Als das Aufzeichnungsmedium 65 kann zum Beispiel ein flüchtiger Speicher, wie etwa ein SDRAM, ein HDD oder ein SSD, verwendet werden.
Wie oben erläutert, kann der Echolöscher 10 der Ausführungsform 1 ein Restsignal e(n) erzeugen, indem eine geschätzte Echokomponente d^(p) (n) von den Falschechosignalen, die im Falschechopuffer 33 gespeichert sind, selektiv verwendet wird, selbst, wenn die Schätzungsgenauigkeit der Echopfadcharakteristiken in der adaptiven Filtereinheit 20 abnimmt und ein fehlerhaftes Lernen der Echopfadcharakteristiken auftritt. Daher kann eine Echolöschleistung erzielt werden, die unter einer Umgebung, bei der ein Doppelsprechen auftritt, stabil ist. Des Weiteren kann die Filterkoeffizientengruppe w(n) in der adaptiven Filtereinheit 20 auch durch eine vorherige Filterkoeffizientengruppe ersetzt werden, die verwendet worden ist, wenn das Lernen normal ausgeführt werden konnte. Infolgedessen kann das Lernen der Echopfadcharakteristiken, das durch die adaptive Filtereinheit 20 ausgeführt wird, im Vergleich zu herkömmlichen Techniken stabiler sein. Des Weiteren wird die Robustheit gegenüber einem Störsignal, wie etwa einer Stimme eines Nahend-Sprechers oder Hintergrundgeräusch, die bzw. das in das akustische Echo gemischt ist, verbessert. Insbesondere kann die Robustheit gegenüber einem relativ längeren Doppelsprechzustand verbessert werden, indem die oben erwähnte Anzahl M so festgelegt wird, dass sie ein großer Wert bis zu einem gewissen Grad ist.
Zusätzlich dazu, da der Betrag der Echolöschung maximiert werden kann, indem die geschätzte Echokomponente d^(p) (n) von den Falschechosignalen, die im Falschechopuffer 33 gespeichert sind, selektiv verwendet wird, wenn eine Echopfadvariation aufgrund einer Umgebungsvariation, wie etwa einer Bewegung einer Person, die sich in der Nähe des Lautsprechers SP befindet, auftritt, wird die Hochgeschwindigkeitsfolgefähigkeit gegenüber Echopfadvariationen verbessert. Daher kann der Echolöscher 10 gemäß der vorliegenden Ausführungsform eine Echolöschleistung beibehalten, die selbst unter einer Umgebung stabil ist, bei der ein Doppelsprechen oder eine Echopfadvariation auftritt.
Ausführungsform 2.
Als Nächstes wird die Ausführungsform 2 gemäß der vorliegenden Erfindung erläutert. 7 ist ein Blockdiagramm, das die schematische Konfiguration eines Echolöschers 10A der Ausführungsform 2 darstellt. Eine Sprachtelekommunikationseinrichtung kann durch eine Kombination dieses Echolöschers 10A und einer in 1 dargestellten Kommunikationsfunktionseinheit 11, wie im Fall des Echolöschers 10 der oben beschriebenen Ausführungsform 1, konfiguriert werden.
Wie in 7 dargestellt, beinhaltet der Echolöscher 10A der Ausführungsform 2 eine Signaleingabeeinheit Sin, eine Signalausgabeeinheit R_out , eine leitungsseitige Signalausgabeeinheit S_out und eine leitungsseitige Signaleingabeeinheit R_in und beinhaltet auch eine adaptive Filtereinheit 20 und einen Subtrahierer 25, wie der Echolöscher 10 gemäß der oben beschriebenen Ausführungsform 1.
Des Weiteren beinhaltet der Echolöscher 10A einen Echoschätzer 30A. Dieser Echoschätzer 30A weist einen Filterkoeffizientenpuffer 31, einen Falschechokalkulator 32 und einen Evaluierungswertkalkulator 34 auf, wie der Echoschätzer 30 gemäß der oben beschriebenen Ausführungsform 1, und weist ferner eine Puffersteuerung 35A einschließlich eines Filterselektors 35f und ein FG(Vordergrund)-Filter 36 auf.
Das FG-Filter 36 erzeugt eine geschätzte Echokomponente d_FG(n), indem eine Filteroperation unter Verwendung einer Filterkoeffizientengruppe w_FG(n) an einer Empfangssignalsequenz X(n) durchgeführt wird. Genauer gesagt, kann das FG-Filter 36 eine geschätzte Echokomponente d_FG(n) erzeugen, indem eine Faltungsoperation an der Empfangssignalsequenz X(n) und der Filterkoeffizientengruppe w_FG(n) gemäß der folgenden Gleichung (13) durchgeführt wird. $d_{F G} (n) = {w_{F G} (n)}^{T} X (n)$
Der Subtrahierer 25 subtrahiert die geschätzte Echokomponente d_FG (n) von einem Sprachübertragungssignal y (n), um ein Restsignal e (n) zu erzeugen. Dieses Restsignal e (n) wird durch die leitungsseitige Signalausgabeeinheit S_out zur Kommunikationsfunktionseinheit 11 ausgegeben.
Als Nächstes wird ein Beispiel für den Betrieb des oben erwähnten Echolöschers 10A unter Bezugnahme auf 8 erläutert. 8 ist ein Flussdiagramm, das ein Beispiel für die Prozedur einer Echolöschverarbeitung darstellt, die durch den Echolöscher 10A ausgeführt wird. Da die Einzelheiten der Vorgänge der Schritte ST1 bis ST11 von 8 die gleichen sind wie die der Schritte ST1 bis ST11 von 3 gemäß der oben beschriebenen Ausführungsform 1, wird die Erläuterung der Einzelheiten der Vorgänge nachfolgend weggelassen.
Das FG-Filter 36 erzeugt im Schritt ST20 eine geschätzte Echokomponente d_FG (n), indem eine Filteroperation unter Verwendung einer neuen Filterkoeffizientengruppe w^(p) (n), die vom Filterkoeffizientenpuffer 31 erfasst wird, durchgeführt wird (Schritt ST20). Genauer gesagt, wenn die dahin gelieferte neue Filterkoeffizientengruppe w^(p) (n) empfangen wird, aktualisiert das FG-Filter 36 eine vorherige Filterkoeffizientengruppe w_FG(n-1) davon zu einer Filterkoeffizientengruppe w_FG(n) (=w^(p) (n)), indem die Filterkoeffizientengruppe w_FG(n-1) mit der neuen Filterkoeffizientengruppe w^(p) (n) ersetzt wird. Das FG-Filter 36 kann dann eine geschätzte Echokomponente d_FG(n) erzeugen, indem eine Faltungsoperation an der aktualisierten Filterkoeffizientengruppe w_FG (n) und der Empfangssignalsequenz X(n) durchgeführt wird.
Als eine Alternative kann das FG-Filter 36 eine Kombinationsfilterkoeffizientengruppe erzeugen, indem eine Linearkombination der neuen Filterkoeffizientengruppe w^(p) (n) und der vorherigen Filterkoeffizientengruppe w_FG(n-1), die durch das FG-Filter 36 verwendet worden ist, durchgeführt wird, und kann die vorherige Filterkoeffizientengruppe w_FG ^(p) (n-1) mit der Kombinationsfilterkoeffizientengruppe w^(p) (n) ersetzen. Das FG-Filter 36 kann dann eine geschätzte Echokomponente d_FG (n) erzeugen, indem eine Filteroperation unter Verwendung dieser Kombinationsfilterkoeffizientengruppe w_FG(n) durchgeführt wird. Wenn ein Gewichtungsfaktor, der der neuen Filterkoeffizientengruppe w^(p) (n) zugewiesen wird, durch γ bezeichnet wird, kann die Kombinationsfilterkoeffizientengruppe w_FG(n) gemäß der folgenden Gleichung (14) berechnet werden. $w_{F G} (n) = (1 - γ) \cdot w_{F G} (n - 1) + γ \cdot w^{(p)} (n)$
Der Gewichtungsfaktor γ wird ein Vergessenheitskoeffizient genannt. Es wird bevorzugt, den Vergessenheitskoeffizienten γ auf einen Wert nahe Null zu setzen. Es ist zum Beispiel wünschenswert, dass der Vergessenheitskoeffizient größer als null ist und innerhalb eines Bereichs fällt, der kleiner als 0,1 ist. Da die Filterkoeffizientengruppe der adaptiven Filtereinheit 20 in das FG-Filter 36 über einen gewissen Zeitraum integriert wird, indem die derartige Kombinationsfilterkoeffizientengruppe wie oben verwendet wird, kann eine Verbesserung in der Robustheit gegenüber einem Doppelsprechen bereitgestellt werden.
Nach dem oben erwähnten Schritt ST20 subtrahiert der Subtrahierer 25 die geschätzte Echokomponente d_FG(n) vom Sprachübertragungssignal y(n), um ein Restsignal e(n) zu erzeugen (Schritt ST21), und die leitungsseitige Signalausgabeeinheit S_out gibt das Restsignal e(n) zur Kommunikationsfunktionseinheit 11 aus (Schritt ST22).
Danach, wenn die Echolöschverarbeitung fortgesetzt wird (wenn JA im Schritt ST23), kehrt die Verarbeitungsprozedur zum Schritt ST1 zurück. Im Gegensatz dazu, wenn die Echolöschverarbeitung nicht fortgesetzt wird (wenn NEIN im Schritt ST23), wird die Echolöschverarbeitung beendet.
Die Hardwarekonfiguration des Echolöschers 10A gemäß der vorliegenden Ausführungsform kann durch zum Beispiel einen Computer, wie etwa eine Arbeitsstation oder ein Mainframe, in dem eine CPU enthalten ist, implementiert werden. Als eine Alternative kann die Hardwarekonfiguration des Echolöschers 10A unter Verwendung einer LSI, wie etwa eines DSP, einer ASIC oder eines FPGA, implementiert werden. Die Hardwarekonfiguration des Echolöschers 10A kann alternativ dazu durch die in 5 oder 6 dargestellte Konfiguration implementiert werden, wie im Fall der Ausführungsform 1.
Wie oben erläutert, wird im Echolöscher 10A der Ausführungsform 2 eine optimale Filterkoeffizientengruppe w^(p) (n) aus den gegenwärtigen und vorherigen Filterkoeffizientengruppen w⁽¹⁾ (n) bis w^(M) (n), die durch die adaptive Filtereinheit 20 verwendet worden sind, ausgewählt und diese Filterkoeffizientengruppe w^(p) (n) wird in die Filterkoeffizientengruppe w_FG (n) des FG-Filters 36 integriert. Das FG-Filter 36 erzeugt eine geschätzte Echokomponente d_FG(n) , indem diese Filterkoeffizientengruppe w_FG(n) verwendet wird. Des Weiteren kann die Filterkoeffizientengruppe w(n) in der adaptiven Filtereinheit 20 auch durch eine vorherige Filterkoeffizientengruppe ersetzt werden, die verwendet worden ist, wenn das Lernen normal ausgeführt werden konnte. Daher kann die Robustheit gegenüber einem Störsignal im Vergleich zu herkömmlichen Techniken weiter verbessert werden. Daher kann eine stabile Echolöschleistung erzielt werden.
Obwohl die verschiedenen Ausführungsformen der vorliegenden Erfindung unter Bezugnahme auf die Zeichnungen beschrieben werden, wie zuvor erläutert, dienen diese Ausführungsformen als Beispiele für die vorliegende Erfindung und verschiedene Ausführungsformen außer diesen Aus führungs formen können auch angenommen werden. Zum Zwecke der Zweckmäßigkeit der Erläuterung ist der Filterkoeffizientenpuffer 31 gemäß einer beliebigen der Ausführungsformen 1 und 2 zum Beispiel so konfiguriert, dass er drei oder mehr Filterkoeffizientengruppen w⁽¹⁾ (n) bis w^(M) (n) speichert. Die vorliegende Erfindung ist jedoch nicht auf dieses Beispiel beschränkt und der Filterkoeffizientenpuffer kann so konfiguriert sein, dass er zwei Filterkoeffizientengruppen w⁽¹⁾ (n) und w⁽²⁾ (n) speichert. In diesem Fall berechnet der Evaluierungswertkalkulator 34 zwei evaluierte Werte dEV₁ (n) und dEV₂(n) der Echolöschmenge.
Innerhalb des Schutzumfangs der vorliegenden Erfindung kann eine beliebige Kombination der Ausführungsformen 1 und 2 wie oben beschrieben vorgenommen werden, eine Änderung in einer beliebigen Komponente gemäß einer beliebigen der oben erwähnten Ausführungsformen kann vorgenommen werden oder eine beliebige Komponente gemäß einer beliebigen der oben erwähnten Ausführungsformen kann weggelassen werden.
INDUSTRIELLE ANWENDBARKEIT
Die Echolöscheinrichtung und die Sprachtelekommunikationseinrichtung gemäß der vorliegenden Erfindung können zum Beispiel für ein Festnetztelefon, ein Mobiltelefon mit einer Lautsprecherfunktion, ein Freisprechkommunikationssystem und ein Videokonferenzsystem verwendet werden.
Bezugszeichenliste
1A, 1B: Sprachtelekommunikationseinrichtungen; 10, 10A: Echolöscher; 11: Kommunikationsfunktionseinheit; 20: adaptive Filtereinheit; 21: adaptives Filter; 22: Subtrahierer; 23: Adaptionsalgorithmuseinheit (AAL); 25: Subtrahierer; 30, 30A: Echoschätzer; 31: Filterkoeffizientenpuffer; 32: Falschechokalkulator; 33: Falschechopuffer; 34: Evaluierungswertkalkulator; 35, 35A: Puffersteuerung; 35e: Falschechoselektor; 35f: Filterselektor; 36: FG(Vordergrund)-Filter; 50: Signalverarbeitungsschaltung; 51: Audioeingabe-/-ausgabeeinheit; 52: Eingabe-/Ausgabeeinheit an der Kommunikationsleitungsseite; 53: Aufzeichnungsmedium; 54:Signalpfad; 60: Prozessor; 60c: CPU; 61: RAM; 62: ROM; 63: Audioeingabe-/-ausgabeeinheit; 64: leitungsseitige Eingabe-/Ausgabeeinheit; 65: Aufzeichnungsmedium; 66: Signalpfad; MK: Tonkollektor; SP: Lautsprecher; Sin: Signaleingabeeinheit; S_out : leitungsseitige Signalausgabeeinheit; R_out : Signalausgabeeinheit und Rin: leitungsseitige Signaleingabeeinheit.

Claims

Echolöscheinrichtung (10), die Folgendes umfasst: eine adaptive Filtereinheit (20), die ausgelegt ist zum Durchführen einer Filteroperation unter Verwendung einer Filterkoeffizientengruppe auf einer in diese eingegebenen Sequenz von Empfangssignalen und zum adaptiven Aktualisieren der Filterkoeffizientengruppe auf Basis eines in diese von einem Tonkollektor eingegebenen Sprachübertragungssignals; einen Falschechokalkulator (32), der ausgelegt ist zum Erfassen von gegenwärtigen und vorherigen Filterkoeffizientengruppen, die durch die adaptive Filtereinheit (20) verwendet worden sind, und zum Berechnen von Falschechosignalen, indem Filteroperationen unter Verwendung der gegenwärtigen und vorherigen Filterkoeffizientengruppen auf der Sequenz von Empfangssignalen durchgeführt werden; einen Evaluierungswertkalkulator (34), der ausgelegt ist zum Berechnen von evaluierten Werten einer Echolöschmenge, die den entsprechenden Falschechosignalen entsprechen, auf Basis des Sprachübertragungssignals und der Falschechosignale; einen Falschechoselektor (35e), der ausgelegt ist zum Auswählen, als eine geschätzte Echokomponente, eines Falschechosignals aus den Falschechosignalen auf Basis der evaluierten Werte der Echolöschmenge; und eine Signalausgabeeinheit (S_out), die ausgelegt ist zum Ausgeben eines Restsignals, das eine Differenz zwischen der geschätzten Echokomponente und dem Sprachübertragungssignal angibt.
Echolöscheinrichtung (10) nach Anspruch 1, ferner umfassend einen Filterselektor (35f), der ausgelegt ist zum Auswählen, als eine neue Filterkoeffizientengruppe, einer Filterkoeffizientengruppe aus den gegenwärtigen und vorherigen Filterkoeffizientengruppen auf Basis der mehreren evaluierten Werte der Echolöschmenge, wobei der Filterselektor (35f) die Werte der Filterkoeffizientengruppe in der adaptiven Filtereinheit (20) mit der neuen Filterkoeffizientengruppe ersetzt.
Echolöscheinrichtung (10) nach Anspruch 2, ferner umfassend einen Filterkoeffizientenpuffer (31), der ausgelegt ist zum temporären Speichern der gegenwärtigen und der vorherigen Filterkoeffizientengruppen, wobei der Filterkoeffizientenpuffer (31) die neue Filterkoeffizientengruppe zur adaptiven Filtereinheit (20) unter Steuerung des Filtersektors (35f) liefert.
Echolöscheinrichtung (10) nach Anspruch 1, wobei der Evaluierungswertkalkulator (34), als jeden der evaluierten Werte der Echolöschmenge, ein Quadrat eines Verhältnisses des Sprachübertragungssignals zu einer Differenz zwischen dem Sprachübertragungssignal und jedem der Falschechosignale berechnet.
Echolöscheinrichtung (10) nach Anspruch 1, wobei die evaluierten Werte der Echolöschmenge auf Basis eines gegenwärtigen Sprachübertragungssignals, das vom Tonkollektor eingegeben wird, berechnet werden.
Echolöscheinrichtung (10) nach Anspruch 1, die ferner Folgendes umfasst: einen Falschechopuffer (33), der ausgelegt ist zum temporären Speichern der Falschechosignale; und einen Subtrahierer (25), der ausgelegt ist zum Empfangen des zu diesem gelieferten Sprachübertragungssignals, wobei der Falschechopuffer (33) die geschätzte Echokomponente unter Steuerung des Falschechoselektors (35e) ausgibt und der Subtrahierer (25) die geschätzte Echokomponente, die vom Falschechopuffer ausgegeben wird, vom Sprachübertragungssignal subtrahiert, um dadurch das Restsignal zu erzeugen.
Echolöscheinrichtung (10) nach Anspruch 1, wobei die adaptive Filtereinheit (20) das Aktualisieren unter Verwendung eines Adaptionsalgorithmus basierend auf einem lernenden Identifikationsverfahren ausführt.
Sprachtelekommunikationseinrichtung (1A), die Folgendes umfasst: eine Kommunikationsfunktionseinheit (11), die ausgelegt ist zum Kommunizieren mit einer anderen Sprachtelekommunikationseinrichtung (1B)über ein elektrisches Kommunikationsnetzwerk (NW); und die Echolöscheinrichtung (10) nach Anspruch 1, die mit sowohl einem Lautsprecher (SP) zum Umwandeln einer in diese von der Kommunikationsfunktionseinheit (11) eingegebenen Empfangssignalsequenz in eine akustische Welle, um die akustische Welle zu emittieren, als auch mit einem Tonkollektor (MK) verbunden ist, wobei die Echolöscheinrichtung (10) eine akustische Echokomponente in einem in diese vom Tonkollektor (MK) eingegebenen Sprachübertragungssignal unter Verwendung der Empfangssignalsequenz verringert.