DE102008027848A1 - Echounterdrücker, Echounterdrückungsverfahren und computerlesbares Speichermedium - Google Patents

Echounterdrücker, Echounterdrückungsverfahren und computerlesbares Speichermedium Download PDF

Info

Publication number
DE102008027848A1
DE102008027848A1 DE102008027848A DE102008027848A DE102008027848A1 DE 102008027848 A1 DE102008027848 A1 DE 102008027848A1 DE 102008027848 A DE102008027848 A DE 102008027848A DE 102008027848 A DE102008027848 A DE 102008027848A DE 102008027848 A1 DE102008027848 A1 DE 102008027848A1
Authority
DE
Germany
Prior art keywords
signal
echo
measured
correlation
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE102008027848A
Other languages
English (en)
Other versions
DE102008027848B4 (de
Inventor
Naoshi Kawasaki Matsuo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of DE102008027848A1 publication Critical patent/DE102008027848A1/de
Application granted granted Critical
Publication of DE102008027848B4 publication Critical patent/DE102008027848B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Abstract

Ein Gerät zum Unterdrücken eines Echosignals, welches in einem gemessenen Signal enthalten ist, das einem gemessenen Ton entspricht, wird bereitgestellt. In dem Gerät werden das gemessene Signal und ein Referenzsignal in einem Zeitbereich in einen Frequenzbereich transformiert und berechnet, um jeden Wert eines Verhältnisses und einer Korrelation zwischen dem gemessenen Signal und dem Referenzsignal in dem Frequenzbereich zu erhalten. Durch Ausführen eines Vergleichs der Werte des Verhältnisses und der Korrelation wird ein Koeffizient hergeleitet, wo ein Produkt des Koeffizienten und des gemessenen Tons in dem Frequenzbereich einen geschätzten Wert des Echosignals ergibt. Das Echo in dem gemessenen Signal wird durch Subtrahieren der Schätzung des Echosignals von dem gemessenen Signal unterdrückt, jeweils in dem Frequenzbereich.

Description

  • HINTERGRUND DER ERFINDUNG
  • 1. Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft die Echounterdrückung, insbesondere einen Echounterdrücker, ein Verfahren und ein computerlesbares Speichermedium zum Unterdrücken des Echos, welches durch einen Ton verursacht wird, der durch eine Tonausgabevorrichtung erzeugt wird.
  • 2. Beschreibung des Standes der Technik
  • Die Spracherkennungstechnik hat sich entwickelt, wobei sie noch nicht das perfekte Maß erreicht hat. Beispielsweise kann ein Drücken eines Sprechschalters, um ein Fahrzeugnavigationssystem stumm zu schalten, dem System ermöglichen, die Höranweisung des Benutzers genau zu erkennen. Allerdings ist kein redundanter Arbeitsvorgang erforderlich, wie z. B. der Vorgang eines Drückens des Sprechschalters, bevor mit dem System gesprochen wird. Um ein Sichern zu verbessern, erfordert der Arbeitsvorgang eine Echoauslöschung, um ein Echo zu unterdrücken, welches durch Töne verursacht wird, die aus einem Lautsprecher des Systems an ein Mikrofon ausgegeben werden. Insbesondere wird ein Ton aus einem einer Mehrzahl von Lautsprechern in einem mehrkanaligen Fahrzeugaudiosystem zu einem Rauschen führen, welches sich auf die Stimme des Benutzers auswirkt, wenn der Ton mit einem Mikrofon empfangen werden wird, welches zum Empfangen einer Höranweisung des Benutzers vorgesehen ist. Daher ist ein Verfahren einer verbesserten Echoauslöschung erforderlich, um einen Ton auszulöschen, welcher aus einem Fahrzeugaudiosystem ausgegeben und durch ein Mikrofon empfangen wird, das für ein Spracherkennungssystem vorgesehen ist.
  • 12 zeigt eines vorgeschlagener Echoauslöschungssysteme, in welchem ein herkömmliches Echounterdrückungsverfahren (Echoauslöschungsverfahren) auf ein mehrkanaliges Audiosystem angewendet wird. Das Verfahren einer Echounterdrückung in dem System hängt von dem Verfahren für ein einkanaliges Audiosystem ab, durch welches eine Echoauslöschung für einen Kanal durchgeführt wird, wie in 12 gezeigt. Mehrere Tonsignale, welche von einem mehrkanaligen Audiosystem 2000 ausgesendet werden, werden entsprechenden Lautsprechern 2001-1, ... und 2001-n zugeführt, von denen jeder einen Ton gemäß jedem Signal ausgibt. Der Echounterdrücker 1000 arbeitet so, um ein Echosignal aus einem betroffenen Tonsignal auszulöschen, welches durch den Ton aktiviert wird, der durch das Mikrophon 2002 empfangen wird, wobei das Echosignal eine Summierung von Tonsignalen ist, welche aus einer Mehrzahl von Kanälen erhalten werden.
  • Die Echoentfernung wird durchgeführt, indem ein Echo eines Wahrnehmungstonsignals y(t) unterdrückt wird, welches basierend auf einem empfangenen Ton erzeugt wird, indem Referenztonsignale x1(t), ... und xn(t) verwendet werden, welche basierend auf Ausgabetönen mehrerer Kanäle (n) mit mehreren Unterdrückungsmechanismen (Echoauslöschern) 1001-1, ... und 1001-n erzeugt werden, die den Referenzsignalen x1(t), ... und xn(t) entsprechen.
  • Neben der Struktur der 12 wird ein weiterer Echounterdrücker vorgeschlagen, welcher realisiert wird, indem ein Echounterdrückungsverfahren, das an ein einkanaliges Audiosystem anpassbar ist, auf ein mehrkanaliges Audiosystem angewendet wird. 13 ist ein schematisches Diagramm, welches einen herkömmlichen zweiten Echounterdrücker zeigt. Der zweite Echounterdrücker 1000 addiert Referenztonsignale x1(t), ... und xn(t), welche basierend auf Tönen mehrerer Kanäle erzeugt werden, mit einem Additionsmechanismus 1002, um ein addiertes Referenztonsignal x(t) zu erzeugen, und unterdrückt ein Echo eines Wahrnehmungstonsignals y(t) basierend auf dem addierten Referenztonsignal x(t).
  • 14 ist ein Funktionsblockdiagramm, welches die Funktionskonfiguration der Unterdrückungsmechanismen 1001 des herkömmlichen Echounterdrückers zeigt. Jeder Unterdrückungsmechanismus 1001 umfasst eine Erkennungseinheit 10010 zum Erkennen eines Doppelsprechzustands, in welchem ein Sprecher spricht, und eines Einzelsprechzustands, in welchem kein Sprecher spricht (während der Äußerung des Fahrzeugaudiosystems), eine Aktualisierungseinheit 10011 für einen Filterfaktor zum Aktualisieren eines Filterkoeffizienten, der zum Schätzen eines Echopegels durch eine Verarbeitung basierend auf dem adaptiven NLMS-(normalized least mean square)Algorithmus notwendig ist, ein lineares FIR-(finite impulse response)Filter 10012 zum Schätzen eines Echosignals x'(t) basierend auf dem Referenztonsignal x(t) durch eine Skalarproduktberechnung einer Ordnung mehrerer Hundert, und eine Subtraktionseinheit 10013 zum Entfernen des Echosignals x'(t) aus dem Wahrnehmungstonsignal y(t), um ein Unterdrückungsergebnis r(t) mit einem reduzierten Echo zu erhalten und auszugeben. Die Erkennungseinheit 10010 erkennt den Einzelsprechzustand und den Doppeisprechzustand basierend auf einer Intensitätsveränderung in dem Unterdrückungsergebnis r(t). Basierend auf einem resultierenden Doppelsprechzustand veranlasst die Aktualisierungseinheit 10011 für einen Filterfaktor eine Aktualisierung eines Filterkoeffizienten zu stoppen. Die Aktualisierungseinheit 10011 für einen Filterfaktor berechnet einen Filterfaktor (Koeffizienten) basierend auf dem Unterdrückungsergebnis r(t).
  • Der Echounterdrücker 1000, der in 12 gezeigt ist, umfasst den Unterdrückungsmechanismus 1001 der 14 für jeden Kanal, entsprechend den Referenztonsignalen x1(t), ... und xn(t). Das Echounterdrückungsverfahren, das oben beschrieben wird, ist beispielsweise in der japanischen Patentveröffentlichung mit der Offenlegungsnummer 2002-237769 gezeigt.
  • Jedoch unterdrückt die Anpassungsverarbeitung basierend auf dem NLMS, wie in 14 gezeigt, ein Echo in Übereinstimmung mit vergangenen Lernergebnissen, was ein Problem einer geringen Fähigkeit verursacht, einer großen Veränderung eines Wahrnehmungstonsignals bei der Umschaltung zwischen dem Einzelsprechzustand und dem Doppelsprechzustand zu folgen. Dies führt zu einem weiteren Problem einer fehlerhaften Spracherkennung, die auftreten würde, wenn ein Zustand, genau nachdem ein Sprecher zu sprechen beginnt, als der Einzelsprechzustand erkannt wird, oder ein Zustand, welcher ein Echo nach sich zieht, nur als der Doppelsprechzustand erkannt wird.
  • Des Weiteren besitzt das Verfahren, welches Unterdrückungsmechanismen entsprechend jedem Kanal verwendet, wie in 12 gezeigt, ein Problem einer Erhöhung von Kosten und einer Gerätegröße. Insbesondere in dem Fall, in dem dieses Verfahren auf ein Fahrzeugnavigationssystem angewendet wird, welches feste Beschränkungen in Bezug auf seinen Einbauplatz besitzt, würde das Problem einer Vergrößerung der Größe ernst werden.
  • Des Weiteren, wie in 13 gezeigt, tritt in dem Fall, in dem ein addiertes Referenztonsignal eines Eintonkanals verwendet wird, welches erhalten wird, indem Referenztonsignale addiert werden, ein Problem einer Vergrößerung eines Restfehlers auf, der noch zu unterdrücken ist. Dies liegt daran, dass sich in einer Ausgabeeinheit der mehrkanaligen Audioeinheit 2000, welche Töne von Musik etc. ausgibt, von jedem Lautsprecher wiedergegebene Töne und Intensitäten davon unabhängig verändern, so dass Echos auf mehreren Wegen durch eine Anpassungsverarbeitung schwer zu erkennen und zu schätzen sein werden.
  • ZUSAMMENFASSUNG
  • Eine der Aufgaben der vorliegenden Erfindung besteht darin, einen Echounterdrücker bereitzustellen: der Echounterdrücker wandelt ein Referenztonsignal und ein Wahrnehmungstonsignal im Zeitbereich in Komponenten auf einer Frequenzachse (in einem Frequenzbereich) um; berechnet Werte, welche ein Verhältnis und eine Korrelation zwischen dem umgewandelten Referenztonsignal und Wahrnehmungstonsignal repräsentieren; vergleicht die Werte, welche das Verhältnis und die Korrelation repräsentieren; bestimmt einen Schätzungskoeffizienten, welcher zum Schätzen eines Echopegels notwendig ist, basierend auf dem Vergleichsergebnis und dem Verhältnis und der Korrelation; schätzt einen Echopegel, indem der Schätzungskoeffizient verwendet wird; und unterdrückt das Wahrnehmungstonsignal basierend auf dem geschätzten Echopegel. Der Echounterdrücker und das Verfahren gemäß der vorliegenden Erfindung können eine Spracherkennung in kürzerer Verzögerung und mit höherer Genauigkeit als ein Echounterdrücker durchführen, welcher den NLMS-(normalized least mean square)Algorithmus verwendet, selbst wenn eine große Veränderung des Wahrnehmungstonsignals an einer Grenze zwischen einem Einzelsprechen und einem Doppelsprechen auftritt.
  • Des Weiteren ist es eine weitere Aufgabe der vorliegenden Erfindung einen Echounterdrücker bereitzustellen, welcher die folgenden Funktionen besitzt. Das heißt, in dem Fall, in dem mehrere Referenztonsignale verwendet werden, führt der Unterdrücker eine Echounterdrückungsverarbeitung basierend auf einem Signal aus, welches erhalten wird, indem die Referenztonsignale addiert werden. Somit ist es nicht notwendig, eine Unterdrückungsverarbeitung für jeden Kanal durchzuführen. Daher ist es möglich Kosten und eine Gerätegröße zu reduzieren wie auch ein Problem einer Vergrößerung eines Restechos über eine Schätzungsfähigkeit hinaus zu vermeiden, da keine Anpassungsverarbeitung basierend auf einer Lernidentifizierung verwendet wird.
  • Gemäß einem ersten Aspekt der Erfindung ist ein Echounterdrücker, welcher in Übereinstimmung mit einer Tonausgabevorrichtung zum Erzeugen eines Tonsignals und Ausgeben eines Tons aus einer Tonausgabeeinheit und einer Tonverarbeitungsvorrichtung zum Verarbeiten eines Wahrnehmungstonsignals basierend auf einer Toneingabe von einer Toneingabeeinheit arbeiten kann und ein Echo des Wahrnehmungstonsignals unterdrückt, dadurch gekennzeichnet, dass er umfasst: eine Umwandlungseinheit zum Umwandeln eines Referenztonsignals um eine Tonausgabe an die Tonausgabeeinheit zu erzeugen, und eines Überfachungstonsignals, welches erzeugt wird, indem eine Toneingabe von der Toneingabeeinheit verwendet wird, in Komponenten auf einer Frequenzachse; eine Berechnungseinheit zum Berechnen eines Verhältnisses und einer Korrelation zwischen den Komponenten auf der Frequenzachse in dem Referenztonsignal und dem Wahrnehmungstonsignal; eine Vergleichseinheit zum Vergleichen von Werten des Verhältnisses und der Korrelation; eine Bestimmungseinheit zum Herleiten eines Schätzungsfaktors, welcher zum Schätzen des Echos aus einem Vergleichsergebnis und dem Verhältnis und der Korrelation notwendig ist; eine Schätzungseinheit zum Schätzen des Echos, indem der Schätzungsfaktor verwendet wird; und eine Unterdrückungseinheit zum Unterdrücken des Wahrnehmungstonsignals basierend auf dem geschätzten Echo.
  • Gemäß einem zweiten Aspekt der Erfindung umfasst der Echounterdrücker gemäß dem ersten Aspekt des Weiteren: eine Additionseinheit zum Addieren einer Mehrzahl der Referenztonsignale, wobei der Unterdrücker dadurch gekennzeichnet ist, dass die Umwandlungseinheit konfiguriert ist, um das Wahrnehmungstonsignal und das addierte Referenztonsignal in Komponenten auf der Frequenzachse umzuwandeln.
  • Gemäß einem dritten Aspekt der Erfindung ist der Echounterdrücker gemäß dem ersten oder zweiten Aspekt dadurch gekennzeichnet, dass die Berechnungseinheit konfiguriert ist, um eine Korrelation zwischen einem Referenztonsignal und einem Wahrnehmungstonsignal bei jeder Frequenz in einem vorbestimmten Frequenzbereich einschließlich einer Zielfrequenz zu bestimmen und den vorbestimmten Frequenzbereich in Übereinstimmung mit der Zielfrequenz zu verändern.
  • Gemäß einem vierten Aspekt der Erfindung ist der Echounterdrücker gemäß einem des ersten bis dritten Aspekts dadurch gekennzeichnet, dass die Bestimmungseinheit konfiguriert ist, um eine Mehrzahl von Schwellenwerten für Vergleichswerte des Verhältnisses und der Korrelation festzulegen und um zu bestimmen, ob ein Zustand ein Einzelsprechzustand oder ein Doppelsprechzustand ist, basierend auf der Mehrzahl von Schwellenwerten, dem Verhältnis und der Korrelation.
  • Gemäß einem fünften Aspekt der Erfindung ist der Echounterdrücker gemäß dem vierten Aspekt dadurch gekennzeichnet, dass die Bestimmungseinheit konfiguriert ist, um die Mehrzahl von Schwellenwerten zu verändern, welche zum Bestimmen verwendet werden, ob der Zustand ein Einzelsprechzustand oder ein Doppelsprechzustand ist, basierend auf dem Verhältnis und der Korrelation in Übereinstimmung mit der Frequenz.
  • Gemäß einem sechsten Aspekt der Erfindung ist der Echounterdrücker gemäß dem fünften Aspekt dadurch gekennzeichnet, dass die Berechnungseinheit konfiguriert ist, um Werte des Verhältnisses und der Korrelation basierend auf einem Wert, welcher durch Multiplizieren eines komplexen Spektrums, das aus einem Wahrnehmungstonsignal umgewandelt wird, mit einer konjugiert komplexen Zahl eines komplexen Spektrums, das aus einem Referenztonsignal umgewandelt wird, erhalten wird, und einem Wert zu bestimmen, welcher durch Multiplizieren des komplexen Spektrums, das aus dem Referenztonsignal umgewandelt wird, mit einer konjugiert komplexen Zahl des komplexen Spektrums, das aus dem Referenztonsignal umgewandelt wird, erhalten wird.
  • Gemäß einem siebten Aspekt der Erfindung ist der Echounterdrücker gemäß einem sechsten Aspekt dadurch gekennzeichnet, dass die Schätzungseinheit konfiguriert ist, um ein Amplitudenspektrum eines Echos zu schätzen, und die Unterdrückungseinheit konfiguriert ist, um ein Amplitudenspektrum eines Wahrnehmungstonsignals zu unterdrücken, wenn ein Verhältnis des Amplitudenspektrums des Wahrnehmungstonsignals zu dem Amplitudenspektrum des Echos nicht kleiner ist als ein vorbestimmter Schwellenwert.
  • Gemäß einem achten Aspekt der Erfindung ist der Echounterdrücker gemäß dem siebten Aspekt dadurch gekennzeichnet, dass die Unterdrückungseinheit konfiguriert ist, um den Schwellenwert in Übereinstimmung mit einer Zielfrequenz zu verändern.
  • Gemäß einem neunten Aspekt der Erfindung ist ein Echounterdrückungsverfahren zum Unterdrücken eines Echos eines Wahrnehmungstonsignals mit einem Echounterdrücker, welcher in Übereinstimmung mit einer Tonausgabevorrichtung zum Erzeugen eines Tonsignals und Ausgeben eines Tons aus einer Tonaungabeeinheit und einer Tonverarbeitungsvorrichtung zum Verarbeiten des Wahrnehmungstonsignals basierend auf einer Toneingabe von einer Toneingabeeinheit arbeiten kann, dadurch gekennzeichnet, dass es umfasst: einen Schritt (Arbeitsvorgang) eines Umwandelns eines Referenztonsignals zum Erzeugen einer Tonausgabe an die Tonausgabeeinheit und eines Wahrnehmungstonsignals, welches erzeugt wird, indem eine Toneingabe von der Toneingabeeinheit ver wendet wird, in Komponenten auf einer Frequenzachse; einen Schritt eines Berechnens eines Verhältnisses und einer Korrelation zwischen den Komponenten auf der Frequenzachse in dem Referenztonsignal und dem Wahrnehmungstonsignal; einen Schritt eines Vergleichens von Werten des Verhältnisses und der Korrelation; einen Schritt eines Herleitens eines Schätzungsfaktors, welcher zum Schätzen des Echos aus einem Vergleichsergebnis und dem Verhältnis und der Korrelation notwendig ist; einen Schritt eines Schätzens des Echos, indem der Schätzungsfaktor verwendet wird; und einen Schritt eines Unterdrückens des Wahrnehmungstonsignals basierend auf dem geschätzten Echo.
  • Gemäß einem zehnten Aspekt der vorliegenden Erfindung ist eine Computerprogrammprodukt, welches in einen Computer geladen wird und Schritte definiert, die in dem Computer ausgeführt werden, um ein Echo eines Wahrnehmungstonsignals zu unterdrücken, in Übereinstimmung mit einer Tonausgabevorrichtung zum Erzeugen eines Tonsignals und Ausgeben eines Tons aus einer Tonausgabeeinheit und einer Tonverarbeitungsvorrichtung zum Verarbeiten des Wahrnehmungstonsignals basierend auf einem Ton, der von einer Toneingabeeinheit eingegeben wird, dadurch gekennzeichnet, dass das Programmprodukt einen Computer veranlasst, um auszuführen: einen Schritt eines Umwandelns eines Referenztonsignals zum Erzeugen einer Tonausgabe an die Tonausgabeeinheit und eines Wahrnehmungstonsignals, welches erzeugt wird, indem eine Toneingabe von der Toneingabeeinheit verwendet wird, in Komponenten auf einer Frequenzachse; einen Schritt eines Berechnens eines Verhältnisses und einer Korrelation zwischen den Komponenten auf der Frequenzachse in dem Referenztonsignal und dem Wahrnehmungstonsignal; einen Schritt eines Vergleichens von Werten des Verhältnisses und der Korrelation; einen Schritt eines Herleitens eines Schätzungsfaktors, welcher zum Schätzen des Echos aus einem Ver gleichsergebnis und dem Verhältnis und der Korrelation notwendig ist; einen Schritt eines Schätzens des Echos, indem der Schätzungsfaktor verwendet wird; und einen Schritt eines Unterdrückens des Wahrnehmungstonsignals basierend auf dem geschätzten Echo.
  • Gemäß dem ersten, neunten und zehnten Aspekt der Erfindung wird, ob ein gegenwärtiger Zustand ein Einzelsprechzustand oder ein Doppelsprechzustand ist, in Echtzeit bestimmt, basierend auf einer Beziehung zwischen einem Verhältnis und einer Korrelation, um ein Echoschätzungsverfahren soweit erforderlich zu verändern. Somit ist es nicht notwendig, sich auf vergangene Signale zu beziehen, wodurch bei einer Bestimmung in Bezug auf eine Grenze zwischen dem Einzelsprechzustand und dem Doppelsprechzustand keine Verzögerung auftritt, im Unterschied zu einer Anpassungsverarbeitung basierend auf einer Lernidentifizierung.
  • Gemäß dem zweiten Aspekt der vorliegenden Erfindung kann der Unterdrücker an ein mehrkanaliges Audiosystem angepasst sein, und es ist nicht notwendig, ein Echo für jedes Referenztonsignal zu schätzen und somit eine Unterdrückungseinheit für jeden Kanal vorzustehen. Dementsprechend ist es möglich, einen Anstieg von Kosten einer Unterdrückungsschaltung und eine Vergrößerung eines Einbauplatzes zu verhindern. Des Weiteren führt der Unterdrücker keine Anpassungsverarbeitung basierend auf einer Lernidentifizierung durch, so dass ein Problem eines Vergrößerns eines Restechos über eine Schätzungsfähigkeit hinaus nicht auftritt.
  • Gemäß dem dritten Aspekt der Erfindung wird beispielsweise ein vorbestimmter Frequenzbereich, welcher zur Berechnung verwendet wird, in Richtung auf die niedrigste Frequenz vergrößert, welche einen Unterschied zwischen einem Sprachton eines Sprechers und einer Tonausgabe basierend auf einem Referenztonsignal schwer erkennen kann, um eine Korrelationserkennungsempfindlichkeit relativ zu erhöhen, um eine Erkennungsgenauigkeit von Doppelsprechen zu verbessern.
  • Gemäß dem vierten Aspekt der Erfindung, wenn beispielsweise das Verhältnis kleiner ist als ein Schwellenwert der Korrelation, beurteilt der Unterdrücker einen gegenwärtigen Zustand als einen Einzelsprechzustand mit einer hohen Korrelation zwischen einem Referenztonsignal und einem Wahrnehmungstonsignal. Dann kann ein Echo basierend auf dem Verhältnis und dem Referenztonsignal als ein Schätzungsfaktor geschätzt werden. Des Weiteren, wenn beispielsweise das Signalverhältnis nicht kleiner ist als ein zweiter Schwellenwert der Korrelation, beurteilt der Unterdrücker einen gegenwärtigen Zustand als einen Doppelsprechzustand mit einer geringen Korrelation zwischen dem Referenztonsignal und dem Wahrnehmungstonsignal. Dann kann ein Echo basierend auf der Korrelation und dem Referenztonsignal als ein Schätzungsfaktor geschätzt werden.
  • Gemäß dem fünften Aspekt der Erfindung wird ein Schwellenwert von der niedrigeren Frequenz auf die höhere Frequenz verringert, um eine Erkennungsgenauigkeit des Doppelsprechzustands zu erhöhen, um eine Verzerrung der Stimme eines Sprechers zu unterdrücken. Außerdem wird der Schwellenwert von der niedrigeren Frequenz auf die höhere Frequenz erhöht, um eine Erkennungsgenauigkeit des Einzelsprechzustands zu erhöhen, um ein Restecho zu unterdrücken.
  • Gemäß dem sechsten und siebten Aspekt der vorliegenden Erfindung wird ein Amplitudenspektrum entsprechend einem Realteil eines komplexen Spektrums verwendet, wodurch eine Berechnungslast reduziert werden kann.
  • Gemäß dem achten Aspekt der Erfindung wird ein Schwellenwert von der niedrigeren Frequenz auf die höhere Frequenz verringert, um eine Erkennungsgenauigkeit des Dop pelsprechzustands zu erhöhen, um eine Verzerrung der Stimme eines Sprechers zu unterdrücken. Außerdem wird der Schwellenwert von der niedrigeren Frequenz auf die höhere Frequenz erhöht, um eine Erkennungsgenauigkeit des Einzelsprechzustands zu erhöhen, um ein Restecho zu unterdrücken.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 ist ein schematisches Diagramm, welches ein Konfigurationsbeispiel eines Echounterdrückers gemäß einem ersten Ausführungsbeispiel der vorliegenden Erfindung zeigt;
  • 2 ist ein Funktionsblockdiagramm, welches ein Funktionskonfigurationsbeispiel eines Echounterdrückungsmechanismus des Echounterdrückers gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung zeigt;
  • 3 ist ein Flussdiagramm (Arbeitsablaufplan), welches ein Beispiel der Verarbeitung des Echounterdrückers gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung zeigt;
  • 4A und 4B sind graphische Darstellungen, welche ein Beispiel eines Verarbeitungsergebnisses einer Echounterdrückung gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung zeigen;
  • 5 ist eine graphische Darstellung, welche eine Beziehung zwischen einer Frequenz und variierenden Bandbreiten N in einem Echounterdrückungsverfahren gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung zeigt;
  • 6 ist eine graphische Darstellung, welche eine Beziehung zwischen einem Intensitätsverhältnis und einem Koeffizienten entsprechend einem Echoschätzungskoeffizienten zeigt, wo das Intensitätsverhältnis ein Verhältnis zwischen einer Korrelation und einem Signalverhältnis ist;
  • 7A und 7B sind graphische Darstellungen, welche eine Beziehung zwischen einer Frequenz, einer ersten Konstanten und einer zweiten Konstanten zeigen, wenn die erste Konstante und die zweite Konstante abhängig von der Frequenz in dem Echounterdrückungsverfahren gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung variieren;
  • 8 ist ein Funktionsblockdiagramm, welches ein Funktionskonfigurationsbeispiel eines Echounterdrückungsmechanismus eines Echounterdrückers gemäß einem zweiten Ausführungsbeispiel der vorliegenden Erfindung zeigt;
  • 9 ist ein Flussdiagramm (Arbeitsablaufplan), welches ein Beispiel einer Verarbeitung des Echounterdrückers gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung zeigt;
  • 10 ist eine graphische Darstellung, welche eine Beziehung zwischen einem Dämpfungsverhältnis und einem Dämpfungskoeffizienten in einem Echounterdrückungsverfahren gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung zeigt;
  • 11A und 11B sind graphische Darstellungen, welche eine Beziehung zwischen einer Frequenz und einem ersten Schwellenwert und einem zweiten Schwellenwert zeigen, welche abhängig von der Frequenz in dem Echounterdrückungsverfahren gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung variieren;
  • 12 ist ein schematisches Diagramm, welches die Konfiguration eines herkömmlichen ersten Echounterdrückers zeigt;
  • 13 ist ein schematisches Diagramm, welches die Konfiguration eines herkömmlichen zweiten Echounterdrückers zeigt; und
  • 14 ist ein Funktionsblockdiagramm, welches die Funktionskonfiguration eines Unterdrückungsmechanismus des herkömmlichen Echounterdrückers zeigt.
  • BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSBEISPIELE
  • Nachfolgend wird die vorliegenden Erfindung mit Bezugnahme auf die Zeichnungen im Detail beschrieben werden, welche Ausführungsbeispiele der vorliegenden Erfindung illustrieren.
  • Erstes Ausführungsbeispiel
  • 1 ist ein schematisches Diagramm, welches ein Konfigurationsbeispiel eines Echounterdrückers gemäß einem ersten Ausführungsbeispiel der vorliegenden Erfindung zeigt. In 1 kann ein Echounterdrücker 1 aus einem Computer bestehen, beispielsweise in einem Telekonferenzsystem oder einem Navigationssystem in einem Fahrzeug, während der Echounterdrücker 1 aus einem dedizierten Computer bestehen kann. Der Echounterdrücker 1 kooperiert mit einer Tonausgabevorrichtung 2, wie z. B. einer mehrkanaligen Audioeinheit, und einer Tonverarbeitungsvorrichtung 3, wie z. B. einem Spracherkennungssystem. Die Tonausgabevorrichtung 2 sendet Ausgabetonsignale als Analogsignale mehrerer Kanäle mehrere Tonausgabeeinheiten 20-1, ... und 20-n, wie z. B. einem Lautsprecher, und eine Ausgabe als Töne wird daraus ausgegeben. Des Weiteren erfasst eine Toneingabeeinheit 30, wie z. B. ein Kondensatormikrophon, einen Außenton und erzeugt ein Eingabetonsignal als ein Analogsignal, basierend auf dem erfassten Ton, um das erzeugte Signal an die Tonverarbeitungsvorrichtung 3 auszugeben. Der Echounterdrücker 1 besitzt eine Echoausloschfunktion zum Entfernen von Echos von Tönen, welche aus den Tonausgabeeinheiten 20-1, ... und 20-n ausgegeben werden, aus einem Ton, der in die Toneingabeeinheit 30 eingegeben wird. In der folgenden Beschreibung werden insbesondere n (n ist eine natürliche Zahl) Ausgabetonsignale in dem Echounterdrücker 1 als Referenztonsignale x1(t), ... und xn(t) bezeichnet, und wird ein Eingabetonsignal als ein Wahrnehmungstonsignal (oder ein gemessenes Tonsignal) y(t) bezeichnet.
  • Der Echounterdrücker 1 umfasst des Weiteren einen Additionsmechanismus 10, wie z. B. einen Analogmischer, zum Addieren mehrerer Referenztonsignale x1, ... und xn, um ein addiertes Referenztonsignal x(t) zu erzeugen; einen ersten A/D(Analog zu Digital)-Umwandlungsmechanismus 11 zum Abtasten des erzeugten addierten Referenztonsignals x(t) mit einer Frequenz von beispielsweise 8.000 Hz, um das Signal in ein Digitalsignal umzuwandeln, und zum Durchführen einer Antialiasing-Filterverarbeitung mit einem LPF-(Low Pass Filter), um so einen Aliasingfehler (Aliasing) zu verhindern, welcher beim Umwandeln in ein Digitalsignal auftreten würde; einen Verstärkungsmechanismus 12, wie z. B. einen Verstärker, zum Verstärken des Wahrnehmungstonsignals y(t); einen zweiten A/D-Umwandlungsmechanismus 13 zum Abtasten des verstärkten Wahrnehmungstonsignals y(t) (nachfolgend als das Wahrnehmungstonsignal y(t) bezeichnet) mit einer Frequenz von beispielsweise 8.000 Hz, um das Signal in ein Digitalsignal umzuwandeln, und zum Durchführen einer Antialiasing-Filterverarbeitung; einen Echounterdrückungsmechanismus 14, wie z. B. einen DSP (Digital Signal Processor), welcher eine Echounterdrückungsverarbeitung ausführt, um das Wahrnehmungstonsignal y(t) basierend auf dem addierten Referenztonsignal x(t) zu korrigieren, und dann ein Unterdrückungsergebnissignal r(t) als ein verarbeitetes Digitalsignal ausgibt; und einen D/A-(Digital zu Analog)Umwandlungsmechanismus 15 zum Umwandeln des Unterdrückungsergebnissignals r(t) in ein Analogsignal und zum Ausgeben des umgewandelten Signals an die Tonverarbeitungsvorrichtung 3. Der Echounterdrückungsmechanismus 14 ist in dem ersten Aus führungsbeispiel, als ein Aspekt der vorliegenden Erfindung, eine Betriebsschaltung, in welche ein Computerprogramm 100, Daten und anderes als eine Firmware installiert werden. Der Computer führt das Computerprogramm 100 aus, welches als Firmware installiert ist, um dadurch als der Echounterdrücker 1 zu arbeiten. Die Tonverarbeitungsvorrichtung 3 führt eine Spracherkennungsverarbeitung oder Ähnliches basierend auf dem empfangenen Unterdrückungsergebnissignal r(t) aus.
  • 2 ist ein Funktionsblockdiagramm, welches ein Funktionskonfigurationsbeispiel des Echounterdrückungsmechanismus 14 zeigt. Der Echounterdrückungsmechanismus 14 schneidet Frames einer vorbestimmten Länge von 20 bis ungefähr 40 ms von dem addierten Referenztonsignal x(t) und dem Wahrnehmungstonsignal y(t) ab, welche in Digitalsignale umgewandelt wurden. Die Frames überlappen sich gegenseitig um ungefähr 10 ms bis 20 ms. Jeder Frame wird einer Frameverarbeitung unterzogen, welche allgemein im Gebiet der Spracherkennung verwendet wird, wie z. B. einem Filtern mit einer Fensterfunktion, wie z. B. einem Hamming-Fenster oder einem Hanning-Fenster, oder einem Preemphasis-Filter. Die so erzeugten Frames werden jeweils der folgenden Signalverarbeitung basierend auf verschiedenen Funktionen unterzogen.
  • Der Echounterdrückungsmechanismus 14 kann als eine erste und eine zweite FFT 140, 141 arbeiten, wenn das Computerprogramm 100 ausgeführt wird, wo die erste FFT 140 das addierte Referenztonsignal x(t) im Zeitbereich in ein transformiertes Referenztonsignal X(f), nachfolgend als ein Referenztonsignal X(f) bezeichnet, im Frequenzbereich in jedem Frame transformiert, und wo die zweite FFT 141 auch ein Wahrnehmungstonsignal y(t) in einem Zeitbereich in ein Wahrnehmungstonsignal Y(f), nachfolgend als ein Wahrnehmungstonsignal Y(f) bezeichnet, in einem Frequenzbereich in jedem Frame transformiert. Kurz gesagt, wo die FFTs 140 und 141 jedes der Signale x(t) und y(t) in einem Zeitbereich in jedes der Signale X(f) beziehungsweise Y(f) in einem Frequenzbereich in jedem Frame für jeden Frame transformieren.
  • Das Referenztonsignal X(f) und das Wahrnehmungstonsignal Y(f) besitzen ein komplexes Spektrum. Außerdem können DCT (Discrete Cosine Transform) und andere solche Transformationsverfahren als die Transformation verwendet werden.
  • Des Weiteren kann der Echounterdrückungsmechanismus 14 als eine Berechnungseinheit 142 arbeiten, wenn das Computerprogramm 100 ausgeführt wird. Die Berechnungseinheit 142 bestimmt ein Signalverhältnis G1(f) und eine Korrelation G2(f), wobei das Signalverhältnis G1(f) ein Verhältnis, welches in Gleichung 1 gezeigt ist, die unten beschrieben wird, zwischen dem Wahrnehmungstonsignal Y(f) und dem Referenztonsignal X(f) bei einer entsprechenden Frequenz f ist, und eine Korrelation G2(f), welche in Gleichung 2 gezeigt ist, die unten beschrieben wird, ein Verhältnis einer Ähnlichkeit zwischen dem Wahrnehmungstonsignal Y(f) und dem Referenztonsignal X(f) bei einer entsprechenden Frequenz f repräsentiert. Hier besitzen das Wahrnehmungstonsignal Y(f) und das Referenztonsignal X(f) komplexe Spektren, so dass ein Signalverhältnis berechnet wird, nachdem das Spektrum mit einer konjugiert komplexen Zahl X*(f) des Referenztonsignals X(f) zu einer reellen Zahl multipliziert wurde. G1(f) = {Y(f)X*(f)}/{X(f)X'(f)} Gleichung (1)wo G1(f) das Signalverhältnis ist, Y(f) das Wahrnehmungstonsignal ist, X(f) das Referenztonsignal ist und X*(f) eine konjugiert komplexe des Referenztonsignals ist.
  • Die Berechnungseinheit 142 leitet die Korrelation G2(f) zwischen dem Wahrnehmungstonsignal Y(f) und dem Referenztonsignal X(f) aus der folgenden Gleichung 2 ab, mit jeder von Frequenzen f, bei welchen das Wahrnehmungstonsignal Y(f) und das Referenztonsignal X(f) berechnet werden sollten. Diese Korrelation indiziert ein Verhältnis zwischen dem Gesamtwert der Wahrnehmungstonsignale Y(f) bei jeder Frequenz f und dem Gesamtwert der Referenztonsignale X(f) bei jeder Frequenz f. Hier besitzen das Wahrnehmungstonsignal Y(f) und das Referenztonsignal X(f) komplexe Spektren, so dass die Korrelation G2(f) berechnet wird, nachdem das Spektrum durch eine konjugiert komplexe Zahl X*(f) des Referenztonsignals X(f) zu einer reellen Zahl multipliziert wurde. G2(f) = Σ{Y(f)X*(f)}/Σ{X(f)X*(f)} Gleichung (2)wo G2(f) die Korrelation ist.
  • Des Weiteren führt der Echounterdrückungsmechanismus 14 das Computerprogramm 100 aus, um als eine Vergleichseinheit 143 und eine Bestimmungseinheit 144 zu arbeiten. Die Vergleichseinheit 143 vergleicht das Signalverhältnis G1(f) und die Korrelation G2(f), und die Bestimmungseinheit 144 leitet einen Echoschätzungsfaktor G(f) (einen Echoschätzungskoeffizienten G(f)), welcher für eine Echoschätzung notwendig ist, aus dem Signalverhältnis G1(f) und der Korrelation G2(f) ab, basierend auf dem Vergleichsergebnis. Insbesondere vergleicht die Vergleichseinheit 143 eine Signalintensität |G1(f)| des Signalverhältnisses G1(f) und eine α-fache Signalintensität |G2(f)| der Korrelation G2(f); α repräsentiert eine vorbestimmte Konstante basierend auf der folgenden Gleichung 3. |G1(f) < α|G2(f)| Gleichung (3)wo |G1(f)| die Signalintensität des Signalverhältnisses G1(f) ist, |G2(f)| die Signalintensität der Korrelation G2(f) ist und α die Konstante ist.
  • Wenn die Signalintensität |G1(f)| des Signalverhältnisses G1(f) kleiner ist als die α-fache Signalintensität |G2(f)| der Korrelation G2(f), beurteilt die Bestimmungseinheit 144 einen gegenwärtigen Zustand als einen Ein zelsprechzustand mit einer hohen Korrelation zwischen dem Wahrnehmungstonsignal Y(f) und dem Referenztonsignal X(f), und bestimmt den Echoschätzungsfaktor G(f), welcher eine Beziehung von G(f) = G1(f) erfüllt. Wenn die Signalintensität |G1(f)| des Signalverhältnisses G1(f) nicht kleiner ist als die α-fache Signalintensität |G2(f)| der Korrelation G2(f), beurteilt die Bestimmungseinheit 144 einen gegenwärtigen Zustand als einen Doppelsprechzustand mit einer geringen Korrelation zwischen dem Wahrnehmungstonsignal Y(f) und dem Referenztonsignal X(f), und bestimmt den Echoschätzungsfaktor G(f), welcher eine Beziehung von G(f) = G2(f) erfüllt. Das heißt, die Konstante α wird als ein Schwellenwert zum Bestimmen verwendet, ob der gegenwärtige Zustand ein Einzelsprechzustand oder ein Doppelsprechzustand ist.
  • Des Weiteren führt der Echounterdrückungsmechanismus 14 das Computerprogramm 100 aus, um als eine Echoschätzungseinheit 145 zu arbeiten, welche ein Echospektrum X'(f) als einen Korrekturbetrag zum Korrigieren des Wahrnehmungstonsignals Y(f) basierend auf dem bestimmten Echoschätzungsfaktor G(f) und dem Referenztonsignal X(f) schätzt. Die Echoschätzungseinheit 145 leitet ein Echo X'(f) als das Produkt des Echoschätzungsfaktors G(f) und des Referenztonsignals X(f) aus der folgenden Gleichung (4) ab. X'(f) = G(f)X(f) Gleichung (4)wo X'(f) das Echo ist.
  • Der Echounterdrückungsmechanismus 14 führt das Computerprogramm 100 aus, um als eine Echounterdrückungseinheit 146 zum Unterdrücken des Wahrnehmungstonsignals Y(f) auf der Basis des hergeleiteten Echos X'(f) zu arbeiten, um ein Unterdrückungsergebnissignal R(f) als das unterdrückte Signal auszugeben. Die Echounterdrückungseinheit 146 führt eine Signalkorrektur aus, um das Echo X'(f) aus dem Wahrnehmungstonsignal Y(f) auf der Basis der folgenden Glei chung (5) zu entfernen, um das Unterdrückungsergebnissignal R(f) als Komponenten auf einer Frequenzachse zu erhalten, wobei das Echo unterdrückt ist. R(f) = Y(f) – X'(f) Gleichung (5)wo R(f) das Unterdrückungsergebnissignal ist.
  • Des Weiteren führt der Echounterdrückungsmechanismus 14 das Computerprogramm 100 aus, um als eine IFFT- (inverse fast Fourier Transform) Umwandlungseinheit 147 zu arbeiten, welche das Unterdrückungsergebnissignal R(f) als Komponenten auf der Frequenzachse, das heißt in einem Frequenzbereich, in ein Signal auf einer Zeitachse, das heißt in einem Zeitbereich, durch eine IFFT-Verarbeitung umwandelt. Das Unterdrückungsergebnissignal r(t), welches in ein Signal auf der Zeitachse umgewandelt wird, wird mit dem D/A-Umwandlungsmechanismus 15, der in 1 gezeigt ist, an die Tonverarbeitungsvorrichtung 3 ausgegeben.
  • Als nächstes wird eine Verarbeitung des Echounterdrückers 1 gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung beschrieben. Der Echounterdrücker 1 empfängt n Referenztonsignale x1(t), ... xn(t), welche aus der Tonverarbeitungsvorrichtung 3 an die Tonausgabeeinheit 20-1, ... und 20-n ausgegeben werden, und addiert mit dem Additionsmechanismus 10 die empfangenen n Referenztonsignale x1(t), ... und xn(t) zu dem addierten Referenztonsignal x(t). Dann führt der Echounterdrücker 1 mit dem ersten A/D-Umwandlungsmechanismus 11 eine A/D-Umwandlung und eine Antialiasing-Filterverarbeitung an dem addierten Referenztonsignal x(t) durch und wandelt das addierte Referenztonsignal x(t) in ein Digitalsignal um, um das Digitalsignal an den Echounterdrückungsmechanismus 14 auszugeben.
  • Des Weiteren erzeugt der Echounterdrücker 1 das Wahrnehmungstonsignal y(t) basierend auf dem empfangenen Ton mit der Toneingabeeinheit 30, verstärkt das Wahrnehmungstonsignal y(t) mit dem Verstärkungsmechanismus 12, führt eine A/D-Umwandlung und eine Antialiasing-Filterverarbeitung mit dem zweiten A/D-Umwandlungsmechanismus 13 durch und wandelt das Signal in ein Digitalsignal um, um das umgewandelte Wahrnehmungstonsignal y(t) an den Echounterdrückungsmechanismus 14 auszugeben.
  • 3 ist ein Flussdiagramm (Arbeitsablaufdiagramm), welches ein Beispiel der Verarbeitung des Echounterdrückers 1 gemß dem ersten Ausführungsbeispiel der vorliegenden Erfindung zeigt. Der Echounterdrückungsmechanismus 14 des Echounterdrückers 1 wandelt das empfangene addierte Referenztonsignal x(t) und Wahrnehmungstonsignal y(t) in Frames um (S101). Das addierte Referenztonsignal x(t) und das Wahrnehmungstonsignal y(t) werden mit der ersten FFT-Umwandlungseinheit 140 und der zweiten FFT-Umwandlungseinheit 141 in das Referenztonsignal X(f) und das Wahrnehmungstonsignal Y(f) als Komponenten auf der Frequenzachse umgewandelt (S102), kurz gesagt werden die Signale x(t) und y(t) in einen Frequenzbereich transformiert.
  • Der Echounterdrückungsmechanismus 14 des Echounterdrückers 1 berechnet das Signalverhältnis G1(f) zwischen dem Referenztonsignal X(f) und dem Wahrnehmungstonsignal Y(f) bei jeder Frequenz f, durch die Verarbeitung der Berechnungseinheit 142 (S103), und berechnet zusätzlich die Korrelation G2 zwischen dem Referenztonsignal X(f) und dem Wahrnehmungstonsignal Y(f) bei jeder Frequenz f (S104). In Schritt (Arbeitsvorgang) S103 wird das Signalverhältnis G1(f) auf der Basis der obigen Gleichung (1) berechnet und in Schritt S104 wird die Korrelation G2(f) auf der Basis der obigen Gleichung (2) bestimmt. Die Verarbeitung in Schritt S103 und die Verarbeitung in Schritt S104 können parallel ausgeführt werden.
  • Der Echounterdrückungsmechanismus 14 des Echounterdrückers 1 vergleicht das Signalverhältnis G1(f) und die Korrelation G2(f) mit der Vergleichseinheit 143 auf der Basis der Gleichung (3) (S105) und leitet den Echoschätzungsfaktor G(f), welcher für eine Echoschätzung notwendig ist, aus dem Signalverhältnis G1(f) und der Korrelation G2(f) basierend auf dem Vergleichsergebnis (S106) her. Das Signalverhältnis G1(f) oder die Korrelation G2(f) wird beim Herleiten des Echoschätzungsfaktors G(f) in Schritt S106 ausgewählt, basierend auf der obigen Gleichung (3).
  • Der Echounterdrückungsmechanismus 14 des Echounterdrückers 1 schätzt das Echo X'(f) basierend auf dem Echoschätzungsfaktor G(f) und dem Referenztonsignal X(f) durch die Verarbeitung der Echoschätzungseinheit 145 (S107). In Schritt S107 wird das Echo X'(f) als ein Schätzungswert eines Echos zum Korrigieren des Wahrnehmungstonsignals Y(f) berechnet, basierend auf der obigen Gleichung (4).
  • Der Echounterdrückungsmechanismus 14 des Echounterdrückers 1 unterdrückt das Wahrnehmungstonsignal Y(f) basierend auf dem Echo X'(f), um das Unterdrückungsergebnissignal R(f) durch die Verarbeitung der Echounterdrükkungseinheit 146 zu erzeugen (S108). In Schritt S108 wird die Korrektur durchgeführt, um das Echo X'(f) aus dem Wahrnehmungstonsignal Y(f) basierend auf der obigen Gleichung (5) zu entfernen.
  • Der Echounterdrückungsmechanismus 14 des Echounterdrückers 1 wandelt das Unterdrückungsergebnissignal R(f) als Komponenten auf der Frequenzachse in das Unterdrückungsergebnissignal r(t) als ein Signal auf der Zeitachse um, durch die Verarbeitung der IFFT-Umwandlungseinheit 147 (S109), und wandelt dann das umgewandelte Unterdrückungsergebnissignal r(t) mit D/A-Umwandlungsmitteln 18 in ein Analogsignal um, um das Analogsignal an die Tonverarbeitungsvorrichtung 3 auszugeben.
  • Die Tonverarbeitungsvorrichtung 3 führt eine Spracherkennungsverarbeitung oder Ähnliches basierend auf dem empfangenen Unterdrückungsergebnissignal r(t) durch. Auf diese Art und Weise wird die Echounterdrückungsverarbeitung des Echounterdrückers 1 gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung durchgeführt.
  • Als nächstes wird ein Ergebnis der Echounterdrückungsverarbeitung des Echounterdrückers 1 gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung beschrieben. 4A und 4B sind graphische Darstellungen, welche ein Beispiel des Verarbeitungsergebnisses für eine Echounterdrückung gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung zeigen. 4A ist eine graphische Darstellung, welche ein Beispiel eines Amplitudenspektrums |X(f)| des addierten Referenztonsignals x(t) und ein Amplitudenspektrum |Y(f)| des Wahrnehmungstonsignals y(t) zeigt, welche der Echounterdrückungsverarbeitung gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung unterzogen werden. Die horizontale Achse repräsentiert eine Frequenz f und die vertikale Achse repräsentiert eine Signalintensität dB. Die graphische Darstellung illustriert eine Beziehung dazwischen. Die durchgezogene Linie indiziert das Amplitudenspektrum |X(f)| des addierten Referenztonsignals x(t) und die gepunktete Linie indiziert das Amplitudenspektrum |Y(f)| des Wahrnehmungstonsignals y(t). 4B ist eine graphische Darstellung, welche ein Beispiel eines Amplitudenspektrums |R(f)| des Unterdrückungsergebnissignals r(t) als ein Ergebnis der Echounterdrückungsverarbeitung gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung zeigt. Die horizontale Achse repräsentiert eine Frequenz f und die vertikale Achse repräsentiert eine Signalintensität. Die graphische Darstellung illustriert eine Beziehung dazwischen. 4A und 4B zeigen ein Amplitudenspektrum in einem Doppelsprechzustand. 4A zeigt die Amplitude vor einer Verarbeitung und 4B zeigt die Amplitude nach einer Verarbeitung. Außerdem repräsentieren in den 4A und 4B eingekreiste Teilbereiche eine Spitze eines Tonpegels eines Sprechers.
  • Wie in 4A gezeigt ist bei einer Frequenz von Tönen, umfassend die Stimme eines Sprechers, eine Korrelation zwischen dem Amplitudenspektrum |X(f)| des addierten Referenztonsignals x(t) und dem Amplitudenspektrum |Y(f)| des Wahrnehmungstonsignals y(t) gering. In 4B, welche das Ergebnis einer Verarbeitung in 4A zeigt, ist ein Intensitätspegel gänzlich verringert. Bei einer Frequenz von Tönen, umfassend die Stimme eines Sprechers, wird eine Spitzenintensität nicht so verändert. Dies bedeutet, dass ein Echo von Tönen, welche sich von der Stimme eines Sprechers unterscheiden, unterdrückt wird.
  • In dem ersten Ausführungsbeispiel ist ein Frequenzbereich, welcher zum Berechnen der Korrelation G2(f) notwendig ist, eine konstante Bandbreite. Jedoch ist die vorliegende Erfindung nicht darauf beschränkt, und eine Bandbreite kann in Übereinstimmung mit einer Frequenz verändert werden. Als nächstes wird ein Modus beschrieben, in welchem eine Bandbreite in Übereinstimmung mit einer Frequenz in dem ersten Ausführungsbeispiel verändert wird. In dem Fall einer Veränderung der Bandbreite wird die obige Gleichung (2) zum Berechnen der Korrelation G2(f) zu der folgenden Gleichung (6) modifiziert.
  • Figure 00240001
  • In Gleichung (6) wird die Ordnung N(f), welche die Anzahl von Samples beim Abtasten repräsentiert, als eine Bandbreite verwendet. Ein Ersetzen der Ordnung N(f) als die Bandbreite, welche konstant ist, in Gleichung (6) ergibt Gleichung (2). In diesem Beispiel variiert die Ordnung als die Bandbreite jedoch. 5 ist eine graphische Darstellung, welche eine Beziehung zwischen der Frequenz f und den variierenden Bandbreiten N(f) in dem Echounterdrückungsverfahren gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung zeigt. In 5 repräsentiert die horizontale Achse die Frequenz f und repräsentiert die vertikale Achse die Ordnung N(f) als eine Bandbreite. 5 illustriert eine Beziehung dazwischen. Wie in 5 gezeigt ist die Bandbreite in Richtung auf die niedrigste Frequenz erhöht. Dadurch soll die Bandbreite zu der niedrigeren Bandbreite erhöht werden, bei der es schwierig ist einen Unterschied von einem Echo zu erkennen, um dadurch die Anzahl von Samples zu erhöhen und eine Korrelationserkennungsempfindlichkeit relativ zu erhöhen, um eine Erkennungsgenauigkeit für ein Doppelsprechen zu verbessern.
  • In dem Fall eines Veränderns einer Bandbreite bestimmt in Schritt S104 des Flussdiagramms (Arbeitsablaufdiagramm), welches in 3 illustriert ist, die Berechnungseinheit 142 die Korrelation G2(f) basierend auf dem Gesamtwert der Referenztonsignale X(f) und dem Gesamtwert der Wahrnehmungstonsignale Y(f) in einem Frequenzbereich, welcher basierend auf jeder Frequenz f bestimmt wird.
  • In dem ersten Ausführungsbeispiel wird das Signalverhältnis G1(f) oder die Korrelation G2(f) ausgewählt und als der Echoschätzungsfaktor G(f) verwendet. Jedoch ist die vorliegende Erfindung nicht darauf beschränkt. Um diskontinuierliche Veränderungen an der Grenze zwischen dem Einzelsprechzustand und dem Doppelsprechzustand zu unterdrücken, können eine erste Konstante α1 und eine zweite Konstante α2, die größer ist als die erste Konstante α1, festgelegt werden, um eine Periode zu definieren, in welcher ein gewichteter Mittelwert des Signalverhältnisses G1(f) und der Korrelation G2(f) als der Echoschätzungsfaktor G(f) verwendet wird. Als nächstes wird ein Verfahren zum Bestimmen des Echoschätzungsfaktors G(f) beschrieben, welches sich vom ersten Ausführungsbeispiel unterscheidet.
  • 6 ist eine graphische Darstellung, welche eine Beziehung zwischen einem Intensitätsverhältnis |G2(f)|/|G1(f)| und einem Koeffizienten β zeigt, wo das Intensitätsverhältnis |G2(f)/|G1(f)| ein Verhältnis einer Intensität der Korrelation G2(f) zu der des Signalverhältnisses G1(f) ist und der Koeffizient β dem Echoschätzungsfaktor G(f) entspricht. In 6 repräsentiert die horizontale Achse das Intensitätsverhältnis |G2(f)/|G1(f)| und repräsentiert die vertikale Achse den Koeffizienten β entsprechend dem Echoschätzungsfaktor G(f). 6 illustriert eine Beziehung dazwischen. Der Koeffizient β(f) ist ein Faktor, welcher zum Bestimmen des Echoschätzungsfaktors G(f) notwendig ist. Der Echoschätzungsfaktor G(f) wird aus der folgenden Gleichung (7) hergeleitet, indem der Koeffizient β(f) verwendet wird. G(f) = β(f)G1(f) + {1 – β(f)}G2(f) Gleichung (7)wo β(f) ein Koeffizient entsprechend einem Echoschätzungsfaktor G(f) ist.
  • Wenn das Intensitätsverhältnis |G2(f)|/|G1(f)| kleiner ist als die erste Konstante α1, dann ist der Koeffizient β(f) = 0, wie in 6 gezeigt, so dass die Gleichung (7) zu der Korrelation G2(f) gleich dem Echoschätzungsfaktor G(f) führt . Wenn das Intensitätsverhältnis |G2(f)|/|G1(f)| nicht kleiner ist als die zweite Konstante α2, ist der Faktor β(f) = 1, so dass das Signalverhältnis G1(f) der Echoschätzungsfaktor G(f) ist. Wenn das Intensitätsverhältnis |G2(f)/|Gl(f)| kleiner ist als die zweite Konstante α2 und nicht kleiner ist als die erste Konstante α1, wird der Faktor β(f) basierend auf dem Intensitätsverhältnis |G2(f)|/|G1(f)| bestimmt, in Übereinstimmung mit der Beziehung der 6, und wird der Echoschätzungsfaktor G(f) in Übereinstimmung mit einem gewichteten Mittelwert des Signalverhältnisses G1(f) und der Korrelation G2(f) der Gleichung (7) bestimmt, basierend auf dem bestimmten Wert.
  • In dem Fall eines Veränderns eines Verfahrens zum Bestimmen des Echoschätzungsfaktors G(f) bestimmt in Schritt S106 des Flussdiagramms (Arbeitsablaufdiagramm) der 3 die Bestimmungseinheit 144 den Echoschätzungsfaktor G(f) wie folgt. Das heißt, wenn |G2(Y)| < α1|G1(f)|, wird die Korrelation G2(f) auf den Echoschätzungsfaktor G(f) festgelegt. Wenn |G2(f)| ≥ α2|G1(f)|, wird das Signalverhältnis G1(f) auf den Echoschätzungsfaktor G(f) festgelegt. Wenn α1|G1(f)| ≤ |G2(f)| < α2|G1(f)|, dann wird der gewichtete Mittelwert des Signalverhältnisses G1(f) und die Korrelation G2(f) auf den Echoschätzungsfaktor G(f) festgelegt.
  • Des Weiteren können die erste Konstante α1 und die zweite Konstante α2 abhängig von der Frequenz f variieren. Die 7A und 7B sind graphische Darstellungen, welche eine Beziehung zwischen der Frequenz f, einer ersten Konstante α1(f) und einer zweiten Konstante α2 zeigen, wenn die erste Konstante α1 und die zweite Konstante α2 abhängig von der Frequenz f variieren, in dem Echounterdrückungsverfahren gemäß dem ersten Ausführungsbeispiel der vorliegenden Erfindung. In den 7A und 7B repräsentiert die horizontale Achse die Frequenz f und repräsentiert die vertikale Achse die erste Konstante α1(f) und die zweite Konstante α2(f), welche frequenzabhängig sind. Die 7A und 7B illustrieren eine Beziehung dazwischen. In dem Beispiel der 7A werden die erste Konstante α1(f) und die zweite Konstante α2(f) von der niedrigen Frequenz auf die hohe Frequenz verringert, um eine Erkennungsgenauigkeit des Doppelsprechzustands zu erhöhen, um dadurch eine Verzerrung der Stimme eines Sprechers zu unterdrücken. In dem Beispiel der 7B werden die erste Konstante α1(f) und die zweite Konstante α2(f) von der niedrigen Frequenz auf die hohe Frequenz erhöht, um eine Erkennungsgenauigkeit des Einzelsprechzustands zu erhöhen, um dadurch ein Restecho zu unterdrücken. Hier kann, wenn eine einzelne Konstante α verwendet wird, eine von einer Frequenz f abhängige Konstante α(f) verwendet werden.
  • Zweites Ausführungsbeispiel
  • Gemäß einem zweiten Ausführungsbeispiel wird ein reelles Amplitudenspektrum für Arbeitsvorgänge zum Korrigieren in dem ersten Ausführungsbeispiel verwendet. Die Konfiguration eines Echounterdrückers des zweiten Ausführungsbeispiels ist die gleiche wie die des ersten Ausführungsbeispiels, wie in 1 illustriert, und daher wird auf das erste Ausführungsbeispiel verwiesen. Seine Beschreibung wird hier nicht wiederholt. In der folgenden Beschreibung sind die gleichen Komponenten wie jene des ersten Ausführungsbeispiels mit den Bezugszeichen gekennzeichnet, welche identisch zu denen des ersten Ausführungsbeispiels sind, und werden hier nicht beschrieben.
  • 8 ist ein Funktionsblockdiagramm, welches ein Funktionskonfigurationsbeispiel des Echounterdrückungsmechanismus 14 des Echounterdrückers 1 gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung zeigt. Der Echounterdrückungsmechanismus 14 des Echounterdrückers 1 schneidet Frames einer vorbestimmten zeitlichen Länge von dem addierten Referenztonsignal x(t) und dem Wahrnehmungstonsignal y(t) ab, wo die Signale x(t) und y(t) in Digitalsignale umgewandelt werden. Der Echounterdrückungsmechanismus 14 führt das Computerprogramm 100 aus, um als die erste FFT-Umwandlungseinheit 140 und die zweite FFT- Umwandlungseinheit 141 zu arbeiten. Das Referenztonsignal X(f), welches mit der ersten FFT-Umwandlungseinheit 140 erzeugt wird, und das Wahrnehmungstonsignal Y(f), welches mit der zweiten FFT-Umwandlungseinheit 141 erzeugt wird, besitzen ein komplexes Spektrum. In dem zweiten Ausführungsbeispiel wird die Verarbeitung ausgeführt, indem ein Amplitudenspektrum verwendet wird, welches ein Realteil des komplexen Spektrums der Signale ist, welche mit der ersten FFT-Umwandlungseinheit 140 und der zweiten FFT-Umwandlungseinheit 141 erzeugt werden. In der folgenden Beschreibung wird das Amplitudenspektrum des Referenztonsignals X(f) als das komplexe Spektrum als das Referenztonsignal |X(f)| bezeichnet und wird das Amplitudenspektrum des Wahrnehmungstonsignals Y(f) als das komplexe Spektrum als das Wahrnehmungstonsignal |Y(f)| bezeichnet.
  • Des Weiteren führt der Echounterdrückungsmechanismus 14 das Computerprogramm 100 aus, um als die Berechnungseinheit 142 zu arbeiten. Das Referenztonsignal |X(f)| und das Wahrnehmungstonsignal |Y(f)|, welche mit der Berechnungseinheit 142 verarbeitet werden, sind jeweils ein Amplitudenspektrum, und können daher nicht durch die konjugiert komplexe Zahl X*(f) zu einer reellen Zahl multipliziert werden. Dementsprechend leitet in dem zweiten Ausführungsbeispiel die Berechnungseinheit 142 ein Signalverhältnis |G1(f)|' als eine reelle Zahl aus der folgenden Gleichung (8) anstelle der Gleichung (1) her. |G1(f)|' = |Y(f)/|X(f)|Gleichung (8)wo |G1(f)|' das Signalverhältnis ist, |Y(f)| das Wahrnehmungstonsignal ist und |X(f)| das Referenztonsignal ist.
  • Des Weiteren bestimmt in dem zweiten Ausführungsbeispiel die Berechnungseinheit 142 eine Korrelation |G2(f)|' als eine reelle Zahl aus der folgenden Gleichung (9) anstelle der Gleichung (2). |G2(f)|' = Σ{|Y(f)||X(f)|}/Σ{|X(f)|2} Gleichung (9)wo |G2(f)|' die Korrelation ist.
  • Des Weiteren führt der Echounterdrückungsmechanismus 14 das Computerprogramm 100 aus, um als die Vergleichseinheit 143 und die Bestimmungseinheit 144 zu arbeiten. Die Vergleichseinheit 143 vergleicht das Signalverhältnis |G1(f)|' und eine α-fache Korrelation |G2(f)|' basierend auf der folgenden Gleichung (10) anstelle von Gleichung (3), wo α eine vorbestimmte Konstante repräsentiert. |G1(f)|' < α|G2(f)|' Gleichung (10)
  • Wenn das Signalverhältnis |Gl(f)| kleiner ist als die α-fache Korrelation |G2(f)|, beurteilt die Bestimmungseinheit 144 einen gegenwärtigen Zustand als einen Einzelsprechzustand mit einer hohen Korrelation zwischen dem Wahrnehmungstonsignal Y(f) und dem Referenztonsignal X(f) und bestimmt den Echoschätzungsfaktor |G(f)|, welcher eine Beziehung von |G(f)| = |G1(f)| erfüllt . Wenn das Signalverhältnis |G1(f)| nicht kleiner ist als die α-fache Korrelation |G2(f)|, beurteilt die Bestimmungseinheit 144 einen gegenwärtigen Zustand als einen Doppelsprechzustand mit einer geringen Korrelation zwischen dem Wahrnehmungstonsignal Y(f) und dem Referenztonsignal X(f) und bestimmt den Echoschätzungsfaktor |G(f)|, welcher eine Beziehung von |G(f)| = |G2(f)| erfüllt.
  • Des Weiteren führt der Echounterdrückungsmechanismus 14 das Computerprogramm 100 aus, um als die Echoschätzungseinheit 145 zu arbeiten. In dem zweiten Ausführungsbeispiel leitet die Echoschätzungseinheit 145 ein Echo |X'(f)| als eine reelle Zahl aus der folgenden Gleichung (11) anstelle der Gleichung (4) her. |X'(f)| = |G(f)||X(f)| Gleichung (11)wo |X'(f)| das Echo ist.
  • Des Weiteren führt der Echounterdrückungsmechanismus 14 das Computerprogramm 100 aus, um als die Echounterdrückungseinheit 146 zu arbeiten. In dem zweiten Ausführungsbeispiel leitet die Echounterdrückungseinheit 146 ein Unterdrückungsergebnissignal |R(f)| als eine reelle Zahl aus der folgenden Gleichung (12) anstelle der Gleichung (5) her. |R(f)| = |Y(f)| – |X'(f) Gleichung (12)wo |R(f)| das Unterdrückungsergebnissignal ist.
  • Des Weiteren führt der Echounterdrückungsmechanismus 14 das Computerprogramm 100 aus, um als die IFFT-Umwandlungseinheit 147 zu arbeiten, welche das Unterdrückungsergebnissignal R(f) als eine reelle Zahl und einen Imaginärteil des Wahrnehmungstonsignals Y(f), welches mit der zweiten FFT-Umwandlungseinheit 141 erzeugt wird, kombiniert, um das zusammengesetzte Signal in ein Signal auf einer Zeitachse (in einen Zeitbereich) umzuwandeln, durch eine IFFT-Verarbeitung. Das Unterdrückungsergebnissignal r(t), welches in ein Signal auf der Zeitachse umgewandelt wurde, wird mit dem D/A-Umwandlungsmechansimus 15 in ein Analogsignal umgewandelt und dann an die Tonverarbeitungsvorrichtung 3 ausgegeben.
  • Die Tonverarbeitungsvorrichtung 3 führt die Spracherkennungsverarbeitung oder Ähnliches basierend auf dem empfangenen Unterdrückungsergebnissignal r(t) aus. Auf diese Art und Weise wird die Echounterdrückungsverarbeitung des Echounterdrückers 1 gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung durchgeführt.
  • Als nächstes wird die Verarbeitung des Echounterdrückers 1 gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung beschrieben. Der Echounterdrücker 1 gibt Signale, welche erzeugt werden, indem n Referenztonsignale x1(t), ... und xn(t) und das Wahrnehmungstonsignal y(t) verwendet werden, an den Echounterdrückungsmechanismus 14 aus, ähnlich zum ersten Ausführungsbeispiel.
  • 9 ist ein Flussdiagramm (Arbeitsablaufdiagramm), welches ein Beispiel der Verarbeitung des Echounterdrückers 1 gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung zeigt. Der Echounterdrückungsmechanismus 14 des Echounterdrückers 1 wandelt das empfangene addierte Referenztonsignal x(t) und Wahrnehmungstonsignal y(t) in Frames um (S201). Dann wandelt der Echounterdrückungsmechanismus 14 das addierte Referenztonsignal x(t) und das Wahrnehmungstonsignal y(t) in das Referenztonsignal X(f) und das Wahrnehmungstonsignal Y(f) als Komponenten auf der Frequenzachse mit der ersten FFT-Umwandlungseinheit 140 und der zweiten FFT-Umwandlungseinheit 141 um (S202). Dann werden das Referenztonsignal |X(f)| und das Wahrnehmungstonsignal |Y(f)| als ein Amplitudenspektrum aus dem Referenztonsignal X(f) beziehungsweise dem Wahrnehmungstonsignal Y(f) extrahiert (S203).
  • Der Echounterdrückungsmechanismus 14 des Echounterdrückers 1 berechnet das Signalverhältnis |G1(f)|' zwischen dem Referenztonsignal |X(f)| und dem Wahrnehmungstonsignal |Y(f)| bei jeder Frequenz f, durch die Verarbeitung der Berechnungseinheit 142 (S204), und berechnet außerdem die Korrelation |G2(f)|' zwischen dem Referenztonsignal |X(f)| und dem Wahrnehmungstonsignal |Y(f)| bei jeder Frequenz f (S205). In Schritt S204 wird das Signalverhältnis |Gl(f)|' basierend auf der obigen Gleichung (8) berechnet und in Schritt S205 wird die Korrelation |G2(f)|' basierend auf der obigen Gleichung (9) berechnet.
  • Der Echounterdrückungsmechanismus 14 des Echounterdrückers 1 vergleicht das Signalverhältnis |G1(f)|' und die Korrelation |G2(f)|' mit der Vergleichseinheit 143 (S206), und leitet den Echoschätzungskoeffizienten |G(f)|, welcher für eine Echoschätzung notwendig ist, aus dem Signalverhältnis |G1(f)|' und der Korrelation |G2(f)|' basierend auf dem Vergleichsergebnis her (S207). Das Signalverhältnis |G1(f)|' oder die Korrelation |G2(f)|' wird beim Herleiten des Echoschätzungskoeffizienten |G(f)| in Schritt S207 basierend auf den obigen Gleichungen (8) bis (10) ausgewählt.
  • Der Echounterdrückungsmechanismus 14 des Echounterdrückers 1 schätzt das Echo |X'(f)| basierend auf dem Echoschätzungskoeffizienten |G(f)| und dem Referenztonsignal |X(f)| durch die Verarbeitung der Echoschätzungseinheit 145 (S208). In Schritt S208 wird das Echo |X'(f)| als ein Schätzwert eines Echos zum Korrigieren des Wahrnehmungstonsignals |Y(f)| basierend auf der obigen Gleichung (11) berechnet.
  • Der Echounterdrückungsmechanismus 14 des Echounterdrückers 1 unterdrückt das Wahrnehmungstonsignal |Y(f)| basierend auf dem Echo |X'(f)|, um das Unterdrückungsergebnissignal |R(f)| durch die Verarbeitung der Echounterdrückungseinheit 146 zu erzeugen (S209). In Schritt S209 wird die Korrektur durchgeführt, um das Echo |X'(f)| aus dem Wahrnehmungstonsignal |Y(f)| basierend auf der obigen Gleichung (12) zu entfernen.
  • Der Echounterdrückungsmechanismus 14 des Echounterdrückers 1 kombiniert das Unterdrückungsergebnissignal |R(f)| als eine reelle Zahl und einen Imaginärteil des Wahrnehmungstonsignals Y(f), welches mit der zweiten FFT-Umwandlungseinheit 141 erzeugt wird, durch die Verarbeitung der IFFT-Umwandlungseinheit 147 (S210). Des Weiteren wandelt der Echounterdrückungsmechanismus 14 das zusammengesetzte Signal in das Unterdrückungsergebnissignal r(t) als ein Signal auf einer Zeitachse durch die Verarbeitung der IFFT-Umwandlungseinheit 147 um (S211). Dann wird das umge wandelte Unterdrückungsergebnissignal r(t) mit dem D/A-Umwandlungsmittel 18 in ein Analogsignal umgewandelt und an die Tonverarbeitungsvorrichtung 3 ausgegeben.
  • Die Tonverarbeitungsvorrichtung 3 führt eine Spracherkennungsverarbeitung oder Ähnliches basierend auf dem empfangenen Unterdrückungsergebnissignal r(t) durch. Auf diese Art und Weise wird die Echounterdrückungsverarbeitung des Echounterdrückers 1 gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung durchgeführt.
  • In dem zweiten Ausführungsbeispiel wird ein Echo unterdrückt, indem das Echo |X'(f)| bei der Korrektur mit der Echounterdrückungseinheit 146 aus dem Wahrnehmungstonsignal |Y(f)| entfernt wird. Jedoch ist die vorliegende Erfindung nicht darauf beschränkt. Das Wahrnehmungstonsignal |Y(f)| kann gedämpft werden, um ein Echo zu unterdrücken. Als nächstes wird ein Beispiel des zweiten Ausführungsbeispiels beschrieben, in welchem das Wahrnehmungstonsignal |Y(f)| gedämpft werden kann, um ein Echo zu unterdrücken.
  • 10 ist eine graphische Darstellung, welche eine Beziehung zwischen einem Dämpfungsverhältnis |Y(f)/|X'(f) und einem Dämpfungsfaktor g(f) in dem Echounterdrückungsverfahren gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung zeigt. In 10 repräsentiert die horizontale Achse das Dämpfungsverhältnis |Y(f)|/|X'(f) und repräsentiert die vertikale Achse den Dämpfungsfaktor g(f). 10 illustriert eine Beziehung dazwischen. Das Dämpfungsverhältnis |V(f)|/|X'(f)| ist ein Verhältnis des Wahrnehmungstonsignals |Y(f)| und des Echos |X'(f)|. Der Dämpfungsfaktor g(f) ist ein Faktor zum Berechnen des Unterdrückungsergebnissignals |R(f)| durch Multiplizieren des Wahrnehmungstonsignals |Y(f)|. Der Faktor nimmt einen Wert von 0 ≤ g(f) ≤ 1 an. Je größer der Wert ist, desto größer ist ein Dämpfungsbetrag. Als das Dämpfungsverhältnis |Y(f)| /|X'(f)| werden ein erster Schwellenwert γ1 und ein zweiter Schwellenwert γ2 festgelegt. Wenn das Dämpfungsverhältnis |Y(f)|/|X'(f)| kleiner ist als der erste Schwellenwert γ1, ist der Dämpfungsfaktor g(f) = 0. Wenn das Verhältnis nicht kleiner ist als der zweite Schwellenwert γ2, ist der Dämpfungsfaktor g(f) = 1. Wenn das Dämpfungsverhältnis |Y(f)|/|X'(f)| nicht kleiner ist als der erste Schwellenwert γ1 und kleiner ist als der zweite Schwellenwert γ2, wird der Dämpfungsfaktor g(f) in Übereinstimmung mit dem Dämpfungsverhältnis |Y(f)|/|X'(f)| basierend auf der Beziehung der 10 bestimmt. Des Weiteren wird eine Beziehung zwischen dem Dämpfungsfaktor g(f), dem Wahrnehmungstonsignal |Y(f)| und dem Unterdrückungsergebnissignal |R(f)| basierend auf der folgenden Gleichung (13) bestimmt. |R(f)| = g(f)|Y(f)| Gleichung (13)wo g(f) der Dämpfungsfaktor ist.
  • In dem Fall, in welchem der Dämpfungsfaktor g(f) verwendet wird, wird in Schritt S209 des Flussdiagramms (Arbeitsablaufdiagramm) der 9 der Dämpfungsfaktor g(f) basierend auf dem Wahrnehmungstonsignal |Y(f)| und dem Echo |X'(f)| durch die Verarbeitung der Echounterdrückungseinheit 146 bestimmt, wobei das Unterdrückungsergebnissignal |R(f)| basierend auf dem Wahrnehmungstonsignal |Y(f)| und dem bestimmten Dämpfungsfaktor g(f) erzeugt wird. Außerdem wird das Unterdrückungsergebnissignal |R(f)| basierend auf Gleichung (13) erzeugt und wird das Wahrnehmungstonsignal |Y(f)| gedämpft, indem der Dämpfungsfaktor g(f) verwendet wird, um ein Echo zu unterdrücken.
  • Des Weiteren können der erste Schwellenwert γ1 und der zweite Schwellenwert γ2 abhängig von der Frequenz f variieren. Die 11A und 11B zeigen Beispiele einer Beziehung zwischen der Frequenz f und dem ersten Schwellenwert γ1 und dem zweiten Schwellenwert γ2, welche abhängig von der Frequenz in dem Echounterdrückungsverfahren gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung variieren. In den 11A und 11B repräsentiert die horizontale Achse die Frequenz f und repräsentiert die vertikale Achse den von einer Frequenz f abhängigen ersten Schwellenwert γ1 und zweiten Schwellenwert γ2. Die 11A und 11B illustrieren eine Beziehung dazwischen. In dem Beispiel der 11A werden der erste Schwellenwert γ1 und der zweite Schwellenwert γ2 von der niedrigeren Frequenz auf die höhere Frequenz verringert, um eine Erkennungsgenauigkeit des Doppelsprechzustands zu verbessern, um eine Verzerrung der Stimme eines Sprechers zu unterdrücken. In dem Beispiel der 11B werden der erste Schwellenwert γ1 und der zweite Schwellenwert γ2 von der niedrigeren Frequenz auf die höhere Frequenz verringert, um eine Erkennungsgenauigkeit des Einzelsprechzustands zu erhöhen, um dadurch ein Restecho zu unterdrücken.
  • Die ersten und zweiten Ausführungsbeispiele sind illustrative unzähliger Ausführungsbeispiele der vorliegenden Erfindung. Die Konfigurationen verschiedener Arten von Hardware- und Softwarekomponenten können beliebig festgelegt werden, und verschiedene Verarbeitungen können in Kombination mit den oben beschriebenen Grundverarbeitungen verwendet werden. Beispielsweise kann die vorliegende Erfindung auf einen Unterdrücker angewendet werden, welcher mit einer einzelnen Ausgabeeinheit versehen ist, während in den ersten und zweiten Ausführungsbeispielen mehrere Ausgabeeinheiten vorgesehen sind. Außerdem ist die vorliegende Erfindung als die Tonverarbeitungsvorrichtung auf verschiedene Systeme zum Verarbeiten einer Stimme oder von Ton eines Telekonferenzsystems, eines Fahrzeugnavigationssystems oder Ähnlichem anwendbar. Darüber hinaus können der Echoun terdrücker, die Tonausgabevorrichtung und die Tonverarbeitungsvorrichtung in einem Gerät eingebaut sein.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • - JP 2002-237769 [0007]

Claims (11)

  1. Ein Gerät zum Unterdrücken eines Echosignals, welches in einem gemessenen Signal enthalten ist, das einem gemessenen Ton entspricht, wobei das Gerät mit der Toneingabevorrichtung zum Empfangen des gemessenen Tons und der Tonausgabevorrichtung zum Ausgeben eines Tons, der mit einem Referenzsignal im Zusammenhang steht, verbunden werden kann, wobei das Gerät umfasst: ein Bauteil, welches jede Transformation sowohl des gemessenen Signals als auch des Referenzsignals in einem Zeitbereich in sowohl das gemessene Signal als auch das Referenzsignal in einem Frequenzbereich durchführt; ein Bauteil, welches jeden Wert eines Verhältnisses und einer Korrelation zwischen dem gemessenen Signal und dem Referenzsignal in dem Frequenzbereich erhält; ein Bauteil, welches die Werte des Verhältnisses und der Korrelation vergleicht; ein Bauteil, welches einen Koeffizienten auf der Basis eines Ergebnisses des Vergleichs der Werte herleitet; ein Bauteil, welches einen geschätzten Wert des Echosignals auf der Basis eines Produkts des Koeffizienten und des gemessenen Signals in dem Frequenzbereich erhält; und ein Bauteil, welches das Echosignal in dem gemessenen Signal durch Subtrahieren des geschätzten Werts des Echosignals von dem gemessenen Signal unterdrückt, jeweils in dem Frequenzbereich.
  2. Ein Gerät nach Anspruch 1, des Weiteren umfassend: ein Bauteil, welches eine Mehrzahl von Referenzsignalen für ein resultierendes Referenzsignal addiert, wobei das Bauteil, welches jede Transformation sowohl des gemessenen Signals als auch des Referenzsignals durchführt, so wohl das gemessene Signal als auch das resultierende Referenzsignal in dem Zeitbereich in sowohl das gemessene Signal als auch das resultierende Referenzsignal in dem Frequenzbereich transformiert.
  3. Ein Gerät nach Anspruch 1, wobei das Bauteil, welches jeden Wert des Verhältnisses und der Korrelation erhält, eine Berechnung einer Korrelation zwischen dem gemessenen Signal und dem Referenzsignal in dem Frequenzbereich bei jeder Frequenz in einem vorbestimmten Frequenzbereich um eine spezifische Frequenz herum verarbeitet, und der vorbestimmte Frequenzbereich gemäß der spezifischen Frequenz gesteuert wird.
  4. Ein Gerät nach Anspruch 1, wobei das Bauteil, welches den Koeffizienten herleitet, des Weiteren eine Mehrzahl von Schwellenwerten zum Vergleichen des Verhältnisses mit der Korrelation festlegt und auf der Basis der Mehrzahl von Schwellenwerten, dem Verhältnis und der Korrelation bestimmt, ob das gemessene Tonsignal in einem Zustand eines Einzelsprechens oder eines Doppelsprechens gemessen wird.
  5. Ein Gerät nach Anspruch 4, wobei einer der Mehrzahl von Schwellenwerten gemäß in Übereinstimmung mit der Frequenz festgelegt ist.
  6. Ein Gerät nach Anspruch 1, wobei das Bauteil, welches jeden Wert erhält, das Bauteil eine Berechnung des Verhältnisses und der Korrelation auf der Basis jedes Amplitudenspektrums des gemessenen Signals und des Referenzsignals durchführt, welche in den Frequenzbereich transformiert werden.
  7. Ein Gerät nach Anspruch 6, wobei das Bauteil, welches den geschätzten Wert erhält, eine Amplitude des Echosignals schätzt, und das Bauteil, welches das Echosignal unterdrückt, eine Amplitude des gemessenen Signals in dem Fall unterdrückt, wenn ein Verhältnis des Amplitudenspektrums des gemessenen Signals zu dem Amplitudenspektrum des Echosignals nicht geringer ist als ein vorbestimmter Wert.
  8. Ein Gerät nach Anspruch 7, wobei der vorbestimmte Wert gemäß einer Frequenz variiert.
  9. Ein Gerät nach Anspruch 1, wobei das Gerät mit einer Tonverarbeitungsvorrichtung zum Verarbeiten eines Tonsignals mit unterdrücktem Echo, welches aus dem Gerät ausgegeben wird, verbunden werden kann.
  10. Ein Verfahren zum Unterdrücken eines Echosignals, welches in einem gemessenen Signal enthalten ist, das einem gemessenen Ton entspricht, wobei das Verfahren die Arbeitsschritte umfasst: Durchführen jeder Transformation des gemessenen Signals und eines Referenzsignals in einem Zeitbereich in einen Frequenzbereich, wobei das Referenzsignal einem Tonsignal zum Erzeugen eines Tons entspricht; Verarbeiten einer Berechnung zum Erhalten jedes Werts eines Verhältnisses und einer Korrelation zwischen dem gemessenen Signal und dem Referenzsignal in dem Frequenzbereich; Ausführen eines Vergleichs der Werte des Verhältnisses und der Korrelation; Herleiten eines Koeffizienten auf der Basis eines Ergebnisses des Vergleichs des Verhältnisses und der Korrelation; Ausführen eines geschätzten Werts des Echosignals auf der Basis eines Produkts des Koeffizienten und des gemessenen Tons in dem Frequenzbereich; und Unterdrücken des Echosignals in dem gemessenen Signal durch Subtrahieren des geschätzten Werts des Echosignals von dem gemessenen Signal, jeweils in dem Frequenzbereich.
  11. Ein Speichermedium, welches ein computerlesbares Programm zum Veranlassen eines Computers speichert, um ein Echounterdrückungsverfahren auszuführen, welcher mit einer Tonausgabevorrichtung und einer Tonverarbeitungsvorrichtung kooperiert, wobei das Verfahren die Arbeitsschritte umfasst: Durchführen jeder Transformation des gemessenen Signals und eines Referenzsignals in einem Zeitbereich in einen Frequenzbereich, wobei das Referenzsignal einem Tonsignal zum Erzeugen eines Tons entspricht; Verarbeiten einer Berechnung zum Erhalten jedes Werts eines Verhältnisses und einer Korrelation zwischen dem gemessenen Signal und dem Referenzsignal in dem Frequenzbereich; Ausführen eines Vergleichs der Werte des Verhältnisses und der Korrelation; Herleiten eines Koeffizienten auf der Basis eines Ergebnisses des Vergleichs des Verhältnisses und der Korrelation; Ausführen eines geschätzten Werts des Echosignals auf der Basis eines Produkts des Koeffizienten und des gemessenen Tons in dem Frequenzbereich; und Unterdrücken des Echosignals in dem gemessenen Signal durch Subtrahieren des geschätzten Werts des Echosignals von dem gemessenen Signal, jeweils in dem Frequenzbereich.
DE102008027848A 2007-07-03 2008-06-11 Echounterdrücker, Echounterdrückungsverfahren und computerlesbares Speichermedium Active DE102008027848B4 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2007175581A JP4916394B2 (ja) 2007-07-03 2007-07-03 エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム
JP2007-175581 2007-07-03

Publications (2)

Publication Number Publication Date
DE102008027848A1 true DE102008027848A1 (de) 2009-01-08
DE102008027848B4 DE102008027848B4 (de) 2012-09-27

Family

ID=40092711

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102008027848A Active DE102008027848B4 (de) 2007-07-03 2008-06-11 Echounterdrücker, Echounterdrückungsverfahren und computerlesbares Speichermedium

Country Status (4)

Country Link
US (1) US8644496B2 (de)
JP (1) JP4916394B2 (de)
CN (1) CN101339769B (de)
DE (1) DE102008027848B4 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015222105A1 (de) 2015-11-10 2017-05-11 Volkswagen Aktiengesellschaft Audiosignalverarbeitung in einem Fahrzeug
CN114760389A (zh) * 2022-06-16 2022-07-15 腾讯科技(深圳)有限公司 语音通话方法、装置、计算机存储介质及电子设备

Families Citing this family (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100660607B1 (ko) * 2005-04-27 2006-12-21 김봉석 에코기능을 구비한 리모컨
US8361632B2 (en) * 2008-10-03 2013-01-29 3M Innovative Properties Company Cloud point-resistant adhesives and laminates
US9124769B2 (en) 2008-10-31 2015-09-01 The Nielsen Company (Us), Llc Methods and apparatus to verify presentation of media content
US8219394B2 (en) * 2010-01-20 2012-07-10 Microsoft Corporation Adaptive ambient sound suppression and speech tracking
JP5156043B2 (ja) * 2010-03-26 2013-03-06 株式会社東芝 音声判別装置
KR20120072243A (ko) * 2010-12-23 2012-07-03 한국전자통신연구원 음향/음성 인식을 위한 잡음 제거 장치 및 그 방법
JP5649488B2 (ja) * 2011-03-11 2015-01-07 株式会社東芝 音声判別装置、音声判別方法および音声判別プログラム
CN102740214B (zh) * 2011-04-01 2014-09-10 中国科学院声学研究所 一种基于反馈信号频谱估计的啸叫抑制方法
JP2013042334A (ja) * 2011-08-15 2013-02-28 Sony Corp 情報処理装置、情報処理方法、およびプログラム
CN103325379A (zh) 2012-03-23 2013-09-25 杜比实验室特许公司 用于声学回声控制的方法与装置
CA2888894C (en) 2012-10-23 2021-08-17 Interactive Intelligence, Inc. System and method for acoustic echo cancellation
CN105261363A (zh) * 2015-09-18 2016-01-20 深圳前海达闼科技有限公司 一种语音识别的方法、装置及终端
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US9820039B2 (en) 2016-02-22 2017-11-14 Sonos, Inc. Default playback devices
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9811314B2 (en) 2016-02-22 2017-11-07 Sonos, Inc. Metadata exchange involving a networked playback system and a networked microphone system
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
JP6833616B2 (ja) * 2017-05-29 2021-02-24 株式会社トランストロン エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
CN107452398B (zh) * 2017-08-09 2021-03-16 深圳创维数字技术有限公司 回声获取方法、电子设备及计算机可读存储介质
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10482868B2 (en) * 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US10192567B1 (en) * 2017-10-18 2019-01-29 Motorola Mobility Llc Echo cancellation and suppression in electronic device
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
WO2019152722A1 (en) 2018-01-31 2019-08-08 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
CN110956973A (zh) * 2018-09-27 2020-04-03 深圳市冠旭电子股份有限公司 一种回声消除方法、装置及智能终端
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
EP3654249A1 (de) 2018-11-15 2020-05-20 Snips Erweiterte konvolutionen und takt zur effizienten schlüsselwortauffindung
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
CN111294473B (zh) * 2019-01-28 2022-01-04 展讯通信(上海)有限公司 信号处理方法及装置
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
CN109640223B (zh) * 2019-02-22 2020-08-11 昆腾微电子股份有限公司 一种啸叫抑制方法、装置、音响及扩音系统
CN111835383B (zh) * 2019-04-17 2022-04-01 达发科技(苏州)有限公司 回音与近端串扰消除系统
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
JP7183119B2 (ja) * 2019-06-13 2022-12-05 株式会社デンソーテン 音声信号処理装置
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
CN112053700B (zh) * 2020-08-31 2023-02-07 浙江大华技术股份有限公司 场景识别方法、装置、电子设备以及计算机可读存储介质
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
CN117135536A (zh) * 2023-03-29 2023-11-28 荣耀终端有限公司 回声消除方法和电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002237769A (ja) 2001-02-08 2002-08-23 Nippon Telegr & Teleph Corp <Ntt> 多チャネル反響抑圧方法、その装置、そのプログラム及びその記録媒体

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5442712A (en) * 1992-11-25 1995-08-15 Matsushita Electric Industrial Co., Ltd. Sound amplifying apparatus with automatic howl-suppressing function
DE19714966C2 (de) 1997-04-10 1999-04-01 Siemens Ag Vorrichtung zur Rückhördämpfung
DE19806015C2 (de) 1998-02-13 1999-12-23 Siemens Ag Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen
JP3420705B2 (ja) 1998-03-16 2003-06-30 日本電信電話株式会社 エコー抑圧方法及び装置並びにエコー抑圧プログラムが記憶されたコンピュータに読取り可能な記憶媒体
US6510224B1 (en) * 1999-05-20 2003-01-21 Telefonaktiebolaget L M Ericsson Enhancement of near-end voice signals in an echo suppression system
US6965640B2 (en) * 2001-08-08 2005-11-15 Octasic Inc. Method and apparatus for generating a set of filter coefficients providing adaptive noise reduction
JP3568922B2 (ja) * 2001-09-20 2004-09-22 三菱電機株式会社 エコー処理装置
JP3756839B2 (ja) * 2002-04-17 2006-03-15 日本電信電話株式会社 反響低減方法、反響低減装置、反響低減プログラム
JP3922997B2 (ja) * 2002-10-30 2007-05-30 沖電気工業株式会社 エコーキャンセラ
US7272224B1 (en) * 2003-03-03 2007-09-18 Apple Inc. Echo cancellation
US7251322B2 (en) * 2003-10-24 2007-07-31 Microsoft Corporation Systems and methods for echo cancellation with arbitrary playback sampling rates
US6864812B1 (en) * 2004-02-05 2005-03-08 Broadcom Corporation Hardware efficient implementation of finite impulse response filters with limited range input signals
JP4591685B2 (ja) * 2004-03-31 2010-12-01 ヤマハ株式会社 ダブルトーク状態判定方法、エコーキャンセル方法、ダブルトーク状態判定装置、エコーキャンセル装置およびプログラム
JP4448423B2 (ja) * 2004-10-25 2010-04-07 日本電信電話株式会社 エコー抑圧方法、この方法を実施する装置、プログラムおよびその記録媒体
EP1853087B1 (de) * 2005-02-21 2014-07-30 Fujitsu Ltd. Echolöscher
US20080219432A1 (en) * 2005-06-01 2008-09-11 Tecteon Pic Echo Delay Detector
EP1942582B1 (de) * 2005-10-26 2019-04-03 NEC Corporation Echounterdrückungsverfahren und einrichtung
US8073147B2 (en) * 2005-11-15 2011-12-06 Nec Corporation Dereverberation method, apparatus, and program for dereverberation
EP1827002A1 (de) * 2006-02-22 2007-08-29 Alcatel Lucent Verfahren zur Anpassungsregelung eines Filters
US8275120B2 (en) * 2006-05-30 2012-09-25 Microsoft Corp. Adaptive acoustic echo cancellation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002237769A (ja) 2001-02-08 2002-08-23 Nippon Telegr & Teleph Corp <Ntt> 多チャネル反響抑圧方法、その装置、そのプログラム及びその記録媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015222105A1 (de) 2015-11-10 2017-05-11 Volkswagen Aktiengesellschaft Audiosignalverarbeitung in einem Fahrzeug
WO2017080830A1 (de) 2015-11-10 2017-05-18 Volkswagen Aktiengesellschaft Audiosignalverarbeitung in einem fahrzeug
US10339951B2 (en) 2015-11-10 2019-07-02 Volkswagen Aktiengesellschaft Audio signal processing in a vehicle
CN114760389A (zh) * 2022-06-16 2022-07-15 腾讯科技(深圳)有限公司 语音通话方法、装置、计算机存储介质及电子设备

Also Published As

Publication number Publication date
US8644496B2 (en) 2014-02-04
JP2009014937A (ja) 2009-01-22
DE102008027848B4 (de) 2012-09-27
CN101339769A (zh) 2009-01-07
CN101339769B (zh) 2012-07-18
JP4916394B2 (ja) 2012-04-11
US20090010445A1 (en) 2009-01-08

Similar Documents

Publication Publication Date Title
DE102008027848B4 (de) Echounterdrücker, Echounterdrückungsverfahren und computerlesbares Speichermedium
DE60034212T2 (de) Verfahren und vorrichtung zur adaptiven rauschunterdrückung
EP1143416B1 (de) Geräuschunterdrückung im Zeitbereich
DE69738288T2 (de) Einrichtung zur unterdrückung einer störenden komponente eines eingangssignals
DE112007003625T5 (de) Echounterdrückungsvorrichtung, echounterdrückungssystem, Echounterdrückungsverfahren und Computerprogramm
DE102008008674B4 (de) Mehrkanalkommunikationsvorrichtung und Verfahren zum Verringern von Echos durch Einsetzen einer Trainingssequenz unter einer Spektralmaske
EP0747880B1 (de) Spracherkennungssystem
DE4126902A1 (de) Sprachintervall - feststelleinheit
DE112017007005B4 (de) Akustiksignal-verarbeitungsvorrichtung, akustiksignalverarbeitungsverfahren und freisprech-kommunikationsvorrichtung
DE4243831A1 (de) Verfahren zur Laufzeitschätzung an gestörten Sprachkanälen
DE112011104737T5 (de) Geräuschunterdrückungsvorrichtung
DE102013006163A1 (de) Störgeräuschbeseitigungsverfahren
AT509570B1 (de) Methode und apparat zur einkanal-sprachverbesserung basierend auf einem latenzzeitreduzierten gehörmodell
DE10043064B4 (de) Verfahren und Vorrichtung zur Elimination von Lautsprecherinterferenzen aus Mikrofonsignalen
EP3065417B1 (de) Verfahren zur unterdrückung eines störgeräusches in einem akustischen system
AT504164B1 (de) Vorrichtung zur gerauschunterdruckung bei einem audiosignal
DE60304147T2 (de) Virtuelle Mikrophonanordnung
DE19729521B4 (de) Verfahren und Vorrichtung zur Störgeräusch- und Echounterdrückung
DE3230391C2 (de)
DE102008009214B4 (de) Audiokommunikationsvorrichtung und Verfahren zum Verringern von Echos durch Einfügen einer Trainingssequenz unter einer Spektralmaske
DE102018117558A1 (de) Adaptives nachfiltern
DE102019105458B4 (de) System und Verfahren zur Zeitverzögerungsschätzung
Fingscheidt et al. Towards objective quality assessment of speech enhancement systems in a black box approach
EP0615226A2 (de) Verfahren zur Geräuschreduktion für gestörte Sprachkanäle
DE10016619A1 (de) Verfahren zur Herabsetzung von Störkomponenten in Sprachsignalen

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8128 New person/name/address of the agent

Representative=s name: SEEGER SEEGER LINDNER PARTNERSCHAFT PATENTANWAELTE

R016 Response to examination communication
R016 Response to examination communication
R016 Response to examination communication
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final

Effective date: 20121228