DE69735275T2 - Gerät und verfahren für nichtlineare verarbeitung in einem kommunikationssystem - Google Patents

Gerät und verfahren für nichtlineare verarbeitung in einem kommunikationssystem Download PDF

Info

Publication number
DE69735275T2
DE69735275T2 DE69735275T DE69735275T DE69735275T2 DE 69735275 T2 DE69735275 T2 DE 69735275T2 DE 69735275 T DE69735275 T DE 69735275T DE 69735275 T DE69735275 T DE 69735275T DE 69735275 T2 DE69735275 T2 DE 69735275T2
Authority
DE
Germany
Prior art keywords
noise
signal
control signal
echo canceller
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69735275T
Other languages
English (en)
Other versions
DE69735275D1 (de
Inventor
P. James Naperville ASHLEY
M. Lee Cary PROCTOR
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Mobility LLC
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Application granted granted Critical
Publication of DE69735275D1 publication Critical patent/DE69735275D1/de
Publication of DE69735275T2 publication Critical patent/DE69735275T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • H04B3/23Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Noise Elimination (AREA)

Description

  • GEBIET DER ERFINDUNG
  • Die vorliegende Erfindung bezieht sich allgemein auf Echokompensation und insbesondere auf eine verbesserte nichtlineare Verarbeitung in Kommunikationssystemen.
  • HINTEGRUND DER ERFINDUNG
  • Moderne Sprachkompressionsstandards für digitale zellulare Systeme erachten die Rauschunterdrückung als einen notwendigen Bestandteil der Signalvorverarbeitungsfunktion. Zwar bleiben die Verfahren zur Rauschunterdrückung innerhalb dieser Standards optional, doch ist es nahezu unmöglich, die subjektive Einhaltungsüberprüfung zu bestehen, falls keine Rauschunterdrückung verwendet wird. Obwohl diese Standards sich mit der Notwendigkeit für die Rauschunterdrückungsfunktion befasst haben, haben sie sich nicht mit der Bedeutung einer Kaskadierung der Rauschunterdrü ckung mit anderen erforderlichen Vorverarbeitungsfunktionen, wie z. B. der Echokompensation, befasst. Die Kaskadierung eines Echokompensators mit einem Geräuschunterdrücker kann zu Problemen führen.
  • Es ist wohl bekannt, dass beim Kompensieren elektrischer und akustischer Echos in Kommunikationssystemen bestimmte Nichtlinearitäten in dem Echopfad (z. B. Quantisierungsrauschen, akustische Varianz, usw.) verhindern, dass das Echo erzeugende System durch den Echokompensator vollständig und genau gebildet wird. Das führt zu einem Restecho, das für den Endbenutzer hörbar sein kann. Um diese Mangelhaftigkeit auszugleichen, verwenden Echokompensationssysteme das, was allgemein als ein "Zentrumsbegrenzer" oder ein "nichtlinearer Prozessor" bekannt ist (siehe CCITT-Empfehlung G.165, Genf, 1980, ergänzt auf Malaga-Torremolinos, 1984 und in Melbourne, 1988). Der nichtlineare Prozessor unterdrückt im Wesentlichen den Rest durch Schätzen des Echorückstrahlverlusts (ERL) und Echorückstrahlverlustkompensation (ERLE) und "Abschneiden" des Rests, ist erst einmal eine Mindest-ERL + ERLE-Schwelle erreicht. Beim Abschneiden handelt es sich üblicherweise um ein Schalten zu einem "Comfort Noise"-Generator mit niedrigem Pegel, der beim Endbenutzer für das Gefühl einer lebendigen Verbindung sorgt.
  • Das Problem liegt darin, dass diese neuen Rauschunterdrückungssysteme mit diesem wohl bekannten nichtlinearen Verfahren nicht kompatibel sind. Einfach dargelegt verwenden diese neuen Rauschunterdrückungssysteme die Langzeitstatistik des eingehenden Signals, um die Hintergrundrauschspektralgröße periodisch zu schätzen. Diese Schätzung wird dann als ein Frequenzbereichfilter verwendet, um Fre quenzbänder des eingehenden Signals zu dämpfen, die der Rauschschätzung in der Größe genügend nahe kommen. Falls dem Rauschunterdrückungssystem ein Echokompensator vorausgeht, wird der nichtlineare Prozessor die Schätzung des Hintergrundrauschens falsch beeinflussen. Das wird zu einem ungültigen Filtervorgang führen, wenn der nichtlineare Prozessor erst einmal inaktiv wird, weil die Hintergrundrauscheigenschaft sich geändert hat. Das macht das Rauschunterdrückungssystem in Umgebungen mit mäßigem bis hohem Rauschen, wie z. B. einer Freihandkonfiguration eines zellularen Funktelefons, nutzlos.
  • Andere Konfigurationen sind ebenfalls erwogen worden. Falls zum Beispiel das Rauschunterdrückungssystem vor dem Echokompensator angeordnet wird, dann würde der nichtlineare Prozess innerhalb des Echokompensators die Rauschschätzung in dem Rauschunterdrückungssystem nicht beeinflussen. Das Problem bei dieser Implementierung liegt darin, dass sich der hoch nichtlineare Geräuschunterdrücker jetzt in dem Echopfad befindet, was verhindern würde, dass der Echokompensator jemals richtig konvergiert. Ein anderes Beispiel umfasst, dass der nichtlineare Prozessor von dem Echokompensator getrennt wird, und der Echokompensator vor dem Rauschunterdrückungssystem richtig angeordnet wird, und der nichtlineare Prozessor hinter dem Rauschunterdrückungssystem (auf dem Geräuschunterdrückerausgang) positioniert wird. Obgleich das die beste soweit erörterte Implementierung ist, gibt es zwei grundlegende Schwierigkeiten. Erstens weist der Comfort Noise-Generator üblicherweise eine feste spektrale Verteilungscharakteristik auf, die zu einem Rausch schaltenden Artefakt führt, das üblicherweise bei den meisten Fernverbindungslandleitungstelefongesprächen wahrgenommen wird. Zweitens kann der nichtlineare Prozessor Probleme bei der Ermittlung der Paketrate für Vocoder mit variabler Rate verursachen. Die meisten Ratenermittlungsalgorithmen verwenden die Energie und spektralen Verteilungscharakteristiken des eingehenden Sprachsignals, um eine Sprachaktivität zu ermitteln. Als solches kann das Ein- und Ausschalten von synthetischem Comfort Noise die Leistung der Ratenermittlungsalgorithmen ernstlich herabsetzen.
  • Somit besteht ein Bedarf für eine verbesserte Echokompensation und Rauschunterdrückungskaskade zur Verwendung in Kommunikationssystemen.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 stellt allgemein ein Kommunikationssystem dar, welches vorteilhaft eine verbesserte nichtlineare Verarbeitung gemäß der Erfindung implementiert.
  • 2 stellt allgemein ein Echokompensationsschema auf dem bekannten Stand der Technik dar, das üblicherweise in Kommunikationssystemen, wie z. B. dem Kommunikationssystem von 1, verwendet wird.
  • 3 stellt allgemein ein Energie-Zeit-Diagramm dar, das zur weiteren Erläuterung der Konfiguration auf dem bekannten Stand der Technik von 2 nützlich ist.
  • 4 stellt allgemein eine verbesserte nichtlineare Verarbeitung zur Verwendung in einem Kommunikationssystem gemäß der Erfindung dar.
  • 5 stellt allgemein ein Blockdiagramm des Rauschunterdrückungssystems von 4 gemäß der Erfindung dar.
  • 6 stellt allgemein eine Frame-zu-Frame-Überlappung dar, die in dem Rauschunterdrückungssystem von 5 stattfindet.
  • 7 stellt allgemein eine trapezförmige Fensterung von preemphasierten Abtastwerten dar, die in dem Rauschunterdrückungssystem von 5 vorkommt.
  • 8 stellt allgemein ein Blockdiagramm der spektralen Abweichungsschätzfunktion innerhalb des in 5 dargestellten Rauschunterdrückungssystems dar.
  • 9 stellt allgemein ein Ablaufdiagramm der in dem Aktualisierungsentscheidungsermittler innerhalb des in 5 dargestellten Rauschunterdrückungssystems durchgeführten Schritte dar.
  • 10 stellt allgemein ein Energie-Zeit-Diagramm dar, welches aus der Implementierung einer verbesserten nichtlinearen Verarbeitung gemäß der Erfindung erfolgt.
  • 11 stellt allgemein eine Mobilstation dar, die eine nichtlineare Verarbeitung gemäß der Erfindung implementiert.
  • AUSFÜHRLICHE BESCHREIBUNG EINER BEVORZUGTEN AUSFÜHRUNGSFORM
  • Allgemein dargestellt beseitigt ein verbesserter nichtlinearer Prozessor eine Comfort Noise-Quelle und gibt stattdessen ein Steuersignal direkt in ein Rauschunterdrückungssystem ein. Das Rauschunterdrückungssystem verwendet das Steuersignal, um die iterative Aktualisierung der Hintergrundrauschschätzung zu unterdrücken, wenn das Steuersignal aktiv ist, was verhindert, dass irgendein Restecho die von dem Rauschunterdrückungssystem zur Verfügung gestellte Rauschschätzung beeinflusst. Darüber hinaus wird das Steuersignal von einem Verstärkungsrechner innerhalb des Rauschunterdrückungssystems verwendet, um jedes Frequenzband auf das maximal zulässige Maß plus dem gegenwärtigen Restkanal-Signal-Rausch-Verhältnis (SNR) zu dämpfen. Abhängig von der Implementierung bildet das Rauschunterdrückungssystem das Hintergrundrauschen von entweder einem Benutzer des PSTN oder einem Benutzer einer Mobilstation.
  • Spezieller dargestellt umfasst eine Vorrichtung zur nichtlinearen Verarbeitung in einem Kommunikationssystem gemäß der Erfindung ein Mittel zum Analysieren eines Echokompensatorbezugssignals und eines Echokompensatorrestsignals, um ein Steuersignal zu erzeugen, und ein Mittel zum Bilden eines Hintergrundrauschens eines Benutzers basierend auf dem Steuersignal. In der bevorzugten Ausführungsform umfasst das Mittel zum Analysieren einen Komparator zum Vergleichen des Echokompensatorbezugssignals mit dem Echokompensatorrestsignal, um das Steuersignal zu erzeugen. Auch kann in der bevorzugten Ausführungsform der Benutzer ein Benutzer innerhalb eines öffentlichen Fernsprechnetzes (PSTN) oder ein Benutzer einer Mobilstation sein.
  • Das Mittel zum Bilden eines Hintergrundrauschens eines Benutzers umfasst darüber hinaus ein Rauschunterdrückungssystem, welches Mittel zum Unterdrücken einer Aktualisierung des Hintergrundrauschens basierend auf dem Steuersignal umfasst. Das Rauschunterdrückungssystem implementiert Kanalverstärkungen, um eine Frequenzbereichfilterung eines Eingangssignals durchzuführen, und modifiziert auch die Kanalverstärkungen basierend auf dem Steuersignal. In der bevorzugten Ausführungsform werden die Kanalverstärkungen unter Verwendung der Gleichung γdB(i) = γn - σ(i), 0 ≤ i < Nc modifiziert, wenn das Steuersignal aktiv ist. In dieser Implementierung bildet das Rauschunterdrückungssystem das Echokompensatorrestsignal spektral als Antwort auf das Steuersignal, um dem von dem Rauschunterdrückungssystem erzeugten gebildeten Hintergrundrauschen im Wesentlichen ähnlich zu klingen.
  • In einer alternativen Ausführungsform umfasst das Mittel zum Bilden eines Hintergrundrauschens eines Benutzers Mittel zum Filtern des Echokompensatorrestsignals. Von einem Systemintegrations- und/oder Implementierungsstandpunkt aus kann das Mittel zum Analysieren des Echokompensatorbezugssignals und des Echokompensatorrestsignals zum Erzeugen des Steuersignals physikalisch von dem Mittel zum Bilden eines Hintergrundrauschens getrennt sein oder kann mit dem Mittel zum Bilden eines Hintergrundrauschens gemeinsam angebracht sein. Der Vorrichtung zugeordnet ist ein entsprechendes Verfahren, das die Schritte zum Analysieren eines Echokompensatorbezugssignals und eines Echokompensatorrestsignals, um ein Steuersignal zu erzeugen, und Bilden eines Hintergrundrauschens eines Benutzers basierend auf dem Steuersignal, umfasst.
  • Anders dargestellt umfasst die Vorrichtung zur nichtlinearen Verarbeitung in einem Kommunikationssystem gemäß der Erfindung ein Mittel zum Aktivieren eines mit einem Rauschunterdrückungssystem verbundenen Steuersignals. Das Rauschunterdrückungssystem umfasst ein Mittel zum Erzeugen eines konditionierten Steuersignals aus dem Steuersignal, ein Mittel zum Unterdrücken einer Aktualisierung einer Hintergrundrauschschätzung basierend auf dem konditionierten Steuersignal und ein Mittel zum Modifizieren einer Kanalverstärkung basierend auf dem konditionierten Steuersignal. In dieser Implementierung umfasst das Mittel zum Aktivieren des Steuersignals entweder ein Mittel zum Vergleichen der Differenz zwischen einem Echokompensatorbezugssignal und einem Echokompensatorrestsignal mit einer Schwelle oder eine von einem Benutzer aktivierte Stummfunktion. Die von einem Benutzer aktivierte Stummfunktion findet bestimmte Anwendung bei Szenarien, wo es vorteilhaft ist, ein Signal zu filtern, während das Hintergrundrauschen belassen wird. Eine solche Situation ereignet sich in Satellitenverbindungsübertragungen (insbesondere Überseeverbindungen), wo ein Hintergrundrauschen erwünscht ist, um den Benutzer des Kommunikationsgeräts wissen zu lassen, dass die Verbindung geschaltet bleibt.
  • Die Analyse des Echokompensatorbezugssignals und des Echokompensatorrestsignals, um das Steuersignal zu erzeugen, kann von einem Echokompensator durchgeführt werden, während das Bilden des Hintergrundrauschens eines Benutzers basierend auf dem Steuersignal von einem Rauschunterdrückungssystem durchgeführt werden kann. Auf diese Art und Weise implementiert, kann der Echokompensator physikalisch von dem Rauschunterdrückungssystem getrennt sein oder kann gemeinsam mit dem Rauschunterdrückungssystem angebracht sein. Es ist wichtig, zu beachten, dass die Implementierung eines Echokompensators, der von dem Rauschunterdrückungssystem getrennt ist, erfordert, dass der Echokompensator das Steuersignal als einen Ausgang zur Verfügung stellt.
  • 1 stellt allgemein ein Kommunikationssystem dar, das eine verbesserte nichtlineare Verarbeitung gemäß der Erfindung vorteilhaft implementiert. In der in 1 dargestellten Ausführungsform handelt es sich bei dem Kommunikationssystem um ein Funktelefonsystem mit Mehrfachzugriff im Codemultiplex (CDMA), aber wie es sich für einen ordent- lichen Fachmann versteht, können verschiedene andere Typen von Kommunikationssystemen, die Echokompensation und/oder Rauschunterdrückungssysteme implementieren, die vorliegende Erfindung vorteilhaft verwenden. Fährt man fort, wird ein öffentliches Fernsprechnetz 103 (PSTN) mit einer Mobilfunkvermittlungsstelle 106 (MSC) verbunden. Wie in der Technik wohl bekannt ist, stellt das PSTN 103 eine leitungsgebundene Vermittlungsleistung zur Verfügung, während die MSC 106 eine Vermittlungsleistung in Bezug auf das CDMA- Funktelefonsystem zur Verfügung stellt. Auch ein Controller 109 wird mit der MSC 106 verbunden, wobei der Controller 109 eine Echokompensation und Sprach-Codierung/Decodierung umfasst. Der Controller 109 steuert das Leiten von Signalen an/von Basisstationen 112, 113, die wiederum im Stande sind, mit einer Mobilstation 115 zu kommunizieren. Das CDMA- Funktelefonsystem ist mit dem Interimstandard (IS) 95-A kompatibel. Für mehr Information über den IS-95-A siehe TIA/EIA/IS-95-A, Mobile Station-Base Station Compatibility Standard for Dual Mode Wideband Spread Spectrum Cellular System, Juli 1993. Während die Vermittlungsleistung der MSC 106 und die Steuerleistung des Controllers 109 wie in 1 verteilt dargestellt werden, versteht es sich für einen ordentlichen Fachmann, dass die zwei Funktionen in einer gemeinsamen physikalischen Einheit zur Systemimplementierung kombiniert werden könnten.
  • Um eine verbesserte nichtlineare Verarbeitung gemäß der Erfindung zu erläutern, ist eine Erläuterung eines Echokompensationsschemas auf dem bekannten Stand der Technik vorteilhaft. 2 stellt allgemein ein Echokompensationsschema auf dem bekannten Stand der Technik dar, das üblicherweise in Kommunikationssystemen, wie z. B. dem Kommuni kationssystem 100 von 1, verwendet wird, und wie durch die EP-A-0739123 (NEC) verkörpert wird. Wie in 2 dargestellt, tritt ein Signal aus der Mobilstation 115 in ein Sprachdecodierfeld 209 innerhalb des Controllers 109 ein. Das Sprachdecodierfeld ist in der Technik wohl bekannt und decodiert hauptsächlich die "codierte" Sprache, die in der Mobilstation 115 codiert wurde. Der Ausgang des Sprachdecodierers 209, bei dem es sich um das Echokompensatorbezugssignal 205 handelt, tritt in einen Echokompensator 203 ein, dessen Betrieb unten allgemein beschrieben wird. Das Echokompensatorbezugssignal 205 strömt im Wesentlichen unbeeinflusst an die MSC 106 durch und gelangt schließlich zum PSTN 103, wo es an einen Benutzer des PSTN 103 gesendet wird, der üblicherweise als ein Landleitungsteilnehmer bezeichnet wird. Wie in der Technik wohl bekannt ist, wird innerhalb des PSTN 103 ein Echo zwischen der Zwischenkopplung ("inter-coupling") erzeugt, die den Übertragungsleitungen zugeordnet ist, welche in das PSTN 103 eintreten und daraus austreten. Dieses Echo wird durch die in Feld 221 dargestellte Übertragungsfunktion H(z) dargestellt. Als solches umfasst das Signal, das aus dem PSTN 103 austretend und in die MSC 106 eintretend gezeigt wird, nicht nur ein reines Signal von dem Benutzer des Landleitungssystems, sondern ein Echo des Signals, welches von der Mobilstation 115 wie oben erläutert ausging. Dieses Signal strömt durch die MSC 106 und tritt erneut in den Echokompensator 203 innerhalb des Controllers 109 ein. Der Echokompensator 203 subtrahiert eine geschätzte Echokopie von dem Eingang, um das Echokompensatorrestsignal 207 zu erzeugen. Der Echokompensator 203 umfasst einen nichtlinearen Prozessor 212, der das Echokompensatorrestsignal 207 basierend auf dem Status des Steuersignals 224 weiter unterdrückt.
  • Wie in 2 dargestellt, wird die nichtlineare Verarbeitung durch Schalten zu einer Comfort Noise-Quelle 214 mit niedrigem Pegel durchgeführt, was beim Endbenutzer für das Gefühl einer lebendigen Verbindung sorgt. Es ist wichtig, zu beachten, dass die Comfort Noise-Quelle 214 lediglich ein weißes Rauschen mit niedrigem Pegel zur Verfügung stellt und überhaupt nicht mit dem Benutzer von entweder dem PSTN oder einer Mobilstation zusammenhängt. Solch ein Echokompensator 203, von dem ein Beispiel in einem von Texas Instruments in den Vereinigten Staaten 1986 veröffentlichten Anmeldungsvermerk mit dem Titel "Digital Signal Processing Applications with the TMS 320 Family" auf den Seiten 417-436 beschrieben wird, ist in der Technik wohl bekannt. Ein weiteres Beispiel eines Echokompensators 203 wird in dem Vereinigte-Staaten-Patent Nr. 5,295,136 zu Ashley et al. mit dem Titel "Method of Performing Convergence in a Least Mean Square Adaptive Filter Echo Canceller" zur Verfügung gestellt, das dem Rechtsnachfolger der vorliegenden Erfindung übertragen ist. Der in diesem Patent beschriebene Echokompensator ist mit der oben zitierten CCITT-Empfehlung G.165 konform.
  • Das Signal, das aus dem Echokompensator 203, und speziell aus dem nichtlinearen Prozessor 212 des Echokompensators 203, austritt, tritt in ein Rauschunterdrückungssystem 206 ein. Üblicherweise handelt es sich bei dem Rauschunterdrückungssystem 206 um dasjenige, das in § 4.1.2 des TIA-Dokuments IS-127 mit dem Titel "Enhanced Variable Rate Codec, Speech Service Option 3 for Wideband Spread Spectrum Digital Systems" mit Datum vom 9. September 1996, beschrie ben wird. Das aus dem Rauschunterdrückungssystem 206 austretende Signal tritt in einen Sprachcodierer 210 ein, der in der Technik wohl bekannt ist, der das rauschunterdrückte Signal zur Übertragung an die Mobilstation 115 über eine Basisstation 112, 113 codiert. Ebenfalls in 2 dargestellt wird ein Ratenermittlungsalgorithmus 211, der die Energie und spektralen Verteilungscharakteristika des in den Sprachcodierer 210 eintretenden Sprachsignals verwendet, um eine Sprachaktivität zu ermitteln.
  • 3 stellt allgemein ein Energie-Zeit-Diagramm dar, das für eine weitere Erläuterung der Konfiguration auf dem bekannten Stand der Technik von 2 nützlich ist. Wie in 3 dargestellt, stellt die obere Energiedarstellung 301 das Signal dar, das aus der MSC 106 austritt und in den Echokompensator 203 eintritt, das in 2 als Punkt A (pt. A.) gekennzeichnet wird. Dieses Signal wird von einem durch H(z) 221 erzeugten Echo und akustischem Rauschen vom Landleitungsteilnehmer innerhalb des PSTN 103 umfasst. Die untere Energiedarstellung 302 ist das Signal, das aus dem Rauschunterdrückungssystem 206 austritt und in den Sprachcodierer 210 eintritt, das in 2 als Punkt B dargestellt wird. Während Intervallen 304 und 306 von 3 ist das Energieniveau der Darstellung 301 hoch, was darauf hinweist, dass der Benutzer der Mobilstation 115 während dieser Zeitperioden spricht. Während einer Zeitperiode 307 schweigt der Benutzer der Mobilstation 115, somit ist die Energie, die während dieser Zeitperiode aus dem Sprachdecodierer 209 austritt, niedrig.
  • Wendet man sich der Darstellung 302 von 3 zu, ist während der Zeitintervalle 304 und 306 die Differenz am Eingang des Komparators 227 groß, das Steuersignal 224 ist aktiv, so dass die Comfort Noise-Quelle 214 als ein Eingang zu dem Rauschunterdrückungssystem 206 verwendet wird. Während des Zeitintervalls 307, wenn die Differenz am Eingang des Komparators 227 klein ist, ermöglicht es das Steuersignal 224, dass der Eingang zum Rauschunterdrückungssystem 206 von dem Benutzer der Landleitung in dem PSTN 103 ist. Der Eingang von der Comfort Noise-Quelle 214 verfügt üblicherweise über ein niedrigeres Energieniveau als der Rauscheingang vom Landleitungsteilnehmerbenutzer des PSTN 103, und das wird als ein Intervall 312 in der Energiedarstellung 302 dargestellt. Da die Energie während des Zeitintervalls 312 (verursacht durch einen Eingang von der Landleitung 214) größer ist als die Energie während des Zeitintervalls 304, nimmt das Rauschunterdrückungssystem 206 an, dass an seinem Eingang Sprache vorhanden ist, und deaktiviert folglich das Rauschunterdrückungssystem 206 bis zur Wiederherstellung in einem Zeitintervall 315. Im Wesentlichen dämpft das Rauschunterdrückungssystem 206 den Landleitungsrauschquellenpegel während der Zeitperiode 315 um 13 dB. Während der Zeitperiode 306, wenn am Ausgang des Sprachdecodierers 209 Sprache erneut vorhanden ist, ist die Differenz am Eingang des Komparators 227 erneut groß, das Steuersignal 224 ist aktiv, so dass die Comfort Noise-Quelle 214 erneut als ein Eingang zum Rauschunterdrückungssystem 206 verwendet wird. Es ist wichtig, zu beachten, dass sich die Energiedarstellung 302 am Eingang des Sprachcodierers 210 befindet, somit werden all die Energieniveauschwankungen, die in der Energiedarstellung 302 dargestellt werden, durch den Sprachcodierer 210 codiert und werden somit dem Benutzer der Mobilstation 115 während einer Kommu nikation mit einem Landleitungsbenutzer des PSTN 103 darstellbar.
  • 4 stellt allgemein eine verbesserte nichtlineare Verarbeitung zur Verwendung in einem Kommunikationssystem gemäß der Erfindung dar. Wie in 4 dargestellt, ist die Comfort Noise-Quelle 214 von 2 beseitigt worden und das Steuersignal 224, das aus dem Komparator 227 austritt, wird direkt in das Rauschunterdrückungssystem 403 eingegeben. Die Vorrichtung 401 in der bevorzugten Ausführungsform gemäß der Erfindung umfasst den Komparator 227 und das Rauschunterdrückungssystem 403. Das ermöglicht, dass der nichtlineare Prozess der Vorrichtung 401, welcher in dieser Ausführungsform der nichtlineare Prozess ist, funktionsgemäß von dem Rauschunterdrückungssystem 403 zur Verfügung gestellt wird. Das Rauschunterdrückungssystem 403 verwendet das Steuersignal 224, um die iterative Aktualisierung der Hintergrundrauschschätzung zu unterdrücken, wenn das Steuersignal 224 aktiv ist, wie ausführlicher mit Bezug auf 5 beschrieben wird. Das hindert jegliches Restecho daran, die vom Rauschunterdrückungssystem 403 zur Verfügung gestellte Rauschschätzung zu beeinflussen. Schließlich wird das Steuersignal 224 von einem Verstärkungsrechner innerhalb des Rauschunterdrückungssystems 403 verwendet, um jedes Frequenzband auf das maximal zulässige Maß plus dem gegenwärtigen Restkanal-Signal-Rausch-Verhältnis (SNR) zu dämpfen. In dieser Ausführungsform bildet das Rauschunterdrückungssystem 403, welches ein Mittel zum Bilden eines Hintergrundrauschens eines Benutzers basierend auf dem Steuersignal zur Verfügung stellt, das Hintergrundrauschen eines Benutzers des PSTN.
  • Insbesondere werden die Kanalverstärkungen, wenn das Steuersignal 224 aktiv ist, so geändert, dass das Restechosignal der Rauschschätzung spektral entsprechend gebildet wird, und dann um ein vorgegebenes Maß gedämpft wird. Es ist wichtig, zu beachten, dass keine Rauschsynthese (wie im Vergleich zu 2 auf dem bekannten Stand der Technik, wo die Comfort Noise-Quelle 214 verwendet wird) umfasst wird, sondern das Restechosignal vielmehr adaptiv gefiltert wird, um unentdeckbar nah am normalen rauschunterdrückten Hintergrundrauschen zu klingen. Da diese Vorrichtung zur verbesserten nichtlinearen Verarbeitung über eine exakte Leistungsspektraldichte verfügt, werden weitere Aspekte des Kommunikationssystems, wie z. B. Ratenermittlung oder Sprachaktivitätsdetektion, innerhalb des Kommunikationssystems ebenfalls verbessert.
  • 5 stellt allgemein ein Blockdiagramm des Rauschunterdrückungssystems 403 gemäß der Erfindung dar. In der bevorzugten Ausführungsform handelt es sich bei dem Rauschunterdrückungssystem 403 um eine modifizierte Version des oben erwähnten in § 4.1.2 des TIA-Dokuments IS-127 beschriebenen Rauschunterdrückungssystems. Es wird angemerkt, dass verschiedene in 5 der vorliegenden Anmeldung dargestellte Felder über einen ähnlichen Betrieb verfügen wie entsprechende in 1 der US Pat.-Nr. 4,811,404 zu Vilmur dargestellte Felder.
  • Um eine Rauschunterdrückung zu beginnen, wird das Eingangssignal s(n) durch einen Hochpassfilter (HPF) 500 hochpassgefiltert, um das Signal shp(n) zu erzeugen. Der HPF 500 ist ein Chebyshev-Typ II vierter Ordnung mit einer Grenzfrequenz von 120 Hz, der in der Technik wohl bekannt ist. Die Übertragungsfunktion des HPF 500 wird definiert als:
    Figure 00160001
    wobei die entsprechenden Zähler- und Nennerkoeffizienten definiert werden als:
    b = {0,898025036, -3,59010601, 5,38416243, -3,59010601, 0,898024917},
    a = {1,0, -3,78284979, 5,37379122, -3,39733505, 0,806448996}.
  • Wie es sich für einen ordentlichen Fachmann versteht, kann jede Anzahl an Hochpassfilterkonfigurationen verwendet werden.
  • Danach, im Preemphasisfeld 503, wird das Signal shp(n) unter Verwendung eines geglätteten trapezförmigen Fensters gefenstert, in dem die ersten D Abtastwerte d(m) des Eingangsframes (Frame "m") von den letzten D Abtastwerten des vorherigen Frames (Frame "m - 1") überlappt werden. Diese Überlappung ist am besten in 6 ersichtlich. Sofern nicht anders angemerkt, verfügen alle Variablen über Anfangswerte von Null, z. B. d(m) = 0; m ≤ 0. Das kann beschrieben werden als: d(m, n) = d(m - 1, L + n); 0 ≤ n < D, wobei m der gegenwärtige Frame ist, n ein Abtastindex zu dem Puffer {d(m)} ist, L = 80 die Framelänge ist und D = 24 die Überlappung (oder Verzögerung) in Abtastwerten ist. Die verbleibenden Abtastwerte des Eingangspuffers werden dann gemäß dem Folgenden preemphasiert:
    Figure 00170001
    wobei
    Figure 00170002
    der Preemphasisfaktor ist. Das führt dazu, dass der Eingangspuffer L + D = 104 Abtastwerte umfasst, in denen die ersten D Abtastwerte die preemphasierte Überlappung vom vorhergehenden Frame sind, und die folgenden L Abtastwerte vom gegenwärtigen Frame eingegeben werden.
  • Danach, in dem Fensterungsfeld 504 von 5 wird ein geglättetes trapezförmiges Fenster (wie am besten durch Fenster 700 von 7 dargestellt) auf die Abtastwerte angewendet, um ein diskretes Fourier-Transformations (DFT) – Eingangssignal g(n) zu bilden. In der bevorzugten Ausführungsform wird g(n) definiert als:
    Figure 00170003
    wobei M = 128 die DFT-Folgelänge ist und alle anderen Begriffe wie vorher definiert sind.
  • In dem Kanalteiler 506 von 5 wird die Transformation von g(n) zum Frequenzbereich durchgeführt unter Verwendung der diskreten Fourier-Transformation (DFT) definiert als:
    Figure 00180001
    wobei e ein Phasenkoeffizient einer komplexen Einheitsamplitude mit momentaner Radialposition ω ist. Das ist eine atypische Definition, aber eine, die die Wirkungsgrade der komplexen schnellen Fourier-Transformation (FFT) ausschöpft. Der 2/M-Normierungsfaktor resultiert aus der Präkonditionierung der M-Punkt-Realfolge, um eine M/2-Punkt-Komplexfolge zu bilden, die unter Verwendung einer M/2-Punkt-Komplex-FFT transformiert wird. In der bevorzugten Ausführungsform umfasst das Signal G(k) 65 eindeutige Kanäle. Einzelheiten zu diesem Verfahren können bei Proakis und Manolakis, Introduction to Digital Signal Processing, 2. Auflage, New York, Macmillan, 1988, Seiten 721-722, gefunden werden.
  • Das Signal G(k) wird dann in die Kanalenergieschätzfunktion 509 eingegeben, wo die Kanalenergieschätzung Ech(m) für den gegenwärtigen Frame, m, unter Verwendung des Folgenden ermittelt wird:
    Figure 00180002
    wobei Emin = 0,0625 die mindestzulässige Kanalenergie ist, αch(m) der Kanalenergieglättungsfaktor (unten definiert) ist, Nc = 16 die Anzahl an kombinierten Kanälen ist, und fL(i) und fH(i) die i-ten Elemente der entsprechenden niedrigen und hohen Kanal kombinierenden Tabellen, fL und fH, sind. In der bevorzugten Ausführungsform werden fL und fH definiert als:
    fL = {2, 4, 6, 8, 10, 12, 14, 17, 20, 23, 27, 31, 36, 42, 49, 56},
    fH = {3, 5, 7, 9, 11, 13, 16, 19, 22, 26, 30, 35, 41, 48, 55, 63}.
  • Der Kanalenergieglättungsfaktor, αch(m), kann definiert werden als:
    Figure 00190001
    was bedeutet, dass αch(m) einen Wert von Null für den ersten Frame (m = 1) voraussetzt und einen Wert von 0,45 für alle nachfolgenden Frames. Das ermöglicht es, dass die Kanalenergieschätzung auf die ungefilterte Kanalenergie des ersten Frames initialisiert wird. Darüber hinaus sollte die Kanalrauschenergieschätzung (wie unten definiert) auf die Kanalenergie des ersten Frames initialisiert werden, d. h.: En (m, i) = max {Einit, Ech (m, i)); m = 1, 0 ≤ i < Nc,wobei Einit = 16 die mindestzulässige Kanalrauschinitialisierungsenergie ist.
  • Die Kanalenergieschätzung Ech(m) für den gegenwärtigen Frame wird danach verwendet, um die quantisierten Kanal-Signal-Rausch-Verhältnis (SNR)-Indizes zu schätzen. Diese Schätzung wird in der Kanal-SNR-Schätzfunktion 518 von 5 durchgeführt und wird ermittelt als:
    Figure 00200001
    wobei En(m) die gegenwärtige Kanalrauschenergieschätzung (wie später definiert) ist und die Werte von {σq} zwischen 0 und einschließlich 89 eingeschränkt werden. In der vorliegenden Erfindung werden die unquantisierten unverarbeiteten SNR's {σ} erfordert, somit kann die obige Gleichung in zwei Schritte zerlegt werden:
    Figure 00200002
    und σq(i) = max{0, min{89, round{σ(i)/0,375}}}, 0 ≤ i <Nc
  • Die Parameter {σ} und {σq} werden jeweils aus der Kanal-SNR-Schätzfunktion 518 von 5 austretend dargestellt.
  • Unter Verwendung der Kanal-SNR-Schätzung {σq} wird die Summe der Sprachmetrik in dem Sprachmetrikrechner 515 ermittelt unter Verwendung von:
    Figure 00200003
    wobei V(k) der kte Wert der 90-Elemente-Sprachmetriktabelle V ist, die definiert wird als:
    V = (2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6, 7, 7, 7, 8,
    8, 9, 9, 10, 10, 11, 12, 12, 13, 13, 14, 15, 15, 16, 17, 17, 18, 19, 20, 20, 21,
    22, 23, 24, 24, 25, 26, 27, 28, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 37, 38,
    39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 50, 50, 50, 50, 50, 50, 50, 50,
    50).
  • Die Kanalenergieschätzung Ech(m) für den gegenwärtigen Frame wird auch als Eingang zu der spektralen Abweichungsschätzfunktion 510 verwendet, die die spektrale Abweichung ΔE(m) schätzt. Mit Bezug auf 8 wird die Kanalenergieschätzung Ech(m) in eine Logarithmus-Leistungs-Spektralschätzfunktion 800 eingegeben, wo das Logarithmusleistungsspektrum geschätzt wird als: EdB (m, i) = 10log10 (Ech (m, i)); 0 ≤ i < Nc.
  • Die Kanalenergieschätzung Ech(m) für den gegenwärtigen Frame wird auch in eine Gesamtkanalenergieschätzfunktion 803 eingeben, um die Gesamtkanalenergieschätzung, Etot(m), für den gegenwärtigen Frame, m, gemäß dem Folgenden zu ermitteln:
    Figure 00210001
  • Danach wird ein exponentieller Fensterungsfaktor α(m) (als eine Funktion der Gesamtkanalenergie Etot(m)) in dem expo nentiellen Fensterungsfaktorermittler 806 ermittelt unter Verwendung von:
    Figure 00220001
    welche zwischen αH und αL begrenzt wird durch: α(m) = max{αL, min{αH, α(m)}},wobei EH und EL die Energieendpunkte (in Dezibel oder "dB") für die lineare Interpolation von Etot(m) sind, die zu α(m), welches über die Grenzen αL ≤ α(m) ≤ αH verfügt, transformiert wird. Die Werte dieser Konstanten werden definiert als: EH = 50, EL = 30, αH = 0,99, αL = 0,50. In Anbetracht dessen würde ein Signal mit einer relativen Energie von, sagen wir mal, 40 dB einen exponentiellen Fensterungsfaktor von α(m) = 0,745 unter Verwendung der obigen Berechnung verwenden.
  • Die spektrale Abweichung ΔE(m) wird dann in der spektralen Abweichungsschätzfunktion 809 geschätzt. Bei der spektralen Abweichung ΔE(m) handelt es sich um die Differenz zwischen dem gegenwärtigen Leistungsspektrum und einer durchschnittlichen Langzeitleistungsspektralschätzung:
    Figure 00220002
    wobei EdB(m) die durchschnittliche Langzeitleistungsspektralschätzung ist, welche in der Langzeitspektralenergieschätzfunktion 812 ermittelt wird unter Verwendung von: E dB(m + 1, i)= α(m) E db(m, i) + (1 - α(m)) EdB(m, i); 0 ≤ i < Nc,wobei all die Variablen vorher definiert werden. Der Anfangswert von E de(m) wird als das geschätzte Logarithmusleistungsspektrum von Frame 1 definiert oder: Edb(m) = EdB(m); m = 1.
  • Danach wird das Steuersignal 224 durch das Konditionsfeld 528 verarbeitet, um das konditionierte Steuersignal 526 zu erzeugen. Dieses Konditionieren ist erforderlich, um die Abtastrate des Steuersignals 224 an die Feldabtastrate des Rauschunterdrückungssystems 403 anzupassen. Der in dem Konditionierungsfeld 528 implementierte Pseudocode wird unten dargestellt.
  • Figure 00230001
  • Das versichert, dass, falls das Steuersignal 224 für einen Abtastwert i inaktiv ist, das konditionierte Steuersignal 526 dann für das gesamte Feld von L Abtastwerten inaktiv ist.
  • An diesem Punkt werden die Summe der Sprachmetrik v(m), die Gesamtkanalenergieschätzung für den gegenwärtigen Frame Etot(m) und die spektrale Abweichung ΔE(m) in den Aktualisierungsentscheidungsermittler 512 eingegeben, genauso wie das konditionierte Steuersignal 526, um eine nichtlineare Verarbeitung gemäß der Erfindung zu ermöglichen. Das konditionierte Steuersignal 526 wird vom Aktualisierungsentscheidungsermittler 512 verwendet, um das Aktualisierungsflag (update_flag) zu unterdrücken, um eine Schätzung/Aktualisierung des Hintergrundrauschens zu verhindern. Die Entscheidungslogik, die unten im Pseudocode dargestellt wird und in Ablaufdiagrammform in 9 dargestellt wird, veranschaulicht, wie die Rauschschätzungsaktualisierungsentscheidung letztendlich gefällt wird. Der Ablauf beginnt bei Schritt 900 und geht weiter zu Schritt 903, wo das Aktualisierungsflag (update_flag) gelöscht wird. Dann, in Schritt 904, wird die Aktualisierungslogik (nur VMSUM) von Vilmur implementiert, indem überprüft wird, ob die Summe der Sprachmetrik ν(m) kleiner ist als eine Aktualisierungsschwelle (UPDATE_THLD). Falls die Summe der Sprachmetrik kleiner ist als die Aktualisierungsschwelle, wird der Aktualisierungszähler (update_cnt) in Schritt 905 gelöscht und das Aktualisierungsflag wird in Schritt 906 gesetzt. Der Pseudocode für die Schritte 903-906 wird unten dargestellt:
    Figure 00240001
    Figure 00250001
  • Falls in Schritt 904 die Summe der Sprachmetrik größer ist als die Aktualisierungsschwelle, wird die Rauschunterdrückung implementiert. Zuerst, in Schritt 907, wird die Gesamtkanalenergieschätzung, Etot(m), für den gegenwärtigen Frame, m, mit dem Rauschboden in dB (NOISE_FLOOR_DB) verglichen, während die spektrale Abweichung ΔE(m) mit der Abweichungsschwelle (DEV_THLD) verglichen wird. Falls die Gesamtkanalenergieschätzung größer ist als der Rauschboden und die spektrale Abweichung kleiner ist als die Abweichungsschwelle, wird der Aktualisierungszähler in Schritt 908 inkrementiert. Nachdem der Aktualisierungszähler inkrementiert worden ist, wird in Schritt 909 eine Überprüfung durchgeführt, um zu ermitteln, ob der Aktualisierungszähler größer als oder gleich einer Aktualisierungszählerschwelle (UPDATE_CNT_THLD) ist. Falls das Ergebnis der Überprüfung in Schritt 909 richtig ist, dann wird das Aktualisierungsflag in Schritt 906 gesetzt. Der Pseudocode für die Schritte 907-909 und 906 wird unten dargestellt:
    Figure 00250002
  • Wie aus 9 ersehen werden kann, wird, falls eine der Überprüfungen in den Schritten 907 und 909 falsch ist, oder nachdem das Aktualisierungsflag in Schritt 906 gesetzt worden ist, eine Logik zum Verhindern eines Langzeit"Kriechens" des Aktualisierungszählers implementiert. Diese Hystereselogik wird implementiert, um zu verhindern, dass sich minimale spektrale Abweichungen über lange Perioden summieren, was eine ungültige gewaltsame Aktualisierung verursacht. Der Ablauf beginnt bei Schritt 910, wo eine Überprüfung durchgeführt wird, um zu ermitteln, ob der Aktualisierungszähler dem letzten Aktualisierungszählerwert (last_update_cnt) für die letzten N Frames (HYSTER_CNT_THLD) entsprochen hat. In der bevorzugten Ausführungsform werden sechs Frames als eine Schwelle verwendet, aber es kann jegliche Anzahl von Frames implementiert werden. Falls die Überprüfung in Schritt 910 richtig ist, wird der Aktualisierungszähler in Schritt 911 gelöscht und der Ablauf geht in Schritt 912 ab zum nächsten Frame. Falls die Überprüfung in Schritt 910 falsch ist, geht der Ablauf in Schritt 912 direkt zum nächsten Frame ab. Der Pseudocode für die Schritte 910-912 wird unten dargestellt:
    Figure 00260001
  • In der bevorzugten Ausführungsform sind die Werte der vorher verwendeten Konstanten wie folgt:
    UPDATE_THLD = 35,
    NOISE_FLOOR_DB = 10log10(1),
    DEV_THLD = 28,
    UPDATE_CNT_THLD = 50, und
    HYSTER_CNT_THLD = 6.
  • Wann immer das Aktualisierungsflag in Schritt 906 für einen vorgegebenen Frame gesetzt wird, wird die Kanalrauschschätzung für den nächsten Frame aktualisiert. Die Kanalrauschschätzung wird in dem Glättungsfilter 524 aktualisiert unter Verwendung von: En (m + 1, i) = max {Emin, αnEn (m, i) + (1 - αn) Ech (m, i)}; 0 ≤ 1 < Nc,wobei Emin = 0,0625 die mindestzulässige Kanalenergie ist, und αn = 0,9 der in dem Glättungsfilter 524 lokal gespeicherte Kanalrauschglättungsfaktor ist. Die aktualisierte Kanalrauschschätzung wird in dem Energieschätzungsspeicher 525 gespeichert und der Ausgang des Energieschätzungsspeichers 525 ist die aktualisierte Kanalrauschschätzung En(m). Die aktualisierte Kanalrauschschätzung En(m) wird als ein Eingang zu der Kanal-SNR-Schätzfunktion 518, wie oben beschrieben, und auch dem Verstärkungsrechner 533, wie unten beschrieben wird, verwendet.
  • Danach ermittelt das Rauschunterdrückungssystem 403, ob eine Kanal-SNR-Modifikation stattfinden sollte. Diese Ermittlung wird in dem Kanal-SNR-Modifikator 527 durchgeführt, der die Anzahl von Kanälen zählt, die Kanal-SNR-Indexwerte aufweisen, welche eine Indexschwelle überschreiten. Während des Modifikationsprozesses selbst reduziert der Kanal-SNR-Modifikator 527 das SNR von denjenigen bestimmten Kanälen, die einen SNR-Index aufweisen, der kleiner ist als eine Setbackschwelle (SETBACK_THLD), oder reduziert das SNR all der Kanäle, falls die Summe der Sprachmetrik kleiner ist als eine Metrikschwelle (METRIC_THLD). Eine Pseudocodedarstellung des Kanal-SNR-Modifikationsprozesses, der in dem Kanal-SNR-Modifikator 527 stattfindet, wird unten zur Verfügung gestellt:
    Figure 00280001
  • An diesem Punkt werden die Kanal-SNR-Indizes {σq'} auf eine SNR-Schwelle in dem SNR-Schwellenfeld 530 begrenzt. Die Konstante σth wird in dem SNR-Schwellenfeld 530 lokal gespeichert. Eine Pseudocodedarstellung des in dem SNR-Schwellenfeld 530 durchgeführten Prozesses wird unten zur Verfügung gestellt:
    Figure 00290001
  • In der bevorzugten Ausführungsform werden die vorhergehenden Konstanten und Schwellen vorgegeben als:
    NM = 5,
    INDEX_THLD = 12,
    INDEX_CNT_THLD = 5,
    METRIC_THLD = 45,
    SETBACK_THLD = 12, und
    σth = 6.
  • An diesem Punkt werden die begrenzten SNR-Indizes {σq''} und die unquantisierten Kanal-SNRs {σ} von der Kanal-SNR-Schätzfunktion 518 in den Verstärkungsrechner 533 eingegeben, wo die Kanalverstärkungen ermittelt werden. Zuerst wird der Gesamtverstärkungsfaktor ermittelt unter Verwendung von:
    Figure 00300001
    wobei γmin = -13 die Mindestgesamtverstärkung ist, Efloor = 1 die Rauschbodenenergie ist und En(m) das während des vorherigen Frames berechnete geschätzte Rauschspektrum ist. In der bevorzugten Ausführungsform werden die Konstanten γmin und Efloor im Verstärkungsrechner 533 lokal gespeichert. Die Entscheidung, entweder {σq''} oder {σ} zu verwenden, wird innerhalb des Verstärkungsrechners 533 basierend auf dem Status des konditionierten Steuersignals 526 gefällt, welches auch in den Verstärkungsrechner 533 eingegeben wird. Die Kanalverstärkungen (in dB) werden dann ermittelt unter Verwendung von: γdB(i) = γn - σ(1), 0 ≤ i < Nc wenn das konditionierte Steuersignal 526 aktiv ist, oder γdB(i) = μgq(i) - σth) + γn, 0 ≤ i < Nc wenn das konditionierte Steuersignal 526 inaktiv ist. Bei der Variablen μg = 0,39 handelt es sich um den Verstärkungsanstieg (auch lokal im Verstärkungsrechner 533 gespeichert). Die linearen Kanalverstärkungen werden dann konvertiert unter Verwendung von: (i) = min{1,10 γdb(i)/20}, 0 ≤ i <Nc
  • An diesem Punkt werden die oben ermittelten Kanalverstärkungen auf das transformierte Eingangssignal G(k) mit den folgenden Kriterien angewendet, um das Ausgangssignal H(k) von dem Kanalverstärkungsmodifikator 539 zu erzeugen:
    Figure 00310001
  • Die sonstige Kondition in der obigen Gleichung setzt voraus, das der Intervall von k 0 ≤ k ≤ M/2 ist. Es wird ferner vorausgesetzt, dass H(k) sogar symmetrisch ist, so dass die folgende Kondition ebenfalls erhoben wird: H(M - k) = H*(k); 0 < k < M/2,wobei das * eine konjugierte komplexe Zahl kennzeichnet. Das Signal H(k) wird dann (zurück) konvertiert zu dem Zeitbereich in dem Kanalkombinator 542 unter Verwendung der inversen DFT:
    Figure 00310002
    und der Frequenzbereichfilterprozess wird fertig gestellt, um das Ausgangssignal h'(n) zu erzeugen, indem ein Overlap-and-Add mit den folgenden Kriterien angewendet wird:
    Figure 00310003
  • Eine Signaldeemphasis wird auf das Signal h'(n) durch das Deemphasisfeld 545 angewendet, um das Signal s'(n) zu erzeugen, das gemäß der Erfindung rauschunterdrückt worden ist. s'(n) = h'(n) + ζds'(n - 1); 0 ≤ n < L,wobei ζd = 0,8 ein innerhalb des Deemphasisfelds 545 lokal gespeicherter Deemphasisfaktor ist.
  • 10 stellt allgemein ein resultierendes Energie-Zeitdiagramm dar, das sich aus dem Implementieren der verbesserten nichtlinearen Verarbeitung gemäß der Erfindung ergibt. Bezieht man sich allgemein auf 4 und 10, ist während der Zeitintervalle 1006 und 1009 die Differenz an den Eingängen des Komparators 227 groß und das in das Rauschunterdrückungssystem 403 eintretende Steuersignal 224 ist aktiv. Während eines Intervalls 1012 ist die Differenz an den Eingängen des Komparators 227, die in das Rauschunterdrückungssystem 403 eintreten, klein, und das Steuersignal 224 ist inaktiv. Jedoch ist die Signalenergie 1003 von 10, im Gegensatz zur Signalenergie 302 in 3, gemäß der Erfindung konstant. Das ist auf die Tatsache zurückzuführen, dass der in 2 auf dem bekannten Stand der Technik dargestellte Comfort Noise-Generator 214 beseitigt worden ist und der Energiesignal 1003-Eingang zum Rauschunterdrückungssystem 403 (pt. "C" von 4) aus im Wesentlichen der "selben" Menge an Rauschen vom PSTN 103 besteht. Darüber hinaus wird das Rauschunterdrückungssystem 403, wenn das in das Rauschunterdrückungssystem 403 eintretende Steuersignal 224 aktiv ist, von der Last befreit, zwischen Hintergrundrauschen und Sprachsignalen zu unter scheiden. Als solches werden, wenn das Steuersignal 224 in dieser Ausführungsform aktiv ist, sowohl das Rauschen und Signal, die auch in das Rauschunterdrückungssystem 403 (das zufällig der Echorest ist) eintreten, immer gedämpft. Zwar wird dargestellt, dass die Energie in dieser Periode durchwegs konstant bleibt, doch sollte wiederholt werden, dass die spektralen Verteilungscharakteristiken auch konsistent sind.
  • Zwar ist die Erfindung mit Bezug auf eine bestimmte Ausführungsform besonders dargestellt und beschrieben worden, doch versteht es sich für Fachleute, dass verschiedenen Änderungen in Form und Einzelheiten vorgenommen werden können, ohne vom Umfang der Erfindung abzuweichen. Zum Beispiel könnte die Vorrichtung 401 gemäß der Erfindung, die innerhalb des Echokompensators 400 dargestellt wird, vom Echokompensator physikalisch getrennt werden. Darüber hinaus könnte die Vorrichtung 401, obschon die Vorrichtung 401 gemäß der Erfindung als auf der Netzseite des Kommunikationssystems implementiert beschrieben worden ist, ebenso in der mobilen Seite des Systems implementiert werden. Falls zum Beispiel die Vorrichtung 401 gemäß der Erfindung in der Mobilstation 115 implementiert wird, würden die einzigen zu 4 erforderlichen Änderungen die Beseitigung des PSTN 103 und der MSC 106 sein und eine Änderung im Modell, das in der in Feld 221 dargestellten Übertragungsfunktion H(z) implementiert wird.
  • Das resultierende Blockdiagramm von 11 stellt die in der Mobilstation 115 implementierte Vorrichtung 401 gemäß der Erfindung dar. Wie in 11 dargestellt, werden aus dem Echokompensator 400 austretende Signale einem Lautsprecher 1103 der Mobilstation 115 zur Verfügung gestellt, während in den Echokompensator 400 eintretende Signale von einem Mikrofon 1106 der Mobilstation 115 ausgehen. Die Übertragungsfunktion H(z) innerhalb Feld 1109 ist eine Übertragungsfunktion basierend auf einem akustischen Modell, welches die rigorose Umgebung der Mobilstation 115 besser verkörpert. Der Betrieb der Vorrichtung 401, oben als in der Netzseite des Kommunikationssystems implementiert beschrieben, ändert sich nicht. In dieser Ausführungsform bildet das Rauschunterdrückungssystem 403, welches ein Mittel zum Bilden eines Hintergrundrauschen eines Benutzers basierend auf dem Steuersignal zur Verfügung stellt, das Hintergrundrauschen eines Benutzers der Mobilstation.

Claims (4)

  1. Vorrichtung zur nichtlinearen Verarbeitung in einem Kommunikationssystem, wobei die Vorrichtung gekennzeichnet ist durch: Mittel, die zum Analysieren eines Echokompensatorbezugssignals und eines Echokompensatorrestsignals geeignet sind, um ein Steuersignal (224) zu erzeugen; und ein Rauschunterdrückungssystem (403), das Mittel umfasst, die zum Schätzen eines Hintergrundrauschens eines Benutzers basierend auf dem Steuersignal (224) geeignet sind, wobei das Rauschunterdrückungssystem darüber hinaus Mittel, die zum Unterdrücken einer Aktualisierung der Rauschschätzung als Antwort auf das Steuersignal (224) geeignet sind, und Mittel, die zum spektralen Bilden des Echokompensatorrestsignals als Antwort auf das Steuersignal (224) und die Rauschschätzung geeignet sind, umfasst, um ein Signal zu erzeugen, das der Rauschschätzung spektral entspricht.
  2. Vorrichtung nach Anspruch 1, wobei die Mittel, die zum Schätzen eines Hintergrundrauschens eines Benutzers geeignet sind, darüber hinaus durch Mittel, die zum Filtern des Echokompensatorrestsignals geeignet sind, gekennzeichnet sind.
  3. Vorrichtung nach Anspruch 1, wobei die Mittel, die zum Analysieren des Echokompensatorbezugssignals und des Echokompensatorrestsignals geeignet sind, um das Steuersignal zu erzeugen, entweder physikalisch von dem zum Schätzen eines Hintergrundrauschens geeigneten Rauschunterdrückungssystem getrennt sind oder mit dem zum Schätzen eines Hintergrundrauschens geeigneten Rauschunterdrückungssystem gemeinsam angebracht sind.
  4. Verfahren zur nichtlinearen Verarbeitung in einem Kommunikationssystem, wobei das Verfahren durch die Schritte gekennzeichnet ist: Analysieren eines Echokompensatorbezugssignals und eines Echokompensatorrestsignals, um ein Steuersignal (224) zu erzeugen; Schätzen eines Hintergrundrauschens eines Benutzers über ein Rauschunterdrückungssystem (403) basierend auf dem Steuersignal (224) und Unterdrücken einer Aktualisierung der Rauschschätzung als Antwort auf das Steuersignal (224); und spektrales Bilden des Echokompensatorrestsignals als Antwort auf das Steuersignal (224) und die Rauschschätzung, um ein Signal zu erzeugen, das der Rauschschätzung spektral entspricht.
DE69735275T 1997-01-23 1997-11-04 Gerät und verfahren für nichtlineare verarbeitung in einem kommunikationssystem Expired - Lifetime DE69735275T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US78806197A 1997-01-23 1997-01-23
US788061 1997-01-23
PCT/US1997/020079 WO1998033311A1 (en) 1997-01-23 1997-11-04 Apparatus and method for non-linear processing in a communication system

Publications (2)

Publication Number Publication Date
DE69735275D1 DE69735275D1 (de) 2006-04-20
DE69735275T2 true DE69735275T2 (de) 2006-07-27

Family

ID=25143329

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69735275T Expired - Lifetime DE69735275T2 (de) 1997-01-23 1997-11-04 Gerät und verfahren für nichtlineare verarbeitung in einem kommunikationssystem

Country Status (9)

Country Link
EP (1) EP0895688B1 (de)
JP (1) JP4261622B2 (de)
KR (1) KR20000064767A (de)
CN (1) CN100361485C (de)
BR (1) BRPI9709148B8 (de)
CA (1) CA2247429C (de)
DE (1) DE69735275T2 (de)
IL (1) IL124578A0 (de)
WO (1) WO1998033311A1 (de)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6658107B1 (en) * 1998-10-23 2003-12-02 Telefonaktiebolaget Lm Ericsson (Publ) Methods and apparatus for providing echo suppression using frequency domain nonlinear processing
DE19935808A1 (de) 1999-07-29 2001-02-08 Ericsson Telefon Ab L M Echounterdrückungseinrichtung zum Unterdrücken von Echos in einer Sender/Empfänger-Einheit
US6507653B1 (en) 2000-04-14 2003-01-14 Ericsson Inc. Desired voice detection in echo suppression
DE60113985T2 (de) * 2000-05-18 2006-06-29 Ericsson Inc., Plano Gerausch-adaptive kommunikationsignalpegelregelung
JP4580508B2 (ja) * 2000-05-31 2010-11-17 株式会社東芝 信号処理装置及び通信装置
US7027591B2 (en) * 2002-10-16 2006-04-11 Ericsson Inc. Integrated noise cancellation and residual echo suppression
US7133825B2 (en) 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
JP4594960B2 (ja) * 2007-05-18 2010-12-08 日本電信電話株式会社 背景雑音補間装置、背景雑音補間方法
CN102136271B (zh) * 2011-02-09 2012-07-04 华为技术有限公司 舒适噪声生成器、方法及回声抵消装置
US8804977B2 (en) 2011-03-18 2014-08-12 Dolby Laboratories Licensing Corporation Nonlinear reference signal processing for echo suppression
CN105872156B (zh) 2016-05-25 2019-02-12 腾讯科技(深圳)有限公司 一种回声时延跟踪方法及装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4783803A (en) * 1985-11-12 1988-11-08 Dragon Systems, Inc. Speech recognition apparatus and method
US4811404A (en) * 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
FR2651077B1 (fr) * 1989-08-18 1994-06-10 Letourneur Gregoire Dispositif de traitement d'echo notamment acoustique dans une ligne telephonique
US5305309A (en) * 1989-12-06 1994-04-19 Fujitsu Limited Echo canceller
GB2245459A (en) * 1990-06-20 1992-01-02 Motorola Inc Echo canceller with adaptive voice switch attenuation
BR9206143A (pt) * 1991-06-11 1995-01-03 Qualcomm Inc Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados
US5295136A (en) * 1992-04-13 1994-03-15 Motorola, Inc. Method of performing convergence in a, least mean square, adaptive filter, echo canceller
US5307405A (en) * 1992-09-25 1994-04-26 Qualcomm Incorporated Network echo canceller
US5613037A (en) * 1993-12-21 1997-03-18 Lucent Technologies Inc. Rejection of non-digit strings for connected digit speech recognition
US5535194A (en) * 1994-07-14 1996-07-09 Motorola, Inc. Method and apparatus for echo canceling with double-talk immunity
JP2928130B2 (ja) * 1995-04-19 1999-08-03 埼玉日本電気株式会社 ハンズフリー通信装置

Also Published As

Publication number Publication date
BRPI9709148B8 (pt) 2016-05-31
CA2247429A1 (en) 1998-07-30
WO1998033311A1 (en) 1998-07-30
CN100361485C (zh) 2008-01-09
KR20000064767A (ko) 2000-11-06
JP2000507432A (ja) 2000-06-13
CN1214171A (zh) 1999-04-14
IL124578A0 (en) 1999-01-26
EP0895688A4 (de) 2001-11-07
JP4261622B2 (ja) 2009-04-30
BR9709148B1 (pt) 2013-10-29
BR9709148A (pt) 1999-08-03
EP0895688B1 (de) 2006-02-15
DE69735275D1 (de) 2006-04-20
EP0895688A1 (de) 1999-02-10
CA2247429C (en) 2002-01-01

Similar Documents

Publication Publication Date Title
DE69830721T2 (de) Verfahren und vorrichtung zur bestimmung der übertragungsrate in einem kommunikationssystem
EP1143416B1 (de) Geräuschunterdrückung im Zeitbereich
DE60132321T2 (de) Verfahren und vorrichtung zur verteilten geräuschunterdrückung
DE69816128T2 (de) Verfahren und vorrichtung zur erzeugung von hintergrundrauschen in einem kommunikationssystem
DE69428119T2 (de) Verringerung des hintergrundrauschens zur sprachverbesserung
DE69332309T2 (de) Ausfallgesichertes betriebsverfahren in einem lautfernsprechsystem
DE60108401T2 (de) System zur erhöhung der sprachqualität
DE69827911T2 (de) Verfahren und einrichtung zur mehrkanaligen kompensation eines akustischen echos
DE69738288T2 (de) Einrichtung zur unterdrückung einer störenden komponente eines eingangssignals
DE60031354T2 (de) Geräuschunterdrückung vor der Sprachkodierung
DE19935808A1 (de) Echounterdrückungseinrichtung zum Unterdrücken von Echos in einer Sender/Empfänger-Einheit
DE69627359T2 (de) Verbesserter echokompensator mit anwendung in der digitalen telefonie
DE102008039330A1 (de) Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung
DE69735275T2 (de) Gerät und verfahren für nichtlineare verarbeitung in einem kommunikationssystem
EP1255398A2 (de) Verfahren zur Maskierung von Geräuschmodulationen und Störgeräuschen bei der Sprachübertragung
EP1103956B1 (de) Exponentielle Echo- und Geräuschabsenkung in Sprachpausen
DE112012005782T5 (de) Nachhallunterdrückungsvorrichtung
DE112017007005T5 (de) Akustiksignal-verarbeitungsvorrichtung, akustiksignalverarbeitungsverfahren und freisprech-kommunikationsvorrichtung
DE60220995T2 (de) Netzwerk-echounterdrückung in mobilstationen
EP1155561B1 (de) Vorrichtung und verfahren zur geräuschunterdrückung in fernsprecheinrichtungen
DE60026570T3 (de) Geräuschunterdrücker
EP1189419B1 (de) Verfahren und Vorrichtung zur Elimination Lautsprecherinterferenzen aus Mikrofonsignalen
DE19805942C1 (de) Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen
DE19806015C2 (de) Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen
EP0797339B1 (de) Verfahren und Schaltungsanordnung zur Verbesserung der Übertragungseigenschaften einer echobehafteten Übertragungsstrecke in einem Telekommunikationsnetz

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: MOTOROLA MOBILITY, INC. ( N.D. GES. D. STAATES, US