DE69937613T2 - Verfahren und vorrichtung zur adaptiven signalverstärkungssteuerung in kommunikationssystemen - Google Patents

Verfahren und vorrichtung zur adaptiven signalverstärkungssteuerung in kommunikationssystemen Download PDF

Info

Publication number
DE69937613T2
DE69937613T2 DE69937613T DE69937613T DE69937613T2 DE 69937613 T2 DE69937613 T2 DE 69937613T2 DE 69937613 T DE69937613 T DE 69937613T DE 69937613 T DE69937613 T DE 69937613T DE 69937613 T2 DE69937613 T2 DE 69937613T2
Authority
DE
Germany
Prior art keywords
speech
level
digital signal
signal
analog
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69937613T
Other languages
English (en)
Other versions
DE69937613D1 (de
Inventor
Patrik SÖRQVIST
Tomas Svensson
Jim Sundqvist
Anders Eriksson
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of DE69937613D1 publication Critical patent/DE69937613D1/de
Application granted granted Critical
Publication of DE69937613T2 publication Critical patent/DE69937613T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/19Arrangements of transmitters, receivers, or complete sets to prevent eavesdropping, to attenuate local noise or to prevent undesired transmission; Mouthpieces or receivers specially adapted therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

  • Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf Kommunikationssysteme, und genauer gesagt auf eine adaptive Verstärkungssteuerung in Kommunikationssystemen.
  • Hintergrund der Erfindung
  • Jüngst gab es eine stetige Anstrengung dazu, die Internettelefonie zu etablieren. Eine Fähigkeit dazu, hochqualitative Audiosignale in Echtzeit über das Internet zu übertragen, wird Konsumenten mit kostenwirksamen und damit unerreichbaren Kommunikationslösungen versorgen, insbesondere im Multimedia-Computer-Kontext. Jedoch bezieht sich ein vorliegendes Hindernis zur erfolgreichen Implementierung von solchen Internettelefonie-Anwendungen, auf eine Audiosignal-Verstärkungssteuerung. Genauer gesagt, ist es schwierig, in der Praxis den Pegel von einem Audiosignal (beispielsweise ein Mikrofron-Ausgangssignal) einzustellen, um einen korrekten und konsistenten Betrieb von den Sprachcodern und weiteren Signalverarbeitungsalgorithmen, welche für gewöhnlich dazu verwendet werden, um das Audiosignal zur Übertragung über das Internet vorzubereiten, sicherzustellen. Mit anderen Worten, sind viele solche Signalverarbeitungsalgorithmen basierend auf einer vollständigen Verwendung von einem bestimmten dynamischen Eingangsbereich optimiert, und erfordern daher eine genaue Signalpegeleinstellung, sodass eingehende Signale diesen Bereich füllen, jedoch nicht übersteigen.
  • Herkömmlicherweise wird die Signalpegeleinstellung dem Anwendungsbenutzer überlassen oder wird automatisch basierend auf einer Kalibrierung vorgenommen, welche durchgeführt wird, wenn die Anwendung das erste Mal installiert wird oder das erste Mal verwendet wird. Beispielsweise wird ein Benutzer oftmals angewiesen, Verstärkungssteuerungseinstellungen über ein Multimedia-Computer-Soundboard vorzunehmen, sodass ein Eingangsleitungs- oder Mikrofonsignal korrekt zur Übertragung verarbeitet wird. Alternativ kann der Benutzer angewiesen werden, ein Kalibrierungssignal (beispielsweise durch ein Sprechen in ein Mikrofon oder eine Bereitstellung eines Audio-Eingangssignals) bei einer Anwendungsinstallation und einer Einrichtung bereitzustellen, sodass die Soundboard-Verstärkung automatisch eingestellt werden kann.
  • Da der Benutzer jedoch das Mikrofon- oder Eingangssignal nicht hören kann, und da die einzelne Verstärkungseinstellung keine zukünftigen Änderungen im Signalpegel berücksichtigen kann (beispielsweise aufgrund von Änderungen in der Mikrofonposition oder Änderungen in der Sprachstärke zwischen Benutzern), haben sich diese Lösungen als inadäquat erwiesen. Bei Zeitpunkten, bei welchen die Soundboard-Verstärkung zu niedrig eingestellt ist, bewirkt dies, dass die Sprachcoder- und/oder weiteren Verarbeitungsalgorithmen weniger akkurat sind. Daraus folgend neigt der empfangene Benutzer dazu, die Verstärkung am entfernten Ende zu erhöhen, welches zu einem empfangenen Sprachsignal führt, welches ein schlechtes Signal-zu-Rauschen-Verhältnis hat und möglicherweise ein störendes Messrauschen enthält. Bei weiteren Zeitpunkten, bei welchen die Soundboard-Verstärkung zu hoch eingestellt ist, bewirkt dies eine Signalsättigung, welche verhindern kann, dass die Sprachcoder- und/oder weiteren Verarbeitungsalgorithmen wie beabsichtigt arbeiten können. Obwohl der empfangene Benutzer die Verstärkung am entfernten Ende verringern kann, kann das empfangene Sprachsignal nichtsdestotrotz gestört sein.
  • Aus der US 5,357,567 sind ein Verfahren und eine Einrichtung zum Emulieren von einem Halbduplex-Betrieb über Vollduplex-Kommunikationskanäle in einem Sprechmikrofon in einem Freihand-Aufbau bekannt, wobei Signal-Abschätzer einen Spitzen- und Signalpegel als auch einen Minimal-Signalpegel von einem Nah- und Mikrofoneingang und einem Eingang am entfernten Ende zur Ausgabe an einem Lautsprecher am nahen Ende abschätzen. Die Abschätzungen werden einem Verstärkungsgenerator zugeführt, welcher bestimmt, wie die Verstärkungen von dem ersten und zweiten Audioeingang variieren sollten, um zu ermöglichen, dass entweder das Signal in Zusammenhang mit dem ersten Eingang oder das Signal in Zusammenhang mit dem zweiten Eingang dominiert, und an die Ausgänge zu passieren ist.
  • Aus der EP 0 765 066 A2 ist ein Sprechermikrofon-Anti-Heulensystem bekannt, welches dazu dient, ein ungewünschtes Heulen zu beseitigen, welches aufgrund von plötzlichen Änderungen in dem akustischen Echopfad zwischen einem Sprecher-Mikrofon und einem Lautsprecher während der Sprecher-Mikrofon-Konversationen herrührt.
  • Daraus folgend gibt es eine Notwendigkeit nach verbesserten Verfahren und einer Einrichtung zum Einstellen von Signalpegeln in Kommunikationssystemen.
  • Umriss der Erfindung
  • Die vorliegende Erfindung erfüllt die oben beschriebenen und weiteren Notwendigkeiten durch eine Bereitstellung von Techniken zur adaptiven Verstärkungssteuerung. Vorzugsweise stellen die offenbarten Techniken korrekt eingestellte Signalpegel während der gesamten Konversation bereit und sind nachgiebig auf Hintergrundrauschen und einem Lautsprecher-Echo. Ferner können die offenbarten Techniken mehrere Sprecher am nahen Ende als auch Änderungen in einer Umgebung am nahen Ende (beispielsweise Änderungen in einer Benutzer- und Mikrofon-Position) berücksichtigen.
  • Eine beispielhafte adaptive Verstärkungssteuerung gemäß der Erfindung enthält einen Verstärkungssteuerungsprozessor, welcher dazu konfiguriert ist, eine analoge Verstärkung, welche einem Mikrofon-Ausgangssignal angelegt wird, basierend auf Messungen von dem Mikrofon-Ausgangssignal und auf Messungen von einem Lautsprecher-Eingangssignal einzustellen. Beispielsweise kann die analoge Verstärkung basierend auf Abschätzungen von dem Mittel- und Spitzen-Sprachpegel im Mikrofonsignal und auf einer Bestimmung, ob das Mikrofon-Ausgangssignal gesättigt ist, eingestellt werden. In beispielhaften Ausführungsformen wird die analoge Verstärkung in der Art eingestellt, dass sich der Mittel-Sprachpegel im Mikrofon-Ausgangssignal einem Ziel-Mittelpegel annähert, und derart, dass der Spitzen-Sprachpegel im Mikrofon-Ausgangssignal einen maximalen Spitzenpegel nicht übersteigt. Um die Leistung zu verbessern, werden die Mittel- und Spitzen-Sprachpegel-Abschätzungen in beispielhaften Ausführungsformen lediglich dann aktualisiert, wenn Sprachaktivitäts-Erfasser anzeigen, dass das Mikrofon-Ausgangssignal eine Sprache enthält, und dass das Lautsprecher-Eingangssignal keine Sprache enthält.
  • Ein beispielhaftes Verfahren zum Einstellen der analogen Verstärkung, welche einem Signal vor einer Digitalisierung über einen Analog-zu-Digital-Umwandler angelegt wird, enthält die Schritte: Bestimmen ob eine digitale Ausgabe des Analog-zu-Digital-Umwandlers gesättigt ist; Verringern der analogen Verstärkung, wenn die digitale Ausgabe gesättigt ist; Vergleichen eines gemessenen Mittelpegels des Kommunikationssignals mit einem Ziel-Mittelpegel, wenn die digitale Ausgabe nicht gesättigt ist; Verringern der analogen Verstärkung, wenn der gemessene Mittelpegel zu weit oberhalb des Ziel-Mittelpegels ist; Vergleichen eines gemessenen Spitzenpegels von dem Kommunikationssignal mit einem maximalen Spitzenpegel des Kommunikationssignals, wenn der gemessene Mittelpegel zu weit unterhalb des Ziel-Mittelpegels ist; und Erhöhen der analogen Verstärkung, wenn der gemessene Spitzenpegel unterhalb des maximalen Pegels ist.
  • Die oben beschriebenen und weitere Merkmale und Vorteile von der Erfindung werden im Folgenden mit Bezug auf die dargestellten Beispiele, welche in den begleitenden Zeichnungen gezeigt sind, detailliert erläutert. Der Fachmann wird anerkennen, dass die beschriebenen Ausführungsformen zum Zwecke der Darstellung und des Verständnisses bereitgestellt sind, und dass zahlreiche äquivalente Ausführungsformen hier in Erwägung gezogen sind.
  • Kurze Beschreibung der Zeichnungen
  • 1 ist ein Blockdiagramm von einem Kommunikationssystem, welches eine beispielhafte adaptive Verstärkungssteuerungsanordnung gemäß der Erfindung enthält.
  • 2 ist ein Ablaufdiagramm, welches Schritte in einem beispielhaften Verfahren zur adaptiven Verstärkungssteuerung gemäß der Erfindung darstellt.
  • Genaue Beschreibung der Erfindung
  • 1 zeigt ein beispielhaftes Internettelefonie-System 100 an, welches eine adaptive Verstärkungssteuerungsanordnung gemäß der Erfindung enthält. Ein solches System kann beispielsweise in einem Multimedia-Personalcomputer enthalten sein. Der Fachmann wird anerkennen, dass die im Folgenden beschriebene Funktionalität von den verschiedenen Elementen des Systems 100 von 1 unter Verwendung einer bekannten analogen und digitalen Signalverarbeitungs-Hardware und/oder eines Vielzweck-Digital-Computers implementiert werden kann.
  • Wie gezeigt, enthält das beispielhafte System 100 ein Mikrofon 110, einen Lautsprecher 120, einen einstellbaren Verstärker 130, einen Analog-zu-Digital-Umwandler 140, einen Digital-zu-Analog-Umwandler 145, einen ersten und zweiten Sprachaktivitäts-Erfasser (VADs) 150, 155 und einen Steuerprozessor 160. Ein Digitalsignal am weiteren Ende x(n) (beispielsweise digitalisierte Sprache am weiteren Ende und über das Internet empfangenes Rauschen) wird dem Digital-zu-Analog-Umwandler 145 und dem zweiten Sprachaktivitäts-Erfasser 155 eingegeben. Der Digital-zu-Analog-Umwandler 145 wandelt das Signal am weiteren Ende x(n) auf die Analog-Domäne um, und das resultierende Analogsignal am weiteren Ende x(t) wird dem Lautsprecher 120 zur Darstellung an einen Benutzer am nahen Ende (nicht gezeigt) eingegeben.
  • Zusätzlich werden Sprache am nahen Ende v1(t), Rauschen am nahen Ende v2(t) und Echo am weiteren Ende s(t) am Mikrofon 110 empfangen und zusammengefasst, um ein Analogsignal am nahen Ende y(t) zu erzeugen, welches durch den einstellbaren Verstärker 130 verstärkt wird und durch den Analog-zu-Digital-Umwandler 140 digitalisiert wird. Das resultierende Digitalsignal am nahen Ende y(n) wird dem ersten Sprachaktivitäts-Erfasser 150 und dem Steuerprozessor 160 eingegeben, und wird ebenfalls an das weitere Ende passiert (beispielsweise über das Internet). Die Ausgabe von jedem Sprachaktivitäts-Erfasser 150, 155 wird dem Steuerprozessor 160 eingegeben.
  • Im Betrieb überwacht der Steuerprozessor 160 das Digitalsignal am nahen Ende y(n) als auch die Ausgabe von jedem Sprachaktivitäts-Erfasser 150, 155 und stellt die Verstärkung des Verstärkers 130 ein, sodass der Pegel des Digitalsignals am nahen Ende y(n) zur Eingabe an einen Sprachcoder (nicht gezeigt) und/oder irgendeinem weiteren Digitalsignal-Verarbeitungsalgorithmus, welcher verwendet werden kann, um das Signal am nahen Ende y(n) zur Übertragung vorzubereiten, geeignet ist. Obwohl es möglich ist, geringe Einstellungen auf den Digitalsignal-Pegel nach einer Analog-zu-Digital-Umwandlung und gerade vor einer Eingabe an den Sprachcoder oder einen weiteren Algorithmus vorzunehmen, werden größere Einstellungen über den Verstärker 130 vorgenommen, um eine übertriebene Verstärkung von Messrauschen zu vermeiden, und um eine Störung aufgrund von einer Signalverstümmelung am Analog-zu-Digital-Umwandler 140 zu verhindern.
  • Im Allgemeinen misst der Steuerprozessor 160 den mittleren Pegel von Sprache am nahen Ende im Signal am nahen Ende y(n) und stellt die Verstärkung des Verstärkers 130 derart ein, um den gemessenen Mittelpegel kontinuierlich zu einem Ziel oder bevorzugt zu einem mittleren Pegel zu bewegen (beispielsweise –22 dBoV, wie im Subscriber Loop Signaling and Transmission Handbook, Whitman D. Reeve, IEEE Press, 1992, S. 95–97 beschrieben). Um das Verstärkungssteuerungssystem robuster zu gestalten, können Verstärkungseinstellungen wie im Folgenden detailliert beschrieben, auf die Ausgaben von den Sprachaktivitäts-Erfassern 150, 155 und auf ein Test zur Signalsättigung festgesetzt werden. Ferner, wie ebenfalls im Folgenden detailliert beschrieben, können Verstärkungseinstellungen ebenfalls auf eine Messung von dem Spitzenpegel von der Sprache am nahen Ende festgesetzt werden, um Verstärkungseinstellungsfehler zu verhindern, wenn zwei oder mehrere Benutzer am nahen Ende sprechen.
  • Gemäß einer beispielhaften Ausführungsform, wird eine laufende Abschätzung des mittleren Pegels von Sprache am nahen Ende im Signal am nahen Ende y(n) am Ende von jedem von einer Abfolge von Signalabtastblöcken am nahen Ende aktualisiert (beispielsweise am Ende von jedem 160-Abtastung GSM-Sprachrahmen). Um jedoch fehlerhafte Verstärkungseinstellungen basierend auf Perioden, wenn der Benutzer am nahen Ende nicht spricht, zu vermeiden, wird die Abschätzung des mittleren Sprachpegels am nahen Ende lediglich dann aktualisiert, wenn der erste Sprachaktivitäts-Erfasser 150 anzeigt, dass das Signal am nahen Ende y(n) Sprache enthält. Ferner, da Echo am weiteren Ende beim ersten Sprachaktivitäts-Erfasser 150 bewirken kann, eine Sprache anzuzeigen, sogar obwohl der Benutzer am nahen Ende nicht spricht, wird die Abschätzung lediglich dann aktualisiert, wenn der zweite Sprachaktivitäts-Erfasser 155 anzeigt, dass das Signal am weiteren Ende x(n) keine Sprache enthält. Techniken zum Aufbauen der Sprachaktivitäts-Erfasser 150, 155 sind bekannt und beispielsweise beschrieben in ETSI, GSM 06:32, European Digital Cellular Telecommunication System Voice Activity Detection, Version 4.3.1, April 1998.
  • Innerhalb von Perioden von Einzelsprechen am nahen Ende (wie durch die Sprachaktivitäts-Erfasser 150, 155 angezeigt), wird die laufende Abschätzung des mittleren Sprachpegels am nahen Ende am Ende von jedem Block von Abtastungen (beispielsweise am Ende von jedem GSM-Rahmen) aktualisiert, indem zunächst ein mittlerer Pegel ry des gesamten Signals am nahen Ende y(n) für den Block von Abtastungen berechnet wird. Mit anderen Worten, wird für einen Block von N (beispielsweise 160) Abtastungen der mittlere Signalpegel am nahen Ende ry berechnet als:
    Figure 00080001
  • Dann wird der Sprachpegel am nahen Ende für den Rahmen berechnet, indem eine Abschätzung des Rauschpegels am nahen Ende (welche innerhalb von Perioden von keiner Sprache am nahen Ende und keiner Sprache am weiteren Ende, wie durch die Sprachaktivitäts-Erfasser 150, 155 angezeigt, berechnet werden kann) von dem berechneten Signalpegel am nahen Ende subtrahiert wird. Mit anderen Worten, wird der Sprachpegel am nahen Ende rv1 als die Differenz zwischen dem Signalpegel am nahen Ende ry und dem Rauschpegel rv2 berechnet: rv1 = ry – rv2.
  • Sobald der Sprachpegel am nahen Ende für den Rahmen bekannt ist, wird die laufende Abschätzung des mittleren Sprachpegels am nahen Ende rav durch ein Glätten von Rahmen zu Rahmen aktualisiert. Mit anderen Worten, wird die mittlere Pegelabschätzung rav aktualisiert zu: rav = αrav + (1 – α)rv1 wobei α ein Aktualisierungs-Koeffizient (eine reelle Zahl) ist, welcher eingestellt ist, um eine Ausgeglichenheit zwischen der Geschwindigkeit von der Verstärkungs-Adaption und einer Systemstabilität bereitzustellen. Empirische Studien haben gezeigt, dass 0,995 ein geeigneter Wert für den Aktualisierungs-Koeffizienten α ist.
  • Durch ein Überwachen des mittleren Sprachpegels am nahen Ende auf diese blockweise Art können periodische Verstärker-Verstärkungseinstellungen vorgenommen werden, um den mittleren Sprachpegel am nahen Ende bei oder nahe dem Zielpegel beizubehalten (beispielsweise innerhalb eines Bereiches von Werten um den Zielpegel). Beispielsweise kann die Verstärkung alle mehrere Blöcken (beispielsweise alle 30 bis 50 GSM-Rahmen) basierend auf einem Vergleich von der laufenden mittleren Abschätzung rav, und dem Zielwert (beispielsweise –22 dBoV) stufenförmig eingestellt werden. Mit anderen Worten, wenn die laufende Abschätzung rav zu weit oberhalb oder unterhalb des Zielpegels am Ende von mehreren Blöcken ist, kann die Verstärkung des Verstärkers um eine geeignete Größe (beispielsweise 1–3 dB) herunter- oder heraufgestuft werden. Indem die Verstärkung lediglich einmal alle mehrere Blöcke oder Rahmen eingestellt wird, und indem die Verstärkung zum Zielwert stufenförmig gestuft wird, werden störende Verstärkungsschwankungen vermieden. Vorzugsweise kann das Intervall (beispielsweise die Anzahl von Blöcken oder Rahmen) zwischen Verstärkungseinstellungen über die Zeit geändert werden. Beispielsweise können Einstellungen während einer frühen Trainingsperiode häufiger vorgenommen werden und danach weniger häufig.
  • Obwohl die oben beschriebene Technik eine Qualitäts-Verstärkungssteuerung bereitstellt, wenn lediglich ein Benutzer am nahen Ende vorliegt, kann sie unzufrieden stellende Ergebnisse erzielen, wenn mehrere Benutzer am nahen Ende sprechen. Mit anderen Worten, wenn zwei oder mehrere Benutzer, welche unterschiedliche Sprachpegel haben, sprechen, wird die oben beschriebene Abschätzung des mittleren Pegels alle der Sprachpegel enthalten und kann somit zu einer Überverstärkung und einer Verstümmelung führen, wenn der lauteste Benutzer, bzw. die lautesten Benutzer, sprechen.
  • Jedoch löst eine weitere beispielhafte Ausführungsform dieses Problem, indem der Spitzenpegel von der Sprache am nahen Ende in Betracht gezogen wird. Genauer gesagt, wird eine laufende Abschätzung des Spitzen-Sprachpegels am nahen Ende auf die blockweise Art berechnet als: rSpitze = Max (βrSpitze + (1 – β)rv1, rv1)wobei β ein realer Aktualisierungs-Koeffizient (beispielsweise 0,995) ist, und wobei der Sprachpegel für einen Rahmen rv1 wie oben beschrieben berechnet wird. Ähnlich der Abschätzung des mittleren Pegels rav wird die Abschätzung des Spitzenpegels rSpitze lediglich dann aktualisiert, wenn die Sprachaktivitäts-Erfasser 150, 155 eine Bedingung eines Einzelsprechens am nahen Ende anzeigen. Indem sichergestellt wird, dass die Abschätzung des Spitzenpegels einen Zielwert nicht übersteigt (beispielsweise –16 dBoV), kann eine Überverstärkung vermieden werden, wenn mehrere Benutzer am nahen Ende vorliegen. Beispielsweise kann der Steuerprozessor 160 dazu konfiguriert sein, um Verstärkungszunahmen lediglich dann zu erlauben (wie durch die Abschätzung des mittleren Pegels angezeigt), wenn die Abschätzung des Spitzenpegels unterhalb des Ziel-Spitzenpegels ist.
  • Vorzugsweise können die oben beschriebenen Verstärkungssteuerungstechniken noch robuster erstellt werden, indem eine Sättigung des Analog-zu-Digital-Umwandlers 140 in Betracht gezogen wird. Beispielsweise, wenn Verstärkungszunahmen (wie beispielsweise durch die oben beschriebenen Abschätzungen des Mittel- und Spitzenpegels angezeigt) lediglich dann zugelassen werden, wenn der Umwandler 140 nicht gesättigt ist (wie beispielsweise angezeigt, wenn das Ausgangssignal y(n) einen Wert gleich dem Minimum oder Maximum des Umwandler-Ausgangsbereiches hat) oder wenn die Verstärkung verringert wird, wann immer eine Sättigung erfasst wird, können dann die Signalverstümmelung und die daraus resultierende Störung minimiert werden.
  • Gemäß einer beispielhaften Ausführungsform wird eine Sättigung überwacht, indem ein Laufende-Sättigung-Zähler beibehalten wird. Am Ende von jedem Block oder Rahmen wird die Anzahl von gesättigten Abtastungen L im Block oder Rahmen bestimmt (beispielsweise werden Abtastungen, welche den minimalen oder maximalen Umwandler-Ausgangswert haben, gezählt). Wenn die Anzahl von gesättigten Abtastungen L im Block oder Rahmen größer oder gleich einem Pro-Block-Sättigungsschwellwert T1 (beispielsweise 2) ist, wird der Sättigungs-Zähler dann durch die Anzahl von gesättigten Abtastungen L erhöht. Wenn die Anzahl von gesättigten Abtastungen L im Block oder Rahmen jedoch kleiner als der Pro-Block-Schwellwert T1 ist, wird der Sättigungs-Zähler dann um eine vorbestimmte Größe M (beispielsweise eine Ganzzahl im Bereich von 1–5) verringert. Wann immer der Sättigungs-Zähler größer oder gleich einem gesamten Sättigungs-Schwellwert T2 (beispielsweise 50) wird, wird die Verstärkung des Verstärkers heruntergestuft und wird der Sättigungs-Zähler zurückgesetzt. Jedoch, solange der Sättigungs-Zähler kleiner als der gesamte Sättigungs-Schwellwert T2 ist, wird die Verstärkung des Verstärkers auf eine geeignete Art eingestellt (beispielsweise basierend auf den oben beschriebenen Abschätzungen des Mittel- und Spitzenpegels). Es ist ebenfalls zu erwähnen, dass aufeinanderfolgenden gesättigten Abtastungen eine höhere Gewichtung (beispielsweise 2), verglichen mit einzeln gesättigten Abtastungen, zugewiesen werden können (da eine einzelne Sättigungs-Abtastung unhörbar sein kann, während aufeinanderfolgend gesättigte Abtastungen für einen Empfangsbenutzer oftmals störend sind). Empirische Studien haben gezeigt, dass die oben beschriebene Technik eine effektive und stabile Art und Weise ist, um eine Sättigung zu verhindern, während eine geeignete Verstärkungssteuerung beibehalten wird.
  • Im Allgemeinen kann eine wirksame Verstärkungssteuerung gemäß der Erfindung erzielt werden, indem Verstärkungseinstellungs-Entscheidungen basierend auf jeglicher Kombination von den oben beschriebenen Mittel-, Spitzen- und Sättigungs-Parametern vorgenommen werden. Ein beispielhafter Entscheidungsalgorithmus 200 ist in 2 angezeigt. Der beispielhafte Algorithmus kann beispielsweise dazu verwendet werden, um Verstärkungseinstellungen des Verstärkers einmalig alle mehrere (beispielsweise 30–50) Rahmen vorzunehmen (wobei es verständlich ist, dass die oben beschriebene Mittelpegel-Abschätzung, Spitzenpegel-Abschätzung und der Sättigungs-Zähler am Ende von jedem Rahmen aktualisiert werden).
  • Der Entscheidungs-Algorithmus beginnt bei Schritt 210, und bei Schritt 220 wird eine Bestimmung vorgenommen, ob das verstärkte und digitalisierte Signal y(n) gesättigt ist (beispielsweise, ob der Laufende-Sättigung-Zähler größer als der Sättigungs-Schwellwert T2 ist). Wenn dies der Fall ist, wird die Verstärkung bei Schritt 230 verringert (beispielsweise um 1–3 dB), und der Entscheidungsalgorithmus ist bei Schritt 240 vollendet. Wenn dies nicht der Fall ist, wird dann eine Bestimmung vorgenommen (bei Schritt 250), ob der Signalpegel zu hoch ist (beispielsweise ob die mittlere Sprachpegel-Abschätzung zu weit oberhalb des Ziel-Mittelpegels ist). Wenn dies der Fall ist, wird die Verstärkung bei Schritt 230 dann verringert, und der Entscheidungsalgorithmus ist bei Schritt 240 beendet. Wenn dies nicht der Fall ist, wird dann eine Bestimmung vorgenommen (bei Schritt 260), ob der Signalpegel zu gering ist (beispielsweise ob die mittlere Sprachpegel-Abschätzung zu weit unterhalb des Ziel-Mittelpegels ist). Wenn dies nicht der Fall ist, wird die Verstärkung nicht modifiziert, und ist der Entscheidungsalgorithmus bei Schritt 240 beendet. Wenn dies der Fall ist, wird dann eine Bestimmung vorgenommen (bei Schritt 270), ob der Spitzen-Signalpegel innerhalb eines geeigneten Bereichs ist (beispielsweise ob die Spitzen-Sprachpegel-Abschätzung kleiner als der Ziel-Spitzenwert ist). Wenn dies nicht der Fall ist, wird die Verstärkung nicht modifiziert und ist der Entscheidungsalgorithmus bei Schritt 240 beendet. Wenn dies der Fall ist, dann wird die Verstärkung bei Schritt 280 erhöht (beispielsweise um 1–3 dB), und ist der Entscheidungsalgorithmus bei Schritt 240 beendet.
  • Wie oben erwähnt, stellen die offenbarten Verstärkungssteuerungstechniken korrekt eingestellte Signalpegel während der gesamten Konversation bereit, und sind widerstandsfähig auf Hintergrundrauschen und Lautsprecher-Echo. Ferner können die offenbarten Techniken mehrere Sprecher am nahen Ende als auch Änderungen in der Umgebung am nahen Ende (beispielsweise Änderungen in einer Benutzer- und Mikrofonposition) berücksichtigen.
  • Vorzugsweise können die offenbarten Techniken in Zusammenhang mit weiteren adaptiven Signalverarbeitungsalgorithmen arbeiten, wie beispielsweise Rauschunterdrückungs-Algorithmen und/oder adaptive Filter-Echoauslöschungs-Algorithmen. Beispielsweise, wie im Stand der Technik bekannt, verwenden Echoauslöscher einen adaptiven Algorithmus (beispielsweise kleinste mittlere Quadrate oder normalisierte kleinste mittlere Quadrate), um eine Abschätzung des Echos s(t) zu entwickeln, welche von dem Signal am nahen Ende y(n) subtrahiert wird, um ein echoausgelöschtes Signal bereitzustellen. Gemäß der vorliegenden Erfindung können Verstärkungsänderungen, welche unter Verwendung der oben beschriebenen Techniken vorgenommen werden, direkt an einen solchen Echoauslöscher gemeldet werden, sodass die adaptiven Filterkoeffizienten des Echoauslöschers unmittelbar eingestellt werden können. Daraus folgend wird der Echoauslöscher keine zusätzliche Zeit erfordern, um die Pegeländerungen zu adaptieren, welche durch die oben beschriebenen Techniken eingeführt sind. Wenn ein Speicherpuffer zwischen dem Analog-zu-Digital-Umwandler 140 und dem Verstärkungssteuerungsprozessor 160 positioniert ist (beispielsweise so, dass der Verstärkungssteuerungsprozessor 160 auf gespeicherten Abtastungen arbeitet), wird die resultierende Signalverzögerung (beispielsweise die Zeit, welche für analoge Verstärkungsänderungen am Verstärker 130 erforderlich ist, um im Ausgangssignal y(n) widergespiegelt zu werden) berücksichtigt, wenn Verstärkungsänderungen an den Echoauslöscher (oder einem weiteren adaptiven Algorithmus) gemeldet werden.
  • Der Fachmann wird anerkennen, dass die vorliegende Erfindung nicht auf die spezifischen beispielhaften Ausführungsformen beschränkt ist, welche hier aus Gründen der Darstellung beschrieben wurden, und dass zahlreiche alternative Ausführungsformen ebenfalls in Betracht gezogen werden. Beispielsweise, obwohl die Ausführungsformen mit Bezug auf eine Echtzeit-Internettelefonie beschrieben wurden, sind die offenbarten Konzepte ebenso in jeglichem Kommunikationskontext anwendbar, bei welchem eine adaptive Verstärkungssteuerung von einem Signal notwendig oder gewünscht ist (beispielsweise Voice-Mail und weitere digitale Telefonie-Anwendungen). Der Umfang von der Erfindung wird daher durch die hier anliegenden Ansprüche anstelle durch die vorhergehende Beschreibung bestimmt, und alle Äquivalente, welche mit dem Sinngehalt von den Ansprüchen konsistent sind, werden als darin umfassend angesehen.

Claims (30)

  1. Adaptive Verstärkungssteuerungsanordnung (100) zum Einstellen einer analogen Verstärkung, welche auf ein Analogsignal am nahen Ende angewendet wird, welches durch ein Mikrophon (110) von einer Kommunikationsvorrichtung ausgegeben wird, wobei die Kommunikationsvorrichtung einen Digital-zu-Analog-Umwandler (145) zum Umwandeln eines Digitalsignals am weiteren Ende, welches eine Sprache am weiteren Ende in einem Analogsignal am weiteren Ende enthält, einen Lautsprecher (120) zum Empfangen des Analogsignals am weiteren Ende und Übergeben dessen an zumindest einen Benutzer am nahen Ende, ein Mikrophon (110) zum Empfangen eines Rauschens am nahen Ende, eines Echos am weiteren Ende und einer Sprache am nahen Ende von dem zumindest einen Benutzer am nahen Ende und Erzeugen des Analogsignals am nahen Ende, einen einstellbaren Verstärker (130) zum Anlegen einer analogen Verstärkung an das Analogsignal am nahen Ende und einen Analog-zu-Digital-Umwandler (140) zum Umwandeln des Analogsignals am nahen Ende zu einem Digitalsignal am nahen Ende hat, wobei die Anordnung enthält: einen ersten Sprachaktivitäts-Erfasser (150) zum Messen von lediglich dem Digitalsignal am nahen Ende, wobei der erste Sprachaktivitäts-Erfasser (150) dazu konfiguriert ist, um anzuzeigen, ob das Digitalsignal am nahen Ende Sprache enthält; einen zweiten Sprachaktivitäts-Erfasser (155) zum Messen von lediglich dem Digitalsignal am weiteren Ende, wobei der zweite Sprachaktivitäts-Erfasser (155) dazu konfiguriert ist, um anzuzeigen, ob das Digitalsignal am weiteren Ende Sprache enthält; und einen Verstärkungssteuerungsprozessor (160), welcher dazu konfiguriert ist, das Digitalsignal am nahen Ende zu überwachen und Anzeigen vom ersten (150) und zweiten (155) Sprachaktivitäts-Erfasser zu empfangen, welche anzeigen, ob das Digitalsignal am nahen Ende und das Digitalsignal am weiteren Ende Sprache enthalten, und die Analogverstärkung, welche an das Analogsignal am nahen Ende angelegt ist, einzustellen, und eine Abschätzung von dem mittleren Pegel von Sprache am nahen Ende lediglich dann zu aktualisieren, wenn das Digitalsignal am nahen Ende Sprache enthält und das Digitalsignal am weiteren Ende keine Sprache enthält; wobei der Verstärkungssteuerungsprozessor (160) dazu konfiguriert ist, den mittleren Pegel von Sprache am nahen Ende abzuschätzen und die am Analogsignal am nahen Ende angelegte Verstärkung einzustellen, um die Abschätzung von dem mittleren Pegel von Sprache am nahen Ende auf einen gezielten mittleren Pegel zu drängen; und wobei der Verstärkungssteuerungsprozessor (160) die analoge Verstärkung, basierend lediglich auf Perioden einstellt, wenn das Digitalsignal am nahen Ende Sprache enthält und das Digitalsignal am weiteren Ende keine Sprache enthält.
  2. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 1, bei welcher die Abschätzung von dem mittleren Pegel von Sprache am nahen Ende als eine gewichtete Summe von einer vorherigen Abschätzung von dem mittleren Pegel von Sprache am nahen Ende und einem derzeitigen Pegel von Sprache am nahen Ende aktualisiert ist, wobei die Anordnung eine Balance zwischen einer Verstärkungsadaption und einer Systemstabilität bereitstellt.
  3. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 1, bei welcher der Verstärkungssteuerungsprozessor (160) die Abschätzung des mittleren Pegels der Sprache am nahen Ende an dem Ende von jedem von einem Ablauf von Abtastblöcken eines Signals am nahen Ende aktualisiert.
  4. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 3, bei welcher die Abschätzung des mittleren Pegels von Sprache am nahen Ende sanft als eine gewichtete Summe von einer vorherigen Abschätzung des mittleren Pegels von Sprache am nahen Ende aktualisiert ist, welche für einen vorherigen Abtastblock eines Signals am nahen Ende und einem derzeitigen Pegel einer Sprache am nahen Ende, welcher für einen derzeitigen Abtastblock eines Signals am nahen Ende berechnet ist, erstellt ist.
  5. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 4, bei welcher der Sprachpegel am nahen Ende für einen derzeitigen Abtastblock eines Signals am nahen Ende als die Differenz zwischen einem mittleren Pegel des Digitalsignals am nahen Ende und einer Abschätzung des Rauschpegels am nahen Ende berechnet ist.
  6. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 5, bei welcher die Abschätzung des Rauschpegels am nahen Ende innerhalb von Perioden berechnet ist, bei denen der erste (150) und zweite (155) Sprachaktivitäts-Erfasser anzeigen, dass weder Sprache am nahen Ende noch Sprache am weiteren Ende jeweils im Digitalsignal am nahen Ende als auch dem Digitalsignal am weiteren Ende vorliegen.
  7. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 3, bei welcher der Ablauf von Abtastblöcken eines Signals am nahen Ende gleich Sprachrahmen sind.
  8. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 3, bei welcher der Verstärkungssteuerungsprozessor (160) die analoge Verstärkung alle einzelne Blöcke stufenweise einstellt.
  9. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 8, bei welcher die Anzahl von Blöcken zwischen Einstellungen von der analogen Verstärkung über die Zeit variiert.
  10. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 1, bei welcher der Verstärkungssteuerungsprozessor (160) die analoge Verstärkung, welche an das Analogsignal am nahen Ende angelegt ist, derart einstellt, dass eine Abschätzung von dem Spitzenpegel der Sprache am nahen Ende im Digitalsignal am nahen Ende einen Ziel-Spitzenpegel nicht übersteigt, und wobei der Verstärkungssteuerungsprozessor (160) die Abschätzung von dem Spitzenpegel der Sprache am nahen Ende lediglich dann aktualisiert, wenn das Digitalsignal am nahen Ende Sprache enthält und das Digitalsignal am weiteren Ende keine Sprache enthält.
  11. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 10, bei welcher der Verstärkungssteuerungsprozessor (160) die Abschätzung des Spitzenpegels der Sprache am nahen Ende am Ende von jedem von einem Ablauf von Abtastblöcken eines Signals am nahen Ende aktualisiert.
  12. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 11, bei welcher der Verstärkungssteuerungsprozessor (160) die Abschätzung von dem Spitzenpegel der Sprache am nahen Ende als das Größte aus einer gewichteten Summe von einer vorherigen Abschätzung des Spitzenpegels der Sprache am nahen Ende, welche für einen vorherigen Abtastblock des Signals am nahen Ende und einem derzeitigen Sprachpegel am nahen Ende, welcher für einen derzeitigen Abtastblock des Signals am nahen Ende berechnet ist, erstellt ist, oder der derzeitige Sprachpegel am nahen Ende, welcher für den derzeitigen Abtastblock des Signals am nahen Ende berechnet ist, aktualisiert.
  13. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 1, bei welcher der Verstärkungssteuerungsprozessor (160) die analoge Verstärkung, welche an das Analogsignal am nahen Ende angelegt ist, basierend auf einer Bestimmung darüber einstellt, ob das Digitalsignal am nahen Ende gesättigt ist.
  14. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 13, bei welcher die Bestimmung darüber, ob das Digitalsignal am nahen Ende gesättigt ist, am Ende von jedem von einem Ablauf von Abtastblöcken des Signals am nahen Ende durchgeführt wird.
  15. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 13, bei welcher der Verstärkungssteuerungsprozessor (160) dazu angepasst ist, die analoge Verstärkung, welche an das Analogsignal am nahen Ende angelegt ist, zu verringern, wenn das Digitalsignal am nahen Ende gesättigt ist.
  16. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 1, bei welcher der Verstärkungssteuerungsprozessor (160) dazu angepasst ist, die Abschätzung des mittleren Pegels der Sprache am nahen Ende zu aktualisieren, um Rauschen im Digitalsignal am nahen Ende zu kompensieren.
  17. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 1, bei welcher der Verstärkungssteuerungsprozessor (160) dazu konfiguriert ist, um die Einstellungen von der analogen Verstärkung, welche an das Analogsignal am nahen Ende angelegt ist, welches vom Mikrophon empfangen wird, an einen adaptiven Echolöscher zu melden, wodurch es dem Echolöscher ermöglicht wird, unmittelbar adaptive Filterkoeffizienten einzustellen.
  18. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 17, bei welcher digitale Abtastungen des Digitalsignals am nahen Ende in einem Puffer gespeichert sind, wobei der Verstärkungssteuerungsprozessor (160) dazu konfiguriert ist, auf gespeicherten Abtastungen von dem Digitalsignal am nahen Ende zu arbeiten, und wobei der Verstärkungssteuerungsprozessor (160) dazu konfiguriert ist, Verzögerungen zu kompensieren, indem die analoge Verstärkung, welche an das Analogsignal am nahen Ende angewendet wird, welches von dem Mikrophon (110) empfangen wird, eingestellt wird, wenn die Verstärkungs-Einstellungen an den Echolöscher gemeldet werden.
  19. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 1, bei welcher der Verstärkungssteuerungsprozessor (160) dazu konfiguriert ist, seine Ausgabe an einen adaptiven Rauschunterdrücker zu senden, welcher Rauschunterdrückungs-Algorithmen an die Ausgabe des Verstärkungssteuerungsprozessors (160) anwendet.
  20. Adaptive Verstärkungssteuerungsanordnung nach Anspruch 1, bei welcher der Verstärkungssteuerungsprozessor (160) dazu konfiguriert ist, um die analoge Verstärkung, welche an das Analogsignal am nahen Ende angelegt ist, welches von dem Mikrophon (110) empfangen wird, basierend auf der Abschätzung des mittleren Pegels von der Sprache am nahen Ende, und zumindest einer aus einer Abschätzung des Spitzenpegels der Sprache am nahen Ende und einer Bestimmung darüber, ob das Digitalsignal am nahen Ende gesättigt ist, einzustellen.
  21. Verfahren zur adaptiven Steuerung, über eine Software-Steuerung, von einer analogen Verstärkung eines einstellbaren Verstärkers (130) in einem Kommunikationssystem, bei welchem ein Analogsignal am nahen Ende, welches Sprache am nahen Ende von zumindest einem Benutzer am nahen Ende enthält, über ein Mikrophon (110) empfangen wird, durch den einstellbaren Verstärker (130) durch Anwenden der analogen Verstärkung verstärkt wird und in ein Digitalsignal am nahen Ende durch einen Analog-zu-Digital-Umwandler (140) umgewandelt wird, und wobei ein Digitalsignal am weiteren Ende, welches Sprache am weiteren Ende enthält, durch einen Digital-zu-Analog-Umwandler (145) in ein Analogsignal am weiteren Ende umgewandelt wird, welches an einem Lautsprecher (120) empfangen wird, und durch den Lautsprecher (120) an den zumindest einen Benutzer am nahen Ende weitergegeben wird, wobei das Verfahren die Schritte enthält: Bestimmen, durch einen Verstärkungssteuerungsprozessor (160), von einer Abschätzung des mittleren Pegels der Sprache am nahen Ende in dem Digitalsignal am nahen Ende; Messen, lediglich auf dem Digitalsignal am nahen Ende, durch einen ersten Sprachaktivitäts-Erfasser (150), um zu bestimmen, ob das Digitalsignal am nahen Ende Sprache enthält; Messen, lediglich auf dem Digitalsignal am weiteren Ende, durch einen zweiten Sprachaktivitäts-Erfasser (155), um zu bestimmen, ob das Digitalsignal am weiteren Ende Sprache enthält; Empfangen, in dem Verstärkungssteuerungsprozessor (160), von Anzeigen von dem ersten (150) und zweiten (155) Sprachaktivitäts-Erfasser, welche anzeigen, ob das Digitalsignal am nahen Ende und das Digitalsignal am weiteren Ende Sprache enthalten; Aktualisieren, durch den Verstärkungssteuerungsprozessor (160), von der Abschätzung von dem mittleren Pegel von Sprache am nahen Ende lediglich dann, wenn das Digitalsignal am nahen Ende Sprache enthält und das Digitalsignal am weiteren Ende keine Sprache enthält; Einstellen, durch den Verstärkungssteuerungsprozessor (160), der analogen Verstärkung in Abhängigkeit von einem Vergleich von der Abschätzung des mittleren Pegels der Sprache am nahen Ende mit dem gezielten mittleren Pegel; Anlegen, durch den einstellbaren Verstärker (130), von der analogen Verstärkung auf das Analogsignal am nahen Ende, um die Abschätzung von dem mittleren Pegel von der Sprache am nahen Ende auf den gezielten mittleren Pegel zu drücken; wobei der Schritt des Einstellens der analogen Verstärkung lediglich basierend auf Perioden durchgeführt wird, wenn das Digitalsignal am nahen Ende Sprache am nahen Ende enthält und das Digitalsignal am weiteren Ende keine Sprache enthält.
  22. Verfahren nach Anspruch 21, bei welchem der Schritt des Einstellens der analogen Verstärkung ferner die Schritte enthält: Bestimmen (220), ob das Digitalsignal am nahen Ende gesättigt ist; Verringern (230) der analogen Verstärkung, welche an das Analogsignal am nahen Ende angelegt ist, wenn das Digitalsignal am nahen Ende gesättigt ist; Vergleichen (250, 260) der Abschätzung des mittleren Pegels der Sprache am nahen Ende mit dem gezielten mittleren Pegel, wenn das Digitalsignal am nahen Ende nicht gesättigt ist; Verringern (230) der analogen Verstärkung, welche an das Analogsignal am nahen Ende angelegt ist, wenn die Abschätzung von dem mittleren Pegel von der Sprache am nahen Ende oberhalb des gezielten mittleren Pegels ist; Vergleichen (270) von einer Abschätzung des Spitzenpegels der Sprache am nahen Ende in dem Digitalsignal am nahen Ende mit einem gezielten Spitzenpegel, wenn die Abschätzung des mittleren Pegels der Sprache am nahen Ende unterhalb des gezielten mittleren Pegels ist; und Erhöhen (280) der analogen Verstärkung, welche an das Analogsignal am nahen Ende angelegt ist, lediglich dann, wenn die Abschätzung des Spitzenpegels der Sprache am nahen Ende unterhalb des gezielten Spitzenpegels ist.
  23. Verfahren nach Anspruch 21, bei welchem die Abschätzung des mittleren Pegels der Sprache am nahen Ende als eine gewichtete Summe von einer vorherigen Abschätzung von dem mittleren Pegel von der Sprache am nahen Ende und einem derzeitigen Sprachpegel am nahen Ende aktualisiert wird; wobei das Verfahren eine Balance zwischen einer Verstärkungsadaption und einer Systemstabilität bereitstellt.
  24. Verfahren nach Anspruch 21, wobei der Schritt des Aktualisierens ferner ein Aktualisieren der Abschätzung des mittleren Pegels der Sprache am nahen Ende am Ende von jedem aus einem Ablauf von Abtastblöcken des Signals am nahen Ende enthält.
  25. Verfahren nach Anspruch 24, bei welchem die Abschätzung des mittleren Pegels der Sprache am nahen Ende als eine gewichtete Summe von einer vorherigen Abschätzung des mittleren Pegels von der Sprache am nahen Ende, welche für einen vorherigen Abtastblock des Signals am nahen Ende erstellt ist, und einen derzeitigen Sprachpegel am nahen Ende, welcher für einen derzeitigen Abtastblock des Signals am nahen Ende berechnet ist, sanft aktualisiert wird.
  26. Verfahren nach Anspruch 25, bei welchem der Sprachpegel am nahen Ende für einen derzeitigen Abtastblock des Signals am nahen Ende als die Differenz zwischen einem mittleren Pegel von dem Digitalsignal am nahen Ende und einer Abschätzung des Rauschpegels am nahen Ende berechnet wird.
  27. Verfahren nach Anspruch 26, bei welchem die Abschätzung des Rauschpegels am nahen Ende während Perioden berechnet wird, bei welchen der erste und zweite Sprachaktivitäts-Erfasser anzeigen, dass weder Sprache am nahen Ende noch Sprache am weiteren Ende jeweils in dem Digitalsignal am nahen Ende und dem Digitalsignal am weiteren Ende vorliegen.
  28. Verfahren nach Anspruch 24, bei welchem der Ablauf von Abtastblöcken des Signals am nahen Ende gleich Sprachrahmen sind.
  29. Verfahren nach Anspruch 24, bei welchem der Schritt des Einstellens ferner alle einzelne Blöcke ein stufenförmiges Einstellen der analogen Verstärkung enthält.
  30. Verfahren nach Anspruch 29, bei welchem die Anzahl von Blöcken zwischen Einstellungen von der analogen Verstärkung über die Zeit variiert.
DE69937613T 1998-12-23 1999-12-07 Verfahren und vorrichtung zur adaptiven signalverstärkungssteuerung in kommunikationssystemen Expired - Lifetime DE69937613T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US219517 1994-03-29
US09/219,517 US20030091180A1 (en) 1998-12-23 1998-12-23 Adaptive signal gain controller, system, and method
PCT/SE1999/002288 WO2000039991A1 (en) 1998-12-23 1999-12-07 Methods and apparatus for adaptive signal gain control in communications systems

Publications (2)

Publication Number Publication Date
DE69937613D1 DE69937613D1 (de) 2008-01-03
DE69937613T2 true DE69937613T2 (de) 2008-10-23

Family

ID=22819594

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69937613T Expired - Lifetime DE69937613T2 (de) 1998-12-23 1999-12-07 Verfahren und vorrichtung zur adaptiven signalverstärkungssteuerung in kommunikationssystemen

Country Status (10)

Country Link
US (1) US20030091180A1 (de)
EP (1) EP1142288B1 (de)
JP (1) JP4204754B2 (de)
KR (1) KR20010099924A (de)
CN (1) CN1331883A (de)
AU (1) AU2132100A (de)
CA (1) CA2356620A1 (de)
DE (1) DE69937613T2 (de)
TW (1) TW453098B (de)
WO (1) WO2000039991A1 (de)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6012027A (en) * 1997-05-27 2000-01-04 Ameritech Corporation Criteria for usable repetitions of an utterance during speech reference enrollment
WO2000079748A1 (en) * 1999-06-23 2000-12-28 At & T Wireless Services, Inc. Automatic gain control for ofdm receiver
EP1345336A1 (de) * 2002-03-11 2003-09-17 Alcatel Verfahren zur automatischen Verstärkungsregelung fur Echo-Dämpfung
JP2003280691A (ja) * 2002-03-19 2003-10-02 Sanyo Electric Co Ltd 音声処理方法および音声処理装置
US7092514B2 (en) 2003-02-27 2006-08-15 Telefonaktiebolaget Lm Ericsson (Publ) Audibility enhancement
US20060062407A1 (en) * 2004-09-22 2006-03-23 Kahan Joseph M Sound card having feedback calibration loop
CN100369113C (zh) * 2004-12-31 2008-02-13 中国科学院自动化研究所 利用增益自适应提高语音识别率的方法
US20060217066A1 (en) * 2005-03-25 2006-09-28 Siemens Communications, Inc. Wireless microphone system
EP1729410A1 (de) * 2005-06-02 2006-12-06 Sony Ericsson Mobile Communications AB Vorrichtung und Verfahren zur Verstärkungsregelung eines Audiosignals
FR2888458A1 (fr) * 2005-07-11 2007-01-12 France Telecom Procede et dispositif de prise de son, notamment dans des terminaux telephoniques en "mains libres"
GB2437570B (en) * 2006-04-26 2010-04-07 Zarlink Semiconductor Inc Automatic gain control for mobile microphone
US8135148B2 (en) 2006-04-26 2012-03-13 Microsemi Semiconductor Corp. Automatic gain control for mobile microphone
JP2008172484A (ja) * 2007-01-11 2008-07-24 Pioneer Electronic Corp ハンズフリー装置
CN101067927B (zh) * 2007-04-19 2010-11-10 北京中星微电子有限公司 音量调整方法及装置
FR2966671A1 (fr) * 2010-10-22 2012-04-27 France Telecom Stabilisation de gain d'amplification d'un signal de microphone dans un equipement de telephonie.
CN102904538B (zh) * 2012-10-10 2015-02-04 华平信息技术股份有限公司 音频模拟信号的agc增益参数调整方法
TWI505724B (zh) * 2013-06-10 2015-10-21 Princeton Technology Corp 增益控制系統、聲音播放系統及其增益控制之方法
GB2547459B (en) * 2016-02-19 2019-01-09 Imagination Tech Ltd Dynamic gain controller
US11223716B2 (en) * 2018-04-03 2022-01-11 Polycom, Inc. Adaptive volume control using speech loudness gesture
CN108900171A (zh) * 2018-07-23 2018-11-27 上海亮牛半导体科技有限公司 一种适配零中频射频接收机的agc装置和方法
EP4165864A4 (de) 2020-06-10 2024-03-20 QUALCOMM Incorporated Audioverstärkungsauswahl
US20230412727A1 (en) * 2022-06-20 2023-12-21 Motorola Mobility Llc Adjusting Transmit Audio at Near-end Device Based on Background Noise at Far-end Device

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4700382A (en) * 1986-03-03 1987-10-13 American Telephone And Telegraph Company, At&T Information Systems, Inc. Voice-switched telephone circuit with center idle state
US5357567A (en) * 1992-08-14 1994-10-18 Motorola, Inc. Method and apparatus for volume switched gain control
US5668871A (en) * 1994-04-29 1997-09-16 Motorola, Inc. Audio signal processor and method therefor for substantially reducing audio feedback in a cummunication unit
JP2928130B2 (ja) * 1995-04-19 1999-08-03 埼玉日本電気株式会社 ハンズフリー通信装置
US5646990A (en) * 1995-09-21 1997-07-08 Rockwell International Corporation Efficient speakerphone anti-howling system

Also Published As

Publication number Publication date
CA2356620A1 (en) 2000-07-06
DE69937613D1 (de) 2008-01-03
TW453098B (en) 2001-09-01
EP1142288B1 (de) 2007-11-21
CN1331883A (zh) 2002-01-16
JP2002534849A (ja) 2002-10-15
EP1142288A1 (de) 2001-10-10
KR20010099924A (ko) 2001-11-09
US20030091180A1 (en) 2003-05-15
AU2132100A (en) 2000-07-31
WO2000039991A1 (en) 2000-07-06
JP4204754B2 (ja) 2009-01-07

Similar Documents

Publication Publication Date Title
DE69937613T2 (de) Verfahren und vorrichtung zur adaptiven signalverstärkungssteuerung in kommunikationssystemen
EP0742664B1 (de) Freisprechverfahren für ein mehrkanaliges Übertragungssystem
DE60108401T2 (de) System zur erhöhung der sprachqualität
DE60031354T2 (de) Geräuschunterdrückung vor der Sprachkodierung
DE69024877T2 (de) Anordnung zur Echoverarbeitung, insbesondere akustisch, für Fernsprechleitung
DE68916218T2 (de) Rechnergesteuerter anpassungsfähiger Lautfernsprecher.
DE60203282T2 (de) Telefongerät
DE69612701T2 (de) Echokompensation mit adaptivem filter im frequenzbereich
DE69512540T2 (de) Verfahren und Einrichtung zur Analyse eines Echosignals und adaptiver Echokompensator welcher diese anwendet
DE69627359T2 (de) Verbesserter echokompensator mit anwendung in der digitalen telefonie
DE69634841T2 (de) Verfahren und Vorrichtung zur Echokompensation
DE68916219T2 (de) Schallabgleichungsanordnung für einen sprachumschaltbaren Lautfernsprecher.
EP1103956B1 (de) Exponentielle Echo- und Geräuschabsenkung in Sprachpausen
DE60310560T2 (de) Echoverarbeitungseinrichtungen für einkanalige oder mehrkanalige kommunikationssysteme
DE19806015C2 (de) Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen
DE19805942C1 (de) Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen
DE68916220T2 (de) Rechnergesteuerter Lautfernsprecher für Fernsprechleitungsanpassung.
EP0797339B1 (de) Verfahren und Schaltungsanordnung zur Verbesserung der Übertragungseigenschaften einer echobehafteten Übertragungsstrecke in einem Telekommunikationsnetz
DE10000009A1 (de) Verfahren zur koordinierten Echo- und/oder Geräuschabsenkung
DE69132988T2 (de) Verfahren für aktive rückkopplunglsunterdrückung
DE69433659T2 (de) Vorrichtung und Verfahren zur Echo-Dämpfung
EP0592787A1 (de) Verfahren zum Verbessern der akustischen Rückhördämpfung von elektroakustischen Anlagen
DE4111820C2 (de)
DE2633394C2 (de) Schaltungsanordnung zum Kompensieren der akustischen Rückkopplung
DE3839627C2 (de) Fernsprechendgerät

Legal Events

Date Code Title Description
8364 No opposition during term of opposition