DE69917677T2 - SPRACHKODIERUNG MIT VERäNDERBAREM KOMFORT-RAUSCHEN FüR VERBESSERTER WIEDERGABEQUALITäT - Google Patents

SPRACHKODIERUNG MIT VERäNDERBAREM KOMFORT-RAUSCHEN FüR VERBESSERTER WIEDERGABEQUALITäT Download PDF

Info

Publication number
DE69917677T2
DE69917677T2 DE69917677T DE69917677T DE69917677T2 DE 69917677 T2 DE69917677 T2 DE 69917677T2 DE 69917677 T DE69917677 T DE 69917677T DE 69917677 T DE69917677 T DE 69917677T DE 69917677 T2 DE69917677 T2 DE 69917677T2
Authority
DE
Germany
Prior art keywords
background noise
noise parameter
variability
parameter
values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69917677T
Other languages
English (en)
Other versions
DE69917677D1 (de
Inventor
Erik Ekudden
Roar Hagen
Ingemar Johansson
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=26807080&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE69917677(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of DE69917677D1 publication Critical patent/DE69917677D1/de
Application granted granted Critical
Publication of DE69917677T2 publication Critical patent/DE69917677T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Noise Elimination (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

  • Diese Anmeldung beansprucht die Priorität unter 35 USC 119(e)(1) einer gleichzeitig anhängigen vorläufigen US-Anmeldung Nr. 60/109,555, eingereicht am 23. November 1998.
  • GEBIET DER ERFINDUNG
  • Die Erfindung betrifft allgemein eine Sprachcodierung, und insbesondere eine Sprachcodierung, bei welcher während Perioden einer Sprachinaktivität ein künstliches Hintergrundrauschen erzeugt wird.
  • HINTERGRUND DER ERFINDUNG
  • Sprachcodierer und -decodierer sind herkömmlich jeweils in Funksendern und Funkempfängern vorgesehen und kooperieren zum Zulassen von Sprachkommunikationen zwischen einem gegebenen Sender und Empfänger über eine Funkverbindung. Die Kombination aus einem Sprachcodierer und einem Sprachdecodierer wird oft Sprach-Codec genannt. Ein Mobilfunktelefon (z. B. ein zellulares Telefon) ist ein Beispiel für eine herkömmliche Kommunikationsvorrichtung, die typischerweise einen Funksender mit einem Sprachcodierer und einen Funkempfänger mit einem Sprachdecodierer enthält.
  • Bei herkömmlichen blockbasierenden Sprachcodierern wird das ankommende Sprachsignal in Blöcke aufgeteilt, die Frames genannt werden. Für allgemeine 4 kHz- Telefonierbandbreitenanwendungen sind typische Framelängen 20 ms oder 160 Abtastungen. Die Frames bzw. Datenübertragungsblöcke sind weiter in Unterframes unterteilt, die typischerweise eine Länge von 5 ms oder 40 Abtastungen haben.
  • Herkömmliche lineare Vorhersage-Analyse-durch-Synthese-(LPAS)-Codierer verwenden spracherzeugungsbezogene Modelle. Aus dem eingegebenen Sprachsignal werden Modellparameter extrahiert, die den Stimmtrakt, die Tonhöhe, etc. beschreiben. Parameter, die sich langsam ändern, werden typischerweise für jeden Frame berechnet. Beispiele für solche Parameter enthalten die STP-(Kurzzeitvorhersage-)Parameter, die den Stimmtrakt in der Vorrichtung beschreiben, der die Sprache erzeugte. Ein Beispiel für STP-Parameter sind lineare Vorhersagekoeffizienten (LPC), die die spektrale Form des eingegebenen Sprachsignals darstellen. Beispiele für Parameter, die sich schneller ändern, enthalten die Tonhöhen- und Innovations-Form/Verstärkungs-Parameter, die typischerweise für jeden Unterframe berechnet werden.
  • Die extrahierten Parameter werden unter Verwendung geeigneter wohlbekannter skalarer und vektorieller Quantisierungstechniken quantisiert. Die STP-Parameter, wie beispielsweise die linearen Vorhersagekoeffizienten, werden oft zu einer Darstellung transformiert, die besser zur Quantisierung geeignet ist, wie beispielsweise Linienspektrumsfrequenzen (LSFs). Nach einer Quantisierung werden die Parameter über den Kommunikationskanal zum Decodierer übertragen.
  • Bei einem herkömmlichen LPAS-Decodierer wird allgemein das Gegenteil vom Obigen durchgeführt, und das Sprachsignal wird synthetisiert. Nachfilterungstechniken werden normalerweise auf das synthetisierte Sprachsignal angewendet, um die wahrgenommene Qualität zu verbessern.
  • Für viele allgemeine Hintergrundrauschtypen liefert eine viel niedrigere Bitrate, als sie für eine Sprache nötig ist, ein Modell des Signals, das gut genug ist. Existierende Mobilfunksysteme verwenden diese Tatsache durch entsprechendes Einstellen der übertragenen Bitrate während eines Hintergrundrauschens. Bei herkömmlichen Systemen, die kontinuierliche Übertragungstechniken verwenden, kann ein Sprachcodierer mit variabler Rate (VR) seine niedrigste Bitrate verwenden. Bei herkömmlichen diskontinuierlichen Übertragungs-(DTX)-Schemen stoppt der Sender ein Senden codierter Sprachframes, wenn der Lautsprecher inaktiv ist. In regelmäßigen oder unregelmäßigen Intervallen (typischerweise alle 500 ms) sendet der Sender Sprachparameter, die für eine Erzeugung eines Komfortrauschens im Decodierer geeignet sind. Diese Parameter für eine Komfortrauscherzeugung (CNG) werden herkömmlich in etwas codiert, was manchmal stille Deskriptor-(SID)-Frames genannt wird. Beim Empfänger verwendet der Decodierer die Komfortrauschparameter, die in den SID-Frames empfangen werden, um mittels eines herkömmlichen Algorithmus zur Einspeisung eines Komfortrauschens (CNI) ein künstliches Rauschen zu synthetisieren.
  • Wenn ein Komfortrauschen im Decodierer in einem herkömmlichen DTX-System erzeugt wird, wird das Rauschen oft derart wahrgenommen, dass es sehr statisch und sehr unterschiedlich vom Hintergrundrauschen ist, das in einem aktiven (keinem DTX) Mode erzeugt wird. Der Grund für diese Wahrnehmung besteht darin, dass DTX SID-Frames nicht so oft zum Empfänger gesendet werden, wie normale Sprachframes. Bei LPAS-Codecs mit einem DTX-Mode werden das Spektrum und die Energie des Hintergrundrauschens typischerweise über mehrere Frames geschätzt (beispielsweise wird ein Durchschnitt gebildet), und die geschätzten Parameter werden quantisiert und über den Kanal zum Decodierer übertragen. 1 stellt einen beispielhaften Komfortrauschcodierer nach dem Stand der Technik dar, der die vorgenannten geschätzten Hintergrundrausch-(Komfortrausch)-Parameter erzeugt. Die quantisierten Komfortrauschparameter werden typischerweise alle 100 bis 500 ms gesendet.
  • Der Vorteil eines Sendens von SID-Frames mit einer niedrigen Aktualisierungsrate anstelle eines Sendens von regulären Sprachframes ist zweifach. Die Batterielebensdauer in beispielsweise einem Mobilfunktransceiver wird aufgrund eines niedrigeren Energieverbrauchs verlängert, und die durch den Sender erzeugte Interferenz wird erniedrigt, um dadurch eine höhere Systemkapazität zur Verfügung zu stellen.
  • Bei einem herkömmlichen Decodierer können die Komfortrauschparameter empfangen und decodiert werden, wie es in 2 gezeigt ist. Weil der Decodierer keine neuen Komfortrauschparameter so oft empfängt, wie er normalerweise Sprachparameter empfängt, werden die Komfortrauschparameter, die in den SID-Frames empfangen werden, typischerweise bei 23 interpoliert, um eine stetige Entwicklung der Parameter bei der Komfortrauschsynthese zur Verfügung zu stellen. Bei der Syntheseoperation, die allgemein bei 25 gezeigt ist, gibt der Decodierer zum Synthesefilter 27 eine verstärkungsskalierte Zufallsrausch-(z. B. weißes Rauschen)-Erregung und die interpolierten Spektrumsparameter ein. Als Ergebnis wird das erzeugte Komfortrauschen sc(n) ungeachtet dessen als äußerst stationär ("statisch") wahrgenommen werden, ob sich das Hintergrundrauschen s(n) an dem Codiererende (siehe 1) bezüglich des Charakters ändert. Dieses Problem wird bei Hintergründen mit starker Variabilität deutlich, wie beispielsweise bei Straßenrauschen und Geplapper (z. B. Restaurantrauschen), ist aber auch in Situationen eines Rauschens von Autos vorhanden.
  • EP 0 843 301 beschreibt die Verwendung von RESC-Parametern (für eine spektrale Steuerung einer Zufallserregung) auf der Empfängerseite zum Modifizieren der Zufallserregung, so dass der Spektralgehalt des erzeugten Komfortrauschens genauer mit dem Hintergrundrauschen übereinstimmt.
  • Ein herkömmlicher Ansatz zum Lösen dieses Problems eines "statischen" Komfortrauschens besteht einfach im Erhöhen der Aktualisierungsrate von DTX-Komfortrauschparametern (z. B. im Verwenden einer höheren SID-Framerate). Beispielhafte Probleme bei dieser Lösung bestehen darin, dass sich ein Batterieverbrauch (z. B. in einem Mobilfunktransceiver) erhöhen wird, weil der Sender sehr oft betrieben werden muss, und sich die Systemkapazität aufgrund der erhöhten SID-Framerate erniedrigen wird. Somit ist es bei herkömmlichen Systemen normal, das statische Hintergrundrauschen zu akzeptieren.
  • Es ist daher wünschenswert, die vorgenannten Nachteile zu vermeiden, die zu einer herkömmlichen Komfortrauscherzeugung gehören.
  • Gemäß der Erfindung, wie sie durch die beigefügten unabhängigen Ansprüche definiert ist, werden herkömmlich erzeugte Komfortrauschparameter basierend auf Eigenschaften eines aktuellen Hintergrundrauschens modifiziert, das beim Codierer erfahren wird. Aus den modifizierten Parametern erzeugtes Komfortrauschen wird als weniger statisch als herkömmlich erzeugtes Komfortrauschen wahrgenommen, und ähnlicher dem aktuellen Hintergrundrauschen, das beim Codierer erfahren wird.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 stellt diagrammmäßig die Erzeugung von Komfortrauschparametern in einem herkömmlichen Sprachcodierer dar.
  • 2 stellt diagrammmäßig die Erzeugung eines Komfortrauschens in einem herkömmlichen Sprachcodierer dar.
  • 3 stellt einen Komfortrauschparametermodifizierer zur Verwendung beim Erzeugen eines Komfortrauschens gemäß der Erfindung dar.
  • 4 stellt ein beispielhaftes Ausführungsbeispiel des Modifizierers der 3 dar.
  • 5 stellt ein beispielhaftes Ausführungsbeispiel der Variabilitätsschätzeinheit der 4 dar.
  • 5A stellt eine beispielhafte Steuerung des AUSWAHL-Signals der 5 dar.
  • 6 stellt ein beispielhaftes Ausführungsbeispiel des Modifizierers der 35 dar, wobei die Variabilitätsschätzeinheit der 5 teilweise im Codierer und teilweise im Decodierer vorgesehen ist.
  • 7 stellt beispielhafte Operationen dar, die durch den Modifizierer der 36 durchgeführt werden können.
  • 8 stellt ein Beispiel des Schätzschritts der 7 dar.
  • 9 stellt ein Sprachkommunikationssystem dar, bei welchem die Modifiziererausführungsbeispiele der 38 implementiert sein können.
  • DETAILLIERTE BESCHREIBUNG
  • 3 stellt einen Komfortrauschparametermodifizierer 30 zum Modifizieren von Komfortrauschparametern gemäß der Erfindung dar. Bei dem Beispiel der 3 empfängt der Modifizierer 30 am Eingang 33 die herkömmlichen interpolierten Komfortrauschparameter, wie beispielsweise die Spektrums- und Energieparameter, die vom Interpolierer 23 der 2 ausgegeben werden. Der Modifizierer 30 empfängt auch am Eingang 31 Spektrums- und Energieparameter, die zu einem Hintergrundrauschen gehören, das beim Codierer erfahren wird. Der Modifizierer 30 modifiziert die empfangenen Komfortrauschparameter basierend auf den Hintergrundrauschparametern, die bei 31 empfangen werden, um modifizierte Komfortrauschparameter bei 35 zu erzeugen. Die modifizierten Komfortrauschparameter können dann beispielsweise zum Komfortrausch-Syntheseabschnitt 25 der 2 zur Verwendung bei herkömmlichen Komfortrausch-Syntheseoperationen geliefert werden. Die bei 35 zur Verfügung gestellten modifizierten Komfortrauschparameter lassen zu, dass der Syntheseabschnitt 25 ein Komfortrauschen erzeugt, das das aktuelle Hintergrundrauschen, das dem Sprachcodierer präsentiert wird, genauer reproduziert bzw. wiedergibt.
  • 4 stellt ein beispielhaftes Ausführungsbeispiel des Komfortrauschparametermodifizierers 30 der 3 dar. Der Modifizierer 30 enthält eine Variabilitätsschätzeinheit 41, die mit dem Eingang 31 gekoppelt ist, um die Spektrums- und Energieparameter des Hintergrundrauschens zu empfangen. Die Variabilitätsschätzeinheit 41 schätzt Variabilitätscharakteristiken der Hintergrundrauschparameter und gibt bei 43 Information aus, die die Variabilität der Hintergrundrauschparameter anzeigt. Die Variabilitätsinformation kann die Variabilität des Parameters um dessen Mittelwert charakterisieren, wie beispielsweise die Varianz des Parameters, oder die maximale Abweichung des Parameters von seinem Mittelwert.
  • Die Variabilitätsinformation bei 43 kann auch Korrelationseigenschaften, die Evolution bzw. Entwicklung des Parameters im Verlaufe der Zeit oder andere Maße für die Variabilität des Parameters im Laufe der Zeit anzeigen. Beispiele für Information für eine zeitliche Variabilität enthalten einfache Maße, wie beispielsweise die Änderungsrate des Parameters (schnelle oder langsame Änderungen), die Varianz des Parameters, die maximale Abweichung vom Mittelwert, andere statistische Maße, die die Variabilität des Parameters charakterisieren, und höher entwickelte Maße, wie beispielsweise Autokorrelationseigenschaften, und Filterkoeffizienten eines aus dem Parameter geschätzten autoregressiven (AR) Vorhersagewerts. Ein Beispiel für ein einfaches Maß einer Änderungsrate ist ein Zählen der Nulldurchgangsrate, d. h. der Anzahl von Malen, für welche sich das Vorzeichen des Parameters ändert, wenn man vom ersten Parameterwert zum letzten Parameterwert in der Folge von Parameterwerten schaut. Die bei 43 von der Schätzeinheit 41 ausgegebene Information wird zu einem Kombinierer 45 eingegeben, der die Ausgangsinformation bei 43 mit den bei 33 empfangenen interpolierten Komfortrauschparametern kombiniert, um die modifizierten Komfortrauschparameter bei 35 zu erzeugen.
  • 5 stellt ein beispielhaftes Ausführungsbeispiel der Variabilitätsschätzeinheit 41 der 4 dar. Die Schätzeinheit der 5 enthält eine Bestimmungseinheit 51 für eine mittlere Variabilität, die mit dem Eingang 31 gekoppelt ist, zum Empfangen der Spektrums- und Energieparameter des Hintergrundrauschens. Die Bestimmungseinheit 51 für eine mittlere Variabilität kann Charakteristiken für eine mittlere Variabilität bestimmen, wie es oben beschrieben ist. Beispielsweise dann, wenn der Hintergrundrauschpuffer 37 der 3 8 Frames und 32 Unterframes enthält, kann die Variabilität der gepufferten Spektrums- und Energieparameter wie folgt analysiert werden. Der Mittel-(oder Durchschnitts-)Wert der gepufferten Spektrumsparameter kann berechnet (wie es herkömmlich in DTX-Codierern zum Erzeugen von SID-Frames durchgeführt wird) und von den gepufferten Spektrumsparameterwerten subtrahiert werden, um dadurch einen Vektor von spektralen Abweichungswerten zu ergeben. Gleichermaßen kann der mittlere Unterframewert der gepufferten Energieparameter berechnet werden (wie es herkömmlich in DTX-Codierern zum Erzeugen von SID-Frames durchgeführt wird), und dann von den gepufferten Unterframe-Energieparameterwerten subtrahiert werden, um dadurch einen Vektor von Energieabweichungswerten zu ergeben. Die Spektrums- und Energie-Abweichungsvektoren weisen somit Werte, von welchen ein Mittelwert entfernt ist, der Spektrums- und Energieparameter auf. Die Spektrums- und Energie-Abweichungsvektoren werden von der Variabilitäts-Bestimmungseinheit 51 über einen Kommunikationspfad 52 zu einer Abweichungsvektor-Speichereinheit 55 kommuniziert.
  • Eine Koeffizienten-Berechnungseinheit 53 ist auch mit dem Eingang 31 gekoppelt, um die Hintergrundrauschparameter zu empfangen. Die beispielhafte Koeffizienten-Berechnungseinheit 53 ist betreibbar, um herkömmliche AR-Abschätzungen über die jeweiligen Spektrums- und Energieparameter durchzuführen. Die Filterkoeffizienten, die aus den AR-Abschätzungen resultieren, werden von der Koeffizienten-Berechnungseinheit 53 über einen Kommunikationspfad 54 zu einem Filter 57 kommuniziert. Die bei 53 berechneten Filterkoeffizienten können beispielsweise jeweilige Allpolfilter für die Spektrums- und Energieparameter definieren.
  • Bei einem Ausführungsbeispiel führt die Koeffizienten-Berechnungseinheit 53 AR-Abschätzungen erster Ordnung für sowohl die Spektrums- als auch die Energieparameter durch, was Filterkoeffizienten al = Rxx(1)/Rxx(0) für jeden Parameter auf herkömmliche Weise berechnet. Rxx(0)- und Rxx(1)-Werte sind herkömmliche Autokorrelationswerte des bestimmten Parameters:
  • Figure 00070001
  • In diesen Rxx-Berechnungen stellt x den Hintergrundrausch-(z. B. Spektrums- oder Energie-)Parameter dar. Ein positiver Wert von al zeigt allgemein an, dass sich der Parameter langsam ändert, und ein negativer Wert zeigt allgemein eine schnelle Veränderung an.
  • Gemäß einem Ausführungsbeispiel kann für jeden Frame der Spektrumsparameter und für jeden Unterframe der Energieparameter eine Komponente x(k) aus dem entsprechenden Abweichungsvektor beispielsweise zufällig ausgewählt (über einen AUSWAHL-Eingang der Speichereinheit 55) und durch das Filter 57 unter Verwendung der entsprechenden Filterkoeffizienten gefiltert werden. Die Ausgabe aus dem Filter wird dann durch einen konstanten Skalierungsfaktor über eine Skalierungsvorrichtung 59, wie beispielsweise einen Multiplizierer, skaliert. Die skalierte Ausgabe, die in 5 als xp(k) bezeichnet ist, wird zum Eingang 53 des Kombinierers 45 der 9 geliefert.
  • Bei einem Ausführungsbeispiel, das diagrammmäßig in 5A dargestellt ist, ist eine Bestimmungseinheit 50 für eine Nulldurchgangsrate bei 31 gekoppelt, um die gepufferten Parameter bei 37 zu empfangen. Die Bestimmungseinheit 50 bestimmt die jeweiligen Nulldurchgangsraten der Spektrums- und Energieparameter. Das bedeutet, dass für die Folge von Energieparametern, die bei 37 gepuffert sind, und auch für die Folge von Spektrumsparametern, die bei 37 gepuffert sind, die Bestimmungseinheit 50 für eine Nulldurchgangsrate die Anzahl von Malen in der jeweiligen Sequenz bestimmt, für welche sich das Vorzeichen des zugehörigen Parameterwerts ändert, wenn man vom ersten Parameterwert zum letzten Parameterwert in der gepufferten Sequenz bzw. Folge schaut. Diese Information über eine Nulldurchgangsrate kann dann bei 56 zum Steuern des AUSWAHL-Signals der 5 verwendet werden.
  • Beispielsweise kann das AUSWAHL-Signal für einen gegebenen Abweichungsvektor gesteuert werden, um Komponenten x(k) des Abweichungsvektors relativ häufiger (so oft wie für jeden Frame oder jeden Unterframe) zufällig auszuwählen, wenn die zu diesem Parameter gehörende Nulldurchgangsrate relativ hoch ist (was eine relativ hohe Parametervariabilität anzeigt), und um Komponenten x(k) des Abweichungsvektors relativ weniger häufig (z. B. weniger oft als für jeden Frame oder Unterframe) zufällig auszuwählen, wenn die zugehörige Nulldurchgangsrate relativ niedrig ist (was eine relativ niedrige Parametervariabilität anzeigt). Bei anderen Ausführungsbeispielen kann die Häufigkeit einer Auswahl der Komponenten x(k) eines gegebenen Abweichungsvektors auf einen vorbestimmten, gewünschten Wert eingestellt werden.
  • Der Kombinierer der 4 arbeitet zum Kombinieren der skalierten Ausgabe xp(k) mit den herkömmlichen Komfortrauschparametern. Das Kombinieren wird auf einer Frame-Basis für spektrale Parameter durchgeführt, und auf einer Unterframe-Basis für Energieparameter. Bei einem Beispiel kann der Kombinierer 45 ein Addierer sein, der einfach das Signal xp(k) zu den herkömmlichen Komfortrauschparametern addiert. Die skalierte Ausgabe xp(k) der 5 kann somit derart angesehen werden, dass es ein Störsignal ist, das durch den Kombinierer 45 zum Stören der herkömmlichen Komfortrauschparameter verwendet wird, die bei 33 empfangen werden, um die modifizierten (oder gestörten) Komfortrauschparameter zu erzeugen, die zu dem Komfortrausch-Syntheseabschnitt 25 einzugeben sind (siehe 24).
  • Der herkömmliche Komfortrausch-Syntheseabschnitt 25 kann die gestörten Komfortrauschparameter auf herkömmliche Weise verwenden. Aufgrund der Störung der herkömmlichen Parameter wird das erzeugte Komfortrauschen eine semi-zufällige Variabilität aufweisen, die die wahrgenommene Qualität für veränderbarere Hintergründe, wie beispielsweise Geplapper und Straßenrauschen sowie für Autorauschen signifikant verbessert.
  • Das Störsignal xp(k) kann bei einem Beispiel wie folgt ausgedrückt werden: xp(k) = βx·(b0x·x(k) – a1x·γx·(xp(k – 1)),wobei βx ein Skalierungsfaktor ist, b0x und alx Filterkoeffizienten sind und γx ein Bandbreitenexpansionsfaktor ist.
  • Die gestrichelte Linie in 5 stellt ein Ausführungsbeispiel dar, bei welchem die Filteroperation weggelassen ist und das Störsignal xp(k) skalierte Abweichungsvektorkomponenten aufweist.
  • Bei einigen Ausführungsbeispielen ist der Modifizierer 30 der 35 völlig innerhalb des Sprachdecodierers vorgesehen (siehe 9) und bei anderen Ausführungsbeispielen ist der Modifizierer der 35 zwischen dem Sprachcodierer und dem Sprachdecodierer aufgeteilt (siehe gestrichelte Linien in 9). Bei Ausführungsbeispielen, bei welchen der Modifizierer 30 völlig im Decodierer vorgesehen ist, müssen die in 3 gezeigten Hintergrundrauschparameter als solches im Decodierer identifiziert werden. Dies kann durch Puffern einer erwünschten Menge (Frames oder Unterframes) der Spektrums- und Energieparameter, die vom Codierer über den Übertragungskanal empfangen werden, bei 37 erreicht werden. Bei einem DTX-Schema kann implizite Information, die herkömmlich im Decodierer verfügbar ist, dazu verwendet werden, zu entscheiden, wenn der Puffer 37 nur Parameter enthält, die zu einem Hintergrundrauschen gehören. Beispielsweise dann, wenn der Puffer 37 N Frames puffern kann und wenn N Frames eines Überhangs hinter Sprachsegmenten verwendet werden, bevor die Übertragung für einen DTX-Mode (wie es herkömmlich ist) unterbrochen wird, ist es für diese letzten N Frames vor dem Schalten zum DTX-Mode bekannt, dass sie nur Spektrums- und Energieparameter eines Hintergrundrauschens enthalten. Diese Hintergrundrauschparameter können dann durch den Modifizierer 30 verwendet werden, wie es oben beschrieben ist.
  • Bei Ausführungsbeispielen, bei welchen der Modifizierer 30 zwischen dem Codierer und dem Decodierer aufgeteilt ist, können die Bestimmungseinheit 51 für eine mittlere Variabilität und die Koeffizienten-Berechnungseinheit 53 im Codierer vorgesehen sein. Somit sind die Kommunikationspfade 52 und 54 bei solchen Ausführungsbeispielen analog zu dem herkömmlichen Kommunikationspfad, der zum Übertragen von herkömmlichen Komfortrauschparametern vom Codierer zum Decodierer verwendet wird (siehe 1 und 2). Genauer gesagt gehen, wie es bei einem Beispiel der 6 gezeigt ist, die Pfade 52 und 54 durch einen Quantisierer (siehe auch 1), zu einem Kommunikationskanal (siehe auch die 1 und 2) und einem entquantisierenden Abschnitt (siehe auch 2) zu der Speichereinheit 55 bzw. zu dem Filter 57 (siehe auch 5). Wohlbekannte Techniken zur Quantisierung von skalaren Werten sowie AR-Filterkoeffizienten können in Bezug auf die Information für eine mittlere Variabilität und die AR-Filterkoeffizienten verwendet werden.
  • Der Codierer weiß durch eine herkömmliche Einrichtung, wenn die Spektrums- und Energieparameter eines Hintergrundrauschens zur Verarbeitung durch die Bestimmungseinheit 51 für eine mittlere Variabilität und die Koeffizienten-Berechnungseinheit 53 verfügbar sind, weil dieselben Spektrums- und Energieparameter herkömmlich durch den Codierer verwendet werden, um herkömmliche Komfortrauschparameter zu erzeugen. Herkömmliche Codierer berechnen typischerweise eine Durchschnittsenergie und ein Durchschnittsspektrum über eine Anzahl von Frames, und diese Durchschnittsspektrums- und -energieparameter werden zum Decodierer als Komfortrauschparameter übertragen. Weil die Filterkoeffizienten von der Koeffizienten-Berechnungseinheit 53 und die Abweichungsvektoren von der Bestimmungseinheit 51 für eine mittlere Variabilität vom Codierer zum Decodierer über den Übertragungskanal übertragen werden müssen, wie es in 6 gezeigt ist, ist eine zusätzliche Bandbreite erforderlich, wenn der Modifizierer zwischen dem Codierer und dem Decodierer aufgeteilt ist. Gegensätzlich dazu ist dann, wenn der Modifizierer völlig im Decodierer vorgesehen ist, keine zusätzliche Bandbreite für seine Implementierung erforderlich.
  • 7 stellt die oben beschriebenen beispielhaften Operationen dar, die durch die Ausführungsbeispiele für einen Modifizierer der 35 durchgeführt werden können. Es wird bei 71 zuerst bestimmt, ob die verfügbaren Spektrums- und Energieparameter (z. B. im Puffer 37 der 3) zu einem Sprach- oder Hintergrundrauschen gehören. Wenn die verfügbaren Parameter zu einem Hintergrundrauschen gehören, dann werden Eigenschaften des Hintergrundrauschens, wie eine mittlere Variabilität und eine zeitliche Variabilität, bei 73 abgeschätzt. Danach werden die interpolierten Komfortrauschparameter bei 75 gemäß den geschätzten Eigenschaften des Hintergrundrauschens gestört. Der Störungsprozess bei 75 wird solange fortgesetzt, wie ein Hintergrundrauschen bei 77 erfasst wird. Wenn bei 77 eine Sprachaktivität erfasst wird, dann wird bei 71 auf eine Verfügbarkeit von weiteren Hintergrundrauschparametern gewartet.
  • 8 stellt beispielhafte Operationen dar, die während des Schätzschritts 73 der 7 durchgeführt werden können. Die Verarbeitung berücksichtigt N Frames und kN Unterframes bei 81, und zwar entsprechend den vorgenannten N gepufferten Frames. Bei einem Ausführungsbeispiel gilt N = 8 und k = 4. Ein Vektor von Spektrumsabweichungen mit N Komponenten wird bei 83 erhalten und ein Vektor von Energieabweichungen mit kn Komponenten wird bei 85 erhalten. Bei 87 wird eine Komponente aus jedem der Abweichungsvektoren ausgewählt (beispielsweise zufällig). Bei 85 werden Filterkoeffizienten berechnet und die ausgewählten Vektorkomponenten werden entsprechend gefiltert. Bei 88 werden die gefilterten Vektorkomponenten skaliert, um das Störsignal zu erzeugen, das bei 75 in 7 verwendet wird. Die gestrichelte Linie in 8 entspricht den Ausführungsbeispielen für eine gestrichelte Linie der 5, das heißt den Ausführungsbeispielen, bei welchen das Filtern weggelassen ist und skalierte Abweichungsvektorkomponenten als die Störparameter verwendet werden.
  • 9 stellt ein beispielhaftes Sprachkommunikationssystem dar, bei welchem die Ausführungsbeispiele für einen Komfortrauschparametermodifizierer der 38 implementiert werden können. Ein Sender XMTR enthält einen Sprachcodierer 91, der mit einem Sprachdecodierer 93 in einem Empfänger RCVR über einen Übertragungskanal 85 gekoppelt ist. Einer oder beide von dem Sender und dem Empfänger der 9 können ein Teil von beispielsweise einem Funktelefon oder einer anderen Komponente eines Funkkommunikationssystems sein. Der Kanal 95 kann beispielsweise einen Funkkommunikationskanal enthalten. Wie es in 9 gezeigt ist, können die Ausführungsbeispiele für einen Modifizierer der 38 im Decodierer implementiert sein, oder können zwischen dem Codierer und dem Decodierer aufgeteilt sein (siehe gestrichelte Linien), wie es oben in Bezug auf die 5 und 6 beschrieben ist.
  • Es wird Fachleuten auf dem Gebiet offensichtlich werden, dass die obigen Ausführungsbeispiele der 39 ohne weiteres beispielsweise durch geeignete Modifikationen bezüglich der Software, der Hardware oder von beiden in herkömmlichen Sprachcodecs implementiert werden können.
  • Die oben beschriebene Erfindung verbessert die Natürlichkeit eines Hintergrundrauschens (ohne zusätzliche Bandbreite oder Energiekosten bei einigen Ausführungsbeispielen). Dies lässt ein Umschalten zwischen Sprach- und Nichtsprachmoden in einem Sprachcodec übergangsloser und daher für das menschliche Ohr akzeptierbarer werden.
  • Obwohl beispielhafte Ausführungsbeispiele der vorliegenden Erfindung oben detailliert beschrieben worden sind, beschränkt dies nicht den Schutzumfang der Erfindung, die in einer Vielfalt von Ausführungsbeispielen ausgeführt werden kann.

Claims (31)

  1. Verfahren zum Erzeugen eines Komfortrauschens in einem Sprachdecodierer (93), der Sprach- und Rauschinformation von einem Kommunikationskanal (95) empfängt, einschließlich eines Lieferns einer Vielzahl von Komfortrausch-Parameterwerten (33), die normalerweise durch den Sprachdecodierer (93) verwendet werden, um ein Komfortrauschen zu erzeugen, und gekennzeichnet durch: Erhalten von Variabilitätsinformation (31), die eine Variabilität eines Hintergrundrauschparameters (37) anzeigt; in Reaktion auf die Variabilitätsinformation Modifizieren (30) der Komfortrausch-Parameterwerte (33), um modifizierte Komfortrausch-Parameterwerte (35) zu erzeugen; und Verwenden der modifizierten Komfortrausch-Parameterwerte (35), um ein Komfortrauschen (25) zu erzeugen, wobei die Variabilitätsinformation anzeigt, wie der Hintergrundrauschparameter in Bezug auf wenigstens einen eines Zeit- und eines Mittelwerts des Hintergrundrauschparameters variiert.
  2. Verfahren nach Anspruch 1, wobei der Hintergrundrauschparameter (37) ein Spektrumsparameter ist.
  3. Verfahren nach Anspruch 1, wobei der Hintergrundrauschparameter (37) ein Energieparameter ist.
  4. Verfahren nach Anspruch 1, wobei der Erhaltungsschritt ein Erhalten von Variabilitätsinformation (31) enthält, die eine Variabilität eines Hintergrundrauschspektrumsparameters und eines Hintergrundrauschenergieparameters enthält.
  5. Verfahren nach Anspruch 1, wobei der Erhaltungsschritt ein Berechnen aus einer Vielzahl von Werten des Hintergrundrauschparameters (37) eines Mittelwerts des Hintergrundrauschparameters (51) und ein Subtrahieren des Mittelwerts von jedem Wert für einen Hintergrundrauschparameter (37) enthält, um eine Vielzahl von Abweichungswerten (55) zu erzeugen.
  6. Verfahren nach Anspruch 5, wobei der Modifizierungsschritt ein beliebiges Auswählen der Abweichungswerte, ein Skalieren des beliebig ausgewählten Abweichungswerts durch einen Skalierungsfaktor zum Erzeugen eines skalierten Abweichungswerts und ein Kombinieren des skalierten Abweichungswerts mit einem der Komfortrausch-Parameterwerte (33) zum Erzeugen von einem der modifizierten Komfortrausch-Parameterwerte (35) enthält.
  7. Verfahren nach Anspruch 1, wobei der Sprachdecodierer (93) in einer Funkkommunikationsvorrichtung vorgesehen ist.
  8. Verfahren nach Anspruch 7, wobei der Sprachdecodierer (93) in einem zellularen Telefon vorgesehen ist.
  9. Verfahren nach Anspruch 1, wobei der Erhaltungsschritt enthält, dass der Sprachdecodierer (93) die Variabilitätsinformation (31) unabhängig von dem Kommunikationskanal (95) erhält.
  10. Verfahren nach Anspruch 1, wobei der Erhaltungsschritt enthält, dass der Sprachdecodierer (93) die Variabilitätsinformation (31) von einem Sprachcodierer (91) über den Kommunikationskanal (95) empfängt.
  11. Verfahren nach Anspruch 1, wobei die Variabilitätsinformation (31) eine mittlere Variabilitätsinformation enthält, die anzeigt, wie der Hintergrundrauschparameter relativ zu einem Mittelwert des Hintergrundrauschparameters (73) variiert.
  12. Verfahren nach Anspruch 11, wobei der Erhaltungsschritt ein Verwenden einer Vielzahl von Werten des Hintergrundrauschparameters (37) zum Berechnen eines Mittelwerts des Hintergrundrauschparameters (37) über eine Zeitperiode (51) und ein Vergleichen des Mittelwerts mit wenigstens einigen der Hintergrundrauschparameterwerte (37) zum Erzeugen von mittleren entfernten Werten des Hintergrundrauschparameters enthält.
  13. Verfahren nach Anspruch 12, wobei der Erhaltungsschritt ein Verwenden der Vielzahl von Werten des Hintergrundrauschparameters (37) zum Berechnen von Filterkoeffizienten (89) und ein Filtern von wenigstens einigen der mittleren entfernten Werte des Hintergrundrauschparameters (37) gemäß den Filterkoeffizienten enthält.
  14. Verfahren nach Anspruch 13, wobei der zuletzt angegebene Anwendungsschritt ein Berechnen von Filterkoeffizienten eines Autoregressions-Vorhersagefilters enthält.
  15. Verfahren nach Anspruch 11, wobei die Variabilitätsinformation (31) Zeitvariabilitätsinformation enthält, die anzeigt, wie der Hintergrundrauschparameter (37) über der Zeit variiert.
  16. Verfahren nach Anspruch 1, wobei die Variabilitätsinformation (31) Zeitvariabilitätsinformation enthält, die anzeigt, wie der Hintergrundrauschparameter mit der Zeit variiert.
  17. Vorrichtung zum Erzeugen von Komfortrauschparametern (33) zur Verwendung beim Erzeugen eines Komfortrauschens in einem Sprachdecodierer (93), der Sprach- und Rauschinformation von einem Kanal (95) empfängt, mit einem ersten Eingang (33) zum Liefern einer Vielzahl von Komfortrauschparameterwerten (33), die normalerweise durch den Sprachdecodierer (93) verwendet werden, um ein Komfortrauschen zu erzeugen, und einem zweiten Eingang (31) zum Liefern eines Hintergrundrauschparameters (37), und dadurch gekennzeichnet, dass sie weiterhin folgendes aufweist: einen Modifizierer (30), der mit dem ersten (33) und dem zweiten (31) Eingang gekoppelt ist und auf Variabilitätscharakteristiken des Hintergrundrauschparameters (51) zum Modifizieren der Komfortrauschparameterwerte (33) zum Erzeugen von modifizierten Komfortrauschparameterwerten (30) reagiert; und einen Ausgang (35), der mit dem Modifizierer (30) gekoppelt ist, zum Liefern der modifizierten Komfortrauschparameterwerte (30) zur Verwendung beim Erzeugen eines Komfortrauschens, wobei die Variabilitätscharakteristiken des Hintergrundrauschparameters anzeigen, wie der Hintergrundrauschparameter in Bezug auf wenigstens einen eines Zeit- und eines Mittelwerts des Hintergrundrauschparameters variiert.
  18. Vorrichtung nach Anspruch 17, wobei der Hintergrundrauschparameter (37) ein Spektrumsparameter ist.
  19. Vorrichtung nach Anspruch 17, wobei der Hintergrundrauschparameter (37) ein Energieparameter ist.
  20. Vorrichtung nach Anspruch 17, wobei der Modifizierer (30) eine Variabilitätsschätzeinheit (37) enthält, die mit dem zweiten Eingang (31) gekoppelt ist und auf den Hintergrundrauschparameter (37) zum Erzeugen der Variabilitätsinformation reagiert.
  21. Vorrichtung nach Anspruch 20, wobei die Variabilitätsabschätzeinheit eine Mittelwertsvariabilitäts-Bestimmungseinheit (51) zum Erzeugen einer Mittelwertsvariabilitätsinformation (31) enthält, die anzeigt, wie der Hintergrundrauschparameter (37) relativ zu einem Mittelwert des Hintergrundrauschparameters (37) variiert.
  22. Vorrichtung nach Anspruch 21, wobei die Mittelwertsvariabilitäts-Bestimmungseinheit (51) im Sprachdecodierer (93) vorgesehen ist.
  23. Vorrichtung nach Anspruch 21, wobei die Mittelwertsvariabilitäts-Bestimmungseinheit (51) in einem Sprachcodierer (91) vorgesehen ist, der betreibbar ist, um mit dem Sprachdecodierer (93) über den Kommunikationskanal (95) zu kommunizieren.
  24. Vorrichtung nach Anspruch 21, wobei die Mittelwertsvariabilitäts-Bestimmungseinheit (51) auf eine Vielzahl von Werten des Hintergrundrauschparameters (37) reagiert, um einen Mittelwert des Hintergrundrauschparameters (37) über eine Zeitperiode (51) zu berechnen, und weiterhin betreibbar ist, um den Mittelwert mit wenigstens einigen der Hintergrundrauschparameterwerte (37) zu vergleichen, um mittlere entfernte Werte des Hinterrauschparameters (37) zu erzeugen.
  25. Vorrichtung nach Anspruch 24, wobei die Variabilitätsinformation (31) eine Zeitvariabilitätsinformation enthält, die anzeigt, wie der Hintergrundrauschparameter (37) mit der Zeit variiert.
  26. Vorrichtung nach Anspruch 25, wobei die Variabilitäts-Abschätzeinheit (41) eine Koeffizienten-Berechnungseinheit (53) enthält, die auf eine Vielzahl von Werten des Hintergrundrauschparameters (37) reagiert, um Filterkoeffizienten (89) zu berechnen, wobei die Zeitvariabilitätsinformation die Filterkoeffizienten enthält.
  27. Vorrichtung nach Anspruch 26, wobei die Filterkoeffizienten Filterkoeffizienten eines Autoregressions-Vorhersagefilters sind.
  28. Vorrichtung nach Anspruch 26, die ein Filter (57) enthält, das mit der Koeffizienten-Berechnungseinheit (53) gekoppelt ist, zum Empfangen der Filterkoeffizienten davon, und mit der Mittelwertvariabilitäts-Bestimmungseinheit (51) gekoppelt ist, zum Filtern von wenigstens einigen der mittleren entfernten Hintergrundrauschparameterwerte gemäß den Filterkoeffizienten.
  29. Vorrichtung nach Anspruch 26, wobei die Koeffizienten-Berechnungseinheit im Sprachdecodierer vorgesehen ist.
  30. Vorrichtung nach Anspruch 26, wobei die Koeffizienten-Berechnungseinheit (53) in einem Sprachcodierer (91) vorgesehen ist, der zur Kommunikation mit dem Sprachdecodierer (93) über den Kommunikationskanal (91) betreibbar ist.
  31. Vorrichtung nach Anspruch 20, wobei die Variabilitätsinformation (31) Zeitvariabilitätsinformation enthält, die anzeigt, wie der Hintergrundrauschparameter über der Zeit variiert.
DE69917677T 1998-11-23 1999-11-08 SPRACHKODIERUNG MIT VERäNDERBAREM KOMFORT-RAUSCHEN FüR VERBESSERTER WIEDERGABEQUALITäT Expired - Lifetime DE69917677T2 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US10955598P 1998-11-23 1998-11-23
US109555P 1998-11-23
US09/391,768 US7124079B1 (en) 1998-11-23 1999-09-08 Speech coding with comfort noise variability feature for increased fidelity
US391768 1999-09-08
PCT/SE1999/002023 WO2000031719A2 (en) 1998-11-23 1999-11-08 Speech coding with comfort noise variability feature for increased fidelity

Publications (2)

Publication Number Publication Date
DE69917677D1 DE69917677D1 (de) 2004-07-01
DE69917677T2 true DE69917677T2 (de) 2005-06-02

Family

ID=26807080

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69917677T Expired - Lifetime DE69917677T2 (de) 1998-11-23 1999-11-08 SPRACHKODIERUNG MIT VERäNDERBAREM KOMFORT-RAUSCHEN FüR VERBESSERTER WIEDERGABEQUALITäT

Country Status (12)

Country Link
US (1) US7124079B1 (de)
EP (1) EP1145222B1 (de)
JP (1) JP4659216B2 (de)
KR (1) KR100675126B1 (de)
CN (1) CN1183512C (de)
AR (1) AR028468A1 (de)
AU (1) AU760447B2 (de)
BR (1) BR9915577A (de)
CA (1) CA2349944C (de)
DE (1) DE69917677T2 (de)
TW (1) TW469423B (de)
WO (1) WO2000031719A2 (de)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US20070110042A1 (en) * 1999-12-09 2007-05-17 Henry Li Voice and data exchange over a packet based network
US6662155B2 (en) * 2000-11-27 2003-12-09 Nokia Corporation Method and system for comfort noise generation in speech communication
US20030120484A1 (en) 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
US7305340B1 (en) * 2002-06-05 2007-12-04 At&T Corp. System and method for configuring voice synthesis
ATE322733T1 (de) * 2002-07-02 2006-04-15 Teltronic S A U Verfahren zur synthese von komfortgeräusch-rahmen
FR2861247B1 (fr) * 2003-10-21 2006-01-27 Cit Alcatel Terminal de telephonie a gestion de la qualite de restituton vocale pendant la reception
DE102004063290A1 (de) * 2004-12-29 2006-07-13 Siemens Ag Verfahren zur Anpassung von Comfort Noise Generation Parametern
FR2881867A1 (fr) * 2005-02-04 2006-08-11 France Telecom Procede de transmission de marques de fin de parole dans un systeme de reconnaissance de la parole
US8874437B2 (en) * 2005-03-28 2014-10-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal for voice quality enhancement
EP1897085B1 (de) 2005-06-18 2017-05-31 Nokia Technologies Oy System und verfahren zur adaptiven übertragung von komfortrauschparametern während einer nicht durchgehenden sprachübertragung
US20070038443A1 (en) * 2005-08-15 2007-02-15 Broadcom Corporation User-selectable music-on-hold for a communications device
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
CN101246688B (zh) * 2007-02-14 2011-01-12 华为技术有限公司 一种对背景噪声信号进行编解码的方法、系统和装置
PL2118889T3 (pl) 2007-03-05 2013-03-29 Ericsson Telefon Ab L M Sposób i sterownik do wygładzania stacjonarnego szumu tła
GB2454470B (en) * 2007-11-07 2011-03-23 Red Lion 49 Ltd Controlling an audio signal
US20090154718A1 (en) * 2007-12-14 2009-06-18 Page Steven R Method and apparatus for suppressor backfill
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
US8290141B2 (en) * 2008-04-18 2012-10-16 Freescale Semiconductor, Inc. Techniques for comfort noise generation in a communication system
EP3246918B1 (de) * 2008-07-11 2023-06-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiodecodierer, verfahren zum decodieren eines audio-signals und computerprogramm
EP2676268B1 (de) 2011-02-14 2014-12-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur verarbeitung eines dekodierten audiosignals in einem spektralbereich
TR201903388T4 (tr) 2011-02-14 2019-04-22 Fraunhofer Ges Forschung Bir ses sinyalinin parçalarının darbe konumlarının şifrelenmesi ve çözülmesi.
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
EP3503098B1 (de) 2011-02-14 2023-08-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur decodierung eines audiosignals unter verwendung eines ausgerichteten look-ahead-abschnitts
AU2012217215B2 (en) 2011-02-14 2015-05-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding (USAC)
AR085895A1 (es) * 2011-02-14 2013-11-06 Fraunhofer Ges Forschung Generacion de ruido en codecs de audio
EP2676270B1 (de) 2011-02-14 2017-02-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines teils eines audiosignals anhand einer transientendetektion und eines qualitätsergebnisses
MY165853A (en) 2011-02-14 2018-05-18 Fraunhofer Ges Forschung Linear prediction based coding scheme using spectral domain noise shaping
TWI483245B (zh) 2011-02-14 2015-05-01 Fraunhofer Ges Forschung 利用重疊變換之資訊信號表示技術
RU2586838C2 (ru) 2011-02-14 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодек, использующий синтез шума в течение неактивной фазы
US20140270249A1 (en) 2013-03-12 2014-09-18 Motorola Mobility Llc Method and Apparatus for Estimating Variability of Background Noise for Noise Suppression
US20140278393A1 (en) 2013-03-12 2014-09-18 Motorola Mobility Llc Apparatus and Method for Power Efficient Signal Conditioning for a Voice Recognition System
CN104217723B (zh) * 2013-05-30 2016-11-09 华为技术有限公司 信号编码方法及设备
DK3217399T3 (en) * 2016-03-11 2019-02-25 Gn Hearing As Kalman filtering based speech enhancement using a codebook based approach

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5630016A (en) 1992-05-28 1997-05-13 Hughes Electronics Comfort noise generation for digital communication systems
JP2541484B2 (ja) * 1992-11-27 1996-10-09 日本電気株式会社 音声符号化装置
US5485522A (en) * 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
SE501981C2 (sv) * 1993-11-02 1995-07-03 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
JP3464371B2 (ja) * 1996-11-15 2003-11-10 ノキア モービル フォーンズ リミテッド 不連続伝送中に快適雑音を発生させる改善された方法
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US5893056A (en) 1997-04-17 1999-04-06 Northern Telecom Limited Methods and apparatus for generating noise signals from speech signals

Also Published As

Publication number Publication date
AR028468A1 (es) 2003-05-14
KR20010080497A (ko) 2001-08-22
CN1183512C (zh) 2005-01-05
DE69917677D1 (de) 2004-07-01
JP4659216B2 (ja) 2011-03-30
CA2349944C (en) 2010-01-12
AU1591100A (en) 2000-06-13
US7124079B1 (en) 2006-10-17
CN1354872A (zh) 2002-06-19
CA2349944A1 (en) 2000-06-02
EP1145222A2 (de) 2001-10-17
WO2000031719A3 (en) 2003-03-20
BR9915577A (pt) 2001-11-13
AU760447B2 (en) 2003-05-15
TW469423B (en) 2001-12-21
WO2000031719A2 (en) 2000-06-02
EP1145222B1 (de) 2004-05-26
EP1145222A3 (de) 2003-05-14
KR100675126B1 (ko) 2007-01-26
JP2003529950A (ja) 2003-10-07

Similar Documents

Publication Publication Date Title
DE69917677T2 (de) SPRACHKODIERUNG MIT VERäNDERBAREM KOMFORT-RAUSCHEN FüR VERBESSERTER WIEDERGABEQUALITäT
DE60122203T2 (de) Verfahren und system zur erzeugung von behaglichkeitsrauschen bei der sprachkommunikation
DE69925168T2 (de) Erkennung der aktivität komplexer signale für verbesserte sprach-/rauschklassifizierung von einem audiosignal
DE19681070C2 (de) Verfahren und Vorrichtung zum Betreiben eines Kommunikationssystems mit Rauschunterdrückung
DE60120734T2 (de) Vorrichtung zur erweiterung der bandbreite eines audiosignals
DE19617630B4 (de) Verfahren zum Herleiten der Nachwirkperiode in einem Sprachdecodierer bei diskontinuierlicher Übertragung, sowie Sprachcodierer und Sender-Empfänger
DE69535723T2 (de) Verfahren und vorrichtung zur sprachkodierung mit reduzierter, variabler bitrate
DE60219351T2 (de) Signaländerungsverfahren zur effizienten kodierung von sprachsignalen
DE60121405T2 (de) Transkodierer zur Vermeidung einer Kaskadenkodierung von Sprachsignalen
DE69830721T2 (de) Verfahren und vorrichtung zur bestimmung der übertragungsrate in einem kommunikationssystem
DE60029147T2 (de) Qualitätsverbesserung eines audiosignals in einem digitalen netzwerk
DE69724739T2 (de) Verfahren zur Erzeugung von Hintergrundrauschen während einer diskontinuierlichen Übertragung
DE69631318T2 (de) Verfahren und Vorrichtung zur Erzeugung von Hintergrundrauschen in einem digitalen Übertragungssystem
DE69534285T3 (de) Verfahren und Vorrichtung zur Auswahl der Kodierrate in einem Vocoder mit variabler Rate
DE69932593T2 (de) Dekodierungsverfahren und system mit einem adaptiven postfilter
DE69910239T2 (de) Verfahren und vorrichtung zur adaptiven bandbreitenabhängigen grundfrequenzsuche für die kodierung breitbandiger signale
DE60110679T2 (de) Wahrnehmungs-Codierung von Audiosignalen unter Verwendung von getrennter Irrelevanzreduktion und Redundanzreduktion
DE60011051T2 (de) Celp-transkodierung
DE60128121T2 (de) Wahrnehmungsbezogen verbesserte aufbesserung kodierter akustischer signale
DE69916321T2 (de) Kodierung eines verbesserungsmerkmals zur leistungsverbesserung in der kodierung von kommunikationssignalen
DE19647298C2 (de) Kodiersystem
DE19935808A1 (de) Echounterdrückungseinrichtung zum Unterdrücken von Echos in einer Sender/Empfänger-Einheit
EP2245621B1 (de) Verfahren und mittel zur enkodierung von hintergrundrauschinformationen
DE60017763T2 (de) Verfahren und vorrichtung zur erhaltung einer ziel-bitrate in einem sprachkodierer
DE69730721T2 (de) Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form

Legal Events

Date Code Title Description
8364 No opposition during term of opposition