DE19811039A1 - Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen - Google Patents

Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen

Info

Publication number
DE19811039A1
DE19811039A1 DE19811039A DE19811039A DE19811039A1 DE 19811039 A1 DE19811039 A1 DE 19811039A1 DE 19811039 A DE19811039 A DE 19811039A DE 19811039 A DE19811039 A DE 19811039A DE 19811039 A1 DE19811039 A1 DE 19811039A1
Authority
DE
Germany
Prior art keywords
audio signal
quantized
signals
predicted
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19811039A
Other languages
English (en)
Other versions
DE19811039B4 (de
Inventor
Lin Yin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Technologies Oy
Original Assignee
Nokia Mobile Phones Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Mobile Phones Ltd filed Critical Nokia Mobile Phones Ltd
Publication of DE19811039A1 publication Critical patent/DE19811039A1/de
Application granted granted Critical
Publication of DE19811039B4 publication Critical patent/DE19811039B4/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephone Function (AREA)

Description

Die Erfindung betrifft Verfahren und eine Vorrichtung zum Codieren von Audiosignalen sowie ein Verfahren und eine Vor­ richtung zum Decodieren derartiger Signale.
Es ist wohlbekannt, daß die Übertragung von Daten in digi­ taler Form für erhöhte Signal/Rauschsignal(S/R)-Verhältnisse und erhöhte Informationskapazität entlang einem Übertra­ gungskanal sorgt. Es existiert jedoch dauernd der Wunsch, die Kanalkapazität dadurch weiter zu erhöhen, daß digitale Signale immer stärker komprimiert werden. Hinsichtlich Au­ diosignalen werden herkömmlich zwei grundlegende Kompressi­ ons-Grundprinzipien angewandt. Das erste derselben umfaßt das Beseitigen statistischer oder determinierter Redundanzen im Quellensignal, während es das zweite beinhaltet, im Quel­ lensignal Elemente zu unterdrücken oder zu beseitigen, die insoweit redundant sind, als das menschliche Wahrnehmungs­ vermögen betroffen ist. In jüngerer Zeit wurde das letztere Prinzip bei Audioanwendungen hoher Qualität vorherrschend, und es beinhaltet typischerweise die Aufteilung eines Audio­ signals in seine Frequenzkomponenten (manchmal als "Unter­ bänder" bezeichnet), von denen jede mit einer Datengenauig­ keit analysiert und quantisiert wird, die so bestimmt ist, daß irrelevante (für den Hörer) Daten entfernt werden. Der ISO(International Standard Organisation)-MPEG(Moving Pic­ tures Expert Group)-Audiocodierungsstandard sowie andere Audiocodierungsstandards verwenden dieses Prinzip und legen es weiter fest. Jedoch verwendet der MPEG-Standard (und an­ dere Standards) auch eine Technik, die als "adaptive Vorher­ sage" bekannt ist, um eine noch weitere Verringerung der Datenrate zu erzielen.
Die Funktion eines Codierers gemäß dem neuen MPEG-2-AAC- Standard ist im einzelnen im internationalen Standardent­ wurfdokument ISO/IEC DIS 13818-7 beschrieben. Dieser neue MPEG-2-Standard verwendet lineare Vorhersage in Rückwärts­ richtung mit 672 von 1024 Frequenzkomponenten. Es ist ins Auge gefaßt, daß der neue MPEG-4-Standard ähnliche Erfor­ dernisse aufweist. Jedoch führt eine derartig große Anzahl von Frequenzkomponenten zu einem großen Berechnungsoverhead aufgrund der Komplexität des Vorhersagealgorithmus, und dies erfordert auch die Verfügbarkeit großer Mengen an Speicher, um die berechneten sowie Zwischenkoeffizienten zu speichern. Es ist wohlbekannt, daß es dann, wenn Einrichtungen dieses Typs für adaptive Vorhersage in Rückwärtsrichtung in der Frequenzdomäne verwendet werden, schwierig ist, die Rechner­ belastung und die Speichererfordernisse weiter zu verrin­ gern. Dies, da die Anzahl der Vorhersageeinrichtungen in der Frequenzdomäne so groß ist, daß sogar ein sehr einfacher adaptiver Algorithmus immer noch zu großer Komplexität bei der Berechnung und zu großem Speicherbedarf führt. Während es bekannt ist, dieses Problem unter Verwendung von Einrich­ tungen zur adaptiven Vorhersage in Vorwärtsrichtung zu ver­ meiden, wobei eine Aktualisierung im Codierer und eine Über­ tragung an den Decodierer erfolgt, führt die Verwendung von Einrichtungen zur adaptiven Vorhersage in Vorwärtsrichtung in der Frequenzdomäne in unvermeidlicher Weise zu einer gro­ ßen Menge an "Neben"-Information, da die Anzahl der Vorher­ sageeinrichtungen so groß ist.
Der Erfindung liegt die Aufgabe zugrunde, Verfahren und Vor­ richtungen zum Codieren und Decodieren von Audiosignalen zu schaffen, die ohne komplexe Berechnungsabläufe und großen Speicherbedarf realisierbar sind.
Diese Aufgabe ist hinsichtlich des Codierungsverfahrens durch Anspruch 1, mit abhängigen Ansprüchen 2 und 3, hin­ sichtlich des Decodierungsverfahrens durch Anspruch 4, hin­ sichtlich der Codierungsvorrichtung durch Anspruch 5, mit abhängigen Ansprüchen 6 und 7, und hinsichtlich der Decodie­ rungsvorrichtung durch Anspruch 8 gelöst. Es wird ein Audio­ signal unter Verwendung von Abweichungssignalen codiert, um Redundanz in jedem von einer Vielzahl von Frequenz-Unterbän­ dern des Audiosignals zu beseitigen, wobei zusätzlich Lang­ zeit-Vorhersagekoeffizienten in der Zeitdomäne erzeugt wer­ den, die es ermöglichen, einen aktuellen Rahmen des Audiosi­ gnals aus einem oder mehreren früheren Rahmen vorherzusagen.
Beim Codierungsverfahren gemäß Anspruch 1 wird eine Kompres­ sion eines Audiosignals unter Verwendung einer Einrichtung für adaptive Vorhersage in Vorwärtsrichtung in der Zeitdomä­ ne vorgenommen. Für jeden Zeitrahmen eines empfangenen Si­ gnals ist es nur erforderlich, einen einzelnen Satz von Koeffizienten für adaptive Vorhersage in Vorwärtsrichtung zu erzeugen und an den Decodierer zu übertragen. Dies steht im Gegensatz zu bekannten Techniken für adaptive Vorhersage in Vorwärtsrichtung, die die Erzeugung eines Satzes von Vorher­ sagekoeffizienten für jedes Frequenzunterband jedes Zeitrah­ mens erfordern. Im Vergleich mit den Vorhersagegewinnen, wie sie durch die Erfindung erzielt werden, ist die Nebeninfor­ mation der Langzeit-Vorhersageeinrichtung vernachlässigbar.
Bestimmte Ausführungsformen der Erfindung ermöglichen eine Verringerung der Komplexität der Rechenvorgänge und des Speicherbedarfs. Insbesondere besteht im Vergleich mit der Verwendung von adaptiver Vorhersage in Rückwärtsrichtung kein Erfordernis, die Vorhersagekoeffizienten im Decodierer neu zu berechnen. Bestimmte Ausführungsformen der Erfindung können auch schneller auf Signaländerungen als herkömmliche Einrichtungen für adaptive Vorhersage in Rückwärtsrichtung reagieren.
Beim Verfahren gemäß Anspruch 2 wird das quantisierte Audio­ signal x dadurch erzeugt, daß das vorhergesagte Signal und das quantisierte Abweichungssignal entweder in der Zeitdomä­ ne oder der Frequenzdomäne aufsummiert werden.
Vorzugsweise wird die Quantisierung der Abweichungssignale gemäß einem psychoakustischen Modell ausgeführt.
Ausführungsformen des erfindungsgemäßen Decodierungsverfah­ rens sind insbesondere dann anwendbar, wenn nur ein Unter­ satz aller möglichen quantisierten Abweichungssignale (k) empfangen wird, wobei einige Unterbanddaten direkt durch die Übertragung der Audiounterbandsignale X(k) übertragen wer­ den. Die Signale (k) und X(k) werden geeignet kombiniert, bevor die Frequenz-Zeit-Transformation ausgeführt wird.
Für ein besseres Verständnis der Erfindung und um zu veran­ schaulichen, wie dieselbe realisierbar ist, wird nun bei­ spielhaft auf die beigefügten Zeichnungen Bezug genommen.
Fig. 1 zeigt schematisch einen Codierer zum Codieren eines empfangenen Audiosignals;
Fig. 2 zeigt schematisch einen Codierer zum Decodieren eines mit dem Codierer von Fig. 1 codierten Audiosignals;
Fig. 3 zeigt den Codierer von Fig. 1 einschließlich eines Vorhersagewerkzeugs des Codierers mit größeren Einzelheiten;
Fig. 4 zeigt den Codierer von Fig. 2 einschließlich eines Vorhersagewerkzeugs des Codierers mit größeren Einzelheiten; und
Fig. 5 zeigt im einzelnen eine Modifizierung des Codierers von Fig. 1, wobei ein alternatives Vorhersagewerkzeug ver­ wendet ist.
In Fig. 1 ist ein Blockdiagramm eines Codierers dargestellt, der eine Codierungsfunktion ausübt, die allgemein gemäß dem MPEG-2-AAC-Standard definiert ist. Das Eingangssignal des Codierers ist ein abgetastetes, einphasiges Signal x, dessen Abtastpunkte in Zeitrahmen oder Blöcke von 2N Punkten grup­ piert sind, d. h.:
xm = (xm(0),xm(1), . . .,xm(2N-1))T (1)
wobei m der Blockindex ist und T einen Transponiervorgang bezeichnet. Die Gruppierung der Abtastpunkte wird durch ein Filterbank-Werkzeug 1 ausgeführt, das auch eine modifizier­ te, diskrete Cosinustransformation (MDCT) an jedem indivi­ duellen Rahmen des Audiosignals ausführt, um einen Satz von Frequenzunterband-Koeffizienten zu erzeugen:
Xm = (Xm(0),Xm(1), . . .,Xm(N-1))T (2)
Die Unterbänder sind im MPEG-Standard definiert. Die MDCT in Vorwärtsrichtung ist wie folgt definiert:
wobei f(i) das Analyse-Synthese-Fenster ist, bei dem es sich um ein symmetrisches Fenster handelt, so daß ein Additi­ ons-Überlappungs-Effekt die Einheitsverstärkung für das Si­ gnal erzeugt.
Die Frequenzunterband-Signale X(k) werden ihrerseits an einem Vorhersagewerkzeug 2 (das unten detaillierter be­ schrieben wird) gegeben, das versucht, Langzeitredundanz in jedem der Unterbandsignale zu beseitigen. Das Ergebnis ist ein Satz von Frequenzunterband-Abweichungssignalen:
Em(k)=(Em(0),Em(1), . . .,Em(N-1))T (4)
die Langzeitänderungen in jeweiligen Unterbändern anzeigen, sowie ein Satz von Koeffizienten A für adaptive Vorhersage in Vorwärtsrichtung für jeden Rahmen.
Die Unterband-Abweichungssignale E(k) werden an eine Quanti­ sierungseinrichtung 3 gegeben, die jedes Signal mit einer Anzahl von Bits quantisiert, die durch ein psychoakustisches Modell bestimmt ist. Dieses Modell wird durch eine Steuerung 4 angewandt. Wie erörtert, wird ein psychoakustisches Modell zum Nachbilden des maskierenden Verhaltens des menschlichen Hörsystems verwendet. Die quantisierten Abweichungssignale (k) und die Vorhersagekoeffizienten A werden dann in einem Bitstrommultiplexer 5 zur Übertragung über einen Übertra­ gungskanal 6 kombiniert.
Fig. 2 zeigt die allgemeine Anordnung eines Decodierers zum Decodieren eines mit dem Codierer von Fig. 1 codierten Au­ diosignals. Ein Bitstrom-Demultiplexer 7 trennt zunächst die Vorhersagekoeffizienten A von den quantisierten Abweichungs­ signalen (k) ab, und er teilt die Abweichungssignale in die gesonderten Unterbandsignale auf. Die Vorhersagekoeffizien­ ten A und die quantisierten Abweichungs-Unterbandsignale (k) werden an ein Vorhersagewerkzeug 8 geliefert, das den im Codierer ausgeführten Vorhersageprozeß umkehrt, d. h., daß das Vorhersagewerkzeug die im Codierer herausgenommene Redundanz wieder einführt, um rekonstruierte quantisierte Unterbandsignale (k) zu erzeugen. Ein Filterbank-Werkzeug 9 gewinnt dann das Signal in der Zeitdomäne durch inverse Transformation hinsichtlich der empfangenen Version (k) wieder, was wie folgt beschrieben ist:
wobei k(i), i = 0, . . . 2N-1 die Invers-Transformierte von ist:
was eine Annäherung an das ursprüngliche Audiosignal x dar­ stellt.
Fig. 3 veranschaulicht das Vorhersageverfahren des Codierers von Fig. 1 in detaillierterer Weise. Unter Verwendung der quantisierten Frequenzunterband-Abweichungssignale (k) wird durch eine Signalverarbeitungseinheit 10 ein Satz quanti­ sierter Frequenzunterband-Signale X(k) erzeugt. Diese Signa­ le X(k) werden ihrerseits an eine Filterbank 11 gegeben, die an den Signalen eine inverse, modifizierte, diskrete Cosi­ nustransformation (IMDCT) ausführt, um ein quantisiertes Signal x in der Zeitdomäne zu erzeugen. Dieses Signal x wird dann an ein Werkzeug 12 für Langzeitvorhersage gegeben, das auch das Audioeingangssignal x empfängt. Dieses Vorhersage­ werkzeug 12 verwendet eine Langzeit(LT)-Vorhersageeinrich­ tung zum Entfernen der Redundanz im Audiosignal, wie sie im aktuellen Rahmen m+1 vorliegt, auf Grundlage der zuvor quan­ tisierten Daten. Die Übertragungsfunktion P dieser Vorhersa­ geeinrichtung ist die folgende:
wobei α eine Langzeitverzögerung im Bereich von 1 bis 1024 Abtastwerten repräsentiert und bk Vorhersagekoeffizienten sind. Für m1 = m2 = 0 entspricht die Vorhersageeinrichtung einer Stufe, während sie für m1 = m2 = 1 drei Stufen ent­ spricht.
Die Parameter α und bk werden durch Minimieren der mittleren quadratischen Abweichung nach der LT-Vorhersage über eine Periode von 2N Abtastwerten bestimmt. Für eine Vorhersage­ einrichtung mit einer Stufe ist der LT-Vorhersagerest r(i) wie folgt gegeben:
wobei x das Audiosignal in der Zeitdomäne ist und das quantisierte Signal in der Zeitdomäne ist. Der mittlere quadratische Rest R ist wie folgt gegeben:
Wenn ∂R/∂b = 0 gesetzt wird, ergibt sich:
und wenn b in die Gleichung (7) eingesetzt wird, ergibt sich:
Ein Minimieren von R bedeutet ein Maximieren des zweiten Terms auf der rechten Seite der Gleichung (9). Dieser Term wird für alle möglichen Werte von α über seinen spezifizier­ ten Bereich berechnet, und es wird derjenige Wert von α ge­ wählt, der diesen Term maximiert. Die Energie im Nenner der Gleichung (9), die mit Ω bezeichnet wird, kann leicht aus der Verzögerung (α-1) auf α aktualisiert werden, anstatt daß eine neue Berechnung erfolgt, wenn folgendes verwendet wird:
Wenn eine LT-Vorhersageeinrichtung mit einer Stufe verwendet wird, wird die Gleichung (8) dazu verwendet, den Vorhersage­ koeffizienten bj zu berechnen. Für eine Vorhersageeinrich­ tung mit j Stufen wird zunächst die LT-Vorhersageverzögerung αdadurch bestimmt, daß der zweite Term der Gleichung (9) maximiert wird, und dann wird ein Satz von j×j Gleichungen gelöst, um die j Vorhersagekoeffizienten zu berechnen.
Die LT-Vorhersageparameter A sind die Verzögerung α und der Vorhersagekoeffizient bj. Die Verzögerung wird abhängig vom verwendeten Bereich mit 9 bis 11 Bits quantisiert. Am üb­ lichsten werden 10 Bits verwendet, mit 1024 möglichen Werten im Bereich von 1 bis 1024. Um die Anzahl der Bits zu verrin­ gern, können die LT-Vorhersageverzögerungen in geradzahligen Rahmen mit 5 Bits delta-codiert werden. Versuche zeigen, daß es ausreichend ist, den Gewinn mit 3 bis 6 Bits zu quantisieren. Aufgrund der ungleichförmigen Verteilung des Gewinns muß eine ungleichförmige Quantisierung verwendet werden.
Beim obenbeschriebenen Verfahren ist nicht immer die Stabi­ lität des LT-Synthesefilters 1/P(z) garantiert. Für eine Vorhersageeinrichtung mit einer Stufe ist die Stabilitätsbe­ dingung |b| ≦ 1. Daher kann Stabilisierung leicht ausgeführt werden, wenn immer dann |b| = 1 eingestellt wird, wenn |b| ≦ 1 vorliegt. Bei einer Vorhersageeinrichtung mit drei Stufen kann ein anderer Stabilisierungsablauf verwendet wer­ den, wie er von R. P. Ramachandran und P. Kabel in "Stabili­ ty and performance analysis of pitch filters in speech co­ ders", IEEE Trans. ASSP, Vol. 35, No. 7, S. 937-946, Juli 1987 beschrieben ist. Jedoch ist die Instabilität des LT-Synthesefilters nicht allzu schädlich hinsichtlich der Qua­ lität des wiederhergestellten Signals. Ein instabiles Filter dauert für einige wenige Rahmen an (was die Energie erhöht), jedoch werden schließlich stabile Perioden angetroffen, so daß das Ausgangssignal nicht dauernd mit der Zeit ansteigt.
Nachdem die Koeffizienten der LT-Vorhersageeinrichtung be­ stimmt sind, kann das vorhergesagte Signal für den Rahmen (m+1) bestimmt werden:
Dann wird das vorhergesagte Signal in der Zeitdomäne an eine Filterbank 13 gegeben, die eine MDCT am Signal aus­ führt, um vorhergesagte spektrale Koeffizienten m+1(k) für den Rahmen (m+1) zu erzeugen. Die vorhergesagten spektralen Koeffizienten (k) werden dann in einem Subtrahierer 14 von den spektralen Koeffizienten X(k) subtrahiert.
Um sicherzustellen, daß eine Vorhersage nur dann verwendet wird, wenn sie zu einem Codierungsgewinn führt, ist eine ge­ eignete Steuerung für die Vorhersageeinrichtung erforder­ lich, und es muß eine kleine Menge an Steuerungsinformat­ ion für die Vorhersageeinrichtung an den Decodierer über­ tragen werden. Diese Funktion wird im Subtrahierer 14 ausge­ führt. Das Steuerungsschema für die Vorhersageeinrichtung ist dasselbe wie dasjenige für eine Vorrichtung für adaptive Vorhersage in Rückwärtsrichtung, wie es gemäß MPEG-2-Advanc­ ed Audio Coding (AAC) verwendet wurde. Die Steuerungsinfor­ mation für die Vorhersageeinrichtung für jeden Rahmen, wie sie als Nebeninformation übertragen wird, wird in zwei Schritten bestimmt. Als erstes wird für jedes Skalierungs­ faktorband bestimmt, ob eine Vorhersage zu einem Codierungs­ gewinn führt oder nicht, und falls ein Gewinn erzielt wird, wird das Bit predictor_used für dieses Skalierungsfaktorband auf Eins gesetzt. Nachdem dies für alle Skalierungsfaktor­ bänder erfolgte, wird ermittelt, ob der Gesamtcodierungsge­ winn durch Vorhersage in diesem Rahmen zumindest den zusätz­ lichen Bitbedarf für die Nebeninformation für die Vorhersa­ geeinrichtung kompensiert. Falls ja, wird das Bit predictor data_present auf Eins gesetzt, und es wird die vollständige Nebeninformation einschließlich derjenigen, die zum Rückset­ zen der Vorhersageeinrichtung erforderlich ist, übertragen, und der Wert der Vorhersageabweichung wird an den Quantisie­ rer geliefert. Andernfalls wird das Bit predictor_data_pre­ sent auf Null gesetzt, und die Bits prediction_used werden alle auf Null rückgesetzt und nicht übertragen. In diesem Fall wird der Spektralkomponentenwert an den Quantisierer 3 geliefert. Wie oben beschrieben, arbeitet die Steuerung für die Vorhersageeinrichtung als erstes für alle Vorhersageein­ richtungen für ein Skalierungsfaktorband, worauf ein zweiter Schritt über alle Skalierungsfaktorbänder folgt.
Es ist ersichtlich, daß es das Ziel der LT-Vorhersage ist, den größten Gesamtvorhersagegewinn zu erzielen. Mit G1 sei der Vorhersagegewinn im Frequenzunterband 1 bezeichnet. Der Gesamtvorhersagegewinn in einem vorgegebenen Rahmen kann dann wie folgt berechnet werden:
Wenn der Gewinn den zusätzlichen Bitbedarf für die Informa­ tion auf der Seite der Vorhersageeinrichtung kompensiert, d. h., wenn G < T (dB) gilt, wird die vollständige Nebenin­ formation übertragen, und es werden die Vorhersageeinrich­ tungen eingeschaltet, die positive Gewinne erzeugen. Andern­ falls werden die Vorhersageeinrichtungen nicht verwendet.
Die durch das vorstehend dargelegte Verfahren erhaltenen LP- Parameter stehen nicht in direktem Zusammenhang mit einer Gewinnmaximierung. Wenn jedoch der Gewinn für jeden Block und für jede Verzögerung innerhalb des ausgewählten Bereichs (1 bis 1024 bei diesem Beispiel) berechnet wird, und wenn diejenige Verzögerung ausgewählt wird, die den größten Ge­ samtvorhersagegewinn erzeugt, ist der Vorhersageprozeß op­ timiert. Die ausgewählte Verzögerung α und die entsprechen­ den Koeffizienten b werden als Nebeninformation mit den quantisierten Abweichungs-Unterbandsignalen übertragen. Wäh­ rend die Komplexität der Berechnung seitens des Codierers erhöht ist, ergibt sich am Decodierer keine Erhöhung der Komplexität.
Fig. 4 zeigt den Decodierer von Fig. 2 mit mehr Einzelhei­ ten. Das codierte Audiosignal wird durch den Bitstrom-Demul­ tiplexer 7 vom Übertragungskanal 6 empfangen, wie oben be­ schrieben. Der Bitstrom-Demultiplexer 7 trennt die Vorhersa­ gekoeffizienten A und die quantisierten Abweichungssignale (k), und er liefert diese an das Vorhersagewerkzeug 8. Die­ ses Werkzeug umfaßt eine Kombiniereinrichtung 24, die die quantisierten Abweichungssignale (k) und ein vorhergesagtes Audiosignal (k) in der Frequenzdomäne kombiniert, um ein wiederhergestelltes Audiosignal (k) ebenfalls in der Fre­ quenzdomäne zu erzeugen. Die Filterbank 9 setzt das wieder­ hergestellte Signal (k) aus der Frequenzdomäne in die Zeit­ domäne um, um ein wiederhergestelltes Audiosignal in der Zeitdomäne zu erzeugen. Dieses Signal wird seinerseits an ein Langzeit-Vorhersagewerkzeug rückgeführt, das ebenfalls die Vorhersagekoeffizienten A empfängt. Dieses Langzeit-Vor­ hersagewerkzeug 26 erzeugt einen vorhergesagten, aktuellen Zeitrahmen aus dem zuvor wiederhergestellten Zeitrahmen un­ ter Verwendung der Vorhersagekoeffizienten für den aktuellen Rahmen. Eine Filterbank 25 transformiert das vorhergesagte Signal .
Es ist ersichtlich, daß die vom Codierer übertragene Steue­ rungsinformation für die Vorhersageeinrichtung seitens des Decodierers dazu verwendet werden kann, den Decodierungsvor­ gang zu steuern. Insbesondere können in der Kombinierein­ richtung 24 die Bits predictor_used dazu verwendet werden, zu ermitteln, ob in irgendeinem vorgegebenen Frequenzband Vorhersage verwendet wurde oder nicht.
In Fig. 5 ist eine alternative Realisierung des Audiosignal­ codierers von Fig. 1 dargestellt, bei der das zu codierende Audiosignal durch einen Komparator 15 mit dem vorhergesagten Signal in der Zeitdomäne verglichen wird, um ein Abwei­ chungssignal e ebenfalls in der Zeitdomäne zu erzeugen. Ein Filterbank-Werkzeug 16 setzt dann das Abweichungssignal von der Zeitdomäne in die Frequenzdomäne um, um einen Satz von Frequenzunterband-Abweichungssignalen E(k) zu erzeugen. Die­ se Signale werden dann durch eine Quantisierungseinrichtung 17 quantisiert, um einen Satz quantisierter Abweichungssi­ gnale (k) zu erzeugen.
Dann wird eine zweite Filterbank 18 dazu verwendet, die quantisierten Abweichungssignale (k) wieder in die Zeitdo­ mäne zurückzutransformieren, was zu einem Signal führt. Dieses in der Zeitdomäne quantisierte Abweichungssignal wird dann in einer Signalverarbeitungseinheit 19 mit dem vorhergesagten Audiosignal in der Zeitdomäne kombiniert, um ein quantisiertes Audiosignal zu erzeugen. Ein Vorher­ sagewerkzeug 20 führt dieselbe Funktion wie das Werkzeug 12 des Codierers von Fig. 3 aus, nämlich die Erzeugung des vor­ hergesagten Audiosignals und des Vorhersagekoeffizienten A. Die Vorhersagekoeffizienten und die quantisierten Abwei­ chungssignale werden in einem Bitstrommultiplexer 21 zur Übertragung über den Übertragungskanal 22 kombiniert. Wie oben beschrieben, werden die Abweichungssignale durch eine Steuerung 23 gemäß einem psychoakustischen Modell quanti­ siert.
Die obenbeschriebenen Audiosignal-Codierungsalgorithmen er­ möglichen die Kompression von Audiosignalen bei niedrigen Bitraten. Die Technik beruht auf Langzeit(LT)-Vorhersage. Im Vergleich mit bekannten Techniken für adaptive Vorhersage in Rückwärtsrichtung liefern die hier beschriebenen Techniken höhere Vorhersagegewinne für Musiksignale von Einzelinstru­ menten und für Sprachsignale, während sie nur geringe Kom­ plexität der Rechenvorgänge erfordern.

Claims (8)

1. Verfahren zum Codieren eines Audiosignals, gekennzeich­ net durch die folgenden Schritte:
  • - Empfangen eines zu codierenden Audiosignals;
  • - Erzeugen eines quantisierten Audiosignals aus dem emp­ fangenen Audiosignal x;
  • - Erzeugen eines Satzes von Langzeitvorhersage-Koeffizienten A, die dazu verwendet werden können, einen aktuellen Zeit­ rahmen des empfangenen Audiosignals unmittelbar aus mindes­ tens einem vorigen Zeitrahmen des quantisierten Audiosignals vorherzusagen;
  • - Verwenden der Vorhersagekoeffizienten A zum Erzeugen eines vorhergesagten Audiosignals ;
  • - Vergleichen des empfangenen Audiosignals x mit dem vorher­ gesagten Audiosignal und Erzeugen eines Abweichungssignals E(k) für jedes von mehreren Frequenzunterbändern;
  • - Quantisieren der Abweichungssignale (k) zum Erzeugen eines Satzes quantisierter Abweichungssignale (k); und
  • - Kombinieren der quantisierten Abweichungssignale E(k) und der Vorhersagekomponenten A zum Erzeugen eines codierten Audiosignals.
2. Verfahren nach Anspruch 1, gekennzeichnet durch:
  • - Transformieren des im Rahmen xm empfangenen Audiosignals x aus der Zeitdomäne in die Frequenzdomäne, um einen Satz von Frequenzunterband-Signalen X(k) zu erzeugen; und
  • - Transformieren des vorhergesagten Audiosignals aus der Zeitdomäne in die Frequenzdomäne, um einen Satz vorhergesag­ ter Frequenzunterband-Signale (k) zu erzeugen;
  • - wobei der Vergleich zwischen dem empfangenen Audiosignal x und dem vorhergesagten Audiosignal in der Frequenzdomäne ausgeführt wird und die jeweiligen Unterbandsignale mitein­ ander verglichen werden, um die Frequenzunterband-Abwei­ chungssignale E(k) zu erzeugen.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Vergleich zwischen dem empfangenen Audiosignal x und dem vorhergesagten Audiosignal in der Zeitdomäne ausgeführt wird, um ein Abweichungssignal e ebenfalls in der Zeitdomäne zu erzeugen, und das Abweichungssignal e aus der Zeit- in die Frequenzdomäne umgesetzt wird, um die mehreren Frequenz­ unterband-Abweichungssignale E(k) zu erzeugen.
4. Verfahren zum Decodieren eines codierten Audiosignals, gekennzeichnet durch die folgenden Schritte:
  • - Empfangen eines codierten Audiosignals, das ein quanti­ siertes Abweichungssignal (k) für jedes einer Vielzahl von Frequenzunterbändern des Audiosignals sowie, für jeden Zeit­ rahmen des Audiosignals, einen Satz von Vorhersagekoeffi­ zienten A enthält, die dazu verwendet werden können, einen aktuellen Zeitrahmen xm des empfangenen Audiosignals unmit­ telbar aus mindestens einem vorigen Zeitrahmen eines wieder­ hergestellten, quantisierten Audiosignals vorherzusagen;
  • - Erzeugen des wiederhergestellten, quantisierten Audiosi­ gnals x aus den quantisierten Abweichungssignalen E(k);
  • - Verwenden der Vorhersagekoeffizienten A und des quanti­ sierten Audiosignals zum Erzeugen eines vorhergesagten Audiosignals ;
  • - Transformieren des vorhergesagten Audiosignals aus der Zeitdomäne in die Frequenzdomäne, um einen Satz vorhergesag­ ter Frequenzunterband-Signale (k) für Kombination mit den quantisierten Abweichungssignalen (k) zu erzeugen, um einen Satz wiederhergestellter Frequenzunterband-Signale (k) zu erzeugen; und
  • - Ausführen einer Transformation von der Frequenz- in die Zeitdomäne an den wiederhergestellten Frequenzunterband-Si­ gnalen (k), um das wiederhergestellte, quantisierte Audio­ signal zu erzeugen.
5. Vorrichtung zum Codieren eines Audiosignals, gekenn­ zeichnet durch:
  • - einen Eingang zum Empfangen eines zu codierenden Audiosi­ gnals;
  • - eine Verarbeitungseinrichtung (2, 3; 15-19), die mit dem Eingang verbunden ist, um aus dem empfangenen Audiosignal x ein quantisiertes Audiosignal zu erzeugen;
  • - eine Vorhersageeinrichtung (12; 19), die mit der Verarbei­ tungseinrichtung (3) verbunden ist, um einen Satz von Lang­ zeitvorhersage-Koeffizienten A zu erzeugen, die dazu verwen­ det werden können, einen aktuellen Zeitrahmen des empfange­ nen Audiosignals unmittelbar aus mindestens einem vorigen Zeitrahmen des quantisierten Audiosignals vorherzusagen;
  • - eine Erzeugungseinrichtung (10-14; 20, 15) zum Erzeugen eines vorhergesagten Audiosignals unter Verwendung der Vorhersagekoeffizienten A und zum Vergleichen des empfange­ nen Audiosignals x mit dem vorhergesagten Audiosignal und Erzeugen eines Abweichungssignals E(k) für jedes von mehre­ ren Frequenzunterbändern;
  • - eine Quantisierungseinrichtung (3; 17) zum Quantisieren der Abweichungssignale E(k) zum Erzeugen eines Satzes quan­ tisierter Abweichungssignale (k); und
  • - eine Kombiniereinrichtung (5; 21) zum Kombinieren der quantisierten Abweichungssignale (k) und der Vorhersagekom­ ponenten A zum Erzeugen eines codierten Audiosignals.
6. Vorrichtung nach Anspruch 5, dadurch gekennzeichnet, daß die Erzeugungseinrichtung eine erste Transformations­ einrichtung (11) zum Transformieren des empfangenen Audiosi­ gnals x aus der Zeitdomäne in die Frequenzdomäne sowie eine zweite Transformationseinrichtung (13) zum Transformieren des vorhergesagten Audiosignals aus der Zeit- in die Fre­ quenzdomäne sowie eine Vergleichseinrichtung (14) aufweist, die so ausgebildet ist, daß sie die sich ergebenden Signale in der Frequenzdomäne innerhalb der Frequenzdomäne ver­ gleicht.
7. Vorrichtung nach Anspruch 6, dadurch gekennzeichnet, daß die Erzeugungseinrichtung so ausgebildet ist, daß sie das empfangene Audiosignal x und das vorhergesagte Audiosi­ gnal in der Zeitdomäne vergleicht.
8. Vorrichtung zum Decodieren eines codierten Audiosignals x, das ein quantisiertes Abweichungssignal (k) für jedes einer Vielzahl von Frequenzunterbändern des Audiosignals sowie, für jeden Zeitrahmen des Audiosignals, einen Satz von Vorhersagekoeffizienten A enthält, die dazu verwendet werden können, einen aktuellen Zeitrahmen xm des empfangenen Audio­ signals unmittelbar aus mindestens einem vorigen Zeitrahmen eines wiederhergestellten, quantisierten Audiosignals vor­ herzusagen; gekennzeichnet durch:
  • - einen Eingang zum Empfangen des codierten Audiosignals;
  • - eine Erzeugungseinrichtung (24, 25, 9) zum Erzeugen des wiederhergestellten, quantisierten Audiosignals aus den quantisierten Abweichungssignalen (k);
  • - eine Signalverarbeitungseinrichtung (26) zum Erzeugen eines vorhergesagten Audiosignals aus den Vorhersagekoeffi­ zienten A und dem wiederhergestellten Audiosignal ;
  • - wobei die Erzeugungseinrichtung eine erste Transformati­ onseinrichtung (25) zum Transformieren des vorhergesagten Audiosignals aus der Zeitdomäne in die Frequenzdomäne zum Erzeugen eines Satzes vorhergesagter Frequenzunterband-Si­ gnale (k), eine Kombiniereinrichtung (24) zum Kombinieren des Satzes vorhergesagter Frequenzunterband-Signale X(k) mit den quantisierten Abweichungssignalen (k) zum Erzeugen ei­ nes Satzes wiederhergestellter Frequenzunterband-Signale (k) sowie eine zweite Transformationseinrichtung (9) zum Ausführen einer Transformation von der Frequenz- in die Zeitdomäne hinsichtlich der wiederhergestellten Frequenzun­ terband-Signale (k) zum Erzeugen des wiederhergestellten, quantisierten Audiosignals aufweist.
DE19811039A 1997-03-14 1998-03-13 Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen Expired - Lifetime DE19811039B4 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI971108A FI114248B (fi) 1997-03-14 1997-03-14 Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
FI971108 1997-03-14

Publications (2)

Publication Number Publication Date
DE19811039A1 true DE19811039A1 (de) 1998-09-17
DE19811039B4 DE19811039B4 (de) 2005-07-21

Family

ID=8548401

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19811039A Expired - Lifetime DE19811039B4 (de) 1997-03-14 1998-03-13 Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen

Country Status (13)

Country Link
US (2) US6721700B1 (de)
EP (1) EP0966793B1 (de)
JP (2) JP3391686B2 (de)
KR (1) KR100469002B1 (de)
CN (1) CN1135721C (de)
AU (1) AU733156B2 (de)
DE (1) DE19811039B4 (de)
ES (1) ES2164414T3 (de)
FI (1) FI114248B (de)
FR (1) FR2761801B1 (de)
GB (1) GB2323759B (de)
SE (1) SE521129C2 (de)
WO (1) WO1998042083A1 (de)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2380640A (en) * 2001-08-21 2003-04-09 Micron Technology Inc Data compression method
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7016547B1 (en) 2002-06-28 2006-03-21 Microsoft Corporation Adaptive entropy encoding/decoding for screen capture content
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7433824B2 (en) * 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
DE60330198D1 (de) 2002-09-04 2009-12-31 Microsoft Corp Entropische Kodierung mittels Anpassung des Kodierungsmodus zwischen Niveau- und Lauflängenniveau-Modus
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
KR100524065B1 (ko) * 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
TWI220753B (en) * 2003-01-20 2004-09-01 Mediatek Inc Method for determining quantization parameters
US7688894B2 (en) 2003-09-07 2010-03-30 Microsoft Corporation Scan patterns for interlaced video content
US7782954B2 (en) 2003-09-07 2010-08-24 Microsoft Corporation Scan patterns for progressive video content
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
WO2005034092A2 (en) * 2003-09-29 2005-04-14 Handheld Entertainment, Inc. Method and apparatus for coding information
TWI227866B (en) * 2003-11-07 2005-02-11 Mediatek Inc Subband analysis/synthesis filtering method
US7933767B2 (en) * 2004-12-27 2011-04-26 Nokia Corporation Systems and methods for determining pitch lag for a current frame of information
DE602006020686D1 (de) * 2005-01-12 2011-04-28 Nippon Telegraph & Telephone Kodierverfahren und dekodierverfahren mit langzeitvorhersage, vorrichtungen, programm und aufzeichnungsmedium dafür
US7693709B2 (en) 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US7599840B2 (en) * 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
US7684981B2 (en) 2005-07-15 2010-03-23 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US7565018B2 (en) * 2005-08-12 2009-07-21 Microsoft Corporation Adaptive coding and decoding of wide-range coefficients
US8599925B2 (en) 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
US7933337B2 (en) 2005-08-12 2011-04-26 Microsoft Corporation Prediction of transform coefficients for image compression
GB2436192B (en) * 2006-03-14 2008-03-05 Motorola Inc Speech communication unit integrated circuit and method therefor
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
RU2464650C2 (ru) * 2006-12-13 2012-10-20 Панасоник Корпорэйшн Устройство и способ кодирования, устройство и способ декодирования
US8184710B2 (en) 2007-02-21 2012-05-22 Microsoft Corporation Adaptive truncation of transform coefficient data in a transform-based digital media codec
WO2008114075A1 (en) * 2007-03-16 2008-09-25 Nokia Corporation An encoder
US7774205B2 (en) 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
CN101075436B (zh) * 2007-06-26 2011-07-13 北京中星微电子有限公司 带补偿的音频编、解码方法及装置
US20090048827A1 (en) * 2007-08-17 2009-02-19 Manoj Kumar Method and system for audio frame estimation
EP2077551B1 (de) * 2008-01-04 2011-03-02 Dolby Sweden AB Audiokodierer und -dekodierer
WO2009132662A1 (en) * 2008-04-28 2009-11-05 Nokia Corporation Encoding/decoding for improved frequency response
US8179974B2 (en) 2008-05-02 2012-05-15 Microsoft Corporation Multi-level representation of reordered transform coefficients
KR20090122143A (ko) * 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8406307B2 (en) 2008-08-22 2013-03-26 Microsoft Corporation Entropy coding/decoding of hierarchically organized data
ES2671711T3 (es) * 2008-09-18 2018-06-08 Electronics And Telecommunications Research Institute Aparato de codificación y aparato de decodificación para transformar entre codificador basado en transformada de coseno discreta modificada y hetero codificador
CN102016530B (zh) * 2009-02-13 2012-11-14 华为技术有限公司 一种基音周期检测方法和装置
DE102010006573B4 (de) * 2010-02-02 2012-03-15 Rohde & Schwarz Gmbh & Co. Kg IQ-Datenkompression für Breitbandanwendungen
JP6173484B2 (ja) 2013-01-08 2017-08-02 ドルビー・インターナショナル・アーベー 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測
CN110062945B (zh) 2016-12-02 2023-05-23 迪拉克研究公司 音频输入信号的处理
CN112564713B (zh) * 2020-11-30 2023-09-19 福州大学 高效率低时延的动觉信号编解码器及编解码方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5921039B2 (ja) 1981-11-04 1984-05-17 日本電信電話株式会社 適応予測符号化方式
US4969192A (en) 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
GB8803390D0 (en) 1988-02-13 1988-03-16 Univ Belfast Method and apparatus for electrical signal coding
FR2628589B1 (fr) * 1988-03-14 1994-03-04 Etat Francais Codeur differentiel a filtre predicteur auto-adaptatif et decodeur utilisable en liaison avec un tel codeur
EP0364647B1 (de) * 1988-10-19 1995-02-22 International Business Machines Corporation Vektorquantisierungscodierer
IT1232084B (it) * 1989-05-03 1992-01-23 Cselt Centro Studi Lab Telecom Sistema di codifica per segnali audio a banda allargata
FR2646978B1 (fr) 1989-05-11 1991-08-23 France Etat Procede et installation a codage de signaux sonores
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
JPH04119542A (ja) 1990-09-07 1992-04-21 Nikon Corp 光磁気記録媒体カートリッジ
US5206884A (en) 1990-10-25 1993-04-27 Comsat Transform domain quantization technique for adaptive predictive coding
FI95085C (fi) 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
FI91345C (fi) 1992-06-24 1994-06-10 Nokia Mobile Phones Ltd Menetelmä kanavanvaihdon tehostamiseksi
BR9404725A (pt) * 1993-03-26 1999-06-15 Motorola Inc Processo de quantificação por vetor de um vetor de coeficiente de reflexão ótimo processo de codificação de fala sistema de comunicação de rádio e processo de armazenagem de vetores de coeficiente de reflexão
IT1270438B (it) * 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce
FI98163C (fi) * 1994-02-08 1997-04-25 Nokia Mobile Phones Ltd Koodausjärjestelmä parametriseen puheenkoodaukseen
DE69429620D1 (de) * 1994-10-28 2002-02-14 Rai Radiotelevisione Italiana Teilbandkodierung mit auf Tonhöhen basierter Prädiktionskodierung in jedem einzelnen Teilband
ATE191107T1 (de) * 1994-12-20 2000-04-15 Dolby Lab Licensing Corp Verfahren und gerät zum anwenden von wellenformprädiktion auf teilbänder in einem perzeptiven kodiersystem
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
TW321810B (de) * 1995-10-26 1997-12-01 Sony Co Ltd
JP3481027B2 (ja) * 1995-12-18 2003-12-22 沖電気工業株式会社 音声符号化装置
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi

Also Published As

Publication number Publication date
JPH10282999A (ja) 1998-10-23
CN1195930A (zh) 1998-10-14
SE9800776L (sv) 1998-09-15
CN1135721C (zh) 2004-01-21
WO1998042083A1 (en) 1998-09-24
JP3391686B2 (ja) 2003-03-31
SE521129C2 (sv) 2003-09-30
JP2003140697A (ja) 2003-05-16
FR2761801B1 (fr) 1999-12-31
US7194407B2 (en) 2007-03-20
ES2164414T3 (es) 2002-02-16
AU6216498A (en) 1998-10-12
US6721700B1 (en) 2004-04-13
GB2323759B (en) 2002-01-16
EP0966793B1 (de) 2001-09-19
SE9800776D0 (sv) 1998-03-10
FR2761801A1 (fr) 1998-10-09
FI971108A (fi) 1998-09-15
FI971108A0 (fi) 1997-03-14
GB2323759A (en) 1998-09-30
AU733156B2 (en) 2001-05-10
DE19811039B4 (de) 2005-07-21
EP0966793A1 (de) 1999-12-29
FI114248B (fi) 2004-09-15
GB9805294D0 (en) 1998-05-06
KR100469002B1 (ko) 2005-01-29
US20040093208A1 (en) 2004-05-13
KR20000076273A (ko) 2000-12-26

Similar Documents

Publication Publication Date Title
DE19811039B4 (de) Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
EP0954909B1 (de) Verfahren zum codieren eines audiosignals
EP0910928B1 (de) Codieren und decodieren von audiosignalen unter verwendung von intensity-stereo und prädiktion
EP0931386B1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
DE69833834T2 (de) Skalierbares Audiokodier-und Dekodierverfahren und Gerät
EP2022043B1 (de) Informationssignalcodierung
EP0846405B1 (de) Verfahren zur redundanzreduktion bei der codierung von mehrkanaligen signalen und vorrichtung zur dekodierung von redundanzreduzierten, mehrkanaligen signalen
DE69737489T2 (de) Formung des erkennbaren Rauschsignals in der Zeitdomäne mittels LPC-Voraussage im Frequenzraum
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE4320990B4 (de) Verfahren zur Redundanzreduktion
EP1495464B1 (de) Vorrichtung und verfahren zum codieren eines zeitdiskreten audiosignals und vorrichtung und verfahren zum decodieren von codierten audiodaten
DE102006051673A1 (de) Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
EP1397799B1 (de) Verfahren und vorrichtung zum verarbeiten von zeitdiskreten audio-abtastwerten
DE10236694A1 (de) Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
EP0962015B1 (de) Verfahren und vorrichtungen zum codieren von diskreten signalen bzw. zum decodieren von codierten diskreten signalen
DE102004009955B3 (de) Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
EP1697931A1 (de) Vorrichtung und verfahren zum ermitteln eines sch tzwerts
DE602004007550T2 (de) Verbesserte frequenzbereichs-fehlerverbergung
EP1023777B1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms
DE10331803A1 (de) Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung
DE60116809T2 (de) Vorrichtung zum Transkodieren eines Audiodatenstroms
EP1277346B1 (de) Vorrichtung und Verfahren zum Analysieren der spektralen Darstellung eines decodierten Zeitsignales
DE19742201C1 (de) Verfahren und Vorrichtung zum Codieren von Audiosignalen
DE19804584A1 (de) Verfahren und Vorrichtung zum Codieren und Decodieren von Audiosignalen

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8125 Change of the main classification

Ipc: G10L 1904

8328 Change in the person/name/address of the agent

Representative=s name: BECKER, KURIG, STRAUS, 80336 MUENCHEN

8364 No opposition during term of opposition
R081 Change of applicant/patentee

Owner name: NOKIA TECHNOLOGIES OY, FI

Free format text: FORMER OWNER: NOKIA MOBILE PHONES LTD., ESPOO, FI

R082 Change of representative

Representative=s name: BECKER, KURIG, STRAUS, DE

R071 Expiry of right