DE19811039A1 - Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen - Google Patents
Verfahren und Vorrichtungen zum Codieren und Decodieren von AudiosignalenInfo
- Publication number
- DE19811039A1 DE19811039A1 DE19811039A DE19811039A DE19811039A1 DE 19811039 A1 DE19811039 A1 DE 19811039A1 DE 19811039 A DE19811039 A DE 19811039A DE 19811039 A DE19811039 A DE 19811039A DE 19811039 A1 DE19811039 A1 DE 19811039A1
- Authority
- DE
- Germany
- Prior art keywords
- audio signal
- quantized
- signals
- predicted
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephone Function (AREA)
Description
Die Erfindung betrifft Verfahren und eine Vorrichtung zum
Codieren von Audiosignalen sowie ein Verfahren und eine Vor
richtung zum Decodieren derartiger Signale.
Es ist wohlbekannt, daß die Übertragung von Daten in digi
taler Form für erhöhte Signal/Rauschsignal(S/R)-Verhältnisse
und erhöhte Informationskapazität entlang einem Übertra
gungskanal sorgt. Es existiert jedoch dauernd der Wunsch,
die Kanalkapazität dadurch weiter zu erhöhen, daß digitale
Signale immer stärker komprimiert werden. Hinsichtlich Au
diosignalen werden herkömmlich zwei grundlegende Kompressi
ons-Grundprinzipien angewandt. Das erste derselben umfaßt
das Beseitigen statistischer oder determinierter Redundanzen
im Quellensignal, während es das zweite beinhaltet, im Quel
lensignal Elemente zu unterdrücken oder zu beseitigen, die
insoweit redundant sind, als das menschliche Wahrnehmungs
vermögen betroffen ist. In jüngerer Zeit wurde das letztere
Prinzip bei Audioanwendungen hoher Qualität vorherrschend,
und es beinhaltet typischerweise die Aufteilung eines Audio
signals in seine Frequenzkomponenten (manchmal als "Unter
bänder" bezeichnet), von denen jede mit einer Datengenauig
keit analysiert und quantisiert wird, die so bestimmt ist,
daß irrelevante (für den Hörer) Daten entfernt werden. Der
ISO(International Standard Organisation)-MPEG(Moving Pic
tures Expert Group)-Audiocodierungsstandard sowie andere
Audiocodierungsstandards verwenden dieses Prinzip und legen
es weiter fest. Jedoch verwendet der MPEG-Standard (und an
dere Standards) auch eine Technik, die als "adaptive Vorher
sage" bekannt ist, um eine noch weitere Verringerung der
Datenrate zu erzielen.
Die Funktion eines Codierers gemäß dem neuen MPEG-2-AAC-
Standard ist im einzelnen im internationalen Standardent
wurfdokument ISO/IEC DIS 13818-7 beschrieben. Dieser neue
MPEG-2-Standard verwendet lineare Vorhersage in Rückwärts
richtung mit 672 von 1024 Frequenzkomponenten. Es ist ins
Auge gefaßt, daß der neue MPEG-4-Standard ähnliche Erfor
dernisse aufweist. Jedoch führt eine derartig große Anzahl
von Frequenzkomponenten zu einem großen Berechnungsoverhead
aufgrund der Komplexität des Vorhersagealgorithmus, und dies
erfordert auch die Verfügbarkeit großer Mengen an Speicher,
um die berechneten sowie Zwischenkoeffizienten zu speichern.
Es ist wohlbekannt, daß es dann, wenn Einrichtungen dieses
Typs für adaptive Vorhersage in Rückwärtsrichtung in der
Frequenzdomäne verwendet werden, schwierig ist, die Rechner
belastung und die Speichererfordernisse weiter zu verrin
gern. Dies, da die Anzahl der Vorhersageeinrichtungen in der
Frequenzdomäne so groß ist, daß sogar ein sehr einfacher
adaptiver Algorithmus immer noch zu großer Komplexität bei
der Berechnung und zu großem Speicherbedarf führt. Während
es bekannt ist, dieses Problem unter Verwendung von Einrich
tungen zur adaptiven Vorhersage in Vorwärtsrichtung zu ver
meiden, wobei eine Aktualisierung im Codierer und eine Über
tragung an den Decodierer erfolgt, führt die Verwendung von
Einrichtungen zur adaptiven Vorhersage in Vorwärtsrichtung
in der Frequenzdomäne in unvermeidlicher Weise zu einer gro
ßen Menge an "Neben"-Information, da die Anzahl der Vorher
sageeinrichtungen so groß ist.
Der Erfindung liegt die Aufgabe zugrunde, Verfahren und Vor
richtungen zum Codieren und Decodieren von Audiosignalen zu
schaffen, die ohne komplexe Berechnungsabläufe und großen
Speicherbedarf realisierbar sind.
Diese Aufgabe ist hinsichtlich des Codierungsverfahrens
durch Anspruch 1, mit abhängigen Ansprüchen 2 und 3, hin
sichtlich des Decodierungsverfahrens durch Anspruch 4, hin
sichtlich der Codierungsvorrichtung durch Anspruch 5, mit
abhängigen Ansprüchen 6 und 7, und hinsichtlich der Decodie
rungsvorrichtung durch Anspruch 8 gelöst. Es wird ein Audio
signal unter Verwendung von Abweichungssignalen codiert, um
Redundanz in jedem von einer Vielzahl von Frequenz-Unterbän
dern des Audiosignals zu beseitigen, wobei zusätzlich Lang
zeit-Vorhersagekoeffizienten in der Zeitdomäne erzeugt wer
den, die es ermöglichen, einen aktuellen Rahmen des Audiosi
gnals aus einem oder mehreren früheren Rahmen vorherzusagen.
Beim Codierungsverfahren gemäß Anspruch 1 wird eine Kompres
sion eines Audiosignals unter Verwendung einer Einrichtung
für adaptive Vorhersage in Vorwärtsrichtung in der Zeitdomä
ne vorgenommen. Für jeden Zeitrahmen eines empfangenen Si
gnals ist es nur erforderlich, einen einzelnen Satz von
Koeffizienten für adaptive Vorhersage in Vorwärtsrichtung zu
erzeugen und an den Decodierer zu übertragen. Dies steht im
Gegensatz zu bekannten Techniken für adaptive Vorhersage in
Vorwärtsrichtung, die die Erzeugung eines Satzes von Vorher
sagekoeffizienten für jedes Frequenzunterband jedes Zeitrah
mens erfordern. Im Vergleich mit den Vorhersagegewinnen, wie
sie durch die Erfindung erzielt werden, ist die Nebeninfor
mation der Langzeit-Vorhersageeinrichtung vernachlässigbar.
Bestimmte Ausführungsformen der Erfindung ermöglichen eine
Verringerung der Komplexität der Rechenvorgänge und des
Speicherbedarfs. Insbesondere besteht im Vergleich mit der
Verwendung von adaptiver Vorhersage in Rückwärtsrichtung
kein Erfordernis, die Vorhersagekoeffizienten im Decodierer
neu zu berechnen. Bestimmte Ausführungsformen der Erfindung
können auch schneller auf Signaländerungen als herkömmliche
Einrichtungen für adaptive Vorhersage in Rückwärtsrichtung
reagieren.
Beim Verfahren gemäß Anspruch 2 wird das quantisierte Audio
signal x dadurch erzeugt, daß das vorhergesagte Signal und
das quantisierte Abweichungssignal entweder in der Zeitdomä
ne oder der Frequenzdomäne aufsummiert werden.
Vorzugsweise wird die Quantisierung der Abweichungssignale
gemäß einem psychoakustischen Modell ausgeführt.
Ausführungsformen des erfindungsgemäßen Decodierungsverfah
rens sind insbesondere dann anwendbar, wenn nur ein Unter
satz aller möglichen quantisierten Abweichungssignale (k)
empfangen wird, wobei einige Unterbanddaten direkt durch die
Übertragung der Audiounterbandsignale X(k) übertragen wer
den. Die Signale (k) und X(k) werden geeignet kombiniert,
bevor die Frequenz-Zeit-Transformation ausgeführt wird.
Für ein besseres Verständnis der Erfindung und um zu veran
schaulichen, wie dieselbe realisierbar ist, wird nun bei
spielhaft auf die beigefügten Zeichnungen Bezug genommen.
Fig. 1 zeigt schematisch einen Codierer zum Codieren eines
empfangenen Audiosignals;
Fig. 2 zeigt schematisch einen Codierer zum Decodieren eines
mit dem Codierer von Fig. 1 codierten Audiosignals;
Fig. 3 zeigt den Codierer von Fig. 1 einschließlich eines
Vorhersagewerkzeugs des Codierers mit größeren Einzelheiten;
Fig. 4 zeigt den Codierer von Fig. 2 einschließlich eines
Vorhersagewerkzeugs des Codierers mit größeren Einzelheiten;
und
Fig. 5 zeigt im einzelnen eine Modifizierung des Codierers
von Fig. 1, wobei ein alternatives Vorhersagewerkzeug ver
wendet ist.
In Fig. 1 ist ein Blockdiagramm eines Codierers dargestellt,
der eine Codierungsfunktion ausübt, die allgemein gemäß dem
MPEG-2-AAC-Standard definiert ist. Das Eingangssignal des
Codierers ist ein abgetastetes, einphasiges Signal x, dessen
Abtastpunkte in Zeitrahmen oder Blöcke von 2N Punkten grup
piert sind, d. h.:
xm = (xm(0),xm(1), . . .,xm(2N-1))T (1)
wobei m der Blockindex ist und T einen Transponiervorgang
bezeichnet. Die Gruppierung der Abtastpunkte wird durch ein
Filterbank-Werkzeug 1 ausgeführt, das auch eine modifizier
te, diskrete Cosinustransformation (MDCT) an jedem indivi
duellen Rahmen des Audiosignals ausführt, um einen Satz von
Frequenzunterband-Koeffizienten zu erzeugen:
Xm = (Xm(0),Xm(1), . . .,Xm(N-1))T (2)
Die Unterbänder sind im MPEG-Standard definiert. Die MDCT in
Vorwärtsrichtung ist wie folgt definiert:
wobei f(i) das Analyse-Synthese-Fenster ist, bei dem es sich
um ein symmetrisches Fenster handelt, so daß ein Additi
ons-Überlappungs-Effekt die Einheitsverstärkung für das Si
gnal erzeugt.
Die Frequenzunterband-Signale X(k) werden ihrerseits an
einem Vorhersagewerkzeug 2 (das unten detaillierter be
schrieben wird) gegeben, das versucht, Langzeitredundanz in
jedem der Unterbandsignale zu beseitigen. Das Ergebnis ist
ein Satz von Frequenzunterband-Abweichungssignalen:
Em(k)=(Em(0),Em(1), . . .,Em(N-1))T (4)
die Langzeitänderungen in jeweiligen Unterbändern anzeigen,
sowie ein Satz von Koeffizienten A für adaptive Vorhersage
in Vorwärtsrichtung für jeden Rahmen.
Die Unterband-Abweichungssignale E(k) werden an eine Quanti
sierungseinrichtung 3 gegeben, die jedes Signal mit einer
Anzahl von Bits quantisiert, die durch ein psychoakustisches
Modell bestimmt ist. Dieses Modell wird durch eine Steuerung
4 angewandt. Wie erörtert, wird ein psychoakustisches Modell
zum Nachbilden des maskierenden Verhaltens des menschlichen
Hörsystems verwendet. Die quantisierten Abweichungssignale
(k) und die Vorhersagekoeffizienten A werden dann in einem
Bitstrommultiplexer 5 zur Übertragung über einen Übertra
gungskanal 6 kombiniert.
Fig. 2 zeigt die allgemeine Anordnung eines Decodierers zum
Decodieren eines mit dem Codierer von Fig. 1 codierten Au
diosignals. Ein Bitstrom-Demultiplexer 7 trennt zunächst die
Vorhersagekoeffizienten A von den quantisierten Abweichungs
signalen (k) ab, und er teilt die Abweichungssignale in die
gesonderten Unterbandsignale auf. Die Vorhersagekoeffizien
ten A und die quantisierten Abweichungs-Unterbandsignale
(k) werden an ein Vorhersagewerkzeug 8 geliefert, das den
im Codierer ausgeführten Vorhersageprozeß umkehrt, d. h.,
daß das Vorhersagewerkzeug die im Codierer herausgenommene
Redundanz wieder einführt, um rekonstruierte quantisierte
Unterbandsignale (k) zu erzeugen. Ein Filterbank-Werkzeug 9
gewinnt dann das Signal in der Zeitdomäne durch inverse
Transformation hinsichtlich der empfangenen Version (k)
wieder, was wie folgt beschrieben ist:
wobei k(i), i = 0, . . . 2N-1 die Invers-Transformierte von
ist:
was eine Annäherung an das ursprüngliche Audiosignal x dar
stellt.
Fig. 3 veranschaulicht das Vorhersageverfahren des Codierers
von Fig. 1 in detaillierterer Weise. Unter Verwendung der
quantisierten Frequenzunterband-Abweichungssignale (k) wird
durch eine Signalverarbeitungseinheit 10 ein Satz quanti
sierter Frequenzunterband-Signale X(k) erzeugt. Diese Signa
le X(k) werden ihrerseits an eine Filterbank 11 gegeben, die
an den Signalen eine inverse, modifizierte, diskrete Cosi
nustransformation (IMDCT) ausführt, um ein quantisiertes
Signal x in der Zeitdomäne zu erzeugen. Dieses Signal x wird
dann an ein Werkzeug 12 für Langzeitvorhersage gegeben, das
auch das Audioeingangssignal x empfängt. Dieses Vorhersage
werkzeug 12 verwendet eine Langzeit(LT)-Vorhersageeinrich
tung zum Entfernen der Redundanz im Audiosignal, wie sie im
aktuellen Rahmen m+1 vorliegt, auf Grundlage der zuvor quan
tisierten Daten. Die Übertragungsfunktion P dieser Vorhersa
geeinrichtung ist die folgende:
wobei α eine Langzeitverzögerung im Bereich von 1 bis 1024
Abtastwerten repräsentiert und bk Vorhersagekoeffizienten
sind. Für m1 = m2 = 0 entspricht die Vorhersageeinrichtung
einer Stufe, während sie für m1 = m2 = 1 drei Stufen ent
spricht.
Die Parameter α und bk werden durch Minimieren der mittleren
quadratischen Abweichung nach der LT-Vorhersage über eine
Periode von 2N Abtastwerten bestimmt. Für eine Vorhersage
einrichtung mit einer Stufe ist der LT-Vorhersagerest r(i)
wie folgt gegeben:
wobei x das Audiosignal in der Zeitdomäne ist und das
quantisierte Signal in der Zeitdomäne ist. Der mittlere
quadratische Rest R ist wie folgt gegeben:
Wenn ∂R/∂b = 0 gesetzt wird, ergibt sich:
und wenn b in die Gleichung (7) eingesetzt wird, ergibt
sich:
Ein Minimieren von R bedeutet ein Maximieren des zweiten
Terms auf der rechten Seite der Gleichung (9). Dieser Term
wird für alle möglichen Werte von α über seinen spezifizier
ten Bereich berechnet, und es wird derjenige Wert von α ge
wählt, der diesen Term maximiert. Die Energie im Nenner der
Gleichung (9), die mit Ω bezeichnet wird, kann leicht aus
der Verzögerung (α-1) auf α aktualisiert werden, anstatt
daß eine neue Berechnung erfolgt, wenn folgendes verwendet
wird:
Wenn eine LT-Vorhersageeinrichtung mit einer Stufe verwendet
wird, wird die Gleichung (8) dazu verwendet, den Vorhersage
koeffizienten bj zu berechnen. Für eine Vorhersageeinrich
tung mit j Stufen wird zunächst die LT-Vorhersageverzögerung
αdadurch bestimmt, daß der zweite Term der Gleichung (9)
maximiert wird, und dann wird ein Satz von j×j Gleichungen
gelöst, um die j Vorhersagekoeffizienten zu berechnen.
Die LT-Vorhersageparameter A sind die Verzögerung α und der
Vorhersagekoeffizient bj. Die Verzögerung wird abhängig vom
verwendeten Bereich mit 9 bis 11 Bits quantisiert. Am üb
lichsten werden 10 Bits verwendet, mit 1024 möglichen Werten
im Bereich von 1 bis 1024. Um die Anzahl der Bits zu verrin
gern, können die LT-Vorhersageverzögerungen in geradzahligen
Rahmen mit 5 Bits delta-codiert werden. Versuche zeigen,
daß es ausreichend ist, den Gewinn mit 3 bis 6 Bits zu
quantisieren. Aufgrund der ungleichförmigen Verteilung des
Gewinns muß eine ungleichförmige Quantisierung verwendet
werden.
Beim obenbeschriebenen Verfahren ist nicht immer die Stabi
lität des LT-Synthesefilters 1/P(z) garantiert. Für eine
Vorhersageeinrichtung mit einer Stufe ist die Stabilitätsbe
dingung |b| ≦ 1. Daher kann Stabilisierung leicht ausgeführt
werden, wenn immer dann |b| = 1 eingestellt wird, wenn
|b| ≦ 1 vorliegt. Bei einer Vorhersageeinrichtung mit drei
Stufen kann ein anderer Stabilisierungsablauf verwendet wer
den, wie er von R. P. Ramachandran und P. Kabel in "Stabili
ty and performance analysis of pitch filters in speech co
ders", IEEE Trans. ASSP, Vol. 35, No. 7, S. 937-946, Juli
1987 beschrieben ist. Jedoch ist die Instabilität des
LT-Synthesefilters nicht allzu schädlich hinsichtlich der Qua
lität des wiederhergestellten Signals. Ein instabiles Filter
dauert für einige wenige Rahmen an (was die Energie erhöht),
jedoch werden schließlich stabile Perioden angetroffen, so
daß das Ausgangssignal nicht dauernd mit der Zeit ansteigt.
Nachdem die Koeffizienten der LT-Vorhersageeinrichtung be
stimmt sind, kann das vorhergesagte Signal für den Rahmen
(m+1) bestimmt werden:
Dann wird das vorhergesagte Signal in der Zeitdomäne an
eine Filterbank 13 gegeben, die eine MDCT am Signal aus
führt, um vorhergesagte spektrale Koeffizienten m+1(k) für
den Rahmen (m+1) zu erzeugen. Die vorhergesagten spektralen
Koeffizienten (k) werden dann in einem Subtrahierer 14 von
den spektralen Koeffizienten X(k) subtrahiert.
Um sicherzustellen, daß eine Vorhersage nur dann verwendet
wird, wenn sie zu einem Codierungsgewinn führt, ist eine ge
eignete Steuerung für die Vorhersageeinrichtung erforder
lich, und es muß eine kleine Menge an Steuerungsinformat
ion für die Vorhersageeinrichtung an den Decodierer über
tragen werden. Diese Funktion wird im Subtrahierer 14 ausge
führt. Das Steuerungsschema für die Vorhersageeinrichtung
ist dasselbe wie dasjenige für eine Vorrichtung für adaptive
Vorhersage in Rückwärtsrichtung, wie es gemäß MPEG-2-Advanc
ed Audio Coding (AAC) verwendet wurde. Die Steuerungsinfor
mation für die Vorhersageeinrichtung für jeden Rahmen, wie
sie als Nebeninformation übertragen wird, wird in zwei
Schritten bestimmt. Als erstes wird für jedes Skalierungs
faktorband bestimmt, ob eine Vorhersage zu einem Codierungs
gewinn führt oder nicht, und falls ein Gewinn erzielt wird,
wird das Bit predictor_used für dieses Skalierungsfaktorband
auf Eins gesetzt. Nachdem dies für alle Skalierungsfaktor
bänder erfolgte, wird ermittelt, ob der Gesamtcodierungsge
winn durch Vorhersage in diesem Rahmen zumindest den zusätz
lichen Bitbedarf für die Nebeninformation für die Vorhersa
geeinrichtung kompensiert. Falls ja, wird das Bit predictor
data_present auf Eins gesetzt, und es wird die vollständige
Nebeninformation einschließlich derjenigen, die zum Rückset
zen der Vorhersageeinrichtung erforderlich ist, übertragen,
und der Wert der Vorhersageabweichung wird an den Quantisie
rer geliefert. Andernfalls wird das Bit predictor_data_pre
sent auf Null gesetzt, und die Bits prediction_used werden
alle auf Null rückgesetzt und nicht übertragen. In diesem
Fall wird der Spektralkomponentenwert an den Quantisierer 3
geliefert. Wie oben beschrieben, arbeitet die Steuerung für
die Vorhersageeinrichtung als erstes für alle Vorhersageein
richtungen für ein Skalierungsfaktorband, worauf ein zweiter
Schritt über alle Skalierungsfaktorbänder folgt.
Es ist ersichtlich, daß es das Ziel der LT-Vorhersage ist,
den größten Gesamtvorhersagegewinn zu erzielen. Mit G1 sei
der Vorhersagegewinn im Frequenzunterband 1 bezeichnet. Der
Gesamtvorhersagegewinn in einem vorgegebenen Rahmen kann
dann wie folgt berechnet werden:
Wenn der Gewinn den zusätzlichen Bitbedarf für die Informa
tion auf der Seite der Vorhersageeinrichtung kompensiert,
d. h., wenn G < T (dB) gilt, wird die vollständige Nebenin
formation übertragen, und es werden die Vorhersageeinrich
tungen eingeschaltet, die positive Gewinne erzeugen. Andern
falls werden die Vorhersageeinrichtungen nicht verwendet.
Die durch das vorstehend dargelegte Verfahren erhaltenen LP-
Parameter stehen nicht in direktem Zusammenhang mit einer
Gewinnmaximierung. Wenn jedoch der Gewinn für jeden Block
und für jede Verzögerung innerhalb des ausgewählten Bereichs
(1 bis 1024 bei diesem Beispiel) berechnet wird, und wenn
diejenige Verzögerung ausgewählt wird, die den größten Ge
samtvorhersagegewinn erzeugt, ist der Vorhersageprozeß op
timiert. Die ausgewählte Verzögerung α und die entsprechen
den Koeffizienten b werden als Nebeninformation mit den
quantisierten Abweichungs-Unterbandsignalen übertragen. Wäh
rend die Komplexität der Berechnung seitens des Codierers
erhöht ist, ergibt sich am Decodierer keine Erhöhung der
Komplexität.
Fig. 4 zeigt den Decodierer von Fig. 2 mit mehr Einzelhei
ten. Das codierte Audiosignal wird durch den Bitstrom-Demul
tiplexer 7 vom Übertragungskanal 6 empfangen, wie oben be
schrieben. Der Bitstrom-Demultiplexer 7 trennt die Vorhersa
gekoeffizienten A und die quantisierten Abweichungssignale
(k), und er liefert diese an das Vorhersagewerkzeug 8. Die
ses Werkzeug umfaßt eine Kombiniereinrichtung 24, die die
quantisierten Abweichungssignale (k) und ein vorhergesagtes
Audiosignal (k) in der Frequenzdomäne kombiniert, um ein
wiederhergestelltes Audiosignal (k) ebenfalls in der Fre
quenzdomäne zu erzeugen. Die Filterbank 9 setzt das wieder
hergestellte Signal (k) aus der Frequenzdomäne in die Zeit
domäne um, um ein wiederhergestelltes Audiosignal in der
Zeitdomäne zu erzeugen. Dieses Signal wird seinerseits an
ein Langzeit-Vorhersagewerkzeug rückgeführt, das ebenfalls
die Vorhersagekoeffizienten A empfängt. Dieses Langzeit-Vor
hersagewerkzeug 26 erzeugt einen vorhergesagten, aktuellen
Zeitrahmen aus dem zuvor wiederhergestellten Zeitrahmen un
ter Verwendung der Vorhersagekoeffizienten für den aktuellen
Rahmen. Eine Filterbank 25 transformiert das vorhergesagte
Signal .
Es ist ersichtlich, daß die vom Codierer übertragene Steue
rungsinformation für die Vorhersageeinrichtung seitens des
Decodierers dazu verwendet werden kann, den Decodierungsvor
gang zu steuern. Insbesondere können in der Kombinierein
richtung 24 die Bits predictor_used dazu verwendet werden,
zu ermitteln, ob in irgendeinem vorgegebenen Frequenzband
Vorhersage verwendet wurde oder nicht.
In Fig. 5 ist eine alternative Realisierung des Audiosignal
codierers von Fig. 1 dargestellt, bei der das zu codierende
Audiosignal durch einen Komparator 15 mit dem vorhergesagten
Signal in der Zeitdomäne verglichen wird, um ein Abwei
chungssignal e ebenfalls in der Zeitdomäne zu erzeugen. Ein
Filterbank-Werkzeug 16 setzt dann das Abweichungssignal von
der Zeitdomäne in die Frequenzdomäne um, um einen Satz von
Frequenzunterband-Abweichungssignalen E(k) zu erzeugen. Die
se Signale werden dann durch eine Quantisierungseinrichtung
17 quantisiert, um einen Satz quantisierter Abweichungssi
gnale (k) zu erzeugen.
Dann wird eine zweite Filterbank 18 dazu verwendet, die
quantisierten Abweichungssignale (k) wieder in die Zeitdo
mäne zurückzutransformieren, was zu einem Signal führt.
Dieses in der Zeitdomäne quantisierte Abweichungssignal
wird dann in einer Signalverarbeitungseinheit 19 mit dem
vorhergesagten Audiosignal in der Zeitdomäne kombiniert,
um ein quantisiertes Audiosignal zu erzeugen. Ein Vorher
sagewerkzeug 20 führt dieselbe Funktion wie das Werkzeug 12
des Codierers von Fig. 3 aus, nämlich die Erzeugung des vor
hergesagten Audiosignals und des Vorhersagekoeffizienten
A. Die Vorhersagekoeffizienten und die quantisierten Abwei
chungssignale werden in einem Bitstrommultiplexer 21 zur
Übertragung über den Übertragungskanal 22 kombiniert. Wie
oben beschrieben, werden die Abweichungssignale durch eine
Steuerung 23 gemäß einem psychoakustischen Modell quanti
siert.
Die obenbeschriebenen Audiosignal-Codierungsalgorithmen er
möglichen die Kompression von Audiosignalen bei niedrigen
Bitraten. Die Technik beruht auf Langzeit(LT)-Vorhersage. Im
Vergleich mit bekannten Techniken für adaptive Vorhersage in
Rückwärtsrichtung liefern die hier beschriebenen Techniken
höhere Vorhersagegewinne für Musiksignale von Einzelinstru
menten und für Sprachsignale, während sie nur geringe Kom
plexität der Rechenvorgänge erfordern.
Claims (8)
1. Verfahren zum Codieren eines Audiosignals, gekennzeich
net durch die folgenden Schritte:
- - Empfangen eines zu codierenden Audiosignals;
- - Erzeugen eines quantisierten Audiosignals aus dem emp fangenen Audiosignal x;
- - Erzeugen eines Satzes von Langzeitvorhersage-Koeffizienten A, die dazu verwendet werden können, einen aktuellen Zeit rahmen des empfangenen Audiosignals unmittelbar aus mindes tens einem vorigen Zeitrahmen des quantisierten Audiosignals vorherzusagen;
- - Verwenden der Vorhersagekoeffizienten A zum Erzeugen eines vorhergesagten Audiosignals ;
- - Vergleichen des empfangenen Audiosignals x mit dem vorher gesagten Audiosignal und Erzeugen eines Abweichungssignals E(k) für jedes von mehreren Frequenzunterbändern;
- - Quantisieren der Abweichungssignale (k) zum Erzeugen eines Satzes quantisierter Abweichungssignale (k); und
- - Kombinieren der quantisierten Abweichungssignale E(k) und der Vorhersagekomponenten A zum Erzeugen eines codierten Audiosignals.
2. Verfahren nach Anspruch 1, gekennzeichnet durch:
- - Transformieren des im Rahmen xm empfangenen Audiosignals x aus der Zeitdomäne in die Frequenzdomäne, um einen Satz von Frequenzunterband-Signalen X(k) zu erzeugen; und
- - Transformieren des vorhergesagten Audiosignals aus der Zeitdomäne in die Frequenzdomäne, um einen Satz vorhergesag ter Frequenzunterband-Signale (k) zu erzeugen;
- - wobei der Vergleich zwischen dem empfangenen Audiosignal x und dem vorhergesagten Audiosignal in der Frequenzdomäne ausgeführt wird und die jeweiligen Unterbandsignale mitein ander verglichen werden, um die Frequenzunterband-Abwei chungssignale E(k) zu erzeugen.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß
der Vergleich zwischen dem empfangenen Audiosignal x und dem
vorhergesagten Audiosignal in der Zeitdomäne ausgeführt
wird, um ein Abweichungssignal e ebenfalls in der Zeitdomäne
zu erzeugen, und das Abweichungssignal e aus der Zeit- in
die Frequenzdomäne umgesetzt wird, um die mehreren Frequenz
unterband-Abweichungssignale E(k) zu erzeugen.
4. Verfahren zum Decodieren eines codierten Audiosignals,
gekennzeichnet durch die folgenden Schritte:
- - Empfangen eines codierten Audiosignals, das ein quanti siertes Abweichungssignal (k) für jedes einer Vielzahl von Frequenzunterbändern des Audiosignals sowie, für jeden Zeit rahmen des Audiosignals, einen Satz von Vorhersagekoeffi zienten A enthält, die dazu verwendet werden können, einen aktuellen Zeitrahmen xm des empfangenen Audiosignals unmit telbar aus mindestens einem vorigen Zeitrahmen eines wieder hergestellten, quantisierten Audiosignals vorherzusagen;
- - Erzeugen des wiederhergestellten, quantisierten Audiosi gnals x aus den quantisierten Abweichungssignalen E(k);
- - Verwenden der Vorhersagekoeffizienten A und des quanti sierten Audiosignals zum Erzeugen eines vorhergesagten Audiosignals ;
- - Transformieren des vorhergesagten Audiosignals aus der Zeitdomäne in die Frequenzdomäne, um einen Satz vorhergesag ter Frequenzunterband-Signale (k) für Kombination mit den quantisierten Abweichungssignalen (k) zu erzeugen, um einen Satz wiederhergestellter Frequenzunterband-Signale (k) zu erzeugen; und
- - Ausführen einer Transformation von der Frequenz- in die Zeitdomäne an den wiederhergestellten Frequenzunterband-Si gnalen (k), um das wiederhergestellte, quantisierte Audio signal zu erzeugen.
5. Vorrichtung zum Codieren eines Audiosignals, gekenn
zeichnet durch:
- - einen Eingang zum Empfangen eines zu codierenden Audiosi gnals;
- - eine Verarbeitungseinrichtung (2, 3; 15-19), die mit dem Eingang verbunden ist, um aus dem empfangenen Audiosignal x ein quantisiertes Audiosignal zu erzeugen;
- - eine Vorhersageeinrichtung (12; 19), die mit der Verarbei tungseinrichtung (3) verbunden ist, um einen Satz von Lang zeitvorhersage-Koeffizienten A zu erzeugen, die dazu verwen det werden können, einen aktuellen Zeitrahmen des empfange nen Audiosignals unmittelbar aus mindestens einem vorigen Zeitrahmen des quantisierten Audiosignals vorherzusagen;
- - eine Erzeugungseinrichtung (10-14; 20, 15) zum Erzeugen eines vorhergesagten Audiosignals unter Verwendung der Vorhersagekoeffizienten A und zum Vergleichen des empfange nen Audiosignals x mit dem vorhergesagten Audiosignal und Erzeugen eines Abweichungssignals E(k) für jedes von mehre ren Frequenzunterbändern;
- - eine Quantisierungseinrichtung (3; 17) zum Quantisieren der Abweichungssignale E(k) zum Erzeugen eines Satzes quan tisierter Abweichungssignale (k); und
- - eine Kombiniereinrichtung (5; 21) zum Kombinieren der quantisierten Abweichungssignale (k) und der Vorhersagekom ponenten A zum Erzeugen eines codierten Audiosignals.
6. Vorrichtung nach Anspruch 5, dadurch gekennzeichnet,
daß die Erzeugungseinrichtung eine erste Transformations
einrichtung (11) zum Transformieren des empfangenen Audiosi
gnals x aus der Zeitdomäne in die Frequenzdomäne sowie eine
zweite Transformationseinrichtung (13) zum Transformieren
des vorhergesagten Audiosignals aus der Zeit- in die Fre
quenzdomäne sowie eine Vergleichseinrichtung (14) aufweist,
die so ausgebildet ist, daß sie die sich ergebenden Signale
in der Frequenzdomäne innerhalb der Frequenzdomäne ver
gleicht.
7. Vorrichtung nach Anspruch 6, dadurch gekennzeichnet,
daß die Erzeugungseinrichtung so ausgebildet ist, daß sie
das empfangene Audiosignal x und das vorhergesagte Audiosi
gnal in der Zeitdomäne vergleicht.
8. Vorrichtung zum Decodieren eines codierten Audiosignals
x, das ein quantisiertes Abweichungssignal (k) für jedes
einer Vielzahl von Frequenzunterbändern des Audiosignals
sowie, für jeden Zeitrahmen des Audiosignals, einen Satz von
Vorhersagekoeffizienten A enthält, die dazu verwendet werden
können, einen aktuellen Zeitrahmen xm des empfangenen Audio
signals unmittelbar aus mindestens einem vorigen Zeitrahmen
eines wiederhergestellten, quantisierten Audiosignals vor
herzusagen; gekennzeichnet durch:
- - einen Eingang zum Empfangen des codierten Audiosignals;
- - eine Erzeugungseinrichtung (24, 25, 9) zum Erzeugen des wiederhergestellten, quantisierten Audiosignals aus den quantisierten Abweichungssignalen (k);
- - eine Signalverarbeitungseinrichtung (26) zum Erzeugen eines vorhergesagten Audiosignals aus den Vorhersagekoeffi zienten A und dem wiederhergestellten Audiosignal ;
- - wobei die Erzeugungseinrichtung eine erste Transformati onseinrichtung (25) zum Transformieren des vorhergesagten Audiosignals aus der Zeitdomäne in die Frequenzdomäne zum Erzeugen eines Satzes vorhergesagter Frequenzunterband-Si gnale (k), eine Kombiniereinrichtung (24) zum Kombinieren des Satzes vorhergesagter Frequenzunterband-Signale X(k) mit den quantisierten Abweichungssignalen (k) zum Erzeugen ei nes Satzes wiederhergestellter Frequenzunterband-Signale (k) sowie eine zweite Transformationseinrichtung (9) zum Ausführen einer Transformation von der Frequenz- in die Zeitdomäne hinsichtlich der wiederhergestellten Frequenzun terband-Signale (k) zum Erzeugen des wiederhergestellten, quantisierten Audiosignals aufweist.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI971108A FI114248B (fi) | 1997-03-14 | 1997-03-14 | Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen |
FI971108 | 1997-03-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE19811039A1 true DE19811039A1 (de) | 1998-09-17 |
DE19811039B4 DE19811039B4 (de) | 2005-07-21 |
Family
ID=8548401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19811039A Expired - Lifetime DE19811039B4 (de) | 1997-03-14 | 1998-03-13 | Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen |
Country Status (13)
Country | Link |
---|---|
US (2) | US6721700B1 (de) |
EP (1) | EP0966793B1 (de) |
JP (2) | JP3391686B2 (de) |
KR (1) | KR100469002B1 (de) |
CN (1) | CN1135721C (de) |
AU (1) | AU733156B2 (de) |
DE (1) | DE19811039B4 (de) |
ES (1) | ES2164414T3 (de) |
FI (1) | FI114248B (de) |
FR (1) | FR2761801B1 (de) |
GB (1) | GB2323759B (de) |
SE (1) | SE521129C2 (de) |
WO (1) | WO1998042083A1 (de) |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2380640A (en) * | 2001-08-21 | 2003-04-09 | Micron Technology Inc | Data compression method |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7016547B1 (en) | 2002-06-28 | 2006-03-21 | Microsoft Corporation | Adaptive entropy encoding/decoding for screen capture content |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
US7433824B2 (en) * | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
DE60330198D1 (de) | 2002-09-04 | 2009-12-31 | Microsoft Corp | Entropische Kodierung mittels Anpassung des Kodierungsmodus zwischen Niveau- und Lauflängenniveau-Modus |
JP4676140B2 (ja) | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
KR100524065B1 (ko) * | 2002-12-23 | 2005-10-26 | 삼성전자주식회사 | 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치 |
TWI220753B (en) * | 2003-01-20 | 2004-09-01 | Mediatek Inc | Method for determining quantization parameters |
US7688894B2 (en) | 2003-09-07 | 2010-03-30 | Microsoft Corporation | Scan patterns for interlaced video content |
US7782954B2 (en) | 2003-09-07 | 2010-08-24 | Microsoft Corporation | Scan patterns for progressive video content |
US7724827B2 (en) * | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
WO2005034092A2 (en) * | 2003-09-29 | 2005-04-14 | Handheld Entertainment, Inc. | Method and apparatus for coding information |
TWI227866B (en) * | 2003-11-07 | 2005-02-11 | Mediatek Inc | Subband analysis/synthesis filtering method |
US7933767B2 (en) * | 2004-12-27 | 2011-04-26 | Nokia Corporation | Systems and methods for determining pitch lag for a current frame of information |
DE602006020686D1 (de) * | 2005-01-12 | 2011-04-28 | Nippon Telegraph & Telephone | Kodierverfahren und dekodierverfahren mit langzeitvorhersage, vorrichtungen, programm und aufzeichnungsmedium dafür |
US7693709B2 (en) | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
US7684981B2 (en) | 2005-07-15 | 2010-03-23 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US7539612B2 (en) * | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US7565018B2 (en) * | 2005-08-12 | 2009-07-21 | Microsoft Corporation | Adaptive coding and decoding of wide-range coefficients |
US8599925B2 (en) | 2005-08-12 | 2013-12-03 | Microsoft Corporation | Efficient coding and decoding of transform blocks |
US7933337B2 (en) | 2005-08-12 | 2011-04-26 | Microsoft Corporation | Prediction of transform coefficients for image compression |
GB2436192B (en) * | 2006-03-14 | 2008-03-05 | Motorola Inc | Speech communication unit integrated circuit and method therefor |
DE102006022346B4 (de) * | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
RU2464650C2 (ru) * | 2006-12-13 | 2012-10-20 | Панасоник Корпорэйшн | Устройство и способ кодирования, устройство и способ декодирования |
US8184710B2 (en) | 2007-02-21 | 2012-05-22 | Microsoft Corporation | Adaptive truncation of transform coefficient data in a transform-based digital media codec |
WO2008114075A1 (en) * | 2007-03-16 | 2008-09-25 | Nokia Corporation | An encoder |
US7774205B2 (en) | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
CN101075436B (zh) * | 2007-06-26 | 2011-07-13 | 北京中星微电子有限公司 | 带补偿的音频编、解码方法及装置 |
US20090048827A1 (en) * | 2007-08-17 | 2009-02-19 | Manoj Kumar | Method and system for audio frame estimation |
EP2077551B1 (de) * | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audiokodierer und -dekodierer |
WO2009132662A1 (en) * | 2008-04-28 | 2009-11-05 | Nokia Corporation | Encoding/decoding for improved frequency response |
US8179974B2 (en) | 2008-05-02 | 2012-05-15 | Microsoft Corporation | Multi-level representation of reordered transform coefficients |
KR20090122143A (ko) * | 2008-05-23 | 2009-11-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US8406307B2 (en) | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
ES2671711T3 (es) * | 2008-09-18 | 2018-06-08 | Electronics And Telecommunications Research Institute | Aparato de codificación y aparato de decodificación para transformar entre codificador basado en transformada de coseno discreta modificada y hetero codificador |
CN102016530B (zh) * | 2009-02-13 | 2012-11-14 | 华为技术有限公司 | 一种基音周期检测方法和装置 |
DE102010006573B4 (de) * | 2010-02-02 | 2012-03-15 | Rohde & Schwarz Gmbh & Co. Kg | IQ-Datenkompression für Breitbandanwendungen |
JP6173484B2 (ja) | 2013-01-08 | 2017-08-02 | ドルビー・インターナショナル・アーベー | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
CN110062945B (zh) | 2016-12-02 | 2023-05-23 | 迪拉克研究公司 | 音频输入信号的处理 |
CN112564713B (zh) * | 2020-11-30 | 2023-09-19 | 福州大学 | 高效率低时延的动觉信号编解码器及编解码方法 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5921039B2 (ja) | 1981-11-04 | 1984-05-17 | 日本電信電話株式会社 | 適応予測符号化方式 |
US4969192A (en) | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
GB8803390D0 (en) | 1988-02-13 | 1988-03-16 | Univ Belfast | Method and apparatus for electrical signal coding |
FR2628589B1 (fr) * | 1988-03-14 | 1994-03-04 | Etat Francais | Codeur differentiel a filtre predicteur auto-adaptatif et decodeur utilisable en liaison avec un tel codeur |
EP0364647B1 (de) * | 1988-10-19 | 1995-02-22 | International Business Machines Corporation | Vektorquantisierungscodierer |
IT1232084B (it) * | 1989-05-03 | 1992-01-23 | Cselt Centro Studi Lab Telecom | Sistema di codifica per segnali audio a banda allargata |
FR2646978B1 (fr) | 1989-05-11 | 1991-08-23 | France Etat | Procede et installation a codage de signaux sonores |
US5115240A (en) * | 1989-09-26 | 1992-05-19 | Sony Corporation | Method and apparatus for encoding voice signals divided into a plurality of frequency bands |
CA2010830C (en) | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
US5754976A (en) * | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
JPH04119542A (ja) | 1990-09-07 | 1992-04-21 | Nikon Corp | 光磁気記録媒体カートリッジ |
US5206884A (en) | 1990-10-25 | 1993-04-27 | Comsat | Transform domain quantization technique for adaptive predictive coding |
FI95085C (fi) | 1992-05-11 | 1995-12-11 | Nokia Mobile Phones Ltd | Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi |
FI91345C (fi) | 1992-06-24 | 1994-06-10 | Nokia Mobile Phones Ltd | Menetelmä kanavanvaihdon tehostamiseksi |
BR9404725A (pt) * | 1993-03-26 | 1999-06-15 | Motorola Inc | Processo de quantificação por vetor de um vetor de coeficiente de reflexão ótimo processo de codificação de fala sistema de comunicação de rádio e processo de armazenagem de vetores de coeficiente de reflexão |
IT1270438B (it) * | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
FI98163C (fi) * | 1994-02-08 | 1997-04-25 | Nokia Mobile Phones Ltd | Koodausjärjestelmä parametriseen puheenkoodaukseen |
DE69429620D1 (de) * | 1994-10-28 | 2002-02-14 | Rai Radiotelevisione Italiana | Teilbandkodierung mit auf Tonhöhen basierter Prädiktionskodierung in jedem einzelnen Teilband |
ATE191107T1 (de) * | 1994-12-20 | 2000-04-15 | Dolby Lab Licensing Corp | Verfahren und gerät zum anwenden von wellenformprädiktion auf teilbänder in einem perzeptiven kodiersystem |
US5706395A (en) * | 1995-04-19 | 1998-01-06 | Texas Instruments Incorporated | Adaptive weiner filtering using a dynamic suppression factor |
TW321810B (de) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
JP3481027B2 (ja) * | 1995-12-18 | 2003-12-22 | 沖電気工業株式会社 | 音声符号化装置 |
US5778335A (en) * | 1996-02-26 | 1998-07-07 | The Regents Of The University Of California | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding |
FI964975A (fi) * | 1996-12-12 | 1998-06-13 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen koodaamiseksi |
-
1997
- 1997-03-14 FI FI971108A patent/FI114248B/fi not_active IP Right Cessation
-
1998
- 1998-02-18 WO PCT/FI1998/000146 patent/WO1998042083A1/en active IP Right Grant
- 1998-02-18 EP EP98904191A patent/EP0966793B1/de not_active Expired - Lifetime
- 1998-02-18 ES ES98904191T patent/ES2164414T3/es not_active Expired - Lifetime
- 1998-02-18 KR KR10-1999-7008369A patent/KR100469002B1/ko not_active IP Right Cessation
- 1998-02-18 AU AU62164/98A patent/AU733156B2/en not_active Expired
- 1998-03-06 US US09/036,102 patent/US6721700B1/en not_active Expired - Lifetime
- 1998-03-10 SE SE9800776A patent/SE521129C2/sv not_active IP Right Cessation
- 1998-03-12 GB GB9805294A patent/GB2323759B/en not_active Expired - Lifetime
- 1998-03-13 CN CNB981041809A patent/CN1135721C/zh not_active Expired - Lifetime
- 1998-03-13 DE DE19811039A patent/DE19811039B4/de not_active Expired - Lifetime
- 1998-03-13 FR FR9803135A patent/FR2761801B1/fr not_active Expired - Lifetime
- 1998-03-13 JP JP06351498A patent/JP3391686B2/ja not_active Expired - Lifetime
-
2002
- 2002-10-07 JP JP2002293702A patent/JP2003140697A/ja active Pending
-
2003
- 2003-11-07 US US10/704,068 patent/US7194407B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH10282999A (ja) | 1998-10-23 |
CN1195930A (zh) | 1998-10-14 |
SE9800776L (sv) | 1998-09-15 |
CN1135721C (zh) | 2004-01-21 |
WO1998042083A1 (en) | 1998-09-24 |
JP3391686B2 (ja) | 2003-03-31 |
SE521129C2 (sv) | 2003-09-30 |
JP2003140697A (ja) | 2003-05-16 |
FR2761801B1 (fr) | 1999-12-31 |
US7194407B2 (en) | 2007-03-20 |
ES2164414T3 (es) | 2002-02-16 |
AU6216498A (en) | 1998-10-12 |
US6721700B1 (en) | 2004-04-13 |
GB2323759B (en) | 2002-01-16 |
EP0966793B1 (de) | 2001-09-19 |
SE9800776D0 (sv) | 1998-03-10 |
FR2761801A1 (fr) | 1998-10-09 |
FI971108A (fi) | 1998-09-15 |
FI971108A0 (fi) | 1997-03-14 |
GB2323759A (en) | 1998-09-30 |
AU733156B2 (en) | 2001-05-10 |
DE19811039B4 (de) | 2005-07-21 |
EP0966793A1 (de) | 1999-12-29 |
FI114248B (fi) | 2004-09-15 |
GB9805294D0 (en) | 1998-05-06 |
KR100469002B1 (ko) | 2005-01-29 |
US20040093208A1 (en) | 2004-05-13 |
KR20000076273A (ko) | 2000-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE19811039B4 (de) | Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen | |
DE19747132C2 (de) | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms | |
EP0954909B1 (de) | Verfahren zum codieren eines audiosignals | |
EP0910928B1 (de) | Codieren und decodieren von audiosignalen unter verwendung von intensity-stereo und prädiktion | |
EP0931386B1 (de) | Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals | |
DE69833834T2 (de) | Skalierbares Audiokodier-und Dekodierverfahren und Gerät | |
EP2022043B1 (de) | Informationssignalcodierung | |
EP0846405B1 (de) | Verfahren zur redundanzreduktion bei der codierung von mehrkanaligen signalen und vorrichtung zur dekodierung von redundanzreduzierten, mehrkanaligen signalen | |
DE69737489T2 (de) | Formung des erkennbaren Rauschsignals in der Zeitdomäne mittels LPC-Voraussage im Frequenzraum | |
DE60310716T2 (de) | System für die audiokodierung mit füllung von spektralen lücken | |
DE4320990B4 (de) | Verfahren zur Redundanzreduktion | |
EP1495464B1 (de) | Vorrichtung und verfahren zum codieren eines zeitdiskreten audiosignals und vorrichtung und verfahren zum decodieren von codierten audiodaten | |
DE102006051673A1 (de) | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale | |
EP1397799B1 (de) | Verfahren und vorrichtung zum verarbeiten von zeitdiskreten audio-abtastwerten | |
DE10236694A1 (de) | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren | |
EP0962015B1 (de) | Verfahren und vorrichtungen zum codieren von diskreten signalen bzw. zum decodieren von codierten diskreten signalen | |
DE102004009955B3 (de) | Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite | |
EP1697931A1 (de) | Vorrichtung und verfahren zum ermitteln eines sch tzwerts | |
DE602004007550T2 (de) | Verbesserte frequenzbereichs-fehlerverbergung | |
EP1023777B1 (de) | Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms | |
DE10331803A1 (de) | Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung | |
DE60116809T2 (de) | Vorrichtung zum Transkodieren eines Audiodatenstroms | |
EP1277346B1 (de) | Vorrichtung und Verfahren zum Analysieren der spektralen Darstellung eines decodierten Zeitsignales | |
DE19742201C1 (de) | Verfahren und Vorrichtung zum Codieren von Audiosignalen | |
DE19804584A1 (de) | Verfahren und Vorrichtung zum Codieren und Decodieren von Audiosignalen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
8125 | Change of the main classification |
Ipc: G10L 1904 |
|
8328 | Change in the person/name/address of the agent |
Representative=s name: BECKER, KURIG, STRAUS, 80336 MUENCHEN |
|
8364 | No opposition during term of opposition | ||
R081 | Change of applicant/patentee |
Owner name: NOKIA TECHNOLOGIES OY, FI Free format text: FORMER OWNER: NOKIA MOBILE PHONES LTD., ESPOO, FI |
|
R082 | Change of representative |
Representative=s name: BECKER, KURIG, STRAUS, DE |
|
R071 | Expiry of right |