DE19804584A1 - Verfahren und Vorrichtung zum Codieren und Decodieren von Audiosignalen - Google Patents
Verfahren und Vorrichtung zum Codieren und Decodieren von AudiosignalenInfo
- Publication number
- DE19804584A1 DE19804584A1 DE1998104584 DE19804584A DE19804584A1 DE 19804584 A1 DE19804584 A1 DE 19804584A1 DE 1998104584 DE1998104584 DE 1998104584 DE 19804584 A DE19804584 A DE 19804584A DE 19804584 A1 DE19804584 A1 DE 19804584A1
- Authority
- DE
- Germany
- Prior art keywords
- spectral
- value
- values
- prediction
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
Description
Die Erfindung betrifft Verfahren zum Codieren und Decodieren
elektronischer Signale, und sie betrifft Vorrichtungen zum
Ausführen solcher Verfahren.
Es ist wohlbekannt, daß die Übertragung von Daten in digi
taler Form für erhöhte Signal/Rauschsignal-Verhältnisse und
erhöhte Informationskapazitäten entlang einem Übertragungs
kanal sorgt. Es existiert jedoch dauernd der Wunsch, die Ka
nalkapazität durch noch stärkeres Komprimieren digitaler Si
gnale weiter zu erhöhen. Im Hinblick auf Audiosignale werden
herkömmlich zwei Kompressions-Grundprinzipien verwendet. Zum
ersten gehört es, statistische oder determinierte Redundan
zen im Quellensignal zu beseitigen, während es zum zweiten
gehört, im Quellensignal Elemente zu unterdrücken oder zu
beseitigen, die insoweit redundant sind, als es das mensch
liche Wahrnehmungsvermögen betrifft. In jüngerer Zeit wurde
das letztere Prinzip bei Audioanwendungen hoher Qualität
vorherrschend, und zu ihm gehört es typischerweise, ein
Audiosignal in Frequenzkomponenten (manchmal als "Subbänder"
bezeichnet) zu unterteilen, von denen jedes mit einer Quan
tisierungsgenauigkeit analysiert und quantisiert wird, die
so bestimmt ist, daß Datenirrelevanz (bezogen auf den Hö
rer) beseitigt wird. Der Audiocodierungsstandard ISO (Inter
national Standards Organisation) MPEG (Moving Pictures Ex
pert Group) sowie andere Audiocodierungsstandards verwenden
dieses Prinzip und definieren es detailliert. Jedoch verwen
den MPEG (und andere Standards) auch eine Technik, die als
"adaptive Vorhersage" bekannt ist, um die Datenrate weiter
zu verringern.
Eine spezielle Form adaptiver Vorhersage ist als "adaptive
Gittervorhersage in Rückwärtsrichtung" bekannt. Ein Algo
rithmus hierfür ist von Fuchs et al. in "Improving MPEG
Audio coding by Backward Adaptive Linear Stereo Prediction",
AES Convention, New York, Preprint 4086, Oktober 1995 be
schrieben. Für jeden spektralen Wert (der "aktuelle" Wert)
jeder Frequenzkomponente erzeugt adaptive Gittervorhersage
in Rückwärtsrichtung einen Satz von Vorhersagekoeffizienten
im Codierer aus den zuvor berechneten spektralen Werten die
ser Komponente (über eine Zwischenberechnung quantisierter
spektraler Werte). Diese Koeffizienten werden dann dazu ver
wendet, den aktuellen spektralen Wert vorherzusagen. Die Ab
weichung zwischen dem aktuellen spektralen Wert und dem vor
hergesagten spektralen Wert wird bestimmt, und dieser Abwei
chungswert (nach der Quantisierung) wird an den Empfänger
übertragen. Es ist ersichtlich, daß zu jedem vorgegebenen
Zeitpunkt die aktuellen Vorhersagekoeffizienten tatsächlich
aus allen zuvor empfangenen Abtastwerten hergeleitet sind.
Im Empfänger werden die Koeffizienten auf ähnliche Weise be
rechnet, und wiederhergestellte spektrale Werte werden da
durch erhalten, daß die vorhergesagten spektralen Werte mit
den empfangenen Abweichungswerten kombiniert werden.
Bei bestimmten Algorithmen, die adaptive Vorhersage in Rück
wärtsrichtung verwenden, tritt häufig der Fall auf, daß
während des Kompressionsprozesses ein Maß für die erzielte
Kompression bestimmt wird und die Abweichungswerte nur dann
geliefert werden, wenn ein positiver Kompressionsgewinn er
zielt ist. Falls nicht, werden statt dessen die tatsächli
chen quantisierten Frequenzkomponentensignale übertragen.
Der neue Standard MPEG-2 AAC verwendet psychoakustische Mo
dellbildung und adaptive, lineare Vorhersage in Rückwärts
richtung mit 1024 Frequenzkomponenten. Es ist ins Auge ge
faßt, daß der neue Standard MPEG-4 VM ähnliche Erforder
nisse aufweist. Jedoch führt eine derartig große Zahl von
Frequenzkomponenten wegen der Kompliziertheit des Vorhersa
gealgorithmus zu einem großen Berechnungsoverhead, und es
müssen auch große Speichergebiete zur Verfügung stehen, um
die berechneten Koeffizienten einzuspeichern. Außerdem muß
der Decodierer bei adaptiver Gittervorhersage in Rückwärts
richtung selbst dann, wenn die Vorhersageeinrichtungen "ab
geschaltet" sind (z. B. dann, wenn aus der Kompression kein
Vorteil durch das Übertragung der Abweichungswerte erzielt
werden kann), damit fortfahren, die Koeffizienten zu bestim
men, so daß die Vorhersageeinrichtungen erneut bei Bedarf
ohne jede zeitliche Funktionsbeeinträchtigung wieder "einge
schaltet" werden können. Dies sorgt für einen zusätzlichen
Berechnungsoverhead.
Der Erfindung liegt die Aufgabe zugrunde, Verfahren und
Vorrichtungen zum Codieren und Decodieren von Audiosignalen
zu schaffen, mit denen es möglich ist, diesen Berechnungs
overhead zu vermeiden.
Diese Aufgabe ist hinsichtlich des Codierungsverfahrens
durch den beigefügten Anspruch 1, hinsichtlich des Decodie
rungsverfahrens durch den beigefügten Anspruch 11, hinsicht
lich der Codierungsvorrichtung durch den beigefügten An
spruch 12 sowie hinsichtlich der Decodierungsvorrichtung
durch den beigefügten Anspruch 13 gelöst.
Die Erfindung nutzt einen Algorithmus für adaptive Vorhersa
ge in Rückwärtsrichtung, der auf eine relativ große Anzahl
von Frequenzkomponenten eines zu codierenden Audiosignals
einwirkt und Vorhersagekoeffizienten für eine Komponente aus
einer vorbestimmten Anzahl zuvor empfangener Abtastwerte
dieser Komponente berechnet.
Beim erfindungsgemäßen Verfahren wird nicht unmittelbar ein
Satz von Vorhersagekoeffizienten aus allen vorangegangenen
spektralen Komponenten berechnet, wie dies bei den herkömm
lichen Algorithmen für adaptive Vorhersage in Rückwärtsrich
tung der Fall ist. D. h., daß die Vorhersagekoeffizienten
für jeden spektralen Wert neu berechnet werden und sie nicht
lediglich aus dem zuvor berechneten Satz adaptiert werden.
Demgemäß besteht in Perioden, in denen die Vorhersageein
richtung abgeschaltet ist, kein Erfordernis, mit dem Aktua
lisieren der Koeffizienten im Decodierer fortzufahren.
Es wurde herausgefunden, daß zwar Algorithmen für adaptive
Vorhersage in Rückwärtsrichtung, die Vorhersagekoeffizienten
aus den Kovarianzen einer vorbestimmten Anzahl voriger spek
traler Werte berechnen, im allgemeinen nicht zum Codieren
von Audiosignalen geeignet sind, die in eine relativ kleine
Anzahl von Frequenz-Subbändern (z. B. 32) unterteilt sind,
daß derartige Vorhersagealgorithinen jedoch zweckdienlich
sind, wenn ein Audiosignal in eine relativ große Anzahl von
Frequenz-Subbändern (z. B. 1024, wie durch den Entwurf zum
Standard MPEG-4 definiert) unterteilt ist. Dies, da dann,
wenn eine große Anzahl von Subbändern definiert ist, die
Ordnung des Vorhersagealgorithmus (d. h. die Anzahl der Vor
hersagekoeffizienten) niedrig sein kann, und die Erfindung
realisierende Algorithmen zeigen hohes Funktionsvermögen und
sind bei niedrigen Ordnungen berechnungsmäßig wirkungsvoll.
Vorzugsweise hat die Vorhersageordnung den Wert Eins oder
Zwei. Bevorzugter hat die Vorhersageordnung den Wert Zwei.
Bevorzugt wird die genannte vorbestimmte Anzahl zuvor emp
fangener, aufeinanderfolgender spektraler Werte dazu verwen
det, eine entsprechende Anzahl quantisierter spektraler Wer
te herzuleiten. Es handelt sich um die quantisierten Werte,
die dann dazu verwendet werden, die Vorhersagekoeffizienten
zu berechnen.
Vorzugsweise überlappen die dem Audiosignal entnommenen
Zeitfenster. Z. B. kann jedes Fenster 2048 Abtastpunkte bei
einer Überlappung mit einem benachbarten Fenster von 50%
enthalten. Jedoch können die Fenster auch zusammenhängend
angeordnet sein.
Bei bestimmten Ausführungsformen der Erfindung kann ein neu
er Satz von Vorhersagekoeffizienten für jeden einzelnen
spektralen Wert berechnet werden. Jedoch kann es bei anderen
Ausführungsformen berechnungsmäßig wirkungsvoller sein, die
Vorhersagekoeffizienten nur für jeden zweiten oder dritten
(oder ein anderes ganzzahliges Vielfaches) spektralen Wert
erneut zu berechnen und dieselben Koeffizienten für mehrere
aufeinanderfolgende spektrale Werte zu verwenden. Es kann
auch zweckdienlich sein, für ein Umschalten zwischen einer
niedrigen Koeffizienten-Aktualisierungsrate (z. B. für einen
Wert pro Sekunde) und ein hoher Aktualisierungsrate (z. B.
für jeden spektralen Wert) unmittelbar nach Erkennung eines
Übergangs im Audiosignal zu sorgen.
Die Untergrenze der vorbestimmten Anzahl zuvor empfangener
Abtastpunkte, wie dazu verwendet, jeden der Vorhersagekoef
fizienten zu berechnen, ist durch die erforderliche Codie
rungsqualität bestimmt. Vorzugsweise beträgt die Zahl jedoch
vier oder mehr. Die Obergrenze dieser Zahl ist durch Spei
cher- und Rechnerbeschränkungen bestimmt. Vorzugsweise be
trägt die Zahl zehn oder weniger. Bevorzugter hat die vorbe
stimmte Zahl den Wert sechs.
Es kann jedes geeignete Verfahren zum Berechnen der Vorher
sagekoeffizienten verwendet werden, z. B. ein Autokorrela
tionsverfahren. Jedoch zeigte es sich, daß das Verfahren
mit dem kleinsten Fehlerquadrat besonders vorteilhaft ist.
Vorzugsweise sind die Vorhersagekoeffizienten, die dazu ver
wendet werden, vorhergesagte spektrale Werte zu berechnen,
Koeffizienten aus linearer Vorhersage.
Es ist zu beachten, daß die Erfindung zur Verwendung mit
psychoakustischer Kompensation vorgesehen ist und daß die
Quantisierung der Abweichungssignale entsprechend gesteuert
werden kann.
Beim Verfahren gemäß Anspruch 11 bestimmen die speziellen
Realisierungsdetails des Codierungsverfahrens stark die
Realisierungseinzelheiten des Decodierungsverfahrens, z. B.
die Vorhersageordnung.
Für ein besseres Verständnis der Erfindung, und um anzuge
ben, wie dieselbe ausgeführt werden kann, wird nun beispiel
haft auf die beigefügten Zeichnungen Bezug genommen.
Fig. 1 zeigt schematisch eine Vorrichtung zum Codieren
eines Audiosignals unter Verwendung adaptiver Vorhersage in
Rückwärtsrichtung gemäß einem Ausführungsbeispiel der Erfin
dung;
Fig. 2 zeigt schematisch eine Vorrichtung zum Decodieren
eines Audiosignals, das mit der Vorrichtung gemäß Fig. 1
codiert wurde; und
Fig. 3 zeigt ein Mobiltelephon, das die Vorrichtungen der
Fig. 1 und 2 enthält.
Gemäß Fig. 1 wird ein zu codierendes Impulscode-moduliertes
(PCM) Audio-Eingangssignal g(t) an den Eingang einer ersten
Signalverarbeitungseinheit 1 einer Codiervorrichtung gege
ben. Diese erste Einheit 1 ist so ausgebildet, daß sie das
Eingangssignal g(t) auf Rahmenbasis von der Zeit- in die
Frequenzdomäne transformiert, wobei jeder Rahmen n aus 2048
Abtastwerten besteht und benachbarte Rahmen eine Überlappung
von 50% aufweisen. Genauer gesagt, verwendet die Einheit 1
eine modifizierte, diskrete Cosinustransformation (MDCT) zum
Transformieren des Signals in die Frequenzdomäne, so daß
das Ausgangssignal der Einheit 1 aus 1024 gesonderten Strö
men spektraler Werte xj(n) besteht, wobei jeder Strom j
einer anderen spektralen Komponente entspricht. Es wird dar
auf hingewiesen, daß andere Transformationsverfahren ver
wendet werden können, z. B. Fouriertransformation.
Jeder Strom von Datenwerten xj(n) wird an den entsprechenden
Eingang einer Vorhersageeinrichtung 2 für adaptive Vorhersa
ge in Rückwärtsrichtung gegeben, deren Funktion unten im
einzelnen beschrieben ist. Allgemein gesagt, berechnet die
Vorhersageeinrichtung 2 für jeden spektralen Wert xj(n) ei
nen Satz von Vorhersagekoeffizienten aj(n) unter Verwendung
nachfolgend hergeleiteter, rekonstruierter, quantisierter
spektraler Werte, die ihrerseits aus zuvor empfangenen spek
tralen Werten dieses Stroms hergeleitet werden. Die Vorher
sagekoeffizienten werden ihrerseits dazu verwendet, einen
Abweichungswert ej(n) für den spektralen Wert zu berechnen.
Die Abweichungswerte für jeden Strom werden an den Eingang
eines Quantisierers 3 gegeben, der so ausgebildet ist, daß
er quantisierte Abweichungen j(n) für anschließende digi
tale Übertragung erzeugt. Die quantisierten Abweichungen
j(n) werden an einen Multiplexer 4 geliefert, der ein Ab
weichungs-Multiplexsignal 9 zur Übertragung erzeugt, und sie
werden auch an die Vorhersageeinrichtung 2 zurückgeführt.
Es ist auch eine weitere Signalverarbeitungseinheit 5 vor
handen, um den Betrieb der Signalverarbeitungseinheit 1 und
des Quantisierers 3 abhängig von der psychoakustischen Cha
rakteristik des Eingangs-Audiosignals g(t) zu steuern. Der
Betrieb dieser Einheit ist herkömmlich und wird hier nicht
im einzelnen beschrieben.
Für jede spektrale Komponente j sind x(n), (n) und (n)
das Eingangsignal für die Vorhersageeinrichtung 2, das Aus
gangssignal derselben bzw. ein wiederhergestelltes quanti
siertes Signal, und e(n) und (n) sind ein Vorhersage-Ab
weichungssignal bzw. ein quantisiertes Vorhersage-Abwei
chungssignal. Der Satz von Vorhersagekoeffizienten kann wie
folgt repräsentiert werden:
a(n)=[a1(n),a2(n), . . ., aP(n)]T
wobei diese Größe zeitabhängig ist und wobei der hochge
stellte Wert T die Transponierte repräsentiert. Das Aus
gangssignal der Vorhersageeinrichtung 2, nämlich x(n), wird
wie folgt berechnet:
mit
wobei P die Vorhersageordnung ist, d. h. die Anzahl von Ko
effizienten. Die Vorhersageordnung ist:
und das wiederhergestellte quantisierte Signal ist
Die Berechnung der Vorhersagekoeffizienten beruht auf einer
Minimierung der Vorhersageabweichung gemäß dem mittleren
Fehlerquadrat. a(n) kann wie folgt ausgedrückt werden:
wobei E den Erwartungswert repräsentiert.
Es ist zu beachten, daß dann, wenn einmal die Autokorrela
tionsfunktionen r(n) erhalten sind, die linearen Vorhersage
werte durch Lösen der Normalengleichung erhalten werden kön
nen. Jedoch wird hier ein Algorithmus mit kleinstem Fehler
quadrat angegeben, um die linearen Vorhersagekoeffizienten
für jeden Abtastwert einzeln abzuschätzen. Das Verfahren mit
dem kleinsten Fehlerquadrat führt häufig zu einer besseren
Abschätzung eines Koeffizienten aus linearer Vorhersage als
das Autokorrelationsverfahren, insbesondere dann, wenn die
Anzahl verfügbarer Daten klein ist. Nachfolgend wird ge
zeigt, daß dann, wenn die Ordnung der Vorhersageeinrichtung
niedrig ist, insbesondere nur zwei, die Kompliziertheit des
Algorithmus mit kleinstem Fehlerquadrat vergleichbar derje
nigen des bekannten Algorithmus mit adaptiver Gittervorher
sage oder kleiner ist.
Es sei erneut angenommen, daß das wiederhergestellte quan
tisierte Signal mit (n) bezeichnet ist. Für eine Vorher
sageordnung von zwei und eine Blocklänge L werden die Kova
rianzen des wiederhergestellten Signals wie folgt berechnet:
Ein wirkungsvoller Algorithmus wäre
Mit diesen Kovarianzen können die zwei Koeffizienten der li
nearen Vorhersage wie folgt berechnet werden:
Es ist zu beachten, daß die Koeffizienten der linearen Vor
hersage aus einer vorbestimmten oder festgelegten, relativ
kleinen Anzahl voriger spektraler Werte hergeleitet werden.
Die Berechnung der Koeffizienten hängt nicht von jedem zuvor
empfangenen spektralen Wert ab.
Um die Robustheit der adaptiven Vorhersage in Rückwärtsrich
tung gegenüber Kanalfehlern und zahlenmäßigen Rundungsfeh
lern zu verbessern, kann nach dem Erhalten der Koeffizienten
für lineare Vorhersage eine Bandbreitenexpansion ausgeführt
werden. Die durch die obigen Gleichungen berechneten Koeffi
zienten für lineare Vorhersage seien ai, i = 0, 1, 2, mit
a0 = 1. Die Bandbreiten-Expansionsoperation ersetzt jeden
Wert ai durch γiai, wobei γ eine Konstante ist, die gering
fügig kleiner als eins ist.
Wie es aus dem vorigen Abschnitt erkennbar ist, werden die
Kovarianzfunktionen für jeden Abtastwert aktualisiert. Dem
gemäß können die Koeffizienten für lineare Vorhersage eben
falls für jeden Abtastwert einzeln durch Lösen der Normalen
gleichung erhalten werden. Um jedoch Rechenaufwand einzuspa
ren, können die Koeffizienten für lineare Vorhersage weniger
häufig berechnet werden. Z. B. können die Koeffizienten für
lineare Vorhersage ein Mal für zwei Abtastwerte berechnet
werden. Der Verlust an mittlerem Vorhersagegewinn ist ver
nachlässigbar. Jedoch ist der Verlust an Vorhersagegewinn
dann deutlich erkennbar, wenn im zu codierenden Audiosignal
ein Übergang auftritt. Daher ist ein Übergangsdetektor 10
vorhanden, der die Vorhersageeinrichtung von einer normalen,
niedrigen Koeffizienten-Aktualisierungsrate (z. B. mit einem
spektralen Wert pro Sekunde) auf eine hohe Aktualisierungs
rate (z. B. für jeden spektralen Wert) umschaltet, wenn ein
Übergang erkannt wird. Die hohe Aktualisierungsrate kann für
eine kurze Periode nach der Erkennung eines Übergangs beibe
halten werden.
Es sei angenommen, daß G1 den Vorhersagegewinn im Skalie
rungsfaktorband l bezeichnet. Wenn G1 < 0 gilt, kann die
Vorhersageeinrichtung in diesem Subband abhängig vom gesam
ten Vorhersagegewinn umgeschaltet werden, der wie folgt be
rechnet wird:
wobei Ns die Anzahl von Skalierungsfaktorbändern ist. Wenn
G das Erfordernis eines Zusatzbits für die Information sei
tens der Vorhersageeinrichtung kompensiert, d. h., wenn
G < T1 (dB) gilt oder wenn der Vorhersagegewinn nicht dras
tisch fällt, d. h. bei Gaktuell - Gvorig < T2 (dB), wird die
Information der vollständigen Seite übertragen, und die Vor
hersageeinrichtungen, die positive Gewinne erzeugen, werden
eingeschaltet; andernfalls werden die Vorhersageeinrichtun
gen nicht verwendet, was auch bedeutet, daß sich ein Über
gang nähert. Nachdem die Übergangsrahmen erkannt sind, wer
den die Koeffizienten für adaptive Vorhersage in Rückwärts
richtung für jeden Abtastwert berechnet. Nach einer bestimm
ten Anzahl von Abtastwerten werden die Vorhersagekoeffizien
ten für die Abtastwerte berechnet, wie sie jede Sekunde auf
treten.
Fig. 2 zeigt eine Vorrichtung zum Decodieren eines Signals,
das unter Verwendung des oben im einzelnen beschriebenen
Verfahrens codiert wurde. Das empfangene Abweichungs-Multi
plexsignal 9 wird an den Eingang eines Demultiplexers 6 ge
geben, der das Signal in 1024 Ströme ej(n) spektraler Werte
unterteilt. Diese Ströme werden dann an eine Signalverarbei
tungseinheit 7 weitergegeben. Für jeden Strom berechnet die
se Einheit 7 für jeden Abweichungswert einen vorhergesagten
oder abgeschätzten spektralen Wert. Eine vorbestimmte Anzahl
dieser vorhergesagten Werte wird dann dazu verwendet, Koef
fizienten für lineare Vorhersage zu berechnen, um die Be
rechnung eines Vorhersagewerts für einen aktuellen Abtast
wert zu ermöglichen. Dieser Prozeß ist identisch mit demje
nigen der für den Codierprozeß beschrieben wurde. Ein wie
derhergestellter spektraler Wert wird dadurch erhalten, daß
das empfangene Abweichungssignal mit dem entsprechenden Vor
hersagewert kombiniert wird. Die Ströme wiederhergestellter
spektraler Werte werden an eine weitere Verarbeitungseinheit
8 geliefert, die einen inversen MDCT-Vorgang an den Daten
ausführt, um im wesentlichen das ursprüngliche Audiosignal
wiederherzustellen.
Fig. 3 zeigt ein Mobiltelephon 11, das in seinem Sender
eine Vorrichtung 12 (entsprechend der Vorrichtung von Fig.
1) zum Codieren eines Funktelephonsignals unter Verwendung
des obenbeschriebenen Codierungsverfahrens enthält. Das Te
lephon enthält in seinem Empfänger auch eine Vorrichtung 13
(entsprechend der Vorrichtung von Fig. 2) zum Decodieren
eines empfangenen, codierten Telephonsignals.
Claims (15)
1. Verfahren zum Codieren eines elektrischen Audiosignals
unter Verwendung adaptiver Vorhersage in Rückwärtsrichtung,
gekennzeichnet durch die folgenden Schritte:
- a) Empfangen eines ersten Zeitrahmens des zu codierenden elektrischen Audiosignals;
- b) Transformieren des Zeitrahmens in die Frequenzdomäne, um ein Frequenzspektrum mit 512 oder mehr spektralen Komponen ten zu erzeugen;
- c) Empfangen folgender Zeitrahmen des elektrischen Audiosi gnals, und aufeinanderfolgendes Wiederholen des Schritts (b) für diese Rahmen, um einen Strom spektraler Datenwerte für jede spektrale Komponente zu erzeugen; und
- e) Berechnen, für jeden dieser Ströme, eines Satzes von Vorhersagekoeffizienten für jeden spektralen Wert unter Ver wendung der Kovarianzen einer vorbestimmten Anzahl zuvor bestimmter, rekonstruierter spektraler Werte des Stroms un ter Verwendung des Satzes von Vorhersagekoeffizienten, um einen vorhergesagten spektralen Wert zu erzeugen, und Be rechnen der Abweichung zwischen dem vorhergesagten spektra len Wert und dem entsprechenden tatsächlichen spektralen Wert, wobei die berechneten Abweichungen für eine codierte Wiedergabe des Stroms spektraler Werte sorgen und wobei die se Abweichungen mit vorhergesagten spektralen Werten kombi niert werden können, um rekonstruierte spektrale Werte zu erhalten.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß
die Vorhersageordnung den Wert Zwei hat.
3. Verfahren nach einem der vorstehenden Ansprüche, da
durch gekennzeichnet, daß die Vorhersagekoeffizienten nur
dann erneut berechnet werden, wenn mehrere spektrale Werte
empfangen wurden, wobei für mehrere aufeinanderfolgende
spektrale Werte dieselben Koeffizienten verwendet werden.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß
die Berechnung nach Empfang von jeweils zwei spektralen Wer
ten erfolgt.
5. Verfahren nach einem der Ansprüche 3 oder 4, gekenn
zeichnet durch ein Umschalten zwischen einer niedrigen und
einer hohen Koeffizienten-Aktualisierungsrate unmittelbar
beim Erkennen eines Übergangs im zu codierenden Audiosignal.
6. Verfahren nach einem der vorstehenden Ansprüche, da
durch gekennzeichnet, daß die vorbestimmte Anzahl spektra
ler Werte vier oder mehr ist.
7. Verfahren nach einem der vorstehenden Ansprüche, da
durch gekennzeichnet, daß die vorbestimmte Anzahl spektra
ler Werte zehn oder weniger ist.
8. Verfahren nach einem der vorstehenden Ansprüche, da
durch gekennzeichnet, daß ein Verfahren mit kleinsten Feh
lerquadraten dazu verwendet wird, die Vorhersagekoeffizien
ten abzuschätzen.
9. Verfahren nach Anspruch 8 in Abhängigkeit von Anspruch
2, dadurch gekennzeichnet, daß die Kovarianzen wie folgt
bestimmt werden:
10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, daß
die Vorhersagekoeffizienten wie folgt bestimmt werden:
11. Verfahren zum Decodieren eines codierten elektrischen
Audiosignals, gekennzeichnet durch die folgenden Schritte:
- - Empfangen einer Abfolge von Abweichungswerten, die dem co dierten Audiosignal entsprechen, als Eingangssignal, und un terteilen dieser Werte in Ströme spektraler Komponenten;
- - Bestimmen, für jeden Strom, eines entsprechenden, vorher gesagten Werts der spektralen Komponente für jeden Abwei chungswert unter Verwendung eines Satzes von Vorhersagekoef fizienten, die unter Verwendung von Kovarianzen einer vorbe stimmten Anzahl zuvor bestimmter aufeinanderfolgender, vor hergesagter Werte spektraler Komponenten für diesen Strom berechnet werden, und Kombinieren des Abweichungswerts und des vorhergesagten spektralen Werts, um einen rekonstruier ten spektralen Wert zu erzeugen; und
- - Rekonstruieren im wesentlichen des Audiosignals durch Kom binieren und Frequenz-Zeit-Transformieren der rekonstruier ten spektralen Werte aller Ströme.
12. Vorrichtung zum Codieren eines elektrischen Audiosi
gnals unter Verwendung adaptiver Vorhersage in Rückwärts
richtung, gekennzeichnet durch:
- - einen Eingang zum Empfangen eines zu codierenden elektri schen Audiosignals;
- - eine Einrichtung zum Transformieren (1) von der Zeit in die Frequenzdomäne, um sequentiell empfangene Zeitrahmen des empfangenen Signals aus der Zeitdomäne in die Frequenzdomäne zu transformieren, um Frequenzspektren mit 512 oder mehr spektralen Komponenten zu erzeugen; und
- - eine Signalverarbeitungseinrichtung (2-5), die jeder spektralen Komponente zugeordnet ist, um einen Strom der zu gehörigen spektralen Werte zu empfangen, um für jeden spek tralen Wert einen Satz von Vorhersagekoeffizienten unter Verwendung von Kovarianzen einer vorbestimmten Anzahl zuvor rekonstruierter spektraler Werte zu berechnen, um diesen Satz von Vorhersagekoeffizienten zum Erzeugen eines vorher gesagten spektralen Werts zu verwenden, und um die Abwei chung zwischen dem vorhergesagten Wert und dem entsprechen den aktuellen spektralen Wert zu berechnen, wobei die be rechneten Abweichungen für eine codierte Wiedergabe des emp fangenen Stroms spektraler Werte sorgen, und wobei die Ab weichungen mit vorhergesagten spektralen Werten kombiniert werden können, um rekonstruierte spektrale Werte zu erhal ten.
13. Vorrichtung zum Decodieren eines codierten elektrischen
Audiosignals, gekennzeichnet durch:
- - einen Eingang zum Empfangen einer Abfolge von dem codier ten Audiosignal entsprechenden Abweichungswerten; und
- - eine Signalverarbeitungseinrichtung (6, 7) zum Unterteilen dieser Abfolge von Werten in getrennte Ströme spektraler Komponenten und um für jeden Abweichungswert unter Verwen dung eines Satzes von Vorhersagekoeffizienten einen entspre chenden vorhergesagten spektralen Wert zu bestimmen, wobei die Verarbeitungseinrichtung so ausgebildet ist, daß sie die Vorhersagekoeffizienten unter Verwendung von Kovarianzen einer vorbestimmten Anzahl zuvor bestimmter, aufeinanderfol gender, rekonstruierter spektraler Werte berechnet, und wo bei die Signalverarbeitungseinrichtung ferner so ausgebildet ist, daß sie jeden Abweichungswert mit dem entsprechenden vorhergesagten spektralen Wert kombiniert, um einen rekon struierten spektralen Wert zu erzeugen und um im wesentli chen das Audiosignal dadurch zu rekonstruieren, daß die wiederhergestellten spektralen Werte aller Subbänder kombi niert werden und einer Frequenz-Zeit-Transformation unterzo gen werden.
14. Kommunikationssystem mit einer Kombination der Vorrich
tungen der Ansprüche 12 und 13.
15. Mobile Kommunikationsvorrichtung mit einer Kombination
der Vorrichtungen der Ansprüche 12 und 13.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI970553A FI970553A (fi) | 1997-02-07 | 1997-02-07 | Audiokoodausmenetelmä ja -laite |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19804584A1 true DE19804584A1 (de) | 1998-08-13 |
Family
ID=8548146
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE1998104584 Withdrawn DE19804584A1 (de) | 1997-02-07 | 1998-02-05 | Verfahren und Vorrichtung zum Codieren und Decodieren von Audiosignalen |
Country Status (9)
Country | Link |
---|---|
JP (1) | JPH10260699A (de) |
CN (1) | CN1202513C (de) |
AU (1) | AU5664898A (de) |
DE (1) | DE19804584A1 (de) |
FI (1) | FI970553A (de) |
FR (1) | FR2759510A1 (de) |
GB (1) | GB2322776B (de) |
SE (1) | SE9800338L (de) |
WO (1) | WO1998035447A2 (de) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8332216B2 (en) | 2006-01-12 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for low power stereo perceptual audio coding using adaptive masking threshold |
US7610195B2 (en) | 2006-06-01 | 2009-10-27 | Nokia Corporation | Decoding of predictively coded data using buffer adaptation |
US8665945B2 (en) * | 2009-03-10 | 2014-03-04 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoding device, decoding device, program, and recording medium |
CN106409299B (zh) * | 2012-03-29 | 2019-11-05 | 华为技术有限公司 | 信号编码和解码的方法和设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02131038A (ja) * | 1988-11-10 | 1990-05-18 | Pioneer Electron Corp | 信号伝送装置 |
JP3343965B2 (ja) * | 1992-10-31 | 2002-11-11 | ソニー株式会社 | 音声符号化方法及び復号化方法 |
EP0692881B1 (de) * | 1993-11-09 | 2005-06-15 | Sony Corporation | Quantisierungsvorrichtung und -verfahren, kodierer und kodierverfahren mit hoher effizienz, dekodierer und aufzeichnungsträger |
US5684920A (en) * | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
DE19526366A1 (de) * | 1995-07-20 | 1997-01-23 | Bosch Gmbh Robert | Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen |
GB2318029B (en) * | 1996-10-01 | 2000-11-08 | Nokia Mobile Phones Ltd | Audio coding method and apparatus |
-
1997
- 1997-02-07 FI FI970553A patent/FI970553A/fi unknown
-
1998
- 1998-01-15 AU AU56648/98A patent/AU5664898A/en not_active Abandoned
- 1998-01-15 WO PCT/FI1998/000029 patent/WO1998035447A2/en active Application Filing
- 1998-02-05 SE SE9800338A patent/SE9800338L/xx not_active Application Discontinuation
- 1998-02-05 JP JP2461598A patent/JPH10260699A/ja not_active Withdrawn
- 1998-02-05 DE DE1998104584 patent/DE19804584A1/de not_active Withdrawn
- 1998-02-06 CN CN 98107058 patent/CN1202513C/zh not_active Expired - Lifetime
- 1998-02-06 FR FR9801430A patent/FR2759510A1/fr active Pending
- 1998-02-06 GB GB9802611A patent/GB2322776B/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
AU5664898A (en) | 1998-08-26 |
FR2759510A1 (fr) | 1998-08-14 |
GB9802611D0 (en) | 1998-04-01 |
GB2322776B (en) | 2002-03-13 |
CN1199959A (zh) | 1998-11-25 |
CN1202513C (zh) | 2005-05-18 |
SE9800338D0 (sv) | 1998-02-05 |
SE9800338L (sv) | 1998-08-08 |
FI970553A0 (fi) | 1997-02-07 |
WO1998035447A2 (en) | 1998-08-13 |
GB2322776A (en) | 1998-09-02 |
FI970553A (fi) | 1998-08-08 |
WO1998035447A3 (en) | 1998-11-19 |
JPH10260699A (ja) | 1998-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE19811039B4 (de) | Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen | |
DE19747132C2 (de) | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms | |
EP0954909B1 (de) | Verfahren zum codieren eines audiosignals | |
EP0931386B1 (de) | Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals | |
DE19628293C1 (de) | Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion | |
EP0846405B1 (de) | Verfahren zur redundanzreduktion bei der codierung von mehrkanaligen signalen und vorrichtung zur dekodierung von redundanzreduzierten, mehrkanaligen signalen | |
EP1145227B1 (de) | Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals | |
DE69333394T2 (de) | Hochwirksames Kodierverfahren und -gerät | |
DE60021083T2 (de) | Verfahren zur verbesserung der kodierungseffizienz eines audiosignals | |
DE4320990B4 (de) | Verfahren zur Redundanzreduktion | |
EP0227956B1 (de) | Verfahren zur Datenreduktion digitaler Bildsignale durch Vektorquantisierung | |
EP0414838B2 (de) | Verfahren zur übertragung eines signals | |
DE602004007550T2 (de) | Verbesserte frequenzbereichs-fehlerverbergung | |
EP0978172A1 (de) | Verfahren zum verschleiern von fehlern in einem audiodatenstrom | |
DE19706516C1 (de) | Verfahren und Vorricntungen zum Codieren von diskreten Signalen bzw. zum Decodieren von codierten diskreten Signalen | |
EP1023777B1 (de) | Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms | |
DE60211854T2 (de) | Vorrichtung zur datenverarbeitung | |
DE19804584A1 (de) | Verfahren und Vorrichtung zum Codieren und Decodieren von Audiosignalen | |
EP1277346B1 (de) | Vorrichtung und Verfahren zum Analysieren der spektralen Darstellung eines decodierten Zeitsignales | |
DE19742201C1 (de) | Verfahren und Vorrichtung zum Codieren von Audiosignalen | |
DE19735675C2 (de) | Verfahren zum Verschleiern von Fehlern in einem Audiodatenstrom | |
EP0284962B1 (de) | Verfahren zur Bilddatenreduktion für digitale Fernsehsignale | |
DE102021203087A1 (de) | Kompression von Audiodaten im Fahrzeug | |
DE10065363A1 (de) | Vorrichtung und Verfahren zum Decodieren eines codierten Datensignals | |
DE102006053976A1 (de) | Verfahren zur Umschaltung von Fenster und zur Entscheidung des Bandstatus der Mittel/Seitenkodierung für fortgeschrittene Audiokodierung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8141 | Disposal/no request for examination |